Sei sulla pagina 1di 6

Las mejores herramientas

xisten diferentes tipos de herramientas de bsqueda de informacin en Internet. Cada una


de ellas funciona de una manera diferente y tiene su propio propsito y su alcance. Aqu nos
referiremos a: buscadores, metabuscadores, directorios, guas y software
especializado.

Buscadores:
Los buscadores o motores de bsqueda utilizan tipos de software especiales que localizan e
indexan, en forma automtica, las pginas Web y adems todos los documentos referenciados en
ellas.
Un buscador est compuesto por cuatro componentes bsicos:

un robot,
un motor de indexacin,
los ndices
un motor de bsqueda.

El robot, tambin llamado spider, es un programa que se encarga de recorrer la Web obteniendo
informacin relevante, de cada una de las pginas que visita.
Una vez obtenida la informacin de la pgina, debe ser analizada y condensada, para su organizacin
y su posterior presentacin a los usuarios. Esta tarea la realiza el denominado motor de indexacin.
La indexacin puede efectuarse por palabras claves, que es la forma ms comn, o por
conceptos. En el caso de hacerlo por palabras claves, algunos buscadores indexan todo el texto del
documento, a excepcin de los artculos, preposiciones y otros trminos denominados palabras
vacas.
Otros motores de bsqueda se limitan a incluir en la indexacin a las palabras que ms se repiten,
o priorizan los trminos que se encuentran en el ttulo, la URL, las cabeceras, los enlaces, los
primeros prrafos y adems, las palabras claves incluidas en las etiquetas o tags.
Para facilitar la bsqueda, en la informacin recolectada, se utilizan estructuras de datos
denominadas "ndices o ficheros inversos", mediante los cuales se asocia una palabra a una lista de
documentos relacionados con ella.
El motor de bsqueda es el encargado de procesar las consultas recibidas por los usuarios, para lo
cual recorre los ndices inversos buscando los trminos relacionados con la consulta y obteniendo

los identificadores de los documentos. Finalmente los ordena jerrquicamente y presenta al usuario
los resultados obtenidos.
Este tipo de herramienta, realiza sus bsquedas en sus propios ndices, no lo hace directamente
sobre la Web. Esto implica, que los buscadores, solo pueden recuperar una muy pequea parte
de todo lo que realmente hay en Internet.
Es importante sealar que los motores de bsqueda se diferencian entre s por diferentes
caractersticas como: el volumen y la frecuencia de indexacin y el ordenamiento que hacen de la
informacin encontrada para su presentacin.
Entre los buscadores ms importantes se encuentran:
Google (http://www.google.com.ar): el ms utilizado.
Lycos (http://www.lycos.com/): un portal web que
incluye un buscador que surgi como un proyecto de desarrollo de un motor de bsqueda.
Bing (http://www.bing.com/): anteriormente Live Search, Windows Live Search y MSN
Search, es un buscador Web de Microsoft.
Otros buscadores:
DuckduckGo (https://duckduckgo.com/): un motor de bsqueda establecido en Valley
Forge, Pensilvania, USA, que utiliza la informacin de sitios de origen pblico con el
objetivo de aumentar los resultados tradicionales y mejorar la relevancia. Se promociona
como un motor de bsqueda con mucha privacidad (no almacena nuestros datos de
registro) y que nos muestra los mejores resultados descartando todo el spam y el ruido
informativo.
Yahoo buscador (https://es.search.yahoo.com/)
Actividad sugerida:
Realiza la misma bsqueda en los distintos buscadores sugeridos y compara los resultados
obtenidos.

Metabuscadores
Los metabuscadores son buscadores en buscadores, es decir, son servidores web que
realizan bsquedas en los ndices de un gran nmero de buscadores y/o directorios,
eliminan las duplicaciones y nos presentan un resumen de los resultados obtenidos,
ordenados por relevancia y, en algunos casos, nos indican cul ha sido el buscador de origen
de dicha informacin. Cada uno de los motores de bsqueda de los metabuscadores
funciona de una manera distinta, aunque existe un proceso interno comn a todos ellos.

Los pasos en el funcionamiento de un metabuscador son los siguientes:


El usuario realiza su peticin al metabuscador.
El metabuscador da formato a dicha peticin de
acuerdo a la interfaz de cada uno de los buscadores y les
pasa la solicitud.
Los buscadores realizan la bsqueda utilizando sus
medios habituales a partir de los sitios web en Internet.
stos devuelven la informacin obtenida al
metabuscador, el cual analiza los datos.
El metabuscador organiza la informacin de
acuerdo a los criterios del mismo y se la muestra al
usuario.

Podra decirse entonces que el metabuscador aporta resultados seleccionados y ordenados


mediante puntos de vista distintos y su ventaja principal es que ampla el mbito de las bsquedas
que realizamos.
Tengamos en cuenta que cada buscador utiliza su propia estrategia a la hora de recoger la
informacin y ordenar los resultados de las bsquedas, por lo que las pginas de mayor relevancia
en un buscador no tienen por qu coincidir con las del resto.
Entre los metabuscadores ms importantes se encuentran:
Metacrawler (http://www.metacrawler.com/) /
Zoo (http://www.zoo.com/)
Metacrawler fue uno de los primeros metabuscadores disponibles
para los usuarios. La empresa denominada Go2Net duea de su
franquicia fue comprada por InfoSpace o Blucora y desde marzo
redirecciona a http://www.zoo.com/(nuevo nombre e imagen del
metabuscador).
Pero si se siente nostalgia todava es posible acceder al original en el
Reino Unido:
http://www.metacrawler.co.uk/
iBoogie (http://www.iboogie.com/)
Realiza bsquedas organizadas en cluster (conjuntos o conglomerados de ordenadores
unidos entre s normalmente por una red de alta velocidad y que se comportan como si
fuesen una nica computadora) y tiene un motor muy potente. Adems, permite aadir
pestaas solicitando buscar en bases de datos concretas que tienen a disposicin del
usuario y posee una bsqueda avanzada (http://iboogie.com/advanced_web.asp)
Ixquick (http://www.ixquick.com/esp/)
El primer metabuscador que se ocup de proteger la privacidad de los usuarios sin

registrar su proceso de bsqueda y su direccin de IP.


Dogpile (http://www.dogpile.com/)
Es un metabuscador que retorna las bsquedas desde los motores About, Ask.com,
FinWhat, Google, LookSmart, MSN Search, Teoma, Yahoo!, Bing y otros buscadores
populares, incluyendo de audio y video.

Actividad sugerida:
Realiza la misma bsqueda en los distintos metabuscadores sugeridos y compara los
resultados obtenidos.

Directorios
Los directorios, tambin denominados buscadores temticos, organizan la informacin por medio
de categoras y sub-categoras que registran las direcciones (URL) y una pequea descripcin de
los diferentes sitios que han sido indexados.
Son organizados en forma manual a partir del registro de sitios por parte de sus autores, y de un
proceso posterior de seleccin y categorizacin jerarquizada por parte de los editores.
Entre los directorios ms importantes se encuentran:

Yahoo (http://ar.search.yahoo.com/)
El equipo de Yahoo! se encargan de visitar, analizar y evaluar los
sitios web y organizarlos segn su contenido en categoras y/o
subcategoras, como por ejemplo Educacin y Formacin, Salud,
Gastronoma, Viajes, etc... como si de una gran biblioteca virtual se
tratase.
Las categoras del Directorio van de lo general a lo ms especfico.

DMOZ (http://www.dmoz.org/World/Espaol/)
El Open Directory Project (ODP), tambin conocido como DMoz (por directory.mozilla.org su
nombre de dominio original) es un proyecto colaborativo multilinge, en el que editores
voluntarios listan y categorizan enlaces a pginas web.
Cualquier persona puede sugerir un enlace en una categora determinada, que luego ha de ser
aprobada por un editor
El proyecto est dividido en varias ramas segn el idioma, y las categoras de pginas se organizan
jerrquicamente dentro de cada una de las ramas.
Portal SEO (http://www.portal-seo.com/directorio- web.php)
Dedicado al SEO (Search Engine Optimization) es decir al posicionamiento en buscadores u

optimizacin en motores de bsqueda, un proceso que busca mejorar la visibilidad de un


sitio web en los resultados orgnicos de los diferentes buscadores.

Excite (http://www.excite.com/)
Es una coleccin de sitios y servicios web, lanzado en diciembre de 1995. Ofrece una gran variedad
de contenido, incluyendo un portal de Internet que muestra noticias y el tiempo, etc., incluye
adems un motor de bsqueda, un servicio de correo electrnico basado en la web, mensajera
instantnea, cotizaciones de bolsa, y una pgina de inicio personalizable por el usuario.

Muchos buscadores incluyen adems un sistema de navegacin en forma de directorio y por otra
parte, algunos directorios complementan sus resultados con los de una bsqueda en un
buscador. Pero es importante realizar una distincin entre estos dos tipos de herramientas de
bsqueda de informacin, ya que, se organizan y funcionan de diferente manera.
Actividad sugerida:
Realiza bsquedas temticas empleando diferentes directorios.

Guas
Las guas temticas estn conformadas por pginas de recursos web organizadas por reas del
dominio de diversos especialistas y entidades acadmicas que asumen la tarea de elaborarlas.
Por lo general incluyen algn mecanismo de bsqueda en sus pginas o en el sitio en general.
Estos directorios anotados suelen ser de gran calidad ya que la seleccin de recursos, es muy
cuidadosa y su actualizacin, frecuente.
Visualiza la siguiente presentacin para ampliar la
informacin:
Guas temticas
http://goo.gl/8tDn1i

Algunas guas son desarrolladas por Universidades y Bibliotecas, como por ejemplo:
Universidad de Almera. Biblioteca Nicols Salmern: Guas Temticas
http://goo.gl/F4AlNa
"Las guas temticas recogen los recursos de informacin disponibles en la Biblioteca
agrupados en diferentes categoras: bases de datos, revistas electrnicas, revistas en papel,
libros impresos, e-books, tesis y proyectos."
Universidad Carlos III de Madrid. Biblioteca: Guas de recursos
http://goo.gl/vht1rP
"En estas guas encontrars fuentes y recursos de informacin, tanto de la Biblioteca como
una seleccin de recursos externos de inters."

Universidad de Sevilla. Biblioteca. Guas: Herramientas y guas para encontrar y gestionar


la informacin: Guas de la BUS
http://goo.gl/nSt3JJ
"...podrs encontrar consejos para elaborar trabajos acadmicos, estrategias y formas de
localizar libros, patentes, pelculas..., recursos de informacin clasificados por temas,
instrucciones para el manejo de gestores bibliogrficos, y mucho ms."
Universidad de Alicante. Biblioteca: Guas temticas
http://goo.gl/OyScXJ
En ciertas ocasiones, varias instituciones se asocian para la elaboracin cooperativa de
estas guas.
Un ejemplo es la Biblioteca Virtual WWW (The WWW Virtual Library) http://vlib.org/
Actividad sugerida:
Realiza bsquedas en algunas de las guas sugeridas.
Software especializado
Para mejorar las bsquedas en la Web puede utilizarse software especializado.
Estos agentes auxiliares se instalan en nuestra PC y operan junto a los navegadores aadindoles
ciertas funcionalidades, como el manejo de conceptos para la recuperacin de la informacin.
Un agente de bsqueda es un programa que, imitando el comportamiento de una persona y
actuando de forma autnoma, recorre automticamente internet aprovechando la estructura de
enlaces de la web. Un agente de bsqueda puede recuperar un documento en particular, o utilizar
algn algoritmo de bsqueda que permita recuperar distintos documentos de la web a los que se
hace referencia en un documento fuente u origen, o conforme a unos criterios predefinidos
anteriormente por sus usuarios.
Un agente de bsqueda puede realizar diversas funciones como:
-

Realizar consultas con una velocidad y en un conjunto de fuentes mucho mayor que el
posible para un usuario humano.
Informar de las actualizaciones que se producen en los sitios web que son de inters.
Agilizar las descargas que se realizan de internet.
Eliminacin de correo basura o spam
Bsqueda de noticias conforme a las preferencias.

Un ejemplo es Copernic Agent, una herramienta realmente til que permite la bsqueda
selectiva en mltiples fuentes y la clasificacin mediante potentes herramientas de anlisis.
Que si bien an est disponible para su descarga, ya no brinda soporte a los usuarios desde su
sitio.

Potrebbero piacerti anche