Hablamos de los
buscadores la semana pasada. Pues bien, no contentos con ello vamos a intentar
retratar qué es la recuperación de la información y como lo hacen los buscadores
para darnos la información que requerimos cuando lo necesitamos.
Para introducir el
tema, debemos definir la Recuperación de Información como la
ciencia de la búsqueda de información en documentos electrónicos y cualquier
tipo de colección documental digitalizada, la búsqueda de metadatos que describan documentos, o también la búsqueda en bases de datos
relacionados. Ya sea a través de internet, intranet o cualquier medio que conecte una red. Ésta tiene
como objetivo realizar la recuperación en textos, imágenes, sonido o datos de
otras características, de manera pertinente y relevante para cualquier tipo de búsqueda
que el usuario realice.
Hablábamos de diferentes
tipos de motores de búsqueda la pasada semana y con esto nos queríamos referir
a los diferentes tipos de Recuperación que emplean y que según utilicen uno u
otro se pueden clasificar también los buscadores.
Los buscadores, tales como Google o Lycos, son algunas de
las aplicaciones más populares para la recuperación de información.
Básicamente la
recuperación de la información que estos llevan a cabo consiste en construir un
Vocabulario, éste es una lista de términos en “lenguaje
natural”. También se
incluye un algoritmo que incluye las reglas lógicas de la búsqueda y una
valoración de los resultados o cantidad de información lograda o posible.
Un proceso de
recuperación de información comienza cuando un usuario hace una consulta al
sistema. Una consulta a su vez es una afirmación formal de la necesidad de una
información. En la recuperación de información una consulta
no identifica únicamente a un objeto dentro de la colección. De hecho varios
objetos pueden ser respuesta a una consulta con diferentes grados de relevancia.
Existen varias maneras
de recuperar dicha información:
Buscadores jerárquicos (Arañas o Spiders)
·
Recorren las páginas recopilando información sobre los
contenidos de las páginas. Cuando se busca una información en los motores,
ellos consultan su base de datos y presentan resultados clasificados por su
relevancia. De las webs, los buscadores pueden almacenar desde la página de
entrada, a todas las páginas que residan en el servidor.
·
Si se busca una palabra, por ejemplo, “ordenadores”.
En los resultados que ofrecerá el motor de búsqueda, aparecerán páginas que
contengan esta palabra en alguna parte de su texto.
·
Si consideran que un sitio web es importante para el
usuario, tienden a registrarlas todas. Si no la consideran importante, sólo
almacenan una o más páginas.
·
Cada cierto tiempo, los motores revisan los sitios,
para actualizar los contenidos de su base de datos, por tanto puede que los
resultados de la búsqueda estén desactualizados.
·
Los buscadores jerárquicos tienen una colección de
programas simples y potentes con diferentes cometidos. Se suelen dividir en
tres partes. Los programas que exploran la red -arañas (spiders)-, los
que construyen la base de datos y los que utiliza el usuario, el programa que
explota la base de datos.
·
Si se paga, se puede aparecer en las primeras páginas
de resultados, aunque los principales buscadores delimitan estos resultados e
indican al usuario que se trata de resultados esponsorizados o
patrocinados. Hasta el momento, aparentemente, esta forma de publicidad es
indicada explícitamente. Los buscadores jerárquicos se han visto obligados a comercializar
este tipo de publicidad para poder seguir ofreciendo a los usuarios el servicio
de forma gratuita.
Directorios
Una tecnología barata,
ampliamente utilizada por gran cantidad de scripts en el
mercado. No se requieren muchos recursos de informática. En cambio, se requiere
más soporte humano y mantenimiento.
·
Los algoritmos son mucho más sencillos, presentando la
información sobre los sitios registrados como una colección de directorios. No
recorren los sitios web ni almacenan sus contenidos. Solo registran algunos de
los datos de nuestra página, como el título y la descripción que se introduzcan
al momento de registrar el sitio en el directorio.
·
Los resultados de la búsqueda, estarán determinados
por la información que se haya suministrado al directorio cuando se registra el
sitio. En cambio, a diferencia de los motores, son revisadas por operadores
humanos, y clasificadas según categorías, de forma que es más fácil encontrar
páginas del tema de nuestro interés.
·
Más que buscar información sobre contenidos de la
página, los resultados serán presentados haciendo referencia a los contenidos y
temática del sitio.
·
Su tecnología es muy barata y sencilla.
Ejemplos de directorios:
Antiguos directorios, Open Directory
Project, Yahoo!, Terra (antiguo Olé). Ahora, ambos utilizan
tecnología de búsqueda jerárquica, y Yahoo! conserva su directorio. Buscar
Portal, es un directorio, y la mayoría de motores hispanos son directorios.
Metabuscador
Permite lanzar varias
búsquedas en motores seleccionados respetando el formato original de los
buscadores. Lo que hacen, es realizar búsquedas en auténticos buscadores,
analizan los resultados de la página, y presentan sus propios resultados, según
un orden definido por el sistema estructural del
metabuscador. Metacrawler, Aleyares son ejemplos de este tipo de
buscador.
Buscadores verticales
Los buscadores verticales o motores de búsqueda temáticos, son
buscadores especializados en un sector concreto, lo que les permite analizar la
información con mayor profundidad, disponer de resultados más actualizados y
ofrecer al usuario herramientas de búsqueda avanzadas. Es importante
resaltar que utilizan índices especializados, para, de esta manera acceder a la
información de una manera más específica y fácil. Algunos ejemplos de estos
buscadores son: Nestoria, Wolfram Alpha.
Existen distintos tipos de
estos buscadores, algunos son especializados en una rama de una ciencia, y
algunos abarcan todo tipo de materias. También existen motores de búsqueda que
solo entregan resultados sobre música, ropa o distintos temas.
Dicho todo esto, podeis comenzar a
dar vueltas a la cabeza sobre cómo utilizar los buscadores y cual elegir en
función de lo que queráis encontrar.
Sin más, cierro esta entrada con
la intención de que sea interesante a quien la pretenda leer.
No hay comentarios:
Publicar un comentario