miércoles, 17 de abril de 2013

RECUPERACIÓN DE LA INFORMACIÓN EN BUSCADORES


Hablamos de los buscadores la semana pasada. Pues bien,  no contentos con ello vamos a intentar retratar qué es la recuperación de la información y como lo hacen los buscadores para darnos la información que requerimos cuando lo necesitamos.
Para introducir el tema, debemos definir la  Recuperación de Información como la ciencia de la búsqueda de información en documentos electrónicos y cualquier tipo de colección documental digitalizada, la búsqueda de metadatos que describan documentos, o también la búsqueda en bases de datos relacionados. Ya sea a través de internet, intranet o cualquier medio que conecte una red. Ésta tiene como objetivo realizar la recuperación en textos, imágenes, sonido o datos de otras características, de manera pertinente y relevante para cualquier tipo de búsqueda que el usuario realice.

Hablábamos de diferentes tipos de motores de búsqueda la pasada semana y con esto nos queríamos referir a los diferentes tipos de Recuperación que emplean y que según utilicen uno u otro se pueden clasificar también los buscadores.
Los buscadores, tales como Google o Lycos, son algunas de las aplicaciones más populares para la recuperación de información.
Básicamente la recuperación de la información que estos llevan a cabo consiste en construir un Vocabulario, éste es una lista de términos en lenguaje natural. También se incluye un algoritmo que incluye las reglas lógicas de la búsqueda y una valoración de los resultados o cantidad de información lograda o posible.

Un proceso de recuperación de información comienza cuando un usuario hace una consulta al sistema. Una consulta a su vez es una afirmación formal de la necesidad de una información. En la recuperación de información una consulta no identifica únicamente a un objeto dentro de la colección. De hecho varios objetos pueden ser respuesta a una consulta con diferentes grados de relevancia.

Existen varias maneras de recuperar dicha información:

Buscadores jerárquicos (Arañas o Spiders)

·         Recorren las páginas recopilando información sobre los contenidos de las páginas. Cuando se busca una información en los motores, ellos consultan su base de datos y presentan resultados clasificados por su relevancia. De las webs, los buscadores pueden almacenar desde la página de entrada, a todas las páginas que residan en el servidor.
·         Si se busca una palabra, por ejemplo, “ordenadores”. En los resultados que ofrecerá el motor de búsqueda, aparecerán páginas que contengan esta palabra en alguna parte de su texto.
·         Si consideran que un sitio web es importante para el usuario, tienden a registrarlas todas. Si no la consideran importante, sólo almacenan una o más páginas.
·         Cada cierto tiempo, los motores revisan los sitios, para actualizar los contenidos de su base de datos, por tanto puede que los resultados de la búsqueda estén desactualizados.
·         Los buscadores jerárquicos tienen una colección de programas simples y potentes con diferentes cometidos. Se suelen dividir en tres partes. Los programas que exploran la red -arañas (spiders)-, los que construyen la base de datos y los que utiliza el usuario, el programa que explota la base de datos.
·         Si se paga, se puede aparecer en las primeras páginas de resultados, aunque los principales buscadores delimitan estos resultados e indican al usuario que se trata de resultados esponsorizados o patrocinados. Hasta el momento, aparentemente, esta forma de publicidad es indicada explícitamente. Los buscadores jerárquicos se han visto obligados a comercializar este tipo de publicidad para poder seguir ofreciendo a los usuarios el servicio de forma gratuita.

Directorios

Una tecnología barata, ampliamente utilizada por gran cantidad de scripts en el mercado. No se requieren muchos recursos de informática. En cambio, se requiere más soporte humano y mantenimiento.
·         Los algoritmos son mucho más sencillos, presentando la información sobre los sitios registrados como una colección de directorios. No recorren los sitios web ni almacenan sus contenidos. Solo registran algunos de los datos de nuestra página, como el título y la descripción que se introduzcan al momento de registrar el sitio en el directorio.
·         Los resultados de la búsqueda, estarán determinados por la información que se haya suministrado al directorio cuando se registra el sitio. En cambio, a diferencia de los motores, son revisadas por operadores humanos, y clasificadas según categorías, de forma que es más fácil encontrar páginas del tema de nuestro interés.
·         Más que buscar información sobre contenidos de la página, los resultados serán presentados haciendo referencia a los contenidos y temática del sitio.
·         Su tecnología es muy barata y sencilla.
Ejemplos de directorios: Antiguos directorios, Open Directory Project, Yahoo!, Terra (antiguo Olé). Ahora, ambos utilizan tecnología de búsqueda jerárquica, y Yahoo! conserva su directorio. Buscar Portal, es un directorio, y la mayoría de motores hispanos son directorios.

Metabuscador
Permite lanzar varias búsquedas en motores seleccionados respetando el formato original de los buscadores. Lo que hacen, es realizar búsquedas en auténticos buscadores, analizan los resultados de la página, y presentan sus propios resultados, según un orden definido por el sistema estructural del metabuscador. Metacrawler, Aleyares son ejemplos de este tipo de buscador.

Buscadores verticales
Los buscadores verticales o motores de búsqueda temáticos, son buscadores especializados en un sector concreto, lo que les permite analizar la información con mayor profundidad, disponer de resultados más actualizados y ofrecer al usuario herramientas de búsqueda avanzadas. Es importante resaltar que utilizan índices especializados, para, de esta manera acceder a la información de una manera más específica y fácil. Algunos ejemplos de estos buscadores son: Nestoria, Wolfram Alpha.
Existen distintos tipos de estos buscadores, algunos son especializados en una rama de una ciencia, y algunos abarcan todo tipo de materias. También existen motores de búsqueda que solo entregan resultados sobre música, ropa o distintos temas.

Dicho todo esto, podeis comenzar a dar vueltas a la cabeza sobre cómo utilizar los buscadores y cual elegir en función de lo que queráis encontrar.
Sin más, cierro esta entrada con la intención de que sea interesante a quien la pretenda leer.



No hay comentarios:

Publicar un comentario