sistemas de búsqueda y recuperación de información eva mª méndez rodríguez universidad. carlos...

30
Sistemas de búsqueda Sistemas de búsqueda y y recuperación de recuperación de Información Información Eva Mª Méndez Rodríguez Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez @ bib .uc3m.es Getafe, 1999

Upload: renata-garcia

Post on 11-Jan-2015

4 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Sistemas de búsqueda y Sistemas de búsqueda y

recuperación de recuperación de InformaciónInformación

Eva Mª Méndez RodríguezEva Mª Méndez Rodríguez Universidad. Carlos III de Madrid

[email protected]

Getafe, 1999

Page 2: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Sistemas de búsquedaTipología

Recursos Web

Software y ficherosPersonas e institucionesListas de distribuciónNews

• Directorios / índices• generales• especializados

• Buscadores• Metabuscadores• Agentes inteligentes• Portales• WebRings

Page 3: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Metabuscadores:Metabuscadores:búsqueda múltiplebúsqueda múltiple

ej: Metacrawler

Sis

tem

as d

e b

úsq

ued

aS

iste

mas

de

squ

eda

Page 4: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Metabuscadores Caracterización

– Permiten formular búsquedas simultáneas en un determinado número de motores de búsqueda.

– Se les denomina también motores de búsqueda en paralelo, megamotores, o metabuscadores.

– Cuando un usuario lanza la búsqueda, el metabuscador las dirige a sus motores asociados componiendo una lista de aciertos, que representan, en teoría, las mejores respuestas a la pregunta.

– Posteriormente pueden llevar a cabo otras tareas, como asignar u ordenar por relevancia, formatearlas de forma consistente, verificar la accesibilidad o eliminar enlaces muertos.

– La lista final indica el motor que ha generado la respuesta y pueden agruparse los resultados por ese criterio.

Page 5: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Metabuscadores Ventajas e inconvenientes

En principio, dada la multiplicidad de motores parecen la solución óptima.

Pero al depender de los tiempos de respuesta y de la efectividad de sistemas sobre los que no se tienen control, no es sorprendente que en ocasiones fallen.

Page 6: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Metabuscadores Alcance:

– Trabajan para poder presentar resultados manejables, por eso no es sorprendente que las listas de resultados sean breves.

Calidad:– Dependen extremadamente de las

posibilidades de indización de los motores con los que trabaja.

– Si el motor genera basura degrada la calidad del metabuscador.

Page 7: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Metabuscadores Control:

– Los motores usan distintos procedimientos de búsqueda. Una petición genérica contra varios, no ofrece las mismas posibilidades que los resultados obtenidos con las funciones avanzadas de cada motor.

Velocidad:– Si un motor es lento, impone retrasos en la

presentación de resultados. Soluciones:– Metacrawler incorpora un mecanismo para verificar que los resultados

que obtiene son accesibles y relevantes antes de presentarlos en pantalla.

– SavvySearch toma en cuenta el tiempo de proceso de los motores y da preferencia a los más rápidos.

Page 8: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Metabuscadores:¿Cuándo usarlos?

Cuando se busque sobre una materia poco común

Cuando no se ha tenido suerte con otros servicios

Cuando no se quieran formular búsquedas complejas

Cuando se quieran recuperar tantos documentos como sea posible con una sola pregunta

Page 9: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

MetaCrawler www.metacrawler.com

Definición:– Es un servicios web que trabaja con

diferentes motores de búsqueda.

Alcance:– Usa Lycos, Webcrawler, Excite, AltaVista,

Yahoo, Infoseek.– Puede buscar en Web, productos

informáticos, ficheros o en News.

Page 10: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

MetaCrawler www.metacrawler.com

Uso:– Posee una única ventana desde la que

formular las búsquedas. Al introducir los términos el usuario puede decidir si quiere que los aciertos tengan cualquiera de los introducidos, todos o que los términos sean considerados una frase.

– Los resultados los presenta listados y normalizados eliminando elementos de publicidad.

Page 11: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

MetaCrawler www.metacrawler.com

Uso avanzado:– Permite limitar las búsquedas por países, nº

de aciertos, tiempo de duración de la búsquedas (en minutos), o por el número de acierto que debe proporcionar cada motor de búsqueda.

– Permite seleccionar los motores contra los que lanzar la pregunta:Altavista, Excite, Yahoo, Infoseek, Lycos, Thunderstone, Webcrawler.

Page 12: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Otros metabuscadores SavySearch: http://www.savvysearch.com/

Internet Sleuth: http://www.isleuth.com/

Profusion: http://www.profusion.com

Cyber411: http://www.cyber411.com

Metafind: http://www.metafind.com

Inference Find: http://www.infind.com/

All-in-One Search: http://www.allonesearch.com/

Ask Jeeves: http://www.aj.com/ ESPAÑOLES:

Metabusca: http://metabusca.com

Page 13: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Diferenciación

Metabuscadores: Lanzan la misma búsqueda a distintos sistemas, aunando los resultados.

Multibuscadores: Permiten lanzar la búsqueda a varios buscadores pero de forma individual (primero uno, después otro...) simplificación de interface pero funcionamiento autónomo.

Buscopio: http://www.buscopio.com

Page 14: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Agentes:Agentes:la búsqueda inteligentela búsqueda inteligente

ej. RoboshopperPointcast

Sis

tem

as d

e b

úsq

ued

aS

iste

mas

de

squ

eda

Page 15: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Agentes Inteligentes:¿Qué son?

– Los agentes inteligentes son programas que realizan tareas de acuerdo con los planteamientos de los usuarios.

– Las posibilidades son muy amplias, desde desarrollar rutinas de trabajo hasta tratar esas rutinas como preferencias o incluso negociar en nombre del usuario.

Software personal que asiste en la búsqueda de información en Internet con una autoridad

delegada de sus usuarios.

Page 16: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Agentes Inteligentes:Caracterización

– La característica que los distingue es la habilidad de “tomar decisiones” según un conjunto de reglas internas y sin intervención del ususario.

– Los agentes pueden tener esta característica de autonomía en mayor o menor grado. El grado de autonomía puede llegar a que tomen iniciativas: por ejemplo suministrar al usuarios información sin que la solicite, pero que quizás sea de su interés.

Page 17: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Agentes Inteligentes: Acceso

– El agente puede ser un programa cliente, o un servidor web.

– Existen múltiples clientes, algunos son gratuitos (Poitcast) , otros son de pago (Webcompass).

– Otros agentes son accesibles a través del URL: Jango, aunque exigen registrarse en muchos casos.

Page 18: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Agentes Inteligentes:Alcance

– Las tareas que pueden llevar a cabo son muy variadas:

• Enriquecen el browsing del usuario sugiriéndole enlaces basados en anteriores conductas.

• Dan valor añadido a las búsquedas convencionales como las realizadas en Altavista, Lycos, Infoseek

• Lanzan preguntas contra diferentes motores, filtran y reordenan los resultados de forma eficiente.

Page 19: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Agentes Inteligentes:Alcance

– Localiza el mejor precio de un determinado producto en las tiendas online.

– Controlan bases de datos Web y proporcionan actualizaciones de su contenido.

– Compila periódicos personalizados.– Visita a bases de datos seleccionadas por el

usuario y descarga automática de todas las páginas o de parte para consulta offline.

Page 20: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Agentes Inteligentes:Alcance

– Localización de personas con intereses similares.

– Vigilar los sitios preferidos del usuario y avisarle cuando se produce un cambio.

– Generar mapas o guías de la estructura hipertextual de un servidor.

– Comprobar y priorizar el correo electrónico, tomar decisiones basadas en el contenido del correo y actuar en consonancia.

Page 21: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Agentes Inteligentes:Uso

– Algunos agentes poseen sus propios conjuntos de reglas y criterios o las tareas que pueden desarrollar se circunscriben a una.

– Otros, por el contrario, deben ser “entrenados”. Es decir, las instrucciones se las proporciona el usuario. Este proceso puede consumir bastante tiempo, pero al finalizar, el usuario tiene un “traje a su medida”.

Page 22: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Agentes InteligentesServidorServidor

BargainFinder:• Fue un servicio experimental creado por

Anderson Consulting (junto con otros como LifestyleFinder, InfoFinder, NewsFinder, etc). Tenía la función de obtener el mejor precio de CDs.

Roboshopper:• Software que permite comparar precios de

distintos tipos de productos en distintas tiendas digitales.

Page 23: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Otros sistemas de Otros sistemas de búsqueda:búsqueda:

•Buscadores temáticos

•Webrings

Sis

tem

as d

e b

úsq

ued

aS

iste

mas

de

squ

eda

Page 24: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Buscadores temáticos:

Un buscador temático o especializado es aquel que centra toda su actividad alrededor de una materia muy concreta. Este tipo de buscadores tratan por todos los medios de recoger en sus bases de datos toda la información que pueda haber en la Red (y a veces incluso fuera de ella) sobre la materia de que tratan.

Page 25: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Buscadores temáticos Permiten obtener de forma sencilla toda la

información existente sobre una materia. La información ordenada y con unos

resúmenes mucho mejores y más completos. Organizados para presentar en primer lugar

las mejores páginas sobre los temas que tratan (Tratamiento de la información suele ser manual)

Todo ello mejora mucho la calidad de la información ante la especificidad.

Page 26: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Buscadores temáticos: Se debe combinar su uso, con el de otros

buscadores más generales, ya que en algunas ocasiones, el hecho de que sean, iniciativas temáticas particulares, pone en tela de juicio su exhaustividad.

Es necesario conocer su existencia y URL concreto, o bien partir de un buscador general que nos puede hacer llegar a él.

Buscopio: http://www.buscopio.com

Page 27: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Anillos web Los webrings son grupos de webs sobre una

misma temática que se han ido formando o construyendo por iniciativa de los propios diseñadores de páginas web con un contenido temático específico.

Hay anillos sobre tantos y diferentes temas como podamos imaginar (más de 23.000 anillos web en todo el mundo), que constituyen hoy en día una alternativa (prometedora) para la búsqueda de información en Internet.

Page 28: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Anillos web Sólo contienen webs relevantes sobre la temática

concreta de la que tratan. El nivel de ruido es =0, en general.

El sistema de índices de la mayoría de los servidores de anillos web está perfectamente estructurado y cada índice contiene información detallada sobre diversas cuestiones de interés

No requieren complejas sintaxis de búsqueda. Si algo no se encuentra en un anillo sobre un tema,

éste nos llevará a otro de la misma temática que quizás si recoja el aspecto que nos interesa

Resulta una de las mejores opciones para el acercamiento a una materia.

Page 29: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Anillos web Si un web relevante sobre un tema no se adhiere al

anillo web, no se localizará. Sigue habiendo muchas páginas web que no se

interconectan a través de enlaces a otras similares, con lo cual siempre habrá que recurrir a índices o motores de búsqueda si se desea una búsqueda más exhaustiva.

Tienen muchas limitaciones en cuanto a la búsqueda (no booleanos)

Si se busca un web determinado, los buscadores de anillos son inútiles. Sólo permiten buscar por términos definitorios no por nombres de sitios ni por dominios.

Page 30: Sistemas de búsqueda y recuperación de Información Eva Mª Méndez Rodríguez Universidad. Carlos III de Madrid emendez@bib.uc3m.es Getafe, 1999

Principales Webrings:

WebRing: http://www.webring.org

Looplink:http://www.looplink.com

Ringsurf: http://www.ringsurf.com

The Rail: http://www.therail.com