búsqueda y obtención de información
DESCRIPTION
Búsqueda y Obtención de Información. Contenido de esta presentación. Búsquedas avanzadas Booleanas. Entornos. Sistemas de información relevantes Motores de búsqueda especializados. Web Invisible Bases de datos especializadas Catálogos de bibliotecas. Las Consecuencias. Es letal - PowerPoint PPT PresentationTRANSCRIPT
L. Codina - UPF
3
Entornos
Sistemas de información relevantes Motores de búsqueda especializados. Web Invisible Bases de datos especializadas Catálogos de bibliotecas
Octubre 2013
L. Codina - UPF
4
Las Consecuencias
Es letal Mucha información (ruido) Perder información (silencio)
Necesitamos Solamente información relevante (precisión), pero Toda la información relevante (exhaustividad)
Octubre 2013
L. Codina - UPF
5
Las Soluciones
Necesitamos Conocer las fuentes
Fuentes críticas de cada sector de actividad o rama del conocimiento Saber buscar
Conocer los principios unificadores de la búsqueda Ecuaciones de búsqueda
Uso efectivo de los formularios de búsquedas avanzadas
Octubre 2013
L. Codina - UPF
6
Búsqueda simple
Palabra(s) clave(s) Un único término
Ejemplos: web Problema: ruido
Dos o más términos yuxtapuestos (sin sintaxis, términos separados por espacios en blanco) Ejemplos: web móvil Problema: falsas coordinaciones
Frase Una frase o una palabra clave compuesta rodeada por comillas
Ejemplos: “la web móvil y los medios de comunicación” Problema: silencio
Recomendación general Uso de búsquedas avanzadas
Octubre 2013
L. Codina - UPF
8
Parametrizadas
Palabras claveRestricción por campos o parámetrosLos más habituales
Título Tema Fecha de publicación Autor Lengua
Ejemplo Título: “cine musical” Entre: 1960 y 1980
Octubre 2013
L. Codina - UPF
9
Parametrizadas
Catálogos:Catálogo Athenea de la UPO http://athenea.upo.es/REBIUN http://rebiun.absysnet.com/ Bases de datos:ISOC del CSIC En http://athenea.upo.es/ buscar ISOCDialnet: http://dialnet.unirioja.es/
Buscadores académicos:SCIRUS http://www.scirus.com/
Octubre 2013
L. Codina - UPF
10
Booleanas - 1
Basada en álgebra de BooleOperadores principales
AND OR NOT
Forma simple t1 OP t2 Dónde:
t1 es una palabra clave OP es uno de los operadores principales (AND, OR, NOT)
Concepto de ecuación t1 OP t2 = conjunto de documentos
Octubre 2013
L. Codina - UPF
11
Booleanas - 2
Forma compuesta (t1 OP t2) OP (t3 OP t4) Ejemplos
(cine OR vídeo) AND (ayudas OR becas) (sitcom OR “comedia de situación”) AND (niños OR adolescentes)
Octubre 2013
L. Codina - UPF
12
Booleanas - 3
Uso AND > reduce resultados y aumenta precisión OR > aumenta resultados y reduce precisión NOT > reduce resultados y aumenta precisión
Balance: AND > aumenta precisión pero elimina información OR > aumenta resultados pero incrementa el ruido NOT > reduce el ruido pero elimina información
Octubre 2013
L. Codina - UPF
13
Cuadro resumen
Operador Resultados Precisión Ruido
AND - + -OR + - +NOT - + -
Octubre 2013
L. Codina - UPF
14
Problemas - 1
AND > Falsamente intuitivo No corresponde necesariamente con el uso del “y” gramatical Ejemplo: “necesito información sobre la obras de teatro y novelas
que han sido adaptadas para cine y televisión” Traducción booleana incorrecta:
(teatro AND novela) AND (cine AND televisión) Problema: el usuario perderá información muy relevante
Traducción booleana correcta: (teatro OR novela) AND (cine OR televisión) Ventaja: el usuario consigue una gran precisión sin pérdida de
información
Octubre 2013
L. Codina - UPF
15
Búsquedas Combinadas
Combinan ecuaciones Parametrizadas Booleanas
Ejemplo (Título artículo= “web móvil” AND publicidad) AND (Años= 2010-
2012) Interpretación: buscamos artículos sobre la web móvil y la
publicidad, pero siempre que esas palabras clave aparezcan en el título, y se hayan publicado en los últimos dos años.
Octubre 2013
L. Codina - UPF
17
Problemas - 2
OR Anti intuitivo
término 1 o bien término 2, o ambos cuantos más términos, más ruido, no menos
En la lengua natural, la partícula “O” puede tener dos significados: Incluyente Excluyente
Cómo operador booleano siempre es incluyente
Octubre 2013
L. Codina - UPF
18
Problemas 3
NOT Anti intuitivo Puede destruir información: elimina por igual información relevante y
no relevanteEjemplo: “necesito información sobre publicidad de
refrescos, pero siempre que sean bebidas para adultos”Con la ecuación: (refrescos AND publicidad) NOT jóvenes
Perdemos este documento: “Resultados de una investigación sobre publicidad de marcas de refrescos para jóvenes y adultos”
Octubre 2013
L. Codina - UPF
19
Ejercicio 1
Dada la siguiente necesidad de información: “becas y ayudas para producciones de cine y vídeo”, ¿cuál de las siguientes ecuaciones es mejor?:a) (becas AND ayudas) AND (cine AND vídeo)b) (becas OR ayudas) AND (cine OR vídeo)
Octubre 2013
L. Codina - UPF
20
Ejercicio 2
Dada la siguiente pregunta: “necesito información sobre mascotas”, ¿cuál es la mejor ecuación?:a) perros AND gatosb) perros OR gatos
Octubre 2013
L. Codina - UPF
21
Ejercicio 3
¿Podría enunciar en lenguaje natural la interpretación de esta ecuación booleana?:• (legislación OR directivas) AND (europa OR estados unidos) AND ((niños OR adolescentes) NOT (videojuegos))
Octubre 2013
L. Codina - UPF
22
Ejercicio 4
¿Podría ofrecer un ejemplo de formalización en una ecuación booleana del siguiente problema de información?: “posicionamiento en la web móvil de marcas de ciudades en Europa y Canadá utilizando técnicas SEO o bien técnicas SEM”
Octubre 2013
L. Codina - UPF
23
Ejemplo de sistemas relevantes
Motores académicos Scirus Google Scholar
Bases de datos académicas (multidisciplinares) Dialnet CSIC
Bases de datos profesionales (Humanistas) Historical Abstracts Fondo antiguo de la USE: http://fondosdigitales.us.es/ Fondo antiguo del Laboratorio de arte: http://fototeca.us.es/ Cartoteca Digital http://cartotecadigital.icc.cat/ Portal de Humanidades Liceus
http://0-www.liceus.com.athenea.upo.es/cgi-bin/aco/excellence_quees.asp?opcion=2 Acceso a Pares http://pares.mcu.es/ Europeana http://www.europeana.eu/portal/ Hemerotecas digitales http://bitelia.com/2012/09/hemerotecas-digitales-online-espanol
Octubre 2013