Download - Bases de datos bibliográficas
Bases de datos bibliográficas
Dra. Layla Michán
E-investigación bibliográfica• Consiste en el análisis sistémico, integral y simultáneo de grandes cantidades
de literatura electrónica disponible. • Investigación bibliográfica basada en el uso de ciberinfraestructura y
recursos de la Web 2.0 en evolución a la 3.0 (aplicaciones, herramientas, servicios).
• Colecciones de datos digitales (repositorios, bases de datos).• Análisis sistémico de la literatura.• Meta-análisis de la literatura (miles 10, 000 o 10, 000).• Ventajas:
– Automatización– Sistematización– Eficiencia– Personalización– Actualización– Inmediatez
Las colecciones de datos digitales• Colecciones
– Se refiere a los datos almacenados, a la infraestructura, las organizaciones y las personas necesarias para preservar el acceso a los datos.
– Bases de datos, reservorios o repositorios.
• Datos – De distintos tipos: texto, números, imágenes, vídeo o películas,
audio, software, algoritmos, ecuaciones, animaciones, modelos, simulaciones, etc
– Pueden ser generados por diversos medios, entre ellos la observación, el cálculo o experimento.
• Digitales– Disponibles a través de Internet.– Almacenados en formato digital.
BASES DE DATOS• Según Date (1993), una base de datos es un sistema informático de registros
con el propósito de almacenar, mantener y generar información, la cual está sistematizada en tablas con un orden establecido.
• Es decir, son programas que permiten guardar, ordenar, procesar y presentar los datos con las siguientes ventajas: – 1) facilitan acumular mucha información en poco espacio– 2) sistematizan los datos de acuerdo con las necesidades del proyecto– 3) proporcionan el acceso a la información– 4) realizan búsquedas a partir de diferentes criterios– 5) procesan datos de forma cuantitativa y cualitativa– 6) interrelacionan los resultados utilizando distintas variables– 7) actualizan la información fácil y rápidamente– 8) son compatibles con otras bases de datos – 9) efectúan diversos cálculos por medio de consultas (‘queries’)– 10) se extienden por módulos– 11) se pueden diseñar, almacenar, manejar y analizar en una computadora personal
(PC)
REGISTRO
• Unidad• Representa físicamente:
– Artículo de publicación periódica
– Libro o monografía– Conferencia, reuniones, etc.– Tesis– Imagen– Mapa– Documento impreso,
audiovisual o electrónico
CAMPOSLos registros están
compuestos por áreas de información conocidas como campos:
• Autor (es)• Título• Lugar de edición• Casa editora• Descriptores, etc.
Almacenamiento de información
Información
Bases de datosBases de datos
BuscadorBuscador
Clasificación de las CDDB
Colecciones de datos bibliográficas– Sistemas de información (documental)– Bases de datos bibliográficas– e-bibliotecas– e-librerias– e-revistas– e-libros– e-editoriales– E-catálogos
Características de las colecciones de datos bibliográficas
Característica Descripción
Editor-Productor Institución o empresa encargada del diseño, captura y publicación
Criterios de selección de documentos
Criterios utilizados para seleccionar los documentos que se indizarán: editoriales (corriente principal), temática, regional, idiomática.
Cobertura tipológica
Tipo de documentos que son capturados: artículos, memorias, libros, monografías
Campos Registro bibliográfico básico (TI, AU, AB, KW), referencias y citas, liga al texto completo, relacionados, Indicadores bibliométricos (FI, Indice H)
Cobertura temporal Longitud de tiempo que abarcan los documentos registrados
Cobertura temática Las áreas del conocimiento y tópicos de los documentos : multidisciplinarias, ciencias biológicas y especializadas
Fecha de inicio Fecha de origen de la base de datos
Cobertura geográfica
Lugar de la edición de las revistas o documentos: mundial, regional o local.
Tipo de acceso Consulta libre o restringida . UNAM
Idioma Idioma de origen de las publicaciones registradas
Tamaño Memoria virtual: Teras, Gigas o megasNúmero de registros indizados: millones o miles.Número de revistas
Tesaurio Existencia de catálogo controlado: descriptores
Recursos Web 2.0 Servicio personalizado, alertas y feeds, manejador de bibliografía, recuperación de registros para meta-análisis (cientos), exportar, url .
Campos1. Registro bibliográfico2. Liga al texto completo3. Descriptores4. Referencias y citas5. Relacionados6. Meta-análisis
1. Indicadores bibliométricos2. Análisis de redes3. Descubrimiento basado en literatura
Registro Bibliográfico• Conjunto de datos formales que identifican y localizan un documento. Es
una representación del documento resultado de la catalogación y por tanto un documento secundario.
• Está constituido por la referencia bibliográfica, los puntos de acceso y la signatura topográfica de cada documento. Su finalidad es facilitar su recuperación en un sistema de información y acceso al documento original.
• Su confección está normalizada por las Reglas de Catalogación que incluyen la norma para la Descripción Bibliográfica Internacional Normalizada y las directrices de la IFLA para la normalización de los puntos de acceso o control de autoridades.
• La metodología consiste en crear un registro único para cada documento que facilite el acceso a la información por cualquier dato de la descripción o de los puntos de acceso, e incluso por la signatura topográfica.
Lopez Yepes, J. Diccionario enciclopédico de ciencias de la información. Madrid: Sintesis,2004.
Búsqueda en una base de datos
• Características y cobertura de las bds– Identificar las características de los registros.– Reconocer los campos de búsqueda.
• Búsqueda simple y avanzada• Diseño de la consulta• Operadores lógicos
Etapas1. Definir la pregunta 2. Establecer el/los dominios de interés3. Caracterizar el/los dominios4. Elegir los enfoques5. Reconocer las herramientas6. Recuperación de información
(Literatura)7. Evaluación
Operadores de búsqueda más comunesOperador Descripción Ejemplo
Boleanos AND (en inglés) Y (en
español) Recupera registros que tengan todos los términos
estudiantes AND universitarios
OR (en inglés) O (en español)
Recupera registros que tengan cualquiera de los términos
estudiantes OR universitarios
NOT (en inglés) NO (en español)
excluye el término indicado para sesgar los resultados
estudiantes NOT universitarios
Truncamiento ? Sustituye una letra o número en
cualquier posición de una palabra o serie de números
mexican?.- mexicana, mexicano
* Sustituye una o más letras o números en cualquier posición de la palabra o serie de números
mexican*.- mexicana, mexicano, mexicanas, mexicanos
Proximidad NEAR Recupera documentos en los
que los términos de búsqueda estén cerca (máximo mil palabras)
becas NEAR extranjero
ADJ Recupera documentos en los que los términos estén uno junto al otro, pueden obtenerse los mismos resultados entrecomillando los términos
servicio ADJ social
“ “ Recupera registros que
contengan el término exacto “servicio social”
Operadores lógicos• Y (combinación)
• O (reunión)
• Not (exclusión)
• $ ¿(truncar)
• “término exacto”
A B
Estrategias de búsqueda
• Búsqueda simple• Búsqueda avanzada• Documentos Relacionados• Relevancia (Pagerank google)• Valoración de los usuarios (Ranking)• En revistas y autores seleccionados• Revisiones
This diagram has been adapted from Evolution of Scientific Information. [From Allan Kent and Harold Lancour, eds., Encyclopedia of Library and Information Science (New York, 1979), s.v. "Scientific Literature," by K. Subramanyam, 394].
Consulta avanzadaAvanzada o refinada (límites)• Campos (Dónde)
– Definir los campos de búsqueda (límites)• Consulta
– Qué • Dominios (disciplinas y subdisciplinas)• Términos (específicos, homónimos, sinónimos y
relacionados)– Cómo
• Operadores lógicos• Truncar *¿ y “Exacto”
Campos– Título– Resumen– Palabras clave– Autores– Revistas– Temas– Año– Tesauro
Diseño de la consulta• Pregunta documental:
– Enfoques– Temas– Términos
• Recuperar documentos – Sobre– Con– Acerca – Términos en los documentos
• Elegir los artículos más representativos– Seleccionar las palabras más comunes– Ver palabras clave
Pregunta documental
• Título de la investigación• Términos:
– Relacionados– Sinónimos– Homónimos
• Una vez elegida la base de datos se procede al diseño de una estrategia de búsqueda; esto es definir claramente que se desea buscar y como.
• Para la adecuada definición de los términos se puede hacer uso de herramientas de búsqueda como índices y tesauros así como de operadores para que establezcan relaciones entre los términos, los amplíen o los reduzcan.
• Los operadores sustituyen a las “palabras vacías” como preposiciones o artículos que al ser empleados en una búsqueda recuperan gran cantidad de resultados no deseados.
Problemas• Provocados por el uso del lenguaje natural: Silencio documental: Son aquellos documentos almacenados en
la base de datos pero que no han sido recuperados, debido a que la estrategia de búsqueda ha sido demasiado específica o que las palabras clave utilizadas no son las adecuadas para definir la búsqueda. – Ambigüedad– Sinonimia
Ruido documental: Son aquellos documentos recuperados por el sistema pero que no son relevantes. Esto suele ocurrir cuando la estrategia de búsqueda se ha definido demasiado genérica . HomonimiaHomografía
Soluciones
• Hacer pruebas de búsqueda• Utilizar sinónimos y homónimos• Buscar en distintas bases de datos
Consulta avanzadaAvanzada o refinada (límites)• Campos (Dónde)
– Definir los campos de búsqueda (límites)• Consulta
– Qué • Términos (específicos, homónimos, sinónimos y
relacionados)– Cómo
• Operadores lógicos• Truncar *¿ y “Exacto”• Near
Selección
• Relevancia: – ligas, cantidad de palabras.
• Impacto– Citas– Cantidad de veces abierto – Cantidad de veces bajado