proyectos de digitalización y preservación de la biblioteca complutense

42
Proyectos de digitalización y preservación de la Biblioteca Complutense Biblioteca Nacional 5 de junio de 2011 Manuela Palafox Parejo José Antonio Magán Wals Biblioteca de la Universidad Complutense de Madrid

Upload: biblioteca-nacional-de-espana

Post on 11-Jul-2015

1.466 views

Category:

Technology


0 download

TRANSCRIPT

Page 1: Proyectos de digitalización y preservación de la Biblioteca Complutense

Proyectos de digitalización y preservación de la Biblioteca 

ComplutenseBiblioteca Nacional

5 de junio de 2011

Manuela Palafox ParejoJosé Antonio Magán Wals

Biblioteca de la Universidad Complutense de Madrid

Page 2: Proyectos de digitalización y preservación de la Biblioteca Complutense

¿Qué pretenden las Colecciones  Digitales Complutenses?

• Facilitar el acceso al conocimiento

• Reducir barreras a la publicación y la difusión del conocimiento garantizando los derechos de propiedad de los autores, docentes e investigadores así como de la sociedad en su conjunto.

• Incrementar la difusión, uso e impacto de la investigaciónproducida en la institución y de nuestro patrimonio.

• Compromiso de preservar este capital a largo plazo.

Page 3: Proyectos de digitalización y preservación de la Biblioteca Complutense

La Colección Digital Complutense

MMáás de 20.000 tesiss de 20.000 tesisEE--PrintsPrints

ComplutenseComplutense :• 30.000 artículos • libros y capítulos• ponencias de congresos

80 cabeceras de prensa80 cabeceras de prensaPortal revistas UCMPortal revistas UCM•300.000 periódicos digitalizados •30.000 artículos de revistas• 82 títulos de revistas

Fondo antiguoFondo antiguo• 120.000 libros• 50.000 grabados

Page 4: Proyectos de digitalización y preservación de la Biblioteca Complutense

La apuesta por la colaboración para la digitalización y difusión de la producción científica y el patrimonio de la UCM

• Apuesta por la difusión en acceso abierto, tanto mediante el archivo en la denominada “vía verde” como en la “vía dorada” y la publicación por parte de la biblioteca en colaboración con otros servicios

• Colaboración con instituciones y organismos oficiales para la difusión y digitalización: Ministerio, Comunidad de Madrid, Madroño, Europeana, Hathi Trust, Internet Text Archive...

• Colaboración con instituciones privadas para la difusión y digitalización: Google, Santander Universidades, Fundación de Ciencias de la Salud, Editorial Extramuros, 

• Colaboración con editoriales y distribuidores comerciales para la difusión: Springer, Thomson Reuters, Proquest, E‐Libro.

Page 5: Proyectos de digitalización y preservación de la Biblioteca Complutense

Colecciones Digitales Complutenses

Page 6: Proyectos de digitalización y preservación de la Biblioteca Complutense

La digitalización del patrimonio bibliográfico

Page 7: Proyectos de digitalización y preservación de la Biblioteca Complutense

La digitalización y difusión del patrimonio bibliográfico: Acuerdo con 

Google• En septiembre de 2006, la Biblioteca de la UCM se suma al proyecto Google Libros.

• Digitalización de obras de dominio público que están en acceso abierto en Internet. 

•Se puede buscar por los metadatos descriptivos de las obras y por el texto completo.

• La Biblioteca de la UCM y Google disponen de una copia digital. 

Page 8: Proyectos de digitalización y preservación de la Biblioteca Complutense

¿Qué puede representar para el público?• Se está creando una gran biblioteca 

universal de objetos digitales selectos

• Parte de los fondos de algunas de las principales bibliotecas del mundo llegarán a los ordenadores del público en general 

• Los libros serán recuperados mediante la tecnología y el interfaz de Google

• Es un motor dinamizador de proyectos similares

• Se avanza en la preservación y difusión de los contenidos culturales

• Herramienta esencial para la democratización del conocimiento

Page 9: Proyectos de digitalización y preservación de la Biblioteca Complutense

¿Qué otras grandes bibliotecas de investigación han realizado acuerdos de colaboración con 

Google?

• Bibliotecas Públicas de Nueva York, Lyon 

• Universidades de Harvard, Princeton, Cornell, Columbia, Oxford, California, Stanford, Michigan, Keio…

• Bibliotecas Nacionales de Austria, Holanda, Italia, Baviera, Cataluña... 

• Se estima que se digitalizarán más de 15 millones de libros 

• Ya se han digitalizado más de 11 millones de libros

Page 10: Proyectos de digitalización y preservación de la Biblioteca Complutense

Fechas clave del proyecto

• Septiembre de 2006: – Firma del acuerdo de colaboración 

• Octubre‐Diciembre 2007: – Organización de los Equipos de selección . – Cursos de formación a los Equipos de selección:

• 2008:– Comienzan los trabajos de selección de libros en los depósitos de las 

bibliotecas (enero)– Comienzan los primeros envíos de libros al Centro de Digitalización 

(marzo)– Desde el otoño, miles de obras se pueden consultar libremente en Internet

• Junio 2011:– 120.000 libros complutenses digitalizados

Page 11: Proyectos de digitalización y preservación de la Biblioteca Complutense

Manuela Palafox. Proyectos de digitalización de la Biblioteca Complutense.  Ministerio de Cultura, 10/11/2011

Datos totales

Libros digitalizados

Libros comprobados No digitalizados  %

120.000 150.000 23.000 17%

Page 12: Proyectos de digitalización y preservación de la Biblioteca Complutense

Accesos a los libros ComplutensesPeríodo de 7 días

Accesos Título Autor Año Centro12.490 Diccionario etimológico de la lengua castellana (ensayo) Pedro Felipe Monlau 1856 FLL-DER

12.008 Diccionario geográfico-estadístico de España y sus posesiones de ultramar Pascual Madoz 1830 VET

8.637 La Ilíada Homero 1788 FOA

8.275 Vida y viajes de Cristóbal Colón Washington Irving 1852 GHI

7.520 Enciclopedia moderna Francisco de Paula Mellado 1851 DER

7.027 Los tres reinos de la naturaleza o museo pintoresco de historia naturaleza: Botánica. Mineralogía

Georges-Luis Leclerc Buffon 1857-1858

MED-FOA

6.468 Diccionario de la lengua castellana Real Academia Española 1852 FLL

4.450 Mitología universal Juan Bautista Carrasco 1864 DER

4.205 Linajes nobles de España Juan José Vilar Psayla 1867 FLL

4.179 Diccionario de agricultura práctica y economía rural Agustín Esteban Collantes, Agustín Alfaro 1855 MED

4.035 Anatomie descriptive Jean Cruveilhier 1837 MED

3.984 Anatomia do corpo humano Bernardo Santucci 1739 FOA

3.671 Diccionario universal latino-español Manuel de Valbuena 1808 FOA

Page 13: Proyectos de digitalización y preservación de la Biblioteca Complutense

La preservación a largo plazo y la difusión del patrimonio bibliográfico: 

Hathi Trust• En 2010 la UCM se convierte en el primer 

socio no norteamericano de Hathi Trust

• Es una asociación de instituciones de investigación y bibliotecas que trabajan para asegurar la difusión y conservación futura del patrimonio cultural

• Su fin es coordinar las estrategias de almacenamiento compartido, lo que reduce los costos a las bibliotecas asociadas

• Proporciona un marco técnico para la creación de herramientas y servicios 

Page 14: Proyectos de digitalización y preservación de la Biblioteca Complutense

Algunas instituciones miembros de HathiTrust

• Library of Congress

• New York Public Library

• Universidades de California, Cornell, Columbia, Chicago, Harvard, MIT, Michigan, Princeton, Stanford, Yale...

Page 15: Proyectos de digitalización y preservación de la Biblioteca Complutense

Beneficios de participar en HathiTrust

• Servicios de preservación:– HathiTrust tiene un compromiso de conformidad con los actuales estándares y procesos de revisión para la preservación digital. Es conforme con:• Trustworthy Repositories Audit & Certification(TRAC): Criteria and Checklist (March 2007)

• Open Archival Information System (OAIS) Reference Model (2002)

• Preservation Metadata Implementation Strategies(PREMIS) (2005)

Page 16: Proyectos de digitalización y preservación de la Biblioteca Complutense

Beneficios de participar en HathiTrust

• Servicios de acceso:– Búsqueda bibliográfica y texto completo. – Sistema de autenticación Shibboleth. Los socios puedendescargarse los libros que están en el dominio público.

– Creación de colecciones: se puede hacer búsquedas de texto completo de los libros guardados en una de nuestras colecciones. 

– Además, se pueden compartir con otros y hacerlaspúblicas. 

Page 17: Proyectos de digitalización y preservación de la Biblioteca Complutense

Beneficios de participar en HathiTrust• Disponibilidad de datos bibliográficos

– HathiTrust ofrece una variedad de métodos  para obtener los registros del repositorio en cada catálogo: acceso a los datos bibliográficos a través del API de HathiTrust y otros mecanismos, así como propuestas adicionales o servicios previstos (como el acceso a usuarios con discapacidad)

• Gobernanza– La asociación a HathiTrust ofrece a las instituciones miembros la capacidad de compartir el desarrollo de nuevos  servicios,  a través de su participación en los órganos de gobierno.  Reunión en octubre de 2011

Page 18: Proyectos de digitalización y preservación de la Biblioteca Complutense

Características de HathiTrust

• El repositorio está localizado en la Universidad de Michigan, en Ann Arbor y hay un mirror completo en la Universidad de Indianápolis, en Indiana.

• Utiliza tecnologías de código abierto (PERL, MySQL, Linux…). • Configuración de un espacio donde todos los socios podrán tener 

acceso para hacer desarrollos y mejoras.• Los metadatos bibliográficos se gestionan en un Sistema de Gestión de 

Bibliotecas (Aleph). • Los metadatos de preservación técnicos y estructurales están incluidos 

en un fichero METS para cada objeto digital. Los metadatos de preservación (PREMIS) se actualizan cuando las acciones se producen en un objeto.

• Formatos: TIFF, JPG2000…• URL permanente (servicio handle)

Page 19: Proyectos de digitalización y preservación de la Biblioteca Complutense

Políticas de acceso en HathiTrust

• El acceso se establece por detección geográfica, dirección IP, y autenticación del usuario en conjunción con el estatus de copyright de cada ejemplar almacenado en una base de datos de derechos de autor.

• El estatus de copyright se determina inicialmente por la información contenida en el registro bibliográfico. Los ejemplares publicados en USA antes de 1923 o después de 1870 fuera de Estados Unidos se consideran que están en el dominio público.

Page 20: Proyectos de digitalización y preservación de la Biblioteca Complutense

Política de preservación en HathiTrust

• Preservación del contenido.HathiTrust tiene el compromiso de preservar el contenido intelectual y en muchos casos la apariencia exacta de los materiales digitalizados y depositados en HathiTrust, lo que incluye:– Representaciones digitales (imágenes) del contenido tal como aparece en su forma original. 

– Representaciones textuales del contenido a través de las tecnologías OCR (¡cuando es posible!)

Page 21: Proyectos de digitalización y preservación de la Biblioteca Complutense

Política de preservación en HathiTrust

• Estrategias de preservación:– Uso de formatos de preservación estándares (ficheros TIFF ITU G4 almacenados en 600dpi, ficheros JPEG o JPEG2000 almacenados en varias resoluciones de 200dpi a 400dpi,  texto Unicode, y ficheros XML). 

– Validación rigurosa en la ingesta.– Diseño del repositorio según los estándares OAIS y TRAC.

– Comprobaciones regulares para verificar la integridad del contenido almacenado.

Page 22: Proyectos de digitalización y preservación de la Biblioteca Complutense

HathiTrust Digital Library

Source: Jeremy York (data as of May 1, 2011)

Page 23: Proyectos de digitalización y preservación de la Biblioteca Complutense

La colaboración en el ámbito euroepeo: Europeana Libraries

Page 24: Proyectos de digitalización y preservación de la Biblioteca Complutense

Proyecto Europeana Libraries• Participan 19 bibliotecas de investigación de 14 países europeos: Universidad de Baviera, Oxford, Gante, Lund, Uppsala, Trinity College, etc. La BUC es la única biblioteca española que participa en el proyecto.

• El objetivo es incorporar a Europeana 5 millonesde objectos digitales: manuscritos, películas y textos pertenecientes al patrimonio bibliográfico y científico de las bibliotecas participantes. 

• Crear una infraestructura para extender al restode las bibliotecas de investigación de LIBER.

Page 25: Proyectos de digitalización y preservación de la Biblioteca Complutense

Europeana Libraries: Aportación de la Universidad Complutense

– Libros antiguos hasta 1870: Metadatos de más de 120,000 librosdigitalizados por Google.

– Grabados de la Colección Digital Dioscórides :  50,000.– Tesis de la UCM: 6,000.– Artículos de las revistas científicas de la UCM: 31,000– Dibujos antiguos de la Facultad de Bellas Artes (entre1752 y 1914): 287.

– Fotos de la Guerra Civil española provenientes del ArchivoHistórico del Partido Comunista de España: 3,200.

– Archivo personal de Rubén Darío: 5,000 documentos.– Manuscritos, incunables y material cartográfico diverso

Page 26: Proyectos de digitalización y preservación de la Biblioteca Complutense

¿Cómo se accede a los libros complutenses digitalizados?

• Google Libros• Interfaz  de  búsqueda  de  Google para  la  búsqueda  exclusiva  de libros complutenses. 

• Catálogo  de  la  Biblioteca  de  la Universidad Complutense.

• Portal  de  Colecciones  Digitales Complutenses

• HathiTrust Digital Library• Europeana• Biblioteca  Virtual  Miguel  de Cervantes

Page 27: Proyectos de digitalización y preservación de la Biblioteca Complutense

Ejemplo de acceso de un libro antiguo: El catálogo de la Biblioteca Complutense

Page 28: Proyectos de digitalización y preservación de la Biblioteca Complutense

Ejemplo de acceso: En Biblioteca Virtual Miguel de Cervantes

Page 29: Proyectos de digitalización y preservación de la Biblioteca Complutense

Ejemplo de preservación y acceso: En Internet Text Archive

Page 30: Proyectos de digitalización y preservación de la Biblioteca Complutense

Ejemplo de acceso: Europeana

Page 31: Proyectos de digitalización y preservación de la Biblioteca Complutense

Ejemplo de difusión y digitalización orientado al público general en Google

Page 32: Proyectos de digitalización y preservación de la Biblioteca Complutense
Page 33: Proyectos de digitalización y preservación de la Biblioteca Complutense
Page 34: Proyectos de digitalización y preservación de la Biblioteca Complutense
Page 35: Proyectos de digitalización y preservación de la Biblioteca Complutense
Page 36: Proyectos de digitalización y preservación de la Biblioteca Complutense

WebGL Bookcase

Page 37: Proyectos de digitalización y preservación de la Biblioteca Complutense

Ejemplo de difusión y digitalización orientado al público académico

Page 38: Proyectos de digitalización y preservación de la Biblioteca Complutense
Page 39: Proyectos de digitalización y preservación de la Biblioteca Complutense
Page 40: Proyectos de digitalización y preservación de la Biblioteca Complutense
Page 41: Proyectos de digitalización y preservación de la Biblioteca Complutense

Recapitulando, ¿Qué pretenden las Colecciones  Digitales Complutenses?

• Facilitar el acceso al conocimiento

• Reducir barreras a la publicación y la difusión del conocimiento garantizando los derechos de propiedad de los autores, docentes e investigadores así como de la sociedad en su conjunto.

• Incrementar la difusión, uso e impacto de la investigaciónproducida en la institución y de nuestro patrimonio.

• Compromiso de preservar este capital a largo plazo.

Page 42: Proyectos de digitalización y preservación de la Biblioteca Complutense

Gracias por su atención

Manuela Palafox ParejoJosé Antonio Magán WalsBiblioteca de la Universidad Complutense de Madrid.