bibliotecas digitales unla modulo 6

49
Preservación digital Preservación digital GESTIÓN DE BIBLIOTECAS Y DOCUMENTOS DIGITALES, MODULO 6 GESTIÓN DE BIBLIOTECAS Y DOCUMENTOS DIGITALES, MODULO 6 UNLA, 2008 UNLA, 2008 Prof. Ana M. Sanllorenti Prof. Ana M. Sanllorenti

Upload: cronicasarequianas

Post on 07-Jun-2015

282 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Bibliotecas Digitales UNLA Modulo 6

Preservación digitalPreservación digital

GESTIÓN DE BIBLIOTECAS Y DOCUMENTOS DIGITALES, GESTIÓN DE BIBLIOTECAS Y DOCUMENTOS DIGITALES, MODULO 6 MODULO 6

UNLA, 2008UNLA, 2008

Prof. Ana M. SanllorentiProf. Ana M. Sanllorenti

Page 2: Bibliotecas Digitales UNLA Modulo 6

Preservación digitalPreservación digital

En la actualidad la creación, utilización y En la actualidad la creación, utilización y distribución de información se realiza en formato distribución de información se realiza en formato digital digital

Las instituciones invierten en digitalizar, adquirir, Las instituciones invierten en digitalizar, adquirir, recopilar y crear objetos digitalesrecopilar y crear objetos digitales

Una copia digital de un documento en papel Una copia digital de un documento en papel amplía enormemente su posibilidad de consulta y amplía enormemente su posibilidad de consulta y preserva al original de la manipulación. Esto preserva al original de la manipulación. Esto alienta la digitalizaciónalienta la digitalización

Un creciente porcentaje del conocimiento, la Un creciente porcentaje del conocimiento, la cultura, la economía se encuentra registrado cultura, la economía se encuentra registrado sólosólo en formato digitalen formato digital

Page 3: Bibliotecas Digitales UNLA Modulo 6

Preservación digitalPreservación digital

¿Cómo leer hoy…?¿Cómo leer hoy…?

Archivos que se almacenaron en un diskette de 5Archivos que se almacenaron en un diskette de 5´¼ ´¼

Documentos que fueron creados con Word Documentos que fueron creados con Word PerfectPerfect

Miremos cómo se ve ahora un texto producido en Miremos cómo se ve ahora un texto producido en 1992 con una versión de Word para DOS:1992 con una versión de Word para DOS:

Page 4: Bibliotecas Digitales UNLA Modulo 6

Preservación digitalPreservación digital

1¾«ä,`kkmnnNORMAL.STYEPSONLXo+Ð[1] 1¾«ä,`kkmnnNORMAL.STYEPSONLXo+Ð[1]

lkmµFACULTAD DE HUMANIDADES - UNLPlkmµFACULTAD DE HUMANIDADES - UNLPPANEL: INFORMACION, INFORMATICA Y HUMANIDADES HOYPANEL: INFORMACION, INFORMATICA Y HUMANIDADES HOYENFOQUE DOCUMENTALENFOQUE DOCUMENTAL

Voy a contar un cuento, hacer un poco de historia, ya que en la historia hay momentos en que seVoy a contar un cuento, hacer un poco de historia, ya que en la historia hay momentos en que seproducen cambios cualitativos en los que se modifica la manera de ver y comprender las cosas. Creoproducen cambios cualitativos en los que se modifica la manera de ver y comprender las cosas. Creoque estamos viviendo uno de esos momentos. Pero no voy a referirme al posmodernismo sino m sque estamos viviendo uno de esos momentos. Pero no voy a referirme al posmodernismo sino m smodestamente a las formas de acceder al conocimiento a trav‚s de la informaci¢n, y a las manerasmodestamente a las formas de acceder al conocimiento a trav‚s de la informaci¢n, y a las manerasen que se trata y organiza la informaci¢n producida. Cuesti¢n que nos toca muy especialmente a losen que se trata y organiza la informaci¢n producida. Cuesti¢n que nos toca muy especialmente a losbibliotecarios y documentalistas.bibliotecarios y documentalistas.Para hablar de estos cambios voy a seguir tres aspectos o l¡neas diferentes en la evoluci¢n de laPara hablar de estos cambios voy a seguir tres aspectos o l¡neas diferentes en la evoluci¢n de lamirada del documento como soporte de informaci¢n:mirada del documento como soporte de informaci¢n:a) Relaci¢n continente/contenidoa) Relaci¢n continente/contenidob) El documento como registro y acumulaci¢n del conocimientob) El documento como registro y acumulaci¢n del conocimientoc) El concepto de unidad documentalc) El concepto de unidad documental

ÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜ€º ÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜÜ€º

ÿÿk xé ÿÿ#u)ÿÿbr£ÿÿ¼o,ÿÿ>lEÿÿƒiáÿÿk xé ÿÿ#u)ÿÿbr£ÿÿ¼o,ÿÿ>lEÿÿƒiá ÿÿêÿÿê fùfù ÿÿÿÿcÜÜÜ[1][1][1][1][1][1][1][1]cÜÜÜ[1][1][1][1][1][1][1][1]ÐÐÿÿÛÿÿÛ

Page 5: Bibliotecas Digitales UNLA Modulo 6
Page 6: Bibliotecas Digitales UNLA Modulo 6

Preservación digitalPreservación digital

“ “El patrimonio digital consiste en recursos únicos que son fruto El patrimonio digital consiste en recursos únicos que son fruto del saber o la expresión de los seres humanos. Comprende del saber o la expresión de los seres humanos. Comprende recursos de carácter cultural, educativo, científico o recursos de carácter cultural, educativo, científico o administrativo e información técnica, jurídica, médica y de administrativo e información técnica, jurídica, médica y de otras clases, que se generan directamente en formato digital otras clases, que se generan directamente en formato digital o se convierten a éste a partir de material analógico ya o se convierten a éste a partir de material analógico ya existente. Los productos “de origen digital” no existen en otro existente. Los productos “de origen digital” no existen en otro formato que el electrónico. Los objetos digitales pueden ser formato que el electrónico. Los objetos digitales pueden ser textos, bases de datos, imágenes fijas o en movimiento, textos, bases de datos, imágenes fijas o en movimiento, grabaciones sonoras, material gráfico, programas grabaciones sonoras, material gráfico, programas informáticos o páginas Web, entre otros muchos formatos informáticos o páginas Web, entre otros muchos formatos posibles dentro de un vasto repertorio de diversidad posibles dentro de un vasto repertorio de diversidad creciente. A menudo son efímeros, y su conservación requiere creciente. A menudo son efímeros, y su conservación requiere un trabajo específico en este sentido en los procesos de un trabajo específico en este sentido en los procesos de producción, mantenimiento y gestión. Muchos de esos producción, mantenimiento y gestión. Muchos de esos recursos revisten valor e importancia duraderos, y constituyen recursos revisten valor e importancia duraderos, y constituyen por ello un patrimonio digno de protección y conservación en por ello un patrimonio digno de protección y conservación en beneficio de las generaciones actuales y futuras”… beneficio de las generaciones actuales y futuras”…

Page 7: Bibliotecas Digitales UNLA Modulo 6

Preservación digitalPreservación digital

“…“…El patrimonio digital del mundo corre el peligro de perderse para El patrimonio digital del mundo corre el peligro de perderse para la posteridad. Contribuyen a ello, entre otros factores, la rápida la posteridad. Contribuyen a ello, entre otros factores, la rápida obsolescencia de los equipos y programas informáticos que le obsolescencia de los equipos y programas informáticos que le dan vida, las incertidumbres existentes en torno a los recursos, la dan vida, las incertidumbres existentes en torno a los recursos, la responsabilidad y los métodos para su mantenimiento y responsabilidad y los métodos para su mantenimiento y conservación y la falta de legislación que ampare estos procesos. conservación y la falta de legislación que ampare estos procesos. Los cambios en las conductas han ido a la zaga del progreso Los cambios en las conductas han ido a la zaga del progreso tecnológico. La evolución de la tecnología digital ha sido tan tecnológico. La evolución de la tecnología digital ha sido tan rápida y onerosa que los gobiernos e instituciones no han podido rápida y onerosa que los gobiernos e instituciones no han podido elaborar estrategias de conservación oportunas y bien elaborar estrategias de conservación oportunas y bien fundamentadas. No se ha comprendido en toda su magnitud la fundamentadas. No se ha comprendido en toda su magnitud la amenaza que pesa sobre el potencial económico, social, amenaza que pesa sobre el potencial económico, social, intelectual y cultural que encierra el patrimonio, sobre el cual se intelectual y cultural que encierra el patrimonio, sobre el cual se edifica el porvenir.” edifica el porvenir.”

““Carta para la preservación del patrimonio digital” (2003), UNESCOCarta para la preservación del patrimonio digital” (2003), UNESCO

Page 8: Bibliotecas Digitales UNLA Modulo 6

Preservación digitalPreservación digital

Conway, Paul (1996). La Preservación en el mundo digital. Santiago de Chile, DIBAMConway, Paul (1996). La Preservación en el mundo digital. Santiago de Chile, DIBAM

Page 9: Bibliotecas Digitales UNLA Modulo 6

Preservación digital: Preservación digital:

La unidad física del documento La unidad física del documento analógicoanalógico

CONTENIDCONTENIDOO

ESTRUCTURESTRUCTURAA

CONTEXTCONTEXTOO

Page 10: Bibliotecas Digitales UNLA Modulo 6

Preservación digital: Preservación digital:

Las “capas” del documento digital Las “capas” del documento digital (textual)(textual)

¿Cuáles son sus ¿Cuáles son sus límites?límites?

La visualización e La visualización e interpretación interpretación depende de varios depende de varios elementos de elementos de software y hardwaresoftware y hardware

Estos elementos se Estos elementos se vuelven rápidamente vuelven rápidamente obsoletosobsoletos

OBJETOS OBJETOS INCRUSTADOSINCRUSTADOS

HIPERVINCULOS HIPERVINCULOS INTERNOS Y INTERNOS Y EXTERNOSEXTERNOS

MARCAS: XML, MARCAS: XML, HTMLHTML

ASCII, UNICODEASCII, UNICODE

0010 1001 00110010 1001 0011

Page 11: Bibliotecas Digitales UNLA Modulo 6

Preservación digital:Preservación digital: El mundo El mundo analógicoanalógico y el mundo y el mundo digitaldigital

La preservación del soporte La preservación del soporte físico (papel / microfilm) físico (papel / microfilm) preserva el contenidopreserva el contenido

Impedir el acceso, con Impedir el acceso, con guarda en apropiadas guarda en apropiadas condiciones ambientales, no condiciones ambientales, no afecta la condición de afecta la condición de “legibilidad”“legibilidad”

El contenido es El contenido es directamente accesible a los directamente accesible a los ojos (+ anteojos o lupa)ojos (+ anteojos o lupa)

Los soportes físicos de Los soportes físicos de información digital tienen información digital tienen menor durabilidad y su sola menor durabilidad y su sola preservación es insuficientepreservación es insuficiente

Impedir el acceso no Impedir el acceso no preserva el contenido ni la preserva el contenido ni la futura accesibilidadfutura accesibilidad

Depende de múltiples capas Depende de múltiples capas de software y de de software y de dispositivos de hardware dispositivos de hardware que se vuelven obsoletosque se vuelven obsoletos

La secuencia de estos conceptos fue extraída de las clases del La secuencia de estos conceptos fue extraída de las clases del curso “Preservación digital en instituciones de la curso “Preservación digital en instituciones de la

memoria”, Fernando Boro, 2007memoria”, Fernando Boro, 2007

Page 12: Bibliotecas Digitales UNLA Modulo 6

Preservación digital:Preservación digital: El mundoEl mundo analógicoanalógico y y el mundoel mundo digitaldigital

Se puede esperar muchos Se puede esperar muchos años entre la creación o años entre la creación o adquisición y las acciones adquisición y las acciones de preservaciónde preservación

Deacidificación, condiciones Deacidificación, condiciones de almacenamiento: de almacenamiento: normas conocidas y normas conocidas y estables para la estables para la preservaciónpreservación

Comenzar ya, desde el Comenzar ya, desde el momento de creación o momento de creación o incorporación de los objetos incorporación de los objetos digitalesdigitales

Se encuentra en Se encuentra en investigación y desarrolloinvestigación y desarrollo

La secuencia de estos conceptos fue extraída de las clases del La secuencia de estos conceptos fue extraída de las clases del curso “Preservación digital en instituciones de la curso “Preservación digital en instituciones de la

memoria”, Fernando Boro, 2007memoria”, Fernando Boro, 2007

Page 13: Bibliotecas Digitales UNLA Modulo 6

Las estrategias de preservación Las estrategias de preservación digitaldigital

De corto plazoDe corto plazoPreservar los soportes (chequeos, refresco)Preservar los soportes (chequeos, refresco)

Preservar integridad de la cadena de bits (chequeos)Preservar integridad de la cadena de bits (chequeos)

Usar formatos de archivo universales, no propietarios Usar formatos de archivo universales, no propietarios (TIFF, XML, etc.)(TIFF, XML, etc.)

Redundancia de copias de los objetos digitalesRedundancia de copias de los objetos digitales

Si todo falla ----> Arqueología digital = muy caro, no siempre Si todo falla ----> Arqueología digital = muy caro, no siempre funcionafunciona

La secuencia de estos conceptos fue extraída de las clases del curso “Preservación digital en instituciones La secuencia de estos conceptos fue extraída de las clases del curso “Preservación digital en instituciones de la memoria”, Fernando Boro, 2007de la memoria”, Fernando Boro, 2007

Page 14: Bibliotecas Digitales UNLA Modulo 6

Las estrategias de preservación Las estrategias de preservación digitaldigital

De largo plazoDe largo plazo

Preservación de la tecnologíaPreservación de la tecnología

EmulaciónEmulación

MigraciónMigración

Metadatos estandarizados de preservaciónMetadatos estandarizados de preservación

Page 15: Bibliotecas Digitales UNLA Modulo 6

Las estrategias de preservación Las estrategias de preservación digitaldigital

De largo plazoDe largo plazo

Preservación de la tecnologíaPreservación de la tecnología

Conservación y mantenimiento de todo el hardware yConservación y mantenimiento de todo el hardware y

software necesario para preservar y visualizar los objetossoftware necesario para preservar y visualizar los objetos

Digitales.Digitales.

Museos tecnológicosMuseos tecnológicos

Page 16: Bibliotecas Digitales UNLA Modulo 6

Las estrategias de preservación Las estrategias de preservación digitaldigital

De largo plazoDe largo plazo

EmulaciónEmulación

Software denominado emulador capaz de reproducirSoftware denominado emulador capaz de reproducir

el comportamiento de una determinada plataforma deel comportamiento de una determinada plataforma de

hardware y softwarehardware y software

Apto para objetos digitales dinámicos e interactivosApto para objetos digitales dinámicos e interactivos

Page 17: Bibliotecas Digitales UNLA Modulo 6

Las estrategias de preservación Las estrategias de preservación digitaldigital

De largo plazoDe largo plazo

MigraciónMigración

Transferencia periódica de material digital de unaTransferencia periódica de material digital de una

determinada configuración de hardware y software adeterminada configuración de hardware y software a

otra.otra.

De soporteDe soporte

De versiones de softwareDe versiones de software

De formatos / NormalizaciónDe formatos / Normalización

- Migración a pedido (siempre desde el objeto original)- Migración a pedido (siempre desde el objeto original)

- Migración distribuida (servicios de conversión vía Internet)- Migración distribuida (servicios de conversión vía Internet)

Lister Hill National Center for Biomedical Communications, Lister Hill National Center for Biomedical Communications, Servicio Web que convierte archivos de 50 formatos Servicio Web que convierte archivos de 50 formatos distintos a PDFdistintos a PDF

Riesgo de pérdida de informaciónRiesgo de pérdida de información Monitoreo regularMonitoreo regular

Page 18: Bibliotecas Digitales UNLA Modulo 6

Las estrategias de preservación Las estrategias de preservación digitaldigital

De largo plazoDe largo plazo

Metadatos de preservaciónMetadatos de preservación

Información que describe y documenta procesos yInformación que describe y documenta procesos y

actividades relacionadas con la preservación digitalactividades relacionadas con la preservación digital

Junto al objeto digital, se reúne información sobre:Junto al objeto digital, se reúne información sobre: Procedencia: historia anterior (formatos originales, guardas, Procedencia: historia anterior (formatos originales, guardas,

conversiones)conversiones) Autenticidad: chequeos de cadenas de bitsAutenticidad: chequeos de cadenas de bits Actividades de preservación: prescriptas y realizadas Actividades de preservación: prescriptas y realizadas

(migraciones, copias)(migraciones, copias) Ambiente tecnológico: Formato del archivo; Tamaño; Ambiente tecnológico: Formato del archivo; Tamaño;

Software de creación; Software de lectura; Velocidad de Software de creación; Software de lectura; Velocidad de lecturalectura

Derechos de acceso y condicionamientos legalesDerechos de acceso y condicionamientos legales

¿Para qué tanta información?¿Para qué tanta información?

Page 19: Bibliotecas Digitales UNLA Modulo 6

Las estrategias de preservación Las estrategias de preservación digitaldigital

Metadatos de preservaciónMetadatos de preservación

Prevenir antes que repararPrevenir antes que reparar

Si hay daño Si hay daño --->---> reparación costosa, a veces reparación costosa, a veces imposible imposible -- --->---> pérdida pérdida

Se busca producir objetos digitales Se busca producir objetos digitales “autodocumentados” a lo largo del “autodocumentados” a lo largo del tiempo, favoreciendo la preservación y tiempo, favoreciendo la preservación y acceso de largo plazo.acceso de largo plazo.

Page 20: Bibliotecas Digitales UNLA Modulo 6

Las estrategias de preservación Las estrategias de preservación digitaldigital

Metadatos de preservaciónMetadatos de preservación

Metadatos descriptivos. Metadatos descriptivos. Metadatos estructurales. Metadatos estructurales. Metadatos administrativos. Metadatos administrativos.

– Metadatos de preservación:Metadatos de preservación: no tanto una categoría no tanto una categoría separada de metadatos sino la suma de varios tipos. separada de metadatos sino la suma de varios tipos. Pueden incluir elementos de carácter único y/o con mayor Pueden incluir elementos de carácter único y/o con mayor nivel de detalle que los metadatos empleados para otras nivel de detalle que los metadatos empleados para otras funciones.funciones.

Page 21: Bibliotecas Digitales UNLA Modulo 6

Los metadatos de preservación Los metadatos de preservación digital:digital:Iniciativas y esquemasIniciativas y esquemas

PREMIS (PREMIS (PREservation Metadata: Implementation PREservation Metadata: Implementation Strategies)Strategies)OCLC / RLGOCLC / RLG

Dublin Core Initiative Preservation Working GroupDublin Core Initiative Preservation Working Group

Cedars Project, Programa eLib, UKCedars Project, Programa eLib, UK

National Library of New ZealandNational Library of New Zealand

Library of CongressLibrary of Congress

Page 22: Bibliotecas Digitales UNLA Modulo 6

Comparación de los principales elementos de los esquemas de metadatos de Comparación de los principales elementos de los esquemas de metadatos de preservaciónpreservación

Candás Romero, Jorge. El papel de los metadatos en la preservación digitalCandás Romero, Jorge. El papel de los metadatos en la preservación digitalEl profesional de la Información, v.15, n.2, 2006El profesional de la Información, v.15, n.2, 2006

PremisPremis CedarsCedars Library of CongressLibrary of Congress"format" (identificación del formato "format" (identificación del formato informático del DLO) informático del DLO)

"associated_file_type" (formato del "associated_file_type" (formato del archivo informático)archivo informático)

"creatingApplication" (aplicación con "creatingApplication" (aplicación con la que se creó el DLO) la que se creó el DLO)

"preservationLevel" (identificación de "preservationLevel" (identificación de las tareas de preservación que han de las tareas de preservación que han de aplicarse)aplicarse)

"preservation description information" "preservation description information" (la información necesaria para una (la información necesaria para una correcta preservación) correcta preservación)

"reformatting_guidelines" (políticas e "reformatting_guidelines" (políticas e instrucciones para el cambio de instrucciones para el cambio de formato)formato)

"objectIdentifier" (la designación que "objectIdentifier" (la designación que identifica unívocamente al DLO)identifica unívocamente al DLO)

"reference information" (los "reference information" (los identificadores del recurso) identificadores del recurso)

"archive_ID" (identificador de la "archive_ID" (identificador de la localización del DLO)localización del DLO)

"relationship" (relaciones existentes "relationship" (relaciones existentes entre el DLO y otro u otros DLO) entre el DLO y otro u otros DLO)

"context nformation" (relación del DLO "context nformation" (relación del DLO con su contexto)con su contexto)

"fixity" (información sobre si el DLO "fixity" (información sobre si el DLO ha sido alterado de ha sido alterado de forma no forma no autorizada o no registrada)autorizada o no registrada)

"provenance information" (la historia "provenance information" (la historia del DLO)del DLO)

"archive_history" (historia de hechos "archive_history" (historia de hechos referentes al archivo del DLO)referentes al archivo del DLO)

"objectCharacteristics" "objectCharacteristics" (características técnicas del DLO) (características técnicas del DLO)

"custody history" (datos de las "custody history" (datos de las organizaciones que han sido organizaciones que han sido depositarias)depositarias)

"reformatted_original_information" "reformatted_original_information" (información sobre las condiciones del (información sobre las condiciones del documento original)documento original)

"management history" (modificaciones "management history" (modificaciones realizadas en el DLO para su realizadas en el DLO para su preservación)preservación)

"archive_date_time" (fecha y hora de "archive_date_time" (fecha y hora de creación, copia de seguridad, etc.)creación, copia de seguridad, etc.)

"rights management" (información "rights management" (información sobre los derechos de propiedad sobre los derechos de propiedad intelectual relativos al DLO)intelectual relativos al DLO)

Page 23: Bibliotecas Digitales UNLA Modulo 6

Software para acciones Software para acciones de preservación digitalde preservación digital

Reconocimiento y validación de formatosReconocimiento y validación de formatos

/ Extracción de metadatos/ Extracción de metadatos• JHOVE, Harvard Library y JSTOR (valida y extrae JHOVE, Harvard Library y JSTOR (valida y extrae

metadatos)metadatos)• XENA (XENA (www.sourceforge.net), de la Biblioteca ), de la Biblioteca

Nacional Australia, también normaliza a XML Nacional Australia, también normaliza a XML • DROID (UK National Archives)DROID (UK National Archives)• NLNZ Metadata Extractor (National Library Nueva NLNZ Metadata Extractor (National Library Nueva

Zelanda): extrae Zelanda): extrae metadatos de archivos metadatos de archivos digitales para crear los metadatos de preservación.digitales para crear los metadatos de preservación.

EmulaciónEmulación

• Dioscuri (National Library and National Archiev de Dioscuri (National Library and National Archiev de Holanda)Holanda)

Chequeos de integridadChequeos de integridad (correrlos al recibir o crear un nuevo archivo, y conservar la clave que (correrlos al recibir o crear un nuevo archivo, y conservar la clave que se produce para cada archivo. Contra esa clave se comprueba en el se produce para cada archivo. Contra esa clave se comprueba en el futuro que no haya habido corrupción de los bytes del archivo) futuro que no haya habido corrupción de los bytes del archivo)

• MD5MD5• HashHash

Page 24: Bibliotecas Digitales UNLA Modulo 6

Proyecto Preservación Digital Proyecto Preservación Digital en Bibliotecas Argentinasen Bibliotecas Argentinas

Contexto:Contexto:

En Argentina hay escasa o nula conciencia en relación En Argentina hay escasa o nula conciencia en relación con la con la preservación digitalpreservación digital No hay políticas, estándares o accionesNo hay políticas, estándares o acciones Es un problema crítico para cualquier institución que Es un problema crítico para cualquier institución que genere, genere, adquiera o utilice información digitaladquiera o utilice información digital

Marco institucional:Marco institucional:

Dirección Técnica: Biblioteca Central de la Facultad de Dirección Técnica: Biblioteca Central de la Facultad de Ciencias Ciencias Exactas y Naturales de la Exactas y Naturales de la

Universidad de Buenos AiresUniversidad de Buenos Aires Subsidio del Programa TICs de la SECYTSubsidio del Programa TICs de la SECYT 18 Instituciones participantes18 Instituciones participantes

Page 25: Bibliotecas Digitales UNLA Modulo 6

Proyecto Preservación Digital Proyecto Preservación Digital en Bibliotecas Argentinasen Bibliotecas Argentinas

Objetivos generales:Objetivos generales:

Explorar los problemas, situaciones y estrategias Explorar los problemas, situaciones y estrategias referidas a lareferidas a la

preservación del conocimiento en formato digitalpreservación del conocimiento en formato digital

Promover el registro, acceso y preservación de la Promover el registro, acceso y preservación de la producción producción científica, técnica y cultural en código digital científica, técnica y cultural en código digital en instituciones en instituciones argentinasargentinas

Page 26: Bibliotecas Digitales UNLA Modulo 6

Proyecto Preservación Digital Proyecto Preservación Digital en Bibliotecas Argentinasen Bibliotecas Argentinas

Objetivos específicos:Objetivos específicos:

Evaluar el estado de la digitalización y de la organización de Evaluar el estado de la digitalización y de la organización de colecciones digitalescolecciones digitales en bibliotecas de instituciones científicas, en bibliotecas de instituciones científicas, técnicas y culturales, con énfasis en las estrategias y procedimientos técnicas y culturales, con énfasis en las estrategias y procedimientos de de preservación de los objetos digitalespreservación de los objetos digitales

Sensibilizar, transmitir conceptos y delinear estrategias y Sensibilizar, transmitir conceptos y delinear estrategias y procedimientosprocedimientos para la preservación a largo plazo de objetos para la preservación a largo plazo de objetos digitales en instituciones científicas, técnicas y culturalesdigitales en instituciones científicas, técnicas y culturales

Realizar una Realizar una experiencia pilotoexperiencia piloto en la definición de estándares y en la definición de estándares y pautas de digitalización en una colección de documentos referidos a pautas de digitalización en una colección de documentos referidos a la Historia de la Facultad de Ciencias Exactas y Naturales de la la Historia de la Facultad de Ciencias Exactas y Naturales de la Universidad de Buenos Aires, con establecimiento de estrategias y Universidad de Buenos Aires, con establecimiento de estrategias y procedimientos para la preservación digital a largo plazo procedimientos para la preservación digital a largo plazo

Page 27: Bibliotecas Digitales UNLA Modulo 6

Proyecto Preservación Digital en Bibliotecas Proyecto Preservación Digital en Bibliotecas Argentinas: Estado de avanceArgentinas: Estado de avance

ETAPAETAPA ESTADOESTADO

Bibliografía comentada sobre preservación digitalBibliografía comentada sobre preservación digital FinalizadaFinalizada

Curso sobre preservación digital para 48 Curso sobre preservación digital para 48 institucionesinstituciones

FinalizadaFinalizada

Diagnóstico de 18 instituciones sobre el estado de Diagnóstico de 18 instituciones sobre el estado de sus colecciones digitales. Taller de puesta en sus colecciones digitales. Taller de puesta en comúncomún

FinalizadaFinalizada

Trazado de estrategias institucionales para Trazado de estrategias institucionales para la pres. digital. Taller de puesta en comúnla pres. digital. Taller de puesta en común

FinalizadaFinalizada

Experiencia piloto en la Biblioteca Central de Experiencia piloto en la Biblioteca Central de la FCEYN-UBAla FCEYN-UBA

FinalizadaFinalizada

Page 28: Bibliotecas Digitales UNLA Modulo 6

Diagnóstico sobre Preservación Digital: Diagnóstico sobre Preservación Digital: Datos de la EncuestaDatos de la Encuesta

Información de la colecciónInformación de la colección

Finalidad / Criterios de selecciónFinalidad / Criterios de selección

Tipo de objeto digitalTipo de objeto digital

Formato de los archivos por tipo de objeto digitalFormato de los archivos por tipo de objeto digital

Archivos únicos / múltiplesArchivos únicos / múltiples

Nro. de documentos, nro. de objetosNro. de documentos, nro. de objetos

Crecimiento estimadoCrecimiento estimado

Modos de accesoModos de acceso

Software de gestión de las colecciones digitalesSoftware de gestión de las colecciones digitales

Objetivo:Objetivo: Conocer las características de las colecciones de objetos digitales Conocer las características de las colecciones de objetos digitales agrupados según el tipo de documento (contenidos), para las que se hayan agrupados según el tipo de documento (contenidos), para las que se hayan

establecido procedimientos de registro, descripción, preservación y accesoestablecido procedimientos de registro, descripción, preservación y acceso

Page 29: Bibliotecas Digitales UNLA Modulo 6

Diagnóstico sobre Preservación Digital: Diagnóstico sobre Preservación Digital: Datos de la EncuestaDatos de la Encuesta

Información de la captura para documentos Información de la captura para documentos digitalizadosdigitalizados

Estrategia imágenes máster / otros formatos de menor calidadEstrategia imágenes máster / otros formatos de menor calidad

Parámetros de capturaParámetros de captura

Dispositivos de capturaDispositivos de captura

Software de capturaSoftware de captura

Método de evaluación de calidadMétodo de evaluación de calidad

Métodos de edición o mejora de los objetos digitalizadosMétodos de edición o mejora de los objetos digitalizados

Objetivo: Conocer las formas de digitalización de las Objetivo: Conocer las formas de digitalización de las

colecciones con miras a su futura preservacióncolecciones con miras a su futura preservación

Page 30: Bibliotecas Digitales UNLA Modulo 6

Diagnóstico sobre Preservación Digital: Diagnóstico sobre Preservación Digital: Datos de la EncuestaDatos de la Encuesta

Edición de los objetos digitalesEdición de los objetos digitales

Conversión inicial de formatosConversión inicial de formatos

Evaluación de calidad de los formatosEvaluación de calidad de los formatos

Métodos de recuperación del texto (OCR / Tipeado)Métodos de recuperación del texto (OCR / Tipeado)

Marca de aguaMarca de agua

Métodos de compresión utilizadosMétodos de compresión utilizados

Software de ediciónSoftware de edición

Objetivo: Conocer las formas de tratamiento de los objetos Objetivo: Conocer las formas de tratamiento de los objetos

digitales con miras a su futura preservacióndigitales con miras a su futura preservación

Page 31: Bibliotecas Digitales UNLA Modulo 6

Diagnóstico sobre Preservación Digital: Diagnóstico sobre Preservación Digital: Datos de la EncuestaDatos de la Encuesta

Nombramiento de los archivosNombramiento de los archivos

Esquemas de nombramientoEsquemas de nombramiento

Métodos de aplicación y control de los esquemas de Métodos de aplicación y control de los esquemas de nombramientonombramiento

Objetivo: Conocer los modos de nombrar los archivos correspondientes a los Objetivo: Conocer los modos de nombrar los archivos correspondientes a los

objetos digitales con miras a facilitar su identificación rápida y consistenteobjetos digitales con miras a facilitar su identificación rápida y consistente

MetadatosMetadatos

Metadatos totales y metadatos de preservación digitalMetadatos totales y metadatos de preservación digital

Uso de esquemas de metadatosUso de esquemas de metadatos

Software para el registro y gestión de metadatosSoftware para el registro y gestión de metadatos

Objetivo: Conocer los datos a través de los cuales se describen los Objetivo: Conocer los datos a través de los cuales se describen los

documentos digitales en forma general, y en particular los datos documentos digitales en forma general, y en particular los datos

que son útiles para la preservación a largo plazoque son útiles para la preservación a largo plazo

Page 32: Bibliotecas Digitales UNLA Modulo 6

Diagnóstico sobre Preservación Digital: Diagnóstico sobre Preservación Digital: Datos de la EncuestaDatos de la Encuesta

Almacenamiento de las colecciones digitalesAlmacenamiento de las colecciones digitales

Formas de almacenamientoFormas de almacenamiento

Redundancia de copiasRedundancia de copias

Identificación de los dispositivos removibles de Identificación de los dispositivos removibles de almacenamientoalmacenamiento

Chequeos de integridad de dispositivos y de archivosChequeos de integridad de dispositivos y de archivos

Previsión para copias de refrescoPrevisión para copias de refresco

Otras medidas de seguridadOtras medidas de seguridad

Objetivo: Conocer los medios y características del almacenamiento Objetivo: Conocer los medios y características del almacenamiento

con miras a la preservación de los objetos digitalescon miras a la preservación de los objetos digitales

Page 33: Bibliotecas Digitales UNLA Modulo 6

Diagnóstico sobre Preservación Digital: Diagnóstico sobre Preservación Digital: Datos de la EncuestaDatos de la Encuesta

Estrategias específicas de preservación digitalEstrategias específicas de preservación digital

Previsiones para la migración de formatosPrevisiones para la migración de formatos EmulaciónEmulación Otras estrategiasOtras estrategias

Objetivo: Conocer las previsiones de migración de formatos como prevención a la Objetivo: Conocer las previsiones de migración de formatos como prevención a la obsolescencia de los mismos y de las aplicaciones con las que se producenobsolescencia de los mismos y de las aplicaciones con las que se producen

Page 34: Bibliotecas Digitales UNLA Modulo 6

Diagnóstico sobre Preservación Digital: Diagnóstico sobre Preservación Digital: Datos de la EncuestaDatos de la Encuesta

Grado de apoyo informático o recursos de personal Grado de apoyo informático o recursos de personal informáticoinformático

Objetivo: Conocer la asistencia en personal informático a las actividades de Objetivo: Conocer la asistencia en personal informático a las actividades de

gestión de colecciones digitales, por parte de las instituciones, gestión de colecciones digitales, por parte de las instituciones,

con miras a analizar la factibilidad de las actividades de preservacióncon miras a analizar la factibilidad de las actividades de preservación

Colaboración entre institucionesColaboración entre instituciones

Objetivo: Conocer la existencia de actividades de colaboración interinstitucional Objetivo: Conocer la existencia de actividades de colaboración interinstitucional referidas a estrategias de preservación como el “guarda compartida”referidas a estrategias de preservación como el “guarda compartida”

Tipo de financiación para las iniciativas digitalesTipo de financiación para las iniciativas digitales

Objetivo: Conocer las fuentes de financiamiento en las que se sustentan estas Objetivo: Conocer las fuentes de financiamiento en las que se sustentan estas iniciativasiniciativas

Page 35: Bibliotecas Digitales UNLA Modulo 6

Proyecto Preservación Digital en Bibliotecas Argentinas:Proyecto Preservación Digital en Bibliotecas Argentinas: Diagnóstico: Finalidad de las coleccionesDiagnóstico: Finalidad de las colecciones

0

2

4

6

8

10

12

de

re

sp

ue

sta

s

Reducirmanipulación

(D)

Ahorrarespacio (D)

Difundir laproduccion

(ND)

Mejorar acceso Importanciaacademica

Valor histo-cultural

Otros Generaringresos

Criterios de Digitalización y selección de originales

Digitalizados

Nacidos Digitales

Page 36: Bibliotecas Digitales UNLA Modulo 6

Proyecto Preservación Digital en Bibliotecas Argentinas:Proyecto Preservación Digital en Bibliotecas Argentinas: Diagnóstico: Cantidad de objetos digitalesDiagnóstico: Cantidad de objetos digitales

Rango de items digitalizados y Nacidos Digitales

0

1

2

3

4

5

6

7

8

9

10

Digitalizados Nacidos Digital

de

Pro

yect

os

de 1 a 999

1.000 a 10.000

Page 37: Bibliotecas Digitales UNLA Modulo 6

Proyecto Preservación Digital en Bibliotecas Argentinas:Proyecto Preservación Digital en Bibliotecas Argentinas: Diagnóstico: Tipo y cantidad de objetos Diagnóstico: Tipo y cantidad de objetos

digitalizadosdigitalizados

35000

0 78 150 0 0

010

000

2000

030

000

de

ob

jeto

s d

igit

aliz

ado

s

Tipo y Cantidad de originales digitalizados

Textos e imag.MicrofilmAudioVideoPeliculasOtros

Page 38: Bibliotecas Digitales UNLA Modulo 6

Proyecto Preservación Digital en Bibliotecas Argentinas:Proyecto Preservación Digital en Bibliotecas Argentinas: Diagnóstico: Tipo y cantidad de objetos Diagnóstico: Tipo y cantidad de objetos

digitalizadosdigitalizados

DigitalizadosDigitalizados Nacidos digitalesNacidos digitales

Modo de acceso

Acceso Web;6

Uso interno;

3

Modo de acceso

Uso interno;

3

Acceso Web;6

CD; 3

Page 39: Bibliotecas Digitales UNLA Modulo 6

Proyecto Preservación Digital en Bibliotecas Argentinas:Proyecto Preservación Digital en Bibliotecas Argentinas: Diagnóstico: Tipo de metadatosDiagnóstico: Tipo de metadatos

Metadatos Registrados

0 2 4 6 8 10 12 14

Información del item físico

Nombre del archivo digital

Extensión del archivo

Parámetros Técnicos (resolución, peso, etc.)

Nombre del master

Nombre de la copia de acceso

Datos de dispositivo de captura (D)

Software de creación

Software de lectura

Productor de digitalización

Fecha de creación

Derechos de acceso y uso

Datos de almacenamiento

Otros

Nº de Instituciones

Page 40: Bibliotecas Digitales UNLA Modulo 6

Proyecto Preservación Digital en Bibliotecas Argentinas:Proyecto Preservación Digital en Bibliotecas Argentinas: Diagnóstico: Esquemas noramlizados de metadatosDiagnóstico: Esquemas noramlizados de metadatos

Metadatos: ¿esquema normalizado?

si; 3

no; 6

si

no

Esquemas normalizados metadatos

0

1

2

3

4

5

6

7

MODS (en uso) DC (a prueba) MIX (a prueba) Ninguno

Ca

nti

dad

pro

yect

os

Page 41: Bibliotecas Digitales UNLA Modulo 6

Proyecto Preservación Digital en Bibliotecas Argentinas:Proyecto Preservación Digital en Bibliotecas Argentinas: Diagnóstico: Nombramiento de los archivosDiagnóstico: Nombramiento de los archivos

DigitalizadosDigitalizados Nacidos DigitalesNacidos Digitales¿Esquema de nombre de archivo normalizado?

NO; 2

SI; 6

¿Verifican exactitud de nombres de archivos generados?

SI; 6

NO; 2

Generación de nombres de archivo

Automatico;1

Manual; 7

¿Esquema de nombre de archivos normalizados?

SI; 9

NO; 1

¿Revisan aplicación de nombres?

SI; 7

NO; 3

Page 42: Bibliotecas Digitales UNLA Modulo 6

Proyecto Preservación Digital en Bibliotecas Argentinas:Proyecto Preservación Digital en Bibliotecas Argentinas: Diagnóstico: Software de gestiónDiagnóstico: Software de gestión

Sotware de gestión

0

0,5

1

1,5

2

2,5

Greenstone Isis Software propio FAO/Webagris Otros Ninguno

de

inst

itu

cio

nes

Page 43: Bibliotecas Digitales UNLA Modulo 6

Proyecto Preservación Digital en Bibliotecas Argentinas:Proyecto Preservación Digital en Bibliotecas Argentinas: Diagnóstico: Medios de almacenamientoDiagnóstico: Medios de almacenamiento

Almacenamiento

0

1

2

3

4

5

6

7

8

C de un servidorlocal

CD C de un servidorgeneral de lainstitución

C de unacomputadora

común de trabajo

DVD Otros dispositivos(disco WORM,ZIPdrive, etc.)

de

Inst

itu

cio

nes

4

3

4

0

1

2

3

4

Can

t. I

nsti

tuc

ion

es

Sólo una c opia Hasta 2 copias Más de 2 copias

Cantidad copias

Redundancia declarada

Page 44: Bibliotecas Digitales UNLA Modulo 6

Proyecto Preservación Digital en Bibliotecas Argentinas:Proyecto Preservación Digital en Bibliotecas Argentinas: Diagnóstico: Obsolescencia de formatos y uso de Diagnóstico: Obsolescencia de formatos y uso de

imágenes masterimágenes master

DigitalizadosDigitalizados Nacidos DigitalesNacidos Digitales

¿Previó futuras migraciones de formato?

Si; 4

NO; 4

Si

NO

¿Crea master de archivo y copias de acceso?

Si; 5

No; 4

Si

No

Previsión de obsolescencia de formatos

NO; 6

SI; 4

SI

NO

Page 45: Bibliotecas Digitales UNLA Modulo 6

Proyecto Preservación Digital en Bibliotecas Argentinas:Proyecto Preservación Digital en Bibliotecas Argentinas: Diagnóstico: Chequeo de archivos y de medios de Diagnóstico: Chequeo de archivos y de medios de

almacenamientoalmacenamiento¿Chequea integridad archivos?

8

0

3

0

5

10

No Si No se

Opciones

Ca

nt.

in

sti

tuc

ion

es

¿Chequean medios almacenamiento?

5

3 3

0

1

2

3

4

5

6

No Si No sé

Opciones

Ca

nt.

in

sti

tuc

ion

es

Page 46: Bibliotecas Digitales UNLA Modulo 6

Proyecto Preservación Digital en Bibliotecas Argentinas:Proyecto Preservación Digital en Bibliotecas Argentinas: Diagnóstico: Copias de refrescoDiagnóstico: Copias de refresco

¿Planean copias de refresco?

No; 4

Sí; 7

1

2

3

0

1

0

1

2

3

Ca

nt.

ins

titu

cio

ne

s

1 Año 2 años 5 años 10 años Sin decidir

Opciones

Frecuencia planeada - copias refresco

Page 47: Bibliotecas Digitales UNLA Modulo 6

Proyecto PDBA: Proyecto PDBA: Impactos en la Biblioteca Central Leloir:Impactos en la Biblioteca Central Leloir:

Metadatos de preservación para las fotografías Metadatos de preservación para las fotografías

Hardware de capturaHardware de captura Información sobre escáneres o Información sobre escáneres o cámaras digitales utilizadascámaras digitales utilizadas

Software de creaciónSoftware de creación Programas con los que se crearon Programas con los que se crearon los archivos (incluidos en el los archivos (incluidos en el hardware de captura)hardware de captura)

Software de lecturaSoftware de lectura Programas que permiten ver las Programas que permiten ver las fotos. Ej. Office Picture Managerfotos. Ej. Office Picture Manager

Software de ediciónSoftware de edición Programas con que se ha Programas con que se ha modificado o comprimido la foto, o modificado o comprimido la foto, o agregado marca de aguaagregado marca de agua

Acciones de preservaciónAcciones de preservación Acciones prescritas o realizadas Acciones prescritas o realizadas para la preservación. Ej. migraciónpara la preservación. Ej. migración

Procedencia e historia del Procedencia e historia del objeto originalobjeto original

Condiciones del objeto originar. Ej. Condiciones del objeto originar. Ej. formatosformatos

Formato digital (extracción Formato digital (extracción automáticaautomática

Nombre, extensión, formato, peso Nombre, extensión, formato, peso del archivodel archivo

Page 48: Bibliotecas Digitales UNLA Modulo 6

Proyecto PDBA: Proyecto PDBA: Impactos en la Biblioteca Central Leloir:Impactos en la Biblioteca Central Leloir:

Archivo de fotografías Archivo de fotografías

En la captura de imágenes:En la captura de imágenes:

La imágenes blanco y negro de fotografías antiguas La imágenes blanco y negro de fotografías antiguas van a ser escaneadas a colorvan a ser escaneadas a color

Captura de imágenes a 600 dpiCaptura de imágenes a 600 dpi

Generación de imágenes MasterGeneración de imágenes Master

En el almacenamiento:En el almacenamiento:

Estrategia de copias múltiples soportes múltiples Estrategia de copias múltiples soportes múltiples (magnéticos y (magnéticos y

ópticos)ópticos)

Page 49: Bibliotecas Digitales UNLA Modulo 6

Proyecto Preservación Digital Proyecto Preservación Digital en Bibliotecas Argentinasen Bibliotecas Argentinas

Grupo de discusión sobre Preservación DigitalGrupo de discusión sobre Preservación Digital

http://espanol.groups.yahoo.com/group/PRESERVACION-DIGITAL-BIBLIOTECA-LELOIR-FCEYN-UBA

/