gestión de los documentos digitales serra serra jordi

16
El profesional de la información, vol. 10, nº 9, septiembre 2001 4 Artículos Gestión de los documentos digitales: estrategias para su conservación Por Jordi Serra Serra Resumen: La voluntad de conservar de forma permanente los documentos digitales ha estado presente desde los primeros tiempos de la revolución informática. Sin embargo, han sido pocas las experiencias de crear archivos digitales, debido principalmente a la dificultad para encontrar soluciones técnicas a los problemas de obsolescencia, al alto coste económico y a la ausencia de instituciones que asuman esta responsabilidad. Este artículo analiza las estrategias de conservación aplicadas hasta el momento, y reflexiona sobre los planteamientos metodológicos que han inspirado las mismas, las tendencias actuales y su viabilidad futura. A continuación expone las dos opciones para identificar el documento digital y establecer sus límites, operación previa a la aplicación de cualquier estrategia de conservación. Finalmente describe cómo se puede facilitar esta identificación aplicando metodologías de evaluación y selección propias de la archivística, y propone las reglas de evaluación documental como la herramienta fundamental que permite definir una política de conservación de los documentos digitales. Palabras clave: Documentos digitales, Archivos digitales, Preservación digital, Documentos electrónicos, Evaluación y selección, Expurgo. Title: Electronic records management: strategies for long term preservation Abstract: The idea of long term preservation of electronic records has been present since the early days of the computer revolution. However, there have been few documented experiences of creating digital archives, mainly due to the difficulty of finding technical solutions to the problems of obsolescence, high costs and a lack of institutions able to assume this responsibility. This paper begins by analysing the preservation strategies applied to date and reflecting upon the methodological underpinnings of these strategies, current trends and future viability. Next it presents two options for identifying electronic records and defining their limits, a necessary step prior to applying any preservation strategy. Finally it describes how archival appraisal can facilitate this identification process and proposes appraisal schedules as the main tools for defining an electronic records preservation policy. Keywords: Digital documents, Digital files, Digital archive, Digital preservation, Electronic records, Appraisal, Appraisal schedules. Serra Serra, Jordi. “Gestión de los documentos digitales: estrategias para su conservación”. En: El profesional de la información, 2001, septiembre, v. 10, n. 9, pp. 4-18. Jordi Serra Serra Introducción El interés por el archivo de los documentos digita- les está creciendo a medida que se generaliza el e-busi- ness. El comercio electrónico es el hecho que hace más evidente la necesidad de capturar y perpetuar las tran- sacciones realizadas telemáticamente. ¿Qué sentido tie- ne garantizar la seguridad de una transacción electróni- ca y la autenticidad de sus intervinientes y de su conte- nido, si esta información no puede ser utilizada como evidencia un tiempo después? La firma digital ha sido la llave que ha hecho posible la expansión del comer- cio electrónico, pero al mismo tiempo ha subido el lis- tón de las dificultades para la conservación a largo pla- zo de los documentos digitales 1 , un campo con un de- sarrollo, tanto técnico como legislativo, todavía insufi- ciente. Es paradigmático el hecho de que los autores de la directriz europea sobre la firma electrónica tan sólo regularon su utilización, pero obviaron que los docu- mentos firmados digitalmente requieren unos procedi- mientos controlados de archivo cuando deben conser- var su valor legal durante todo el tiempo que la legisla- ción estipula 2 . El Real decreto ley 14/1999 3 , que desa- rrolla la directriz europea, tampoco recoge esta necesi- dad, con más gravedad por cuanto que desde la Ley 30/1992 la conservación se considera una garantía del valor legal de los documentos digitales 4 . El objetivo de este artículo es comentar las dife- rentes tendencias dentro de las estrategias para la con- servación a largo plazo de los documentos digitales. Artículo recibido el 01-07-01 Aceptación definitiva: 07-09-01 Jordi Serra Serra. Facultat de Biblioteconomia i Documentació. Univ. de Barcelona. [email protected]

Upload: cursobd2008

Post on 07-Jun-2015

2.225 views

Category:

Documents


4 download

TRANSCRIPT

Page 1: Gestión de los documentos digitales Serra Serra Jordi

El profesional de la información, vol. 10, nº 9, septiembre 20014

ArtículosGestión de los documentos digitales:

estrategias para su conservaciónPor Jordi Serra Serra

Resumen: La voluntad de conservar de forma permanente los documentos digitales ha estadopresente desde los primeros tiempos de la revolución informática. Sin embargo, han sido pocas lasexperiencias de crear archivos digitales, debido principalmente a la dificultad para encontrarsoluciones técnicas a los problemas de obsolescencia, al alto coste económico y a la ausencia deinstituciones que asuman esta responsabilidad. Este artículo analiza las estrategias deconservación aplicadas hasta el momento, y reflexiona sobre los planteamientos metodológicos quehan inspirado las mismas, las tendencias actuales y su viabilidad futura. A continuación expone lasdos opciones para identificar el documento digital y establecer sus límites, operación previa a laaplicación de cualquier estrategia de conservación. Finalmente describe cómo se puede facilitaresta identificación aplicando metodologías de evaluación y selección propias de la archivística, ypropone las reglas de evaluación documental como la herramienta fundamental que permite definiruna política de conservación de los documentos digitales.

Palabras clave: Documentos digitales, Archivos digitales, Preservación digital, Documentoselectrónicos, Evaluación y selección, Expurgo.

Title: Electronic records management: strategies for long term preservation

Abstract: The idea of long term preservation of electronic records has been present since the earlydays of the computer revolution. However, there have been few documented experiences of creatingdigital archives, mainly due to the difficulty of finding technical solutions to the problems ofobsolescence, high costs and a lack of institutions able to assume this responsibility. This paperbegins by analysing the preservation strategies applied to date and reflecting upon themethodological underpinnings of these strategies, current trends and future viability. Next it

presents two options for identifying electronic records and defining their limits, a necessary step prior to applying any preservation strategy. Finally itdescribes how archival appraisal can facilitate this identification process and proposes appraisal schedules as the main tools for defining an electronicrecords preservation policy.

Keywords: Digital documents, Digital files, Digital archive, Digital preservation, Electronic records, Appraisal, Appraisal schedules.

Serra Serra, Jordi. “Gestión de los documentos digitales: estrategias para su conservación”. En: El profesional de la información, 2001, septiembre,v. 10, n. 9, pp. 4-18.

Jordi Serra Serra

Introducción

El interés por el archivo de los documentos digita-les está creciendo a medida que se generaliza el e-busi-ness. El comercio electrónico es el hecho que hace másevidente la necesidad de capturar y perpetuar las tran-sacciones realizadas telemáticamente. ¿Qué sentido tie-ne garantizar la seguridad de una transacción electróni-ca y la autenticidad de sus intervinientes y de su conte-nido, si esta información no puede ser utilizada comoevidencia un tiempo después? La firma digital ha sidola llave que ha hecho posible la expansión del comer-cio electrónico, pero al mismo tiempo ha subido el lis-tón de las dificultades para la conservación a largo pla-zo de los documentos digitales1, un campo con un de-sarrollo, tanto técnico como legislativo, todavía insufi-

ciente. Es paradigmático el hecho de que los autores dela directriz europea sobre la firma electrónica tan sóloregularon su utilización, pero obviaron que los docu-mentos firmados digitalmente requieren unos procedi-mientos controlados de archivo cuando deben conser-var su valor legal durante todo el tiempo que la legisla-ción estipula2. El Real decreto ley 14/19993, que desa-rrolla la directriz europea, tampoco recoge esta necesi-dad, con más gravedad por cuanto que desde la Ley30/1992 la conservación se considera una garantía delvalor legal de los documentos digitales4.

El objetivo de este artículo es comentar las dife-rentes tendencias dentro de las estrategias para la con-servación a largo plazo de los documentos digitales.

Artículo recibido el 01-07-01Aceptación definitiva: 07-09-01

Jordi Serra Serra. Facultat de Biblioteconomia i Documentació. Univ. de [email protected]

Page 2: Gestión de los documentos digitales Serra Serra Jordi

5El profesional de la información, vol. 10, nº 9, septiembre 2001

Gestión de los documentos digitales: estrategias para su conservación

Iniciativas existentesSon numerosos los proyectos internacionales que

están estudiando los varios aspectos que condicionanla conservación de los documentos digitales y de suvalor evidencial. Sin ánimo de exhaustividad, destaca-mos en primer lugar el proyecto Interpares (Interna-tional Research on Permanent Authentic Records inElectronic Systems), compuesto por seis grupos de in-vestigación de Canadá, USA, Norte de Europa, Italia,Australia, y Este de Asia, y que tiene como base el es-tudio The preservation of the integrity of electronic re-

cords realizado entre 1994 y 1997 por la Uni-versidad de British Columbia. Otra iniciativa adestacar es el Cerar (Center for Electronic Re-cordkeeping & Archival Research), que recogelos trabajos de la Universidad de Pittsburgh(Functional requirements for evidence in re-cordkeeping), puestos en práctica en el Phila-delphia electronic records project (Perp). En elReino Unido, el Public Record Office desarro-lla desde 1995 el proyecto Eros (Electronic re-cords from office systems). El organismo Natio-

nal Archives of Australia dispone de una sección dedi-cada a los documentos digitales, que experimenta consu gestión y publica interesantes trabajos. También esimportante el Dutch Digital Repository (Digiduur), unproyecto holandés que tiene por objetivos adquirir ex-periencia concreta en la preservación de los documen-tos digitales y conseguir una toma de conciencia a ni-vel político.

Conceptos básicos

La conservación de los documentos digitales pre-senta una doble problemática5. En una primera fase esnecesario crear y mantener documentos activos y se-miactivos fiables y auténticos. Esto significa preservarlos valores primarios de los documentos, es decir elvalor del documento como evidencia de un hecho aefectos de su utilización dentro de un procedimientoadministrativo o proceso de negocio6. En una segundaetapa se deben conservar los documentos inactivos au-ténticos por sus valores secundarios, es decir por el va-lor intrínseco de la información que contienen7.

«¿Qué sentido tiene garantizarla fiabilidad de una transacciónelectrónica y la autenticidad desus intervinientes y de su con-tenido si esta información nopuede ser utilizada como evi-dencia un tiempo después?»

En el contexto de la preservación de los valoresprimarios la problemática va asociada a la dificultadpara identificar el documento electrónico, y al estable-cimiento de sus límites y partes componentes (figura1). El objetivo es conservar el documento como unaentidad intelectual u objeto lógico, no como entidad fí-sica8. En el entorno digital la mayoría de los métodosde preservación de la integridad que se aplican (firmadigital, contraseñas, watermarks o filigranas, etc.) es-tán basados en una concepción unitaria del documen-to. Sin embargo los estándares de facto basados en

Universidad de British Columbia

Propone un modelo de actuación que tiene porobjetivos:

—Establecer cómo reconocer e identificar un do-cumento en el entorno digital.

—Determinar qué tipos de sistemas informáticosgeneran documentos.

—Formular los criterios para segregar los docu-mentos del resto de conjuntos de datos generadospor los sistemas informáticos.

—Definir los requerimientos conceptuales paragarantizar la fiabilidad y la autenticidad de los docu-mentos en los sistemas electrónicos.

Este modelo parte de la definición de un docu-mento tradicional completo (que tiene todas las par-tes: contenido, estructura y contexto administrativo ydocumental), fiable (que su contenido es cierto) y au-téntico (que es original, si ha sido transmitido de for-ma controlada y conservado y custodiado sin altera-ciones). Esta definición se extrapola a lo que debe con-siderarse un documento electrónico completo, fiable yauténtico, al que se añade un contexto tecnológico. Elmodelo establece tres espacios de trabajo (individual,de grupo y general o corporativo), y define los estadosdel documento electrónico en relación con estos es-pacios. Un documento generado en el espacio indivi-dual es un borrador, y sólo se convierte en originalcuando atraviesa una frontera electrónica. Es a partirde este momento cuando se debe controlar cualquiermodificación para que el documento se considere au-téntico.

Figura 1. El documento digital ha perdido la unidad física del documentotradicional

Page 3: Gestión de los documentos digitales Serra Serra Jordi

El profesional de la información, vol. 10, nº 9, septiembre 20016

Jordi Serra Serra

sgml, firmes candidatos a formatos de conservación alargo plazo, se basan en un modelo de documentocompuesto de diferentes documentos o partes de ellos,distribuido entre diferentes redes y sistemas informá-ticos, y que puede ser actualizado con gran facilidad ysin dejar rastro (dinámico). Podemos tomar comoejemplo xml, en el que las hojas de estilo permiten al-macenar la estructura fuera del contenido del docu-mento, e incluso definir una estructura común a unconjunto de contenidos.

En el ámbito de la conservación de los valores se-cundarios, la preocupación principal es tanto la con-servación física de los soportes como la legibilidad desu contenido, un problema que afecta conjuntamente ala documentación administrativa y a la cognitiva. Poresta razón los archivos y las bibliotecas nacionales es-tán trabajando en proyectos de conservación de los so-portes y documentos digitales. Es muy interesanteconsultar los numerosos trabajos publicados por elCouncil on Library and Information Resources (Clir)y las actividades de la European Comission on Preser-vation and Access (Ecpa), así como la obra: NationalPreservation Office. Digital culture: maximising thenation’s investment. Mary Feeney (ed.). London: Bri-tish Library Board, 1999.

http://www.clir.org

http://www.knaw.nl/ecpa/ecpatex/intro.htm

A medida que se ha asumido la independencia deldocumento electrónico de sus distintos soportes físicosha disminuido la problemática de la conservación físi-ca de los soportes puesto que, considerando que unacopia en el entorno informático es siempre una copiaidéntica, un cambio de soporte físico no implica nin-guna transformación en el documento. Ciertamente si-gue existiendo el reto de la conservación física de lossoportes digitales, pero su tratamiento no es el objetode este artículo, teniendo en cuenta que la duración delos soportes actuales, tanto ópticos como magneto-óp-ticos, proporciona un margen de tiempo suficiente co-mo para realizar un recopiado periódico (refreshing).

«A medida que se ha asumidola independencia del documen-to electrónico de sus distintossoportes físicos, ha disminuidola problemática de la conserva-

ción física de los soportes»

El problema de la legibilidad está asociado a la ob-solescencia tecnológica, tanto de hardware como desoftware. Como todos hemos experimentado, el plazo

de legibilidad de un documento de uso cotidiano pue-de oscilar entre los 10-20 años en el aspecto de hard-ware, y unos 5-10 años en el de software. Si este pla-zo puede ser admisible para documentos con vigencialimitada, no permite una planificación de la conserva-ción a medio o a largo plazo, por lo que se imponen so-luciones previas. Vamos a comentar con más detallecada una de estas soluciones.

1. Estrategias de conservación

Podemos identificar cuatro métodos para garan-tizar la accesibilidad futura de los documentos digi-tales9:

1.1. Preservación de la tecnología

La primera solución ha sido conservar la tecnolo-gía de la cual depende el documento. Para mantener elcontexto tecnológico de accesibilidad de los documen-tos digitales es necesario “congelar” el estado de latécnica en un momento determinado. Esto implicaconservar tanto el hardware como el software origina-les, y ocuparse de tenerlos en funcionamiento inclusocuando su obsolescencia sea ya completa, lo que en al-gunos casos ha conducido a la creación de verdaderosmuseos cibernéticos. Esta opción ha demostrado sereconómicamente inviable, y tan sólo es aplicable acorto y medio plazo, o como una medida extremacuando se trate de una información de gran importan-cia y no sea posible migrarla a un nuevo entorno tec-nológico actualizado.

1.2. Migración de la información digital

Se ha impuesto como la solución más aceptada pa-ra la creación y el mantenimiento de archivos digitales.Parte de la idea de que los documentos deben ser ac-cesibles a partir de los sistemas informáticos existentesen cada momento, lo que exige su migración periódi-ca a formatos inteligibles por los sistemas actuales.

Existen diversas estrategias de migración, cadauna de ellas adaptada a un determinado tipo de docu-mento digital.

—Cambio de medio. Esta estrategia pretendesubsanar la obsolescencia física, y consiste en un reco-piado periódico de los documentos digitales a soportesmás estables (por ejemplo, de soporte magnético a óp-tico). En su forma más extrema incluye la impresiónen papel o la microfilmación de los documentos digi-tales con tal de conservar la accesibilidad o legibilidaddel contenido, aun a costa de perder todas las funcio-nalidades del documento digital original.

Page 4: Gestión de los documentos digitales Serra Serra Jordi

7El profesional de la información, vol. 10, nº 9, septiembre 2001

Gestión de los documentos digitales: estrategias para su conservación

En 1978 los archivos nacionalesde Francia, a través del Centre desArchives Contemporaines, empezarona trabajar en la conservación de losdocumentos digitales generadospor la Administración Central fran-cesa. Esta actividad se concretó en1983 con la creación de un archivodigital y de un conjunto de métodosde trabajo que recibió el nombre deConstance (Conservation et stockagedes archives nouvelles constituées parl’électronique)10. El principal objetivode este proyecto era la conserva-ción permanente de los docu-mentos digitales con valor eviden-cial, mediante una evaluación previaque eliminaba los documentos sininterés histórico o con informaciónrepetitiva.

Inicialmente se usó la cinta mag-nética como medio de almacenaje,puesto que era el tipo de soporte deuso más extendido. Sin embargo lascondiciones de conservación eranexigentes y se hacía necesario un re-copiado periódico de las cintas (re-freshing). Su anunciada obsolescenciaobligó, a partir de 1995, a sustituir elsoporte magnético por el soporteóptico, iniciándose un laborioso pro-ceso de migración, que finalizó en199711. Esta operación se realizó conla previsión de unos diez años de re-lativa estabilidad, tras los cuales se-ría necesario iniciar una nueva mi-gración. Pero en 1998 se vio que laopción escogida había sido un errorestratégico, y fue necesario volver amigrar toda la documentación a cin-tas magnéticas DLT 4000.

Un punto importante para elmantenimiento de un archivo digitales la regulación del proceso detransferencia de documentos. Ac-tualmente la operativa del métodoConstance es la siguiente:

—Selección de los documentosa conservar en las misma oficinasproductoras, con el asesoramientodirecto de miembros del equipoConstance.

—Tratamiento de los documen-tos transferidos, migrándolos a unformato estándar (preferentementeascii) y elaborando los siguienteselementos descriptivos12:

a. Del sistema informático oaplicación que genera el documento.

b. Del proceso administrativo.

c. De la estructura del docu-mento.

d. Del contenido del documento.

e. Ficha técnica indicando el pe-so, número de registros, longitud,etc.

f. Diccionario de datos (cuandose trata de una base de datos).

—Prueba del documento en sunuevo formato usando la descrip-ción anterior.

—Fijación en un soporte defini-tivo y archivo seguro del documen-to, con las correspondientes copiasde seguridad.

La mayoría de los documentosconservados son ficheros estadísti-cos y censales o de gestión de per-sonal a partir de 1960. Los períodosde publicidad y las características delacceso a los documentos archivadosson establecidos por la CommissionNationale pour l’Informatique et les Li-bertés. Sin embargo, dado que la ma-yoría de documentos conservadoscontienen datos personales que, se-gún la legislación francesa, no pue-den ser públicos hasta pasados 100años, la difusión de los documentosse ha limitado hasta el momento alos usuarios internos de la propiaAdministración. Paradójicamente esmuy difícil justificar la inversión rea-lizada en un archivo histórico cuan-do existen tales restricciones a la di-fusión de su contenido.

Las conclusiones del proyectoConstance son las siguientes:

—Los costes de mantenimientode un archivo digital son imprevisi-bles, puesto que dependen de fac-tores externos al archivo, tanto de laevolución tecnológica como de laestructura de las organizaciones queproducen los documentos.

—La principal inversión para elmantenimiento de un archivo digitaldebe realizarse en la formación delos recursos humanos, puestoque los problemas tecnológicos se-rán cambiantes y su resolución de-penderá de las habilidades del per-sonal del archivo.

—Las decisiones sobre la meto-dología y la financiación de un archi-vo digital público deben ser tomadasal más alto nivel de gobierno.

La principal aportación del pro-yecto Constance es la experienciaobtenida en referencia a los costesde mantenimiento de un archivodigital de gran envergadura. Con an-terioridad al establecimiento deunos estándares de conservación, lavoluntad del Centre des Archives Con-temporaines era conservar ejempla-res de todos los programas y tiposde ordenadores utilizados por la Ad-ministración Central francesa, y enesta dirección dirigieron sus esfuer-zos. El coste de mantenimiento deeste archivo crecía de forma expo-nencial, y pronto adquirió dimensio-nes prohibitivas para los fondos pú-blicos que, coincidiendo con un re-corte presupuestario (1993), condu-jeron a la Administración a reducirla plantilla de 15 a 4 técnicos y a li-mitar los gastos en hardware. El pro-yecto, que hasta el momento habíasido impulsado por el Ministerio deCultura, pasó a depender directa-mente de los archivos nacionales, yse creó un grupo de trabajo intermi-nisterial para su seguimiento. En laactualidad, sin embargo, el coste delarchivo todavía es financiado ínte-gramente por el Ministerio de Cultura.El archivo se ha tenido que adaptar ala nueva situación, trabajando sólocon formatos de bajo nivel. Pero in-cluso con estas limitaciones el man-tenimiento de este archivo siguesiendo muy caro, y la cantidad nece-saria de personal altamente cualifica-do muy elevada.

Existe otro factor que aumentalos costes: mientras en un archivoadministrativo los fondos documen-tales pueden mantener estables susdimensiones gracias al expurgo, enun archivo histórico los fondos cre-cen constantemente. Por esta razón,considerando que aproximadamentecada diez años será necesario migrartodo el fondo documental a nuevossoportes y formatos, el volumen dedocumentos para cada migración se-rá mucho mayor y sus costes muchomás elevados.

El método Constance

Page 5: Gestión de los documentos digitales Serra Serra Jordi

El profesional de la información, vol. 10, nº 9, septiembre 20018

Jordi Serra Serra

—Compatibilidad retroactiva. Los programascomerciales permiten a menudo leer documentos crea-dos con versiones anteriores de una misma familia deprogramas, así como su migración a la versión actual.La compatibilidad retroactiva, sin embargo, está suje-ta a los cambios en la estrategia comercial de la em-presa productora del software. Además, este tipo demigración puede realizar alteraciones en la estructurainterna de los documentos digitales no deseables des-de el punto de vista legal, o que atenten a la autentici-dad del documento original.

—Interoperabilidad. Programas de distintas em-presas pueden compartir los mismos formatos de do-cumento digital. Esta estrategia comercial, practicadapor los principales productores de software, permitevisualizar documentos de un formato propietario conel programa de otra empresa y convertirlos a nuevosformatos propietarios. En este caso se reproducen losmismos problemas que en la compatibilidad retroacti-va: la dependencia de las políticas de empresa, y el ele-vado porcentaje de pérdida de datos.

—Conversión a formatos estándar. Podemosconsiderar esta opción una versión extendida de la in-teroperabilidad.

La existencia de formatos estándar es la principalgarantía de la conservación de la funcionalidad de losdocumentos digitales. Sin embargo, los formatos es-tándar válidos como formato final para la conserva-ción permanente no siempre pueden ser un formato detrabajo, como sucede por ejemplo en la edición de do-cumentos con sgml o xml. Esta estrategia, por lo tan-to, debe contemplar la utilización de un formato segu-ro (fiable y auténtico) durante el uso del documento,cuando tiene valores primarios, e incluir la posibilidad,cuando se quiera disponer el documento para su con-

Es un organismo dependiente dela Nara que tiene como misión ga-rantizar el acceso a los documentosdigitales de conservación permanen-te generados por las oficinas del Go-bierno Federal de los Estados Unidos.Este archivo digital constituye unavasta fuente de información, al mis-mo tiempo que sirve de evidencia ytestimonio de cómo las oficinas delGobierno Federal han llevado a cabosu acción política y administrativa. Elcentro recoge todo tipo de docu-mentos generados directamente enformato digital, tales como bases dedatos, documentos de texto o siste-mas de información geográfica. Losdocumentos digitales conservadospor la Nara constituyen asimismo untestimonio de la evolución de la tec-nología informática. Los más anti-guos datan de la Segunda GuerraMundial, aunque la mayor parte delos documentos son posteriores a1960.

El Center for Electronic Records haestablecido unas normas para latransferencia de documentos elec-trónicos a su archivo digital por par-te de las oficinas federales. En re-

ferencia al soporte, admite tantocintas magnéticas como cd-rom, yestablece las normas de grabaciónde los datos, pero no contempla latransferencia telemática realizada di-rectamente a los servidores del Cen-ter. Estas normas especifican que lossoportes transferidos pueden conte-ner ficheros de software y de datosen un mismo soporte, pero que losdocumentos que se consideren his-tóricos deben estar en un soporteque contenga únicamente ficherosde conservación permanente.

En referencia al formato, losdocumentos transferidos deben es-tar en un formato no dependientede un hardware o software concre-tos. El documento debe estar codifi-cado en ascii o ebcdic, habiendo eli-minado de él todos los caracteres decontrol, a excepción de los delimita-dores de campo y registro y de lasetiquetas sgml. El fichero no puedetener ningún tipo de compresiónque no haya sido aprobado previa-mente por la Nara. Los ficheros debase de datos se deben transferir enascii, sql o irds14, desvinculados de latecnología original, únicamente con

las tablas de datos y la documenta-ción de las relaciones, y respetandola primera forma normal. En princi-pio no se contempla la transferenciade bases de datos no relacionales.

Cuando se recibe una transfe-rencia electrónica es necesario unproceso de validación antes de in-corporar los documentos al archivodigital. La validación es el proceso decomparar el contenido de los docu-mentos digitales recibidos de unaagencia federal con la descripcióndel contenido de estos documentosque proporciona la documentaciónque los acompaña15. Inicialmente laNara realizaba una validación ma-nual, imprimiendo una parte de losdatos y comparando su estructuracon la expresada en la documenta-ción. Desde 1992 se utiliza la aplica-ción informática Aeric (Archival elec-tronic records inspection and control),desarrollada en Oracle, que analiza ydepura las tablas de datos, generan-do un informe con las anomalías quedeben ser solventadas antes de suingreso en el archivo digital.

Center for Electronic Records13

Figura 2. Un documento digital encapsulado

Page 6: Gestión de los documentos digitales Serra Serra Jordi

9El profesional de la información, vol. 10, nº 9, septiembre 2001

Gestión de los documentos digitales: estrategias para su conservación

El uso de emuladores para laconservación permanente de los do-cumentos digitales ha sido propues-to por Jeff Rothenberg16. Esta teo-ría parte de que la única forma depoder recrear la apariencia y la fun-cionalidad originales de un docu-mento digital es mediante el softwa-re con el que fue creado. La pro-puesta consiste en utilizar aplicacio-nes que emulen el funcionamientode los programas originales cuandoéstos sean ya obsoletos.

Sin embargo no tendría sentidoconservar emuladores de cada soft-ware utilizado, puesto que con eltiempo estos emuladores tambiénserían obsoletos. Lo que se debeconservar asociado al documento esla información sobre cómo de-sarrollar un emulador que puedareproducir ese documento. Esta fór-mula debe ser suficientementeabierta para sobrevivir a la incerti-dumbre tecnológica de la conserva-ción indefinida.

La propuesta consiste en en-capsular tres tipos de informacióncon cada documento digital (figura2)17:

—La explicación en un formatopermanentemente inteligible delsoftware y del hardware emulado,

metadatos sobre el documento, suciclo de vida y su contexto de crea-ción, anotaciones, etc. Consiste enun fichero readme, que contiene lasinstrucciones para el proceso deabrir y poner en marcha un docu-mento encapsulado.

—El emulador de la plataformainformática original. No consiste enun programa ejecutable, sino en laespecificación de los atributos tec-nológicos considerados relevantespara recrear el comportamiento deldocumento original.

—El documento y su entornode software. Consiste en el docu-mento digital, compuesto de uno omás ficheros en el formato original,más los ficheros que representan lacadena de bits ejecutable originalque permitía reproducir el docu-mento, y los ficheros que represen-tan la cadena de bits del sistemaoperativo que permitía que se ejecu-tase el software.

En la práctica los elementos co-munes a más de un documento pue-den ser almacenados de forma cen-tralizada, encapsulando con el docu-mento tan sólo un enlace al elemen-to correspondiente18.

El proceso completo compren-de cuatro etapas:

—Anotación: crear las explica-ciones sobre el contexto del docu-mento y sobre cómo abrir y usar laencapsulación.

—Encapsulación: construir laestructura lógica que contenga to-dos los elementos citados.

—Transliteración: periódica-mente actualizar las anotaciones oexplicaciones textuales para mante-nerlas inteligibles.

—Emulación: cuando sea ne-cesario acceder al documento se de-berá abrir la encapsulación, crear elemulador específico, y hacerlo fun-cionar en el ordenador futuro. Ob-viamente no será necesario crear unemulador para cada documento, tansólo para cada tipo o formato de do-cumento.

Para desarrollar este modelo se-rá necesario investigar en el desa-rrollo de un metalenguaje que sirvapara describir las especificacionesdel emulador con relación a una pla-taforma de hardware concreta, asícomo de técnicas para hacer siem-pre inteligibles las explicaciones y losmetadatos, y de métodos de encap-sulación que protejan la informacióndigital de posibles manipulaciones odel deterioro y que aseguren su co-hesión19.

La Wgbh Educational Foundation,con una subvención de la NationalHistorical Publications and RecordsCommission, ha impulsado el desa-rrollo de un formato universal depreservación a largo plazo de los do-cumentos digitales que asegure laaccesibilidad de un amplio abanicode formatos con independencia decualquier plataforma.

La idea del formato universal depreservación es la de un contenedoren el que no sólo se almacenan losdocumentos digitales, sino tambiéntoda la información necesaria parapoderlos reproducir. Esta idea la en-contramos desarrollada en el Bentocontainer format21, creado por Apple

Computer y conocido también comoOpenDoc standard interchange format.Un contenedor Bento es un tipo defichero que contiene uno o más ob-jetos, junto con la información sobreestos objetos (metadatos). Dichocontenedor permite reproducir e in-tercambiar documentos entre dife-rentes plataformas, aunque los obje-tos que contiene no correspondan aun mismo formato propietario ni ha-yan sido diseñados para utilizar losmecanismos Bento. Los objetos pue-den ser simples o complejos, y pue-den pesar desde unos pocos byteshasta 264 bytes. Actualmente el có-digo Bento funciona sobre Macintosh,DOS, Microsoft Windows, OS/2 y dife-

rentes variantes de Unix.

El formato de intercambio Openmedia framework (OMF)22, de AvidTechnology, actualmente un estándarpara el intercambio de documentosdigitales entre plataformas heterogé-neas, ha adoptado el uso de conte-nedores Bento. OMF encapsula todala información necesaria para la edi-ción y la reproducción de los docu-mentos digitales que contiene.

Aunque no se consiga un únicoformato estándar de preservación,el uso de estos contenedores com-patibles con una gran variedad deformatos reduce notablemente la di-versidad de los documentos que esnecesario conservar.

Teoría de la emulación

Universal preservation format (UPF)20

Page 7: Gestión de los documentos digitales Serra Serra Jordi

El profesional de la información, vol. 10, nº 9, septiembre 200110

Jordi Serra Serra

servación a largo plazo, de congelar sus valores pri-marios en un formato estándar.

A pesar de ser el método más aceptado, la migra-ción presenta numerosos problemas. Migrar la docu-mentación de un archivo digital es caro —en recursosmateriales y humanos—, laborioso y lento. También esuna tarea peligrosa que comporta un riesgo de pérdidade datos, tanto por errores en la grabación como porincompatibilidades entre formatos. Hay que añadir queel curso de la tecnología y su ritmo de obsolescenciason imprevisibles, por lo que cada nueva migraciónpresenta una problemática distinta.

1.3. Eliminación de la dependencia de los docu-mentos de una determinada tecnología

Este método consiste en eliminar las dependenciasno esenciales que los documentos mantienen con losprogramas con que han sido creados. Estas dependen-cias pueden ser de dos tipos:

—Funcionalidades para editar o actualizar el do-cumento electrónico (por ejemplo, el sistema gestor deuna base de datos, sgbd). Cuando se plantea la conser-vación a largo plazo de un documento digital auténti-co se infiere que debe ser inmodificable. Por lo tanto,no es necesario conservar más que las funcionalidadesde visualización y los datos contextuales.

—Vestigios de la tecnología original, como porejemplo los formularios y listados de una base de datos.

Esta opción necesita una tecnología estándar parala recuperación de la información, una vez eliminadasu dependencia original. Hasta el momento se ha utili-zado en documentos digitales simples (texto plano o

datos estructurados de bases de datos relacionales), pe-ro puede ser aplicable a documentos más complejossiempre que éstos estén sujetos a normas abiertas y sedisponga de las herramientas adecuadas para su mi-gración al formato estándar con la menor pérdida dedatos posible.

1.4. Emulación de la tecnología

El objetivo de este método es conservar la funcio-nalidad que tienen los documentos cuando son repro-ducidos por el software original. Esta emulación sepuede limitar a conservar la presentación visual de losdocumentos mediante visores (viewers) o bien conser-vando la imagen electrónica del documento, con for-matos como pdf o djvu. Pero se puede avanzar haciauna opción más completa, intentando conservar unaversión reducida del software operacional y los siste-mas originales, o bien desarrollando un emulador quereproduzca el funcionamiento de dichos sistemas ori-ginales. Esta opción garantiza la autenticidad de losdocumentos conservados y la fidelidad de la reproduc-ción, pero al mismo tiempo presenta un importante in-conveniente: tanto la versión reducida del softwareoriginal como el emulador también están sujetos a unaprogresiva obsolescencia, y su mantenimiento y actua-lización pueden ser muy difíciles, especialmente cuan-do dependan de una firma comercial que actúe exclu-sivamente en función de los intereses del mercado.

Cada tipo de documento digital tiene unas caracte-rísticas específicas de conservación y, sobre todo, unasnecesidades de utilización por parte de la organizaciónproductora, que son establecidas durante su evalua-ción23. Por esta razón la política de preservación de unarchivo digital no debe basarse tan sólo en una de lasestrategias citadas. En la tabla 1 se indican los méto-dos más adecuados para aplicar a cada tipo de docu-mento digital24.

2. Objetos versus procesos

Hasta este momento hemos analizado la problemá-tica de la conservación a largo plazo de los documen-tos digitales considerándolos unidades mínimamenteidentificables e independientes. Ya hemos comentadoque esta no es, en la mayoría de los casos, la naturale-za real de los documentos digitales. Su carácter com-puesto, distribuido y dinámico proviene de la relaciónque mantienen con los sistemas informáticos que losgeneran, los cuales a su vez están inextricablemente li-gados a los procesos operativos de una organización.En este horizonte metodológico se plantea si la con-servación debe orientarse al documento como enti-

Conjuntos de datos

Mig

raci

ón: c

ambi

o de

med

io

Mig

raci

ón: c

ompa

tibili

dad

retr

oact

iva

Mig

raci

ón: i

nter

oper

abili

dad

Mig

raci

ón: c

onve

rsió

n a

está

ndar

Emul

ació

n

Texto estructuradoDocumentos ofimáticosGráficos de datosPresentacionesImágenesSonidoVídeoDatos geográficos y mapasPublicaciones multimedia interactivas

XXXXXX

XXXXXXX

X

X

XXXXXXXXX

X

Tabla 1

Page 8: Gestión de los documentos digitales Serra Serra Jordi

11El profesional de la información, vol. 10, nº 9, septiembre 2001

Gestión de los documentos digitales: estrategias para su conservación

dad unitaria, o si debe seguir un enfoque orientado aprocesos. Vamos a trabajar algunos ejemplos.

«En el contexto de la preserva-ción de los valores primarios,la problemática va asociada ala dificultad para identificar eldocumento electrónico, y paraestablecer sus límites y partes

componentes»

El caso paradigmático de este dilema son las basesde datos (bdds), las cuales se pueden concebir comodocumentos en su conjunto, o únicamente como herra-mientas generadoras de documentos25. Tomemos elejemplo de una base de datos relacional típica, que en-tendemos como un conjunto de datos estructurados enuna o más tablas que mantienen entre sí relaciones dedistinto grado, formando un núcleo compuesto por elcontenido (datos) y la estructura (tablas y relaciones).Estos datos se actualizan mediante diversas interfacesde usuario (formularios), y su explotación se realiza através de un conjunto de consultas o vistas y formatosde salida (informes). La actualización y la explotaciónde los datos no dependen de éstos ni de su estructura,

sino del sistema gestor de la bdd que se utilice. Cuan-do nos planteamos la conservación a largo plazo de loscontenidos de una bdd, debemos ser capaces de identi-ficar sobre qué partes de la misma se deben aplicar lasestrategias de preservación. El usuario que trabaja conella accede a los datos mediante un conjunto de for-mularios e informes, y lo hace de manera que la formacomo se estructuran los datos en una interfaz de entra-da o de salida no se corresponde con la estructura in-terna de las tablas, sino con las necesidades del usua-rio. Por ejemplo, una base de datos que gestiona la for-mación del personal de una empresa le sirve al usuariopara generar los certificados para los alumnos que hanasistido a los cursos. En último término, al usuario loque más le interesa es el conjunto de datos que consti-tuye el certificado de asistencia, documento identifica-ble y al cual podemos atribuir valores administrativosy jurídicos. Los datos de este certificado provienen delas tablas de alumnos y de cursos, y de la relación“muchos a muchos” cursos realizados por cada alum-no. Sin embargo, al usuario no le interesa conservarsólo una de estas tablas. Lo que necesita es poder re-producir siempre que sea necesario el agregado de da-tos que constituye el certificado. Ante esta situación es

Figura 3

Page 9: Gestión de los documentos digitales Serra Serra Jordi

cuando se pueden adoptar dos estrategias distintas (fi-gura 3).

«El problema de la conserva-ción de los documentos elec-trónicos reside tanto en la di-versidad de soluciones tecno-lógicas como en la falta de co-hesión de las soluciones meto-

dológicas que se aplican»

Si nos referimos a una estrategia orientada a docu-mentos, el usuario se conformará con poder convertirel certificado que tiene en pantalla en un documentodigital completo, extrayéndolo de la base de datos y ar-chivándolo junto con su contexto de creación median-te un proceso controlado y autenticado. Podría, porejemplo, convertir el certificado en un documento pdf,con sus correspondientes metadatos, y con algún tipode certificación digital. Si optamos por una estrategiaorientada a procesos, será toda la base de datos que au-tomatiza el proceso de gestionar cursos la que deberáser conservada, tomando la prevención de que su es-tructura responda a la necesidad de poder “recrear” elcertificado, es decir, protegiendo y fijando los datosnecesarios a partir del momento en que adquieren ca-rácter “histórico”. Esta decisión se debe tomar en la fa-se de análisis y diseño de la base de datos.

El mismo razonamiento podemos hacerlo extensi-ble a todos los sistemas de gestión de documentos:Aunque un sistema workflow trabaje orientado a docu-mentos ¿no es la información de los procesos en suconjunto lo que realmente refleja el funcionamiento dela organización? ¿en qué medida un data warehousepuede identificarse, por su carácter exhaustivo y acu-mulativo, con el archivo histórico de una organización?

Los mismos parámetros podemos aplicar al correoelectrónico. Los mensajes y su contexto residen den-tro del sistema de mensajería, pero dicho sistema nopuede garantizar su conservación ni funcionar a modode archivo digital, puesto que la mayoría de programasde correo electrónico están diseñados para un corto pe-ríodo de conservación de los mensajes en los buzonesdigitales. Por lo tanto, los mensajes deben transferirseal sistema de gestión documental corporativo (edms),una vez seleccionados aquellos que tengan valor evi-dencial26.

Como veremos más adelante, la evaluación es cla-ve para escoger la mejor política de preservación delcorreo electrónico. En Estados Unidos, cuando el pre-sidente abandona su cargo, todos los mensajes de co-rreo electrónico se transfieren en bloque para su con-servación permanente, puesto que toda la correspon-dencia de la Casa Blanca se considera un documentohistórico. En cambio la mayoría de las organizacionesdeben adoptar una estricta política de selección que

El profesional de la información, vol. 10, nº 9, septiembre 200112

Jordi Serra Serra

Figura 4

Page 10: Gestión de los documentos digitales Serra Serra Jordi

13El profesional de la información, vol. 10, nº 9, septiembre 2001

Gestión de los documentos digitales: estrategias para su conservación

permita que los mensajes que se consideran documen-tos evidenciales sean transferidos a un sistema segurode conservación junto con su contexto de transmisión(registros de fechas, ficheros adjuntos o attachments,etc.), considerando el sistema de correo electrónico tansólo un instrumento para realizar las transacciones te-lemáticas. La Universidad de California incluye losmensajes de correo electrónico en sus reglas de eva-luación de conservación (records disposition schedu-les), y transfiere los mensajes con valor evidencial aformatos más estables para su conservación perma-nente27.

Las administraciones públicas y las empresas utili-zan cada vez más internet en sus relaciones con sususuarios o clientes, así como intranets para el inter-cambio de información dentro de la organización28. Es-tos desarrollos tienen un gran impacto en la necesidad

del archivo a largo plazo de las páginas web, del queen otras ocasiones se ha tratado ya29. Desde la utópicapropuesta de Brewster Kahle30 hasta los enfoques másrealistas del proyecto Pandora31 se ha planteado cuálesson los elementos de una página web que forman par-te de una misma unidad documental y que en conjun-to pueden reunir el valor evidencial que justifique suconservación32. Las organizaciones deben saber qué haestado disponible, para quién y en qué momento. Step-hen Harries define las dos perspectivas para archivarlas páginas web:

—Modelo documento (u orientado a objetos): unapágina web contiene elementos que pueden conside-rarse documentos de archivo. En este caso es precisoevaluar toda la página para seleccionar estos elemen-tos, que se integraran en el edms corporativo y serán

Estrategia orientada a objetos

El National Partnership for Ad-vanced Computational Infrastructu-re, con sede en el San Diego Su-percomputer Center (Sdsc) estádesarrollando una parte del pro-yecto Distributed object computa-tion testbed (Doct) de infraestruc-tura de redes de alta velocidad.La Nara colabora con el Sdsc enel desarrollo de un modelo depreservación de los documentoselectrónicos, centrándose en laconservación y el acceso deacuerdo con los estándares ar-chivísticos35.

La metodología orientada aobjetos se basa en asignar unaserie de propiedades (atributos ycomportamientos)36 a cada obje-to de un conjunto, y relacionar-los a partir de una determinadapropiedad. De esta manera habrátantas clasificaciones posibles co-mo atributos comunes compar-tan un determinado grupo de ob-jetos. Estas clasificaciones o cla-ses son a su vez objetos, con suspropiedades, que se agrupan enmetaclases. Todos los objetosque pertenecen a una clase he-redan automáticamente los atri-butos y comportamientos aso-

ciados a la misma. Teniendo encuenta que desde el punto de vis-ta archivístico no se deben cap-turar solamente los documentossino también las relaciones entrelos documentos de un mismofondo, la herencia de las propie-dades y la jerarquía de clases ysubclases se adecua sin proble-mas a la estructura de un fondodocumental.

El primer paso en esta estra-tegia consiste en identificar quépropiedades tiene cada objeto, ycuáles de éstas se heredarán pa-ra cada clase. Y en segundo lugar,se deben aplicar las solucionessiempre a partir del nivel jerár-quicamente superior. Por ejem-plo, los metadatos sobre el perí-odo de conservación de un do-cumento digital deben estar in-cluidos a nivel de clase. Todos losobjetos relacionados con dichaclase heredarán esta informa-ción, que determinará su com-portamiento cuando se apliquenautomáticamente métodos deselección y eliminación sobre unconjunto documental (figura 4).

El sistema incluye dos com-ponentes: un depósito digital,

donde se conservan los docu-mentos y se realiza virtualmenteel trabajo archivístico, y un con-junto de herramientas utilizadaspara acceder a los documentos.

Durante el proceso de trans-ferencia al archivo digital, la co-lección o serie se descomponeen todos los documentos quecontiene, y el contexto y la es-tructura de cada documento soncaracterizados mediante metada-tos. Hasta el momento se ha uti-lizado xml para agregar los meta-datos a los objetos, creando unadocument type definition (dtd) paracada clase de objeto identificadadurante esta descomposición.Con esta operación la clase seconvierte en un nuevo objeto, ladtd.

Las colecciones de objetos,encapsuladas en formato xml,son notablemente independien-tes de la infraestructura informá-tica utilizada. El uso de xml sobreuna gran variedad de tipos de do-cumentos digitales produce unacolección de objetos muy homo-génea de cara a la conservación alargo plazo, facilitando procesosde migración o emulación.

Page 11: Gestión de los documentos digitales Serra Serra Jordi

El profesional de la información, vol. 10, nº 9, septiembre 200114

Jordi Serra Serra

gestionados conjuntamente con el resto de documentosdigitales.

—Modelo base de datos (u orientado a procesos):toda la página web es un documento de archivo. En es-te caso es preciso almacenar periódicamente una espe-cie de “fotografía” digital de la sede web, fijando sucontenido en un momento dado y almacenándolo enun depósito digital, o en un sistema que permita uncontrol de versiones. Aun así, la funcionalidad de mu-chos elementos de la página web —así como la vigen-cia de los enlaces— es muy difícil de capturar, por loque en la fase de evaluación hay que establecer:

a. Los límites del documento, es decir hasta dón-de hay que seguir los enlaces, qué elementos externosforman parte del documento y qué elementos multi-media deben archivarse conjuntamente.

b. El contexto del documento. Se debe crear unregistro (log) del contexto de creación y utilización dela página web. Estos registros también forman parte,conceptualmente, del mismo documento.

c. La estructura y la presentación. En las basesde datos dinámicas es necesario conservar también losdatos de origen, o las sucesivas presentaciones de es-tos datos.

Si el mantenimiento de una página web está cen-tralizado y depende del filtro de un webmaster es másfácil preparar los contenidos para su conservación alargo plazo que si todos los usuarios tienen la posibili-dad de publicar directamente en internet o en la intra-net. La actuación sobre las fuentes de información essiempre más efectiva que la captura de los contenidosuna vez publicados. Así, el webmaster puede extraerperiódicamente una copia de archivo de cada páginapublicada, y mantener un registro histórico del mapade la sede web y de los enlaces33. Existen en el merca-do programas que facilitan la automatización de estatarea, incluso en entornos descentralizados donde to-dos los usuarios pueden publicar directamente los do-cumentos.

Entre las dos estrategias reseñadas, actualmente seimpone la tendencia orientada a documentos (véasexml), cada vez más autosuficientes, independientes deun software concreto, que podrán ser modificados yvisualizados por distintos programas a lo largo de suciclo de vida. La Victorian electronic records strategy(Vers)34, Australia, se decanta por esta opción. Segúnella, todos los documentos digitales deben estar un for-mato que permita:

—Soportar una conservación a largo plazo, es de-cir que sean accesibles, que se puedan visualizar en suforma original y que incluyan su contexto de creación.

—Servir de evidencia para saber quién creó el do-cumento, cuándo lo hizo, y que el documento no ha si-do modificado desde ese momento, es decir que estáíntegro.

—Si el documento está evaluado, saber cuándo sedebe transferir o destruir y ejecutar dicho proceso.

—Debe ser posible aumentar o cambiar la infor-mación asociada a un documento sin alterar de ningu-na manera su valor evidencial ni su integridad. Paracumplir con este requerimiento, en el aspecto estructu-ral los documentos digitales deben ser autodocumen-tados (que sea posible reconstruir el contexto de crea-ción a partir del mismo documento, sin necesidad dedisponer del sistema que lo creó), autocontenidos (demanera que toda la información sobre el documentoesté contenida en el mismo documento) y extensibles(de forma que se pueda ampliar la estructura del docu-mento para añadir nuevos metadatos o enlaces sinafectar su estructura básica).

«La herramienta conceptualque se convierte en la clave

para la preservación de los do-cumentos electrónicos son las

reglas de evaluación docu-mental»

Es interesante remarcar la extensibilidad comocaracterística de la conservación orientada a documen-tos. Cuando un documento digital es firmado digital-mente o enviado por correo electrónico se convierte enun original, en un documento definitivo y auténticocon valores primarios. Pero aquí no finaliza su utiliza-ción. El documento puede pasar por trámites o valida-ciones que le añadan información, marcas de autenti-cación, control de versiones, o referencias a otros do-cumentos posteriores (por ejemplo durante su tramita-ción dentro de un sistema workflow o con herramien-tas groupware). Asimismo, el entorno tecnológico deldocumento cambiará, y el documento tiene que sercompatible con los nuevos sistemas sin perder sus ca-racterísticas primigenias. Por esta razón la Vers definedos partes en un documento digital:

—Una parte invariable o contenido, que es aque-lla que debe ser conservada en su codificación y es-tructura originales (pdf, xml, etc.).

Page 12: Gestión de los documentos digitales Serra Serra Jordi

15El profesional de la información, vol. 10, nº 9, septiembre 2001

Gestión de los documentos digitales: estrategias para su conservación

—Una parte variable o contexto, que acumula to-dos los metadatos que describen la estructura, el con-tenido, el contexto documental o las relaciones conotros documentos, y las características técnicas y dereproducción o visualización.

3. La importancia de la evaluación

Todas estas propuestas eminentemente tecnológi-cas exigen una actuación previa en la fase de creaciónde los documentos. Con el fin de preservar sus valoresprimarios el documento debe ser creado de formacontrolada, de manera que el sistema garantice su fia-bilidad y su autenticidad (recordemos que el sistemainformático es parte del contexto que da sentido al do-cumento). Pero también debe ser creado en el forma-to que mejor responda a su futura disposición, seaesta la conservación o la destrucción. De este modo, laherramienta conceptual que se convierte en la clavepara la preservación de los documentos electrónicosson las reglas de evaluación documental (appraisalschedules)37.

Estas reglas no corresponden al modelo tradicionalde expurgo (la selección realizada sobre conjuntos dedocumentos preexistentes), sino a la evaluación porfunciones, que parte del análisis del contexto generalde la organización (macroevaluación) para llegar aldetalle en cada función o proceso (microevaluación).Estas reglas no se limitan a un calendario de conserva-ción, sino que especifican el formato de creación y uti-lización del documento acorde con su período de con-servación. Asimismo establecen su contenido informa-tivo en función de su participación en un determinadoproceso, su régimen de acceso y sus sistemas de au-tenticación, permitiendo así calcular los costes de laconservación de los documentos digitales. En definiti-va, las reglas de evaluación proporcionan toda la in-formación que se debe introducir en el sistema infor-mático de una empresa o institución para que su ges-tión documental sea verdaderamente eficaz.

La localización física de los documentos informá-ticos es aleatoria, de modo que la clasificación es laúnica forma de relacionar archivísticamente dichos do-cumentos. Los documentos virtuales (compuestos, dis-tribuidos y dinámicos) no pueden ser conservados co-mo tales más que a partir de la clasificación, que per-mite relacionar intelectualmente las distintas partes deldocumento. Las reglas de evaluación parten pues deuna herramienta previa, el cuadro de clasificación,que permite identificar y referenciar todos los procesosde una empresa o institución susceptibles de ser docu-mentados38. El diseño de esta herramienta va íntima-

mente ligado a proyectos de reingeniería de procesos(bpr), e incluso el proyecto de la Universidad de Bri-tish Columbia establece que para garantizar la correc-ta gestión y preservación de los documentos electróni-cos es necesario integrar los procedimientos documen-tales con el resto de procedimientos de la empresa. Asíse ha puesto en marcha en el estado de Kentucky(EUA), donde el programa para impulsar las transac-ciones electrónicas entre las empresas y unificar losservicios de las oficinas públicas (Enterprise informa-tion technology strategic plan) incorpora el requeri-miento de que una vez rediseñados los procesos se ela-boren las herramientas conceptuales básicas del siste-ma de gestión documental antes de proceder a la in-formatización.

David Bearman39 expone cuatro principios para laevaluación de los documentos digitales:

El modelo finlandés aplicado a la evalua-ción de los documentos electrónicos

El modelo finlandés de gestión documental seha caracterizado siempre por su pragmatismo enla búsqueda de soluciones. Según este modelo42,las reglas de evaluación (records management sche-dules en este caso) deben incluir cierta informa-ción básica sobre los sistemas informáticos quegeneran los documentos, como por ejemplo:

—Funciones básicas del sistema.

—Si la información en el sistema está clasifi-cada o no.

—Información técnica (software, hardware).

—Personas responsables de la información ydel mantenimiento técnico del sistema.

Desde 1994 en los Archivos Nacionales de Fin-landia un grupo de trabajo estudia los materialesdigitales y propone métodos para su tratamiento.Una aportación interesante es la distinción entreconservación permanente y conservación conti-nua. Los documentos de conservación perma-nente son aquellos que se conservan por su va-lor histórico, y deben permanecer inalterables,mientras que los documentos de conservacióncontinua son aquellos que se conservan por susvalores primarios y deben permanecer siempreaccesibles. Esta distinción debe ponerse en rela-ción con las dos necesidades especificadas por elproyecto de la Universidad de British Columbia,cuando distingue entre unas necesidades prima-rias de integridad y unas necesidades secundariasde conservación.

Page 13: Gestión de los documentos digitales Serra Serra Jordi

El profesional de la información, vol. 10, nº 9, septiembre 200116

Jordi Serra Serra

—Ya no es posible evaluar únicamente documen-tos. Se deben evaluar las funciones y los procesos queproducen documentos.

—Son los archiveros40 quienes deben definir losrequerimientos funcionales para la gestión del ciclo devida de los documentos digitales de una organización.

—La evaluación debe realizarse en la fase de dise-ño de los sistemas informáticos.

—Los conjuntos de metadatos que se asocian a losdocumentos deben incluir elementos que sirvan paradescribir las diferentes etapas de su ciclo de vida.

Quiero insistir en la afirmación de que las reglas deevaluación deben introducirse en el sistema informáti-co de la organización antes de que se empiecen a gene-rar documentos. El objetivo es asegurar que los docu-mentos con valores secundarios serán conservados enuna forma auténtica, y esto no es posible si el formatooriginal no facilita la migración, si no se han recogidolos metadatos suficientes o si no se han conservadotambién los documentos y conjuntos de datos que con-figuran el contexto documental. La elección de la es-trategia de conservación a largo plazo (tipo de migra-ción, estándares, metadatos, etc.) es una de las decisio-nes que se deben tomar durante la evaluación, e impli-ca participar, junto con los analistas informáticos, en eldiseño de sus sistemas, pasando de la tradicional eva-luación enfocada a los documentos a evaluar la estruc-tura del sistema de información de la organización41.

Para gestionar con eficacia la documentación ad-ministrativa tradicionalmente se ha utilizado una pe-riodización por etapas orientada a optimizar los recur-sos invertidos. La más habitual consiste en distinguiruna fase de utilización administrativa o activa, una fa-se semiactiva y una fase inactiva. Con los documentos

digitales es difícil seguir manteniendo la misma divi-sión, puesto que las decisiones que antes se debían to-mar en cada una de las fases las tomará automática-mente el sistema a partir de la información que se leproporcione durante el análisis y diseño. Parece nece-sario sustituir esta periodización por modelos basadosen considerar el ciclo de vida de los documentos ad-ministrativos como un continuum, un destino que tie-nen escrito los documentos evaluados, y que puede serreescrito si cambian las condiciones del entorno de uti-lización43. En este caso se debe admitir la posibilidadde reevaluar los documentos periódicamente o conmotivo de la migración a un nuevo entorno tecnológi-co44 (tabla 2)45.

4. Conclusión

El problema de la conservación de los documentoselectrónicos reside tanto en la diversidad de solucionestecnológicas como en la falta de cohesión de las solu-ciones metodológicas que se aplican. A modo de con-clusión quiero citar el acertado colofón conceptual quepone Margaret Hedstrom a esta problemática, cuan-do detalla las condiciones básicas para una estrategiade preservación digital46. Estas condiciones se resumenen la necesidad de disponer de un sistema de gestióndocumental que garantice la conservación de los docu-mentos digitales, y que sea:

—Implantado: Las posibilidades de conservar losdocumentos electrónicos van asociadas al nivel de im-plantación real del sistema de gestión documental. Elconocimiento detallado de los documentos que se de-ben conservar es la premisa básica para articular unaestrategia de preservación digital.

—Integrado: Es necesario que la gestión de los do-cumentos que pertenecen a un mismo fondo sea inte-grada, con independencia de su soporte y ubicación.

Fecha de creación

Volumende datos

Formatosde texto

ASCII ASCII ASCIIASCII

EBCDIC

ASCIIEBCDICSGML

PostScript

Formatos debases de datos

Formatosde imagen

TIFF 6.0 TIFFTIFF 6.0

CCITT/TSSTIFF 6.0

ASCII ASCII ASCIIASCII

EBCDICASCII

EBCDICASCII

EBCDIC

6500 docum.4500 cintas

200 CD-ROM6000 docum. 23000 docum.

2 Terabytes deinformación11500 cintas

25 bases de datos

Tipo desoporte

CD-R DAT

CintaDLT4000DLT7000

DATÓptico

CintaDAT

CR-ROM

CintaDAT

CR-ROMCD-R

CintaDAT

CR-ROM

1973 1995 1986 1991 1983 1998Dinamarca Finlandia Francia Alemania Suecia Reino Unido

Tabla2. Archivos digitales nacionales en Europa

Page 14: Gestión de los documentos digitales Serra Serra Jordi

17El profesional de la información, vol. 10, nº 9, septiembre 2001

Gestión de los documentos digitales: estrategias para su conservación

Los documentos digitales deben gestionarse conjunta-mente con los documentos en soportes tradicionales.

—En la fase de diseño: Las reglas de evaluacióndeben incorporarse a los sistemas informáticos en lafase de diseño.

—Controlado: Se deben establecer políticas queeviten que la decisión sobre la conservación o elimina-ción de documentos, o sobre la aplicación de las reglasde evaluación, recaiga sobre el usuario del sistema.

—Normalizado: La tan demandada normalizaciónno se debe restringir a los formatos. Los métodos detrabajo y las herramientas conceptuales deben seguirtambién un proceso de normalización que permita suintegración con los sistemas informáticos47.

Bibliografía y notas

1. En los documentos firmados digitalmente es necesario adoptar una po-lítica para la conservación de las claves de encriptación.

2. Kampffmeyer, Ulrich. “E-documents: It’s all legal, or is it?”. E-doc,2000, septiembre-octubre, p. 31-33.

3. El Real decreto ley 14/1999, de 17 de septiembre, sobre la firma elec-trónica regula las funciones de los prestadores de servicios de certifica-ción (las “notarías digitales”), los cuales autentican las transacciones tele-máticas privadas o públicas mediante un sistema de claves asimétricas.Cabe destacar el artículo 3.1. “La firma electrónica avanzada, siempreque esté basada en un certificado reconocido y que haya sido producidapor un dispositivo seguro de creación de firma, tendrá, respecto de los da-tos consignados en forma electrónica, el mismo valor jurídico que la fir-ma manuscrita en relación con los consignados en papel y será admisiblecomo prueba en juicio, valorándose ésta según los criterios de apreciaciónestablecidos en las normas procesales”.

4. Ley 30/1992 de Régimen jurídico de las administraciones públicas ydel procedimiento administrativo común, de 26 de noviembre de 1992. Enel artículo 45.5 dice: “Los documentos emitidos, cualquiera que sea susoporte, por medios electrónicos, informáticos o telemáticos por las Ad-ministraciones Públicas, o los que éstas emitan como copias de originalesalmacenados por estos mismos medios, gozarán de la validez y eficaciade documento original siempre que quede garantizada su autenticidad, in-tegridad y conservación y, en su caso, la recepción por el interesado, asícomo el cumplimiento de las garantías y requisitos exigidos por esta uotras Leyes”. Este artículo fue desarrollado por el Real decreto 263/1996,de 16 de febrero, por el que se reguló la utilización de técnicas electróni-cas, informáticas y telemáticas por la Administración General del Estado.

5. The preservation of the integrity of electronic records [en línea]. Lu-ciana Duranti, Terry Eastwood, Heather MacNeil. Vancouver: Univer-sity of British Columbia; School of Library, Archival & Information Stu-dies, 1997. Consultado: 14-07-2001. Disponible en:http://www.interpares.org/UBCProject/

6. El valor de un documento como prueba de un hecho y su capacidad pa-ra, a raíz de este valor, dar origen a nuevas acciones están sujetos a que eldocumento cumpla dos condiciones:

—Que sea fiable, es decir, que su contenido sea cierto. La fiabilidad es,por lo tanto, una noción relativa, y por esto se habla del grado de fiabili-dad de un documento.

—Que sea auténtico, es decir, que su grado de fiabilidad inicial no se ha-ya alterado desde su creación y durante su utilización y conservación.

La fiabilidad depende de las condiciones de creación del documento (lafiabilidad del autor, el grado de control ejercido durante su creación y laintegridad o nivel de completitud del documento), mientras que la autenti-cidad depende de las condiciones de utilización y, posteriormente, de con-servación (los mecanismos de transmisión y de custodia).

7. Sobre la formulación de la teoría de los valores véase: Schellenberg,T. R. Archivos modernos: principios y técnicas. La Habana: Instituto Pa-namericano de Geografía e Historia, 1958, p. 163-210.

8. Hofman, Johannes. “Shooting at a moving target: The development ofa repository for the preservation of digital information”. En: EuropeanCommission. Proceedings of the DLM-Forum: European citizens andelectronic information: the memory of the information society. Luxem-bourg: Office for Official Publications of the European Communities,2000, p. 81.

9. Comité sur les documents électroniques. Guide pour la gestion archi-vistique des documents électroniques. Paris: Conseil International des Ar-chives, 1997. (Études, 8), p. 53-56.

10. Conchon, Michèle. “Traitement et conservation des archives infor-matiques en France: la méthode Constance”. En: Commission Européen-ne. Actes du DLM-Forum sur les données lisibles par machine. Luxem-bourg: Office des publications officielles des Communautés européennes,1997, p. 146-151. También en: Dhérent, Catherine. “The Archives ofFrance: policy on storing electronic documents”. En: European Commis-sion. Proceedings of the DLM-Forum: European citizens and electronicinformation: the memory of the information society. Luxembourg: Officefor Official Publications of the European Communities, 2000, p. 172-179.

11. Las 4.500 cintas existentes fueron reemplazadas por 40 discos ópti-cos, con un coste de tres millones de francos. Desde mayo de 1999, 20cintas han reemplazado a los 40 discos ópticos.

12. Hasta el momento todos los metadatos recopilados sobre cada docu-mento digital, y las fichas descriptivas asociadas, se conservan preferente-mente en papel. Se está experimentando en la digitalización de estas des-cripciones.

13. Transfer of electronic records (from 36 CFR 1228.270 - formerly 36CFR 1228.188) [en línea]. Washington, DC: National Archives and Re-cords Administration, last updated April 5, 2001. Consultado: 11-07-2001. Disponible en:http://www.nara.gov/nara/electronic/transfer.html

14. La aceptación de sql e irds como formatos de base de datos es unapropuesta del informe presentado en mayo de 1989 por el National Com-puter Systems Laboratory del National Institute of Standards and Techno-logy (Nist), a petición de la Nara.

15. Básicamente el diccionario de datos y el conjunto de relaciones.

16. Rothenberg, Jeff. Avoiding technological quicksand: finding a viabletechnical foundation for digital preservation. Amsterdam: EuropeanCommission on Preservation and Access; Washington DC: Council on Li-brary and Information Resources, 1999. Véase también Rothenberg,Jeff. An experiment in using emulation to preserve digital publications.Den Haag: The Koninklijke Bibliotheek; Rand-Europe, 2000.

Otro estudio interesante es: Rothenberg, Jeff; Bikson, Tora K. Carryingauthentic records through time in a usable and understandable way. Dis-ponible en:http://www.archief.nl/digiduur

17. Rothenberg, Jeff, op. cit., 1999.

18. Véase el comentario de la metodología orientada a objetos en estemismo artículo.

19. La Universidad de Michigan, junto con el proyecto Cedars (Curlexemplars in digital archives), desarrolla una iniciativa centrada en laaplicabilidad de la emulación para ciertos tipos de objetos digitales en los

Page 15: Gestión de los documentos digitales Serra Serra Jordi

El profesional de la información, vol. 10, nº 9, septiembre 200118

Jordi Serra Serra

que la presentación es esencial. Otra experiencia importante en emulaciónes la que realiza el proyecto Nedlib (Networked European Deposit Li-brary), bajo la coordinación de la Koninklijke Bibliotheek.http://www.leeds.ac.uk/cedars/ http://www.konbib.nl/nedlib/

20. Se puede obtener más información del Formato Universal de Preser-vación en:http://info.wgbh.org/upf/

21. Bento specification. Apple Computer Inc., c1993.ftp://cil.org/pub/cilabs/tech/bento/

22. Open media framework interchange specification. Avid TechnologyInc., c1995.http://www.avid.com/omf/

23. Véase el apartado correspondiente en este mismo artículo.

24. National Preservation Office. Digital culture: maximising the nation’sinvestment. Mary Feeney (ed.). London: British Library Board, 1999.

25. Comité sur les documents électroniques, op. cit., p. 48-52.

26. Australian Archives. Managing electronic messages as records. Tam-bién: Peterson, Trudy H. Nara electronic mail regulations, donde se pro-ponen los criterios para discriminar los mensajes con valor evidencial delresto de comunicaciones. Se incluyen en esta consideración otros objetosdigitales típicamente asociados a los programas de correo electrónico, co-mo pueden ser los calendarios y agendas.

27. Electronic mail policy. University of California; Office of the Presi-dent, 1998.

28. Harries, Stephen. “Capturing and managing electronic records fromwebsites and intranets in the government environment”. En: EuropeanCommission. Proceedings of the DLM-Forum: European citizens andelectronic information: the memory of the information society. Luxem-bourg: Office for Official Publications of the European Communities,2000, p. 72-79.

29. Serra, Jordi. “Archivar internet”. El profesional de la información,1998, núm. 7-8, julio-agosto.

30. Kahle, Brewster. “Archiving the internet”. Scientific American,March, 1997. Es interesante visitar la página de The internet archive:building an internet library, que actualmente cuenta ya con 4 billones depáginas web almacenadas, 16 millones de mensajes de Usenet y 360 pelí-culas que en total ocupan más de 40 terabytes de memoria. Consultado:14-07-2001.http://www.archive.org/index.html

31. http://pandora. nla.gov.au/pandora/

32. Berninger, Peter. Website electronic records management (Werm) inthe European Commission. January 2000.

33. Como ejemplo, la Nara ha evaluado todas las páginas web estáticasdel Gobierno Federal disponibles en internet a partir del 20 de enero de2001 como documentos de conservación permanente. Para su preserva-ción captura periódicamente una “instantánea” de las páginas web guber-namentales.

34. http://www.prov.vic.gov.au/vers/welcome.htm

35. Thibodeau, Kenneth. “Limites et transformations: une stratégieorientée objet pour la conservation des documents électroniques”. En:Commission Européenne. Actes du DLM-Forum sur les données lisiblespar machine. Luxembourg: Office des publications officielles des Com-munautés européennes, 1997, p. 161-167. También en: Thibodeau, Ken-neth; Moore, Reagan; Baru, Chaitanya. “Persistent object preservation:advanced computing infrastructure for digital preservation”. En: EuropeanCommission. Proceedings of the DLM-Forum: European citizens andelectronic information: the memory of the information society. Luxem-

bourg: Office for Official Publications of the European Communities,2000, p. 113-118.

36. Los atributos de un objeto constituyen el estado en que se encuentra.Un comportamiento es una acción o un proceso que opera sobre un esta-do del objeto.

37. Eastwood, Terry. Appraisal of electronic records: a review of the li-terature in English. Appraisal Task Force. Interpares project, 2000.

38. La identificación de un documento ya forma parte del proceso de eva-luación, puesto que permite el estudio del ciclo de vida de dicho docu-mento dentro del sistema informático que lo genera.

39. Bearman, David. “Archival strategies”. The American archivist,1995, 58:4.

40. Es este caso la traducción corresponde al records manager, el respon-sable de gestionar la documentación administrativa de una organización.En nuestro contexto esta figura corresponde al archivero de un archivoadministrativo que actúa sobre la fase activa de los documentos.

41. Canela, Montserrat; Campos, Isabel; Domingo, Joan; Serra,Jordi. “Le processus d’évaluation comme moyen d’intégrer le point devue archivistique dans la planification, la création et l’utilisation de docu-ments électroniques et de systèmes automatisés. Étude de cas”. En: Com-mission Européenne. Actes du DLM-Forum sur les données lisibles parmachine. Luxembourg: Office des publications officielles des Commu-nautés Européennes, 1997, p. 113-117.

42. Pohjola, Raimo. “Appraisal and disposal of electronic records”. En:Principles of appraisal and their application in electronic environment:European models and concepts. DLM-Experts meeting in Tampere, Fin-land, 1999.

43. Hofman, Johannes, op. cit., p. 81.

44. Kowlowitz, Alan. “Appraising in a vacuum: electronic records ap-praisal issues: a view from the trenches”. En: David Bearman (ed.). Ar-chival management of electronic records. Archives and museum informa-tics technical report, 1991, n. 13.

45. Schürer, Kevin. “Survey on the relationship between public adminis-tration and archives services concerning electronic records managementin the EU Member States.” En: European Commission. Proceedings ofthe DLM-Forum: European citizens and electronic information: the me-mory of the information society. Luxembourg: Office for Official Publica-tions of the European Communities, 2000, p. 219-235.

46. Hedstrom, Margaret; Kowlowitz, Alan. “Meeting the challenge ofmachine readable records: a state archives perspective”. Reference servi-ces review, 16(1/2), p. 31-40.

47. Véase:US Department of Defense 5015.2 Standard:http://jitc.fhu.dis.mil/recmgt/

Standard for the management of electronic records, del Vers:

http://www.prov.vic.gov.au/vers/

General records schedule 20 de los archivos de los Estados Unidos.http://www.nara.gov/records/grs20/

En Europa se está trabajando en un estándar de gestión documental(ISO/CD 15489).Oais (Open archive information system)

Jordi Serra Serra. Facultat de Biblioteconomia i Docu-mentació. Universitat de Barcelona.DLM-Forum on electronic records, Monitoring [email protected]@correu.gencat.es

Page 16: Gestión de los documentos digitales Serra Serra Jordi