a rchivos sistema de gestión y acceso a la información...

12
1 / OPEN ARCHIVES Los distintos datasets se gestionan en un repositorio OAI-PMH que garantiza la interoperabilidad, accesibilidad y reutilización de todos los registros y sus metadatos 2 / OPEN DATA Es un sistema que, además de cumplir con los estándares de descripción e interoperabilidad, permite la libre descarga y disponibilidad de todos los datos 3 / OPEN SOURCE Todo la plataforma tecnológica se ha desarrollado con diferentes soluciones open source, y con recursos y medios propios. No se ha utilizado ningún software propietario. 4 / LINKED DATA Se aplican conceptos y técnicas de la web semántica, Los descriptores de personas, lugares y materias están enlazados a VIAF, Geonames y Dbpedia a rchivos e n abierto Sistema de información del patrimonio documental y cultural de Arganda del Rey El concepto de acceso abierto hace referencia a la disponibilidad de los recursos para su acceso, descarga, copia, distribución, impresión, enlazado de sus metadatos y, el elemento diferencial respecto a los sistemas convencionales, los metadatos están normalizados y son recolectables a través de procesos automatizados, facilitando por tanto su reutilización sin ninguna barrera financiera, técnica o semánticaGracias al uso de un repositorio OAI-PMH se garantiza la interoperabilidad de los recursos digitales. Una decidida apuesta por las soluciones en abierto y con muy bajo coste de implementación

Upload: lamduong

Post on 22-Oct-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: a rchivos Sistema de gestión y acceso a la información delarchivo.ayto-arganda.es/digital/openarchives.pdf · web semántica, Los descriptores de personas, lugares y materias están

1 / OPEN ARCHIVES Los distintos datasets se gestionan

en un repositorio OAI-PMH que

garantiza la interoperabilidad,

accesibilidad y reutilización de

todos los registros y sus metadatos

2 / OPEN DATA Es un sistema que, además de

cumplir con los estándares de

descripción e interoperabilidad, permite la libre descarga y

disponibilidad de todos los datos

3 / OPEN SOURCE Todo la plataforma tecnológica se ha

desarrollado con diferentes soluciones

open source, y con recursos y medios

propios. No se ha utilizado ningún

software propietario.

4 / LINKED DATA La tecnología empleada permite

aplicar conceptos y técnicas de la

web semántica, Los descriptores

de personas, lugares y materias

están enlazados a VIAF,

Geonames y Dbpedia

El concepto de acceso abierto hace referencia a “que está disponible a través de la web,

permitiendo a los usuarios su lectura,

descarga, copia, distribución, impresión,

búsqueda o enlazado a los contenidos

completos, recolectarlos para su

indexación, o utilizarlos para cualquier

otro propósito legítimo, sin ninguna

barrera financiera, legal o técnica”

Duis autem vel eum iriure dolor in hend

rerit in vulputate velit esse molestie conseq

uat, vel illum dolore eu feugiat nulla facilisi

at vero eros et accumsan et iusto odio dig

illum dolore eu feugiat nulla facilisis at

vero eros et accumsan et iusto odio

dignissim qui blandit praesent luptatum

zzril delenit augue facilisi.

Un innovador uso de los repositorios

OAI-PMH. Una decidida apuesta por las

soluciones en abierto.

Sistema de gestión y acceso a la información del

patrimonio cultural de Arganda del Rey

1 / OPEN ARCHIVES Los distintos datasets se gestionan

en un repositorio OAI-PMH que

garantiza la interoperabilidad,

accesibilidad y reutilización de

todos los registros y sus metadatos

2 / OPEN DATA Es un sistema que, además de

cumplir con los estándares de

descripción e interoperabilidad, permite la libre descarga y

disponibilidad de todos los datos

3 / OPEN SOURCE Todo la plataforma tecnológica se ha

desarrollado con diferentes

soluciones open source, y con

recursos y medios propios. No se ha

utilizado ningún software propietario.

4 / LINKED DATA Se aplican conceptos y técnicas

de la web semántica, Los

descriptores de personas, lugares

y materias están enlazados a

VIAF, Geonames y Dbpedia

archivos en abierto Sistema de información del patrimonio documental y cultural de Arganda del Rey

El concepto de acceso abierto hace referencia a

“la disponibilidad de los recursos para su acceso,

descarga, copia, distribución, impresión, enlazado

de sus metadatos y, el elemento diferencial

respecto a los sistemas convencionales, los

metadatos están normalizados y son

recolectables a través de procesos

automatizados, facilitando por tanto su

reutilización sin ninguna barrera financiera,

técnica o semántica”

“ Gracias al uso de un repositorio OAI-PMH se

garantiza la interoperabilidad de los

recursos digitales. Una decidida apuesta por

las soluciones en abierto y con muy bajo

coste de implementación ”

Page 2: a rchivos Sistema de gestión y acceso a la información delarchivo.ayto-arganda.es/digital/openarchives.pdf · web semántica, Los descriptores de personas, lugares y materias están

1. INTRODUCCIÓN

El Archivo de la Ciudad de Arganda del Rey conserva los documentos producidos y recibidos

por la administración local a lo largo de sus más de ochocientos años de existencia. Es de los archivos

con fondos de mayor antigüedad de la Comunidad de Madrid (1306). Conserva además un notable

fondo documental, y en muy distintos soportes: bibliográficos, gráficos, audiovisuales, y participa en

los procesos de implantación de la administración electrónica.

Desde sus inicios ha intentado ser un centro innovador en la aplicación de soluciones

tecnológicas. En 1999 fue de los primeros archivos en crear un OPAC que diera acceso web tanto a

los registros descriptivos como a sus imágenes digitales. La Web fue rediseñada en 2006,

incorporando utilidades de las entonces nacientes redes sociales, como un chat en línea para

consultas, o una plataforma de acceso a su a su colección de vídeos documentales que suma en la

actualidad más de 350.000 visitas. En 2012 volvió a renovar por completo su web, siempre con

recursos y medios propios, apostando como eje rector la filosofía open y utilidades de la Web 3.0.

2. ARCHIVOS EN ABIERTO. INTEROPERABILIDAD TÉCNICA Y SEMÁNTICA. WEB 3.0.

En el presente año 2015 se ha ultimado un nuevo proyecto para hacer accesibles todos los datos

y registros con una única hoja de ruta: cumplir los estándares para la descripción e intercambio de

recursos electrónicos y hacer posible la interoperabilidad de todos sus datos, metadatos y recursos

de uso público. Una estrategia que podemos encuadrar dentro de los sistemas open access (acceso

abierto).

Page 3: a rchivos Sistema de gestión y acceso a la información delarchivo.ayto-arganda.es/digital/openarchives.pdf · web semántica, Los descriptores de personas, lugares y materias están

Toda la tecnología utilizada es aplicable en cualquier dato de carácter público. La arquitectura

del sistema se articula en torno al protocolo de archivos abiertos para la recolección de metadatos

(OAI-PMH), un tipo de repositorio que ha incrementado exponencialmente la disponibilidad,

accesibilidad y reutilización de los distintos datasets. Es un complemento a la búsqueda en el portal

web convencional, que sigue existiendo, y que se diferencia de la opción de “descarga de ficheros ”

fundamentalmente en que la infraestructura técnica del OAI obliga a cumplir unos requisitos de

normalización para poder acceder a los datasets de su repositorio. Es imprescindible la codificación e

identificación de sus metadatos y disponer de un formato común para los ficheros XML (XML-DC,

XML-EAD y XML-ESE), una información normalizada que hace posible que la institución se convierta

en proveedora de contenidos ya que los datasets pueden ser recolectados automáticamente por

otros portales y agregadores como Hispana, Europeana y OAIster.

Una vez que los datos son “interoperables” y que son reutilizados, la visibilidad de los recursos

digitales de la entidad se multiplica, consiguiendo una difusión y posicionamiento web inimaginable

hace unos años. Se comparten los metadatos, las vías para acceder a la información, pero los

recursos digitales siguen estando alojados en los servidores de la institución, por lo que en ningún

caso se resta visibilidad a la organización. En el trabajo de normalización de los datos se han

vinculado los descriptores a recursos externos y vocabularios estructurados como Geonames

(nombres geográficos) Dbpedia (materias) y VIAF (personas) y a la creación de bases de datos en RDF

(Resource Description Framework). Una contextualización de los registros que nos aproxima a la

Web Semántica y a las técnicas de Linked Open Data.

Page 4: a rchivos Sistema de gestión y acceso a la información delarchivo.ayto-arganda.es/digital/openarchives.pdf · web semántica, Los descriptores de personas, lugares y materias están

3. ¿CÓMO FUNCIONA EL PROTOCOLO OAI-PMH?

OAI-PMH (Open Archives Initiative – Protocol for Metadata Harvesting) es en

un protocolo para la comunicación de metadatos, nacido inicialmente para la comunicación y acceso

de documentos científicos pero que se ha extendido en los últimos años como un estándar para la

comunicación de metadatos. Podríamos señalar tres características fundamentales del protocolo:

1. Simplicidad: Se concibió bajo la premisa de la sencillez. Los creadores buscaron una fórmula

simple que estuviera al alcance de cualquier potencial implementador.

2. Normalización: Basado en estándares ampliamente utilizados en Internet como son el

protocolo http (HiperText Transfer Protocol) para la transmisión de datos y órdenes y XML

(Extended Markup Language) para la codificación de los metadatos.

3. Recolección. Frente a otros sistemas de agregación de contenidos como la los sistemas

de sindicación de contenidos vía RSS, OAI-PMH ha optado por la recolección de metadatos.

En este caso, existe una entidad, normalmente agregadores de contenidos o empresas

infomediarias que recogen periódica y sistemáticamente todos o parte de los metadatos

expuestos en los distintos OAI y poder así desarrollar servicios de valor añadido.

OAI-PMH sigue el principio de que existen múltiples organizaciones que son potenciales

proveedoras de datos (PD) y que desean compartir su información con múltiples proveedores de

servicios (PS) a través de un protocolo común. Los primeros son entidades que proporcionan los

metadatos de los documentos que gestionan y los segundos son los recolectores o agregadores de

contenidos, que toman los datos con el objetivo de incorporarles algún valor añadido y ofrecerlos a

los usuarios finales. Pueden ser empresas infomediarias o sistemas públicos de difusión como

Hispana (Ministerio de Cultura) o Europeana (Comunidad Europea), o cualquier otra organización

pública o privada que cuente con este tipo de repositorios.

La comunicación entre el proveedor de datos (PD) y el proveedor de servicios(PS) se realiza

utilizando transacciones http para emitir preguntas y obtener repuestas. Mediante estas peticiones

se pueden filtrar y seleccionar el envío de determinados metadatos según determinados criterios

como por ejemplo la fecha de creación de los registros, o una determinada materia o concepto. En

respuesta, el proveedor de datos devuelve un conjunto de registros en formato XML codificado y

Page 5: a rchivos Sistema de gestión y acceso a la información delarchivo.ayto-arganda.es/digital/openarchives.pdf · web semántica, Los descriptores de personas, lugares y materias están

estructurado. Las peticiones se emiten a través de los métodos GET y POST del protocolo http,

existen seis tipos de peticiones que se pueden realizar a un repositorio OAI-PMH:

1. Identify: Recupera información sobre el proveedor de datos: nombre, versión del protocolo

que utiliza, dirección del administrador, etc.

[Ejemplo: http://archivo.ayto-arganda.es:8080/repox/OAIHandler?verb=Identify ]

2. ListMetadataFormats: Devuelve la relación de los formatos normalizados de metadatos que

se han utilizado en los datasets del repositorio

[Ejemplo: http://archivo.ayto-

arganda.es:8080/repox/OAIHandler?verb=ListMetadataFormats

3. ListIdentifiers: Recupera los identificadores o códigos de referencia de los registros. Tiene un

argumento obligatorio (metadataprefix) para especificar el formato de metadatos en el que

se quiere obtener la respuesta. Además permite introducir otros comandos como el rango

de fechas de los datos que queremos recuperar.

Ejemplo: [http://archivo.ayto-

arganda.es:8080/repox/OAIHandler?verb=ListIdentifiers&metadataPrefix=oai_dc

4. ListRecords: Ofrece una información de conjunto de todos los datos y metadatos del

repositorio.

[Ejemplo: http://archivo.ayto-

arganda.es:8080/repox/OAIHandler?verb=ListRecords&metadataPrefix=oai_dc ]

5. GetRecord: Recupera un registro concreto. Necesita dos argumentos: identificador del

registro solicitado (identifier) y especificación del formato de metadatos (metadataprefix) .

Ejemplo: http://archivo.ayto-

arganda.es:8080/repox/OAIHandler?verb=GetRecord&metadataPrefix=oai_dc&identifier=oai

:archivo.aytoarganda.es:1Biblioteca_Digital:e5694e7a-6c12-4bda-b94c-6b662715fa02

6. ListSets: Informa de los dataset que integran el OAI-PMH. Es el más utilizado ya que, además

de dar una visión global del repositorio, se pueden seleccionar los identificadores y los

registros de cada uno de los conjuntos de datos .

Ejemplo: http://archivo.ayto-arganda.es:8080/repox/OAIHandler?verb=ListSets

Page 6: a rchivos Sistema de gestión y acceso a la información delarchivo.ayto-arganda.es/digital/openarchives.pdf · web semántica, Los descriptores de personas, lugares y materias están

Hemos utilizado el software open source para la creación de repositorios OAI-PMH

“Repox”, utilizado también por Europeana. A pesar de ser una solución de código abierto no

es el software de este tipo con más instalaciones en España. La práctica totalidad de los OAI-

PMH en funcionamiento han sido implementados por empresas especializadas. En nuestro

caso ha sido puesto en funcionamiento con recursos y medios propios.

Al tratarse de una solución de código abierto permite la personalización o agregación de

nuevas funcionalidades. Gracias a ello hemos añadido una hoja de estilo XSLT a las respuestas en

XML del OAI. De este modo, se ha conseguido que la presentación de los datos sea accesible para los

navegadores y por tanto mucho más amigable para los usuarios.

Page 7: a rchivos Sistema de gestión y acceso a la información delarchivo.ayto-arganda.es/digital/openarchives.pdf · web semántica, Los descriptores de personas, lugares y materias están

XML - RESPUESTA DEL OAI sin hoja de estilo XSLT XML – RESPUESTA DEL OAI con hoja de estilo XSLT

<?xml version="1.0" encoding="UTF-8" ?>

1. <oai_dc:dc schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd">

1. <dc:title>El Colegio Imperial, fundador de una Cátedra en Arganda</dc:title>

2. <dc:description>El Colegio Imperial, fundador de una Cátedra en Arganda 34. 319-336. Madrid: Consejo Superior de Investigaciones Científicas, 1994</dc:description>

4. EXPLOTACIÓN Y PUBLICACIÓN DE CONTENIDOS

Independientemente de la interoperabilidad de los datos gracias al uso del protocolo OAI-

PMH, y el acceso a los registros desde plataformas como Hispana, Europeana y el Portal de Archivos

Europeos, el proyecto tenía también como objetivo transformar por completo el sistema de

recuperación del OPAC.

Funcionalidades básicas:

1 Se ha mejorado el OPAC WEB con nuevas soluciones que permiten realizar filtros y búsquedas sobre los resultados, búsquedas facetadas, y representación de la información en tablas y galerías, con las librerías open source datatables y fisotope

2

Gestión de imágenes y objetos digitales.

Dada la diversidad de tipos de recursos digitales se ha creado un módulo específico que incorpora: Gestión de objetos digitales multimedia. Visor de imágenes multipágina. Visor de imágenes de publicaciones periódicas. [open source: openseadragon] Reproductor de vídeo flv y audio. Generación dinámica de PDFs con datos y metadatos. Posibilidad de incluir el visualizador de un recurso en una web externa.

Page 8: a rchivos Sistema de gestión y acceso a la información delarchivo.ayto-arganda.es/digital/openarchives.pdf · web semántica, Los descriptores de personas, lugares y materias están

3 Geolocalización de la información sobre mapas interactivos con utilidades de búsqueda y filtrado, realizadas íntegramente con Open Source: Open Geo Suite

4 Multidispositivo. Diseño web adaptable o adaptativo, conocido por las siglas RWD (Responsive Web Design) que permite adaptar la apariencia de las páginas web al dispositivo que se esté utilizando para visualizarla.

5 Generación dinámica de código QR, vinculado a los enlaces persistentes, que han sido situados en todos los bienes culturales, y que dan acceso a los registros descriptivos de cada bien.

6 Geolocalización del usuario y generación de itinerario, distancia, rutas, etc. utilizando la API de Google Maps.

7 Generación dinámica de metadatos. XML-EAD / XML-DC /XML-ESE

Page 9: a rchivos Sistema de gestión y acceso a la información delarchivo.ayto-arganda.es/digital/openarchives.pdf · web semántica, Los descriptores de personas, lugares y materias están

8 Open Linked data. Incorpora soporte básico para el

reconocimiento y la visualización de enlaces a datos

Linked Open Data procedentes de fuentes como

VIAF, DBpedia, GeoNames y data.bne.es.

Se utilizan tecnologías de Web Semántica utilizando RDF (Resource Description Framework), el estándar para la descripción conceptual o modelado de la información vinculada a recursos web.

9 Interacción con los usuarios. Cada uno de los registros incorpora un formulario para que los ciudadanos puedan hacer aportaciones o sugerencias.

10 Bibliografía-Recursos electrónicos. Todos los recursos bibliográficos que aparecen en las descripciones son libros virtuales realizados con una adaptación personalizada del proyecto open source Archive.org, una iniciativa de Internet Archive.

Ejemplo: http://archivo.ayto-arganda.es/digital/object.aspx?id=03000001#page/1+/mode/2up

11 Realidad aumentada. Se ha comenzado a desarrollar una APP de realidad aumentada con la herramienta open source ARToolKit NFT

12 Accesibilidad de todos los recursos desde las más importantes plataformas como Hispana, Europeana y el Portal de Archivos Europeos. Por el momento es la única administración no vinculada a la Administración General del Estado que está presente, gracias a la interoperabilidad que proporciona la generación dinámica de metadatos.

Page 10: a rchivos Sistema de gestión y acceso a la información delarchivo.ayto-arganda.es/digital/openarchives.pdf · web semántica, Los descriptores de personas, lugares y materias están

5. ANEXOS

Ver vídeo del proyecto: https://www.youtube.com/watch?v=ECd49BpTd28

. Home: http://archivo.ayto-arganda.es/patrimonio/Index.aspx

. Mapa interactivo: http://geoarchivo.ayto-arganda.es/ga/patrimonio.html

. Búsquedas documentales. http://archivo.ayto-arganda.es/B%C3%BAsquedas.aspx

. Acceso desde Hispana: http://hispana.mcu.es/es/consulta/busqueda.cmd?

. Acceso desde Europeana: http://www.europeana.eu/portal/search.html?

. Acceso desde el Portal de Archivos Europeos: http://www.archivesportaleurope.net/es/

. OAI-PMH: http://hispana.mcu.es/es/recoleccion/datos.cmd?

. Interoperabilidad. Registro tipo con datos enlazados:

http://archivo.ayto-arganda.es/digital/person.aspx?id=009700100001&p=Felipe%20III

http://archivo.ayto-arganda.es/digital/place.aspx?id=DD0001230397&l=Alicante

Page 11: a rchivos Sistema de gestión y acceso a la información delarchivo.ayto-arganda.es/digital/openarchives.pdf · web semántica, Los descriptores de personas, lugares y materias están

. Acceso desde Europeana, APP de Europeana e Hispana:

Page 12: a rchivos Sistema de gestión y acceso a la información delarchivo.ayto-arganda.es/digital/openarchives.pdf · web semántica, Los descriptores de personas, lugares y materias están