implantación de un servidor institucional de e-prints en la u.c.m

17
Implantación de un Implantación de un servidor institucional servidor institucional de e-prints en la U.C.M. de e-prints en la U.C.M. Víctor Manuel Herreros Villanueva Departamento de Automatización de la Biblioteca Servicio Informático de Apoyo a la Docencia e Investigación Universidad Complutense de Madrid 13 de Diciembre de 2004

Upload: lucky

Post on 10-Jan-2016

45 views

Category:

Documents


3 download

DESCRIPTION

Implantación de un servidor institucional de e-prints en la U.C.M. Víctor Manuel Herreros Villanueva Departamento de Automatización de la Biblioteca Servicio Informático de Apoyo a la Docencia e Investigación Universidad Complutense de Madrid 13 de Diciembre de 2004. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Implantación de un servidor institucional de e-prints en la U.C.M

Implantación de un servidor Implantación de un servidor institucional de e-prints en la institucional de e-prints en la

U.C.M.U.C.M.

Víctor Manuel Herreros Villanueva

Departamento de Automatización de la Biblioteca

Servicio Informático de Apoyo a la Docencia e Investigación

Universidad Complutense de Madrid

13 de Diciembre de 2004

Page 2: Implantación de un servidor institucional de e-prints en la U.C.M

Estructura de la presentaciónEstructura de la presentación

Definiciones clave Criterios para la elección de sistemas de software

que provean un servidor de publicaciones electrónicas

Requisitos del sistema Características del sistema GNU EPrints Ejemplos de su flexibilidad del sistema Breve recorrido por nuestra instalación Perspectivas de futuro

Page 3: Implantación de un servidor institucional de e-prints en la U.C.M

Definiciones claveDefiniciones clave

E-print o publicación electrónicaOpen Archives Initiative (OAI)

Page 4: Implantación de un servidor institucional de e-prints en la U.C.M

Definiciones claveDefiniciones clave

E-print o publicación electrónica– Los e-prints son copias electrónicas de artículos de investigación

académica. Pueden adoptar la forma de pre-prints (artículos antes de haber sido revisados por un comité científico) o post-prints (tras haber sido revisados). Pueden ser artículos de revistas, conferencias, capítulos de libros o cualquier otro producto resultado de investigación. Un archivo de e-prints es sencillamente un repositorio on-line de estos materiales. Usualmente se pone a disposición a través de la web de un modo gratuito al objeto de asegurar la mayor diseminación posible de sus contenidos.

Page 5: Implantación de un servidor institucional de e-prints en la U.C.M

Definiciones claveDefiniciones clave

Open Archives Initiative (OAI) – La iniciativa de archivos abiertos u OAI “desarrolla y promueve

estándares de interoperabilidad que pretenden facilitar la diseminación eficiente del contenido”. En el núcleo de este trabajo se sitúa el protocolo de recolección de datos OAI-MH, que permite la recolección de metadatos procedentes de archivos de e-prints y su centralización en una base de datos consultable. Los metadatos recolectados siguen el estándar formal Dublin Core.

Page 6: Implantación de un servidor institucional de e-prints en la U.C.M

Definiciones claveDefiniciones clave

E-print o publicación electrónica Open Archives Initiative (OAI)

Sobre el respeto a estos dos conceptos se apoya el sistema que se va a describir a continuación, y que constituye el servidor de publicaciones electrónicas de la Universidad Complutense de Madrid. Debe ser visto, empleando la terminología utilizada en OAI, como un proveedor de datos y a la vez como un proveedor de servicios, pues ofrece metadatos para recolectores externos y habilita al usuario final para realizar búsquedas particulares.

Page 7: Implantación de un servidor institucional de e-prints en la U.C.M

Criterios para la elección de Criterios para la elección de software de publicaciones software de publicaciones

electrónicaselectrónicas Disponible públicamente y actualizado regularmente Disponible gratuitamente y libremente modificable y redistribuible Compatible con la última versión de los protocolos de recolección de

datos OAIARNO

CDSware

Dspace

Eprints

Fedora

i-Tor

MyCoRe

Page 8: Implantación de un servidor institucional de e-prints en la U.C.M

Criterios para la elección de Criterios para la elección de software de publicaciones software de publicaciones

electrónicaselectrónicas Eprints tiene un mayor conjunto de instalaciones que el resto de

sistemas. Está desarrollado por la Universidad de Southampton. Su primera versión (1.0) data de Noviembre de 2000. La versión actual es la 2.3.7. Ofrece un intensivo apoyo a través de la red a los nuevos implementadores, y puede ser puesto en funcionamiento relativamente rápido y con un mínimo de conocimientos técnicos. Sobre este sistema con funcionalidades

básicas, pueden integrarse de un modo sencillo características avanzadas. Permite almacenar un número en la práctica ilimitado de publicaciones electrónicas. En el momento actual, en nuestro servidor hay 1391 publicaciones electrónicas, correspondientes a tesis doctorales defendidas en la UCM durante el período 1991-2000. Esta colección responde a la intención de ofrecer un servidor de e-prints con contenido lo suficientemente atractivo como para que nuestra comunidad investigadora comience a utilizarlo no sólo en modo consulta sino como depósito institucional de artículos sensu lato.

Page 9: Implantación de un servidor institucional de e-prints en la U.C.M

Criterios para la elección de Criterios para la elección de software de publicaciones software de publicaciones

electrónicaselectrónicas Además, está basado en PERL – Apache – MySQL sobre

plataformas tipo Unix, entorno en el que poseemos un conocimiento suficiente como para adaptar el software a nuestras necesidades.

Page 10: Implantación de un servidor institucional de e-prints en la U.C.M

Requisitos del sistemaRequisitos del sistema Hardware capaz de soportar un sistema operativo GNU/Linux o similar, a

partir de procesadores Pentium II Sistema operativo de tipo GNU/Linux o similar (RedHat, Debian, SuSE,

Solaris, Mac OS X) Servidor web Apache Intérprete de lenguaje de programación PERL y un reducido número de

módulos adicionales para este lenguaje Módulo mod_perl para Apache Gestor de bases de datos MySQL Software EPrints

Es de destacar que todos los requisitos software se distribuyen de modo gratuito, y que el coste de la plataforma hardware mínima es ínfimo.

Page 11: Implantación de un servidor institucional de e-prints en la U.C.M

Características de EPrintsCaracterísticas de EPrints

Desarrollo en continua evolución Instalación estándar mediante scripts de tipo ./configure Flexibilidad en la configuración Puede almacenar documentos en cualquier formato, inclusive para un

mismo e-print Se puede emplear cualquier esquema de metadatos Los e-prints pueden encuadrarse dentro de una jerarquía de materias

expandible Los e-prints pueden remitirse al archivo a través de una sencilla interfaz

web, bien procedentes de archivos locales o de URLs remotas

Los autores también pueden tener asociada una serie de metadatos

Page 12: Implantación de un servidor institucional de e-prints en la U.C.M

Características de EPrintsCaracterísticas de EPrints

Los trabajos remitidos deben superar un proceso de moderación para asegurar un nivel mínimo de calidad (formal y/o de contenido). Este proceso se ejecuta mediante interfaz web

Se contempla la indexación a texto completo de documentos en los siguientes formatos: ASCII, HTML, PDF, Word, LaTeX

Se contempla el uso de motores externos de búsqueda, como Google Uso opcional de HTTPS en áreas restringidas Exportación/importación de metadatos de e-prints, usuarios y materias

en formato XML Configuración de la interfaz web mediante XHTML La intervención del administrador del sistema, una vez configurado y

adaptado éste, es mínima

Page 13: Implantación de un servidor institucional de e-prints en la U.C.M

Flexibilidad de EPrintsFlexibilidad de EPrints

Las características que se han adaptado a las peculiaridades de nuestro entorno son:

Posibilidad de almacenar los ficheros en una red de almacenamiento remoto y los metadatos de las mismas en el propio servidor de e-prints

Posibilidad de almacenar e-prints compuestos sólo de metadatos Posibilidad de realizar cargas masivas de e-prints a partir de registros

bibliográficos extraídos del catálogo USMARC de la BUC, empleando XML como lenguaje formal de intercambio de datos

Personalización de la interfaz web de usuario para adaptarse a la hoja de estilos empleada en el sitio web de la BUC y para incluir barra de menús en JavaScript

Interfaz web multilingüe

Page 14: Implantación de un servidor institucional de e-prints en la U.C.M

Flexibilidad de EPrintsFlexibilidad de EPrints

Las características que se han adaptado a las peculiaridades de nuestro entorno son:

Posibilidad de instalar varios archivos de e-prints en un mismo servidor Administración distribuida geográfica y temáticamente de los usuarios

administradores, ideal para el esquema funcional de la biblioteca complutense

Empleo del listado de encabezamientos de materias utilizados en la BUC Creación de tipos de e-prints a la medida de las necesidades de la BUC Creación de metadatos personalizados para cada tipo de e-print, a partir

del esquema básico conforme a Dublin Core

Page 15: Implantación de un servidor institucional de e-prints en la U.C.M

Nuestra instalaciónNuestra instalación

Recorrido por las características básicas de la implementación de EPrints en la UCM

Consulta (Año / Materia / Facultades) Búsqueda simple Búsqueda avanzada Registro de usuarios Servicio de subscripción Estado del servidor Buffer de envío Búsquedas por parte del personal (E-prints borrados) Creación de usuarios Edición de materias Deposición de e-prints Cambio de idioma

Page 16: Implantación de un servidor institucional de e-prints en la U.C.M

Perspectivas de futuroPerspectivas de futuroTrabajos a realizar a corto plazo1. Migración de la plataforma actual (Linux Suse 9.0, Apache 1.3) a un

entorno plenamente soportado por nuestros servicios infraestructurales informáticos (Solares 8, Apache 2.0)

2. Profundizar en la personalización del interfaz web3. Integración con la cadena de producción de tesis doctorales

digitalizadas procedentes de nuestro servicio de publicaciones4. Incremento del volumen de la colección de publicaciones electrónicas

con la incorporación de otros tipos5. Definición formal del tipo de e-prints que serán aceptados en un

futuro, así como del formato de sus ficheros y sus procedencias6. Labor de difusión del servicio, en una primera instancia entre nuestra

comunidad universitaria y más adelante en entornos más ambiciosos7. Registro del servicio de e-prints de la UCM como proveedor de datos

acorde con OAI, para proporcionar un amplio contexto de búsquedas más allá de la Universidad Complutense de Madrid

Page 17: Implantación de un servidor institucional de e-prints en la U.C.M

Implantación de un servidor Implantación de un servidor institucional de e-prints en la institucional de e-prints en la

U.C.M.U.C.M.

Víctor Manuel Herreros Villanueva

Departamento de Automatización de la Biblioteca

Servicio Informático de Apoyo a la Docencia e Investigación

Universidad Complutense de Madrid

13 de Diciembre de 2004