implantación de un servidor institucional de e-prints en la u.c.m
DESCRIPTION
Implantación de un servidor institucional de e-prints en la U.C.M. Víctor Manuel Herreros Villanueva Departamento de Automatización de la Biblioteca Servicio Informático de Apoyo a la Docencia e Investigación Universidad Complutense de Madrid 13 de Diciembre de 2004. - PowerPoint PPT PresentationTRANSCRIPT
Implantación de un servidor Implantación de un servidor institucional de e-prints en la institucional de e-prints en la
U.C.M.U.C.M.
Víctor Manuel Herreros Villanueva
Departamento de Automatización de la Biblioteca
Servicio Informático de Apoyo a la Docencia e Investigación
Universidad Complutense de Madrid
13 de Diciembre de 2004
Estructura de la presentaciónEstructura de la presentación
Definiciones clave Criterios para la elección de sistemas de software
que provean un servidor de publicaciones electrónicas
Requisitos del sistema Características del sistema GNU EPrints Ejemplos de su flexibilidad del sistema Breve recorrido por nuestra instalación Perspectivas de futuro
Definiciones claveDefiniciones clave
E-print o publicación electrónicaOpen Archives Initiative (OAI)
Definiciones claveDefiniciones clave
E-print o publicación electrónica– Los e-prints son copias electrónicas de artículos de investigación
académica. Pueden adoptar la forma de pre-prints (artículos antes de haber sido revisados por un comité científico) o post-prints (tras haber sido revisados). Pueden ser artículos de revistas, conferencias, capítulos de libros o cualquier otro producto resultado de investigación. Un archivo de e-prints es sencillamente un repositorio on-line de estos materiales. Usualmente se pone a disposición a través de la web de un modo gratuito al objeto de asegurar la mayor diseminación posible de sus contenidos.
Definiciones claveDefiniciones clave
Open Archives Initiative (OAI) – La iniciativa de archivos abiertos u OAI “desarrolla y promueve
estándares de interoperabilidad que pretenden facilitar la diseminación eficiente del contenido”. En el núcleo de este trabajo se sitúa el protocolo de recolección de datos OAI-MH, que permite la recolección de metadatos procedentes de archivos de e-prints y su centralización en una base de datos consultable. Los metadatos recolectados siguen el estándar formal Dublin Core.
Definiciones claveDefiniciones clave
E-print o publicación electrónica Open Archives Initiative (OAI)
Sobre el respeto a estos dos conceptos se apoya el sistema que se va a describir a continuación, y que constituye el servidor de publicaciones electrónicas de la Universidad Complutense de Madrid. Debe ser visto, empleando la terminología utilizada en OAI, como un proveedor de datos y a la vez como un proveedor de servicios, pues ofrece metadatos para recolectores externos y habilita al usuario final para realizar búsquedas particulares.
Criterios para la elección de Criterios para la elección de software de publicaciones software de publicaciones
electrónicaselectrónicas Disponible públicamente y actualizado regularmente Disponible gratuitamente y libremente modificable y redistribuible Compatible con la última versión de los protocolos de recolección de
datos OAIARNO
CDSware
Dspace
Eprints
Fedora
i-Tor
MyCoRe
Criterios para la elección de Criterios para la elección de software de publicaciones software de publicaciones
electrónicaselectrónicas Eprints tiene un mayor conjunto de instalaciones que el resto de
sistemas. Está desarrollado por la Universidad de Southampton. Su primera versión (1.0) data de Noviembre de 2000. La versión actual es la 2.3.7. Ofrece un intensivo apoyo a través de la red a los nuevos implementadores, y puede ser puesto en funcionamiento relativamente rápido y con un mínimo de conocimientos técnicos. Sobre este sistema con funcionalidades
básicas, pueden integrarse de un modo sencillo características avanzadas. Permite almacenar un número en la práctica ilimitado de publicaciones electrónicas. En el momento actual, en nuestro servidor hay 1391 publicaciones electrónicas, correspondientes a tesis doctorales defendidas en la UCM durante el período 1991-2000. Esta colección responde a la intención de ofrecer un servidor de e-prints con contenido lo suficientemente atractivo como para que nuestra comunidad investigadora comience a utilizarlo no sólo en modo consulta sino como depósito institucional de artículos sensu lato.
Criterios para la elección de Criterios para la elección de software de publicaciones software de publicaciones
electrónicaselectrónicas Además, está basado en PERL – Apache – MySQL sobre
plataformas tipo Unix, entorno en el que poseemos un conocimiento suficiente como para adaptar el software a nuestras necesidades.
Requisitos del sistemaRequisitos del sistema Hardware capaz de soportar un sistema operativo GNU/Linux o similar, a
partir de procesadores Pentium II Sistema operativo de tipo GNU/Linux o similar (RedHat, Debian, SuSE,
Solaris, Mac OS X) Servidor web Apache Intérprete de lenguaje de programación PERL y un reducido número de
módulos adicionales para este lenguaje Módulo mod_perl para Apache Gestor de bases de datos MySQL Software EPrints
Es de destacar que todos los requisitos software se distribuyen de modo gratuito, y que el coste de la plataforma hardware mínima es ínfimo.
Características de EPrintsCaracterísticas de EPrints
Desarrollo en continua evolución Instalación estándar mediante scripts de tipo ./configure Flexibilidad en la configuración Puede almacenar documentos en cualquier formato, inclusive para un
mismo e-print Se puede emplear cualquier esquema de metadatos Los e-prints pueden encuadrarse dentro de una jerarquía de materias
expandible Los e-prints pueden remitirse al archivo a través de una sencilla interfaz
web, bien procedentes de archivos locales o de URLs remotas
Los autores también pueden tener asociada una serie de metadatos
Características de EPrintsCaracterísticas de EPrints
Los trabajos remitidos deben superar un proceso de moderación para asegurar un nivel mínimo de calidad (formal y/o de contenido). Este proceso se ejecuta mediante interfaz web
Se contempla la indexación a texto completo de documentos en los siguientes formatos: ASCII, HTML, PDF, Word, LaTeX
Se contempla el uso de motores externos de búsqueda, como Google Uso opcional de HTTPS en áreas restringidas Exportación/importación de metadatos de e-prints, usuarios y materias
en formato XML Configuración de la interfaz web mediante XHTML La intervención del administrador del sistema, una vez configurado y
adaptado éste, es mínima
Flexibilidad de EPrintsFlexibilidad de EPrints
Las características que se han adaptado a las peculiaridades de nuestro entorno son:
Posibilidad de almacenar los ficheros en una red de almacenamiento remoto y los metadatos de las mismas en el propio servidor de e-prints
Posibilidad de almacenar e-prints compuestos sólo de metadatos Posibilidad de realizar cargas masivas de e-prints a partir de registros
bibliográficos extraídos del catálogo USMARC de la BUC, empleando XML como lenguaje formal de intercambio de datos
Personalización de la interfaz web de usuario para adaptarse a la hoja de estilos empleada en el sitio web de la BUC y para incluir barra de menús en JavaScript
Interfaz web multilingüe
Flexibilidad de EPrintsFlexibilidad de EPrints
Las características que se han adaptado a las peculiaridades de nuestro entorno son:
Posibilidad de instalar varios archivos de e-prints en un mismo servidor Administración distribuida geográfica y temáticamente de los usuarios
administradores, ideal para el esquema funcional de la biblioteca complutense
Empleo del listado de encabezamientos de materias utilizados en la BUC Creación de tipos de e-prints a la medida de las necesidades de la BUC Creación de metadatos personalizados para cada tipo de e-print, a partir
del esquema básico conforme a Dublin Core
Nuestra instalaciónNuestra instalación
Recorrido por las características básicas de la implementación de EPrints en la UCM
Consulta (Año / Materia / Facultades) Búsqueda simple Búsqueda avanzada Registro de usuarios Servicio de subscripción Estado del servidor Buffer de envío Búsquedas por parte del personal (E-prints borrados) Creación de usuarios Edición de materias Deposición de e-prints Cambio de idioma
Perspectivas de futuroPerspectivas de futuroTrabajos a realizar a corto plazo1. Migración de la plataforma actual (Linux Suse 9.0, Apache 1.3) a un
entorno plenamente soportado por nuestros servicios infraestructurales informáticos (Solares 8, Apache 2.0)
2. Profundizar en la personalización del interfaz web3. Integración con la cadena de producción de tesis doctorales
digitalizadas procedentes de nuestro servicio de publicaciones4. Incremento del volumen de la colección de publicaciones electrónicas
con la incorporación de otros tipos5. Definición formal del tipo de e-prints que serán aceptados en un
futuro, así como del formato de sus ficheros y sus procedencias6. Labor de difusión del servicio, en una primera instancia entre nuestra
comunidad universitaria y más adelante en entornos más ambiciosos7. Registro del servicio de e-prints de la UCM como proveedor de datos
acorde con OAI, para proporcionar un amplio contexto de búsquedas más allá de la Universidad Complutense de Madrid
Implantación de un servidor Implantación de un servidor institucional de e-prints en la institucional de e-prints en la
U.C.M.U.C.M.
Víctor Manuel Herreros Villanueva
Departamento de Automatización de la Biblioteca
Servicio Informático de Apoyo a la Docencia e Investigación
Universidad Complutense de Madrid
13 de Diciembre de 2004