creacionparte2

Upload: aditesi

Post on 09-Feb-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/22/2019 creacionparte2

    1/23

    Creacin y personalizacin de una coleccin de documentos

    digitales basada en Greenstone. Parte 2.

    Lic. Jorgelina Jimnez Miranda

    [email protected]

    Resumen

    La presentacin y organizacin de las colecciones construidas con el sistemaGreenstone estn dotadas de una notable flexibilidad que confiere un valor aadido alacceso a la informacin segn los intereses, caractersticas y necesidades de los usuariosfinales. En el artculo Creacin y personalizacin de una coleccin de documentosdigitales basada en Greenstone. Parte I,se describi el diseo personalizado de unacoleccin compuesta de archivos .doc y -pdf en lo relativo a mecanismos de bsqueda ynavegacin, por una parte, y cambios en algunos elementos de su pgina Acerca de, por

    la otra, los cuales se lograron a partir de dismiles cadenas de formatos correspondientesa los clasificadores y la macro extra.dm. Con el fin de profundizar en la familiarizacinde las ventajas de este sistema y ampliar el abanico de posibilidades que ofrece, en lasegunda parte de este trabajo, se dio continuidad a la personalizacin de una coleccinsimilar sobre la base de la aplicacin de otras cadenas de formato que operanmodificaciones inmediatas en la disposicin de los datos as como en la apariencia yorganizacin de la informacin contenida en las diferentes pginas generadas por estesistema. Tal conjunto de posibles personalizaciones ilustra, en alguna medida, lasalternativas de configuracin de las salidas de esta aplicacin las cuales, adems, seejecutan en forma expedita.

    Palabras clave: Greenstone, creacin de colecciones digitales, personalizacin decolecciones digitales, archivos -pdf, archivos .doc, cadenas de formato.

    Key words: Greenstone, creating digital collections, customizing digital collections, -pdf files, .doc files, format strings.

    Introduccin

    La flexibilidad, facilidad de uso, as como la libre disponibilidad de Greenstone le

    otorgan a este software una capacidad de adaptacin a las innumerables necesidades delos usuarios en diversos escenarios y por consiguiente, dotan a esta herramientainformtica de un valor inestimable para los pases en vas de desarrollo.

    La aplicacin de cadenas de formatos diversas es una de las vas ofertadas por estesistema para lograr una configuracin particular de las salidas de sus diferentes pginas(Acerca de, ndi ces, clasificadoresy resultados de bsqueda).

    En el artculo Creacin y personalizacin de una coleccin de documentos digitalesbasada en Greenstone. Parte I se reprodujo el procedimiento aplicado en unacoleccin de documentos .doc y -pdf para configurar, en alguna medida, tales pginas

    mediante macros y cadenas de formato, aunque slo se abordaron cierto nmero deadaptaciones por razones de espacio. Por tal motivo, en el presente trabajo, se retoma el

    mailto:[email protected]:[email protected]:[email protected]
  • 7/22/2019 creacionparte2

    2/23

    tema para proporcionar nuevas sugerencias en cuanto a la personalizacin decolecciones de archivos -pdf y .doc. Por tanto, la finalidad de este artculo consiste encontinuar la ejemplificacin de dismiles configuraciones de las pginas de Greenstomemediante la aplicacin de nuevas cadenas de formato las cuales determinarnapariencia y facilidades particulares en funcin de las necesidades de los usuarios de

    este sistema.

    Desarrollo

    El punto focal de la organizacin de las bibliotecas digitales gravita en torno de lascolecciones cuyo propsito fundamental es el acceso a la informacin contenida en ellas(1). En lo que al programa Greenstone concierne, ste se ha concebido para prestarauxilio a los usuarios en la organizacin y construccin, en forma muy rpida, decolecciones de informacin sencillas -por defecto-, aunque por las facilidades brindadasa travs de la interfaz del usuario son sumamente configurables en mltiples nivelesdistintos en un breve lapso. Algunas de ellas son (2, 3):

    definicin de ndices de bsqueda puestos a disposicin de los usuarios, estructuras de navegacin adaptables a las necesidades de los usuarios, cambios en las macros, modificaciones en las cadenas de formato, presentacin particularizada de los temes desde la pantalla al personalizar

    alguna o cada una de las pginas que Greenstone genera, utilizacin de macros dinmicas, personalizacin de la fase de construccin de las colecciones, modificaciones en las caractersticas del sistema de ejecucin.

    Por tanto, llegado el punto en que el usuario de Greenstone ha creado una coleccin pordefecto, es decir, despus de obtener una coleccin en forma bsica, puede tomar ladecisin de modificar la estructura lograda a partir de su construccin por omisin.Tales transformaciones se pueden concretar por distintas medios (2), algunos de loscuales se esbozan a continuacin:

    Enriquecimiento de los metadatos lo cual en la prctica implica asignar valores

    especficos a cada uno de los metadatos

    En la concepcin de las bibliotecas digitales Greenstone est implcito el empeo de

    aadir valor a las colecciones creadas y almacenadas en ellas. Una de los mediosexistentes para alcanzar esta meta radica en el enriquecimiento de las colecciones conmetadatos de alta calidad sobre los cuales descansan actividades de bsqueda ynavegacin de manera uniforme y til (1).

    Los metadatos son informacin adicional acerca de los documentos originales talescomo los autores o creadores, ttulo, editorial, palabras clave o descriptores, lugar yfecha de publicacin, entre otras y brindan un resumen muy sucinto de cualquier recursode informacin. Describen varios atributos de los objetos de informacin y les proveende significado, contexto y organizacin (4). Sirven para identificar, localizar, recuperary acceder a esos documentos. Posibilitan una gestin eficaz y eficiente de la

    informacin, porque le confieren una organizacin estructurada a diferencia de Internet;por consiguiente, la descripcin normalizada de los documentos o recursos electrnicos

  • 7/22/2019 creacionparte2

    3/23

    mediante conjuntos de metadatos constituye una solucin para el mejoramiento de larelevancia o pertinencia de los resultados en el proceso de bsqueda y recuperacin enInternet o en bibliotecas digitales (5). En Greenstone hay disponibles diferentesconjuntos de metadatos: Dublin Core (dc.) de cobertura internacional, DevelpmentLibrary Subset Example Metadata (dls.) y Extracted Greenstone Metadata (ex.). Otros

    pueden crearse tambin a la medida de las necesidades.

    Entre los conjuntos de metadatos citados, el Dublin Core se considera el ms interesantepues responde a la norma ISO Conjunto de Metadatos Dublin Core, ampliamenteaceptada como referente a nivel mundial.

    Para organizar una biblioteca digital Greenstone, es necesario la intervencin de losmetadatos que son informacin estructurada referente a los recursos de informacin, lacual se refleja en la presentacin y apariencia de la interfaz del usuario (2). Losmetadatos son la materia prima de las colecciones que permite configurar las distintassalidas del sistema por lo que puede afirmarse que la caracterstica definitoria de las

    bibliotecas digitales es el uso de los metadatos en calidad de materia prima. Laasignacin de metadatos en Greenstone resulta decisiva y est asociada a la eleccinconcreta de los ndices de bsqueda y de clasificadores contemplados en lascolecciones, as como otras facilidades (2).

    En lo que a metadatos se refiere, es conveniente subrayar que la arquitectura deGreenstone comprende a un editor de metadatos denominado Greenstone EditorMetadata Sets, una aplicacin Java que facilita la creacin de conjunto de metadatosdefinidos por el usuario a fin de que, con posterioridad, estn disponibles para suasignacin a las colecciones (6).

    El panel Enriquecer es la opcin del Greenstone L ibrarian in terf ace(GL I) que ofrecela posibilidad de asignar metadatos a los documentos incluidos en las colecciones.

    Asignacin de conectores segn el formato de los archivos originales procesados y

    configuracin subsiguiente cuando se precise

    Los conectores son pequeos programas escritos en lenguaje de programacin Perl quetransforman los documentos originales (.pdf, .doc, .ppt u otros) a un formatonormalizado XML y codificados en Unicode lo que asegura la capacidad de laaplicacin para tratar cualquier idioma. Todos proceden de un conector bsico

    denominado BasPlugin que realiza las operaciones necesarias para crear un nuevodocumento en el formato de archivo Greenstone con el cual trabajar el sistema (7, 8).

    Por tanto, es posible plantear que los conectores analizan los documentos importados yextraen los metadatos y debido a ello, en el diseo de ndices o clasificadores hay unaasociacin entre ambos. Por ejemplo, el conector HTML convierte los metadatos queestn implcitos en el formato del clasificador de ttulos entre etiquetas(8).

    La seleccin y configuracin de los conectores desempean un papel clave durante elprocesamiento de los documentos incluidos en las colecciones a tal punto que si estos

    procesos no son adecuados algunos documentos pueden ser rechazados. Asimismo, elorden en que se cargan los conectores igualmente puede originar problemas. Algunos

  • 7/22/2019 creacionparte2

    4/23

    autores recomiendan situar GreenstonePlugin y HTMLPlugin en el encabezamiento dela lista (6).

    Conviene subrayar que su revisin detenida reviste inters en lo que a los conectoresheredados se refiere, pues en algunos casos, sirven de gua para configurar los

    metadatos asignados que permanecern de manera definitiva en las colecciones dadoque pueden sugerir los plugins y argumentos con los cuales funciona, correctamente, talcoleccin.

    Desde el GLI, panel Diseo, opcin Plugins de documentos, es posible asignar losconectores (plugins) a las colecciones Greenstone.

    Determinacin de los ndices de los formularios de bsqueda que tambin se

    representan mediante metadatos de acuerdo con las necesidades de los usuarios

    Los ndices de bsqueda figuran entre los mecanismos disponibles en Greenstone para

    recuperar, de manera muy rpida, informacin en volmenes potencialmente elevados.

    Estos ndices especifican cules son las partes de las colecciones por las que puedenefectuarse las bsquedas o consultas. Se materializan en los formularios de bsquedasimple o avanzada, entre otros, y se determinan mediante la asignacin de los metadatosttulo, autores, fechas, materias, organizaciones o tambin se definen a partir dedeterminado nivel, es decir, permiten realizar las consultas a texto completo, a nivel decaptulos, de prrafo o incluso de los ttulos de las secciones. Igualmente, se puedenconfigurar ndices que permitan buscar por varios campos a la vez, por frases largas o

    prrafos completos. Tal como se explic al iniciar este tpico, la personalizacinlograda se debe a la asociacin con metadatos (9). Reviste importancia destacar que la

    bsqueda a texto completo en todos los documentos de una coleccin es una de lasfacilidades bsicas que, por defecto, suministra Greenstone en todas las colecciones (9):este tipo de bsqueda se ejecuta en forma muy eficiente gracias a los potentes motores(MG, MGPPy Lucene) disponibles en este sistema.

    Para disear los formularios de bsqueda de las colecciones Greenstone, se precisautilizar el panel Diseo, opcin ndices de bsqueda.

    Determinacin de los tipos de clasificadores necesarios para crear las estructuras

    de navegacin que permitirn la exploracin de las listas jerrquicas generadas

    segn los metadatos asignados y las necesidades de los usuarios

    Entre las funciones de bsqueda de Greenstone figuran los clasificadores. Estos sonfunciones que ofrecen una ordenacin clasificada de todos los documentoscomprendidos en una coleccin de acuerdo con criterios establecidos en el momento deconstruccin de sta (6). Tal como sucede con los ndices, los clasificadores puedenorganizarse segn el ttulo, los autores, palabras clave, fechas, o cualquier otro metadato

    por el cual se haya determinado su diseo ( 6).

    En las colecciones de Greenstone pueden apreciarse clasificadores que cubren una ciertagama, a saber, los mencionados en el prrafo anterior y tambin los clasificadores,

    Phind, Navegar, Collagey Hierarchy.

  • 7/22/2019 creacionparte2

    5/23

    En este caso, tambin los metadatos desempean un papel relevante en la configuracinde los clasificadores.

    De igual modo, desde el panel Diseo, pero con la opcin Clasificadores deexploracin, se configuran las colecciones en cuanto a mecanismos de navegacin.

    Configuracin de las cadenas de formatos obtenidas tras la creacin de la

    coleccin por defecto con vistas a que la visualizacin de los mecanismos de

    bsqueda y exploracin obedezcan a las caractersticas deseadas por el usuario

    final

    Otro de los factores imprescindibles a la personalizacin de las colecciones consiste enla utilizacin de las cadenas de formato (instrucciones o comandos); stas controlan laapariencia de gran nmero de aspectos de las pginas (8). Esos aspectos se puedenagrupar en 2 tipos distintos:

    1- Elementos de la pgina que muestran documentos o partes de documentos.2- Listas generadas por los clasificadores y formularios de bsquedas.

    Las cadenas de formato son la va seleccionada para la ejercitacin en el presentetrabajo.

    Al experimentar con las cadenas de formato, durante el proceso de configuracin de unacoleccin, los cambios se suceden rpida y sencillamente puesto que estas cadenas seinterpretan en el mismo instante en que se visualizan las pginas, es decir, tales pginasno se encuentran almacenadas previamente en Greenstone, sino que se generan a la horaen que se crean, configuran o modifican las cadenas de formato (8) y se muestran en

    pantalla las salidas del programa.

    Tal hecho demuestra cun potentes son las cadenas de formato, aunque por otra parte,son complejas y difciles de aprender (10). En lo fundamental son cdigo Html. Constande varios elementos:

    Funciones CL1 CL2 CL3 CL4 Search Document NavigationbarComponentes VL ist H li stVari ables [l ink] [dls .Title] [ex. Source]Cdigo H tml

    Condiciones { I f } {Or}

    Significado de algunos de sus elementos

    [text] Muestra el texto del documento.[parent] Se refiere al documento padre.[icon] cono de carpeta o pgina Web[srcicon] cono de documento en formato Word o Pdf[ link] [icon] [ /link] Enlace al cono del documento Html. La expresin link denota undocumento Html.

    [ link] [Title] [/link] Enlace con el documento en su versin Html, donde elhipervnculo se crea a partir del ttulo del documento.

  • 7/22/2019 creacionparte2

    6/23

    [scrlink][scricon][/scrkink] Crea un enlace etiquetado por el cono estndar deldocumento original (Word o Pdf) y no por el ttulo del documento.

    {Or} [dls. Title],[dc. Title], [ex.Ti tle], Unti tled

    Muestra el que est disponible de los 3, o sea, entre los metadatos dls., dc. o ex. yenlaza con el ttulo del que est disponible, o sea, el ttulo del conjunto de metadatosque se haya utilizado para crear o configurar la coleccin.

    En las cadenas de formato, estos elementos se combinan para conformar las rdenes ocomandos que el sistema ejecutar.

    Como se conoce, Greenstone es capaz de procesar un considerable nmero de formatosde gran diversidad. Ahora bien, durante el procesamiento, los archivos de talesformatos - .doc, -pdf u otro-, se convierten a Html mientras el archivo original sealmacena como un archivo asociado. Debido a ello, en las diversas pantallas por

    defecto de Greenstone (clasificadores, resultados de bsqueda), se observan 2 conos(Html y el cono del documento original desde donde se hipervincula el texto.

    Fig. 1. Visualizacin de dos conos en la salida de una coleccin de archivos.doc y -pdf

    En cambio, si tan solo se desea visualizar el original, se debe suprimir la lneacorrespondiente:

    [li nk][i con][/link]

    Si se examina la cadena de formato por defecto de Greenstone en el prrafo siguienteresaltado en azul, es posible comprobar su complejidad, sin embargo, ese elevado nivelde complejidad resulta necesario para formular una expresin razonable en cualquiercondicin, o sea, que resulte vlida para todos los casos y adems permita mantener lacompatibilidad con condiciones heredadas de versiones anteriores del programaGreenstone (6).

    Para trabajar en funcin de las cadenas de formato, se debe elegir el panel Formato,opcin Formatos. Como primer paso, cuando se selecciona la funcin Todas lascaractersticas conjuntamente con el componente afectado VList, se visualiza lasiguiente cadena:

    [li nk][i con][/link][ex.srclink]{Or}{[ ex.thumbicon],[ex.srcicon]}[ex./srcli nk][highlight]{Or}{[dc.Title],[exp.Title],[ex.Title],Untitled}[/highlight]{If}{[ex.Source],
    ([ex.Source])}

  • 7/22/2019 creacionparte2

    7/23

    Hechas las precisiones necesarias en lo concerniente a los aspectos tericos bsicosprevistos para este tema, se est en condiciones de acometer el ejercicio depersonalizacin de una coleccin Greenstone de archivos .pdf y .doc mediante lascadenas de formato, luego de una construccin por defecto; tal ejercitacin es elobjetivo trazado en este artculo el cual contribuir a la profundizacin del conocimiento

    de esta aplicacin informtica y de las facilidades que brinda en cuanto al acceso yorganizacin de la informacin.

    Recomendacin

    En sentido general, resulta conveniente realizar determinadas comprobaciones antes deintegrar a los documentos en su correspondiente carpeta mediante el panel Reunir.stas son:

    Asegurarse de que los archivos no estn protegidos por ninguna contraseade seguridad.

    Verificar que su estructura sea correcta, por ejemplo, la presencia de tabla decontenido bien jerarquizada mediante los marcadores (bookmarks) en el casode los -pdf.

    Comprobar que todas las fuentes estn incrustadas en el caso de los .pdf.

    Construccin bsica de la coleccin

    Considerando la explicacin detallada de la construccin bsica en Greenstone de unacoleccin de documentos en formato .pdf y .doc en la primera parte de este tema, esafase del trabajo se presenta en forma resumida a fin de recordar solamente ciertos

    puntos importantes, retomados para dar continuidad a la modificacin de la coleccin.

    Como resultado de la construccin bsica de tal coleccin, se logr un diseoinapropiado para los fines perseguidos dado que se obtuvieron:

    1. ndices que contemplaban la bsqueda a texto completo, por el metadatottulo y por el metadato fuente. Estos 2 ltimos son heredados deldocumento original y no satisfacen las necesidades requeridas. Losmetadatos heredados resultan baratos porque el sistema los extrae automticay rpidamente de los documentos, sin embargo, no son confiables en elsentido de que no resuelven todas las necesidades ni cumplen requisitos msambiciosos. Por consiguiente, deben asignarse metadatos manualmente,accin que torna confiables los resultados, pero encarece la operacin. Ellosignifica que la mejor opcin es intermedia, por tanto, se crea la coleccin enforma bsica y luego se mejora mediante la asignacin de metadatos DublinCore de manera manual (11,12).

    -Las imgenes siguientes muestran los ndices logrados por omisin que en una etapa

    posterior sern objeto de personalizacin:

  • 7/22/2019 creacionparte2

    8/23

    Fig. 2. ndice ttu los por defecto de la coleccin Fig. 3. ndice fuentepor defecto de la coleccin

    2. clasificadores de ttulo y fuente, solamente, los cuales se consideraninsuficientes para la navegacin de las colecciones de modo tal que aportenla informacin demandada por los usuarios. En un momento posterior, seeliminaron stos para aadir otros enriquecidos por metadatos. Mediante las

    imgenes 4 y 5, es posible observar el cono que enlaza con la versinh htmlal cual se elimina por su deficiente calidad (en ocasiones) y el nombre delarchivo, dato insustancial a los efectos de la explotacin de la coleccin y

    por dems antiesttico.

    Las imgenes siguientes visualizan los clasificadores ttulosy fuentedesplegados.En ellas se aprecian, con claridad, errores en el ttulo del ltimo documento y en losanteriores, ausencia de uniformidad en la presentacin de los datos debido a lainsuficiencia de la construccin bsica de la coleccin.

    Fig. 4Clasificador CL1 de ttulo por defecto desplegado Fig. 5 Clasificador CL2 de fuente por defecto desplegado

    Reconstruccin de la coleccin a partir de nuevos ndices y clasificadores

    enriquecidos con metadatos

    Con vistas a modificar el diseo de la coleccin desde el GLI, se decidi establecerndices de bsqueda por autor, ttulo, palabras clave y a nivel de captu lo y textocompleto. En cuanto a los clasificadores, se eligieron de ttulos, autores, palabrasclave y fechas con listas VList, AZCompact L isty Date L istrespectivamente. Con laintencin de reproducir los pasos acometidos, se utilizaron los paneles Enriquecer,Diseo y Formato con las opciones convenientes, explicadas ms adelante. Losdetalles correspondientes se exponen a continuacin mediante los procedimientosabreviados puesto que en la primera parte de este artculo se abordaron paso a paso:

  • 7/22/2019 creacionparte2

    9/23

    Desde el panel Enriquecer, se asignaron los valores de cada metadato comprendido enel conjunto Dublin Core necesarios para esta coleccin. Los metadatos seleccionadosestaban relacionados con los tipos de ndices y clasificadores que se deseaba visualizar.

    Durante este paso, se recomienda registrar los datos completos y en forma adecuada,

    sobre todo, no olvidar consignar todos los autores y todas las palabras clave pese a lalaboriosidad requerida, pues resultan imprescindibles a los efectos de la calidad de lacoleccin. Omitir datos o teclearlos con descuido implica prdida de informacin o decalidad.

    El llenado de los registros en cuanto a reglas de entrada de los autores, notacin de laspalabras clave, fecha e idioma dependen de las polticas y normas implantadas en cadainstitucin.

    En la prxima imagen se pueden apreciar los correspondientes a uno de los documentosprocesados.

    Fig. 6. Asignacin de metadatos Dublin Core a un documento de la coleccin mediante el panelEnriquecer

    Desde el panel Diseo, opcin Plugins de documento, se eliminaron los conectoresinnecesarios para esta coleccin y se mantuvieron los imprescindibles a su buenfuncionamiento, por ello, se conservaron nicamente, GreenstonePlugin, HTMLPluginWordPlugin y PDFPlugin, adems de los ubicados debajo de la lnea divisoria quenunca deben eliminarse tal como se presentan en la figura 7 que sonMetadataXMLPlugin, ArchiveInfPluginy DirectoryPlugin.

    Aunque la presencia de todos los conectores no afecta el diseo de la coleccin, serecomienda eliminar aquellos que no resultan indispensables dado que la aplicacinpuede trabajar mejor si se adjudican tan solo los requeridos. Por consiguiente, aunqueno es estrictamente necesario retirar los conectores redundantes, s constituye una buena

    prctica incluir, solamente, los que se necesiten y con ello evitar la inclusin accidentalde documentos dispersos (12).

  • 7/22/2019 creacionparte2

    10/23

    Fig. 7.Plugins o conectores asignados manualmente a la coleccin

    Desde el panel Diseo, opcin ndices de bsqueda, se suprimieron los ndicesconstruidos en forma bsica title y source y se mantuvo el text Este ltimo no debesuprimirse nunca pues determina las bsquedas a texto completo y debe figurar en

    primer lugar siempre en la relacin de conectores (plugins) asignados. En el lugar delos reemplazados, se adicionaron otros 3: ttulos, autores y palabras clave.

    La figura 8 permite apreciar tal configuracin:

    Fig. 8. Asignacin de ndices de bsqueda manualmente sobre la base de metadatosDublin Core

    Desde el panel Diseo, opcin Clasifi cadores de exploracin, se eliminaron losclasificadores L ist, titley sourceconstruidos por defecto y se sustituyeron por otros dettulo, autoresy palabrasclave configurados manualmente por medio de metadatos delconjunto Dubin Core (fig.9). Se utilizaron clasificadores del tipo AZList yAZCompactList.

  • 7/22/2019 creacionparte2

    11/23

    Fig. 9.Clasificadores de ttulo, autores y palabras clave diseados gracias a los metadatos Dublin Core

    Otras personalizaciones sobre la base del panel Formato

    Desde el panel Formato, opcin General, llenar los campos disponibles en el ladoderecho del panel segn se precise, excepto Carpeta de la coleccin que lo asigna elsistema Greenstone automticamente y no es modificable. Tambin desde esta opcinse puede adjudicar una imagen a la coleccin tanto en la pgina principal de Greenstonecomo en la pgina Acerca decorrespondiente.

    Fig. 10. Campos del panel Diseo, opcin General llenados segn necesidades

    De modo similar se procedi con el panel Diseo, opcin Buscary se logr visualizarlos ndices asignados manualmente en espaol. Las operaciones efectuadas en este

    sentido se aprecian por medio de la siguiente imagen:

  • 7/22/2019 creacionparte2

    12/23

    Figura 11. Sustitucin de los nombres de ndices por defecto por nombres en espaol de

    acuerdo con las necesidades del usuario final

    Luego de ejecutar estos pasos, se reconstruy la coleccin desde el panel Crear, botn

    Crear coleccin.

    Con el propsito de comprobar los resultados logrados, se examinaron todas las salidasde Greenstone. Partiendo de la pgina Acerca de de esta coleccin, se pueden verificarlos ajustes operados en el formulario de bsqueda obtenido cuando se da un clic sobre el

    botn Bsqueda. Las figuras 12 y 13 ofrecen las imgenes correspondientes:

    Fig. 12.ndices por los que es posible buscar Fig. 13. Niveles permitidos para realizar la bsqueda

    Desde la pgina Acerca de correspondiente a la coleccin, se muestra el clasificador

    Ttu los (CL1) obtenido gracias a la utilizacin de un VListque determina una sencillarelacin de ttulos con sus respectivos conos luego de la reconstruccin. Note que todoslos ttulos de los documentos se visualizan correctamente, aunque aparece el doblecono y el nombre del archivo.

  • 7/22/2019 creacionparte2

    13/23

    Fig. 14. Clasificador Ttulos (CL1) reconstruido

    Desde la pgina Acerca de correspondiente a la coleccin, al oprimir el botnautores/creadores, el clasificador Autores (CL2) ofrece la apariencia que muestra laimagen siguiente. A diferencia del anterior en este figuran conos de estanteras loscuales se logran al aplicar el clasificador AZCompactList.

    Fig. 15. Clasificador Ttulos (CL2) reconstruido

    El clasificador CL3 igualmente se cre a partir de AZCompactList que agrupa a losdocumentos cuyos temas coinciden.

    Desde la pgina Acerca de igualmente se revis la pgina de resultados. stos seobservaron al pulsar el botn Bsqueda (o Buscar), teclear el trmino sistemas deaplicaciny dar clic en el botn I ni ciar bsqueda. La figura 16 ofrece la apariencia dela lista de resultados obtenida:

    Fig. 16. Pgina de resultados obtenida tras teclear el trminosistemas de aplicacin

  • 7/22/2019 creacionparte2

    14/23

    Personalizacin de la coleccin mediante las cadenas de formato

    Antes de abordar este tema se recuerda, en forma somera, el procedimiento inherente almanejo de las cadenas de formato dado que en el artculo Creacin y personal izacin

    de documentos digitales en Greenstone. Parte 1 se ofrecieron explicaciones alrespecto. Para alterar el contenido de stas se procede as:

    Activar el panel Formatodel GLI. Dar clic sobre la opcin Formatosen el lado izquierdo del panel. En el panel derecho, pulsar la lista desplegable correspondiente a la opcin

    Elegir funcinpara seleccionar la deseada. Debajo, seleccionar el componente afectado que corresponda al caso. Clic en el botn Anadir formatopara activar el cuadro de texto correspondiente

    a Cadena de formato Htmldonde es posible modificar las cadenas de formato. Tambin se encuentran disponibles los botones I nser tar variable, Deshacer,

    Rehacer, Eliminar formatoy Volver a los parmetros.

    Una rpida inspeccin a todas las pginas de esta coleccin posibilita la comprobacinde aspectos an modificables entre los que figuran el doble cono de los trabajos y elnombre del archivo, elementos que pueden suprimirse sin afectar el funcionamiento dela coleccin.

    Tales circunstancias determinaron un nuevo intento de configuracin de la coleccin, enesta oportunidad, a partir de las cadenas de formato. stas se modifican desde el panelFormato, opcin Formatos.

    Resulta conveniente aclarar que en esta ejercitacin se aplicaron cambios ensayados enel artculo antes mencionado, pero mediante cadenas diferentes: se trata de laeliminacin del nombre del archivo del documento original y de la insercin del nmerode temes en los clasificadores. Hecha esta precisin, es posible describir lasmodificaciones experimentadas.

    El primer cambio ejecutado consisti en trabajar con la cadena de formato delclasificador CL1con el propsito de eliminar la primera lnea cuyo efecto determina elenlace al cono de la versin Html del documento. Se seleccion como componenteafectado VListy la funcin CL1. Esta accin se previ con la intencin de acceder al

    trabajo mediante su versin original la cual, por lo general, posee una calidad superior ala lograda al visualizar el documento como una pgina Web.

    La lnea eliminada fue:

    [link][icon][/link]

    Con esta accin se logra la desaparicin del cono que enlaza con la versin en Html deldocumento, pero solo es aplicable en los clasificadores que no presentan estanteras, esdecir para los AZList, en este caso, aplicados al metadato title. Para los AZCompactListes preciso utilizar otro procedimiento que se explicar ms adelante.

    La cadena de formato resultante es sta:

  • 7/22/2019 creacionparte2

    15/23

    [ex.srclink]{Or}{[ ex.thumbicon],[ex.srcicon] }[ex./srcli nk][highlight]{Or}{[dc.Title],[exp.Title],[ex.Title],Untitled}[/highlight]{If}{[ex.Source],
    ([ex.Source])}

    En la imagen siguiente se aprecia la modificacin lograda:

    Fig. 17.Clasificador CL1 en el que se suprimi el cono de la versin Html del documento original

    Con la finalidad de hacer desaparecer el nombre del archivo del documento, que seencuentra ubicado debajo del ttulo correspondiente, se borr la ltima lnea de lacadena de formato de la funcin CL1y VLIst. A continuacin se reproduce esa lnea:

    ([/highlight]{If}{[ex.Source],
    ([ex.Source])})

    que al suprimirse se obtiene una expresin como la que sigue:

    [ex.srclink]{Or}{[ ex.thumbicon],[ex.srcicon]}[ex./srcli nk][highlight]{Or}{[dc.Title],[exp.Title],[ex.Title],Untitled}

    Tal cambio permiti la supresin del nombre del archivo del documento original, hechoque confiere una apariencia ms profesional a la pgina debido a la eliminacin de datoscarentes de funcin y al uso ms racional del espacio disponible en cada pgina. Estos

    procedimientos son vlidos tambin para las funciones Search y DateList. La figura 18

    posibilita la observacin del nuevo formato de presentacin.

    Fig. 18.Formato de presentacin modificado para el CL1 de la coleccin reconstruida

  • 7/22/2019 creacionparte2

    16/23

    Este paso se repiti con el clasificador CL2,pero como se trata de un AZCompactList,se debi aplicar otra cadena de formato (13), pues si se procediera eliminando la

    primera lnea tambin sucedera lo mismo con el cono de la versin pdf o doc y no sepodra acceder al texto original sino a la versin .Html que en el caso de los .pdf

    generalmente es defectuosa. Por tanto, se aplic otra cadena de formato para mantenerel enlace a la versin pdf del documento desde la estantera de este clasificador ( CL2) :

    {If }{[srcicon],[srclink] [srcicon][/srclink] , [l ink] [i con][ /link]}[highlight]{Or}{[dc.Title],[exp.Title],[ex.Title],Untitled}

    con el consiguiente resultado que es posible observar en la figura 19.

    Fig. 19.Formato de presentacin modificado para el CL2 de esta coleccin

    En la cadena de formato antes aplicada tambin se elimin la ltima lnea que determinala aparicin del nombre del archivo original.

    Observe que en esta cadena de formato se introduce la condicional {If} delante devariables Greenstone que contemplan tanto [srclink]como [ l ink] por cuanto el sistemaofrece la posibilidad de elegir entre ambos enlaces y lo practica con [srclink] que esquien enlaza con la versin -pdf del documento.

    Existe otra cadena de formato aplicable para CL2 (13) con el mismo objetivo y quearroja resultados similares:

    {I f}{[ F ileFormat] eq" PDF" ,[srclink][ srcicon][/srclink],[li nk][i con][/link]}[highlight]{Or}{[dc.Title],[exp.Title],[ex.Title],Untitled}

  • 7/22/2019 creacionparte2

    17/23

    Fig 20. Segunda cadena de formato vlida para el clasificador CL2

    Se recomienda, a los lectores, ejecutar las 3 alternativas (en la parte 1 se ofreci otradiferente) con el propsito de comprobar por s mismos el alcance y consecuencias dela aplicacin de cada una de esas variantes.

    Cuando a los efectos del usuario final resulta provechoso adicionar los datosconcernientes a los autores, las materias tratadas por los documentos y la fecha deldocumento dentro del clasificador ttulos con vistas a su posterior visualizacin, seagregan varias lneas al final de la cadena de formato de un clasificador AZList oAZCompactList. Tales lneas son:

    {If}{[dc.Creator],
    Autor: [dc.Creator]}

    {If}{[dc.Subject],
    Temas: [sibling:dc.Subject]}

    {If}{[dc.Date],
    Fecha: [format:dc.Date]}

    En este caso, se insertaron, tambin, varios elementos en cada lnea. Esos elementos se

    resaltan grficamente en el prrafo anterior. No obstante, resulta pertinente comentaralgunos aspectos. Observe que se adicionaron las palabras autor, temas y fechasseguidas de dos puntos (:).

    En la primera lnea se aplic el metadato Creatordel conjunto Dublin Core y el efectoalcanzado fue la aparicin del primer autor debajo del ttulo de cada documentomientras que para visualizar todas las palabras clave empleadas se insert la variablesibling: al metadato Subject.

    En el caso del metado Datedel conjunto Dublin Core se le antepuso la variable format:cuyo efecto fue el registro de la fecha de la manera prevista en Greenstone.

    Las figuras 21 y 22 muestran el efecto logrado en un caso en el clasificadorcorrespondiente a los autores (CL2)y el siguiente a los ttulos (CL1).

  • 7/22/2019 creacionparte2

    18/23

    Fig. 21Clasificador Autores desplegado Fig. 22. Clasificador Ttulos desplegado

    Por otra parte, en presencia de estanteras generadas por clasificadores AZCompactListresulta beneficioso conocer cuntos documentos estn agrupados, por ejemplo, por un

    mismo autor o materia segn el diseo de la coleccin En este caso la adicin de esedato es particularmente interesante y se obtuvo al aadir una nueva lnea a la cadena deformato donde se utiliza la variable[numleafdocs]:

    {If}{[numleafdocs],([numleafdocs])}

    Esta expresin es aplicable a todas los clasificadores del tipo AZCompactListque enesta coleccin son los CL2 y CL3. Al emplearlo en el clasificador de temas CL2 seobtuvo:

    [link][icon][/link]

    [ex.srclink]{Or}{[ex.thumbicon],[ex.srcicon]}[ex./srclink]

    [highlight]

    {Or}{[dc.Title],[exp.Title],[ex.Title],Untitled}

    [/highlight]{If}{[ex.Source],
    ([ex.Source])}

    {If}{[numleafdocs],([numleafdocs])}

    que determin este efecto:

    Fig. 23.Clasificador de Creadores/autores con especificacin del nmero de trabajos por autor

  • 7/22/2019 creacionparte2

    19/23

    En el artculo precedente a ste se aplic una variante que consisti en la insercin delnmero entre parntesis detrs de la estantera en lugar de figurar al final como sucedeen la figura 23.

    Es necesario dar clic en las estanteras para revisar los ttulos subordinados a cada autor

    donde por supuesto aparecern, adems del ttulo, el autor, las palabras clave y la fechade publicacin del documento segn el efecto de la cadena de formato utilizada en esecaso.

    Fig. 24. Clasificador Cl2 desplegado donde se visualiza el primer autor y las palabras clave

    La prxima personalizacin consisti en aplicar etiquetas Html para colorear el fondode los resultados (6). Ello se materializ mediante la insercin de una lnea alclasificador CL1(debajo de la primera) como la que sigue:

    La cadena de formato resultante fue:

    [ex.srclink][ex.srcicon][ex./srclink]

    [link][dc.Title][/link]

    [dc.Creator]

    con la que se obtuvo la apariencia que muestra la figura 25:

    Figura 25.Aplicacin de cadena de formato que permite colorear la columna donde aparecen

    los ttulos y autores.

  • 7/22/2019 creacionparte2

    20/23

    Otra transformacin que es posible practicar consiste en la presentacin de los datos endos columnas al aadir una etiqueta Html en la segunda lnea; este cdigo es

    [highlight]

    el cual determina la disposicin de los datos en la forma mencionada.

    [ex.srclink]{Or}{[ex.thumbicon],[ex.srcicon]}[ex./srclink]

    [highlight]

    {Or}{[dc.Title],[exp.Title],[ex.Title],Untitled}[sibling:dc.Subject]

    [/highlight]

    {If}{[ex.Source],
    {Or}{[sibling:dc.Creator],[sibling:ex.Creator]}

    {If}{[numleafdocs],([numleafdocs])}

    El formato de presentacin resultante puede apreciarse en la prxima imagen:

    Fig. 26.Formato de presentacin de los datos en 2 columnas

    Compare la figura 26 con las 21 y 22 a fin de corroborar las transformaciones operadasen las pginas correspondientes en cuanto a presentacin de los datos e conos.

    En caso de que se desee hacer an ms explcita la informacin ofrecida en la columnade la derecha, es posible introducir encabezamientos que permitan identificar msclaramente a los autores y palabras clave. Para ello se anteponen los trminos Autores:y Temas: delante de los metadatos correspondientes de la forma que se muestra acontinuacin:

    [ex.srclink]{Or}{[ex.thumbicon],[ex.srcicon]}[ex./srclink]

    [highlight]

    {Or}{[dc.Title],[exp.Title],[ex.Title],Untitled}

    Temas:
    [sibling:dc.Subject][/highlight]

    Autores:{If}{[ex.Source],
    {Or}{[sibling:dc.Creator],[sibling:ex.Creator]}

    {If}{[numleafdocs],([numleafdocs])}

    En la figura 27 se aprecia el efecto surtido:

  • 7/22/2019 creacionparte2

    21/23

    Fig. 27. Encabezamientos de los ttulos y autores

    Si se aplicaran etiquetas Html convenientes ( y /b; ), sera posible resaltaren negritas o subrayar los encabezamientos Temas y Autores.

    Por otra parte, desde las funciones disponibles en el panel Formato, opcin Formatos,tambin puede configurarse el formulario de bsqueda para realizar bsquedasavanzadas por campos (14). La funcin que permite este cambio es Searchcuya cadenaes plain, form. Basta suprimir plain y la coma(,) para operar una transformacinradical. La cadena obtenida es:

    form

    cuya salida se visualiza en esta forma:

    Fig. 27.Formulario determinado por la cadena de formato form

    Este tipo de formulario ofrece la posibilidad de ejecutar bsquedas ms complejas alespecificar valores para los campos disponibles (ndices) y requiere la utilizacin delmotor de bsqueda MGPP. Tal formulario puede transformarse desde el botnPreferenciascuando se selecciona la opcin bsqueda avanzada, accin con la cual es

    posible utilizar operadores booleanos.

    El cambio operado es el siguiente:

  • 7/22/2019 creacionparte2

    22/23

    Fig. 28.Formulario anterior transformado desde el botn Preferencias

    Conclusiones

    Las cadenas de formato aplicadas al reproducir este ejercicio de personalizacin de lascolecciones permiten la profundizacin del conocimiento del sistema Greenstone yofrecen la posibilidad de adentrarse en el tema de la configuracin de tales colecciones ala medida de las necesidades de cada usuario final, en este caso especfico, documentos-pdf y .doc. Con tales acciones se logra acceder a la informacin almacenada en formams eficiente.

    Referencias bibliogrficas

    1. Witten IH., Don KJ, Dewsnip M, Tablan V. Text mining in a digital library. JDig Libr. August; 4(1):56-9. [Consultado: 2 mar2011].

    2. Witten IH. Customizing digital library interfaces with Greenstone. TCDL Bull.Summer 2003. [Consultado: 23 feb 2010].

    3. Witten IH. Creating and customizing digital library collections with theGreenstone Librarian Interface.[Consultado: 2 mar 2011].

    4. FAO. Perspectiva general de los estndares de metadatos [curso en CD-ROM].En: La digitalizacin y las bibliotecas digitales del Repertorio de recursos para lagestin de informacin. [Roma?]: (IMARK). 2006.

    5. Mndez Rodrguez E. Metadatos y recuperacin de informacin : estndares,problemas y aplicabilidad en bibliotecas digitales: sinopsis. [Madrid?]:

    Ediciones Trea, 2002.http://www.primeravista.com?

    http://www.cs.waikato.ac.nz/~ihw/publications.htmlhttp://www.ieee.tcdl.org/bulletin/v1n1/summer2003.htmlhttp://www.ieee.tcdl.org/bulletin/v1n1/summer2003.htmlhttp://www.kc.tsukuba.ac.jp/dlkc/e-proceedings/papers/dlkc04pp97.pdfhttp://www.kc.tsukuba.ac.jp/dlkc/e-proceedings/papers/dlkc04pp97.pdfhttp://www.kc.tsukuba.ac.jp/dlkc/e-proceedings/papers/dlkc04pp97.pdfhttp://www.primeravista.com/http://www.primeravista.com/http://www.primeravista.com/http://www.kc.tsukuba.ac.jp/dlkc/e-proceedings/papers/dlkc04pp97.pdfhttp://www.ieee.tcdl.org/bulletin/v1n1/summer2003.htmlhttp://www.cs.waikato.ac.nz/~ihw/publications.html
  • 7/22/2019 creacionparte2

    23/23

    6. Tramullas J, Garrido P. Bibliotecas digitales: Greenstone. En: Software librepara servicios de informacin digital. Madrid:Pearson Prentice Hall, 2006. [Consultado:2 mar 2011]

    7. Witten IH, Boddie S, Thompson J. Visin general de Greenstone. Gua del

    usuario. Nueva Zelanda: Universidad de Waikato, 2006.[Consultado:2 mar 2011]

    8. Bainbridge D, McKay D, Witten IH. Explotacin ptima de sus documentos.En: Gua del programador. New Zealand :University of Waikato. DigitalLibrary, 2004.

    [Consultado: 11/10/2009].

    9. University of Waikato. Digital Library Proyect. Ayuda: 6.3 ndices de bsqueda.

    En: Greenstone Digital Library Software [programa informtico].ver 2.82 NewZeland: University of Waikato, 2008.

    10.Aprender acerca de formatos y de macros. En: Ejercicio tutorial de Greenstone:modificado para versin 2.70.[Consultado:2 mar 2011].

    11.Una coleccin de archivos de Word y PDF. En: Ejercicio tutorial de Greenstonemodificado para versin 2.70

    .