sistema de circulación automatizado por internet para la biblioteca de la fundación arturo...

Upload: afrappem3302

Post on 02-Mar-2016

94 views

Category:

Documents


0 download

DESCRIPTION

Sistema de automatización de bibliotecas, describe los problemas técnicos de crear un sistema web, opac, sistema de reservas y circulación bibliotecario.Explica conceptos sobre las aplicaciones cliente /servidor, uml web, CDS/ISIS, recuperación de la información

TRANSCRIPT

  • ESTUDIOS CON RECONOCIMIENTO DE VALIDEZ OFICIAL SEP NMERO 972142 DE FECHA 10 DE JUNIO DE 1997

    SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO

    ROSENBLUETH

    TESIS

    QUE PARA OBTENER EL TTULO DE

    INGENIERO EN COMPUTACIN

    PRESENTA:

    ARTURO FRAPP MUOZ

    ASESOR: ING. ABELARDO HERRERO PEREZRUL

    MEXICO, D.F. ABRIL 2004

  • 4

    Contenido Introduccin. .................................................................................................................... 7

    Descripcin del Problema............................................................................................. 8 Importancia de este trabajo. ......................................................................................... 9 Planteamiento del problema de Investigacin. ............................................................. 9 Posibles soluciones.................................................................................................... 10 Planteamiento de la solucin...................................................................................... 10 Alcance y limitaciones de soluciones planteadas....................................................... 12 Resultados deseables de esta tesis. .......................................................................... 12 Aplicabilidad de la solucin. ....................................................................................... 12 Desarrollo de la tecnologa nacional en este campo. ................................................. 13 Perspectivas de venta. ............................................................................................... 13 Descripcin breve del contenido de este trabajo........................................................ 14

    Captulo I Fundamentos de Bibliotecologa................................................................... 15

    1.1 Los servicios que ofrece una biblioteca................................................................ 16 1.1.1 Servicios al Pblico. .......................................................................................... 16 1.1.2 Procesos Tcnicos. ........................................................................................... 20 1.2 Automatizacin de Bibliotecas.............................................................................. 24 1.2.1 Los servicios de la biblioteca bajo la ptica de la automatizacin. .................... 25 1.3 Formato de datos MARC..................................................................................... 26 1.3.1 Ventajas del Formato de datos MARC. ............................................................. 28 1.4 Recuperacin de Informacin.............................................................................. 29 1.4.2 Recuperacin de Informacin basada en texto. ................................................ 31 1.4.3 Catlogos Automatizados de Bibliotecas y la Recuperacin de Informacin. ... 32

    Captulo II Fundamentos de Computacin.................................................................... 35

    2.1 Plataforma de bases de datos.............................................................................. 36 2.1.1 La tecnologa CDS/ISIS..................................................................................... 39 2.2 Modelo cliente / servidor....................................................................................... 42 2.2.1 Bloques del modelo cliente / servidor. ............................................................... 43 2.2.2 Procesamiento cooperativo cliente / servidor. .................................................. 45 2.2.3 Componentes del Middleware World Wide Web. ............................................. 45 2.3 Aplicaciones Web................................................................................................. 48

    Captulo III Desarrollo del SCAI-BIBFAR. ..................................................................... 50

    3.1 Introduccin.......................................................................................................... 51 3.2 Ingeniera de Software Web. ................................................................................ 51 3.2.1 Problemtica de la Ingeniera de Software Web. .............................................. 52 3.3 Programacin Orientada a Objetos. ..................................................................... 52 3.3.1 UML................................................................................................................... 53 3.3.2 UML y El desarrollo de Aplicaciones WEB. ....................................................... 54 3.5 Anlisis. ................................................................................................................ 55

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    5

    3.5.1 Anlisis de Requerimientos. .............................................................................. 56 3.5.2 Anlisis de Casos de Uso.................................................................................. 60 3.5.4 Glosario del Sistema. ........................................................................................ 71 3.6.1 Artefactos de la Experiencia del Usuario........................................................... 76 3.7 Diseo. ................................................................................................................. 79 3.7.1 Diagramas de Estructura esttica o Vista Lgica. ............................................. 80 3.7.2 Diagramas de Componentes............................................................................. 84

  • 6

    Introduccin.

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    7

    Descripcin del Problema.

    La Biblioteca de la Fundacin Arturo Rosenblueth (en adelante BIBFAR), inicia

    operaciones en 1981, por la necesidad de tener un centro de referencia que apoyara a

    las actividades acadmicas realizadas en ella; actualmente (en el 2003) cuenta con un

    acervo de aproximadamente 1500 ttulos, sumando mas de 2000 ejemplares, que en su

    mayora son colecciones especializadas en Ciencias de la Computacin e Informtica;

    tambin cuenta con una computadora personal conectada a Internet y al grupo de

    trabajo de la FAR; en su reglamento interno se contemplan dos tipos de usuarios:

    Internos o Externos.

    Los usuarios internos son todas aquellas personas que tienen relacin directa con la

    institucin, (empleados o alumnos).

    Los usuarios externos son los visitantes de ocasin. Su misin consiste en conservar,

    difundir y proveer informacin para el desarrollo cientfico y tecnolgico de la Institucin.

    Para dar cumplimiento a esa misin tiene asignadas dos personas que cubren 2 turnos

    en los que se prestan los siguientes servicios:

    - Prstamo en sala.- Tanto para usuarios internos como para usuarios externos.

    - Prstamo a domicilio.- Slo para usuarios internos con credencial vigente, consiste en

    gestionar los pasos que involucran la autorizacin para extraer un libro por una cantidad

    razonable de tiempo, y asegurar su regreso a los estantes de la biblioteca.

    - Prstamo interbibliotecario.- Se realiza a travs de convenios que se establecen con

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    8

    diferentes instituciones, consiste en gestionar los pasos que involucran la autorizacin

    para extraer un libro de otra biblioteca por una cantidad razonable de tiempo.

    - Prstamo solo por una noche.- Slo para usuarios internos, abarca libros de consulta,

    tesis y materiales especiales; este servicio es especial, pues consiste en prestar libros

    que normalmente no se prestan por ms de 24 horas.

    - Atencin a usuarios.- Involucra a cualquier tipo de usuario, consiste en asistir a los

    usuarios en su bsqueda de informacin, ya sea hojeando el catlogo o revisando los

    estantes.

    Esta biblioteca presenta varios problemas que son comunes a toda biblioteca:

    a) Robo o prdida de volmenes, y por lo tanto desconocimiento del acervo actual.

    b) Deficiencia en los servicios que se prestan.

    c) Por el tamao de la misma biblioteca, es escaso el presupuesto asignado.

    d) No existen registros bibliogrficos confiables.

    Importancia de este trabajo.

    Debido a que no existen muchos trabajos vigentes sobre el tema en Mxico y

    Latinoamrica, es importante desarrollar sistemas adaptados al mbito local, usando las

    tecnologas disponibles, a travs de una investigacin y un desarrollo, cuyo resultado

    ayude a resolver los problemas antes mencionados. Un sistema como el que aqu se

    expone satisface las necesidades especficas de la biblioteca Dr. Arturo Rosenblueth.

    Planteamiento del problema de Investigacin.

    Se trata de una investigacin que propone una accin y un diseo, que conduce a la

    obtencin de un software de automatizacin de bibliotecas, el cual se adapta a

    necesidades especficas.

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    9

    Posibles soluciones.

    Existen diferentes alternativas en la automatizacin de bibliotecas, segn la

    clasificacin de Herrero1, mostrada en la tabla 1.

    La solucin ms adecuada para este caso en particular, segn este autor, es un

    Sistema Pblico en Lnea de carcter Acadmico, pues es el que mejor se adapta al

    contexto de la BIBFAR.

    Tabla 1. Soluciones de automatizacin para bibliotecas. Soluciones de automatizacin para bibliotecas.

    Por su forma de obtencin. Por su arquitectura.

    Sistemas comerciales. Sistemas Locales.

    Sistemas pblicos. Sistemas en Lnea.

    Sistemas Propietarios. Sistemas Hbridos.

    Soluciones de automatizacin por niveles de obtencin. Sistemas de alto nivel (Aleph, Unicorn, Logicat). - Caros.

    - Poderosos. - Llenos de caractersticas.

    Soluciones acadmicas (SIABUC). - Accesibles. - Limitados. Sistemas propietarios.

    - Hechos a la medida. - Costo elevado.

    Planteamiento de la solucin.

    La solucin propuesta consiste en crear un sistema propietario en lnea, de tipo

    acadmico, que por su bajo costo se adapte a las necesidades de la biblioteca, que

    como ya se indic anteriormente pertenece al entorno acadmico.

    La solucin propuesta contempla la creacin de una aplicacin web en dos mdulos

    1 HERRERO, Abelardo.: Diapositivas del Curso Pblico de Informtica Aplicada en Bibliotecas., 24 de Septiembre 2001.

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    10

    conectados mediante 4 diferentes bases de datos (fig. 1).

    Catlogo Automatizado.- Mdulo que almacena los datos esenciales para describir un

    libro, que permite hacer bsquedas sobre esos datos.

    Circulacin Automatizada.- Mdulo que registra los movimientos de materiales

    (prstamos, devoluciones, prdidas, etc.) dentro de una biblioteca.

    1. Esquema general de la aplicacin.

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    11

    Alcance y limitaciones de soluciones planteadas.

    a) Alcance.

    Los servicios al pblico deben estar disponibles a travs de Internet

    (aplicacin web).

    La biblioteca debe contar con un servidor dedicado al sistema.

    La biblioteca debe contar con una terminal remota con acceso al sistema.

    La base de datos debe ser abierta, es decir que puede ser manipulable desde el

    exterior del sistema.

    b) Limitaciones.

    Los datos del catlogo pueden ser exportados a diferentes formatos

    (XML, ISO2709, etc.). |

    La cantidad de ejemplares de la biblioteca es reducido.

    El nmero de usuarios del sistema es reducido.

    Las necesidades de la biblioteca en 2003 limitan el sistema a la automatizacin del

    sistema de circulacin y al catlogo en lnea.

    Resultados deseables de esta tesis.

    Creacin e implantacin de una aplicacin web (aplicacin que cae dentro de la

    clasificacin de sistemas cliente / servidor) para circulacin automatizada de materiales

    de una biblioteca.

    Experiencia para futuros proyectos.

    Aplicabilidad de la solucin.

    La solucin que aqu se plantea, adems de satisfacer las necesidades de la

    Fundacin, puede ser aplicada a cualquier biblioteca de tamao pequeo a mediano en

    idioma espaol, con acceso a una red de punto a punto como requisito mnimo y que no

    requiera de mayor procesamiento administrativo.

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    12

    Desarrollo de la tecnologa nacional en este campo.

    Desde hace tiempo, hay quienes realizan esfuerzos en este campo, existen referencias

    de desarrollos mexicanos galardonados por la misma Fundacin Arturo Rosenblueth2

    La Universidad de Colima, lleva cerca de 15 aos desarrollando un sistema integral de

    automatizacin de bibliotecas, denominado SIABUC (Sistema Integral de Automati-

    zacin de Bibliotecas de la Universidad de Colima).

    La empresa Sistemas Lgicos comercializa un sistema llamado Logicat, el cual es

    ampliamente difundido en Mxico y Amrica Latina. ientras se escriba esta tesis, una

    empresa mexicana lanz al mercado un sistema de automatizacin de bibliotecas sobre

    Internet, llamado ALTAIR.

    Existe tambin el antecedente de la tecnologa CDS/ISIS que aunque no es exclusiva

    para bibliotecas, ha sido adoptada en Mxico y Latinoamrica como tecnologa de

    automatizacin de bibliotecas, inclusive forma parte de los planes de estudio de las

    escuelas de Bibliotecologa y Archivonoma de la SEP y por el Colegio de Estudios

    Bibliotecolgicos de la UNAM.

    Perspectivas de venta.

    Tanto en Mxico como en Latinoamrica se percibe la existencia de un nicho de

    mercado para un sistema de bajo costo, orientado a pequeas bibliotecas que cuenten

    con un mnimo de hardware, como el que se plantea en esta tesis.

    Para una posible comercializacin del producto de esta investigacin ser necesario

    transformar el sistema para que sea adaptable a las necesidades especficas de otros

    usuarios, as como tambin crear la documentacin necesaria para su distribucin

    pblica.

    2 La Fundacin Arturo Rosenblueth entreg sus primeros premios. En: Revista Ciencia y Desarrollo. CONACYT, 1980 Nm. 30., pp. 84-85.

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    13

    Descripcin breve del contenido de este trabajo.

    Introduccin.

    En esta seccin se plantea el contexto del problema sobre el cual se desarrolla la

    investigacin que da origen a la tesis.

    Captulo I. Fundamentos de Bibliotecologa.

    Introduce los conceptos pertinentes a la Bibliotecologa en lo relacionado con los

    servicios que se ofrecen en las bibliotecas, es aqu donde se traza una lnea entre la

    Bibliotecologa, y una disciplina conocida como Recuperacin de Informacin

    que tiene relacin directa con las Ciencias de la Computacin y las Ciencias de la

    Informacin (de donde se deriva la Bibliotecologa).

    Captulo II. Fundamentos de Computacin.

    Trata sobre la definicin de los conceptos relacionados a las ciencias de la

    computacin, estos conceptos se refieren a Bases de Datos, Ingeniera de Software,

    Arquitecturas Cliente / servidor e Internet.

    Captulo III. Desarrollo del SCAI-FAR.

    En este captulo se desarrollan las actividades concernientes al desarrollo del software

    que se plantea en esta investigacin, a travs de tcnicas de ingeniera web (web

    engineering). Se plantea el anlisis y diseo orientado a objetos del modelo conceptual

    del sistema, tambin se consideran los aspectos tecnolgicos concernientes a la

    arquitectura web necesarios para plantear la distribucin a nivel lgico de los

    componentes del sistema.

    Resultados y Conclusiones

    En este apartado se analizan los resultados obtenidos, as como tambin se enuncian

    las posibles lneas de investigacin para continuar este proyecto.

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    14

    Captulo I Fundamentos de Bibliotecologa.

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    15

    1.1 Los servicios que ofrece una biblioteca.

    Comprenden los servicios que se brindan al pblico y los procesos que involucran la

    preparacin de los materiales para el prstamo.

    1.1.1 Servicios al Pblico.

    Los servicios al pblico desde el punto de vista de la biblioteca de la FAR, a su vez se

    dividen en:

    2. Los servicios al pblico.

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    16

    a) Prstamo.- Consiste en permitir la salida de un material de la biblioteca al domicilio

    de un usuario. Este servicio involucra una metodologa que consiste generalmente en

    registrar el prstamo de materiales, y que se le conoce como sistema de cargo.

    Desde que existen las bibliotecas pblicas han existido diversos sistemas de cargo,

    incluyendo el Dickman, el Detroit, el Newark, el Browne, el Gaylord, de auto servicio,

    fotogrfico, de doble registro, de doble papeleta, y el de tarjetas perforadas.

    La lista anterior no es exhaustiva, existen casos en los que se dan combinaciones de

    varios sistemas de cargo, as mismo algunos autores sugieren que no hay

    implantaciones al pie de la letra.

    En la tabla 1 se muestran los objetivos y caractersticas de los sistemas de circulacin,

    de acuerdo con la Asociacin Americana de Bibliotecas (ALA por sus siglas en ingls)

    y recopilados en un estudio sobre sistemas de circulacin publicado en 1961 [Study,

    1961].

    Tabla 1. Objetivos y caractersticas de los sistemas de circulacin.

    Objetivos y Caractersticas de los Sistemas de Circulacin. (Clasificacin de la American Library Association)

    Objetivos Mnimos Tener la capacidad de identificar los materiales en prstamo. Tener la capacidad de identificar al prestatario. Asegurar el regreso de los materiales, en caso de no ser devueltos en un perodo de tiempo razonable despus de su expiracin.

    Caractersticas Mnimas El sistema debe ser simple para el pblico en cuanto a operacin se refiere y para el personal de la biblioteca deber ser fcil de entender y operar. El sistema debe ser flexible para adaptarse a las operaciones principales de la biblioteca.

    Objetivos Adicionales Proveer informacin adecuada de prestatarios con adeudos. Permitir la disponibilidad de libros solicitados a los lectores tan pronto como sea posible a travs de un sistema eficiente de reservaciones.

    Caractersticas Adicionales

    El sistema debe ser flexible para variar los perodos de prstamo. El sistema no debe requerir costos excesivos para su operacin, ni causar problemas.

    El sistema de circulacin adoptado por la BIBFAR es una variacin del sistema Newark

    y reconoce a las siguientes entidades:

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    17

    Usuarios Internos.- Son todas aquellas personas (empleados o alumnos) que tienen

    relacin directa con la institucin.

    Staff: Personal que trabaja en la biblioteca.

    Prestatario.- Usuario interno con credencial vigente que puede solicitar el prstamo de

    libros.

    E involucra las siguientes rutinas:

    Registro de lectores.- Se requiere un registro de los usuarios internos, con sus datos de

    identificacin. El personal de la biblioteca genera una credencial de prstamo, con la

    fotografa del usuario.

    Rutinas de cargo.- El prestatario anota en una papeleta, el nmero de clasificacin,

    autor, ttulo abreviado, nombre del lector, telfono, y fecha de devolucin.

    El personal revisa la legibilidad de la papeleta, as como los datos del usuario y del

    libro. El personal archiva la papeleta, junto con la credencial del usuario.

    Rutinas de descargo.- El prestatario presenta el libro ante el personal. El personal

    verifica la fecha de vencimiento, si sta ya se venci se calcula la multa. Si el

    prestatario no puede pagar la multa, es anotado en una lista de deudores. El prestatario

    coloca el libro en el estante correspondiente.

    Vencimientos.- El personal, revisa las papeletas con fechas de vencimiento que han

    expirado, y lo notifica a los prestatarios para que se normalice esa situacin.

    Reservaciones.- En la BIBFAR, no existe un procedimiento definido para establecer la

    reservacin de un libro.

    b) Consulta.- Este servicio es de suma importancia para la biblioteca, pues como

    seala Morales 3 coadyuva a que se haga un uso exhaustivo, pleno y propio de la

    biblioteca, de sus servicios y de los materiales bibliotecarios.

    3 MORALES, Estela.: El Servicio de Consulta., p. 15.

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    18

    La Consulta consiste en ayudar al usuario lector a localizar libros que respondan a sus

    necesidades de informacin; este servicio inicia con la pregunta del usuario, sobre la

    existencia de un libro o libros que le interesa consultar; el bibliotecario debe entonces

    responder a esa pregunta ubicando los libros que requiere ese usuario.

    En algunos casos encontrar la respuesta a las preguntas del usuario es una tarea difcil,

    pues puede ocurrir que el bibliotecario no entienda la terminologa de la pregunta; en

    ese caso, los bibliotecarios recurren a una enciclopedia o a algn material de

    referencia, para trasladar los trminos importantes de la pregunta a un lenguaje

    relevante para el sistema bibliogrfico en el que se va a realizar la bsqueda

    (encabezamientos, descriptores, etc.).

    Es en este proceso donde se requiere que la calidad de la catalogacin y clasificacin

    sean ptimas, pues de ello depende el xito de la consulta.

    Segn un anlisis realizado por la ALA en 1942 citado por Morales4, las actividades

    relacionadas con el servicio de consulta, se dividieron en cinco:

    1) Supervisin.- Consiste en supervisar y coordinar el servicio de consulta con los

    dems departamentos de la biblioteca.

    2) Informacin.- Esta funcin consiste en responder las preguntas que formulen los

    usuarios, en relacin con sus necesidades de consulta.

    3) Instruccin.- Consiste en ensear al usuario a usar una biblioteca, a fin de que el

    usuario sea autosuficiente.

    4) Bibliografa.- Consiste en ayudar en la elaboracin de las citas bibliogrficas de los

    materiales consultados.

    5) Evaluacin.- Contempla dos aspectos: la evaluacin del servicio que se presta en la

    biblioteca y la evaluacin de las obras de Consulta.

    En el caso de la BIBFAR, el servicio de consulta ocurre cuando un usuario pregunta al

    4 Ibdem., p. 15.

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    19

    encargado sobre algn tema en especial, es entonces cuando el encargado recorre los

    estantes en busca del libro que satisface las necesidades de informacin del lector.

    1.1.2 Procesos Tcnicos.

    Son las tareas que preparan a los materiales para colocarlos en los estantes,

    representan la mayor parte del trabajo de un biblioteclogo:

    a) Organizacin bibliogrfica.

    La organizacin bibliogrfica segn [Quio, 2002] se refiere a la disposicin y arreglo de

    los materiales bibliogrficos relacionada con el ordenamiento y control de los mismos.

    La funcin primordial de la organizacin bibliogrfica es lograr que todo documento sea

    adecuadamente publicado, almacenado y registrado, y su objetivo es permitir la

    identificacin, seleccin y localizacin de los documentos segn las necesidades de los

    usuarios, para su comprensin se divide en tres fases:

    1) Catalogacin.- Segn Granados5 es la transcripcin de los datos caractersticos de

    un material documental en fichas, siguiendo un orden determinado.

    Actualmente la catalogacin se regula a travs de varias normas, algunas de alcance

    regional y otras con alcance internacional.

    En Mxico las reglas que se siguen son las de la 2a. edicin de las Reglas de

    Catalogacin Anglo Americanas 6.

    Como lo indican las AACR2, dependiendo de los propsitos perseguidos al redactar un

    catlogo, existen tres niveles de descripcin bibliogrfica:

    5 GRANADOS Xolapa Eleazar y Luz Mara Mendoza Bentez.: Manual de Informacin Bsica en Bibliotecologa., p. 249

    6 Por sus siglas en ingls Anglo American Cataloging Rules 2nd edition.

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    20

    1er. nivel:

    / .

    .

    : .

    : ; .

    2o. nivel:

    = : / ; .

    / .

    : , .

    : ; .

    ( / , ; . ; ) - -

    3er. nivel:

    Para el tercer nivel se incluyen todos los elementos sealados en las AACR2 que sean

    aplicables al material que se describe.

    Generalmente este nivel de descripcin es el utilizado para la bibliografa nacional de

    cada pas.

    b) Indizacin.

    La indizacin u organizacin del conocimiento es un proceso que se ha requerido

    durante miles de aos. Conforme aumenta la cantidad de conocimiento, la necesidad

    de organizarlo se ha vuelto ms importante, principalmente en aquellas disciplinas

    relacionadas con la informacin.

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    21

    La organizacin del conocimiento o indizacin es una actividad preliminar, esencial para

    la eficaz explotacin de la informacin; para [Arriola,2001] el objetivo general de la

    indizacin consiste en permitir que la informacin o el conocimiento pueda ser

    localizado cuando se le necesite, de tal forma que su organizacin y su posterior

    consulta puedan entenderse como dos partes del mismo proceso.

    Indizacin es la asignacin de palabras que expresan el contenido intelectual de un

    libro y bajo el cual se agrupan todos aquellos que tratan sobre el mismo tema. [Gimeno,

    1996] , menciona que la UNESCO define la indizacin bajo dos perspectivas: como

    proceso y como finalidad. Como proceso, consiste en describir y caracterizar un

    documento con la ayuda de representaciones de los conceptos contenidos en dicho

    documento. Su finalidad es la de permitir una bsqueda eficaz de las informaciones

    contenidas en un fondo documental

    A juicio de Gimeno, Garca Gutirrez 7 quin ofrece una definicin mucho ms completa

    y precisa del concepto la indizacin documental es la operacin intelectual de aplicar

    tcnicas especficas normalizadas -anlisis- a un colectivo documentario con el fin de

    hacerlo controlable y utilizable -recuperacin-.

    Guinchat y Menou 8 establecen cuatro criterios fundamentales a considerar en el

    proceso de indizacin:

    1) Exhaustividad.- Se deben reflejar todos los temas y conceptos de relevancia

    informativa incluidos en el documento.

    2) Selectividad.- El indizador debe hacer una seleccin previa de aquellos conceptos

    relevantes, excluyendo los repetidos y aquellos que carecen de utilidad informativa.

    3) Especificidad.- Se han de utilizar significantes precisos de los conceptos, rechazando

    los muy generales, ambiguos, abstractos o muy especficos, que no reflejen la exactitud

    del mensaje informativo.

    7 Garca Gutirrez, Antonio citado por Javier Gimeno. Tratado Bsico de Biblioteconoma., p. 200 8 Guinchat y Menou, citados por Javier Gimeno. Ibdem., p.204.

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    22

    4) Uniformidad.- Los trminos de la indizacin deben observar criterios formales y

    contenidos homogneos.

    Lenguajes Documentales.

    Actualmente existen sistemas de informacin basados en sustitutos, los ms comunes

    se encuentran en disciplinas como la bibliotecologa, documentacin o ciencias de

    la informacin; en ellos los sustitutos son usados como los componentes bsicos en

    el almacenamiento y recuperacin de la informacin, es decir, el usuario recupera el

    sustituto y ste lo conduce al documento buscado.

    De lo anterior se deduce la importancia que para los profesionales de la informacin

    tienen los procesos dedicados a la creacin de estos sustitutos, es por ello que hace

    uso de lenguajes documentales, los cuales pueden ser de dos tipos:

    1) Lenguajes Libres.- Se refieren a aquellos lenguajes que utilizamos en nuestra vida

    diaria para comunicarnos.

    Estos lenguajes estn representados por los diccionarios de las lenguas.

    v.gr: El Diccionario de la Lengua Espaola o El Diccionario del espaol usual en

    Mxico.

    2) Lenguajes Controlados.- Tambin conocidos como lenguajes artificiales, son

    aquellos que controlan la sinonimia, la polisemia, la homonimia, etc.

    Estos lenguajes estn representados por:

    2.1) Tesauros y Listas de Encabezamientos de Materia:

    A travs del uso de vocabularios controlados se representa con una palabra o frase el

    contenido del documento.

    v. gr: Un libro que trate sobre bases de datos documentales y sus aplicaciones en la

    industria, tendra la siguiente representacin:

    Bases de Datos DocumentalesAplicacin

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    23

    Con esta forma garantizamos que la informacin siempre se presentar de una sola

    forma, tanto para su almacenamiento como para su recuperacin. Descartando la

    palabra: Industria.

    2.2) Sistemas de Clasificacin:

    La mayora de los sistemas de clasificacin que existen, intentan representar de una

    manera lgica el conocimiento humano. Existen sistemas que usan notaciones

    numricas o alfanumricas para lograr su objetivo.

    Clasificacin, en palabras de Arguinzniz 9, denota la colocacin de los libros en los

    estantes; consiste en la asignacin de un lugar exacto de los libros dentro de un

    estante considerando algn criterio.

    Dos de los sistemas ms conocidos y usados en el mundo son:

    La Clasificacin Decimal de Dewey y la clasificacin de la Biblioteca del Congreso de

    los Estados Unidos (LC por sus siglas en ingls). En la BIBFAR, se usa un sistema de

    clasificacin propio que no se apega a ninguna norma aceptada internacionalmente.

    1.2 Automatizacin de Bibliotecas.

    Existen diferentes definiciones de Automatizacin de Bibliotecas (LA por sus siglas en

    ingls de Library Automation), Herrero 10 define LA como El cmputo aplicado a los

    procesos y servicios de tipo tcnico - bibliotecolgico y administrativo de la biblioteca.

    Herrera 11 sugiere que la automatizacin de bibliotecas consiste en aplicar las

    tecnologas de informacin y computacin en los procesos primordiales de una

    biblioteca.

    La introduccin de tecnologa a las bibliotecas comenz a finales de la dcada de 1960,

    cuando las bibliotecas norteamericanas decidieron dar el paso de las fichas de papel

    9 ARGUINZNIZ, Mara de la Luz.: Gua de la Biblioteca., p. 49. 10 HERRERO, Abelardo.: op. cit. 11 HERRERA, Jos Romn.: Software de Acceso a la Biblioteca Digital., p.1.

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    24

    a los registros de computadora.

    La Biblioteca del Congreso de los Estados Unidos de Norteamrica, form un comit de

    varios especialistas en las reas de Bibliotecologa y Ciencias de la Computacin,

    para desarrollar un formato de catalogacin legible por computadora MARC 12.

    Bajo la ptica de la Automatizacin de Bibliotecas y como lo sugiere Herrero 13

    Una biblioteca debe automatizar la mayor cantidad posible de procesos y mecanismos

    para aumentar la eficiencia del trabajo, reducir tiempos y mejorar el control.

    Hasta principios de la dcada de 1990, [Cohn,1998] la automatizacin de bibliotecas

    involucraba generalmente las mismas caractersticas propuestas desde el surgimiento

    de MARC en 1960:

    - Las bibliotecas crearon sistemas integrados en los cuales las funciones tradicionales

    de una biblioteca (circulacin, catalogacin, catlogo pblico, etc.) se computarizaban a

    travs de la base de datos de la biblioteca.

    - Los sistemas funcionaban usualmente en poderosas computadoras supermicro,

    mini o mainframes.

    - Los sistemas estaban basados en texto, no incorporaban grficas, sonido u otros

    componentes multimedia.

    - Los sistemas eran locales fundamentalmente, con nfasis en el control de acceso a

    los recursos dentro de una discreta red local, sin posibilidades de acceso a bases de

    datos remotas o catlogos de otras bibliotecas.

    1.2.1 Los servicios de la biblioteca bajo la ptica de la automatizacin.

    La Consulta.- La automatizacin de la funcin de Informacin del servicio de consulta,

    12 Machine Readable Cataloging por sus siglas en ingls. 13 HERRERO, Abelardo.: op. cit.

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    25

    se realiza a travs de un Catlogo Pblico en Lnea, OPAC 14 y como lo advierte

    [Peters,1999] un catlogo en lnea es la parte ms visible de la automatizacin de

    bibliotecas, es el reemplazo eficiente del catlogo de tarjetas.

    Los catlogos en lnea son una clase de sistemas que se hayan entre los denominados

    Sistemas de Almacenamiento y Recuperacin de la Informacin.

    El Prstamo.- Para este proceso, [Peters,1999] seala que los procedimientos de

    bsqueda en bases de datos y de circulacin automatizada, ambos se ven afectados

    por el catlogo en lnea.

    El prstamo automatizado de libros requiere de un catlogo pblico en lnea conectado

    con una base de datos de inventarios que registre el control de las existencias de

    ejemplares, as como sus entradas y salidas de la biblioteca.

    1.3 Formato de datos MARC.

    El acrnimo MARC resulta de MAchine Readable Cataloging (catalogacin legible a

    travs de computadora) o generacin de registros catalogrficos legibles a travs de

    computadora. Gredley, citado por Arriola 15 comenta que MARC es: un grupo de

    formatos que emplean un conjunto particular de convenciones para la identificacin y

    manejo de datos bibliogrficos por computadora.

    El nmero de formatos que integran al estndar MARC son cinco:

    1. Bibliogrfico o integrado.

    2. Autoridades.

    3. Clasificaciones.

    4. Holdings.

    14 Por sus siglas en ingl, de Online Public Accesa Catalog. 15 ARRIOLA, Oscar.: Diapositvas del Curso Pblico de Informtica Aplicada en Bibliotecas., 24 de Septiembre.

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    26

    5. Informacin comunitaria.

    En esta investigacin solo nos ocuparemos del formato MARC Bibliogrfico.

    La estructura del formato MARC Bibliogrfico (fig. 2) est basada en la norma ANSI

    Z39.2 de la American National Standard for Bibliographic Information Interchange,

    misma que sirvi como base para implementar la norma ISO 2709 Format for

    Bibliographic Information Interchange on Magnetic Tape.

    2. Registro de datos MARC Bibliographic. (Cortesa de El Colegio de Mxico).

    Dicha estructura consta de los siguientes elementos:

    Lder.- Est integrado por un nmero finito de 24 caracteres en los que se consigna la

    informacin general del registro catalogrfico.

    Directorio.- Est integrado por campos de longitud fija de 12 caracteres, cada uno

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    27

    contiene la etiqueta de identificacin, la longitud y la posicin del primer carcter en

    el registro de cada etiqueta en el campo variable.

    Elementos de longitud fija.- Estos campos consignan informacin catalogrfica la cual

    determina el contenido del registro. Para su identificacin se utilizan cdigos ya

    establecidos, estos datos se ubican en una longitud de posiciones fijas del 0 al 39.

    Campos de longitud variable.- La informacin contenida en estos campos se

    representa a travs de etiquetas numricas, cada campo tiene sus propios indicadores

    de subcampo y tanto los campos como los indicadores de subcampo pueden repetirse

    en un mismo registro.

    Etiquetas.- Los campos de longitud variable son identificados por etiquetas numricas y

    se encuentran agrupados en nueve bloques:

    0XX Nmero de control, clasificacin, etc.

    1XX Asiento principal.

    2XX Ttulos, ediciones, rea de publicacin.

    3XX Descripcin fsica.

    4XX Mencin de serie.

    5XX Notas.

    6XX Temas o materias.

    7XX Asientos secundarios.

    8XX Asientos secundarios series, acceso y localizacin de recursos

    electrnicos.

    1.3.1 Ventajas del Formato de datos MARC.

    El uso del formato MARC ofrece muchas ventajas, por que:

    - Permite el intercambio de informacin catalogrfica con otras bibliotecas.

    - Todos los sistemas comerciales de automatizacin bibliotecaria manejan el formato.

    - Ofrece una forma estructurada para almacenar registros catalogrficos, cuyas

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    28

    caractersticas esenciales consiten en la repetibilidad de campos y el tamao no

    determinado de sus registros.

    - Existe una correspondencia entre las reas de una ficha catalogrfica generada con

    las AACR2 y MARC, de manera que es posible transcribir un catlogo en papel a

    MARC.

    El standard MARC (ANSI Z39.2) tan solo es un formato, una especificacin de como

    deben ser almacenados los registros bibliogrficos dentro de una computadora, es decir

    que MARC no es un programa de computadora.

    La verdadera incorporacin de tecnologa se da, cuando un software es capaz de

    procesar, transformar, buscar o administrar estos datos estructurados con formato

    MARC.

    Con la informacin catalogrfica con que se cuenta en la BIBFAR, no es posible

    generar registros apegados 100% al estndar MARC, por lo tanto slo se usarn

    algunas etiquetas de los campos de longitud variable.

    1.4 Recuperacin de Informacin.

    La Recuperacin de Informacin o IR 16, una disciplina relativamente joven,

    perteneciente a las Ciencias de la Informacin, su tema central est relacionado con la

    estructura, el anlisis, organizacin, almacenamiento y bsqueda de informacin.

    Actualmente, esta disciplina tiene un enfoque ms orientado hacia el cmputo, sin

    embargo el tema de esta disciplina tiene sus orgenes algunos siglos atrs.

    Segn [Meadow,1992], existe una diferencia entre Information Retrieval e Information

    Recovery, en espaol es posible confundir ambas con Recuperacin de Informacin.

    Meadow, explica que mientras el primer trmino involucra bsqueda de informacin en

    algn depsito de informacin o base de datos, va acompaada implcitamente del

    16 Por sus siglas en ingls, de Information Retrieval.

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    29

    concepto de selectividad; el segundo trmino, no es idntico al primero a no ser que

    exista una selectividad de por medio, como ejemplo, menciona que copiar un archivo

    completo de un disco a otro no es Recuperacin de Informacin.

    En general, el trmino Recuperacin de Informacin debe entenderse en el sentido de

    Consulta de Informacin.

    Meadow 17 concluye su explicacin con el siguiente ejemplo:

    Una biblioteca es el mejor ejemplo de una institucin dedicada a la recuperacin

    selectiva. Uno asiste y no lee toda la coleccin. Uno asiste y busca algo

    selectivamente, frecuentemente alguna cosa satisfacer un conjunto de necesidades de

    informacin altamente individualizadas.

    1.4.1 Aplicaciones de la Recuperacin de Informacin.

    Herrero 18 en su tesis de maestra sugiere que desde 1950 - 1960, principalmente en el

    sector militar de USA, se aplic y us tecnologa de Recuperacin de Informacin,

    tecnologa que posteriormente se traslad y utiliz en otros mbitos, como el

    acadmico, dentro del cual las bibliotecas ocuparon un nicho de aplicacin muy

    importante.

    Los sistemas de IR tienen muy diversas aplicaciones entre las que se cuentan:

    - Motores de bsqueda en Internet (Google19, htdig 20, Microsoft Index Server 21).

    - Sistemas policiales de inteligencia.

    - Sistemas de decodificacin e identificacin de ADN.

    17 MEADOW, Charles T : Text Information Retrieval Systems., p. 2. 18 HERRERO, Abelardo.: Borrador de Tesis de Maestra. p. 5. 19 Google Press Center.: Google Technology Overview www.google.com/press/overview_tech.html 20 ht://Dig Introduction. www.htdig.org 21 Microsoft.: Index Server A Technical Overview. www.microsoft.com/NTServer/techresources/IndServ.asp

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    30

    - Catlogos de bibliotecas (Star 22).

    - Utileras de sistema operativo como Norton File Find, Midnight Commander, fgrep, etc.

    1.4.2 Recuperacin de Informacin basada en texto.

    Existen diversas variantes de Recuperacin de Informacin que dependen del

    paradigma de datos de que se trate ya sea texto, datos numricos, imgenes,

    secuencias de DNA, sonido, msica etc., una de ellas merece especial mencin por

    relacionarse con el tema de esta tesis:

    La Recuperacin de Informacin basada en texto.

    Segn Herrero, la recuperacin basada en texto es la que tiene un campo de aplicacin

    ms amplio y creciente, puesto que la representacin informtica de letras y palabras y

    las operaciones involucradas en el proceso de recuperacin, tales como comparacin y

    ordenamientos estn lo suficientemente sistematizadas en trminos de cmputo, para

    poder desarrollar sistemas muy evolucionados.

    Sugiere que otro tipo de informacin, como las imgenes, presentan problemas de

    mayor complejidad: la simple comparacin de imgenes, o los mecanismos de

    formulacin de peticiones, constituyen retos monumentales en trminos de

    instrumentacin de software.

    Los sistemas de texto pueden dividirse en dos tipos:

    a) Sistemas de recuperacin de texto completo.- Se les llama tambin, sistemas de

    recuperacin de documentos, pues recuperan documentos completos.

    b) Sistemas de recuperacin de texto referenciales.- La funcin de los sistemas de texto

    22 Cuadra Associates.: STAR. www.cuadra.com/products/star.html

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    31

    referenciales consiste en recuperar referencias a textos, es decir, indican la referencia

    de textos en algn entorno; son de extrema importancia, pues son los mas usados dado

    que, en la mayora de los sistemas de informacin se guarda una referencia a objetos o

    situaciones del mundo real en forma de texto controlado.

    Los motores de bsqueda de Internet son el ejemplo ms clsico de sistemas de texto

    referenciales. Otro ejemplo de sistemas de texto referencial, son los catlogos de

    biblioteca, que son sistemas que permiten buscar los materiales de un acervo a travs

    de una base de datos bibliogrfica.

    Segn Hildreth, citado por Herrero 23, La IR, plantea dos estrategias o acercamientos

    para la consulta de texto: la bsqueda (search) y el hojeo (browse). De stos, la

    bsqueda es el ms utilizado, aunque existen intentos notables para desarrollar

    sistemas de hojeo poderosos.

    1.4.3 Catlogos Automatizados de Bibliotecas y la Recuperacin de

    Informacin.

    Como lo sugiere Herrero: Hasta avanzado el siglo XX, los sistemas de Recuperacin de

    Informacin en bibliotecas estaban basados en catlogos de tarjetas. La administracin

    de grandes cantidades de tarjetas en ficheros de gran tamao constituyeron un caldo

    de cultivo excepcional para la automatizacin y ms especficamente, para la aplicacin

    de las bases de datos y de la Recuperacin de Informacin.

    Cuando el sector militar de EUA liber la tecnologa de cmputo (restringida hasta

    entonces) a las universidades y centros acadmicos para que estas pudieran aplicar

    libremente la computacin, las bibliotecas se vieron beneficiadas, porque de entre ellas

    las mas importantes y con capacidad de aplicar innovaciones tecnolgicas, se

    encuentran precisamente en universidades y otros centros de investigacin

    acadmicos.

    23 HERRERO Abelardo.: op. cit., p. 5.

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    32

    Una de las primeras aplicaciones del cmputo en Recuperacin de Informacin fueron

    los catlogos automatizados, que mas tarde se reconoceran internacionalmente como

    OPAC.

    En su tesis de maestra, Herrero, apunta que el ncleo de un OPAC, es un sistema de

    recuperacin de texto referencial, de manera que el contenido completo de los libros,

    revistas y otros materiales no se almacena, slo se almacenan apuntadores, datos

    bsicos, trminos clasificatorio entre otros.

    Toda esta informacin referencial es preparada mediante reglas y lenguajes especiales

    y es tratada en la bibliotecologa por varias disciplinas.

    3. Componentes de un OPAC.

    En trminos de software, los componentes de un OPAC (fig. 3) son los siguientes:

    - Sistema Manejador de Bases de Datos.

    - Motor de Bsquedas.

    - Intrprete de Bsquedas.

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    33

    - Interfaz de Captura de Peticiones.

    - Interfaz de Manejador de Resultados.

    Los problemas de un OPAC pueden dividirse hipotticamente en dos tipos:

    Problemas asociados a la Recuperacin de Informacin.

    Problemas generados por el entorno de la aplicacin (en este caso las bibliotecas).

    Estos se presentan solos o combinados, en diversas situaciones de los procesos

    asociados a la consulta, por la extensin de esta tesis, no se tratarn aqu.

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    34

    Captulo II Fundamentos de Computacin.

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    35

    2.1 Plataforma de bases de datos.

    Existen muchas acepciones del concepto bases de datos, por lo que ser mejor hacer

    una distincin entre algunas de ellas:

    Segn Date 24 es un sistema computarizado para llevar registros .

    Para Yarger 25 simplemente una coleccin organizada de datos, es as que base de

    datos se diferenca de sistema manejador de bases de datos (DBMS por sus siglas en

    ingls), cuya definicin segn Yarger un programa de computadora que permite al

    usuario, crear, mantener y administrar bases de datos electrnicas.

    [Feiler,1999] indica que el concepto Base de Datos puede tener tres acepciones, las

    cuales estn bien diferenciadas unas de otras:

    - Una base de datos puede ser un cuerpo de datos, -frecuentemente un gran cmulo de

    informacin- usualmente almacenados e indizado en una computadora o en un

    dispositivo electrnico.

    - Una base de datos puede ser el software (y algunas veces el hardware), que se usa

    para almacenar, consultar y manipular datos.

    - Una base de datos puede ser una combinacin de datos, software y programas

    hechos a la medida que resuelven determinado problema.

    Feiler, finaliza su explicacin aclarando que, una base de datos, se refiere a la primer

    24 DATE, C.J.: Introduccin a los Sistemas de Bases de Datos., p.2. 25 Yarger, R. et al.: mSql & MySQL., p. 6.

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    36

    definicin, un sistema manejador de bases de datos DBMS 26 corresponde a la segunda

    definicin, y un proyecto de bases de datos, corresponde a la tercera definicin.

    Como sugiere [Tenopir,1989], los manejadores de bases de datos ms comunes son

    manejadores de registros, los cuales en su mayora no han sido diseados para

    manejar registros bibliogrficos, de cualquier manera los sistemas comunes de bases

    de datos imponen severas restricciones en el diseo y en la capacidad de bsqueda.

    As mismo Tenopir sugiere evaluar los manejadores de bases de datos, considerando

    las caractersticas nicas de las bases de datos bibliogrficas, caractersticas que no se

    presentan comnmente en aplicaciones de negocios, estas caractersticas son:

    - Las bases de datos bibliogrficas o textuales se componen principalmente de registros

    alfanumricos, en vez de datos numricos o claves, los cuales se ocupan en cualquier

    tipo de clculo.

    - En el caso de que incluyan nmeros, estos son tratados frecuentemente como

    cadenas de caracteres (v. gr.: nmeros de volumen, pginas, etc.).

    - Cada registro tiende a tener muchos campos, pero el mismo campo o campos

    similares estn presentes en la mayora de los registros de la base de datos.

    - Existen campos que son frecuentemente largos (v.gr.: ttulos o resmenes), pero el

    largo de cada campo puede variar de un registro a otro.

    - Algunos campos tienen valores que deben tratarse por separado, pero representan

    datos equivalentes (v. gr.: descriptores, autores mltiples).

    La frecuencia o repeticin es generalmente impredecible de un registro a otro.

    - Muchas aplicaciones requieren acceso de bsqueda en la mayora de los campos.

    Las capacidades de bsqueda son importantes, (v. gr.: Lgica booleana, proximidad

    26 Por sus siglas en ingls Data Base Management System.

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    37

    de palabras, bsqueda en un campo especfico o en varios campos especficos y la

    capacidad de realizar bsquedas truncadas).

    La informacin no cambia rpidamente y el nmero de registros tiende a crecer

    continuamente.

    Tabla 2. Opciones de software para bases de datos bibliogrficas segn Tenopir.

    Opciones de software para bases de datos bibliogrficas.

    Software de propsito general. Software de propsito especfico.

    Diseados para resolver diferentes necesidades. - Fciles de obtener. - Ampliamente difundidos. - Fciles de usar.

    - Se adaptan ms a las necesidades de una base de datos bibliogrfica. - Son escasos, por lo tanto, no hay mucha documentacin al respecto. - No todos han sido diseados tomando en cuenta las necesidades de una base de datos bibliogrfica, pero los que las toman en cuenta resuelven la mayora de los problemas asociados a ellas.

    DBMS Programas de almacenamiento y recuperacin de

    informacin (IS & R por sus siglas en ingls). A Favor: - Pueden manejar mas de una tabla a la vez. - Pueden relacionar diferentes archivos (o tablas). - Cuentan con suficiente documentacin. En Contra: - Son limitados para uso bibliogrfico. - Campos de longitud fija. - Por lo general no pueden manejar mas de un valor por campo (no existen mltiples ocurrencias). - En algunos casos, hay restricciones en el nmero de campos y en el tamao de los registros. - La bsqueda de datos se realiza a travs de un lenguaje limitado. - Hay que invertir muchas horas para adaptarlos a el funcionamiento de una aplicacin bibliogrfica. Ejemplos: dBase, mSQL, MySQL, DB/2, PostgreSQL, FileMaker, MS-Access.

    A Favor: - Diseados para modelar bsquedas y consultas poderosas. - Incluyen algoritmos de bsqueda booleana, por truncamiento, bsqueda por proximidad, construccin de conjuntos, entre otras. - Permiten definir formatos de impresin a los resultados de las bsquedas. - La mayora de los paquetes funcionan con una PC comn. - Permiten estructurar campos. - Permiten longitud variable. - Permiten repetibilidad de campos. En contra: - Generalmente crean archivos invertidos (ndices) para facilitar y acelerar las bsquedas lo cual produce overheads. Ejemplos: CDS/ISIS, OpenIsis.

    Software de Recuperacin de Texto Aplicaciones Bibliotecarias A Favor: - No requieren de estructuracin de archivos (no hay informacin separada en campos). - Ofrecen poderosas caractersticas de bsqueda (bsqueda booleana, truncada, proximidad de palabras, etc.). En Contra: - Por no usar estructuras, existen problemas al combinar el software con datos estructurados bibliogrficamente. - Por la misma razn, cuando realizan bsquedas tienen que recorrer toda la base de datos, lo cual no es ptimo. Ejemplos: Folio 4.1, dtSearch.

    A Favor: - Funcionan bien si la biblioteca se adapta a las caractersticas del sistema. En Contra: - Ofrecen menor flexibilidad que los IS&R. - Los formatos de impresin y la estructura de los datos ya estn predefinidos. - Resuelven otros problemas como el prstamo de materiales. Ejemplos: BiblioScape (www.biblioscape.com)

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    38

    Estas caractersticas tienen un efecto directo en la adopcin de un software apropiado

    para una base de datos bibliogrfica. En la tabla 2, se muestra una propuesta de las

    diferentes opciones de software de bases de datos que puede usarse en una biblioteca.

    Segn Tenopir, el software que se ha adoptado exitosamente para el uso de

    aplicaciones bibliogrficas puede dividirse en dos categoras, las cuales a su vez

    pueden subdividirse en diferentes tipos de software.

    Para el desarrollo del catlogo automatizado que se propone en este trabajo, se opt

    por el uso de un software llamado CDS/ISIS (Computarized Documentation

    System/Integrated Set of Information System por sus siglas en ingls), conocido

    simplemente como ISIS, este software esta dentro de la clasificacin de los llamadas

    Aplicaciones de Almacenamiento y Recuperacin de la Informacin.

    La decisin de usar CDS/ISIS se basa en el argumento de que la mayora de los

    motores de bases de datos (DBMS) carecen de funcionalidades de Recuperacin de

    Informacin como la capacidad de bsqueda y estructuracin de informacin que ISIS

    ofrece, ya que tratar de incorporar alguna de esas caractersticas a un DBMS

    Relacional dara lugar a una nueva tesis.

    Al respecto de este argumento, [Manzanos,1999] realiza una comparacin suficiente

    entre una base de datos relacional y CDS/ISIS, las conclusiones a las que llega son

    contundentes. Si se desea saber sobre esta comparacin el interesado puede remitirse

    al apndice D.

    2.1.1 La tecnologa CDS/ISIS.

    CDS/ISIS es uno de los llamados manejadores de bases de datos bibliogrficas o

    textuales, sus inicios nos llevan a los aos 60, perteneca a la Organizacin

    Internacional del Trabajo, en sus inicios solo era ISIS (Integrated Set of

    Information System), posteriormente el desarrollo fue tomado por la UNESCO, y

    programado por Gian Paolo del Bigio, mas tarde adquiri el nombre de CDS/ISIS

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    39

    (Computarized Documentation System/Integrated Set of Information System).

    La idea de UNESCO era brindar software gratuito a las bibliotecas del mundo con

    escasos recursos. En el tiempo presente se autoriza su uso bajo licencia, sin cargo,

    con el compromiso de no cederlo ni comercializarlo; para ello nombr en cada pas a

    un distribuidor nacional, que en el caso de Mxico es el Consejo Nacional de

    Ciencia y Tecnologa (CONACYT).

    En un documento conocido como Elements for a charter of the ISIS-Coordination

    Group 27 UNESCO declara que ISIS es una familia de software capaz de

    manejar diferentes estndares propietarios:

    ISIS Master File (MST) .- El formato de organizacin de archivos que permite el

    almacenamiento de informacin.

    ISIS Inverted File (IF) .- El formato de organizacin de archivos que permite indizar la

    informacin almacenada por el archivo MST.

    ISIS Query Language (IQL).- El lenguaje de consulta de ISIS.

    ISIS Formatting Language (IFL).- El lenguaje de formato de ISIS.

    Hacia 2003, la familia de software CDS/ISIS (fig. 4) se compona de:

    Micro CDS/ISIS.- Es un software basado en consola de texto que funciona en

    ambientes MS-DOS, UNIX y VAX.

    WinISIS.- Como su nombre lo indica, es una versin modificada de Micro CDS/ISIS

    para ambientes Windows, funciona para Windows 3.1 y superiores.

    CISIS.- Es una interfaz de rutinas escritas en C, desarrollada por Bireme que ofrece las

    funcionalidades bsicas de CDS/ISIS.

    ISIS_DLL.- Es una librera DLL que permite a los programadores habilitar aplicaciones

    para acceder a bases de datos ISIS, tambin ha sido desarrollada por Bireme y

    27 SMET, Egbert de.: Elements for a charter of the ISIS-Coordination Group., p. 1

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    40

    funciona en plataformas Win32 y Linux.

    WWWISIS.- Es una aplicacin diseada para funcionar como un CGI esttico que

    ofrece acceso a bases de datos ISIS desde Web.

    JavaIsis .- Es una aplicacin desarrollada en Java que hace uso de WWWIsis para

    acceder a bases de datos ISIS.

    4. La familia de Software ISIS.

    Las caractersticas principales de la tecnologa CDS/ISIS son:

    - Manejo de un nmero indefinido de distintas bases de datos, con una informacin de

    hasta 500 millones de caracteres, estructurados en registros.

    - Capacidad para contener un mximo de 16 millones de registros de hasta 8.000

    caracteres, codificados en cdigo ASCII, desagregables en un mximo de 200 campos

    diferentes, a su vez, divisibles en subcampos.

    - Campos de longitud variable: No requiere predefinir una longitud del campo, sta es

    variable de registro en registro, pudiendo ser nula o extenderse hasta completar la

    longitud mxima del registro.

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    41

    - Campos repetibles: Un determinado campo puede repetirse mltiples veces en un

    mismo registro.

    - Potentes recursos de recuperacin (bsqueda) de registros seleccionados de acuerdo

    a su contenido en determinados campos con uso de operadores booleanos y otras

    expresiones condicionales.

    -Las bsquedas se pueden efectuar por el contenido completo de un campo, por

    palabras aisladas o secuencia de caracteres.

    - Salidas en formato ISO 2709 (norma internacional para el intercambio de informacin

    documental).

    - Capacidad de convertir el contenido de un campo determinado.

    Las razones para elegir CDS/ISIS como software de base para el catlogo de la

    BIBFAR son :

    - Posee la capacidad de almacenar elementos de longitud variable compatibles con el

    Formato de datos bibliogrficos MARC.

    - Posee las funciones caractersticas de un OPAC.

    2.2 Modelo cliente / servidor.

    El modelo cliente / servidor es un caso especial de sistemas de cmputo

    distribuidos. Segn [Berson,1996], el trmino cliente / servidor aplica para la

    arquitectura de software que describe el procesamiento entre dos programas: una

    aplicacin (cliente) y un servicio de soporte (servidor), sin importar que el cliente y el

    servidor estn separados fsicamente.

    El modelo cliente / servidor implica el procesamiento cooperativo de solicitudes

    enviadas por un cliente, al servidor el cual procesa las solicitudes y regresa

    los resultados al cliente.

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    42

    Segn [Umar,1997] las caractersticas principales del modelo cliente/servidor son:

    1. Clientes y servidores son mdulos funcionales con interfaces bien definidas.

    2. Cada relacin cliente / servidor es establecida entre dos mdulos funcionales cuando

    un modulo (el cliente) inicia una peticin de servicio y el otro (el servidor) elige

    responder a la peticin de servicio.

    3. El intercambio de informacin entre clientes y servidores es estrictamente a travs de

    mensajes (no existen variables globales).

    4. Los mensajes intercambiados entre clientes y servidores son tpicamente

    interactivos.

    5. Tanto clientes como servidores residen en diferentes mquinas conectadas a travs

    de una red.

    2.2.1 Bloques del modelo cliente / servidor.

    En la interpretacin de [Umar,1997] (fig. 5), los sistemas cliente/servidor se construyen

    a partir de bloques:

    Procesos del Cliente.- (comnmente referidos como cliente) comprenden desde

    interfaces de usuario, hojas de clculo hasta aplicaciones completas. Cada vez ms los

    procesos del cliente se estn convirtiendo en aplicaciones basadas en Internet.

    Procesos del Servidor.- (Comnmente referidos como servidor) proveen los servicios al

    cliente, ofrecen funcionalidades desde muy simples hasta muy sofisticadas. Idealmente

    ocultan informacin interna que los clientes no deben conocer.

    Middleware28.- Provee un amplio rango de funcionalidades tales como el establecer

    sesiones entre los procesos del cliente y del servidor, conexiones a bases de datos,

    28 Software que conecta otras piezas de software.

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    43

    etctera.

    Umar reconoce un caso particular de middleware:

    El World Wide Web, que en el tiempo presente (ao 2004), consiste en Navegadores

    Web, Servidores Web, motores de bsqueda, lenguaje de marcacin de hipertexto

    (HTML), el protocolo de transferencia de hipertexto (HTTP), y puentes (Gateways) que

    permiten acceder a bases de datos (todos estos componentes se detallarn mas

    adelante).

    5. Bloques del modelo cliente / servidor segn Umar.

    Middleware del cliente.- Esencialmente es un conjunto de mdulos de software los

    cuales pueden ser invocados desde el cliente a travs de una interfaz de programacin

    (API por sus siglas en ingls).

    Middleware del servidor.- Su funcin es monitorear las peticiones de los clientes e

    invocar los procesos apropiados.

    Servicios de Red.- Redes de comunicacin o redes, proveen el ms bajo nivel de

    servicio, para comunicar el Middleware de clientes y servidores. En este contexto una

    red es una coleccin de equipos, mdulos de software y medios fsicos vistos como un

    todo autnomo, que interconecta dos o ms computadoras.

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    44

    Los servicios de Red, estn basados en alguna arquitectura de red como el modelo de

    referencia OSI, o la pila de protocolos TCP/IP.

    2.2.2 Procesamiento cooperativo cliente / servidor.

    Dentro del modelo cliente / servidor existen diferentes enfoques que tratan la

    distribucin de una aplicacin dentro de una red, un ejemplo de estos enfoques es el

    Procesamiento Cooperativo cliente / servidor que propone [Berson,1996], en el que

    una aplicacin se divide en cuatro componentes:

    a) Lgica de Presentacin.- Es la parte que interacta con el usuario y la terminal.

    Solo se encarga del despliegue de datos y de las entradas del usuario.

    b) Lgica de Negocio.- Usa las entradas del usuario o de la base de datos para realizar

    las tareas del negocio.

    c) Lgica de Manipulacin de datos.- Es la parte de la aplicacin que manipula datos,

    los datos son manejados por un DBMS.

    d) Procesamiento de datos.- Es la parte de la aplicacin que accede a los datos a bajo

    nivel.

    2.2.3 Componentes del Middleware World Wide Web.

    En la opinin de Umar, el middleware World Wide Web es un middleware que opera en

    la capa de aplicacin del protocolo TCP/IP.

    El middleware Web esta basado en los siguientes conceptos y tecnologas:

    - Servicio de Nombres de Dominio (DNS).

    - Servidores Web (Web Servers).

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    45

    - Navegadores Web (Web Navigator).

    - Localizador Uniforme de Recursos (URL).

    - Protocolo de Transferencia de Hipertextos (HTTP).

    - Lenguaje de Marcacin de Hipertextos (HTML).

    - Puentes (Gateways).

    Localizador Uniforme de Recursos (URL).- Es una secuencia de caracteres que

    identifica a un recurso dentro de la Internet, su sintaxis est definida en el documento

    RFC - 1738 [ Berners-Lee,1994].

    La sintaxis se divide en dos partes, un esquema y su correspondiente parte especfica,

    la notacin BNF de una URL es:

    :

    La notacin BNF de es:

    //:@:/

    Donde:

    es una secuencia de caracteres del alfabeto ingls que identifica a un

    protocolo de comunicacin (v.gr.: ftp, http, https).

    y son una secuencia de caracteres nmericos o del alfabeto

    ingls que determinan el nombre de un usuario y su correspondiente clave de acceso

    ante un servidor determinado.

    es una secuencia de caracteres numricos o del alfabeto ingls, separados

    por puntos, que hacen referencia a una direccin de internet en la que se encuentra un

    servidor.

    es una secuencia de caracteres numricos que representa algn nmero

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    46

    comprendido entre el 1 y el 65535.

    es una secuencia de caracteres numricos o del alfabeto ingls que

    representa un recurso disponible en el servidor.

    Protocolo de Transferencia de Hipertexto (HTTP).- Actualmente definido en el

    documento RFC 2616 [Fielding,1999] es un protocolo de nivel de aplicacin para

    sistemas de informacin de hipermedia distribuidos y colaborativos. Es un protocolo

    genrico y no orientado a la conexin (no maneja sesiones).

    Lenguaje de Marcacin de Hipertextos (HTML).- Comentado en el documento RFC

    2854 [Connolly,2000] y por [Ragget ,1997]. Es un lenguaje que define documentos de

    hipertexto, es usado como lenguaje de presentacin de pginas adems de que permite

    definir hiperligas mediante los URL. Este lenguaje es interpretado por un Navegador, lo

    que provoca que la presentacin de las pginas dependa del navegador que se use

    para mostrar dicha pgina.

    Anteriormente solo se limitaba a describir la estructura y contenido de un documento y

    no el formato de la pgina ni su apariencia, actualmente (en el ao 2003), ha

    evolucionado a tal grado que las pginas empiezan a parecerse a documentos

    compuestos en programas de autoedicin.

    Puentes (Gateways).- Son enlaces a recursos que no pertenecen a la Web. Para Umar

    son mecanismos que enlazan navegadores web con recursos que no son pginas web.

    Los enlaces son usados para acceder a informacin desde orgenes de datos

    heterogneos (bases de datos relacionales, sistemas de informacin propietarios, u

    otros servicios del servidor).

    La idea principal es que los Navegadores slo pueden mostrar HTML, los gateways son

    usados para acceder a la informacin no-HTML y convertirla al formato HTML para

    mostrarla en el Navegador.

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    47

    Los gateways son programas que corren generalmente en el servidor.

    En el presente (en el ao 2004) continan vigentes los diferentes enfoques que segn

    Perrochon 29 consisten en:

    - CGI.- Common Gateway Interface.

    - SSI.- Server Side Includes.

    - Servidores Especficos.- Programados a travs de un API especfico del web server.

    - Sistemas de cdigo mvil.- Gateways Java.

    El desarrollo de la aplicacin planteada en esta tesis est basado en la programacin

    de una variante de SSI.

    Un SSI consiste en una secuencia especial de caracteres (etiquetas) dentro de una

    pgina HTML.

    Estas etiquetas son procesadas por el servidor en el instante en que enva el

    documento al navegador. Cuando el servidor encuentra una etiqueta SSI interpreta las

    instrucciones contenidas dentro de la etiqueta y efecta una accin apropiada.

    As mientras el HTML es interpretado por los navegadores (clientes), los SSI son

    interpretados por el servidor.

    2.3 Aplicaciones Web.

    Se trata de un concepto de aplicaciones cliente / servidor en el que se usa la

    infraestructura de Internet como software intermedio entre clientes y servidores.

    En palabras de Conallen 30, una aplicacin de software web o aplicacin web, es un

    sistema web donde la entrada del usuario (navegacin y entrada de datos) afecta el

    estado del sistema.

    29 PERROCHON, citado por Umar Ajmad.: Object Oriented Client/Server Internet Environments., p. 178. 30 CONALLEN, Jim.: Modeling Web Application Architectures with UML., p. 1.

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    48

    La definicin de Gellersen 31, es mas general: definimos una aplicacin web, como

    cualquier aplicacin de software que depende de la web para su correcta ejecucin.

    A diferencia de las aplicaciones cliente/servidor tradicionales, las aplicaciones web

    tienen muchas ventajas, tanto econmicas como tecnolgicas: A nivel tcnico, la

    programacin de este tipo de aplicaciones es ms fcil, en comparacin a las

    aplicaciones cliente/servidor tradicionales, en las que los programadores deban

    involucrarse en detalles como el desarrollo de protocolos de comunicacin, el escribir

    un servidor que escuchara las peticiones de los clientes y atendiera a esas peticiones.

    En opinin de Gellersen, las aplicaciones web gozan de acceso a plataforma cruzada,

    esto es que pueden correr en sistemas operativos diferentes a los que se desarroll la

    aplicacin, Gellersen contina mencionando que la distribucin o instalacin de una

    aplicacin web recae sobre el concepto de clientes ligeros y en el concepto de

    mantenimiento centralizado.

    Algunas desventajas asociadas a las aplicaciones web se presentan en el ciclo de

    desarrollo de las mismas, razn por la cual los lectores interesados debern remitirse al

    Captulo III , apartado 3.2 Ingeniera de Software Web.

    31 GELLERSEN, Hans-W.: Object-Oriented Web Application Development. , IEEE Internet Computing Magazine, Enero-Febrero 1999. p. 61

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    49

    Captulo III Desarrollo del SCAI-BIBFAR.

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    50

    3.1 Introduccin.

    Este captulo trata sobre las actividades necesarias para construir una aplicacin web

    de calidad; para ello se hace una breve introduccin del concepto de Ingeniera de

    Software, as como tambin del concepto de Ingeniera de Software Web.

    En seguida se justifica el uso de programacin orientada a objetos para resolver el

    sistema de software, continuando con la justificacin del modelo de desarrollo.

    Por ltimo, se describen a detalle los entregables del anlisis, diseo de la experiencia

    de usuario, diseo, implementacin y pruebas relativas al desarrollo del sistema.

    3.2 Ingeniera de Software Web.

    La Ingeniera del Software, disciplina que Pressman 32 describe como : el uso de

    principios de la Ingeniera a fin de obtener un software que sea fiable y que funcione

    eficientemente en el mundo real; involucra principios tales como anlisis, diseo,

    implementacin, pruebas y mantenimiento.

    La Ingeniera de Software Web, o Ingeniera Web 33 es una especializacin de la

    Ingeniera de Software, en la que, en opinin de [Kirda,2001] incluye otras

    actividades adicionales de anlisis de datos, estructuracin de informacin,

    administracin de navegacin y organizacin de datos; este mismo autor advierte sobre

    lo inadecuado y difcil que resulta usar un proceso de ingeniera de software tradicional .

    32 PRESSMAN, Roger.: Ingeniera de Software, un enfoque prctico., p. XXIX 33 Del concepto de la lengua inglesa, Web Engineering.

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    51

    3.2.1 Problemtica de la Ingeniera de Software Web.

    La problemtica de la Ingeniera Web se refiere a la no existencia de metodologas

    estndar, es decir, que el desarrollo de aplicaciones web se caracteriza, en opinin de

    algunos autores, por su anarqua y por el uso de metodologas ad hoc.

    La falta de metodologas para desarrollo de aplicaciones web, como sugiere

    [Gellersen,1999], se debe al origen de la web como un medio de informacin en lugar

    de una plataforma de aplicaciones, as, el desarrollo de aplicaciones web es visto como

    un problema de autoedicin, en lugar de un problema de desarrollo de software, al cual

    se le deberan aplicar principios de Ingeniera de software.

    Otra razn que explica la falta de metodologas, es la naturaleza del middleware de la

    Web, no es homogneo, ni en clientes ni en servidores, pues involucra diferentes

    tecnologas (Java, ActiveX, JavaScript, PHP, etc.) y diferentes enfoques de

    programacin (declarativos, estructurados, basados en clases, en eventos, orientados a

    objetos, etc).

    En aos recientes, se han propuesto varias metodologas [Enguix, 1999] para facilitar el

    desarrollo de aplicaciones web, sin embargo, no se ha creado alguna metodologa

    estndar que cubra las necesidades de un enfoque sistemtico y metodolgico para el

    desarrollo dinmico y complejo de aplicaciones web .

    3.3 Programacin Orientada a Objetos.

    Las razones para aplicar tcnicas de programacin orientada a objetos estn

    relacionadas con la reutilizacin de cdigo, la reduccin en el tiempo de desarrollo y

    la existencia de un lenguaje para especificacin, visualizacin y construccin de

    elementos de software orientado a objetos [Joyanes,1998], lenguaje conocido como

    UML (Unified Modeling Language), que estandariza la forma en que un ingeniero de

    software expresa el anlisis y diseo de software orientado a objetos.

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    52

    3.3.1 UML

    En palabras de Sinan Si Alhir 34 UML es un lenguaje que unifica las mejores prcticas

    de la industria del software para el modelado de sistemas.

    UML no es simplemente una notacin para dibujar diagramas, es un lenguaje completo

    para capturar el conocimiento (semntico) acerca de un tema y expresar ese

    conocimiento (sintaxis) para propsitos de comunicacin.

    Los diagramas de UML son productos entregables que junto con otros documentos

    constituyen lo que en UML se conoce como artefactos.

    Las metas del UML son:

    - Ser un lenguaje visual y expresivo de modelado listo para usarse, que sea simple y

    extensible.

    -Tener mecanismos de extensibilidad y especializacin, en vez de modificar los

    conceptos principales.

    - Formalizar un conjunto bsico de conceptos que constituyen el paradigma orientado a

    objetos, de manera que las extensiones no requieran de la reimplementacin de los

    conceptos bsicos.

    - Permitir agregar nuevos conceptos y notacin mas all de los ya definidos por la base.

    - Permitir varias interpretaciones de los conceptos existentes para los cuales no existe

    un consenso claro.

    - Permitir la especializacin de conceptos, notacin y restricciones para dominios en

    particular.

    UML es un lenguaje de modelado que comunica una conceptualizacin o

    especificacin, no es un lenguaje de programacin visual.

    34 SI ALHIR Sinan.: UML in a nutshell. A Desktop Reference., p. 3.

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    53

    La especificacin de UML es parte de la OMG (Object Management Group), quien

    constantemente hace revisiones al documento original y publica cambios, por este

    hecho es importante remarcar que los diagramas que se presentan en esta tesis

    corresponden a la especificacin 1.1 de UML.

    3.3.2 UML y El desarrollo de Aplicaciones WEB.

    Cuando se trata de modelar aplicaciones web con UML, resulta que algunos de los

    componentes de las aplicaciones Web no encajan a la perfeccin en los elementos de

    modelado de UML. Para resolver este problema [Conallen,1999], ha propuesto una

    extensin de UML para modelar los elementos arquitectnicos de las aplicaciones

    Web; es as que esta extensin se ha usado en el anlisis y diseo del sistema

    propuesto.

    En la literatura especializada, se le conoce como WAE-UML35.

    No es tema de esta tesis tratar los detalles de cmo y en que consiste la extensibilidad

    de UML, slo cabe mencionar que en UML es posible definir nuevos estereotipos y

    reglas para extender su semntica y as solventar los problemas que pudieran no estar

    cubiertos con la especificacin estndar de UML.

    El modelo de desarrollo del sistema o modelo de ciclo de vida de un sistema, se refiere

    a la secuencia con que se realizan las actividades concernientes a la Ingeniera del

    Software: especificacin, diseo, implementacin, revisin, mantenimiento, prueba, etc..

    En opinin de [McConell, 1998], dependiendo del modelo elegido se pueden maximizar

    o minimizar algunos de los factores involucrados en el desarrollo.

    En este caso los factores esenciales del proyecto son los siguientes:

    - Bajo costo.

    - No hay necesidad de estimar tiempos requeridos.

    35 Por sus siglas en ingls Web Application Extension for UML, es una extensin al lenguaje UML, propuesta en 1999 por Jim Conallen.

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    54

    -Se requiere un producto final cuya operacin se realice 24 horas al da y 365

    das del ao.

    - Se cuenta con una definicin estable del producto final.

    Tras la revisin de los diversos mtodos disponibles [McConell, 1996] se eligi el

    modelo de desarrollo iterativo en cascada (fig. 6) considerando las siguientes razones:

    - Es ms fcil de seguir.

    - Genera una mejora contina al sistema en cada iteracin.

    - Requiere poca comprensin de la arquitectura del sistema.

    - Ataca el riesgo mostrando resultados en cada iteracin.

    6. Modelo de desarrollo en cascada.

    3.5 Anlisis.

    Se entender por anlisis a la investigacin necesaria para describir un problema de

    software, que para el caso de este desarrollo en particular, se expresar mediante

    cuatro entregables o artefactos:

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    55

    1) Anlisis de Requerimientos.- El anlisis ordenado y clasificado de las necesidades

    del usuario, expresadas en un lenguaje que evita tecnicismos en el mayor grado de lo

    posible.

    2) Anlisis de Casos de Uso.- La traduccin de las necesidades del usuario en

    operaciones del producto final, identificando a los principales involucrados.

    3) Glosario del Sistema.- Un glosario que describe en lenguaje no tcnico todos los

    trminos usados para describir los casos de uso.

    4) Modelo Conceptual.- La identificacin de unidades de funcionalidad independientes

    (posiblemente clases) que componen el producto final como sistema.

    3.5.1 Anlisis de Requerimientos.

    En las metodologas de desarrollo orientado a objetos, como la propuesta

    por [Larman, 1999], se inicia con un diagnstico de las necesidades del usuario, es en

    este primer acercamiento donde quedan definidas todas las caractersticas y

    operaciones que el sistema deber realizar. El anlisis de requerimientos que se

    presenta esta basado en un modelo que ayuda en la categorizacin y agrupamiento de

    requerimientos conocido como FURPS+36; el formato usado para expresar los

    requerimientos consiste en un listado numerado usando notacin decimal.

    En el mbito de este sistema se han considerado como una fuente de requerimientos

    esenciales toda la informacin vertida en los apartados 2.1, 2.2, 2.3, 2.4, 2.5 y 2.6 del

    Captulo I de esta tesis.

    1. Requerimientos funcionales.

    1.1 El sistema deber tener un catlogo pblico en lnea (OPAC).

    36 Por sus siglas en ingls Funcionality Usability Reliability Performance Supportability, es una propuesta de Robert Grady, citado por Peter Eles.: Capturing Architectural Requirements., The Rational Edge, November 2001 , Rational.

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    56

    1.2 El sistema permitir hojear el OPAC.

    1.3 El sistema almacenar registros catalogrficos basados en MARC.

    1.4 El OPAC almacenar mas de un catlogo.

    1.5 El OPAC estar disponible en Internet.

    1.6 El sistema de circulacin (SC) identificar los materiales en prstamo.

    1.7 El SC identificar a los prestatarios.

    1.8 El SC asegurar el regreso de los materiales dentro de un periodo razonable de

    tiempo, despus de su expiracin.

    1.9 El SC proveer informacin adecuada de prestatarios con adeudos.

    1.10 El SC permitir la disponibilidad de materiales tan pronto como sea posible, a

    travs de un sistema eficiente de reservaciones.

    1.11 El SC ser flexible para variar los perodos de prstamo.

    1.12 El SC no requerir de costos excesivos para su operacin.

    1.13 El SC permitir hacer reservaciones por Internet.

    1.14 El SC permitir consultar el expediente de un usuario, por Internet.

    1.15 El SC notificar por correo electrnico a los usuarios cuando una fecha de

    prstamo expire.

    1.16 El SC mostrar el nmero de ejemplares disponibles para prstamo.

    1.17 El SC permitir establecer perfiles para los prestatarios donde se especifique el

    nmero de ejemplares de prstamo, el monto de multa por da de retraso, y el nmero

    mximo de renovaciones que se le permiten.

    1.18 El SC permitir establecer perfiles para los materiales donde se especifique el

  • SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH

    57

    nmero mximo de das de prstamo permitidos, el nmero de ejemplares que se

    pueden prestar y el tipo de perfil de prestatario a quin aplica ese perfil.

    1.19 El SC calcular automticamente la fecha de expiracin en das hbiles, de un

    prstamo y una reservacin.

    1.20 El SC calcular en base a los perfiles prestatario / material los das de prstamo y

    el nmero mximo de das que un prestatario puede conservar un ejemplar.

    1.21 El sistema ayudar en la generacin de bibliografas para los usuarios.

    1.22 El sistema permitir evaluar el servicio prestado en la biblioteca.

    1.23 El sistema proteger el acceso a la informacin de prestamos y reservaciones.

    1.24 El sistema contar con ayuda en lnea.

    1.25 El OPAC podr exportar sus datos a otros formatos como XML.

    1.26 El OPAC estar conectado lgicamente con el SC, por cada registro catalogrfico

    existente en el OPAC, habr al menos un registro en el SC.

    1.27 El SC permitir hacer renovaciones de cargos que estn vigentes.

    2. Requerimientos de Usabilidad.

    2.1 El SC deber ser simple para el pblico en cuanto a operacin se refiere, y para el

    personal de la biblioteca deber ser fcil de entender y operar.

    2.2 El OPAC deber verse en la mayora de los navegadores.

    2.3 El OPAC no usar FRAMES de HTML para facilitar la visualizacin en todos los

    navegadores.

    2.4 El OPAC no depender de JavaScript para su funcionamiento bsico.

    2.5 El OPAC usar hojas de estilo en cascada CSS para mostrar los resultados de

    las bsquedas.

  • TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ

    58

    3. Requerimientos de Confiabilidad.

    3.1 El OPAC asegurar los mejores resultados en cada bsqueda.

    3.2 El OPAC deber estar en lnea 24 horas al da durante los 7 das de una semana.

    4. Requerimientos de Desempeo.

    4.1 El tiempo de respuesta del sistema para pginas estticas ser menor o igual a 3

    segundos.

    4.2 El tiempo de respuesta del sistema para pginas generadas dinmicamente ser

    menor o igual a 8 segundos.

    4.3 El tiempo de respuesta del sistema para consultas a base de datos relacional ser

    menor o igual a 2 segundos.

    4.4 El tiempo de respuesta del sistema para consultas a b