topics maps y la indización de recursos electrónicos en la web

8
141 El profesional de la información, vol. 12, nº 2, marzo–abril 2003 Topics maps y la indización de recursos electrónicos en la web Por Ricardo Eíto Brun El problema del acceso a la información en internet HABLAR DE INTERNET NOS OBLIGA a hacer referen- cia a los inconvenientes relacio- nados con la dificultad de encon- trar y acceder a la información. Este problema se debe al carác- ter dinámico y al crecimiento ex- ponencial de la información dis- ponible. Frente a este problema se han planteado todo tipo de so- luciones, desde las encaminadas a crear “subconjuntos” de conte- nidos que acoten aquellos más relevantes a un área de conoci- miento específica, como son los portales verticales, hasta siste- mas que pretenden mejorar sus- tancialmente la forma en la que se organizan y se accede a los contenidos. La web semántica propuesta por Tim Berners-Lee, inventor del world wide web, constituye una de las principales iniciativas en la segunda línea de trabajo. Se plantea así una estrategia a largo plazo que (en caso de llegar a buen término) permitirá automatizar el tráfico de información en la Red. Este es un punto importante que necesitamos aclarar: la web se- mántica no tiene como objetivo di- Visualización de la información sobre un topic con Omnigator, de Ontopia. Esta vista muestra la información asociada al topic Aida. Se listan las ocurrencias (o documentos) que tratan sobre ese él y otros relacionados. En el ejemplo, Aida está relacionado con el topic Verdi. En esta relación, Verdi desempeña el rol Composed by.e.

Upload: maestria-bib-cs-informacion

Post on 21-Mar-2016

213 views

Category:

Documents


1 download

DESCRIPTION

Por Ricardo Eíto Brun El problema del acceso a la información en internet Hablar de internet nos obliga a hacer referencia a los inconvenientes relacionados con la dificultad de encontrar y acceder a la información. Este problema se debe al carácter dinámico y al crecimiento exponencial de la información disponible. Frente a este problema se han planteado todo tipo de soluciones, desde las encaminadas a crear “subconjuntos” de contenidos que acoten aquellos más relevantes a un área de conocimiento específica, como son los portales verticales, hasta sistemas que pretenden mejorar sustancialmente la forma en la que se organizan y se accede a los contenidos.

TRANSCRIPT

141El profesional de la información, vol. 12, nº 2, marzo–abril 2003

Topics maps y la indización de recursoselectrónicos en la web

Por Ricardo Eíto Brun

El problema del acceso ala información en

internet

HABLAR DE INTERNETNOS OBLIGA a hacer referen-cia a los inconvenientes relacio-nados con la dificultad de encon-trar y acceder a la información.Este problema se debe al carác-ter dinámico y al crecimiento ex-ponencial de la información dis-ponible. Frente a este problemase han planteado todo tipo de so-luciones, desde las encaminadasa crear “subconjuntos” de conte-nidos que acoten aquellos másrelevantes a un área de conoci-miento específica, como son losportales verticales, hasta siste-mas que pretenden mejorar sus-tancialmente la forma en la quese organizan y se accede a loscontenidos.

La web semántica propuestapor Tim Berners-Lee, inventor

del world wide web, constituyeuna de las principales iniciativas enla segunda línea de trabajo. Seplantea así una estrategia a largoplazo que (en caso de llegar a buen

término) permitirá automatizar eltráfico de información en la Red.Este es un punto importante quenecesitamos aclarar: la web se-mántica no tiene como objetivo di-

Visualización de la información sobre un topic con Omnigator, de Ontopia. Esta vista muestra lainformación asociada al topic Aida. Se listan las ocurrencias (o documentos) que tratan sobreese él y otros relacionados. En el ejemplo, Aida está relacionado con el topic Verdi. En estarelación, Verdi desempeña el rol Composed by.e.

El profesional de la información, vol. 12, nº 2, marzo–abril 2003142

Ricardo Eíto Brun

recto mejorar la forma en la que laspersonas usamos la Red y facilitar-nos el acceso a la información, si-no que se centra en hacer posibleuna recuperación más efectiva dedatos e información en el diálogoentre ordenadores. En una situa-ción ideal, permitirá a un ordena-dor situado en la web interrogar yobtener información de otros orde-nadores conectados. Entre las má-quinas que participen en este diálo-go se podrá establecer una interac-ción que permitirá acotar, precisary comparar de forma automática lainformación recuperada para satis-facer un objetivo previamente es-pecificado.

Este planteamiento beneficiaráa los usuarios del sistema de infor-mación basado en la web semánti-ca, aunque no será una personaquien interactúe directamente conla web semántica, sino que estafunción estará delegada en un or-denador y en un software determi-nado. Así, los beneficiarios direc-tos serán los llamados “agentes”, oaplicaciones informáticas que ac-túan en representación de un usua-rio final de forma independiente.Como ejemplo de las herramientasque facilitarán la adopción de laweb semántica se suelen citar losagentes programados para buscarlas mejores ofertas y completar unproceso de compra sin necesidadde que participe ninguna persona,o aquellos capaces de interrogarbases de datos, recuperar informa-ción relevante y filtrar de forma in-teligente los contenidos.

Web semántica,metadatos y rdf

Las bases de la web semánticason la utilización de metadatos y ellenguaje de marcas rdf (resourcedescription framework). Los meta-datos (definidos habitualmente co-mo “información sobre la informa-ción”) son propiedades identifica-tivas o descriptivas que podemosasociar a un recurso de informa-

Fragmento de un topic map codificado con XTM.Extraído del texto de la especificación XTM

<topic id=”hamlet”><instanceOf><topicRef xlink:href=”#play”/></instanceOf><baseName>

<baseNameString>Hamlet, Prince of Denmark</baseNameString></baseName><occurrence>

<instanceOf><topicRef xlink:href=”#plain-text-format”/></instanceOf><resourceRef

xlink:href=”<ftp://www.gutenberg.org/pub/gutenberg/etext97/1ws2610.txt>”/></occurrence>

</topic>

<topic id=”tempest”><instanceOf><topicRef xlink:href=”#play”/></instanceOf><baseName>

<baseNameString>The tempest</baseNameString></baseName><occurrence>

<instanceOf><topicRef xlink:href=”#plain-text-format”/></instanceOf><resourceRef

xlink:href=”<ftp://www.gutenberg.org/pub/gutenberg/etext97/1ws4110.txt>”/></occurrence>

</topic>

Los elementos <topic> definen dos topics: el primero para laobra Hamlet, y el segundo para la obra The tempest. Cada uno ten-drá un identificador único. El elemento baseName recoge el nombreo designación del topic. El elemento ocurrence contiene un hipervín-culo a un documento en formato electrónico relacionado con el to-pic en cuestión.

<association><instanceOf><topicRef xlink:href=”#written-by”/></instanceOf><member>

<roleSpec><topicRef xlink:href=”#author”/></roleSpec><topicRef xlink:href=”#shakespeare”/>

</member><member>

<roleSpec><topicRef xlink:href=”#work”/></roleSpec><topicRef xlink:href=”#hamlet”/>

</member></association>

El elemento <association> establece una asociación entre dos to-pics definidos previamente en el topic map. Para cada uno de los dosrelacionados tendremos un elemento <member>. El elemento <ro-leSpec> indica la función o role del topic en la asociación. El elemen-to <topicRef> hace referencia al <topic> correspondiente del topicque participa en la asociación.

143El profesional de la información, vol. 12, nº 2, marzo–abril 2003

Topics maps y la indización de recursos electrónicos en la web

ción. Normalmente, se expresanmediante pares “atributo -valor”.Dublin Core es el sistema de meta-datos más conocido entre los apli-cados en la descripción de recursosdisponibles en la web.

Junto a este concepto, el se-gundo pilar de la web semántica esel lenguaje rdf, que es una aplica-ción xml que indica cómo debe-mos codificar los metadatos aso-ciados a un recurso. La descripcióndel recurso será un conjunto demetadatos expresados en xml. Estoresultará en un documento fácil-mente procesable por cualquierprograma informático.

A partir de las descripcionesprecisas de los recursos de infor-mación codificadas mediante rdf,un agente será capaz de recuperarinformación relevante y precisa de

distintos repositorios de datos ac-cesibles a través de la web. Losmetadatos asociados a los recursosle permitirán comparar recursoscon requerimientos de búsqueda yrealizar cualquier tipo de procesa-miento.

A pesar de lo novedoso quepueda resultar este planteamiento,detrás del concepto de la web se-mántica se encuentran dos eviden-cias que no son nuevas para losprofesionales de la documenta-ción:

—la necesidad de aplicar siste-mas de ordenación en la descrip-ción de recursos y en la formaliza-ción de las necesidades de infor-mación de los usuarios del sistema,y

—el hecho de que las descrip-ciones precisas de los recursos ha-cen posible la discriminación deinformación relevante.

Los topic maps

Una iniciativa estrechamenterelacionada con la web semántica,y que se suele relacionar con elmodelo rdf y los sistemas de meta-datos para la web son los topicmaps. Para este término no existe

una traducción comúnmente acep-tada en castellano, por lo que eneste texto utilizaremos el términoinglés.

Los topic maps (al igual que ellenguaje rdf) constituyen una he-rramienta que nos facilitará el ac-ceso y la recuperación de informa-ción relevante en la web. Al igualque rdf, toman como punto de par-tida la necesidad de describir deforma precisa los recursos de infor-mación.

Otra similitud es que tanto lostopic maps como los documentosrdf actúan como mediadores entreun repositorio de información y losusuarios del sistema. Es decir, am-bos sirven de interfaz de acceso alrepositorio, de forma similar a co-mo una lista de encabezamiento dematerias sirve de mediación entreel usuario de un opac y las descrip-ciones bibliográficas del catálogode una biblioteca.

Sin embargo, entre los topicmaps y el lenguaje rdf existen im-portantes diferencias que se en-cuentran en el enfoque planteadopara solucionar el problema de larecuperación de información, en elmotivo por los que se originaron y

FacetasLa norma ISO 13250 in-

cluyó este concepto, las cua-les consisten en propiedadesque podemos utilizar paradescribir los recursos infor-mativos u ocurrencias a lasque se hace referencia desdeel topic map. Las facetas en símismas pueden entendersecomo metadatos que asigna-mos a las ocurrencias y se ex-presarán mediante pares“atributo-valor”. Si bien fre-cen una mayor capacidad pararepresentar y facilitar la recu-peración de información, en laespecificación XTM se evitósu uso y no fueron incluidas.

Sitios web de interéshttp://www.ontopia.com

http://www.infoloom.com

http://www.mondeca.com

http://www.empolis.com

http://www.topicmaps.org

http://www.topicmaps.net

Demostración online de la aplicación ITM de Mondeca. Muestra la navegación a través de untopic map.

El profesional de la información, vol. 12, nº 2, marzo–abril 2003144

Ricardo Eíto Brun

en el modelo de interacción que seplantea entre los repositorios de in-formación y sus usuarios finales.

Origen de los topic maps

Surgen a principios de la déca-da de los 90 con independencia dela web. Se plantearon en el ámbitode la documentación técnica desoftware para facilitar la creación yel intercambio de los índices que seincluyen al final de los libros y ma-nuales.

Estos índices contienen un lis-tado de términos ordenados alfabé-ticamente y relaciones cruzadasentre ellos, y tienen como objetivolocalizar información puntual entrelas páginas de los libros impresos.El objetivo inicial era permitir elintercambio y la fusión de índicescreados por diferentes autores, deforma que se garantizase la cohe-rencia de la indización y facilitar laintegración de documentación téc-nica procedente de distintos fabri-cantes.

Pero el modelo de los índicesse puede aplicar fácilmente a co-lecciones de documentos electróni-cos y a cualquier otro repositoriode información. De hecho, es posi-

ble establecer equivalencias entreel índice de un libro y una base dedatos documental indizada me-diante un thesaurus: los términosdel índice equivaldrían a los delthesaurus y los párrafos del libro secorresponderían con los registrosde la base de datos documental. Yesto es lo que ha sucedido con lostopic maps.

Los encargados de redactar unaespecificación para ellos plantea-ron un modelo teórico junto con unmecanismo de codificación o se-rialización que utilizaba sgml. En1999, los topic maps se publicaroncomo norma ISO 13250 dentro delconjunto de estándares Documentdescription and processing lan-guages del que forma parte el len-guaje sgml.

Posteriormente, un grupo deeditores de la norma migraron ladtd de sgml a xml, para facilitar laintegración de los topic maps enlas líneas de evolución de la web.El resultado de este trabajo fue laespecificación XTM (xml topicmaps). El 19 de mayo de 2002 sepublicó una versión revisada de lanorma ISO 13250 en la que se in-cluyó (como parte del estándar) larepresentación de topic maps conXTM.

El modelo teórico

Un topic map equivaldría a uníndice creado para una colecciónde recursos disponibles en formatoelectrónico. En este índice, conta-ríamos con:

Ejemplo de un topic map generado con la aplicación de InfoLoom. Consiste en un índice parauna colección de documentos en formato electrónico (actas de congreso).

El sistema k42 de Empolis, ofrece una visualización gráfica de los topic maps.

145El profesional de la información, vol. 12, nº 2, marzo–abril 2003

Topics maps y la indización de recursos electrónicos en la web

—Una serie de topics (temas omaterias), que se utilizarán paradescribir el contenido de los recur-sos y facilitar su recuperación.

—Relaciones que se estable-cen entre estos topics.

—Una serie de recursos queserán indizados o descritos me-diante los topics anteriores. Esta-blecer una relación entre un recur-sos y un topic equivale a decir queel recurso trata de, o contiene in-formación sobre ese topic.

En este sentido, un topic mapsería similar a un catálogo de ma-terias en el que contamos con:

—Un conjunto de encabeza-mientos que podemos utilizar co-mo descriptores.

—Unas relaciones explícitasentre estos encabezamientos: porejemplo, los vínculos que unenaquellos que están relacionados.

—Las referencias a los libros alos que se han asignado las mate-rias.

En la norma ISO 13250 se uti-lizan los términos topics para refe-rirse a las materias o temas, ocu-

rrencias, para referirse a los recur-sos o documentos y asociacionespara las relaciones que se estable-cen entre topics.

Ventajas del uso de topicmaps

Su utilización como herra-mienta de indización y recupera-ción de información conlleva lasmismas ventajas que encontramosen la indización controlada me-diante thesaurus o listas de encabe-zamientos:

—La asignación de descripto-res aumenta la relevancia y la per-tinencia del proceso de recupera-ción frente a los modelos basados

en la indización del texto completode los documentos.

—La existencia de relacionesentre topics permite al usuario re-correr la estructura creada por estasrelaciones y localizar otros topicsque pueden ser relevantes y que sepueden utilizar como criterios debúsqueda.

—Los encargados de indizar ydescribir los recursos pueden re-presentar con una mayor precisiónel conocimiento implícito en losdocumentos mediante la asigna-

ción de topics y la creación de aso-ciaciones entre éstos.

—Finalmente, señalaremos suprincipal ventaja: la posibilidad decrear topics y asociaciones entreellos con independencia de que di-cha relación se haya establecido enel recurso de información que seestá indizando. En este sentido, lostopic maps se comportan de formasimilar a un thesaurus (en el quelos vínculos se establecen a priori,con independencia del contenidode los documentos indizados) perocon la ventaja adicional de poderutilizar un número ilimitado de re-laciones entre topics, más allá delas relaciones comunes: términogenérico, específico o relacionado.

Elementos básicos de untopic map: topics,

ocurrencias yasociaciones

Un topic se define como “la re-presentación de una entidad sobrela que se quiere afirmar algo”. Enla especificación se utiliza el térmi-no subject para referirse al objeto oentidad de la que se quiere afirmaralgo, y topic para hacer referenciaa su representación en un topicmap.

La diferenciación entre topics ysubjects podríamos compararla conla que se hace (en el ámbito de laterminología) entre concepto y de-nominación. Siguiendo a Arntz yPicht (1995, p. 58) un concepto se-ría “una unidad de pensamiento queabarca las características comunesasignadas a objetos” o la idea en sí,y la denominación “la designación,formada por un mínimo de una pa-labra, de un concepto”.

Los topics tienen 3 característi-cas: nombres, ocurrencias y roles.Los primeros permiten hacer refe-rencia a un topic utilizando una ca-dena de caracteres. Un mismo to-pic puede tener más de un nombre,con lo que se resuelven los proble-mas relacionados con la sinonimia,el multi-idioma y con las formas

Visualización alternativa de un topic map en el sistema k42 de Empolis

El profesional de la información, vol. 12, nº 2, marzo–abril 2003146

Ricardo Eíto Brun

autorizadas o no de un mismo tér-mino. Por ejemplo, un topic referi-do al autor Miguel de Cervantes,podría tener un número ilimitadode nombres con los que hacerle re-ferencia: “Cervantes, Miguel de”,“Cervantes Saavedra, Miguel de”o “el manco de Lepanto”.

1. Ocurrencias. Relación en-tre topics y documentos. La se-gunda característica de un topicson las ocurrencias, es decir, los re-cursos informativos o documentosque son relevantes para él. Dichode otra forma, los recursos infor-

mativos a los que se ha asignadoese topic. Continuando con elejemplo anterior, todos los artícu-los o textos en los que se trate deMiguel de Cervantes, serían ocu-rrencias de este topic.

El hecho de que las ocurrenciasse incluyan como una característi-cas de los topics puede resultarconfusa y dar la sensación de quesu asignación debe hacerse en elmomento de crear los topics. No esasí, los topic maps ofrecen la flexi-bilidad característica de cualquiersistema de indización y no es pre-ciso establecer relaciones entreellos y ocurrencias a priori. Sim-plemente, una vez se han asociado,

esa ocurrencia se considerará unacaracterística o propiedad de dichotopic.

2. Asociaciones: relacionesentre topics. Finalmente, un topicmap puede contener relaciones es-tablecidas entre topics. Así, los to-pic maps ofrecen un mecanismo derepresentación de conocimiento si-milar al de las redes semánticas.Continuando con el ejemplo delapartado anterior, “Miguel de Cer-vantes” podría estar relacionadocon los relativos a la Batalla de Le-panto o a la novela La galatea. Es-

tas relaciones entre topics se deno-minan asociaciones y tienen unnombre. Además, cada uno de lostopics que participan en una aso-ciación desempeña una función orole.

Por ejemplo, la asociación en-tre “Miguel de Cervantes” y “Lagalatea” se podría llamar “au-tor_escribe_libro”. En esta asocia-ción, “Miguel de Cervantes” de-sempeñaría la función de autor y“La Galatea” tendría la función deobra_literaria.

Debemos destacar la posibili-dad de asignar cualquier nombretanto a las asociaciones como a losroles. A priori esto es una ventaja

ya que nos ofrece una mayor capa-cidad expresiva. Como contraparti-da, acarrea la necesidad de norma-lizar los nombres que se deben uti-lizar para cada tipo de asociación yrole. Esta necesidad relaciona a lostopic maps con las ontologías y conlas listas de términos autorizados.

Tipos de topics yocurrencias

La capacidad expresiva de lostopic maps se completa con la po-sibilidad de clasificar a los topics ya las ocurrencias. Así, dependien-do del contexto o del área de cono-cimiento para la cual estemos cre-ando el topic map, podremos clasi-ficar o agrupar los topics en distin-tos grupos; por ejemplo: autores,obras literarias, periodo artístico,novelas, poemas, etc.

La misma agrupación puedehacerse con las ocurrencias y así,éstas, podrán ser de distintos tipos:artículos, archivos multimedia,menciones, etc. En este caso tam-bién disponemos de libertad abso-luta para definir el sistema de cla-sificación que vayamos a utilizarpara agrupar topics y ocurrencias,y adaptarlo a la naturaleza de loscontenidos que vayamos a indizar.

El problema de laidentidad

Uno de los inconvenientes queresuelve la indización controlada(thesauri, listas de encabezamien-tos o listas de autoridades) es ase-gurar que siempre se haga referen-cia a un mismo tema, se utilice elmismo descriptor. Es decir, debe-mos asegurar que siempre que ha-cemos referencia a algo, lo hace-mos de la misma forma.

¿Cómo solucionamos el pro-blema que surge cuando dos listasde autoridades utilizan entradas onombres diferentes para referirseal mismo autor? En ambos casos setrata del mismo, de una misma per-sona con una única identidad. Sinembargo, cada lista de autoridades

Topic map codificado en XTM con un editor xml

147El profesional de la información, vol. 12, nº 2, marzo–abril 2003

Topics maps y la indización de recursos electrónicos en la web

puede utilizar dos formas diferen-tes. En un proceso automatizado,un ordenador no sería capaz de de-ducir que son equivalentes.

En la especificación topicmaps se incorpora un mecanismopara solucionar este problema. Lasolución exige que exista un recur-so con un nombre o uri (uniformresource identifier) único, al quedistintos autores deberán hacer re-ferencia desde sus topic maps. Es-to equivaldría a tener un listado deautoridades en línea, en el cual ca-da entrada tendrá un único uri.

En la especificación se utilizael término subject indicator parareferirse a estos recursos especia-les. Se definen como “un recursoque ofrece una indicación no ambi-gua de la identidad de un sujeto”.

Esta solución (técnicamenteacertada), trae consigo la necesi-dad y la ardua tarea de publicar ymantener listados de materias, per-sonas, nombres de lugares, etc. au-torizados, así como el hecho deque los autores de topic maps los

acepten como referencia, y esta-blezcan la equivalencia entre sustopics y las “formas autorizadas”.Una tarea nada trivial, que requie-re un elevado grado de consenso yque difícilmente se puede conse-guir a medio plazo.

Serialización eintercambio de topics

maps

En los apartados anteriores seha descrito el modelo planteadopor los topic maps para la indiza-

ción de contenidos. La especifica-ción topic maps se completa conun mecanismo de serialización,que se refiere a cómo debemos co-dificar y escribir un topic map uti-lizando un formato legible y proce-sable por un ordenador. En estesentido, se han propuesto dos alter-nativas. Inicialmente, la normaISO 13250 definió una dtd sgmlpara su codificación, intercambio yprocesamiento. Posteriormente, lageneralización de xml hizo que seadaptase la dtd inicial a este len-guaje. El resultado de este trabajofue la especificación XTM, que sepublicó en febrero de 2001. A suvez, la norma ISO 13250 fue revi-sada para incluir (como parte delestándar) la versión xml de la dtd.

Existen diferencias entre lasversiones sgml y xml de la dtd. En-tre ellas encontramos la elimina-ción del concepto de facetas en laversión xml, y cambios en el nom-bre de algunos elementos.

Estándares relacionados:Tmql y Tmcl

Tanto la norma ISO 13250 co-mo la especificación XTM se cen-tran en la definición conceptual delos topic maps y en su representa-ción con lenguajes de marcas. Paracompletar la revisión de los topicmaps, debemos hacer referencia ados estándares que actualmente seencuentran en fase de desarrollo.Se trata de las especificaciones

Un topic map contiene topics y asociaciones entre ellos. Este gráfico muestra una serie detopics representados mediante óvalos (y las asociaciones que se pueden establecer entre sí,

representadas mediante líneas). Este topic map recogería parte del contenido publicado en unanoticia de prensa.

El topic map del ejemplo anterior se completaría con las ocurrencias asociadas a los topics. Esdecir, las referencias a los documentos que tratan sobre cada uno de los topics que se hanidentificado. En este diagrama, representamos las ocurrencias mediante rectángulos. Cada

ocurrencia tiene su url. Una línea discontinua une a las ocurrencias con los topics para los queson relevantes.

El profesional de la información, vol. 12, nº 2, marzo–abril 2003148

Ricardo Eíto Brun

Tmql (Topic maps query language)y Tmcl (Topic maps constraint lan-guage).

El propósito de Tmql es definirun lenguaje para interrogar el con-tenido de los topic maps. La espe-cificación Tmcl permitirá definirrestricciones sobre el contenidoexpresado en un topic map. Sepuede consultar el estado actual deestas especificaciones en el sitioweb:http://www.isotopicmaps.org

Aplicaciones

A día de hoy contamos con unescaso número de aplicaciones di-señadas para facilitar la creación,visualización e intercambio de to-pic maps. Si bien son poco conoci-das, y podemos juzgar que con es-casa repercusión en los ámbitos detrabajo, nos sirven como ejemplodel potencial que ofrecen en la re-cuperación y organización de la in-formación. Ontopia, Mondeca,Empolis e Infoloom son 4 ejemplosde empresas que comercializan he-rramientas basadas en este para-digma. Junto a estas iniciativas,también encontramos otras no co-merciales, publicadas como soft-ware libre: SemanText, TM4J o Ne-xist.

Las aplicaciones comercializa-das por Ontopia, Mondeca, Empo-lis e Infoloom comparten caracte-rísticas y funcionalidades. En to-dos los casos los topic maps se uti-lizan como una interfaz para indi-zar, interrogar y navegar reposito-rios de información. Quizás lasprincipales diferencias las encon-tramos en las capacidades gráficaspara visualizar la información ex-traída.

Conclusiones

La viabilidad del modelo plan-teado por los topic maps y su rela-ción con la especificación rdf esuno de los temas que más discu-sión e intercambio de ideas ha sus-citado. Distintos autores han seña-

lado las diferencias entre estos dosmodelos, y al mismo tiempo la ne-cesidad de compaginar ambas so-luciones para aunar esfuerzos en lacarrera hacia la web semántica.

Sin embargo, los dos modelosparten de un enfoque diferente: sirdf trata de asignar metadatos a re-cursos en forma de pares atributo-valor, los topic maps pretenden re-presentar el conocimiento median-te conceptos o topics y las relacio-nes que se establecen entre éstos.

Por otra parte, si rdf es un sis-tema ideado para ser usado poraplicaciones informáticas y agen-tes, los topic maps están pensadospara facilitar la navegación de am-plios repositorios de informaciónen formato electrónico.

Al margen de estas diferencias,y de la posibilidad de plantear dis-tintos mecanismos de codificacióny transferencia de metadatos, elprincipal problema que debenafrontar los topic maps se encuen-tra en la necesidad de estandarizarlos nombres que asignamos a losdistintos topics y a las asociacionesque se pueden establecer entreellos. Si queremos que este sistemasea aplicable y resulte útil en la re-cuperación de información, se de-be implantar un nivel mínimo decontrol del vocabulario. En estesentido, el desarrollo de terminolo-gías, ontologías, y el tradicionalanálisis de facetas resultan clavespara permitir que esta propuesta sepueda aplicar para solucionar pro-blemas reales.

El segundo problema que seplantea deriva de los costes asocia-dos al control del vocabulario y alanálisis documental. Es tentadorcuestionarnos si el esfuerzo que su-pone la creación de topic maps re-almente compensa, y si las venta-jas que obtendremos de su uso su-peran a las de otras propuestas ba-sadas en la indización del textocompleto de los documentos dele-gada a un programa informático.

Sin embargo, todo problematrae consigo una oportunidad. Eneste caso, se abre una importante yprometedora línea de trabajo rela-cionada con el procesamiento dellenguaje natural, y que tiene comoobjetivo automatizar la extracciónde términos y de las relaciones quese pueden establecer entre ellos.Las aplicaciones disponibles a díade hoy para la gestión de topicmaps resuelven importantes pro-blemas relacionados con su visua-lización, la navegación de estos“espacios informativos” y su trans-ferencia y validación. Sin embar-go, no resuelven el principal incon-veniente con el que nos encontra-mos al tratar de aplicar esta técni-ca: los elevados costes que suponela indización de los documentosutilizando lenguajes controlados.

Bibliografía

Arntz, Reiner; Picht, Heribert. Introduccióna la terminología. Madrid: Fundación GermánSánchez Ruipérez, 1995. 381 p. Isbn 84-86168-95-3.

Berners-Lee, Tim. Tejiendo la Red: el inven-tor del world wide web nos descubre su origen.Madrid: Siglo XXI de España, 2000. 237 p.Isbn 84-323-1040-9.

Fensel, Dieter. Ontologies: a silver bullet forknowledge management and electronic com-merce. Berlin [etc.]: Springer, 2001. 137 p.Isbn 3-540-41602-1.

Hjelm, Johan. Creating the semantic web withrdf. New York [etc.]: Wiley Computer Publis-hing, 2001. 277 p. Isbn 0-471-40259-1.

ISO/IEC 13250 Topic maps: information tech-nology-document description and markup lan-guages. 2ª ed., 19 de mayo de 2002.

http://www.y12.doe.gov/sgml/sc34/document/0129.pdf

Pepper, Steve. The TAO of topic maps: findingthe way in the age of the infoglut. Ontopia.

http://www.ontopia.net

Professional xml meta data. Birmingham:Wrox, 2001. 567 p. Isbn 1861004516.

Xml topic maps: creating and using topic mapsfor the web. Jack Park, ed. Boston [etc.]: Ad-dison-Wesley, 2003. 604 p. Isbn 0-201-74960-2.

Xml Topic Maps (XTM) 1.0.

http://www.topicmaps.org/xtm/index.html

Ricardo Eíto Brun.

[email protected]