ensayo 6 (equipo 2) – el uso de lenguajes libres y controlados para la representación del...

6

Click here to load reader

Upload: reyna-lizet-ramirez-montes

Post on 27-Jul-2015

664 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Ensayo 6 (Equipo 2) – El uso de lenguajes libres y controlados para la representación del contenido de documentos

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO

FACULTAD DE FILOSOFÍA Y LETRAS

CENTRO UNIVERSITARIO DE INVESTIGACIONES

BIBLIOTECOLÓGICAS

PROGRAMA DE POSGRADO EN BIBLIOTECOLOGÍA Y

ESTUDIOS DE LA INFORMACIÓN

ENSAYO

EL USO DE LENGUAJES LIBRES Y CONTROLADOS PARA LA REPRESENTACIÓN DEL CONTENIDO DE DOCUMENTOS

Elaborado por:

Aarón Elías May Palma

María De Jesús Iracheta Carrasco

Perla Alejandra Orozco Rodríguez.

Olegario Márquez Bonilla

PROFESOR: MTRO. JORGE GÓMEZ BRISEÑO

Marzo de 2010

Page 2: Ensayo 6 (Equipo 2) – El uso de lenguajes libres y controlados para la representación del contenido de documentos

Análisis temático de los documentos

El tema de una obra se encuentra en todo el texto y su representación y uso con

fines de organización y recuperación documental implica la necesidad de sinterizarlo a

la brevedad de códigos de clasificación, o palabras que se emplearán como términos de

indización, o puntos de acceso en catálogos, bibliografías e índices.

La falta de objetividad que lleva a descripciones inexactas o incompletas en las

representaciones temáticas dificulta, si no es que impiden completamente, la re-

cuperación documental.

Lancaster (1996) afirma que la extensión del registro es el factor de mayor

importancia y no el tipo de vocabulario al momento de la recuperación de un ítem. Esto

es que en una búsqueda en un resumen expandido será probablemente más eficiente

en la recuperación del ítem que la indización exhaustiva, la cual será mejor que el

resumen breve. Esto no concierne la diferencia entre el uso de un tipo de vocabulario.

La especificidad con que se puede describir el contenido temático de un

documento también es un factor importante en el desempeño final de un sistema de

recuperación. A pesar de que Lancaster (1996) considera que el texto libre ofrece una

mayor especificidad por abarcar los conceptos propiamente vertidos en el documento,

esto puede ser objeto de debate, ya que una correcta aplicación del lenguaje controlado

ofrece un mejor nivel de precisión en los resultados.

Claro está que los puntos de acceso también juegan un papel importante en la

estrategia de recuperación. Cuanta mayor cantidad de ellos exista, habrá una mayor

probabilidad de recuperación, pero también aumenta la posibilidad de tener resultados

no relevantes al aumentar el horizonte de temas.

Las falsas asociaciones y las relaciones incorrectas entre términos también se

cuentan entre los posibles problemas de precisión que aparejan los sistemas de

recuperación mediante lenguaje libre, ya sea porque los términos que causan la

recuperación no guardan la relación esperada.

También hay que recordar que la indización realizada por los seres humanos

posee una cuota de subjetividad inherente al proceso intelectual de éstos, lo cual

también es un factor de distorsión al momento de representar el contenido de los

documentos.

Lancaster (1996) comenta que en el caso de los nuevos términos que aparecen

en títulos y resúmenes; el lenguaje natural es el preferido por el usuario especialista en

el tema o materia, en tanto que el lenguaje controlado lo será para el especialista en

Page 3: Ensayo 6 (Equipo 2) – El uso de lenguajes libres y controlados para la representación del contenido de documentos

información, pues domina las reglas que lo conforman. En medio de esta polémica,

intentaremos esquematizar las ventajas y desventajas de cada uno de los lenguajes a

fin de comprender mejor sus cualidades y limitantes.

Ventajas y desventajas del lenguaje controlado

El lenguaje controlado es técnicamente una lista de términos autorizados que

incluyen una estructura semántica destinada al control de sinónimos, con ella se logra

diferenciar homógrafos y reunir o vincular términos cuyo significado presenten una

relación más estrecha entre si y son utilizados por los profesionales de la información

para reunir bajo un mismo término paquetes de información con similitud de

información.

Taylor (2004) identifica tres tipos de lenguaje controlado:

Esquemas de clasificación bibliográfica

Listas de encabezamientos de materia

Tesauros.

Algunas ventajas que presenta el lenguaje controlado.

Es un proceso intelectual subjetivo que permite representar un tema con el mejor

término posible, reduciendo la diversidad de terminología y ayudando al usuario a

identificar todos los términos necesarios para realizar una búsqueda con mayor

precisión, ya que impone consistencia en la representación del contenido temático por

medio de una estructura jerárquica y de referencias de los documentos con una

reducción de tiempo favorable al usuario en la identificación de términos de búsqueda

apropiados. Se emplea el lenguaje controlado en las bibliotecas con la intención de

proporcionar mayor precisión y ahorro de tiempo a los usuarios.

Para ejemplificar el tema: se buscó el término “Biblia” en la “base de datos” de

Google y se encontraron aproximadamente 16, 900,000 paquetes de información

relacionados al término, de los cuales un alto porcentaje simplemente se reduce a

hacer mención de la palabra “biblia” en alguna parte del cuerpo del documento arro jado

sin tener relación propiamente con el tema.

Por otra parte el catálogo de la Biblioteca del Congreso de los Estados Unidos a

través de su sistema de encabezamientos LCSH arrojó la siguiente información acerca

del mismo término:

[ 8 ] 1 Bible. Manuscripts, Latin. Velislai Biblia picta. [from old LC subject headings

Page 4: Ensayo 6 (Equipo 2) – El uso de lenguajes libres y controlados para la representación del contenido de documentos

catalog]

[ 9 ] 1 Bible. N.T. Spa -- -- LC subject headings

[ 10 ] 1 Bible. O.T. Hebrew. Biblia Hebraica quinta. LC subject headings

[ 11 ] 9 Bible. O.T. Hebrew--Versions--Biblia Hebraica Stuttgartensia. LC subject headings

[ 12 ] 1 Bible. O.T. Hebrew--Versions--Biblia Hebraica Stuttgartensia--

Indexes. LC subject headings

[ 13 ] 1 P Pł ck --Illustrations. LC subject headings

[ 14 ] 1 Bible. Polish--Versions-- Pł ck LC subject headings

[ 15 ] 1 -- c c LC subject headings

16 Biblia de San Luis

LC subject headings

[ 17 ] 8 Biblia pauperum LC subject headings

[ 18 ] 5 Biblia pauperum. [from old catalog] LC subject headings

19 Biblia rica

LC subject headings

[ 20 ] 1 Biblia Sancti Petri Rodensis. [from old catalog] LC subject headings

Vemos como el porcentaje de información arrojada en ambas búsquedas es

impresionantemente diferente en relación a la cantidad de entradas que proporcionan y

el ahorro de tiempo que debería invertir el usuario en la valoración de los paquetes que

son los adecuados para su búsqueda específica.

Desventajas de lenguaje controlado.

La aparición de nuevos términos que aparecen en un vocabulario generalmente

tardan en adaptarse como lenguaje controlado; los costos por el procesamiento

intelectual utilizando términos controlados hecho por el profesional de la información

tiende a ser mas costoso; y, la preferencia de los usuarios a utilizar términos de

lenguaje no controlado debido a su falta de manejo de los términos controlados son

algunas desventajas que representa el uso de lenguaje controlado.

Ventajas y desventajas del uso de los lenguajes libres.

Cuando hablamos de procesamiento del lenguaje natural (NLP) nos referimos a

los vocablos extraídos del mismo documento que se está analizando, de ahí se toman

los términos para elaborar el registro del paquete de información que permitirá al

usuario su recuperación.

Page 5: Ensayo 6 (Equipo 2) – El uso de lenguajes libres y controlados para la representación del contenido de documentos

Estos lenguajes ayudan a interpretar la información de las necesidades de

información que los usuarios buscan, representan una gama completa de los

significados transmitidos en el documento y unifica todos los documentos según el

criterio de búsqueda del interesado. Utilizan palabras claves de los documentos que en

realidad ayudan a encontrar una cantidad considerable de referencias, muchas más que

si la búsqueda se realiza con vocabulario controlado.

La siguiente tabla nos muestra las ventajas y desventajas de este tipo de

lenguajes.

VENTAJAS DESVENTAJAS

Gran cantidad de palabras clave que permiten hacer búsquedas más extensas.

Con las palabras clave, no toda la información que se recupera es de importancia.

Resúmenes expandidos que proporcionan mayor número de puntos de acceso.

Dificultad de elegir las palabras clave debido a la utilización de términos que significan lo mismo.

En la medida que se agrega más texto, el ítem se vuelve más recuperable.

Menor precisión en la recuperación.

Proporciona mayor especificidad al posibilitar la recuperación a partir de nombres.

El tiempo empleado para seleccionar lo que realmente es importante para los usuarios es mayor.

Los nuevos términos aparecen antes que en los vocabularios controlados, por lo cual puede ser de mayor actualidad.

Falsas asociaciones, relaciones incorrectas entre términos.

El usuario no tiene que "adivinar" qué términos se emplearon para llegar a la información.

Tiende a ser más redundante.

Cuenta con la preferencia del usuario especialista en la materia.

Las búsquedas producen malos resultados en las búsquedas de conceptos genéricos.

Las búsquedas producen buenos resultados en el caso de conceptos particulares.

Es más barato que los lenguajes controlados.

Definitivamente, optar por este tipo de lenguaje dependerá de la decisión de las

unidades de información para ayudar a los usuarios a localizar los materiales que

necesitan ser recuperados por ellos.

Conclusiones.

El Usuario resulta ser el elemento fundamental para las bibliotecas, centros de

información, y por ende, de los profesionales en el campo de la bibliotecología y de la

información; porque alrededor de él han girado las polémicas en cuanto al uso de los

términos adecuados, (uso del lenguaje natural o controlado) para la indización o el

análisis temático que se debe realizar para la elaboración de una base de datos o el

Page 6: Ensayo 6 (Equipo 2) – El uso de lenguajes libres y controlados para la representación del contenido de documentos

catálogo que permita recuperar los diferentes paquetes de información que existen, los

cuales son demandados por los usuarios como necesarios.

Para ello se deben considerar los cuatro propósitos esenciales que nos plantea

Taylor (2004). Uno de esos propósitos es ahorrarle tiempo al usuario. Para lograrlo se

debe proporcionar una localización lógica de los paquetes de información; los cuales

deben estar colocados de acuerdo a la naturaleza similar; lo que finalmente

proporcionará el acceso a temas significativos de los paquetes de información.

La finalidad del uso de los lenguajes naturales, lenguajes controlados, o un

sistema híbrido, (en el que se consideren ambos como complementarios), es que el

usuario pueda encontrar todas las obras que la biblioteca puede ofrecer y recuperar la

información de un tema en particular que necesite o le interese. Por eso cobra

relevancia el estudio de estos temas.

Bibliografía:

Taylor, Arlene G. (2004),The Organization of Information / Arlene G. Taylor. Englewood, Colorado : Libraries Unlimited, 2nd, 2004, 417 p. (Library and Information Science Text Series). Capítulos 9 y 10.

Lancaster, Frederick Wilfrid. (1996), Indización y resúmenes : teoría y práctica / F. W.

Lancaster ; traducción de Elsa E. Barber. Buenos Aires : EB Publicaciones, 1996. xii, 337 p. Capítulos: 1-4; 10 y 13.

Soto, Susana. Los conflictos de la Clasificación. (En: Boletín Bibliotecológico de La Plata, 1981/82, (2) pp. 7-9)