el análisis del discurso: hacia sistemas expertos de recuperación informativa
DESCRIPTION
El análisis del discurso como método para la elaboración de estructuras conceptuales que alimenten sistemas de organización del conocimiento para la recuperación de información especializada dentro de un dominio temático concreto.TRANSCRIPT
[Escribir el nombre de la compañía] | ¡Error! No hay texto con el estilo especificado en el documento.
1
qwertyuiopasdfghjklzxcvbnmqwerty
uiopasdfghjklzxcvbnmqwertyuiopasd
fghjklzxcvbnmqwertyuiopasdfghjklzx
cvbnmqwertyuiopasdfghjklzxcvbnmq
wertyuiopasdfghjklzxcvbnmqwertyui
opasdfghjklzxcvbnmqwertyuiopasdfg
hjklzxcvbnmqwertyuiopasdfghjklzxc
vbnmqwertyuiopasdfghjklzxcvbnmq
wertyuiopasdfghjklzxcvbnmqwertyui
opasdfghjklzxcvbnmqwertyuiopasdfg
hjklzxcvbnmqwertyuiopasdfghjklzxc
vbnmqwertyuiopasdfghjklzxcvbnmq
wertyuiopasdfghjklzxcvbnmqwertyui
opasdfghjklzxcvbnmqwertyuiopasdfg
hjklzxcvbnmrtyuiopasdfghjklzxcvbn
mqwertyuiopasdfghjklzxcvbnmqwert
yuiopasdfghjklzxcvbnmqwertyuiopas
dfghjklzxcvbnmqwertyuiopasdfghjklz
El análisis del discurso: hacia sistemas expertos de recuperación informativa
El análisis del discurso como método para la elaboración de estructuras conceptuales que
alimenten sistemas de organización del conocimiento para la recuperación de información especializada dentro de un dominio temático concreto
Carolina Callejo Lavado
Representación y organización conceptuales del conocimiento para la recuperación de la información.
Máster de Información y comunicación científica de la Universidad de Granada (UGR), curso 2014-2015.
2
Índice
1. Introducción .............................................................................................................................................................................3
2. Fundamentos teóricos del método: análisis de dominio en el paradigma socio-cognitivo ..................4
3. Objetivos del método: un modelo metodológico para la construcción de estructuras conceptuales especializadas .........................................................................................................................................................................7
4. Proceso de construcción de estructuras conceptuales mediante el análisis del discurso ....................8
5. Representación del usuario en la estructura conceptual .................................................................................. 10
6. Conclusiones: hacia sistemas expertos de recuperación informativa ......................................................... 11
7. Bibliografía ............................................................................................................................................................................. 14
3
1. Introducción
La organización y representación del conocimiento humano constituye una tradicional vía
de investigación que se enmarca en el campo de estudio de la Organización del
Conocimiento (OC o KO, por sus siglas en inglés). Desde que el hombre comenzó a registrar
la información empírica (aquella procedente de la experiencia percibida a través de los
sentidos) se ha realizado un esfuerzo continuo por representar y organizar ese
conocimiento para hacerlo accesible. Me refiero a la actividad académico-investigadora en
la organización del conocimiento para la Recuperación de Información (RI o IR, por sus
siglas en inglés), un dominio de estudio inserto en el ámbito de las Ciencias de la
Información y la Documentación (LIS, por sus siglas en inglés).
En este contexto teórico, diferentes paradigmas científicos tratan de definir la forma en
que el conocimiento humano tiene que ser representado y organizado para servir a su
recuperación informativa por parte de los usuarios interesados. La organización del
conocimiento es la base para adquirir nuevo conocimiento. Se deduce, por tanto, que esta
tarea es fundamental para la actividad investigadora, el avance de la ciencia y, por ende, el
desarrollo humano y social1.
Pero trasladar una entidad abstracta como lo es el conocimiento a algo concreto y hacerlo
accesible es una tarea difícil. Es aquí cuando entran en juego los Sistemas de Organización
del Conocimiento (SOC o KOS, por sus siglas en inglés), desarrollados con el objetivo de
estructurar y organizar formalmente el conocimiento humano.
Los sistemas de organización del conocimiento integran una serie de tecnologías
que ayudan a crear, gestionar y visualizar modelos que muestren una
perspectiva simplificada de los conceptos que forman determinado dominio y de
la estructura semántica subyacente. (Sánchez-Cuadrado, 2009)
Los sistemas de organización del conocimiento son propuestas para la
representación y organización del conocimiento en una determinada disciplina o
temática o bien propuestas universales con la finalidad de recuperar la
información de un determinado sistema. (López-Huertas, 2015: diapositiva 11)
Por tanto, el campo teórico de la organización del conocimiento encuentra su aplicación
práctica en el desarrollo de sistemas de organización del conocimiento tales como
ontologías, tesauros, encabezados de materia, clasificaciones… que pueden ser de dominio
general o especializado. Y estos sistemas constituyen la base de conocimiento de los
Sistemas de Recuperación de Información (SRI), tales como directorios, navegadores,
sistemas de búsqueda de respuestas (QA, por sus siglas en inglés), etc. De esta manera, “los
productos teóricos son las reglas para descubrir la ordenación natural del conocimiento o
para imponer una secuencia útil en el conocimiento descubierto” (Smiraglia, 2012).
1 La actividad científico-investigadora es un proceso acumulativo de obtención de conocimiento en el que el acceso a los resultados de investigación previos es vital. Pero la capacidad de recuperación informativa es también una base fundamental para el desarrollo social, no solo porque éste sea inherente al desarrollo científico, sino también porque sociedades más y mejor informadas se traduce en sociedades más evolucionadas.
4
Pero ¿cómo representar el conocimiento y organizarlo de forma que sea accesible por parte
del usuario? Primero, mediante la representación terminológica y conceptual del dominio
(lenguaje especializado y descripción de los conceptos que caracterizan el dominio) que da
como resultado un corpus de conocimiento del dominio; segundo, mediante la organización
de este último, a través de la ordenación formal de los conceptos que definen el dominio en
una determinada estructura y el establecimiento de las relaciones semánticas entre los
conceptos que representan el dominio, lo que se traduce en una estructura conceptual del
dominio.
El objetivo de este trabajo es presentar las virtudes del análisis del discurso como método
para la elaboración de estructuras conceptuales que alimenten sistemas de organización
del conocimiento para la recuperación de información especializada dentro de un dominio
temático concreto. En otras palabras, defender que el análisis del discurso es un método
eficaz para representar y organizar el conocimiento de un dominio concreto de forma que
sirva al desarrollo de sistemas expertos de recuperación de información.
A partir de la revisión bibliográfica se describen los fundamentos teóricos y objetivos del
método, se explica el proceso de construcción de estructuras conceptuales mediante el
análisis del discurso, se realizan propuestas específicas para incorporar la representación
del usuario a la estructura conceptual resultante y se explica por qué el análisis del discurso
es un prometedor modelo metodológico para la elaboración de estructuras conceptuales
que alimenten sistemas de organización del conocimiento para la recuperación de
información especializada.
2. Fundamentos teóricos del método: análisis de dominio en el
paradigma socio-cognitivo
El análisis del discurso es un método alternativo a los enfoques tradicionales y dominantes
en el ámbito de la organización del conocimiento para la recuperación de información.
Estos enfoques han evolucionado desde un paradigma físico (modelo objetivo) de la
organización del conocimiento, hacia un paradigma cognitivo (modelo subjetivo) e incluso
socio-cognitivo (constructivista).
En el primero, la elaboración de las estructuras conceptuales se sustenta exclusivamente en
la representación del conocimiento objetivo de los documentos (los textos son la base del
diseño y construcción de las estructuras) sin tener en cuenta a los usuarios que recuperarán
la información, con las limitaciones y dificultades que esto supone para responder al
objetivo de los sistemas recuperación de información: proporcionar al usuario una
respuesta relevante a su consulta.
El enfoque cognitivo o paradigma “orientado por el usuario”, que comenzó a ganar
popularidad a partir de los años 70, introduce al usuario como novedad dando lugar a una
organización del conocimiento más cercana al usuario final de los sistemas de recuperación
informativa y basada en estudios empíricos de los usuarios (Hjørland, 2008: 13). En este
5
modelo los textos son solo una de las bases para la elaboración de estructuras
conceptuales, que se completa con el usuario como segundo pilar básico de la misma.
Por último, el paradigma socio-cognitivo introduce, además de los textos y los usuarios, las
influencias de su esfera socio-laboral como elemento activo del modelo, que “evolucionó a
partir de la corriente cognitiva hacia el ámbito de lo social” y “es una de las últimas grandes
corrientes de pensamiento” en el campo de la organización del conocimiento (López-
Huertas, 2015: diapositiva 38).
En cualquiera de los casos, el proceso de representación y organización conceptuales del
conocimiento se fundamenta en la teoría del concepto que algunos sostienen que es el
elemento más básico o primario en el universo del conocimiento (Van den Heuvel;
Smiraglia, 2010; Szostak, 2011 en Smiraglia, 2012). El concepto es aquí entendido como una
unidad de conocimiento que comprende expresiones verificables y necesarias sobre el
referente, de manera que se convierte en la expresión relevante y representativa de un
determinado dominio a través de la definición de los conceptos que lo integran y de las
relaciones existentes entre los mismos.
Los conceptos poseen una serie de características que se derivan de su referente y que se
identifican con las categorías potenciales (cualidades de los conceptos) para representar el
conocimiento de un dominio temático. De esta manera, las estructuras conceptuales
resultantes del proceso de representación y organización del conocimiento parten de los
conceptos definitorios de una especialidad (dominio temático) para posteriormente
identificar las categorías que los describen y las relaciones semánticas que se dan entre los
mismos, con el objetivo final de establecer un orden jerárquico entre las categorías (en
función de la relevancia de las mismas en los textos) y elaborar una estructura conceptual
que represente y organice formalmente el conocimiento de esa especialidad.
El análisis del discurso como método para la elaboración de estas estructuras conceptuales
que representan el conocimiento de un determinado dominio, se enmarca dentro de la
principal vía de investigación para la organización del conocimiento: el análisis de dominio.
El análisis de dominio es un enfoque teórico formulado inicialmente por Hjørland y
Albrechtsen en la década de los 90 como una alternativa a la visión cognitiva dominante en
las Ciencias de la Información y la Documentación (Hjørland, 2008: 16).
Este enfoque teórico se sustenta en el “estudio de los dominios del conocimiento o las
comunidades de pensamiento o discursivas” (Hjørland, 2004: 17) como modelo y referente
para la elaboración de estructuras conceptuales especializadas. Parte de la idea de que la
representación de un documento se realiza para permitir al usuario realizar
discriminaciones significativas, por lo que el documento debería ser mirado con los ojos de
potenciales usuarios (Hjørland, 2008: 17).
Si esos potenciales usuarios están influidos no solo por aspectos objetivos y subjetivos, sino
también por aspectos sociales y culturales, resulta lógico que estas particularidades sean
también incorporadas a la representación y organización formal del conocimiento. De esta
manera, se obtendrán estructuras conceptuales más complejas, enriquecidas y fieles a la
6
ordenación natural del conocimiento y, por ende, se desarrollarán sistemas de organización
del conocimiento y sistemas de recuperación de información más eficaces.
El conocimiento del dominio temático en cuestión se convierte así en la unidad de análisis
para la representación y organización del conocimiento especializado según el análisis de
dominio. Con el objetivo de obtener un conocimiento multidisciplinar y enriquecido del
dominio, los autores de esta vía teórica proponen once métodos para estudiar los dominios
desde una perspectiva socio-cognitiva (Hjørland, 2004: 17):
1. Producción de guías bibliográficas.
2. Producción de clasificaciones especializadas.
3. Indexación y recuperación de información especializada.
4. Estudios empíricos de los usuarios en los diferentes campos.
5. Estudios bibliométricos.
6. Estudios históricos de intercambio de información.
7. Estudios del documento y de género.
8. Estudios epistemológicos y críticos.
9. Estudios terminológicos, idiomas para fines especiales (IFE) y estudios del discurso.
10. Estudios de las estructuras e instituciones de la comunicación científica.
11. Análisis de dominio en la cognición profesional, el conocimiento experto y la
Inteligencia Artificial (IA).
Estos once métodos pueden ser aplicados por separado, aunque la idea del análisis de
dominio es la utilización conjunta de más de uno en el mismo dominio para proporcionar
una comprensión más profunda de la dinámica subyacente (Hjørland, 2004: 17-18).
El resultado del análisis de dominio es la descripción y el conocimiento de los dominios
temáticos en base a tres bases de teorías y conceptos que constituyen cada dominio
(Hjørland y Hartel, 2003 en López-Huertas, 2015: diapositiva 50):
1. Teorías ontológicas sobre objetos de la actividad humana.
2. Teorías epistemológicas sobre el conocimiento y las formas de obtenerlo.
3. Teorías sociológicas sobre los grupos de personas que se relacionan con los objetos.
Así, las interacciones entre los factores ontológicos, epistemológicos y sociales influyen en
el desarrollo de los campos de conocimiento (dominios temáticos) y deben ser, por tanto,
tenidos en cuenta a la hora de representar y organizar el conocimiento en un determinado
dominio.
El análisis de dominio es una perspectiva teórico-práctica muy influyente en el ámbito de la
organización del conocimiento para la recuperación de información, que ha ido ganando
terreno durante el último cuarto de siglo porque se ha pasado de la búsqueda de soluciones
universalmente aceptables, a enfoques centrados en un área concreta (Smiraglia, 2012).
Éste es un modelo teórico prometedor para entender el discurso científico y
potencialmente una herramienta muy útil para proyectar el mapa estructural del discurso
científico (Mai, 2004 en López-Huertas, 2015: diapositiva 60).
7
El análisis del discurso puede ser entendido, por tanto, como sub-enfoque teórico dentro
del análisis de dominio del que toma (1) el estudio y análisis del discurso como herramienta
para la identificación de las categorías que representan e identifican el dominio y el peso o
relevancia de éstas en los textos y (2) la identificación de la relevancia del contenido de las
definiciones para establecer las categorías y su orden basado en una jerarquía.
La diferencia entre el análisis de dominio y el análisis del discurso es que en el primero la
unidad de análisis para la representación y organización del conocimiento es el dominio
temático, mientras que en el segundo la unidad de análisis es el concepto (el conjunto de
conceptos con los que se identifica un dominio temático, sus categorías y las relaciones
semánticas entre éstas), que se expresa formalmente mediante un descriptor.
3. Objetivos del método: un modelo metodológico para la construcción
de estructuras conceptuales especializadas
El análisis del discurso en el campo de la organización del conocimiento para la
recuperación de información pretende dar respuesta a la complejidad inherente a la tarea
de representar y organizar el conocimiento humano, que crece de manera exponencial y
que debe ser representado en entornos contextualizados, tal y como existe en la realidad.
Su principal objetivo es el de servir de base metodológica para la construcción sistemática
de estructuras conceptuales dentro de un dominio determinado a partir del estudio y el
análisis de los propios textos especializados pertenecientes a ese dominio. Este método se
fundamente en el análisis de las definiciones de los conceptos del dominio dadas por los
expertos para extraer las categorías.
Los diccionarios y las enciclopedias especializados elaborados por expertos en cada materia
se convierten así en la fuente de información (contenido) textual para identificar los
conceptos definitorios del dominio y las relaciones semánticas entre los mismos,
clasificarlos en categorías y determinar la relevancia de éstas y su ordenación en la
estructura.
De esta forma, la estructura conceptual resultante incorporaría tanto el conocimiento
objetivo de los documentos, como el conocimiento subjetivo de sus autores (también
presente en los documentos y que se desprende de las definiciones de los conceptos que
realizan cada uno de los autores). A esto hay que añadir una dimensión más, aún poco
desarrollada en la teoría de este modelo, el usuario final del sistema de recuperación de
información. Esto aportaría una dimensión socio-cultural al sistema que se traduciría en la
extracción de nuevas categorías que no están presentes en los documentos pero que son
relevantes, porque enriquecen las estructuras conceptuales resultantes y ayudan al
desarrollo de sistemas de recuperación de información que respondan de forma eficaz a las
necesidades informativas de los usuarios que van a utilizarlo.
Se pretende así objetivar y automatizar el método para la construcción de estructuras
conceptuales especializadas que sirvan a la recuperación de información inteligente
mediante sistemas expertos de recuperación informativa.
8
4. Proceso de construcción de estructuras conceptuales mediante el
análisis del discurso2
Para ilustrar cómo el análisis del discurso puede contribuir a la tarea anterior, se me ocurre
un escenario en el que ha de elaborarse una estructura conceptual perteneciente al
dominio de la “epidemiología”, con el objetivo final de desarrollar un sistema de
organización del conocimiento que pueda servir de base a un sistema experto para la
recuperación de información especializada. La epidemiología es la disciplina médica
encargada del estudio de las enfermedades humanas, esto es, su distribución poblacional,
su frecuencia de aparición y los factores determinantes de su desarrollo, con la finalidad de
predecir y controlar las enfermedades en las sociedades humanas.
En este contexto, sería útil el desarrollo de un sistema experto que pueda ser empleado por
los científicos que investigan en esta rama médica (usuarios finales del sistema) para la
recuperación inteligente de información relevante.
¿Y qué información es relevante para los epidemiólogos? Para averiguarlo, primero hay que
identificar los conceptos que van a constituir el punto de partida del análisis del discurso
para seleccionar después las definiciones de los mismos que realizan diferentes autores en
textos especializados (enciclopedias y diccionarios). En este ejemplo, el concepto como
unidad de análisis del discurso que define al dominio temático es evidente: cada una de las
enfermedades humanas. Es decir, los conceptos que van a constituir el objeto de análisis del
discurso y que se expresan formalmente mediante descriptores son: cáncer, diabetes,
obesidad…y así cada una de las enfermedades médicas registradas. Para cada uno de estos
descriptores se crea un texto que constituye la base del análisis.
Para establecer las categorías (características) de los conceptos e identificar las relaciones
semánticas y jerárquicas entre las mismas (la relevancia de cada una dentro de la
estructura) acudiremos a las definiciones dadas por expertos en la materia presentes en
textos especializados como lo son las enciclopedias médicas. Este es el primer paso en el
análisis del discurso, seleccionar los textos especializados que van a constituir la base
informativa para la descripción de los conceptos, a partir de las definiciones que diferentes
autores realizan de los mismos.
En este caso las definiciones3 de cada uno de los conceptos, que son cada una de las
enfermedades, dadas en las enciclopedias contendrán diferentes elementos textuales
relevantes para representar cada uno de los conceptos “cáncer”, “diabetes”, “obesidad”,
etc. en el dominio de la epidemiología. Y estos elementos textuales son los que sugerirán
las categorías y su relevancia dentro de la estructura conceptual. Este es el segundo paso
en el proceso de elaboración de estructuras conceptuales mediante el análisis del discurso,
2 La información relativa a este apartado sobre el proceso de construcción de estructuras conceptuales se ha extraído de López-Huertas, 2015: dispositivas 127-140. 3 No se incluyen aquí las definiciones del ejemplo por la imposibilidad de acceso a estas enciclopedias médicas especializadas y porque esta tarea desbordaría los límites del trabajo. Se considera que la descripción del proceso de análisis del discurso es suficiente para ilustrar la aplicabilidad del método en la práctica.
9
señalar los elementos textuales relevantes contenidos en las diferentes definiciones de
cada uno de los conceptos.
En el ejemplo que nos ocupa, tras analizar diversas enciclopedias médicas seguramente
obtendríamos elementos textuales relevantes muy similares a los recogidos en la siguiente
tabla, y las categorías se establecerían a partir de esos elementos textuales (el nombre de
las categorías viene propuesto directamente por los propios textos).
Elementos textuales relevantes Identificación de categorías
Exceso de grasas Causa
Consumo de alcohol Factor de riesgo
Tabaquismo Factor de riesgo
Sedentarismo Factor de riesgo
IMC Prueba diagnóstica
Medida de la circunferencia de la cintura Prueba diagnóstica
Cambios en el estilo de vida Tratamiento
Fármacos Tratamiento
Riesgos para la salud Tratamiento
El 13% de las personas son obesas Prevalencia
Estas categorías definitorias de las enfermedades (los conceptos) se ampliarían muchísimo
en la realidad (factores de riesgo, procesos biológicos, origen, síntomas, tratamiento,
incidencia, prevalencia, grupos de riesgo, pronóstico, etc.), pero baste con el ejemplo
anterior para entender cómo se realiza la identificación de las categorías en el análisis del
discurso (tercer paso del proceso de elaboración de la estructura conceptual).
Una vez identificadas, hay que evaluar las categorías para determinar su importancia dentro
de la estructura conceptual (cálculo del índice de relevancia, cuarto paso) y organizarlas
según un orden jerárquico (ordenación de las categorías según el índice de relevancia,
quinto paso). “El orden en que deben aparecer las categorías en la estructura y los criterios
de organización de las mismas es una decisión muy importante en la elaboración de una
estructura conceptual” (López-Huertas, 2015: diapositiva 136).
La relevancia de las categorías se convierte en el criterio de ordenación de los conceptos en
la estructura conceptual y viene dada por el número de veces que cada una de ellas aparece
en las definiciones de las enciclopedias. Durante la ordenación de las categorías éstas se
agrupan en función de su relevancia pero también se establecen grupos de categorías en
función de su semejanza.
Llegados a este punto habrá que realizar el proceso anterior con cada uno de los conceptos
del dominio de la epidemiología, esto es, con cada una de las enfermedades humanas4.
El último paso sería la propuesta de una estructura conceptual concreta para organizar y
representar el conocimiento del dominio dado con vistas al desarrollo de sistemas de
organización del conocimiento para la recuperación de información.
4 Esta sería una tarea ardua y compleja en la práctica y su mención aquí solo sirve a modo de ejemplo ilustrativo.
10
Por tanto, los pasos a seguir para la elaboración de estructuras conceptuales dentro de un
dominio temático mediante el análisis del discurso son:
1. Selección de textos especializados.
2. Identificación de elementos textuales relevantes.
3. Establecimiento de las categorías (sugeridas por los propios textos).
4. Evaluación de la relevancia de las categorías.
5. Ordenación de las categorías en la estructura.
6. Repetición del proceso para cada concepto del dominio.
7. Propuesta de la estructura conceptual.
5. Representación del usuario en la estructura conceptual
Para obtener una estructura conceptual completa y enriquecida, digna de representar la
complejidad de un dominio temático, es vital que se represente al usuario dentro de la
misma, ya que al final será éste quien utilice los sistemas de recuperación de información
para los que ha sido desarrollada la estructura conceptual.
La representación del usuario en el marco del análisis del discurso queda excluida si solo se
tienen en cuenta las categorías sugeridas por los textos (que reflejan tanto el conocimiento
objetivo como el conocimiento subjetivo de los autores). Se me ocurre, por tanto, que una
forma de incorporar la representación del usuario en la elaboración de estructuras
conceptuales es considerar también cuestiones ajenas a los contenidos de los textos
especializados que son la base del análisis del discurso.
Me refiero a cuestiones que no están presentes en los textos pero que son relevantes para
los usuarios finales del sistema y que responderán, por tanto, a sus necesidades de
información. En el ejemplo anteriormente expuesto sobre el desarrollo de una estructura
conceptual para el dominio temático de la epidemiología, estas cuestiones ajenas a los
textos pero relevantes a los usuarios del sistema (investigadores de esta rama médica)
abarcarían, por ejemplo, el impacto psicológico de la enfermedad, su concepción social, el
control de la enfermedad que llevan a cabo las administraciones públicas, la inversión en
I+D realizada para su estudio, etc.
Esto se traduciría, en el marco del análisis del discurso, en la identificación de nuevas
categorías y su incorporación a la estructura conceptual, que incluiría así la representación
del usuario final del sistema. Pero ¿cómo identificar categorías que no están presentes en el
texto? ¿Cómo saber qué información “invisible” es relevante para los usuarios? Este
conocimiento se podría obtener con métodos de investigación cuantitativos como sondeos
a potenciales usuarios del sistema sobre sus necesidades informativas o con métodos
cualitativos, como entrevistas a estos usuarios estándar del sistema o grupos de discusión.
De esta manera, el análisis del discurso podría convertirse en un método para la elaboración
sistemática y automatizada de estructuras conceptuales para la representación y la
ordenación del conocimiento en los sistemas de organización del conocimiento. Y estos
últimos podrían servir de base de conocimiento a los sistemas de recuperación de
11
información especializada, esto es, a sistemas expertos. Esto es lo que abordaremos a
continuación.
6. Conclusiones: hacia sistemas expertos de recuperación informativa
Los fundamentos del análisis del discurso y el proceso aquí descrito para la construcción de
estructuras conceptuales especializadas a partir de los propios textos pero incorporando
también la representación del usuario, dan como resultado estructuras conceptuales
contextualizadas, caracterizadas por una elevada representatividad conceptual y por la
potencial capacidad para establecer relaciones semánticas entre sus conceptos (López-
Huertas, 2015: dispositiva 37).
Esto se traduce en una precisión y exhaustividad elevadas en la representación y
organización del conocimiento de un dominio, ya que la realidad también es contextual y
rica a nivel conceptual y semántico. Por tanto, un sistema de organización del conocimiento
basado en una estructura conceptual de este tipo (la que proporciona el análisis del
discurso como modelo metodológico) dispone de toda la información relevante (la de los
textos y la de los usuarios) de cada concepto y su entramado semántico.
Por esto, creo que el análisis de discurso constituye una potencial vía de investigación para
el desarrollo de sistemas expertos. Los sistemas expertos son sistemas para la recuperación
inteligente de información especializada que reproducen el proceso intelectual de un
experto humano en un dominio concreto y asisten a los usuarios durante el proceso de
recuperación informativa.
Los sistemas expertos, un producto de la inteligencia artificial, “pueden considerarse como
intermediarios entre el experto humano, que transmite su conocimiento al sistema, y el
usuario que lo utiliza para resolver un problema con la eficacia del especialista. El sistema
experto utilizará para ello el conocimiento que tenga almacenado y algunos métodos de
inferencia” (Sámper).
Estos sistemas están diseñados para resolver problemas concretos y facilitar la toma de
decisiones dentro de un dominio determinado. Por ejemplo, se han desarrollado sistemas
expertos para el diagnóstico médico que se han convertido en una herramienta de trabajo
de los profesionales sanitarios porque hacen más eficiente el proceso de diagnóstico al
economizar tiempo y recursos.
¿Cómo funcionaría un sistema de este tipo? Siguiendo a María José López-Huertas (López-
Huertas, 1999) un sistema experto basado en una estructura conceptual inferida a partir del
análisis del discurso funcionaría como un sistema de búsqueda a dos niveles, con un modo
de búsqueda y un modo de pregunta.
En el primero el sistema experto devolvería la información relativa a una consulta concreta
planteada por el usuario, que representa una necesidad informativa específica. Por ejemplo,
siguiendo el ejemplo anteriormente planteado sobre el dominio de la epidemiología,
podríamos realizar al sistema la siguiente consulta: “factores de riesgo ambiental del
12
melanoma”. Es este caso, el procesador funcionaría de la siguiente manera: extraería una
lista de todos los posibles factores de riesgo ambiental en el desarrollo de enfermedades
(productos tóxicos, rayos ultravioleta, etc.) y seleccionaría aquellos relacionados con el
melanoma. O bien, extraería una lista de todos los factores de riesgo (no solo ambiental,
sino también genético o de otro tipo) del melanoma y seleccionaría solo aquellos que le
interesan, los ambientales. En cualquiera de los dos casos devolvería al usuario la
información relativa a la consulta planteada.
Como vemos, ésta podría ser una típica expresión booleana: “factores de riesgo ambiental
y melanoma”. Una de las características de un sistema experto como el aquí referido es que
evita el uso de operadores booleanos (López-Huertas, 1999).
Si realizáramos la pregunta anterior en un buscador, por ejemplo, obtendríamos una serie
de documentos (ordenados en función de una relevancia establecida según una serie de
criterios) que contendrían la cadena de caracteres que constituye la consulta. Porque así es
precisamente como un buscador al uso “entiende” la consulta que realiza el usuario, de
manera que le devuelve documentos que incluyen esas dos cadenas de caracteres (es decir,
documentos que contienen “factores de riesgo ambiental” y que también contienen
“melanoma”) sin importar las relaciones entre las mismas.
En este caso el sistema de recuperación de información no sabe (ni le importa) si “factores
ambientales” es una característica (cualidad, categoría) referente a “melanoma”, algo que
un sistema experto sí conoce. Parece lógico, por tanto, que en el segundo caso las
necesidades informativas de los usuarios se verán más satisfechas.
En el segundo nivel de búsqueda, el modo de pregunta, la consulta planteada por el usuario
representa una necesidad informativa imprecisa, es decir, quiere recuperar una información
concreta sobre un concepto o conceptos que él no conoce, por ejemplo, cuáles son los
factores de riesgo ambiental relacionados con los tumores malignos de la piel. En este caso
el usuario quiere saber cuáles son los conceptos (cada uno de los factores de riesgo
ambiental) que responden a esas características (que se relacionan con el desarrollo de
tumores malignos de piel). Para ello, realizaría la siguiente consulta al sistema “tumores
malignos de la piel” y en la pantalla aparecerían todos los tipos de factores ambientales
relacionados con la aparición de tumores malignos de piel: contacto directo con productos
tóxicos, exposición a la luz ultravioleta, herencia genética, etc.
En un sistema experto para la recuperación inteligente de información el sistema
mantendría un diálogo continuo con el usuario y le asistiría en todo momento durante el
proceso de búsqueda, pasando del modo búsqueda al modo pregunta y viceversa cuando
así fuese necesario, por lo que va refinando la búsqueda progresivamente hasta dar con la
respuesta a la necesidad informativa del usuario.
“Se trata de una ayuda que lo conduce (al usuario) de forma inteligente a navegar por la
estructura del sistema hasta que tiene claro lo que busca y puede expresarlo
adecuadamente en la frase de búsqueda” (López-Huertas, 1999).
13
Para concluir, vemos que el análisis del discurso como modelo metodológico para la
construcción de estructuras conceptuales es una vía de investigación académica
prometedora para el desarrollo de sistemas de organización del conocimiento más
sofisticados y cercanos a la complejidad inherente a la realidad y a la forma de expresarla a
través del lenguaje.
El análisis del discurso emplea métodos cualitativos y cuantitativos. El estudio y análisis de
los textos especializados que sirven de base son cualitativos, mientras que la decisión sobre
la relevancia de las categorías referentes a cada concepto es cuantitativa (el número de
veces que cada categoría o característica aparece en el texto). El resultado de aplicar este
método a la elaboración de estructuras conceptuales son sistemas de organización del
conocimiento más enriquecidos y contextualizados, más cercanos a la ordenación natural
del conocimiento.
Estos sistemas proporcionarían, a su vez, una base más exhaustiva y precisa para el
desarrollo de sistemas de recuperación inteligente de información, sistemas expertos
pensados para dominios temáticos concretos cuyos usuarios necesitan recuperar
información especializada.
14
7. Bibliografía
HJØRLAND, Birger. “Domain analysis: a socio-cognitive orientation for information science
research” [en línea]. Bulletin of the American Society for Information Science. 2004, vol. 30,
no. 3, págs. 17-21. Disponible en
<http://onlinelibrary.wiley.com/doi/10.1002/bult.312/abstract>. [Consulta: 20 marzo 2015].
Traducción al español disponible en
<http://www.academia.edu/6589249/An%C3%A1lisis_de_dominio_Por_Birger_Hjorland>.
HJØRLAND, Birger. “What is Knowledge Organization (KO)?” [en línea]. Knowledge
Organization. International Journal devoted to Concept Theory, Classification, Indexing and
Knowledge Representation. 2008, vol. 35, no.2-3, págs. 86-101. Disponible en
<http://arizona.openrepository.com/arizona/handle/10150/106183>. [Consulta: 20 marzo
2015].
LÓPEZ-HUERTAS, María José. Representación y organización conceptuales del conocimiento
para la recuperación de la información [presentación Power Point]. 2015. Material de estudio
de la asignatura en el máster de Información y Comunicación científica de la Universidad de
Granada.
LÓPEZ-HUERTAS, María José. Potencialidad evolutiva del tesauro: Hacia una base de
conocimiento experto [en línea]. Granada: 1999, págs. 133-140. Ponencia (Actas de
congresos). Disponible en <dialnet.unirioja.es/descarga/articulo/1300435.pdf>. [Consulta: 20
marzo 2015].
SÁMPER MÁRQUEZ, Juan José. Introducción a los sistemas expertos [en línea]. Red científica
(Ciencia, Tecnología y Pensamiento). Disponible en
<http://www.redcientifica.com/doc/doc199908210001.html>. [Consulta: 22 marzo 2015].
SÁNCHEZ-CUADRADO, Sonia; MORATO, Jorge. Organización del conocimiento, Sistema de ||
KOS [en línea]. Sánchez-Cuadrado, Sonia: 2009. Recurso electrónico. Disponible en
<http://glossarium.bitrum.unileon.es/Home/organizacion-del-conocimiento-sistema-de>.
[Consulta: 20 marzo 2015].
SMIRAGLIA, Richard P. “Knowledge organization: some trends in an emergent domain” [en
línea]. El professional de la información. 2012, vol. 21, no. 3. Disponible en
<http://recyt.fecyt.es/index.php/EPI/article/view/epi.2012.may.01/17913>. [Consulta: 20
marzo 2015]. Traducción al español disponible en
<http://www.elprofesionaldelainformacion.com/contenidos/2012/mayo/01_esp.pdf>.