1. r epresentaciÓn del conocimiento - … · en las ciencias de la computación, la inteligencia...

14
Revista Electrónica de Socioeconomía, Estadística e Informática (RESEI) ISSN 2007 – 817X Vol. 1 Num. 1, Julio - Diciembre de 2012 Colegio de Postgraduados, México 6 1. REPRESENTACIÓN DEL CONOCIMIENTO: DESARROLLO DE ONTOLOGÍAS KNOWLEDGE REPRESENTATION VIA ONTOLOGIES Yolanda Fernández-Ordoñez 1 , Reyna Carolina Medina Ramírez 2 , Jesús Soria-Ruiz 3 , Jorge Rafael Gutiérrez Pulido 4 1 Colegio de Postgraduados-Campus Montecillo, Montecillo ([email protected]). 2 Universidad Autónoma Metropolitana-Iztapalapa, Iztapalapa, México. ([email protected]). 3 Laboratorio de Geomática. Instituto Nacional de Investigaciones Forestales, Agrícolas y Pecuarias (INIFAP), Toluca, México ([email protected]). 4 Universidad de Colima, Colima, México ([email protected] ). Resumen Las ontologías son representaciones del conocimiento para su procesamiento computarizado. Un objetivo principal de una ontología es dar soporte a sistemas de organización del conocimiento, particularmente a programas de computadora orientados a utilizar la información existente en la web basándose en sus significados. Las ontologías son una de las tecnologías para la realización de la Web Semántica, que es la extensión de la web actual con capacidades para interpretar exactamente las solicitudes de información de los usuarios. Este trabajo introduce las nociones básicas de las ontologías y presenta una metodología para crearlas, la cual parte desde el punto de vista humano hasta la obtención de conceptos que pueden representarse en lenguajes especializados. La metodología se ha aplicado para implementar el acceso a recursos de información de dominios de conocimiento tales como la acuacultura, los bosques, la educación y las memorias corporativas. Palabras clave: ontología, web semántica, metodología Abstract Ontologies are representations of knowledge for computer processing. A main objective of an ontology is to support knowledge organization systems, in particular computer programs oriented to the use of information existing in the web based on its meaning. Ontologies are one of the technologies for the realization of the Semantic Web, which is the extension of the current web with capabilities to accurately interpret information requests from users. This work introduces the basic notions of ontologies and presents a methodology to create them, starting from the human point of view until the determination of concepts that can be represented in specialized languages. This methodology has been applied to implement access to information resources pertaining to knowledge domains such as aquaculture, forests, education and corporate memories. Keywords: ontology, semantic web, methodology.

Upload: truongdat

Post on 29-Sep-2018

212 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 1. R EPRESENTACIÓN DEL CONOCIMIENTO - … · En las ciencias de la computación, la inteligencia artificial y en particular la representación de l conocimiento (RC) , han evolucionado

Revista Electrónica de Socioeconomía, Estadística e Informática (RESEI) ISSN 2007 – 817X

Vol. 1 Num. 1, Julio - Diciembre de 2012

Colegio de Postgraduados, México 6

1. REPRESENTACIÓN DEL CONOCIMIENTO: DESARROLLO DE ONTOLOGÍAS

KNOWLEDGE REPRESENTATION VIA ONTOLOGIES Yolanda Fernández-Ordoñez

1, Reyna Carolina Medina Ramírez

2, Jesús Soria-Ruiz

3, Jorge Rafael Gutiérrez Pulido

4

1Colegio de Postgraduados-Campus Montecillo, Montecillo ([email protected]).

2Universidad Autónoma Metropolitana-Iztapalapa, Iztapalapa, México.

([email protected]). 3Laboratorio de Geomática. Instituto Nacional de

Investigaciones Forestales, Agrícolas y Pecuarias (INIFAP), Toluca, México ([email protected]).

4Universidad de Colima, Colima, México ([email protected] ).

Resumen Las ontologías son representaciones del conocimiento para su procesamiento computarizado. Un objetivo principal de una ontología es dar soporte a sistemas de organización del conocimiento, particularmente a programas de computadora orientados a utilizar la información existente en la web basándose en sus significados. Las ontologías son una de las tecnologías para la realización de la Web Semántica, que es la extensión de la web actual con capacidades para interpretar exactamente las solicitudes de información de los usuarios. Este trabajo introduce las nociones básicas de las ontologías y presenta una metodología para crearlas, la cual parte desde el punto de vista humano hasta la obtención de conceptos que pueden representarse en lenguajes especializados. La metodología se ha aplicado para implementar el acceso a recursos de información de dominios de conocimiento tales como la acuacultura, los bosques, la educación y las memorias corporativas.

Palabras clave: ontología, web semántica, metodología

Abstract Ontologies are representations of knowledge for computer processing. A main objective of an ontology is to support knowledge organization systems, in particular computer programs oriented to the use of information existing in the web based on its meaning. Ontologies are one of the technologies for the realization of the Semantic Web, which is the extension of the current web with capabilities to accurately interpret information requests from users. This work introduces the basic notions of ontologies and presents a methodology to create them, starting from the human point of view until the determination of concepts that can be represented in specialized languages. This methodology has been applied to implement access to information resources pertaining to knowledge domains such as aquaculture, forests, education and corporate memories.

Keywords: ontology, semantic web, methodology.

Page 2: 1. R EPRESENTACIÓN DEL CONOCIMIENTO - … · En las ciencias de la computación, la inteligencia artificial y en particular la representación de l conocimiento (RC) , han evolucionado

Revista Electrónica de Socioeconomía, Estadística e Informática (RESEI) ISSN 2007 – 817X

Vol. 1 Num. 1, Julio - Diciembre de 2012

Colegio de Postgraduados, México 7

1. Introducción En las ciencias de la computación, la inteligencia artificial y en particular la representación del conocimiento (RC), han evolucionado en una larga historia de aciertos y fracasos desde los años 70. La RC ha sido motivada por la creación de programas que simulen “comportamiento inteligente” – incluyendo demostradores de teoremas matemáticos, redes de neuronas artificiales para resolver problemas, programas jugadores de ajedrez o sistemas expertos que capturen el conocimiento y experiencia humanos y apoyen tareas como el diagnóstico médico o la prevención de desastres industriales. Sin embargo, autores como Barr (1993), coinciden desde hace años en señalar que la inteligencia artificial ha dejado el ámbito cerrado de resolución de problemas específicos para dirigirse — con mayor provecho para el ser humano — hacia la diseminación inteligente de la información y del conocimiento. Desde mediados de los años 90 los grupos de investigación líderes se orientan a temas de sistemas basados en conocimiento, sistemas inteligentes, sistemas de información activos, ingeniería de datos y conocimiento y sistemas organizadores del conocimiento (Hodge, 2000). En estas orientaciones un objetivo común es encontrar medios de expresión formal integrados para datos, información y conocimiento que permitan su utilización computacional de manera eficaz y efectiva en diferentes ámbitos. La secuencia que permite ir de los datos a la información y luego al conocimiento Datos Información Conocimiento (“secuencia DIC”) constituye una cadena de valor computacional. La gran cantidad de modelos, lenguajes y teorías propuestos para realizar la cadena DIC es un indicador de la dificultad de la tarea. Makhfi (2012) menciona un último eslabón en esta cadena, Sabiduría, pues considera que estos cuatro componentes son realmente la base del concepto de inteligencia.

Dependiendo de la misión y contexto del software manejador de conocimiento que se pretenda construir, se recurre a distintos elementos para representar tipos de conocimiento. Dichos elementos se conocen como primitivos de una representación del conocimiento y pueden incluir reglas, definiciones de objetos y plantillas (“frames”) entre otros. Los elementos primitivos se combinan y conectan para crear construcciones más elaboradas, tales como estructuras ligadas de objetos, redes asociativas y mapas de conceptos, redes semánticas, expresiones lógicas y ontologías. En el artículo de Vassev y Hinchey (2011) se incluye una revisión somera y muy accesible sobre la RC. El reto finalmente es utilizar una RC a la vez suficientemente simple para que el ser humano pueda comprender su significado y estructura y que sea utilizable eficientemente por programas computacionales.

Una de las partes más relevantes del conocimiento humano se ha vertido en documentos digitales, gran parte de los cuales están disponibles en la web. Para representar su estructura se desarrollaron lenguajes como HTML y XML. A la par, se desarrollaron programas buscadores para la web como los “browsers” que utilizan dichas representaciones para ubicar y presentar documentos sobre todos los temas y en prácticamente todos los idiomas. El acceso a documentos no sólo por su estructura sino por el significado de su contenido es la propuesta central de la Web Semántica (WS). La WS es la siguiente generación de la web donde se expresa el significado de los datos mediante metadatos, es decir, definiciones formales de dichos datos en formas o lenguajes de representación especiales, permitiendo con esto la explotación computacional de sus significados. Tim Berners-Lee y su grupo son reconocidos como pioneros de la propuesta de la WS (Berners-Lee et al, 2001; Shadbolt, N. et al, 2006); estos autores son los fundadores del consorcio W3C, World Wide Web Consortium que recomienda estándares y orienta a equipos de investigación y desarrollo de la WS en todo el mundo.

Page 3: 1. R EPRESENTACIÓN DEL CONOCIMIENTO - … · En las ciencias de la computación, la inteligencia artificial y en particular la representación de l conocimiento (RC) , han evolucionado

Revista Electrónica de Socioeconomía, Estadística e Informática (RESEI) ISSN 2007 – 817X

Vol. 1 Num. 1, Julio - Diciembre de 2012

Colegio de Postgraduados, México 8

Un documento web conlleva una connotación más amplia que un documento común y corriente, ya que se refiere a cualquier recurso de información (RI) disponible: bases de datos, páginas web, blogs, wikis, documentos multimedia, fotografías, y videos. Para materializar la WS las tecnologías más utilizadas son, por una parte, las ontologías como representaciones del contenido de los recursos y, por otra, los programas en lenguajes como Protegé y OWL que puedan utilizarlas (Noy et al,2001), (Lacy, 2005).

Este trabajo está organizado como sigue:

En la sección 2 se presentan dos ejemplos motivacionales de la WS.

En la sección 3 se introducen los elementos de una ontología y se resumen los tipos de ontologías de acuerdo a su aplicación.

En la sección 4 se presentan las etapas de una metodología para la construcción de ontologías, partiendo desde el punto de vista del humano hasta la obtención de conceptos y relaciones y en la sección 5 se muestran ejemplos de su aplicación.

La sección 6 cierra con comentarios.

2. Ejemplos motivacionales de la Web Semántica La mayoría de los usuarios de la web ha enfrentado la situación a veces frustrante de buscar información y recibir cientos o miles de documentos como respuesta. Toma algún tiempo aprender para formular las consultas o usar la opción de búsqueda avanzada para reducir el conjunto de documentos que seguramente contiene la información buscada; esto ocurre porque la web actual no realiza búsquedas inteligentes sino búsquedas en texto libre basadas en la forma –sintaxis- de la consulta presentada.

Considere los siguientes ejemplos:

1.- Un usuario inexperto interesado en el cultivo del arroz teclea directamente en un buscador como Google® la palabra “arroz”; obtendrá más de 6 millones de resultados la mayoría irrelevantes al cultivo del cereal. Si el usuario es más experto y sabe del buscador Google Académico® y allí introduce la palabra “arroz”, logrará reducir considerablemente el número de resultados, aproximadamente 300,000, conjunto que incluye los de interés pero también muchos no relacionados, como serían artículos o libros donde uno de los autores se apellida “Arroz”. Ver Figura 1.

2.- Un usuario está interesado en autos usados en venta en la parte occidental del estado de Massachusetts que cuesten menos de 8,000 dólares. El lector puede intentar la búsqueda siguiente comentada por Shadbolt (2008): “Toyota used cars for sale in western Massachusetts under $8,000”, y obtendrá más de dos millones de respuestas, muchas no deseadas porque se refieren a otras marcas de autos o informaciones de otros estados. Ver Figura 2.

Page 4: 1. R EPRESENTACIÓN DEL CONOCIMIENTO - … · En las ciencias de la computación, la inteligencia artificial y en particular la representación de l conocimiento (RC) , han evolucionado

Revista Electrónica de Socioeconomía, Estadística e Informática (RESEI) ISSN 2007 – 817X

Vol. 1 Num. 1, Julio - Diciembre de 2012

Colegio de Postgraduados, México 9

Figura 1. Resultado de búsqueda con la palabra del ejemplo 1

Figura 2. Resultado parcial de búsqueda con la frase del ejemplo 2

Page 5: 1. R EPRESENTACIÓN DEL CONOCIMIENTO - … · En las ciencias de la computación, la inteligencia artificial y en particular la representación de l conocimiento (RC) , han evolucionado

Revista Electrónica de Socioeconomía, Estadística e Informática (RESEI) ISSN 2007 – 817X

Vol. 1 Num. 1, Julio - Diciembre de 2012

Colegio de Postgraduados, México 10

¿Qué se esperaría de un sistema de búsqueda inteligente como reacción a estos ejemplos? En el primer ejemplo, que el sistema se percatara de que la consulta formulada es ambigua y proponer al usuario un menú de opciones para desambiguarla, tales como “cultivo de arroz”, “apellido arroz”, “cereal arroz”, “propiedades nutricionales del arroz”, “recetas para arroz” etc. En el ejemplo 2, se requeriría que el sistema contara y utilizara definiciones de conceptos como “auto usado”, “en venta”; y “localidad geográfica”, además de entender que Massachusetts es un ente geográfico que tiene subdivisiones, que “ parte occidental” significa lo mismo que “occidental” y “zona occidental”

Un problema central para realizar la WS es identificar los conceptos a los que se refiere un RI y mediante mecanismos de asociación de significado y de interpretación ofrecer al usuario respuestas cercanas a la intención de sus consultas.

3. Elementos de una ontología Una ontología define conceptos, los componentes primitivos de la representación, los integra en jerarquías y expresa sus propiedades en un lenguaje formal. Los conceptos se relacionan entre sí por su semántica, formándose redes asociativas mediante relaciones semánticas. Los conceptos podrán ser cercanos o lejanos de acuerdo a la longitud de las rutas definidas por las ligas de relación semántica. Determinar la cercanía semántica es un problema difícil que puede apoyarse en una variedad de técnicas (Islam e Inkpen, 2008). Stoutenbourg y coautores (2010) han realizado un trabajo interesante para encontrar relaciones semánticas en los artículos de Wikipedia, quizás la colección más grande de conocimiento que haya existido.

La organización de base en una ontología consiste en establecer las jerarquías de los conceptos y cómo se relacionan entre sí sus significados. Es útil apoyarse en nociones de objeto-concepto y objeto-relación porque tanto conceptos como relaciones tienen propiedades que se definen en las partes superiores de la jerarquía para materializarse en instancias al utilizarse la ontología en razonamientos. En este sentido se reutilizan nociones provenientes de la orientación a objetos y otras provenientes de la inteligencia artificial como marcos (“frames”), reglas y mapas conceptuales. (Kifer et al, 1995) (Swartour y Tate, p cit). Adicionalmente a los conceptos y relaciones, como parte de la ontología se definen restricciones que capturan explicaciones más detalladas sobre las relaciones y que pueden usarse para representar afirmaciones verdaderas o hechos. Las materializaciones de los conceptos definidos por las ontologías fundamentan el intercambio de información y la construcción de conocimiento (Swartout y Tate, 1999). Figura 3.

Puede apreciarse que la construcción de una ontología es un proceso complejo y la ontología resultante, aunque comprensible a programas computacionales, puede ser muy extensa y poco clara para el ser humano, por lo que se desarrollan sistemas de apoyo visual para evaluar las consecuencias de las definiciones en los procesos de razonamiento (Howse et al, 2010).

Page 6: 1. R EPRESENTACIÓN DEL CONOCIMIENTO - … · En las ciencias de la computación, la inteligencia artificial y en particular la representación de l conocimiento (RC) , han evolucionado

Revista Electrónica de Socioeconomía, Estadística e Informática (RESEI) ISSN 2007 – 817X

Vol. 1 Num. 1, Julio - Diciembre de 2012

Colegio de Postgraduados, México 11

Figura 3. Elementos básicos de una ontología

Una ontología se construye gradual e iterativamente y requiere de una metodología. Noy y McGuinness (2001) proponen consideraciones iniciales, pero no existe una metodología generalmente aplicable para todos los usos que pueden darse a una ontología. Guarino y Giaretta (1995) explican que existen diferentes tipos de ontologías de acuerdo al propósito principal que se prevé y que denominamos aquí vocación de una ontología.

Las distintas vocaciones de una ontología pueden resumirse de la manera siguiente:

• De Datos. La vocación de esta ontología es describir un repositorio o base de datos. Si existe una fuerte concordancia entre el esquema de una base de datos relacional y los conceptos de su dominio, puede ser suficiente una ontología simple. Debe notarse que ontologías y esquemas de bases de datos no son un mismo constructo ni persiguen los mismos fines (Konstantinou et al, 2008).

• De Tarea. El propósito es formalizar el conocimiento necesario para realizar una tarea específica o resolver un problema desligado de situaciones específicas o de contextos organizacionales. Por ejemplo, para monitorear contaminantes en el aire, o para la aplicación de insecticidas o hacer comparaciones cruzadas de genomas se requieren ontologías. Este tipo de ontología identifica el contexto en el cual los conceptos pueden ser utilizados pero no pretende completez de los conceptos primarios fuera del contexto.

• De Aplicación. Aquí el propósito es similar al anterior sólo que se considera el problema en una situación y dentro de un ambiente organizacional definidos. Las ontologías de aplicación no contienen conocimiento que pueda ser reutilizado totalmente por otras aplicaciones. Cabrían en este tipo ontologías para apoyar el monitoreo de la calidad del agua de acuerdo a reglamentaciones locales en una zona geográfica particular o a cargo de organismos oficiales, o bien para llenar formularios oficiales y cumplir regulaciones.

• De Dominio. Es la vocación de mayor interés para la WS, donde el uso pretendido es el de formalizar un área del conocimiento con primitivos de representación de conceptos, capturando detalles semánticos en anotaciones e inter-relaciones existentes. Ejemplos serían ontologías para la educación, la bio-informática, la acuacultura, los recursos naturales, la salud, la agricultura, la ecología, la química entre muchos otros. Este tipo de ontología constará de un conjunto de conceptos primarios y secundarios que eventualmente serán reutilizados en diferentes contextos y para relacionarse con otros dominios. Los conceptos primarios (núcleo)

Page 7: 1. R EPRESENTACIÓN DEL CONOCIMIENTO - … · En las ciencias de la computación, la inteligencia artificial y en particular la representación de l conocimiento (RC) , han evolucionado

Revista Electrónica de Socioeconomía, Estadística e Informática (RESEI) ISSN 2007 – 817X

Vol. 1 Num. 1, Julio - Diciembre de 2012

Colegio de Postgraduados, México 12

son esenciales al dominio. La ontología misma no precisará cuáles conceptos podrán ser reutilizados en otros dominios ni cómo se haría esto.

• De alto nivel o fundamental. En este caso se trata de formalizar descripciones muy generales e invariantes entre dominios de conceptos (entes), apelando a principios de la metafísica, la ciencia cognitiva y la lingüística. Estas ontologías son útiles para el modelado de alto nivel y pueden asistir en el proceso de combinar o integrar ontologías.

La vocación de una ontología sirve para delimitar el alcance que tendrá tanto en amplitud como en profundidad de la jerarquía de conceptos. La vocación es un considerando principal para una metodología que guíe el proceso de su construcción.

4. Una Metodología de Desarrollo de Ontologías La metodología que se menciona en este trabajo combina propuestas expuestas en (Fernández-López et al, 1997) y (Hart et al, 2007); se la ha ensayado en proyectos orientados al desarrollo de ontologías para acuacultura (Fernández-Ordóñez et al, 2010), bosques (Guerra García, 2011), educación (Hernández Ramón, 2011), y memorias corporativas (Monsalvo Zamora, 2012), todos estos proyectos orientados a la gestión semántica de los recursos de información. El objetivo común ha sido manejar el enlace a RI de distintos tipos para que las herramientas de consulta ofrezcan resultados semánticamente más ricos que una simple lista de enlaces (Medina-Ramírez y Ramos-Ramos, 2007).

Las etapas y tareas principales de la metodología son:

1. Ubicar y seleccionar los recursos. Puede tratarse de documentos, bases de datos, bases de conocimientos, conocimiento directo de expertos humanos y ontologías existentes que se utilizarán como puntos de partida para definir el alcance y el contexto. De acuerdo al continuo de explicitación de la semántica de las fuentes para una ontología, una vez identificados los RI se obtienen listas de términos para identificar conceptos (Liang et al, 2009). Ver la Figura 4.

2. Especificar el alcance de la ontología. Se expresa mediante elección del núcleo de conceptos principales, su organización, el detalle requerido en las anotaciones y en la precisión de las relaciones de acuerdo al contexto. Es recomendable la intervención de expertos. Esta etapa incluye la obtención de la ontología nuclear del dominio (‘core ontology’), que contiene los elementos mínimamente requeridos para comprender todos los conceptos y produce un glosario base. Se ha experimentado con la extracción manual y/o semi-automatizada de conceptos de los RI.

2.1 Construir un primer glosario de términos más comunes empleados en el dominio, basándose en las listas de la etapa 1.

2.2 A partir del glosario encontrar obtener una primera aproximación a los conceptos núcleo.

2.3 Elegir RIs de base, consultando con expertos sobre los RIs más pertinentes. Los RIs incluyen taxonomías, tesauros, esquemas relacionales y ontologías, descartando definiciones muy generales o no aplicables para la vocación de la ontología. Por ejemplo, para el caso de la acuacultura, se consideraron las propuestas de la FAO para

Page 8: 1. R EPRESENTACIÓN DEL CONOCIMIENTO - … · En las ciencias de la computación, la inteligencia artificial y en particular la representación de l conocimiento (RC) , han evolucionado

Revista Electrónica de Socioeconomía, Estadística e Informática (RESEI) ISSN 2007 – 817X

Vol. 1 Num. 1, Julio - Diciembre de 2012

Colegio de Postgraduados, México 13

construcción de tesauros y ontologías (FAO, 2012). A nivel nacional, se consideraron los portales web de oficinas gubernamentales regulatorias de la acuacultura y un sistema de información sobre acuacultura (Soria-Ruiz y Fernández-Ordóñez, 2007).

2.4 Generar metadatos para los RIs, incluyendo título, autor, datos de publicación y urls, que se refieren a la vista externa del recurso y pueden ser etiquetados con marcadores XML.

2.5 Depurar los RIs de acuerdo al contexto, consultando a expertos del dominio, y reunir los conceptos en un nuevo glosario, regresando al paso 2.1 hasta obtener una versión satisfactoria.

3. Representar el conocimiento. El objetivo es construir el aspecto conceptual en términos de conceptos y relaciones. Es recomendable la intervención de expertos en esta etapa.

3.1 Verter los conceptos del glosario en una organización jerárquica. Esta actividad descansa en el contexto y la vocación de la ontología Asimilar el contexto es uno de los problemas más importantes a los que se enfrenta un desarrollador de ontologías, pues debe concluir en una clasificación de los componentes de un dominio. En nuestro trabajo hemos experimentado con la creación de taxonomías con apoyo exclusivamente por expertos, y semi-automatizada, recurriendo a técnicas de mapas auto-organizados y de redes neuronales (JRGPulido, 2003).

3.2 Definir las relaciones semánticas no jerárquicas entre los conceptos. Precisar estas relaciones presenta incluso mayores retos que determinar los conceptos, ya que el ser humano tiene una amplia capacidad para manejar y entender relaciones muchas veces de manera inconsciente, pero la elección de relaciones para una ontología deberá hacerse explícita para lograr su representación y uso por programas.

4. Definir aspectos computacionales. Consiste en tomar la representación conceptual de la etapa anterior y verterlo en una ontología en formato procesable, usando lenguajes de representación como OWL y Protegé.

5. Validar la propuesta ontológica. Involucra varias técnicas, como definir con expertos series de preguntas de prueba y verificación, o recurrir a métodos semiautomáticos o automáticos para garantizar consistencia del conocimiento representado.

6. Realizar modificaciones. Se refiere a modificaciones consecuencia de la etapa 5 o cuando se ha redefinido el alcance, por ejemplo, por extensión de la ontología o fusión con otra ontología (Cuevas y Guzmán-Arenas, 2010).

Figura 4. Explicitación de la semántica en fuentes de información

Page 9: 1. R EPRESENTACIÓN DEL CONOCIMIENTO - … · En las ciencias de la computación, la inteligencia artificial y en particular la representación de l conocimiento (RC) , han evolucionado

Revista Electrónica de Socioeconomía, Estadística e Informática (RESEI) ISSN 2007 – 817X

Vol. 1 Num. 1, Julio - Diciembre de 2012

Colegio de Postgraduados, México 14

5. Ejemplos de aplicación de la metodología Los ejemplos de esta sección se han tomado de la experiencia de desarrollo de OntoAquaMx, una ontología para la práctica de la acuacultura donde se trabajó siempre en comunicación con expertos del dominio (Fernández-Ordóñez et al, 2010).

Un fragmento de una taxonomía de términos para acuacultura obtenida manualmente con apoyo de expertos se muestra en la Tabla 1.

Tabla 1. Términos del dominio de la Acuacultura

TÉRMINOS DEFINICIÓN RI

3. Acuacultura

(a) Conjunto de actividades dirigidas a la reproducción controlada, pre-engorda y engorda de especies de la fauna y flora realizadas en instalaciones ubicadas en aguas dulces, marinas o salobres, por medio de técnicas de cría o cultivo, que sean susceptibles de explotación comercial, ornamental o recreativa; (b) cultivo o cría en cautividad en un medio acuático de cualquier especie de organismos acuáticos.

Ley General de Pesca y Acuacultura Sustentables (Ley GPAS) - México

3.1. Modalidad de la acuacultura

Manifestación, características, propiedades de la actividad de acuacultura de acuerdo a los objetivos que persigue

INAPESCA http://www.inapesca.gob.mx/

3.1.1 Acuacultura comercial

Acuacultura que persigue como primer objetivo la comercialización de productos y especies acuícolas

INAPESCA http://www.inapesca.gob.mx/

3.1.2 Acuacultura social

Acuacultura que persigue como primer objetivo el desarrollo social de las comunidades que la practican

INAPESCA http://www.inapesca.gob.mx/

3.1.3 Acuacultura rural

Acuacultura que se desarrolla en el medio rural y como parte de las actividades de la población rural

INAPESCA http://www.inapesca.gob.mx/

3.2.Clasificación de la acuacultura por ambiente

Tipo de acuacultura según el medio ambiente en que se la practica

ASFA: Aquatic Sciences and Fisheries Abstracts http://www.csa.com/factsheets/aquclust-set-c.php

3.2.1 Acuacultura marina

Acuacultura que se desarrolla en el mar ASFA: Aquatic Sciences and Fisheries Abstracts http://www.csa.com/factsheets/aquclust-set-c.php

3.2.2 Acuacultura continental

Acuacultura que se desarrolla al interior de los continentes o tierra firme

ASFA: Aquatic Sciences and Fisheries Abstracts http://www.csa.com/factsheets/aquclust-set-c.php

3.3.3 Acuacultura en agua salobre

Contiene entre 5 y 30 gramos de sal por litro. El agua salobre es típica de los estuarios y resulta de la mezcla del agua del río correspondiente con el agua del mar

INAPESCA http://www.inapesca.gob.mx/

En la Figura 5 se muestra el resultado de entrenar y aplicar una red neuronal a listas de conceptos y en la Figura 6 un esquema metáfora navegable de una parte de la ontología en la etapa 2 del desarrollo. En la Tabla 2 se muestran ejemplos de relaciones semánticas.

Page 10: 1. R EPRESENTACIÓN DEL CONOCIMIENTO - … · En las ciencias de la computación, la inteligencia artificial y en particular la representación de l conocimiento (RC) , han evolucionado

Revista Electrónica de Socioeconomía, Estadística e Informática (RESEI) ISSN 2007 – 817X

Vol. 1 Num. 1, Julio - Diciembre de 2012

Colegio de Postgraduados, México 15

Figura 5. Resultado de aplicación de una red neuronal a listas de conceptos

Figura 6 Metáfora navegable de una ontología.

Page 11: 1. R EPRESENTACIÓN DEL CONOCIMIENTO - … · En las ciencias de la computación, la inteligencia artificial y en particular la representación de l conocimiento (RC) , han evolucionado

Revista Electrónica de Socioeconomía, Estadística e Informática (RESEI) ISSN 2007 – 817X

Vol. 1 Num. 1, Julio - Diciembre de 2012

Colegio de Postgraduados, México 16

Tabla 2 Relaciones Semánticas Estructurales o Estáticas

Tipo de Relación Descripción

Entre concepto A y concepto B

Observaciones y ejemplos

Asociación Relación o acoplamiento estático.

Tiene * A=Acuacultura tiene B=Mercado

A= Especie tiene B=Mercado

Explicativa Relaciones que aparecen explícitas a nivel de OWL.

Propiedades de objeto, de dato, de anotación.

Sinonimia Conceptos sinónimos. Acuacultura sinónimo Acuicultura

Control o Restricción

Capta significados de dependencia, restricción, control o norma, etc.

Cultiva * Relación genérica que puede especificarse Relaciona A = Especies con B = infraestructura.

Las especies cultivadas dependen de la Infraestructura.

La Infraestructura restringe el tipo de Especies que pueden cultivarse.

Equivalencia Equivalencia de conceptos, pueden usarse indistintamente sin llegar a ser sinónimos estrictos.

Acuacultura en Aguas Continentales equivalente Acuacultura de Agua Dulce

Oposición Oposición de conceptos, A es el opuesto de B. Indica que no hay relación de sinonimia, ni de equivalencia ni de similitud.

Agua salada opuesta agua dulce

Lago opuesto Laguna

Por las condiciones de la práctica de la acuacultura que puede practicarse los conceptos son opuestos.

En la Figura 7 se muestran partes de la ontología OntoAquaMx traducida a OWL, en formato de visualización de la herramienta NeOn Toolkit (NeOn Foundation, 2012).

Page 12: 1. R EPRESENTACIÓN DEL CONOCIMIENTO - … · En las ciencias de la computación, la inteligencia artificial y en particular la representación de l conocimiento (RC) , han evolucionado

Revista Electrónica de Socioeconomía, Estadística e Informática (RESEI) ISSN 2007 – 817X

Vol. 1 Num. 1, Julio - Diciembre de 2012

Colegio de Postgraduados, México 17

Figura 7. Parte de la ontología OntoAquaMx

6. Comentarios finales En este trabajo se introdujeron las ontologías, mecanismos de representación del conocimiento, consideradas los pilares del manejo semántico de la información en la WS. Actualmente se construyen ontologías para prácticamente todos los campos, por las facilidades que brindan a aplicaciones diversas y por su contribución a la solución de problemas que siguen siendo vigentes en las ciencias computacionales, tales como la integración de bases de datos heterogéneas, sistemas par-par (peer-to-peer), memorias corporativas, redes sociales, comercio electrónico y búsqueda de servicios que conjuntan fuentes de información. La construcción de sistemas inteligentes y la solución de disparidades semánticas en cuanto a conceptualización, perspectivas y contextos ofrecen preguntas abiertas y temas de investigación. Aparecen propuestas de especificaciones y estándares para apoyar a los sistemas de organización y manejo del conocimiento - KOS- Knowledge Organization Systems. (W3C, 2012)- y enfoques multidisciplinarios como la minería de datos, que persigue la extracción de patrones ocultos en grandes bases de datos y su transformación en conocimiento mediante técnicas estadísticas avanzadas.

7. Referencias Documentales Barr, A. (1993, Julio). “ Active Information Systems: The Evolution of Expert Systems Technology”. "Out of the Lab"

column, IEEE Expert. Disponible en : http://www.stanford.edu/group/scip/avsgt/expertsystems/activeinfosys_fn.html#fn0 (Consultado: enero 06, 2012).

Berners-Lee, T., Hendler, J. y Lassila, O. (2001, Mayo). “The Semantic Web". Scientific American Magazine, 34-43.

Page 13: 1. R EPRESENTACIÓN DEL CONOCIMIENTO - … · En las ciencias de la computación, la inteligencia artificial y en particular la representación de l conocimiento (RC) , han evolucionado

Revista Electrónica de Socioeconomía, Estadística e Informática (RESEI) ISSN 2007 – 817X

Vol. 1 Num. 1, Julio - Diciembre de 2012

Colegio de Postgraduados, México 18

Cuevas A-D., Guzman-Arenas, A., (2010, Enero), “Automatic fusion of knowledge stored in ontologies”, Journal Intelligent Decision Technologies - Engineering and management of IDTs for Knowledge Management Systems, 4 (1), pp. 5-19.

FAO (2012) “AGROVOC”. Disponible en: http://aims.fao.org/es/website/AGROVOC/sub/AGROVOC-Thesaurus/sub. (Consultado el 13 de enero de 2012)

Fernández-López, M., Goméz-Pérez A. y Jurista N., (1997) “Methontology: From ontological art towards ontological engineering”, AAAI Technical Report SS-97-06.

Fernández-Ordóñez, Y. M., JRG Pulido, R. C. Medina-Ramírez y J. Soria-Ruiz (2011) “Aquaculture knowledge elicitation: a semantic viewpoint” 3-10. En M. Martín Ortíz & I. Olmos Pineda, Mathematical Models and ITC: Theory and Applications, BUAP-PROMEP, 300p, ISBN: 978-607-487-353-5. México.

Fernández-Ordóñez, Y., Soria-Ruiz, J., Medina-Ramírez, R.C., JRGPulido, (Noviembre 2010) “OntoAquaMx: Ontología para la Práctica y el Fomento de la Acuacultura en México”, Memorias del CIINDET 2010 VIII Congreso Internacional sobre Innovación y Desarrollo Tecnológico, Cuernavaca, Morelos, México. 2010. ISBN:978-607-95255-2-1.

Guerra García, E. J., (2011 Diciembre), “Sistema Con Enfoque Semántico Para La Gestión Vía Web De Recursos De Información Forestal”, Tesis de Maestría en Ciencias en Computación Aplicada, Colegio de Postgraduados, México.

Hart, G, Dolbear, C., Goodwin, J., y Kovacs, K (2007) “Domain Ontology Development”, Ordnance Survey Research. V1.0, July, 2007.

Hernández Ramón, J. (2011 Diciembre), “Gestión Vía Web de una Memoria de Recursos Didácticos Considerando su Naturaleza Semántica”, Tesis de Maestría en Ciencias en Computación Aplicada, Colegio de Postgraduados, México.

Hodge, G. (2000). Systems of Knowledge Organization for Digital libraries: Beyond traditional authority files. Disponible en: http://www.clir.org/pubs/reports/pub91/contents.html (Consultado: diciembre 18, 2011)

Howse, J., Stapleton, G. and Oliver, I. (2010) “Visual reasoning about ontologies”, International Semantic Web Conference, November 2010, China.

Islam, A., Inkpen, D., (2008, Julio), “Semantic text similarity using corpus-based word similarity and string similarity”, Transactions on Knowledge Discovery from Data Volume 2 (2).

JRGPulido (2003) “Ontology Learning for the Semantic Web: An Approach Based on Self-Organizing Maps”, Tesis doctoral en ciencias computacionales, Universidad de Nottingham, Inglaterra.

Kifer, M., Lausen, G., Wu, J. (Julio, 1995) “Logical foundations of object-oriented and frame-based languages”, Journal of the ACM, 42 (4), 741-843.

Konstantinou, N., Spanos, D-E., Mitrou, N. (Marzo, 2008) “Ontology and database mapping: a survey of current implementations and future directions”, Journal of Web Engineering , 7 (1).

Lacy, L. (2005). OWL: Representing Information Using the Web Ontology Language, Bloomington, Indiana: Trafford Publishing.

Liang, A., Salokhe, G., Sini, M., y Keizer, J. (2009) “Towards An Infrastructure For Semantic Applications: Methodologies For Semantic Integration Of Heterogeneous Resources”. Reportes FAO, 2009. ftp://ftp.fao.org/docrep/fao/009/ag869e/ag869e00.pdf (Consultado: enero 06, 2012)

Medina-Ramírez, R.C y Ramos-Ramos, V.M. (2007, Junio) “A Semantic Web Approach To Enrich Information Retrieval Answers”, 9th International Conference on Enterprise Information Systems. ICEIS (4) 2007, Funchal, Madeira, Portugal, 299-302.

Monsalvo Zamora, A. (2012) Guía para la Administración del Conocimiento: Una Memoria Corporativa para el Colegio de Postgraduados. Proyecto de investigación, Colegio de Postgraduados, México.

Page 14: 1. R EPRESENTACIÓN DEL CONOCIMIENTO - … · En las ciencias de la computación, la inteligencia artificial y en particular la representación de l conocimiento (RC) , han evolucionado

Revista Electrónica de Socioeconomía, Estadística e Informática (RESEI) ISSN 2007 – 817X

Vol. 1 Num. 1, Julio - Diciembre de 2012

Colegio de Postgraduados, México 19

Neon Foundation (2012). Disponible en: http://neon-toolkit.org/wiki/Main_Page. (Consultado: enero 06, 2012).

Noy, N. F., Sintek, M., Decker, S. Crubézy, M., Fergerson, R. W. y Mark A. Musen, M.A. (2001).“Creating Semantic Web Contents with Protégé-2000”. IEEE Intelligent Systems, Marzo de 2001, 60-71.

Noy, N.F. y McGuinness, D.L. (2001) "Ontology development 101: A guide to creating your first ontology", Stanford Knowledge Systems Laboratory Technical Report KSL-01-0. Disponible en: http://www-ksl.stanford.edu/people/dlm/papers/ontology-tutorial-noy-mcguinness.pdf (Consultado: marzo 28, 2008).

Popular web browsers. (2011). http://www.webdevelopersnotes.com/articles/popular-web-browsers.php (Consultado: noviembre 18, 2011).

Shadbolt, N. y Berners-Lee, T. (2008, Octubre). “Web Science Emerges,” Scientific American Magazine, 76-81.

Shadbolt,N., Hall, W. y Berners-Lee, T. (2006, Mayo/Junio) "The Semantic Web Revisited". IEEE Intelligent Systems Journal, 96-101.

Soergel, D., Lauser, B., Liang, A., Fisseha, F., Keizer, J., & Katz, S. (2006). “Reengineering Thesauri for New Applications: the AGROVOC Example”. Journal Of Digital Information, 4(4). Disponible en: http://journals.tdl.org/jodi/article/view/112/111 (Consultado: febrero 05, 2012).

Stoutenburg, S, Kalita, J y Hawthorne S. “Extractin Semantic Relationships between Wikipedia Articles”. Disponible en: http://www.cs.uccs.edu/~kalita/work/reu/papers/sofsem08-stoutenburg-wikipedia.pdf (Consultado: febrero 19, 2010).

Swartout, W. y Tate, A. (I999, Enero/Febrero). “Ontologies”, IEEE Intelligent Systems Systems,18-19.

Vassev, E. y Hinchey, M. (2011) “Knowledge Representation and Reasoning for Intelligent Software Systems”. IEEE Computer, 44 (8), 96-99.

W3C (2012) SKOS Simple Knowledge Organization System. http://www.w3.org/2004/02/skos/ (Consultado marzo 20, 2012)