u5l01 conocimiento e incertidumbre

13
RAZONAMIENTO APROXIMADO CONOCIMIENTO E INCERTIDUMBRE

Upload: alberto-alonso

Post on 19-Feb-2015

21 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: U5L01 Conocimiento e Incertidumbre

 

 

 

 

 

 

 

 

 

 

RAZONAMIENTO APROXIMADO 

 

CONOCIMIENTO E INCERTIDUMBRE 

Page 2: U5L01 Conocimiento e Incertidumbre

RAZONAMIENTO APROXIMADO 

CONOCIMIENTO E INCERTIDUMBRE 

 

  2

Índice 

Presentación ................................................................................................................................................. 3 

¿Qué es el razonamiento aproximado?........................................................................................................ 4 

Ámbitos de aplicación del razonamiento aproximado ................................................................................. 5 

Razonamiento aproximado e incertidumbre. Dominios inciertos ............................................................... 6 

Razonamiento aproximado e incertidumbre. Fuentes de error ................................................................... 7 

Métodos de razonamiento aproximado ....................................................................................................... 8 

El formalismo de los factores de certeza (CF) .............................................................................................. 9 

Propagación de los factores de certeza y regla de encadenamiento I ....................................................... 11 

Propagación de los factores de certeza y regla de encadenamiento II ...................................................... 12 

Resumen ..................................................................................................................................................... 13 

Page 3: U5L01 Conocimiento e Incertidumbre

RAZONAMIENTO APROXIMADO 

CONOCIMIENTO E INCERTIDUMBRE 

 

  3

Presentación 

 El razonamiento aproximado se orienta a tratar el conocimiento que se utiliza en múltiples dominios 

como la medicina o el derecho, o diferentes ámbitos de la ingeniería. En la unidad anterior nos hemos 

centrado en los sistemas expertos y los sistemas basados en el conocimiento en los que los datos, 

hechos, relaciones entre ellos, y conocimiento en general, se encontraban definidos de forma precisa y 

clara. Esto no ocurre así en múltiples situaciones donde existe incertidumbre tanto en los datos con los 

que el sistema trabaja, como en el propio conocimiento que utilizan los expertos, que puede ser más 

vago e impreciso. 

Las técnicas de razonamiento aproximado se orientan a gestionar este tipo de situaciones donde los 

datos y el conocimiento son más imprecisos, vagos y pueden incluir diferentes fuentes de 

incertidumbre. En esta unidad trataremos el razonamiento aproximado, y nos centraremos en dos 

modelos que resultan especialmente representativos: el formalismo de los factores de certeza y la 

lógica difusa. 

 

 

 

Al terminar este tema serás capaz de: 

Tener una visión general de qué es el razonamiento aproximado y en qué aspectos se centra. 

Distinguir los ámbitos de aplicación del razonamiento aproximado. 

Comprender la importancia de la incertidumbre en el razonamiento aproximado y las 

diferentes fuentes de donde puede provenir. 

Diferenciar la diversidad de técnicas de razonamiento aproximado. 

Conocer el formalismo de los factores de certeza y la regla de encadenamiento. 

   

Page 4: U5L01 Conocimiento e Incertidumbre

RAZONAMIENTO APROXIMADO 

CONOCIMIENTO E INCERTIDUMBRE 

 

  4

¿Qué es el razonamiento aproximado? 

De forma complementaria a los sistemas basados en el conocimiento que hemos visto en la anterior 

unidad, existen muchas ocasiones en las que es necesario modelar conocimiento en el que las reglas o 

relaciones entre los conceptos no son exactamente de tipo binario si/no o verdadero/falso.  

En la vida diaria y en la toma de decisiones en dominios concretos es habitual hacer uso de 

conocimiento que relaciona conceptos de forma más ambigua o con un cierto nivel de incertidumbre. 

En este tema veremos un conjunto representativo de elementos en torno al razonamiento aproximado, 

que permite abordar este tipo de situaciones.  

Un conocimiento de este tipo del que hacemos uso todos los días puede ser por ejemplo: “Si está muy 

nublado, es posible que llueva en unas horas”. No es un conocimiento que podamos representar 

mediante una regla o un predicado lógico. No estamos expresando que “si está nublado lloverá”, de 

forma precisa. 

No es fácil encontrar una correspondencia de la frase anterior con un lenguaje de representación del 

conocimiento que hemos visto en la unidad anterior. Incluye una cierta gradación e incertidumbre. Por 

otra parte, es un conocimiento que puede resultarnos útil representar y ser capaces de integrar en un 

sistema que opere con él. 

Consideremos como ejemplo sencillo la siguiente regla: 

Sistema experto de esta regla 

La regla podría encontrarse en un sistema experto, dentro de un conjunto más amplio en el que se 

estuviese representando el conocimiento de síntomas de enfermedades. 

 

R: IF dolor.de.cabeza THEN gripe

 

Efectivamente, uno de los síntomas de la gripe es el dolor de cabeza. Por otra parte, la regla concluye 

directamente que si existe dolor de cabeza, entonces la enfermedad es la gripe con toda seguridad. Una 

regla parecida a la anterior, pero incorporando uno de los métodos que veremos en puntos siguientes, 

el de factores de certeza, sería esta: 

 

R: IF dolor.de.cabeza THEN gripe (CF = 0,3)

 

A diferencia de la anterior, en este formalismo estamos representando, de forma más gradual, e 

incluyendo una dosis de incertidumbre o consideración de probabilidad, que efectivamente es posible 

que el paciente tenga como enfermedad la gripe si tiene dolor de cabeza, pero con un factor de certeza 

(CF) de 0,3 (que viene a representar su probabilidad, siendo el CF máximo 1,0). 

Page 5: U5L01 Conocimiento e Incertidumbre

RAZONAMIENTO APROXIMADO 

CONOCIMIENTO E INCERTIDUMBRE 

 

  5

Ámbitos de aplicación del razonamiento aproximado 

Los ámbitos de aplicación en que se han utilizado sistemas de razonamiento aproximado son múltiples y 

abarcan un amplio espectro, desde sistemas de control de transporte ferroviario, aire acondicionado, 

control de aeronaves y procesos industriales, a sistemas de análisis y toma de decisiones en 

biomedicina. 

Técnicas de este tipo se han aplicado en sistemas diversos: de búsqueda de información en la web, 

filtrado de spam y páginas web, marketing personalizado, comercio electrónico, control de cuencas 

fluviales, clasificación de datos estelares, encaminamiento y clasificación de textos, y un largo 

etcétera. 

Por ver en más detalle, por ejemplo, en el dominio biomédico, este tipo de sistemas han sido utilizados 

en aplicaciones concretas que han incluido: 

 

 

   

Page 6: U5L01 Conocimiento e Incertidumbre

RAZONAMIENTO APROXIMADO 

CONOCIMIENTO E INCERTIDUMBRE 

 

  6

Razonamiento aproximado e incertidumbre. Dominios inciertos 

El  razonamiento aproximado es  la clave en sistemas orientados a campos de aplicación en  los que  la 

incertidumbre de los datos que se analizan y la del conocimiento con que se trabaja en él juega un papel 

especialmente protagonista. 

 

El campo de la medicina es un ejemplo de dominio incierto. En él es frecuente un planteamiento en el 

que se estudia un paciente, se presentan un conjunto de signos y síntomas, y un interrogante principal 

es saber qué enfermedad tiene. Se puede tener tan incorporada esta pregunta que no siempre se es 

capaz de percibir el grado de incertidumbre implícito. La relación entre los signos y los síntomas de las 

enfermedades que los producen es variable (existen pacientes con iguales síntomas y diferentes 

enfermedades). 

 

De hecho,  la  secuencia de  los eventos  y  los datos disponibles 

puede  no  ser  conocida  con  exactitud.  No  aceptar  un  cierto 

grado de incertidumbre en la información puede abrir senderos 

rápidos pero equivocados. El paciente puede administrar datos 

equívocos, no estar seguro de tal o cuál afirmación o evocación, 

puede  haber  ausencia  de  información,  errores  y  subjetividad 

por parte del paciente y por parte del médico. 

El  proceso mental  que  acerca  al  diagnóstico  es  complejo,  el 

concepto  de  probabilidad  e  incertidumbre  están  en mayor  o 

menor grado presentes. Para medir la incertidumbre, se puede 

partir de un conjunto grande que incluya todas las posibilidades 

de  diagnóstico,  luego  construir  un  subconjunto  acotado  y 

asignar  un  número  real  que mida  el  grado  de  incertidumbre 

sobre  tal o cual diagnóstico. Puede ser necesario acudir a medidas de probabilidad, y  la  intuición no 

está excluida del proceso. 

 

El campo de la medicina es efectivamente uno paradigmático de dominio incierto, pero todas estas 

fuentes de incertidumbre pueden darse, y de hecho se dan en múltiples campos de las ciencias 

naturales, el derecho, las humanidades y la ingeniería en sus distintos ámbitos de aplicación. 

   

Page 7: U5L01 Conocimiento e Incertidumbre

RAZONAMIENTO APROXIMADO 

CONOCIMIENTO E INCERTIDUMBRE 

 

  7

Razonamiento aproximado e incertidumbre. Fuentes de error 

Existen situaciones donde los datos que debe procesar el sistema, o el conocimiento que proviene de un 

experto y que queremos incluir, se encuentran rodeados de diferentes niveles de incertidumbre. 

La incertidumbre puede tener origen en los datos, por ejemplo: 

Los datos pueden no llegar o no estar disponibles en un determinado momento. 

Los datos pueden estar disponibles, pero pueden ser ambiguos, o no ser de confianza, debido a 

errores en medidas, medidas en conflicto, etc. 

La representación de los datos puede ser imprecisa o inconsistente. 

Los datos pueden ser simplemente la mejor estimación de un usuario. 

Los datos pueden ser valores por defecto, y los valores por defecto pueden tener excepciones. 

 

La incertidumbre puede provenir también del conocimiento representado e incluido en el sistema, ya 

que puede:  

Representar la mejor estimación de los expertos, basada en asociaciones plausibles o 

estadísticas que han observado. 

No ser apropiada en todas las situaciones, sino sólo en un subconjunto no determinado de 

ellas. 

 

Teniendo presentes estas numerosas fuentes de error, hay muchas situaciones en las que los sistemas 

basados en el conocimiento requieren la incorporación de alguna forma de gestión de la incertidumbre. 

Cuando se desarrolla un sistema hay tres aspectos principales a considerar, (algunos a veces son sutiles 

pero pueden tener impacto significativo en el funcionamiento y conclusiones obtenidos por un sistema): 

 

 

   

Page 8: U5L01 Conocimiento e Incertidumbre

RAZONAMIENTO APROXIMADO 

CONOCIMIENTO E INCERTIDUMBRE 

 

  8

Métodos de razonamiento aproximado 

En la actualidad existe un amplio abanico de diversos métodos y técnicas, y aplicaciones basadas en 

ellos, orientados a la implementación de diferentes formas de razonamiento aproximado: hacemos una 

revisión sintética de algunos de los más relevantes. 

Las primeras aproximaciones se basaron de forma muy directa en el teorema de Bayes (al que ya 

hemos hecho referencia en temas anteriores de esta asignatura) para relacionar probabilidades de 

hipótesis y evidencias: 

 

 

 

Respecto a los primeros sistemas basados en el método probabilístico clásico (a veces denominado 

Bayes Ingenuo), el formalismo de los factores de certeza (CF), supuso un avance básico al permitir la 

incorporación de criterios de incertidumbre y probabilidad en las reglas de los  sistemas expertos. 

Método probabilístico en sistemas expertos 

El primer sistema experto en incorporarlo fue MYCIN, a principios de los años 70. En años siguientes, el 

formalismo de los factores de certeza recibió mejoras en su fundamentación y fue incorporado de forma 

creciente en diversos sistemas y entornos de desarrollo. Las redes bayesianas han sido en cierta medida 

una continuación directa, y en la actualidad son utilizadas en diversos productos de fabricantes como 

Microsoft, Digital, Hewlett‐Packard, IBM, Intel o Siemens, así como de fabricantes tecnológicos más 

especializados. 

 

 

También ha jugado un papel relevante en el ámbito del razonamiento aproximado la teoría de la 

evidencia desarrollada inicialmente por Dempster en 1967 y posteriormente extendida por Shafer en 

1976, y que es habitualmente denominada teoría de Dempster‐Shafer. 

También, en el marco del razonamiento aproximado, la teoría de conjuntos difusos, y la lógica difusa 

basada en ella, han sido la base de un número muy importante tanto de sistemas como de entornos de 

desarrollo. 

 

 

   

Page 9: U5L01 Conocimiento e Incertidumbre

RAZONAMIENTO APROXIMADO 

CONOCIMIENTO E INCERTIDUMBRE 

 

  9

El formalismo de los factores de certeza (CF) 

El conocimiento en un sistema experto que incorpore el formalismo de los factores de certeza, se 

representa como un conjunto de reglas de la forma: 

IF EVIDENCIA

THEN HIPOTESIS (CF)

 

Donde EVIDENCIA son uno o más hechos que dan soporte a que la HIPOTESIS sea cierta. El valor del CF 

de la regla denota la confianza en que efectivamente la HIPOTESIS se dé, si EVIDENCIA ocurre. En este 

formalismo, también a los hechos se les puede asignar un valor de CF, dependiendo del nivel de 

seguridad o certidumbre con que se estén produciendo. Para verlo sobre un ejemplo, consideremos una 

regla sencilla motivada en el dominio médico: 

R: IF dolor.de.cabeza THEN gripe (0,3)

 

Valor de CF 

El valor de CF oscila entre ‐1 y 1, de tal forma que un CF=1 es seguridad total, un CF= ‐1 es seguridad de 

que no ocurre, y un CF = 0 es incertidumbre absoluta. 

 

Los hechos que se incluyen como evidencia en las reglas, también pueden tener su CF para modelar una 

situación. De esta forma, si estamos considerando una situación en la que alguien tiene dolor de cabeza 

bastante intenso, podríamos asignarle un CF = 0,9 a dolor.de.cabeza. Si por el contrario, manifiesta que 

no tiene absolutamente ningún tipo de dolor de cabeza, podríamos asignarle a dolor.de.cabeza un CF = ‐

0,9, o incluso un CF = ‐1,0. Dado un valor de CF para la EVIDENCIA, y aplicando la regla, el CF de la 

HIPOTESIS se calcula mediante el producto de ambas, es decir: 

CF(HIPOTESIS) = CF(EVIDENCIA) * CF(REGLA)

 

Por lo tanto, para un caso por ejemplo en que tuviésemos un CF = 0,9 para dolor.de.cabeza, 

obtendríamos para gripe un CF = 0,9*0,3 = 0,27. 

 

 

 

 

 

Page 10: U5L01 Conocimiento e Incertidumbre

RAZONAMIENTO APROXIMADO 

CONOCIMIENTO E INCERTIDUMBRE 

 

  10

 

Explicación regla 

 

Explicación de la regla 

Con esta regla (que puede ser muy cuestionable en un caso real) estamos representando el 

conocimiento de que si alguien tiene dolor de cabeza, es probable que tenga la gripe. Al asignarle un CF 

= 0,3 a la regla R, estamos representando que estimamos un 30% aproximadamente de que 

efectivamente ocurra, que si alguien tiene dolor de cabeza, tenga la gripe (esto se corresponde con que 

es también bastante probable que alguien tenga dolor de cabeza, pero por otras razones, y que de 

hecho no tenga la gripe). 

   

Page 11: U5L01 Conocimiento e Incertidumbre

RAZONAMIENTO APROXIMADO 

CONOCIMIENTO E INCERTIDUMBRE 

 

  11

Propagación de los factores de certeza y regla de encadenamiento I 

Es habitual que tengamos una serie de reglas y que todas ellas influyan en una determinada hipótesis. Es 

decir, para dos reglas, esta situación: 

R1: IF EVIDENCIA1 THEN HIPOTESIS (CF1)

R2: IF EVIDENCIA2 THEN HIPOTESIS (CF2)

 

En este caso, surge la cuestión de cómo componer los valores obtenidos para el CF de HIPOTESIS a partir 

de cada una de ellas. 

Consideremos esto sobre el ejemplo sencillo: 

R1: IF dolor.de.cabeza THEN gripe (0,5)

R2: IF fiebre THEN gripe (0,9)

 

Si por ejemplo obtenemos como resultado para gripe un CF(gripe) = 0,4 aplicando R1, y un CF(gripe) = 

0,7 aplicando R2, ¿cómo componer ambos valores?  

Podríamos por ejemplo intentar sumar ambos CF, pero este caso nos muestra que no puede ser así, ya 

que obtendríamos un CF de 1,1 y, por definición el máximo CF es 1,0 (que sería certeza absoluta de 

tener la gripe). Veremos a continuación la expresión que nos permite componer ambos CF respetando 

sus propiedades. 

 

 

   

Page 12: U5L01 Conocimiento e Incertidumbre

RAZONAMIENTO APROXIMADO 

CONOCIMIENTO E INCERTIDUMBRE 

 

  12

Propagación de los factores de certeza y regla de encadenamiento II 

El formalismo de CF incluye las siguientes expresiones para la composición de CF de dos reglas que 

proporcionan evidencia para la misma hipótesis: 

 

 

 

La expresión (E1) constituye la base de la denominada regla de encadenamiento, que permite 

encadenar las conclusiones obtenidas por las reglas en el proceso de inferencia o razonamiento. La 

expresión se puede fundamentar con teoría de probabilidades: ver en detalle esta cuestión queda fuera 

de los objetivos de este tema, pero interesa tenerlo presente. 

Las expresiones en (E1) permiten componer un número n de reglas, de forma iterativa. En el caso 

anterior que comentábamos de los dos valores obtenidos para gripe de CF(gripe) = 0,4 y CF(gripe) = 0,7, 

aplicaríamos la expresión (la opción correspondiente a los dos CF > 0), y obtendríamos un CF para la 

gripe de: 

 

R1+R2. CF(gripe) = 0,4 + 0,7*(1-0,4) = 0,82

 

En el tema siguiente veremos la utilización de todos estos elementos y su cálculo para dos ejemplos de 

sistemas expertos simplificados: uno en un dominio jurídico simplificado, y otro en un sistema de 

control de alarmas. 

   

Page 13: U5L01 Conocimiento e Incertidumbre

RAZONAMIENTO APROXIMADO 

CONOCIMIENTO E INCERTIDUMBRE 

 

  13

Resumen 

Las técnicas de razonamiento aproximado se orientan a tratar situaciones en donde los datos y el 

conocimiento tienen una cierta imprecisión o puede incluir diferentes fuentes de incertidumbre. En este 

tema hemos proporcionado una visión general de qué es el razonamiento aproximado y en qué 

aspectos se centra.  

Hemos visto la diversidad de ámbitos de aplicación del razonamiento aproximado, como la biomedicina, 

el derecho o la ingeniería. La incertidumbre juega un papel relevante en el conocimiento con el que se 

trabaja en muchas situaciones de estos ámbitos de aplicación, y puede provenir de diversas fuentes. 

 

 

 

Existe un cierto número de técnicas de razonamiento aproximado que incluyen las aproximaciones 

bayesianas clásicas, el formalismo de los factores de certeza, las redes bayesianas, la teoría de la 

evidencia de Dempster‐Shafer y la lógica difusa. 

El formalismo de los factores de certeza (CF) permite representar en las reglas de un sistema experto el 

nivel de confianza o probabilidad asociado a ella. La regla de encadenamiento permite calcular el valor 

del CF resultante de la aplicación de las reglas, y de las conclusiones finales del proceso de 

razonamiento.