u5l01 conocimiento e incertidumbre

RAZONAMIENTO APROXIMADO

CONOCIMIENTO E INCERTIDUMBRE



2

Índice

Presentación ................................................................................................................................................. 3

¿Qué es el razonamiento aproximado?........................................................................................................ 4

Ámbitos de aplicación del razonamiento aproximado ................................................................................. 5

Razonamiento aproximado e incertidumbre. Dominios inciertos ............................................................... 6

Razonamiento aproximado e incertidumbre. Fuentes de error ................................................................... 7

Métodos de razonamiento aproximado ....................................................................................................... 8

El formalismo de los factores de certeza (CF) .............................................................................................. 9

Propagación de los factores de certeza y regla de encadenamiento I ....................................................... 11

Propagación de los factores de certeza y regla de encadenamiento II ...................................................... 12

Resumen ..................................................................................................................................................... 13



3

Presentación

El razonamiento aproximado se orienta a tratar el conocimiento que se utiliza en múltiples dominios

como la medicina o el derecho, o diferentes ámbitos de la ingeniería. En la unidad anterior nos hemos

centrado en los sistemas expertos y los sistemas basados en el conocimiento en los que los datos,

hechos, relaciones entre ellos, y conocimiento en general, se encontraban definidos de forma precisa y

clara. Esto no ocurre así en múltiples situaciones donde existe incertidumbre tanto en los datos con los

que el sistema trabaja, como en el propio conocimiento que utilizan los expertos, que puede ser más

vago e impreciso.

Las técnicas de razonamiento aproximado se orientan a gestionar este tipo de situaciones donde los

datos y el conocimiento son más imprecisos, vagos y pueden incluir diferentes fuentes de

incertidumbre. En esta unidad trataremos el razonamiento aproximado, y nos centraremos en dos

modelos que resultan especialmente representativos: el formalismo de los factores de certeza y la

lógica difusa.

Al terminar este tema serás capaz de:

Tener una visión general de qué es el razonamiento aproximado y en qué aspectos se centra.

Distinguir los ámbitos de aplicación del razonamiento aproximado.

Comprender la importancia de la incertidumbre en el razonamiento aproximado y las

diferentes fuentes de donde puede provenir.

Diferenciar la diversidad de técnicas de razonamiento aproximado.

Conocer el formalismo de los factores de certeza y la regla de encadenamiento.



4

¿Qué es el razonamiento aproximado?

De forma complementaria a los sistemas basados en el conocimiento que hemos visto en la anterior

unidad, existen muchas ocasiones en las que es necesario modelar conocimiento en el que las reglas o

relaciones entre los conceptos no son exactamente de tipo binario si/no o verdadero/falso.

En la vida diaria y en la toma de decisiones en dominios concretos es habitual hacer uso de

conocimiento que relaciona conceptos de forma más ambigua o con un cierto nivel de incertidumbre.

En este tema veremos un conjunto representativo de elementos en torno al razonamiento aproximado,

que permite abordar este tipo de situaciones.

Un conocimiento de este tipo del que hacemos uso todos los días puede ser por ejemplo: “Si está muy

nublado, es posible que llueva en unas horas”. No es un conocimiento que podamos representar

mediante una regla o un predicado lógico. No estamos expresando que “si está nublado lloverá”, de

forma precisa.

No es fácil encontrar una correspondencia de la frase anterior con un lenguaje de representación del

conocimiento que hemos visto en la unidad anterior. Incluye una cierta gradación e incertidumbre. Por

otra parte, es un conocimiento que puede resultarnos útil representar y ser capaces de integrar en un

sistema que opere con él.

Consideremos como ejemplo sencillo la siguiente regla:

Sistema experto de esta regla

La regla podría encontrarse en un sistema experto, dentro de un conjunto más amplio en el que se

estuviese representando el conocimiento de síntomas de enfermedades.

R: IF dolor.de.cabeza THEN gripe

Efectivamente, uno de los síntomas de la gripe es el dolor de cabeza. Por otra parte, la regla concluye

directamente que si existe dolor de cabeza, entonces la enfermedad es la gripe con toda seguridad. Una

regla parecida a la anterior, pero incorporando uno de los métodos que veremos en puntos siguientes,

el de factores de certeza, sería esta:

R: IF dolor.de.cabeza THEN gripe (CF = 0,3)

A diferencia de la anterior, en este formalismo estamos representando, de forma más gradual, e

incluyendo una dosis de incertidumbre o consideración de probabilidad, que efectivamente es posible

que el paciente tenga como enfermedad la gripe si tiene dolor de cabeza, pero con un factor de certeza

(CF) de 0,3 (que viene a representar su probabilidad, siendo el CF máximo 1,0).



5

Ámbitos de aplicación del razonamiento aproximado

Los ámbitos de aplicación en que se han utilizado sistemas de razonamiento aproximado son múltiples y

abarcan un amplio espectro, desde sistemas de control de transporte ferroviario, aire acondicionado,

control de aeronaves y procesos industriales, a sistemas de análisis y toma de decisiones en

biomedicina.

Técnicas de este tipo se han aplicado en sistemas diversos: de búsqueda de información en la web,

filtrado de spam y páginas web, marketing personalizado, comercio electrónico, control de cuencas

fluviales, clasificación de datos estelares, encaminamiento y clasificación de textos, y un largo

etcétera.

Por ver en más detalle, por ejemplo, en el dominio biomédico, este tipo de sistemas han sido utilizados

en aplicaciones concretas que han incluido:



6

Razonamiento aproximado e incertidumbre. Dominios inciertos

El razonamiento aproximado es la clave en sistemas orientados a campos de aplicación en los que la

incertidumbre de los datos que se analizan y la del conocimiento con que se trabaja en él juega un papel

especialmente protagonista.

El campo de la medicina es un ejemplo de dominio incierto. En él es frecuente un planteamiento en el

que se estudia un paciente, se presentan un conjunto de signos y síntomas, y un interrogante principal

es saber qué enfermedad tiene. Se puede tener tan incorporada esta pregunta que no siempre se es

capaz de percibir el grado de incertidumbre implícito. La relación entre los signos y los síntomas de las

enfermedades que los producen es variable (existen pacientes con iguales síntomas y diferentes

enfermedades).

De hecho, la secuencia de los eventos y los datos disponibles

puede no ser conocida con exactitud. No aceptar un cierto

grado de incertidumbre en la información puede abrir senderos

rápidos pero equivocados. El paciente puede administrar datos

equívocos, no estar seguro de tal o cuál afirmación o evocación,

puede haber ausencia de información, errores y subjetividad

por parte del paciente y por parte del médico.

El proceso mental que acerca al diagnóstico es complejo, el

concepto de probabilidad e incertidumbre están en mayor o

menor grado presentes. Para medir la incertidumbre, se puede

partir de un conjunto grande que incluya todas las posibilidades

de diagnóstico, luego construir un subconjunto acotado y

asignar un número real que mida el grado de incertidumbre

sobre tal o cual diagnóstico. Puede ser necesario acudir a medidas de probabilidad, y la intuición no

está excluida del proceso.

El campo de la medicina es efectivamente uno paradigmático de dominio incierto, pero todas estas

fuentes de incertidumbre pueden darse, y de hecho se dan en múltiples campos de las ciencias

naturales, el derecho, las humanidades y la ingeniería en sus distintos ámbitos de aplicación.



7

Razonamiento aproximado e incertidumbre. Fuentes de error

Existen situaciones donde los datos que debe procesar el sistema, o el conocimiento que proviene de un

experto y que queremos incluir, se encuentran rodeados de diferentes niveles de incertidumbre.

La incertidumbre puede tener origen en los datos, por ejemplo:

Los datos pueden no llegar o no estar disponibles en un determinado momento.

Los datos pueden estar disponibles, pero pueden ser ambiguos, o no ser de confianza, debido a

errores en medidas, medidas en conflicto, etc.

La representación de los datos puede ser imprecisa o inconsistente.

Los datos pueden ser simplemente la mejor estimación de un usuario.

Los datos pueden ser valores por defecto, y los valores por defecto pueden tener excepciones.

La incertidumbre puede provenir también del conocimiento representado e incluido en el sistema, ya

que puede:

Representar la mejor estimación de los expertos, basada en asociaciones plausibles o

estadísticas que han observado.

No ser apropiada en todas las situaciones, sino sólo en un subconjunto no determinado de

ellas.

Teniendo presentes estas numerosas fuentes de error, hay muchas situaciones en las que los sistemas

basados en el conocimiento requieren la incorporación de alguna forma de gestión de la incertidumbre.

Cuando se desarrolla un sistema hay tres aspectos principales a considerar, (algunos a veces son sutiles

pero pueden tener impacto significativo en el funcionamiento y conclusiones obtenidos por un sistema):



8

Métodos de razonamiento aproximado

En la actualidad existe un amplio abanico de diversos métodos y técnicas, y aplicaciones basadas en

ellos, orientados a la implementación de diferentes formas de razonamiento aproximado: hacemos una

revisión sintética de algunos de los más relevantes.

Las primeras aproximaciones se basaron de forma muy directa en el teorema de Bayes (al que ya

hemos hecho referencia en temas anteriores de esta asignatura) para relacionar probabilidades de

hipótesis y evidencias:

Respecto a los primeros sistemas basados en el método probabilístico clásico (a veces denominado

Bayes Ingenuo), el formalismo de los factores de certeza (CF), supuso un avance básico al permitir la

incorporación de criterios de incertidumbre y probabilidad en las reglas de los sistemas expertos.

Método probabilístico en sistemas expertos

El primer sistema experto en incorporarlo fue MYCIN, a principios de los años 70. En años siguientes, el

formalismo de los factores de certeza recibió mejoras en su fundamentación y fue incorporado de forma

creciente en diversos sistemas y entornos de desarrollo. Las redes bayesianas han sido en cierta medida

una continuación directa, y en la actualidad son utilizadas en diversos productos de fabricantes como

Microsoft, Digital, Hewlett‐Packard, IBM, Intel o Siemens, así como de fabricantes tecnológicos más

especializados.

También ha jugado un papel relevante en el ámbito del razonamiento aproximado la teoría de la

evidencia desarrollada inicialmente por Dempster en 1967 y posteriormente extendida por Shafer en

1976, y que es habitualmente denominada teoría de Dempster‐Shafer.

También, en el marco del razonamiento aproximado, la teoría de conjuntos difusos, y la lógica difusa

basada en ella, han sido la base de un número muy importante tanto de sistemas como de entornos de

desarrollo.



9

El formalismo de los factores de certeza (CF)

El conocimiento en un sistema experto que incorpore el formalismo de los factores de certeza, se

representa como un conjunto de reglas de la forma:

IF EVIDENCIA

THEN HIPOTESIS (CF)

Donde EVIDENCIA son uno o más hechos que dan soporte a que la HIPOTESIS sea cierta. El valor del CF

de la regla denota la confianza en que efectivamente la HIPOTESIS se dé, si EVIDENCIA ocurre. En este

formalismo, también a los hechos se les puede asignar un valor de CF, dependiendo del nivel de

seguridad o certidumbre con que se estén produciendo. Para verlo sobre un ejemplo, consideremos una

regla sencilla motivada en el dominio médico:

R: IF dolor.de.cabeza THEN gripe (0,3)

Valor de CF

El valor de CF oscila entre ‐1 y 1, de tal forma que un CF=1 es seguridad total, un CF= ‐1 es seguridad de

que no ocurre, y un CF = 0 es incertidumbre absoluta.

Los hechos que se incluyen como evidencia en las reglas, también pueden tener su CF para modelar una

situación. De esta forma, si estamos considerando una situación en la que alguien tiene dolor de cabeza

bastante intenso, podríamos asignarle un CF = 0,9 a dolor.de.cabeza. Si por el contrario, manifiesta que

no tiene absolutamente ningún tipo de dolor de cabeza, podríamos asignarle a dolor.de.cabeza un CF = ‐

0,9, o incluso un CF = ‐1,0. Dado un valor de CF para la EVIDENCIA, y aplicando la regla, el CF de la

HIPOTESIS se calcula mediante el producto de ambas, es decir:

CF(HIPOTESIS) = CF(EVIDENCIA) * CF(REGLA)

Por lo tanto, para un caso por ejemplo en que tuviésemos un CF = 0,9 para dolor.de.cabeza,

obtendríamos para gripe un CF = 0,9*0,3 = 0,27.



10

Explicación regla

Explicación de la regla

Con esta regla (que puede ser muy cuestionable en un caso real) estamos representando el

conocimiento de que si alguien tiene dolor de cabeza, es probable que tenga la gripe. Al asignarle un CF

= 0,3 a la regla R, estamos representando que estimamos un 30% aproximadamente de que

efectivamente ocurra, que si alguien tiene dolor de cabeza, tenga la gripe (esto se corresponde con que

es también bastante probable que alguien tenga dolor de cabeza, pero por otras razones, y que de

hecho no tenga la gripe).



11

Propagación de los factores de certeza y regla de encadenamiento I

Es habitual que tengamos una serie de reglas y que todas ellas influyan en una determinada hipótesis. Es

decir, para dos reglas, esta situación:

R1: IF EVIDENCIA1 THEN HIPOTESIS (CF1)

R2: IF EVIDENCIA2 THEN HIPOTESIS (CF2)

En este caso, surge la cuestión de cómo componer los valores obtenidos para el CF de HIPOTESIS a partir

de cada una de ellas.

Consideremos esto sobre el ejemplo sencillo:

R1: IF dolor.de.cabeza THEN gripe (0,5)

R2: IF fiebre THEN gripe (0,9)

Si por ejemplo obtenemos como resultado para gripe un CF(gripe) = 0,4 aplicando R1, y un CF(gripe) =

0,7 aplicando R2, ¿cómo componer ambos valores?

Podríamos por ejemplo intentar sumar ambos CF, pero este caso nos muestra que no puede ser así, ya

que obtendríamos un CF de 1,1 y, por definición el máximo CF es 1,0 (que sería certeza absoluta de

tener la gripe). Veremos a continuación la expresión que nos permite componer ambos CF respetando

sus propiedades.



12

Propagación de los factores de certeza y regla de encadenamiento II

El formalismo de CF incluye las siguientes expresiones para la composición de CF de dos reglas que

proporcionan evidencia para la misma hipótesis:

La expresión (E1) constituye la base de la denominada regla de encadenamiento, que permite

encadenar las conclusiones obtenidas por las reglas en el proceso de inferencia o razonamiento. La

expresión se puede fundamentar con teoría de probabilidades: ver en detalle esta cuestión queda fuera

de los objetivos de este tema, pero interesa tenerlo presente.

Las expresiones en (E1) permiten componer un número n de reglas, de forma iterativa. En el caso

anterior que comentábamos de los dos valores obtenidos para gripe de CF(gripe) = 0,4 y CF(gripe) = 0,7,

aplicaríamos la expresión (la opción correspondiente a los dos CF > 0), y obtendríamos un CF para la

gripe de:

R1+R2. CF(gripe) = 0,4 + 0,7*(1-0,4) = 0,82

En el tema siguiente veremos la utilización de todos estos elementos y su cálculo para dos ejemplos de

sistemas expertos simplificados: uno en un dominio jurídico simplificado, y otro en un sistema de

control de alarmas.



13

Resumen

Las técnicas de razonamiento aproximado se orientan a tratar situaciones en donde los datos y el

conocimiento tienen una cierta imprecisión o puede incluir diferentes fuentes de incertidumbre. En este

tema hemos proporcionado una visión general de qué es el razonamiento aproximado y en qué

aspectos se centra.

Hemos visto la diversidad de ámbitos de aplicación del razonamiento aproximado, como la biomedicina,

el derecho o la ingeniería. La incertidumbre juega un papel relevante en el conocimiento con el que se

trabaja en muchas situaciones de estos ámbitos de aplicación, y puede provenir de diversas fuentes.

Existe un cierto número de técnicas de razonamiento aproximado que incluyen las aproximaciones

bayesianas clásicas, el formalismo de los factores de certeza, las redes bayesianas, la teoría de la

evidencia de Dempster‐Shafer y la lógica difusa.

El formalismo de los factores de certeza (CF) permite representar en las reglas de un sistema experto el

nivel de confianza o probabilidad asociado a ella. La regla de encadenamiento permite calcular el valor

del CF resultante de la aplicación de las reglas, y de las conclusiones finales del proceso de

razonamiento.

u5l01 conocimiento e incertidumbre

Documents