ia unidad4.pdf

8/18/2019 IA unidad4.pdf

1/16

Universidad Autónoma del Estado

de Hidalgo

Instituto de Ciencias Básicas

e Ingenierı́a

Inteligencia Artificial

Licenciatura en

Sistemas Computacionales

Karla I. López De La Cruz

mailto:lopezdelacruz [email protected]

Julio de 2013

Este documento contiene las notas de la unidad 2 para el curso de Inteligencia Artificial. La

unidad tiene como objetivo relacionar los conceptos matemáticos estudiados con modelos

computacionales para representar y almacenar conocimiento.


2/16


3/16

Índice general

1. Lógica difusa 11.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2. Conjuntos difusos y variables lingǘısticas . . . . . . . . . . . . . . . . . . . 2

1.2.1. Representación de conjuntos difusos . . . . . . . . . . . . . . . . . . 2

1.2.2. Operaciones entre conjuntos difusos . . . . . . . . . . . . . . . . . . 51.2.3. Relaciones difusas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.3. Reglas e inferencia difusa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.4. Desarrollo de un sistema experto difuso . . . . . . . . . . . . . . . . . . . . 9

I


4/16

II ÍNDICE GENERAL


5/16

1

Lógica difusa

1.1. IntroducciónEn sentido estricto lógica difusa es una generalización de la lógica clásica para razona-

mientos con incertidumbre. En un sentido más amplio, la lógica difusa se refiere a todaslas teoŕıas y tecnoloǵıas que emplean conjuntos difusos, los cuales son clases con ĺımitesvagamente definidos.

Entre otras caracteŕısticas que diferencian a la lógica difusa de la lógica clásica se en-cuentran

El grado de verdad de una aseveración en la lógica bivalente toma un valor entre unconjunto finito de valores: verdadero o falso; en la lógica difusa, el grado de verdades un subconjunto que se puede expresar como verdadero, muy verdadero, bastantefalso, no muy falso, etc.

En la lógica clásica los predicados son concretos, mientras que en la lógica difusapueden ser tanto ńıtidos como difusos.

La lógica bivalente admite sólo dos cuantificadores: el universal ∀ y el existencial ∃.La lógica difusa admite además una gran variedad de cuantificadores difusos comomuchos, pocos, algunos, la mayoŕıa, etc. Estos se pueden interpretar como números

difusos que dan una caracterización imprecisa del cardinal de un conjunto difuso oclásico.

Este tipo de razonamiento aproximado permite distintas interpretaciones de las sen-tencias: casi cierto, muy falso,poco verdadero, etc.

Principio de incompatibilidadA medida que la complejidad de un sistema aumenta, disminuye nuestra capacidad parahacer afirmaciones precisas, incluso significativas sobre su comportamiento, hasta que sealcanza un umbral más allá del cual precisión y relevancia son caracteŕısticas mutuamente

excluyentes (Zadeh).

1


6/16

2 1.2. Conjuntos difusos y variables lingüı́sticas

1.2. Conjuntos difusos y variables lingǘısticas

Un conjunto clásico tiene ĺımites duramente definidos, por ejemplo, un conjunto clásicode numeros reales mayores que 6 puede expresarse como sigue:A = x|x > 1.8Donde existe un ĺımite duramente definido 1.8 tal que si x es mayor que este número,entonces x pertenece al conjunto A; de otra forma x no pertenece al conjunto. Aunque losconjuntos clásicos son útiles para varias aplicaciones y son una herramienta importantepara las ciencias matemáticas y computacionales, no reflejan la naturaleza de los concep-tos y pensamientos humanos, que tienden a ser abstractos e imprecisos. Por ejemplo, sepuede expresar matemáticamente el conjunto de personas altas como una colecci ón depersonas cuya altura es mayor que 1.80m. Si definimos A = personasaltas y x = altura.De modo que esta es una representación poco natural e inadecuada del concepto de ”per-sona alta”. La teoŕıa de conjuntos clásica clasificaŕıa a una persona de 1.8001m como

una persona alta, pero no a una persona de 1.7999m. Esta distinción es intuitivamentepoco razonable debido a la transición abrupta entre la inclusión y la exclusión del conjunto.

En contraste a los conjuntos clásicos, un conjunto difuso no tiene ĺımites duramente defini-dos, esto significa que la transición de pertenencia a no pertenencia al conjunto es gradualy es caracterizada por funciones de pertenencia que dan flexibilidad a los conjuntos difusospara modelar expresiones lingǘısticas como .el agua está caliente.o ”la temperatura es alta”.Como Zadeh señala, los conjuntos o clases definidos de forma imprecisa tienen un papelimportante en el pensamiento humano, particularmente en el dominio del reconocimientode patrones, comunicación de información y abstracción. La naturaleza difusa no viene de

la aleatoriedad de los miembros del conjunto, sino de la naturaleza incierta e imprecisade los pensamientos y conceptos abstractos.

Variable lingǘıstica. Es una variable cuyos valores son palabras o sentencias en len-guaje natural o artificial reducido.

1.2.1. Representación de conjuntos difusos

La función caracteŕıstica o función de pertenencia µ indica el grado de pertenencia deun elemento a un conjunto. Su valor vaŕıa de forma continua en un intervalo, admitiendola posibilidad de pertenencia parcial de un elemento a un conjunto.

La función de pertenencia generalizada toma sus valores de un conjunto L, llamado conjun-to de pertenencia. Los elementos de L no tienen que ser necesariamente números; cualquierconjunto total o parcialmente ordenado seŕıa igualmente válido. Ordinariamente se tomael conjunto de números reales comprendido entre 0 y 1. L = [0, 1]

µA(x) =

1 si x ∈ A0 si x /∈ A

(1.1)

µA(x) = [0, 1] (1.2)

Para el conjunto de sólo dos valores, 0 ó 1, L = 0, 1, A se reduce a un conjunto ordi-nario, de manera que la teoŕıa clásica de conjuntos es un caso particular de la teoŕıa de


7/16

1. Lógica difusa 3

conjuntos difusos, en los que la función de pertenencia toma exclusivamente valores de 0ó 1.

La función de pertenencia puede definirse de forma numérica, mediante un vector (parauniversos discretos y finitos) o de forma funcional, em cuyo caso tiene generalmente formade campana, triangular, trapezoidal, etc. En este caso puede depender de parámetros quepermitan variar su forma. La representación gráfica de una función de pertenencia es otraforma de representar los conjuntos difusos que resulta útil para compararlos y operar conellos.

Un conjunto difuso A es un conjunto de pares ordenados de un elemento genérico xque pertenece al universo de discurso U y su grado de pertenencia al conjunto

A = x|µA(x), ∀x ∈ U (1.3)

EJEMPLOS

Funciones de pertenencia generalizadas

Figura 1.1: Función de pertenencia triangular

Triangular(x,a,b,c) =

0 x ≤ a

x−ab−a

a ≤ x < bc−x

c−b b ≤ x < c0 c < x

(1.4)


8/16


Figura 1.2: Función de pertenencia trapezoidal

Trapezoidal(x,a,b,c,d) =

0 x ≤ ax−ab−a

a ≤ x < b

1 b ≤ x < cd−xd−c

b ≤ x < c

0 d < x

(1.5)

Figura 1.3: Función de pertenencia gaussiana

Gaussiana(x,c,σ) = e−1

2(x−c

σ)2 (1.6)


9/16


Figura 1.4: Función de pertenencia Bell

Bell(x,a,b,c) = 1

1 + |x−ca

|2b (1.7)

Figura 1.5: Función de pertenencia sigmoidal

Sigmoidal(x,a,c) = 1

1 + e−a(x−c) (1.8)

1.2.2. Operaciones entre conjuntos difusos

Las operaciones entre conjuntos difusos se definen de la siguiente forma:

Complemento.C (A) = {x|µC (A)(x) = 1 − µA(x), ∀x ∈ U } (1.9)


10/16


Unión.

A ∪ B = {x|µA∪B(x) = max(µA(x), µB(x)), ∀x ∈ U } (1.10)

Intersección.

A ∩ B = {x|µA∪B(x) = min(µA(x), µB(x)), ∀x ∈ U } (1.11)

Puede equipararse a la interpretacíon de los operadores lógicos not, and or y and, y sepuede comprobar que incluyen, como casos particulares, a las definiciones para conjuntosclásicos para L = 0, 1.La mayoŕıa de las propiedades de las operaciones entre conjuntos clásicos se siguen cum-pliendo, excepto dos:

Principio de contradicción clásico

A ∩ Ā = ∅ (1.12)

Ley del tercio excluso clásicaA ∪ Ā = U (1.13)

Modificadores lingǘısticos. A los conjuntos difusos se les puede aplicar operadoreso reglas de modificación. Los modificadores lingǘısticos son adverbios que se utilizan confrecuencia en el lenguaje natural para especificar, junto con el predicado, una propiedadmás concreta. La interpretacíon de los modificadores corresponde a un cambio en la formade la función de pertenencia para representar la acción de ese modificador sobre la funciónoriginal.

Los modificadores se modelan en la teoŕıa de conjuntos difusos mediante operaciones

sobre la función de pertenencia asociada al predicado que se está modificando.

Negación (No). Operación unaria que da como resultado el complemento.

NEG(µ(x)) = 1 − µ(x) (1.14)

Concentración (Muy). Operación unaria que aplicada a un conjunto difuso A, da comoresultado un subconjunto difuso de A tal que la reducción en los grados de pertenenciamás altos de la función es mucho menor que la reducción en los grados más bajos.

CON (µ(x)) = µ2(x) (1.15)


11/16


Dilatación (Algo, casi, más o menos). Operación unaria que da un resultado opuesto

a la concentración; admite distintas definiciones.

DIL(µ(x)) = 2µ(x) − µ2(x) (1.16)

Intensificación (Bastante). Operación unaria que se suele utilizar en combinación conalguna otra operación para hacer más selectiva una propiedad.

I N T µ(x) =

2µ2(x) si 0 ≤ µ(x) ≤ 0.5

1 − 2(1 − µ(x))2 si µ(x) > 0.5(1.17)

1.2.3. Relaciones difusas

Una relación representa la presencia o ausencia de asociación entre dos elementos dedos o más conjuntos. Este concepto se puede generalizar asignando a cada grupo de ele-mentos un número comprendido entre 0 y 1 que represente el grado de pertenencia a larelación, en este caso difusa.

Relaciones clásicas entre conjuntos difusos A y B son conjuntos clásicos defini-dos sobre el mismo universo de discurso.

Inclusión.A ⊂ Bsi µA(x) ≤ µB(x), ∀x ∈ U (1.18)

Equivalencia.A = Bsi µA(x) = µB(x), ∀x ∈ U (1.19)

Desigualdad. A = Bsi µA(x) = µB(x), ∀x ∈ U (1.20)

Relaciones difusas entre conjuntos clásicos Las relaciones definidas de esta for-ma son binarias, ARB donde A y B son conjuntos clásicos que pueden estar definidos enuniversos de discurso diferentes y R es un subconjunto difuso del producto cartesiano deA y B. Se obtiene como resultado un conjunto de pares ordenados (x, y), cada uno conun determinado grado de pertenencia µR a la relación R, que indica en qué grado o con

qué intensidad los elementos (x, y) están en la relación R. Las relaciones binarias difusaspueden representarse mediante matrices. Observe el siguiente ejemplo.


12/16


x ∈ U 1 es un familiar cercano de y ∈ U 2

U 1 = {madre, to, primo}

U 2 = {hijo}

R Madre T́ıo PrimoHijo 1 0.6 0.3

Cuadro 1.1: Relación difusa es un familiar cercano

Relaciones difusas entre conjuntos difusos R es un subconjunto difuso del pro-

ducto cartesiano de A y B.

Producto cartesiano. Admite varias definiciones, en la definición estándar se asignaa cada pareja formada por un elemento de U 1 y otro de U 2, el menor de sus grados depertenencia al conjunto A y al conjunto B respectivamente

A × B = {(x, y)|µA×B(x, y) = min(µA(x), µB(y)), ∀x ∈ U 1, ∀y ∈ U 2} (1.21)

La operación es similar a la definición de la intersección, excepto que, como los universosson diferentes, el conjunto difuso resultante está formado por parejas.

Composición de relaciones. Puede ser expresada como una secuencia de operacio-nes max − ∗, donde ∗ es cualquier operador de la clase de las normas triangulares; losmás usuales son el mı́nimo, producto algebraico, producto drástico o producto acotado.El operador es elegido según la aplicación especı́fica.

R1(U 1, U 2)◦R2(U 2, U 3) = R3(U 1, U 3) (1.22)

dondeR3(U 1, U 3) = {(x, z )|µR1◦R2(x, z ), ∀x ∈ U 1, ∀y ∈ U 2, ∀z ∈ U 3} (1.23)

µR1◦R2(x, z ) = max[∀y ∈ U 2 : min(µR1(x, y), µR2(y, z ))] (1.24)

Existe una similitud entre esta operación y el producto matricial, asociando la sumacon la operación max y el producto con la operación min. En este caso la composición derelaciones difusas es conocida con el nombre de producto matricial max − min. Observeel siguiente ejemplo:

U 1 = { primavera, verano, otoo, invierno}

U 2 = {fro, calor}

U 3 = {shorts, abrigo, impermeable}

Se definen sobre ellos las siguientes relaciones


13/16


R1(U 1, U 2) Fŕıo CalorPrimavera 0.4 0.6Verano 0 1

Otoño 0.6 0.4Invierno 1 0

R2(U 2, U 3) Shorts Abrigo ImpermeableFŕıo 0.1 0.9 0.6Calor 0.9 0.1 0.4

La composición de relaciones se ejecuta de la siguiente manera

µ(1,1) = max[min(0.4, 0.1),min(0.6, 0.9)] = max(0.1, 0.6) = 0.6µ(1,2) = max[min(0.4, 0.9),min(0.6, 0.1)] = max(0.4, 0.1) = 0.4µ(1,3) = max[min(0.4, 0.6),min(0.4, 0.4)] = max(0.4, 0.4) = 0.4

R3(U 1, U 3) =

0.4 0.60 1

0.6 0.41 0

◦

0.1 0.9 0.60.9 0.1 0.4

=

0.6 0.1 0.40.9 0.1 0.40.4 0.6 0.60.1 0.9 0.6

(1.25)

1.3. Reglas e inferencia difusaImplicación Mamdani. Sean a y b dos conjuntos difusos,Para obtener conclusiones a partir de una base de reglas se necesita un mecanismo

que produzca una salida a partir de una colección de reglas. Esto se hace usando la reglacomposicional de inferencia (CROI). La regla de inferencia modus ponens

a ∧ (a → b) → b (1.26)

describe que si la sentencia a → b es verdadera, y también a lo es, entonces podemosinferir que b es verdadera. La lógica difusa generaliza esto en el modus ponens generalizado(GMP)

a ∧ (a → b) → b (1.27)

En lógica difusa se permite que los conjuntos a y b sean ligeramente diferentes de a y b

1.4. Desarrollo de un sistema experto difuso

El problema de la propina. ¿cuál es el porcentaje adecuado de propina? Dado un nú-mero entre 0 y 10 que representa la calidad del servicio en el restaurante, donde 10 es

excelente. La propina promedio es de 15 % sobre el total de los alimentos consumidos,aunque el porcentaje vaŕıa de acuerdo a la calidad del servicio.


14/16

10 1.4. Desarrollo de un sistema experto difuso

Aproximación no difusa

La relación más simple posible es suponer que la propina siempre es igual al 15 % dela cuenta total

tip = 0.15

Figura 1.6: Primera aproximación no difusa

Esta aproximación no considera la calidad del servicio, aśı que se agrega un términoa la ecuación. Dado que el servicio, está representado en una escala de 0 a 10, la propinapuede ir de forma lineal de 5 % si el servicio es malo a 25 %, si el servicio es excelente.

tip = 0.2/10 ∗ servicio + 0.05

Figura 1.7: Segunda aproximación no difusa


15/16


Hasta ahora la fórmula no resuelve el problema. Si se desea considerar además lacalidad de la comida en el cálculo de la propina, el problema extendido se define de lasiguiente forma

Dados dos conjuntos de números entre 0 y 10, donde 10 es excelente, que representanla calidad de servicio y de la comida respectivamente, ¿cuál es el porcentaje adecuado depropina?

La fórmula se modifica con la nueva variable

tip = 0.2/20 ∗ (servicio + calidad) + 0.05

Figura 1.8: Tercera aproximación no difusa

En este caso se debe analizar el resultado más de cerca. Suponiendo que el servicio esun factor más importante que la calidad de la comida. Digamos que el servicio aporte el80 % al total de la propina y que la comida aporte el 20 % restante

servratio = 0.8

tip = servratio ∗ (0.2/10 ∗ (servicio + 0.05) + . . .(1 − servratio) ∗ (02/10 ∗ food + 0.05);

El enfoque difuso Serı́a apropiado capturar sólo la esencia del problema, dejando delado todos los factores arbitrarios. Al realizar una lista de lo realmente importante en elproblema se obtienen las siguientes descripciones:

1. Si servicio es malo, entonces propina es pobre

2. Si servicio es bueno, entonces propina es regular

3. Si servicio es excelente, entonces propina es generosa


16/16

12 1.4. Desarrollo de un sistema experto difuso

El orden de las reglas es arbitrario. Si se desea incluir el efecto de la comida en la propina,se agregan 2 reglas

4 Si comida es mala, entonces propina es pobre

5 Si comida es deliciosa, entonces propina es generosa

Al combinar las 5 reglas se obtiene

1. Si servicio es malo o comida es mala, entonces propina es pobre

2. Si servicio es bueno, entonces propina es regular

3. Si servicio es excelente o comida es deliciosa, entonces propina es generosa

Estas 3 reglas son la parte principal de la solución y son parte de un sistema de lógica

difusa. A continuación se proporciona significado matemático a las variables lingüı́sticasy el sistema de inferencia difuso estará completo

Pasos

1. Identificar variables lingǘısticas asociadas al problema

2. Definir las funciones de pertenencia de cada variable o clases difusas a las cualespuede pertenecer la variable

3. Definir el rango de validez de las clases difusas

4. Fusificar las entradas o calcular los valores de pertenencia de las variables a las clasesdifusas

5. Aplicar operadores lógicos difusos

6. Aplicar operador de implicación

7. Agregar las salidas de cada una de las reglas

8. Defusificar el poĺıgono resultante

ia unidad4.pdf

Documents