ia unidad4.pdf
TRANSCRIPT
-
8/18/2019 IA unidad4.pdf
1/16
Universidad Autónoma del Estado
de Hidalgo
Instituto de Ciencias Básicas
e Ingenierı́a
Inteligencia Artificial
Licenciatura en
Sistemas Computacionales
Karla I. López De La Cruz
mailto:lopezdelacruz [email protected]
Julio de 2013
Este documento contiene las notas de la unidad 2 para el curso de Inteligencia Artificial. La
unidad tiene como objetivo relacionar los conceptos matemáticos estudiados con modelos
computacionales para representar y almacenar conocimiento.
-
8/18/2019 IA unidad4.pdf
2/16
-
8/18/2019 IA unidad4.pdf
3/16
Índice general
1. Lógica difusa 11.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2. Conjuntos difusos y variables lingǘısticas . . . . . . . . . . . . . . . . . . . 2
1.2.1. Representación de conjuntos difusos . . . . . . . . . . . . . . . . . . 2
1.2.2. Operaciones entre conjuntos difusos . . . . . . . . . . . . . . . . . . 51.2.3. Relaciones difusas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3. Reglas e inferencia difusa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.4. Desarrollo de un sistema experto difuso . . . . . . . . . . . . . . . . . . . . 9
I
-
8/18/2019 IA unidad4.pdf
4/16
II ÍNDICE GENERAL
-
8/18/2019 IA unidad4.pdf
5/16
1
Lógica difusa
1.1. IntroducciónEn sentido estricto lógica difusa es una generalización de la lógica clásica para razona-
mientos con incertidumbre. En un sentido más amplio, la lógica difusa se refiere a todaslas teoŕıas y tecnoloǵıas que emplean conjuntos difusos, los cuales son clases con ĺımitesvagamente definidos.
Entre otras caracteŕısticas que diferencian a la lógica difusa de la lógica clásica se en-cuentran
El grado de verdad de una aseveración en la lógica bivalente toma un valor entre unconjunto finito de valores: verdadero o falso; en la lógica difusa, el grado de verdades un subconjunto que se puede expresar como verdadero, muy verdadero, bastantefalso, no muy falso, etc.
En la lógica clásica los predicados son concretos, mientras que en la lógica difusapueden ser tanto ńıtidos como difusos.
La lógica bivalente admite sólo dos cuantificadores: el universal ∀ y el existencial ∃.La lógica difusa admite además una gran variedad de cuantificadores difusos comomuchos, pocos, algunos, la mayoŕıa, etc. Estos se pueden interpretar como números
difusos que dan una caracterización imprecisa del cardinal de un conjunto difuso oclásico.
Este tipo de razonamiento aproximado permite distintas interpretaciones de las sen-tencias: casi cierto, muy falso,poco verdadero, etc.
Principio de incompatibilidadA medida que la complejidad de un sistema aumenta, disminuye nuestra capacidad parahacer afirmaciones precisas, incluso significativas sobre su comportamiento, hasta que sealcanza un umbral más allá del cual precisión y relevancia son caracteŕısticas mutuamente
excluyentes (Zadeh).
1
-
8/18/2019 IA unidad4.pdf
6/16
2 1.2. Conjuntos difusos y variables lingüı́sticas
1.2. Conjuntos difusos y variables lingǘısticas
Un conjunto clásico tiene ĺımites duramente definidos, por ejemplo, un conjunto clásicode numeros reales mayores que 6 puede expresarse como sigue:A = x|x > 1.8Donde existe un ĺımite duramente definido 1.8 tal que si x es mayor que este número,entonces x pertenece al conjunto A; de otra forma x no pertenece al conjunto. Aunque losconjuntos clásicos son útiles para varias aplicaciones y son una herramienta importantepara las ciencias matemáticas y computacionales, no reflejan la naturaleza de los concep-tos y pensamientos humanos, que tienden a ser abstractos e imprecisos. Por ejemplo, sepuede expresar matemáticamente el conjunto de personas altas como una colecci ón depersonas cuya altura es mayor que 1.80m. Si definimos A = personasaltas y x = altura.De modo que esta es una representación poco natural e inadecuada del concepto de ”per-sona alta”. La teoŕıa de conjuntos clásica clasificaŕıa a una persona de 1.8001m como
una persona alta, pero no a una persona de 1.7999m. Esta distinción es intuitivamentepoco razonable debido a la transición abrupta entre la inclusión y la exclusión del conjunto.
En contraste a los conjuntos clásicos, un conjunto difuso no tiene ĺımites duramente defini-dos, esto significa que la transición de pertenencia a no pertenencia al conjunto es gradualy es caracterizada por funciones de pertenencia que dan flexibilidad a los conjuntos difusospara modelar expresiones lingǘısticas como .el agua está caliente.o ”la temperatura es alta”.Como Zadeh señala, los conjuntos o clases definidos de forma imprecisa tienen un papelimportante en el pensamiento humano, particularmente en el dominio del reconocimientode patrones, comunicación de información y abstracción. La naturaleza difusa no viene de
la aleatoriedad de los miembros del conjunto, sino de la naturaleza incierta e imprecisade los pensamientos y conceptos abstractos.
Variable lingǘıstica. Es una variable cuyos valores son palabras o sentencias en len-guaje natural o artificial reducido.
1.2.1. Representación de conjuntos difusos
La función caracteŕıstica o función de pertenencia µ indica el grado de pertenencia deun elemento a un conjunto. Su valor vaŕıa de forma continua en un intervalo, admitiendola posibilidad de pertenencia parcial de un elemento a un conjunto.
La función de pertenencia generalizada toma sus valores de un conjunto L, llamado conjun-to de pertenencia. Los elementos de L no tienen que ser necesariamente números; cualquierconjunto total o parcialmente ordenado seŕıa igualmente válido. Ordinariamente se tomael conjunto de números reales comprendido entre 0 y 1. L = [0, 1]
µA(x) =
1 si x ∈ A0 si x /∈ A
(1.1)
µA(x) = [0, 1] (1.2)
Para el conjunto de sólo dos valores, 0 ó 1, L = 0, 1, A se reduce a un conjunto ordi-nario, de manera que la teoŕıa clásica de conjuntos es un caso particular de la teoŕıa de
-
8/18/2019 IA unidad4.pdf
7/16
1. Lógica difusa 3
conjuntos difusos, en los que la función de pertenencia toma exclusivamente valores de 0ó 1.
La función de pertenencia puede definirse de forma numérica, mediante un vector (parauniversos discretos y finitos) o de forma funcional, em cuyo caso tiene generalmente formade campana, triangular, trapezoidal, etc. En este caso puede depender de parámetros quepermitan variar su forma. La representación gráfica de una función de pertenencia es otraforma de representar los conjuntos difusos que resulta útil para compararlos y operar conellos.
Un conjunto difuso A es un conjunto de pares ordenados de un elemento genérico xque pertenece al universo de discurso U y su grado de pertenencia al conjunto
A = x|µA(x), ∀x ∈ U (1.3)
EJEMPLOS
Funciones de pertenencia generalizadas
Figura 1.1: Función de pertenencia triangular
Triangular(x,a,b,c) =
0 x ≤ a
x−ab−a
a ≤ x < bc−x
c−b b ≤ x < c0 c < x
(1.4)
-
8/18/2019 IA unidad4.pdf
8/16
4 1.2. Conjuntos difusos y variables lingüı́sticas
Figura 1.2: Función de pertenencia trapezoidal
Trapezoidal(x,a,b,c,d) =
0 x ≤ ax−ab−a
a ≤ x < b
1 b ≤ x < cd−xd−c
b ≤ x < c
0 d < x
(1.5)
Figura 1.3: Función de pertenencia gaussiana
Gaussiana(x,c,σ) = e−1
2(x−c
σ)2 (1.6)
-
8/18/2019 IA unidad4.pdf
9/16
1. Lógica difusa 5
Figura 1.4: Función de pertenencia Bell
Bell(x,a,b,c) = 1
1 + |x−ca
|2b (1.7)
Figura 1.5: Función de pertenencia sigmoidal
Sigmoidal(x,a,c) = 1
1 + e−a(x−c) (1.8)
1.2.2. Operaciones entre conjuntos difusos
Las operaciones entre conjuntos difusos se definen de la siguiente forma:
Complemento.C (A) = {x|µC (A)(x) = 1 − µA(x), ∀x ∈ U } (1.9)
-
8/18/2019 IA unidad4.pdf
10/16
6 1.2. Conjuntos difusos y variables lingüı́sticas
Unión.
A ∪ B = {x|µA∪B(x) = max(µA(x), µB(x)), ∀x ∈ U } (1.10)
Intersección.
A ∩ B = {x|µA∪B(x) = min(µA(x), µB(x)), ∀x ∈ U } (1.11)
Puede equipararse a la interpretacíon de los operadores lógicos not, and or y and, y sepuede comprobar que incluyen, como casos particulares, a las definiciones para conjuntosclásicos para L = 0, 1.La mayoŕıa de las propiedades de las operaciones entre conjuntos clásicos se siguen cum-pliendo, excepto dos:
Principio de contradicción clásico
A ∩ Ā = ∅ (1.12)
Ley del tercio excluso clásicaA ∪ Ā = U (1.13)
Modificadores lingǘısticos. A los conjuntos difusos se les puede aplicar operadoreso reglas de modificación. Los modificadores lingǘısticos son adverbios que se utilizan confrecuencia en el lenguaje natural para especificar, junto con el predicado, una propiedadmás concreta. La interpretacíon de los modificadores corresponde a un cambio en la formade la función de pertenencia para representar la acción de ese modificador sobre la funciónoriginal.
Los modificadores se modelan en la teoŕıa de conjuntos difusos mediante operaciones
sobre la función de pertenencia asociada al predicado que se está modificando.
Negación (No). Operación unaria que da como resultado el complemento.
NEG(µ(x)) = 1 − µ(x) (1.14)
Concentración (Muy). Operación unaria que aplicada a un conjunto difuso A, da comoresultado un subconjunto difuso de A tal que la reducción en los grados de pertenenciamás altos de la función es mucho menor que la reducción en los grados más bajos.
CON (µ(x)) = µ2(x) (1.15)
-
8/18/2019 IA unidad4.pdf
11/16
1. Lógica difusa 7
Dilatación (Algo, casi, más o menos). Operación unaria que da un resultado opuesto
a la concentración; admite distintas definiciones.
DIL(µ(x)) = 2µ(x) − µ2(x) (1.16)
Intensificación (Bastante). Operación unaria que se suele utilizar en combinación conalguna otra operación para hacer más selectiva una propiedad.
I N T µ(x) =
2µ2(x) si 0 ≤ µ(x) ≤ 0.5
1 − 2(1 − µ(x))2 si µ(x) > 0.5(1.17)
1.2.3. Relaciones difusas
Una relación representa la presencia o ausencia de asociación entre dos elementos dedos o más conjuntos. Este concepto se puede generalizar asignando a cada grupo de ele-mentos un número comprendido entre 0 y 1 que represente el grado de pertenencia a larelación, en este caso difusa.
Relaciones clásicas entre conjuntos difusos A y B son conjuntos clásicos defini-dos sobre el mismo universo de discurso.
Inclusión.A ⊂ Bsi µA(x) ≤ µB(x), ∀x ∈ U (1.18)
Equivalencia.A = Bsi µA(x) = µB(x), ∀x ∈ U (1.19)
Desigualdad. A = Bsi µA(x) = µB(x), ∀x ∈ U (1.20)
Relaciones difusas entre conjuntos clásicos Las relaciones definidas de esta for-ma son binarias, ARB donde A y B son conjuntos clásicos que pueden estar definidos enuniversos de discurso diferentes y R es un subconjunto difuso del producto cartesiano deA y B. Se obtiene como resultado un conjunto de pares ordenados (x, y), cada uno conun determinado grado de pertenencia µR a la relación R, que indica en qué grado o con
qué intensidad los elementos (x, y) están en la relación R. Las relaciones binarias difusaspueden representarse mediante matrices. Observe el siguiente ejemplo.
-
8/18/2019 IA unidad4.pdf
12/16
8 1.2. Conjuntos difusos y variables lingüı́sticas
x ∈ U 1 es un familiar cercano de y ∈ U 2
U 1 = {madre, to, primo}
U 2 = {hijo}
R Madre T́ıo PrimoHijo 1 0.6 0.3
Cuadro 1.1: Relación difusa es un familiar cercano
Relaciones difusas entre conjuntos difusos R es un subconjunto difuso del pro-
ducto cartesiano de A y B.
Producto cartesiano. Admite varias definiciones, en la definición estándar se asignaa cada pareja formada por un elemento de U 1 y otro de U 2, el menor de sus grados depertenencia al conjunto A y al conjunto B respectivamente
A × B = {(x, y)|µA×B(x, y) = min(µA(x), µB(y)), ∀x ∈ U 1, ∀y ∈ U 2} (1.21)
La operación es similar a la definición de la intersección, excepto que, como los universosson diferentes, el conjunto difuso resultante está formado por parejas.
Composición de relaciones. Puede ser expresada como una secuencia de operacio-nes max − ∗, donde ∗ es cualquier operador de la clase de las normas triangulares; losmás usuales son el mı́nimo, producto algebraico, producto drástico o producto acotado.El operador es elegido según la aplicación especı́fica.
R1(U 1, U 2)◦R2(U 2, U 3) = R3(U 1, U 3) (1.22)
dondeR3(U 1, U 3) = {(x, z )|µR1◦R2(x, z ), ∀x ∈ U 1, ∀y ∈ U 2, ∀z ∈ U 3} (1.23)
µR1◦R2(x, z ) = max[∀y ∈ U 2 : min(µR1(x, y), µR2(y, z ))] (1.24)
Existe una similitud entre esta operación y el producto matricial, asociando la sumacon la operación max y el producto con la operación min. En este caso la composición derelaciones difusas es conocida con el nombre de producto matricial max − min. Observeel siguiente ejemplo:
U 1 = { primavera, verano, otoo, invierno}
U 2 = {fro, calor}
U 3 = {shorts, abrigo, impermeable}
Se definen sobre ellos las siguientes relaciones
-
8/18/2019 IA unidad4.pdf
13/16
1. Lógica difusa 9
R1(U 1, U 2) Fŕıo CalorPrimavera 0.4 0.6Verano 0 1
Otoño 0.6 0.4Invierno 1 0
R2(U 2, U 3) Shorts Abrigo ImpermeableFŕıo 0.1 0.9 0.6Calor 0.9 0.1 0.4
La composición de relaciones se ejecuta de la siguiente manera
µ(1,1) = max[min(0.4, 0.1),min(0.6, 0.9)] = max(0.1, 0.6) = 0.6µ(1,2) = max[min(0.4, 0.9),min(0.6, 0.1)] = max(0.4, 0.1) = 0.4µ(1,3) = max[min(0.4, 0.6),min(0.4, 0.4)] = max(0.4, 0.4) = 0.4
R3(U 1, U 3) =
0.4 0.60 1
0.6 0.41 0
◦
0.1 0.9 0.60.9 0.1 0.4
=
0.6 0.1 0.40.9 0.1 0.40.4 0.6 0.60.1 0.9 0.6
(1.25)
1.3. Reglas e inferencia difusaImplicación Mamdani. Sean a y b dos conjuntos difusos,Para obtener conclusiones a partir de una base de reglas se necesita un mecanismo
que produzca una salida a partir de una colección de reglas. Esto se hace usando la reglacomposicional de inferencia (CROI). La regla de inferencia modus ponens
a ∧ (a → b) → b (1.26)
describe que si la sentencia a → b es verdadera, y también a lo es, entonces podemosinferir que b es verdadera. La lógica difusa generaliza esto en el modus ponens generalizado(GMP)
a ∧ (a → b) → b (1.27)
En lógica difusa se permite que los conjuntos a y b sean ligeramente diferentes de a y b
1.4. Desarrollo de un sistema experto difuso
El problema de la propina. ¿cuál es el porcentaje adecuado de propina? Dado un nú-mero entre 0 y 10 que representa la calidad del servicio en el restaurante, donde 10 es
excelente. La propina promedio es de 15 % sobre el total de los alimentos consumidos,aunque el porcentaje vaŕıa de acuerdo a la calidad del servicio.
-
8/18/2019 IA unidad4.pdf
14/16
10 1.4. Desarrollo de un sistema experto difuso
Aproximación no difusa
La relación más simple posible es suponer que la propina siempre es igual al 15 % dela cuenta total
tip = 0.15
Figura 1.6: Primera aproximación no difusa
Esta aproximación no considera la calidad del servicio, aśı que se agrega un términoa la ecuación. Dado que el servicio, está representado en una escala de 0 a 10, la propinapuede ir de forma lineal de 5 % si el servicio es malo a 25 %, si el servicio es excelente.
tip = 0.2/10 ∗ servicio + 0.05
Figura 1.7: Segunda aproximación no difusa
-
8/18/2019 IA unidad4.pdf
15/16
1. Lógica difusa 11
Hasta ahora la fórmula no resuelve el problema. Si se desea considerar además lacalidad de la comida en el cálculo de la propina, el problema extendido se define de lasiguiente forma
Dados dos conjuntos de números entre 0 y 10, donde 10 es excelente, que representanla calidad de servicio y de la comida respectivamente, ¿cuál es el porcentaje adecuado depropina?
La fórmula se modifica con la nueva variable
tip = 0.2/20 ∗ (servicio + calidad) + 0.05
Figura 1.8: Tercera aproximación no difusa
En este caso se debe analizar el resultado más de cerca. Suponiendo que el servicio esun factor más importante que la calidad de la comida. Digamos que el servicio aporte el80 % al total de la propina y que la comida aporte el 20 % restante
servratio = 0.8
tip = servratio ∗ (0.2/10 ∗ (servicio + 0.05) + . . .(1 − servratio) ∗ (02/10 ∗ food + 0.05);
El enfoque difuso Serı́a apropiado capturar sólo la esencia del problema, dejando delado todos los factores arbitrarios. Al realizar una lista de lo realmente importante en elproblema se obtienen las siguientes descripciones:
1. Si servicio es malo, entonces propina es pobre
2. Si servicio es bueno, entonces propina es regular
3. Si servicio es excelente, entonces propina es generosa
-
8/18/2019 IA unidad4.pdf
16/16
12 1.4. Desarrollo de un sistema experto difuso
El orden de las reglas es arbitrario. Si se desea incluir el efecto de la comida en la propina,se agregan 2 reglas
4 Si comida es mala, entonces propina es pobre
5 Si comida es deliciosa, entonces propina es generosa
Al combinar las 5 reglas se obtiene
1. Si servicio es malo o comida es mala, entonces propina es pobre
2. Si servicio es bueno, entonces propina es regular
3. Si servicio es excelente o comida es deliciosa, entonces propina es generosa
Estas 3 reglas son la parte principal de la solución y son parte de un sistema de lógica
difusa. A continuación se proporciona significado matemático a las variables lingüı́sticasy el sistema de inferencia difuso estará completo
Pasos
1. Identificar variables lingǘısticas asociadas al problema
2. Definir las funciones de pertenencia de cada variable o clases difusas a las cualespuede pertenecer la variable
3. Definir el rango de validez de las clases difusas
4. Fusificar las entradas o calcular los valores de pertenencia de las variables a las clasesdifusas
5. Aplicar operadores lógicos difusos
6. Aplicar operador de implicación
7. Agregar las salidas de cada una de las reglas
8. Defusificar el poĺıgono resultante