ia unidad4.pdf

Upload: katiaperalta

Post on 07-Jul-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/18/2019 IA unidad4.pdf

    1/16

    Universidad Autónoma del Estado

    de Hidalgo

    Instituto de Ciencias Básicas

    e Ingenierı́a

    Inteligencia Artificial

    Licenciatura en

    Sistemas Computacionales

    Karla I. López De La Cruz

    mailto:lopezdelacruz [email protected]

    Julio de 2013

    Este documento contiene las notas de la unidad 2 para el curso de Inteligencia Artificial. La

    unidad tiene como objetivo relacionar los conceptos matemáticos estudiados con modelos

    computacionales para representar y almacenar conocimiento.

  • 8/18/2019 IA unidad4.pdf

    2/16

  • 8/18/2019 IA unidad4.pdf

    3/16

    Índice general

    1. Lógica difusa 11.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2. Conjuntos difusos y variables lingǘısticas . . . . . . . . . . . . . . . . . . . 2

    1.2.1. Representación de conjuntos difusos . . . . . . . . . . . . . . . . . . 2

    1.2.2. Operaciones entre conjuntos difusos . . . . . . . . . . . . . . . . . . 51.2.3. Relaciones difusas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

    1.3. Reglas e inferencia difusa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.4. Desarrollo de un sistema experto difuso . . . . . . . . . . . . . . . . . . . . 9

    I

  • 8/18/2019 IA unidad4.pdf

    4/16

    II   ÍNDICE GENERAL

  • 8/18/2019 IA unidad4.pdf

    5/16

    1

    Lógica difusa

    1.1. IntroducciónEn sentido estricto lógica difusa es una generalización de la lógica clásica para razona-

    mientos con incertidumbre. En un sentido más amplio, la lógica difusa se refiere a todaslas teoŕıas y tecnoloǵıas que emplean conjuntos difusos, los cuales son clases con ĺımitesvagamente definidos.

    Entre otras caracteŕısticas que diferencian a la lógica difusa de la lógica clásica se en-cuentran

    El grado de verdad de una aseveración en la lógica bivalente toma un valor entre unconjunto finito de valores: verdadero o falso; en la lógica difusa, el grado de verdades un subconjunto que se puede expresar como verdadero, muy verdadero, bastantefalso, no muy falso, etc.

    En la lógica clásica los predicados son concretos, mientras que en la lógica difusapueden ser tanto ńıtidos como difusos.

    La lógica bivalente admite sólo dos cuantificadores: el universal ∀  y el existencial ∃.La lógica difusa admite además una gran variedad de cuantificadores difusos comomuchos, pocos, algunos, la mayoŕıa, etc. Estos se pueden interpretar como números

    difusos que dan una caracterización imprecisa del cardinal de un conjunto difuso oclásico.

    Este tipo de razonamiento aproximado permite distintas interpretaciones de las sen-tencias: casi cierto, muy falso,poco verdadero, etc.

    Principio de incompatibilidadA medida que la complejidad de un sistema aumenta, disminuye nuestra capacidad parahacer afirmaciones precisas, incluso significativas sobre su comportamiento, hasta que sealcanza un umbral más allá del cual precisión y relevancia son caracteŕısticas mutuamente

    excluyentes (Zadeh).

    1

  • 8/18/2019 IA unidad4.pdf

    6/16

    2 1.2. Conjuntos difusos y variables lingüı́sticas

    1.2. Conjuntos difusos y variables lingǘısticas

    Un conjunto clásico tiene ĺımites duramente definidos, por ejemplo, un conjunto clásicode numeros reales mayores que 6 puede expresarse como sigue:A =  x|x > 1.8Donde existe un ĺımite duramente definido 1.8 tal que si x es mayor que este número,entonces x pertenece al conjunto A; de otra forma x no pertenece al conjunto. Aunque losconjuntos clásicos son útiles para varias aplicaciones y son una herramienta importantepara las ciencias matemáticas y computacionales, no reflejan la naturaleza de los concep-tos y pensamientos humanos, que tienden a ser abstractos e imprecisos. Por ejemplo, sepuede expresar matemáticamente el conjunto de personas altas como una colecci ón depersonas cuya altura es mayor que 1.80m. Si definimos  A =  personasaltas  y  x =  altura.De modo que esta es una representación poco natural e inadecuada del concepto de ”per-sona alta”. La teoŕıa de conjuntos clásica clasificaŕıa a una persona de 1.8001m como

    una persona alta, pero no a una persona de 1.7999m. Esta distinción es intuitivamentepoco razonable debido a la transición abrupta entre la inclusión y la exclusión del conjunto.

    En contraste a los conjuntos clásicos, un conjunto difuso no tiene ĺımites duramente defini-dos, esto significa que la transición de pertenencia a no pertenencia al conjunto es gradualy es caracterizada por funciones de pertenencia que dan flexibilidad a los conjuntos difusospara modelar expresiones lingǘısticas como .el agua está caliente.o ”la temperatura es alta”.Como Zadeh señala, los conjuntos o clases definidos de forma imprecisa tienen un papelimportante en el pensamiento humano, particularmente en el dominio del reconocimientode patrones, comunicación de información y abstracción. La naturaleza difusa no viene de

    la aleatoriedad de los miembros del conjunto, sino de la naturaleza incierta e imprecisade los pensamientos y conceptos abstractos.

    Variable lingǘıstica.  Es una variable cuyos valores son palabras o sentencias en len-guaje natural o artificial reducido.

    1.2.1. Representación de conjuntos difusos

    La función caracteŕıstica o función de pertenencia µ  indica el grado de pertenencia deun elemento a un conjunto. Su valor vaŕıa de forma continua en un intervalo, admitiendola posibilidad de pertenencia parcial de un elemento a un conjunto.

    La función de pertenencia generalizada toma sus valores de un conjunto L, llamado conjun-to de pertenencia. Los elementos de L no tienen que ser necesariamente números; cualquierconjunto total o parcialmente ordenado seŕıa igualmente válido. Ordinariamente se tomael conjunto de números reales comprendido entre 0 y 1.  L = [0, 1]

    µA(x) =

      1 si  x ∈  A0 si  x /∈ A

      (1.1)

    µA(x) = [0, 1] (1.2)

    Para el conjunto de sólo dos valores, 0 ó 1,  L = 0, 1, A se reduce a un conjunto ordi-nario, de manera que la teoŕıa clásica de conjuntos es un caso particular de la teoŕıa de

  • 8/18/2019 IA unidad4.pdf

    7/16

    1. Lógica difusa 3

    conjuntos difusos, en los que la función de pertenencia toma exclusivamente valores de 0ó 1.

    La función de pertenencia puede definirse de forma numérica, mediante un vector (parauniversos discretos y finitos) o de forma funcional, em cuyo caso tiene generalmente formade campana, triangular, trapezoidal, etc. En este caso puede depender de parámetros quepermitan variar su forma. La representación gráfica de una función de pertenencia es otraforma de representar los conjuntos difusos que resulta útil para compararlos y operar conellos.

    Un conjunto difuso A es un conjunto de pares ordenados de un elemento genérico   xque pertenece al universo de discurso  U  y su grado de pertenencia al conjunto

    A =  x|µA(x), ∀x ∈  U    (1.3)

    EJEMPLOS

    Funciones de pertenencia generalizadas

    Figura 1.1:  Función de pertenencia triangular

    Triangular(x,a,b,c) =

    0   x ≤  a

    x−ab−a

      a ≤  x < bc−x

    c−b   b ≤  x < c0   c < x

    (1.4)

  • 8/18/2019 IA unidad4.pdf

    8/16

    4 1.2. Conjuntos difusos y variables lingüı́sticas

    Figura 1.2:   Función de pertenencia trapezoidal

    Trapezoidal(x,a,b,c,d) =

    0   x ≤  ax−ab−a

      a ≤  x < b

    1   b ≤  x < cd−xd−c

      b ≤  x < c

    0   d < x

    (1.5)

    Figura 1.3:  Función de pertenencia gaussiana

    Gaussiana(x,c,σ) = e−1

    2(x−c

    σ)2 (1.6)

  • 8/18/2019 IA unidad4.pdf

    9/16

    1. Lógica difusa 5

    Figura 1.4:   Función de pertenencia Bell

    Bell(x,a,b,c) =  1

    1 + |x−ca

      |2b  (1.7)

    Figura 1.5:   Función de pertenencia sigmoidal

    Sigmoidal(x,a,c) =  1

    1 + e−a(x−c)  (1.8)

    1.2.2. Operaciones entre conjuntos difusos

    Las operaciones entre conjuntos difusos se definen de la siguiente forma:

    Complemento.C (A) = {x|µC (A)(x) = 1 − µA(x), ∀x ∈  U }   (1.9)

  • 8/18/2019 IA unidad4.pdf

    10/16

    6 1.2. Conjuntos difusos y variables lingüı́sticas

    Unión.

    A ∪ B  = {x|µA∪B(x) = max(µA(x), µB(x)), ∀x ∈  U }   (1.10)

    Intersección.

    A ∩ B  = {x|µA∪B(x) = min(µA(x), µB(x)), ∀x ∈  U }   (1.11)

    Puede equipararse a la interpretacíon de los operadores lógicos not, and or y and, y sepuede comprobar que incluyen, como casos particulares, a las definiciones para conjuntosclásicos para  L = 0, 1.La mayoŕıa de las propiedades de las operaciones entre conjuntos clásicos se siguen cum-pliendo, excepto dos:

    Principio de contradicción clásico

    A ∩  Ā = ∅   (1.12)

    Ley del tercio excluso clásicaA ∪  Ā = U    (1.13)

    Modificadores lingǘısticos.   A los conjuntos difusos se les puede aplicar operadoreso reglas de modificación. Los modificadores lingǘısticos son adverbios que se utilizan confrecuencia en el lenguaje natural para especificar, junto con el predicado, una propiedadmás concreta. La interpretacíon de los modificadores corresponde a un cambio en la formade la función de pertenencia para representar la acción de ese modificador sobre la funciónoriginal.

    Los modificadores se modelan en la teoŕıa de conjuntos difusos mediante operaciones

    sobre la función de pertenencia asociada al predicado que se está modificando.

    Negación (No).  Operación unaria que da como resultado el complemento.

    NEG(µ(x)) = 1 − µ(x) (1.14)

    Concentración (Muy). Operación unaria que aplicada a un conjunto difuso A, da comoresultado un subconjunto difuso de A tal que la reducción en los grados de pertenenciamás altos de la función es mucho menor que la reducción en los grados más bajos.

    CON (µ(x)) = µ2(x) (1.15)

  • 8/18/2019 IA unidad4.pdf

    11/16

    1. Lógica difusa 7

    Dilatación (Algo, casi, más o menos).  Operación unaria que da un resultado opuesto

    a la concentración; admite distintas definiciones.

    DIL(µ(x)) = 2µ(x) − µ2(x) (1.16)

    Intensificación (Bastante).  Operación unaria que se suele utilizar en combinación conalguna otra operación para hacer más selectiva una propiedad.

    I N T µ(x) =

      2µ2(x)   si 0  ≤  µ(x) ≤  0.5

    1 − 2(1 − µ(x))2 si µ(x) >  0.5(1.17)

    1.2.3. Relaciones difusas

    Una relación representa la presencia o ausencia de asociación entre dos elementos dedos o más conjuntos. Este concepto se puede generalizar asignando a cada grupo de ele-mentos un número comprendido entre 0 y 1 que represente el grado de pertenencia a larelación, en este caso difusa.

    Relaciones clásicas entre conjuntos difusos   A y B son conjuntos clásicos defini-dos sobre el mismo universo de discurso.

    Inclusión.A ⊂  Bsi µA(x) ≤  µB(x), ∀x ∈  U    (1.18)

    Equivalencia.A =  Bsi µA(x) = µB(x), ∀x ∈  U    (1.19)

    Desigualdad. A = Bsi µA(x) = µB(x), ∀x ∈  U    (1.20)

    Relaciones difusas entre conjuntos clásicos  Las relaciones definidas de esta for-ma son binarias,  ARB  donde  A  y  B  son conjuntos clásicos que pueden estar definidos enuniversos de discurso diferentes y  R es un subconjunto difuso del producto cartesiano deA  y  B. Se obtiene como resultado un conjunto de pares ordenados (x, y), cada uno conun determinado grado de pertenencia  µR  a la relación  R, que indica en qué grado o con

    qué intensidad los elementos (x, y) están en la relación  R. Las relaciones binarias difusaspueden representarse mediante matrices. Observe el siguiente ejemplo.

  • 8/18/2019 IA unidad4.pdf

    12/16

    8 1.2. Conjuntos difusos y variables lingüı́sticas

    x ∈ U 1  es un familiar cercano de  y ∈  U 2

    U 1  =  {madre, to, primo}

    U 2  =  {hijo}

    R Madre T́ıo PrimoHijo   1 0.6 0.3

    Cuadro 1.1:  Relación difusa es un familiar cercano

    Relaciones difusas entre conjuntos difusos  R es un subconjunto difuso del pro-

    ducto cartesiano de  A y B.

    Producto cartesiano.   Admite varias definiciones, en la definición estándar se asignaa cada pareja formada por un elemento de  U 1  y otro de  U 2, el menor de sus grados depertenencia al conjunto  A y al conjunto  B  respectivamente

    A × B  = {(x, y)|µA×B(x, y) = min(µA(x), µB(y)), ∀x ∈ U 1, ∀y ∈  U 2}   (1.21)

    La operación es similar a la definición de la intersección, excepto que, como los universosson diferentes, el conjunto difuso resultante está formado por parejas.

    Composición de relaciones.   Puede ser expresada como una secuencia de operacio-nes  max − ∗, donde  ∗  es cualquier operador de la clase de las normas triangulares; losmás usuales son el mı́nimo, producto algebraico, producto drástico o producto acotado.El operador es elegido según la aplicación especı́fica.

    R1(U 1, U 2)◦R2(U 2, U 3) = R3(U 1, U 3) (1.22)

    dondeR3(U 1, U 3) = {(x, z )|µR1◦R2(x, z ), ∀x ∈  U 1, ∀y  ∈  U 2, ∀z  ∈  U 3}   (1.23)

    µR1◦R2(x, z ) = max[∀y ∈  U 2 : min(µR1(x, y), µR2(y, z ))] (1.24)

    Existe una similitud entre esta operación y el producto matricial, asociando la sumacon la operación max  y el producto con la operación min. En este caso la composición derelaciones difusas es conocida con el nombre de producto matricial  max − min. Observeel siguiente ejemplo:

    U 1  =  { primavera, verano, otoo, invierno}

    U 2  =  {fro, calor}

    U 3  =  {shorts, abrigo, impermeable}

    Se definen sobre ellos las siguientes relaciones

  • 8/18/2019 IA unidad4.pdf

    13/16

    1. Lógica difusa 9

    R1(U 1, U 2)   Fŕıo CalorPrimavera   0.4 0.6Verano   0 1

    Otoño   0.6 0.4Invierno   1 0

    R2(U 2, U 3)   Shorts Abrigo ImpermeableFŕıo   0.1 0.9 0.6Calor   0.9 0.1 0.4

    La composición de relaciones se ejecuta de la siguiente manera

    µ(1,1) = max[min(0.4, 0.1),min(0.6, 0.9)] = max(0.1, 0.6) = 0.6µ(1,2) = max[min(0.4, 0.9),min(0.6, 0.1)] = max(0.4, 0.1) = 0.4µ(1,3) = max[min(0.4, 0.6),min(0.4, 0.4)] = max(0.4, 0.4) = 0.4

    R3(U 1, U 3) =

    0.4 0.60 1

    0.6 0.41 0

    0.1 0.9 0.60.9 0.1 0.4

     =

    0.6 0.1 0.40.9 0.1 0.40.4 0.6 0.60.1 0.9 0.6

    (1.25)

    1.3. Reglas e inferencia difusaImplicación Mamdani.  Sean  a y b dos conjuntos difusos,Para obtener conclusiones a partir de una base de reglas se necesita un mecanismo

    que produzca una salida a partir de una colección de reglas. Esto se hace usando la reglacomposicional de inferencia (CROI). La regla de inferencia modus ponens

    a ∧ (a →  b) →  b   (1.26)

    describe que si la sentencia  a →  b  es verdadera, y también  a   lo es, entonces podemosinferir que b es verdadera. La lógica difusa generaliza esto en el modus ponens generalizado(GMP)

    a ∧ (a →  b) →  b (1.27)

    En lógica difusa se permite que los conjuntos  a y b sean ligeramente diferentes de  a y  b

    1.4. Desarrollo de un sistema experto difuso

    El problema de la propina. ¿cuál es el porcentaje adecuado de propina? Dado un nú-mero entre 0 y 10 que representa la calidad del servicio en el restaurante, donde 10 es

    excelente. La propina promedio es de 15 % sobre el total de los alimentos consumidos,aunque el porcentaje vaŕıa de acuerdo a la calidad del servicio.

  • 8/18/2019 IA unidad4.pdf

    14/16

    10 1.4. Desarrollo de un sistema experto difuso

    Aproximación no difusa

    La relación más simple posible es suponer que la propina siempre es igual al 15 % dela cuenta total

    tip = 0.15

    Figura 1.6:  Primera aproximación no difusa

    Esta aproximación no considera la calidad del servicio, aśı que se agrega un términoa la ecuación. Dado que el servicio, está representado en una escala de 0 a 10, la propinapuede ir de forma lineal de 5 % si el servicio es malo a 25 %, si el servicio es excelente.

    tip = 0.2/10 ∗ servicio + 0.05

    Figura 1.7:  Segunda aproximación no difusa

  • 8/18/2019 IA unidad4.pdf

    15/16

    1. Lógica difusa 11

    Hasta ahora la fórmula no resuelve el problema. Si se desea considerar además lacalidad de la comida en el cálculo de la propina, el problema extendido se define de lasiguiente forma

    Dados dos conjuntos de números entre 0 y 10, donde 10 es excelente, que representanla calidad de servicio y de la comida respectivamente, ¿cuál es el porcentaje adecuado depropina?

    La fórmula se modifica con la nueva variable

    tip = 0.2/20 ∗ (servicio + calidad) + 0.05

    Figura 1.8:   Tercera aproximación no difusa

    En este caso se debe analizar el resultado más de cerca. Suponiendo que el servicio esun factor más importante que la calidad de la comida. Digamos que el servicio aporte el80 % al total de la propina y que la comida aporte el 20 % restante

    servratio = 0.8

    tip =  servratio ∗ (0.2/10 ∗ (servicio + 0.05) + . . .(1 − servratio) ∗ (02/10 ∗ food + 0.05);

    El enfoque difuso Serı́a apropiado capturar sólo la esencia del problema, dejando delado todos los factores arbitrarios. Al realizar una lista de lo realmente importante en elproblema se obtienen las siguientes descripciones:

    1. Si servicio es malo, entonces propina es pobre

    2. Si servicio es bueno, entonces propina es regular

    3. Si servicio es excelente, entonces propina es generosa

  • 8/18/2019 IA unidad4.pdf

    16/16

    12 1.4. Desarrollo de un sistema experto difuso

    El orden de las reglas es arbitrario. Si se desea incluir el efecto de la comida en la propina,se agregan 2 reglas

    4 Si comida es mala, entonces propina es pobre

    5 Si comida es deliciosa, entonces propina es generosa

    Al combinar las 5 reglas se obtiene

    1. Si servicio es malo o comida es mala, entonces propina es pobre

    2. Si servicio es bueno, entonces propina es regular

    3. Si servicio es excelente o comida es deliciosa, entonces propina es generosa

    Estas 3 reglas son la parte principal de la solución y son parte de un sistema de lógica

    difusa. A continuación se proporciona significado matemático a las variables lingüı́sticasy el sistema de inferencia difuso estará completo

    Pasos

    1. Identificar variables lingǘısticas asociadas al problema

    2. Definir las funciones de pertenencia de cada variable o clases difusas a las cualespuede pertenecer la variable

    3. Definir el rango de validez de las clases difusas

    4. Fusificar las entradas o calcular los valores de pertenencia de las variables a las clasesdifusas

    5. Aplicar operadores lógicos difusos

    6. Aplicar operador de implicación

    7. Agregar las salidas de cada una de las reglas

    8. Defusificar el poĺıgono resultante