cenidef rodolfo... · señal de entrada aplicada al sistema lineal de primer orden, para generar...

186
SEP SEIT DGIT CENTRO NACIONAL DE INVESTIGACIÓN Y DESARROLLO TECNOL~GICO cenidef WNTONIZACI~N DE CONTROLADORES DIFUSOS BASADA EN EL MÉTODO DE GRADIENTE DESCENDENTE " T E S I S QUE PARA OBTENER EL GRADO DE: MAESTRO EN CIENCIAS EN CIENCIAS COMPUTACIONALES P R E S E N T A: RODOLFO CASTILLO ROMERO DIRECTORES DE TESIS: DR. JOSE RUIZ ASCENCIO DR. FRANCISCO J. MUGICA ALVAREZ CUERNAVACA, MORELOS. MAYO DE 1999

Upload: trandang

Post on 01-Nov-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

SEP SEIT DGIT

CENTRO NACIONAL DE INVESTIGACIÓN Y DESARROLLO TECNOL~GICO

cenidef

WNTONIZACI~N DE CONTROLADORES DIFUSOS BASADA EN EL MÉTODO DE GRADIENTE DESCENDENTE"

T E S I S QUE PARA OBTENER EL GRADO DE: MAESTRO EN CIENCIAS EN CIENCIAS COMPUTACIONALES P R E S E N T A: RODOLFO CASTILLO ROMERO

DIRECTORES DE TESIS: DR. JOSE RUIZ ASCENCIO DR. FRANCISCO J. MUGICA ALVAREZ

CUERNAVACA, MORELOS. MAYO DE 1999

Page 2: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

m n n Centro Nacional de Investigación y Desarrollo Tecnológico

FORMA A3 REVISION DE TESIS

REV. 12/97 Cuernavaca. Morelos a 20 de abril de 1999

M.C. Máximo López Sánchez Presidente de la Academia de Presente

Ciencias Computacionales

Nos es grato comunicarle que, conforme a los lineamientos para la obtención del grado de Maestro en Ciencias de este Centro, y después de haber sometido a revisión académica la tesis, denominada: "SINTONIZACIdN DE CONTROLADORES DIFUSOS BASADA EN EL MÉTODO DE GRADIENTE DESCENDENTE", realizada por el C. Rodolfo Castillo Romero, y habiendo cumplido con todas las correcciones que le fueron indicadas, acordamos no tener objeción para que se le conceda la autorización de impresión de la tesis.

Sin otro particular, quedamos de usted.

Atentamente La comisión de revisión de tesis

M.I. Marino Sánchez Parra 'M.C.,darbs Daniel García Beltrán

, Dr. José Ruiz Ascencio Asesor de tesis

ccp Dr. Javier Ortiz Hernández/Jefe del Departamento de Ciencias Cornputacionales

INTERIOR INTERNADO PALMIPA CIN, CUERNAVACA, MOR. M&ICO APARTADO POSTAL 5-164 CP 62050, CUERNAVACA. T a S . (73)12 2314,12 7613 ,18 7741 , FAX (73) 12 2434 AIL [email protected] AIL Subdlreccldn : abautista @cenidet.edu.rnx cenidet

Page 3: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Centro Nacional de Investigación y Desarrollo Tecnológico

FORMA A4 AUTORIZACION DE IMPRESIÓN DE TESIS

REV. 12/97

Cuernavaca, Morelos a 20 de abril de 1999

C. Rodolfo Castillo Romero Candidato al grado de Maestro en Ciencias En Ciencias Computacionales Presente

Después de haber atendido las indicaciones sugeridas por la Comisión Revisora de la Academia de Ciencias Computacionales en relación a su trabajo de tesis: ‘SINTONIZACIÓN DE CONTROLADORES DIFUSOS BASADA EN EL MÉTODO DE GRADIENTE DESCENDENTE”, me es grato comunicarle que conforme a los lineamientos establecidos para la obtención del grado de Maestro en Ciencias en este Centro, se le concede la autorización para que proceda con la impresión de su tesis.

Jefe del Dep

INTERIOR INTERNADO PALMIRA SIN. CUERNAVACA. MOR. M h I C O APARTADO POSTAL 5-164 CP62050. CUERNAVACA. TELS. (73)lZ 2314.12 7613 ,18 7741, FAX (73) 12 2434 EMAIL [email protected] AIL Subdireccibn : abautista @cenidet.edu.mx cenídet

Page 4: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Dedicatoria

Con amor a mis padres Ma del Refugio y Marcelino por haber infundado en mí: la dedicación, la constancia, la responsabilidad y el deseo de estudiar

Con cariño a mis hermanos Lucila y Hugo Marcelino por darme su apoyo y confianza y con quienes deseo compartir este logro tun importante en mi vida

Con todo mi respeto, a mis amigos fallecidos en mi ausencia y que no estuve en su último adiós

Y con todo mi amor a la mujer que forma parte de mi vida, mi esposa Patricia, con quien he compartido momentos inolvidables

Page 5: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Agradecimientos

Agradezco a Dios por haberme dado vida para llegar a este momento

.Con un agradecimiento muy especial a mi asesor Dr. José Ruiz Ascencio por haber compartido sus conocimientos y darme paciencia en momentos diflciles además de su amistad desinteresada

Al Dr. Francisco José Mugica Álvarez por su amistad y apoyo

A todos mis amigos de computación, especialmente a Lucero Ayala, Carlos Gámez y Martha Rocha por su amistad y confianza

A mis amigos “electrónicos” Jorge Luis Ibarra, Juan Carlos Alarcón y Gustavo Iván Alarcón con quienes formé una familia durante mi maestría

Al comité de revisión por sus comentarios y sugerencias para mejorar este tema de investigación: MC Marino Sánchez Parra, MC Carlos Daniel García Beltrán y MC Raúl Pinto Elías

A Margarita Martinez Leal por sus correcciones y sugerencias en la redacción de este proyecto

A mis maestros por su amistad y apoyo durante mi formación académica

A todo el personal administrativo y del área de computación de esta institución

A cenidet y al Consejo Nacional de Ciencia y Tecnología por fomentar el desarrollo tecnológico y la investigación en México, además de su apoyo económico durante mi formación como Maestro en Ciencias

Page 6: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Contenido ............................. iv Lista de figuras .........................

Lista de tablas ................ Tabla de símbol .......................

1. ANTECEDENTES 1.1 Introducción .......................... ......................... 1.2 El control inteligente ..................... 1.3 Problemática ......................................... ....................................... 1-3 1.4 Objetivo .............. 1.5 Estado de la práctica 1.6 Metodología ................................ ................................ 1-5 I .7 Casos de aplicación ......................................... 1.8 Alcance ................................................. 1-6 I .9 Aportaciones ............................................ ..................

.................................

........................................................... .............................

2. ESTADO DEL ARTE ...............

2.2 El control difuso ............................. 2.3 Sistemas difusos

2.3.1. Metodol ................ 2.3.1.1. Comentarios ................................................. 2-6

2.3.2. Metodol ................................................. 2-1 2.3.2.1. Comentarios .... ............................. ................ 2-8

2.3.3. Metodología Burkhar ......................................................... 2-9

2.3.3.2. Comentarios 2.3.4. Metodología Fei92

2.3.4.1. Comentarios .........................................................................

2.3.5.1. Comentarios ....................

2.3.6.4. Construcción del árbol de trayectorias 2.3.6.5. Comentarios . ................ ............. 2-17

2.3.7.1. Algoritmo de auto sintonizado ............

.................................

................... 2.3.7. Metodología Nomura92 ................... 2-17

..................... 2-22

I

Page 7: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

2.3.8.2. Definición de las zonas de incrementos ....... 2.3.5.3. Procedimiento de aprendizaje ................................ 2.3.8.4. Parametros de diseiio del cmtrolador ........................................... 2.3.8.5. Comentarios ..........................

2-25

2.3.9. Conclusiones

3. SINTONIZACIÓN DE SISTEMAS DIFUSOS EMPLEANDO EL MÉTODO DE GRADIENTE DESCENDENTE ., 3. I . Iiitroduccion .............................. ........................

3.2 .Consideraciones generales 3.3.Sintoiiización por el métod

3.3.1. Definición de o 3.3.2. Obtención de las reglas de aprendizaje .................................... 3-6 3.3.3. Proceso de sintonización ...... .............................................. 3-8 3.3.4. Condiciones iniciales en los parámetros del sistema difuso ....... 3-9 3.3.5. Cantidad de parametros a optimizar

3.4.1, Método de sintonizacion forma de campana de Gauss

3.4.2. Método de sintonización u

3.4.3. Método de

3.4.Variantes de la metodología

.....

triangular asimétrica ................................................ 3- 13

forma triangular asimétrica ......... 3.5.Aproximación de funciones algebraicas ........................................

3.5.1. Raiz cubica ................................... 3.5.2. Campana de Gauss ......................................... 3.5.3. Función p 3.5.4. Función suma de senos ........................................

3.6.0tras mejoras en el p 3.6.1. Momento 3.6.2. Paso variable ................................ 3.6.3. Valor in¡

, I .

4. IDENTIFICACI~N DE SISTEMAS DINÁMICOS UTILIZANDO LÓGICA DIFUSA 4.1 Introducción ................... ...................................................... 4.2 Núcleo de transición de estados ........... ................................................. 4-2 4.3 Identificación de sistemas dinámicos ................... 4.4 Experimentos de identificación empleando FSGD

.4.4.1. Sistema de primer orden G(s)=0.2/(~+2) .... 4.4.2. Sistema de primer orden G(s)=4/(s+0.4) ............................................ 4-16

4.4.4. Sistema de segundo orden lineal G(s)=39.44/(sZ + 6.28s + 39.44) .... 4-26 4.4.5. Sistema de segundo orden lineal G(s)=39.44/(s2 + 2.51s + 39.44) .... 4-30

4.4.3. Sistema de primer orden no lineal .............. ....................... 4-18

I1

Page 8: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

5. CONTROL DE SISTEMAS DINÁMICOS UTILIZANDO LÓGICA DIFUSA . , 5.1 Introduccion .................................................... 5.2 Control de sistemas dinámicos 5.3 Estructura de control modelo in ....................... 5-3 5.4 Experimentos con estructura de

5.4.1. Sistema de primer orden 5.4.2. Sistema de primer orden no lineal 5.4.3. Sistema de segundo orden lineal G 5.4.4. Sistema de segundo orden lineal G(s)=39.44/(s2 + 2.5 Is + 39.44) _.._ 5-23

5.5 Estructura de control basada en modelo de referencia .... 5-25 5.6 Presintonización de las reglas difusas .......................................................... 5-32 5.7 Control del péndulo invertido ........................................................................ 5-36

5.7.1. Imitar un controlador difuso existente ................................................. 5-37 5.8 Conclusiones .............................. .................... 5-46

6. CONCLUSIONES 6.1 Objetivos cubiertos ............ ................ 6-1 6.2 Resultados obtenidos ........................................................................................ 6-3 6.3 Limitantes ........................ 6.4 Trabajos futuros .

Anexo A. INFERENCIA EN UN SISTEMA DIFUSO EMPLEANDO REGLAS SUGENO DE ORDEN CERO

A.1. Un ejemplo de un sistema difuso de dos entradas ........................................ A-1

Anexo B. ANÁLISIS DEL EMPLEO DE DOS CONJUNTOS POR VARZABLE DE ENTRADA B.1. Sistemas difusos de una entrada .................................................................. B-1 B.2. Sistemas difusos de dos entradas ................................................................. B-4

REFERENCIAS BIBLIOGRÁFICAS .............................................................................. R- I

BIBLIOGRAFIA GENERAL .......................................................................................... BG-1

... 111

Page 9: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Lista de fguras Capítulo 2 FIG, 2.1. Configuración básica de un controlador de lógica difusa (FLC). FIG, 2.2. Esquema completo del control difuso adaptable. FIG. 2.3. Escalación de las funciones de pertenencia mediante el parámetro s. FIG. 2.4. Árbol de trayectorias, cada ui representa un conjunto de secuencias de control. FIG. 2.5. Definición de los parámetros de los conjuntos difusos triangulares. FIG. 2.6. Dimensión del vector Z. El número de parámetros a optimizar esp=iinn+n. FIG. 2.7. Funciones de pertenencia para la variable .rl. FIG, 2.8. Tablas de implementación. FIG. 2.9. División por zonas en la tabla de accesos y sus respectivas tablas de incrementos.

Capítulo 3 FIG. 3.1. Representación de un conjunto difuso triangular. FIG. 3.2. Condición inicial para cuatro conjuntos difusos. FIG. 3.3. Campana de Gauss formada por una media de n,=O y una desviación estándar

FIG. 3.4. Posición y forma arbitraria de cinco conjuntos difusos triangulares empleando la

FIG. 3.5. Conjunto difuso triangular generado por la función de pertenencia de triángulos

FIG. 3.6. Situación inicial del sistema difuso conKr)=-r’”. La línea continua es la salida del

FIG. 3.7. Condición final de los parámetros del sistema difuso empleados durante la

FIG. 3.8. Comportamiento del valor de EC calculado por el FSGD durante las 50 épocas de

FIG. 3.9. Situación final del sistema difuso aproximandoflx)=x’”. FIG. 3.10. Situación final de los parámetros del sistema difuso empleados durante la

aproximación de la función campana de Gauss. FIG. 3.11. Comportamiento del valor de EC calculado por el FSGD durante las 40 épocas de

entrenamiento en la aproximación de la función campana de Gauss. FIG. 3.12. Situación final del sistema difuso aproximando una función campana de Gauss. FIG. 3.13. situación final de los parámetros del sistema difuso después de aproximar la

funciÓnfixl,xZ)=xl *x2. FIG. 3.14. Comportamiento del valor de EC calculado por el FSGD durante las 12 épocas de

entrenamiento en la aproximación de la funciónprod(x1, x2). FIG. 3.15. Situación final del sistema difuso aproximandof(xl, x2) =prod(xl, xZ). FIG. 3.16. Señales senoidales de entrada, aplicadas al sistema difusof(x1, x2). FIG. 3.17. Comparativo de la respuesta obtenida con el sistema difuso, actuando como

FIG. 3.18. Datos de entrenamiento para la función suma de senos, en donde cada símbolo +

FIG. 3.19. Gráfica comparativa entre conjuntos y valor de error EC. FIG. 3.20. Gráfica comparativa entre conjuntos y valor de error EC.

bij=0.3, evaluando la función de pertenencia en el intervalo [-1, I].

función de pertenencia de triángulos eslabonados.

asimétricos independientes.

sistema difuso y cada signo +representa un dato de entrenamiento.

aproximación de la funciónf(x)=x“’.

entrenamiento en la aproximación de la función raíz cúbica.

ínterpolador, (línea continua) y el operador producto (línea punteada).

representa un dato de entrenamiento.

iv

Page 10: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capítulo 4 FIG. 4.1. Selección de variables a considerar para la identificación de un sistema de orden n. FIG. 4.2. Obtención de los datos de entrenamiento para la identificación de una planta de

segundo orden. FIG. 43. Obtención de los valores de las derivadas a partir de un filtro de estimados en

representación de diagrama a bloques. FIG. 4.4. Obtención de los valores estimados de las derivadas a partir de un filtro de estimados

en la entrada y salida de la planta. FIG. 4.5. Sistema difuso FS empleado durante una etapa de reconocimiento mostrando el lazo

de retroalimentación, útil para capturar la dinámica de una planta P de primer orden.

FIG. 4.6. Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento.

FIG. 4.7. Situación inicial del sistema difuso. FIG. 4.8. Evolución de la medida de error EC durante la identificación del sistema de primer

FIG. 4.9. Situación del sistema difuso después de la etapa de entrenamiento. FIG. 4.10. Respuesta del sistema difuso sintonizado al aplicar la señal de entrada con la cual

FIG. 4.11. Señal de entrada triangular aplicada al sistema difuso para probar su capacidad de

FIG. 4.12. Comparativo de las salidas entregadas por el sistema difuso y la planta como

FIG. 4.13. Señal de entrada escalón de amplitud 0.7 aplicado al sistema difuso para probar su

FIG. 4.14. Comparativo de las salidas entregadas por el sistema difuso y la planta lineal de

FIG. 4.15. Variación del error EC durante 300 épocas de entrenamiento con el sistema de

FIG. 4.16. Variación respecto a los valores iniciales de los centros de la variable u(t-AT). FIG. 4.17. Variación respecto a los valores iniciales de los centros de la variable y(r-AT). FIG. 4.18. Variación de los valores de las bases de los conjuntos difusos de la variable u(t-AT) FIG. 4.19. Variación de los valores de las bases de los conjuntos difusos de la variable y(t-ATJ. FIG. 4.20. Variación de los valores de los pesos wi de las cuatro reglas difusas del sistema. FIG. 4.21. Señal de entrada aplicada a la planta con función de transferencia G(s)=4/(s+0.4)

FIG. 4.22. Comparativo de las salidas entregadas por el sistema difuso y el sistema de primer

FIG. 4.23. Diagrama de bloques del sistema de primer orden no lineal. FIG. 4.24. Señal senoidal alimentada a la entrada del sistema de primer orden no lineal para

FIG. 4.25. Datos de entrenamiento para el sistema de primer orden no lineal. FIG. 4.26. Variación del error EC durante 200 épocas de entrenamiento para identificar el

FIG. 4.27. Posición de los conjuntos difusos en las variables de entrada después del

orden lineal.

se realizó el entrenamiento.

generalización.

respuesta a una señal de entrada triangular.

capacidad de generalización.

primer orden como respuesta a una señal escalón.

primer orden lineal.

para obtener los datos de entrenamiento.

orden lineal G(s)=4/(s+O.4) como respuesta a un escalón.

generar los datos de entrenamiento.

sistema de primer orden no lineal.

entrenamiento para el sistema de primer orden no lineal.

V

Page 11: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

FIG. 4.28. Salida del sistema no lineal de primer orden y salida del sistema difuso. FIG. 4.29. Salida del sistema no lineal de primer orden y salida del sistema difuso. FIG. 430. Variación respecto a los valores iniciales de los centros de la variable u(l-dT). FIG. 4.31. Variación respecto a los valores iniciales de los centros de la variable?:(r-dT). FIG. 4.32. Variación de los valores de las bases de los conjuntos difusos de la variable FIG. 4.33. Variación de los valoresde las bases de los conjuntos difusos de la variabley(f-dT). FIG. 4.34. Variación de los valores de los pesos de las 16 reglas difusas del sistema. FIG. 4.35. Señal de entrada aplicada a la planta para generar los datos de entrenamiento. FIG. 4.36. Comparativo de la salida del sistema difuso después del entrenamiento y la salida

FIG. 4.37. Señal de entrada escalón aplicada al identiticador difuso para probar su capacidad

FIG. 4.38. Comparativo de la salida del sistema difuso después del entrenamiento y la salida

FIG. 4.39. Comparativo de la salida del sistema del sistema difuso después del entrenamiento

FIG. 4.40. Señal de entrada escalón aplicada al identificador difuso para probar su capacidad

FIG. 4.41. Comparativo de la salida del sistema difuso después del entrenamiento y la salida

FIG. 4.42. Comparativo de la salida del sistema difuso después del entrenamiento y la salida

de la planta de segundo orden.

de generalización.

de la planta de segundo orden lineal.

y la salida de la planta de segundo orden lineal.

de generalización.

de la planta de segundo orden lineal.

de la planta de segundo orden lineal.

Capítulo 5 FIG. 5.1. Esquema de control utilizando modelo inverso a lazo abierto. FIG. 5.2. Selección de las variables de entrada a considerar. FIG. 5.3. Obtención de datos de entrenamiento para el control de una planta de primer orden. FIG. 5.4. Controlador difuso FC basado en modelo inverso aplicado a una planta de primer

FIG. 5.5. Controlador difuso FC basado en modelo inverso aplicado a una planta de primer

FIG. 5.6. Señal de referencia, salida de la planta y señal de control empleando el controlador

FIG. 5.7. Señal de referencia, salida de la planta y señal de control empleando el controlador

FIG. 5.8. Señal de referencia, salida de la planta y señal de control empleando el controlador

FIG. 5.9. Señal de referencia, salida de la planta y señal de control empleando el controlador

FIG. 5.10. Señal de perturbación aplicada a la entrada de la planta, agregada a la señal del

FIG. 5.11. Señal de referencia, salida de la planta y señal de control empleando el controlador

FIG. 5.12. Señal de referencia, salida de la planta y señal de control empleando el controlador

orden en una configuración a lazo abierto.

orden en una configuración a lazo cerrado.

difuso a lazo abierto.

difuso a lazo cerrado.

difuso a lazo abierto.

difuso a lazo cerrado.

controlador difuso.

difuso a lazo abierto y aplicando una perturbación.

difuso a lazo cerrado y aplicando una perturbación.

vi

Page 12: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

FIG. 5.13. Señal de perturbación aplicada a la entrada de la planta, agregada a la señal del

FIG. 5.14. Señal de referencia, salida de la planta y señal de control empleando el controlador

FIG. 5.15. Señal de referencia, salida de la planta y señal de control empleando el controlador

FIG. 5.16. Posición final, después del entrenamiento, de los conjuntos difusos para las

FIG. 5.17. Superficie de control generada por el sistema difuso después de la etapa de

FIG. 5.18. Señal de referencia triangular, salida de la planta y señal de control empleando el

FIG. 5.19. Señal de referencia triangular, salida de la planta y señal de control empleando el

FIG. 5.20. Señal de referencia senoidal, salida de la planta y señal de control empleando el

FIG. 5.21. Señal de referencia senoidal, salida de la planta y señal de control empleando el

FIG. 5.22. Escalón de amplitud 0.5 inyectado como perturbación a la entrada de la planta. FIG. 5.23. Señal de referencia triangular, salida de la planta y señal de control empleando el

controlador difuso a lazo abierto al aplicar una señal de perturbación. FIG. 5.24. Señal de referencia triangular, salida de la planta y señal de control empleando el

controlador difuso a lazo cerrado al aplicar una señal de perturbación. FIG. 5.25. Escalón de amplitud -0.5 inyectado como perturbación a la entrada de la planta. FIG. 5.26. Señal de referencia senoidal, salida de la planta y señal de control empleando el

FIG. 5.27. Señal de referencia senoidal, salida de la planta y señal de control empleando el

FIG. 5.28. Señales obtenidas aplicando el controlador, en lazo abierto, a la planta de segundo

FIG. 5.29. Señales obtenidas aplicando el controlador, en lazo abierto, a la planta de segundo

FIG. 530. Situación final de los conjuntos difusos, para las tres variables de entrada, después

FIG. 531. Señales obtenidas al aplicar el controlador, en lazo cerrado, a la planta de segundo

FIG. 532. Señales obtenidas al aplicar el controlador en lazo cerrado. FIG. 5.33. Esquema de control utilizando modelo de referencia. FIG. 534. Componentes de un controlador de una estructura basada en modelo de referencia. FIG. 535. Controlador difuso FC basado en modelo de referencia aplicado a una planta de

FIG. 536. Controlador difuso FC basado en modelo de referencia aplicado a una planta de

FIG. 537. Señal de entrada aplicada al modelo de referencia para obtener su identificación

FIG. 538. Señal de entrada aplicada al conjunto PM' para obtener su identificación inversa.

controlador difuso.

difuso a lazo abierto y aplicando una perturbación.

difuso a lazo cerrado y aplicando una perturbación.

vanablesy(1) y y(t-AT).

entrenamiento.

controlador difuso a lazo abierto. I

controlador difuso a lazo cerrado.

controlador difuso a lazo abierto.

controlador difuso a lazo cerrado.

controlador difuso a lazo abierto y aplicando una pemirbación.

controlador difuso a lazo cerrado y aplicando una perturbación.

orden lineal.

orden lineal.

de 100 épocas de entrenamiento.

orden lineal.

primer orden en una configuración a lazo abierto.

primer orden en una configuración a lazo cerrado.

inversa.

vi¡

Page 13: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

FIG. 5.39. Respuesta del modelo de referencia, salida de la planta utilizando el control MP-' a

FIG. 5.40. Respuesta del modelo de referencia, salida de la planta utilizando el control MP' a

FIG. 5.41. Criterio de selección de variables de entrada y salida para un sistema discreto de

FIG. 5.42. Criterio de selección de variables de entrada y salida para un sistema discreto de

FIG. 5.43. Criterio de selección de variables de entrada y salida para un sistema discreto de

FIG. 5.44. interpretación de cuatro reglas difusas vistas como parches. FIG. 5.45. Conjunto de 33 datos empleados para aproximar la función raíz cúbica. FIG. 5.46. Variable de entrada x particionada por cuatro conjuntos difusos. FIG. 5.47. Salida del sistema difuso al utilizar un 1vi,i=0.5 en las cuatro reglas del sistema. FIG. 5.48. Salida del sistema difuso al utilizar un \vini= j>'promedio en las cuatro reglas del

sistema. FIG. 5.49. Salida del sistema difuso al utilizar un wiiii= j: promedio en las cuatro reglas del

sistema, considerando únicamente aquellos datos que dispararon las reglas difusas con un p 0.5.

lazo abierto y señal de referencia.

lazo abierto y señal de referencia.

orden n durante la etapa de identificación.

orden I I durante la etapa de identificación inversa del sistema.

orden n usando la variante de deltas.

FIG. 5.50. Consideraciones en los sentidos para el ángulo y la fuerza del péndulo invertido. FIG. 5.51. Datos de entrenamiento muestreados sobre las variables ángulo y velocidad angular

FIG. 5.52. Datos de entrenamiento cubiertos por la superficie de control generada por el

FIG. 5.53. Situación final de los conjuntos difusos para las variables de entrada theta y theta'. FIG. 5.54. Valor de error EC en el transcurso de 100 épocas de entrenamiento. FIG. 5.55. Variación respecto a su valor inicial de los centros de los conjuntos difusos para la

FIG. 5.56. Variación respecto a su valor inicial de los centros de los conjuntos difusos para ia

FIG. 5.57. Variación de las bases de los conjuntos difusos pa- la variable de entrada 6'. FIG. 5.58. Variación de las bases de los conjuntos difusos para la variable de entrada 6". FIG. 5.59. Variación de los pesos de las 16 reglas del controlador difuso respecto a su valor

FIG. 5.60. Variación del ángulo a partir de un valor de 0.9 radianes utilizando el controlador

FIG. 5.61. Acción de control aplicada al péndulo invertido para llevarlo a una posición de

FIG. 5.62. Variación del ángulo del péndulo a partir de un valor de 4 . 3 rad aplicando el

FIG. 5.63. Acción de control aplicada al péndulo invertido para llevarlo a una posición de

FIG. 5.64. Datos de entrenamiento muestreados de un control PiD en las variables ángulo y

del péndulo invertido:

sistema difuso después de la etapa de entrenamiento.

variable de entrada 8.

variable de entrada 8'.

inicial win¡= y'promedio.

difuso en lazo cerrado.

equilibrio 8= O radianes.

controlador difuso identificado.

equilibrio 8= O radianes.

velocidad angular del péndulo invertido.

... Vll l

Page 14: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Anexo A FIG. A.l. Representación gráfica de los conjuntos difusos. FIG. A.2. Grados de pertenencia al aplicar un vector de entrada al sistema difuso

Anexo B FIG. B.l. Respuesta del sistema difuso utilizando a i = - 1 , a? = I . bl = b? = 4, wI = O y w2 = 1. FIG. B.2. Respuesta del sistema difuso utilizando al = - I , a? = I, b, = 6 , bl = 2. wl= O y w2 = 1.

ix

Page 15: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Lista de tablas

Capítulo 2 TABLA 2.1. Metodologías con adquisición automática del conocimiento

Capítulo 3 TABLA 3.1. Cantidad de parámetros a sintonizar para el caso de dos entradas y una salida a

TABLA 3.2. Valores finales de los parámetros del FSGD en la funciÓnflx)=ic”’. TABLA 3.3. Valores fmales de los parámetros sintonizados por el FSGD en la función

TABLA 3.4. Valores finales de los NCONJ=[3 31 triángulos sintonizados por el FSGD en la

TABLA 3.5. Valores finales de los pesos de las nueve reglas sintonizadas por el FSGD en la

TABLA 3.6. Valores de EC obtenidos en la época 50 y 100 utilizando diferente número de

TABLA 3.7. Valores de EC obtenidos en las épocas 50, 100, 150 y 200 utilizando diferente

distinto número de conjuntos.

campana de Gauss.

función producto.

función producto.

conjuntos en la versión A .

número de conjuntos difusos en la versión E.

Capítulo 4 TABLA 4.1. Otros experimentos realizados para identificar al sistema de primer orden lineal. TABLA 4.2. Otros experimentos realizados para identificar al sistema de primer orden no

TABLA 4.3. Resumen de experimentos realizados para identificar al sistema de segundo

TABLA 4.4. Otros experimentos realizados para identificar al sistema de segundo orden

lineal.

orden lineal.

lineal.

Capítulo 5 TABLA 5.1. Otros experimentos realizados para obtener el controlador de un sistema de

TABLA 5.2. Otros experimentos realizados para obtener el controlador de un sistema de

TABLA 5.3. Cantidad de datos por regla, sumatoria de salidas de los datos relacionados y

primer orden lineal.

primer orden no lineal.

salida promedio por regla para las cuatro reglas del sistema.

Anexo A TABLA A.1. Valores en los parámetros de los conjuntos difusos. TABLA A.Z. Valores en los parámetros de las reglas difusas. TABLA A.3. Grados de pertenencia al aplicar un vector de entrada en el sistema difuso. TABLA A.4. Cálculo de la inferencia a partir de los grados de pertenencia.

X

Page 16: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Tabla de símbolos

Descripción Factor de reducción de error. Vector de parámetros. Valor de error lo suficientemente pequeño. Grado de pertenencia del conjunto F.

Grado de disparo de la regla número i . Factor de aprendizaje. Incremento a la celda e.c de la tabla C. Incremento a la celda e.c de la tabla L . Incremento al factor de escalamiento sdc. Incremento al factor de escalamiento s,. Incremento a la celda e,c de la tabla If'. Etiqueta del conjunto difuso de la regla r y antecedente i. Parámetros de un controlador de tipo h e a l . Aceleración. I ) Centro del conjunto &angular de la regla i y antecedentej. 2) Media del conjunto i j con forma de campana de Gauss. Grado de pertenencia del conjunto i j al fusificar un valor de entada. Centro del conjunto siguiente. Centro del conjunto anterior. I ) Base del conjunto triangular que se encuentra en la regla i y antecedente j. 2) Desviación estándar del conjunto ij con forma de campana de Gauss. Constante. Cambio en el valor de error e. Tabla acumuladora de accesos durante un día del controlador. Memoria de largo plazo (LTM). Etiqueta del conjunto difuso de la regla r en el consecuente. Valor en la posición e,c dentro de la tabla C. Función de costo. Coeficientes de un polinomio de orden n. Término lingüistico,(conjunto difuso) de la variable cambio de error. Constante para la discretización de la variable cambio de error. índice que representa el número de dato de entrenamiento. Derivativo del error. . ,

Operador defusificación. Vector de cuantificación para la variable ce. Cambio en la acción de control. Función de costo. Representa el error calculado con la diferencia de la referencia y el valor obtenido.

. ..

.. X i

Page 17: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capítulo

1

ANTECEDENTES

1 .I. INTRODUCCIÓN

La lógica difusa en las últimas décadas ha tenido un gran auge, especialmente al ser aplicada al área de control de procesos; a esta aplicación se le ha llamado control dijmo. Los controladores difusos, a diferencia de los controladores convencionales, poseen la característica de trabajar con conceptos a través de enunciados condicionales de la forma ij then, los cuales relacionan conjuntos difusos en sus antecedentes y acciones de control en su s i ida. Esta característica hace posible tener la capacidad de poder incluir reglas provenientes de expertos humanos.

La facilidad para diseñar controladores difusos y su capacidad para trabajar con la incertidumbre. ha favorecido su uso en el mercado japonés en productos comerciales y de tipo industrial, como se incluye en un estado de la práctica en la sección 1.5. Sin embargo, los controles difusos dependen de lo bueno o malo que sea el diseñador humano, siendo esta su principal desventaja. En esta investigación se aborda el tema de automatizar en cierto grado el proceso de sintonización de controladores difusos. En este primer capítulo se presenta una introducción al control inteligente; el objetivo, un estado de la práctica, la metodología a seguir, el alcance y las aportaciones de este tema de investigación.

Page 18: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

.Anrecedenrer Capitulo I

1.2. EL CONTROL INTELIGENTE

El control clásico (e.g. Pi, PD, PID’) incluye teorías y métodos que fueron desarrolladas en las décadas pasadas para controlar sistemas dinámicos, cuyo comportamiento se describe principalmente mediante ecuaciones diferenciales. Bajo este marco matemático no se pueden resolver todos los problemas, algunos de ellos debido a que no pueden ser adecuadamente descritos en el marco de las ecuaciones diferenciales por su falta de generalidad; debido a estas limitaciones, se han desarrollado nuevos métodos, uno de ellos es llamado colectivamente el control inteligente, el cual intenta construirse sobre el control convencional y realzar sus metodologias para resolver problemas del tipo cambiantes [Antsaklis94].

Las características deseadas en los controladores inteligentes son: trabajar bajo grandes incertidumbres, reconfiguración del control al haber diagnóstico de fallas, adaptación y aprendizaje. Para llevar a cabo estas tareas, es necesario que el área del control inteligente sea interdisciplinario y que intente combinar y extender las teorías y los métodos de las áreas de control, ciencias de la computación e investigación de operaciones para lograr el éxito en el control de sistemas complejos [Antsaklis94].

Entre las herramientas más comúnmente utilizadas en el control inteligente se cuentan los sistemas expertos, las redes neuronales, los algoritmos genéticos y la lógica difusa, entre otras. Algunas de las ventajas que podemos citar del control difuso con respecto a las redes neuronales son: que mientras que la mayoria de las operaciones de cómputo en los controladores neuronales involucra la multiplicación, suma o logaritmos de dos números reales, en los controladores difusos la mayoria de las operaciones computacionales involucran el comparar y sumar dos números reales [Kosko92]. La metodologia propuesta en esta investigación utiliza un número mucho menor de iteraciones (algunos cientos), respecto al algoritmo de retropropagación (backpropagation) que emplea miles de regresos para entrenar a la red controladora.

Hablando un poco acerca de controladores en problemas del tipo “servo”, se ha encontrado que cuando se diseña un controlador de cualquier tipo (clásico, adaptivo o difuso), el problema intrínseco siempre es el mismo: dada una planta (sistema) y una trayectoria deseada de la señal de salida, surge entonces una pregunta, ¿cuál es la mejor trayectoria de entrada que, al ser aplicada a la planta, provoque que la salida del sistema resulte tan similar como sea posible a la trayectoria que se desea?. Ahora bien, todos los diseños de controladores, ya sean directos o inversos, están basados en un conocimiento parcial de la dinámica inversa de la planta y, al menos conceptualmente, ésta responde a la pregunta planteada anteriormente [Mugica95], como se mencionará con detalle más adelante.

’ Controladores basados en acciones de control P:pmporcional, D:denvativa e 1:integral

Sintonimidn de wnnoladores difusos basada en el metodo de gradiente descendente 1-2

Page 19: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Anrecedentes capitulo I

1.3. PROBLEMÁTICA

El diseño de controladores difusos ha dependido del conocimiento y experiencia, buena o mala, de un experto humano, así como también de su sentido de intuición. Esto resulta en un proceso que dista mucho de ser sistemático y, aunado a ésto, también cabe la posibilidad de no contar con dicho experto. La problemática que se aborda en este tema de investigación, así como de las metodologias presentadas en el capitulo dos, consiste en automatizar el diseño de controladores difusos a través de un proceso de sintonización de sus parámetros en forma sistemática.

1.4. OBJETIVO

Analizar, seleccionar e implementar una metodología de control que posea como característica, la adquisición del conocimiento en forma automática y que incluya como elemento controlador un sistema difuso. El comportamiento de este controlador se evaluará, mediante pruebas de simulación, en cierta clase de sistemas dinámicos, presentando sus ventajas y desventajas.

1.5. ESTADO DE LA PRÁCTICA

Entre las aplicaciones importantes de tipo comercial e industrial, y no de laboratorio, reportadas en el año de 1994 en el campo del control difuso encontramos las siguientes:

En [Takagi94] y [Kosko93] se mencionan productos de consumo que utilizan control difuso, y que se encuentran en el mercado, tal como lo indica la siguiente tabla, se incluyen además las marcas de los fabricantes:

Producto Marca@) Papel de la lógica difusa Aires acondicionados (Hitachi, Matsushita, Mitsubishi, Sharp): previene que la

oscilación de temperatura sea demasiado baja o alta y consume menos energía eléctrica al encender y apagar.

Frenos untibloqueo (Nissan): controla los frenos en situaciones de peligro, basándose en la velocidad y aceleración del automóvil y de las ruedas.

Auto encendido WOK, Nissan): control de inyección de combustible y encendido, basado en la posición de la esprea, el contenido de oxígeno, temperatura del agua de enfriamiento, RPM, volumen de combustible y varias presiones.

Auto irunsmisión (Honda, Nissan, Subaru): selección del radio de engrane basado en la carga del motor, la forma de conducir y las condiciones de la carretera.

Medudor químico (Fuji Electric): mezcla los químicos basándose en las condiciones de la planta.

Sintonizacidn dc conmladores difusos basada en el método de gradicnte descendente 1-3

Page 20: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Máquina copiadora (Canon): ajusta el voltaje del tambor basándose en la densidad de la imagen, temperatura y humedad.

Lavadora de platos (Matsushita): ajusta el ciclo de lavado y realiza estrategias de enjuague y secado, basándose en el número de platos y, en el tipo y cantidad de alimentos sobre los platos.

Secadora (Matsushita): convierte el tamaño de la carga, el tipo de material y el flujo de aire caliente a tiempos y estrategias de secado.

Control en elevador (Fujitec, Mitsubishi Elctric, Toshiba): reduce el tiempo de espera basándose en el tráfico de pasajeros.

Sistema de diagnóstico de golf(Maromaii Golf): selecciona el palo de golf basándose en el fisico y ritmo del golfista.

Sistema de detección de nivel de salud (Omron): evalúa la salud y el estado fisico de empleados.

Huniidrjkador (Casio): ajusta el contenido de humedad dependiendo de las condiciones del cuarto.

Control de una fábrica de hierro (Nippon Steel): mezcla los ingredientes y ajusta las temperaturas y tiempos.

Control de horno (Mitsubushi Chemical): mezcla los compuestos para fabricar el cemento.

Horno de inicroondas (Hitachi, Sanyo, Sharp, Toshiba): ajusta y selecciona la energía y la estrategia de cocinado.

Computadora Palmtop (Sony): reconoce caracteres Kanji escritos a mano. Refrigerador (Sharp): coloca tiempos de descongelación y enfriado basándose en su

uso. Una red neuronal aprende los hábitos del usuario y selecciona las reglas difusas que vayan de acuerdo con él.

Cocinadora de arroz (Matsuhita, Sanyo): coloca tiempo y método de cocinado basándose en el vapor, temperatura y volumen de arroz.

Sistema de ducha (Matsushita de Panasonic): suprime las variaciones en la temperatura del agua.

Fijador de cámara (Canon, Minolta): encuentra al sujeto en cualquier lugar dentro del área del lente y ajusta automáticamente el autoenfoque.

Cartera de acciones (Yamaichi): maneja la cartera de acciones japonesas basándose en datos de la macro y microeconomía.

Televisor (Goldstar de Corea, Hitachi, Samsung de Corea, Sony): ajusta el color de la pantalla, la textura de cada cuadro y estabiliza el volumen de acuerdo a su ubicación en un cuarto.

Tostador (Sony): coloca el tiempo de tostado y la estrategia de calentamiento para cada tipo de pan.

Aspiradora (Hitachi, Matsushita, Toshiba): coloca la estrategia de succión basándose en la cantidad de polvo y del tipo de piso.

Video cámara (Canon, Sanyo): ajuste de autofocus y de iluminación. Video cámma (Matsushita de Panasonic): cancela el movimiento o tembloreo que

provoca la persona al estar grabando, además de ajustar automáticamente el autofocus.

Sintoniraci6n de conuoladores difusos basada en el rnhodo de gradienie dacendenie 1-4

Page 21: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Anrecedenrer Capitulo I

Lavadora de ropa (Daewoo de Corea, Goldstar de Corea, Hitachi, Matsushita, Samsung de Corea, Sanyo, Sharp): ajusta las estrategias de lavado basándose en e l nivel de suciedad, tipo de material, tamaño de carga y nivel de agua. Algunos modelos usan redes neuronales para seleccionar las reglas a los gustos del usuario.

Aún cuando algunos de estos productos también utilizan redes neuronales, e l uso de las mismas no es en la operación en línea propiamente del control, sino para determinar los parámetros de los conjuntos difusos y algunas tareas secundarias al control [Kosko93].

Algunas otras aplicaciones industriales son: el control de nivel de tanque de una planta desengrasante de solventes [Tani94]; un sistema de desagüe de drenajes para situaciones de tormentas fuertes en Seattle [Hou94]; control de concentración de CO (monóxido de carbono) [Tanaka94]; control difuso en un modelo constructor de automóviles en Alemania [Altrock92]; control de motores para ahorro de energía eléctrica patrocinado por la Agencia de Protección del Medio Ambiente de Estados Unidos de Norteamérica (EPA) [Cleland92]; control de temperatura para alimentador de calor a una refinería [Perei92]; estabilizador de un sistema de energía eléctrica [Ishigame92]; control difuso del tratamiento de aguas negras, control de purificación del agua, controlador difuso para control de tráfico en una intersección de dos calles de un sentido; autopiloto para barcos y controlador difuso en homos de cemento rotatorios, estas últimas se mencionan en [Pedrycz93], entre otras.

Una aplicación der tipo no industrial es e l control de la presión sanguínea durante la anestesia en una operación quirúrgica [Meier92].

A pesar de que algunos países, como Japón, tienen extendida la práctica del control difuso en muchas aplicaciones, en México su investigación y tecnología está poco desarrollada.

1.6. METODOLOGiA

El proyecto de tesis constará de las siguientes etapas: 1) Identificación de las principales metodologías, con capacidad de adquirir el

conocimiento en forma automática, de controladores difusos. 2) Selección y estudio de una de las metodologias. 3) Asimilación de la metodología y la incorporación de conceptos de control. 4) Implementación del controlador. 5) Evaluación del controlador mediante la aplicación a casos de cómplejidad

creciente: i) Simulación de sistemas algebraicos, ii) Simulación de sistemas lineales y no lineales para estudiar y validar la

iii) Simulación del control de un péndulo invertido. metodología.

6) Análisis comparativo de las ventajas y desventajas del controlador difuso.

Stntonizacibn de wnuoladores difusos basada en el melodo de gradienle descendente 1-5

Page 22: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Antecedenres Capitulo I

1.7. CASOS DE APLlCACldN

Esta investigación incluye una etapa de experimentación, durante la cual se realizará la identificación de sistemas algebraicos, sistemas dinámicos lineales y no lineales, además del control de sistemas dinámicos lineales y no lineales en los cuales se observará el comportamiento de la operación del control difuso.

El caso final a controlar, después de una etapa de evaluación de la metodología, consiste en la simulación del control de un péndulo invertido; en este caso se obtendrá un controlador difuso a partir de la identificación de un controlador ya existente.

1.8. ALCANCE

Este trabajo no incluyó el desarrollo de una tarjeta o algún dispositivo semejante de hard ware. El desarrollo del control fué llevado a cabo en la arquitectura PC bajo el sistema WiNDOWS95, utilizando el paquete de simulación matemática MATLAB. Se realizó un prototipo original. Se hizo un análisis del desempeño de la metodologia seleccionada. Se adoptó una metodologia para sintonizar controladores difusos basada en gradieiite descendente capaz de sintonizar conjuntos y reglas difusas del sistema. Se implementó y evaluó la metodología. El producto final es un software basado en lógica difusa para identificar y controlar cierta clase de sistemas dinámicos a partir de datos muestreados.

1.9. APORTACIONES

Este tema hace un acoplamiento entre la computación y la teoría del control, mediante la aplicación de una técnica de inteligencia artificial (lógica difusa) al control de procesos y, de esta forma, encontrar beneficios dentro del área de la teoría del control.

Un interés adicional del tema consiste en abrir proyectos dentro de nuevas áreas de aplicación, por ejemplo, en el área productiva con la automatización de procesos usando técnicas de inteligencia artificial.

También es de señalar que hasta el momento solo existen tres tesis [Garcia97], [Espinoza98] y [Gámez98] en el Centro Nacional de Investigación y Desarrollo Tecnológico, cenider, que han abordado el tema de lógica difusa; sin embargo, las dos primeras no realizan un proceso de sintonización automático en sistemas difusos, lo cual es el punto principal de esta investigación.

Sintonización de controladora difusos basada en el mélcdo de gnidiente descendente I4

Page 23: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Anlecedenres Capitulo I

Este tema de investigación apoyó al desarrollo de la tesis [Gámez98] durante la etapa de sintonización de sistemas difusos, en la cual se obtuvieron buenos resultados.

Esta aplicación es parte del proyecto de formación de infiaestruciura y recursos humanos en automatización industrial del departamento de Ciencias Computacionales en el Centro Nacional de Investigación y Desarrollo Tecnológico, cuyos planes son vincular proyectos de forma interdisciplinaria, uniendo proyectos del área de mecánica, electrónica y computación hacia la solución de problemas en aplicaciones de tipo industrial.

Finalmente obtener una independencia, en cierto grado, en la existencia de un experto humano durante la etapa de diseño de controladores difusos, logrando con esto un proceso sistemático.

Sintonizaci6n de wntroladores difusos basada en el método de gradienre descendente 1-7

9 9 - 0 3 2 5

Page 24: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capítulo

2

ESTADO DEL ARTE

2.1. INTRODUCCIÓN

Este capítulo describe a los coniroladores difusos y presenta sus componentes y señala las ventajas y desventajas que poseen. Una de sus principales desventajas se encuentra en la etapa de dis,eño, debido a que el controlador difuso depende de la experiencia de operadores humanos y, por lo tanto dependerá de lo bueno o malo del conocimiento extraído de éstos. Como primer paso para encontrar alguna forma de eliminar esta desventaja, se realizó una búsqueda bibliográfica relacionada con metodologías basadas en lógica difusa, las cuales poseen capacidad de adquirir el conocimiento en forma automática. Las metodologías encontradas van desde la simple sintonización de ganancias de entrada y salida, hasta la sintonización de conjuntos difusos, sintonización de las reglas del sistema difuso, modificación de las etiquetas de los conjuntos difusos o una combinación de ellas.

Page 25: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

2.2. EL CONTROL DIFUSO

Los controladores difusos pueden ser aplicables a plantas’ que son dificiles de modelar matemáticamente y en las cuales la experiencia de los operadores humanos se encuentra disponible en reglas de tipo lingüístico, ¡as cuales permiten incluir el conocimiento de la planta. en el diseño de los controladores difusos, a diferencia del diseño de, los controladores convencionales que no incorporan este conocimiento lingüístico (experiencia). Wang [Wang92, p.25 1 I ] menciona que los controladores difusos resultan útiles en situaciones donde:

1) no existe un modelo matemático áceptable para la planta y/o, 2) existen operadores humanos experimentados quienes pueden controlar la planta-.

satisfactoriamente y pueden dar reglas de control cualitativas en términos de enunciados vagos y difusos.

La mayoría de las plantas, en la práctica, necesitan de acciones de control no lineales y los controladores difusos ofrecen controladores no lineales, como se demuestra en el teorema de la “aproximación universal” ‘[Wang92a] en donde los controladores difusos son lo suficientemente generales para realizar cualquier acción de control no lineal.

Lee [Lee90, p.4071 presenta una configuración básica de un controlador difuso formada de 4 componentes principales: una interfaz de fusificación, una base de conocimiento, lógica de toma de decisión y una interfaz de defusificación$.la cual se muestra en la figura 2.1.

Inteifaz de -+ fiuiiiiación

Interfaz de deiüsiiiiación

-

FIG. 2.1. Configuración b&ica de un controlador de lógica difusa (FLC).

, Ditbo

’ En este contexto ‘planta’ significa cualquier sistema dinámiw causal.

Sintonizacibn de connoladores difusos basada en el metodo de gradiente descendente 2-2

Lógica de

deck,,, Diñiso tomade t .

Page 26: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Eslodo del o m Caoirulo 2

I ) En la interfaz de fusificación se realizan las funciones de: a) medir los valores de las variables de entrada, b) realizar un escalamiento que convierta el rango de valores de las variables

numéricas de entrada en los universos del discurso correspondientes (variables lingüísticas),

c) realizar la función de fusificación, que consiste en convertir los datos de entrada en valores lingüísticos los cuales puedan verse como etiquetas de conjuntos difusos.

2) La base de conocimiento posee un conocimiento del dominio de la aplicación y los correspondientes objetivos del control. Se forma de una "base de datos" y de una "base de reglas de control lingüístico" (difiisas):

a) la base de datos genera definiciones necesarias utilizadas para definir las reglas de control lingüístico y la manipulación de datos difusos en un controlador difuso,

b) la base de reglas caracteriza el objetivo del control y la política de control de los expertos por medio de un conjunto de reglas de control lingüístico.

3) La lógica de toma de decisiones es el núcleo de un controlador difuso; tiene la capacidad de simular la toma de decisión humana basándose en conceptos difusos y de inferir las acciones de control mediante los operadores de la lógica difusa (implicación, modusponens, modus tollens, etc.).

4) L a interfaz de defusificación realiza: a) un escalamiento que convierte el rango de valores de las variables de salida

b) y la defusificación, que produce una acción de control no difusa a partir de en los universos del discurso correspondiente,

una acción de control difusa inferida.

Anteriormente se mencionó que la base de reglas juega un papel muy importante en el éxito o fracaso de un controlador difuso, debido a que es el conocimiento, propiamente dicho, para lograr controlar una planta. En [Lee90, p.41 I ] se mencionan algunas características a considerar en las reglas de control difuso, mejor conocida como la base de reglas:

a) realizar una selección apropiada de las variables de estado del proceso (entradas) y las variables de control (salidas), generalmente se utiliza al estado o la variable de control, su integral y derivadas.

b) la obtención de las reglas de control puede ser a partir de: 1) experiencia del experto y conocimiento de ingeniería de control: la

mayoría de nuestra información diaria es de tipo lingüístico en vez de numérico, y por esto la mayoria de las reglas se pueden derivar directamente del experto,

2 ) basarse en las acciones de control del operador: se deducen de la observación de las acciones del controlador en términos de los pares de datos entradalsalida,

Sintonizacibn de controladores difusos basada en el metodo de gradicntc descendente 2-3

Page 27: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Emdo del orre Caoihilo 2

Metodologia Parárnetros Ventajas sintonizados

Daugherity92 Ganancias de Sintonización de las ganancias de entrada. entrada.

Wang92 Conjuntos Sintoniza conjuntos difusos y reglas difusos y del sistema bajo el principio de conírol reglas del adaptable en linea. sistema.

sistema. Burkhardt92 Reglas del Sintonizar las reglas del sistema difuso

empleando un parámetro no lineal s, usando una funci6n de costo que relaciona algunos parámetros de desempeño.

Fei92 Modifica las Redefine las etiauetas de los coniuntos

. 3) basado en el niodelo difuso de un proceso: utilizando la descripción lingüística de las dinámicas caracteristicas de un proceso controlado, y

4) basado en aprendizaje: creando las reglas de control difusas mediante reglas de aprendizaje dirigidas hacia un desempeño deseado.

Una desventaja de los controladores difusos convencionales es que el proceso para la obtención de la posición y forma de los conjuntos difusos, as¡ como la selección de la base de reglas, generalmente esta basada en el conocimiento de un experto humano, y en este caso el controlador dependerá de lo bueno o malo que éste sea. Por tal motivo se han buscado alternativas para construir un controlador difuso en forma automática y, la alternativa basada en el aprendizaje resulta uno de los puntos de interés en esta tesis.

Algunas de las alternativas existentes para obtener un controlador con adquisición del

1) ajustando sus reglas de control difusas, 2) ajustando sus funciones de pertenencia (conjuntos difusos), 3) variando las ganancias de entraddsalida y/o, 4) modificando las definiciones de las variables de estado lingüisticas (etiquetas de los

conocimiento en forma automática son:

conjuntos difusos).

En la siguiente sección se explicarán algunas de las metodologías obtenidas en una búsqueda bibliográfica, así como una breve conclusión de las ventajas y liinitantes, desde nuestro punto de vista, encontradas en cada una de ellas y algunas caracteristicas observadas durante su estudio, las cuales conducirán a seleccionar el método más adecuado para la elaboración de controladores difusos. La tabla 2.1. incluye el conjunto de metodologías, para lograr la obtención de controladores difusos, que se estudiaron y que incluyen adquisición automática del conocimiento, la cual va desde la adaptación y sintonización de parámetros hasta el aprendizaje a partir de muy poca información.

Desventajas

No sintoniza reglas ni conjuntos difusos. Conocimiento de control adaptable y supervisono, ademhs de optimización.

Utiliza nueve conjuntos en cada variable de entrada, restricci6n de obtener el Jacobian0 en plantas SISO.

Es necesario contar con los etiquetas de los conjuntos.

difusos (ahorro &mputacional). conjuntos y reglas ya sintonizados.

Sintonizaci6n de wnlroladorer difusos basada en el método de gradiente descendente 2-4

Page 28: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Estada del orit CapiNlo 2

TABLA 2.1. Metodologia con adquisición automática del conocimiento (continuación).

Ventajas sintonizados

sistema. Tanaka94

Desventajas

sistema.

En etapa de identificación se sintonizan las reglas del sistema,

Chen94

Shenoi95 sistema.

No se sintonizan los conjuntos difusos. En la etapa de control no

mientras que en la etapa de control se sintonizan los coeficientes de un controlador de tipo INieal usando gradiente descendente. Puede emplearse para identificación y control. Utiliza el concepto de estados. En identificación se sintoniza mediante el aprendizaje hebbiano y en control se emplea un árbol de trayectorias. Esta basado en gradiente descendente. Sintoniza conjuntos y reglas del sistema.

se utiliza un controlador difuso.

Falta de especificación en la construcción del controlador, de su función de costo y de la construcción del árbol de trayectorias.

Dependencia de los datos de entrenamiento. No hay criterio para selección de número de conjuntos. Existen grados de

Sintoniza conjuntos y reglas del sistema. Utiliza grados de pertenencia en el intervalo [O, I].

Basado en tablas look up. Sintoniza las acciones de las reglas del sistema.

I pertenencia negativos. Está basado en gradiente descendente. I Dependencia de los datos de

entrenamiento. No hay criterio para selección de número de conjuntos. Limitada para sistemas de dos entradas y una salida. Cantidad excesiva de parámetros de usuario. Solo realiza incrementos en las acciones de las reglas, pero faltan las politicas para decrementarlas. Controlador demasiado especifico para un tipo de sistemas.

2.3. SISTEMAS DIFUSOS CON ADQUISICIÓN AUTOMATICA DEL CONOCIMIENTO

2.3.1. Metodología Daugherity92

En [Daugheriíy92] se emplea un método de auto sintonizado que afecta únicamente a las ganancias de entrada. El tipo de planta a controlar es un proceso de una entrada y una salida (SISO), y el controlador difuso es del tipo PID difuso, en donde sus enbadas son el error en cada iteración (e) y el primer derivativo (de), y su salida o acción de control generada por el controlador difuso es du, es decir, el cambio en la variable manipulada u.

Sintonizacidn de controladores difusos basada en el melodo de gradiente descendente 2-5

Page 29: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Estado del orre Caoitulo 2

Este controlador debe de comenzar con una base de reglas y con conjuntos difusos previamente definidos, debido a que el sintonizado del controlador consiste en ajustar los factores de escalación de las entradas, representados por s, y sdr, por medio de un conjunto de meta reglas difusas. Este artículo se basó en la técnica empleada en [Maeda90].

Se emplean restricciones para el diseño del controlador difuso, las cuales son: sobretiro (OV), tiempo de ascenso (RT) y la amplitud de la oscilación (OSC). Así mismo, estas características se emplean como medidas de desempeño.

Las reglas que se emplean para sintonizar las ganancias de entrada son de la forma: IF niedición-de-~eseiiipeiio is XI THEN AY, is Y, IF niedición_de-desempe>io is X, THEN AydC is Y,

En donde iiredición-de-deseriipeño puede ser OV, RT u O X , los conjuntos difusos que describen a estas mediciones de desempeño están definidos en X I y X,, mientras que Y, y Y, son conjuntos difusos que describen las correcciones de los factores de escalación. AI final de cada iteración del procedimiento de sintonizado, los factores de escalación s, y sde se actualizan de la siguiente manera:

s, (¡+I)+&(¡) +A& S& (i+l) 4- s,* (i) +&de

2.3.1.1. Comentarios

La adquisición del conocimiento en esta metodología resulta muy limitada, debido a que sintoniza únicamente las ganancias de entrada, Io cual es análogo a variar las ganancias de un controlador PID convencional. Esta metodología genera un controlador bajo restricciones, en donde las características que se consideran en la operación del controlador son: sobretiro (OV), tiempo de ascenso (RT) y porcentaje de amplitud de oscilación (OSC), los cuales diseñan un controlador más personalizado hacia la planta y con desempeños de operación preestablecidos. Las pruebas sobre el controlador consisten en hacer la sustitución de un controlador tipo PID por un controlador difuso aplicado al control de temperatura de un calentador de agua por medio de un quemador de gas.

Se observó que se necesita inicializar al controlador con la base de reglas y los conjuntos difusos previamente establecidos y medianamente ajustados, sintonizando únicamente las ganancias de entrada, las cuales incrementan o decrementan la señal de entrada al controlador.

Sintonimci6n de wntroladores difusos basada en el mklodo de gradienre descendente 2-6

Page 30: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

&sfado del o m capitulo 2

2.3.2. Metodología Wang92

Wang [Wang92] describe un controlador difuso adaptable en linea, el cual utiliza un controlador difuso convencional, como el descrito en [Lee901 además se emplea un control supervisorio, es decir la señal de control u será la suma de un control difuso u,fx/@ y un control supervisorio u.&).

La salida del control difuso convencional defusificada se define como:

-1 en donde y es el punto en el cual el grado de pertenencia,uu,.: obtiene su máximo valor, es

decir el grado de pertenencia 1 .O, lo cual cumple que ,uf:! ( y ' ) = 1 .O -

La aportación del control supervisorio u,(Y) queda determinada por una función que relaciona un valor de error lo suficientemente pequeño E, a una función que incluye a un umbral definido por el diseñador para verificar el desempeño del controlador I ] y a un vector de constantes de operación del controlador k que pertenece al universo de los números reales, entre otras variables.

Se hace la suposición de que se cuenta con un conjunto de L reglas difusas, las cuales se obtienen a partir de expertos humanos, definidas de la forma:

R(r: : ifx, is A ; and ... andx, is AL then u is c" donde: A : y c" son etiquetas de conjuntos difusos en R y r = 1,2, ..., L.

pueden ayudar a aceleran el proceso de aprendizaje. Estas reglas si bien no son necesarias como condición de inicio en el controlador,

El esquema completo del control difuso adaptable se muestra en la figura 2.2, el cual incluye la aplicación de una ley de adaptación a un vector de paráinetros del controlador ( e ) y la comparación de la salida contra un parámetro (I]) , para incluir la aportación del control supervisorio.

Sintonizaci6n de wntmladores difusos basada en el método de gradiente dacendente 2-7 Ql

Page 31: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Estado del arte Capitulo 2

I +

IfIT=O

J O ---+-tu Canid supehoz ic

FIG. 2.2. Esquema completo del control difuso adaptable

2.3.2.1. Comentarios

Esta metodología emplea un controlador difuso convencional, el cual debe de contar con una base de reglas de control y la definición de los conjuntos difusos medianamente sintonizados, lo que requiere conocimiento del experto humano para la realización de estos componentes. Este sistema difuso presintonizado acelera el proceso de aprendizaje, aunque también es posible comenzar con otra situación inicial.

Se emplea un control supeniisorio en línea, cuyo estudio aún no hemos profundizado, ya que se necesitan conocimientos de optimización y control adaptable. Los casos de simulación consisten en regular al origen una planta, inestable cuando no tiene control, dada por:

Sintonizaci6n de wntroladores difusos basada en el melodo de gradienle descendente 2-8

Page 32: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Esiodo del mle Cnnirill" 2

2.3.3. Metodología Burkhardt92

En [Burkhardt92] se presenta una propuesta de aprendizaje planteada por Procyk y Mamdani empleando el jacobiano de la planta. La adaptación del controlador difuso se lleva a cabo mediante la modificación de la base de reglas, usando nueve conjuntos difusos con forma triangular igualmente espaciados a lo largo de cada uno de los universos del discurso. Las variables de entrada y salida son escaladas en el intervalo [ - I , I ] . El controlador diseñado es de la familia PID ya que se utiliza al error y a su derivada como entradas. La planta a controlar es el péndulo invertido y el objetivo será mantener al péndulo verticalmente.

La actualización de la base de reglas, mediante la asignación del grado de confianza o crédito, determina cuál regla o reglas son las responsables del mal desempeño, realizando sobre ellas la corrección. El controlador auto organizativo realiza iterativamente mejoras en su base de reglas durante sus ensayos de aprendizaje a través de una asignación de crédito utilizando una regla heurística que relaciona una de las salidas anteriores de la planta, el retardo de la planta y el orden de la planta. Dado que serán necesarios estos parámetros, se requieren sus estimados.

2.3.3.1. Modificación de la base de reglas

Una política consiste en borrar sólo una regla y sustituirla por otra nueva con las mismas premisas, en donde la nueva conclusión es el término lingüístico más cercano a la suma del escalar de corrección. La regla de control a ser borrada en el tiempo nT, Ek 3 C, 3 uk esta definida por las ecuaciones:

Ek=F,{e(nT-niT)) C , = F , { c ( n T - m T ) )

uk=Fk{u(nT-mT) +r(nT))

donde: Fe, F, y F, son operadores que devuelven el conjunto difuso con más alto grado de pertenencia al aplicar un argumento preciso, en los universos de error, cambio de error y salida del controlador, respectivamente,

e y c son las variables error y cambio de error respectivamente, en valores precisos normalizados, en el tiempo de muestre0 (nT- m7),

u es la salida del controlador y r es el valor de corrección de la regla, en valores precisos.

Además de sintonizar la base de reglas, también se hace un sintonizado de las funciones de pertenencia mediante un parámetro s llamadofactor de escalamiento no lineal, el cual condensa el espacio de los conjuntos alrededor del punto de equilibrio (O, O), lo que sirve para mejorar el desempeño de estado estable y el porcentaje de sobretiro; por otro lado, los conjuntos de ambos extremos se emplean para mantener el tiempo de ascenso. El efecto que realiza elfacfor de escalamiento sobre las funciones de pertenencia se muestra en la figura 2.3.

SintonizaciCin de wnlroladores difusos basada en el metodo de gradiente descendente 2-9

Page 33: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Eslodo de/ orit Capitulo 2

NZ PZ

I I -1 .o -I 0.0 I 1 .o

FIG. 2.3. Escalamiento de las funciones de pertenencia mediante el parámetro s. N:negati\,o. P:positivo. Z:cero. B:grande, M:mediano y %pequeño.

El mejor valor d e s es determinado por un método de búsqueda de gradiente sobre una función de costo (CF), la cual es una combinación de las cuatro características de desempeño a la respuesta a la señal escalón. Las características que se consideran son: el tiempo de ascenso (RT), el porcentaje de sobretiro (POS), el tiempo de asentamiento (STS) y el error promedio cuadrado (RMS) del error de estado estable.

2.3.3.2. Comentarios

Las partes importantes de esta metodologia son: a) el controlador puede comenzar a partir de una base de reglas nulas, b) el empleo de un factor de escalamiento no lineal s, el cual distribuye las funciones de pertenencia de las entradas y salidas sobre los universos del discurso, y c) la función de costo (CF) que se aplica para obtener el mejor valor de s, y que incluye restricciones para el controlador por medio de cuatro caracteristicas: tiempo de ascenso, porcentaje de sobretiro, tiempo de estabilización y porcentaje de error de estado estable, las cuales permiten diseñar un controlador bajo ciertos criterios de desempeño y operación. El controlador obtenido se aplicó a un péndulo invertido cuyo objetivo fué mantener al péndulo verticalmente. Los experimentos consistieron en partir de condiciones iniciales en el ángulo.

En la elaboración del controlador encontramos que se necesita el Jacobian0 de la planta, el cual es un escalar para plantas de una entrada, una salida (SISO), sin embargo nuestros casos de prueba son plantas de tipo múltiple entrada, una salida (MISO), esto dá una limitante en el desarrollo y experimentación de esta metodologia, otra limitante es que no profundiza en la elección de la regla a modificar y tampoco se menciona una referencia bibliográfica a la cual acudir. Otros inconvenientes que se consideraron fueron utilizar nueve conjuntos por variable de entrada al controlador difuso, el cual es un número grande, que genera una cantidad considerable de reglas difusas; finalmente se comenta que no se incluye a detalle la obtención del parámetro s a través de la función de costo CF.

Sintoniracidn de cnnlroladorer difusos basada en el metado de gradienle descendente 2-10

Page 34: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Estado del o m CaOitulO 2

2.3.4. Metodología Fei92

En [Fei92] se emplea como metodología un esquema de adaptación de un control difuso, el cual se aplica al control del desplazamiento de un robot móvil. El controlador obtenido reacciona a variaciones en el medio ambiente, y en vez de modificar la base de conocimiento se modifican las definiciones de las variables lingüísticas (etiquetas de los conjuntos difusos). La base de reglas a emplear deberá estar ya definida, así como los conjuntos difusos que particionarán a cada uno de los universos del discurso.

Como ejemplo de la modificación de las definiciones de las variables lingüísticas se comenta que en el mundo real una velocidad de 100 km/hr en un automóvil puede ser segura bajo condiciones de autopista recta y seca, pero cuando las condiciones del medio ambiente cambian, por ejemplo, con un camino con curvas y el pavimento mojado se puede considerar esta velocidad como insegura. En este artículo se presenta un teorema que relaciona este concepto y encuentra un conjunto difuso equivalente al modificar las definiciones de las variables lingüísticas, el controlador diseñado se aplica a un problema en el que la variable a controlar para un robot móvil es la aceleración (acc) y cuyo objetivo es llevar al robot a una posición y ángulo determinados.

El concepto de modificar las definiciones lingüísticas en el caso del robot móvil se aplica cuando las condiciones del medio ambiente cambian, lo cual causará un correspondiente cambio en el valor de la aceleración máxima permisible, la cual puede ser ajustada mediante cambios en las definiciones de las variables lingüísticas, en este caso velocidad o distancia, pero sin llevar a cabo modificaciones en la base de conocimiento. La base de conocimiento se encuentra representada por una tabla de distancias seguras previamente obtenida con una aceleración constante de 2.5 ft/s2 (6.35 cm/s2) en el robot móvil.

2.3.4.1. Comentarios

La alternativa, en esta metodología de diseño de un controlador, es redefinir las etiquetas de los conjuntos difusos en vez de modificar la base de reglas o las ganancias de entrada cuando se presenten variaciones en las condiciones del medio ambiente. De las metodologías revisadas es la única que utiliza este concepto y, parece importante desde el punto de vista de ahorro en el gasto computacional al modificar únicamente las etiquetas de los conjuntos difusos y evitar modificar la base de reglas y los parámetros de los conjuntos.

El controlador resultante se aplicó al desplazamiento de un robot móvil cuyo objetivo consistía en llegar a una posición y ángulo determinados a partir de un origen. Se empleó como parámetro la aceleración máxima y el concepto a modificar fue la distancia segura. Las limitantes observadas en esta metodología son que la base de reglas a emplear deberá estar ya definida, así como los conjuntos difusos que particionarán a los universos del discurso y, que a nuestro parecer resultan parámetros dificiles de obtener y desearíamos un mayor grado de automatización*.

’ Este arlículo se fundamenta en tesis de maestrla y doctorado de launiversidad de Syracuse, NY, las cuales hasta el momenlo no se han podido conseguir y aclarar las dudas referentes a la elaboraci6n del wntrol del movimiento de un robot basado en conocimiento difuso, así como la tabla de distancias seguras.

Sintonizacidn de conmladorcs difusos basada en el rnttodo de aradienle descendente 2-1 I

Page 35: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

2.3.5. Metodologia Tanaka94

En [Tanaka941 se presenta la identificación y la validación de un modelo difuso de predicción de concentración de monóxido de carbono (CO). Después de contar con el modelo difuso, se lleva a cabo la simulación del control de la concentración de CO empleando como referencia una señal escalón. La dinámica obtenida de este modelo queda definida por dos reglas tipo Sugeno de orden uno, el modelo cuenta con cinco entradas, considerando en cada una, su valor actual y sus cuatro valores anteriores:

xi([) -.yj(t-4) : velocidad del viento, xZ(t) -x>(i-4) : volumen de tráfico,

xj(t) -q(í-4) : temperatura, x,(Z, -x,(f-4) : cantidad de luz,

y([) - y@-4) : concentración de CO anteriores y í tiempo.

Como salida del modelo identificado se predecirá la concentración de CO en el tiempo siguiente y(í+l), la identificación se lleva a cabo utilizando una base de datos de entrenamiento y modificando los parámetros de las reglas de control difuso con el método del criterio imparcial (UC), que se empleó en [Ivakheiiko78], las reglas de control difuso que representan localmente relaciones de entraddsalida lineales de un sistema están definidas como:

Regla i : IF x i is A;, y . . . y x,, is A,,, THEN y; = C;O + cijxi + . . . + ci,j,, donde: i=l,2, ..., r número de reglas IF-THEN,

x, son las entradas al modelo difuso, y, salida de la i-ésima regla IF-THEN, A , es un conjunto difuso y cjn constantes que se adaptarán mediante la regla de aprendizaje.

Previamente identificado el proceso mediante un modelo difuso, se simula el control con auto aprendizaje de la concentración de CO, teniendo como objetivo mantener la concentración de CO a un nivel constante, la estructura del controlador es del tipo directo de la familia PID, utilizando como salida del controlador el volumen de tráfico.

El controlador a emplear es de tipo lineal y está definido como: h z f t ) = aizdt) + a 2 Z d t ) xzft) = X z ( I - I ) + Aq(tj

donde .zl(t) = r - y([) y q(f) = z,(t) - .zl(t-I) y los coeficientes al y al son parámetros del controlador.

Se comenta que no es fácil resolver los parámetros óptimos del controlador analíticamente y se utiliza como alternativa el ajuste automático de los parámetros por medio de la regla de aprendizaje de Widrow-Hoe, empleada en redes neuronales.

' El aprendizaje Widrow-Hoff consiste en utilizar w m o inuemento o corrección de los parSmeiros el error obtenido de la salida deseada y la salida obtenida por el proceso.

Sintonizacidn de wntroladores difusos basada en el método de gradiente descendenre 2-12

Page 36: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Ezlodo del orre Caoihdo 2

La función de salida objetivo queda definida por: 1 2

J = - (r - y ( t + 1))’

Esta ecuación es derivada parcialmente respecto a cada parámetro del controlador para obtener los máximos de desempeño. Finalmente la ecuación para modificar en forma sucesiva los parámetros del controlador es:

donde: E ; es un factor de aprendizaje, i=( I , 2 } , pj es un parámetro consecuente de .Y>@) y

valor de pertenencia de la j-ésima regla del modelo difuso al instante de tiempo t.

2.3.5.1. Comentarios

No se comenta que se pueda utilizar al controlador en línea o fuera de línea para el ajuste de sus parámetros, pero por las gráficas y lo explicado en el artículo, concluimos que es un aprendizajefuera de línea, por lo que después de ajustado se aplica el controlador obtenido a la planta, no representando esto una desventaja. La cantidad de muestras de entrenamiento para la identificación y la predicción es rica, ya que se comenta que utilizaron 253 datos reales de la predicción, lo cual da una valoración de la capacidad de aprendizaje de este método.

El método para lograr la identificación del modelo de concentración de CO utiliza un criterio de imparcialidad (UC), que se encuentra en [Ivakhnenko78] (el cual no ha sido aun revisado). La planta que se controla es de tipo predictivo y emplea cinco entradas, cada una de las cuales contiene la entrada actual y sus cuatro valores anteriores x,(f)-x,(f-4), es importante que se aplique a una planta tipo MISO (múltiple entrada, salida simple), debido a que se emplearán casos de prueba de este tipo.

La adaptación del controlador lineal mediante el método del gradiente produce una forma de dirigir correctamente al controlador hacia un buen desempeño disminuyendo el error promedio progresivamente. Las pruebas del controlador se realizan sobre el modelo de concentración de CO y el objetivo es mantener el nivel de CO utilizando como señal de control el volumen de tráfico y empleando como referencia una señal escalón. Un punto que no se indicó en esta metodología es si la base de reglas debe iniciarse o si el método la generará automáticamente; este punto daría una valoración del grado de automatización que posee.

Sinlonizacibn de controladores difusos basada en el melodo de gradienle desccndcnte 2-13

Page 37: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Esrodo del m e Capitulo 2

2 3.6. Metodoiogia Wang92b

La metodología de [Wang92b] realiza la identificación de una planta Pfi) y el controlador Kfi) en forma difusa. Se comienza a partir de la consideración de que un proceso dinámico no lineal discreto se encuentra representado desde el punto de vista del concepto de estado por:

x ( k + l ) =f(XF), u(k), W , donde x(k)=[xl(k), x&) ,..., x,,fi)J7 es el vector de estados y

u(k)=[u,fi), u&) ,..., un(k)Jr son las entradas de control.

Haciendo una equivalencia empleando la lógica difusa, obtenemos: X(k+II=X(k)" Ufi) OPlkj, (2-1)

donde Pfi) es la relación del proceso, y U@) y X(k) son los conjuntos difusos fusificados de ufi) y x(k) respectivamente. A partir de esta consideración se lleva a cabo la identificación de Pfi).)

2.3.6.1. Obtención d e P(k)

El modelo difuso representado por la ecuación (2-1) queda definido mediante un número finito de reglas implicativas difusas de la forma:

if(xfi) is LJ and (u@) is L,J then (x(k+l) is L J

donde L representa el valor lingüístico de una variable lingüística, es decir un conjunto difuso.

Para lograr el mecanismo de aprendizaje de la identificación difusa, adaptable en Iínea, se utilizará la ley de aprendizaje hebbiana difusa, en la forma siguiente:

p fi+ I)=Cip(k) V cz{(X(k)A u&)) I)x(k+ 1)) donde cI es la tasa de olvido y CI la tasa de aprendizaje, el término P(k+l) representa el valor actual del modelo difuso, P(k) representa el valor anterior del modelo difuso y el término (Xfi)~U(k))+X(k+l) representa el incremento que se debe de aplicar ai modelo difuso.

Los ajustes de los parámetros del modelo difuso identificado Pfi) pueden ser interpretados como la modificación de las reglas implicativas difusas.

La evaluación de la identificación se lleva a cabo mediante

Sintonización de convoladores difusos basada en el rnCtodo de gradiente descendente 2-14

Page 38: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Errado del orre Capitulo 2

donde E z O y Defuz( ] es el operador defusificación. Si no se cumple la ecuación (2-2), entonces se volverá a modificar P(k) hasta cumplir con la condición, mediante un proceso iterativo. A partir de la identificación de la planta P(k) se lleva a cabo la generación del controlador.

2.3.6.2. Obtención del control

En el caso del controlador, éste consiste en un árbol de trayectorias, en donde cada secuencia de control queda representado por una rama del árbol. El proceso de elaboración del controlador comienza bajo la consideración de un sistema dinámico no lineal, de tiempo discreto, definido por:

X(k+ I ) =X(k) o Ufi) O P(k)

Haciendo la suposición de que la entrada de control U@) es un control de retroalimentación de estado y realizando la descripción del sistema de lazo cerrado, se obtiene:

X(k+I)=Xfk) oXík) "KnO "PF), (2-3)

XdF+I) =XW OX@) "TF), (2-4)

Finalmente se hace la consideración de que se encontrará el estado siguiente óptimo mediante:

donde T(k) es la relación de transición deseada y Y() es el estado siguiente óptimo.

Ahora el problema radica en encontrar el término T(k), el cual representa la relación de transición deseada, cuyo procedimiento será explicado más adelante, mientras tanto, pensemos que se estima P(k) usando el algoritmo de identificación en linea y que T(k) se construye apropiadamente, entonces obtendremos la relación del controlador K(k) comparando las ecuaciones (2-3) y (2-4):

K' (k ) = T ( k ) " k ' ( k ) donde P- ' (k) es el estimado de P-'(k), el cual representa la relación inversa de P(k),

K'(k) : relación Óptima del controlador. - ~

2.3.6.3. Obtención de la relación de transición T(kJ

Para este paso se utiliza un algoritmo de "seguimiento en el tiempo" (forward-in time) basado en un árbol de búsqueda, de tipo truncado, que representa en si un conjunto de secuencias de control que se encuentran en los nodos del árbol.

Para encontrar T(k) se empleará una función de costo J, definida por:

J = ~N(xW) + Crlo'lk ( x í k ) , u(k)), (2-5)

Sinlonizaci6n de wnlroladores difusos basada en el melodo de gradiente descendente 2-15

Page 39: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Eslodo del o m Capitulo 2

El procedimiento para la construcción de Tfi) en línea basado en el algoritmo de

a) colocar u=@,, uz, _.., u#.} y definir una función de costo que satisfaga las especificaciones del diseñador,

b) leer los estados actuales y asignarlos a la raiz del árbol. Si la raíz es el nodo terminal entonces parar; de otra manera generar un árbol de trayectorias de nivel p usando el método de primero en anchura, calcular el valor de la función de costo para cada trayectoria simulada,

“seguimiento en el tiempo” es:

c) encontrar la trayectoria óptima o la política de control óptimo, d) encontrar los estados subóptimos siguientes, e) ir al paso b).

2.3.6.5. Comentarios

Los casos de experimentación aplicados a esta metodología fueron la identificación de un sistema lineal de segundo orden que es excitado por una señal senoidal, y el control de una planta lineal de segundo orden inestable.

Esta metodología explica los pasos para construir un controlador en términos muy generales, sin embargo no especifica el proceso completo; esto evita su posible reproducción. En lo que respecta al proceso de idenrificación, presenta con todo detalle el procedimiento a seguir. La función de costo es demasiado general y no muestra ningún criterio a seguir, éste puede ser por ejemplo menor esfuerzo o bien menor tiempo de respuesta por citar algunos. Sin embargo, la obtención de la función de costo también lleva uti cierto grado de dificultad. En cuanto a la construcción del árbol, no menciona las políticas a emplear en el número de controles admisibles, los cuales representan el número de opciones o ramas para cada nodo, y esto es algo importante en la obtención de la relación de transición deseada Tfi). Tampoco se especifica la estructura del controlador. Esta metodología posee demasiados puntos sin esclarecer y, t a n solo parece una propuesta en vez de un trabajo terminal.

2.3.7. Metodología Nomura92

En momura92] se desarrolla una metodología de sintonizado de parámetros de las acciones de las reglas de control difusas y de los conjuntos difusos (base y posición), por medio de un método de gradiente.

Se emplea como información inicial un vector de datos, que consta en dos partes: un vector de entrada (xi , x2, ___, x,) y su respectiva salida y , los cuales se pueden describir mediante una regla difusa de la forma:

r fx i is A I / A ... A X , is Ay, ihen y is w, donde i=1,2, ... n reglas difusas

Ai,, ..., A i , son funciones de pertenencia de la parte antecedente y w, es un número real que es la parte del consecuente de cada regla.

Sinfonización de conlmladores difusos basada en el metodo de gradiente descendente 2-17

Page 40: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

EsStado del arte Capitulo 2

Las funciones de pertenencia son en forma de triángulo isósceles. como lo muestra la figura 2.5, y cada una se define mediante dos parámetros, base (anchura sobre el eje de abscisas) b,, y centro (eje central del triángulo) u,~:

A ,cr, t

FIG. 2.5. Definición de los parámetros de los conjuntos difusos triangulares a emplear. a, centro y b, anchura de la base del triángulo.

La salida del sistema difusoy, puede obtenerse a partir de las ecuaciones: 2 Ixj-a, I

Aij(xj) = 1 - con i = I , 2 , . 4 yj=l,2, ..., ni (2-6) bij

donde A,(x,) es el grado de pertenencia sobre el conjunto ij al aplicar un valor de entrada preciso xj,

p i = A i l (xj) .Ai l (x, )...:Ai, (x, ) = nm J=I A i j ( ~ j ) (2-7) donde ,ui representa el grado de disparo de la regla i.

donde wi representa el peso o valor de salida de la regla i.

El proceso consiste enfusificar un valor xj de entrada, ecuación (2-6), calcular el grado de disparo de cada una de las reglas mediante la inferencia, ecuación (2-7) y defusificar, utilizando la ecuación (2-S), para obtener finalmente un valor preciso o exacto (crisp).

2.3.7.1. Algoritmo de auto sintonizado

Se necesita un vector de dimensión p definido como Z=(ZI, 22, ..., zp) que contiene los parámetros a sintonizar. Este vector en el método de descenso minimiza una función objetivo E@). El vector que decrementa el valor de una función objetivo E@) se expresa por:

Sinlonizacidn de conlmladarcs difusos basada en el metodo de gradienlc descendente 2-18

Page 41: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Estado de/ arte c?pitulo-2

La regla de aprendizaje, para cada uno de los parámetros, está expresada por la ecuación:

donde: i = l , ...,p t es el número de iteración de aprendizaje y k es una constante.

La función objetivo E que se desea minimizar sintonizando las reglas de inferencia, se encuentra definida por la ecuación:

donde:

1 E = ?(y -yr)'

yr es la salida deseada de datos adquirida por los datos de entrenamiento, y es la salida obtenida a partir del razonamiento difuso, E es el error de inferencia.

(2- 1 O)

Sustituyendo (2-7) y (2-8) en (2-lo), E puede ser expresada como:

(2-1 I )

Dado que A , depende de los parámetros u, y de b,, la función objetivo E depende del sintonizado de los parámetros u,,, b , y w,, (i=l,2 ,..., n, J=1,2 ,..., m).

Ahora el vector óptimo Z capaz de minimizar la función objetivo E@) está definido

una representación de la dimensión del vector 2 se presenta en la figura 2.6.

n consecuentes

1 por cada regla g I a s

ancho rn antecedentes

FIG. 2.6. Dimensión del vector Z. El número de parámetros a optimizar esp=Znm+n.

Sintonirni411 de comoladores difusos basada en el método de gradienie descendente 2-19

Page 42: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Estodo del o m Capihdo 2

Derivando parcialmente la función objetivo E respecto a cada uno de los tres distintos parámetros (a, , bij , wi) y, sustituyendo las expresiones resultantes en la ecuación (2-9) se obtienen las ecuaciones de adaptación de los parámetros mediante el método del descenso:

w, ( I + I ) =w, ( I ) -K.,.-+- P E,=, PI

( y -f) (2- 14)

donde K,, Kb y K," son constantes, que representan los factores de aprendizaje o los grados de modificación independientes para cada tipo de parámetro y sgn( ) es la función signo.

El procedimiento de aprendizaje consiste en adaptar iterativamente los paráinetros y evaluar el desempeño del controlador mediante el error medio de la salida deseada respecto a la obtenida por el controlador difuso, cuando el error medio sea menor que un parámetro E > O se terminará la adaptación. Las condiciones iniciales del sistema difuso son: conjuntos difusos espaciados linealmente, bases entre conjuntos adyacentes traslapadas entre si y pesos iniciales de las reglas difusas en w,,, = O. El ajuste se llevará a cabo primero sobre las acciones de control (w,), y a continuación sobre los parámetros de los conjuntos difusos (a, , b,), para finalmente calcular el error medio de las salidas.

Esta metodologia se empleó en [Chen94], con la variante de que la definición de las funciones de pertenencia se encuentran de la siguiente manera:

de otra manera

en donde ,u!, es el grado de pertenencia de la variable de entrada xt , i es el número de regla y los valores de u , ~ . ~ ) , al, y al(,4l) son los centros de tres conjuntos triangulares consecutivos. Esta ecuación de fusificación genera conjuntos triangulares eslabonados tal como lo muestra la figura 2.7.

Sintonilacibn de controladorer difusos basada en el metodo de gradient descendente 2-20

Page 43: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Estado del arte CapiNlo 2

FIG. 2.7. Funciones de pertenencia para la variablex,.

Como se observa, la definición de los grados de pertenencia está en el intervalo [O.O, 1.01, a diferencia de Nomura pJomura921, en donde existen grados de pertenencia negativos.

2.3.7.2. Comentarios

Esta metodología tiene como característica la adaptación de algunos de los parámetros que en la práctica son complicados de obtener, los cuales son: la sintoirización de las aiciones de las reglas de control (w;) y la sintonización de los conjuntos difusos, incluyendo las posiciones (a,) y bases (by). El artículo presenta con claridad toda la metodología y las reglas de adaptación o aprendizaje, obtenidas a partir del método de gradiente descendente.

El sistema difuso que se sintoniza utiliza un número fijo de reglas de control, así como de conjuntos difusos. Las condiciones de inicio requeridas en los conjuntos difusos son encontrarse los centros espaciados linealmente en cada universo del discurso y sus bases entre conjuntos consecutivos traslapadas entre si; en cuanto a los pesos de las reglas del sistema todos son inicializados con un valor de 0.0. A partir de estas condiciones, la metodología se encargará de adaptar estas conjuntos y reglas hasta obtener el control de la planta.

En esta metodología el controlador deberá de llevar a la planta a una señal de referencia representada por un pulso escalón, pero se espera que la metodología sea lo suficientemente general para lograr el control de nuestros casos de prueba. La desventaja principal de la metodología pomura92J radica en no encontrarse formalizada con la teoría de conjuntos difusos, debido a que utiliza grados de pertenencia negativos. La metodología [Chen94] sí utiliza grados de pertenencia en el intervalo [O, 11, pero la propuesta está limitada a sistemas que utilizan dos entradas y una salida.

Sintonizacibn de wnlmladores difusos basada en el m&do de gradicnlc deseendenle 2-21

Page 44: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 2 Emdo delarle

2.3.8. Metodología Shenoi95

La propuesta presentada en [Shenoi95] en un controlador difuso de la familia PID, que utiliza al error y al cambio de error como entradas al controlador y, como salida se aplica la acción de control. Se hacen dos experimentos para probar el controlador: 1)control de temperaiura: que consiste en controlar la temperatura de un foco, y 2)control de elevación: utilizado para controlar la elevación de una pelota de ping pong en un recipiente con entrada de aire proveniente de una secadora de pelo. El objetivo de ambos casos es llegar a una referencia constante. Su aprendizaje es en lhea utilizando matrices, en las que sus renglones representan el error, sus columnas el cambio en el error y las intersecciones las acciones de control, a estas matrices se les conoce con el nombre de tablas look up. En esta metodología el efecto resultante al modificarla es semejante a modificar las reglas difusas yio lasfunciones de pertenencia.

Se utilizan cuatro tablas para llevar a cabo el aprendizaje, cada una está compuesta de 13*13=169 localidades figura 2.8, sus respectivos nombres y funcionamiento se describen a continuación:

C 13 STM LTM

FIG.'2.8. Tablas de implementación.

L : tabla de acciones de control, cada componente se referirá como la localidad IC= en donde e es el error y c el

W : tabla contadora de accesos a la localidad I,, se le denomina memoria de corto plazo (STM). C : tabla que acumula los accesos en un diu del controlador. se le denomina memoria de largo plazo (LTM). M : máximo número de accesos a las localidades de la tabla L durante cualquier día en la vida del controlador.

cambio del error.

2.3.8.1. Cuantificación de los datos de entrada precisos

El proceso comienza cuando se tiene un vector de entrada (ie, ic) de tipo preciso (crisp), cada una de estas entradas se procesará para obtener la posición (renglón,columna) que le corresponde en la tabla de acciones L.

Existen trece renglones y trece columnas lo que equivale a 169 acciones pero, a diferencia de otras implementaciones de tablas look-up, aquí se emplean como renglones y columnas valores numéricos y no conjuntos difusos. En el artículo se comenta que se trabajarán siete conjuntos difusos por cada variable de entrada, lo que representa 49 reglas difusas en total.

2-22 Sintonizacibn de controladores difusos basada en el método de gradiente dmcendentc

Page 45: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 2 Eslado del arte

La forma de llevar una entrada precisa a una posición (única) en la tabla look-up es de acuerdo a dos vectores de cuantificación, los cuales le dan un efecto de no linealidad a los conjuntos, haciéndolos parecer mas cercanos alrededor del centro (valor 0.0) y más esparcidos hacia los extremos. Los vectores de cuantificación definidos para e y c son qe y dqe respectivamente y se calculan de la siguiente manera:

qe(n) = ?E,,,,d’~’’ dqe(n) = -Kn,,,P

I I3 en donde: C,,, = ( I -e- ) E,,,, N=O.S(Número de niveles de cuantificación - I), en este caso N=0.5(13-1)=6, el valor de a se busca de forma que qe( i ) = i .O y dqe( I ) = ] .O, E,,,, se seleccionó en I OO.

El valor de -1/3 es el valor de la constante de tiempo normalizada, es decir (alJ/tc - d e í q en donde fc-deluy es un parámetro que se considera durante el diseño del controlador y que se comentará más adelante.

Los vectores de cuantificación resultantes son:

qe = [-46.4, -21.5, -10.0, -4.6, -2.2, -1.0, 0.0, 1.0, 2.2, 4.6, 10.0,21.5,46.4] y dqe= [-l6.2, -9.3, -5.3, -3.0, -1.7, -1.0, 0.0, 1.0, 1.7, 3.0, 5.3, 9.3, 16.21.

Empleando estas discretizaciones se obtendrá un número entre {A,-5,..,5, 6) para el renglón (e) y para la columna (c) al aplicar como vector de entrada de tipo preciso (ie, ic).

2.3.8.2. Definición d e las zonas d e incrementos

Los incrementos a las acciones de control se llevan a cabo de acuerdo a zonas de incrementos que se encuentran definidas como lo muestra la figura 2.9.

-6... O ... 6 -6... O ... 6

-1 Zona “3

0 0 0 1 2 1 I ’ l l I D l J 1 1 11 10 o 01 zona 22 zona t 1

FIG. 2.9. División por zonas en la tabla de accesos y sus respectivas tablas de incrementos.

Sintonimci6n de controladorer difusos basada en el metodo de gradicnle descendente 2-23

Page 46: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

CapiNlO 2 Esiodo del arte

2.3.8.3. Procedimiento de aprendizaje

Habiendo obtenido el renglón y la columna a la cual pertenece la acción a tomar, el proceso de aprendizaje del sistema difuso es el siguiente:

1. Cuando se accesa I,,, se detecta la zona en la cual se encuentra y entonces se llevan a cabo los incrementos en las tablas W y C mediante:

we,c + wes + Awes ce,c + Ces + Awes

donde Awe,c es el incremento basado en los cuadros de incrementos definidos en la figura 2.9, es decir, los incrementos se llevan a cabo en la posición ( e s ) y en las celdas vecinas una posición alrededor.

L a única zona que no posee incrementos es la zona O, la cual nunca tendrá incrementos, ni en cantidad de accesos n i en acciones de control. Los accesos o contadores en las tablas W, C y Msiempre son enteros positivos

2. Cuando se llega a la situación >preset threshold y

cCF > mc.c se procederá al aprendizaje en la tabla L, en caso contrario se incrementaráii los contadores de accesos de las tablas W, C y Mcomo se definió anteriormente.

3. La regla de aprendizaje en la tabla de acciones L viene dada por: 1e.s + 1e.c + A1e.c

we& + 0

en donde está también definido por la zona a la cual pertenece (e,c). Las modificaciones se llevan a cabo en la celda de esa posición y sus celdas vecinas. Los incrementos Ale,c quedan definidos como :

Zona f l : Zona f 2 : Ale,c = '0.5 Zona f3 : A& = kl .O

= fO. 1 w , , ~ I threshold I threshold I threshold

Los incrementos a la tabla de acciones L son unidireccionuíes, ya que dependen del signo de la zona a l a cual pertenecen, sus valores son de tipo real. El efecto de las condiciones de disparo al aprendizaje es producir paciencia en el controlador y además para prevenir sobreaprendizaje.

4. Una transición al estado dormido dispara los siguientes pasos de manejo del control para todos los pares (e,c) :

t ce,c ifc,, > we& +- o, G . C o.

Sintonimián de canmiladores difusos basada ni el metodo de gradiente descendente 2-24

Page 47: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 2 Estado del arie

La transición al estado dormido representa el f in de un día en la vida del controlador. De esta manera, la memoria de tiempo de vida M, retiene el máximo número de accesos acumulativos y las memorias de corto y largo plazo, Wy C son inicializadas.

5. Finalmente cuando la unidad se desconecta se borra la memoria de tiempo de vida: M t O.

2.3.8.4. Parárnetros d e diseño del controlador

Se utilizan seis parámetros para obtener el controlador difuso personalizado a la aplicación, los cuales son:

1. tc delay: este parámetro sirve para evitar sobreaprendizajes y comportamientos oscilatorios en el controlador. Si se inicia con un valor i, provoca que el controlador use cada i-ésima entrada de e(n) para ajustar la superficie de control y no provocar que el controlador se vaya con el alias de la planta,

2. threshold parámetro de umbral de disparo para modificar la superficie de control L. Se utiliza para ajustar la inercia de aprendizaje o el nivel de paciencia del controlador a cambios en el desempeño de control,

3. qel ... qe6 y dqel _.. dqeó: son los niveles de cuantificación para el error e(n) y el cambio de error c(n) respectivamente, en este caso utilizamos 13 dentro de la tabla look-up, logrando en el controlador un nivel de control más fino cerca del punto estable cero y un, nivel de cuantificación más grueso en las regiones lejanas del punto estable,

4. r-delay: retardo de la planta, considerado como el tiempo que transcurre desde que se aplica una señal de entrada a la planta hasta que sucede su respuesta,

5. w-s-deIq y s-w-delay: son términos de retardo que inician las transiciones de despierto a dormido o de dormido a despierto,

6. k, y k,: son los coeficientes de ganancia de entrada y salida respectivamente. No se incluye el coeficiente de la entrada de cambio de error k, debido a que es una entrada directa y su valor es calculado por el controlador.

2.3.8.5. Comentarios

Esta metodología posee facilidad en su implementación ya que se emplean matrices de datos llamadas tablas look up. Según Braae [Braae79] los controladores difusos basados en tablas Iook up se encuentran entre las implementaciones más simples de los algoritmos de control difuso básicos [Shenoi95, p.741.

Sintonizaci6n de cuntroladores difusos basada en el método de grndiente descendente 2-25

Page 48: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 2 Esiodo del arte

La personalización del controlador a una planta determinada es otra cualidad de esta metodología, y se menciona que los seis parámetros de diseño necesarios son fáciles de obtener mediante un análisis superficial de la planta y otros por prueba y error. No se necesita una base de reglas inicial ni tampoco la definición de los conjuntos difusos. Los casos de prueba de esta metodología consisten en llevar a las plantas a una referencia constante, representada por un escalón, que en un caso es una temperatura y en la otra la posición de una pelota.

Algunas de las limitantes encontradas en esta metodología son que no se menciona la política a emplear sobre la entrada precisa en la etapa de cuantificación ya que no existe en forma explícita la operación de fusificación y en ningún momento se incluye la ecuación relacionada. Otra limitante es que esta metodología esta diseñada para obtener controladores del tipo PID, debido a que se utilizan como entradas el error y el cambio en el error, y por lo tanto se encuentra limitada a controladores difusos de dos entradas. Finalmente la adaptación se realiza en un solo sentido, al incrementar las celdas de la tabla look up, por lo que no hay manera de corregir un posible sobreaprendizaje y se deben hacer consideraciones acerca de los parámetros de retardo y tiempo de muestreo.

2.4. CONCLUSIONES

Las metodologias Shenoi95 y Nomura92 poseen mayor grado de automatización en la construcción de sistemas difusos, ya que ambas sintonizan tanto conjuntos difusos como las reglas del sistema. Estas dos características, a nbestra consideración, son las que poseen un mayor grado de complejidad para su obtención.

Se realizó la implementación de la metodología Shenoi95 no encontrando los resultados esperados, además de observar que posee un diseño a la medida para una clase específica de sistemas a controlar; esto puede notarse en los valores de cuantificación y en la posición de las zonas de incrementos, las cuales bien podrían estar en otra dirección. Además de estos inconvenientes, la metodología requiere una gran cantidad de parámetros de usuario, los cuales son dificiles de colocar a punto; otro inconveniente es que solo existe la política de incrementar las acciones de control, y sería deseable contar con una política que también pudiera decrementar y de esta manera evitar sobreaprendizajes. Finalmente, también existe la restricción de poder aplicarla solamente a sistemas de dos entradas.

La metodología elegida para el diseño de sistemas difusos con adquisición del conocimiento en forma automática fue Nomura92, la cual consideramos que posee más automatización en los parámetros de la base de reglas y conjuntos difusos, además de que resulta más clara y entendible. Esta metodología, a diferencia de Shenoi95, utiliza una cantidad baja de parámetros de usuario. Aunque en el artículo se consideran plantas de tipo SISO, se espera lograr la generalización a plantas del tipo MISO, lo cual hará más atractiva esta metodología. Un punto que se desea conseguir en esta metodología es utilizar grados de pertenencia en el intervalo [O, I ] y evitar los valores negativos que actualmente posee.

Sintonización de wntroladores difusos basada en el método de gradiente descendente 2-26

Page 49: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capítulo

3

SINTONIZACIÓN DE SISTEMAS DIFUSOS EMPLEANDO EL MÉTODO DE GRADIENTE DESCENDENTE

3.1. INTRODUCCIÓN

En el capítulo anterior se realizó un análisis y selección de metodologías capaces de sintonizar sistemas difusos en forma automática; también se realizó la evaluación de dos de las metodologías. Finalmente, se eligió el método de gradiente descendente propuesto por Nomura [Nomura92] debido a que es capaz de sintonizar tanto conjuntos difusos como la base de reglas del sistema difuso; otra característica encontrada en el método es la sintonización no heurística, sino dirigida, de los parámetros a sintonizar ya que se basa en un método de gradiente descendente.

Inicialmente, en este capítulo se incluirán las consideraciones necesarias para la implementación del algoritmo de gradiente descendente, así como las modificaciones o adaptaciones propuestas que permitieron mejorar el algoritmo original; luego se incluirá un conjunto de variantes al método de gradiente descendente relacionadas con las funciones de pertenencia del sistema difuso. Posteriormente se mostrará un conjunto de experimentos realizados sobre funciones de tipo algebraico, y finalmente se describirán las conclusiones basadas en estos experimentos.

Page 50: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 3 S;nton;zoeión de s;~tpmos di/usos empleando el método de grodiente descendente

3.2. CONSIDERACIONES GENERALES

La metodología de gradiente descendente propuesta por Nomura [Nomura92] posee

a) Es un método dirigido, debido a que las ecuaciones de aprendizaje o sintonización se obtienen a partir de un método de gradiente descendente.

b) Es capaz de sintonizar los parametros que a nuestra consideración resultan más dificiles de obtener, como son: las posiciones de los conjuntos difusos y las reglas difusas de control; además de calcular en forma automática los factores de escalamiento en entradas y salida. Utiliza un conjunto completo de reglas, es decir, incluye la combinación de todos los conjuntos de cada uno de las variables de entrada para formar la base de reglas difusas del sistema.

d) Conserva el conocimiento lingüístico, a diferencia de otros métodos como redes neuronales artificiales o algoritmos geneticos; los sistemas difusos contienen conjuntos que forman particiones, en las variables de entrada y salida, cuya forma o posición representa un comportamiento lingüístico relacionado al universo del discurso, puede ser alto, bajo, medio, etc.; así mismo, cada una de las reglas de control difuso que relaciona en sus antecedentes los conjuntos difusos define un comportamiento de la salida del sistema a partir de los comportamientos de las entradas.

e) Se puede incluir información a priori en la operación del sistema difuso, esta información es muy Ú t i l ya que a diferencia de los métodos convencionales de control de procesos, los cuales no pueden incluir información acerca del comportamiento del sistema, un sistema difuso puede incluir ya sean reglas de control o conjuntos difusos. Las reglas de control pueden ser dadas por un usuario experto o un especialista, e.g. para el control de una caldera podría encontrarse una regla de control definida por: si la fenzperatura es baja y la presión es baja entonces abrir la vúluula de inyección de combustible, en donde las variables de entrada u observadas son: la temperatura y la presión; mientras que la acción de control está dada por el grado de inyección de combustible por parte de la válvula. En el caso de los conjuntos difusos podemos incluir información acerca de las posiciones y formas que guardan los conjuntos sobre la distribución de los datos del universo del discurso en una variable tal como tenperafura, velocidad, alfirud, etc.

0 El método de aprendizaje consiste en una optimización de los parámetros del sistema difuso a partir de los valores calculados por el sistema y y los valores deseados o esperados y' como resultado de una señal de entrada u al sistema. Debido a esta característica necesitamos un conjunto de datos, denominados datos de entrenamiento, formado en dos partes: un vector de datos de entrada (xi. xl, .__, xm) y su respectivo valor de salida y'generado por el vector de entrada. Un término con el que se suele denotar este tipo de procesos en sistemas basados en conocimiento es: método supervisado, por la forma en la cual sintoniza o aproxima usando como modelo una salida deseada.

las siguientes características:

c)

Sinfaniraci6n de coniroladores difusos basada en el metodo de gradiente descendente 3-2

.*

Page 51: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 3 Sinioncación de sisiems d@sos empleando el mirodo de gradfenre descendenle

g) Sintonización fuera de línea, hasta el momento de realizar esta investigación se ha trabajado con el algoritmo fuera de línea. es decir, tomando datos de las entradas necesarias y de la salida de una función algebraica o un sistema dinámico, a partir de este conjunto de datos de entrenamiento se realiza la sintonización de los parámetros del sistema hasta lograr aproximar el conjunto de datos de entrenamiento, también denominado convergencia del algoritmo. Posteriormente se utiliza el sistema difuso con los valores finales de los parámetros sintonizados durante una simulación, lo que también se conoce con el nombre de validación.

Teniendo este conjunto de características tan extenso, y considerando la posibilidad de mejorar la metodología se hará a continuación el planteamiento en la definición de los operadores a considerar en el método de gradiente descendente aplicado a los parámetros de un sistema difuso.

3.3. SINTONIZACIÓN POR EL MÉTODO DE GRADIENTE DESCENDENTE

Las cuatro partes de las que se compone el proceso de sintonización de los parámetros de un sistema difuso basado en gradiente descendente son:

a) definir los operadores con los cuales se calculará la salida del sistema difuso a través de la fusificación, inferencia y defusificación,

b) obtener las reglas de aprendizaje a partir del método de gradiente descendente, las cuales serán calculadas para cada uno de los parámetros del sistema difuso que se deseen sintonizar,

c) combinar la acción de cada una de las reglas de aprendizaje mediante un proceso iterativo, durante el cual se lleva a cabo la sintonización del sistema difuso,

d) colocar los valores de los parámetros del sistema difuso en una condición de inicio, a partir de la cual comience el proceso de sintonización.

3.3.1. Definición de operadores

En esta sección se definirá el proceso mediante el cual una entrada, de tipo preciso, es transformada a valores difusos, posteriormente es evaluada con la base de reglas del sistema y finalmente el resultado de tipo difuso es convertido a un valor de tipo preciso, el cual representa la acción del sistema difuso. En términos generales, en esta sección haremos una definición de las ecuaciones que forman el proceso del sistema difuso: fusificación, inferencia y defusificación.

que forman la base de reglas del sistema difuso, esta metodología emplea reglas de tip@ ugen 7 de orden cero, las cuales poseen en los antecedentes conjuntos difusos y como consecuknte-un escalar w, que representa el peso o aportación de la regla a la salida del sistema; una regla típica se puede ver como

La primera definición se realiza sobre el tipo de reg4

reglai: ifxl isA,/and ... andx,isA/,thenyisw,

Sintonizaci6n de cnntmladorei difusos basada en el metodo de gradiente descendente 3-3

Page 52: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

SintoncociM de srstemr d$isos empleando el iniredo de grudienle descendente Capitulo 3

donde i=1,2 ,..,, n, xIi x2, ,..., x, son las variables de entrada al sistema, A i / , Ai2 ,..., A , son conjuntos difusos, y es la variable de salida y wi es un escalar que representa el peso o aportación de la regla i a la solución del sistema.

La diferencia principal de estas reglas, respecto al esquema Mamdani, radica en que la salida de la regla no es un conjunto difuso, sino un escalar, representado en la regla de orden cero por w,, Un orden superior puede utilizar valores de sus antecedentes para formar un polinomio de diversas formas, como por ejemplo + bx2 + CX/X I + h z ' : en donde los coeficientes a, b, c y d representan los paráinetros de peso sobre cada uno de los términos del polinomio.

Habiendo planteado el tipo de reglas difusas, el proceso a seguir para obtener la salida del sistema difuso utilizando reglas difusas tipo Sugeno de orden cero es el siguiente:

a) Fusijkación: en está sección se consideró la posibilidad de mejorar el método propuesto por Nomura [Nomura92], el análisis llevó a una modificación [Castillo98], la cual va relacionada con las funciones de pertenencia. Una característica que se desea evitar es considerar valores de pertenencia negativos; es decir se desean considerar conjuntos difusos con grados de pertenencia en el intervalo [O.O, 1 .O], en donde el 0.0 representa nula pertenencia al conjunto difuso y el valor 1.0 representa pertenencia total, entre ambos extremos existen valores intermedios que significan el grado al cual pertenece un valor de entrada a cada uno de los conjuntos difusos. Esta propiedad es útil debido a que se encuentra fundamentada en la teoría de la lógica difusa y permite comparar este sistema difuso contra otras variantes. Otra ventaja es el hecho de poder mapear directamente el conocimiento de un experto a conjuntos difusos y al mismo tiempo poderlos interpretar directamente con el solo hecho de observarlos. El tipo de funciones de pertenencia a utilizar son conjuntos triangulares isósceles, representados por un centro a, y un anclio de base bu, como se puede ver en la figura 3.1; y cuyo grado de pertenencia Au(xJ para un valor de entrada xj, ahora se encuentra en el intervalo fO.0, 1.01. Recuerde que la función de pertenencia original, ecuación (2-6), generaba grados de pertenencia negativos y positivos, y en la lógica difusa formal'dichos grados de pertenencia no se encuentran definidos. La ecuación que relaciona los parámetros del conjunto difuso y el valor de entrada xj para encontrar su grado de pertenencia A&J se define mediante la ecuación (3-1).

I o de otra manera

donde j = 1,2, ..., m número de antecedentes en la regla del sistema difuso, i = 1,2, ..., n numero de reglas del sistema, a, representa el centro del triángulo para el conjunto ij, b, representa la base del triángulo para el conjunto ij, y x, representa la variable de entrada a fusificar.'

Sintonizacibn de controladores difusos basada en el metodo de gradiente descendente 3-4

Page 53: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 3 Sinfoncoeión de srsfemm dfimos empleando el m i l d o de grad,enfe deseendenfe

0- 6 ,

0

FIG. 3.1. Representación de un conjunto difuso triangular de forma isósceles: centro q, ancho de la base b, y grado de pertenencia A,,($ como resultado de un valor de entradax,.

b) Injerencia: el proceso de inferencia consiste en determinar matemáticamente el grado de disparo de cada una de las reglas a partir de los grados de pertenencia en sus antecedentes. El operador difuso empleado para calcular la inferencia estará representado por el producto de los grados de pertenencia A,(xJ de cada uno de los antecedentes que componen cada una de las reglas difusas. Tal como se muestra en la ecuación (3-2).

cc I = A, , (Xi 1 .A,&% 1.. . ..A ,,(X, 1 = u;] A,J (XJ ) (3-2) donde i=1,2, ..., n número de reglas difusas.

El operador producto tiene la característica de combinar la información (el conocimiento), de cada uno de los antecedentes de la regla; a diferencia del operador difuso nifn(), el cual sólo incluye la información del antecedente con menor grado de pertenencia, desechando la información del resto de los antecedentes y que de alguna manera podria ser útil para calcular la fuerza con la que actúa la regla difusa en la solución del problema.

c) Dejus$cución: a diferencia de un esquema Manidani, el cálculo de defusificación en un esquema Sugeno de orden cero no relaciona conjuntos difusos en su ecuación; más bien, realiza un promedio de los pesos de cada regla y de su grado de disparo. La ecuación empleada para realizar la defusificación está dada por la ecuación (3-3):

(3-3)

3-5 Sintonizaci6n de controladores difusos basada en el método de gradiente descendente

Page 54: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

La parte clave de esta metodología no radica en la definición de sus operadores, sino en la habilidad de sintonizar la mayoria de los parámetros que componen al sistema difuso, ésto se logra mediante las reglas de aprendizaje, las cuales realizan la optimización de los parámetros del sistema difuso empleando el método de gradiente descendente. A continuación se describe el proceso mediante el cual se lleva a cabo la obtención de las reglas de aprendizaje con la metodologia de gradiente descendente empleada en un sistema difuso que utiliza como conjuntos difusos triángulos isósceles y, cuyos grados de pertenencia se encuentran en el intervalo [O.O. I .O].

Los factores de escalamientos en entradas y salidas son necesarios para un manejo adecuado de los universos del discurso sobre las variables de entrada y salida. Los factores de escalamiento se obtienen a partir de los valores minimo y máximo, obtenidos de entre todos los datos de entrenamiento, mediante una ecuación de tipo lineal.

Para la escalación de los valores de entrada, de valores reales a un intervalo [-I .O, 1 .O], se utiliza la ecuación:

2 . (x - valor - minimo) valor - ma.wno - valor - minimo

Valor escalado(x) = ---- - 1

Mientras que la escalación de valores de salida, de un intervalo 10.0, 1 .O] a números reales, se obtiene con la ecuación:

Valor escalado(y) = y . (Valor - niaximo - Valor - minimo) + Valor - minimo

3.3.2. Obtención de las reglas de aprendizaje

Después de haber definido los operadores para obtener la salida del sistema difuso a partir de valores en las entradas, se procede a formalizar el método de gradiente descendente. Como parte principal del método es necesario contar con una función objetivo, en nuestro caso denominada E, la cual es derivada parcialmente respecto a cada uno de los parámetros a optimizar, en este caso los centros y bases de los conjuntos difusos y los pesos de las reglas. Empleando el valor obtenido de la derivada, también denominada dirección gradiente, se consigue optimizar los parámetros del sistema difuso guiando a encontrar un minimo (o un máximo) de la función objetivo.

La función objetivo E que relaciona la salida deseada y', y la salida calculada por el sistema difusoy, para un solo par entrada salida, queda representada por la ecuación (3-4):

1 E = ( y -y')* (3-4)

sustituyendo las ecuaciones de fusificación (3-i), inferencia (3-2) función de costo ( 3 4 ) resulta:

defusific I \

(3-33 en la

/\\ Sintonización de wntroladorer difusos basada en el melodo de gradienre descendente 3'6

Page 55: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Sintonización de sirie,nos di/usos empleundo el milodo de gradienre descendenre Capitulo 3

(3-5)

A la ecuación (3-5) la derivamos parcialmente respecto a cada uno de los diferentes parámetros: centro u,,, ancho de base b,, y peso de la regla 19, resultando las siguientes ecuaciones:

(3-7)

El proceso para res a r las reglas de aprendizaje es termina me' inte la siguiente expresión, que minimiza por gradiente descendente una función objetivo E a partir de la optimización del parámetro zj:

3E Z,(f+l) t z , ( t ) - K . - az, (3-9)

donde 1 = l,2, ..., p número de parámetros, f es el número de iteración de aprendizaje, z, es el valor de un parárnetro a optimizar - en este caso centros, bases o pesos de las reglas -, y K es un escalar que representa la rapidez con la cual se desea realizar el aprendizaje y que se denominaráfactor de aprendizaje. Para el caso de intentar nimimizar la función objetivo, la dirección de gradiente se suma, en vez de restarse.

En forma similar a la ecuación (3-9), se define para cada uno de nuestros parámetros del sistema, el siguiente conjunto de reglas de aprendizaje abreviadas:

aE a,(r + 1) t a,(t) -KO,- 30,

aE 'b,(t +1) c b,(t)-K, .-- ab,

(3-10)

(3-1 I )

Sintonizaci6n de controladores difusos basada en el melodo de gradimte descendente 3-7

Page 56: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

3E W i ( t + 1) t M>; ( I ) -K '

" &vi (3-12)

en donde KO, Kb y K, son los factores de aprendizaje para centros, bases y pesos de reglas respectivamente. d

A partir del análisis matemático, se encontró que la actualización de los parámetros será llevada a cabo únicamente cuando el grado de pertenencia A,(xJ > O.

Sustituyendo las ecuaciones (3-6), (3-7) y (3-8) en las ecuaciones (3-IO), (3-11) y (3-1 2) respectivamente, obtenemos las reglas de aprendizaje [Castillo98]:

W , (t + 1) t M', ( t ) -K --;--(y P - y r ) ' Z,&

donde sgn(*) es la función signo del argumento *I

(3-15)

El proceso de sintonización de parámetros posee como ventaja el poder ser aplicado a sistemas difusos con cualquier número de entradas y conjuntos difusos, con la restricción de tener únicamente una salida; para el caso de contar con más de una salida se utilizarán tantos sistemas difusos como salidas se deseen;.otra ventaja consiste en ser independiente del número de datos de entrenamiento.

A partir de estas reglas de aprendizaje, se propone el método de actualización de parámetros basándose en los datos de entrenamiento, sobre los cuales el proceso de aprendizaje lleva a una minimización del error representado por la función de costo E. El proceso de sintonización será explicado en forma detallada en la siguiente sección.

3.3.3. Proceso de sintonización

La sintonización de los parámetros del sistema difuso consiste de un proceso iterativo durante el cual una función de error EC definida por:

3-8 Sintonización de controladores difusos basada en el m¿todo de gradiente descendente

Page 57: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Sintonizoción de ,sisremas dftsos empleando el método de gradienre descendente Capitulo 3

es minimizada; este proceso contiene los siguientes pasos:

a) contar con una base de datos de entrenamiento, b) calcular la aportación a efectuar de cada uno de los datos de entrenamiento (di'& .:. dd

hacia cada uno de los pesos de las reglas del sistema difuso. )vi, ecuación (3-8), c) calcular el promedio de todas las aportaciones'a los pesos de las reglas .del .sistema.

difuso w;, tal como una votación por parte de cada uno de los datos de entrenamiento hacia la dirección que habrán de seguir los parámetros [Castillo98]; esto hace más dirigido el proceso de sintonización. El paso original planteado en Nomura &omura94] no realizaba una votación de todos los datos de entrenamiento, ya que cada uno ellos en. forma independiente afectaba los parámetros del sistema.'Esta política no aseguraba una. dirección de modificación de parámetros bien planteada,'

I d) aplicar el incremento promedio en cada peQlde las reglas del sistema difuso w,, e) realizar los pasos b) al d/ considerando como parámetros a sintonizar los centros de cada

triángulo a, así como sus respectivas bates'bb,, ecuaciones (3-6) y (3-7), 9 calcular el resultado de la funcióii de error EC utilizando los nuevos valores de. los

paráinetros, g) si EC > E regresar al paso b); en caso contrario, se ha llegado a la convergencia del

sistema al haber encontrado los parámetros del sistema que minimizan la función de costo E.

El parámetro de usuario E 2 O es un "valor de aceptación" que se utiliza como condición de paro de la etapa de entrenamiento, aunque también se puede utilizar como condición de paro un número arbitrario de iteraciones. Se referirá a este proceso a lo largo de la tesis como etapa de entrenamiento.

En cada iteración (denominada también época), el sistema difuso se aproxima a los datos de entrenamiento, al minimizar la diferencia entre el sistema difuso y y la salida deseada yr. Después de haber terminado el proceso de sintonización, el sistema se encuentra en'. condiciones de operar con datos diferentes a los de entrenamiento y generar una respuesta; este paso se realiza para comprobar la capacidad de generalización del sistema difuso a entradas desconocidas.

3.3.4. Condiciones iniciales en los parametros del sistema difuso \

Esta sección sugiere los valores iniciales de los parámetros del sistema difuso antes de comenzar la etapa de sintonización. Las consideraciones relacionadas con la posición inicial que deben de guardar los conjuntos difusos y los límites en los universos del discurso' se conservaron tal como se propusieron en Nomura [Nomura94], el universo del discurso para cada variable x, estará acotado en [-i .O, 1 .O] , y dentro de él, la posición inicial de los triángulos estará dada considerando los centros a, igualmente espaciados a lo largo del universo del discurso y iraslapando las bases entre conjuntos adyacentes, la figura 3.2 muestra la situación inicial para el caso de cuatro conjuntos difusos.

Sintonización de controladora difusos basada en el metodo de gradiente descendente 3-9

Page 58: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 3 Sinronimción de sisemos drfusos empleando el méioda de gradieiiie descendente

FIG. 3.2. Condicion inicial para cuatro conjuntos difusos

Los valores iniciales de los pesos, de todas las reglas difusas, serán de it!,-0.5, dado que la salida del sistema se encuentra escalada en el intervalo [O.O, 1.01 y un punto medio al, inicio de la sintonización puede ser mejor, que comenzar en los extremos 0.0 ó 1.0. En experimentos se encontró que el valor de 0.5 es muy útil en los casos de considerar simetría en los valores de entrenamiento [Castillo98], como también podrá observarse en la sección de aproximación de funciones algebraicas.

El número total de reglas a considerar en el sistema inicial depende del total de combinaciones de todos los conjuntos en cada. antecedente y no cambiará a lo largo de la etapa de entrenamiento. Como ejemplo, supóngase que se utilizan dos variables de entrada x i y x2, las cuales son particionadas en dos y tres conjuntodrespectivamente, por io tanto el número total de reglas del sistema difuso será de (2)(3)=6 reglas.

3.3.5. Cantidad de parámetroc a optimizar.

Haciendo una evaluación de la cantidad de parámetros necesarios a sintonizar por el método de gradiente descendente, se encontró que para un total de dos antecedentes con NC, y NC, conjuntos respectivamente se obtiene un total de NC,+ NC2 centros de triángulos u,, de NCl+ NC, bases de triángulos b, y de un total de (NCJ)(NCI) reglas del sistema difuso, sumando un total dep=2(NCI+ NCJ+ NC,.NC, parámetros a sintonizar. La tabla 3.1 muestra un concentrado de parámetros a sintonizar con distinto número de conjuntos por variable.

TABLA 3.1. Cantidad de par&metros a sintonizar para el caso de dos entradas y una salida a distinto número de conjuntos.

Sintoniraci6n de wntroladores difusos basada en el meiodo de gradiente dcscendenle 3-10

Page 59: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 3 S;nion;;oc;ón de sirlemas dfzsos empleando el miiodo de grndienle descendenre

Resulta evidente que conforme se aumenta el número de conjuntos, la cantidad de parámetros se convierte en una función cuadrática. Sin embargo, como se verá más adelante en la sección de identificación y contro1,'en la mayoría de los casos es suficiente contar con pocos conjuntos (dos o cuatro) para lograr aproximar un comportamiento de tipo lineal y no lineal.

3.4. VARIANTES DE LA METODOLOGIA

Algunas variantes del método de gradiente descendente generadas a partir de un análisis matemático de las funciones de pertenencia, y haciendo uso de las fórmulas de derivadas parciales contenidas en el apéndice B han sido:

a) versión de sintonización de conjuntos con forma de can1 una de auss, la cual fue

b) versión de sintonización de conjuntos en forma de triángulos asiniéíricos

c) versión de sintonización de conjuntos en forma de lriúngulos asiméíricos

implementada y evaluada, l.i&OkfCeviitrn

eslabonados, la cual también fue implementada y evaluada,

independientes, la cual no fue implementada.

El conjunto de reglas de aprendizaje necesarias para llevar a cabo las modificaciones respecto a la metodología que emplea como funciones de pertenencia triángulos isósceles independientes se incluye a continuación.

3.4.1. Método de sintonización utilizando conjuntos independientes con forma de campana de Gauss

La diferencia en el tipo de reglas, los operadores utilizados y la función de costo de esta variante respecto a la variante de triángulos isósceles independientes detallada en la sección 3.2 se encuentra en la función de pertenencia, la cual queda determinada por:

2bg ' A , (x j ) =e (3-16)

donde j=1,2, ..., m número de antecedentes, i=1,2 ,..., n número de reglas difusas, a, representa la media y b, representa su desviación estándar y x, representa la variable independiente,

La figura 3.3 muestra un conjunto difuso con forma campana de Gauss, considerando los parámetros media a,,=O y desviación estándar b,-0.3., evaluada en el intervalo [O, I] sobre la variable independiente x,:

3-1 I Sintonimcibn de wntroladorer difusos basada en el mttodo de gradiente descendente

Page 60: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

FIG. 3.3. Campana de Gauss formada por una media de 4, = O y una desviación estándar b ;, = 0.3 evaluando la función de pertenencia en el intervalo [ - l . I].

Se sustituye la función de pertenencia de la ecuación (3-16) en la función de costo E de la ecuación (3-5). Se deriva parcialmente respecto a cada uno de los diferentes parámetros: media ay, desviación estándar b,, y peso de la regla +vi y se sustituyen en las ecuaciones (3-IO), (3-1 I ) y (3-12) resultando las siguientes reglas de aprendizaje:

w, (t +I) t w, (1) -K,. f f ( y -f) E,=, pi

(3-18)

(3-19)

en donde KO, Kh y K , son los factores de aprendizaje para medias, desviaciones estándar y pesos de las reglas difusas respectivamente. La actualización de los parámetros se llevará a / cabo Únicamente cuando el grado de pertenencia A,(xJ > O.

La cantidad total de parámetros p a optimizar, para el caso de un sistema de dos entradas con NC, y NC2 conjuntos difusos cada uno, queda representado porp=Z(NC/+ NCd+ NC, . NC, parámetros, de los cuales el término (NC, . NCJ representa la cantidad de reglas difusas del sistema. El nÚmero de parámetros a sintonizarp resulta en la misma cantidad que la variante con friánguZos isósceles independientes, debido a que existe una correspondencia entre el centro del triángulo y la media de la campana de Gauss, así como entre la base de cada triángulo y la desviación estándar de cada campana de Gauss.

SintoniraciQ de controladores difusos basada en e1 metodo de p d i e n t e descendente 3-12

Page 61: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 3 Sintoni:oeidn de sisremm d$mm empleando el mérdo de Fadienre descendenie

3.4.2. Método d e sintonización utilizando conjuntos eslabonados con forma triangular asimétrica

Esta variante está basada en [Chen94], el cual cambia la construcción de los conjuntos triangulares, empleando en este caso los centros de los conjuntos adyacentes, anterior au(7-l) y siguiente a,í7+1), como partes finales del triángulo con centro a&); de esta forma se elimina un parámetro a sintonizar, respecto a la variante de triángulos isósceles independientes, el cual es la base del triángulo, sintonizando únicamente los centros de cada triángulo a&).

Una ventaja de esta metodologia es la intersección entre conjuntos adyacentes en un grado de pertenencia O S , esta propiedad se produce debido a la construcción que siempre se guarda entre los centros de dos conjuntos adyacentes, es aecir, sin traslapes entre si, lo cual ayuda a mantenerlos siempre eslabonados para evitar la generación de huecos entre conjuntos dentro de cada universo del discurso. Otra ventaja de esta metodologia es la forma que pueden tomar los conjuntos triangulares que, a diferencia de la versión con triángulos isósceles independientes, ahora pueden tomar formas diferentes en los extremos izquierdo y derecho de cada triángulo, y no verse forzados a generar siempre triángulos con lados iguales, como sucede con los triángulos isósceles.

La diferencia en las ecuaciones de esta variante, radica en la función de pertenencia, permaneciendo sin cambio el tipo de reglas (Sugeno orden cero); los operadores utilizados (producto y defusificación) y la función de costo E.' La función de pertenencia para una variable de entrada con valor x, queda determinada por la siguiente expresión:

A, (x j ) = a(,+,,j-xl si a , < x, 5 a(j+,)j a(i+l>l.-a,

-

O de otra manera

(3-20)

donde j=1,2 ,..., rn número de antecedentes, i=1,2 ,_.., n número de reglas, uo.~,,, a, y aOk,,, representan los centros de los triángulos anterior, actual y siguiente, x, representa el valor de la variable de entrada.

Los valores de grados de pertenencia se encuentran acotados en el intervalo [O, I]. En la figura 3.4 se presenta el caso de cinco conjuntos en posiciones arbitrarias empleando como función de pertenencia la ecuación (3-20):

;Q ...

"-t- ..' -

1 l .

3-13 Sinlonización de wnlroladores difusos basada cn el metodo de gradiente descendente

Page 62: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capituio 3 Sintoncación de ~ i s t e m s d$ms empleando el método de gradiente descendente -

-1 O 1

FIG. 3.4. Posición y forma arbitraria de cinco conjuntos difusos triangulares empleando la funci6n de pertenencia de tribgulos eslabonados.

Sustituyendo la ecuación (3-20) en la función de costo E planteada en la ecuación ( 3 - 9 , y derivándola parcialmente respecto a los parámetros: centro de triángulo representado por a,, y peso de la regla w,; y sustituyendo finalmente en las ecuaciones (3-10) y (3-12) en forma respectiva, resultan las siguientes reglas de aprendizaje:

w, (t + I) t w , ( t ) -ELw. +--(y -y') (3-22) C,=& donde:

(3-23)

y K,, y K,. son los factores de aprendizaje para los centros de los triángulos y pesos de las reglas difusas. La actualización de los parámetros se llevará a cabo únicamente cuando el í/ grado de pertenencia A,(xS > 0.

La cantidad total de parámetros p a optimizar, para el caso de un sistema de dos entradas con NCI y NCj conjuntos difusos cada una, queda representado por p = NCI+ NC2+ NClNC2 paránieiros. En esta variante de conjuntos difusos, la cantidad de parámetros es menor a los anteriores, debido a que cada conjunto difuso está definido únicamente por su centro.

3-14 Sintonizaci6n de controladores dihiros basada en cl melodo de gradiente descendente

Page 63: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 3 Sinron;:oc;ón de s ; s w m s difusos empieondo el mérodo de grodieirle descendenre

3.4.3. Método d e sintonización utilizando conjuntos independientes con forma triangular asimetrica

Esta variante utiliza una función de pertenencia que genera triángulos que pueden tener su lado izquierdo y derecho diferentes y que no se encuentran eslabonados como sucedió en el caso anterior. Para lograr esto, se utiliza un parámetro extra, formado a partir de la división de la base original b, por una base izquierda Ib, y una base derecha Db,. La diferencia se lleva a cabo únicamente en la función de pertenencia, mientras que el tipo de reglas, Los operadores utilizados y la función de costo permanecen sin cambio. La función de pertenencia con grados de pertenencia en el intervalo [O, I ] está determinada por la siguiente expresión:

si a , < x j SDb, Db,-a,

(3-24)

de otra manera donde j=1,2,.,,,m número de antecedentes,

i=1,2 ,..., n número de reglas, a, representa el centro del triángulo, Ib, y Db,, representan respectivamente la base izquierda y derecha del conjunto

triangular consideradas a partir del centro del triángulo a,, x, representa el valor de la variable de entrada.

Un conjunto triangular generado por la función de pertenencia (3-24) a partir de los parámetros a,, Ib, y Db,, se presenta en la figura 3.5.

t

FIG. 3.5. Conjunto difuso triangular generado por la función de pertenencia de tribgulos asimétncos independientes.

Sustituyendo la ecuación (3-24) en la función de costo E definida en la ecuación (3-5), y derivando parcialmente respecto a cada uno de los parimetros que forman los conjuntos triangulares y los pesos de las reglas del sistema, se obtienen las direcciones de gradiente para cada uno de los parámetros del sistema. Finalmente se sustituyen en la ecuación (3-9), resultando las siguientes reglas de aprendizaje:

Sinionizacibn de controladores difusos basada en el mttodo de @diente descendente 3-15

Page 64: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Sinlonizoción de s i s r e m d@sos empleando el méfodo de gradienle descendenre CapiNlo 3

(AU (1,) - 1) Ib , , ( t+l) t Ib,(t)-KO.--- (y-y').(w,(t)-y).------- cy=, P , x,-Ib, (4 (3-26)

cuando Ib, < x, C a,

cuando a, < x, 5 Db, Y

(3-28)

donde:

(3-29)

y KO, Klh, KDb y K , son los factores de aprendizaje para centros de los triángulos, base izquierda, base derecha y pesos de las reglas difusas respectivamente. La actualización de los parámetros será llevada a cabo únicamente cuando el grado de pertenencia A,,(xJ > O.

La cantidad total de parámetros p a sintonizar en esta variante, para el caso de dos variables de entrada con NCi y NC2 conjuntos respectivamente esp=3(NCi+ NCJ + NC, NC,; en donde el término NClNC2 representa el conjunto de pesos w, de las reglas difusas del sistema. Esta variante emplea más parámetros a sintonizar, debido a las dos nuevas variables generadas a partir de la base del conjunto triangular.

De las cuatro variantes planteadas en esta y las anteriores secciones, las tres primeras fueron implementadas y se realizaron experimentos con ellas, exceptuando únicamente esta última variante que emplea íriángulos asirnéíricos independientes como funciones de pertenencia. De los resultados obtenidos al examinar las tres variantes, se encontró que la metodología que posee mejor desempeño es la metodología de gradiente descendente que utiliza conjuntos en forma de triángulos isósceles independientes.

Sintonizacibn de controladores difusos basada en el metodo de gradiente descendente 3-16

Page 65: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

L I - E aiuapuaasap aiua!peiS ap opoiaiu la ua epeseq sosnj!p SaiopeloiiuoJ ap up!~!zz!uoiu!s

(OE-E)

Page 66: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Sinmni:ocióii de sisfemas diJzusos empleando el mirodo de gradienfe descendenfe Capitulo 3

3.5.1. Raíz cúbica

El primer experimento de aproximación de funciones algebraicas está dado por la función f(x)=x'". Para este experimento se emplearon como datos de entrenamiento 33 pares (x, y ) igualmente espaciados sobre la variable independiente x en el intervalo [-IO, IO], y evaluados con la función f(x)=xl". La situación inicial del FSGD se muestra en la figura 3.6, en donde observamos la línea horizontal que atraviesa el centro de la gráfica, la cual corresponde a la primera aproximación del sistema difuso, al tener valores de 0.5 todas las reglas del sistema difuso:

FIG. 3.6. Situación inicial del sistema difuso con f(x)-x'". La linea continua es la salida del sistema difuso y cada signo + representa un dato de entrenamiento.

La configuración del FSGD para aproximar a esta función, de un antecedente y un consecuente, se llevó a cabo utilizando cuatro conjuntos difusos para particionar el universo del discurso de la variable independiente x; después de haber realizado un entrenamiento de 50 épocas, el valor de la función de error (EC) fue de 0.01050 (un error promedio por dato de 3.18 x I 04). Los parámetros generados por el FSGD para aproximar la función se indican en la tabla 3.2:

TABLA 3.2. Valores finales de los parámetros del FSGD en la función f7x)=x'".

Con' Centros Bases Pesos

-0.4617 1.2806 0.1824 c3 0.4617 1.2806 0.8176 cá 0.9912 1.3374 1.0163

Otra forma de representar estos resultados es mostrando los conjuntos en un gráfico del universo del discurso de la variable independiente x, la cual se encuentra escalada en el intervalo [-l,+l], la figura 3.7 a) muestra los conjuntos finales después del entrenamiento y la interpretación de los parámetros de las reglas difusas del sistema en la parte b):

Sintonizaci6n de controladares difusos basada en el mdtodo de gradienle descendente 3-18

Page 67: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Sinionizción de r i s i em difuror empleando el méiodo de grodienie descendenre CBPiNlO 3

;:;m i fx is c l theny= -0.0163 if x is c2 then y= O. I824 if x is c3 then 0.81 76 if x is c4 then y= 1 .O I63

0.4

0 . 2

o - 1 - 0 . 5 o o 5 1

a) b)

FIG. 3.7. Condizión final de los parkmetros del sistema difuso empleados durante la aproximación de la función fix)=x'''~ a) situación final de los cuatro conjuntos difusos y b) inierpretación de los parámetros de las reglas y conjuntos difusos generados por FSGD.

En la figura 3.8 se presenta la evolución del error EC al transcurrir el número de épocas durante la etapa de aprendizaje:

O' O 10 20 30 40

época

FIG. 3.8. Comporlamiento del valor de EC calculado por el FSGD durante las 50 épocas de entrenamiento en la aproximación de la función mi= cibica.

La gráfica que muestra la aproximación de la función f(x)=x"" después de haber completado el aprendizaje, se indica en la figura 3.9:

FIG. 3.9. Situación final del sistema difuso aproximando l\x)=x'". La linea continua es la salid:del sistema difuso y cada signo + representa un dato de entrenamiento.

Sinlonimidn dc controladom dihisos basada en el mciodo de gradienle descendente 3-19

Page 68: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso
Page 69: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Sjnionjlocjón de sisremm dfwos empleando el mPlafo de grodienre desmndenle capitulo 3

La figura 3.1 I muestra la disminución del valor de EC calculado por el FSGD durante la etapa de entrenamiento:

0.04

0.02

u

O O 10 20 30 época

10 20 30 época

FIG. 3.11. Comportamiento del valor de EC calculado por el FSGD durante las 40 épocas de entrenamiento en La aproximación de la función campana de Gauss.

' La respuesta del sistema difuso, evaluada en los datos de entrenamiento e interpolando en el resto de valores se muestra en la figura 3.12:

FIG. 3.12. Situación final del sistema .difuso aproximando una función campana de Gauss. La linea continua es la salida del sistema difuso y cada signo + representa un dato de entrenamiento.

Los resultados de los experimentos de aproximación sobre la función raíz cúbica y campana de Gauss muestran un coinporiamiento de simeniu respecto a la posición que guardan sus conjuntos difusos finales. así como en los pesos wi de cada una de las reglas del sistema. Para el caso de la raíz cúbica la función posee simetría impar y las reglas generadas poseen valores de pesos wj complementarios (0.0163+1.0163=1 para los pesos WI y w4 respectivamente y 0.1824+0.8176=1 para los pesos w2 y w3 respectivamente). Sin embargo, para el caso de la función campana de Gauss, que posee simetría par, los resultados mantienen una simetría completa respecto a la posición de los conjuntos y a'l peso w, asignado en cada una de las reglas del sistema (valores iguales en los conjuntos y reglas I y 5 , as¡ como 2 y 4).

SinlonimciOn de controladorer difusos bmda en el rnbtodo de gradienie descendente 3-21

Page 70: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

La simetria en el aproximador difuso se encontró debido a que se utilizaron datos de entrenamiento igualmente espaciados, los cuales provocan incrementos iguales en los parámetros. Este comportamiento podría usarse para construir aproximadores difusos utilizando la mitad de los datos de entrenamiento y después de sintonizarlos, completar la otra mitad de conjuntos y reglas difusas.

Además de realizar pruebas sobre sistemas de una entrada una salida, también se probará el método para el caso de un sistema algebraico de dos entradas y una salida.

3.5.3. Función producto d e d o s argumentos

El siguiente caso de estudio es la función producto para dos argumentos de entrada f(xl,x2)=prod(xl,x2), en el cual se utilizaron 42 datos de entrenamiento que poseen simetría. Se realizó una aproximación empleando tres conjuntos difusos por variable independiente. Después de 12 épocas el valor de EC fue de 0.00120 (un error promedio por dato de 2.85xIO”), resultando los conjuntos y rep:ac dirusas que se incluyen en la tabla 3.4. y 3.: respectivamente.

TABLA 3.4. Valores finales de los NCONJ=[3 31 triángulos sintonizados por el FSGD en la función producto

TABLA 3.5. Valores finales de los pesos de las nueve reglas sintonizadas por el FSGD en la función producto.

La situación final en forma gráfica de los conjuntos difusos y la interpretación de las reglas del sistema generadas por FSGD se muestran en la figura 3.1 3:

Sintoniraci6n de wnmladores difusos basada en el mttodo de gradicnte descendente 3-22

Page 71: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

I j i f x l is c l and x2 is c l then y = 0.0529 2) i f x l is c2 and x2 is c l then y = 0.0457 3) if x l i s c3 and x2 is c l then y = 0.0591 4) if x i i s c l and x2 i s c j then y = 0.0457

-0.5 O 0.5 1 5) i f x l is c2 and xZ i s c5 then y = 0.2644 6) if x l i s c3 and x2 is c j then y = 0.5 154 7) i f x l i s cl and x2 i s c6 then y = 0.0591 8) if .Y/ i s c2 and x2 is c6 then y = 0.5 154 9 ) if x l i s c3 and x2 i s c6 then y = 0.9394

xl

O -1

x2 O l r n -1 -0.5 O 0.5 1

b)

O.

a)

FIG. 3.13. Situación final de los parametros del sistema difuso despues de aproximar la función /?xl32)Fxl*x2. a) situación final de los conjuntos difusos y b) interpretación de los parametros de las reglas conjuntos difusos generados por FSGD.

Nuevamente se observa simetría presente en las reglas M'? y M'I, M J ~ y MI,,, y M ' ~ y w8. respectivamente, que se obtuvo al haber entrenado al sistema con puntos de entrenamiento simétricos. Las reglas I ) , 5 ) y 9) no poseen reglas simétricas.

L a figura 3.14 muestra la disminución de la medida de error EC, durante las 12 épocas necesarias para aproximar l a función producto de dos argumentosprod(xl,x2).

FIG. 3.11. Coniponaniiento del iialor de ISC calculado por e l FSGD durante las 12 épocas dc entrenamiento en la aproximación de la función pr-od/il. .S).

L a superficie generada por el sistema difuso después de la etapa de entrenamiento. comparada contra los puntos de entrenamiento, se muestra en la figura 3.15, en donde se observó que todos los puntos fueron atravesados 5 cubiertos por l a superficie de aproximacion. logrando de esta manera la coiivergeiicia de l a función productoprod(xl. x2).

Sinionizacibti de coniroladorcr difusos hnrada en CI iiieiodo dc grodicnir descendente 3-23

Page 72: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso
Page 73: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Sintoniroción de sistemas diJCsm empleando el méiodo de gmdienre descendenie Capitulo 3

Un comparativo de la respuesta del sistema difuso y la función prod(Y1, x2) se muestra en la figura 3.17.

FIG. 3.17. Comparativo de la respuesta obtenida con el sistema difuso. actuando como inrcrpolador. (linea continua) y el o p e r a h prudusio (1ine.a ptintezda).

La respuesta del sistema difuso se encuentra traslapada a la del operador prod(~l,x2), lo cual muestra una muy buena capacidad de interpolación por parte del aproximador difuso para esta función.

El método de aproximación para sistemas con una y dos entradas, demostró una buena capacidad de aproximación por parte del sistema difuso. Aun cuando los datos de entrenamiento no cubrían completamente el espacio de trabajo, el sistema difuso pudo interpolar adecuadamente el resto de valores, lo cual representa una gran ventaja para poderlo emplear en procesos de identificación y control de procesos dinámicos.

A continoacih se incliiye m a prueba más complicada que se realizo e.n:re dos de la? variantes entre conjuntos difusos para verificar la capacidad de aproximación de ilii sisíenia. Las dos variantes en los conjuntos difusos a tratar consistieron en triángulos isósceles independientes y triángulos asimétricos eslabonados.

3.5.4. Función s u m a d e s e n o s

Un caso que se aplicó a dos de las metodologías propuestas en esta tesis consistió de la función suma de senos, definida por la función algebraica f(x)=O.ósen(m) + 0.3sen(3m) + O.Isen(5m). El tota1.de datos de entrenamiento consistió en 51 pares (x, y) igualmente espaciados sobre la variable independiente x en el intervalo [-I .O, I .O].

Las dos variantes de sintonización de conjuntos a comparar consistieron en la variante de la sección 3.3.1 ., la cual emplea como conjuntos difusos triángulos isósceles independientes y que para simplificar se denominará en este experimento versión A. La segunda variante se definió en la sección 3.4.2. y utiliza conjuntos triangulares eslabonados, a esta variante se

Sinlonizacion de controladorer difusos bwda en el mttodo de grsdiente derccndentc 3-25

Page 74: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Sintonización de sistems d@ms empleando el mdlcdo de prodienle descendente Capitulo 3

0.6.

0.4.

denominará versión B. Las condiciones iniciales de sintonización utilizadas en ambas variantes fueron K, = Kh K,= 3.0, y un valor inicial de reglas difusas w,,,,= O S .

El gráfico de los datos de entrenamiento utilizados en la aproximación difusa se muestra en la figura 3.18.

rr ye + + + + +

+ + / + +

*+

-0.41 + L +-+ * + + + .-- -06L - 7' ++,

0 5 1 -1 -0 5 ' O x

FIG. 3.18. Datos de entrenamiento para la funció~ suma de senos. en donde cada símbolo + representa un dato de entrenamiento.

Los resultados de EC obtenidos con la versión A en la época 50 y en la época 100 utilizando diferente número de conjuntos se muestran en la tabla 3.6:

TABLA 3.6. Valores de EC obtenidos en la %oca 50 y IW utilizando diferente numero de canjuntos (versión A) .

Los resultados de EC obtenidos con la versión B en las épocas utilizando diferente número de conjuntos se muestran en la tabla 3.7:

o, 100, 50 y 200

3-26 Sintonización de controladores difusos basada en CI rntlodo de gradiente daccndentc

Page 75: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Sinimi~ckin de sistemas dfmos empleando el mérodo de gradienre descendenre Capitulo 3

TABLA 3.7. Valores de EC obtenidos en las épocas 50, 100. 150 y 200 utilizando diferente nimero de conjuntos en la versión E.

Las dos variantes en general mejoran la aproximación de la función al aumentar el número de conjuntos difusos así como la cantidad de épocas de entrenamiento. Los resultados obtenidos son mejores empleando la versión A , aunque el algoritmo de la versión B tiene la ventaja de que nunca quedarán puntos sobre el universo del discurso sin cubrir por, al menos, uno de los conjuntos, debido a que iodos los triángulos se traslapan en un grado de pertenencia de 0.5. Otra ventaja es que se sintonizan menor cantidad de parámetros debido a que sólo se sintonizan centros sin incluir las bases de los triángulos y, finalmente se pueden generar triángulos con el lado izquierdo y derecho diferentes. Sin embargo, aún con estas ventajas, la versión B no compite en rapidez ni en cantidad de conjuntos empleados con la versión A al aproximar a la función suma de senos.

Los valores de EC en las épocas 50 y 100 variando el número de conjuntos se muestran gráficamente en la figura 3.19, para las versiones A y B.

Sinionizaciún de controladores difusos basada en d metodo de gradiente desccndcnic 3-27

Page 76: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

S#ntoni:an& de mtemos di/><sos empleondo el método de grodieirte descendente CapihAo 3

TABLA 3.7. Valores de EC obtenidos en las épocas 50. 100. 150 y 200 utilizando diferente número de conjuntos en la version E.

Las dos variantes en general mejoran la aproximación de la función al aumentar el número de conjuntos difusos así como la cantidad de épocas de entrenamiento. Los resultados obtenidos son mejores empleando la versión A, aunque el algoritmo de la versión B tiene la ventaja de que nunca quedarán puntos sobre el universo del discurso sin cubrir por, al menos, uno de los conjuntos, debido a que todos los triángulos se traslapan en un grado de pertenencia de 0.5. Otra ventaja es que se sintonizan menor cantidad de parámetros debido a que sólo se sintonizan centros sin incluir las bases de los triángulos y, finalmente se pueden generar triángulos con el lado izquierdo y derecho diferentes. Sin embargo, aún con estas ventajas, la versión B no compite en rapidez ni en cantidad de conjuntos empleados con la versión A al aproximar a la función suma de senos.

Los valores de EC en las épocas 50 y 100 variando el número de conjuntos se muestran gráficamente en la figura 3.19, para las versiones A y B.

SintonizaciOn de controladores difusos basada en el metodo dc gradadiente descendente 3-27

Page 77: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Sintonizan& de sistemas dt@sos empleando el método de gradiente descendente CapiUilO 3

- Versión A, época 50 --- Versidn A. época 100

Versión 8, época 50 __ Versión B. época 100

o ' ' I 10 12 14 16 18 20

coni

FIG. 3.19. Gráfica Comparativa enúe númm de conjuntos y valor de aror EC.

La versión B se comporta más precisa conforme se aumenta el número de conjuntos; sin embargo, la versión A no tiene el mismo comportamiento y al revisar la gráfica de la figura 3.19 se observa un minio de EC al ocupar 16 conjuntos durante la etapa de sintonización.

La gráfica de la figura 3.20 muestra la aproximación de la función suma de senos utilizando la versión B con diferente número de conjuntos en las épocas 100, 150 y 200 comparada contra la versión A en la época 50

0 . 0 1 5 p 1, 0.01 \

- Versión A, época 50 --- Versión E. época 200

Versión E. época 150 __ Versión E, época 100

FIG. 3.20. Gráiica mpamtiva entre númm de amjuntos y valor de m E C .

Smtonizaóám de controladores difusos basada m el metodo de gradiaae descaidmte 3-as

Page 78: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

En este experimento se observa que la versión B posee mayor grado de precisión conforme se aumenta el número de conjuntos difusos, a diferencia de la versión A que no tiene un comportamiento estable y que al aumentar el número de conjuntos no logra mayor precisión, o al menos eso sucedió para el caso de iniciar el sistema difuso en el proceso de sintonización con los factores de ganancia de 3.0 y un valor inicial del peso de las reglas del sistema en 0.5.

Como comentarios finales en la sección de aproximación de funciones algebraicas, se encontró que el método de gradiente descendente aplicado a la Fintonización de parámetros de un sistema difuso (FSGD), tuvo la capacidad de conseguir aproximar e interpolar adecuadamente funciones a partir de datos tomados de la función, además de que el proceso de sintonización al emplear datos distribuidos en forma simétrica provocará que el FSGD genere conjuntos y reglas difusas con la característica de simetría. La característica de simetría podría emplearse al sintonizar el sistema con la mitad de la información y mediante algún mecanismo completar la otra mitad de la función con el objeto de ahorrar tiempo y lograr un sistema simétrico.

3.6. OTRAS MEJORAS EN EL PROCESO DE SINTONIZAC16N

3.6.1. Momento

Las reglas de aprendizaje aplicadas en el proceso de sintonización del sistema difuso basado en el método de gradiente descendente FSGD, pueden reescribirse como:

En doi:de dc representa la dirección grudiente obtenida a partir dc I r de.Jivada parcial de la función de costo E respecto al parámetrop a sintonizar X/+.

Una mejora a las reglas de aprendizaje, propuesta en las reglas de aprendizaje de redes neuronales por [RumelhartSó], es utilizar un coeficiente de momento a obteniendo una^ ecuación de la forma:

p(k+l)cp(k)-K,,d,(k) -ad,(k-l)

en donde d,(k) representa la dirección gradiente actual y d,(k-l) representa la dirección gradiente en la época anterior.

El término de momento a permite avanzar en forma más rápida y dirigida hacia un mínimo local, su efecto consiste en colocar un incremento proporcional al incremento realizado en la iteración anterior; es decir, si el incremento anterior d&k-I) fué positivo, y el incremento actual ddk) también, se avanza a pasos más grandes; sin embargo, si d&k) es positivo y d,(k-I) es negativo, es un indicativo de haber parado un mínimo y por lo tanto se

Sintonización de controladom difusos basada cn el metodo de gradicnte descendente 3-29

Page 79: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

debe de aplicar un incremento pequeño provocando que se avance a pasos más lentos para poder alcanzarlo.

El momento también evita las oscilaciones alrededor de un mínimo provocadas al haber elegido un factor de aprendizaje Kp alto y permite no estancarse en mínimos locales.

3.6.2. Paso variable

En la sección de experimentación se observó que suceden incrementos más grandes a los parámetros durante las primeras épocas del proceso de sintonización, mientras que al acercamos a un mínimo local los incrementos son más pequeños. De esta manera, una mejora consiste en comenzar el valor de las ganancias de las reglas de aprendizaje Kp, con un valor grande y, conforme el valor de error de la función de costo disminuye, decrementar sus valores para llevar a cabo incrementos más pequeños y, de esta manera evitar oscilar alrededor de minimos.

3.6.3. Valor inicial de las reglas

Finalmente, una mejora que se aplica a la base de reglas del sistema consiste en colocar el peso inicial de las reglas w, con un valor relacionado a los datos de entrenamiento afectados por la regla, recuerde que cada regla difusa cubre un área del espacio de resultados y en conjunto forman la solución del sistema. Una sugerencia consiste en calcular el valor promedio de las salidas de los datos y' que cubre la regla y usar dicho valor como valor inicial de la regla; de esta manera, la situación inicial del sistema se encuentra más favorecida hacia el minimo que se busca en la función de costo E. Este punto se trata con más detalle al final del capitulo cinco.

Las pruebas realizadas con momento no arrojaron buenos resultados y, el valor elegido en a queda a consideración del usuario, lo que aumenta el número de parámetros de usuario. Las pruebas sugieren trabajar únicamente con los factores de aprendizaje K, y utilizar un valor alrededor de 1.0 a 3.0, aunque se aceptan valores más altos. AI observar la evolución en los valores de error EC un comportamiento de tipo oscilante puede evitarse colocando valores más pequeños en las ganancias de aprendizaje, si no se encuentran efectos oscilatorios se pueden incrementar los valores de K,. ,

En los resultados obtenidos no se encontró un valor agregado durante el proceso de sintonización al utilizar momento; sin embargo, pueden existir valores adecuados en a que provoquen resultados más satisfactorios, y de esta manera la convergencia del sistema difuso en un menor número de épocas.

Sinloniración de conrroladorcs difusos basada en el melodo de gradient descendcnie 3-30

Page 80: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capítulo

4 '

I DENTI F I CAC IÓN u1

/ I

4.1. INTRODUCCIÓN

Después de haber presentado en e sintonización de parámetros aplicado a s descendente (FSGD) y emplearlo en la apr se enfocará la atención a la identificaciór experimentación sistemas de primer ordc lineal.

Se incluye un método para selecci del sistema difuso, que se encuentra rel; identificar. Además el proceso a seguir d datos, la generación de los datos de entrer sustitución por un sistema difuso.

IE SISTEMAS DINÁMICOS - IZANDO LÓGICA DIFUSA

apitulo anterior un análisis de la metodología de mas difusos, basado en el método de gradiente mación de funciones algebraicas; en este capitulo $ sistemas dinámicos empleando como casos de ineal, segundo orden lineal y primer orden no

ir las variables, utilizadas como entradas y salida mado directamente con el orden del sistema a e elegir el sistema a identificar, el muestre0 de iento. la etapa de entrenamiento y finalmente su

Page 81: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Idenrflwicocidn de sisremas dinámicos urilizando Idgiw d@sa Capilulo 4

4.2. NÚCLEO DE TRANSlCldN DE ESTADOS

A diferencia de la aproximación de funciones algebraicas en donde se cuenta con argumentos (entradas) que nunca dependen de los valores anteriores de la función (salidas), en la identificación y conwol de sistemas dinámicos es necesario obtener la base de datos de entrenamiento a partir de la simulación del comportamiento de un dispositivo, o bien a partir del dispositivo físico; para este efecto es necesario aplicar una señal de excitación a la entrada del dispositivo y posteriormente tomar durante cada intervalo de tiempo, generalmente constante, muestras de los datos encontrados en las entradas y salidas, proceso denominado niuestreo del sistema.

A fin de lograr contemplar la dinámica y no solamente la estática de la planta, es necesario considerar tanto entradas como salidas atrasadas en el tiempo; la selección de dichas entradas y salidas, denominada selección de variables, no -es trivial y en esta sección se trata con una metodología de selección de variables a partir del orden que presenta una planta dada, basándose en la teoría de control.’ Por estática de la planta se refiere al hecho de asociar o , “memorizar” una secuencia de entradas y sus correspondientes salidas, como sucede también durante el comportamiento en estado estable, esto puede verse como una aproximación de una función algebraica, sin embargo ésta no posee la dinámica propia de la planta.

4.3. IDENTIFICAC16N DE SISTEMAS DlNAMlCOS

La identificación de sistemas dinámicos consiste de un proceso que especifica en forma matemática el comportamiento de un dispositivo denominado planta dentro de ciertas regiones de operación, esto puede realizarse en forma analítica, numérica o cualitativa. La simzrlacióit es útil en casos donde resulta demasiado costosa la experimentación en forma directa sobre la planta, como sucede en el caso de estudiar los efectos sobre satélites y naves espaciales: por otro lado, también resulta útil en situaciones en donde por ser demasiado peligrosa la operación directa de la planta, como sucede en el caso de centrales nucleares o plantas de gas, es necesario trabajar y realizar experimentos en modelos matemáticos que simulan la operación de tales plantas.

El proceso de identificación puede llevarse a cabo mediante el modelado matemático empleando las leyes de la dinámica en fisica, sin embargo existen situaciones en donde no es posible lograr una exactitud adecuada debido a las aproximaciones y linealizaciones que ayudan a simplificar las ecuaciones resultantes, lográndose en la mayoría de los casos una aproximación demasiado burda del comportamiento exacto de la planta. Con efecto de emplear metodologías libres de modelo matemático se utilizan algoritmos del tipo inteligencia artificial, los cuales son capaces de imitar un conportamiento a partir de un conocimiento dado (datos de entrenamiento), como son las redes neuronales; por otra parte, existen sistemas basados en lógica difusa que también permiten la identificación de sistemas dinámicos aunque empleando la experiencia de operadores humanos, en esta sección se aprovechará la capacidad de sintonización de parámetros de un sistema difuso por medio de la metodología de gradiente descendente, para hacer la identificación de sistemas dinámicos, comentando en cada uno de ellos los hallazgos resultantes de la experimentación.

Sintonizacion de controladores difusos basada en el metodo de gradiente descendente 4-2

Page 82: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Identijcación de s&temar dinómicor utilizando lógica d@a Capihilo 4

En el proceso de identificación de una planta, el primer paso que se sigue en este trabajo es contar con una planta P, a la cual se aplica una señal de excitación u a la entrada, posteriormente se realiza un muestre0 de los valores de entradas y salidas durante un cierto tiempo r, y de esta manera se obtiene la base de datos de entrenamiento TrnDuru. La selección de las variables de entrada a considerar, conocidas como variables lingüísticas de un sistema difuso, dentro de un sistema dinámico de orden n, está determinada por la estructura mostrada en la figura 4.1, la cual esta basada en la teoría de control de procesos. Esta estructura para seleccionar variables de entrada y de salida utiliza tanto variables discretas, como es el caso de la entrada anterior en un instante delta de tiempo u(f-dT), así como también variables del tipo continuas y (?-Av, formándose una estructura de variables del tipo híbrido. Otras formas de considerar las variables de entrada y salida para la identificación mediante técnicas basadas en inteligencia artificial se tratan en Narendra Warendra901 y Warendra911 utilizando redes neuronales artificiales, él plantea 4 estructuras diferentes dependiendo del lugar en que se encuentre la no linealidad, pudiendo encontrarse en la entrada, como una función de la salida o en ambos. Sin embargo, en esta investigación se emplea solo una estructura, la cual es aplicable a cualquiera de los 4 casos a identificar, pensando en la dificultad que encierra el hecho de encontrar el lugar donde se presenta la no linealidad, y a la simplicidad de la estructura para conseguir el mismo fin.

Antecedentes Consecuente

FIG. 4.1. Selección de variables a considerar para la identificación de un sistema de orden n.

El proceso completo para obtener los datos de entrenamiento a partir de muestras tomadas de la planta P para una planta de segundo orden se ilustra en la figura 4.2, en la cual se indican las variables necesarias a considerar utilizando el criterio de selección de variables propuesto en la figura 4.1.

Sintonización de controladores difusos basada en el melodo de gradienre descendente 4-3

Page 83: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

U Datos de entrenamiento

FIG. 4.2. Obtención de los datos de entrenamiento para la identificación de una planta de segundo orden

Los ND datos de entrenamiento obtenidos por muestre0 en un tiempo t, tienen la siguiente estructura (x,, x2, ..., x,,, y'), en donde cada uno de los valores xi contiene un valor posible dentro de cada uno de los antecedentes de las reglas de un sistema difuso, mientras que el valor y' representa la salida deseada u objetivo esperado como respuesta a una enirada con valores x,, x ~ , ._., x,. Teniendo en cuenta esta estructura, es posible visualizar la manera en la cual se realiza el proceso de sintonización o aprendizaje del FSGD. Para el caso de contar con más de una entrada, es necesario emplear sistemas difusos acoplados, en donde cada uno de ellos infiere una salida diferente como resultado de una misma señal de entrada.

Un problema que puede presentarse radica en encontrar los valores de las derivadas de la variable de salida, aunque también pueden considerarse sobre los datos de entrada, en estos casos es necesario contar con un observador ofilfro de estimados mediante el cual se pueda encontrar un estimado de los valores de las derivadas que sean necesarias. El filtro de estimados debe de cumplir con las características de ser un filtro pasa bajos, en donde la ganancia directa a frecuencia cero es 1 y su frecuencia fundamental es menor que la planta. Finalmente el filtro de estimados es definido en la forma de diagrama a bloques como se muestra en la figura 4.3, bajo esta estructura, los estimados de las derivadas son los valores que se encuentran antes de cada bloque integrador.

Sintonización de controladores difusos basada en el metodo de gradiente descendente 4-4

Page 84: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Estimado de las derivadas

FIG. 4.3. Obtención de los valores de las derivadas a partir de un filtro de estimados en representación de diagrama a bloques.

Una forma de utilizar el filtro de estimados es colocando un filtro Fen las señales de entrada y salida de la planta P, tal como lo muestra la figura 4.4, y obtener a partir de éstos, los valores estimados de las derivadas y formar los datos de entrenamiento.

Enfrada Salida

Filtro de Filtro de estimados estimados

FIG. 4.4. Obtención de los valores estimados de las derkadas a partir de filtros de estimados en la entrada y salida de la planta.

Una vez realizada la etapa de entrenamiento, la cual se efectúa fuera de linea, un sistema difuso FS simulando la identificación de un sistema dinámico de primer orden, puede verse como el diagrama de la figura 4.5, a esta etapa se le denomina etapa de reconociiniento. En este diagrama el lazo de retroalimentación empleado para la variable y(t-AT) se utiliza con la finalidad de contemplar la dinámica del sistema. Se puede considerar que la conexión de retroalimentación es interna en el bloque difuso, de esta manera permanecen únicamente las conexiones externas de entrada y salida u(/-dT) y y(t) respectivamente, tal como sucede con la planta identificada P.

Sinlonizaci6n de controladores difusos basada en el metodo de gradicnte descendente 4-5

Page 85: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Entrada Salida

u(@ V >-fl , Y'ru

I PLANTA _.

'V

_ _ _ _ _ _ _ _ _ _ _ _ _ _

I Retraso I

Ytt) +

I . . . . . . . . . . . . . . . . . . . .

FIG. 4.5. Sistema difuso FS empleado durante una etapa de reconocimiento mostrando el lazo de retroalimentación. útil para capnirar la dinámica de una planta P de primer orden. Entrada u(t-AT), salida objetivo f(t) y señal retroalimentada y(l-ATJ obtenida a partir de un retraso aplicado en la señal de salida del sistema difuso y([). La linea punteada encierra el bloque principal aislando la retroalimentación interna y considerando únicamente las conexiones externas de entrada y salida.

Durante la etapa de reconocimiento se utiliza la señal con la cual se generaron los datos de entrenamiento, comparando las salidas obtenidas del sistema difuso y y la salida generada por la planta y'; en el caso de resultar muy semejantes se procede a la efapa de validación, etapa en la cual se alimentan a la entrada del sistema difuso señales diferentes a las empleadas en la etapa de entrenamiento, es decir se prueba la capacidad de generalización del sistema difuso a señales de entrada desconocidas.

En la siguiente sección se realizan experimentos para lograr identificar sistemas dinámicos mediante FSGD, se tratan sistemas lineales tanto de primero como de segundo orden, además de un sistema no lineal de primer orden. Los conjuntos difusos empleados para los experimentos de identificación y control son triángulos isósceles independientes, que fué la versión que mejores resultados mostró durante la aproximación de funciones algebraicas.

4.4. EXPERIMENTOS DE IDENTIFICACIÓN EMPLEANDO FSGD

4.4.1. Sistema de primer orden lineal G(s)=0.2/(~+2)

Para probar en orden de complejidad creciente la capacidad del FSDG, se hará una identificación difusa del sistema de primer orden representado por la función de transferencia G(s)=O.2/(~+2), la característica de este sistema es que pertenece a un sistema estable con un polo en -2. Las variables de entrada necesarias al sistema difuso para lograr capturar la

Sintonizacion de controladores difusos basada en el método de gradiente descendente 4-6

Page 86: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

dinámica de este sistema, están determinadas por la entrada u(t-AT) y la salida retrasada y(t-AT), y partiendo de estos antecedentes inferir a partir de la base de reglas difusas la salida y(0. Los paráinetros a considerar para conseguir la identificación del sistema mediante el algoritmo de aprendizaje son K, = Kb = K, = 3.0, valor inicial de los pesos de las reglas del sistema difuso w,.,=O.S, número de conjuntos difusos dos para la variable u(i-AT) y dos para la variable y(r-dT). En lo sucesivo, se denotará el orden y cantidad de conjuntos mediante NCONJ=[NC, NC, NC, ... NC,] en donde cada NC, representa un número entero que indica la cantidad de conjuntos para la variable seleccionada en el orden definido en el criterio de selección de variables, planteado al inicio de esta sección; de esta manera este experimento utilizó NCONJ=[2 21.

La cantidad de parámetros a sintonizar consiste en cuatro centros, cuatro bases y cuatro pesos de reglas, sumando un total dep=2(NC, + NC,) + NC, *NC, = 12 parámetros.

La medida de error EC es definida mediante la ecuación:

en donde y representa la salida del sistema difuso, y‘el valor deseado u objetivo, calculando el cuadrado de su diferencia para todos los ND datos de entrenamiento.

La señal de entrada aplicada al sistema lineal de primer orden se muestra en la figura 4.6, formada de un conjunto de escalones con una duración total de SO seg. El tiempo de muestre0 para esta identificación fué de O.lseg, obteniéndose un total de SO1 datos de entrenamiento.

10 M 40 50 tfw? FIG. 4.6. Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento.

La figura 4.7 muestra el conjunto de datos de entrenamiento generados por la simulación, los cuales se encuentran representados por pequeños circulos; mientras que la salida del sistema difuso, en una situación inicial con los pesos de las reglas difusas en 0.5, es representada por la malla en la parte central de la gráfica.

Sintonización de controladores difusos basada en el metodo de gradiente descendente 4-7

Page 87: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Identficoción de sistemas dinámicos utilizando iógica d i h a Capitulo 4

0.1.

o Lu

0.05

O

FIG. 4.1. Situación inicial del sistema difuso representando su salida por la malla en la parte media de la figura. los pequeños círculos dentro de la figura representan los datos de entrenamiento.

-

FIG. 4.8. Evolución de la medida de error EC durante la identificación del sistema de primer orden lineal

La figura 4.9 muestra la salida del sistema difuso después de la etapa de entrenamiento, representando por los pequeños círculos los datos de entrenamiento y la salida del sistema difuso representada por la malla, la cual después del entrenamiento logra atravesar a la mayoría de los datos de entrenamiento, con lo cual se consigue la identificación.

Sinionizaci6n de controladores difusos basada en el melodo de gradientc descendente 4-8

Page 88: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Identficaciin de sislemas dinimicos utilizando íigica d f i m Capitulo 4

FIG. 4.9. Situación del sistema difuso después de la etapa de entrenamiento, los pequeños circulos dentro de la figura representan los datos de entrenamiento y la salida del sistema difuso se encuentra representada por la malla.

La respuesta del sistema difuso después de haber identificado a la planta al aplicar la señal de entrada con la cual se realizó el entrenamiento se muestra en la figura 4.10, donde puede apreciarse que concuerdan los valores en estado estable después de cada transitorio en el valor de los escalones.

..........................

10 20 30 40 50 W g )

FIG. 4.10. Respuesta del sistema difuso sintonizado al aplicar la señal de entrada con la cual se realizó e l entrenamiento. La linea continua representa la salida del sistema difuso. mienta que la linea punteada rcpresenta la salida de la planta G(s)=20/(s+2).

Sinlonizacion de controladores difusos basada en el melodo de gradiente descendentc 4-9

Page 89: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

AI utilizar dos conjuntos difusos en cada una de las variables de entrada, durante la etapa de sintonización no se realiza una variación considerable en sus centros y bases, sin embargo en lo que respecta a la base de reglas si se realiza una sintonización fuerte, las cuatro reglas generadas y sintonizadas por el método de gradiente descendente, etiquetando con números consecutivos del uno al cuatro los conjuntos difusos de las dos variables fueron:

Si u(f-AT) es CI y y(-AT) es C3 entoncesyQ) = 0.0629 Si u(r-AT) es C2 y y(í-AT) es C3 entonces y@) = 0.3557 Si u(t-AT) es Cl y y(i-AT) es C4 entonces y() = 0.6413 Si u(t-AT) es C2 y y(f-AO es C4 entonces y(t) = 0.9353

Los pesos de las reglas representan la salida del sistema difuso escalado en un intervalo de [O.O, 1.01, sin embargo, los factores de escalamiento realizan el cambio de escala nuevamente. Los pesos de valor pequeño representan una salida baja, mientras que los pesos con valor cercano a 1 .O representan una salida alta.

Después de haber encontrado buenos resultados durante la etapa de reconocimiento, se aplicarán señales de entrada desconocidas para el sistema difuso, es decir no consideradas durante la etapa de entrenamiento y de esta manera se comprobará la capacidad de generalización del sistema difuso.,

Se aplica como señal de entrada una onda triangular de frecuencia un ciclo cada 10.0seg y amplitud + I .O, como se muestra en la figura 4.1 1.

FIG. 4.11. Señal

Un comparativo entre la salida calculada por el sistema difuso y la salida generada por la planta lineal, al aplicar una señal triangular, se muestra en la figura 4.12.

Sinlonizacion de controladores difusos basada en el metodo de gradiente descendente 4-10

Page 90: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

/denr$mción de sislemas dindmicos utilizando Iógica d%ra Capihllo 4

FIG. 4.12. Comparativo de las salidas entregadas por el sistema difuso (linea continua) y la planta (linea punteada) como respuesia a una señal de entrada triangular.

Además de la señal de entrada triangular, también se aplicó una señal escalón de amplitud 0.7, la cual es desconocida por la planta, figura 4.13.

"O 2 t(seg) 4 6

FIG. 4.13. Señal de entrada escalón de amplitud 0.7 aplicado al sistema difuso para probar su capacidad de generalización.

El comparativo entre las respuestas del sistema difuso y la planta de primer orden como resultado a una entrada escalón de amplitud 0.7 se muestra en la figura 4.14.

Sintonización de controladora difusos basada en el niétodo de gradiente descendente 4-1 I

Page 91: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capihlo4 Idenf@caci& de sfsfemas dinómicos utilimndo lógico dlf io

FIG. 4.14. Comparativo de las salidas entregadas por el sistema difuso (linea continua) y la planta lineal de primer orden (linea punteada) como respuesta a una señal escalón.

Los valores de salida entregados por el sistema difuso después de entrenado concuerdan con los valores de salida de la planta, aunque posee un tiempo de respuesta menor. Un resultado ideal sería que la salida de la identificación de la planta por medio del sistema difuso no se encontrara ni adelantada ni atrasada, sino en la misma fase que tiene la salida de la planta.

Además de observar un comportamiento monótono decreciente en la medida de error EC durante la etapa de entrenamiento (figura 4.8) puede resultar Útil observar el comportamiento de la variación de los parámetros que componen el sistema difuso durante la etapa de entrenamiento. Se continuó con el entrenamiento completando 300 épocas a fin de observar con mayor detenimiento el movimiento de los parámetros. La evolución de la medida de error EC se muestra en la figura 4.15.

200 300 O' O 'Oo época

FIG. 4.15. Variación del error EC durante 300 &pocas de entrenamiento con el sirtema de primer orden lineal.

Sintonización de controladorcs difusos basada en el metodo de gradiente descendente 4-12

Page 92: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

IdenI#%ación de sis~emus dinómicos utilizando Iógico d@sa CüpiNlO 4

La variación relativa respecto a los valores iniciales de los centros de los dos conjuntos difusos para la variable de entrada u(t-AlJ se muestra en la gráfica de la figura 4.16:

-0.1 200 300 loo época O

FIG 4.16. Variaci6n respecto a los valores iniciales de los dos centros de la variable de entrada uO-AU: a, linea continua y a? lineapunteada.

En la figura 4.17 se muestran los incrementos en los valores respecto a sus valores iniciales en los centros de los dos conjuntos difusos de la variable de entrada y(í-AT):

-0.1 L 200 300 '00 época O

FIG. 4.17. Variación respecto a los valores iniciales de los dos centros de la variable de entrada v(t-A7): o3 linea continua y a, linea punteada.

Sintonizaci6n de controladores difusos basada en el método de gradiente descendente 4-13

Page 93: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Idenrficacidn de sistemas dindmicos utilizando 16giCo d&o capitulo 4

4

3.99

9 -3.98 3 93.97.

-_-- ___-_------ -__--- 3.96.

La figura 4.18 muestra la evolución en los valores de las bases para los dos conjuntos triangulares de la variable de entrada u(l-AT) a partir de sus valores iniciales, mostrando una variación respecto a su valor inicial menor al 1 .O%:

4.021 I

3.96' I loo

época 200 300 O

FIG. 4.18. Variación de los valores de ¡as bases de los dos conjuntos difusos de la variable ufl-dT): b, linea continua y b, linea punteada.

Los valores de las bases de los triángulos de los dos conjuntos difusos de la variable de entrada y(f-dT) se muestran en la figura 4.19:

I 200 300

3.95' O 100 epoca

FIG. 4.19. Variación de los valores de las bases de los dos conjuntos difusos en la variable y(l-AT): bl linea continua y 6, linea punteada.

La figura 4.20 muestra un concentrado de los valores de los cuatro pesos w,, que componen la base de reglas difusas del sistema. Todos los valores de los pesos w, graficados, son considerados a partir del valor inicial de 0.5 y muestran su evolución respecto a las 300 épocas de entrenamiento:

Sintonización de controladorer difusos basada en el nittodo de gradiente descendenre 4-14

Page 94: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

_____------ -____---

ND T$ NCONJ 501 0.1 [2 21 501 0.1 (3 31 251 0.2 12 21 126 0.4 [2 21

0.2 u

ECtiw, Comentarios 0.0220 salida un poco adelantada 0.0190 le falta amplitud y su salida es irregular 0.01 15 salida adelantada 0.0143 salida adelantada

J L

O 200 300 1 00 época O

FIG. 4.20. Variación de los valores de los pesos w, de las cuatro reglas difusas del sistema desde un valor inicial de 0.5, durante la identificación de un sistema de primer orden lineal.

Las gráficas de vhación de parámetros muestran un comportamiento brusco 'en la modificación de los parámetros durante las primeras épocas de entrenamiento, aproximadamente durante las primeras 20; sin embargo, al transcurrir el número de épocas de entrenamiento, la variación de los parámetros se vuelve más suave, hasta llegar al punto de estabilizarse algunos de ellos. En este caso se observa un comportamiento en la variación de los parámetros en forma simétrica. Los parámetros que mostraron cambios más fuertes en sus valores son los pesos de las cuatro reglas difusas, las cuales llegan a modificarse desde un valor inicial de 0.5 hasta valores cercanos a 0.0 y 1.0, mostrando una variación aproximadamente de 0.5 unidades. La sintonización del sistema difuso está dada principalmente por los pesos de las reglas difusas w,, y en menor grado por la posición de los conjuntos difusos (centros a, y bases by).

La tabla 4.1 muestra otros experimentos realizados durante la identificación del sistema de primer orden lineal incluyendo el número de datos de entrenamiento, el tiempo de muestreo, los conjuntos difusos utilizados en cada variable de entrada, el valor de error EC a 1 O0 épocas de entrenamiento y un breve comentario de los resultados obtenidos.

6 TABLA 4.1.. Otros experimentos realizados para identificar al sistema de primer orden lineal. se incluye

el número de datos de entrenamiento NDo el tiempo de muestreo K% en segundos. el número de conjuntos utilizado NCONJ. el error encontrado en4a epoca 100 ECriai) y finalmente un breve comentario acerca de los resultados encontrados comparando la salida del sistema difuso contra la rcspuesta de la planta.

Sintonizacion de controladores difusos basada en el método de gradiente descendente 4-15

Page 95: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

La identificación del sistema de primer orden lineal rápido, incluyendo su dinámica, fué posible capturarla mediante el FSGD, y aunque los resultados muestran un efecto de adelanto en la salida del identificador difuso respecto a la respuesta de la planta, la dinámica la logra seguir adecuadamente cuando se utilizan señales de tipo senoidal o triangular. La posibilidad de identificar al sistema con una variedad de tiempos de muestreo se presenta en el resumen de experimentos de la tabla 4.1.

4.4.2. Sistema d e primer orden lineal G(s)=4/(s+0.4)

Para determinar si el FSGD es capaz de identificar un sistema de primer orden lineal “más lento”, se realizó otro experimento con una planta cuya función de transferencia es G(s)=4/(s+0.4), este sistema posee un polo en -0.4 y en comparación con el experimento anterior, es cinco veces más lento en responder y llegar a estado estable como respuesta a una señal escalón. La señal de entrada consistió de un generador de datos aleatorios combinado con un retenedor de orden cero ZOH, donde las máximas amplitudes son f3, y genera aleatoriamente escalones con una duración de 3.0 seg entre cada transición, tal como se muestra en la figura 4.21, El tiempo de muestreo fué de 0.1 seg durante 40 seg, obteniéndose 401 datos de entrenamiento.

FIG. 4.21. Señal de entrada aplicada a la planta con función de transferencia G(s)=4/(s+0.4) para obtener los datos de entrenamiento.

Después de haber realizado el entrenamiento con NCONJ=[2 21, &=K~=K,=3.0, pesos iniciales de las reglas n~,~,=0.5 y haber logrado en 100 épocas un EC de 0.0044, se aplica como señal de entrada un escalón unitario en el tiempo 1.0 seg durante 15 seg. La figura 4.22 muestra el comparativo entre la salida del sistema difuso y la salida obtenida con la planta G(s)=4/(s+0.4).

SinronizeciOn de controladarcs difusos basada en el metodo de gradiente descendente 4-16

Page 96: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Idenrijcación de sislemas dinámicos urilizmdo /6@m diJLsa Capiiulo 4

i 12 ! 1

FIG. 4.22. Comparativo de las salidas entregadas por el sistema difuso (línea continua) y el sistema de primer orden lineal G(s)=4/(s+0.4) (línea punteada) como respuesta a un escalón unitario en el tiempo 1 .O seg.

La interpretación de las cuatro reglas generadas por el sistema después de la sintonización, a partir de dos conjuntos en cada uno de los dos antecedentes, y etiquetando los conjuntos difusos en forma consecutiva del uno al cuatro es la siguiente:

Si u(/-AT) es CI y y(t-ATJ es C3 entonces y(t) = 0.0746 Si u(l-AT) es C2 y y(/-AT) es C3 entonces y(/) = 0.1308 Si u((-AT) es C1 y y(i-AT) es C4 entonces yo) = 0.8716 Si u(t-AT) es C2 y y(t-AT) es C4 entonces yo) = 0.9268

Se encontró en este experimento que la salida del sistema difuso también se anticipa respecto a la respuesta entregada por la planta, además de tener una variación respecto al valor final de I O unidades entregado por la planta en 0.3 unidades más (3%). Aunque éste no es el comportamiento ideal, es de mencionar la capacidad de generalización del sistema difuso, ya que aún habiendo entregado un valor un 3% mayor, el sistema difuso logra capturar la dinámica de la planta, tal como se muestra con la respuesta al escalón unitario. Otra señal con la cual se realizó la etapa de validación fueron señales senoidales a las cuales responde adecuadamente.

Otros experimentos que se realizaron sobre sistemas lineales de primer orden están dados por las funciones de transferencia G(s)=2/(s+2) y G(s)=20/(s+2), con ganancias a frecuencia cero de uno y 10.0 respectivamente, teniendo un polo en -2 al igual que el sistema G(s)=O.2/(~+2) identificado en el experimento anterior. Los resultados encontrados comparando estos tres casos entre sí, al aplicar la misma señal de entrenamiento, consistieron en iguales posiciones de los conjuntos (centros y bases), iguales valores de los pesos de las reglas y disminución igual de los valores de EC durante el entrenamiento. La única diferencia entre estos tres casos radica en los factores de escalación en entradas y salidas, los cuales hacen ver a los tres sistemas iguales en la etapa de entrenamiento, cabe recordar que se utilizan los valores escalados en las variables de entrada de -I .O a + I .O y en los valores de salida de 0.0 a + I .O.

Sinlonizacion de coniroladores difusos basada en el metodo de gradiente descendente 4-17

Page 97: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Un hallazgo observado al realizar estos experimentos, sobre sistemas lineales de primer orden, fué que al utilizar dos conjuntos difusos para particionar cada una de las variables de entrada del sistema, dichos conjuntos poseen la capacidad suficiente para formar una superficie en forma de plano, la cual es capaz de capturar la dinámica de los datos de entrenamiento, como se observó en la figura 4.9. La superficie formada por los datos muestreados de un sistema de primer orden lineal está determinada por un plano, el cual posee una inclinación proporcional relacionada con la rapidez del sistema. Este comportamiento fué analizado matemáticamente (anexo B) sobre un sistema difuso utilizando reglas difusas tipo Sugeno de orden cero, empleando sólo una entrada particionada con dos conjuntos difusos triangulares; encontrándose que es capaz de formar una recia (propiedad lineal); otro análisis, aplicado a un sistema difuso de dos entradas con dos conjuntos difusos triangulares en cada una de sus entradas demostró la capacidad de estas características para formar un plano.

También en el análisis matemático se encontró que un sistema difuso utilizando dos conjuntos difusos por variable de entrada, no se encuentra limitado a la formación de una recta (o un plano en el caso de dos entradas), sino que también tiene la capacidad de formar curvaturas, dependiendo únicamente de los valores de las dos bases de los conjuntos difusos de cada variable de entrada, en el caso de una entrada se forma una recta entre las intersecciones de los conjuntos difusos al tener las bases de ambos conjuntos valores iguales y para el caso de un sistema difuso de dos entradas se formará un plano al tener las bases de los conjuntos de la variable de entrada una valores iguales, es decir bl=b2 y además las bases de los dos conjuntos de la variable de entrada dos valores iguales, es decir b3=b4, al haber diferencias en los valores de las bases se forman curvaturas sobre la superficie generada por el sistema difuso.

4.4.3. Sistema d e primer orden no lineal

La ventaja de los sistemas difusos radica principalmente en su capacidad para conseguir reproducir comportamientos no lineales. En este experimento se probará la capacidad del método de sintonización de un sistema difuso basado en el método de gradiente descendente FSGD aplicándolo a la identificación de un sistema de primer orden no lineal cuyas características son poseer dos ganancias de retroalin~entación: una para valores de salida menores a un umbral O, y la otra para valores mayores que dicho umbral. En el caso a tratar en este experimento, se aplica una ganancia de 10.0 cuando la salida de la planta y@) < 2.5 y se aplica una ganancia de 5.0 cuando la salida de la planta yo) 2 2.5, siendo el valor de O = 2.5. El diagrama de la figura 4.23 muestra la planta de primer orden no lineal en forma de diagrama de bloques.

Sintonizacion de controladores difusos basada en el metodo de gradiente descendenie 4-18

Page 98: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 4 Identifiución de sislemas dinómicos utilizando lógim d&ro

FIG. 4.23. Diagrama de bloques del sistema de primer orden no lineal, mostrando el lazo de retroalimentaci6n para generar las ganancias de 5.0 y 10.0.

La señal aplicada a la entrada de la planta para generar los datos de entrenamiento consiste de una señal senoidal de amplitud f 2 , con frecuencia 2.5 radseg alimentada a la planta durante 40seg., esta señal fué modulada en amplitud con una señal senoidal de amplitud 1 .O con frecuencia 0.8 radseg, tal como se muestra en la figura 4.24.

FIG. 4.24. Señal senoidal de amplitud +2 de frecuencia 2.5 rad/seg modulada por senoidal de baja frecuencia alimentada a la entrada del sistema de primer orden no lineal para generar los datos de entrenamiento.

El tiempo de muestre0 fue de O. 1 seg obteniéndose durante 40 segundos de simulación un total de 401 datos de entrenamiento. Las variables de entrada a considerar fueron u(t-AT) y y(t-AT), y a partir de las entradas se infiere la salida y@). El número de conjuntos a emplear fué NCONJ=[3 31, las ganancias de sintonización fueron K,=K,,=K..=3.0 y los valores iniciales de los pesos de las reglas fueron de w,,,,=0.5. En esta sintonización se necesitaron más conjuntos, respecto al caso lineal, para particionar las variables de entrada debido a la superficie no lineal que presentaban los datos de entrenamiento. Después de un entrenamiento del sistema difuso con 200 épocas se llegó a una convergencia de EC=0.0077. Los datos de entrenamiento, así como la superficie generada por el sistema difuso se muestran en la figura 4.25.

Sintonizacion de controladores difusos basada en el rnetodo de gradiente descendente 4-19

Page 99: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 4 Idenr$cación de sisremas dinimicos utilizando lógica d$so

10

FIG. 4.25. Datos de entrenamiento representados en la figura por los circulos obtenidos para el sistema de primer orden no lineal, mostrando la superficie obtenida por el sistema difuso después del entrenamiento.

En la figura 4.26 se muestra un gráfico de los valores de EC durante la etapa de entrenamiento, en la cual se observó un comportamiento monótono decreciente durante sus 200 épocas de entrenamiento.

I 200

O' O 50 100 6ppoca 150

FIG. 4.26. Variación del error EC durante 200 épocas de entrenamiento para identificar el sistema de primer orden no lineal.

La posición de los conjuntos difusos después del entrenamiento, considerando un escalamiento en los datos de entrada en un universo del discurso de -1 a + I , se muestra en la figura 4.27.

Sintonización de controladores difusos basada en el nittodo de gradiente descendente 4-20

Page 100: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

CapiNlO4 Idenfrjcación de sistemas dinámicos utilizando lógiu d*a

/

// /

U ( t -A T) -1 -0.5 O 0.5 1

FIG. 4.27. Posición de los conjuntos difusos en las variables de entrada después del entrenamiento para el sistema de primer orden no lineal.

Como se muestra en la figura 4.27, el conjunto c4 en la variable u(t-AT), considerado de izquierda a derecha, casi logra salir del área de trabajo, esto podría indicar que la solución de esta identificación podría necesitar solamente tres conjuntos, sin embargo, pruebas experimentales con otras variantes en los conjuntos de las variables de entrada mostraron comportamientos de menor precisión que con esta configuración.

Después de haber logrado identificar al sistema de primer orden no lineal mediante un sistema difuso, se examinará la capacidad de generalización del sistema difuso a entradas desconocidas, no aplicadas durante el entrenamiento, como primer caso se aplicará como señal de entrada una onda triangular con frecuencia I .O ciclos cada I O segundos, con una amplitud de f l durante 20 segundos de simulación, tal como se muestra en la figura 4.11.

Una gráfica comparativa entre las salidas de la planta no lineal y el sistema difuso, se presenta en la figura 4.28, en donde se encontró que el sistema difuso sí logró capturar la no linealidad presente en la planta - representada por la falta de simetría de los valores de salida respecto a una entrada simétrica-, con una precisión muy cercana al valor ideal.

'"1 O 5 10 t(seg) '5 20

FIG. 4.28. Salida del sistema no lineal de primer orden (linea gris punteada) y salida del sistema difuso (linea negra continua).

Sinlonizacidn de controladores difusos basada en el metodo de gradiente descendente 4-2 I

Page 101: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 4 Idennfcanbn de Sistemas drn<mizm$ uhlrzanndo Iógrca drfuso

Otra seiial de entrada para verificar la capacidad de generalización del sistema difuso como identificador del sistema de primer orden consistió de una señal compuesta de varios escalones, como la utilizada en la figura 4.6. Las respuestas obtenidas por el sistema difuso y la planta de primer orden no lineal se muestran en la figura 4.29, en donde se encontró una pequeña diferencia entre ellas.

10 20 40 50 30 t(seg)

FiG. 4.29. salida del sistema no iineai de primer orden (línea negra punteada) y salida del sistema difuso (iinea negra continua), m o q u e s i a a la seaal de enIda moshada en la figura 4.6.

Un punto imporiante, en los métodos de sintonización de parámetros mediante un proceso iterativo, está dado por la dirección en la modificación de los valores de los parámetros durante la etapa de entrenamiento. Se realizó el análisis de la variación de los parámetros del sistema difuso: centros u,, bases b, y pesos de las reglas w, durante el entrenamiento del sistema de primer orden no lineal, encontrando la variación relativa respecto a los valores iniciales de cada uno de los centros u, de los conjuntos difusos para la variable de entrada u(í-AT) como se muestra en la gráfica de la figura 4.30

0.5

0.4- / 0.3-

-centro a, centro a2 centro a3

----.centro a4

,'

__----_______ -_____ ---- 6 2 ; I'

.-

-0.1 O 50 100 epoca 150 200

FIG. 430. Variaci6nrespecto a los valores iniciales de los centms de la variable de entrada u(I-ATJ.

Page 102: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

En la figura 4.31 se muestran los incrementos en los valores respecto a sus valores iniciales en cada uno de los centros de los conjuntos difusos de la variable de entrada y(t-AT):

---base b2 base b3

0.2,

m- e c

150 -0.2'

O 50 100 época . 1

- - c e n t r o a5 ---centro a6

centro a7 ----cedro a8

io

FIG. 4.31. Variación respecto a los valores inides de los cenims de la h a b l e de en&& y(t-An.

La figura 4.32 muestra la evolución en los valores de las cuatro bases para los conjuntos triangulares de la variable de entrada u(t-dT) a partir de sus valores iniciales:

1.61 I

9 1.41

9 1.3

I O 50 150 200 1.1 '

100 é m a

FIG. 4 .32 Variación de los valora de las bases de los conjuntos difusos de ia variable u(t-AT).

Los valores de las bases de los triángulos para la variable de entrada y(t-AT) .se muestran en la figura 4.33:

Page 103: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

--- base baseq

-----base bs

1.25‘ 1 O 50 150 200 100 época

FIG. 4.33. Variación de los valores de las bass de los conjuntos difusos en la variableyp-AT).

La figura 4.34 muestra un concentrado de los valores de los 16 pesos w,, que componen la base de reglas difusas del sistema. Todos los valores graficados son considerados a partir del valor inicial de 0.5 y muestran su evolución respecto al número de épocas de entrenamiento:

200 O O 50 100epoca 150

FIG. 4.34. Variación de los valores de los pews de las 16 reglas dihisas del si- utilizando un valor inicial de 0.5, durante la identificación de un sistema de primer orden no lineal.

ShtniizaB<ni de &oladores difusas basada en el rné(odo de mdiezne descaideite 4-24

Page 104: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

CapiNlo4 idenrflcaci6n de sistemas dinamicos utilizando Idgia d$m

Se observa, en general, que las gráficas de variación de valores en los parámetros del sistema difuso durante la etapa de entrenamiento no muestran cambios bruscos para lograr la convergencia, se observa, además, que durante las primeras épocas de entrenamiento, menos de 20, suceden los cambios más fuertes, mientras que al avanzar la etapa de entrenamiento se vuelven más suaves. En general, durante la etapa de sintonización las posiciones y bases de los conjuntos difusos juegan un papel menos importante que los pesos de las reglas difusas, notando esto en experimentos donde se sintonizan únicamente los pesos de las reglas, dejando sin cambio las posiciones de los conjuntos encontrando buenos resultados. De cualquier manera el método de sintonización de parámetros de sistemas difusos basado en la metodología de gradiente descendente produce una actualización en los parámetros de una manera dirigida y sin encontrar cambios bruscos en su comportamiento. A diferencia de la variación de los parámetros para el sistema lineal, en este sistema no se encontró simetría en centros, ni en bases, ni en pesos de las reglas.

Regresando al tema de los datos, se puede preguntar ¿cuál es la señal de entrada capaz de generar datos de entrenamiento lo suficientemente adecuados para lograr la convergencia?. Esta pregunta se trata en [Yale97], en donde se aplica a las técnicas de redes neuronales; tratando al FSGD como una caja negra con entradas y salida, resulta una estructura de entradadsalida tal como sucede en las redes neuronales. En la representación gráfica de los datos de entrenamiento para los experimentos utilizando dos entradas, se observó que se forma una superficie de puntos, los cuales se encuentran distribuidos sobre el área de trabajo; a partir de ella se genera una malla del sistema difuso, la cual durante la etapa de entrenamiento debe de cubrir a los datos de entrenamiento, de preferencia cortar a cada uno de ellos. Cuando se logra incluir a todos los puntos de entrenamiento se logra la convergencia y se ha minimizado la función de costo E, lo cual es señal de haber llegado al objetivo: la identificación del sisrenia. Con base en lo anterior, la señal de entrada que se aplica a la planta para obtener los datos de entrenamiento debe, al menos en esta metodología, distribuir uniformemente los datos sobre el área de trabajo, por citar otras señales de entrada, una señal de tipo escalón, genera únicamente una recta de datos sobre el área de trabajo, mientras que las señales senoidales tienen la propiedad de distribuir mejor los datos de entrenamiento, además de pasar de un valor a otro en forma gradual y no en forma abrupta como sucede con las señales escalón. Una mejor alternativa es utilizar señales senoidales moduladas en amplitud y en frecuencia, tal como la señal chirp, aunque resulta bastante aceptable utilizar Únicamente la modulación en amplitud. Los métodos para identificar plantas, basados en frecuencias, emplean señales impulso, las cuales excitan la mayor cantidad de modos del sistema, en la practica no es posible realizarlos y es bastante aceptable la identificación a partir de las señales escalón; en este caso 110 resulta útil esta información debido a que se trabaja con la distribución de datos en el área de trabajo y no con frecuencias. De cualquier modo, en estos experimentos se emplean distintas señales de entrenamiento considerando en la mayoría de los casos señales senoidales moduladas en amplitud.

En la tabla 4.2. se incluye un resumen de otros experimentos realizados para la identificación del sistema de primer orden no lineal, la tabla incluye el número de datos de entrenamiento, el tiempo de muestreo, los conjuntos difusos empleados para la identificación, el valor de error EC a 100 épocas de entrenamiento y un breve comentario de los resultados obtenidos.

Sinionizacion de controladores difusos basada en el metodo de gradiente descendente 4-25

Page 105: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Identijcación de sisleinos dinómicos uiilizmda lógica dtfisa Caplhilo 4

TABLA 4.2. Otros experimentos realirados para identificar al sistema de primer orden no lineal, se incluye el número de datos de entrenamiento NO, el tiempo de muestreo T, en segundos, el número de conjuntos utilizado NCONJ, el error encontrado en la epoca 100 EC(Im! y finalmente un breve comentario acerca de los resultados encontrados comparando la salida del sistema difuso contra la respuesta de la planta

Se hicieron además otros experimentos utilizando como señal de entrenamiento un conjunto de cinco escalones con diferentes amplitudes, los cuales no lograron hacer que el identificador difuso capturara la no linealidad en la dinámica del sistema de primer orden, por lo que tan solo es de mencionarse este comentario.

Aún cuando algunos resultados de EC al utilizar otros valores en el número de conjuntos, mostraron menor cantidad de error, al realizar las pruebas de simulación no resultaron las identificaciones tan precisas. Esto puede advertir acerca de no emplear como medida de calidad únicamente el valor de EC, sino comprobar además mediante pruebas de simulación comparaciones contra la planta identificada, las cuales darán una mejor decisión acerca de cual es la mejor identificación difusa lograda.

39.44 s2+6.28s + 39.44

4.4.4. Sistema d e segundo orden lineal G(s) =

El sistema de segundo orden a identificar posee un factor de amortiguamiento de 5 = O S , el cual genera como respuesta a un escalón unidad una señal con un solo sobretiro y casi sin oscilaciones, en términos de velocidad de respuesta, es rápido y posee una ganancia unitaria a frecuencia.

La señal de entrada aplicada a la planta para obtener los datos de entrenamiento consistió de una señal senoidal de amplitud +_2 y frecuencia 2.5 radkeg modulada por una señal senoidal de amplitud uno y frecuencia 0.8 radkeg durante 30 seg, utilizando un tiempo de muestreo de 0.1 seg, obteniendo 301 datos de entrenamiento, tal como se muestra en la figura 4.35.

Sinlonizacitm de contraladores difusos basada en el m h d o de gradiente descendente 4-26

Page 106: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 4 ldenr~colicocion de sisremas dinimicos urilizando I6gica diJFso

FIG. 4.35. Señal de entrada aplicada a la planta para generar los datos de entrenamiento.

El criterio de selección de variables se realizó empleando el formato mostrado en la figura 4.1, denominado núcleo de fmnsición de estados. Para el propósito de la identificación de una planta de segundo orden se utilizan como variables de entrada u(f-AT), y(f-AT) y y'(f-AT) para inferir a partir de ellas la salida ~ ( 1 ) . Se realizó una etapa de entrenamiento de 100 épocas empleando un número de conjuntos por variable NCONJ=[3 2 21, obteniendo un error EC=0.0115 (error promedio por dato 3.8205 x

La figura 4.36 muestra un comparativo de la salida del sistema difuso después del entrenamiento y la salida de la planta de segundo orden al aplicar como entrada la señal de la figura 4.35.

2

1

O

-1

-2

O 10 t(seg) 20 30

FIG. 4.36. Comparativo de la salida del sistema difuso después del entrenarnientu (linea continua) y la salida de la planta de segundo orden lineal (linea punteada) como respuesta a la señal de entrada de la figura 4.35.

SinioniznciOn de cuntroladores difusos basada en el método de gradiente dcscendenic 4-27

Page 107: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Se aplicó una señal de entrada, que no fué utilizada durante el entrenamiento, para probar la capacidad de generalización del identificador difuso, que consiste en un escalón de amplitud 2.0 aplicado en 1.0 seg de tiempo de simulación, tal como se muestra en la figura 4.37.

O 1 3 4 2 t(seg) u

FIG. 4.37. Señal de entrada escalón aplicada al ideniificador difuso para probar su capacidad de generalización.

La respuesta del sistema difuso y la planta, se muestra en una gráfica comparativa en la figura 4.38, donde se observa que logra llegar al valor de estado estable, aunque su sobretiro es menor y la frecuencia de oscilación es de aproximadamente el doble respecto a la planta.

FIG. 4.38. Comparativo de la salida del sistema difuso después del entrenamiento (linea continua) y la salida de la planta de segundo orden lineal (linea punteada) como respuesta ai escal6n de amplitud 2.0 aplicado en 1.0 se&

Sintonización de controladores difusos basada en el mktodo de gradiente descendente 4-28

Page 108: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Otra señal de entrada aplicada a la planta y al sistema difuso para probar su capacidad de generalización fué una señal triangular de amplitud il .O y frecuencia 1 .O ciclo cada IO seg, tal como se muestra en la figura 4.1 1, obteniendo la salida del identificador difuso y la planta de segundo orden lineal. La figura 4.39 muestra el comparativo de las salidas, en donde se observa que existe solo una oscilación aunque de menor amplitud e igual tiempo de respuesta. Esta identificación difusa no logró una semejanza respecto a la planta de segundo orden y se realizará la identificación de otro sistema de segundo orden para observar su capacidad de identificación.

FIG. 4.39. Comparativo de la salida del sistema difuso después del entrenamiento (linea continua) y la salida de la planta de segundo orden lineal (linea punteada) como respuesta a la SeAal triangular.

La tabla 4.3 muestra otros experimentos realizados para aproximar el sistema de segundo orden lineal incluyendo el número de datos de entrenamiento, el tiempo de muestreo, los conjuntos difusos empleados para la identificación, el valor de error EC a 100 épocas de entrenamiento y un breve comentario de los resultados obtenidos.

TABLA 4.3. Resumen de experimentos realizados para identificar al sistema de segundo orden lineal, se incluye el numero de datos de entrenamiento hD. el tiempo de muestreo T~ en segundos. el número de conjuntos utilizado NCONJ, el error encontrado en la época 100 EC,,wi y finalmente un breve comentario acerca de los resultados encontrados comparando la salida del sistema difuso contra la respuesta de la planta.

Sintonizacion de controladores difusos basada en el método de gradienie descendente 4-29

Page 109: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 4 ldenrijicacidn de sisremas dindmicos urrlisando &ica d s s a

La planta de segundo orden lineal, fué identificada con una buena aceptación por un sistema difuso, mostrando su capacidad de generalización al aplicar nuevas señales de entrada, no aplicadas durante la etapa de entrenamiento en forma muy satisfactoria, aunque la respuesta a las entradas escalón no fué exacta por no conservar la frecuencia, si logró imitar el número de oscilaciones así como el valor a estado estable. En el caso de las señales senoidales logra responder muy bien, trabajando en fase, salvo pequeñas variaciones en las amplitudes mínima y máxima (extremos de la señal).

39.44 s2+2.51s +39.44

4.4.5. Sistema de segundo orden lineal G(s) =

A fin de utilizar la identificación de plantas mediante un sistema difuso para otro tipo de comportamientos se propuso utilizar una planta de segundo orden lineal con ganancia unitaria a frecuencia cero y, a diferencia del caso anterior, ésta posee un factor de amortiguamiento 5 = 0.2, la cual produce aproximadamente tres ciclos antes de llegar a estado estable como respuesta a un escalón unitario de entrada. Se utilizaron las mismas variables de entrada y salida.

Se utilizó como señal de entrenamiento la señal senoidal modulada de la figura 4.35, empleada en el experimento anterior, con la variante en el tiempo de muestre0 de T$= 0.2 seg, obteniendo durante 40 segundos de simulación 201 datos de entrenamiento. En la etapa de entrenamiento se utilizaron NCONJ=[2 2 21 conjuntos difusos por variable para lograr la identificación. Aplicando el método de gradiente durante 100 épocas de entrenamiento se obtuvo un error EC = 0.0045 (error promedio por dato 2.23 x lo5).

Después de la etapa de entrenamiento, se aplicó una señal desconocida por el identificador difuso, la cual se empleó para probar la capacidad de generalización del sistema difuso. La señal consistió de un escalón de amplitud 2.0, aplicado en 1.0 seg del tiempo de simulación, tal como se muestra en la figura 4.40.

FIG. 4.40. Señal de entrada escalon aplicada al identificador difuso para probar su capacidad de generalizaciOn.

La figura 4.41 muestra un comparativo de la respuesta de la planta y del identificador difuso como respuesta a un escalón de amplitud 2.0.

Sinlonizacion de canmiadores difusos basada en el meiodo de gradieiile descendente 4-30

Page 110: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capihilo 4 ldenrficación de sislemas dimimicos utilizada 16gico d$sa

m

O 2 4 t(seg) 6 8

FIG. 4.41. Comparativo de la salida del sistema difuso después del entrenamiento (linea continua) y la salida de la planta de segundo orden lineal (linea punteada) como respuesta a un escalón de amplitud 2.0.

Se observa que la capacidad de imitar la dinámica de la planta es satisfactoria, salvo el desfasamiento que existe entre las señales, se obtiene un valor a estado estable correcto, así como igual número de oscilaciones antes de llegar a estado estable.

Otra señal aplicada a la entrada del sistema difuso, es una onda triangular de amplitud k1.0 y frecuencia 1.0 ciclos cada I O seg, como se muestra en la figura 4.1 I , obteniendo la respuesta de la figura 4.42. En esta gráfica se muestra una similitud considerable de la salida del sistema difuso respecto a la salida del sistema de segundo orden lineal.

FIG. 4.42. Comparativo de la salida del sistema difuso despuks del entrenamiento (linea negra continua) y la salida de la planta de segundo orden lineal (linea gris punteada) como respuesta a la señal triangular.

La señal triangular posee cambios bruscos en los valores de la señal, y aún así logra seguir adecuadamente la respuesta de la planta de segundo orden lineal que posee un comportamiento más oscilatorio que el caso planteado en el experimento anterior.

Sinionizacion de contraladores difusos basada en el método de gradiente descendente 4-3 I

Page 111: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

/deniijicoción de sislemor dimimicos uli1i:ondo Iógieo diJCs0 Capitulo 4

ND 301 301 201

En la tabla 4.4 se incluyen otros experimentos de identificación del sistema de segundo orden lineal, los cuales no tuvieron un desempeño adecuado, la tabla incluye el número de datos de entrenamiento, el tiempo de muestreo, los conjuntos difusos empleados para la identificación, el valor de error EC a 100 épocas de entrenamiento y un breve comentario de los resultados obtenidos.

7s NCONJ ECrioo, Comentarios 0.1 12 2 21 0.0066 no logra llegar a las amplitudes, frecuencia correcta 0.1 [3 2 21 0.0127 tiene dos ciclos menos en respuesta a escalones 0.2 [2 2 21 0.0036 produce más ciclos en respuesta a escalones

TABLA 4.4. Otros experimentos realizados para identificar al sistema de segundo orden lineal, se incluye el número de datos de entrenamiento ND, el tiempo de rnuestreo T, en segundos, el número de conjuntos utilizado NCONJ, el error encontrado en la época 100 ECiim, y finalmente un breve comentario acerca de los resultados encontrados comparando la salida del sistema difuso contra la respuesta de la planta.

La planta de segundo orden lineal con factor de amortiguamiento 5 = 0.2, fué identificada con una buena aceptación por un sistema difuso actuando como identificador, mostrando su capacidad de generalización al aplicar nuevas señales de entrada en forma muy satisfactoria. Aunque la respuesta a las entradas escalón no fué exacta por no responder a la misma frecuencia, si logró imitar el número de oscilaciones así como el valor a estado estable. En el caso de las señales senoidales logra responder muy bien, trabajando en fase, salvo pequeñas variaciones en la amplitud de la respuesta del sistema difuso comparada contra la respuesta de la planta.

Un punto importante a comentar para los dos experimentos de identificación de las plantas de segundo orden lineal, es haber utilizado las mismas variables en entradas y salida, así como un gran parecido en el número de conjuntos por variable. Esto representa una ventaja importante al utilizar FSGD como identificadores, los cuales logran imitar el comportamiento del sistema dinámico, utilizando una estructura fija en las variables a utilizar para identificar familias de sistemas dinámicos; esto también se aplica en el caso de los sistemas de primer orden lineal.

Se observó además, que en los casos de identificación de sistemas dinámicos del tipo lineal, es suficiente emplear dos o tres conjuntos por cada variable de entrada, ya que utilizando más conjuntos difusos, el método FSGD excluye los conjuntos innecesarios moviéndolos a los extremos del área de trabajo, o bien provoca que se sobrepongan los conjuntos; de cualquier modo, esto ofrece una retroalimentación visual para la selección adecuada de los conjuntos a utilizar en cada variable de entrada. Para el caso de la identificación de sistemas no lineales, la variante a utilizar en el método de sintonización FSGD consiste en aumentar el número de conjuntos difusos en cada una de las variables de entrada, sin necesidad de incrementar el número de variables de entrada. Es decir, una estructura de identificación para sistemas de un mismo orden puede ser utilizada tanto para los casos lineales (se sugiere emplear dos o tres conjuntos difusos por variables) como para el caso de sistemas no lineales.

Sintonización de controladorer difusos basada en el d i o d o de gradiente descendente 4-32

Page 112: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Se realizaron algunas pruebas para identificar sistemas de orden mayor con un núcleo de transición de estados de menor orden, por ejemplo un sistema de segundo orden con un sistema difuso de primer orden; sin embargo, no se obtuvieron resultados contundentes al respecto y aun queda mucho por investigar en este tema,

Finalmente al cerrar la sección de identificación de sistemas dinámicos se hace notar la importancia para lograr una buena identificación del parámetro tiempo de muestreo T, durante la obtención de los datos de entrenamiento, ya que se pueden realizar problemas tales como sobremuestreos o submuestreos, los cuales darían información incorrecta del comportamiento de la planta, haciendo con esto que no pueda ser identificada por FSGD. El tiempo de muestreo representa un parámetro de usuario a considerar durante la obtención de la base de datos de entrenamiento y que juega un papel crucial durante la etapa de entrenamiento, una medida propuesta en este tema de investigación fué utilizar aproximadamente diez muestras dentro de una constante de tiempo para el caso de sistemas de primer orden o tomar diez muestras por cada ciclo de la máxima frecuencia de una respuesta al escalón unitario en el caso de sistemas de segundo orden. En los experimentos, las dinámicas de los sistemas de primer y segundo orden fueron identificadas con un sistema difuso empleando un tiempo de muestreo de 0.1 seg, aunque también se probaron otros experimentos utilizando 0.2 seg y 0.4 seg.

Sintonizacibn de controladorer difusos basada en el método de gradiente descendente 4-33

Page 113: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capítulo

5

CONTROL DE SISTEMAS DINÁMICOS UTILIZANDO LÓGICA DIFUSA

5.1. INTRODUCCI~N

En el capítulo anterior se presentó una etapa de experimentación del método de sintonización de un sistema difuso basado en gradiente descendente FSGD aplicado a la identificación de sistemas dinámicos, utilizando como selección de variables el criterio definido por el Núcleo Hídrido de Trumición de Esrudos, el cual permite emplear las variables de estado directamente como entradas de un sistema difuso.

En este capítulo se empleará el FSGD en la generación de controladores difusos construidos a partir de datos de plantas. La obtención de los controladores se lleva a cabo principalmente a partir de una estructura de control basada en modelo inverso de la planta; aunque se incluye el proceso de obtención de controladores basados en una estructura de modelo de referencia. Otros experimentos muestran la identificación de un controlador ya existente en una planta, y por lo tanto se estudia la capacidad de convertir la información de un controlador (donde puede ser un operador humano) en información lingüística dada por los conjuntos difusos y las reglas de un sistema difuso. En el caso de la estructura de control basada en el modelo inverso de la planta, las entradas son las variables de estado, a diferencia de los controladores PID que utilizan el error y su derivada, lo cual permite hacer el lazo de retroalimentación y trabajar en control a lazo cerrado.

Page 114: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Control de sislems dinámicos uliliuindo 16gico difuu? Capitulo 5

5.2. CONTROL DE SISTEMAS DINAMICOS

Unido al proceso de identificación existe un proceso principal dentro de la teoría de sistemas, el cual es el control de sistemas dinámicos. El control tiene como objetivo llevar o mantener a un proceso dentro de un área de operación, o bien realizar las acciones necesarias para lograr mantener la salida de la planta en un valor de referencia deseado (denominado problemas de control de tipo regulación), también puede utilizarse para seguir una señal de referencia o una trayectoria dada (conocidos como problemas de conirol tipo servo). En general se desearia que dicho control sea capaz de lograr su objetivo independientemente de las señales de ruido, provenientes principalmente de señales electromagnéticas, como es el caso de los generadores o motores eléctricos, o bien el ruido debido a la interferencia por señales de transmisión de voz y datos.

El controlador deberá de ser capaz de realizar su objetivo en forma adecuada, independientemente del ruido aplicado a la planta o de la variación de sus caracteristicas, debido principalmente a fallas o por efecto del envejecimiento de los componentes de la planta o del controlador. Se dice que un controlador es robusto cuando es menos susceptible a cambios en los parámetros del sistema o al ruido. El proceso de elaboración de un controlador convencional para aplicarlo a un proceso especifico lleva consigo una gran cantidad de planteamientos y cálculos matemáticos y, en la mayoria de los casos, resultan controladores que aproximan burdamente al modelo de la planta; además, cuando es necesario utilizar ese controlador en una planta con caracteristicas relativamente diferentes a la que fué planteado suceden problemas de control, y por lo tanto se debe de realizar nuevamente un análisis matemático del actual problema a resolver.

Los métodos basados en inteligencia artificial tales como redes neuronales y lógica difusa presentan características adecuadas a este tipo de problemas, debido a su facilidad de construcción y a su capacidad de generalización, lo cual permite aplicarlos a diversos tipos de problemas con comportamientos diferentes. Su principal ventaja es la capacidad de identificar o controlar sin necesidad de un modelo matemático. Por estas caracteristicas, y con el afán de evitar un gran conjunto de cálculos matemáticos durante la elaboración de controladores convencionales que en la mayoria de los casos resultan sólo en aproximaciones burdas del control, las metodologias basadas en inteligencia artificial resultan una solución práctica.

Los controladores difusos (FLC) permiten incluir conocimiento relacionado al proceso -no siendo posible en los controladores convencionales ni en las redes neuronales-, principalmente a través de expertos humanos, considerándose también una caracteristica de gran interés por parte de los diseñadores de controladores, ya que en la mayoría de los lugares a implementar un controlador de tipo inteligente existe una gran cantidad de información relacionada con los procesos en forma de reglas de tipo lingüístico, las cuales pueden ser trasladadas fácilmente a reglas difusas para formar un controlador difuso. Esta propuesta automatiza el proceso de la construcción de controladores difusos empleando un método de sintonizado basado en el método de gradiente descendente FSGD apariir de d a m o muestras obtenidas de la planta o sistema a controlar, es decir, resumir mediante un sistema difuso el comportamiento de control de un sistema a partir de un conjunto de datos, otra ventaja resulta el hecho de poder incluir información u priori del sistema como condición inicial de los parámetros del sistema difuso.

Sinlonizacibn dc controladores difusos basada en el meiodo de gradiente descendente 5-2

Page 115: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Las dos estructuras de control a tratar en la etapa de experimentación son: la estructura de control basada en modelo inverso y la estructura de control basada en modelo de referencia.

5.3. ESTRUCTURA DE CONTROL MODELO INVERSO

En la estructura de control basada en modelo inverso, primero se realiza una identificación inversa P' del comportamiento de la planta P a controlar, se conectan en cascada: colocando primero a P" y conectando su salida'a la entrada de P, tal como lo muestra la figura 5.1. El objetivo de esta metodología es considerar que se obtuvo una identificación inversa ideal, y por lo tanto el producto de P-' y P resultará ser (F ' ) (P) =l; al tener esto en cuenta, se encuentra ue al aplicar como entrada a P-' una señal de referencia ref; y ser operada por el producto de P y P resulta una salida y=ref: En nuestra configuración la identificación inversa de la planta P-ljuega el papel del dispositivo controlador. Esta estructura de control se eligió debido a la facilidad, al menos en plantas invertibles y estables, de construir controladores basados en técnicas de inteligencia artificial y, a que la mayoría de los controladores de tipo servo estan basados en cierta parte en un modelo inverso [Mugica95].

9

salida

* y

entrada

ref

Control Planta

FIG. 5.1. Esquema de control utilizando modelo inverso a lazo abieno.

La configuración de la figura 5.1 se encuentra a lazo abierto, lo cual no es deseable, debido a que pueden presentarse disturbios en el camino entre ref y la salida y. Estos disturbios causan que se modifique la salida de referencia, y el controlador no tiene manera de conocer la salida y para compensar de alguna manera las variaciones en la salida. Se desearía en lo posible trabajar a lazo cerrado y de esta manera evitar estos inconvenientes.

En general, el proceso para obtener un controlador, utilizando cualquiera de las dos estructuras de control, consiste en la identificación inversa de un comportamiento dinámico, en donde éste puede ser una planta en el caso de estructuras de control basadas en modelo inverso, o una planta combinada con un modelo de referencia a seguir, en el caso de estructuras de control basadas en modelo de referencia. La selección de las variables de entrada y salida consideradas en la fabricación de una identificación inversa a partir de datos muestreados de una planta de orden n, esta dada por el diagrama de la figura 5.2a) denominado Núcleo hibrido de transición de estados para identificación inversa.

~~ ~

Sintonizacion de coniroladores difusos basada en el m&do de gradienie descendente 5 -3

Page 116: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Confrol de sixletnos dinámicos ufili;ondo Iógico di@m Capitulo 5

Antecedentes Consecuente Antecedenles Consecuente a) b)

FIG. 5.2. Selección de las variables de entrada a considerar a) durante la identificación y b) durante el control de una planta de orden n.

La diferencia entre el diagrama de la figura 5.2a y la figura 5.2b consiste en el intercambio de la variable de salida de la planta y(t) por la variable de entrada u(r-AT). La configuración del Núcleo de transición de esfados híbrido puede ser interpretado como "encontrar la entrada u(t-ATJ que sea necesaria para lograr llevar a la salida y(r) apartir de los valores anteriores y(t-AT), y '(&AT), .._".

Habiendo seleccionado las variables necesarias para obtener la identificación inversa del sistema a controlar, el siguiente paso consiste en generar los datos de entrenamiento TrnDafa, para lograr esto se aplica una señal de entrada a la planta, en lazo abierto, y se toman muestras de los datos de entrada y salida necesarios según se presentó en el diagrama de la figura 5.2. La figura 5.3 muestra el proceso para obtener los datos de entrenamiento para un sistema de primer orden.

Señal de entrada

Datos de

Antecedentes

Consecuente

entrenamiento

FIG. 5.3. Obtención de los datos de entrenaniiento para el control de una planta de primer orden

Como sucede durante el proceso de identificación de una planta, en la identificación inversa suele ser necesario utilizar como variables de entrada los valores de las derivadas, por lo que resulta necesario emplear los jZíros de estimados, comentados en la sección de identificación de sistemas dinámicos.

Sinlonizacion de controladorer difusos basada en el metodo de gradiente descendente 5-4

Page 117: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Conrrolde sis lems dinámicos ulililondo lógica difusa Capitulo 5

FC

Después de haber recolectado un total de ND datos de entrenamiento con la estructura (xi . x ~ , ..., x,, yr), en donde cada uno de los valores x, contiene un valor posible de la variable de antecedente de las reglas del sistema difuso y el valor y', representa la salida deseada u objetivo, comienza la etapa de entrenamiento realizando la sintonización de los parámetros del sistema difuso (centros y bases de conjuntos difusos y pesos de las reglas del sistema) mediante el FSGD; esta etapa se lleva a cabo hasta obtener un valor de error EC pequeño o bien hasta un determinado número de épocas. AI igual que el proceso de identificación, en el caso de necesitar más de una salida de control, es necesario emplear bloques de sistemas difusos trabajando en paralelo.

El diagrama de la figura 5.4 muestra un control para un sistema de primer orden basado en la estructura de control modelo inverso, en donde la identificación inversa, obtenida durante la etapa de entrenamiento fuera de linea, representa el bloque controlador.

YfO I b P . b ; uftl - I I - I I _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _

FIG. 5.4. Controlador difuso FC basado en el modelo inverso aplicado a una planta de primer orden en una configuración a lazo abierto. Referencia ref(1). seflal de control z r 0 ) y salida >(I). La linea punteada encierra el bloque principal que representa el inverso de la planta P .

Un aspecto importante de la selección de variables propuesta consiste en haber utilizado como entradas las variables de estado, en vez del error y sus derivadas, tal como sucede en el caso de control empleando PID's. Esta característica permite, haciendo la suposición de haber realizado una identificación inversa de la planta ideal: cerrar el lazo de retroalimentación y permitir al controlador conocer el valor de la salida y(t). lo cual le permite rechazar perturbaciones, en cierta medida, ocurridas durante el proceso de control. Para el caso de la planta de primer orden presentado eii la figura 5.4, el lazo de retroalimentación se realiza suponiendo que la salida y(f) = ref@). por lo tanto se puede obtener el retraso de la salida de la planta, representado por y(t-AT) y sustituir por la entrada ref(t-Ar), resultando el diagrama de la figura 5.5.

Sintonización de contraladores difusos basada en el meiodo de gradienie descendente 5-5

Page 118: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Control de sisfem(ls diminómicos utilizando lógico d&sa Capitulo 5

- b > I I W)

Referencia I I b P Y(t-AT) FC - I

I

Sena1 de

P -' I _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _I Sedal de I ; control Salida I I

Yttl b

I I I

En la siguiente sección se muestran experimentos para controlar sistemas de primer orden lineal, sistemas de segundo orden lineal con factores de amortiguamiento 0.2 y 0.5 respectivamente, además de un sistema de primer orden no lineal. La estructura de control está basado en el modelo inverso, además de incluir un caso de control basado en modelo de referencia aplicado a un sistema de segundo orden lineal. La variante de conjuntos empleada en esta sección es triángulos isósceles independientes.

retraso CONTROL DIFUSO I PLANTA I I I _ _ _ _ _ _ _ _ _ _ _ _ - _ _ _ - - _ -

lazo de retroalimentacidn - - -

5.4. EXPERIMENTOS CON ESTRUCTURA DE CONTROL MODELO INVERSO

20 5.4.1. SISTEMA DE PRIMER ORDEN LINEAL G(s) = -- s + 2

Como primer caso a utilizar en la etapa de control, empleando la estructura de control basada en modelo inverso, se hará uso de la planta de primer orden lineal de ganancia 10.0 a frecuencia cero, la planta posee una respuesta rápida, la cual se observó durante la etapa de identificación. La selección de variables para obtener la identificación inversa de un sistema de primer orden está dada por e l siguiente formato: 2 variables de entrada y@ y y(t-dT), mientras que la variable de salida estará determinada por u(t-AT).

La señal aplicada a la entrada de la planta, a lazo abierto, para generar los datos de entrenamiento consistió en una senoidal de amplitud +2 y frecuencia 2.5 rad/seg, modulada por una señal senoidal de amplitud 1 .O y frecuencia 0.8 rad/seg., aplicada durante 40 seg de simulación. como se muestra en la figura 4.24. Los valores de las variables y(t), y(t-AT) y u(/-d?) fueron inuestreados cada 0.2 seg, obteniendo un total de 201 datos de entrenamiento. L a identificación inversa de la planta con un sistema difuso se llevó a cabo mediante el FSGD utilizando un total de conjuntos difusos NCONJ=[2 21 durante 250 épocas de entrenamiento, con ganancias de aprendizaje KO= Kh= K,.= 3.0. logrando un error final EC = 0.05342.

5-6 Sinionizacibn de controladores difusos basada en el melado de gradienle descendente

Page 119: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Conectando el controlador difuso con la planta, en una estructura de modelo inverso bajo una configuración a lazo abierto, y aplicando como referencia una señal triangular de amplitud f l y frecuencia 1 .O ciclo cada IO seg, tal como la señal de la figura 4.1 1, se obtienen las señales de la figura 5.6.

1 ot :; ............................... ..................... j ............................... 8'. ,il

:. ........ ..................... .................................. :; ...............

O 5 10 t(seg) 15 20

FIG. 5.6. Grhfica comparativa entre la señal de referencia (línea gris punteada), la salida de la planta (línea negra continua) y señal de control (linea negra punteada) empleando el controlador difuso a lazo abierio.

La respuesta de la planta controlada a lazo abierto, respecto a la referencia a seguir, es deficiente y no logra seguir del todo a la referencia, aunque en términos generales, la forma de onda que produce la planta es semejante a la referencia triangular faltándole amplitud. Con el objeto de lograr mejorar la respuesta de la planta, se realizó la conexión a lazo cerrado del controlador y se encontró la respuesta que se muestra en la figura 5.7.

O

.............. ...... i ...... ............................ 4 ........................... s'.... .../ .......,.........

5

FIG. 5.7. Gráfica comparativa entre la señal de referencia (linea gris punteada). la salida de la planta (linea negra continua) y señal de control (linea negra punteada) empleando el controlador difuso a lazo cerrado.

Sintonizaci6n de controladorer difusos basada en el método de gradiente descendente 5-7

Page 120: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Conlrol de sistemas dimimicos utilCando Iórica difisa Caoitu1o 5

La respuesta del sistema al aplicar la retroalimentación y trabajar a lazo cerrado es buena, notando que la planta logra seguir a la referencia deseada en forma muy aceptable. La capacidad de generalización del controlador difuso a entradas desconocidas, y el poder trabajar el controlador a lazo cerrado da una perspectiva hacia la utilización de controladores difusos sintonizados con FSGD.

Otra señal de referencia aplicada al controlador difuso fué una señal senoidal de amplitud f l .O y frecuencia 2.5 radkeg. Encontrando los resultados mostrados en la figura 5.8.

O 1 2 t(seg) 3 4 5

FIG. 5.8. Señal de referencia (linea gris punteada), la salida de la planta (linea negra continua) y señal de control (linea negra punteada) empleando el controlador difuso a lazo abieno.

Esta señal de referencia posee una frecuencia mayor que la señal de referencia triangular y, sin embargo, la planta reacciona satisfactoriamente a la referencia aun trabajando a lazo abierto.

Conectando el controlador a lazo cerrado se encontró la respuesta de la planta y el controlador aplicando como referencia la señal senoidal que se muestra en la figura 5.9.

I

4 5 O 1 2 t(seg) 3

FIG. 5.9. Señal de referencia (linea gris punteada). la salida de la planta (linea negra continua) y seaal de control (linea negra punteada) empleando el controlador difuso a lazo cerrado.

5-8 Sinlonizacitvn de controladorer difusos basada en el melodo de gradiente dercendcnte

Page 121: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Control de sistemas dinámicos utilizando Iágico d&m Capitulo 5

~ o,5 ................................... +.... i !

2 i I I .- -

La señal de referencia estuvo dada por la señal triangular de amplitud k1.0 y frecuencia 1.0 ciclo cada IO segundos como se muestra en la figura 4.1 I . La referencia a seguir, la respuesta de la planta y la señal de control para el caso de una configuración a lazo abierto se muestran en la figura 5.1 I .

..........................

O 5 20

FIG. 5.11. Señal de referencia (linea gris punteada). salida de la planta (linea negra continua) y señal de control (línea negra punteada) empleando el controlador difuso a lazo abieno y aplicando una perturbación.

Se observó que el controlador nunca se enteró de la perturbación, y su señal de control permaneció sin cambio, tal como lo muestra la figura 5.1 1, logrando con esto que la salida de la planta aumente en una gran proporción (aproximadamente 0.5 multiplicado por la ganancia

Sintanizacion de contmladores difusos basada en el método de gradiente descendente 5-9

Page 122: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Conlrol de sislemm dinámicos uriliuindo lógico dzfiso Capitulo 5

de la planta 10.0, resulta en un incremento de 5.0 unidades). La diferencia entre la salida de la planta y la referencia permaneció muy grande, por este motivo, se optó por realizar pruebas empleando el controlador a lazo cerrado, encontrando los resultados mostrados en la figura 5.12.

I 9 I

I I

O 5 15 20 '0 t(seg)

FIG. 5.12. Señal de referencia (línea gris punteada). la salida de la planta (linea negra continua) y setial de control (linea negra punteada) empleando el controlador difuso a lazo cerrado y aplicando una perturbación.

AI haber realizado la configuración en lazo cerrado se encontró que la señal de control cambió a partir de los 7.0 segundos, tiempo en el cual se aplicó la perturbación, intentando de esta manera compensar el error encontrado a la salida; a pesar de no haber seguido exactamente la salida de la planta a la señal de referencia, se encontró que el controlador a lazo cerrado tiene un índice grande hacia el rechazo a perturbaciones, como se observa en la figura 5.12.

En otra prueba de rechazo a perturbaciones por parte del controlador difuso, se aplicó en la salida de la planta, agregada a la señal de control, un escalón de amplitud 0.5, después de los 3.0 seg de simulación, tal como se muestra en la figura 5.13.

I i i ! i i I j i ~ E -0.5 ....................................................

i i

O ,a 2 ?

a -

- 0 1 2 4 5 f fseg)

FIG. 5.13. Señal de perturbación aplicada a la entrada de la planta. agregada a la señal del controlador difuso,

La respuesta de la planta bajo una configuración a lazo abierto se muestra en la figura 5.14.

Sintonización de controladores difusas basada en el metodo de gradiente descendente 5-10

Page 123: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

FIG. 5.14. Señal de referencia (linea gris punteada), salida de la planta (linea negra continua) y señal de control (linea negra punteada) empleando el controlador difuso a lazo abierto y aplicando una perturbación.

Los resultados muestran que el controlador nunca se enteró de la perturbación y por lo tanto la señal de control permaneció sin cambio; sin embargo, la salida de la planta fué afectada y aumentó en una gran proporción respecto a la señal de referencia, mostrando una gran diferencia entre ellas al aplicar la perturbación a los 3.0 segundos de simulación.

La coiifiguracióii del controlador a lazo cerrado muestra un rechazo a perturbaciones, compensando la señal de perturbación al modificar la señal de control, como se observa en la figura 5.15. Se observa también el desfasamiento de adelanto de la señal de control respecto a la señal de referencia, lo cual provoca que logre llevar a la planta a la misma fase que la señal de referencia.

FIG. 5.15. Serial de referencia (linea gris punteada). la salida de la planta (linea negra continua) y señal de control (línea negra punteada) empleando el controlador difuso a lazo cerrado y aplicando una perturbación.

5-1 I Sintonizaci6n de controladores difusos basada en e l mttodo de gradicnte descendente

Page 124: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Conirol de sistemas dinimicos uiiliuindo Ió@o d$um CapiNlo 5

El controlador difuso basado en la estructura de control modelo inverso logra funcionar adecuadamente para el caso de una planta de primer orden lineal rápida, utilizando tan solo dos conjuntos por variable de entrada, como sucedió en el caso de la identificación. Una diferencia respecto a los experimentos de identificación es haber empleado un tiempo de simulación mayor a 0.1 seg. La razón es la siguiente: al utilizar como variables de entraday@) y y ( t - A q , esto para el caso de un sistema de primer orden, nótese el problema que se ocasiona al utilizar muestreos de tiempo muy pequeño, sobremuestreo, se vuelven los valores tan parecidos que no hay manera de capturar ese comportamiento.

La tabla 5.1 incluye otros experimentos realizados para conseguir un controlador basado en modelo inverso para una planta de primer orden lineal, la tabla incluye el número de datos de entrenamiento, el tiempo de muestreo, los conjuntos difusos empleados para la identificación, el valor de error EC a 100 épocas de entrenamiento y un breve comentario de los resultados obtenidos.

TABLA 5.1. Otros experimentos para obtener el controlador de un sistema de primer orden lineal. Se incluye el número de datos de entrenamiento ND, el tiempo de muestreo T> en segundos, el número de conjuntos utilizado NCONJ, el error encontrado en la época 100 EC,iw, y finalmente un breve comentario acerca de los resultados encontrados comparando la salida del sistema difuso contra la respuesta de la planta.

I] 1 2.377 I no converge. problema de sobremuestr

Los resultados empleando NCONJ=[4 41 y NCONJ=[5 51 utilizaron como señal de entrenamiento un tren de escalones de diferentes amplitudes, como el de la figura 4.6, la cual se aplicó durante 50 segundos de simulación. Los resultados de error EC obtenidos son muy altos debido a la cantidad incorrecta de conjuntos difusos, ya que cuatro o cinco conjuntos resultan demasiados para u n problema lineal, en donde es suficiente con dos o tres conjuntos por cada variable de entrada.

El problema de obtener un controlador para una planta de primer orden lineal del tipo estable. a partir de muestras de datos tomadas de la planta a lazo abierto, resultó ser un experinieiito al cual el FSGD pudo superar satisfactoriamente. Otro elemento a favor, resultó el Iieclio de poder utilizar el controlador basado en inodelo inverso en la configuración de lazo cerrado. debido a la seleccióii de variables de estado, por medio del criterio de Núcleo híbrido de frunsición de esiudos, en vez de utilizar las variables error y sus derivadas. Este criterio hace posible retroalimentar las variables y poder trabajar a lazo cerrado, contando con la capacidad de rechazar perturbaciones en un alto porcentaje.

~

5-12 Sinionizacián de controladores difusos basada en el método de gradienle descendente

Page 125: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

5.4.2. SISTEMA DE PRIMER ORDEN NO LINEAL

El experimento a tratar es una planta de primer orden no lineal, en donde la no linealidad es un cambio en la ganancia de retroalimentación al superar un valor de umbral Ben la salida de la planta y(r). Las dos ganancias posibles a frecuencia cero son 10.0 antes del umbral y de 5.0 al superar el valor de umbral O= 2.5, tal como se muestra en la figura 4.23.

La señal de entrada que se aplicó a la planta, en lazo abierto, para generar los datos de entrenamiento se muestra en la figura 4.24, la cual es una señal senoidal de amplitud f2.0 y frecuencia 2.5 radíseg modulada por una señal senoidal de amplitud 1.0 y frecuencia 0.8 radkeg, se aplicó durante 40 seg de simulación con un tiempo de muestre0 de 0.2 seg obteniendo un total de 201 datos de entrenamiento.

La identificación inversa de la planta fié realizada mediante un número de conjuntos NCONJ = [4 31 por variable de entrada, logrando una convergencia en 150 épocas de entrenamiento de EC = 0.0876 (un error promedio de 4.35 x lo4 en cada dato). La configuración final de los conjuntos difusos se muestra en la figura 5.16.

m o,;m aJ 'O * c

$ 5 Lm Y(t) o -1 -0.5 O 0.5 1

FIG. 5.16. Posición final. despues del entrenamiento' de los conjuntos difusos para las variables yo) y yO-AV empleados para identificar el modelo inverso de una planta de primer orden no lineal.

Un gráfico mostrando los datos de entrenamiento y la superficie de control generada por el sistema difuso después del entrenamiento se muestra eii la figura 5.17, esta superficie se genera al evaluar el sistema difuso para distintos valores en los intervalos de trabajo de las variables de entrada y#) yy(i-dT).

5-13 Sinloniiacion de controladores difusos basada en el metodo de gradiente descendente

Page 126: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

FIG. 5.17. Supefiicie de control generada por el sistema difuso despub de la etapa de entrenamiento empleando los datos de entrenamiento representados por loc cíicillos ai centro de la figura.

La superficie generada por el sistema difuso representa las acciones de control, por lo que puede decirse que es una superficie de control para un sistema de primer orden no lineal; cuando esta superficie atraviesa a todos los datos de entrenamiento (círculos distribuidos al centro del gráfico), se logra la convergencia y se imita el comportamiento dado por los datos de entrenamiento.

El área de trabajo donde no existen datos de entrenamiento, queda cubierta por una superficie determinada por las condiciones finales de las reglas, las cuales no tienen una dirección POT no haber existido datos que provocaran su sintonización. Bajo estas consideraciones se hace notar que las señales de entrenamiento de tipo senoidal modulada, distribuyen los datos de entrenamiento en forma más adecuada que el caso de señales del tipo escalón o triangular.

Habiendo logrado un error EC bajo, se conecta el sistema difuso como controlador de la planta, bajo una estructura de modelo inverso. Aplicando una señal de referencia triangular de amplitud +I .O y frecuencia 1 .O ciclos cada 1 O seg durante 20 seg de simulación, como se observa en la figura 4.1 1, se encuentra, bajo una configuración del controlador a lazo abierto, la respuesta de la planta tal como lo indica la figura 5.18.

5-14 Sintonizaci6n de controladorer difusos basada en el mModo de gradiente descendente

Page 127: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 5 Control de s;stemos dinámicos utilirando 16gica d(fiisa

15 20 O 5 10 t(seg)

' FIG. 5.18. Seaal de referencia triangular (linea gris punteada). salida de la planta (linea negra continua) y seaal de control (linea negra punteada) empleando el controlador difuso a lazo abierto.

La salida de la planta no logra seguir a la referencia en forma satisfactoria, notando desviaciones considerables respecto a la señal de referencia en las partea negativas. Para uli sistema no lineal como éste, la señal de control necesaria para generar una salida simétrica, como sucede con la señal triangular usada como referencia, debe de ser una señal que sea capaz de compensar la nolinealidad presente en la planta, lo cual se consigue con una señal de control no simétrica, como se observa en la figura 5.1 8.

AI realizar la configuración del controlador a lazo cerrado y aplicar la misma señal triangular de referencia de la figura 4.1 I , se observa la respuesta de la planta que se muestra en la figura 5.19.

FIG. 5.19. Señal de referencia triangular (linea gris punteada), la salida de la planta (linea negra continua) y señal de control (linea negra punteada) empleando el controlador difuso a lazo cerrado.

AI trabajar a lazo cerrado se observa una gran mejoría de la salida, logrando seguir a la referencia con un pequeño margen de error, del mismo modo que sucedió en la configuración a lazo abierto, la señal de control no es simétrica, a diferencia de lo que sucedió para el experimento de control de una planta de primer orden lineal, intentando de esta manera compensar la no linealidad presente en la dinámica de la planta a controlar.

Sintoniración de wntroladam difusos basada en el mtiodo dc gradiente descendente 5-15

Page 128: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Otra señal de referencia que se aplicó al controlador consistió en una señal senoidal de amplitud +7.5 y frecuencia 2.5 radseg. La señal de referencia, la señal aplicada por el controlador y la respuesta de la planta se muestran en la figura 5.20 para una configuración del controlador a lazo abierto.

O 2 4 t(segj 6

FIG. 5.20. Sena1 de referenua senoidal (línea gris punteada), la salida de la planta (linea negra contnua) y seaal de control (linea negra punteada) empleando el controlador difuso a lazo abierto.

AI igual que sucedió con la referencia triangular, la señal de referencia senoidal es simétrica, y por lo tanto, la señal de control debe de compensar con una señal senoidal asimétrica de forma que sea capaz de compensar la no linealidad de la planta. A lazo abierto se encontró que a pesar de seguir la salida de la planta a la señal de referencia, se nota un retraso considerable en la respuesta, es decir se encuentran desfasadas entre sí. Otro punto a comentar es el desfasamiento de la señal de control respecto a la señal de referencia con objeto de anticipar una respuesta para lograr seguir a la señal de referencia.

Aplicando el controlador difuso en una configuración a lazo cerrado se obtiene la respuesta de la planta y la señal de coatroi que se indican en la figura 5.21,

O 2 4 t(seg) 6

FIG. 5.21. Seaal de referencia senoidal (linea gris punteada), la salida de la planta (linea negra continua) y seaal de control (linea negra puntada) empleando el controlador difuso a lazo cerrado.

Sintoniracibn de coniroladorcr difuror b a d a m cI método de gradimte dcsccndcnic 5-16

Page 129: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

AI retroalimentar y trabajar a lazo cerrado se observa que la señal de referencia logra seguir en forma muy parecida a la señal de referencia y el retraso entre la salida de la planta y la referencia logra disminuirse considerablemente.

Habiéndose encontrado buenos resultados al aplicar las señales de referencia triangular y senoidal, se harán pruebas al controlador difuso, las cuales consisten en inyectar una señal de perturbación a la entrada de la planta, la cual será agregada a la señal de control. Con esta prueba, se evaluará la capacidad del controlador difuso al rechazo de perturbaciones.

La señal de perturbación aplicada a la planta fué un escalón de amplitud 0.5 aplicado a los 7.0 seg de simulación, tal como lo muestra la figura 5.22 .

0.5 p....- ! 1 D

2 I - ! .- -

15 20 lo tfseg j 5 e o 4 0

FIG. 5.22. Escalón de amplitud 0.5 inyectado como penurbacijn a la entnda de.1: plan:a.

La señal de referencia fué una señal triangular de amplitud *I y frecuencia 1.0 ciclos cada 10.0 segundos, como se muestra en la figura 4.1 I , la salida de la planta y la señal de control se muestran en la figura 5.23 para una configuración del controlador a lazo abierto.

O 5 10 t(seg) 15 20

FIG. 5.23. Seaal de referencia (linea gris punteada). salida de la planta (linea negra continua) y seaal de control (linea negra punieada) empleando el controlador difuso a lazo abierto al aplicar una perturbaci6n.

Durante la perturbación, el controlador no logra enterarse del error en la salida y no tiene manera de compensar este transitorio por encontrarse a lazo abierto, esto se nota en la señal de control, la cual permanece sin cambio durante el tiempo que se aplica la perturbación.

Sintonización de controladom dihisor bajada cn CI método dc gadicntc dcrccndcnte 5-17

Page 130: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 5 Control de sisemos dimimicos uriliiondo lógica d$ua

._ -

Haciendo la conexión del controlador a lazo cerrado y realizando la misma prueba se encontraron los resultados que se presentan en la figura 5.24, en donde se incluye la señal de control, la salida de la planta y la señal de referencia.

I

O 5 15 20

FIG. 5.21. Seaal de referencia (linea gris punteada), salida de la planta (linea negra continua) y seilal de control (linea negra punteada) empleando el controlador difuso a lazo cerrado al aplicar una perturbación.

y se aplicó como señal de referencia una senoidal de amplitud 57.5 y frecuencia 2.5 radseg, encontrando los resultados que se muestran en la figura 5.26, bajo una configuración del controlador a lazo abierto.

5-18 Sintonimci6n de controladom difusos basada en el metdo de gradienie descendente

Page 131: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

O 2 4 t(ceg) 6

FIG. 5.26. Sefial de referencia (línea gris punteada), salida de la planta (linea negra continua) > señal de control (linea negra punteada) empleando el controlador difuso a lazo abierto y aplicando una perturbación.

AI trabajar en una configuración a lazo abierto se observa que la señal de control permanece sin cambio antes y después del transitorio, ya que el controlador no logra enterarse del error en la salida y no tiene manera de compensar este transitorio. La figura 5.27 muestra la salida de la planta y la señal de control al conectar e l controlador en una configuración a lazo cerrado y aplicar e l transitorio a los 3.0 segundos del tiempo de simulación.

O 2 4 i(sed 6

FIG. 5.27. Señal de referencia (linea gris punteada), salida de la planta (linea negra continua) y seaal de control (linea negra punteada) empleando el controlador difuso a lazo cerrado y aplicando una perturbación.

El transitorio no pudo ser compensado a un loo%, pero el controlador, bajo esta configuración, realizó un cambio en la señal de control con el objeto de intentar compensar la diferencia entre la señal de salida y la señal de referencia.

Sintonización dc controladores dihiros basada en el nietodo de gradiente descendente 5-19

Page 132: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Un resumen de otros experimentos realizados sobre la planta de primer orden no lineal para conseguir su identificación inversa se muestra en la tabla 5.2, en donde se incluye el número de datos de entrenamiento, el tiempo de muestreo, los conjuntos difusos empleados para la identificación, el valor de error EC a 100 épocas de entrenamiento y un breve comentario de los resultados obtenidos.

TABLA 5.2. Experimentos realizados para obtener el controlador para un Sistema de primer orden no lineal. Se incluye el número de datos de entrenamiento ND, el tiempo de rnuestreo T, en segundos, el número de conjuntos utilizado X O N J . el error encontrado en la epoca 100 EC(lw> y finalmente un breve comentario acerca de los resultados encontrados comparando la salida del sistema difuso contra la respuesta de la planta.

Algunos resultados mostraron menor valor de error EC, sin embargo al realizar una prueba de simulación no mostraron buen comportamiento. AI utilizar pocos conjuntos se hace una aproximación gruesa, tal como linealizar el comportamiento, sin embargo al aumentar el número de conjuntos se logran capturar las no linealidades de la planta. Si se llega a aumentar el número de conjuntos a un número mayor de cuatro se encuentra una aproximación poco exacta, haciendo el FSGD la eliminación de algunos conjuntos no necesarios para la identificación inversa. En la etapa de control el muestreo de datos representa un parámetro de usuario que juega un papel importante en la sintonización de los datos mediante un sistema difuso, como se puede observar el comportamiento del sistema con datos muesbeados cada 0.1 seg no puede ser capturado en forma satisfactoria manteniendo un error EC muy alto.

Se encontraron resultados satisfactorios durante las pruebas de control realizadas sobre la planta de primer orden no lineal, donde se muestra el controlador difuso su capacidad de generalización y SU rechazo a perturbaciones. La identificación del modelo inverso de la planta, a partir de los datos muestreados de las plantas de primer orden a lazo abierto, fué sintonizada en forma satisfactoria, y se encontró para el caso de la planta no lineal un aumento en el número de conjuntos difusos empleados en cada variable de entrada con el fin de capturar la no linealidad de la planta.

5-20 Sintonización de wnlroladores difusos basada en el metodo de gradienfe descendente

Page 133: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 5 Control de sistema^ dinómicor utilizando 16gica d+tm

5=0.5 39.44

s2+6.28s + 39.44 5.4.3. SISTEMA DE SEGUNDO ORDEN LINEAL G(s) =

Este sistema tiene un factor de amortiguamiento de 0.5, su respuesta a l a entrada escalón unitario genera tres oscilaciones, antes de llegar en 5.0 segundos, a estado estable y tiene una ganancia unitaria a frecuencia cero. Las variables a considerar como entradas para lograr un controlador basado en modelo inverso, siguiendo el criterio del Núcleo híbrido de transición de estados, son: y(t), y(r-AT) y y'(t-AT); mientras que la variable a considerar como salida será uft--Ar) la cual representará nuestra señal de control.

La señal de entrada utilizada para generar los datos de entrenamiento fué una señal senoidal de amplitud f 2 y frecuencia 2.5 rad/seg, la cual se encuentra modulada por una señal senoidal de amplitud 1.0 y frecuencia 0.8 rad/seg aplicada durante 40 seg, como se muestra en la figura 4.24. Los datos de entrenamiento se tomaron muestreando cada 0.2 seg a cada una de las variables de entrada y salida obteniendo un total de 201 datos de entrenamiento.

La etapa de aprendizaje se realizó empleando 100 épocas, con un total de conjuntos por variable de NCONJ = 12 2 21, logrando finalmente un error EC = 0.0098 (un error promedio de 4 . 8 7 ~ por cada dato).

Habiendo logrado un error EC pequeño, se procede a conectar el sistema difuso con la planta, bajo una estructura de control en modelo inverso. L a señal de referencia fué una señal triangular de amplitud f1.5 y frecuencia 1.0 ciclos cada I O seg, como se muestra en la figura 4.1 I . La figura 5.28 muestra la referencia a seguir, la salida de la planta y la señal de control para una configuración del controlador a lazo cerrado.

FIG. 5.28. Seiiales al aplicar el controlador, en lazo abierto, a la planta de segundo orden lineal a) señal de referencia (línea gris punteada) y salida de la planta (línea negra continua) y b) seaal de control.

5-2 I Sintonizaci6n de controladores difusos basada en el método de gradiente descendente

Page 134: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 5 Control de smiemm dináinrcos urilrzondo logfca dhsa

La salida de la planta a pesar de intentar seguir una señal con cambios bruscos, como lo es una señal triangular, posee un retardo en su respuesta, además de no llegar completamente a la amplitud de la señal de referencia. Sin embargo, cabe mencionar que la planta a controlar es de segundo orden, y por lo tanto posee retrasos propios de su dinámica, además de un comportamiento oscilante con un amortiguado de 0.5.

Utilizando ahora como señal de referencia una señal senoidal de amplitud f1 .5 y frecuencia 2.5 radkeg, bajo una configuración a lazo cerrado se encontró la respuesta de la figura 5.29.

1.5

o 0.5 c O

ai U

4 6 O 2 4 6 Use4

b) tíseg)

O

a)

FIG. 5.19. Señales al aplicar el controlador. en lazo abierto, a la planta de segundo orden lineal. a) seiial de referencia (linea gris punteada) y salida de la planta (línea negra continua) y b) seaal de control.

Se observa un desfasamiento de la salida de la planta respecto a la señal de referencia, aún con este retraso, la planta logra seguir en forma aceptable la señal de referencia.

Algunos de los resultados obtenidos durante la etapa de control para una planta de segundo orden lineal fué encontrar que la salida de la planta esté retrasada respecto a la señal de referencia, en el caso de la referencia senoidal es más notorio, debido a su frecuencia alta de 2.5 rad/seg; y en el caso de la frecuencia baja de la señal triangular se sigue encontrando el retardo. Es de mencionar el esfuerzo que realiza el sistema difuso para controlar al sistema de segundo orden oscilatorio y con sobretiro, y a pesar de estos contratiempos logra hacer que la planta siga a la señal de referencia en forma casi aceptable.

5-22 Sinlonizaci6n de controladom difuror basada en el m h d o de gradiente dei&ndente

Page 135: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 5 Conirol de sisiems dinimicos ai l iando lógico dguso

39.44 sZ+2.5ls+39.44 5.4.4. SISTEMA DE SEGUNDO ORDEN LINEAL G(S) = 5z0.2

Como caso final de la sección de estructura de control basada en modelo inverso se controlará una planta de segundo orden de tipo lineal cuyo factor de amortiguamiento 5=0.2, este factor de amortiguamiento provoca que al aplicarle a la planta una entrada escalón unitario, produzca aproximadamente cuatro oscilaciones antes de llegar a estado estable, bajo esta explicación, este sistema es más oscilatorio que el sistema controlado en el experimento anterior, finalmente otra característica de la planta es tener una ganancia unitaria a frecuencia cero.

La etapa de entrenamiento se llevó a cabo utilizando 201 datos de entrenamiento, los cuales fueron obtenidos de haber muestreado los datos de la planta aplicando como señal de entrada una senoidal de amplitud f 2 y frecuencia 2.5 rad/seg modulada por una senoidal de amplitud 1.0 y frecuencia 0.8 rad/seg durante 40 seg de simulación, figura 4.24, empleando como tiempo de muestre0 0.2 seg.

El sistema difuso fue sintonizado para lograr minimizar la función de error EC mediante una etapa de entrenamiento con FSGD, logrando en 100 épocas de entrenamiento, con un número de conjuntos NCONJ= [ 2 2 21, un valor de EC = 0.015 (un error promedio por dato de 7.46 x IO-'), la situación final de los conjuntos para las tres variables de entrada se muestra en la figura 5.30.

-1 -0.5 O 0.5 1 O

Yft-AT)

-1 -0.5 O 0.5 1

-1 -0.5 O 0.5 1

FIG. 5.30. Situación final de los conjuntos difusos, para las tres variables de entrada, después de 1üO épocas de entrenamiento

Después de haber realizado la etapa de entrenamiento y haber conseguido un error EC bajo, se utilizó el sistema difuso sintonizado como un controlador para la planta de segundo orden lineal bajo una estructura de control basada en modelo inverso. La señal de referencia aplicada al controlador fue una onda triangular de amplitud tl.5 y frecuencia 1 .O ciclos cada

Sintonización de controladores difusos basada en el metodo de gradiente dikmdente -

5-23

Page 136: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 5 Conrroi de sisrems dinámicos urilixndo lógica difitsa

I O segundos durante 20 seg de simulación. Los resultados obtenidos al utilizar el controlador a lazo cerrado se muestran en la figura 5.3 1.

i i

/I \ 3 0.5 / I \ !

1.5

1

x o E 4 -0.5 \ :

i ! i I

I

I ____

-1

-1.5

1.5

1

2 0.5 a 0 E a-0.5

-1 -1.5

- ._

I

1

3 0.5 b c s o

$

m

2 -0.5

-1

D -

O 2 4 6

FIG. 5.32. Señales al aplicar el controlador en lazo cerrado a) señal de referencia (línea gris punteada) y salida de la planta (línea negra continua); b) señal de control.

Sintonizaci6n de controladores difusos basada en el metodo de gradienre derccndenie ~~

5-24

Page 137: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Conrrol de sisienns dinimicos uii1i:ando logico difusa Capitulo 5

L~ respuesta obtenida por la planta se encuentra desfasada respecto a la señal de referencia y además las amplitudes no corresponden exactamente a los valores deseados. La señal de control es suavizada y no posee cambios bruscos, y en términos generales la señal de salida es muy semejante a la referencia.

Los resultados encontrados en los experimentos de control para plantas de segundo orden lineal fueron buenos, consiguiendo la sintonización de un sistema difuso con las características de un controlador para plantas de segundo orden, el cual consiguió seguir en forma casi satisfactoria las referencias, aún las de tipo triangular que poseen cambios abruptos.

Una característica muy importante en la metodologia planteada para controladores basados en modelo inverso es la capacidad de utilizar la retroalimentación en forma directa, ya que no se hace uso de las variables de error y sus derivadas, sino el empleo de las variables de estado, las cuales consisten en la salida anterior y sus derivadas. De esta manera, considerando una identificación inversa ideal de la planta, se pueden cerrar los lazos de retroalimentación al controlador, obteniendo un porcentaje alto en el rechazo a perturbaciones y una buena respuesta para seguir las referencias.

Antes de terminar con la sección de control basado en modelo inverso es necesario comentar el papel tan importante que desempeña el tiempo con el cual se realiza el muestreo de los datos de la planta a identificar o controlar, ya que es un parámetro de usuario. En el caso de los experimentos de identificación, este parámetro no juega un papel muy crucial; sin embargo, durante la etapa de control es un parámetro decisivo para el éxito o el fracaso durante la simulación del controlador y la planta. En nuestros experimentos se consideró un muestreo de 0.2 seg y se obtuvieron buenos resultados; sin embargo, para muestreos cada 0.1 segundos el método no logró converger a un valor pequeño de EC.

5.5. ESTRUCTURA DE CONTROL BASADA EN MODELO DE REFERENCIA

En la estructura de control basada en modelo de referencia se utiliza un comportamiento semejante al modelo inverso, con una diferencia en la salida de la planta, la cual contiene un comportamiento afectado por un modelo a seguir como referencia MR. Como modelo de referencia se puede emplear el comportamiento de plantas tales como un sistema de primer orden (generalmente sin sobretiro, ni oscilaciones), una planta de segundo orden (la cual posee sobretiro y oscilaciones hasta llegar a un tiempo de asentamiento o estado estable), o cualquier otro comportamiento deseado el cual debe de ser seguido por la salida de la planta. La conexión de un controlador basado en modelo de referencia se muestra en la figura 5.33 en donde el objetivo es obtenery =y'.

5-25 Sintonilaci6n de controladores difusos basada en el metodo de gradiente descendente

Page 138: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Salida referencia Entrada

FIG. 5.33. Esquema de control utilizando modelo de referencia

Para este caso, el controlador resultante estará formado por el producto de MR y P -', tal como se muestra en la figura 5.34.

Control

FIG. 5.34. Componentes de un controlador basado en la estructura modelo de referencia

La estructura de control basada en modelo de referencia, se emplea cuando el inverso de la planta P resulta demasiado complicado de realizar, o bien resulta en una aproximación demasiado gruesa de la planta, en estos casos se emplea seguir un comportamiento (v.g. primer orden, segundo orden, etc.) de una respuesta de un modelo de referencia MR Una manera de conseguir un controlador para este tipo de plantas, consiste en realizar una identificación inversa del modelo de referencia MR, pudiendo emplearse un identificador difuso, a continuación se une la identificación realizada MR-' con la planta a controlar P bajo la configuración (P)(MR-'), y finalmente se realiza su identificación inversa. El sistema difuso obtenido representa a un controlador formado por FC=(MR)(P-').

En esta estructura de control se emplea primero una identificación inversa del modelo de referencia y no de la planta que, como ya se comento, algunas veces no es posible obtener su inversa. El modelo de referencia por ser elegido por el usuario, debe tener como la propiedad de ser invertible, ya sea por métodos algebraicos, o bien mediante técnicas de inteligencia artificial; de esta manera al conectar el modelo de referencia y la planta, se logra bajar la complejidad de la identificación inversa del conjunto.

Una configuraci6n utilizando la estructura de control basada en modelo de referencia para un sistema de primer orden se muestra en el diagrama de la figura 5.35.

5-26 Sintoniracibn de caneoladores difusos basada en el método de gradiente deccndente

Page 139: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

I I

1 I

. FC Señal de

referencia I

I I Retraso CONTROL DIFUSO I PLANTA I I --------------------I

FIG. 5.35. Controlador difuso FC basado en modelo de referencia aplicado a una planta de primer orden en una configuración a lazo abierto. Referencia ref(i), señal de control u(i). salidayílJ y modelo de referencia MR. La linea punteada encierra el bloque que representa el controlador difuso.

La manera de conseguir la retroalimentación bajo este esquema, no resulta tan simple como sucedió en la estructura de modelo inverso, ya que en este caso la saliday@) se encuentra afectada por el comportamiento del modelo de referencia MR. El proceso a seguir para lograr retroalimentar la salida de la planta,. es obtener el comportamiento inverso del modelo de referencia, es decir MR-', mediante una aproximación difusa, y conectarle la salida y(t) a este bloque; bajo estas condiciones la salida obtenida, se encuentra en condiciones de poder retroalimentarse en la entrada del control difuso ref(r-dT), tal como se muestra en el diagrama de lafigura 5.36.

W O

Señal de referencia

Señal de control I Salida

Y '(O

Y(Y

FIG. 5.36. Controlador difuso FC basado en modelo de referencia aplicado a una planta de primer orden en una configuraci6n a lazo cerrado. Referencia ref@), señal de control u(i), saliday(,), modelo de referencia MR, aproximación difusa del inverso del modelo de referencia ,i.fR.'& La linea punteada encierra el bloque principal que representa el controlador difuso.

Sinfonizaci6n de controladores difusos basada en el metodo de gradiente descendente 5-27

Page 140: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Confro1 de si~~emor dinimicos uriliiondo lógico d<uso Capitulo 5

Como se observa en el diagrama de control a lazo abierto de la figura 5.35, se emplea un retardo en la segunda entrada del controlador difuso, mientras que en el diagrama de la figura 5.36, empleando lazo cerrado, el retardo fué eliminado, esto debido a que el transcurso de la señal a través del controlador y la planta provoca retardos generados por las dinámicas propias de la relación control-planta, de forma tal que, si se incluyera otro retardo, la señal de retroalimentación se encontraría demasiado fuera de fase.

Además de la etapa de experimentación utilizando la estructura de modelo inverso, se hicieron experimentos con la estructura de modelo de referencia, el modelo de referencia M y la planta a controlar G(s) están definidas de la siguiente manera:

1 1 + 0.28s + 0.0204s'

M=--

39.4384 s2 + 6.28s + 39.4384

G(s) = __-~____-

El modelo de referencia tiene una ganancia unitaria a frecuencia cero y un factor de amortiguamiento 5 = 0.98, mientras que la planta a controlar G(s) posee una ganancia unitaria a frecuencia cero y un factor de amortiguamiento 5 = 0.5.

La señal de entrenamiento aplicada al modelo de referencia M para obtener su identificación inversa fué una señal senoidal de amplitud f 3 con una frecuencia de 2.5 radseg modulada por una señal senoidal de amplitud 1.0 y frecuencia 0.8 radíseg, muestreando cada 0.2 seg durante 40 seg, tal como se observa en la figura 5.37.

FIG. 5.37.

I I I I I 30 40 *O t(W)

10 . ~~

Señal de entrada aplicada al modelo de referencia Mpara obtener su identiiicacián inversa.

Las variables de entrada utilizadas para conseguir la identificación inversa fueron y(t+AT), y@) y ~'(0, mientras que la variable de salida fué u@). Se emplearon un total de conjuntos NCONJ=[2 2 21 para identificar MI con 201 datos de entrenamiento durante 200 épocas logrando un error final de EC = 0.00323.

5-28 Sintonizacibn de canUdadores difusos basada en el método de gnidienic descendente

Page 141: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Conirol de sisicms dinóniicos uiiliíondo lógico di&sa Capitulo 5

La identificación inversa del conjunto PM' se llevó a cabo empleando como entrada una señal senoidal de amplitud I 2 con una frecuencia de 2.5 radkeg modulada por una señal senoidal de amplitud 1.0 y frecuencia 0.8 radlseg., muestreando cada 0.2 seg durante 40 seg, como se observa en la figura 5.38.

FIG. 5.38. Seaal de entrada aplicada al conjunta P M ' para obtener su identificación inversa.

Las variables de entrada fueron y(t+drj, y@) y y'([) mientras que la variable de salida fué u@). Se emplearon un total de conjuntos NCONJ=[3 3 31 para identificar MP" con 201 datos de entrenamiento durante 100 épocas logrando u n error final EC de 0.0299.

Después de haber obtenido la identificación del conjunto M P ' , el cual representa el bloque controlador, se realizó la conexión con la planta P a lazo abierto. Se utilizó como referencia una señal senoidal de amplitud f1.5 y frecuencia 2.5 rad/seg, los resultados se muestran en la figura 5.39.

2 : 1

1.5 m

W n

= W

0.5

- m o W z-0.5 3 - ._ - 3 -l

-1.5 10

t(Seg? O 2 4

FIG. 5.39. Respuesta del modelo de referencia, linea negra punteada; salida de la planta utilizando el control MP' a lazo abierto, linea negra continua. Señal de referencia, señal senoidal de amplitud f1.5.

La señal de salida de la planta logra seguir en forma correcta la respuesta del modelo de referencia utilizando como referencia la señal senoidal.

Sintonizaci6n de wnlroladors difusos basada en el mttodo de gradienle descendente 5-29

Page 142: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

AI utilizar como señal de referencia una señal triangular de amplitud k1.5, con una frecuencia de I .O Ciclos cada I O seg se obtuvieron los resultados de la figura 5.40.

O 5 '0 t(seg) '5 20

FIG. 5.40. Respuesta del modelo de referencia (linea negra punteada) y salida de la planta utilizando el control MP.' a lazo abierto (linea negra continua).

La respuesta de la planta controlada en lazo abierto logra seguir la respuesta del modelo de referencia empleando como referencia la señal triangular de baja frecuencia afectada por el modelo de referencia. Respecto a la respuesta del controlador aplicada a la misma planta utilizando la estructura de control de modelo inverso, figura 5.28a, se obtuvieron mejores resultados; aunque no pueden compararse del todo igual debido a que son diferentes estructuras de control. Se puede concluir que, al menos para esta planta, resulta mejor el controlador basado en mode1o.de referencia.

AI aplicar la configuración del controlador a lazo cerrado no se encontraron resultados satisfactorios, ya que se encontró una disminución drástica en las amplitudes de la salida de la planta.

Además de la selección de variables descritas en la sección de identificación y control, para el caso de sistemas continuos híbridos, se proponen los siguientes criterios de selección de variables cuando se trata con sistemas de tipo discreto.

La figura 5.41 muestra el criterio de selección de variables durante la etapa de identificación para un sistema discreto de orden n.

;q-- HSTK

y(k-(n-1 J FIG. 5.41. Criterio de selecci6n de variables de entrada y salida para un sistema discreto de orden n

durante la etapa de identificación.

Sintoniraci6n de controladores difusos basada en el metodo de gradiente descendente 5-30

Page 143: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

En la figura 5.42 se presenta el criterio de selección de variables para el proceso de identificación del modelo inverso para el caso de un sistema discreto de orden n.

FIG. 5.42. Criterio de selección de variables de entrada y salida para un sistema discreto de orden n durante la etapa de identificación inversa del sistema.

En los criterios de identificación y control se presentan semejanzas muy fuertes en el conjunto de variables de entrada, la única diferencia entre ellos es el intercambio de posición entre las variables y&+l) y ufi); haciendo posible el cambio entre el proceso de obtener la identificación capaz de “encontrar y(k+l) a partir de un conjunto de valores de entrada” y el proceso de obtener el controlador (identificación inversa) capaz de “encontrar ufi), señal de control, necesaria para llevar a la planta al estado y&+./)”.

Una restricción en el proceso de identificación del modelo inverso mediante un sistema difuso, a partir de datos muestreados de la planta, al ser utilizado para estructuras de control basadas en modelo inverso o en modelo de referencia, es que la planta o el modelo de referencia puedan ser invertibles.

Otra variante propuesta para el proceso de la selección de variables, consiste en utilizar deltas o incrementos entre los valores anteriores y actuales. El diagrama de la figura 5.43 muestra las variables necesarias, en entradas y salida, para lograr el proceso de identificación y control para un sistema discreto de orden n.

FIG. 5.43. Criterio de seleccibn de variables de entrada y salida para un sistema discreto de orden n a) durante la etapa de identificación empleando deltas y b) durante la etapa de control (identificación inversa) empleando deltas.

Sintonimi6n de controladores difusos bwda en el m&do de gradiente descendente 5-3 1

Page 144: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Control de siskwws dinámicos utilimndo 16g;co difiisa Capitulo 5

5.6. Presintonización de las reglas difusas

A diferencia de las redes neuronales, en donde cada peso de la red no se encuentra mapeado a un valor de salida especifico, sino que en conjunto varios pesos componen un valor de salida; en los sistemas difusos cada regla realiza una contribución hacia una zona específica formada por los valores de salida (respuesta del sistema difuso). Debido a que cada regla es disparada dependiendo de los valores de sus antecedentes, la información permanece en forma de parches (o clusters), formados por cada una de las reglas difusas. Para aclarar más esta idea, obsérvese el gráfico de la figura 5.44, donde se muestra el efecto de parches que producen cuatro reglas aplicadas a la funciÓnf(i) [Kosko93].

4

X

FIG. 5.44. Interpretación de cuatro reglas difusas vistas como parches

Cada uno de los parches representa una porción del conocimiento necesario para resolver una parte del problema dado, las cuales al actuar en conjunto son capaces de resolver el problema completo. En la figura 5.44 se observan traslapes entre cada una de las cuatro reglas, y la delimitación del área del problema que le es asignado a cada una de ellas.

A continuación se muestra la aplicación a una función algebraica (raiz cúbica); sin embargo, es aplicable a sistemas dinámicos como se verá en la siguiente sección para el control de un péndulo invertido. Los datos empleados para aproximar esta función fueron tomando 33 pares (x, ffx)) igualmente espaciados sobre la variable independiente x en el intervalo [-IO, 1 O], evaluados con la funciónffx) = xin, tal como se muestra en la figura 5.45.

5-31 Sintonizaci6n de controladores difusos basada en el método de gradientc descendente

Page 145: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

t

O

FIG. 5.45. Conjunto de 33 datos empleados para aproximar la función raíz cúbica. Cada signo + representa un dato de entrenamiento,

Si el universo del discurso de la variable de entrada x se particiona en cuatro conjuntos difusos, con centros igualmente espaciados y bases traslapadas entre sí, escalados en el intervalo [ - I , I], se obtendría la gráfica de la figura 5.46.

FIG. 5.46. Variable de entrada x particionada por cuatro conjuntos difusos.

AI utilizar un sistema difuso de una entrada, la cantidad total de reglas generadas es cuatro, en donde cada regla utiliza como antecedente a uno de los cuatro conjuntos difusos. La interpretación lingüística de las cuatro reglas es:

I ) S ix es CI entoncespwq 2) Si x es C2 entonces y=w2 3) Si x es C3 entonces y, 4) S i x es C I entoncesFw4

donde wi es un escalar que representa el peso de la regla i como respuesta a la solución del problema.

Una respuesta del sistema difuso, evaluando x en el intervalo [-IO, IO], utilizando = 0.5 se muestra en la figura Iodos los pesos de las reglas del sistema can un valor inicial

5.47.

Sintoniraci6n de mntroladorer difusos basada en el método de gradiente descendente 5-33

Page 146: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 5 Coitlrol de sistemas dinimicos uriiLando lógica di/irsa

2 3 4

'I

.. ._-,

22 6.63 0.3013 22 15.37 0.6986 1 1 9.87 0.8972

+' 1 - 1

-10 -5 O 5 10 X

FIG. 5.4'7. Salida del sistema difuso (linea horizontal al centro de la figura) al utilizar un iv,,i=O.j en las cuatro reglas del sistema. Cada signo + representa un dato de entrenamiento.

Sin embargo, una situación inicial más favorable para el sistema difuso consiste en encontrar los valores de salidapromedio de los datos que incluye cada una de las cuatro reglas del sistema, y utilizar este valor como valor inicial de, cada uno de los pesos de las reglas. La tabla 5.3. muestra la cantidad de datos cubiertos por cada una de las reglas del sistema frecuencia, así como la sumatoria de sus valores de salida (escalados en el intervalo [O, I ] ) y el valor promedio por regla.

TABLA 5.3. Cantidad de datos por regla í./iecuencia), sumatoria de salidas de los datos relacionados (Sum y') y salida promedio por regla vpromedio) para las cuatro reglas del sistema.

Sum I Regla I frecuencia I p romedio 1 1 I 1 I 1 1 7 1 n 11177

Las reglas dos y tres incluyen el doble de datos, debido a que sus conjuntos relacionados, conjuntos c2 y c3, poseen su lado izquierdo y derecho; a diferencia de los conjuntos cl y c4, los cuales solo poseen el lado derecho e izquierdo respectivamente. El valor promedio de salida promedio) es más alto conforme se pasa del conjunto cl al c4, encontrándose valores de salida (escalados en el intervalo [O, I I) menores en la regla uno y mayores para el caso de la regla cuatro, por ser una función monótona creciente.

AI utilizar como valor inicial de los pesos wi de las reglas difusas, el valorypromedio, se obtiene la salida del sistema difuso de la figura 5.48.

Sintoniraeión de controladores difusos basada en el metodo de gradimlc descendente ~

5-34

Page 147: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 5 Conrrol de sisremos dimimicos uiiliiondo Iógico d>frisa

-10 -5 O x 5 10

FIG. 5.48. Salida del sistema difuso (linea continua al centro de la figura) al utilizar un yni=,!Jpromedio en las cuatro reglas del sistema. Cada signo + representa un dato de entrenamiento.

Se observa una gran ventaja al comenzar en esta situación, y el resto del proceso de sintonización se encargará de aproximar el sistema difuso a la función raíz cúbica.

Una situación aún más favorable es considerar Únicamente los datos que tengan mayor efecto dentro de cada una de las reglas, ésto puede conseguirse utilizando los datos que provoquen un grado de disparo de la regla p 2 O S . La situación inicial del sistema difuso utilizando esta característica para calcular el peso inicial de cada una de las cuatro reglas del sistema se muestra en la figura 5.49.

1.5).

I I + ++I 0.5.

-0.5.

-10 -5 O x 5 10

FIG. 5.49. Salida del sistema difuso (linea continua al centro de la figura) al utilizar un wni =Y promedio en las cuatro reglas del sistema, considerando Unicamente aquellos datos que dispararon las reglas difusas con un 2 0.5. Cada signo + representa un dato de entrenamiento.

5-35 Sintoniracidn de controladores difusos basada en e l m&do de gradiente descendente

Page 148: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Este mismo proceso puede aplicarse a los pesos iniciales de un sistema de n entradas y una salida, ayudando al sistema difuso a comenzar desde una situación presinroilizudu en el valor de los pesos de sus reglas. En la sección de identificación y control se observó en las gráficas relacionadas a vuriuci6n de purúmelros, que los pesos de las reglas, comparados contra centros y bases de los conjuntos, sufrian mayor variación durante la etapa de entrenamiento, en algunos casos encontrando hasta 0.5 unidades, provocando que los centros se movieran considerablemente, llegando incluso a casos en los cuales eran expulsados del área de trabajo; por este motivo, al presintonizur el sistema difuso se encoiiíró mayor estabilidad en el movimiento de los parámetros, conservando en las etapas de sintonización hasta una cantidad alta de conjuntos difusos por variable.

En lo que respecta al tiempo de proceso, al aplicar esta condición de inicio: la etapa de entrenamiento se disminuyó en aproximadamente la mitad del número de épocas, aunque en algunos casos se encontró hasta tres veces menos tiempo necesario para llevar a cabo el entrenamiento.

Para observar el comportamiento del FSGD, utilizando pesos de las reglas con valor constante de 0.5 y con valor promedio relacionado a los datos de entrenamiento, se hizo la variante de identificar el comportamiento de un controlador ya existente aplicado a un péndulo invertido. En las etapas anteriores, aplicando FSGD, se utilizó la identificación o el control de sistemas utilizando datos provenientes del mismo sistema; sin embargo en este experimento se utilizará una tercer variante, la cual consiste en identificar el comportamiento de un controlador ya existente.

5.7. CONTROL DEL PÉNDULO INVERTIDO

En este experimento se aplicó la ventaja del presintonizudo de reglas difusus utilizando como caso de estudio el control del péndulo invertido, en donde se probará la capacidad del identificador difuso sintonizado con FSGD, para imitar el comportamiento de un controlador ya existente aplicado al péndulo invertido en configuración de control lazo cerrado. El objetivo que se tiene en este Último experimento consiste en extraer el conocimiento lingüístico de un controlador ya existente, en donde pudiera existir un operador humano actuando como controlador y se desea convertir su experiencia en conjuntos difusos y reglas que forman parte de un sistema difuso sintonizado por el método de gradiente descendente FSGD.

El objetivo del controlador es mantener lo más pequeño el ángulo del péndulo (mantenerlo vertical) sin considerar la posición del carrito. El controlador actúa como reguludor, ya que la referencia permanece constante S,, = O grados (considerados sobre la vertical), a diferencia de los experimentos de control utilizados en la sección 5.4 y 5.5, los cuales pertenen al tipo servo. Este controlador no puede ser tratado como los sistemas dinámicos de las secciones anteriores (con modelo inverso o con modelo de referencia), debido a que es una planta de tipo inestable, y por lo tanto, se tiene la necesidad de utilizar un controlador ya existente. Nótese que la salida del controlador es igual a la entrada de la planta

~

Sinlonizacidn de contmladores difusos basada en el metodo de gradiente descendente 5-36

Page 149: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 5 Conirol de sirremos dinhnicos uiilizando ldgico difidsa

y que las entradas del controlador son iguales a las salidas de la planta; por io que el controlador difuso obtenido del muestreo de la planta (péndulo invertido) representa ai controlador conectado a él, durante el muestreo de los datos de entrenamiento, por lo que indudablemente se imitará al controlador existente, sea éste bueno O malo.

Las características fisicas del péndulo invertido son: gravedad 9.8 m/s2, peso del carro 1 .O Kg, peso del péndulo 1 .O Kg, longitud del péndulo 1 .O m y peso del péndulo O. 1 Kg. Las variables observadas (ángulo y posición del carrito) y controlada (fuerza) se harán considerando la medición del ángulo sobre la vertical, manejando valores negativos a la izquierda de la vertical mientras que los ángulos positivos serán considerados a la derecha de la vertical. Para el caso de la fuerza aplicada al carrito del péndulo se hará considerándola positiva cuando se aplique de izquierda a derecha y negativa cuando se aplique de derecha a izquierda. La posición que guarda el carrito del péndulo respecto a la referencia será negativa cuando permanezca a la derecha de la referencia y positiva cuando permanezca a la izquierda de la referencia. Los signos para ángulos y fuerza se muestran en la figura 5.50.

e- e+

FIG. 5.50. Consideraciones en los sentidos para el ángulo y la fuerza del pkndulo invenido

5.7.1. Imitar un controlador difuso existente

El procedimiento para imitar el controlador difuso ya existente, controlador difuso de la herramienta f i q v toolbox del paquete de simulación matemática Muflub, consiste en muestrear cada 0.1 seg a partir de cuatro condiciones iniciales del péndulo invertido -0.8, -0.6, 0.6 y 0.8 radianes en el ángulo, esperando hasta que el controlador ya existenfe logre controlar el péndulo (aproximadamente 6.0 segundos de simulación). El total de datos de entrenamiento recolectados fueron 244 datos, muestreando las variables ángulo 8 y velocidad angular 8’ las cuales se observan en la figura 5.5 1.

5-37 Sintonización de controladores difusos basada en el método de gradientc descendente

Page 150: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

401 20 O O

O

-40

O 0.5 1

FIG. 5.51. Datos de entrenamiento (círculos al centro de la figura) muestreados sobre las variables ángulo y velocidad angular del péndulo invertido.

La fígura 5.51 muestra una distribución de datos de entrenamiento con un comportamiento no lineal, en la cual se observa que se aplica una fuerza mayor en los ángulos grandes (positivos y negativos) y una fuerza menor en la zona cercana a la estabilidad (theta = O y theta' =O).

Empleando un número de conjuntos difusos por variable NCONJ= [4 41 y, realizando una etapa de entrenamiento de 100 épocas se obtuvo un error EC = 0.0437 (un error promedio por dato de 1.79 x 1 04). La variante utilizada como condición inicial en los pesos de las reglas fué usando el presintonizado de /as reglas difusas. La superficie de control obtenida por el sistema difuso después del entrenamiento se muestra en la figura 5.52.

O

- 0.5 '-0.5 o

theta

FIG. 5.52. Datos de entrenamiento (circulos al centro de la figura) cubiertos por la superficie de control generada por el sistema difuso despues de la etapa de entrenamiento.

Sintonimcih de wntmladores difusos basada en el metodo de gradiente dexondente 5-38

Page 151: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Conrrol de sistemas dinimicos uiilimndo I6ggico difusa Capitulo 5

La superficie logra cubrir adecuadamente los puntos de entrenamiento cercanos a la región estable, representada al centro de la figura, mientras que los puntos presentes en los extremos no se lograron cubrir adecuadamente.

Los conjuntos generados por FSGD después de la etapa de entrenamiento se muestran en la figura 5.53.

-1 -0.5 O 0.5 1 theta

theta’

FIG. 5.53. Situación final de los conjuntos difusos para las variables de entrada theta y theta’.

Los conjuntos c2 y c3 en la variable theta (ángulo del péndulo) se acercaron entre sí, con el objeto de llevar a la región estable, en forma más fina, el valor del ángulo; mientras que los conjuntos de la variable theta’ (velocidad angular) no resultaron modificados en forma significativa.

La variación de la medida de error EC en el transcurso de 100 épocas de entrenamiento se muestra en la figura 5.54.

O 20 40 60 80 100 bpoca

FIG. 5.54. Valor de error EC en el transcum de 100 épocas de entrenamiento

5-39 Sintonización de cnnmladorcs difusos basada en el meiodo de gradiente descendente

Page 152: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

La variación del error EC se muestra monótona decreciente, logrando llegar a un valor bajo de error EC y por lo tanto a un buen nivel de identificación del control del péndulo inveitido. Aunque la medida de error es un buen indicador de la convergencia de la identificación, finalmente las pruebas de simulación muestran la operación final del sistema difuso, encontrándose en algunas simulaciones que no por conseguir un valor bajo de EC, resulta una buena identificación.

Además de la situación final del sistema difuso, representada por el valor de error EC y la superficie de control; un punto importante para analizar es la variación que poseen los parrlnetros sintonizados por el método de @diente en el transcurso del proceso de entrenamiento. la, la siguiente sección se hace un análisis en los centros y bases de los conjuntos, así como en los pesos de las reglas del sistema. La variación de los centros a, de los conjuntos difusos respecto a su valor inicial, para la variable 6 durante 100 épocas de entrenamiento se muestra en la figura 5.55.

I I

- centro ai centro a2 centro a centro a ---

FIG. 5.55.

I I O 20 40 60 80 100

&Jm Variación respedo a su valor inicial de los centros de los conjmtos difusos para la enfmda 8.

variable de

La variación en los centros de los conjuntos difisos para la variable de entrada O’, respedo a su valor inicial se muestra en la figura 5.56.

0.031 I

-0.03 O 20 40 60 80 100

epoca FIG. 5.56 Variación respecto a su valor inicial de los ceniros de los conjuntos difusos para la variable de a ihda 6 ’.

5-40 SmtonizaOái de contxoladores difusas basada ai el maodo de Badiaite descaidmte

Page 153: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

capítulo 5 Control de sisfsremhr dinámicos utilizondo 16gico difusa ,

Las variaciones en los centros no parecen estandrse a partir de cierta época, sin embargo su variación es de tipo suave y no suceden cambios abruptos. Aunque en el caso de la variable ángulo el comportamiento de los centros de los conjuntos no sufrió cambio de signo, en elcaso de !a velocidad angular sucede un cambio de signo antes de la,époq 20.

La figura 5.57 muestra la variación de las bases dd los conjuntos triangulares para la 1

/ ’ i 1

variable de entrada 0 a partir de su posición inicial.

FiG. 5.57. Variación de las bases de los conjuntos difusos para la variable de entrada O.

La vanación en las bases de los conjuntos tnan&lares para la variable velocidad angular e’, se muestra en la figura 5.58. I

i . I 1.345

1.34- !

----_base bs base& --- base bs

^^-

I

1.32 ’ 1 O 20 40 60 80 i. 100

6pocs

FIG. 5.58. Variación de las bases de los conjuntos difusos para I la vanable de entrada O’.

! 1 I

5-41 Sintonización de d o l a d o r e s dihisos basada en el m(todo de sadieite descaidente

Page 154: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 5 Conrrol de s i s r e m s dinámicos uri1i:ando lógica d$so

La variación de estos parámetros también tuvo un comportamiento suave, mostrando un cambio de signo únicamente para el casa de la variable velocidad angular. En ninguno de los cuatro casos de bases y centros se mostró una tendencia a permanecer en un cierto valor final, sino que continúan modificando sus valores conforme aumenta el número de épocas de entrenamiento; sin embargo, el criterio de paro, en nuestra identificación, es el valor de er ror EC respecto a los datos de entrenamiento y no la situación de ausencia de movimiento en los parámetros. Se encontró una variación máxima aproximada de casi O. 15 unidades para el caso de las bases de la variable ángulo, mientras que para el resto de parámetros la variación fué pequeña.

La variación respecto ai valor inicial w,,,= promedio y r en el conjunto de las 16 reglas que componen el controlador difuso se muestra en la figura 5.59.

O ..

O 20 40 60 80 1 O0 época

FIG. 5.59. Variación de los pesos de las 16 reglas del controlador difuso respecto su valor inicial iv,,;=promedio yr.

Se observó un buen comportamiento (no oscilatorio, ni con cambios bruscos) en la variación de los pesos de las 16 reglas, notando además que la variación máxima encontrada no superó las 0.2 unidades, a diferencia de la variante con wini = 0.5 en donde se encontraron variaciones del orden de 0.5 unidades. El movimiento de los parámetros fué más suave comparado contra las variaciones encontradas en la variante con win¡ =0.5.

Las conclusiones que se encontraron durante este experimento fueron una mejora en el tiempo para sintonizar el sistema difuso y una disminución de la variación de los parámetros en más de un 50% respecto al método de sintonización que comienza los pesos de las reglas con wiili= 0.5.

Los movimientos, respecto a los valores iniciales de los centros y bases de los conjuntos difusos, así como de los pesos de las reglas del sistema difuso, mostraron una tendencia suave al modificarse por el método de gradiente descendente. Los cambios más bruscos fueron llevados a cabo durante las primeras épocas de entrenamiento,

5 4 2 Sintonización dc controladorer difusos basada en el m h d o de gradicnte descendente

Page 155: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

aproximadamente hasta la época 20, en donde se encontraron desde cambios de signo, hasta cambios demasiado abruptos y pronunciados; sin embargo al transcurrir el número de épocas, el movimiento a los parámetros resulta cada vez más suave y con tendencia a estabilizarse hacia un valor final.

Las pruebas de simulación, en general son las que muestran el comportamiento adecuado o deficiente de la aproximación difusa. De forma tal que se sustituye el controlador existente por la identificación difusa y se aplica una condición inicial diferente a las utilizadas durante la etapa de entrenamiento, con objeto de evaluar la capacidad de generalización del sistema difuso a entradas desconocidas. El valor inicial del ángulo del péndulo con 0.9 rad y su estabilización al aplicar el controlador a lazo cerrado durante 6.0 segundos de simulación se muestra en la figura 5.60.

FIG. 5.60. Variación del ángulo a partir de un valor de 0.9 radianes: a) con el controlador difuso identificado y .b) con el controlador existente.

Existe una gran semejanza en la evolución del ángulo del péndulo, a partir de una condición de 0.9 rad, entre las acciones de ambos controladores.

La fuerza (acción de control) necesaria para llevar al péndulo invertido a una posición de equilibrio empleando el controlador obtenido y el controlador ya existente se muestra en la figura 5.61.

543 Sintonizaci6n de coniroladores difusos basada en el metodo de gradiente descendente

Page 156: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Control de ~istemar dimimicos utilirondo lógico difuso Capitulo 5

a) b)

FIG. 5.61. Acción de control (fuerza) aplicada al péndulo invertido para llevarlo a una posición de equilibrio: a) con el controlador difuso identificado y b) con el controlador existente.

Aproximadamente desde los 3.0 segundos de simulación, los controladores logran llevar a un valor de 0.0 rad el ángulo del péndulo, mostrando semejanzas entre las dos acciones de control.

El comportamiento del valor del ángulo del péndulo desde una posición inicial de e,", = -0.3rad. al aplicar el controlador identificado se muestra en la figura 5.62.

FIG. 5.62. Variacibn del ángulo del pendulo a partir de un valor de -0.3rad aplicando: a) el controlador difuso identificado y b) controlador existente,

En esta condición de inicio se observa que el controlador obtenido con FSGD no realiza cambio de signo en el péndulo invertido; sin embargo, el controlador ya existente oscila hasta aproximadamente 0.15 rad para llevar al péndulo a una situación de estabilidad,

La fuerza (acción de control) necesaria para llevar al Hndulo invertido a una posición de equilibrio se muestra en la figura 5.63.

Sintonizaci6n de controladores difusos basada en el metado de gradiente descendente 5-44

Page 157: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 5 Control de sislemos dinimicos itti1i:ando Iógica d@sa

O 1 4 5 t(sesl O 1 4 5

a) b)

FIG. 5.63. Acción de control (fuerza) aplicada al péndulo invertido para llevarlo a una posición de equilibrio: a) empleando el controlador difuso identificado y b) empleando el controlador ya existente.

Se observa una diferencia notable, entre ambos controladores, en la cantidad de fuerza aplicada al carrito para llevar el péndulo a una situación de equilibrio. Encontrándose que el controlador difuso identificado con FSGD necesitó menor cantidad de tiempo y de fuerza para llevar al péndulo a una situación de equilibrio respecto al controlador ya existente. Este comportamiento proviene de haber identificado un controlador de cuarto order? mediante un controlador difuso de segundo orden; ya que el controlador ya existente además de controlar el ángulo también controla la posición del carrito, mientras que el controlador difuso identificado tan solo controla el ángulo. Otro punto que influye en la diferencia en el comportamiento consistió en haber efectuado una etapa de generalización en donde se aplican condiciones de inicio d i jknres a las que se observaron durante el entrenamiento.

Este experimento permitió evaluar la capacidad del FSGD pa ra imitar un controlador existente a partir de muestras de datos tomadas del controlador, en donde el controlador puede ser un controlador convencional, o bien un operador experto humano. El objetivo es obtener el conocimiento lingüístico por medio de los conjuntos difusos y las reglas del sistema difuso. Una desventaja de esta variante es que el controlador identificado depende de lo bueno o malo que sea el controlador a identificar. En este caso, se encontraron buenos resultados al hacer la extracción de conocimiento del controlador ya existente, debido a que el controlador a identificar era de buena calidad, logrando mejorar al controlador ya existente en algunas ocasiones.

Se sigue encontrando el problema del tiempo de muestreo, se debe de tener cuidado con este parámetro, el cual resulta ser un parámetro de usuario, unas pocas reglas de dedo ayudarán a encontrar un buen valor a considerar.

A diferencia de los datos de entrenamiento obtenidos de un controlador difuso (no lineal) que se muestran en la figura 5.51, un controlador convencional del tipo PID con parametros Kp=25, &=0.5 y Ki=O genera los datos que se muestran en la figura 5.64.

Sintonizacibn de controladarcs difusos basada en el m6todo de gradiente descendente 5-95

Page 158: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

- . - --

201 10

FIG. 5.64. Datos de entrenamiento (clrculos al centro de la figura) muestreados de un control PID en las variables ángulo y velocidad angular del péndulo invertido.

Como se puede observar la superficie necesaria para capturar los datos de entrenamiento consiste en un plano, lo cual muestra que un controlador del tipo PID produce una superficie de control de tipo lineal. Esta superficie de control puede ser aproximada fácilmente utilizando dos conjuntos en cada una de las variables de entrada.

5.8. CONCLUSIONES

En este capítulo se reportaron buenos resultados al efectuar experimentos de identificación y control sobre plantas de primer orden lineal, de segundo orden lineal y de primer orden no lineal utilizando el método de sintonización de sistemas difusos basado en el método de gradiente descendente FSGD. El método tiene la capacidad de resumir el comportamiento, a partir de un conjunto de muestras tomadas de un sistema, en un sistema difuso, manteniendo las propiedades de utilizar información lingüística en las reglas difusas, las cuales relacionan conjuntos difusos en sus antecedentes.

Esta metodología tiene la ventaja de sintonizar tanto la base de conjuntos difusos como la base de reglas del sistema, a partir de un valor inicial, aunque también existe la posibilidad de comenzar con información de posición y anchura de los conjuntos difusos triangulares, o bien con reglas lingüísticas que contengan información del comportamiento del sistema a identificar o del controlador. Esta característica no fue empleada en ninguno de los experimentos de identificación o control, sin embargo, es posible utilizar información a priori como condición inicial del sistema difuso.

Sinloniracibn de controladom difusos basada en el metodo de gradiente descendente 5 4 6

Page 159: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 5 Control de sisternos dinimicos uiilirondo &icu diJLsa

EI tiempo de muestre0 representó un parámetro crucial para lograr el éxito 0 fracaso, tanto en el proceso de identificación como en el de control, mostrando mayor relevancia durante el proceso de la identificación inversa de sistemas (control mediante modelo inverso). El valor a considerar como tiempo de muestreo, al momento de obtener los datos, para aplicar el proceso de entrenamiento, representa un parámetro de usuario al cual no es posible sintonizar mediante esta metodología, aunque el proceso de obtención de su valor no resulta complicado.

En la elección del orden del sistema a identificar o controlar, se considera pertinente que la respuesta a un escalón es una guía fácil para suponer un posible orden. Si la respuesta de la planta no genera oscilaciones ni sobretiro, indudablemente la planta pertenece al grupo de plantas de primer orden, salvo el caso de un sistema de segundo orden sobreamortiguado; y si la respuesta provoca oscilaciones y sobretiro puede pertenecer a un sistema de segundo o de mayor orden. Las aproximaciones de sistemas de orden tercero y mayor pueden lograrse mediante aproximaciones a un sistema de segundo orden, lo cual es aceptable obteniendo sistemas difusos de pocas variables de entrada y por lo tanto de pocos parámetros.

La cantidad de conjuntos a emplear para lograr la identificación o el control de sistemas dinámicos va directamente relacionado con la característica de linealidad o no linealidad presente en el sistema dinámico. Asi, mientras que utilizar dos conjuntos difusos por variable resulta suficiente para el caso de sistemas lineales, los sistemas dinámicos no lineales requieren de mayor cantidad de conjuntos para lograr atrapar las no linealidades presentes en su comportamiento. De esta manera, una sugerencia al considerar la cantidad de conjuntos difusos, necesarios para la identificación o el control de sistemas dinámicos, puede ser comenzar con dos conjuntos por variable de entrada y dependiendo de la medida de error, obtenida durante la etapa de entrenamiento, si resulta un valor grande, aumentar el número de conjuntos por variable en forma progresiva.

La siguiente guia en la elección del número de conjuntos es observar la posición final que guardan los conjuntos difusos entre si, algunas veces se observan conjuntos muy unidos, lo que puede indicar que sale sobrando uno de ellos, y puede probarse un número menor; otras veces se tienden a separar lo que pudiera indicar la necesidad de más conjuntos. Además se pueden realizar experimentos con un número par o impar de conjuntos y observar el comportamiento después de una etapa de entrenamiento, resultando esto también una guía para elegir la cantidad adecuada de conjuntos. Como conclusión acerca de la frase “a mayor número de conjuntos mayor precisión”, en las etapas de experimentación con FSGD aplicado a sistemas algebraicos y dinámicos, se observó que generalmente existe un iIúmero adecuado de co~tjz(?~tos dependiendo de la naturaleza del problema, y ai colocar núineros mellores o mayores a este, se provocan aproximaciones con mayor cantidad de error.

5-47 Sintonizacidn de controladores difusos basada en el metodo de gradiente descendente

Page 160: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capítulo

6

CONCLUSIONES

6.1. OBJETIVOS CUBIERTOS

Los controladores difusos permiten trabajar con conceptos, ya que utilizan etiquetas liiigüisticas en los conjuntos difusos (valores lingüisticos) y estos se relacionan entre si mediante reglas difusas de tipo lingüístico. Esta propiedad permite, a diferencia de los controladores convencionales, utilizar información del comportamiento del sistema proveniente de expertos humanos. Esto es una gran ventaja, sin embargo provoca que el controlador diseñado dependa de lo bueno o malo que resulte el experto humano.

Los controladores difusos convencionales no poseen un algoritmo de sintonización de sus parámetros (conjuntos difusos, reglas difusas del sistema y factores de escalamiento por citar algunos) y, analizando la problemática que acarrea la construcción de sistemas difusos y su alta dependencia del experto humano, se propuso coino objetivo de este tema de investigación lograr la automatización, en cierto grado, en el diseño de aproxiniadores basados en lógica difusa, logrando sistematizar dicho proceso. La metodología FSGD (sintonización de sistemas difusos basada en el método de gradiente descendente) seleccionada de entre un conjunto con capacidad de sintonización (llámese también adaptación o aprendizaje), tiene la caracteristica de sintonizar sistemas difusos de i7 entradas y una salida. Dicha metodología sintoniza tanto los conjuntos como las reglas del sistema, las cuales a nuestro parecer son los parámetros que poseen más dependencia del experto humano.

Page 161: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Conclusiones Capítulo 6

Los objetivos cubiertos durante el desarrollo de esta investigación fueron:

Emplear una metodología, seleccionada de la literatura, que auxilie en la construcción de controladores difusos. En este punto se resalta que, además de haber cubierto este objetivo, se realizaron modificaciones a la metodología ya existente pomura92], las cuales mejoraron el algoritmo original al conseguir: a) utilizar conjuntos difusos con grados de pertenencia formalizados dentro de la lógica difusa (grados de pertenencia en el intervalo [O,i]); b) mejor dirección en el proceso de actualización de los parámetros; c) una situación de inicio de los pesos de las reglas difusas más favorable y finalmente d) la obtención de 3 variantes extras en la forma de los conjuntos difusos: conjuntos con forma de campana de Gauss, conjuntos triangulares eslabonados con lado izquierdo y derecho diferentes y conjuntos triangulares independientes con lado izquierdo y derecho diferentes.

En la automatización del proceso de construcción de controladores difusos se llegó a un proceso semiautomático, ya que se sigue dependiendo de algunos puráinefros de usuario. El grado de automatización fué alto debido a que el método FSGD permite construir en forma automática la base de reglas del sistema difuso, así como los conjuntos difusos relacionados a éstas. Se considera que estos son dos de los componentes de un sistema difuso que requieren más esfuerzo al sintonizar en forma manual ayudándose de un experto humano. Otro paráinetro que se automatizó con esta metodología es el cálculo de las ganancias de entrada y salida del sistema difuso, las cuales se llevan a cabo utilizando los valores mínimos y máximos encontrados eii los datos de entrenamiento. Dichas ganancias se encargan de escolar los valores de las entradas en valores dentro del intervalo [ - I , I ] , mientras que los valores de salida se escalan en el intervalo [O, I].

Como caso de estudio final se planteó: el control del péndulo invertida, en el cual se consiguieron buenos resultados al controlar la variable ártgulo del péndulo invertido; sin embargo, pruebas más completas pudieran considerar también la posición del carro y la presencia de perturbaciones. El resto de casos fueron una variedad de plantas de primero y segundo orden durante la etapa experimental, los cuales son suficientes para cubrir las objetivos del tema de investigación.

Sinioiiizacion dc coniroladores difusos basada en el método de gradienle descendente 6-2

Page 162: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 6 Conclusiones

6.2. RESULTADOS OBTENIDOS

Las conclusiones a las que se llegó durante el desarrollo de este tema de investigación fueron:

8

. 8

8

8

La sintonización de un sistema difuso en la forma convencional resulta una tarea laboriosa y que depende, en gran medida, de contar con un experto humano que auxilie en su elaboración. Analizando y evaluando alternativas para obtener la sintonización en fonna automática, en cierto grado, de sistemas difusos se eligió la metodología de gradiente descendente. Esta metodología esta basada en [Nomura92], a la cual se le efectuaron modificaciones en los procesos de fusificación, sintonización de parámetros, asi como a la situación de inicio del sistema difuso. El producto final consistió de la implementación de una metodología que es capaz de sintonizar tanto los conjuntos como las reglas difusas, logrando una herramienta que auxilie en la elaboración de aproximadores difusos.

Como sucede en los sistemas difusos, los resultados obtenidos en nuestra sección de experimentación conservan el conocimiento lingüístico (mediante la interpretación por parte del usuario), a partir de las etiquetas de los conjuntos difusos y de la relación que guardan dichos conjuntos en las reglas del sistema.

Aunque en el desarrollo de nuestros casos de experimentación no se empleó nunca conocimiento a priori del comportamiento del sistema a identificar o controlar, nuestra metodología permite incluirla tanto en las condiciones iniciales como durante la sintonización. El utilizar información a priori al inicio de la sintonización puede ayudar a evitar caer en mínimos locales (u otras singularidades) y en acelerar el proceso de sintonización al comenzar desde una situación más favorable y dirigida. Se recomienda emplear la mayor cantidad posible de conociniieiito lingüístico del sistema a identificar o controlar para de esta manera mejorar la aproximación.

Esta metodología, respecto a las presentadas en el capítulo 2, utiliza pocos parámetros de usuario, siendo esta una de las razones por la que fué elegida. Entre los parámetros de usuario se encuentran: el número de conjuntos difusos a considerar en cada una de las variables de entrada, los valores de las ganancias de aprendizaje (también conocidas como paso de las ecuaciones de gradiente).

En este trabajo se utilizó el FSGD: a) para aproximar funciones de tipo algebraico, empleándose como interpolador de valores desconocidos de entrada; b) en la identificación de sistemas dinámicos y c) en la construcción de controladores difusos basados en estructuras de control modelo inverso y modelo de referencia. Es decir, tiene capacidad de poderse utilizar en diversas aplicaciones que utilicen, en general, la aproxiniación de datos numéricos mediante una función determinada, en nuestro caso, por un sistema difuso.

SintonizaciOn de controladores difusos basada en el método de gradiente descendeiite 6-3

Page 163: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Los valores de las ganancias de las reglas de aprendizaje (Ka, K b y K,) fueron de 3.0 en casi toda la etapa experimental encontrando resultados satisfactorios. Pueden emplearse valores más altos; sin embargo podrían causar que el error EC oscile alrededor de un mínimo local y no resulte favorable la aproximación.

En el caso del número de conjuntos difusos se encontró que para sistemas lineales es suficiente utilizar dos conjuntos por cada una de las variables de entrada del sistema difuso.,La característica de formar rectas y planos con sistemas difusos de una y dos entradas se muestra en el anexo B. En el caso de sistemas de tipo no lineal, una regla de dedo a seguir es comenzar con tres conjuntos por variable de entrada y realizar el proceso de sintonización, en caso de obtener un EC grande, incrementar el número.

Como ya se mencionó, la cantidad de conjuntos difusos en las variables de entrada del sistema difuso, es un parámetro de usuario y aunque no se logró encontrar un método sistemático para su selección, la metodología FSGD presenta en forma gráfica la situación final de los conjuntos después de la etapa de aprendizaje. De esta manera se puede observar alguna tendencia en la posición o forma de los conjuntos difusos finales. La paridad en el número de conjuntos tiene una gran importancia en la aproximación, pero depende del tipo de problema (ver secciones 3.5.1 a 3.5.4).

Otro resultado relacionado con el número de conjuntos difusos es la existencia de un número adecuado de conjuntos difusos, el cual depende del tipo de problema a ser aproximado y que no tiene que ver con: “a mayor número de conjuntos, mayor precisión” (ver sección 3.5.4).

Un paránietro de usuario propio del proceso de identificación y control de sistemas dinámicos es el tiempo de iitues/reo utilizado durante el proceso de obtención de los datos de entrenamiento. Este paráinetro afecta el proceso de sintonización debido a que, si los muestreos son inadecuados (sobremuestreos o submuestreos) se obtienen datos que no muestran el comportamiento real del sistema. En este punto se observa que el tiempo de miiestreo no es u n parátnetro tan crítico durante el proceso de identificación, como lo es durante el proceso de control (identificación inversa y modelo de referencia), en donde representa un punto importante del cual depende el éxito o fracaso del controlador. Se obtuvieron buenos resultados utilizando entre 2.5 y 25 muestras por constante de tiempo en el caso de plantas de primer orden y de 8 a 15 muestras por oscilación, como respuesta a la señal escalón, en plantas de segundo orden.

Los datos de entrenamiento son una parte primordial del proceso de siiitonización y durante la etapa experimental se observó que la sintonización se altera cuando se presentan repeticiones o la ausencia de datos en ciertas regiones o zonas. Uiia forma de solucionar estoo es intentar distribuir los datos de entrenamiento en todo el espacio de trabajo? lo cual se puede conseguir muestreando adecuadainente y aplicando una señal de excitación que distribuya los datos de entrenamiento lo

6-4 Sinroiiizacion de controladorer difusas basada en el mfioda de gradienie descendente

Page 164: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capitulo 6 Conclusiones

mejor posible. A diferencia de la identificación para sistemas lineales, a partir de un análisis de frecuencias, en donde la señal impulso o bien el escalón tienen preferencia por excitar más modos del sistema; nuestra metodología trabaja con la posición de los datos y no directamente con sus frecuencias, por lo que la mejor alternativa consiste en distribuir dichos datos lo mejor posible en nuestro espacio de trabajo. Las señales de excitación que se utilizaron en la mayoría de los experimentos por mostrar buenos resultados fueron la senoidal modulada en amplitud y la senoidal modulada en frecuencia (chirp).

La utilización del concepto núcleo de fransicióil de eslados permite trabajar directamente con las variables de estado del sistema. Con esta característica es posible realizar controladores basados en modelo inverso o modelo de referencia que tengan la capacidad de trabajar a Zazo cerrado, una propiedad deseada en la mayoría de sistemas de control de procesos.

6.3. LIMITANTES

La metodologia FSGD permite sintonizar sistemas difusos con un número 11 de entradas y una salida (sistemas MISO); sin embargo, existe una gran cantidad de plantas que utilizan más de una salida. La limitante de sintonizar sistemas de una salida no es propia de ésta metodología, sino una caracteristica de los sistemas difusos en general. En el caso de requerir sistemas difusos de más de una salida (sistemas MIMO), la solución consiste en utilizar en paralelo dos o más sistemas difusos según se requiera. Esto se traduce en más esfuerzo de sintonización, ya que en vez de sintonizar Únicamente un sistema difuso, se requerirá sintonizar, fuera de linea, a 171 sistemas difusos, uno por cada una de las salidas.

Una limitante propia de nuestra metodología FSGD consiste en utilizar un tipo de conjuntos en todo el sistema difuso. En esta investigación se desarrollaron tres variantes en coiijuntos difusos, pero no pueden combinarse entre sí dentro de una etapa de sintonización. No se hizo una evaluación exhaustiva de las tres variedades de conjuntos, pero en general, con los conjuntos triangulares de forma isósceles se obtuvieron mejores resultados, observando que contrario a la intuición, los sistemas difusos mostraban buenos resultados generando una salida de tipo continua suave (no formada por trozos de líneas).

La metodologia de gradiente posee la desventaja de caer eii mínimos locales, y u~ia solución a este respecto consiste en utilizar la mayor cantidad posible de coiiociiniento del comportamiento del sistema. Algunas otras metodologías de optimización de parámetros son: mínimos cuadrados, Newton-Raplison, Gauss-Newton y Levenberg-Marquardt; sin embargo requieren más capacidad de cómputo y el cálculo de derivadas de orden más alto (en el caso de las tres Últimas). Nuestras investigaciones se limitaron a gradiente descendente por el factor tiempo de elaboración del tema de investigación. A pesar de existir otros algoritmos de optiinización, se encontró que el método de gradiente posee la capacidad suficiente para sintonizar sistemas difusos en forma satisfactoria, tener simplicidad en los cálculos y ocupar pocos recursos computacioiiales.

6-5 Sintonizacion de controladores difusos basada en el meiodo de gradienre descendente

Page 165: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Capflulo 6 Conclusiones

Como punto final en las limitantes se menciona que se utilizó una metodología de tipo supervisada, y hasta el momento se trabajó fuera de línea en todos los experimentos; sin embargo esto no condiciona a que no pueda ser utilizada en línea.

6.4. TRABAJOS FUTUROS

Entre los planes a futuro contemplados con el algoritmo de sintonización de sistemas difusos empleando el método de gradiente descendente FSGD se tienen:

Aplicar la metodología FSGD en un sistema real. Entre nuestros alcances estuvo el trabajar con simulación de sistemas y, una buena prueba de la metodología consistiría en utilizar datos reales de una planta y trabajar en procesos de identificación y control. Así, bajo condiciones como ruido, obtención de variables usando filtros estimados y la presencia de huecos en el espacio de trabajo se probará la robustez y precisión del sistema difuso obtenido.

El trabajar con un conjunto completo de reglas provoca que se realice mayor cantidad de cálculos y, el tiempo de sintonización podría acelerarse trabajando con una versión de base de reglas reducida. Para lograr ésto, se deberá contar con un criterio para eliminar reglas, por citar algunos: ausencia de datos de entrenamiento o imposibilidad del sistema al no cumplir los antecedentes de la regla (limitaciones fisicas).

Los sistemas dinámicos que se trataron en ésta investigación consistieron en plantas sin retardo de primer orden lineal, una planta de primer orden no lineal, plantas de segundo orden lineal y el péndulo invertido; sin embargo, esto es tan solo una pequeiia variedad de plantas a las que puede ser empleado el FSGD. Futuras investigacioiies pueden tratar con sistemas más complejos tanto de mayor orden como con diversas no linealidades.

Continuar con las investigaciones relacionadas a la estructura de control basada en modelo de referencia. No se pueden realizar conclusiones contundentes al haber experimentado con un caso de experimentación y resultaría benéfico extender el número de experimentos.

Se plantea analizar el dominio del área de aplicación, dentro de sistemas dinámicos, del concepto iiúcieo de transición de estados, ya que en nuestra investigación fué empleado con éxito dentro de un grupo reducido de plantas. En este aspecto resultará necesario un análisis matemático para evaluar su alcance.

Investigar, además de las estructuras de control modelo inverso y modelo de referencia, nuevas estrategias de controí empleando el concepto de núcleo de transición de estados.

Sintonizacion de controladorer difusos basada en el método de gradienie descendente 6-6

Page 166: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Además de utilizarse en la identificación y control de sistemas dinámicos, se propone emplear esta metodología en problemas de reconocimiento de patrones en donde exista una continuidad entre los valores de entrada y salida.

Para terminar, se menciona la inquietud de lograr desarrollar la metodología para trabajar en línea y de esta manera motivar la continuación de investigaciones en el tema de lógica difusa dentro del área de control de procesos. Una propuesta consiste en utilizar una etapa previa de sintonización del controlador difuso y posteriormente su conexión en línea a la planta, conservando un conjunto de datos de entrenamiento anteriores y actualizando los datos paulatinamente con nuevos datos muestreados del proceso en línea.

6-7 Siiitoniracián de controladores difusos basada en el mitodo de gradiente descendente

Page 167: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Anexo

INFERENCIA EN UN SISTEMA DIFUSO EMPLEANDO REGLAS SUGENO

DE ORDEN CERO

A.1. UN EJEMPLO DE UN SISTEMA DIFUSO DE DOS ENTRADAS

Este anexo presenta un ejemplo del proceso de fusificación, inferencia y defusificación en un sistema difuso (con parámetros ya definidos) al aplicar un vector de entrada de tipo preciso.

Los operadores considerados para un sistema de dos entradas y una salida son:

fusificación:

I o de otra manera

Page 168: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Anexo A

cs

donde j = I ,2 , ..., nt número de antecedentes en la regla del sistema difuso, i = I ,2 ,,,., n número de reglas del sistema, a, representa el centro del triángulo para el conjunto ij, b, representa la base del triángulo para el conjunto i j : y

representa la variable de entrada a fusificar.

Inferencia: m

p i = A i I ( x j ) . A i , ( x , ) . . . . . A i , n ( ~ , ) = n. , = I Aij(xj) donde i=l,2, ... >i1 número de reglas difusas.

Defusificación:

1.01 2.0

(A-3)

El número de conjuntos difusos empleados para particioiiar a las dos variables de entrada XI y .y2 son NCONJ=[2 31. Los valores de los conjuntos difusos (centros y bases) se muestran en la tabla A. I .

TABLA A.l. Valores en los parameiros de los conjuntos difusos.

Con’unto Centro

-1.0 2.0

Una representación gráfica de los cinco conjuntos difusos se muestra en la figura A.1.

X I -1 -0.5 O 0.5 1

xz O -1 -0.5 O 0.5 1

FIG. A.l. Representación gráfica de los conjuntos difusos.

A-2

Page 169: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Anern A

Los valores )vi de las seis reglas del sistema difuso se muestran en la tabla A.2.

TABLA A.2. Valores en los parametros de las reglas difusas TABLA A.2. Valores en los parametros de las reglas difusas

I Regla I Conjunto I Conjunto I Peso I

La interpretación de las seis reglas del sistema utilizando los conjuntos y pesos wi es:

S i x l es c l y x2 es c3 entonces ~,=0.0609 S i x l esc2yx2esc3entoncesy0.1236 Si XI es cl y x 2 es c4 entoncesyO.1205 Si x l es c2 y x2 es c4 entoncesy=0.4116 Si XI es cl y x2 es c5 entoncesy-0.2009 Si XI es c2 y x2 es c5 entonces y=0.6864

AI utilizar como valores de entrada XI = -0.5 y x2 = 0.2 se obtienen los grados de pertenencia, calculados con la ecuación (A-l), que se muestran en la tabla A.3:

TABLA A.3. Grados de pertenencia A(xj) al aplicar un vecior de entrada [-OS. 0.21 en el sistema difuso

L a figura A.2 muestra los grados de pertenencia obtenidos al aplicar el vector de entrada [-0.5, 0.21 en el sistema difuso.

A-3

Page 170: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

-1 1 -0.5

- 8 -1 1

0.3

FIG. A.2. Grados de pertenencia al aplicar un vector de entrada al sistema difuso.

Calculando la inferencia (grado de disparo de la regla pi ) mediante la ecuación (3-2) se obtienen los resultados de la tabla A.4.

TABLA A.4. Cálculo de la inferencia a partir de los grados de pertenencia

Finalmente aplicando la defusificación, ecuación (A-3), se obtiene:

- - 0(0.0609)+0(0.1236)+ 0.6(0.1205)+0.15(0.4116)+ - 0.2(0.2009)+0.05(0.6864) -

O + O + 0.6 + 0.15 + 0.2 + 0.05 y = -

= 0.20854

La respuesta del sistema difuso como respuesta a un vector de entrada x=[-0.5, 0.31 es y=0.20854, el cual es un valor de tipo preciso. Las operaciones necesarias para obtener el valor de salida consistieron en sumas, multiplicaciones, divisiones y comparadores.

Page 171: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Anexo

ANÁLISIS DEL EMPLEO DE DOS CONJUNTOS POR VARIABLE DE ENTRADA

B.1. SISTEMAS DIFUSOS DE UNA ENTRADA

Se realizo el análisis matemático de sistemas difusos de una entrada y una salida que emplean reglas de tipo Sugeno orden cero para encontrar el tipo de funciones de salida que son capaces de formar. El primer análisis se lleva a cabo considerando la zona de traslape de los dos conjuntos, el cual puede aplicarse a cada par de conjuntos; en el caso de existir un solo conjunto, el resultado del sistema difuso es el peso w, de su regla relacionada.

Los operadores necesarios para calcular la salida del sistema difuso son los siguientes

Fusificación 2jx -u, ~

A , ( x ) = 1 - ~ ' ; i=1,2 b ,

Inferencia P; = A t (4

Defusificación

Page 172: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Anexo B

El total de conjuntos del sistema difuso son dos CI y C2, al igual que el número de reglas del sistema, en donde cada conjunto es el antecedente de cada una de ellas, como se muestran a continuación:

regla 1: S i x e s C I en toncesy=w regla 2: S i x es C2 entoncesy = w2

Considerando que el conjunto CI se encuentra a la izquierda del conjunto C2, el valor absoluto en el cálculo de los grados de pertenencia para los dos conjuntos se convierte en:

Sustituyendo las ecuaciones (B-4) y (B-5) en las ecuacioiies (8-2) y (B-3) y analizando el término resultante en el denominador encontramos:

Evaluando y agrupando términos comunes resulta:

El denominador posee un término afectado por la variable independiente x, el cual puede se cancela cuando b1=b2, resultando el denominador un término constante. Para valores de bl y b2 muy cercanos el término en x resulta casi despreciable, mientras para valores muy diferentes en bl y b2 permanece un término afectado por la variable independiente x. Debido a que el término p, es una constante, encontramos que el resultado del numerador de la ecuación (B-3) representa la función afectada por la variable independiente x, mientras que el denominador representa solamente un escalar.

2

,=I

Realizando el análisis para el caso del numerador encontramos:

B-2

Page 173: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Anexo B

Evaluando y agrupando términos comunes resulta:

La ecuación de una recta en el formato general es: y = 7nx + b, donde m representa la pendiente de la recta y b el punto donde la recta intersecta el eje de las ordenadas. Haciendo la semejanza respecto a la ecuación (8-6) encontramos todos los términos.

La conclusión a la que llegamos haciendo el análisis de un sistema difuso de una entrada, usando reglas de tipo Sugeno de orden cero, con valores iguales en las dos bases de sus conjuntos triangulares, es que posee la capacidad de representar la función de una recta, a partir de la relación entre sus parámetros: centros a,, bases b, y pesos de las reglas TI),, Para el caso de valores de bases diferentes, el sistema difuso es capaz de formar funciones racionales.

A continuación se presentan ejemplos para diferentes valores en las bases de los conjuntos.

0.5

-1 -0.5 O 0.5 1 -1 -0.5 O 0.5 1 X X

b) b)

FIG. B.l. Respuesta del sistema difuso utilizando a,=], a+], b,=b2=4, w,=O y w,=l. a) Salida del sistema difuso, b) conjuntos difusos resultantes. difusos resultantes.

FIG 6.2. Respuesta del sistema difuso utilizando a ,=l , az=+l, b,=6, b2=2, w,=O y wz=O. a) Salida del sistema difuso, b) conjuntos

Page 174: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

REFERENCIAS B I BLI OGRÁFI CAS

[Altrock92] C. von Altrock, B. Krause and H. J. Zimmermann, “Advanced fuzzy logic control technologies in automotive applications”, IEEE International Conference on Fuzzy Systems, March 8-12, 1992, San Diego, California, 1992, pp. 835-842.

[Antsaklis94] Paiios Antsaklis, Chair, “Defining Intelligent Control, report of the task force on intelligent control”, IEEE ControlSystents, vol. 14, no. 3, June 1994, pp. 4, 5, 58-66.

[Braae79] M. Braae and D. A. Rutherford, “Theoretical and linguistic aspects of the fuzzy logic controller”, Automática, vol. 15, 1979, pp. 553-557.

[Burkhardt92] David G. Burkhardt and Piero P. Bonisone, “Automated f u u y knowledge base generation and tuning”, Proceedings IEEE International Conjerence on Fuzzy Systems, San Diego, California, March 1992, pp. 179-188.

[Castillo98] Rodolfo Castillo Romero, José Ruiz Ascencio, “Construcción automática de aproximadores difusos mediante la sintonización de sus parámetros utilizando el método de gradiente descendente”, Memorias del Simposium Internacional en Computación CIC’98, instituto Politécnico Nacional IPN, México, D.F., noviembre de 1998, pp. 418-425.

[Cleland92] John Cleland et. al., “Fuzzy logic control of ac induction motors”, IEEE International Conference on Fuzzy Systems, March 8-1 2, 1992, San Diego, California, 1992, pp. 835-842.

Page 175: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Referencias bibliograficas

[Chen94] Raymond L. Chen and Costas J. Spanos, “Self-learning fuzzy modeling of semiconductor processing equipment”, Fuzzy Logic Technology and Applications, IEEE Technical Activiiies Board, 1994, pp. 267-273.

[Daugherity92] Walter C. Dauglierity and Balaji Ratliakrishnan and John Yen, “Performance Evaluation of a Self-Tuning Fuzzy Controller”, Proceedings IEEE International Corlference on Fuzzy Systems, San Diego, California, March 1992, pp, 389-397.

[Egusa92] Y o Egusa, Hiroshi Akahori, Atsushi Morimura and Noboru Wakami, “An electronic video camera image stabilizer operated on fuzzy theory”, IEEE International Conference on Fuzzy Systems, March 8-1 2, 1992, San Diego, California, 1992, pp. 835-842.

[Fei92] Jian Fe¡ and Can Isik, “Adaptive fuzzy control via modification of linguistic variables“, Proceedings IEEE International Conference on Fuzzy Systems, San Diego, California, March 1992, pp. 399-406.

[Gámez98] Carlos Alfonso Gámez Carrillo, Coiistruccián automática de reglas en razonamiento inductivo difuso, TESIS DE MAESTRíA, Centro Nacional de Investigación y Desarrollo Tecnológico, Cuernavaca, Morelos, diciembre de i 998.

[Garcia971 Carlos Daniel Garcia Beltrán, Control digiialpara unidades turbogas, TESIS DE MAESTRíA, Centro Nacional de Investigación y Desarrollo Tecnológico, Cuernavaca, Morelos, febrero de 1997.

[Hernández97] José Juan Hernández Mora, José Ruiz Asceiicio, “Control de .un manipulador planar rígido, mediante una red neuronal holográfica”, Meniorias del primer Simposio Internacional en Tecnologías Inteligentes, Instituto Tecnológico de Apizaco, Tlaxcala, junio 1997, pp. 55-64. . ’

[Hou94] Sheng-Lu Hou and N. Lawrence Ricker, “Minimization of combined sewer overflows using fuzzy logic control”, IEEE Technical Activities Board, 1994, pp. 253-260.

[Ishigame921 Atsushi Ishigame, Tomoyuki Ueda, Shunji Kawamoto, Tsuneo Taniguchi and Masahiro Kikuta, “Design of electric power system stabilizer based on fuzzy control theory”, IEEE International Conference on Fuzzy Systems, March 8-12, 1992, San Diego, California, 1992, pp. 835-842.

[Ivakhnenko78] A G . Ivaklinenko et. al., “Principle versions of the minimum bias criterion for a model and an investigation of their noise immunity”, Soviet Automat. Control l I , 1978, pp. 27-45.

[Kosko92] Bart Kosko, Neural Networks and Fuzzy Systems, PRENTICE HALL, Englewood Cliffs, N.Y., 1992, pp. 346-347.

R-2

Page 176: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Referencias bibliográficas

[Kosk093] Bart Kosko, Fuzzy thitJkingc The >Jew science of fuzzy logic: First Edition, Hyperion, New York, 1993, pp. 184-193.

[Lee901 Chueii Chien Lee, “Fuzzy logic in control systems: fuzzy logic controller - Part I”, IEEE Transactions on systems, man and cybernetics, vol. 20, no. 2, March 1990, pp. 404-418.

[Maeda90] Mikio Maeda and Takeo Sato and Shuta Mirakami, “Design of the self-tuning fuzzy controller“, Proceedings of the international Conference on Fuzzy Logic and Neural Nehvorks, July 1990, pp. 393-396.

[Meier92] R. Meier, J . Nieuwland, S. Hacisalihzade, D. Steck, A. Zbinden, “Fuzzy control of blood pressure during anesthesia with isoflurane”, IEEE International Conference on Fuzzy Systems, March 8-12, 1992, San Diego, California, 1992, pp, 835-842.

[Mugica95] Francis0 Mugica Álvarez, Disefio sistemático de confroladores difusos usando razonan~iento inductivo, TESIS DOCTORAL, Universidad Politécnica de Cataluiia, Barcelona, Espalia, marzo 1995, pp. 147-162.

Parendra901 Kumpati S. Narendra, and Parthasarathy Kaniian, “Identification and control of dynainical systems using neural networks”. IEEE Traf~sactioiis OIJ neural iJehi,orks, vol. I , no. I , March 1990, pp. 4-27.

marendra9 I ] Kumpati S. Narendra, and Parthasarathy Kannaii, “Gradient methods for the optimization of dynamical systems containing neural networks”, IEEE Transactions on neural nehvorks, vol. 2, no. 2, March 1991, pp. 252-262.

[Nomura92] Hiroyoshi Nomura, and Isao Hayashi and Noboru Wakami, “A learning method of fuzzy inference rules by descent method”, Proceedings IEEE International Conference on Fuzzy Systems, San Diego, California, March 1992, pp. 203-2 I O.

[Pedrycz93] Witold Pedrycz, Fuzzy control and fuzzy systems, second, extended, edition, 1993, pp. 103-105.

[Pereira92] C.A. Pereira, V.K. Prabhulla Chandran and Urna Krishnan, “Precision control of refinery feed-heater temperature using fuzzy algorithm”, IEEE Infernational Conference on Fuzzy Systems, March 8-12, 1992, San Diego, California, 1992, pp. 835-842.

[Rumelhart861 D. Rumelhart, G. Hinton and R. Williams, “Learning representations by backpropagating errors”, Nature, 323, 1986, pp. 533-536. Reimpreso. en el texto “Parallel Distributed Processing: Explorations in the microstructure of cognition”, vol. 1, D. Rumelhart and J. McClelland ed., MITPress, 1986, pp. 318-362.

[Shenoi95] Sujeet Shenoi and -Kaveh Ashenayi and Marc Timmerman, “Implementation of a learning fuzzy controller”, IEEE Control Systems, vol. 15, no. 3, June 1995, pp. 73-80.

R-3

Page 177: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Referencias bibliográficas

[Espinoza98] Sócrates Espinoza Salgado, Sistema de control de agua de álimentación basado en lógica dijiusapara reactores nucleares de agua hirviente, TESIS DE MAESTRíA, Centro Nacional de Investigación y Desarrollo Tecnológico, Cuernavaca, Morelos, septiembre de 1998. . .

[Takagi94] Hideyuki Takagi, “Application of neural networks and fuzzy logic to consumer products”, Fuzzy Logic technology and applications,’lEEE Technical Activities Board, 1994, pp. 8-12.

[Tanaka941 Tanaka, Kázuo and Sano, Maiiabu and Watanabe, Hiroyuki, “Identification and analysis of fuzzy model for air pollution - An approach to self-learning control of CO concentration-, Proceeding frizzy logic technolog): and applications, JEEE Technical Activities Board, 1994, pp. 261 -266.

[Taiii94] Tetsuji Tani, Shuiiji Murakoshi, Tsutomu Sato, Motohide Umano and. Kazuo Tanaka, “Application of neuro-fuzzy hybrid control systein to tank level control”, IEEE Technical Activities Board, 1994, pp. 247-252.

[Wang92] Li-Xin Wang, “Sta6le adaptive fuzzy control of nonlinear systems”, Proceedings of the 31” conference on decision and controI, Tucson, Arizona, December 1992, pp. 251 1-2516.

[Wang92a] Li-Xin Wang, “ F y z y systems are universal aproximators”, Proceedings IEEE Jnteniational Conference 0 1 1 Fuzzy Systei7is, San Diego, California, 1992, pp. 1163-1 170.

[Wang92b] B.H. Wang and G. Vachtsevanos, “Learning Fuzzy Logic Control: An Indirect Control Approach”, Proceedings JEEE InIernational Conference on F‘iizqv System, San Diego, California, March 1992, pp. 297-304.

[Yale971 Karla Yale, “Preparing the right data diet for training neural networks”, IEEE Specfruiii, March 1997, pp. 64-66. .

I

Page 178: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

B I B LI OG RAF íA G EN ERAL

Altrock, C. von and Krause B. and Zimmermaiiii H. J., “Advanced fuzzy logic control technologies in automotive applications”, lEEE International Conference on Firzzy Systems, March 8-12, 1992, San Diego, California, 1992, pp. 835-842.

Antsaklis, Panos J., “Intelligent Learning Control”, IEEE Control Systems, June 1995, pp. 5-7.

Braae, M. and Rutherford, D. A,, “Theoretical and linguistic aspects of the fuzzy logic controller”, Automática, vol. 15, 1979, pp. 553-557.

Burkhardt, David G. and Bonisone, Piero P., “Automated fuzzy knowledge base generation and tuning”, Proceedings IEEE International Conference on Fuzzy Systems, San Diego, California, March 1992, pp. 179-188.

Canales Ruiz, R. y Barrera Rivera, R., Análisis de sistemas dinámicos y control automático, Limusa, México, 1980, 517 p.

Castro, J. L., “Fuzzy Logic Controllers are Universal Approximators”, IEEE Transactions on Systems, Man, andcybernetics, vol. 25, no. 4, April 1995.

Castillo Romero Rodolfo, Ruiz Ascencio José, “Construcción automática de aproximadores difusos mediante la sintonización de sus parámetros utilizando el método de gradiente descendente”, Memorias del Simposium Internacional en Computación ClC’98, Instituto Politécnico Nacional IPN, México, D.F., noviembre de 1998, pp. 41 8-425.

Page 179: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Bibliografia general

Cleland, John et. al., “Fuzzy logic control of ac induction motors”, IEEE International Coiference on Fuzzy Systenis, March 8-12, 1992, San Diego, California, 1992; pp. 835-842.

Clien, Raymond L. and Spanos, Costas J., “Self-learning fuzzy modeling of semiconductor processing equipment”, Fuz? Logic technology and applications, IEEE Technical Activities Board, 1994, pp. 267-273.

Daugherity, Walter C., Rathakrishnan, Balaji and. Yen, John. “Performance Evaluation of a Self-Tuning Fuzzy Controller”, Proceedings IEEE International Corference on FUiT Systeins, San Diego, California: March 1992, pp. 389-397.

Egusa, Yo and Akahori, Hiroshi and Morimura, Atsushi and Wakami, Noboru, “An electronic video camera image stabilizer operated on fuzzy theory”, IEEE International Conference on Furry Systerns, March 8-1 2, 1992, San Diego, California, 1992, pp. 835-842.

Fe¡, Jian and Isik, Can, “Adaptive fuzzy control via modification of linguistic variables”, Proceedings IEEE International Conference on Fuzzy Systeins, San Diego, California, March 1992, pp.399-406.

Gámez Carrillo, Carlos Alfonso, Construcción autoniática de reglas e17 razonaniiento inductive difuso, TESIS DE MAESTRíA, Centro Nacional ,de Investigación y Desarrollo Tecnológico, Cuernavaca, Morelos, diciembre de 1998, 120 p.

Garcia Beltrán, Carlos Daniel, Control digital para unidades turbogas, TESIS DE MAESTRíA, Centro Nacional de Investigación y Desarrollo Tecnológico, Cuernavaca, Morelos, febrero de 1997.

Hernández Mora, José Juan y Ruiz Ascencio, José, “Control de un manipulador planar rígido, mediante una red neuronal holográfica”, Meinorias del printer Sinposio Iniernacional en Tecnologías Inteligentes, Instituto Tecnológico de Apizaco, Tlaxcala, junio 1997, pp. 55-64.

Hou, Sheng-Lu and Lawrence Ricker, N., “Minimization of combined sewer overflows using fuzzy logic control”, IEEE Technical Activities Board, 1994, pp. 253-260.

Hunt, K. J. and Sbarbaro D. and Zbikowski R. and Gawthrop P. J., “Neural Networks for Control Systems - A survey”, pp. 1083-1 109.

Ishigame, Atsushi and Ueda, Tomoyuki and Kawamoto, Shunji and Taniguchi, Tsuneo and Kikuta, Masahiro, “Design of electric power system stabilizer based on fuzzy control theory”, IEEE International Conference on Fuzzy Systeins, March 8-12, 1992, San Diego, California, 1992, pp. 835-842. I

BG-2

Page 180: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Bibliogafia general

Ivakhnenko, A.C. et. al., “Principle versions of the minimum bias criterion for a model and an investigation oftheir noise immunity”, Soviet Autontaf. Control 11, 1978, pp. 27-45.

Klir, George J. and Yuan, Bo, Fuzzy sets andfuzv logic theory and applicatioits, Prentice Hall PTR, 1995,574 p.

Kosko, Bart, Neural Networks and Fuzzy Systems, PRENTICE HALL, Englewood Cliffs, N.Y., 1992,450 p.

Kosko, Bart, Fuzzy thinking: The new science of3izzy logic, First Edition, Hyperion, New York, 1993, 318 p.

Lee, Chuen Chien, “Fuzzy logic in control systems: fuzzy logic controller - Part I“, IEEE Transactions on systenis, man and cybernetics, vol. 20, no. 2, March 1990, pp. 404-4 18.

Lee, Chuen Chien, “Fuzzy logic in control systems: fuzzy logic controller - Part II”, IEEE Transactions on systenis, man, and cybernetics, vol. 20, no. 2, March 1990, pp. 419-435.

Maeda, Mikio and Sato, Takeo and Mirakami, Shuta, “Design of the self-tuning fuzzy controller”, Proceedings of the international Conference on Fuzzy Logic and Neural Networks, July 1990, pp. 393-396.

Mamdani, E. H., “Twenty years of fuzzy control: experiencies gained and lessons learnt”, Fuzzy logic technology and applicafions, IEEE Technical Acíivities Board, 1994, pp. 19-24.

Meier, R. and Nieuwland, J. and Hacisalihzade, S. and Steck, D. and Zbinden, A., “Fuzzy control of blood pressure during anesthesia with isoflurane”, IEEE Internafional Conference on Fuzzy Systems, March 8-12, 1992, San Diego, California, 1992, pp. 835-842.

Mugica Álvarez, Francisco, “Diseño sistemático de controladores difusos usando razonamiento inductivo”, TESIS DOCTORAL, Universidad Politécnica de Cataluña, Barcelona, España, Marzo 1995.

Narendra , Kumpati S. and Kannan, Parthasarathv. “Identification and control of dvnamical - . systems using neural networks”, IEEE Transactions on neural networks, vol.’l, no. 1, March 1990, pp. 4-27.

Narendra, Kumpati S. and Kannan, Parthasarathy, “Gradient methods for the optimization of dynamical systems containing neural networks”, IEEE Transactions on neural networks, vol. 2, no. 2, March 1991, pp. 252-262.

BG-3

Page 181: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Bibliogalia general

Yomura, Hiroyoshi, and Hayashi, Isao, and Wakami, Noboru, “A learning method of fuzzy inference rules by descent method”, Proceedings IEEE International Corference on Fuzzy Systenis, San Diego, California, March 1992, pp. 203-210.

Ogata, Katsuhiko, Ingeniería de control moderna, Za edición, Prentice Hall, 1993, 1020 p.

Passino, Kevin M., “Intelligent control for autonomous systems”, IEEE Spechum, June 1995, pp. 55-62.

Pedrycz, Witold, Fuzzy control andjiizzy systenis, second edition, I993

Pereira, G.A. and Prabhulla Chandran, V.K. and Krishnaii, Uma, “Precision control of refinery feed-heater temperature using fuzzy algorithm”, IEEE International Conference on Fuzzy Systenis, March 8-12, 1992, San Diego, California, 1992, pp. 835-842.

Procyk, T. J. and Mamdani E. H., “A linguistic self-organizing process controller”, Autoinatica, vol. 15, pp. 15-30,

RayChaudhuri, Tirthankar, and Hainey, Leonard G.C., and Rodney D. Bell, “From conventional control to autonomous intelligent methods”, IEEE Control Systems, October 1996, pp. 78-84.

Ruiz Ascencio, José and Castillo Romero, Rodolfo, “Self-Tuning Fuzzy Identification and Control using a Hybrid State Transition Kernel”, CIMCA’99, International Conference on Computational Intelligence for Modell, Viena, Austria, February 1999.

Rumelhart, D. and Hinton, G. and Williams, R., “Learning representations by backpropagating errors”, Nature, 323, 1986, pp. 533-536. Reimpreso en el texto “Parallel Distributed Processing: Explorations in the microstructure of cognition”, vol. 1 ., D. Rumelhart and J. McClelland ed., MITPress, 1986, pp. 318-362.

Shenoi, Sujeet, and Ashenayi, Kaveh, and Tiinmerman, Marc, “Implementation of a learning fuzzy controller”, IEEE Control Systems, vol. 15, no. 3, June 1995, pp.73-80.

Espinoza Salgado, Sócrates, Sistema de control de agua de alimentación basado en lógica dijiusa para reactores nucleares de agua hirviente, TESIS DE MAESTRÍA, Centro Nacional de Investigación y Desarrollo Tecnológico, Cuernavaca, Morelos, septiembre de 1998.

Takagi, Hideyuki, “Application of neural networks and fuzzy logic to consumer products”, F u u y Logic technology and applications, IEEE Technical Activities Board, 1994, pp. 8-12.

BG-4

Page 182: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Bibliografía general

Tanaka, Kazuo, and Sano, Manabu, and Watanabe, Hiroyuki, “Identification and analysis of fuzzy model for air pollution - An approach to self-learning control of CO concentration-, Proceeding fuzzy logic technology and applications, IEEE Technical Activities Board, 1994, pp. 261 -266.

Tani, Tetsuji and Murakoshi, Shunji and Sato, Tsutomu and Umano, Motohide and Tanaka, Kazuo, “Application of neuro-fuzzy hybrid control system to tank level control”, IEEE Technical Activities Board, 1994, pp. 247-252.

Wang, B.H. and Vachtsevanos, G.? ”Learning Fuzzy Logic Control : An Indirect Control Approach’o, Proceedings IEEE International Conference on Fuzzy Systeiiu, San Diego, California, March 1992, pp. 297-304.

Wang, Li-Xin, ”Stable adaptive fuzzy control of nonlinear systems”, Proceedings of the 31“ conference on decision and control, Tucson, Arizona, December 1992, pp. 25 I 1-25 16.

Wang, Li-Xin, “Fuzzy systems are universal aproximators”, Proceedings IEEE International Conference on Fuzzy Systenis, San Diego, California, 1992, pp. 1 163-1 170.

Wasserman, Philip D., Neural coniputing: theory and practice, Van Nostrand Reinhold, New York, 1989.

Yale, Karla, “Preparing the right data diet for training neural networks”, IEEE Specírum, March 1997, pp. 64-66.

Zadeh, Lotfi A,, “Fuzzy sets”, Inform. Control, vol. 8, pp. 338-353, 1965

Zadeh, Lotfi A,, “Outline of a new approach to the analysis of complex systems and decision processes”, IEEE Trans. Syst. Man, and Cybern., vol. 3, no. I , January 1973, pp. 28- 44.

Zadeh, Lotfi A,, “Fuzzy logic = Computing with words”, IEEE Trans. on fuzzy systems, vol. 4, no. 2, May 1996, pp. 103- 1 1 I .

BG-5

Page 183: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Anexo B

Evaluando y agrupando términos comunes resulta:

La ecuación de una recta en el formato general es: y = tnx + b, donde rn representa la pendiente de la recta y b el punto donde la recta intersecta el eje de las ordenadas. Haciendo la semejanza respecto a la ecuación (8-6) encontramos todos los términos.

La conclusión a la que llegamos haciendo el análisis de un sistema difuso de una entrada, usando reglas de tipo Sugeno de orden ceroo con valores iguales en las dos bases de sus conjuntos triangulares, es que posee la capacidad de representar la función de una recta, a partir de la relación entre sus parámetros: centros a,, bases b, y pesos de las reglas IV,. Para el caso de valores de bases diferentes, el sistema difuso es capaz de formar funciones racionales.

A continuación se presentan ejemplos para diferentes valores en las bases de los conjuntos.

b) b)

FIG. B.I. Respuesta del sistema difuso utilizando a ,=l , a,=+l, bl=bl=4, w,=O y w,=l. a) Salida del sistema difuso, b) conjuntos difusos resultantes. difusos resultantes.

FIG 8.2. Respuesta del sistema difuso utilizando a,=-l, a+I, b1=6, b2=2. w,=O y w,=O. a) Salida del sistema difuso, b) conjuntos

Page 184: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Anexo B

8.2. SISTEMAS DIFUSOS DE DOS ENTRADAS

Un sistema difuso de dos entrada y una salida que emplea reglas de tipo Sugeno orden cero utiliza los siguientes operadores.

Fusificación I 2ix -a,;

6, A , ( x ) = I - -__ ' ' ; paraj=l,c=1,2 y paraj=2,c=3,4. (B-7) J

Defusificación

El total de conjuntos del sistema difuso son cuatro, que por simplicidad denominaremos CI C2, C3 y C4. Las reglas resultantes a partir de la combinación de los cuatro conjuntos son:

regla 1 : Si XI es C I y x2 es C3 entonces y = wI regla 2: Si XI es CI yx2 es C4 entoiicesy = wz regla 3: Si X I es C2 y x2 es C3 entonces y = w 3 regla 4: Si XI es C2 y x2 es C4 entonces y = wd

Considerando que el conjunto CI se encuentra a la izquierda del conjunto C2, y que el conjunto C3 se encuentra a la izquierda del conjunto C4, el valor absoluto en el cálculo de los grados de pertenencia para los cuatro conjuntos se convierte en:

(B- I O)

(B-11)

(B-12)

(B-13)

B-4

Page 185: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Anexo B

Sustituyendo las ecuaciones (B-IO), (B-l I), (B-12) y (B-13) en las ecuaciones (8-8) y (B-9) y analizando el término resultante en el denominador de la ecuación (B-9) encontramos:

Evaluando y agrupando términos comunes en la forma A+BxI+CX~+DXI.IZ resulta:

b1b ,+2b a +2a b +4a ,a ,

+'J----- b b -2a,b , +2a ,b4 -4a ,a , + b,h, - 2a ,b z -2a2b4 ~ +4a2a4

b ,b ,+2a ,b2-2a2b , -4a ,a , + A = l L - - J L - - + - bib, b2 b3

' 1 b 4 b2b4

4a4-2b, 4a4-2h, 4a3+26, 4a3+2b, B + -- b l b4 b2b4 bzb, 61 b3

4a -26 4a ,-2b 4a ,+2b, 4a ,+2b, c = - + ___ - b2b3 4 6 4 b ,b , bib,

D = 4 - 4 - 4 + 4 = 0

El término A es constante, el término D se canceló (independientemente de los valores de los parámetros) y, para el caso de los términos B y C que están directamente relacionados con las variables independientes x I y x2 respectivamente, se encontró que se cancelan cuando las bases bi=b2 y b3=b4.

En el caso del numerador de la ecuación (B-9) observamos que se forma una ecuación de la forma E + Fx, + G x ~ + Hxlx2, la cual pertenece a la función de un plano, en donde los coeficientes E, F, G y H son constantes que se obtienen a partir de los parámetros del sistema difuso: centros a,, bases b, y pesos de las reglas difusas w,. Por lo tanto dependiendo de los valores de las bases de los cuatro conjuntos difusos dicha función del plano sera afectada por un cociente constante (en el caso de bi=b2 y b3=b4) o bien una función racional de dos argumentos.

La conclusión a la que llegamos durante el análisis de un sistema difuso, con reglas tipo Sugeno orden cero con dos conjuntos difusos particionando cada una de las dos variable's de entrada, fué haber obtenido la función de un plano cuando las bases del par de conjuntos de las variables de entrada son iguales, es decir cuando bl=bz y b3=b4. I

Page 186: cenidef Rodolfo... · Señal de entrada aplicada al sistema lineal de primer orden, para generar los datos de entrenamiento. FIG. 4.7. Situación inicial del sistema difuso

Anexo U

La caracteristica de formar rectas o planos puede utilizarse como un indicador al momento de sintonizar comportamientos lineales, como es el caso de la identificación y el control de sistemas lineales; al usar esta propiedad se obtiene una propuesta en la cantidad necesaria de conjuntos difusos para lograr la sintonización de sistemas lineales. Para el caso de emplear más de dos conjuntos por variable de entrada, se puede hacer una interpretación de las superficies formadas a partir del sistema difuso analizando la situación sobre cada intersección de conjuntos (cada par de conjuntos) y los valores de sus bases.

U-6