tfm marco herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/t... ·...

118
Universidad Politécnica De Madrid Escuela Técnica Superior de Ingenieros Industriales Modelado Discreto y Control Óptimo de Sistemas No Lineales Multivariables y su Aplicación a un Péndulo Invertido utilizando Lego Mindstorms Marco Antonio Herrera Garzón Trabajo Fin de Máster presentado en la Escuela Técnica Superior de Ingenieros Industriales de la Universidad Politécnica de Madrid para la obtención del grado de Máster en Automática y Robótica. Tutores: Prof. Agustín Jiménez Avello, PhD. Prof. Basil Mohammed Al-Hadithi, PhD. Madrid, 2014

Upload: phamnga

Post on 25-Sep-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

Universidad Politécnica De Madrid

Escuela Técnica Superior de Ingenieros Industriales

Modelado Discreto y Control Óptimo de Sistemas No Lineales Multivariables y su Aplicación a un Péndulo Invertido utilizando Lego

Mindstorms

Marco Antonio Herrera Garzón

Trabajo Fin de Máster presentado en la Escuela Técnica Superior de Ingenieros Industriales de la Universidad Politécnica de Madrid para la obtención del grado de Máster en Automática

y Robótica.

Tutores:

Prof. Agustín Jiménez Avello, PhD.

Prof. Basil Mohammed Al-Hadithi, PhD.

Madrid, 2014

Page 2: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

DEDICATORIA

A Dios quien me ha dado la fortaleza y coraje para ir alcanzando mis metas, sueños y quien me ha enviado seres maravillosos a mi vida, a mis padres José Antonio y Targelia Mariana por ser un modelo de vida, mi fuente de inspiración y por estar siempre pendientes de mi. A mis hermanos José Luis y Ximena por todo su apoyo.

A mis abuelitos, Eduardo y Mariana, Segundo (†) y María, quienes siempre me han brindado todo su amor incondicional.

A toda mi familia quienes a pesar de la distancia han sabido transmitirme todo su sentimiento de fuerza y cariño.

Todo el esfuerzo, pasión y sacrificio entregado a este trabajo está dedicado a la memoria de mi abuelito Segundo (†), que Dios lo tenga en su gloria.

"Todos tus sueños pueden hacerse realidad si tienes el coraje de perseguirlos"

Walt Disney

Page 3: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

AGRADECIMIENTOS

Mi vida no sería nada sin personas quienes han sabido brindarme todo su apoyo y cariño, a quienes les estoy eternamente agradecido.

Agradezco a mis primos Fausto y Roció y a sus hijos Dayana, Jordan y Camila quienes me han brindado todo su apoyo, calidez familiar y me han hecho sentir como en casa.

A mis tutores Agustín y Basil quienes con toda su experiencia y conocimiento me han sabido guiar no solo en mi formación académica si no en parte de mi formación personal y se han convertido en mi ejemplo a seguir por su profesionalismo, gracias por todo su tiempo y apoyo.

A mis amigos que a la distancia me han enviado toda su buena vibra y positivismo, les estoy muy agradecido.

A mis profesores, compañeros y nuevos amigos con quienes he compartido estos dos años de mi vida, siempre los tendré en mi mente.

Y al Gobierno de la República del Ecuador por haberme adjudicado una beca completa mediante el SENESCYT, la cual me ha permitido realizar mis estudios de postgrado y me ha brindado esta maravillosa oportunidad en mi vida.

Page 4: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

RESUMEN

La teoría de los sistemas de control de manera general se encargan del análisis y diseño de estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a controlar. Existen numerosas aplicaciones de los sistemas de control en la ingeniería entre las áreas que más se destacan se tiene: ingeniería aeronáutica, eléctrica, mecánica, ambiental, civil, química y muchas otras disciplinas no vinculadas a la ingeniería. Controlar de manera eficiente a los procesos en la industria presentan ventajas entre las cuales se pueden mencionar: mejora en la calidad de los productos, reducción del consumo energético, aumento en los niveles de seguridad, optimización en los procesos, reducción en la contaminación ambiental, etc. Para el análisis de los sistema de control es de vital importancia partir de un modelo matemático de la planta, el cual debe represente lo más apegado a la realidad su dinámica.

El avance tecnológico y la disponibilidad de herramientas computacionales cada vez más potentes han dado la apertura a una variedad de nuevos problemas y aplicaciones de naturaleza no lineal. Aplicaciones tales como: sistemas de vuelo en aeronaves, control de manipuladores robóticos, sistemas de generación eléctrica (eólica, fotovoltaica, hidráulica, mareomotriz, térmica, nuclear, etc.), ingeniería biomédica, automotriz, espacial, control de procesos industriales, etc. Estas aplicaciones presentan fenómenos inherentemente de naturaleza no lineal y no se los puede describir mediante la dinámica de modelos lineales, esta es la razón indiscutible que hace necesario el uso de modelos no lineales que se aproximan más a la realidad, lo cual requiriere del desarrollo de conceptos y herramientas que aborden esta problemática del control no lineal. En cuanto al desarrollo de teorías que aborden el control no lineal se han realizado notables avances en áreas como: linealización por realimentación, control deslizante, técnicas adaptativas no lineales entre otras. Como resultado de esto, el control no lineal está ocupando cada vez un lugar más importante en la ingeniería de control automático.

Los sistemas de control no lineales presentan ventajas en su diseño con lo cual se puede mejorar los sistemas de control ya existentes, permitiéndoles operar en rangos más amplios y compensarlos de manera adecuadas frente a las no linealidades existentes. Los controladores no lineales robustos y adaptativos pueden tratar con los problemas que no se tratan en el diseño clásico como son: perturbaciones, ruidos en la medición, dinámicas no modeladas con incertidumbre en los parámetros del modelo. Por lo tanto, el estudio de los sistemas de control no lineales brindan una comprensión más nítida del mundo real que es inherentemente no lineal.

El presente Trabajo Fin de Máster tiene como objetivo obtener un modelo discreto de un sistema no lineal multivariable y a partir de este modelo diseñar una estrategia de control óptimo, aplicado a un péndulo invertido sobre dos ruedas. En la parte del modelado discreto se ha utilizado la metodología de identificación borrosa la cual permite la estimación de parámetros del modelo borroso de Takagi-Sugeno (T-S). Esta metodología permite encontrar un modelo el cual se forma mediante el uso de un conjunto de reglas borrososas que representan al sistema no lineal, para completar esta metodología es necesario darle un

Page 5: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

sentido físico al sistema esto se consigue mediante la sintonización de los parámetros del modelo T-S a través de una primera aproximación lineal en la región de operación del sistema (� ≈ 0; ����ó���������), esta aproximación se la obtiene a partir del sistema no lineal mediante la identificación del sistema por el método de mínimos cuadrados.

En la parte de control del sistema no lineal multivariable, a partir del modelo borroso de Takagi-Sugeno se ha implementado una estrategia de control óptima mediante el uso de un Regulador Cuadrático Lineal (LQR) discreto. Para analizar el comportamiento del controlador diseñado (FC-LQR) se lo ha simulado en MatLab-Simulink© realizando diversas pruebas, donde se verificó la robustez y eficacia del controlador.

El controlador FC-LQR se lo implementó en la plataforma educativa Lego Mindstorms© NXT 2.0. Dicha plataforma es una nueva generación en robótica educativa que permite construir numerosas configuraciones mecánicas, para este caso en configuración péndulo invertido sobre dos ruedas. El controlador fue desarrollado en la plataforma de programación RobotC la cual fue seleccionada por su capacidad de velocidad de procesamiento, lo que ha permitido adquirir y acondicionar las variables necesarias para la realimentación del sistema obteniendo así: el ángulo de inclinación (�) y su velocidad ���� mediante el giroscopio, la

posición angular (�) y su velocidad ���� mediante sensores de posición angular (encoder), el

ángulo de orientación (�) y su velocidad ��� � mediante el sensor brújula. Además se mejoró la estimación del ángulo de orientación del sistema mediante la implementación de un Filtro de Kalman, reduciendo el problema de posibles deslizamientos del sistema mientras este se desplaza en el plano X-Y y de medidas erróneas del sensor brújula.

El controlador implementado sobre el sistema real ha logrado resolver el problema de equilibrio del péndulo invertido frente a perturbaciones externas y a ruidos en las medidas siempre presentes en los sensores. Se realizaron pruebas con perturbaciones externas: de carga variable y de fuerza externa, así como también pruebas con estados finales no nulos y con algunas trayectorias, en donde se comprobó la robustez y eficacia del controlador.

Como trabajos futuros, se puede mencionar, la implementación del control FC-LQR en otros sistemas no lineales, inestables y multivariable, entre las cuales se puede mencionar: control de vehículos aéreos, control de aerogeneradores, manipuladores robóticos, etc. Además, del desarrollo de otras estrategias de control no lineal a partir del modelo borroso de T-S obtenido mediante la identificación borrosa, entre los cuales se destacan: el control de estructura variable en modo deslizante y el control adaptativo.

Palabras clave: sistemas no lineales multivariables, control borroso, modelo de Takagi-Sugeno, control óptimo, LQR, péndulo invertido sobre dos ruedas, Lego Mindstorms NXT.

Códigos UNESCO: 331102, 120304, 120702, 120909

Page 6: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a
Page 7: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

i

Contenido

1. INTRODUCCIÓN .............................................................................................................. 9

1.1 Antecedentes ................................................................................................................ 9

1.2 Justificación ................................................................................................................. 9

1.3 Objetivos .................................................................................................................... 10

1.4 Estructura del Trabajo Fin de Máster ........................................................................ 11

1.5 Presupuesto ................................................................................................................ 12

1.6 Planificación Temporal .............................................................................................. 12

2. ESTADO DEL ARTE ....................................................................................................... 14

2.1 Introducción ............................................................................................................... 14

2.2 Generalidades en el diseño de sistemas del control no lineal .................................... 15

2.2.1 Problemas presentes en el control no lineal ....................................................... 15

2.2.2 Especificaciones deseadas en los sistemas de control no lineal ......................... 17

2.3 Técnicas de control no lineal ..................................................................................... 18

2.3.1 Linealización por realimentación ...................................................................... 18

2.3.2 Control de estructura variable en modo deslizante ............................................ 21

2.4 Control borroso .......................................................................................................... 24

2.4.1 Conjuntos borrosos ............................................................................................. 24

2.4.2 Diseño de controladores borrosos ...................................................................... 25

2.5 Control óptimo ........................................................................................................... 27

2.5.1 Aplicaciones del control óptimo ........................................................................ 29

3. MODELADO DISCRETO DEL PÉNDULO INVERTIDO MEDIANTE EL MODELO

BORROSO DE TAKAGI-SUGENO ....................................................................................... 32

3.1 Introducción ............................................................................................................... 32

3.2 Modelo matemático no lineal del péndulo invertido sobre dos ruedas ..................... 32

3.3 Ecuaciones de movimiento del sistema ..................................................................... 34

3.3.1 Modelo no lineal del sistema .............................................................................. 37

3.3.2 Modelo en variables de estado del péndulo invertido sobre dos ruedas ............ 38

3.4 Estimación de los parámetros del modelo borroso de T-S ........................................ 40

Page 8: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

ii

3.4.1 Sintonización de parámetros del modelo borroso de T-S utilizando el método de ponderación ....................................................................................................................... 43

3.5 Identificación borrosa T-S multivariable ................................................................... 45

3.6 Implementación de la identificación borrosa T-S en Simulink-MatLab© del péndulo

invertido sobre dos ruedas .................................................................................................... 47

4. DISEÑO DEL CONTROL ÓPTIMO Y SIMULACIÓN EN MATLAB© DEL

PÉNDULO INVERTIDO SOBRE DOS RUEDAS................................................................. 53

4.1 Introducción ............................................................................................................... 53

4.2 Diseño del control óptimo mediante un LQR discreto .............................................. 53

4.2.1 Implementación del LQR discreto ..................................................................... 56

4.3 Simulación del Controlador Óptimo.......................................................................... 58

4.3.1 Pruebas con estados iníciales no nulas ............................................................... 59

4.3.2 Pruebas con condiciones finales no nulas .......................................................... 63

4.3.3 Pruebas con condiciones iníciales y finales no nulas ......................................... 65

4.3.4 Pruebas con trayectorias ..................................................................................... 67

4.3.5 Pruebas con perturbaciones externas y ruido en los estados .............................. 73

5. IMPLEMENTACIÓN DEL CONTROL EN EL PÉNDULO INVERTIDO SOBRE DOS

RUEDAS UTILIZANDO LEGO MINDSTORMS NXT ........................................................ 77

5.1 Descripción del péndulo invertido sobre dos ruedas en base a Lego Mindstorms NXT .................................................................................................................77

5.2 Sistema de sensores ................................................................................................... 78

5.2.1 Acondicionamiento del giroscopio ..................................................................... 78

5.2.2 Acondicionamiento de la brújula ....................................................................... 80

5.2.3 Acondicionamiento de la posición angular (encoder) ........................................ 82

5.2.4 Estimación de la orientación mediante el Filtro de Kalman .............................. 84

5.3 Sistema Electrónico ................................................................................................... 87

5.4 Implementación del sistema de control ..................................................................... 89

6. PRUEBAS Y RESULTADOS .......................................................................................... 92

6.1 Consideraciones previas ............................................................................................ 92

6.2 Pruebas y resultados obtenidos .................................................................................. 93

6.2.1 Pruebas con estados finales nulos ...................................................................... 93

6.2.2 Pruebas con estados finales no nulos ................................................................. 94

Page 9: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

iii

6.2.3 Pruebas con perturbaciones externas .................................................................. 98

6.2.4 Pruebas con trayectorias ................................................................................... 100

7. CONCLUSIONES Y TRABAJOS FUTUROS .............................................................. 107

7.1 Conclusiones ............................................................................................................ 107

7.2 Trabajos Futuros ...................................................................................................... 108

7.3 Impacto Industrial .................................................................................................... 109

8. BIBLIOGRAFÍA ............................................................................................................ 110

Page 10: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

iv

Lista de Figuras Figura 2-1 No linealidades: (a) fricción por Coulomb, (b) Zona muerta, (c) Saturación, (d)

Histéresis .................................................................................................................................. 14

Figura 2-2 Esquema del péndulo invertido sobre un carro ...................................................... 16

Figura 2-3 Péndulo invertido , ECP 505 ................................................................................. 19

Figura 2-4 Robot Móvil T-WIP ............................................................................................... 19

Figura 2-5 Péndulo invertido sobre dos ruedas ........................................................................ 20

Figura 2-6 Esquema de un servo control (Tipo PID) ............................................................... 20

Figura 2-7 Robot de trasporte de equipaje en base a un péndulo invertido ............................. 21

Figura 2-8 Plano de fase aplicando el VSC de dos sistemas inestables ................................... 22

Figura 2-9 Robot móvil péndulo invertido sobre dos ruedas ................................................... 23

Figura 2-10 Péndulo invertido sobre dos ruedas con sus parámetros ...................................... 24

Figura 2-11 Conjunto borroso de temperaturas ........................................................................ 25

Figura 2-12 Esquema de proceso del control Borroso ............................................................. 26

Figura 2-13 Péndulo invertido .................................................................................................. 26

Figura 2-14 Vistas y parámetros geométricos (TWIP): (a) frontal, (b ) lateral, (c) superior ... 27

Figura 2-15 Esquema de control de un LQR ............................................................................ 28

Figura 2-16 Esquema de un doble péndulo invertido .............................................................. 29

Figura 2-17 Péndulo invertido sobre dos ruedas ...................................................................... 30

Figura 2-18 Esquema del péndulo invertido ............................................................................ 30

Figura 2-19 Esquema de control 2PID+LQR del sistema nolineal péndulo invertido ............. 31

Figura 3-1 Vista Frontal y lateral del sistema bajo estudio ...................................................... 32

Figura 3-2 Esquema generalizado del péndulo invertido sobre dos ruedas ............................. 33

Figura 3-3 Vista lateral y superior del sistema ......................................................................... 33

Figura 3-4 Vista frontal , superior y lateral del sistema ......................................................... 38

Figura 3-5 Implementación del modelo no lineal del sistema en Simulink - MatLab ............. 39

Figura 3-6 Respuesta del modelo nolineal del sistema en lazo directo .................................... 40

Figura 3-7 Funciones de pertenencia del sistema borroso ....................................................... 41

Figura 3-8 Modelo general implementado en MatLab©.......................................................... 48

Figura 3-9 Funciones de pertenencia del ángulo ψ .................................................................. 49

Figura 3-10 Funciones de pertenencia de la velocidad del ángulo de inclinación ................... 49

Figura 3-11 Funciones de pertenencia de la velocidad de la posición angular ........................ 50

Figura 3-12 Funciones de pertenencia de la velocidad del ángulo de orientación ................... 50

Page 11: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

v

Figura 4-1 Evolución de ganancias K:(a) acción de control u1 (b) acción de control u2 ........ 58

Figura 4-2 Sistema de control implementado en Simulink-MatLab© ..................................... 58

Figura 4-3 Evolución de ψ y �para estados iníciales no nulos ............................................... 59

Figura 4-4 Evolución de θ y �para estados iníciales no nulos ................................................ 60

Figura 4-5 Evolución ϕ y � para estados iníciales no nulos .................................................... 60

Figura 4-6 Evolución acciones de control u1 y u2 para estados iníciales no nulos ................ 61

Figura 4-7 Evolución de ψ y � para estados iníciales no nulos ............................................... 61

Figura 4-8 Evolución de θ y � para estados iníciales no nulos ................................................ 62

Figura 4-9 Evolución ϕ y � para estados iníciales no nulos ................................................... 62

Figura 4-10 Evolución acciones de control u1 y u2 para estados iníciales no nulos .............. 63

Figura 4-11 Evolución de ψ y � para estados finales no nulos................................................ 63

Figura 4-12 Evolución de θ y � para estados finales no nulos ................................................. 64

Figura 4-13 Evolución ϕ y � para estados finales no nulos ..................................................... 64

Figura 4-14 Evolución acciones de control u1 y u2 para estados finales no nulos ................. 65

Figura 4-15 Evolución de ψ y � para estados iníciales y finales no nulos .............................. 65

Figura 4-16 Evolución de θ y � para estados iníciales y finales no nulos .............................. 66

Figura 4-17 Evolución ϕ y � para estados iníciales y finales no nulos ................................... 66

Figura 4-18 Evolución acciones de control u1 y u2 para estados iníciales y finales no nulos 67

Figura 4-19 Vista lateral y superior del péndulo invertido de dos ruedas ................................ 67

Figura 4-20 Trayectoria lineal .................................................................................................. 68

Figura 4-21Evolución de los estados θ y �, trayectoria (a) ...................................................... 69

Figura 4-22 Evolución de los estados ϕ y �, trayectoria (a) ................................................. 69

Figura 4-23 Evolución de las entrada voltaje motor izquierdo y derecho, trayectoria (a) ....... 70

Figura 4-24 Evolución de la trayectoria (a) en el plano X-Y del péndulo invertido ................ 70

Figura 4-25 Evolución de los estados ψ y �, trayectoria (b) ................................................. 71

Figura 4-26 Evolución de los estados θ y �, trayectoria (b) ................................................... 72

Figura 4-27 Evolución de los estados ϕ y �, trayectoria (b) .................................................. 72

Figura 4-28 Evolución de las entrada voltaje motor izquierdo y derecha, trayectoria (b) ....... 73

Figura 4-29 Evolución de la trayectoria (b) en el plano X-Y del péndulo invertido sobre dos

ruedas ....................................................................................................................................... 73

Figura 4-30 Sistema de control implementado con perturbación y ruido ................................ 74

Figura 4-31 Evolución de los estados ψ y � con perturbaciones y ruido ................................ 74

Figura 4-32 Evolución de los estados θ y � con perturbaciones y ruido ................................. 75

Page 12: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

vi

Figura 4-33 Evolución de los estados ϕ y � con perturbaciones y ruido ............................... 75

Figura 4-34 Evolución de las entrada voltaje motor izquierdo y derecho con perturbaciones y

ruido ......................................................................................................................................... 76

Figura 5-1 Configuración péndulo invertido sobre dos ruedas en base a Lego Mindstorms ... 77

Figura 5-2 (a) Vista frontal y (b) vista superior, del péndulo invertido sobre dos ruedas ...... 78

Figura 5-3 Sensor Gyro NXT ................................................................................................... 78

Figura 5-4 Velocidad y ángulo de inclinación adquiridos del giroscopio ................................ 80

Figura 5-5 Velocidad y ángulo de orientación para un desplazamiento lineal ........................ 81

Figura 5-6 Velocidad y ángulo de orientación para una rotación sobre su propio eje ............. 82

Figura 5-7 Servomotor del Lego Mindstorms NXT................................................................. 82

Figura 5-8 Posición angular y velocidad para un desplazamiento lineal ................................. 83

Figura 5-9 Posición angular y velocidad para una rotación sobre su propio eje ...................... 84

Figura 5-10 Velocidad y ángulo de orientación estimado para un desplazamiento lineal ....... 85

Figura 5-11 Velocidad y ángulo de orientación estimado para una rotación sobre su propio eje

.................................................................................................................................................. 85

Figura 5-12 Algoritmo recursivo del Filtro de Kalman ........................................................... 86

Figura 5-13 Ángulo de la orientación estimada para un desplazamiento lineal ....................... 87

Figura 5-14 Ángulo de orientación estimada para una rotación sobre su propio eje .............. 87

Figura 5-15 Ladrillo NXT de Lego Mindstorms ...................................................................... 88

Figura 5-16 Arquitectura de control implementada en el péndulo invertido sobre dos ruedas 89

Figura 5-17 Diagrama de flujo del sistema de control implementado ..................................... 90

Figura 5-18 Arquitectura del Controlador FC-LQR ................................................................ 91

Figura 6-1 Conjunto borroso del ángulo de inclinación ψ, sistema real .................................. 92

Figura 6-2 Conjunto borroso de la velocidad del ángulo �, sistema real ................................. 93

Figura 6-3 Evolución de los estados ψ, θ y ϕ para estados finales nulos, sistema real ............ 94

Figura 6-4 Vista frontal, lateral y superior del péndulo invertido, equilibrando ..................... 94

Figura 6-5 Evolución de la posición angular θ y su velocidad �, con estados finales no nulos,

sistema real ............................................................................................................................... 95

Figura 6-6 Evolución acciones de control u1 y u2 , con estados finales no nulos, sistema real

.................................................................................................................................................. 95

Figura 6-7 Desplazamiento del péndulo invertido sobre dos ruedas en el plano X-Y ............. 96

Figura 6-8 Evolución ángulo de orientación ϕ y su velocidad � con estados finales no nulos,

sistema real ............................................................................................................................... 96

Figura 6-9 Evolución acciones de control u1 y u2 con estados finales no nulos, sistema real 97

Page 13: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

vii

Figura 6-10 Desplazamiento del péndulo invertido sobre dos ruedas en el plano X-Y ........... 97

Figura 6-11 Péndulo invertido sobre dos ruedas con carga variable ........................................ 98

Figura 6-12 Evolución ángulos ψ, θ, ϕ, con perturbación externa de carga variable, sistema

real ............................................................................................................................................ 98

Figura 6-13 Péndulo invertido sobre dos ruedas con perturbación externa de incremento de

carga ......................................................................................................................................... 99

Figura 6-14 Péndulo invertido sobre dos ruedas con perturbación externa de decremento de

carga ......................................................................................................................................... 99

Figura 6-15 Evolución estados ψ , θ , ϕ con perturbación de fuerza externa, sistema real .... 100

Figura 6-16 Péndulo invertido sobre dos ruedas con perturbación de fuerza externa ........... 100

Figura 6-17 Evolución ángulo de posición angular θ y su velocidad � para la trayectoria (a),

sistema real ............................................................................................................................. 101

Figura 6-18 Evolución ángulo de orientación ϕ y su velocidad � para la trayectoria (a),

sistema real ............................................................................................................................. 102

Figura 6-19 Evolución acciones de control u1 y u2 para la trayectoria (a), sistema real....... 102

Figura 6-20 Desplazamiento del péndulo invertido sobre dos ruedas en el plano X-Y,

trayectoria (a) ......................................................................................................................... 103

Figura 6-21 Evolución trayectoria (a) sobre el plano X-Y ..................................................... 103

Figura 6-22 Evolución ángulo de posición angular θ y su velocidad � para trayectoria (b),

sistema real ............................................................................................................................. 104

Figura 6-23 Evolución ángulo de orientación ϕ y su velocidad � para trayectoria (b), sistema

real .......................................................................................................................................... 104

Figura 6-24 Evolución acciones de control u1 y u2 para la trayectoria (b), sistema real ...... 105

Figura 6-25 Evolución trayectoria (b) sobre el plano X-Y .................................................... 105

Figura 6-26 Desplazamiento del péndulo invertido sobre dos ruedas en el plano X-Y para

trayectoria (b) ......................................................................................................................... 106

Page 14: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

viii

Lista de Tablas

Tabla 1 Presupuesto económico de los equipos adquiridos ..................................................... 12

Tabla 2 Horas de trabajo Presupuesto económico de los equipos adquiridos ......................... 12

Tabla 3 Parámetros físicos del sistema bajo estudio ................................................................ 34

Tabla 4 Rango de las muestras ................................................................................................. 48

Tabla 5 Parámetros de la trayectoria (a) ................................................................................... 68

Tabla 6 Parámetros de la trayectoria (b) .................................................................................. 71

Tabla 7 Especificaciones Técnicas del ladrillo NXT ............................................................... 88

Tabla 8 Actuadores, sensores y sus puertos de conexión ......................................................... 88

Tabla 9 Parámetros de la trayectoria (a) ................................................................................ 101

Tabla 10 Parámetros trayectoria (b) ....................................................................................... 103

Page 15: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

9

1. INTRODUCCIÓN

1.1 Antecedentes El Consejo Superior de Investigaciones Científicas (CSIC) conjuntamente con la Universidad Politécnica de Madrid (UPM) han creado el Centro de Automática y Robótica (CAR) en donde se realiza investigación fundamentalmente aplicada, la cual contribuye al avance del conocimiento y a la resolución de problemas planteados desde distintos ámbitos de la sociedad. El CAR participa activamente en numerosos proyectos, programas de la comisión europea y sus actividades están enfocadas al estudio de las áreas de Automática y Robótica, teniendo como líneas de investigaciones las siguientes: Supervisión y Control Inteligente, Percepción Artificial, Robótica Inteligente y Robótica Aplicada.

Dentro del CAR se cuenta con el Grupo de Control Inteligente el cual es parte de la División de Ingeniería de Sistemas y Automática (DISAM), teniendo como objetivo innovar en el área de la ingeniería de control. El Grupo de Control Inteligente se dedica aplicar sus investigaciones y desarrollos tecnológicos orientados al control de procesos industriales y a la automatización, así como también a los robots móviles. El grupo tiene como líneas de investigación: el control inteligente de procesos, técnicas avanzadas de control, control borroso, inteligencia artificial, modelado del conocimiento, planificación inteligente, percepción y modelado del entorno, etc.

El grupo ha desarrollado importantes aportaciones al estado del arte del control inteligente de procesos mediante la combinación de las mejores características del control borroso y óptimo. Esta fusión de conceptos ha permitido abordar la problemática del control de sistemas no lineales, de donde se ha logrado obtener controladores robustos y estables de sistemas como: robots manipuladores y algunos procesos industriales de naturaleza no lineal.

Por lo antes expuesto y continuado con el aporte a esta línea de investigación en el presente Trabajo de Fin de Máster se propone desarrollar el modelado y control de un sistema no lineal multivariable utilizando la combinación de técnicas de control borroso y óptimo aplicados al control de un péndulo invertido.

1.2 Justificación La teoría de los sistemas de control de manera general se encargan del análisis y diseño de estructuras que permitan obtener un comportamiento deseado en la dinámica de los sistemas a controlar. De manera general los sistemas de control se basan en el concepto fundamental de la realimentación, mediante la medición variables y generación de acciones de control necesarias para conseguir dicho comportamiento.

Existen numerosas aplicaciones de los sistemas de control en la ingeniería entre las áreas que más se destacan se tiene: ingeniería aeronáutica, mecánica, eléctrica, ambiental, civil, procesos químicos y muchas otras disciplinas no ingenieriles.

Page 16: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

INTRODUCCIÓN

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 10

Conseguir controlar de manera eficiente los procesos en la industria presenta ciertas ventajas entre las cuales se pueden mencionar: mejora de la calidad de los productos que están siendo procesados, reducción del consumo energético, aumento en los niveles de seguridad, optimización de la materia prima minimizando la cantidad de materiales de desecho, reducción en la contaminación ambiental.

Para el diseño de un sistema de control se parte de un modelo matemático de la planta bajo estudio, dicho modelo representa la relación entre las entradas y salidas del sistema. Por lo general a la mayoría de los modelos se los trata de describir de manera que fuesen sistemas lineales, debido a que son más fáciles de manejar que a los sistemas no lineales y pudiendo representar de manera adecuada el comportamiento real del sistema en muchos casos útiles.

El avance tecnológico actual ha generado la apertura a una variedad de nuevos problemas y aplicaciones de naturaleza no lineal. Aplicaciones tales como: sistema de vuelo en aeronaves, control de manipuladores robóticos, sistema de generación eléctrica (eólica, fotovoltaica, hidráulica, mareomotriz, etc.), sistema de freno y tracción en vehículos, control de procesos industriales, etc. Estas aplicaciones presentan fenómenos inherentemente de naturaleza no lineal y no se los puede describir mediante la dinámica de modelos lineales, esta es una de las razones indiscutibles que hacen necesario el uso de modelos no lineales y el desarrollo de conceptos, herramientas que aborden esta problemática de control.

La estrategia de control no lineal a diferencia del lineal permite rangos de operación más amplios del sistema, se puede analizar el comportamiento de no linealidades tales como: de saturación, histéresis, zonas muertas, fricción de Coulomb, etc. Permite tratar con incertidumbres paramétricas en el modelo, desarrollar técnicas adaptables de control, además de la posibilidad de reducir costos en su implementación al evitar el uso de sensores y actuadores lineales en todo el rango de trabajo.

Para explorar el diseño de sistemas de control no lineal en el presente Trabajo Fin de Máster se desarrollará el modelado y control óptimo de sistemas no lineales multivariables y su aplicación a un péndulo invertido el cual es un reto para los ingenieros en control y que permitirá realizar valiosos aportes y conclusiones a este campo.

1.3 Objetivos El objetivo del Trabajo Fin de Máster es obtener el modelo discreto de un sistema no lineal multivariable por estimación de parámetros del modelo borroso de Takagi-Sugeno (T-S) mediante la metodología de identificación borrosa y controlar de manera óptima al mismo, para la aplicación de un péndulo invertido sobre dos ruedas en base a Lego Mindstorms NXT.

Para lograr este objetivo se llevará a cabo dos tareas: una tarea de obtención del modelo discreto y una tarea de control óptimo del sistema bajo estudio.

• En la parte del modelado se plateará un modelo matemático no lineal que describa de la mejor manera la dinámica del sistema y el cual este representado en variables de

Page 17: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 11

estado, además se obtendrá y se sintonizará el modelo borroso de T-S mediante la metodología de identificación borrosa del modelo no lineal del sistema planteado.

• En la parte de control del sistema no lineal multivariable, a partir del modelo borroso de T-S se implementará, calibrará y simulará en MatLab-Simulink© un control óptimo y además se realizarán diversas pruebas para comprobar la robustez y eficacia del controlador.

• Se implementará el controlador óptimo en el sistema real del péndulo invertido sobre dos ruedas en base a Lego Mindstorms, para lo cual se realizará la calibración, adquisición y acondicionamiento de todas las variables necesaria para la realimentación del sistema, además se someterá al sistema a diversas pruebas para comprobar la robustez y eficacia del controlador.

1.4 Estructura del Trabajo Fin de Máster El presente Trabajo Fin de Máster (TFM) se ha estructurado en siete capítulos de la siguiente forma:

• En el Capítulo 1 se indica los antecedentes y justificación del TFM, al igual que los objetivos a desarrollar y el presupuesto y planificación temporal del presente trabajo.

• En el Capítulo 2 se revisa el estado del arte sobre las generalidades del control no lineal y sus técnicas más relevantes para afrontar la problemática del control de sistemas no lineales.

• En el Capítulo 3 se detalla el procedimiento de la estimación y sintonización de los parámetros del modelo borroso de T-S obtenido mediante la identificación borrosa del sistema bajo estudio.

• En el Capítulo 4 se desarrolla el control óptimo mediante un Regulador Cuadrático Lineal discreto y la simulación del controlador en MatLab-Simulink© para algunas pruebas realizadas.

• En el Capítulo 5 se implementa el controlador desarrollado en el sistema real del péndulo invertido sobre dos ruedas ensamblado a base de Lego Mindstorms NXT.

• En el Capítulo 6 se muestran los resultados de las pruebas realizadas sobre el sistema real para estados finales nulos y no nulos, algunas trayectorias y perturbaciones externas: de cargas variables y de fuerza externa.

• En el Capítulo 7 se presentan las conclusiones más relevantes del TFM y se expone un conjunto de interesantes líneas de investigación futuras.

Page 18: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

INTRODUCCIÓN

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 12

1.5 Presupuesto En el presente apartado se presenta el presupuesto del Trabajo de Fin de Máster, tanto la parte económica como el esfuerzo de horas de trabajo.

En cuanto a la parte económica en la Tabla 1 se muestra los equipos electrónicos y licencias de software necesarias para el desarrollo del trabajo expuesto.

Tabla 1 Presupuesto económico de los equipos adquiridos

Característica Costo (€)

Pack LEGO Mindstorms NXT 2.1 384,95

Sensor giroscópico Hitechnic NXT 79

Sensor brújula Hitechnic NXT 75

Caja de recursos LEGO Mindstorms NXT 94

Licencia Software RobotC 79

Total 711,95

En la parte de horas de trabajo se dividen en horas aproximadas de trabajo por parte de estudiante y horas de tutorías, en la Tabla 2

Tabla 2 Horas de trabajo

Personal Horas Estudiante 600

Tutores 50

Total 650

En la Tabla 10 se muestran las horas de esfuerzo aproximadas realizadas por parte de estudiante para las actividades desarrolladas en el presente Trabajo de Fin de Máster, además se incluye las horas de tutorías por parte de los docentes tutores del presente trabajo.

1.6 Planificación Temporal En el siguiente Diagrama de Gantt se muestra la planificación temporal del presente Trabajo Fin de Máster.

Page 19: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

13

Page 20: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

14

2. ESTADO DEL ARTE 2.1 Introducción En los últimos años, la disponibilidad de herramientas computacionalmente poderosas y de bajo costo han logrado estimular grandes avances en el campo del control no lineal. En cuanto a la teoría se han realizado notables avances en áreas como: linealización por realimentación, control deslizante, técnicas adaptativas no lineales entre otras. En el campo de las aplicaciones se han desarrollado muchos sistemas de control no lineales tales como: sistemas de control de vehículos aéreos, automóviles, robots avanzados, sistemas espaciales entre otras. Como resultado de esto, el control no lineal está ocupando cada vez un lugar más importante en la ingeniería de control automático.

Para el diseño de sistemas de control lineales se tiene una gran variedad de métodos y un amplio desarrollo de aplicaciones industriales exitosas. Muchos investigadores de áreas como: el control de vehículos aéreos, robótica, procesos de control e ingeniería biomédica entre otros, han mostrado un gran interés en el desarrollo de metodologías de control y aplicaciones no lineales. Entre las razones se pueden citar las expuestas en [1]:

• Mejoramiento de los sistemas de control ya existentes: los métodos de control lineal confían en suponer que un modelo lineal es válido para rangos pequeños de operación. Pero cuando se requiere operar en un rango más amplio, el controlador lineal tendrá un mal desempeño o a comportarse de manera inestable, porque las no linealidades en el sistema no pueden ser compensadas de forma adecuada.

• Análisis de no linealidades: en el control lineal se supone también que el modelo del sistema puede ser linealizado. Sin embargo en los sistemas de control existen una gran cantidad de no linealidades cuya naturaleza discontinua no permite una aproximación lineal.

Figura 2-1 No linealidades: (a) fricción por Coulomb, (b) Zona muerta, (c) Saturación, (d) Histéresis

Page 21: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

ESTADO DEL ARTE

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 15

Entre estas nolinealidades se pueden mencionar: fricción por Coulomb, saturación,

zonas muertas e histéresis, las cuales se muestran en la Figura 2-1 y que generalmente

se encuentran en los problemas de la ingeniería de control. Las técnicas de análisis

nolineales deberían ser desarrollados para predecir el rendimiento del sistema en

presencia de dichas no linealidades.

• Tratar incertidumbres en el modelo: en el diseño de controladores lineales, usualmente se asume que los parámetros del modelo son razonablemente conocidos. Sin embargo muchos problemas de control involucran incertidumbres en estos parámetros, esto se debe a variaciones en el tiempo de los mismos, como por ejemplo a cambios de la presión del aire en el vuelo de un vehículo aéreo, o a cambios bruscos en los parámetros como por ejemplo en los parámetros inerciales de un robot. Las no linealidades pueden ser intencionalmente introducidas como parte del controlador de modo que el modelo con incertidumbre pueda tolerarlo, existen dos clases de controladores no lineales para este propósito: controladores robustos y controladores adaptativos.

• Simplicidad de diseño: los sistemas de control lineales pueden requerir sensores y actuadores de alta calidad para producir un comportamiento lineal en el rango de operación requerido, mientras que los sistemas de control no lineal pueden permitir el uso de componentes menos costosos con características no lineales.

Por lo tanto, en los sistemas de control no lineales se toma en cuenta las características presentes en problemas prácticos de control, lo cual brinda una comprensión más nítida del mundo real que es inherentemente no lineal.

2.2 Generalidades en el diseño de sistemas del control no lineal

En este apartado se analizan las generalidades en el diseño de sistemas de control no lineal haciendo hincapié en las diferencias que existen entre el diseño de sistemas de control no lineal con el lineal.

Para el diseño de un sistema de control se parte de un modelo matemático que representa su dinámica y de especificaciones de comportamiento deseado, partir de lo cual se construye una ley de control de tal manera que el sistema en lazo cerrado se comporte con las especificaciones deseadas. Los dos problemas básicos que se consideran son: la regulación y el seguimiento no lineal. A continuación, se discuten las especificaciones de comportamiento deseado en los sistemas de control no lineal.

2.2.1 Problemas presentes en el control no lineal

Si las tareas del sistema a controlar involucran amplios rangos y/o movimientos a alta velocidad, lo efectos no lineales serán significativos en la dinámica y en el rendimiento

Page 22: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 16

deseado. En general, las tareas a realizar por el sistema de control se lo puede dividir en dos categorías como se plantea en [1]: estabilización (o regulación) y seguimiento.

El problema de estabilización en un sistema de control consiste en mantener estable al sistema en lazo cerrado alrededor de un punto de equilibrio, algunos ejemplos de estabilización son: control altitud de un vehículo aéreo, equilibrio en un péndulo invertido, control de posición de un brazo robótico, etc.

El problema de seguimiento en un sistema de control consiste en mantener salida del sistema en una trayectoria durante un tiempo dado, como por ejemplo: mantener un vehículo aéreo volando a lo largo de una ruta deseada, hacer que un brazo robótico dibuje rectas o círculos son problemas típicos del control de seguimiento.

Problemas de estabilización

Para el problema del estabilización asintótica, dado un sistema dinámico no lineal descrito por:

�� � �(�, �, �) (2.1)

en donde se requiere obtener una ley de control � tal que, iniciando desde cualquier punto de operación, el estado � → 0 cuando � → ∞.

Uno de los problemas clásicos en el control no lineal y el cual se ha convertido en un desafío para los ingenieros de control es la familia del péndulo invertido, el cual constituye un banco de pruebas muy completo para probar y desarrollar estrategias de control. El mas estudiado de esta familia es el péndulo invertido sobre un carro [2].

Figura 2-2 Esquema del péndulo invertido sobre un carro

Page 23: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

ESTADO DEL ARTE

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 17

En la Figura 2-2 se muestra el esquema del péndulo invertido sobre un carro, en este sistema la entrada es la fuerza u, la cual se aplica al carro de masa !, lo que genera un desplazamiento horizontal �. Sobre dicho carro se encuentra una barra rígida, que gira libremente sobre su punto de apoyo con un ángulo de inclinación � y cuya masa " se la supone concentrada en un punto situado a una distancia l de su base sobre el carro.

Este tipo de sistemas aparecieron inicialmente en los años 60 del siglo pasado en los laboratorios de control de las universidades más prestigiosas. Y el reto consistía en ubicar manualmente la barra rígida en posición vertical invertida, soltarla y de forma automática realimentando su posición el péndulo continuase en posición vertical [2]. El péndulo invertido es inestable por que puede girar en cualquier momento y en cualquier dirección, a menos que se aplique una fuerza de control conveniente. El modelo matemático del péndulo invertido sobre un carro mostrado en la Figura 2-2, presenta numerosas no linealidades como se lo mostrara en los próximos capítulos.

Como es conocido en los sistemas lineales, la estabilización en bucle cerrado de un punto inestable en lazo directo no presentan mayor problema de control, estos aparecen cuando el sistema es no lineal.

Problema del seguimiento

El problema del seguimiento se lo analiza de manera similar al de estabilización para lo cual dado un sistema dinámico no lineal descrito por la Ec. (2.1) y por la salida:

# = ℎ��� (2.2)

donde para una trayectoria deseada #%, se desea encontrar una ley de control � tal que partiendo de un estado inicial, el error de seguimiento & = #��� − #%��� tiene a cero, mientras todo el estado � permanece acotado. Cuando el sistema en lazo cerrado es tal que sus estados iníciales implican un error de seguimiento de cero para todo tiempo, se dice que el sistema es capaz de seguimiento perfecto [1].

2.2.2 Especificaciones deseadas en los sistemas de control no lineal

En el control lineal, el comportamiento del sistema se puede expresar de forma sistemática ya sea en el dominio del tiempo o en el dominio de la frecuencia. De tal manera que primero se procede a cuantificar estas especificaciones del sistema de control en lazo cerrado en una región de operación de interés para luego diseñar un controlador que cumpla con estas especificaciones.

Sin embargo las especificaciones sistemáticas para sistemas no lineales no son tan evidentes debido a que la respuesta del sistema es no lineal, además de que no es posible una descripción en el dominio de la frecuencia. En relación con el comportamiento deseado en los sistemas de control no lineales se pueden considerar las siguientes características [1]:

Page 24: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 18

La estabilidad y convergencia se debe garantizar para el modelo utilizado en el diseño, ya sea en el sentido local como en el global para una región de estabilidad.

La precisión y la velocidad de respuesta pueden ser consideras para algunas trayectorias típicas de movimientos. En algunos sistemas, elegir el adecuado controlador puede garantizar la precisión y la velocidad de la respuesta independientemente de la trayectoria como es el caso del control deslizante.

La robustez es la sensibilidad a los efectos que no se consideran en el diseño como son: las perturbaciones, ruidos en la medición, dinámicas no modeladas, etc. El sistema debe ser capaz de soportar los afectos antes mencionados.

El coste del sistema considera la cantidad y tipo de sensores, actuadores y equipos necesarios para su ejecución. Los actuadores, sensores y la complejidad del controlador (coste computacional) deben ser elegidos apropiadamente para la aplicación en particular.

2.3 Técnicas de control no lineal

Para el diseño de sistemas de control no lineal no existen métodos generales pero hay técnicas alternativas o complementarias, estos métodos se aplican a determinados tipos de problemas de control no lineal.

Entre los métodos de diseño de controladores no lineales que se han desarrollado se expondrá el control de linealización por realimentación y control de estructura variable en modo deslizante.

2.3.1 Linealización por realimentación El diseño de sistemas de control mediante el método de linealización por realimentación se puede utilizar como metodología de diseño no lineal. El primer paso fundamental para el diseño de un sistema de control, es contar con un modelo matemático de la planta que represente lo más aproximado la dinámica real de dicha planta. De donde la idea de esta metodología es transformar el modelo original a un modelo equivalente más simple y a partir de este modelo simplificado aplicar las técnicas de control lineal.

Esta metodología se ha usado para una serie de problemas prácticos del control no lineal, siendo aplicable a un importante grupo de sistemas no lineales (llamados estado-entrada linealizable o sistemas de fase mínima ) [1], típicamente se requiere la medición completo del estado, esto no garantiza la robustez frente a incertidumbres en el modelo o perturbaciones.

En [3] se presenta una técnica de seguimiento a la salida para el equilibrio de un péndulo invertido con una barra el cual se muestra en la Figura 2-3. En donde, los autores en una primera instancia proceden a linealizar la realimentación del sistema a lo largo de una trayectoria mediante la técnica de linealización por retroalimentación. La realimentación no lineal completa de los estados se usa para asignar los polos del sistema. Además proponen una selección óptima de los polos mediante un regular cuadrático lineal cuando el sistema está en

Page 25: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

ESTADO DEL ARTE

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 19

equilibrio y una realimentación no lineal completa de los estados para atar estos polos cuando el sistema va a lo largo de una trayectoria.

Figura 2-3 Péndulo invertido , ECP 505 tomado de [4]

Si se considera el sistema dinámico a controlar al péndulo invertido con carro de la Figura 2-2, el cual es altamente inestable y no lineal. Su modelo matemático puede ser linealizado, considerando que se debe mantener al péndulo invertido en posición vertical, se puede

suponer que ����#����� son pequeños, de esta manera se pueden transformar algunas no

linealidades como sin��� ≅ �,cos��� ≅ 1, y ��� = 0, como se expone en [4]. Y a partir del modelo lineal se puede diseñar un controlador mediante técnicas de control lineales.

Una técnica de control lineal es el método de asignación de polos el cual ha sido implementado en [5], en el péndulo invertido sobre dos ruedas que se muestra en la Figura 2-4 que ha sido inspirado en el robot segway.

Figura 2-4 Robot Móvil T-WIP, tomado de [5]

Page 26: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 20

El control por asignación de polos del robot móvil T-WIP se ha implementado a partir del modelo matemático representando en variables de estado linealizado en el punto de operación, es decir cuando el robot se encuentra en posición vertical.

En los trabajos [6] y [7] , se presenta el péndulo invertido sobre dos ruedas ensamblado a base de Lego Mindstorms NXT que se muestra en la Figura 2-5, en donde para el desarrollo de su modelo han utilizado el método de Lagrange, para lo cual es necesario definir coordenadas generalizadas del sistema.

Figura 2-5 Péndulo invertido sobre dos ruedas, tomado de [6]

En [6] se ha implementado un servo control en el robot de la Figura 2-5, a partir del modelo en variables de estado linealizado en el punto de operación y los autores plantean el esquema de control que se muestra en la Figura 2-6.

Figura 2-6 Esquema de un servo control (Tipo PID), tomado de [6]

Donde, las ganancias /0 se las puede determinar mediante la asignación de polos o mediante

un Regulador Cuadrático Lineal, para determinar las ganancias /1 es necesario expandir los estados donde el nuevo estado es la diferencia entre la salida #���con la referencia #230 el

cual viene a ser el error, se añade un integrador para garantizar un error de posición en estado estacionario nulo y permite realizar un seguimiento de la salida, el comportamiento del servo control implementado se asemeja a un control clásico Proporcional Integral Derivativo (PID) [6].

Page 27: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

ESTADO DEL ARTE

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 21

En [7] se ha desarrollado un control PID discreto, el cual se diseña a partir del modelo en variables de estado linealizado del péndulo invertido sobre dos ruedas, el modelo ha sido discretizado utilizando el método de discretización exacta. Este control soporta ligeras perturbaciones alrededor de la posición vertical, pero requiere de ajustes en el controlador para su implementación.

El modelo dinámico del péndulo invertido sobre dos ruedas es analizado desde el punto de vista de controlabilidad y de linealización parcial por realimentación en [8]. Donde los autores han diseñado dos controladores, el primero un controlador de velocidad de dos niveles para el seguimiento de la orientación del péndulo mientras controla el ángulo de inclinación dentro de un rango especificado. El segundo controlador también de dos niveles que maneja la posición del vehículo y también mantiene al péndulo en posición vertical dentro de un rango especificado.

En [9] se presenta un robot móvil capaz de transportar equipaje a base de un péndulo invertido sobre dos ruedas, el cual se muestra en la Figura 2-7, además incorpora funciones de navegación en espacios reales.

Figura 2-7 Robot de trasporte de equipaje en base a un péndulo invertido , tomado de [9]

Donde se han desarrollado dos subsistemas de cooperación el uno para el control del balanceo y de viaje y el otro para la navegación. Los autores proponen como estrategia de control la realimentación de estados para balancear y viajar. Sin embargo se ha encontrado errores en la posición del péndulo invertido causados por desvíos en la medición del sensor giroscopio y cambios en el centro de gravedad debido a la carga del equipaje y se da como solución un reajuste de la postura a cero cuando el robot esta en un punto muerto, independiente si está o no con carga de equipaje.

2.3.2 Control de estructura variable en modo deslizante En este apartado se consideran las imprecisiones que existen en el modelado matemático del sistema, las cuales pueden provenir de inexactitudes como por ejemplo: parámetros desconocidos de la planta, o elección arbitraria de una representación simplificada de la dinámica del sistema.

Page 28: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 22

Las imprecisiones en el modelo pueden tener fuertes efectos negativos sobre los sistemas de control no lineal, estas se pueden afrontar mediante el control robusto, un enfoque que trata con habilidad estas condiciones es el control de estructura variable (VSC, variable structure control). Este control ha sido aplicado satisfactoriamente en el control de manipuladores robóticos, vehículos submarinos, transmisión de vehículos, motores eléctricos de alta eficiencia y sistemas de energía, [1].

El VSC es ampliamente utilizado en sistemas no lineales con retrasos, sistemas estocásticos, sistemas a gran escala, sistemas multivariable, etc. Una condición muy deseada en este tipo de control es elegir parámetros para seguir una línea de conmutación sin importar los parámetros originales del sistema. Sin embargo presenta problemas de ganancias muy altas y de ruido continuo (Chattering), [10].

Se puede considerar al control deslizante (SM, Slide Mode), como una combinación del VSC y el método de asignación de polos (autovalores). En el SM los estados del sistema siguen la ecuación de línea de conmutación 4��� = 0, estos es similar a el método de asignación de polos pero el SM es insensible a variaciones en los parámetros del sistema original.

El VSC se suele modelar en el plano de fase como se muestra en la Figura 2-8, el cual se basa en conmutaciones y control discontinuo para guiar la trayectoria de fase en el plano de diseño y forzándola a mantenerse sobre ella, [10].

Figura 2-8 Plano de fase aplicando el VSC de dos sistemas inestables , tomado de [10]

Un modo deslizante se define como:

��� = 4����,4 ∈ 6789 (2.3)

El cual debe ser diseñado de tal manera que reduzca el orden del sistema y en modo deslizante sea estable. Un control equivalente que garantiza que ���� = 0 se presenta en [11]:

�3:��� = −�4;�<74=���� = −4=����, �4; = 1� (2.4)

Page 29: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

ESTADO DEL ARTE

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 23

Para satisfacer la entrada es necesario agregar el termino ���� el cual es un control alternante de tal manera que la entrada queda reescrita como:

���� = �3:��� > ���� (2.5)

La idea básica y una solución simple del VSC es hacer un control que verifique:

escogiendo ���� tal que ���� = �

donde:

Si ��� ? 0 entonces � = −/

Si ��� = 0 entonces � = 0 Si ��� @ 0 entonces � = / (2-6)

Para / ? 0

Un control robusto mediante un SM basado en un VSC es implementado en [12], la superficie de deslizamiento está diseñada a partir de un LQR, donde se controla un robot móvil compuesto por un péndulo invertido sobre dos ruedas el cual se muestra en la Figura 2-9, el mismo que se conduce sobre pendientes uniformes. Además, se ha demostrado que la función de conmutación para llegar al deslizamiento es estable según el criterio de estabilidad de Lyapunov.

Figura 2-9 Robot móvil péndulo invertido sobre dos ruedas, tomado de [12]

En [13] se presenta el control en modo deslizante de un péndulo invertido sobre dos ruedas (MWIP), de donde han seleccionado este tipo de control debido robustez para sistemas nolineales, en la Figura 2-10 se muestra el sistema a controlar. De donde los autores consideran incertidumbre en los parámetros y perturbaciones externas, proponiendo el diseño de dos controladores SM el primero estabiliza al sistema, y el segundo elimina el error de seguimiento con una superficie de deslizamiento especial.

Page 30: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 24

Figura 2-10 Péndulo invertido sobre dos ruedas con sus parámetros, tomado de [13]

Un controlador SM adaptativo para equilibrar un péndulo invertido de doble eje es presentado en [14], en donde se ha obtenido el modelo matemático del sistema no lineal incluyendo las dinámicas de los actuadores a través del principio de conservación de la energía, y se ha encontrando resultados satisfactorios del control implementado frente a la existencia de incertidumbres.

2.4 Control borroso La lógica borrosa (o difusa, fuzzy logic) y su primera formalización se dio inicio en los años 60 y surge como intento de formalizar el razonamiento con incertidumbre, intentando abordar problemas definidos en términos lingüísticos y por tanto imprecisos, donde los datos se encuentran en términos cualitativos y sirve como nexo entre el mundo numérico y el impreciso. En la lógica borrosa los valores lógicos son conjuntos borrosos propuestos por Lotfi Zadeh en 1965.

Los valores lógicos corresponden a términos lingüísticos como por ejemplo: a medias, bastante, casi, poco, mucho, etc. Estos términos permiten plantear problemas de la manera como lo haría un experto humano, con lo cual se puede buscar solución a un problema no perfectamente definido por medio de un planteamiento matemático muy exacto, además que el ser humano razona empleando inexactitudes,[15].

2.4.1 Conjuntos borrosos Para entender a los conjuntos borroso es necesario compararlos con los conjuntos clásicos en donde un elemento cualquiera o bien pertenece a un conjunto o no pertenece al mismo. En los conjuntos borrosos un elemento siempre pertenece un cierto grado a un conjunto y nunca pertenece del todo al mismo.

Una definición de un subconjunto borroso = de un universo A = B�C es un conjunto de pares ordenados = = B�, DE���∀� ∈ AC, donde DE: A → H0,1I es la función de pertenencia asociada a =,[15].

Page 31: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

ESTADO DEL ARTE

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 25

El grado de pertenencia no tiene un sentido probabilístico, sino mas bien representa un grado de compatibilidad de un cierto predicado, o un grado de posibilidad que este sea cierto. En la Figura 2-11 se muestra un ejemplo donde se representan las funciones triangulares de pertenencia de varios conjuntos borrosos de temperaturas HJI del medio ambiente en base a términos lingüísticos: frio, agradable y caliente.

Figura 2-11 Conjunto borroso de temperaturas

Siendo importante definir los siguiente conceptos:

Valores semánticos: son los subconjuntos borrosos del intervalo real H0,1I siendo necesario definir para cada predicado los correspondientes subconjuntos.

Universo de discurso: conjunto de posibles valores particulares que pueden tomar las variables que intervienen en el predicado, para el ejemplo de la Figura 2-11 son los valores del eje de las abscisas, es decir el rango de variación de la temperatura de 10 - 40.

Etiquetas lingüísticas: valores semánticos correspondientes a un predicado, en el ejemplo de la Figura 2-11 existen 3 etiquetas (frio, agradable, caliente).

Funciones de pertenencia de un término lingüístico: cada término lingüístico corresponde a un subconjunto borroso que lleva asociada una función de pertenencia. Esta representa el grado de asociación de un valor numérico x con ese término.

2.4.2 Diseño de controladores borrosos

Los controladores difusos son simples y están compuesto por una etapa de entrada, una etapa de procesamiento y una de salida. La etapa de entrada o borrosificación consiste en calcular el grado de pertenencia de las variables de entrada a cada una de las etiquetas lingüísticas mediante las funciones de pertenencia, este será un número comprendido entre H0,1I para cada etiqueta. Las funciones de pertenencia pueden ser: trapezoidales (de ahí derivan en rectangulares o triangulares), exponenciales (distribución normal), polinómicas, cada una tiene sus ventajas y desventajas. La inferencia borrosa representa el peso que tendrá cada una

0 5 10 15 20 25 30 35 40 45 50

0

0.2

0.4

0.6

0.8

1

1.2

Conjuntos Borrosos

Temperatura

Fun

ción

de

Per

tene

cia

(uA

)

Frio

AgradableCaliente

Page 32: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 26

de las reglas borrosas para la conclusión final. La desborrosificación permite obtener un valor numérico de control que se determina a partir del conjunto de funciones de pertenencia de salida. En la Figura 2-12 se muestra un esquema de proceso del control borroso.

Figura 2-12 Esquema de proceso del control Borroso

En [16] se presenta las etapas de desarrollo de un controlador de lógica difusa implementado en MatLab-Simulink© para controlar un péndulo invertido, en donde han identificado algunos beneficios potenciales de la utilización de controladores borrosos: en comparación de la teoría de control moderno la lógica borrosa es más sencilla de implementar ya que elimina el proceso complejo del modelamiento matemático, en cambio utiliza un conjunto de reglas. En comparación con los controladores tradicionales PID los resultados que han obtenido muestran que el controlador de lógica difusa propuesto presenta mejores prestaciones robustas en términos máximo sobre impulso, tiempo de establecimiento y respuesta a cambios en sus parámetros.

Desde el punto de vista experimental el control en tiempo real requiere una cierta simplificación del modelo experimental, en general el control borroso se basa en la experiencia del experto (operador humano) es decir utilizan esta información heurística para el diseño del controlador del sistema dinámico no lineal. Este enfoque elimina la necesidad de un amplio conocimiento y modelización matemática del sistema. En [17], se implementa el control borroso en tiempo real del péndulo invertido que se muestra Figura 2-13.

Figura 2-13 Péndulo invertido, tomado de [17]

Page 33: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

ESTADO DEL ARTE

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 27

En donde para el diseño del controlador borroso se ha tomado como entradas al ángulo de inclinación, velocidad del péndulo y como salida la fuerza aplicada al carro, tanto para las entradas como para la salida utilizan funciones de pertenencia triangulares, 7 etiquetas lingüísticas y el mecanismo de inferencia tipo Mamdani, obteniendo en las pruebas experimentales resultados efectivos y viables del control implementado.

En [18], se presenta el diseño de un controlador difuso de un péndulo invertido sobre dos ruedas (TWIP), en la Figura 2-14 se muestra las vistas con los parámetros geométricos del sistema.

Figura 2-14 Vistas y parámetros geométricos (TWIP): (a) frontal, (b ) lateral, (c) superior, tomado de [18]

Donde el esquema de control implementado incluye tres clases de controladores borrosos, control de balanceo del péndulo ���, control de posición��� y control de dirección���. Para el control de balanceo del péndulo se parte del modelo de Takagi-Sugeno utilizando funciones de pertenencia sinusoidales y 2 etiquetas lingüísticas, a partir de este modelo se desarrolla el controlador. Para el control de posición y de dirección se utiliza la inferencia Mamdani con funciones de pertenencia triangulares y 7 etiquetas lingüísticas, encontrando que tanto en las simulaciones como en el experimento práctico, eficacia en el esquema propuesto.

2.5 Control óptimo En la teoría clásica el problema de diseño involucra conseguir especificaciones deseadas tales como: sobreoscilaciones, tiempos de establecimiento, margen de ganancia, etc. En el control óptimo se considera el problema más general, de modo que el sistema tenga un mejor comportamiento global posible. El método de diseño está conformado generalmente de dos partes, primero el planteamiento donde se define un cierto índice de coste que cuantifique ciertas características con restricciones que se requiere desde un punto de vista práctico y segundo la resolución en donde se determina el valor de un conjunto de variables que, cumpliendo las restricciones se minimice o maximice dicho índice de coste, [19].

Cuando se requiere planificar las referencias (entradas) del sistema se trata de determinar la entrada necesaria para que la trayectoria del sistema se optima en algún sentido, la búsqueda de la entrada óptima se la puede obtener a partir del Regulador Lineal Óptimo (LQR). Este al

Page 34: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 28

tratarse de un regulador también permite manejar el comportamiento del sistema para que sea lo más parecido posible al comportamiento deseado.

Para el desarrollo del LQR en el caso general se plantea el problema de determinar el control óptimo de un sistema lineal descrito en variables de estado y llevarlo desde un estado inicial ���7� = A7 al estado final ���K� = AK, minimizando un índice de coste cuadrático definido por:

L = M N����� − AK�OP������ − AK�� > ����OQ����RS�OT

OU�2.7�

donde P es una matriz semidefinida positiva y Q definida positiva, la resolución se la puede hacer mediante varias consideraciones, inicialmente se supone que el estado final es nulo para lo cual la expresión del índice de coste viene dado por:

L = M H����OP���� > ����OQ����IS�OT

OU�2.8�

Donde el esquema de control realimentado viene dado como se muestra en la Figura 2-15:

Figura 2-15 Esquema de control de un LQR

Donde la entrada � viene dada por :

� = −Z2� (2.9)

y la matriz de ganancias Z2 de realimentación está dada por:

Z2 = Q<7;OZ (2.10)

siendo necesario resolver la ecuación de Riccati, que viene dada por la expresión:

Z� O = −P − =OZ − Z= > Z;Q<7;OZ (2.11)

Page 35: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

ESTADO DEL ARTE

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 29

Si el sistema es invariante las matrices = y ; son constantes (se considera que P y Q también lo son), cuando se busca un régimen estacionario nulo en tiempo infinito (tK → ∞), la solución a la ecuación algebraica de Riccati viene dado por, [19]:

0 = −P − =OZ − Z= > Z;Q<7;OZ (2.12)

De donde se puede determinar la matriz Z, para el cálculo de las ganancias óptimas.

2.5.1 Aplicaciones del control óptimo En el trabajo [20], se analiza y simula un control LQR de un péndulo invertido a partir de su modelo matemático de primer orden obtenido a partir de la ecuación de Lagrange, donde los resultados experimentales muestran que este controlador es eficaz y robusto.

Un controlador LQR-Fuzzy para un doble péndulo invertido es desarrollado en [21], su esquema se muestra en la Figura 2-16.

Figura 2-16 Esquema de un doble péndulo invertido, tomado de [21]

Donde su modelo matemático lo han obtenido por el método de Lagrange y linealizado al sistema sobre el punto de operación, el número de reglas para el controlador de lógica difusa

es considerable (7\) debido a la variedad de entradas (�, �� , �7, ��7, �K, ��7) al sistema, por lo cual ha sido necesario reducir el número de entradas. Para resolver este problema los autores combinan la teoría de control óptimo y la estrategia de lógica difusa, planteado el diseño de una función de fusión lineal de variables de estado, transformando las múltiples variables de entrada a un error integral & y a su tasa de cambio &�, lo cual simplifica el controlador difuso reduciéndolo a (7K) reglas, los resultados que han obtenido no solo logran una buena estabilización del péndulo, además también permite el movimiento del carro del péndulo a lo largo del eje �.

En [22] se presenta el control LQR de un robot móvil en base péndulo invertido sobre dos ruedas, el cual se muestra en la Figura 2-17:

Page 36: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 30

Figura 2-17 Péndulo invertido sobre dos ruedas, tomado de [22]

Donde se parte del modelo matemático linealizado en el punto de operación, el objetivo del LQR es mantener al robot equilibrado mediante un índice de coste que minimiza el error dinámico y la energía de consumo. Para una selección óptima de las matrices P y Q del índice a minimizar en este tipo de control, les ha permitido obtener un tiempo de estabilización del sistema de 2[seg].

La técnica de control óptimo LQR y el método de control PID, ambos son usados generalmente para sistemas dinámicos lineales, en [23] se propone utilizarlos para el control de la dinámica nolineal de un péndulo invertido el cual se muestra su esquema en la Figura 2-18.

Figura 2-18 Esquema del péndulo invertido, tomado de [23]

Donde para estabilizar el péndulo en posición vertical �� = 0� y para controlar la posición del

carro ��� los autores han utilizado dos lazos de control PID, además se adiciona un control

LQR el cual ha sido diseñado a partir del modelo matemático linealizado sobre el punto de

operación, en la siguiente Figura 2-19 se muestra es esquema de control que han propuesto.

Page 37: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

ESTADO DEL ARTE

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 31

Figura 2-19 Esquema de control 2PID+LQR del sistema nolineal péndulo invertido, modificado de [23]

Tomando en cuenta que todos los estados están disponibles para su medición, en las

simulaciones implementadas en MatLab-Simulink© se ha determinado que el control 2PID-

LQR es más robusto y eficaz en comparación con un control PID.

Page 38: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

32

3. MODELADO DISCRETO DEL PÉNDULO INVERTIDO MEDIANTE EL MODELO BORROSO DE TAKAGI-SUGENO

3.1 Introducción En este apartado se presenta el modelado discreto de un péndulo invertido sobre dos ruedas a base de Lego Mindstorms mediante la estimación del modelo borroso de Takagi-Sugeno (T-S). Para el diseño de un controlador robusto y eficaz es necesario contar con un modelo preciso y eficiente. En [24] se ha desarrollado un método para identificar sistemas no lineales usando datos de entrada/salida. En [25],[26] y [27] se presentan nuevos y eficaces puntos de vista para mejorar la estimación global y local del modelo borroso de T-S.

En la Figura 3-1 se muestra la vista frontal y lateral del péndulo invertido sobre dos ruedas a base de Lego Mindstorms NXT.

Figura 3-1 Vista Frontal y lateral del sistema bajo estudio

3.2 Modelo matemático no lineal del péndulo invertido sobre dos ruedas Para la obtención del modelo matemático no lineal del sistema planteado se partirá del desarrollado en [6]. El sistema puede ser considerado de manera general mediante el esquema de la Figura 3-2, donde se muestran algunos parámetros físicos del sistema que son considerados para plantear su modelo.

Page 39: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO DEL PÉNDULO INVERTIDO MED. EL MODELO BORROSO DE T

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES

Figura 3-2 Esquema generalizado del péndulo invertido

Para obtener las ecuaciones dinámicas que describen el movimiento del sistema, se utilizan los esquemas de la Figura 3-3 donde se muestra la vista lateral y superiose especifica el sistema de coordenadas

Figura 3-3

De la Figura 3-3 se identifican los siguientes ángulos:

� : Ángulo de inclinación del sistema (

�],2: Posición angular de la rueda (l,r indica izquierda o derecha)

�^],2: Posición angular del eje del motor de corriente continua

DISCRETO DEL PÉNDULO INVERTIDO MED. EL MODELO BORROSO DE T

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM)

Esquema generalizado del péndulo invertido sobre dos ruedas

Para obtener las ecuaciones dinámicas que describen el movimiento del sistema, se utilizan 3 donde se muestra la vista lateral y superior, así como también

se especifica el sistema de coordenadas a utilizar.

3 Vista lateral y superior del sistema, tomado de [6]

se identifican los siguientes ángulos:

Ángulo de inclinación del sistema (pitch)

Posición angular de la rueda (l,r indica izquierda o derecha)

Posición angular del eje del motor de corriente continua

DISCRETO DEL PÉNDULO INVERTIDO MED. EL MODELO BORROSO DE T-S

UPM) 33

dos ruedas

Para obtener las ecuaciones dinámicas que describen el movimiento del sistema, se utilizan r, así como también

Page 40: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 34

Los parámetros físicos del péndulo invertido sobre dos ruedas en base al lego Mindstorms NXT se muestran en la Tabla 3.

Tabla 3 Parámetros físicos del sistema bajo estudio, tomado y modificado de [6]

Parámetro Unidad Descripción

_ = 9.8 ["/��K] Gravedad

m � 0.03 [/_] Peso de la rueda

Q � 0.021 ["] Radio de la rueda

Ld � "QK/2 [/_"K] Momento de inercia de la rueda

! � 0.6 [/_] Peso del cuerpo

f � 0.09 ["] Ancho del cuerpo

g � 0.05 ["] Profundidad del cuerpo

i � 0.26 ["] Altura del Cuerpo

j � i/2 ["] Distancia del centro de la masa del eje de la rueda

Lk � !jK/3 [/_"K] Momento de inercia la inclinación (pitch) del cuerpo

Ll � !(fK + gK)/12 [/_"K] Momento de inercia de la orientación (yaw) del cuerpo

L^ � 1�10<m [/_"K] Momento de inercia del motor CC

Q^ � 6.69 [Ω] Resistencia del motor CC

Zo � 0.468 [q��/��S] Constante de velocidad motor CC

ZO � 0.317 [r"/=] Constante de Torque motor CC

� � 1 Relación de transmisión

�̂ � 0.0022

Coeficiente de fricción entre el cuerpo y el motor

ft � 0

Coeficiente de fricción entre la rueda y el suelo

3.3 Ecuaciones de movimiento del sistema Las ecuaciones que describen el movimiento del péndulo invertido se obtienen mediante el método de Lagrange [6], sobre el sistema de coordenadas de la Figura 3-3:

(�, �) = u7K (�] + �2),vw (�2 − �])x (3.1)

��^,#̂ ,y^� = (z ��^S�, z #�̂ S�,Q), (��^, #�^) = �Q����,Q������

��] ,#],y]� = {�^ − wK ���, #̂ + w

K ��,y^|

��2 ,#2,y2� = {�^ + wK ���, #̂ − w

K ��,y^|

��o ,#o,yo� = (�^ + j�����, #̂ + j������,y^ + j��) (3.2)

Page 41: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO DEL PÉNDULO INVERTIDO MED. EL MODELO BORROSO DE T-S

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 35

De las coordenadas de las Ec. (3.2), se determina la energía cinética traslacional }7, la energía cinética rotacional }K y la energía potencial ~ que vienen dadas por las expresiones, [6]:

}7 = 7K"���]K > #�]K > y�]K� >

7K"���2K > #�2K > y�2K� >

7K!���oK > #�oK > y�oK�

}K = 7K Ld��]

K > 7K Ld��2

K > 7K Lk�� K >

7K Ll�� K >

7K�KL̂ ���] − �� �K >

7K�KL̂ ���2 − ���K

~ = "_y] >"_y2 >!_yo (3.3)

El Lagrangiano viene dado por la expresión:

~ = }7 + }K − ~ (3.4)

Utilizando las siguientes variables como coordenadas generalizadas:

�: Posición angular promedio de la rueda izquierda y derecha

�: Ángulo de inclinación del cuerpo del péndulo

�: Ángulo de orientación del cuerpo del péndulo

Las ecuaciones de Lagrange vienen dadas por:

�� = SS� u�j

���x − �j��

�k = SS� ��j

��� � − �j��

�l = SS� ��j

��� � − �j�� (3.5)

Evaluando las Ec. (3.5), las fuerza obtenidas son, [6]:

�� = H(2" + !)QK + 2Ld + 2�KL̂ I�� + (!jQ�� − 2�KL̂ )�� − !jQ�� K��� �k = H!jQ�� − 2�KL̂ I�� + (!jK + Ld + 2�KL̂ )�� − !_j��� − !jK�� K�����

�l = �7K "fK + Ll + wT

KvT (Ld + �KL̂ ) + !jK��K�� �� + 2!jK�� �� ����� (3.6)

Considerando el par del motor de corriente continua y la fricción viscosa, las fuerzas generalizadas vienen dadas por, [6]:

Page 42: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 36

���, �k, �l� = u�] > �2 , �k ,wKv ��2 − �]�x

�] = �ZO�] > �̂ ��� − ��]� − �d��]

�2 = �ZO�2 > �̂ ��� − ��2� − �d��2

�k = −�ZO�] − �ZO�2 − �̂ ��� − ��]� − �̂ ��� − ��2� �3.7)

donde:

i�,�: Corriente del motor de corriente continua (C.C)

No se puede utilizar directamente la corriente del motor de C.C como señal de control porque el sistema está basado en un control PWM (Modulación por Ancho de Pulso), el mismo que utiliza al voltaje como señal de control. Por lo cual se utiliza la relación entre la corriente �],2 y

el voltaje �],2. Si se desprecia la fricción interna del motor la ecuación del motor de C.C viene dada por:

j^�],2 = �],2 + Zo��� − ��],2� − Q^�],2 (3.8)

Generalmente se considera la inductancia del motor despreciable aproximadamente cero, por lo tanto las corrientes se determina mediante:

�],2 = �],2 + /o(�� − ��],2)Q" �3.9)

A partir de las Ec. (3.7), la generalización de las fuerzas pueden ser expresadas utilizando el voltaje del motor como,[6]:

�� = �(�] + �2) − 2(� + �d)�� + 2�ψ� �k = −���] > �2� > 2��� − 2���

�l = f2Q �(�] − �2) − fK

2QK (� + �d)�� �3.10)

donde:

� = �ZOQ^ , � = �ZOZoQ^ + �̂

Page 43: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO DEL PÉNDULO INVERTIDO MED. EL MODELO BORROSO DE T-S

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 37

3.3.1 Modelo no lineal del sistema Igualando las Ec. (3.6) y (3.10) se tiene:

H(2" + !)QK + 2Ld + 2�KL̂ I�� + (!jQ�� − 2�KL̂ )�� − !jQ�� K��� = �(�] + �2) −2(� + �d)�� + 2��� (3.11)

H!jQ�� − 2�KL̂ I�� + (!jK + Ld + 2�KL̂ )�� − !_j��� − !jK�� K����� =−�(�] + �2) + 2��� − 2��� (3.12) �7

K "fK + Ll + wTKvT (Ld + �KL̂ ) + !jK��K�� �� + 2!jK�� �� ����� = w

Kv �(�2 − �]) −wTKvT (� + �d)�� (3.13)

Despejando �� de la Ec. (3.12) y reemplazando en Ec. (3.11) se obtiene:

�� = N�(�] + �2) − 2(� + �d)�� + 2��� + !jQ�� K �� �R(!jQ � � − 2�KL̂ )(!jQ � � − 2�KL̂ )K − H(2" + !)QK + 2Ld + 2�KL̂ I�!jK + Lk + 2�KL̂ � −

H(2" + !)K + 2Ld + 2�KL̂ IN!_j �� � + !jK�� K �� � � � − �(�] + �2) + 2��� − 2��� R(!jQ � � − 2�KL̂ )K − H(2" + !)QK + 2Ld + 2�KL̂ I�!jK + Lk + 2�KL̂ �

Despejando �� de la Ec. (3.11) y reemplazando en Ec. (3.12) se obtiene:

�� = N!_j��� + !jK�� K����� − �(�] + �2) + 2��� − 2��� R(!jQ�� − 2�KL̂ )(!jQ�� − 2�KL̂ )K − H(2" + !)QK + 2Ld + 2�KL̂ I�!jK + Lk + 2�KL̂ � −

N!jK + Lk + 2�KL̂ RN!jQ�� K sin � + �(�] + �2) − 2(� + �d)�� + 2��� R(!jQ�� − 2�KL̂ )K − H(2" + !)QK + 2Ld + 2�KL̂ I�!jK + Lk + 2�KL̂ �

Despejando �� de la Ec. (3.13) se obtiene:

�� =f2Q �(�2 − �]) − fK

2QK (� + �d)�� + 2!jK�� �� sin � cos ��12 "fK + Ll + fK

2QK (Ld + �KL̂ ) + !jK sinK ��

Page 44: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 38

3.3.2 Modelo en variables de estado del péndulo invertido sobre dos ruedas

En la Figura 3-4 se muestran la vista frontal, superior y lateral del sistema péndulo invertido sobre dos ruedas y los parámetros angulares.

Figura 3-4 Vista frontal , superior y lateral del sistema

Se toma el vector de estados del sistema y el vector de entradas como:

A = N��� ��� ��� R� = H�7�K�����m�\I�

~ = H�] �2I� = H�7�KI�

donde:

�: Ángulo de inclinación del cuerpo del péndulo

�: Posición angular promedio de la rueda izquierda y derecha

�: Ángulo de orientación del cuerpo del péndulo

El vector ~ representa las señales de control de voltaje para el motor derecho ��K� e izquierdo ��7� del sistema. La ecuación de estado está en función de los estado y de la entrada:

A� ��� = ���, A���, ~���) (3.14)

Para la ecuación de salida se considera que todos los estados son accesibles (medibles a través de sensores ) al sistema para realizar la realimentación. Así el modelo del sistema en variables de estado viene dado por:

Page 45: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO DEL PÉNDULO INVERTIDO MED. EL MODELO BORROSO DE T-S

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 39

��7 = �K

��K = H�(�K + �7) − 2�� > �d��� > 2��K >!jQ�KK���7I�!jQ��7 − 2�KL̂ ��!jQ��7 − 2�KL̂ �K − H�2" >!�QK > 2Ld > 2�KL̂ I�!jK > Lk > 2�KL̂ � −

H(2" >!�QK > 2Ld > 2�KL^IH!_j sin�7 >!jK�\K sin �7 cos �7 − ���K > �7� > 2��� − 2��KI�!jQ��7 − 2�KL^�K − H�2" >!�QK > 2Ld > 2�KL^I�!jK > Lk > 2�KL^�

��� = ��

��� = H!_j���7 + !jK�\K���7��7 − �(�K + �7) + 2��� − 2��KI�!jQ��7 − 2�KL̂ ��!jQ��7 − 2�KL̂ �K − H�2" >!�QK > 2Ld > 2�KL̂ I�!jK > Lk > 2�KL̂ � −

N!jK > Lk > 2�KL̂ RH!jQ�KK sin �7 > ���K > �7� − 2�� > �d��� > 2��KI�!jQ��7 − 2�KL̂ �K − H�2" >!�QK > 2Ld > 2�KL̂ I�!jK > Lk > 2�KL̂ �

��m = �\

��\ =f2Q ���K − �7� −

fK2QK �� > �d��\ > 2!jK�K�\ sin �7 cos �7

�12"fK > Ll > fK

2QK �L̂ > �KL̂ � > !jK sinK �7�

De las ecuaciones anteriores se puede notar que las variables �� y �) no afectan a la variable

�� ni a la variable �� , lo cual indica que no tiene importancia la posición angular inicial de las ruedas ni la orientación inicial del sistema en su dinámica. En Figura 3-5 se muestra la implementación del modelo no lineal del péndulo invertido sobre dos ruedas en MatLab-Simulink©:

Figura 3-5 Implementación del modelo no lineal del sistema en Simulink - MatLab

Page 46: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 40

Donde:

1. Dinámica no lineal del péndulo invertido 2. Entradas al sistema (voltaje a los motores) 3. Estados iníciales del sistema 4. Visualización de los estados 5. Vector de estados

Para un estado inicial A = N��� ��� ��� R� = H0.1500000I�, aplicado al sistema de

la Figura 3-5. En la Figura 3-6 se muestra la evolución de los estados � y �� :

Figura 3-6 Respuesta del modelo nolineal del sistema en lazo directo

En la Figura 3-6 se demuestra que el sistema no lineal del péndulo invertido sobre dos ruedas es altamente inestable ante un ángulo inicial de inclinación �, convirtiéndose este ángulo en el de mayor prioridad a controlar, con el fin de estabilizar al sistema.

3.4 Estimación de los parámetros del modelo borroso de T-S El modelado mediante la identificación borrosa recibe una gran atención en el área de modelado no lineal, en especial el modelo borroso de Takagi-Sugeno (T-S) debido a su capacidad de aproximarse a cualquier modelo no lineal, [24].

Un método de optimización para mejorar la aproximación global, local y capacidad de modelado del modelo borroso de T-S se presenta en [25], donde el objetivo principal es obtener una aproximación de las funciones no lineales con un rendimiento optimizado. El principal problema a considerar en el método de identificación del modelo borroso de Takagi-Sugeno es que no se puede aplicar cuando las funciones de pertenencia se solapan por partes [26].

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.50

2

4

6

8

10

12

14

16Respuesta del sistema en lazo directo

tiempo [ seg ]

ángu

lo [

rad

]

y ve

loci

dad

[rad

/ s

eg]

Ángulo de inclinación Psi

Velocidad ángulo de inclinación

Page 47: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO DEL PÉNDULO INVERTIDO MED. EL MODELO BORROSO DE T-S

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 41

La idea básica en la estimación de los parámetros del sistema no lineal es minimizar un índice de desempeño cuadrático, y se basa en la identificación de las funciones de la forma siguiente:

�: �9 → � # = ���7, �K, … , �9�

Donde para cada regla SI - ENTONCES Q1U……1� de un sistema borroso, de tal manera que

para un sistema de orden � puede ser reescrito de la siguiente forma:

4�1U…1��:��7�!71U &�K�!K1T &….�9�!91� �3.18) ������#� � ��(1U…1�) > �7(1U…1�)�7 > �K(1U…1�)�K >⋯> �9(1U…1�)�9

La estimación borrosa de la salida viene dada por, [25]:

#� � ∑ …2U1U�7 ∑ �(1U…1�)(�)���(1U…1�) > �7(1U…1�)�7 >⋯> �9(1U…1�)�9�2�1��7 ∑ …2U1U�7 ∑ �(1U…1�)2�1��7 (�) (3.19) donde:

�(1U…1�)(�) � D71U(�7)DK1T(�K)…D91�(�9) ��D�1�(�)9��7 (3.20)

siendo D�1�(��) las distintas funciones de pertenecía las cuales se suponen conocidas que

pertenecen al conjunto borroso de !�1� , como se representa en la Figura 3-7.

Figura 3-7 Funciones de pertenencia del sistema borroso

Page 48: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 42

Para iniciar la metodología de identificación, si se tiene un conjunto de muestras entrada/salida, B�7 , �K , … , �9 , # C, los parámetros del modelo borroso pueden ser calculados como resultado de minimizar el índice,[26]:

L � ¡(#  − #� )K � ‖£ − A�‖K^ �7 (3.21)

donde:

£ � H#7#K ⋯ #̂ IO � � ���(7⋯7)�7(7⋯7)�K(7⋯7) ⋯ �9(7⋯7) ⋯ ��(2U⋯2�)⋯ �9(2U⋯2�)�O (3.22) A � ¤ �7(7⋯7)�7(7⋯7)�77 ⋯ �7(7⋯7)�97 … �7(2U⋯2�) ⋯ �7(2U⋯2�)�97⋮�(̂7⋯7)�(̂7⋯7)�7^ ⋯ �(̂7⋯7)�9^ … �(̂2U⋯2�) ⋯ �(̂2U⋯2�)�9^¦ y

β(̈©U…©ª) = w(©U…©ª)(x¨)∑ …�U©U�7 ∑ w(©U…©ª)(x¨)�ª©ª�7

(3.23)

Si A es una matriz de rango completo y se obtiene la solución como:

L = ‖£ − A�‖K = (£ − A�)O(£ − A�)

Aplicando el operador gradiente e igualando a cero para minimizar se tiene que,

∇J = −2(Y − XP)²X = AO(£ − A�) = 0

AO£ − AOA� = 0 (3.24) de esta manera los parámetros del modelo borroso están dados por:

� � (AOA)<7AO£ (3.25)

Page 49: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO DEL PÉNDULO INVERTIDO MED. EL MODELO BORROSO DE T-S

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 43

Hay que notar que en la Ec. (3.25) los parámetros del modelo borroso � se los puede

determinar siempre y cuando AOA sea invertible, [26].

3.4.1 Sintonización de parámetros del modelo borroso de T-S utilizando el método de ponderación

El método expuesto en el apartado anterior no puede ser aplicado para el caso más común de funciones de pertenencia que se muestran en la Figura 3-7, ya que presenta la existencia de infinitas soluciones para la Ec. (3.22), debido a que la matriz A tiene columnas linealmente dependiente por ende no existe su inversa, siendo imposible calcular los parámetros �, como se lo demuestra en [26].

Un enfoque efectivo y con poco costo computacional se basa en el método de ponderación de parámetros, en donde el objetivo principal es mejorar la elección del índice de rendimiento y minimizarlo, así como también convertir la matriz A en una matriz de rango completo,[26]. Este método se caracteriza por extender la función objetivo incluyendo un factor de ponderación Z y la norma del vector �.

L � ¡(#  − #� )K > Z¡��K�^ �7 � ‖£ − A�‖K > Z‖�‖K(3.26)

L = (£ − A�)O(£ − A�) + �OZ�

Aplicando el operador gradiente e igualando a cero para minimizar se tiene que,

³L = −2(£ − A�)OA + 2�OZ = 0

−X²Y + (X²X + K)P = 0

de esta manera los parámetros del modelo borroso esta dado por:

� = (AOA + Z)<7AO£ (3.27) donde

Z es una matriz diagonal que necesariamente debe tener valores diferentes a cero para garantizar que el termino AOA > Z sea invertible.

El método antes descrito se lo puede utilizar para sintonizar los parámetros del modelo borroso de T-S a partir de parámetros locales obtenidos a través de la identificación de un sistema en una región de operación [26], dándole un sentido físico al sistema.

Page 50: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 44

Si se supone que se tiene una primera estimación de los parámetros del modelo de T-S de la siguiente forma:

�� = H��� �7� �K� ⋯ �9�IO (3.28) con el fin de obtener esta primera estimación, se puede usar el método de identificación por mínimos cuadrados alrededor del punto de equilibro. Donde el objetivo es obtener una aproximación global del sistema mediante:

#� = ��� + �7��7 + �K��K + ⋯ + �9��9 (3.29) Para un conjunto de muestras del sistema entrada/salida B�7 , �K , �9 , # C, los parámetros de la aproximación global puede ser calculada minimizando el índice de desempeño cuadrático:

L = ¡(#  − #� )K = µ£ − A¶��µ^

 �7 (3.30)

donde:

£ = H£7 £K ⋯ £·IO

�� = H��� �7� �K� ⋯ �9�IO

A¶ =¹̧¹¹º

nmmm

n

n

xxx

xxx

xxx

L

MOMMM

L

L

21

22212

12111

1

1

1

»¼¼¼½ (3.31)

En este caso, si se han seleccionado el suficiente número de muestras distribuidas en la región donde se requiere obtener la aproximación, la matriz A¶ será de rango completo por lo cual la

solución es única [26] y se la puede calcular de la siguiente manera:

�� = (A¶OA¶)<7A¶O£ (3.32)

Esta primera aproximación se la puede utilizar como referencia de todos los subsistemas lineales, entonces los parámetros del modelo borroso pueden ser obtenidos minimizando:

Page 51: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO DEL PÉNDULO INVERTIDO MED. EL MODELO BORROSO DE T-S

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 45

L � ¡(#  − #� )K > Z ¡ … ¡ ¡{��(1U…1�) − ���|K9

���

2�

1��7

2U

1U�7

^

 �7(3.33)

L � ‖#  − A�‖K > Z‖� − ��‖K � (£ − A�)O(£ − A�) > (� − ��)OZ(� − ��)donde:

�� � H���� … ��IO

Aplicando el operador gradiente e igualando a cero para minimizar se tiene que:

³L = −2(£ − A�)OA + 2(� − ��)OZ = 0 −AO(£ > A�) > Z(� − ��) � 0 De esta manera los parámetros del modelo borroso utilizando la sintonización mediante el método de ponderación están dados por:

� � (AOA > Z)<7(AO£ > Z��) (3.34) donde :

Z es una matriz diagonal de ganancia y representa el grado de confianza de los parámetros

de la primera estimación, siendo posible tener diferentes factores de ponderación Z�(1U…1�) para cada uno de los parámetros ��(1U…1�) en función de la fiabilidad de los parámetros

iníciales ��� en una regla especifica, [26].

3.5 Identificación borrosa T-S multivariable Para el caso de los sistemas multivariables las funciones vectoriales vienen dadas por:

�:ℜ9 → ℜ^ # � �(�7, �K,… , �9)# ∈ ℜ^Esta función es equivalente a la función escalar de orden ":

#� � ��(�7, �K,… , �9)# ∈ ℜ^¾ � 1… "

Page 52: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 46

y cada una de esta funciones pueden ser modeladas con un sistema borroso como:

4�(1U…1�): ��7�!�71U &�K�!�K1T &….�9�!�91� (3.35)

������#�� � ���(1U…1�) + ��7(1U…1�)�7 + ��K(1U…1�)�K + ⋯ + ��9(1U…1�)�9

Aplicando la formulación anterior para cada uno de los modelos, se puede obtener el caso básico:

£� = N#�7#�K ⋯ #�^RO �� � ����(7⋯7)��7(7⋯7)��K(7⋯7) ⋯ ��9(7⋯7) ⋯ ���(2U⋯2�) ⋯ ��9(2U⋯2�)�O (3.36) A� � ¿ ��7(7⋯7)��7(7⋯7)�77 ⋯ ��7(7⋯7)�97 … ��7(2U⋯2�) ⋯ ��7(2U⋯2�)�97⋮��·(7⋯7)��·(7⋯7)�7· ⋯ ��·(7⋯7)�9· … ��·(2U⋯2�) ⋯ ��·(2U⋯2�)�9·À L� � µ£� − A���µK > Z�µ�� − ���µ (3.37) Es muy usual en el modelado borroso T-S, que los conjuntos borrosos de todos los subsistemas sean los mismos [28], por lo cual se cumple que:

A7 � AK � A�… = A Además, si la matriz de ponderación Z�(1U…1�) es la misma para todos los subsistemas, los

parámetros del modelo borroso de T-S será el mismo que el caso escalar de la Ec. (3.34), siendo entonces agrupadas de la siguiente manera:

H�7�K … �̂ I = (AOA + Z)<7(AOH£7£K … £̂ I + ZH�7��K�… �^�I)(3.38) El objetivo es diseñar un controlador para un sistema no lineal cuyos estados son accesibles, de donde para un sistema dinámico cuyo modelo discreto es el siguiente:

�(/ > 1) � ���(/), �(/)�� ∈ ℜ9� ∈ ℜ^Aplicando el método de estimación anterior se obtiene el modelo borroso T-S, el cual puede ajustarse como:

Page 53: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO DEL PÉNDULO INVERTIDO MED. EL MODELO BORROSO DE T-S

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 47

4(1U…1�):��7(/)�!71U &�K(/)�!K1T &….�9(/)�!91� (3.39)

�������(/ > 1) � ��(1U…1�) + =(1U…1�)�(/) + ;(1U…1�)�(/)

��(1U…1�)Áℜ9, =(1U…1�)Áℜ989, ;(1U…1�)Áℜ98^

Donde !71U(�7 � 1,2, … , �7) son conjuntos borrosos para �7(/), !K1U(�7 = 1,2, … , �7) son

conjuntos borrosos para �K(/) y !91U(�7 = 1,2, … , �7) son conjuntos borrosos para �9(/). El sistema borroso se describe como:

�(/ + 1) = ∑ …2U1U�7 ∑ �(1U…1�)(�(/))N��(1U…1�) + =(1U…1�)�(/) + ;1U…1�)�(/)R2�1��7∑ …2U1U�7 ∑ �(1U…1�)2�1��7 (�) (3.40)

el cual es equivalente al sistema, [25].

�(/ > 1) � ����(/)� > =��(/)��(/) > ;��(/)��(/)(3.41)3.6 Implementación de la identificación borrosa T-S en Simulink-

MatLab© del péndulo invertido sobre dos ruedas

Para la implementación de la identificación borrosa T-S del péndulo invertido sobre dos ruedas se toma como variables de entrada y variables de salida:

A � N��� ��� ��� R� � H�7�K�����m�\I�

~ � H�] �2I� � H�7�KI�

Como se indico en el apartado 3.3.2 las variables (�#�) no afectan a la variable �� ni a la

variable �� , con esta consideración el modelo borroso de T-S viene dado por:

4(1U…1�):��7(/)�!71U &�K(/)�!K1T &��(/)�!�1 &�\(/)�!�1Ã

�������(/ > 1) � ��(1U…1Ã) + =(1U…1Ã)�(/) + ;(1U…1Ã)�(/)

donde:

Page 54: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 48

�Áℜ\,� ∈ �K,�� ∈ �\8K,= ∈ �\8\,; ∈ �\8K

Usando la metodología propuesta es necesario contar con un conjunto de muestras entrada/salida, B�7 , �K , … , �9 , # C para lo cual a partir del modelo implementado en la Figura 3.5 y su modelo general que se muestra en la Figura 3.8.

Figura 3-8 Modelo general implementado en MatLab©

Donde se tiene como entradas a los estados iníciales y los voltajes para los servomotores del sistema, los cuales fueron generados de forma aleatoria dentro de un rango de operación y se tomaron 2000 muestras por cada variable de entrada y como salidas se tiene la evolución de los estados en un tiempo de muestreo de 0.01H�_I. En la Tabla 4 se muestran los rangos de operación de las muestras.

Tabla 4 Rango de las muestras

Entrada Variable Rango Unidad

�7 � �− Ä12 ,Ä12� [��SI

�K �� H−1,1I H��S/�_I �� � H−2Ä, 2ÄI H��SI �� �� H−10,10I H��S/�_I �m � H−2Ä, 2ÄI H��SI �\ �� H−1,1I H��S/�_I �7 �] H−10,10I H����I �K �2 H−10,10I H����I

Ahora es necesario definir los conjuntos borrosos, para lo cual el universo de discurso del

ángulo de inclinación � es de H<Å7K ,<Å7KI, donde se tienen funciones de pertenencia triangulares

para esta variable como se muestra en la Figura 3-9.

Page 55: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO DEL PÉNDULO INVERTIDO MED. EL MODELO BORROSO DE T-S

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 49

Figura 3-9 Funciones de pertenencia del ángulo ψ

El universo de discurso de la velocidad del ángulo de inclinación �� es de H−1, 1I, donde se tienen funciones de pertenencia triangulares para esta variable como se muestra en la Figura 3-10.

Figura 3-10 Funciones de pertenencia de la velocidad del ángulo de inclinación

El universo de discurso de la velocidad de la posición angular �� es de H−5, 5I, donde se tienen funciones de pertenencia triangulares para esta variable como se muestra en la Figura 3-11.

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5

0

0.2

0.4

0.6

0.8

1

Conjuntos Borrosos Ángulo Phi

[ rad ]

Fun

ción

de

Per

tene

cia

M11

M21M31

-2 -1.5 -1 -0.5 0 0.5 1 1.5 2

0

0.2

0.4

0.6

0.8

1

Conjuntos Borrosos velocidad Ángulo Psi

[ rad/seg ]

Fun

ción

de

Per

tene

cia

M12

M22M32

Page 56: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 50

Figura 3-11 Funciones de pertenencia de la velocidad de la posición angular

El universo de discurso de la velocidad del ángulo de orientación �� es de H−1, 1I, donde se tienen funciones de pertenencia triangulares para esta variable como se muestra en la Figura 3-12.

Figura 3-12 Funciones de pertenencia de la velocidad del ángulo de orientación

El objetivo es llevar al péndulo invertido a su posición de equilibrio es decir �7 = �K = 0, con esta consideración y con la metodología planteada es necesario encontrar una primera estimación para sintonizar los parámetros del modelo borroso de T-S, de donde para este fin se utilizada el método clásico de mínimos cuadrados planteado en el apartado 3.4.1, siendo necesario utilizar intervalos en las variables más cercanos al punto de equilibrio así se tiene:

-8 -6 -4 -2 0 2 4 6 8

0

0.2

0.4

0.6

0.8

1

Conjuntos Borrosos velocidad Ángulo Theta

[ rad/seg ]

Fun

ción

de

Per

tene

cia

M13

M23M33

-2 -1.5 -1 -0.5 0 0.5 1 1.5 2

0

0.2

0.4

0.6

0.8

1

Conjuntos Borrosos velocidad Ángulo Phi

[ rad/seg ]

Fun

ción

de

Per

tene

cia

M14

M24M34

Page 57: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO DEL PÉNDULO INVERTIDO MED. EL MODELO BORROSO DE T-S

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 51

�7 ∈ �− Ä40 , Ä

40� �K,�,\ ∈ H−0.5, 0.5I��,m ∈ �−Ä4 , Ä4� El modelo de la primera aproximación del sistema se la obtiene con un tiempo de muestreo de } � 0.01H�_I en el intervalo anterior y viene dado por:

�(/ + 1) =¹̧¹¹¹¹¹º

0.12860.0004-0.00030.00080.0009-0.0308

0.004210000.0003-

0.00040.00010.13350.0004-0.85671.2091-

000.003210.00670.0102

0.0001-0.00010.12080.00030.88380.7187

000.000900.00911.0041

»¼¼¼¼¼¼½

�(/) +¹̧¹¹¹¹º

4122.04132.0

0027.00027.0

8422.08422.0

0066.00066.0

1173.01174.0

0009.00009.0

−−

−−−−

»¼¼¼¼¼½

�(/)

La medida de confiabilidad del sistema identificado se lo realiza mediante la determinación del error cuadrático medio el cual viene dado por la expresión:

!4Æ � 1�¡(#�1 − #1)K91�7 (3.42)

donde

� : numero de muestras#�1 : vector de valores estimados#1 : vector de valores reales

De esta manera el error cuadrático medio obtenido para cada una de las seis salidas del sistema identificado son:

!4Æ � N 0.034905-1.3232e0.000806-1.1770e0.0002 06-3.2339e R De donde el error cuadrático medio obtenido tiene valores aceptables, de esta manera se da como valida a la identificación.

Al tener cuatro conjuntos borrosos cada uno con tres etiquetas lingüísticas para cada uno se obtienen 81 reglas por lo tanto se tendrán la misma cantidad de subsistemas lineales, a continuación se muestran algunos subsistemas obtenidos mediante la estimación del modelo borroso de T-S, utilizando una matriz de ponderación de Z � 0.01 de ganancia se tiene:

Page 58: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 52

4(7777):�(�7�!77)&(�K�!K7)&(���!�7)&(�\�!�7)

�(/ > 1) � ¹̧¹¹¹¹º

0429.0

0002.0

1195.0

0006.0

0478.0

0002.0

−−

»¼¼¼¼¼½>¹̧¹¹¹¹¹º

0.39710.02720.01110.0472-0.0756-0.0152-

0.00571.00020.00010.0004-0.0005-0

0.0347-0.01620.12920.03940.82051.0402-

00.00010.00331.00020.00610.0078

0.01210.0056-0.12200.0157-0.910.6374

000.00090.0001-0.00921.0034

»¼¼¼¼¼¼½�(/) > ¹̧¹¹

¹¹º3869.03881.0

0024.00024.0

8374.08386.0

0065.00065.0

1148.01157.0

0009.00009.0

−−

−−−−

»¼¼¼¼¼½�(/)

4(777K):�(�7�!77)&(�K�!K7)&(���!�7)&(�\�!�K)

�(/ > 1) � ¹̧¹¹¹¹º

3668.0

0027.0

2069.0

0013.0

0762.0

004.0

−−

−−

»¼¼¼¼¼½>¹̧¹¹¹¹¹º

0.01760.00650.0464-0.00670.01180.2825-

0.003710.0003-00.00010.0025-

0.0566-0.0042-0.16830.0132-0.81521.2047-

0.0004-00.00350.99980.00630.0078

0.02550.00160.10800.00630.90290.6922

0.000100.000900.00921.0035

»¼¼¼¼¼¼½�(/) > ¹̧¹¹

¹¹º3789.03817.0

0023.00023.0

8355.08376.0

0065.00065.0

1147.01155.0

0009.00009.0

−−

−−−−

»¼¼¼¼¼½�(/)

4(����):�(�7�!7�)&(�K�!K�)&(���!��)&(�\�!��)

�(/ > 1) � ¹̧¹¹¹¹º

0680.0

0005.0

1091.0

0002.0

0412.0

001.0

−−

»¼¼¼¼¼½>¹̧¹¹¹¹¹º

0.0038-0.0399-0.0007-0.01100.0626-0.3059-

0.00350.9998000.0005-0.0027-

0.10280.00400.11980.00550.94971.2511-

0.00070.00010.00321.00010.00740.0091

0.0445-0.0015-0.12570.0018-0.84500.7166

0.0002-00.000900.00891.0038

»¼¼¼¼¼¼½�(/) > ¹̧¹¹

¹¹º3945.03777.0

0024.00023.0

8423.08398.0

0065.00065.0

1178.01161.0

0009.00009.0

−−

−−−−

»¼¼¼¼¼½�(/)

De esta manera determinando el error cuadrático medio obtenido para cada una de las seis salidas del sistema identificado mediante el modelado borroso de T-S con sintonización de parámetros se tiene:

!4Æ � N 0.001606-1.4832e0.000507-6.3146e0.0001 06-1.9662e R Los valores obtenidos del error cuadrático medio son aceptables dando como válida la identificación planteada.

Page 59: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

53

4. DISEÑO DEL CONTROL ÓPTIMO Y SIMULACIÓN EN MATLAB© DEL PÉNDULO INVERTIDO SOBRE DOS RUEDAS

4.1 Introducción Una vez determinado el modelo no lineal del péndulo invertido sobre dos ruedas mediante la identificación borrosa de T-S es necesario plantear una estrategia de control. Una posibilidad es el control mediante realimentación de estados, en esta metodología se plantea seleccionar polos en lazo cerrado en la parte negativa del semiplano complejo s. Si la parte real negativa es grande esto hace que la respuesta dinámica del sistema sea rápida pero la acción de control estará fuera del rango permisible, lo cual puede generar que el sistema se comporte de manera inestable.

Una selección de estos polos en lazo cerrado de manera óptima permitirá obtener un consenso entre las variables del sistema y las acciones de control. Junto con la metodología de identificación planteado en el capítulo 3 el conocido LQR puede ser una opción, el cual permitirá el equilibro entre el comportamiento estático y dinámico del sistema con acciones de control admisibles.

4.2 Diseño del control óptimo mediante un LQR discreto En el capítulo 3 se obtuvo un conjunto de subsistemas lineales mediante la metodología de identificación borrosa, cada subsistema obtenido viene dado por:

�(/ + 1) = ����(/)� + =��(/)��(/) + ;��(/)��(/)

de donde las matrices son determinadas por el sistema borroso mediante:

4(1U…1�):4��7(/)�!71U &�K(/)�!K1T &… &�9(/)�!91� (4.1)

�������� � ��(1U…1�)&= � =(1U…1�)&; � ;(1U…1�)

De tal manera que se han obtenido 81 subsistemas lineales discretos, determinados con un tiempo de muestro de } = 0.01H�_I. Cada subsistema vienen dado por:

�(/ + 1) = H��I + H=I�(/) + H;I�(/) (4.2)

Page 60: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

DISEÑO DEL CONTROL ÓPTIMO

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 54

El objetivo es encontrar una acción de control �(/) para llevar al sistema desde cualquier condición inicial �(/�) a un estado final �(/7) = 0 en un intervalo de tiempo. La acción de control implementada viene dada por la expresión:

�(/) = −Z�(/) (4.3)

donde

Z:es la matriz de realimentación de estados

Para determinar de la matriz Z de realimentación de estados se partirá minimizando el índice de rendimiento que viene dado por:

L � ¡ �O(/ > 1)P�(/ > 1) > �O(/)Q�(/) U<7 � Ç (4.4)

donde

Siendo P ∈ �989 una matriz simétrica, por lo menos semidefinida positiva y Q ∈ �^8^ también una matriz simétrica semidefinida positiva. La elección óptima de estas matrices determinara la velocidad de la dinámica del sistema, así como también la amplitud de las variables y de la acción de control.

Remplazando la Ec. (4.3) en Ec. (4.2) tenemos que:

�(/ + 1) = �� + =�(/) − ;Z�(/) = �� + (= − ;Z)�(/) (4.5)Con el fin de garantizar un error de estado estacionario de cero la solución más adecuada es agregar una acción de control integral de la señal del error [28]. Se tiene un vector de referencias �2 y se propone añadir nuevos " estados que vienen dados por la siguiente expresión:

�(/ > 1) � �(/) > �2 − �(/ > 1) (4.6)Remplazando la Ec. (4.2) en Ec. (4.6) se tiene que:

�(/ > 1) � �(/) > �2 − ��� > =�(/) > ;�(/)� �(/ > 1) � �(/) > �2 − �� − =�(/) − ;�(/) (4.7)

Lo cual daría lugar a una ecuación de estado extendida expresada como:

Page 61: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 55

��(/ + 1)�(/ + 1)� = �−���� � + �È −=0 = � ��(/)

�(/) � + �−;; � �(/) + �È0� �2 (4.8)

Donde para continuar con el análisis se cambiara la nomenclatura de la matrices del sistema ampliado, quedando de la siguiente forma:

�É = ��(/ + 1)�(/ + 1)� , =É � �È −=0 = � , �É(/) ��(/)�(/)� , ;É � �−;; �

Si el sistema tiene un objetivo estable �2 y se propone definir un controlador que minimice el índice de rendimiento:

L � ¡ ���2 − �(/)�OP8��2 − �(/)� > �(/)OPd�(/) > �O(/)Q�(�)�∞

 ��

Si se tiene un estado de referencia ampliado �2É � H0 �2I y minimizando el índice:

L � ¡���2É − �É(/)�O �Pd 00 P8� ��2É − �É(/)� + �O(/)Q�(�)� (4.9)∞

 ��

Seleccionando matrices comunes Pd, P8, Q para cada una de los subsistema de la regla:

4(1U…1�):4��7(/)�!71U &�K(/)�!K1U &… &�9(/)�!91U �������(/ > 1) � ��(1U…1�) + =(1U…1�)�(/) + ;(1U…1�)�(/)

se obtienen las matrices ZÉ(1U…1�) de realimentación, donde a cada matriz ZÉ(1U…1�) =

NZd(1U…1�) Z8(1U…1�)R se la determina resolviendo la conocida ecuación de Riccati.

De esta manera la acción de control viene dada por:

�(/) = ZÉ(�2É − �É) = HZd Z8I u� 0�2� − ��(/)�(/) �x

donde:

ZÉ � ¡ … ¡ �(1U…1�)ZÉ(1U…1�)2�

1��7

2U

1U�7(4.10)

Page 62: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

DISEÑO DEL CONTROL ÓPTIMO

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 56

Siendo �(1U…1�) determinada de forma análoga a la de Ec. (3.23), así se obtiene como acción de control:

�(/) = −Zd�(/) + Z8��2 − �(/)� (4.11)

La Ec. (4.11) se asemeja al bien conocido controlador PI (Proporcional Integral), con lo cual se ha logrado obtener una versión óptima del mismo.

La acción de control integral elimina posibles perturbaciones en el sistema, por otro lado el

termino afín ��(1U…1�) puede ser considerando como una perturbación el cual será compensado

por la acción de control, [28].

4.2.1 Implementación del LQR discreto En el apartado anterior a partir de los subsistemas lineales se procede a determinar una realimentación óptima mediante un LQR para cada uno de ellos. Cada subsistema lineal viene dado por:

�(/ + 1) = =�(/) + ;�(/) (4.12)

donde se desea pasar desde un estado �(0) = �� a un estado �(r) = 0, minimizando un índice de rendimiento:

L = ¡H�O(/)P�(/) + �O(/)Q�(/)I·

�� (4.13)

Para solucionar el problema se emplea el Principio de Optimalizad, aplicando de forma iterativa en orden inverso, por lo cual se plantea una solución general la cual se obtiene aplicando de forma iterativa como se indica en [19].

Z(�) = HQ + ;O�(� + 1);I<7;O�(� + 1)= (4.14)

�(�) = P + ZO(�)QZ(�) + H= − ;Z(�)IO�(� + 1)H= − ;Z(�)I (4.15)

El cálculo iterativo se inicia con �(r) = P y Z(r) = 0, se lo realiza en orden inverso a la trayectoria, es decir comenzando por �(r − 1) y terminando en �(0).

La sucesión iterativa Z(r − 1), Z(r − 2), … , Z(2), Z(1), Z(0) es convergente cuando r → ∞ y por lo tanto en el limite el control será una realimentación invariante óptima del estado:

Page 63: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 57

�∗ = −Z�(�) (4.16)

Desde el punto de vista numérico no se puede realizar infinitas iteraciones, el objetivo es verificar la convergencia de la matriz Z, por lo cual se define una condición de convergencia en el método iterativo que viene dado por:

‖Z· − Z·<7‖ < Ì‖Z·‖(4.17)

donde Ì permite calibrar la condición de convergencia.

Para la implementación del controlador óptimo mediante un LQR, se parte del sistema ampliado y minimizando el índice rendimiento de la Ec. (4.9), el objetivo es encontrar una relación óptima entre las variables del sistema y la acción de control de esta manera se tiene :

Pd =¹̧¹¹¹¹º

100000

010000

001000

000100

000010

000001

»¼¼¼¼¼½

, P8 =¹̧¹¹¹¹º

100000

010000

001000

000100

00001000

000001000

»¼¼¼¼¼½

, Q = �5000 00 5000�

Donde como se puede apreciar se le da prioridad a las acciones de control ya que se encuentran restringidas físicamente a un rango de operación, además se da prioridad al ángulo de inclinación del péndulo invertido sobre dos ruedas y su velocidad de inclinación con el fin de mantenerlo controlado en el punto de equilibrio.

De esta manera para un Ì = 0.0001 y aplicando el método iterativo para el subsistema que viene dado por:

4(7777):4�(�7�!77)&(�K�!K7)&(���!�7)&(�\�!�7)

�(/ > 1) �¹̧¹¹¹¹º

0.39710.02720.01110.0472-0.0756-0.0152-

0.00571.00020.00010.0004-0.0005-0

0.0347-0.01620.12920.03940.82051.0402-

00.00010.00331.00020.00610.0078

0.01210.0056-0.12200.0157-0.910.6374

000.00090.0001-0.00921.0034

»¼¼¼¼¼½�(/) > ¹̧¹¹

¹º3869.03881.0

0024.00024.0

8374.08386.0

0065.00065.0

1148.01157.0

0009.00009.0

−−

−−−−

»¼¼¼¼½ �(/)

donde la matriz de ganancias óptimas acorde al índice de desempeño planteado viene dado por:

Page 64: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

DISEÑO DEL CONTROL ÓPTIMO

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 58

�Z�7Z�K� = Í0056.03097.13097.11470.14940.99748.7200064.000060.000

0051.03407.12992.11299.14178.93979.7200065.000059.000

−−−−−−−−−−− Î

La primera fila es el vector de ganancias óptimas tanto para la vector de errores como para el vector de estados, necesarios en la realimentación de la acción de control u7 (voltaje de entrada para el motor izquierdo del sistema). De la misma forma la segunda fila pero para la acción de control uK (voltaje de entrada para el motor derecho del sistema). En la Figura 4-1 se muestra la convergencia de la matriz de ganancia de los estados del sistema tanto para las acciones de control �7 y �K:

Figura 4-1 Evolución de ganancias K:(a) acción de control u1 (b) acción de control u2

4.3 Simulación del Controlador Óptimo En este apartado se presentan los resultados obtenidos del control implementado en el péndulo invertido sobre dos rueda en base a Lego Mindstorms NXT, el mismo que se encuentra implementado en Simulink-MatLab©. En la Figura 4-2 se muestra el esquema del sistema de control implementado:

Figura 4-2 Sistema de control implementado en Simulink-MatLab©

En donde se ha incluido un bloque de saturación debido a que el voltaje de entrada a los motores del sistema tienen un rango de operación de -10 [v] a 10 [v] y además de un bloque

0 50 100 150 200 250 300 350 400 450-60

-40

-20

0

20

gana

ncia

(a)

K1K2

K3

K4

K5K6

0 50 100 150 200 250 300 350 400 450-100

-50

0

50

iteraciones

gana

ncia

(b)

K1K2

K3

K4

K5K6

Page 65: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 59

retenedor de orden cero (ZOH) y un muestreador los cuales permiten simular como un sistema discreto.

A continuación se presenta las pruebas de simulación en MatLab© del sistema bajo estudio:

4.3.1 Pruebas con estados iníciales no nulas Como se había indicado los estados del péndulo invertido sobre dos ruedas son � =H��� ��� ��� IO, de donde el estado crítico a controlar es � al cual se debe mantenerlo en � � 0, es decir en posición vertical.

Para estados iníciales �� � H0.200000IO y estados finales nulos. En las siguientes figuras se muestran las evoluciones de los estados del sistema y de las acciones de control.

En la Figura 4-3 se muestra la evolución del ángulo de inclinación � y la velocidad del ángulo

de inclinación �� del sistema.

Figura 4-3 Evolución deψ y Ð� para estados iníciales no nulos

En la Figura 4-4 se muestra la evolución de la posición angular � y la velocidad de la posición

angular �� .

0 2 4 6 8-0.1

-0.05

0

0.05

0.1

0.15

0.2

0.25Ángulo de inclinacion Psi

tiempo [ seg ]

ángu

lo [

rad

]

0 2 4 6 8-2.5

-2

-1.5

-1

-0.5

0

0.5Velocidad Ángulo de inclinacion Psi

tiempo [ seg ]

velo

cida

d [

rad/

seg

]

Page 66: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

DISEÑO DEL CONTROL ÓPTIMO

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 60

Figura 4-4 Evolución de θ y Ò� para estados iníciales no nulos

En la Figura 4-5 se muestra la evolución de ángulo de orientación � y la velocidad del ángulo

de orientación �� .

Figura 4-5 Evolución ϕ y Ô� para estados iníciales no nulos

En la Figura 4-6 se muestra la evolución de las acciones de control u7 (voltaje motor izquierdo) y uK (voltaje motor derecho) del sistema.

0 2 4 6 8-1

-0.5

0

0.5

1

1.5

2

2.5

3Posición angular Theta

tiempo [ seg ]

ángu

lo [

rad

]

0 2 4 6 8-5

0

5

10

15

20Velocidad posición angular Theta

tiempo [ seg ]ve

loci

dad

[ ra

d/se

g ]

0 2 4 6 8-5

0

5

10

15

20x 10

-3 Ángulo de orientación Fi

tiempo [ seg ]

ángu

lo [

rad

]

0 2 4 6 8-0.05

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4Velocidad ángulo de orientación Fi

tiempo [ seg ]

velo

cida

d [

rad/

seg

]

Page 67: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 61

Figura 4-6 Evolución acciones de control u1 y u2 para estados iníciales no nulos

Para estados iníciales x� � H0.201.5010I² y estados finales nulos. En la Figura 4-7 se

muestra la evolución del ángulo de inclinación � y la velocidad del ángulo de inclinación �� .

Figura 4-7 Evolución de ψ y Ð� para estados iníciales no nulos

En la Figura 4-8 se muestra la evolución de la posición angular � y la velocidad de la posición

angular �� .

0 2 4 6 8-4

-2

0

2

4

6

8

10Acción de control U1

tiempo[ seg ]

volta

je [

V ]

0 2 4 6 8-4

-2

0

2

4

6

8

10Acción de control U2

tiempo [ seg ]vo

ltaje

[ V

]

0 2 4 6 8-0.1

-0.05

0

0.05

0.1

0.15

0.2

0.25Ángulo de inclinacion Psi

tiempo [ seg ]

ángu

lo [

rad

]

0 2 4 6 8-2.5

-2

-1.5

-1

-0.5

0

0.5Velocidad Ángulo de inclinacion Psi

tiempo [ seg ]

velo

cida

d [

rad/

seg

]

Page 68: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

DISEÑO DEL CONTROL ÓPTIMO

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 62

Figura 4-8 Evolución de θ y Ò� para estados iníciales no nulos

En la Figura 4-9 se muestra la evolución de ángulo de orientación � y la velocidad del ángulo

de orientación �� .

Figura 4-9 Evolución ϕ y Ô� para estados iníciales no nulos

En la Figura 4-10 se muestra la evolución de las acciones de control u7 (voltaje motor izquierdo) y uK (voltaje motor derecho) del sistema:

0 2 4 6 8 10-2

-1

0

1

2

3

4

5Posición angular Theta

tiempo [ seg ]

ángu

lo [

rad

]

0 2 4 6 8 10-10

-5

0

5

10

15

20Velocidad posición angular Theta

tiempo [ seg ]ve

loci

dad

[ ra

d/se

g ]

0 2 4 6 8 10-0.2

0

0.2

0.4

0.6

0.8

1

1.2Ángulo de orientación Fi

tiempo [ seg ]

ángu

lo [

rad

]

0 2 4 6 8 10-1.6

-1.4

-1.2

-1

-0.8

-0.6

-0.4

-0.2

0

0.2Velocidad ángulo de orientación Fi

tiempo [ seg ]

velo

cida

d [

rad/

seg

]

Page 69: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 63

Figura 4-10 Evolución acciones de control u1 y u2 para estados iníciales no nulos

4.3.2 Pruebas con condiciones finales no nulas Para estados iníciales nulos y estados finales no nulos �0 = H001.5020IO. En la Figura

4-11 se muestra la evolución del ángulo de inclinación � y la velocidad del ángulo de

inclinación �� .

Figura 4-11 Evolución de ψ y Ð� para estados finales no nulos

En la Figura 4-12 se muestra la evolución de la posición angular � y la velocidad de la

posición angular �� .

0 2 4 6 8 10-4

-2

0

2

4

6

8

10Acción de control U1

tiempo[ seg ]

volta

je [

V ]

0 2 4 6 8 10-5

0

5

10Acción de control U2

tiempo [ seg ]vo

ltaje

[ V

]

0 2 4 6 8 10-0.005

0

0.005

0.01

0.015

0.02

0.025Ángulo de inclinacion Psi

tiempo [ seg ]

ángu

lo [

rad

]

0 2 4 6 8 10-0.1

0

0.1

0.2

0.3

0.4

0.5

0.6Velocidad Ángulo de inclinacion Psi

tiempo [ seg ]

velo

cida

d [

rad/

seg

]

Page 70: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

DISEÑO DEL CONTROL ÓPTIMO

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 64

Figura 4-12 Evolución de θ y Ò� para estados finales no nulos

En la Figura 4-13 se muestra la evolución de ángulo de orientación � y la velocidad del

ángulo de orientación �� .

Figura 4-13 Evolución ϕ y Ô� para estados finales no nulos

En la Figura 4-14 se muestra la evolución de las acciones de control u7 (voltaje motor izquierdo) y uK (voltaje motor derecho) del sistema:

0 2 4 6 8 10-0.5

0

0.5

1

1.5

2Posición angular Theta

tiempo [ seg ]

ángu

lo [

rad

]

Ángulo

Referencia

0 2 4 6 8 10-3

-2

-1

0

1

2

3Velocidad posición angular Theta

tiempo [ seg ]ve

loci

dad

[ ra

d/se

g ]

0 2 4 6 8 100

0.5

1

1.5

2

2.5

tiempo [ seg ]

ángu

lo [

rad

]

Ángulo de orientación Fi

Ángulo

Referencia

0 2 4 6 8 10-0.5

0

0.5

1

1.5

2

2.5Velocidad ángulo de orientación Fi

tiempo [ seg ]

velo

cida

d [

rad/

seg

]

Page 71: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 65

Figura 4-14 Evolución acciones de control u1 y u2 para estados finales no nulos

4.3.3 Pruebas con condiciones iníciales y finales no nulas Para estados iníciales �� = H−0.150 − 0.50 − 10IO y estados finales �0 =H00101.50IO. Figura 4-15 se muestra la evolución del ángulo de inclinación � y la

velocidad del ángulo de inclinación �� .

Figura 4-15 Evolución de ψ y Ð� para estados iníciales y finales no nulos

En la Figura 4-16 se muestra la evolución de la posición angular � y la velocidad de la

posición angular �� .

0 2 4 6 8 10-4.5

-4

-3.5

-3

-2.5

-2

-1.5

-1

-0.5

0

0.5Acción de control U1

tiempo[ seg ]

volta

je [

V ]

0 2 4 6 8 10-0.5

0

0.5

1

1.5

2

2.5

3

3.5Acción de control U2

tiempo [ seg ]vo

ltaje

[ V

]

0 2 4 6 8 10-0.15

-0.1

-0.05

0

0.05

0.1Ángulo de inclinacion Psi

tiempo [ seg ]

ángu

lo [

rad

]

0 2 4 6 8 10-0.5

0

0.5

1

1.5

2

2.5Velocidad Ángulo de inclinacion Psi

tiempo [ seg ]

velo

cida

d [

rad/

seg

]

Page 72: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

DISEÑO DEL CONTROL ÓPTIMO

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 66

Figura 4-16 Evolución de θ y Ò� para estados iníciales y finales no nulos

En la Figura 4-17 se muestra la evolución de ángulo de orientación � y la velocidad del

ángulo de orientación �� .

Figura 4-17 Evolución ϕ y Ô� para estados iníciales y finales no nulos

En la Figura 4-18 se muestra la evolución de las acciones de control u7 (voltaje motor izquierdo) y uK (voltaje motor derecho) del sistema.

0 2 4 6 8 10-2.5

-2

-1.5

-1

-0.5

0

0.5

1

1.5

2Posición angular Theta

tiempo [ seg ]

ángu

lo [

rad

]

Ángulo

Referencia

0 2 4 6 8 10-20

-15

-10

-5

0

5

10Velocidad posición angular Theta

tiempo [ seg ]ve

loci

dad

[ ra

d/se

g ]

0 2 4 6 8 10-1

-0.5

0

0.5

1

1.5

2

tiempo [ seg ]

ángu

lo [

rad

]

Ángulo de orientación Fi

Ángulo

Referencia

0 2 4 6 8 10-0.5

0

0.5

1

1.5

2

2.5

3

3.5Velocidad ángulo de orientación Fi

tiempo [ seg ]

velo

cida

d [

rad/

seg

]

Page 73: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 67

Figura 4-18 Evolución acciones de control u1 y u2 para estados iníciales y finales no nulos

4.3.4 Pruebas con trayectorias En las pruebas anteriores se ha controlado al péndulo invertido sobre dos ruedas en su punto de equilibrio para varios estados iníciales y finales. En este apartado se prueba el controlador diseñado para algunas trayectorias con el fin de verificar su funcionamiento. En la Figura 4-19 se muestra la vista lateral y superior del péndulo invertido sobre dos ruedas con sus parámetros físicos, además se muestra la vista superior a partir de la cual se realizarán las diferentes trayectorias sobre el plano X-Y a ser probadas.

Figura 4-19 Vista lateral y superior del péndulo invertido de dos ruedas, Tomado de [8]

Tomando las coordenadas (�^, #̂ � y considerando que el sistema se encuentra en la posición vertical � � 0. Para realizar las trayectorias se utiliza los estados H�, �I los cuales

0 2 4 6 8 10-10

-8

-6

-4

-2

0

2Acción de control U1

tiempo[ seg ]

volta

je [

V ]

0 2 4 6 8 10-10

-8

-6

-4

-2

0

2

4

6Acción de control U2

tiempo [ seg ]vo

ltaje

[ V

]

Page 74: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

DISEÑO DEL CONTROL ÓPTIMO

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 68

nos permite movilizar al péndulo invertido sobre dos ruedas en el plano X-Y, sus coordenadas vienen dadas por:

��^,#̂ ,� = uM��^S�,M #�̂ S�x , ���^, #�^� = �Q����,Q������

Además las velocidades de los estados involucrados vienen dado por:

�� = ∆�∆O , �� =

∆l∆O

Las trayectorias generadas para el sistema bajo estudio se realizan desplazándolo en el plano X-Y, para lo cual se ajustara su trayectoria deseada como se muestra en la Figura 4-20.

Figura 4-20 Trayectoria lineal

Esta trayectoria se la generara en dos partes:

1) Partiendo de � = 0, � = 0, se orienta al péndulo invertido sobre dos ruedas hasta una

orientación � deseada a una velocidad �� . 2) Una vez que se encuentre el péndulo invertido en la orientación deseada, se desplaza una

posición angular� a una velocidad �� , lo cual permite trasladar al sistema sobre el plano X-Y.

Para la trayectoria (a) con los siguientes parámetros que se muestran en la Tabla 5:

Tabla 5 Parámetros de la trayectoria (a)

Parámetros Valor unidad

� Ä/4 H��SI �� 0.1 H��S/�_I � 4Ä H��SI �� 1 H��S/�_I

Page 75: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 69

En esta trayectoria se desea primero dar una orientación deseada al péndulo invertido sobre dos ruedas para luego desplazarlo sobre el plano X-Y. A continuación se muestran las figuras de las evoluciones de los estados del sistema, las entradas y la trayectoria generada, para estados del sistema iníciales nulos.

En la Figura 4-21 se muestra la evolución de la posición angular � y la velocidad de la

posición angular �� .

Figura 4-21Evolución de los estados θ y Ò� , trayectoria (a)

En la Figura 4-22 se muestra la evolución de ángulo de orientación � y la velocidad del

ángulo de orientación �� .

Figura 4-22 Evolución de los estados ϕ y Ô� , trayectoria (a)

0 5 10 15 20-2

0

2

4

6

8

10

12

14Posición angular Theta

tiempo [ seg ]

ángu

lo [

rad

]

Ángulo

Referencia

0 5 10 15 20-0.2

0

0.2

0.4

0.6

0.8

1

1.2

Velocidad posición angular Theta

tiempo [ seg ]

velo

cida

d [

rad/

seg

]

0 5 10 15 200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

tiempo [ seg ]

ángu

lo [

rad

]

Ángulo de orientación Fi

Ángulo

Referencia

0 5 10 15 20-0.02

0

0.02

0.04

0.06

0.08

0.1

Velocidad ángulo de orientación Fi

tiempo [ seg ]

velo

cida

d [

rad/

seg

]

Page 76: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

DISEÑO DEL CONTROL ÓPTIMO

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 70

En la Figura 4-23 se muestra la evolución de las acciones de control u7 (voltaje motor izquierdo) y uK (voltaje motor derecho) del sistema.

Figura 4-23 Evolución de las entrada voltaje motor izquierdo y derecho, trayectoria (a)

En la Figura 4-24 se muestra la evolución de la trayectoria del péndulo invertido sobre el plano X-Y para la trayectoria planteada.

Figura 4-24 Evolución de la trayectoria (a) en el plano X-Y del péndulo invertido

También se desea una trayectoria (b) para péndulo invertido sobre dos ruedas con los parámetros que se muestran en la Tabla 4.

0 5 10 15 20-0.2

-0.1

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7Acción de control U1

tiempo[ seg ]

volta

je [

V ]

0 5 10 15 200

0.1

0.2

0.3

0.4

0.5

0.6

Acción de control U2

tiempo [ seg ]

volta

je [

V ]

0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 0.20

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

0.2Trayectoria X-Y

X - Distancia [ m ]

Y -

Dis

tanc

ia [

m ]

Page 77: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 71

Tabla 6 Parámetros de la trayectoria (b)

Parámetros Valor unidad

� 2Ä H��SI �� 0.5 H��S/�_I � 2Ä H��SI �� 0.5 H��S/�_I

De donde los parámetros anteriores indican que cada 13.81HcmI de trayecto lineal el péndulo invertido rotara 2πHradI en su propio eje. A continuación se muestran las figuras de las evoluciones de los estados del sistema, las entradas y la trayectoria generada, para estados iníciales del sistema nulos.

En la Figura 4-25 se muestra la evolución del ángulo de inclinación � y la velocidad del

ángulo de inclinación �� .

Figura 4-25 Evolución de los estados ψ y Ð� , trayectoria (b)

En la Figura 4-26 se muestra la evolución de la posición angular � y la velocidad de la

posición angular �� .

0 10 20 30 40 50-2.5

-2

-1.5

-1

-0.5

0

0.5

1

1.5

2

2.5x 10

-3Ángulo de inclinacion Psi

tiempo [ seg ]

ángu

lo [

rad

]

0 10 20 30 40 50-0.01

-0.008

-0.006

-0.004

-0.002

0

0.002

0.004

0.006

0.008

0.01Velocidad Ángulo de inclinacion Psi

tiempo [ seg ]

velo

cida

d [

rad/

seg

]

Page 78: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

DISEÑO DEL CONTROL ÓPTIMO

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 72

Figura 4-26 Evolución de los estados θ y Ò� , trayectoria (b)

En la Figura 4-27 se muestra la evolución de ángulo de orientación � y la velocidad del

ángulo de orientación �� .

Figura 4-27 Evolución de los estados ϕ y Ô� , trayectoria (b)

En la Figura 4-28 se muestra la evolución de las acciones de control u7 (voltaje motor izquierdo) y uK (voltaje motor derecho) del sistema.

0 20 40 60-5

0

5

10

15

20Posición angular Theta

tiempo [ seg ]

ángu

lo [

rad

]

Ángulo

Referencia

0 10 20 30 40 50-0.2

-0.1

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7Velocidad posición angular Theta

tiempo [ seg ]ve

loci

dad

[ ra

d/se

g ]

0 20 40 60-2

0

2

4

6

8

10

12

14

tiempo [ seg ]

ángu

lo [

rad

]

Ángulo de orientación Fi

Ángulo

Referencia

0 20 40 60-0.1

0

0.1

0.2

0.3

0.4

0.5

Velocidad ángulo de orientación Fi

tiempo [ seg ]

velo

cida

d [

rad/

seg

]

Page 79: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 73

Figura 4-28 Evolución de las entrada voltaje motor izquierdo y derecha, trayectoria (b)

En la Figura 4-29 se muestra la evolución de la trayectoria del péndulo invertido sobre el plano X-Y para la trayectoria planteada.

Figura 4-29 Evolución de la trayectoria (b) en el plano X-Y del péndulo invertido sobre dos ruedas

4.3.5 Pruebas con perturbaciones externas y ruido en los estados Con el fin de presentar condiciones más ajustadas a la realidad se introducirá una perturbación externa así como también ruido a los estados (presentes en la medida de las variables mediante sensores), y se comprobara la robustez del controlador diseñado. En Figura 4-30 se muestra el sistema implementado en Simulink-MatLab©.

0 10 20 30 40 50-1

-0.5

0

0.5Acción de control U1

tiempo[ seg ]

volta

je [

V ]

0 10 20 30 40 50-0.1

0

0.1

0.2

0.3

0.4

0.5

0.6

Acción de control U2

tiempo [ seg ]vo

ltaje

[ V

]

-0.1 0 0.1 0.2 0.3 0.4-1

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1Trayectoria X-Y

X - Distancia [ m ]

Y -

Dis

tanc

ia [

m ]

Page 80: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

DISEÑO DEL CONTROL ÓPTIMO

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 74

Figura 4-30 Sistema de control implementado con perturbación y ruido

Para lo cual se tiene estados iniciales x� � H0.200000I² y estados finales xØ �H0010 ' 1.50I² . En la Figura 4-31 se muestra la evolución del ángulo de inclinación �

y la velocidad del ángulo de inclinación �� .

Figura 4-31 Evolución de los estados ψ y Ð� con perturbaciones y ruido

En la Figura 4-32 se muestra la evolución de la posición angular � y la velocidad de la

posición angular �� .

0 5 10 15-0.1

-0.08

-0.06

-0.04

-0.02

0

0.02

0.04

0.06

0.08

0.1Ángulo de inclinacion Psi

tiempo [ seg ]

ángu

lo [

rad

]

0 5 10 15-2

-1.5

-1

-0.5

0

0.5

1

1.5Velocidad Ángulo de inclinacion Psi

tiempo [ seg ]

velo

cida

d [

rad/

seg

]

Page 81: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 75

Figura 4-32 Evolución de los estados θ y Ò� con perturbaciones y ruido

En la Figura 4-33 se muestra la evolución de ángulo de orientación � y la velocidad del

ángulo de orientación �� .

Figura 4-33 Evolución de los estados ϕ y Ô� con perturbaciones y ruido

En la Figura 4-34 se muestra la evolución de las acciones de control u7 (voltaje motor

izquierdo) y uK (voltaje motor derecho) del sistema.

0 5 10 150

0.5

1

1.5

2

2.5

3Posición angular Theta

tiempo [ seg ]

ángu

lo [

rad

]

Ángulo

Referencia

0 5 10 15-15

-10

-5

0

5

10

15Velocidad posición angular Theta

tiempo [ seg ]ve

loci

dad

[ ra

d/se

g ]

0 5 10 15-2.5

-2

-1.5

-1

-0.5

0

tiempo [ seg ]

ángu

lo [

rad

]

Ángulo de orientación Fi

Ángulo

Referencia

0 5 10 15-2.5

-2

-1.5

-1

-0.5

0

0.5Velocidad ángulo de orientación Fi

tiempo [ seg ]

velo

cida

d [

rad/

seg

]

Page 82: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

DISEÑO DEL CONTROL ÓPTIMO

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 76

Figura 4-34 Evolución de las entrada voltaje motor izquierdo y derecho con perturbaciones y ruido

0 5 10 15 20-8

-6

-4

-2

0

2

4

6

8

10Acción de control U1

tiempo[ seg ]

volta

je [

V ]

0 5 10 15 20-8

-6

-4

-2

0

2

4

6

8

10Acción de control U2

tiempo [ seg ]vo

ltaje

[ V

]

Page 83: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

77

5. IMPLEMENTACIÓN DEL CONTROL EN EL PÉNDULO INVERTIDO SOBRE DOS RUEDAS UTILIZANDO LEGO MINDSTORMS NXT

5.1 Descripción del péndulo invertido sobre dos ruedas en base a Lego Mindstorms NXT

El controlador diseñado en el capítulo 4 se lo implementa en la plataforma educativa Lego Mindstorms NXT 2.0. Dicha plataforma es una nueva generación en robótica educativa que permite ensamblar numerosas configuraciones mecánicas, así como también permite la posibilidad de programación en varios lenguajes (ej. RobotC, LabView, MatLab, etc.). En la Figura 5-1 se muestra la plataforma Lego Mindstorms NXT en la configuración péndulo invertido sobre dos ruedas.

Figura 5-1 Configuración péndulo invertido sobre dos ruedas en base a Lego Mindstorms

Los principales componentes del péndulo invertido sobre dos ruedas son: 1) ladrillo NXT el cual es el cerebro del Lego Mindstorms y se lo programa mediante un computador, 2) sensor

brújula el cual permite medir el ángulo de orientación � y estimar su velocidad �� , 3) sensor

giroscopio el cual permite medir la velocidad de inclinación �� y estimar su ángulo � y 4) actuadores eléctricos (servomotores) tanto para la rueda izquierda como la derecha, los cuales contienen sensores de posición angular (encoders) que permiten medir la posición angular �

de la rueda y estimar su velocidad �� .

Page 84: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

IMPLEMENTACIÓN DEL CONTROL EN EL PÉNDULO INVERTIDO UTIL. LEGO MINDSTORMS

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 78

5.2 Sistema de sensores El sistema de sensores permite la adquisición y posterior acondicionamiento de las variables necesarias para la realimentación, en la Figura 5-2 se muestran las variables del sistema, las

cuales son: giroscopio (�,�� ), brújula (�,�� ) y encoder (�, �� ).

Figura 5-2 (a) Vista frontal y (b) vista superior, del péndulo invertido sobre dos ruedas

5.2.1 Acondicionamiento del giroscopio El giroscopio permite estimar el ángulo de inclinación � mediante la medición de la

velocidad del ángulo de inclinación �� , para lo cual se utiliza el sensor Hitechnic Gyro NXT que se muestra en la Figura 5-3.

Figura 5-3 Sensor Gyro NXT , tomado de [31]

El giroscopio retorna el número de grados por segundo de la rotación y además indica la dirección de la misma, su rango de medida se encuentra entre Ù360� por segundo, este sensor tiene un solo eje de medición y puede medir la velocidad de rotación unas 300 veces por segundo.

Se realizó la adquisición de la velocidad del ángulo de inclinación �� mediante el sensor Gyro Hitechnic NXT cuando este no se encuentra rotando (inactivo) y retorna un valor alrededor de

Page 85: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 79

600, a este valor se lo conoce como offset. Para el sistema propuesto si un valor adquirido es superior a este valor offset el sentido de inclinación es horario caso contrario es anti horaria.

El valor offset es diferente para cada sensor Gyro Hitechnic NXT y puede cambiar por factores externos. Debido a la existencia de ruido en el giroscopio es necesario obtener una medida confiable del valor offset, para lo cual se mantiene al sistema sin rotación y se realiza la adquisición de 300 muestras para posteriormente determinar su promedio, con este procedimiento se obtuvo un valor offset de 606.

Se ha determinado un valor de offset compensado constante pero esto no es verdaderamente cierto, si el sistema es impulsado también es necesario constantemente ir ajustando el offset, ya que se producirá un desvió (drift) con el tiempo, para corregirlo se mantiene el valor promedio por un tiempo prolongado esto se lo realiza mediante la conocida media móvil exponencial [29], que se obtienen por:

�� _����H/I � �� _����H/ ' 1I + ���� _Q�� ' �� _����H/ ' 1I� (5.1)

donde:

�� _����H/I: nuevo valor offset

�� _����H/ ' 1I: valor offset anterior

�� _Q��: medida actual

�: factor de diminución de ponderación

El factor � será un valor pequeño de esta forma si el péndulo invertido sobre dos ruedas se desplaza hacia adelante o hacia atrás mientras se encuentra en equilibrio no va a tener un cambio inmediato en el valor offset, si se desplaza por un tiempo significativo prolongado el valor de offset será considerable, a la media móvil exponencial se comporta como un como filtro pasa bajo [30].

Una vez obtenido el valor offset con la compensación y el filtro pasa bajo, el valor de la

velocidad del ángulo de inclinación �� es el siguiente:

�� � �� _Q�� ' �� _���� (5.2)

donde:

�� _����:valor offset compensado y filtrado

�� _Q��: medida actual

Determinado el valor de la velocidad del ángulo de inclinación �� del sistema, se procede a estimar el valor del ángulo de inclinación � ,el cual viene dado por:

Page 86: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

IMPLEMENTACIÓN DEL CONTROL EN EL PÉNDULO INVERTIDO UTIL. LEGO MINDSTORMS

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 80

�H/I � �H/ ' 1I +�� ∗ �È������� (5.3)

donde:

�H/I:valor actual estimado del ángulo de inclinación

�H/ ' 1I:valor anterior del ángulo de inclinación

�È�������: tiempo de adquisición del sensor

En la Figura 5-4 se muestra la velocidad del ángulo de inclinación �� así como también la estimación del ángulo de inclinación �, mientras se abanica al giroscopio entre un ángulo aproximado de Ù15�.

Figura 5-4 Velocidad y ángulo de inclinación adquiridos del giroscopio

5.2.2 Acondicionamiento de la brújula Cuando el péndulo invertido se encuentra equilibrado en posición vertical, en una segunda instancia se requerirá realizar desplazamientos en el plano X-Y en una cierta orientación y distancia, para determinar la orientación se utiliza el sensor Compass Hitechnic NXT cuya apariencia física viene dada por la Figura 5-3, dicho sensor contiene una brújula digital que mide el campo magnético de la tierra y calcula el ángulo del rumbo actual. Este sensor utiliza el protocolo de comunicación I2C y calcula el rumbo con una precisión de 1� retornando un número entre 0-359, que representa una lectura absoluta de la orientación [31].

El sensor brújula tiene dos modos de operación: de lectura y de calibración. En el modo de lectura se calcula el rumbo actual y en el modo de calibración el sensor es acondicionado para compensar las anomalías de campos magnéticos generados externamente como los que rodean a los motores y la batería, con el fin de tener la mayor precisión. Para determinar la orientación relativa se partirá de una orientación inicial � � 0 y luego incrementar o decrementar dicho ángulo, para lo cual se realiza una primera adquisición de la brújula y esta lectura será el valor offset, de tal manera que el ángulo relativo de orientación viene dado por:

0 1 2 3 4 5 6 7 8-50

-40

-30

-20

-10

0

10

20

30

40

50Adquisición giroscopio

tiempo [seg]

[gra

dos]

Ángulo de inclinación

Velocidad ángulo de inclinación

Page 87: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 81

�_Q�� � �_Q�� ' �_���� (5.4)

donde:

�_����:primera lectura adquirida por el sensor

�_Q��: ángulo de orientación absoluta

Para estimar la velocidad del ángulo de orientación se realiza un promedio de tres estimaciones consecutivas de la velocidad angular, que viene dado por:

�� H/I �∆�_Q��H/I > ∆�_Q��H/ ' 1I > ∆�_Q��H/ ' 2I

3 ∗ �È�������(5.5)

con:

∆�_Q��H/ ' �I � �_Q��H/ ' �I ' �_Q��H/ ' (� ' 1)I

donde:

�� H/I ∶velocidad actual promedio del ángulo de orientación relativa

�_Q��H/ ' �I: lecturas anteriores del ángulo de orientación relativa

∆�_Q��H/ ' �I: diferencia de lecturas del ángulo de orientación relativa

�È�������: tiempo de adquisición del sensor

En la Figura 5-5 se muestra el ángulo y la velocidad de la orientación del péndulo invertido, para un desplazamiento en línea recta � � 0.

Figura 5-5 Velocidad y ángulo de orientación para un desplazamiento lineal

0 1 2 3 4 5 6 7 8 9 10-20

-15

-10

-5

0

5

10

15Adquisición Brújula

tiempo [seg]

[gra

dos]

-

- [

grad

os/s

eg]

Angulo de orientación

Velocidad ángulo de orientación

Page 88: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

IMPLEMENTACIÓN DEL CONTROL EN EL PÉNDULO INVERTIDO UTIL. LEGO MINDSTORMS

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES

En la Figura 5-6 se muestra el ángulo y la velocidad de orientación del péndulo invertido, para una rotación sobre su propio

Figura 5-6 Velocidad y ángulo de orientación para una rotación sobre su propio eje

5.2.3 Acondicionamiento de la posición angular (encoder) Además de las variables ya acondicionadas y determinar la posición angularse cuenta con un servomotor integrado que serviría para cada rueda, en la Figura 5Mindstorms NXT.

Figura

El servomotor cuenta con un encoder incremental integradoservomotor se lo realiza mediante cual se lo configura por software, el voltaje de operación que opera con una señal de control PWM (modulaciónsensor de posición angular determina el ángulo con una resolución de

En el modelo matemático del péndulo invertido sobre dos ruedas angular � viene dada por el promedio de

� ��2 > �]2

00

50

100

150

200

250

300

350

400

[gra

dos]

-

- [

grad

os/s

eg]

IMPLEMENTACIÓN DEL CONTROL EN EL PÉNDULO INVERTIDO UTIL. LEGO MINDSTORMS

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM)

6 se muestra el ángulo y la velocidad de orientación del péndulo invertido, propio eje de: 0� @ � @ 360�.

Velocidad y ángulo de orientación para una rotación sobre su propio eje

Acondicionamiento de la posición angular (encoder)

Además de las variables ya acondicionadas y con el fin de realimentar al sistema es necesario la posición angular de las ruedas así como la velocidad de las mismas

se cuenta con un servomotor que internamente contiene un sensor de posición angularpara cada rueda, en la Figura 5-7 se muestra el servomotor del Lego

Figura 5-7 Servomotor del Lego Mindstorms NXT

El servomotor cuenta con un encoder incremental integrado, el funcionamiento delservomotor se lo realiza mediante un controlador PID (Proporcional Integral Derivativo)

se lo configura por software, el voltaje de operación del servomotor es de 0que opera con una señal de control PWM (modulación por ancho de pulso). sensor de posición angular determina el ángulo con una resolución de 1�.

del péndulo invertido sobre dos ruedas se planteo que por el promedio de la posición angular de ambas ruedas como:

1 2 3 4 5 6 7 8

Adquisición Brújula

tiempo [seg]

Ángulo de orientación

Velocidad ángulo de orientación

IMPLEMENTACIÓN DEL CONTROL EN EL PÉNDULO INVERTIDO UTIL. LEGO MINDSTORMS

82

6 se muestra el ángulo y la velocidad de orientación del péndulo invertido,

Velocidad y ángulo de orientación para una rotación sobre su propio eje

al sistema es necesario de las mismas, para lo cual

contiene un sensor de posición angular 7 se muestra el servomotor del Lego

funcionamiento del controlador PID (Proporcional Integral Derivativo) el

es de 0-10 [voltios] por ancho de pulso). Además, el

se planteo que la posición de ambas ruedas como:

(5.6�

Page 89: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 83

donde:

�: posición angular del sistema

�2: posición angular de la rueda derecha

�]: posición angular de la rueda izquierda

Para estimar la velocidad de la posición angular, se realiza un promedio de tres estimaciones consecutivas de la velocidad angular, que viene dada por:

�� H/I �∆�H/I > ∆�H/ ' 1I > ∆�H/ ' 2I

3 ∗ �È�������(5.7�

con:

∆�H/ ' �I � �H/ ' �I ' �H/ ' �� ' 1�I

donde:

��H/I ∶velocidad actual promedio de la posición angular

�H/ ' �I: lecturas anteriores de la posición angular

∆�H/ ' �I: diferencia de lecturas de la posición angular

�È�������: tiempo de adquisición

En la Figura 5-8 se muestra el ángulo y la velocidad de la posición angular del péndulo invertido, para un desplazamiento en línea recta de: 0� @ � @ 360�.

Figura 5-8 Posición angular y velocidad para un desplazamiento lineal

0 0.5 1 1.5 2 2.5 3 3.5 40

100

200

300

400

500

600

700

800Adquisición Encoder

tiempon [seg]

[gra

dos]

-

- [

grad

os/s

eg]

Posición angular

Velocidad posición angular

Page 90: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

IMPLEMENTACIÓN DEL CONTROL EN EL PÉNDULO INVERTIDO UTIL. LEGO MINDSTORMS

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 84

En la Figura 5-9 se muestra el ángulo y la velocidad de la posición angular del péndulo invertido, para una rotación sobre su propio eje, � � 0.

Figura 5-9 Posición angular y velocidad para una rotación sobre su propio eje

5.2.4 Estimación de la orientación mediante el Filtro de Kalman Si bien se han obtenido resultados aceptables en la adquisición de los sensores, también existen inconvenientes con la medición del ángulo de orientación cuando existe un cambio considerable en el ángulo de inclinación � en el plano X-Z o un campo magnético externo, de tal manera que del ángulo de dirección � presenta error en su medición.

Es posible estimar el ángulo de dirección � tomando en cuenta las características físicas del sistema y se lo determina mediante:

� �Q ∗ (�] ' �2)

f(5.8�

donde:

Q ∶radio de las ruedas

f:separación entre las ruedas

�2: posición angular de la rueda derecha

�]: posicion angular de la rueda izquierda

La velocidad del ángulo de orientación �� se lo determina la misma manera planteada en la Ec. (5.5), en la Figura 5-10 se muestra el ángulo y la velocidad de orientación del sistema, para un desplazamiento en línea recta � � 0.

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5-40

-30

-20

-10

0

10

20

30

40Adquisición Encoder

tiempon [seg]

[gra

dos]

-

- [

grad

os/s

eg]

Posición angular

Velocidad posición angular

Page 91: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 85

Figura 5-10 Velocidad y ángulo de orientación estimado para un desplazamiento lineal

En la Figura 5-11 se muestra el ángulo y la velocidad de orientación del sistema, para una rotación sobre su eje de: 0� @ � @ 360�.

Figura 5-11 Velocidad y ángulo de orientación estimado para una rotación sobre su propio eje

Uno de los problemas de la estimación del ángulo de orientación planteada en la Ec. (5.8) es la presencia de inexactitudes en los valores de Q#f, además de errores en la medición si el sistema presenta deslizamientos mientras se desplaza en el plano X-Y, para lo cual se propone utilizar el Filtro de Kalman. El Filtro de Kalman estima el estado y también genera una medida de la confianza de ese estado estimado en relación el verdadero. La estimación presenta dificultad cuando el estado está sujeto a la influencia del ruido. El algoritmo consiste en las etapas de: inicialización, de predicción, una de corrección del estado y finalmente una de actualización. En la inicialización se especifica el estado estimado inicial x�� y su incertidumbre P�.

0 1 2 3 4 5 6 7 8-15

-10

-5

0

5

10

15Adquisición Encoder

tiempo [seg]

[gra

dos]

-

- [

grad

os/s

eg]

Ángulo de orientación

Velocidad ángulo de orientación

0 1 2 3 4 5 6 7 8-50

0

50

100

150

200

250

300

350

400Adquisición Encoder

tiempo [seg]

[gra

dos]

-

- [

grad

os/s

eg]

Ángulo de orientación

Velocidad ángulo de orientación

Page 92: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

IMPLEMENTACIÓN DEL CONTROL EN EL PÉNDULO INVERTIDO UTIL. LEGO MINDSTORMS

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 86

Para la etapa de predicción para cada instante de tiempo k, el Filtro de Kalman estima un nuevo estado x�¨

< del sistema y su incertidumbre P̈<. La combinación de estos dos estimados son el supuesto previo, los cuales se calculan propagando el sistema dinámico a través del tiempo mediante:

�� < � =�� <7 > ;�  (5.9)

� < � =� <7=� > P (5.10)

De donde =#; son matrices que representan la dinámica del proceso, � representa la entrada al sistema y P representa el ruido del sistema. En la etapa de corrección con la información disponible acerca del estado real del sistema, la cual se usa para corregir el estado estimado; es decir para corregir a el supuesto previo que proviene de la predicción. Esto se logra mediante la incorporación de la información que proporcionan las mediciones mediante la observación y viene dado por:

�� Þ � �� 

< > Z (y  ' i�� <) (5.11)

donde K¨ se determina mediante:

Z  � � <i�(i� 

<i� ' Q )<7 (5.12)

Donde i es la matriz de observación, Z la matriz de ganancia de Kalman, la matriz Q representa el ruido de los sensores y la diferencia entre la medida de los sensores y la estimación anterior (y  − i�� <) se la conoce como innovación. Finalmente en la etapa de actualización se calcula la covarianza del error en la estimación corregida mediante:

� Þ = (È − Z i)� < (5.13)

Una de las ventajas importantes del Filtro de Kalman es que su algoritmo es recursivo por lo tanto no necesita acumular información, de esta manera el algoritmo recursivo viene descrito por:

Figura 5-12 Algoritmo recursivo del Filtro de Kalman, Tomado de [32]

Page 93: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 87

Se realizaron pruebas y tomando como valores iníciales para el algoritmo del Filtro de Kalman P � 1, Q � 15, �� � 1. En la Figura 5-13 se muestra el ángulo de la orientación del péndulo invertido, para un desplazamiento en línea recta � � 0.

Figura 5-13 Ángulo de la orientación estimada para un desplazamiento lineal

En la Figura 5-14 se muestra el ángulo y la velocidad de orientación del péndulo invertido, para una rotación sobre su eje de: 0� @ � @ 360�.

Figura 5-14 Ángulo de orientación estimada para una rotación sobre su propio eje

5.3 Sistema Electrónico El sistema electrónico del Lego Mindstorms está compuesto por el ladrillo NXT el cual es el cerebro del sistema, este ladrillo puede ser programado en diferentes lenguajes y controlado por ordenador, teniendo la posibilidad de conectar diferentes dispositivos externos (sensores, actuadores, sistemas de comunicación, visión, etc.) como se muestra en la Figura 5-15.

0 1 2 3 4 5 6 7 8-8

-6

-4

-2

0

2

4

6

8Estimación de la orientación

tiempo [seg]

[gra

dos]

Estimación por las Ruedas

Adquisición BrújulaEstimación por Filtro de Kalman

0 1 2 3 4 5 6 7 80

50

100

150

200

250

300

350

Estimación de la orientación

tiempo [seg]

[gra

dos]

Estimación por las Ruedas

Adquisición BrújulaEstimación por Filtro de Kalman

Page 94: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

IMPLEMENTACIÓN DEL CONTROL EN EL PÉNDULO INVERTIDO UTIL. LEGO MINDSTORMS

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 88

Figura 5-15 Ladrillo NXT de Lego Mindstorms

El ladrillo NXT de manera general está compuesto por:

1. Tres puertos de salida para conectar actuadores los mismos que se encuentran etiquetados con las letras A,B y C, 2. Puerto USB para cargar y descargar los datos desde o hacia el ordenador, siendo posible también utilizar conexión inalámbrica Bluetooth 3. Cuatro puertos de entrada para conectar sensores 4. Botones de encendido/apagado, navegación del ladrillo NXT.

En la Tabla 7 se presentan las características técnicas del ladrillo NXT de Lego Mindstorms.

Tabla 7 Especificaciones Técnicas del ladrillo NXT, tomado de [33]

Dispositivo Especificación Técnica

Microprocesador ARM7 de 32 bits

Memoria FLASH de 4 Kb, RAM de 64 Kb

Comunicación Inalámbrica Bluetooth

Puerto USB 2.0

Fuente de Alimentación Batería de litio recargable 9 [v]

En la Tabla 8 se muestra los diferentes actuadores y sensores, así como también sus correspondientes puertos de conexión utilizados en el péndulo invertido sobre dos ruedas.

Tabla 8 Actuadores, sensores y sus puertos de conexión

Actuador o sensor Puerto de conexión

Sensor Giróscopo Puerto 1

Sensor Brújula Puerto 4

Servomotor izquierdo Puerto C

Servomotor derecho Puerto B

Page 95: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 89

5.4 Implementación del sistema de control

El sistema de control implementado está compuesto de las siguientes etapas:

• Acondicionamiento de sensores

• Referencias • Señales de control • Controlador desarrollado FC-LQR (Fuzzy Control - Linear Quadratic Regulator).

En la Figura 5-16 se muestra la arquitectura de control implementada en el sistema.

Figura 5-16 Arquitectura de control implementada en el péndulo invertido sobre dos ruedas

El Lego Mindstorms presenta la versatilidad de ser programado en varios lenguajes tales como: MatLab, LabView, RobotC, etc. Para la implementación del sistema de control se ha seleccionado RobotC, el cual está basado en lenguaje de programación C bajo un entorno Windows para escribir, depurar programas y es el único lenguaje de programación a este nivel que ofrece una solución integral, además posee un depurador en tiempo real [34].

En la Figura 5-17 se muestra el diagrama de flujo de sistema de control implementado en el péndulo invertido sobre dos ruedas.

Page 96: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

IMPLEMENTACIÓN DEL CONTROL EN EL PÉNDULO INVERTIDO UTIL. LEGO MINDSTORMS

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 90

Figura 5-17 Diagrama de flujo del sistema de control implementado

El diagrama de flujo del sistema de control implementado está compuesto de las siguientes etapas:

1. Configuración e inicialización de variables: se configuran los diferentes puertos E/S (entrada/salida), se inicializan las diferentes variables necesarias para el algoritmo de control (rangos de los conjuntos borrosos, ganancias óptimas, etc.).

2. Determinación del Offset del giroscopio: se determina el valor de compensación offset para el acondicionamiento del giroscopio, acorde al algoritmo planteado en el apartado 5.2.1.

3. Acondicionamiento de sensores: se acondicionan todas las mediciones provenientes de los

sensores (giróscopo �� , brújula � y encoder �) y se estiman los estados ��, �� , ���, con lo cual

se forma el vector de estados para la realimentación del sistema A � N��� ��� ��� R.

4. Controlador FC-LQR: se determinan las acciones de control para mantener al sistema equilibrado dentro del rango de operación, mediante la realimentación de los estados y de sus errores. En la Figura 5-18 se muestra la arquitectura del controlador FC-LQR.

Page 97: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 91

Figura 5-18 Arquitectura del Controlador FC-LQR

De donde la inferencia borrosa determina el peso que se le da a cada regla borrosa y se obtiene la conclusión final (acción de control). 5. Señales de control: se toma la salida de la etapa del controlador FC-LQR y se verifica que las señales de control estén dentro de los rango de operación permitidos (-10 [v], 10 [v]) del péndulo invertido sobre dos ruedas basado en Lego Mindstorms, caso contrario se saturan las mismas.

Page 98: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

92

6. PRUEBAS Y RESULTADOS

6.1 Consideraciones previas Para la realización de las pruebas y análisis de los resultados obtenidos del modelado discreto utilizando el modelo borroso de Takagi-Sugeno y control óptimo del sistema bajo estudio, es necesario realizar ciertas consideraciones previas.

Durante la implementación del control en el péndulo invertido sobre dos ruedas a base de Lego Mindstorms se determino que el tiempo de muestreo está alrededor de los 0.01 [seg], de esta manera se obtuvo el modelo borroso de Takagi-Sugeno del sistema como se planteó en el capítulo 3.

Por la limitación de velocidad de procesamiento del ladrillo NXT se redujeron las variables borrosas, de esta manera se tomaron para la implementación del sistema de control las

variables:N�, �� R. De donde el universo de discurso del ángulo de inclinación � es de H<Å

7K , <Å

7K IH��SI, con

cinco conjuntos borrosos y funciones de pertenencia triangulares como se muestra en la Figura 6-1.

Figura 6-1 Conjunto borroso del ángulo de inclinación ψ, sistema real

El universo de discurso de la velocidad de la posición angular �� es de H'1, 1I �2É%ß3¶�, con tres

conjuntos borrosos y funciones de pertenencia triangulares, como se muestra en la Figura 6-2.

-0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4

0

0.2

0.4

0.6

0.8

1

Conjunto Borroso Ángulo Psi

[ rad ]

Fun

ción

de

Per

tene

cia

M11

M21

M31M41

M51

Page 99: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

PRUEBAS Y RESULTADOS

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 93

Figura 6-2 Conjunto borroso de la velocidad del ángulo Ò� , sistema real

Al tener dos conjuntos borrosos uno con cinco y otro con tres etiquetas lingüísticas se obtienen 15 reglas, por lo tanto se tendrán la misma cantidad de subsistemas lineales los cuales se determinan siguiendo la metodología planteada en el capítulo 3.

6.2 Pruebas y resultados obtenidos En este apartado se presentan las pruebas y resultados obtenidos del control (FC-LQR) . Se realizaron pruebas con estados finales nulos y no nulos, pruebas con perturbaciones externas, pruebas con trayectorias y a partir de las cuales se analiza el funcionamiento del controlador.

6.2.1 Pruebas con estados finales nulos El vector de estados del sistema es: � � H��� ��� ��� IO, de donde el estado crítico a controla es el ángulo de inclinación � el cual se debe mantenerlo en � � 0, es decir equilibrado en posición vertical.

En las siguientes figuras se muestran las evoluciones de los estados del sistema para estados finales �0 � H000000IO.

En la Figura 6-3 se muestra la evolución del estados: � (ángulo de inclinación), � (posición angular) y � (ángulo de orientación).

-2 -1.5 -1 -0.5 0 0.5 1 1.5 2

0

0.2

0.4

0.6

0.8

1

Conjunto Borroso velocidad Ángulo Theta

[ rad/seg ]

Fun

ción

de

Per

tene

cia

M12

M22M32

Page 100: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 94

Figura 6-3 Evolución de los estados ψ, θ y ϕ para estados finales nulos, sistema real

En la Figura 6-4 se muestran las vistas frontal, lateral y superior del péndulo invertido sobre dos ruedas a base de Lego Mindstorms, para estados finales nulos.

Figura 6-4 Vista frontal, lateral y superior del péndulo invertido, equilibrando

6.2.2 Pruebas con estados finales no nulos En este apartado a partir de los estados iníciales �à � H0 0 0 0 0 0IO se desea llevar al sistema a los estados finales �0 � H0 0 � 0 � 0IO, en las siguientes figuras se muestran las

evoluciones de los estados del sistema bajo estudio.

En la Figura 6-5 se muestra la evolución del estado � (posición angular) y su velocidad �� , con estados finales �0 � H0 0 3Ä 0 0 0IO.

0 1 2 3 4 5 6 7 8 9

-0.1

0

0.1

Ángulo de inclinación Psi

ángu

lo [

rad]

0 1 2 3 4 5 6 7 8 9-2

0

2Posición angular Theta

ángu

lo

[rad

]

0 1 2 3 4 5 6 7 8 9-0.1

0

0.1Ángulo de orientación Fi

tiempo [seg]

ángu

lo

[rad

]

Page 101: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

PRUEBAS Y RESULTADOS

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 95

Figura 6-5 Evolución de la posición angular θ y su velocidad Ò� , con estados finales no nulos, sistema real

En la Figura 6-6 se muestra la evolución de las acciones de control tanto para el motor de la rueda izquierda u7 como para el derecho uK, con estados finales xØ � H003π000I².

Figura 6-6 Evolución acciones de control u1 y u2 , con estados finales no nulos, sistema real

En la Figura 6-7 se muestra el desplazamiento del sistema en el plano X-Y, con estados finales xØ � H003π000I².

0 2 4 6 8 10 12 14 16 18-5

0

5

10

15Posición angular Theta

ángu

lo [

rad]

0 2 4 6 8 10 12 14 16 18-4

-2

0

2

4Velocidad posición angular

tiempo [seg]

velo

cida

d [r

ad /

seg

]Ángulo

Referencia

0 2 4 6 8 10 12 14 16 18-5

0

5Voltaje motor rueda izquierda

volta

je [

v]

0 2 4 6 8 10 12 14 16 18-5

0

5Voltaje motor rueda derecha

tiempo [seg]

volta

je [

v]

Page 102: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 96

Figura 6-7 Desplazamiento del péndulo invertido sobre dos ruedas en el plano X-Y

Al tratarse de un desplazamiento en línea recta la distancia recorrida viene dada por:

S2 � � ∗ � (6.1)

donde:

�: radio de la rueda

De esta manera la distancia recorrida es aproximadamente de: S2 � 20H�"I

En la Figura 6-8 se muestra la evolución del estado � (ángulo de orientación), con estados

finales �0 � H00 ÅK000IO

Figura 6-8 Evolución ángulo de orientación ϕ y su velocidad Ô� con estados finales no nulos, sistema real

0 2 4 6 8 10 12 14 16 18-2

-1

0

1

2Ángulo de orientacion Fi

ángu

lo [

rad]

0 2 4 6 8 10 12 14 16 18-1

-0.5

0

0.5

1Velocidad ángulo de orientación Fi

tiempo [seg]

velo

cida

d [r

ad /

seg

]

Ángulo

Referencia

Page 103: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

PRUEBAS Y RESULTADOS

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 97

En la Figura 6-9 se muestra la evolución de las acciones de control tanto para el motor de la

rueda izquierda u7 como para el de la derecha uK, con estados finales �0 � H00 ÅK000IO.

Figura 6-9 Evolución acciones de control u1 y u2 con estados finales no nulos, sistema real

En la Figura 6-10 se muestra el desplazamiento del sistema en el plano X-Y, con estados

finales �0 � H00 ÅK000IO.

Figura 6-10 Desplazamiento del péndulo invertido sobre dos ruedas en el plano X-Y

0 2 4 6 8 10 12 14 16 18-5

0

5Voltaje motor rueda izquierda

volta

je [

v]

0 2 4 6 8 10 12 14 16 18-5

0

5Voltaje motor rueda derecha

tiempo [seg]

volta

je [

v]

Page 104: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 98

6.2.3 Pruebas con perturbaciones externas En este apartado se presenta el comportamiento del sistema sometido a perturbaciones externas, las pruebas realizadas son: a) Prueba con perturbación carga adicional variable: en la Figura 6-11 se muestra al sistema con perturbación externa de carga variable.

Figura 6-11 Péndulo invertido sobre dos ruedas con carga variable

De donde cada carga variable tiene un peso aproximado de 0.067H/_I. En la Figura 6-12 se muestra la evolución del los estados: � (ángulo de inclinación), � (posición angular), � (ángulo de orientación), con perturbación externa de carga variable.

Figura 6-12 Evolución ángulos ψ,θ,ϕ, con perturbación externa de carga variable, sistema real

0 10 20 30 40 50 60 70-0.2

0

0.2Ángulo de inclinación Psi

ángu

lo [

rad]

0 10 20 30 40 50 60 70-5

0

5Posición angular Theta

ángu

lo [

rad]

0 10 20 30 40 50 60 70-0.5

0

0.5Ángulo de orientación Fi

tiempo [seg]

ángu

lo [

rad]

Page 105: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

PRUEBAS Y RESULTADOS

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 99

En la Figura 6-13 se muestra el comportamiento del sistema en el plano X-Z, cuando se incrementa la perturbación externa de carga.

Figura 6-13 Péndulo invertido sobre dos ruedas con perturbación externa de incremento de carga

En la Figura 6-14 se muestra el comportamiento del sistema en el plano X-Z, cuando se decrementa la perturbación externa de carga.

Figura 6-14 Péndulo invertido sobre dos ruedas con perturbación externa de decremento de carga

Page 106: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 100

b) Prueba con perturbación de fuerza externa: En la Figura 6-15 se muestra la evolución de los estados: � (ángulo de inclinación), � (posición angular), � (ángulo de orientación), con perturbación de fuerza externa.

Figura 6-15 Evolución estados ψ , θ , ϕ con perturbación de fuerza externa, sistema real

En la Figura 6-16 se muestra el comportamiento del sistema en el plano X-Z, con perturbación de fuerza externa.

Figura 6-16 Péndulo invertido sobre dos ruedas con perturbación de fuerza externa

6.2.4 Pruebas con trayectorias En este apartado se realizara pruebas con trayectorias como se planteo en la sección 4.3.4 de donde la trayectoria se la generara en dos partes:

1) Partiendo de � = 0, � = 0, se orientan al péndulo invertido sobre dos ruedas hasta el

ángulo � deseado a una velocidad �� .

0 5 10 15-0.2

0

0.2Ángulo de inclinación Psi

ángu

lo [

rad]

0 5 10 15-4

-2

0

2

4Posición angular Theta

ángu

lo [

rad]

0 5 10 15-0.5

0

0.5Ángulo de orientación Fi

tiempo [seg]

ángu

lo [

rad]

Page 107: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

PRUEBAS Y RESULTADOS

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 101

2) Una vez que se encuentre el péndulo invertido sobre dos ruedas en la orientación deseada,

se desplazara una posición angular � a una velocidad ��

Se realiza la trayectoria (a) con los siguientes parámetros que se muestran en la Tabla 9:

Tabla 9 Parámetros de la trayectoria (a)

Parámetros Valor unidad

� Ä/4 H��SI �� 0.1 H��S/�_I � 4Ä H��SI �� 2 H��S/�_I

A continuación se muestran las figuras de las evoluciones de los estados del sistema bajo estudio y la trayectoria generada, partiendo de estados iníciales nulos. En la Figura 6-17 se

muestra la evolución de la posición angular � y su velocidad �� , para la trayectoria (a).

Figura 6-17 Evolución ángulo de posición angular θ y su velocidad Ò� para la trayectoria (a), sistema real

En la Figura 6-18 se muestra la evolución del ángulo de orientación � y su velocidad �� , para la trayectoria (a).

0 5 10 15 20 25 30-5

0

5

10

15Posición angular Theta

ángu

lo [

rad]

0 5 10 15 20 25 30-4

-2

0

2

4Velocidad posición angular

tiempo [seg]

velo

cida

d [r

ad /

seg

]

Ángulo

Referencia

Page 108: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 102

Figura 6-18 Evolución ángulo de orientación ϕ y su velocidad Ô� para la trayectoria (a), sistema real

En la Figura 6-19 se muestra la evolución de las acciones de control tanto para el motor de la rueda izquierda u7 como para el de la derecha uK, para la trayectoria (a).

Figura 6-19 Evolución acciones de control u1 y u2 para la trayectoria (a), sistema real

En la Figura 6-20 se muestra el desplazamiento del péndulo invertido sobre dos ruedas en el plano X-Y, para la trayectoria (a).

0 5 10 15 20 25 30-0.5

0

0.5

1Ángulo de orientación Fi

ángu

lo [

rad]

0 5 10 15 20 25 30-1

-0.5

0

0.5

1velocidad ángulo de orientación

tiempo [seg]

velo

cida

d [r

ad /

seg

]Ángulo

Referencia

0 5 10 15 20 25 30-5

0

5Volatje motor de la rueda izquierda

vola

tje [

v]

0 5 10 15 20 25 30-5

0

5Voltaje motor de la rueda derecha

volta

je [

v]

Page 109: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

PRUEBAS Y RESULTADOS

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 103

Figura 6-20 Desplazamiento del péndulo invertido sobre dos ruedas en el plano X-Y, trayectoria (a)

En la Figura 6-21 se muestra la evolución de la trayectoria del sistema en el plano X-Y, para la trayectoria (a).

Figura 6-21 Evolución trayectoria (a) sobre el plano X-Y

También se realiza la trayectoria (b) con los siguientes parámetros que se muestran en la Tabla 10:

Tabla 10 Parámetros trayectoria (b)

Parámetro Valor unidad

� 2Ä H��SI

�� 0.1 H��S/�_I

� 3Ä H��SI

�� 0.5 H��S/�_I

-0.02 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18-0.02

0

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

distancia [m]

dist

anci

a [m

]

Desplazamiento Plano X-Y

Trayectoria

Referencia

Page 110: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 104

En la Figura 6-22 se muestra la evolución de la posición angular � y su velocidad θ� , para la trayectoria (b).

Figura 6-22 Evolución ángulo de posición angular θ y su velocidad Ò� para trayectoria (b), sistema real

En la Figura 6-23 se muestra la evolución del ángulo de orientación � y su velocidad �� , para la trayectoria (b).

Figura 6-23 Evolución ángulo de orientación ϕ y su velocidad Ô� para trayectoria (b), sistema real

0 10 20 30 40 50 60 70 80

0

10

20

Posición angular Theta

ángu

lo [

rad]

0 10 20 30 40 50 60 70 80

-2

0

2

Velocidad posición angular

tiempo [seg]

velo

cida

d [r

ad /

seg

]

0 10 20 30 40 50 60 70 80

0

2

4

6

8Ángulo de orientación Fi

ángu

lo [

rad]

0 10 20 30 40 50 60 70 80

-1

0

1

Velocidad ángulo de orientación

tiempo [seg]

velo

cida

d [

rad

/ se

g]

Ángulo

Referencia

Page 111: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

PRUEBAS Y RESULTADOS

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 105

En la Figura 6-24 se muestra la evolución de las acciones de control tanto para el motor de la rueda izquierda u7 como para el de la derecha uK, para la trayectoria (b).

Figura 6-24 Evolución acciones de control u1 y u2 para la trayectoria (b), sistema real

En la Figura 6-25 se muestra la evolución de la trayectoria sobre en el plano X-Y, para la trayectoria (b).

Figura 6-25 Evolución trayectoria (b) sobre el plano X-Y

En la Figura 6-26 se muestra el desplazamiento del péndulo invertido sobre dos ruedas en el plano X-Y, para la trayectoria (b).

0 10 20 30 40 50 60 70 80-5

0

5Volatje motor de la rueda izquierda

vola

tje [

v]

0 10 20 30 40 50 60 70 80-5

0

5Voltaje motor de la rueda derecha

volta

je [

v]

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4-0.1

-0.08

-0.06

-0.04

-0.02

0

0.02

0.04

0.06

0.08

0.1

distancia [m]

dist

anci

a [m

]

Desplazamiento Plano X-Y

Trayectoria

Referencia

Page 112: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO DISCRETO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 106

Figura 6-26 Desplazamiento del péndulo invertido sobre dos ruedas en el plano X-Y para trayectoria (b)

De las anteriores pruebas realizadas al sistema de control implementado en el péndulo invertido sobre dos ruedas a base Lego Mindstorms se tiene que:

• El controlador implementado es robusto frente a perturbaciones externas y a la existencia de ruido en las mediciones, como se puede notar en las pruebas con perturbaciones: externas de carga variable y de fuerza externa.

• El controlador implementado presenta un error en estado estacionario prácticamente nulo (como se lo había planteado en el capítulo 4), lo cual permite llevar al sistema a estados finales deseados como se puede notar en las pruebas: estados finales nulos, estados finales no nulos y ambas trayectorias planteadas.

• Las acciones de control generadas por el controlador implementado para ambos motores están dentro de los rangos de operación es decir no existe saturación de las mismas como se puede notar en las pruebas: estados finales no nulos y ambas trayectorias planteadas.

• La metodología planteada durante el presente trabajo ha permitido abordar la problemática del control de sistemas no lineales multivariables lo cual permitirá analizar varios sistemas de naturaleza no lineal.

Page 113: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

107

7. CONCLUSIONES Y TRABAJOS FUTUROS

7.1 Conclusiones

Del presente Trabajo de Fin de Máster es posible destacar las siguientes conclusiones:

• Se ha planteado un modelo matemático no lineal que describe de manera eficiente la

dinámica del péndulo invertido sobre dos ruedas ensamblado a base de Lego Mindstorms y el cual se encuentra representado en variables de estado.

• Se ha obtenido un modelo discreto de Takagi-Sugeno a partir de la estimación y sintonización de sus parámetros mediante la metodología de identificación borrosa del sistema no lineal multivariable planteado, validando a el sistema identificado por presentar errores cuadráticos medios (MSE) aceptables.

• Se ha obtenido una primera aproximación lineal del sistema en la región de operación (� � 0; ������ó���������) a partir del sistema no lineal mediante la identificación por el método de mínimos cuadrados, validando a este sistema lineal identificado por presentar (MSE) aceptables, el cual ha permitido sintonizar los parámetros del modelo borroso de T-S, dándole un sentido físico al sistema.

• Se ha implementado y simulado en MatLab-Simulink© el control óptimo FC-LQR a partir del modelo borroso de T-S del sistema no lineal multivariable planteado, el cual ha sido sometido a pruebas con: estados iníciales nulos y no nulos, estados finales nulos y no nulos, a trayectorias, además de pruebas con ruidos en los sensores y perturbaciones externas, obteniendo resultados muy satisfactorios en las simulaciones verificando así la robustez y eficacia del controlador.

• Se ha logrado garantizar error de estado estacionario de cero y eliminar perturbaciones en el sistema, al incluir una acción de control Proporcional Integral (PI), obtenido así una versión óptima de la misma.

• Se ha logrado adquirir y acondicionar las variables de realimentación de los diferentes sensores (giroscopio, encoder y brújula) que componen al sistema, las cuales han permitido el correcto desempeño del controlador implementado.

• Se ha mejorado la estimación del ángulo de orientación del sistema mediante la implementación del Filtro de Kalman, reduciendo el problema de posibles deslizamientos del sistema mientras se desplaza en el plano X-Y y de medidas erróneas del sensor brújula debido a campos magnéticos externos.

Page 114: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

CONCLUSIONES Y TRABAJOS FUTUROS

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM ) 108

• Se ha implementado el control óptimo FC-LQR a partir del modelo borroso de T-S en

el sistema real del péndulo invertido sobre dos ruedas ensamblado a base de Lego Mindstorms, obteniendo resultados satisfactorios, verificando así la robustez y eficacia del controlador.

• Se ha logrado resolver el problema de equilibrio del péndulo invertido frente a perturbaciones externas y se lo ha comprobando mediante pruebas de perturbación en el sistema real: de carga variable y de fuerza externa.

• Se ha realizado pruebas con estados finales no nulos y con varias trayectorias, sobre el sistema real del péndulo invertido y se han obtenido errores en estado estacionario alrededor de cero, comprobando la eficiencia de la acción integral implementada.

• Se ha propuesto un esquema modular en la implementación en MatLab© de la metodología de estimación y sintonización de parámetros de los modelos borrosos de T-K mediante la identificación borrosa, lo cual permite fácilmente modificar parámetros como: el número de etiquetas lingüísticas por variable borrosa, rango de los universos de discurso y estudio de otro tipo de sistemas no lineales.

7.2 Trabajos Futuros Como trabajos futuros del presente Trabajo de Fin de Máster, se puede mencionar un conjunto de actividades para desarrollarlas.

• Generalizar la implementación en MatLab© de la metodología de estimación de parámetros del modelo borroso de T-K mediante la identificación borrosa incluyendo varios tipos de funciones pertenencia como: trapezoidales, gaussianas, sigmoidales, etc.

• Desarrollar otras estrategias de control no lineal a partir del modelo borroso T-S obtenido mediante la identificación borrosa, entre los cuales se destacan: el control de estructura variable en modo deslizante y el control adaptativo.

• Simular e implementar el control FC-LQR en otras plantas no lineales, inestables y multivariable, entre las cuales se puede mencionar: control de vehículos aéreos, control de aerogeneradores, manipuladores robóticos, etc.

• Explorar otros métodos de estimación de modelos lineales a partir de sistemas no lineales multivariable y aplicar técnicas de control para dichos sistemas.

Page 115: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 109

7.3 Impacto Industrial En el presente apartado se analiza el impacto industrial del Trabajo Fin de Máster, como se ha mencionado en las conclusiones del presente trabajo se ha logrado controlar de manera eficaz al sistema no lineal multivariable, mediante el modelado discreto y control óptimo del sistema bajo estudio. Los sistemas no lineales multivariables se encuentran presentes prácticamente en todos de procesos industriales y controlarlos de manera eficaz se ha convertido en prioridad en la industria. El avance tecnológico actual y la disponibilidad de herramientas computacionales cada vez más poderosas han permitido abordar de mejor manera la problemática del control de sistemas no lineales. Entre los sistemas de naturaleza no lineal que las industrias requieren controlar se puede mencionar: sistemas de generación eléctrica (fotovoltaica, eólica, hidráulica, mareomotriz, térmica, nuclear, etc.), aplicaciones en el área automotriz, biomédica, espaciales, procesos de manufactura con manipuladores robóticos, control de aeronaves, etc. Estas aplicaciones requieren ser controladas de la manera más eficiente posible y tratarlas es de vital importancia. Abordar de la manera más eficiente el control de sistemas no lineales presentes en la industria genera un sin número de ventajas entre las cuales se pueden mencionar: mejora en la calidad de los productos o servicios brindados por las industrias, optimización en sus procesos, reducción en la contaminación ambiental, incremento en los niveles de seguridad. De esta manera el enfoque que se presenta en el presente trabajo para abordar a los sistemas de naturaleza no lineal y multivariables mediante técnicas de modelado utilizando la inteligencia artificial (modelo de Takagi-Sugeno) y posterior control óptimo de los mismos, brinda una opción eficaz para abordar esta problemática y conseguir las ventajas antes mencionadas.

Page 116: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

110

8. BIBLIOGRAFÍA

[1] J. Slotine, W. Li, "Applied Nonlinear Control", Prentice-Hall, 1991

[2] J. Aracil, F. Gordilllo, "El Péndulo Invertido: Un Desafío para el Control No Lineal", Revista Iberoamérica de Automática e Informática Industrial, Vol.2, No. 2, Abril 2005.

[3] R. Chanchareon, V. Sangveraphusiri, S. Chantranuwathana, "Tracking Control of an Inverted Pendulum Using Computed Feedback Linearization Technique", IEEE Conference on Robotics, Automation and Mechatronics, pp. 1-6, Dec. 2006.

[4] K. Ogata, "Ingeniería de Control Moderna", Pearson, 5 Ed, , pp. 68-72, 2010

[5] S.W. Nawawi, M. N. Ahmad, J. H. S. Osman, "Development of a Two-Wheeled Inverted Pendulum Mobile Robot", 5th Student Conference on Research and Development, pp. 1-5, Dec. 2007.

[6] Yorihisa Yamamoto. NXT way-GS "Model-Based Design: Control of self-balancing two-wheeled robot built with LEGO Mindstorms NXT". Cybernet Systems Co. 2009, http://www.mathworks.com/matlabcentral/_leexchange/19147m/

[7] T. Kanada, Y. Watanabe, G. Chen, "Robust iK control for two-wheel inverted pendulum using LEGO Mindstorms", Australian Control Conference, pp.136 - 141, Nov. 2011.

[8] K. Pathak, J. Franch, and S. K. Agrawal , "Velocity and Position Control of a Wheeled Inverted Pendulum by Partial Feedback Linearization", IEEE Trans. on Robotics, Vol. 21, No. 3, pp. 505- 513 , Jun. 2005

[9] T. Takei, R. Imamura, and S. Yuta, "Baggage Transportation and Navigation by a Wheeled Inverted Pendulum Mobile Robot", IEEE Trans. On Industrial Electronics, Vol. 56, No. 10, pp. 3985-3994, Oct. 2009

[10] B. Al-Hadithi, J. Suardiaz, "Implementación de un Controlador Robusto de Estructura Variable Mediante FPGA", Revista Tecnologi@ y desarrollo, Escuela Politécnica Superior, Universidad Alfonso X el Sabio, Vol. II ,2004

[11] Y. Pan, K. Furuta, S. Suzuki, S. Hatakeyama, "Design of Variable Structure Controller From Sliding Mode to Sliding Sector ", Proceedings of the 39th IEEE Conference on Decision and Control, Vol. 2, pp. 1685 - 1690, Dec. 2000.

[12] Min-Sun Key, Chang-Gook Jeon, Dong Sang Yoo, "Sliding Mode Control for a Two-Wheeled Inverted Pendulum Mobile Robot Driving on Uniform Slopes", 12th

Page 117: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

BIBLIOGRAFÍA

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES (UPM) 111

International Conference on Control, Automation and Systems, pp. 2159 - 2162, Oct. 2012.

[13] Jian Huang, Zhi-Hong Guan, T. Matsuno, T. Fukuda, and K. Sekiyama, " Sliding-Mode Velocity Control of Mobile-Wheeled Inverted-Pendulum Systems", IEEE Trans. on Robotics, Vol. 26, No. 4, pp. 750- 758 , Aug. 2010.

[14] Rong-Jong Wai, and Li-Jung Chang, "Adaptive Stabilizing and Tracking Control for a Nonlinear Inverted-Pendulum System via Sliding-Mode Technique", IEEE Trans. on Industrial Electronics, Vol. 53, No. 2, pp. 674-692, Apr. 2006.

[15] A. Jiménez, F. Matía, "Control Fuzzy: Estado Actual y Aplicaciones", Cuadernos Profesionales AADCA , No. 6, Vol. 2, 1994.

[16] M. I. H. Nour, J. Ooi, , and K. Y. Chan, "Fuzzy Logic Control vs. Conventional PID Control of an Inverted Pendulum Robot", International Conference on Intelligent and Advanced Systems , pp. 209 - 214, Nov. 2007.

[17] Y. Liu, Z. Chen, D. Xue, X. Xu, "Real-Time Controlling of Inverted Pendulum by Fuzzy Logic", Proceedings of the IEEE International Conference on Automation and Logistics, pp. 1180-1183, Aug. 2009.

[18] Cheng-Hao Huang, Wen-June Wang, Chih-Hui Chiu, " Design and Implementation of Fuzzy Control on a Two-Wheel Inverted Pendulum", IEEE Trans. on Industrial Electronics, Vol. 58, No. 7, pp. 2988 - 3001, Jul. 2011.

[19] A. Jiménez, E. Jiménez, "Introducción al Control Óptimo", Universidad Politécnica de Madrid, Sección de Publicaciones, Madrid, 1998.

[20] B. Zhang, J. Wang, "The Analysis and Simulation of First-Order Inverted Pendulum Control System Based on LQR", Third International Symposium on Information Processing, pp. 447 - 449, Oct. 2010.

[21] Wang Luhao, Sheng Zhanshi, "LQR-Fuzzy Control for Double Inverted Pendulum", International Conference on Digital Manufacturing & Automation, Vol. 1, pp. 900 - 903, Dec. 2010.

[22] Changkai Xu, Ming Li, Fangyu Pan, "The System Design and LQR control of a Two-wheels Self-balancing Mobile Robot", International Conference on Electrical and Control Engineering, pp. 2786 - 2789 , Sep. 2011.

[23] L. Prasad, B. Tyagi, H. Gupta, "Modelling & Simulation for Optimal Control of Nonlinear Inverted Pendulum Dynamical System using PID Controller & LQR", Sixth Asia Modelling Symposium, pp. 138 - 143, May. 2012.

[24] T. Takagi, and M. Sugeno, "Fuzzy identification of systems and its applications to modeling and control". IEEE Trans. Syst., Man, Cybern, Vol. SMC-15, No. 1, pp 116-132, Jan. 1985.

Page 118: TFM Marco Herrera - …repositorio.educacionsuperior.gob.ec/bitstream/28000/1613/1/T... · estructuras que permitan obtener un comportamiento deseado en la dinámica del sistema a

MODELADO Y CONTROL ÓPTIMO DE SIS. NO LINEALES MULTIVARIABLES

MARCO HERRERA GARZÓN 112

[25] B. M. Al-Hadithi, Agustín Jiménez, Fernando Matía, "A new approach to fuzzy estimation of Takagi - Sugeno model and its applications to optimal control for nonlinear systems", Appplied Soft computing, pp. 280-290. 2012.

[26] B. M. Al-Hadithi, A. Jiménez, F. Matía, "An Optimal T-S Model for the Estimation and Identification of Nonlinear Function", WSEAS TRANSACTIONS on SYTEMS and CONTROL, Vol. 3, No. 3, pp. 897-906, 2008.

[27] A. Jiménez , B. M. Al-Hadithi and F. Matía, "Improvement of Takagi-Sugeno Fuzzy Model for the Estimation of Nonlinear Functions", Asian Journal of Control, Published online in Wiley Online Library (wileyonlinelibrary.com). DOI: 10.1002/asjc.310: 24 Nov. 2010. To be published in Vol. 14, No. 6, pp.1-15, Nov. 2012.

[28] A. Jiménez, B. Al-Hadithi, L. Alonso, J. Pérez-Oria, "Linear Quadratic Regulator Based Takagi-Sugeno Model for Multivariable Nonlinear processes", IEEE 17th International Conference System Theory, Control and Computing, pp. 285-290, Oct. 2013.

[29] HiTechnic, "HiTechnic NXT Gyro Sensor for LEGO Mindstorms NXT", Copyright ©2001-2012, HiTechnic Products is a division of Dataport Systems, Inc, http://www.hitechnic.com/cgi-bin/commerce.cgi?preadd=action&key=NGY1044

[30] HiTechnic, "HTWay - A Segway type robot", Copyright© 2001-2012, HiTechnic Products is a division of Dataport Systems, Inc, http://www.hitechnic.com/blog/gyro-sensor/htway

[31] HiTechnic, "HiTechnic NXT Compass Sensor for LEGO Mindstorms NXT", Copyright© 2001-2012, HiTechnic Products is a division of Dataport Systems, Inc, https://www.hitechnic.com/cgi-bin/commerce.cgi?preadd=action&key=NMC1034

[32] G. WELCH, G. BISHOP, "An Introduction to the Kalman Filter", Department of Computer Science, University of North Carolina at Chapel Hill, 2006

[33] Lego Minstorms education, "NXT software V2.1.6 and NXT User Guide", Copyright© 2012 the LEGO Group.

[34] Robomatter, "ROBOTC a C Programming Language for Robotics", Copyright© 2005-2014,http://www.robotc.net