controlnlv10

CONTROL NO LINEALMULTIVARIABLEAPLICACIONES EN TIEMPO REAL

ARTURO ROJAS-MORENO, Ph.D.

F Modelado de Sistemas No Lineales

F Control Optimo Cuadratico

F Control Adaptativo con Modelo Referencial

F Control con Modos Deslizantes

F Control Backstepping

F Linealizacion por Realimentacion de Estados

F DVD: Programas en LabVIEW y MathScript

F Problemas de Diseno con Solucionario

II

CONTROL NO LINEAL MULTIVARIABLE

APLICACIONES EN TIEMPO REAL

Copyright c© 2009 Arturo Rojas-Moreno. Todos los derechos reservados.

ISBN

Queda rigurosamente prohibida la reproduccion total o parcial de esta obra por cualquiermedio o procedimiento, sin la autorizacion escrita del propietario del “Copyright”.

A la Memoria de mis Padres

Indice general

III

Prefacio IX

1. Introduccion 11.1. Estructura General . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2. Estructura para el Manipulador MR1 . . . . . . . . . . . . . . . . . . 21.3. Estructura para los Manipuladores MRE y MRT . . . . . . . . . . . . 31.4. Estructura del Sistema de Control del Tanque . . . . . . . . . . . . . . 4

2. Modelado de Sistemas No Lineales 52.1. Modelado Empleando las Leyes de la Fısica . . . . . . . . . . . . . . . 5

2.1.1. Manipulador Robotico de 1GDL . . . . . . . . . . . . . . . . . 52.1.2. Manipulador Robotico con Articulacion Elastica (MRAE) . . . 122.1.3. Sistema Tanque de Agua . . . . . . . . . . . . . . . . . . . . . 16

2.2. Metodo de Las Ecuaciones de Lagrange . . . . . . . . . . . . . . . . . 212.2.1. Manipulador Robotico Traslacional (MRT) . . . . . . . . . . . 212.2.2. Manipulador Robotico Esferico (MRE) . . . . . . . . . . . . . . 28

2.3. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

3. Control Optimo 453.1. Configuracion del Sistema de Control Optimo . . . . . . . . . . . . . . 453.2. Descripcion dinamica del Sistema . . . . . . . . . . . . . . . . . . . . . 463.3. El Controlador PI Optimo . . . . . . . . . . . . . . . . . . . . . . . . . 473.4. El Observador No Lineal Multivariable . . . . . . . . . . . . . . . . . . 503.5. Procedimiento de Diseno . . . . . . . . . . . . . . . . . . . . . . . . . . 523.6. Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

3.6.1. Control Optimo del Manipulador Robotico de 1GDL (MR1) . . 543.6.2. Control Optimo del Manipulador Robotico Esferico . . . . . . . 553.6.3. Control Optimo del Manipulador Robotico Traslacional . . . . 56

3.7. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

4. Control Adaptativo con Modelo Referencial 614.1. Configuracion de un SCAMR . . . . . . . . . . . . . . . . . . . . . . . 614.2. SCAMR para Sistemas No Lineales Multivariables . . . . . . . . . . . 62

4.2.1. Diseno del SCAMR . . . . . . . . . . . . . . . . . . . . . . . . 624.2.2. El Observador de Velocidad . . . . . . . . . . . . . . . . . . . . 64

VI INDICE GENERAL

4.2.3. Zona–Muerta para Evitar Corrimiento de Parametros . . . . . 654.2.4. Procedimiento de Diseno del SCAMR . . . . . . . . . . . . . . 65

4.3. SCAMR para Sistemas con Forma Asociada . . . . . . . . . . . . . . . 674.3.1. Formulacion del Problema y la Ley de Control . . . . . . . . . 674.3.2. La Ley de Adaptacion . . . . . . . . . . . . . . . . . . . . . . . 694.3.3. Procedimiento de Diseno . . . . . . . . . . . . . . . . . . . . . 70

4.4. Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 704.4.1. Control Adaptativo del Manipulador Robotico Esferico . . . . . 704.4.2. Control Adaptativo del Manipulador Robotico Traslacional . . 714.4.3. Control Adaptativo del Manipulador Robotico MR1 . . . . . . 73

4.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

5. Control por Modos Deslizantes 775.1. Conceptos Basicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 775.2. Control Deslizante para Sistemas Multivariables . . . . . . . . . . . . . 81

5.2.1. El Sistema a Controlar . . . . . . . . . . . . . . . . . . . . . . . 815.2.2. La Superficie de Conmutacion . . . . . . . . . . . . . . . . . . . 815.2.3. Diseno de la Fuerza de Control Multivariable . . . . . . . . . . 82

5.3. Procedimiento de Diseno . . . . . . . . . . . . . . . . . . . . . . . . . . 845.4. Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

5.4.1. Control Deslizante del Manipulador Esferico . . . . . . . . . . . 855.4.2. Control Deslizante del Manipulador Traslacional . . . . . . . . 865.4.3. Control Deslizante del Sistema Tanque con Agua . . . . . . . . 885.4.4. Control Deslizante del Manipulador MR1 . . . . . . . . . . . . 90

5.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

6. Control Backstepping 936.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 936.2. Caracterısticas del Modelo . . . . . . . . . . . . . . . . . . . . . . . . . 966.3. Diseno Backstepping No Lineal . . . . . . . . . . . . . . . . . . . . . . 976.4. Procedimiento de Diseno Backstepping . . . . . . . . . . . . . . . . . . 986.5. Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

6.5.1. Control Backstepping del Manipulador Esferico . . . . . . . . . 986.5.2. Control Backstepping del Manipulador Traslacional . . . . . . 996.5.3. Control Backstepping del Sistema Tanque con Agua . . . . . . 1006.5.4. Control Backstepping del Manipulador MR1 . . . . . . . . . . 101

6.6. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

7. Linealizacion por Realimentacion de Estados 1077.1. Herramientas de la Geometrıa Diferencial . . . . . . . . . . . . . . . . 107

7.1.1. Derivadas y Corchetes de Lie . . . . . . . . . . . . . . . . . . . 1087.1.2. Difeomorfismos y Transformacion de Coordenadas . . . . . . . 1097.1.3. El Teorema de Frobenius . . . . . . . . . . . . . . . . . . . . . 109

7.2. Linealizacion por Realimentacion. Caso: SISO . . . . . . . . . . . . . . 1107.2.1. Condiciones para Linealizacion . . . . . . . . . . . . . . . . . . 1107.2.2. El Grado Relativo de un Sistema SISO . . . . . . . . . . . . . . 1127.2.3. Forma Normal SISO con Linealizacion Exacta . . . . . . . . . . 113

INDICE GENERAL VII

7.2.4. La Ley de Control SISO para Linealizacion . . . . . . . . . . . 1147.3. Linealizacion por Realimentacion: Caso MIMO . . . . . . . . . . . . . 115

7.3.1. Modelando Sistemas MIMO Cuadrados . . . . . . . . . . . . . 1157.3.2. Grado Relativo Total . . . . . . . . . . . . . . . . . . . . . . . . 1167.3.3. Forma Normal MIMO para Linealizacion Exacta . . . . . . . . 1177.3.4. La Ley de Control MIMO Desacoplada . . . . . . . . . . . . . . 118

7.4. Observadores No Lineales con Polos Prescritos . . . . . . . . . . . . . 1207.4.1. Observador SISO No Lineal con Polos prescritos . . . . . . . . 1217.4.2. Observador MIMO No Lineal con Polos Prescritos . . . . . . . 123

7.5. Procedimiento de Diseno . . . . . . . . . . . . . . . . . . . . . . . . . . 1247.6. Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

7.6.1. Control por Linealizacion del Manipulador MR1 . . . . . . . . 1257.6.2. Control por Linealizacion del Manipulador MRE . . . . . . . . 125

7.7. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

A. El Metodo Directo de Lyapunov 131A.1. Estabilidad vıa el Metodo Directo de Lyapunov . . . . . . . . . . . . . 131

A.1.1. Conceptos de Estabilidad . . . . . . . . . . . . . . . . . . . . . 131A.1.2. Funciones de Lyapunov . . . . . . . . . . . . . . . . . . . . . . 132A.1.3. Teoremas de Estabilidad de Lyapunov . . . . . . . . . . . . . . 136A.1.4. Teoremas del Conjunto Invariante . . . . . . . . . . . . . . . . 138

. Bibliografıa 141

. Indice alfabetico 144

Prefacio

Esta publicacion esta dirigida a todos los profesionales, cientıficos, especialistasy estudiantes interesados en familiarizarse con el diseno e implementacion de sistemasde control no lineales multivariables operando en tiempo real. El libro presenta ydiscute la simulacion e implementacion en tiempo real de varias configuraciones desistemas de control no lineal con el proposito de validar los procedimientos de disenodesarrollados en los capıtulos.

Los diversos estudios de simulacion y los programas de adquisicion de datosy control en tiempo real han sido elaborados con LabVIEW, version 8.5. El CDadjunto a esta publicacion contiene todos los archivos desarrollados en este libro.Tales programas de control permiten sintonizar en lınea y en forma interactiva losparametros de los algoritmos de control y visualizar en tiempo real las variables enjuego del sistema. Se ha dado enfasis a la visualizacion de las variables de control y desalida con la finalidad de observar en linea que las senales de salida controladas hacenun seguimiento de las senales de referencia deseadas, cumpliendo las especificacionesde diseno pre–establecidas.

Los procedimientos de diseno e implementacion de los sistemas de control nolineal desarrollados en este libro se pueden aplicar a una gran clase de procesos nolineales, tales como brazos roboticos (manipuladores), aeronaves de alto rendimiento,vehıculos espaciales, procesos quımicos, motores de corriente alterna, entre otros.Al final de cada capıtulo se propone un conjunto de problemas relacionados con elmodelado, simulacion y diseno del sistema de control no lineal para diversos sistemas.

Esta publicacion emplea el control en tiempo real de sistemas prototipo paraverificar mediante experimentacion la efectividad de los sistemas de control disenados.Tales sistemas prototipos son: brazos roboticos de uno y dos grados de libertad y elsistema tanque de agua. En los brazos roboticos el objetivo de control es lograr quecada brazo alcance posiciones angulares de referencia deseadas. Dichas referenciaspueden ser tambien variantes con el tiempo (problema de seguimiento). En el casodel sistema tanque de agua, el objetivo de control es que la temperatura y nivel dellıquido en el tanque sigan a referencias constantes.

Este libro esta organizado en los capıtulos siguientes:

Capıtulo 1: Modelado de Procesos No Lineales. En este capıtulo se de-ducen los modelos matematicos que representan la dinamica de los sistemas a sercontrolados en tiempo real. Tales modelos matematicos son necesarios para disenarlas leyes de control no lineal.

Capıtulo 2: Implementacion en Tiempo Real. Este capıtulo describe las

X Prefacio

estructuras en hardware de los sistemas de control no lineal multivariables implemen-tados.

Capıtulo 3: Control Optimo. El sistema de control optimo considerado com-bina un proceso no lineal pero linealizable, un controlador de realimentacion de es-tados proporcional-integral y un observador no lineal para estimar los estados delproceso. El objetivo del sistema de control optimo es determinar una funcion defuerza capaz de minimizar la diferencia entre el vector de salida del proceso y el vec-tor de trayectorias deseadas, a pesar de la presencia de disturbios estocasticos en elsistema.

Capıtulo 4: Control Adaptativo con Modelo Referencial. Este sistemade control no lineal se compone principalmente de cuatro partes: el modelo de referen-cia, el controlador adaptativo, el proceso no lineal y el el mecanismo de adaptacion.El modelo de referencia es un modelo dinamico auxiliar empleado para especificar larespuesta deseada del sistema, mientras que el mecanismo de adaptacion es un con-junto de bloques interconectados y empleados para implementar la ley de adaptacion,la cual modifica los parametros del controlador adaptativo de forma tal que el sistemade control adaptativo permanezca estable y que el error de seguimiento converja acero a pesar de que existan cambios reales en los parametros del proceso y disturbiosexternos. El metodo directo de Liapunov se emplea en este contexto para garantizarestabilidad asintotica en el sistema disenado.

Capıtulo 5: Linealizacion de la Realimentacion. Los metodos de la ge-ometrıa diferencial se pueden aplicar a sistemas no lineales para determinar si talessistemas son linealizables por realimentacion; esto es, si la descripcion dinamica deun sistema en particular se puede hacer que parezca lineal despues de que se le hayaaplicado una transformacion de coordenadas apropiada y una realimentacion no li-neal de estados. Este capıtulo presenta el metodo para llevar a cabo la linealizacionde la realimentacion con el proposito de disenar una ley de control desacoplada. Unobservador no lineal con asignacion de polos se emplea tambien para estimar los es-tados del sistema.

Capıtulo 6: Control con Modos Deslizantes. En un sistema de control conmodos deslizantes la descripcion del sistema puede ser imprecisa. La metodologıaaplicada en este tipo de control incluye una ley de control de realimentacion no li-neal que esta conmutando en forma discontinua sobre una superficie que perteneceal espacio de estado del sistema. Si alguna trayectoria de estado originada en estasuperficie, en respuesta al comportamiento natural de la dinamica del sistema a lazoabierto, se trata de desviar de la superficie especificada, entonces se deben aplicaracciones de control para hacer retornar a dicha trayectoria a su estado anterior. Esposible modificar la ley de control adecuadamente a fin de obtener acciones de controlmas moderadas.

FALTAN AGRADECIMIENTOS

XI

Arturo Rojas Moreno, [email protected]

Capıtulo 1

Introduccion

El control no lineal de sistemas multivariables es un campo de la Ingenierıa deControl que ha logrado la madurez gracias a sus innumerables y variadas aplicacionesindustriales exitosas. Este hecho ha sido posible por que el control no lineal tiene adisposicion una diversidad de metodos de analisis y sıntesis de sistemas de control.

En contraposicion con los sistemas de control lineales, un sistema de control nolineal puede operar en grandes rangos de operacion, a pesar de la presencia de incertidum-bres en el modelo dinamico del sistema y considerables perturbaciones actuando sobreel sistema controlado. Los sistemas de control no lineales tambien son capaces de com-pensar no linealidades inherentes al sistema controlado tales como friccion de Coulomb,saturacion, zona muerta, histerisis, juegos en los engranajes (backlash en ingles), entreotras. Cabe anotar que todos los sistemas a controlar son no lineales por naturaleza.

Los metodos de diseno de sistemas de control no lineal multivariable a desarrollaren los siguientes capıtulos son: control optimo cuadratico, control adaptativo con modeloreferencial, control con modos deslizantes, control backstepping (terminologıa en inglesque tambien se usa en castellano) y control por linealizacion de la realimentacion. Estapublicacion emplea el control en tiempo real de los sistemas siguientes:1) Manipulador robotico de 1GDL (1 Grado de Libertad).2) Manipulador Robotico Espacial (MRE).3) Manipulador Robotico Traslacional (MRT).4) Sistema Tanque de Agua

1.1. Estructura General

La estructura mostrada en la figura 1.1 se emplea para la implementacion entiempo real de los sistemas de control a ser desarrollados en los capıtulos siguientes.Tal figura nos informa que los algoritmos de control y las senales deseadas o dereferencia se implementan en la computadora personal. Los algoritmos de controlimplementados en este trabajo emplean el lenguaje del software LabVIEW, version8.5. La interfaz entre la PC y el usuario es una DAQ (Data Acquisition Card) o tarjetade adquisicion de datos PCI 6229 de NI (National Instrument). Las senales medidasy generadas para cada sistema de control se discuten en las siguientes secciones.

2 Introduccion

Computadora Personal

DAQ PCI 6229

AnalógicasAO1 − AO4

AI00 − AI31AnalógicasEntradas

Salidas

ProgramablesEntradas

Actuador

Medición

P1

Sistema

Fig. 1.1: Estructura del sistema de control en tiempo real empleado.

AmplificadorPWM

θ


DAQ PCI 6229



Salidas


P1

Armadura

Sensor de Posición

Fig. 1.2: Sistema de control en tiempo real para el manipulador robotico MR1.

1.2. Estructura para el Manipulador MR1

La figura 1.2 muestra la estructura para controlar la posicion angular del ma-nipulador robotico de 1GDL (MR1). El sistema de control requiere de la medicionde la posicion angular, la cual se logra gracias al sensor de posicion en cuadratu-ra (“encoder”) que posee el servomotor D.C. (Direct Current) en su eje. La senalmedida ingresa por uno de los dos contadores que posee la DAQ PCI 6229. Estoscontadores se ubican en sus terminales PFI (Programmable Function I/O) y se de-nominan entradas P1. La senal medida y el algoritmo de control se procesan en lacomputadora personal empleando el software LabVIEW previamente instalado. Losdetalles del codigo de programacion en LabVIEW se encuentran en los listados delos respectivos programas que forman parte del CD (Compact Disk) que se adjuntaa esta publicacion.

1.3 Estructura para los Manipuladores MRE y MRT 3

θ

θ

PWM 1Amplificador

Amplificador PWM 2


DAQ PCI 6229



Salidas


P1

1

2

Armadura

Armadura

1

2

Sensoresde

Posición

Fig. 1.3: Sistema de control en tiempo real para los manipuladores MRE y MRT.

La senal de control generada en la computadora personal es una senal sin lacapacidad de hacer girar al servomotor D.C. Por esta razon se la potencia usandoun amplificador PWM (Pulso Width Modulation). La senal que sale del amplificadorconstituye el voltaje de control que que ingresa a los terminales de la armadura delservomotor. Los amplificadores usados son Galil FAAAALTAAA!!!!!!

1.3. Estructura para los Manipuladores MRE y MRT

La estructura para controlar las posiciones angulares de los dos brazos de los ma-nipuladores roboticos esferico (MRE) y traslacional (MRT) se muestra en la Fig. 1.3.Observar que el sistema de control en tiempo real requiere de la medicion simultaneade dos posiciones angulares para cada manipulador, la cual se logra mediante lossensores de posicion en cuadratura que posee en su eje cada uno de los servomotores.

Las senales medidas ingresan a los dos contadores que posee la DAQ PCI 6229.Se menciono que estos contadores se ubican en las denominadas entradas P1. Lassenales medidas y el algoritmo de control multivariable se procesan en la computadorapersonal empleando el software LabVIEW. Los detalles del codigo de programacionen LabVIEW se pueden ver en los listados de los respectivos programas que formanparte del CD que se adjunta a este libro.

Las senales de control generada en la computadora personal son senales sin lapotencia requerida para hacer girar al servomotor D.C. Por esta razon se empleandos amplificadores PWM (Pulso Width Modulation) para incrementar la potencia delas senales. Las senales que salen de los amplificadores son los voltajes de control queque ingresan a los terminales de armadura de los servomotores. Los amplificadoresusados son Galil FAAAALTAAA!!!!!!

4 Introduccion

1.4. Estructura del Sistema de Control del Tanque

La figura 1.4 muestra La estructura para controlar simultaneamente o porseparado el nivel y la temperatura del agua contenido en el tanque. Los sistemas decontrol a realizarse requieren de la medicion del nivel y de la temperatura del agua.La medicion de nivel se logra empleando un transmisor de presion Valcom de rango0 a 1.25 m, mientras que la medicion de la temperatura emplea una termoresistenciade rango 0 a 100 oC con sensor Pt 100.

La medicion de nivel debe ingresar a la computadora personal a traves de latarjeta de adquisicion de datos en un rango de voltaje adecuado. Para ello se empleael convertidor e indicador de nivel Safir tipo P, el cual convierte los 4 a 20 mA queproporciona el transmisor de nivel Valcom tipo P a una senal de voltaje de 0 a 10V, que equivale al rango de 0 a 1.25 m de medicion de nivel. Tal transmisor sirvetambien como indicador digital del nivel.

De mismo modo, la senal que proporciona la termoresistencia se convierte alrango de voltaje de 0 a 10 V empleando para ello el transmisor de temperaturaValcom tipo T, el cual convierte el rango de temperatura de 0 a 100 oC a una senalde voltaje de 0 a 10 V. Tal convertidor sirve tambien como indicador digital de latemperatura.

Fig. 1.4: Sistema de control en tiempo real para el tanque.

El algoritmo de control grabado en la PC procesa tal medicion y genera dossenales de control. Estas senales salen a traves de dos de las cuatro salidas analogicasque posee la tarjeta DAQ PCI 6229. La primera senal de rango 0 a 10 V, va directa-mente a la valvula motorica Sauter AVM104S, la cual sirve para controlar el flujo deagua de entrada al tanque. La segunda senal de rango 1 a 5 V, sirve como entrada alcontrolador de potencia SPC1-35, el cual genera la corriente adecuada para alimentara la resistencia electrica con el proposito de producir el calor necesario para calentarel agua del tanque a una temperatura deseada.

Capıtulo 2

Modelado de Sistemas NoLineales

La dinamica de una gran variedad de sistemas a ser controlados se puede describirmediante un conjunto de ecuaciones diferenciales. Tal descripcion matematica se obtieneaplicando las leyes de la fısicas y de la quımica sobre el sistema, tales como la conservacionde la energıa, las leyes de Newton, entre otras. Para construir un modelo adecuado parapropositos de control, se requiere conocer bien la dinamica del sistema. No siempre esmejor que un modelo sea lo mas exacto posible a su comportamiento dinamico. Tener encuenta que mientras mas complejo sea el modelo, mas dificultoso sera el analisis y disenodel sistema de control correspondiente. Lo recomendable es que el modelo del sistemamantenga las caracterısticas dinamicas de interes para el rango de operacion del sistemade control a disenar.

En este capıtulo se emplean las siguientes estrategias de modelado: aplicacion delas leyes de la fısica (seccion 2.1) y aplicacion de las ecuaciones de Lagrange (seccion2.2). Los modelos dinamicos de los siguientes sistemas se desarrollan en este capıtulo:

(1) Manipulador Robotico de 1 Grado de Libertad (MR1, leyes fısicas).(2) Manipulador Robotico de 1 Grado de Libertad con Articulacion Elastica (MRAE, leyesfısicas).(3) Tanque de agua (leyes fısicas).(4) Manipulador Robotico Esferico (MRE, ecuaciones de Lagrange).(5) Manipulador Robotico Traslacional (MRT, ecuaciones de Lagrange).

En la seccion Problemas se propone la derivacion de modelos dinamicos de otrossistemas no lineales.

2.1. Modelado Empleando las Leyes de la Fısica

2.1.1. Manipulador Robotico de 1GDL

El manipulador robotico de 1GDL (1 Grado De Libertad) mostrado en la figura2.1 es uno de los sistemas prototipo a ser utilizado en esta publicacion para validarmediante experimentacion algunos de los sistemas de control no lineal desarrollados en

6 Modelado de Sistemas No Lineales

esta publicacion. Este sistema se compone de un subsistema electrico y un subsistemamecanico. El subsistema electrico comprende un servomotor D.C. (“Direct Current”)con codificador (“encoder”) de posicion incorporado, el cual se emplea para medir laposicion angular del brazo del manipulador en cada instante de tiempo. El servomotorposee una caja de engranajes para reducir la velocidad en su eje de salida; de de estamanera se facilita el control de posicion del manipulador.

El subsistema mecanico consiste de un brazo accionado por el torque rotacionalgenerado en el eje de salida del servomotor D.C. (el actuador). En el extremo libre delbrazo robotico se puede acoplar un efector final, el cual puede ser una pinza para asirobjetos, una herramienta para soldar, una herramienta para pintar, etc. En nuestrocaso usaremos una pinza con dos grados de libertad: un grado para rotar la pinza yotro para abrirla y cerrarla. para propositos de modelado, vamos a suponer que elefector final y su carga se pueden modelar mediante una masa mh variable. La tabla2.1 describe las variables y los valores de los parametros del manipulador mostradoen la figura 2.1.

El manipulador de 1GDL es del tipo SISO (“Single Input Single Output”)ya que solo posee una entrada: el voltaje de control u aplicado a la armadura delservomotor, y una salida: la posicion angular θ del brazo.

i

N

T

R

L

u

BJ

v

T

a

a a

b

g1mm

1

m

θω

mm

2N Tg2Bg

JgTL

ω

BLJL

mθ L

b

+

_

+

_

θ

mh

L

mh

KA

τ L

Fig. 2.1: Manipulador robotico de 1GDL.

Modelo del Subsistema Mecanico

Para modelar el subsistema mecanico del manipulador empleamos la segundaley de Newton para los movimientos lineal y rotacional. La aplicacion de esta segundaley se traduce en una ecuacion de balance mecanico. Con respecto a la figura 2.1, laecuacion de balance mecanico en el eje del servomotor articulado al primer engranajese formula como:

Tm = Jmθm + Bmθm + Tg1 θm =dθm

dtθm =

d2θm

dt2(2.1)

donde Jm y Bm representan el momento de inercia y la constante de friccion viscosadel rotor respectivamente, Tm es el torque del servomotor, Tg1 es el torque de reacciondebido al primer engranaje y θm es la posicion angular en el lado del motor. Para los

2.1 Modelado Empleando las Leyes de la Fısica 7

Tabla 2.1: Parametros y variables del brazo robotico de 1 GDL.

Sımbolo Descripcion Valor Unidadesu Voltaje de entrada al sistema V

KA Ganancia del amplificador 8.5Va Voltaje de armadura VRa Resistencia de armadura 3.5 ΩLa Inductancia de armadura 0.004 Hia Corriente de armadura A

Km Constante del torque motor 0.0436 N-m/ATm Torque motor N-mTL Torque de carga N-mτL Torque causado por pesos de la carga N-mTg1 Torque de entrada a los engranajes N-mTg2 Torque de salida de los engranajes N-mJm Inercia del motor 0.00059 kg-m2

Jg Inercia de los engranajes 0.066 kg-m2

JL Inercia de la carga kg-m2

Bm Constante de friccion del motor 0.00014 N-m/rad/sBg Constante de friccion en engranajes 0.0124 N-m/rad/sBL Constante de friccion en la carga 0.0023 N-m/rad/smh Masa del efector final 0.1 kgmb Masa del brazo 0.4 kgL Longitud del brazo 0.25 mrh Distancia al centro de masa del efector 0.02 mVb Voltaje contraelectromotriz VKb Constante contraelectromotriz 0.0565 V/rad/sg Aceleracion de la gravedad 9.81 m/s2

N1, N2 No de dientes de los engranajes N2 > N1

n Relacion de engranajes (n = N2/N1) 18.5θm Posicion angular del motor radθ Posicion angular de la carga radω Velocidad angular de la carga rad/s

ωm Velocidad angular del motor ωm = nω rad/sKw Constante de elasticidad 0.052 N-m/rad


engranajes de reduccion del servomotor podemos formular:

n =N2

N1=

θm

θθm = nθ n > 1 (2.2)

donde N1 y N2 es el numero de dientes de los engranajes y n > 1 es la relacion entreellos. Para formular la ecuacion (2.2) se ha tenido en cuenta que el espacio angularrecorrido por el engranaje de menor radio es n veces mayor que el espacio recorridopor el engranaje de radio mayor. Por otra parte, el principio de la conservacion de laenergıa establece que el trabajo realizado por el engranaje de la izquierda debe serigual al trabajo realizado por el engranaje de la derecha, es decir:

Tg2θ = Tg1θm = Tg1nθ; Tg2 = nTg1 (2.3)

donde Tg2 es el torque de reaccion debido al segundo engranaje. El balance mecanicoen el eje articulado al brazo del manipulador produce:

Tg2 = Jg θ + Bg θ + TL (2.4)

donde Jg y Bg representan el momento de inercia y la constante de friccion viscosade la caja de reduccion respectivamente. El torque de carga TL se formula como (verfigura 2.2):

TL = JLθ + BLθ + τL (2.5)

τL = mbgL

2senθ + mhg (L + rh)senθ = Q sen θ (2.6)

Q = mbgL

2+ mhg (L + rh)

donde JL y BL representan el momento de inercia y la constante de friccion viscosade la carga no lineal (brazo mas efector final), g es la constante gravitacional, mb ymh denotan las masas del brazo y del efector final (esta masa tambien incluye la masade la carga en el efector) respectivamente, y rh denota la distancia desde el extremodel brazo al centro de masa de mh. Para fines practicos se puede asumir que rh esdespreciable con respecto a la longitud L del brazo. Notar en (2.6) que el torqueτL se debe a las fuerzas ejercidas por los pesos del brazo y de la esfera. Ası, el torquemb g L senθ

2 es el producto del peso mb g del brazo por su brazo de palanca L senθ2 ,

mientras que el torque mh g (L+ rh)senθ es el producto del peso mb g del efector porsu brazo de palanca (L + rh)senθ.

El momento de inercia JL de la carga es la suma del momento de inercia delbrazo Jb mas el momento de inercia del efector Jh. Por otra parte, el teorema de losejes paralelos, establece que el momento de inercia de una masa m alrededor de uneje de rotacion que no pasa por su C.M. esta dado por:

J = Jo + ma2 (2.7)

donde Jo es el momento de inercia de m alrededor del eje de rotacion que pasa porsu centro de masa y a es la distancia entre los dos ejes.

Asumiendo que la masa mb del brazo se concentra en su C.M., su momento deinercia con relacion a un eje perpendicular que pasa por su C.M. es [8]:

Jbo =112

mbL2 (2.8)


2_L

_2L

θ

hr

m gh

mbg

τ L

Fig. 2.2: Brazo del manipulador robotico de 1GDL.

Considerando que la masa del brazo esta distribuida a lo largo de su longitud yaplicando el teorema de los ejes paralelos, el momento de inercia Jb con respecto alpunto de articulacion se formula como:

Jb = Jbo + mb

(L

2

)2

=13mbL

2 (2.9)

Del mismo modo, asumiendo que la masa mh del efector esta concentrada ensu C.M., entonces:

Jh = Jho + mh(L + rh)2 (2.10)

donde Jho es el momento de inercia del efector con relacion a un eje de rotacionque pasa por su C.M. Si consideramos por ejemplo, sin perder generalidad, que elefector es una masa esferica de radio rh, su momento de inercia alrededor de un ejede rotacion que coincide con su diametro [8] es:

Jho =25mhr2

h (2.11)

Empleando (2.5), (2.6), (2.4), (2.3) y (2.2) en (2.1) y operando se obtiene:

nTm = Jeq θ + Beq θ + τL = Jeqω + Beqω + Qsenθ (2.12)

donde:Jeq = n2Jm + Jg + JL Beq = n2Bm + Bg + BL

Las expresiones de Q, Jh y Jb (tener en cuenta que JL = Jh + Jb) se dan en (2.6),(2.10) y (2.8) respectivamente.

Modelo del Subsistema Electrico

El voltaje de armadura Va viene expresado por (ver la descripcion de las varia-bles y parametros en la Tabla 2.1):

Va = iaRa + Ladiadt

+ Vb (2.13)


donde ia, Ra y La son la corriente, la resistencia y la inductancia en la armadu-ra del servomotor respectivamente, y Vb es el voltaje de fuerza contraelectromotrizgobernado por la relacion:

Vb = Kbωm = Kbnω = Kbnθ (2.14)

donde Kb es la constante de fuerza contra-electromotriz y esta relacionado con lavelocidad angular ωm del motor. El voltaje de armadura Va es:

Va = KAu (2.15)

donde KA es la ganancia del amplificador.

Conversion de Energıa Electrica en Mecanica

Sabemos que el torque motor Tm (energıa mecanica) es proporcional a la co-rriente de armadura ia (energıa electrica):

Tm = Kmia = TJeq θ + Beq θ + τL (2.16)

donde Km es la constante del motor. Reemplazando (2.12) en ( 2.16) se obtiene lasiguiente ecuacion de conversion de energıa electrica a energıa mecanica:

nKmia == Jeq θ + Beq θ + τL (2.17)

Por otra parte, igualando (2.13) con (2.15) obtenemos:

diadt

=KA

Lau− Kbn

Laω − Ra

Laia (2.18)

Empleando (2.16) en (2.12) y despejando ω = dω/dt obtenemos:

dω

dt= − Q

Jeqsenθ − Beq

Jeqω +

nKm

Jeqia (2.19)

Ecuacion de Estado del Sistema MR1 con La 6= 0

Las ecuaciones (2.18) y (2.19) describen el modelo no lineal del sistema de tercerorden. Eligiendo en dichas ecuaciones como variables de estado: x1 = θ (posicionangular), x2 = θ (velocidad angular) y x3 = ia (corriente de armadura), se obtiene:

x1 = x2

x2 = − Q

Jeqsenx1 − Beq

Jeqx2 +

nKm

Jeqx3

x3 = −nKb

Lax2 − Ra

Lax3 +

KA

Lau (2.20)

donde la salida es la posicion x1 y la senal de control es u (la tension de armadura).


Ecuacion de Estado del Sistema MR1 con La∼= 0

En la Tabla 2.1 podemos observar que la inductancia de armadura La delservomotor es bastante pequena, de modo tal que puede despreciarse sin que se pierdaconsiderable exactitud en los resultados. Considerando el producto x3La = 0 en latercera ecuacion de (2.20) y despejando la corriente de armadura x3 resulta:

x3 =KA

Rau− nKb

Rax2 (2.21)

Reemplazando (2.21) en la segunda ecuacion de (2.20), se obtiene la ecuacion deestado no lineal de orden dos del manipulador:

x1 = x2

x2 = −a1 sinx1 − a2x2 − bu (2.22)

donde:

a1 =Q

Jeqa2 =

(BeqRa + n2KmKb

JeqRa

)b =

nKmKA

JeqRa

Modelo de Lagrange del Sistema MR1 con La∼= 0

La ecuacion (2.16) tiene la forma: (2.12):

nKmia = Jeq θ + Beq θ + τL

Si despreciamos la inductancia La en (2.18), entonces el producto Ladiadt iguala a

cero. Por consiguiente:0 = KA u−Kbn θ −Ra ia

Combinando las dos ultimas ecuaciones se obtiene el denominado modelo dinamicode Lagrange:

Mθ + P θ + d = u (2.23)

donde:

M =(

JeqRa

nKmKA+

nKb

KA

)P =

BeqRa

nKmKAd =

RaQ sin θ

nKmKA

Forma Asociada del Sistema MR1 con La∼= 0

Despreciando la inductancia de armadura La y despejando θ de (2.23) resulta:

θ = − P

Mθ − d

M+

1M

u

Reemplazando las expresiones de M , P , d y simplificando se obtiene la llamada formaasociada del sistema MR1:

hθ +2∑

i=1

αifi = hθ + α1f1 + α2f2 = u (2.24)

donde:

h =JeqRa + n2KmKb

nKmKAα1 =

BeqRa

nKmKAα2 =

RaQ

nKmKAf1 = θ f2 = sin θ


Forma Asociada del Sistema MR1 con La 6= 0

Definamos y = θ y x = [ y y y y(3) ]. Derivando (2.19) se obtiene:

d3y

dt3= − Q

Jeqcos y y − Beq

Jeqy +

nKm

Jeq

diadt

(2.25)

Reemplazando (2.18) en (2.25) se obtiene:

d3y

dt3= − Q

Jeqcos y y − Beq

Jeqy +

nKmK −A

JeqLau− n2KmKb

JeqLay − nKmRa

JeqLaia (2.26)

Despejamos ia de ( 2.19), la reemplazamos en (2.26) y luego reordenamos la ecuacionresultante para obtener la siguiente forma asociada del sistema MR1:

h y(3) +4∑

i=1

αifi(x) = u (2.27)

donde:

h =JeqLa

nKmKAα1 =

(BeqLa

KA+

RaJeq

nKAKm

)

α2 =(

nKb

KA+

RaBeq

nKAKm

)α3 =

QLa

nKAKmα4 =

RaQ

nKAKm

meq =12m + mH f1 = y f2 = y f3 = y cos y f4 = sen y

2.1.2. Manipulador Robotico con Articulacion Elastica (MRAE)

La figura 2.3 muestra el Manipulador Robotico con Articulacion Elastica (MRAE)de 1GDL. El efecto del acoplamiento elastico entre el eje de salida del servomotorcon el brazo (o eslabon) del MRAE, se puede modelar mediante un resorte rotacionalcon constante de elasticidad Kw.

En la figura 2.3, u denota el voltaje de entrada, θ (la salida del sistema) esla posicion angular del brazo de longitud L y masa mb, θm representa la posicionangular del eje del actuador (el servomotor DC) antes de la caja de reduccion. Alextremo del brazo se puede articular un efector final, como en el caso del manipuladorde 1GDL. La tabla 2.1 tambien describe las variables y los valores de los parametrosdel sistema mostrado en la figura 2.1.

Ecuaciones Dinamicas del MRAE

El balance mecanico en el eje del servomotor articulado al primer engranaje seexpresa como:

Tm = Jmθm + Bmθm + Tg1


i

N

T

R

L

u

BJ

v

T

a

a a

b

g1mm

1

m

θω

mm

2N

m

L

b

+

_

+

_

θ

mh

KA

τ L

Tg2 TLB

LJLJ g

Bg

ωθ

wKL

mh

Fig. 2.3: Manipulador Robotico con Articulacion Elastica (MRAE).

donde Jm y Bm representan el momento de inercia y la constante de friccion viscosadel rotor, Tm es el torque del servomotor y Tg1 es el torque de reaccion debido alprimer engranaje. El balance mecanico del eje articulado a la carga se expresa como:

Tg2 = Jgθm

n+ Bg

θm

n+ Kw

(θm

n− θ

)

en donde Kw

(θmn − θ

)es el torque originado por el acoplamiento elastico, Tg2 es el

torque debido al segundo engranaje, n = N2/N1 denota la relacion de transmision delos engranajes, y Jg y Bg representan el momento de inercia y la constante de friccionviscosa de la caja de reduccion respectivamente. Asumiendo engranajes ideales, laconservacion de la energıa requiere que el trabajo realizado por cada engranaje debede ser el mismo, a saber:

Tg1θm = Tg2θm

n

Empleando las relaciones anteriores, la ecuacion que gobierna el torque servomotorse formula como:

Tm =Jeq

n

(θm

n

)+

Beq

n

(θm

n

)+

Kw

n

(θm

n− θ

)(2.28)

Jeq = n2Jm + Jg Beq = n2Bm + Bg

La ecuacion que gobierna la dinamica del brazo del manipulador se puede expresarcomo:

Kw

(θm

n− θ

)= JLθ + BLθ +

12mbgLsen θ + mhgLsin θ (2.29)

donde JL y BL representan el momento de inercia y la constante de friccion viscosade la carga no lineal (brazo mas efector), g es la constante gravitacional, mb y mh

(esta masa tambien incluye la masa de la carga) denotan la masa del del brazo ydel efector respectivamente y, 1

2mbgLsen θ y mhgLsin θ son los torques debido a lospesos del brazo y del efector respectivamente. Los momentos de inercia JL = Jh +Jb,


asumiendo que las masas mh y mb se concentran en sus respectivos C.M., se formulanen las ecuaciones (2.9) y (2.10).

Para completar el modelado de la parte electrica del sistema MRAE, podemosaseverar que:

Raia + Ladiadt

+ Vb = KAu (2.30)

donde KA es la ganancia del amplificador y Vb es el voltaje de la fuerza contraelectromotrız y responde a la relacion:

Vb = Kbθm (2.31)

donde Kb es la constante de fuerza contra electromotriz. El torque servomotor Tm estambien proporcional a la corriente ia, es decir:

Tm = Kmia (2.32)

donde Km es la constante del servomotor.

Modelo de Lagrange del MRAE

Las ecuaciones (2.28) y (2.29) se pueden reordenar en forma matricial, conel proposito de obtener el denominado modelo dinamico de Lagrange del sistemaMRAE:

T = Hq + Cq + d (2.33)

donde:

Tm

0

=

Jeq

n 0

0 JL

θmn

θ

+

Beq

n 0

0 BL

θmn

θ

+

Kwn

(θmn − θ

)

d2

d2 =(

12

mb + mh

)Lg sin θ −Kw

(θm

n− θ

)

Despreciando la inductancia de armadura La en (2.30), y despejando ia se obtiene:

ia = −Kb

Raθm +

KA

Rau (2.34)

Sustituyendo ia en Tm = Kmia de (2.33) y despejando u, el modelo de Lagrangetoma una nueva forma:

u = Mq + Pq + d (2.35)

u

0

=

m11 0

0 JL

θmn

θ

+

p11 0

0 BL

θmn

θ

+

d1

d2

(2.36)

m11 =RaJeq

nKAKmp11 =

nKb

KA+

RaBeq

nKAKmd1 =

RaKw

nKAKm

(θm

n− θ

)


Modelo del MRAE en el Espacio de Estado

Seleccionando como variables de estado: x1 = θ, x2 = θ, x3 = θm/n, x4 =θm/n, y x5 = ia, entonces el vector de estado del sistema es de orden 5. Luego,las ecuaciones (2.28), (2.29) y (2.30) (sin despreciar la inductancia La) producen lasiguiente ecuacion de estado no lineal:

x =

x1

x2

x3

x4

x5

= f(x, u) =

f1(x, u)f2(x, u)f3(x, u)f4(x, u)f5(x, u)

(2.37)

f1(x, u) = x2

f2(x, u) = −Kw

JLx1 − BL

JLx2 +

Kw

JLx3 − Lg

JL

(mb

2+ mh

)sen x1

f3(x, u) = x4

f4(x, u) =Kw

Jeqx1 − Kw

Jeqx3 − Beq

Jeqx4 +

nKm

Jeqx5

f5(x, u) = −nKb

Lax4 − Ra

Lax5 +

KA

Lau

donde hemos usado el hecho de que x1 = x2 y x3 = x4. Si la salida del sistema esy = θ, entonces la ecuacion de salida del MRAE resulta:

y = h(x) = Cx = [1 0 0 0 0]x (2.38)

Despreciando la inductancia de armadura La en (2.37), lo que equivale a elimi-nar un elemento almacenador de energıa independiente (por consiguiente, eliminaruna variable de estado), entonces:

Lax5 = 0 = −nKbx4 −Rax5 + KAu ⇒ x5 = −nKb

Rax4 +

KA

Rau

Reemplazando x5 en la cuarta ecuacion de (2.37), se obtiene una ecuacion de estadono lineal de orden 4:

x1

x2

x3

x4

=

f1(x, u)f2(x, u)f3(x, u)f4(x, u)

(2.39)

f1(x) = x2

f2(x) = −Kw

JLx1 − BL

JLx2 +

Kw

JLx3 − Lg

JL

(mb

2+ mH

)sin x1

f3(x) = x4

f4(x) =Kw

Jeqx1 − Kw

Jeqx3 −

(n2KmKb

JeqRa+

Beq

Jeq

)x4 +

nKmKA

JeqRau

La salida del sistema en este caso se expresa como:

y = h(x) = Cx = [1 0 0 0]x (2.40)


2.1.3. Sistema Tanque de Agua

El sistema tanque de agua estudiado aquı se muestra en la figura 2.4. En estesistema, el agua frıa que se envıa al tanque se calienta en forma controlada. El aguacalentada puede ser usado luego por los consumidores. Este sistema es multivariableporque posee dos entradas y dos salidas. Las variables de entrada (las fuerzas decontrol) son el flujo de agua de entrada al tanque y el calor suministrado al aguamediante una resistencia electrica. Las variables de salida (las senales controladas)son el nivel del liquido en el tanque y la temperatura de salida del agua calentada.La tabla 2.2 describe las variables y los valores de los parametros del sistema tanquede agua.

H

o

i

i

Φi

a

Ao

A

q

qθ

θ

θo

Fig. 2.4: Sistema tanque con agua.

Modelo Lineal del Proceso Nivel

El volumen de agua acumulado en el tanque se modela como:

Adh

dt= Ah = qi − qo (2.41)

Considerando un flujo laminar de salida:

qo =h

Rh(2.42)

donde la resistencia hidraulica Rh se calcula de la relacion:

Rh =H

Q(2.43)

Entonces, la ecuacion de estado del proceso nivel toma la forma:

h = − 1ARh

h +1A

qi (2.44)


Tabla 2.2: Parametros y variables del sistema tanque con agua.

Sımbolo Descripcion Valor Unid.dS Diametro del tanque 0.265 mA Seccion circular del tanque 0.055 m2

H Nivel del agua en estado estacionario mh Nivel del agua mQ Flujo de agua en estado estacionario 0.16 m3/hqi Flujo de agua de entrada al tanque m3/sqo Flujo de agua de salida del tanque m3/sRh Resistencia hidraulica del tanque: Rh = H/Q 2700 s/m2

g Aceleracion de la gravedad 9.81 m/s2

ρ Densidad del agua 1000 kg/m3

do Diametro del orificio de salida 0.0127 mAo Seccion del orificio de salida 0.000126 m2

Av Seccion de la vena contracta m2

Cc Coeficiente de correccion entre Ao y Av 0.6 a 1Cv Coeficiente de correccion por perdidas 0.8 a 0.99Cd Coeficiente de descarga:Cd = CvCc 0.5a Factor de flujo turbulento: a = CdAO

√2g 0.00028 m2.5/s

Cp Calor especıfico del agua 4186.8 Jkg K

Ct Capacitancia termica del tanque: Ct = ρSHCp 27633 K/W

Rt Resistencia termica del tanque: Rt = 1CpρQ

0.0054 K/W

θa Temperatura ambiente oCΘ Temperatura en el tanque en estado estacionario oCθo Temperatura del agua de salida oCΦi Calor entregado por la resistencia electrica WΦi Calor en estado estacionario 1540 WΦT Calor del agua en el tanque WΦo Calor que toma el flujo de salida WΦs Calor que se libera al exterior: Φs = Θo−Θa

RtW

Φc Calor que trae consigo el flujo de entrada W


y su funcion de transferencia resulta:

h(s)qi(s)

=Rh

ARhs + 1(2.45)

donde el producto ARh es la constante de tiempo del proceso nivel.

Determinacion Experimental de Rh

La valvula de control empleada para regular la entrada de agua al tanque es deltipo VXN015F250, con diametro nominal DN15, conexion G1B y actuador motorico.La abertura maxima se obtiene alimentando con 10 V al actuador, la cual correspondea un flujo de 0.4 m3/h, de acuerdo al manual del fabricante. La mınima abertura,con 0 V, corresponde a un flujo de 0 m3/h. Esto significa que para una abertura de1 V el flujo que pasa por la valvula es de 1/90000 m3/s.

Asumiendo una variacion lineal entre el flujo qi que pasa por la valvula y laaltura h del tanque, se realizo el siguiente experimento. Con una abertura de valvulapara 4 V (0.16 m3/h), se abrio convenientemente la valvula de descarga hasta lograruna altura estable de 0.12 m. Luego, con una abertura de valvula para 6 V (0.24m3/h), se siguio abriendo la valvula de descarga hasta lograr una altura de 0.18 m.Empleando la relacion:

Rh =H

Q

la resistencia hidraulica para cada punto resulto aproximadamente Rh = 2700 s/m2.Se asume que los valores en estado estacionario de h y qi son H = 0.12 m y Q = 0.16m3/h respectivamente.

Modelo Lineal del Proceso Temperatura

El calor en el interior del tanque se modela aproximadamente como:

Ctdθo

dt= Φi − Φo (2.46)

donde:Φo = Cp ρQθo (2.47)

Por consiguiente, la ecuacion de estado del proceso temperatura resulta:

θo = − 1RtCt

θo +1Ct

Φi (2.48)

donde la capacitancia termica Ct y la resistencia termica Rt se calculan de:

Ct = ρSHCp Rt =1

CpρQ(2.49)

La funcion de transferencia del proceso temperatura toma la forma:

θo(s)Φi(s)

=Rt

CtRts + 1(2.50)

donde el producto CtRt es la constante de tiempo de dicho proceso.


Ecuacion de Estado Lineal del Sistema Tanque

Juntando las ecuaciones (2.44) y (2.48), las ecuaciones de estado y de salidalineales del sistema tanque con agua resulta:

x = Ax + Bu y = Cx (2.51)

x =[

x1

x2

]=

[hθo

]u =

[u1

u2

]=

[qi

Φi

]y =

[y1

y2

]=

[hθo

]

A =[ − 1

ARh0

0 − 1RtCt

]B =

[ 1A 00 1

Ct

]C =

[1 00 1

]

Modelo No Lineal del Proceso Nivel

El volumen de agua acumulado en el tanque se modela como:

Adh

dt= Ah = qi − qo (2.52)

donde qi y qo son los flujos de agua de entrada y salida respectivamente y h es laaltura del tanque. Para orificios circulares pequenos, se puede formular [12]:

qo = CdAo

√2gh = a

√hH; a = CdAo

√2g (2.53)

donde g es la aceleracion de la gravedad, Cd es el coeficiente de descarga y Ao es laseccion del orificio de salida. Se sabe ademas que [12]:

Cd = CvCc; 0.8 ≤ Cv ≤ 0.99; 0.6 ≤ Cc ≤ 1 (2.54)

donde Cv es el coeficiente de correccion por perdidas y Cc es el coeficiente de correc-cion entre Ao y Av (la seccion de la vena contracta). Para nuestro estudio tomaremosCd =0.5. De (2.52) se obtiene la primera ecuacion de estado:

h = − a

A

√h +

1A

qi (2.55)

Modelo No Lineal del Proceso Temperatura

El balance de energıa termica dentro del tanque se formula:

ΦT = −Φo − Φs + Φc + Φi (2.56)

donde Φi es calor entregado por la resistencia electrica, ΦT es el calor del agua enel tanque, Φo es el calor que toma el flujo de salida, Φs es el calor que se liberaal exterior y Φc es el calor que trae consigo el flujo de entrada. Las relaciones quegobiernan tales flujos calorıficos:

ΦT = AhρCpdθo

dt

Φo = Cpρθoa√

h

Φs =θo − θa

Rt

Φc = Cpρθiqi (2.57)


Los parametros que aparecen en (2.57) se describen en la tabla 2.2. La ecuacion deestado del proceso temperatura se obtiene despejando dθo

dt = θo de (2.56):

θo = − a

Ahθo

√h− θo − θa

AhρCpRt+

θi

Ahqi +

1AhρCp

Φi (2.58)

Ecuacion de Estado No Lineal del Sistema Tanque

Seleccionemos como variables de estado q1 = h, q2 = θo y como entradasde control u1 = qi, u2 = Φi. Introduciendo tales variables en ( 2.55) y (2.58), lasecuaciones de estado del sistema resultan:

[q1

q2

]=

[f1

f2

]+

[G11 0G21 G22

] [u1

u2

](2.59)

f1 = − a

A

√q1 f2 = − a

Aq1q2√

q1 − q2 − θa

AρCpRtq1

G11 =1A

G21 =θi

Aq1G22 =

1AρCp q1

Modelo de Lagrange del Sistema Tanque

Para obtener el modelo de Lagrange del sistema tanque, despejamos u1 de laprimera relacion de (2.59) y lo reemplazamos en la segunda relacion de dicha ecuacion.El resultado es la siguiente ecuacion de estado:

q2 = − a

Aq1q2√

q1 − q2 − θa

AρCpRtq1+

θi

Aq1(Aq1 + a

√q1) +

1AρCp q1

u2 (2.60)

Empleando la primera relacion de (2.59) y la ecuacion (2.60), se obtiene el modelode Lagrange del sistema:

[u1

u2

]=

[P11 0P21 P22

] [q1

q2

]+

[d11

d21

](2.61)

P11 = A P21 = −AρCpθi P22 = AρCpq1

d11 = a√

q1 d21 = Cpρa√

q1q2 − Cpρa√

q1θi +q2 − θa

Rt

Determinacion de las Fuerzas de Control en Estado Estacionario

El actuador que emplea el sistema de control de temperatura trabaja en elrango de voltaje de 1 a 5 V. Con 5 V, el calefactor proporciona un flujo maximo decalor de 7700 W, de acuerdo al manual del fabricante. Se asume una correspondencialineal entre el voltaje que ingresa al actuador y el flujo de calor entregado. Entonces,para subir 1 V en dicho actuador (de 1 a 2 V o de 4 a 5 V por ejemplo), se debe deproporcionar 7700/4 = 1925 W.

2.2 Metodo de Las Ecuaciones de Lagrange 21

2.2. Metodo de Las Ecuaciones de Lagrange

Las ecuaciones diferenciales que gobiernan el movimiento de complicados sis-temas mecanicos, se pueden obtener empleando las ecuaciones de Lagrange, las cualesse derivan de las leyes de Newton del movimiento. El metodo de las ecuaciones deLagrange considera cantidades escalares (energıas potencial y cinetica) en lugar devectores (fuerzas y torques), minimizando ası la necesidad de complicados diagramasvectoriales.

El modelo dinamico del sistema obtenido con el metodo de las ecuaciones deLagrange se denomina el modelo de Lagrange. Este modelo tambien nos permite de-terminar el modelo en el espacio de estado. El metodo en cuestion requiere de larepresentacion del sistema mediante un conjunto de coordenadas generalizadas qi

(i = 1, 2, . . . , r), una para cada grado de libertad independiente del sistema. Luego,la energıa cinetica V y la energıa potencial U se formulan en terminos de tales coorde-nadas y de sus derivadas con el fin de establecer la funcion Lagrangiana del sistema,la cual toma la forma:

L = V (q1, . . . , qr, q1, . . . , qr)− U(q1, . . . , qr, q1, . . . , qr) (2.62)

Notar en la ecuacion (2.62) que L depende de las variables q1, . . . , qr, q1, . . . , qr. Porotra parte, de acuerdo al principio de la mınima accion de Hamilton para sistemasconservativos, la integral I definida por:

I =∫ t2

t1

L(q1, . . . , qr, q1, . . . , qr)

es un extremo para la trayectoria de movimiento del sistema desde el tiempo t1 hastael tiempo t2. En adicion, la variacion de I es igual al trabajo realizado por fuerzasexternas. Basado en el principio de Hamilton, se puede demostrar que las ecuacionesque gobiernan el movimiento de un sistema dinamico constituyen las ecuaciones deLagrange [1], [2]:

d

dt

(∂L

∂qi

)− ∂L

∂qi= Qi i = 1, 2, . . . , r (2.63)

donde Qi indica las fuerzas y torques generalizados que son externos al sistema o noson obtenibles a partir de una funcion potencial escalar. Si asignamos una variable deestado para cada coordenada generalizada qi y otra para su derivada qi, tendremosentonces 2r ecuaciones diferenciales de segundo orden de la forma dada en (2.63)correspondientes al sistema de r grados de libertad.

2.2.1. Manipulador Robotico Traslacional (MRT)

Descripcion del Sistema

La figura 2.5 ilustra el manipulador robotico traslacional (MRT) de 2 GDL.M1 es un servomotor DC que posee un mecanismo de reduccion por engranajes yun codificador optico y esta articulado a una polea de radio rp. Esta polea usa uncable para transmitir la fuerza F para accionar el movimiento de traslacion de uncarro de masa mc montado sobre un par de rieles a lo largo de un eje x. M2 estambien un servomotor con codificador optimo y mecanismo de reduccion, empleado


para accionar el movimiento rotatorio del brazo (el eslabon) del MRT alrededor deuna articulacion ubicada en el centro de masa del carro. Asumiremos que M1 y M2

poseen los mismos parametros. En la figura 2.5, θ es la posicion angular del brazode longitud Lb y masa mb, r es la posicion longitudinal del carro y Ff es la fuerzade friccion opuesta al movimiento del carro. Al extremo del brazo se puede articularuna mano o efector final para diferentes propositos.

El sistema MRT es multivariable cuadrado, denominado ası por poseer dosentradas: los voltajes KA1u1 y KA2u2 aplicados los terminales de las armaduras deM1 and M2 respectivamente, y dos salidas: r y θ. Los parametros KA1 y KA2 son lasganancias de los amplificadores. La tabla 2.3 muestra los valores de los parametrosdel sistema MRT.

Ff

r

M2

1M

x

y

θ mp

rp

L h

mhEFECTORFINAL

PIVOTE

POLEA

L

cos

θsenbL

Lb θBRAZO

m b

CARRO

F

b

Fig. 2.5: El manipulador robotico traslacional (MRT).

Ecuaciones de Energıa del MRT

Ecuaciones de Energıa del Carro

El carro esta confinado a moverse en la direccion horizontal x (ver figura 2.5).Su energıa cinetica V1 y su energıa potencial U1 vienen dadas por:

V1 =12mcr

2 U1 = 0 (2.64)

Ecuaciones de Energıa del Brazo

Sean ma y mh las masas del brazo y del efector mas su carga respectivamente.Asumiendo que el brazo y el efector final forman una unidad de masa mb = ma +mh

y longitud Lb = La + Lh, donde Lh ¿ L, la energıa cinetica almacenada en el brazose formula aproximadamente como:

V2 =12Jbθ

22 +

12mb

(x2 + y2

)(2.65)


Tabla 2.3: Parametros valorados del sistema MRT. La abreviatura C.M. significaCentro de Masa.

Sımbolo Descripcion Valor Unidadesu1, u2 Voltaje de entrada al sistema VKA Ganancia del amplificador 8.5Va1, Va2, Voltaje de armadura VRa Resistencia de armadura 3.5 ΩLa Inductancia de armadura 0.002 Hia1, ia2 Corriente de armadura AKm Constante del torque motor 0.0421 N-m/ATm1, Tm2 Torque motor N-mTg1, Tg2 Torque en los engranajes N-mT Torque de carga N-mJm Momento de inercia del motor 0.0003 kg-m2

Jg Momento de inercia de los engranajes 0.053 kg-m2

Jp Momento de inercia de la polea kg-m2

Jb Momento de inercia del brazo kg-m2

Jeq Momento de inercia equivalente kg-m2

Beq Constante de friccion equivalente N-m-s/radBm Constante de friccion del motor 0.0001 N-m/rad/sBg Constante de friccion engranajes 0.01 N-m-s/radBp Constante de friccion en la polea 0.006 N-m-s/radF Fuerza aplicada al carro NFf Fuerza de rozamiento (Ff = Fc r) NFc Constante de friccion del carro 2.81 kg/smh Masa del efector 0.15 kgma Masa del brazo 0.8 kgmc masa del carro 0.95 kgmp masa de la polea 0.3 kgrp Radio de la polea 0.05 mr Posicion del carro mLb Longitud del brazo 0.225 mVb1, Vb2 Voltajes contraelectromotrices VKb Constante contraelectromotriz 0.0565 V-s/radg Aceleracion de la gravedad 9.81 m/s2

N1, N2 No de dientes de los engranajes N2 > N1

n Relacion de engranajes (n = N2/N1) 12.5θ, θm Posicion angular: brazo y motor radω, ωm Velocidad angular: carga y motor rad/s


De acuerdo a la figura 2.5:

x = r +Lb

2sen θ y =

Lb

2cos θ (2.66)

El momento de inercia Jb, segun la referencia [8], se calcula como:

Jb =13mbL

2b mb = ma + mh Lb = La + Lh (2.67)

La energıa potencial almacenada en el brazo se puede expresar como:

U2 = mbgLb

2cosθ (2.68)

Las Ecuaciones de Lagrange del MRT

Reemplazando (2.66) en (2.65), efectuando las operaciones indicadas y simplifi-cando, la funcion de Lagrange L = V − U = (V1 + V2)− (U1 + U2) toma la forma:

L =12(mc + mb)r2 +

12

(Jb +

L2b

2

)θ2 − 1

2mbLbrθ cos θ − 1

2mbLbg cos θ (2.69)

Las ecuaciones de Lagrange para las coordenadas generalizadas r y θ del MRT seformulan como:

d

dt

(∂L

∂r

)− ∂L

∂r= F − Ff

(2.70)d

dt

(∂L

∂θ

)− ∂L

∂θ= T (2.71)

donde F es la fuerza generada para mover al carro, Ff es la fuerza de friccion actuandosobre las ruedas del carro, Fc es la constante de friccion y TL es el torque generadopara accionar el brazo. Reemplazando L en (2.70) y (2.71) y operando, se obtiene:

F = (mc + mb)r − Lb

2mbθ

2 sin θ +Lb

2mbθ cos θ + Ff r (2.72)

T =Lb

2mbr cos θ +

(L2

b

4mb + Jb

)ϑ− Lb

2mb sin θ (2.73)

Partiendo de (2.72) y (2.73) podemos determinar el modelo de Lagrange del mod-elo TRM. Sin embargo, si estamos interesados en tener como fuerzas de control losvoltajes de armadura u1 y u2 en lugar de F y T respectivamente, entonces se requieremodelar los susbsistemas electricos del sistema como sigue.

Modelado del Servomotor M1 Accionando la Polea

La figura 2.6 muestra el servomotor M1 articulado a la polea. Despreciando lainductancia de armadura La, el voltaje de entrada KAu1 aplicado a la armadura es:

Raia1 + Vb1 = KAu1 (2.74)


i

N

T

R

L

u

BJ

v

T

a

a a

b

g1mm

1

m

θω

mm

2N Tg2Jg

+

_

+

_KA

pr

F

pBθω

1

111

11

Bg

J p

1

1

Fig. 2.6: Servomotor M1 articulado a la polea.

El voltaje de fuerza contraelectromotriz es proporcional a la velocidad del servomotor,es decir:

Vb1 = Kb θm1 (2.75)

La ecuacion del torque motor Tm1 esta dada por (ver figura 2.6):

Tm1 = Jmθm1 + Bmθm1 + Tg1 (2.76)

El torque Tg2 requerido para mover a la polea se expresa como:

Tg2 = nTg1 = (Jg + Jp)θm1

n+ (Bg + Bp)

θm1

n+ Frp (2.77)

donde n > 1 es la relacion de dientes de los engranajes del mecanismo de reduccion,Jm, Jg y Jp son los momentos of inercia de la armadura, del mecanismo de reducciony de la polea respectivamente, mientras que Bm, Bg y Bp son las constantes defriccion de la armadura, del mecanismo de reduccion y de la polea respectivamente.La relacion Tg2 = nTg1 se obtiene asumiendo que los engranajes son ideales. En estasituacion, el principio de conservacion de energıa requiere que:

Tg1θm1 = Tg2θm1

n

Asumiendo que la polea es un disco que gira sobre su eje, su momento de inercia sepuede calcular como:

Jp = mp ∗ r2p/2; (2.78)

El torque servomotor Tm1 es proporcional a ia1:

Tm1 = Kmia1 (2.79)

El movimiento rotacional de la polea se puede transformar en el movimiento trasla-cional del carro usando la relacion (ver figura 2.6):

r =θm1

nrp (2.80)


Usando las ecuaciones (2.74), (2.75), (2.76), (2.77), (2.79) y (2.80) podemos obtener:

F =KmKA

rpRau1 − Jeq1

nr2p

r −(

Beq1

nr2p

+nKmKb

nr2p

)r (2.81)

donde:Jeq1 = n2Jm + Jg + Jp Beq1 = n2Bm + Bg + Bp

Modelado del Servomotor M2 Accionando el Brazo

La figura 2.7 muestra al servomotor M2 articulado al punto pivote localizadoen el centro de masa del carro. Sabemos que M1 y M2 poseen los mismos parametrospor ser similares. Despreciando la inductancia de armadura La, podemos formular:

Raia2 + Vb2 = KAu2 (2.82)

donde:Vb2 = Kbnθ (2.83)

La ecuacion del torque motor Tm2 es (ver figura 2.7):

i

N

T

R

L

u

BJ

T

a

a a

g1mm

1

m

θω

mm

2N Tg2Jg

+

_

+

_KA

Bg

2

2

2 v 2b

θω

Articulación

Fig. 2.7: Servomotor M2 articulado al punto pivote del carro

Tm2 = Jmnθ + Bmnθ + Tg1 (2.84)

El torque Tg2 requerido para mover el brazo se expresa como:

Tg2 = nTg1 = Jg θ + Bg θ + T (2.85)

donde T es el torque de carga. El torque motor Tm2 es proporcional a ia2:

Tm2 = Kmia2 (2.86)

Empleando las ecuaciones (2.82), (2.83), (2.84), (2.85) y (2.116) se puede demostrarque:

T = −Jeq2θ −(

Beq2 +n2KmKb

Ra

)θ +

nKmKb

Rau2 (2.87)

donde:Jeq2 = n2Jm + Jg Beq2 = n2Bm + Bg


Modelo Dinamico de Lagrange del MRT

Igualando (2.101) con (2.81) y (2.102) con(2.87) el modelo de Lagrange delsistema MRT toma la forma:

u1 = M11r + M12θ + P11r + P12θ (2.88)u2 = M21r + M22θ + P22θ + d21 (2.89)

Las ecuaciones (2.88) y (2.89) se pueden transformar en su forma matricial comosigue:

M(q)q + P(q, q)q + d(q) = u q =[

q1

q2

]=

[rθ

]u =

[u1

u2

](2.90)

donde:

M =[

M11 M12

M21 M22

]P =

[P11 P12

0 P22

]d(q) =

[0

d21

]

M11 =Rarp

nKmKA

(mc + mb +

Jeq

r2p

)

M12 =RarpmbLb

2nKAKmcos θ

M21 =RambLb

2nKmKAcos θ

M22 =Ra

nKAKm

(mbL

2b

4+ Jb + Jeq

)

P11 =Rarp

nKmKA

(Fc +

Beq

r2p

+n2KmKb

Rar2p

)

P12 = −RarpmbLb

2nKAKmθ sin θ

P22 =Ra

nKAKm

(Beq +

n2KmKb

Ra

)

d21 = −RambLbg

2nKAKmsin θ

Ecuacion de Estado del MRT

Seleccionemos como variables de estado: x1 = r, x2 = θ, x3 = r y x4 = θ. Porconsiguiente, las dos primeras ecuaciones de estado son: x1 = x3, x2 = x4. Las otrasdos ecuaciones de estado no lineales se deducen despejando q = [x3 x4]T de (2.90),resultando:

x3 = M22(−P11x3 − P12x4 + u1)/den−M12(−P22x4 − d21 + u2)/den

x4 = −M21(−P11x3 − P12x4 + u1)/den + M11(−P22x4 − d21 + u2)/den

den = M11M22 −M12M21 (2.91)


Haciendo en la ecuacion (2.90) las aproximaciones siguientes: cos θ ∼= 1 en M12 y M21,θ sin θ ∼= θθ ∼= 0 en P12 y sin θ ∼= θ en d21, la ecuacion de estado lineal del sistemaMRT resulta:

x = Ax + Bu y = Cx (2.92)

donde:

A =1

den

0 0 1 00 0 0 10 M12d21 −M22P 11 −(M22P 12 −M12P 22)0 −M11d21 M21P 11 (M22P 12 −M11P 22)

B =1

den

0 00 0

M22 −M12

−M21 M11

C =

[1 0 0 00 1 0 0

]den = M11M22−M12M21

En las relaciones anteriores:

M11 = M11 M12 =RarpmbLb

2nKAKm

M21 =RambLb

2nKmKAM22 = M22

P 11 = P11 P 12 = 0

P 22 = P22 d21 = −RambLbg

2nKAKm

2.2.2. Manipulador Robotico Esferico (MRE)

Descripcion del MRE

La figura 2.8 muestra el sistema Manipulador Robotico Esferico (MRE) de 2GDL,donde M1 es un servomotor DC con decodificador optico que acciona el movimientorotatorio de una base metalica (la base del MRE) articulada a su eje. Esta basecomprende un disco metalico de espesor d y radio rd unido a una barra metalica delongitud b, seccion a2 y masa mb. La barra y el disco conforman un cuerpo rıgido conmovimiento rotatorio alrededor del eje z, donde L1 es la distancia del C.M. (centrode masa) de la base con respecto al origen del sistemas de coordenadas (x, y, z).M2 es un servomotor montado en el extremo libre de la barra y se emplea paraaccionar el movimiento de rotacion de un brazo o eslabon de longitud La (el brazodel manipulador) y masa ma. Asumiremos que M1 y M2 son similares, por ello poseenlos mismos parametros. En la figura 2.8, q1 y q2 son las posiciones angulares de labase y del brazo respectivamente. Al extremo del brazo se puede articular un efectorfinal de masa mh.

El manipulador MRE representa un sistema multivariable cuadrado, denomi-nado ası por poseer dos entradas: los voltajes de control u1 y u2 aplicados a losterminales de armaduras de M1 y M2 respectivamente, y dos salidas: q1 y q2. Latabla 2.4 muestra los valores de los parametros del manipulador.


Tabla 2.4: Variables y parametros del sistema MRE (C.M.: centro de masa).

Sımbolo Descripcion Valor Unidadq1 Posicion angular de la base radq2 Posicion angular del brazo radT1, T2 Torques generados N-mmd Masa del disco 0.55 kgmb Masa de la barra 0.9 kgma Masa del brazo o eslabon 0.8 kgmh Masa del efector final 0.15 kgm2 Masa equivalente del brazo kgd Espesor del disco 0.01 mrd Radio del disco 0.06 mb Longitud de la barra 0.25 ma2 Seccion cuadrada de la barra 0.044 2 m2

M1,M2 Servomotores D.C.La Longitud del brazo 0.3 mLh Longitud del efector 0.05 mL1 Ubicacion C.M. de la base mL2 Longitud equivalente del brazo mJh Momento de inercia del efector kg-m2

Jm Momento de inercia de M1 y M2 0.0003 kg-m2

Jeq Momento de inercia equivalente kg-m2

Jg1, Jg2 Momentos de inercia de los engranajes 0.053 kg-m2

J1, J2 Momentos de inercia de la base y del brazo kg-m2

Bm Constante de friccion de M1 y M2 0.0001 N-m-s/radBeq Constante de friccion equivalente N-m-s/radBg1, Bg2 Constantes de friccion en engranajes 0.01 N-m-s/radn Relacion de engranajes de M1 y M2 12.5Ra Resistencia de armadura de M1 y M2 3.5 ΩLarm Inductancia de armadura de M1 y M2 0.00015 HVb1, Vb2 Voltajes contraelectromotrices VVa1, Va2 Voltajes de armadura Via1, ia2 Corrientes de armadura AKA Ganancia del amplificador 8.5Km Constante del servomotor 0.0421 N-m/AKb Constante contraelectromotrız 0.0565 V-s/radu1, u2 Voltajes de control Vg Constante gravitacional 9.81 m/s2


x

y

z

b

a

q2L

d rda

md

mmh

a

a

EFECTORFINAL

M1

SERVOMOTORM2

q1

L1

mb

BRAZO

BASE

Fig. 2.8: El manipulador robotico esferico (MRE).

Ecuaciones de Energıa del MRE

Ecuaciones de Energıa de la Base

La base esta confinada a girar alrededor del eje z (ver figura 2.8). Su energıacinetica V1 y su energıa potencial U1 vienen dadas por:

V1 =12J1q

21 U1 = m1g L1 (2.93)

donde:

m1 = md + mb L1 =mbb + mdd

mb + md(2.94)

y el momento de inercia J1 resulta de la suma de los momentos de inercia del disco(Jd) y de la barra (Jb) alrededor del eje z, como sigue [8]:

J1 = Jd + Jb =12mdr

2d +

112

mb(a2 + a2) (2.95)

Ecuaciones de Energıa del Brazo

Sean ma y mh las masas del brazo y del efector mas su carga respectivamente.Asumiendo que el brazo y el efector final forman una unidad de masa m2 = ma +mh

y longitud L2 = La +Lh, donde Lh ¿ La, la energıa cinetica almacenada en el brazo


se formula aproximadamente como:

V2 =12J2q

22 +

12m2

(x2 + y2 + z2

)(2.96)

De acuerdo a la figura 2.8:

x =L2

2sin q2 cos q1 y =

L2

2sin q2 sin q1 z = d + b +

L2

2cos q2 (2.97)

El momento de inercia J2, segun la referencia [8], se calcula como:

J2 =13m2L

22 m2 = ma + mh L2 = La + Lh (2.98)

La energıa potencial almacenada en el brazo se puede expresar como:

U2 = m2g

(L2

2cos q2 + b + d

)(2.99)

Modelo Dinamico de Lagrange del MRE

Reemplazando (2.97) en (2.96), efectuando las operaciones indicadas y simplifi-cando, la funcion de Lagrange L = V − U = (V1 + V2)− (U1 + U2) toma la forma:

L =12J1q

21 +

12J2q

22 +

18m2L2

(q22 + q2

1 sin2 q2

)

− m1gL1 −m2g

(d + b +

L2

2cos q2

)(2.100)

Las ecuaciones de Lagrange para las coordenadas generalizadas q1 y q2 del MRE seformulan como:

d

dt

(∂L

∂q1

)− ∂L

∂q1= T1 (2.101)

d

dt

(∂L

∂q2

)− ∂L

∂q2= T2 (2.102)

donde T1 y T2 son los torques generados para hacer girar la base y el brazo respecti-vamente. Reemplazando L en (2.101) y (2.102) y operando se obtiene:

(J1 +

14m2L2 sin2 q2

)q1 +

(12m2L2 sin q2 cos q2

)q1q2 = T1 (2.103)

(J2 +

14m2L2

)q2 −

(14m2L2q

21 sin q2 cos q2 +

12m2L2g sin q2

)= T2 (2.104)

Partiendo de (2.101) y (2.102) podemos determinar el modelo de Lagrange del modeloMRE. Sin embargo, si estamos interesados en tener como fuerzas de control los volta-jes de armadura u1 y u2 en lugar de T1 y T2 respectivamente, entonces se requieremodelar los susbsistemas electricos del sistema MRE como sigue.


Modelado del Servomotor M1 Accionando la Base

La figura 2.9 muestra al servomotor M1 articulado al punto pivote en contactocon el disco de la base. Sabemos que M1 y M2 poseen los mismos parametros porser similares. Despreciando la inductancia de armadura Larm, podemos formular (vefigura 2.9):

Raia1 + Vb1 = KAu1 (2.105)

donde:Vb1 = Kbqm1 = Kbnq1 qm1 = nq1 (2.106)

donde n = N2/N1 > 1 es la relacion de dientes de los engranajes del mecanismo dereduccion. La ecuacion del torque motor Tm1 es (ver figura 2.9):

N

T

R

u

BJ

T

a

g1mm

1

m

m

2N Tg2Jg

+

_

+

_KA

Bg

vbArticulación

1 1

1

m

qq

q1

q1

11

L i a1arm

Fig. 2.9: Servomotor M1 articulado al disco de la base.

Tm1 = Jmnq1 + Bmnq1 + Tg1 (2.107)

El torque Tg2 requerido para mover la base se expresa como:

Tg2 = nTg1 = Jg q1 + Bg q1 + T1 (2.108)

donde Jm y Jg son los momentos de inercia del motor y del mecanismo de reduccionrespectivamente, mientras que Bm y Bg son las constantes de friccion del motor y delmecanismo de reduccion respectivamente. La relacion Tg2 = nTg1 se obtiene asum-iendo que los engranajes son ideales. En esta situacion, el principio de conservacionde energıa requiere que:

Tg1qm1 = Tg2qm1

nqm1 = nq1

El torque motor Tm1 es proporcional a ia1:

Tm1 = Kmia1 (2.109)

Empleando las ecuaciones (2.105), (2.106), (2.107), (2.108) y (2.109) se puede de-mostrar que:

T1 = −Jeq q1 −(

Beq +n2KmKb

Ra

)q1 +

nKmKA

Rau1 (2.110)

donde:Jeq = n2Jm + Jg Beq = n2Bm + Bg (2.111)


Modelado del Servomotor M2 Accionando el Brazo

La figura 2.10 muestra al servomotor M2 articulado al punto pivote del segun-do brazo. Sabemos que M1 y M2 poseen los mismos parametros por ser similares.Despreciando la inductancia de armadura Larm, formulamos:

Raia2 + Vb2 = KAu2 (2.112)

donde:

Vb2 = Kbqm2 = Kbnq2 qm2 = nq2 (2.113)

La ecuacion del torque motor Tm2 es (ver figura 2.10):

N

T

R

u

BJ

T

a

g1mm

1

m

m

N Tg2Jg

+

_

+

_KA

Bg

vbArticulación

m

qq

q

q2

2

2

2

22

22

2aiL arm

Fig. 2.10: Servomotor M2 articulado al punto pivote del brazo.

Tm2 = Jmnq2 + Bmnq2 + Tg1 (2.114)

El torque Tg2 requerido para mover el brazo se expresa como:

Tg2 = nTg1 = Jg q2 + Bg q2 + T2 (2.115)

donde T2 es el torque para accionar el brazo. El torque motor Tm2 es proporcional aia2:

Tm2 = Kmia2 (2.116)

Empleando las ecuaciones (2.112), (2.113), (2.114), (2.115) y (2.116) se puede de-mostrar que:

T2 = −Jeq q2 −(

Beq +n2KmKb

Ra

)q2 +

nKmKA

Rau2 (2.117)

donde:

Jeq = n2Jm + Jg Beq = n2Bm + Bg (2.118)


Modelo Dinamico del Manipulador MRE

Igualando (2.103) con (2.110) y (2.104) con (2.117) el modelo de Lagrange delsistema MRE toma la forma:

u1 = M11q1 + P11q1 + P12q2 (2.119)u2 = M22q2 + P21q1 + P22q2 + d21 (2.120)

Manipulando las ecuaciones (2.119) y (2.120) se obtiene el modelo dinamico de La-grange del sistema:

M(q)q + P(q, q)q + d(q) = u q =[

q1

q2

]u =

[u1

u2

](2.121)

donde:

M =[

M11 00 M22

]P =

[P11 P12

P21 P22

]d =

[0

d21

]

M11 =Ra

nKmKA

(J1 + Jeq +

14m2L2 sin2 q2

)

M22 =Ra

nKmKA

(J2 + Jeq +

14m2L2

)

P11 =Ra

nKmKA

(Beq +

n2KmKb

Ra

)

P12 =Ram2L2q1 sin q2 cos q2

2nKmKA

P21 = −Ram2L2q1 sin q2 cos q2

4nKmKA

P22 =Ra

nKmKA

(Beq +

n2KmKb

Ra

)

d21 = −Ram2L2g sin q2

2nKmKA

Ecuacion de Estado No Lineal del Sistema MRE

Definiendo las siguientes variables de estado: x1 = q1, x2 = q2, x3 = q1 yx4 = q2, el modelo dinamico dado en (2.119) y (2.120) se puede transformar en lasiguiente ecuacion de estado del sistema MRE:

x1

x2

x3

x4

=

f1(x,u)f2(x,u)f3(x,u)f4(x,u)

=

x3

x4

M−111 (−P11x3 − P12x4 + u1)

M−122 (−P21x3 − P22x4 − d21 + u2)

(2.122)

2.3. Problemas

Problema 2.1

2.3 Problemas 35

Considere el manipulador robotico con articulacion fija MR1 mostrado en la figura2.1 y descrito en la subseccion 2.1.1. Determine su modelo de Lagrange (ecuacion(2.23)) aplicando las ecuaciones de Lagrange. Despreciar la inductancia de armaduraLa.

Problema 2.2

Para el manipulador robotico con articulacion elastica MRAE descrito en la subsec-cion 2.1.2, determine su modelo de Lagrange (ecuacion (2.33)) aplicando las ecua-ciones de Lagrange. Despreciar la inductancia de armadura La.

Problema 2.3

En la subseccion 2.1.3 se determinaron el modelo de Lagrange y la ecuacion de estadodel sistema tanque con agua. Ahora consideremos que se desea controlar el flujode salida qo = a

√h y la temperatura en el tanque θo. Las fuerzas de control (las

entradas), siguen siendo las mismas: qi y Φi.

a) Determinar la ecuacion de estado y el modelo de Lagrange del sistema paraesta situacion.

b) Defina las variables q = Qo + qoe y θo = Θo + θoe, donde Qo y Θo son valoresestacionarios de qo y θo respectivamente, y qoe y θo sus respectivas desviaciones.Realice el siguiente cambio de variables en las ecuaciones dinamicas del sistematanque:

qi = (Qo + qoe)(1 + uq)

Φi =(

(Qo + qoe)Cpρ +1R

)Qo − θa

Rt− (Qo + qoe)Cpρθi + uφ

Determine la ecuacion de estado y el modelo de Lagrange del sistema transfor-mado, donde las variables a controlar son ahora qoe θoe y las nuevas entradasson uq y uφ.

Problema 2.4 : Sistema de Plataformas

La figura 2.11 muestra dos plataformas P1 y P2 de masas m1 y m2 acopladas porresorte y amortiguador. Las senales de referencia r1 y r2 y las salidas de este sistema,las posiciones individuales y1 e y2 de las plataformas, se fijan mediante potenciomet-ros. El sistema de plataformas descrito tiene como entradas de control las senales u1

y u2 generadas por actuadores, de forma tal que lleven a cero con suficiente rapidezlos errores de posicion e1 = r1 − y1 y e2 = r2 − y2. Asuma Usted los valores de losparametros del sistema.

a) Determine el modelo de Lagrange del sistema.

b) Determinar las ecuaciones de estado y de salida del sistema.

Problema 2.5 : Columna de Destilacion


e

−

+

+

−

2y

1y

2

+

−+

−

r

r P

P

R

R Y

Y

K

K

B

B

2 2

1

1

22

1

2

1

e1

1

2

u2

u1

1

Fig. 2.11: Plataformas acopladas.

La figura 2.12 ilustra una columna de destilacion para fraccionar petroleo pesado. Elmodelo con tiempos muertos del fraccionador (ecuacion (2.123)), en el cual p es eloperador de Laplace, se describe en [31] y [30]. Tal modelo considera tres variablesque deben de ser controladas: la composicion de los productos de la parte superiorY1 y lateral y2 de la columna, y la temperatura de fondos Y3. Las senales o fuerzasde control correspondientes (las variables manipuladas) son: el flujo superior U1,el flujo lateral U2 y el reflujo de fondos U3. Considerar que que se dispone de laenergıa calorıfica requerida por la columna. Asumir que los tiempos muertos se puedenrepresentar mediante la siguiente fraccion racional de Pade de segundo orden:

eTs =12− 6Ts + T 2s2

12− 6Ts + T 2s2

donde T es el tiempo muerto y s es el operador de Laplace. Para el sistema descritodetermine:

a) Sus ecuaciones de estado y de salida.

b) Su modelo de Lagrange.

(b) Determine su modelo en el espacio de estado.(a) Determine su modelo de Lagrange.

Y1(s)Y2(s)Y3(s)

=

4.05e−27s

1+50s1.77e−28s

1+60p5.88e−27s

1+50s5.39e−18s

1+50s5.72e−14s

1+60s6.9e−15s

1+40s4.38e−20s

1+33s4.42e−22s

1+44s7.2

1+19s

U1(s)U2(s)U3(s)

(2.123)

2.3 Problemas 37

LC

PC

FC

FC

A

T

T

T

TF

LC

LC

T

T

Upper

Intermediate

Feed

BottomsReflux

Reflux

Reflux

Bottoms

SideStripper

TopDraw

SideDraw

Fig. 2.12: Columna de destilacion para fraccionar petroleo pesado.

Problema 2.6 : Reactor Quımico

El modelo dinamico del reactor quımico con chaqueta de enfriamiento mostrado enla figura 2.13 ha sido tomado de [32] y [30]. En este reactor ingresa un fluido liquidoque contiene el producto A. Este liquido se revuelve dentro del tanque medianteun agitador para formar una mezcla perfecta. El producto A en esta condicion va aexperimentar una reaccion irreversible exotermica. Debido a que este tipo de reaccionlibera calor, es entonces necesario que la temperatura en el interior del tanque seacontrolada por medio del agua de refrigeracion que circula en la chaqueta que rodeaal reactor. La reaccion quımica del producto o componente A dentro del tanque paraformar el componente B se formula como:

A → B

Esta reaccion se realiza a una velocidad especıfica K en horas−1, cuya expresion se damas adelante. Los parametros y variables que intervienen en el sistema de reaccion(ver figura 2.13) son:

1) A: producto que ingresa al reactor.

2) B: producto resultante de la transformacion del producto A dentro del tanque.

3) Ca0: concentracion del producto A que ingresa al reactor.

4) Tl0: temperatura del liquido que contiene el producto A.


Product A

Products A and B

T

BC

Fc

Coolant

Tc 0

b

C Ca b Fl

Ca 0 l 0Fl T

Tl

T Fc c

l

AC a

Jacket

Reactor

Fig. 2.13: Reactor quımico con chaqueta de enfriamiento.

5) F`: Flujo del liquido que pasa a traves del reactor. Cuando el flujo ingresa alreactor, contiene solamente el producto A. Cuando el flujo sale del reactor,contiene los productos A y B. Este flujo es la alimentacion al reactor.

6) T`: temperatura del liquido que sale del reactor.

7) Cb: Concentracion del producto B a la salida del reactor y en el interior.

8) Ca: Concentracion del producto A. Siempre debe de cumplirse la desigualdad:Ca < Ca0. En el estado estacionario se tiene: Ca + Cb = Ca0.

9) Tc0: temperatura del agua de refrigeracion que ingresa a la chaqueta.

10) Tc: temperatura del agua de refrigeracion en el interior y en la salida de la lachaqueta.

11) Fc: flujo del agua de refrigeracion.

Las concentraciones se dan en kmol/m3, los flujos en m3/h y las temperaturas enoC (grados Celcius). A continuacion se muestran las ecuaciones diferenciales quedescriben la dinamica del sistema. Para ello se aplican las leyes de conservacion de lamasa y de la energıa. Para hacer esto, se supone que no existe liquido acumulado enel reactor, que las concentraciones y temperaturas son homogeneas y que las perdidasde energıa hacia el exterior son despreciables. Las ecuaciones de balance de masa son:

d(V` Ca)dt

= F` Ca0 − V` kCa − F` Ca (2.124)

d(V` Cb)dt

= V` kCa − F` Cb (2.125)

2.3 Problemas 39

donde: F` Ca0 es el flujo del componente A en kmol/h que ingresa al sistema, F` Ca esel flujo de A que sale del sistema, V` es el volumen del liquido en el sistema, −V` kCa

es la velocidad de formacion de A (el signo negativo indica que el componente Ase esta consumiendo), d(V` Ca)

dt es el flujo de A (en kmol/h) en transicion, F`Cb es elflujo de B que sale del sistema, +V` kCa es la velocidad de formacion de B a partirde A (por esta razon posee signo positivo) y d(V` Cb)

dt es el flujo de B (en kmol/h) entransicion. Las ecuaciones de balance de energıa se formulan como:

d(V` ρ` Cp`T`)dt

= F` ρ` Cp`T`0 − F` ρ` Cp`T` −Q + V`kCaH (2.126)

d(Vc ρc Cp cTc)dt

= Fc ρc Cp c(Tc0 − Tc) + Q (2.127)

donde: F` ρ` Cp`T`0 es el flujo calorıfico entregado al sistema, F`ρ`Cp`T` es el flujocalorıfico que sale del sistema, Q es el flujo calorıfico absorbido por el agua de re-frigeracion, V` kCaH es flujo calorıfico producido en la reaccion debido a la entalpıaH de la reaccion, d(V` ρ` Cp`T`)/dt es el flujo calorıfico en transicion (acumulado) enel interior del tanque, FcρcCp c(Tc0 − Tc) es el flujo calorıfico absorbido en el sistema(refrigeracion) y d(VcρcCp cTc)/dt es el flujo calorıfico en transicion (acumulado) enla chaqueta del tanque. Todos los flujos calorıficos estan en kJ/h, mientras que laentalpıa H posee unidades de kJ/kmol.

El balance de energıa en el sistema asume que la temperatura Tc es uniforme entoda la chaqueta. La transferencia de calor entre el sistema de reaccion (que se realizaa la temperatura T`) y el agua de refrigeracion (que se realiza a la temperatura Tc),se describe mediante la relacion:

Q = US(T` − Tc) (2.128)

donde U es el coeficiente global de transmision de calor en kJ/(h m2 K), S es lasuperficie efectiva de transferencia de calor en m2. Tener en cuenta que en general lasuperficie S puede variar debido a los flujos que ingresan al reactor y cuando algunassuperficies dentro del tanque no estan completamente cubiertas todo el tiempo conla masa liquida de la reaccion. La velocidad de reaccion k en h−1 tiene la forma:

k = αe−Ea/R(272+T`) (2.129)

donde Ea es la energıa de activacion en kJ/kmol y R es la constante universal de losgases. La tabla 2.5 muestra los valores nominales de los parametros del sistema.

El objetivo de control es estabilizar la temperatura T`, ası como tambien laconcentracion Cb a la salida del reactor, cumpliendo determinadas especificacionesde diseno, tales como tiempo de estabilizacion, maximo sobrepico de las respuestascontroladas y error en estado estable de las respuestas con respecto a las senales dereferencia o “set points”. Las fuerzas de control para lograr este objetivo son el flujoF` del liquido y el flujo de refrigeracion Fc. Para este sistema:

(a) Determine su modelo en el espacio de estado.(b) Determine su modelo de Lagrange.(c) Para un cambio escalon de 25 a 26 m3/h en el flujo de alimentacion F`, graficar

la respuesta no lineal a lazo abierto correspondiente a Cb, T`, Ca y Tc.


Tabla 2.5: Parametros nominales del reactor quımico con chaqueta de enfriamiento.

Sımbolo Descripcion Valor Unidades

α Coeficiente de la velocidad de reaccion 29.063 h−1

R Constante de los gases ideales 8.314 kJ/K kmol

Ea Energıa de activacion 2100 kJ/kmol

H Entalpıa de reaccion 2100 kJ/kmol

U Coeficiente global de transmision de calor 4300 kJ/(hm2 K)

ρ` Densidad del liquido 800 kg/m3

ρc Densidad del refrigerante 1000 kg/m3

Cp` Calor especıfico del lıquido 3 kJ/(kgK)

Cp c Calor especıfico del refrigerante 4.1868 kJ/(kgK)

S Superficie efectiva de intercambio de calor 24 m2

V` Volumen del tanque 24 m3

Vc Volumen de la chaqueta 8 m3

Tl0 Temperatura del liquido entrante 34 oC

Tc0 Temperatura del refrigerante entrante 20 oC

Ca0: Concentracion del liquido de entrada 8 kmol/m3

(d) Para un cambio de 1 m3/h en el flujo de enfriamiento Fc, graficar la respuesta alazo abierto no lineal del sistema correspondiente a Cb, T`, Ca y Tc.

Problema 2.7 : Motor DC No Lineal

La figura 2.14 muestra un motor DC en el cual el voltaje de armadura se mantieneconstante mientras que el voltaje de campo es variable. El modelo de este motor hasido tomado de [14]. El balance electrico en el devanado del estator se describe como:

V

I

IR L

L

R

+

-- +V

Ω

Φ

r

rrs

s

s

Fig. 2.14: Nonlinear DC motor.

LsdIs

dt+ RsIf = Vs

2.3 Problemas 41

donde Is es la corriente del estator, Vs es el voltaje del estator, Rs y Ls son la re-sistencia e inductancia del devanado del estator respectivamente. El balance electricoen el devanado del rotor resulta:

LrdIr

dt+ RrIr = Vr −E

donde Ir es la corriente del rotor, Vr es el voltaje del rotor, Rr y Lr son la resistenciae inductancia del devanado del rotor respectivamente, y E es el voltaje de fuerzacontra electromotriz. Considerando solo friccion viscosa, el balance mecanico en lacarga esta dado por:

JdΩdt

+ FΩ = T

donde Ω representsa la velocidad angular del eje del motor, J denota la inercia de lacarga, F es la constante de friccion viscosa, y T es el torque de carga. Si Φ denota elflujo asociado con el devanado del estator, entonces:

E = KeΦΩ T = KmΦIr Φ = LsIs

donde Ke y Km son constantes. Asumiendo 100 % de eficiencia en la conversion deenergıa, entonces Ke = Km = K. Para el sistema descrito considere que el voltajeu = Vs es la entrada del sistema y seleccione como variables de estado: x1 = Is,x2 = Ir, x3 = Ω. Luego:

(a) Determine el modelo de Lagrange del motor DC.(b) Determine el modelo en el espacio de estado.

Problema 2.8 : Manipulador Polar Vertical

La figura 2.15 muestra un manipulador robotico polar vertical de 2GDL extraıdo de[25].

a) Determinar SU modelo de Lagrange.

b) Determinar SUS ecuaciones de estado y de salida.

Problema 2.9 : Manipulador Polar Horizontal

La figura 2.16 muestra un manipulador robotico polar horizontal de 2GDL extraıdode [25].

a) Determinar SU modelo de Lagrange.

b) Determinar SUS ecuaciones de estado y de salida.

Problema 2.10 : Manipulador Robotico Traslacional–Esferico (MRTE)

La Fig. 2.17 muestra el Manipulador Robotico Traslacional–Esferico (MRTE). Estemanipulador es una combinacion del manipuladores MRT (Fig. 2.5) descrito en lasubseccion 2.2.1 y el manipulador MRE (Fig. 2.8) descrito en la subseccion 2.2.2.Determinar su modelo de Lagrange y su modelo en el espacio de estado empleandolas ecuaciones de Lagrange.


θ1

m 1

m

L1

d 1

2

Fig. 2.15: Manipulador robotico polar vertical de 2GDL.

m

d 1

21L

1m

θ1

Fig. 2.16: Manipulador robotico polar horizontal de 2GDL.

Problema 2.11 : Manipulador Robotico Esferico de 3GDL (MRE3)

La Fig. 2.18 muestra el Manipulador Robotico Esferico de 3 GDL (MRE3). Este ma-nipulador es una extension del manipulador MRE (Fig. 2.18) descrito en la subseccion2.2.2. Determinar su modelo de Lagrange y su modelo en el espacio de estado emple-ando las ecuaciones de Lagrange. Considerar longitudes L1 = L2 y masas m1 = m2

de los brazos.

Problema 2.12 : Motor Sıncrono de Iman Permanente

El modelo matematico de un motor sıcrono de iman permanente (MSIP) en un sis-tema de referencias sıcrono, o el denominado sistema d–q, se formula como:

vd = R id +dφd

dt− ω φq

vq = R iq +dφq

dt+ ω φd

φd = Ld id + φm

φq = Lq iq

2.3 Problemas 43

Ff

r

x

y

mp

rp

θ

mhL h

mbbL

FdDisco

b

a

Efector Final

Brazo

Carro

BasePoleaMotor 1

Motor 2

α Motor 3

Fig. 2.17: Manipulador Robotico Traslacional–Esferico (MRTE).

x

y

z

b

a

q2

d rda

mdM1

SERVOMOTORM2

q1

mb

DISCO

BASE

M3

L

L2

Lh

m1

1

m2

hm

q3

EFECTORFINAL

Fig. 2.18: Manipulador Robotico Esferico de 3GDL (MRE3).

Te =32

p[φm iq − (Lq − Ld) id iq]

Te = TL + B ωr + Jdωr

dtω = pωr


donde:

vd, vq Voltajes en los ejes d y q del estator.id, iq Corrientes en los ejes d y q del estator.φd, φq Flujos magneticos en los ejes d y q del estator.φm Flujo creado por los magnetos del rotor.R Resistencia del estator.Ld, Lq Inductancias en los ejes d y q del estator.Te, TL Torques electromagnetico y de carga.J Momento de inercia.B Coeficiente de friccion viscosa.p Numero de pares de polos.ωr Velocidad del rotor en frecuencia angular.ω Frecuencia del inversor.

Determinar el modelo de Lagrange y la ecuacion de estado del MSIP. Los estadosdel sistema son id, iq y wr. Las entradas son vd y vq y la salida es el toque Te.

Capıtulo 3

Control Optimo

El procedimiento de diseno del sistema de control optimo presentado en este capıtu-lo se puede aplicar a una gran clase de procesos no lineales, algunos de los cuales ya fueronpropuestos en el capıtulo 2. Este capıtulo trata el problema del control optimo cuadraticogaussiano, denominado ası porque el ındice de rendimiento o funcion de costo que em-plea es una funcion cuadratica de los estados y de las senales de control. La solucion delproblema de control planteado consiste en determinar un extremo de la funcion de costomediante minimizacion con el proposito de generar la ley de control optima.

La configuracion del sistema de control optimo no lineal desarrollado en este capıtulocomprende el modelo no lineal multivariable del sistema a controlar, un observador nolineal para estimar los estados del sistema y un controlador de realimentacion de estadosdel tipo proporcional–integral. El diseno del sistema de control optimo (Fig. 3.1) consisteen producir una fuerza de control U que sea capaz de hacer que el vector de salida Ydel sistema (la salida controlada) siga al vector de referencias deseadas Rd cumpliendociertas especificaciones de diseno, no obstante la presencia de disturbios estocasticosgaussianos actuando sobre el sistema en operacion.

Con el proposito de validar el procedimiento de diseno propuesto en la seccion 3.5,sistemas de control optimo no lineal han sido disenados e implementados en tiempo realpara los sistemas:(1) Manipulador robotico de 1GDL.(2) Manipulador robotico esferico.(3) Manipulador robotico traslacional.(4) Tanque de agua

3.1. Configuracion del Sistema de Control Optimo

La configuracion del sistema de control optimo no lineal empleada en estecapıtulo se ilustra en la Fig. 3.1. Tal configuracion combina en su diseno la repre-sentacion de un sistema no lineal, un observador no lineal para estimar los estadosdel sistema y una ley de control de realimentacion de estados del tipo proporcional–integral. El objetivo del sistema de control optimo consiste en seleccionar una fuerzade control U capaz de minimizar la diferencia entre el vector de salida Y del sistemay el vector de trayectorias de referencia deseadas R, a pesar de la presencia de incer-tidumbres en los parametros y de disturbios estocasticos gaussianos actuando sobre

46 Control Optimo

el sistema controlado.

CK Ι SISTEMA

OBSERVADOR

K

YXUR

X

zz

Fig. 3.1: Configuracion del sistema de control optimo.

La implementacion en tiempo real del sistema mostrado en la figura 3.1 operacomo sigue: despues de cada tiempo de discretizacion, el observador no lineal estimalos estados X del sistema empleando los datos proporcionados por el vector de entradaU y el vector de salida Y. Invocando el bien conocido teorema de la separacion[15], tales estados estimados y la integral del error z, se usan para computar la leyde control U = −KX + KI z. La senal U, que es del tipo proporcional–integral,actua sobre el sistema para hacer que el error entre Rd y la salida Y tienda a cerocumpliendo ciertas especificaciones de diseno.

3.2. Descripcion dinamica del Sistema

El sistema dinamico no lineal multivariable (de multiples entradas U y multiplessalidas Y) se describe como:

X = f(X,U) + v X(0−) = 0

Y = h(X) + w (3.1)

X =

X1...

Xn

U =

U1...

Um

v =

v1...

vn

Y =

Y1...

Yp

w =

w1...

wp

f =

f1(X,U)...

fn(X,U)

h =

h1(X)...

hp(X)

donde X es el vector de estado, U es el vector de control (la entrada al sistema) e Yes el vector de salida. Asumiremos que las funciones vectoriales de variable vectorialf(X,U) y h(X) son operadores no lineales diferenciables que representan la dinamicadel sistema y la dinamica de la salida respectivamente. Los vectores v de orden n× 1y w de orden p×1 son los disturbios en los estados del sistema (ruidos en los estados)y en sus salidas (ruidos de medicion) respectivamente.

3.3 El Controlador PI Optimo 47

Sean X0, U0 e Y0 los vectores de referencia (o nominales) de X, U e Yrespectivamente. Si la entrada del sistema se selecciona exactamente igual a U0, surespuesta sera X0. Entonces X0 satisface:

X0 = f(X0,U0) + v X0(0−) = 0

Y0 = h(X0) + w (3.2)

Si la entrada del sistema U no es exactamente, pero sı muy cercana a U0, el vectorde estado X resultante difiere muy poco de X0. Para tal situacion, las trayectoriasactuales pueden formularse como:

X = X0 + x U = U0 + u Y = Y0 + y (3.3)

donde los vectores residuales y, u y x representan desviaciones con respecto a loscorrespondientes vectores de estado, de control y de salida respectivamente. Reem-plazando (3.3) en (3.1) produce:

X0 + x = f(X0 + x,U0 + u) + v

Y0 + y = h(X0 + x) + w (3.4)

Como hemos asumido que las desviaciones actuales son pequenas, entonces el sistema(3.4) admite ser linealizado alrededor de un vector de trayectorias nominales o dereferencia X0. La linealizacion de (3.4) empleando operadores jacobianos alrededorde X0 y U0 resulta:

x ≈ Ax + Bu + v x(0−) = 0

y ≈ Cx + w (3.5)

donde:

A =

∂f1

∂X1· · · ∂f1

∂Xn...

. . ....

∂fn

∂X1· · · ∂fn

∂Xn

(X0,U0)

B =

∂f1

∂U1· · · ∂f1

∂Um...

. . ....

∂fn

∂U1· · · ∂fn

∂Um

(X0,U0)

C =

∂h1∂X1

· · · ∂h1∂Xn

.... . .

...∂hp

∂X1· · · ∂hp

∂Xn

(X0)

(3.6)

Observar que las matrices jacobianas Ann, Bnm, Cpn y Dpm necesitan ser evaluadasalrededor de los vectores de referencia X0 y U0.

3.3. El Controlador PI Optimo

La Fig. 3.2 muestra el sistema de control optimo proporcional integral a emplearpara la deduccion de la correspondiente ley de control. Notar que en dicha figura noaparece el observador de estados. Ademas, el sistema a controlar emplea la descripcion

48 Control Optimo

zzIK

uB

R xx

K

A

Cy

Fig. 3.2: Sistema de control optimo linealizado con controlador PI (Proporcional–Integral) de realimentacion de estados.

lineal dada en (3.5). Sin considerar los vectores gaussianos v y w (estos vectores seincluyen al final), de la figura 3.2 se obtiene:

x = Ax + Bu

y = Cx

u = −Kx + KI z

z = R− y = R−Cx (3.7)

donde x es el vector de estado de orden n, u es el vector de control de orden m, y esel vector de salida de orden p, z es el vector de salida del integrador de orden p, R esel vector de referencias deseadas de orden p, A es la matriz de estado de dimensionn × n, B es la matriz de control de dimension n ×m y C es la matriz de salida dedimension p× n. De (3.7) se puede formular:

[x(t)z(t)

]=

[A 0−C 0

] [x(t)z(t)

]+

[B0

]u(t) +

[0I

]R(t) (3.8)

donde I es la matriz identidad de orden p y las matrices y vectores 0 poseen dimen-siones apropiadas. Dado que (3.8) es cierto para cualquier t, entonces para un tiempofinal tf se tiene:

[x(tf )z(tf )

]=

[A 0−C 0

] [x(tf )z(tf )

]+

[B0

]u(tf ) +

[0I

]R(tf ) (3.9)

Restando (3.8) de (3.9) resulta:

[xe

ze

]=

[A 0−C 0

] [xe

ze

]+

[B0

]ue +

[0I

]Re (3.10)

3.3 El Controlador PI Optimo 49

donde:

xe = x(t)− x(tf )ze = z(t)− z(tf )ue = u(t)− u(tf )Re = R(t)−R(tf ) (3.11)

son los errores del sistema. Dado que se desea un comportamiento asintoticamenteestable del sistema controlado, entonces los errores xe, ze y ue deben de tender a cero,mientras que el error Re debe de ser nulo cuando se alcance el estado estacionario.Por consiguiente, la ecuacion de estado del error (incluyendo los vectores de ruidogaussiano) toma la forma:

e = Aae + Baue + v e(0−) = 0 (3.12)

e =[

xe

ze

]Aa =

[A 0−C 0

]Ba =

[B0

]

donde el vector de error e es de orden n + p, el vector de ruido gaussiano v es ahorade orden n + p y las matrices Aa y Ba son de orden (n + p)× (n + p) y (n + p)×mrespectivamente. De la misma manera, la ley de control u = −Kx + KI z dada en(3.7) toma la forma:

ue = −Kxe + KI ze = −Kae Ka = [K −KI] (3.13)

donde la matriz de ganancia Ka es de orden m× (n + p).Observar que la ecuacion de estado del error (3.12) y la ley de control residual

(3.13) poseen la misma estructura que las ecuaciones de estado y de control delsistema dado en (3.7). Esta similitud nos permite ahora determinar la matriz deganancia optima Ka como sigue [15]. Siempre que el sistema descrito por (3.12)cumpla la siguiente condicion de controlabilidad:

rango Ma = rango[Ba AaBa · · · (Aa)n−1Ba

]= n + p (3.14)

entonces, Ka puede ser computada de:

Ka = R−1(Ba)TPa (3.15)

donde Pa = (Pa)T de orden (n + p) × (n + p) es la unica matriz solucion definidapositiva de la siguiente ecuacion asociada de Riccati:

Pa(Aa + αI) + (Aa + αI)TPa −PaBaR−1(Ba)TPa + Qa = 0 (3.16)

Por lo tanto, la ley de control de realimentacion de estados (el controlador PI derealimentacion de estados):

u = −Kaxa = − [K −KI

] [xz

](3.17)

50 Control Optimo

minimiza la siguiente funcion de costo cuadratica:

Ia =∫ ∞

0e2αt[(xa)T (t)Qa xa(t) + uT (t)Ru(t)]dt (3.18)

sujeto a la ecuacion de restriccion:

xa = Aaxa + Bau + va (3.19)

En (3.18), Qa = (Qa)T de orden (n+p)×(n+p) es una matriz semi-definida positiva,R = RT de orden m×m es una matriz definida positiva y α ≥ 0 es una constante.Observar que R y Qa son matrices de sintonizacion que sirven para ponderar elrendimiento del sistema.

Agregando los valores estacionarios U y X a ambos miembros de (3.17), seobtiene la ley de control actual U:

u+U = U = −KaXa = − [K −KI

] [x + X

z

]= − [

K −KI

] [Xz

](3.20)

De acuerdo al teorema de la separacion [15], los controladores de realimentacionde estado se pueden implementar empleando los estimados de los estados en lugar delos estados actuales del sistema. Por consiguiente, la ley de control (3.20) se puedeimplementar tambien como:

U = −KaXa = − [K −KI

] [Xz

](3.21)

Para obtener el vector de estado estimado X emplearemos un observador nolineal (section 3.4). El vector estimado z no necesita estimarse ya que se obtienedirectamente integrando la salida actual Y.

3.4. El Observador No Lineal Multivariable

Consideremos la estructura de la figura 3.3 para la estimacion de estados y con-trol del sistema descrito en (3.1). El observador no lineal ilustrado se puede describirpor:

˙X = f(X,U) + H(Y − Y) X(0−) = 0

Y = h(X) (3.22)

donde Y y X son los vectores estimados de Y y X respectivamente, y H es unamatriz residual de ganancia de orden n× p a ser determinada.

Por otra parte, asumamos que los disturbios v y w en (3.1) sean ruido blancogaussiano con media (o esperanza) nula. El ruido blanco gaussiano posee la propiedadde ser no correlacionado en cada instante de tiempo. En otras palabras, no existe unainterrelacion (correlacion) entre v y w. La propiedad de la media nula implica quetoda la informacion estadıstica del ruido se acumula en la covarianza de los disturbios.En terminos matematicos:

E[v(t)vT (τ)] = Vδ(t− τ) E[v] = 0

E[w(t)wT (τ)] = Wδ(t− τ) E[w] = 0 (3.23)

3.4 El Observador No Lineal Multivariable 51

−

^ ^ ^

^

^^

+

+

+++

+x x

+

h

^

C

+( )

− K

H

a

f( )

Y

h(X)

XXaX

U

U

U

f(X, U)

v w R

f(X, U)

Y YX X

zz

zz

f( )

Fig. 3.3: Estructura del sistema de control optimo para estimacion de estados ycontrol.

donde E[.] es la operacion matematica esperanza, δ(t − τ) es la funcion delta deKronecker definida como: δ(t − τ) = 1 para t = τ y nula en otro caso. Tambien, Vde orden n× n y W de orden p× p son matrices de covarianza definidas positivas.

Es un hecho conocido que un sistema lineal de la forma dada en (3.7) pero conv = w = 0, es observable siempre que su correspondiente matriz de observabilidadN posea rango completo:

rango N = rango

CCA

...CAn−1

= n (3.24)

Cuando el modelo linealizado dado en (3.7) es completamente observable, la matrizresidual de ganancia H del observador no lineal descrito en (3.22), se calcula de:

H = SCTW−1 (3.25)

donde S = ST de orden n × n es la unica matriz definida positiva solucion de lasiguiente ecuacion asociada de Riccati:

0 = S(A + αI)T + (A + αI)S− SCTW−1CS + V (3.26)

El estimador de estados resultante mostrado en la figura 3.3 es conocido tambiencomo el filtro extendido de Kalman de ganancia constante H [15].

52 Control Optimo

3.5. Procedimiento de Diseno

El procedimiento de diseno del sistema de control optimo desarrollado sigue lospasos siguientes:

(1) Formular el problema: describir el sistema a controlar, definir las especifica-ciones de diseno y determinar el modelo no lineal del sistema en la forma dadaen (3.1).

(2) Determinar el modelo linealizado del sistema (ecuacion (3.5)).(3) Determinar la controlabilidad y observabilidad del sistema linealizado (ecua-

ciones (3.14) y (3.24) respectivamente).(4) Computar la matriz de ganancia Ka de la ley de control PI del sistema (ecua-

ciones (3.15) y (3.16)).(5) Computar la matriz de ganancia H del observador no lineal del sistema (ecua-

ciones (3.25) y (3.26)).(6) Simular el sistema de control optimo empleando las ecuaciones dinamicas no

lineales (3.1) y (3.22).(7) Implementar el sistema de control optimo (hardware).(8) Desarrollar el software de control en tiempo real del sistema.(9) Ejecutar pruebas de funcionamiento en tiempo real.

Ejemplo 3.1

Disenar un sistema de control optimo para el manipulador robotico con articulacionelastica (MRAE) mostrado en la Fig. 2.3 y descrito en la subseccion 2.1.2.

Solucion: La ecuacion de estado no lineal del MRAE, despreciando la inductanciade armadura La se muestra en la ecuacion (2.39). Haciendo sinx1

∼= x1 en (2.39), laecuacion de estado lineal toma la forma:

x = Ax + Bu y = Cx (3.27)

A =

0 x2 0 0a21 −BL

JL

KωJL

00 0 0 x4

KωJeq

0 −KmJeq

a44

B =

000(

nKmKbJeqRa

)

C =

[1 0 0 0

]

a21 = −Kω

JL− Lg

JL

(mb

2+ mh

)a44 = −

(n2KmKb

JeqRa+

Beq

Jeq

)

Dado que el sistema es completamente controlable y completamente observable,la ganancia Ka del controlador y la ganancia H del observador se determinaronusando los comandos lqr y lqe de Mathscript respectivamente. Las matrices requeridaspor estos comandos se fijaron como sigue: R = 30I, Qa = 50I, V = 0.01I, W = 0.01I y G = I, donde I es la matriz identidad. El parametro α de la funcion de costo sefijo en 3.5.

La simulacion se llevo a cabo ejecutando el archivo ocmraer.m (que se encuentraen el CD adjunto) para senales de referencia R tipo escalon. La relacion z =

∫ t0 Ydτ

3.5 Procedimiento de Diseno 53

se aproximo en el dominio discreto como z(k+1) = z(k)+Tx(k), donde T=0.001 s esel tiempo de muestreo y k = t/T es el tiempo discreto. El resultado de la simulacionse muestra en la Fig. 3.4. Notar que las especificaciones de diseno: porcentaje desobreimpulso nulo, error en estado estacionario nulo y tiempo de estabilizacion menorde 1.5 s se cumplen satisfactoriamente. ♣

0 2 4 6 8 10 12 14 160

0.2

0.4

0.6

0.8

1

Pos

ició

n x1

[rad

]

TIEMPO [s]

0 2 4 6 8 10 12 14 16−30

−20

−10

0

10

20

30

Con

trol

u [

V]

TIEMPO [s]

Fig. 3.4: Posicion angular controlada del brazo del manipulador MRAE.

Ejemplo 3.2

Disenar un sistema de control optimo para el proceso tanque de agua mostrado en laFig. 2.4 y descrito en la subseccion 2.1.3.

Solucion: La ecuacion de estado del sistema tanque de agua se muestra en (2.51).Como el sistema es completamente controlable y completamente observable, la ganan-cia Ka del controlador y la ganancia H del observador se determinaron usando loscomandos lqr y lqe de MathScript respectivamente. Las matrices de sintonizacionrequeridas por tales comandos se fijaron como sigue: R = 4000I, Qa = 50 I, dondeI es la matriz identidad. Cabe anotar que no se requiere observador dado que lasvariables de estado son las variables de salida medibles. El parametro α de la funcionde costo se fijo en 0.008.

La simulacion se ejecuto empleando el archivo octanque.m (que se encuentraen el CD adjunto) para senales de referencia R tipo escalon. La relacion z =

∫ t0 Ydτ

se aproximo en el dominio discreto como z(k + 1) = z(k) + Tx(k), donde T = 1 s esel tiempo de muestreo y k = t/T es el tiempo discreto. El resultado de la simulacion

54 Control Optimo

se muestra en la Fig. 3.5. Notar que las especificaciones de diseno: porcentaje desobreimpulso nulo, error en estado estacionario nulo y tiempo de estabilizacion menorde 1.5 s se cumplen satisfactoriamente. ♣

0 500 1000 1500 2000 2500 3000 3500 40000

0.2

0.4

NIV

EL

[m]

0 500 1000 1500 2000 2500 3000 3500 4000−50

0

50

TIEMPO [s]

FLU

JO [V

]

0 500 1000 1500 2000 2500 3000 3500 40000

500

TE

MP

ER

AT

UR

A [K

]

0 500 1000 1500 2000 2500 3000 3500 4000−100

0

100

TIEMPO [s]

CA

LOR

[V]

Fig. 3.5: Nivel y temperatura controladas en el sistema tanque con agua.

3.6. Aplicaciones

3.6.1. Control Optimo del Manipulador Robotico de 1GDL (MR1)

La ecuacion de estado del MRE1 se muestra en la ecuacion (2.20). Este sistemase puede linealizar haciendo sin x1

∼= x1, asumiendo que x1 es pequeno. Entonces:

x = Ax + Bu y = Cx

A =

0 1 0− Q

Jeq−Beq

Jeq

nKmJeq

0 −nKbLa

−RaLa

B =

00

KaLa

C =[

1 0 0]

D =[

0]

Por lo tanto:

Aa =[

A 0−C 0

]Ba =

[B0

]Ca =

[C 0

]

Es facil comprobar que el sistema es completamente controlable y comple-tamente observable. Por ello, la ganancia Ka del controlador y la ganancia H del

3.6 Aplicaciones 55

observador fueron determinadas usando los comandos lqr y lqe de Mathscript, re-spectivamente. Las matrices requeridas por estos comandos se fijaron en: R = 1I, Qa

= 0.5I, V = 0.1I, W = 0.1I, G = I, Re = 0.1I, Qe = 0.3I, donde I es la matrizidentidad. El parametro α de la funcion de costo se fijo en 10.

La simulacion se lleva a cabo ejecutando el archivo ocmr1r.m para el caso deregulacion. Tal archivo se lista en el CD adjunto para las senales de referencia tipoescalon. La relacion z =

∫ t0 Ydτ se aproximo en el dominio discreto como z(k + 1) =

z(k) + Tx(k), donde T=0.001 s es el tiempo de muestreo y k = t/T es el tiempodiscreto. La simulacion se muestra en la Fig. 3.6. Notar que las especificaciones dediseno porcentaje de sobreimpulso nulo, error en estado estacionario nulo y tiempode estabilizacion menor de 1 s se cumplen satisfactoriamente.

0 1 2 3 4 5 6 7 8 9 100

0.2

0.4

0.6

0.8

1

TIEMPO EN SEGUNDOS

Ang

ulo

[rad

]

0 1 2 3 4 5 6 7 8 9 10−15

−10

−5

0

5

10

15

TIEMPO EN SEGUNDOS

Con

trol

U [V

]

Fig. 3.6: Posiciones angulares de la base y del del brazo MR1 controladas.

3.6.2. Control Optimo del Manipulador Robotico Esferico

.La ecuacion de estado del MRE se muestra en la ecuacion (2.122). Este sistema

se puede linealizar usando las matrices jacobianas dadas en (3.6). Sin embargo, apli-caremos el metodo de linealizacion aproximada que consiste en asumir que, cuando xes suficientemente pequeno, se cumple: sin(x) ∼= x, cos(x) ∼= 1, x2 ∼= 0, etc. Aplicandoesta aproximacion en (2.122) se obtiene (el sobrerayado indica un valor estacionario):

M11 =Ra

nKmKA(J1 + Jeq)

56 Control Optimo

M22 = M22

P 11 = P 22 = P11 = P22

P 12 = P 21 = 0

d21 = d21 sinx2; d21 =Ram2L2g

2nKmKA;

Por consiguiente:

A =

0 0 1 00 0 0 10 0 −M

−111 P 11 0

0 −M−122 d21 0 −M

−122 P 22

B =

0 00 0

M−111 00 −M

−122

C =[

1 0 0 00 1 0 0

]D =

[0 00 0

]

Por lo tanto:

Aa =[

A 0−C 0

]Ba =

[B0

]Ca =

[C 0

]

Usando el hecho de que el sistema es completamente controlable y completa-mente observable, la ganancia Ka del controlador y la ganancia H del observadorfueron determinadas usando los comandos lqr y lqe de Mathscript, respectivamente.Las matrices requeridas por estos comandos se fijaron como sigue: R = 0,1I, Qa = 2I,V = 0,1I, W = 0,1I y G = I, donde I es la matriz identidad. El parametro α de lafuncion de costo se fijo en 5.5.

La simulacion se llevo a cabo ejecutando el archivo ocmrer.m (que se encuentraen el CD adjunto), para las senales de referencia R1 = 1 rad y r2 = 1 rad. La relacionz =

∫ t0 Ydτ se aproximo en el dominio discreto como z(k + 1) = z(k) + Tx(k),

donde T=0.001 s es el tiempo de muestreo y k = t/T es el tiempo discreto. Elresultado de la simulacion se muestran en la Fig. 3.7. Notar que las especificacionesde diseno porcentaje de sobreimpulso nulo, error en estado estacionario nulo y tiempode estabilizacion menor de 1 s se cumplen satisfactoriamente.

3.6.3. Control Optimo del Manipulador Robotico Traslacional

.La ecuacion de estado lineal del sistema MRT se muedtra en (2.92). Por con-

siguiente:

Aa =[

A 0C 0

]Ba =

[B0

]Ca =

[C 0

]

Como el sistema es completamente controlable y completamente observable, laganancia Ka del controlador y la ganancia H del observador fueron determinadasusando los comandos lqr y lqe de Mathscript, respectivamente. Las matrices de pon-deracion pedidas por estos comandos se fijaron en: R = 0.01I, Qa = 40I, V = 0,1I,W = 0,1I y G = I, donde I es la matriz identidad. El parametro α de la funcion decosto se fijo en 6.

3.7 Problemas 57

0 1 2 3 4 5 6 7 80

0.5

1

Pos

ició

n X

1 [r

ad]

0 1 2 3 4 5 6 7 8−10

0

10

Con

trol

U1

[V]

0 1 2 3 4 5 6 7 80

0.5

1

Pos

ició

n X

2 [r

ad]

0 1 2 3 4 5 6 7 8−10

0

10

Con

trol

U2

[V]

Tiempo [segundos]

Fig. 3.7: Posiciones angulares de la base y del del brazo MRE controladas.

La simulacion se llevo a cabo ejecutando el archivo ocmrts.m (que se encuentraen el CD adjunto), para las senales de referencia R1 y R2 sinusoidales. La relacionz =

∫ t0 Ydτ se aproximo en el dominio discreto como z(k + 1) = z(k) + Tx(k),

donde T=0.001 s es el tiempo de muestreo y k = t/T es el tiempo discreto. Elresultado de la simulacion se muestra en la Fig. 3.8. Notar que las especificaciones dediseno porcentaje de sobreimpulso nulo, error en estado estacionario nulo y tiempode estabilizacion menor de 1 s se cumplen satisfactoriamente.

3.7. Problemas


Disenar un sistema de control de posicion optimo para el sistema de plataformasmostrado en la Fig. 2.11 y descrito en el problema 2.4.


En el problema 2.5 se describe la columna de destilacion para fraccionar petroleopesado, mostrado en La Fig. 2.12. Disenar un sistema de control optimo para estesistema.


58 Control Optimo

0 2 4 6 8 10 12 14 16−10

0

10

20

Pos

ició

n X

1 [m

etro

s]

0 2 4 6 8 10 12 14 16−50

0

50

100

Con

trol

U1

[V]

0 2 4 6 8 10 12 14 16−2

0

2

Pos

ició

n X

2 [r

ad]

0 2 4 6 8 10 12 14 16−5

0

5

Con

trol

U2

(vo

ltios

)

Tiempo [segundos]

Fig. 3.8: Posiciones angulares controladas de la base y del del brazo del MRT.

Disenar un sistema de control optimo para el reactor quımico con chaqueta de enfri-amiento mostrado en la Fig. 2.13 y descrito en el problema 2.6.


En el problema 2.7 se describe un motor DC en el cual el voltaje de armadurase mantiene constante mientras que el voltaje de campo es variable (ver Fig. 2.14.Disenar un sistema de control optimo para este motor.


La Fig. 2.15 (problema ) muestra un manipulador polar vertical. Disenar un sistemade control optimo para este manipulador.


La Fig. 2.16 (problema ) muestra un manipulador polar horizontal. Disenar un sis-tema de control optimo para este manipulador.


Disenar un sistema de control optimo para el manipulador robotico traslacional–esferico mostrado en la Fig. 2.17 y descrito en el problema 2.10.

3.7 Problemas 59

Problema 3.8 : Manipulador Robotico Esferico (MRE3)

Disenar un sistema de control optimo para el manipulador robotico esferico mostradoen la Fig. 2.17 y descrito en el problema 2.11.


La dinamica del motor sıncrono de iman permanente se describe en el problema 2.12.Disenar un sistema de control optimo del torque para este motor.

Capıtulo 4

Control Adaptativo con ModeloReferencial

El procedimiento de diseno de un sistema de control adaptativo presentado eneste capıtulo se puede aplicar a una gran variedad de procesos no lineales, algunos delos cuales ya fueron formulados en el capıtulo 2. Este capıtulo trata el problema delcontrol adaptativo con modelo referencial, cuya estructura incluye un modelo dinamicode referencia, un controlador adaptativo, un modelo dinamico del sistema a controlar yun mecanismo de adaptacion.

El diseno del sistema de control adaptativo con modelo referencial consiste en pro-ducir una fuerza de control u que sea capaz de hacer que el vector de salida y del sistemaa controlar, siga a la respuesta deseada del sistema yd cumpliendo ciertas especificacionesde diseno, a pesar de la presencia de incertidumbre parametrica (parametros no modela-dos en el modelo dinamico usado o con valores inciertos) y no parametrica (efectos nolineales no tomados en cuenta en el modelo dinamico tales como friccion de coulumb,saturacion, entre otros).

A fin de validar el procedimiento de diseno propuesto, sistemas de control adaptativocon modelo referencial han sido disenados e implementados en tiempo real para el:(1) Manipulador robotico de 1GDL.(2) Manipulador robotico esferico.(3) Manipulador robotico traslacional.

4.1. Configuracion de un SCAMR

La figura 4.1 ilustra la configuracion de un Sistema de Control Adaptativo conModelo Referencial (SCAMR) que puede ser empleado en una gran variedad de apli-caciones. El SCAMR se compone basicamente de un modelo de referencia, un contro-lador adaptativo, el sistema a controlar y un mecanismo de adaptacion . El esquemaen consideracion se denomina un SCAMR paralelo debido a la ubicacion relativa delmodelo referencial con respecto al sistema.

El modelo de referencia, el cual esta excitado por una entrada externa r, esun sistema dinamico auxiliar usado para especificar la respuesta deseada del sistema.Tal respuesta debe de ser lograda por el SCAMR a pesar de las restricciones gener-adas por inexactitudes en el modelado de la estructura del modelo de referencia y el

62 Control Adaptativo con Modelo Referencial

−+

ru

y

y

yd

~

ADAPTATIVO

REFERENCIAL MODELO

SISTEMANO LINEAL

DE ADAPTACIÓN

MECANISMO

CONTROLADOR

Fig. 4.1: Configuracion de un Sistema de Control Adaptativo con Modelo Referencial(SCAMR).

modelo del sistema. En este capıtulo se emplea un modelo de referencia con matrizde transferencia unitaria lo cual implica que r = qd.

El mecanismo de adaptacion es un conjunto de bloques interconectados usadospara implementar la ley de adaptacion. De hecho, la ley de adaptacion es el algoritmode control empleado para modificar los parametros del controlador adaptativo, demodo tal que el SCAMR permanezca estable y que el error de seguimiento qq = q−qd

converja a cero a pesar de la presencia de parametros del sistema variantes conel tiempo y disturbios externos. El metodo directo de Lyapunov es empleado paradeterminar que el SCAMR disenado garantice convergencia global de las senalescontroladas con respecto a sus trayectorias deseadas.

Se asume que el sistema es no lineal. Por consiguiente, su descripcion puede serimprecisa; esto es, el modelo dinamico del sistema puede presentar incertidumbres ensu estructura o dinamica no modelada en su representacion. Ya que la descripcion delsistema permite incertidumbres, el control adaptativo (en general) se puede consideraruna aproximacion particular de control robusto.

4.2. SCAMR para Sistemas No Lineales Multivariables

4.2.1. Diseno del SCAMR

Una gran clase de sistemas no lineales se pueden describir mediante su modelodinamico de Lagrange:

M(q)q + P(q, q)q + d(q) = u q =

q1...

qm

u =

u1...

um

(4.1)

donde las matrices M, P y d representan la inercia del sistema a controlar, los torquescentrıpetos y de Coriolis, y los torques gravitacionales respectivamente. Tambien, qes el vector de coordenadas generalizadas y u es el vector de control.

El objetivo de control del SCAMR es disenar una ley de control u capaz dehacer que la salida del sistema q(t) siga a la trayectoria deseada qd(t) con velocidad

4.2 SCAMR para Sistemas No Lineales Multivariables 63

suficiente a pesar de la presencia de incertidumbres en los parametros. Asumamosque todos los terminos en (4.1) dependen linealmente de un vector de parametros acon elementos conocidos, a saber:

Ya = u (4.2)

donde Y es una matriz conocida. Considere la siguiente ley de control:

u = Ya−KD s (4.3)

donde KD s es el termino derivativo e Ya es el termino anticipativo. En los terminosdescritos, a es el vector estimado de parametros, KD (la ganancia derivativa) es unamatriz simetrica constante definida positiva y s es un vector de superficies deslizantescuyos elementos si, i = 1, . . . ,m se definen mediante la ecuacion escalar si(q, t) = 0,de modo tal que:

si = (d

dt+ λi)n−1qi = (p + λi)n−1qi (4.4)

donde λi > 0 es una constante (el ancho de banda), p es el operador de Laplace y:

qi = qi − qdi

es el error de seguimiento. Por ejemplo, para n = 2, (4.4) se convierte en un error deseguimiento compuesto de velocidad y posicion:

s = ˙q + Λq = q− qr q = q− qd qr = qd −Λq (4.5)

donde:

s =

s1...

sm

˙q =

˙q1...

˙qm

˙qr =

˙qr1...

˙qrm

qd = [qd1 . . . qdm]T Λ =

λ1 0 . . . 00 λ2 . . . 0...

... . . ....

0 0 . . . λm

(4.6)

La conservacion de la energıa requiere que:

12

d

dt[qTMq] = qT (u− d) (4.7)

donde qTMq es la energıa cinetica del sistema y qT (u−d) es la potencia de entradagenerada por el actuador. Diferenciando el miembro izquierdo de (4.7):

qTMq +12qTMq = qT (u− d) (4.8)

De (4.1) obtenemos: Mq = u− d−Pq. Sustituyendo este termino en (4.8):

qT (M− 2P)q = 0 (4.9)


Ha sido establecido en [27], [3] que (M− 2P) = J es antisimetrica. Por consiguiente:

M = 2P + J (4.10)

Considere la siguiente candidata para funcion de Lyapunov:

V (t) =12

[sTMs + aTΓ−1a

](4.11)

donde Γ es una matriz simetrica definida positiva y a = a−a es el error de estimacionde parametros. Diferenciando (4.11) se obtiene:

V (t) = sTMs +12sTM + ˙a

TΓ−1a

y empleando la relacion s = q−qr (ecuacion (4.5)) en la expresion anterior se obtiene:

V (t) = sT (Mq + Mqr) +12sTMs + ˙a

TΓ−1a

Sustituyendo (4.10), (4.3) y Mq de (4.1) en V produce:

V (t) = sT (Ya−KDs−Mqr −Pqr − d) + ˙aTΓ−1a (4.12)

en donde hemos usado el hecho de que sTJs = 0, dado que J es antisimetrica1. Laactualizacion de los parametros estimados a se puede formular como:

˙a = −ΓYT s (4.13)

mientras que la propiedad de parametrizacion lineal en (4.12) establece que:

Y(q, q, qr, qr)a = M(q)qr + P(q, q)qr + d(q) (4.14)

Reemplazando (4.14)y (4.13) en (4.12) produce:

V (t) = −sTKDs ≤ 0 (4.15)

Dado que s = ˙q + Λq (ver (4.5)), entonces (4.15) garantiza que los errores deseguimiento de posicion q y de velocidad ˙q tiendan a 0 conforme t → ∞. En otraspalabras, los errores de seguimiento convergen en la superficie s = 0.

4.2.2. El Observador de Velocidad

Es conveniente estimar la velocidad angular q del sistema, dado que solo secuenta con la medicion del vector de posicion q. El estimado de la velocidad angular,denotada como ˙q, toma la forma:

˙q = qd + Ld(q− q) (4.16)

donde la matriz de ganancia Ld = `dI del observador es diagonal y definida positiva,donde `d es una constante positiva.

1Suponga que sT Js = c 6= 0, donde c es una constante. Como J es antisimetrica: J = −JT; luegosT Js = ±c. Entonces, la unica solucion posible para la constante es: c = 0

4.2 SCAMR para Sistemas No Lineales Multivariables 65

4.2.3. Zona–Muerta para Evitar Corrimiento de Parametros

El problema del corrimiento de parametros hacia valores peligrosos esta aso-ciado con las incertidumbres no parametricas tales como fricciones estatica y deCoulomb, ruidos de medicion, tiempos muertos, entre otros. Tal problema se origi-na principalmente cuando el SCAMR no esta excitado permanentemente o debido ala presencia del ruido de medicion o de disturbios. El corrimiento de los valores delos parametros puede causar que el SCAMR se torne inestable si se permite que losparametros estimados desplacen sus valores hacia valores que puedan provocar quelos polos del SCAMR se vuelvan inestables.

La experiencia dicta que la presencia de pequenos errores de seguimiento puedenoriginar el corrimiento de los parametros a valores peligrosos, debido a que dichassenales basicamente contienen ruido y disturbios. La tecnica mas simple de modi-ficacion de la ley de control para evitar este problema es detener el mecanismo deadaptacion en presencia de pequeno errores de seguimiento. Esta tecnica conocidacomo “zona–muerta”sustituye (4.13) por:

˙a = −ΓYT s |s| > ∆

0 |s| < ∆(4.17)

donde ∆ representa el tamano de la zona–muerta. Ecuacion (4.17) nos indica que

cuando |s| < ∆, entonces ˙h debe tomar el valor −ΓYT s computado en el tiempo demuestreo anterior.

4.2.4. Procedimiento de Diseno del SCAMR

El procedimiento de diseno del sistema de control adaptativo con modelo refe-rencial desarrollado sigue los pasos siguientes:

(1) Formular el problema: describir el sistema a controlar, definir las especifica-ciones de diseno y determinar el modelo dinamico de Lagrange (ecuacion (4.1)).

(2) Construir la ecuacion de parametrizacion lineal dada en (4.14) como sigue.Primero estimar el vector ˙q usando el observador de velocidad dado en (4.16):

˙q = qd + Ld(q− q)

Luego, formular los errores de posicion y velocidad:

q = q− qd˙q = q− qd

y la funcion de deslizamiento:

s = q + Λq

La velocidad y aceleracion de referencias se formulan como:

qr = qd −Λq qr = qd −Λ˜q


Finalmente, formular la matriz de parametrizacion:

Y(q, q, qr, qr)a = M(q)qr + P(q, q)qr + d(q)

(3) Determinar el vector de parametros estimados a integrando la ley de adaptacion˙a = −ΓY T s (ecuacion (4.13)).

(4) Calcular la ley de control u = Ya−KDs (ecuacion (4.3)).(5) Si fuera necesario, con el fin de evitar el corrimiento de los parametros, emplear

la siguiente ecuacion de la zona–muerta:

˙αi = −ΓYT s |s| > ∆

0 |s| < ∆(4.18)

donde ∆ representa el tamano de la zona–muerta.(6) Simular el sistema de control adaptativo empleando los resultados de los pasos

anteriores.(7) Implementar el sistema de control adaptativo (hardware).(8) Desarrollar el software de control en tiempo real del sistema.(9) Ejecutar pruebas de funcionamiento.

Ejemplo 4.1

Disenar simular un sistema de control adaptativo con modelo referencial para el ma-nipulador robotico MR1.

Solucion: El modelo dinamico de Lagrange del MR1 se muestra en la ecuacion (2.23).Para fines de parametrizacion lineal, tal modelo se formula como: Mθ + P θ + d = u,donde:

M =(

JeqRa

nKmKA+

nKb

KA

)P =

BeqRa

nKmKAd =

RaQ sin θ

nKmKA

Definiendo:a1 = M a2 = P a3 =

RaQ

nKmKA

Se obtiene la siguiente matriz de parametrizacion lineal:

Y(q, q, qr, qr)a =[

qr qrqr2 sin q]

a1

a2

a3

donde el vector de parametros estimados a se calcula integrando la ley de adaptacion:a = −ΓY T s. Luego es posible calcular la ley de control u = Ya−Kds.

Las Figs. 4.2 y 4.3 muestran los resultados de la simulacion del sistema decontrol adaptativo disenado para controlar las posicion angular del brazo del MR1para los casos de seguimiento y regulacion respectivamente. Para obtener tales resul-tados, ejecutar los programas acmr1s.m y acmr1r.m (ver listados en el CD adjunto).Notar que las especificaciones de diseno porcentaje de sobreimpulso nulo, error enestado estacionario nulo y tiempo de estabilizacion menor de 1 s se cumplen satis-factoriamente para ambos casos. Los parametros de sintonizacion en los dos casos seseleccionaron: Λ = 10, γ = 0.01, Ld = 30 y Kd = 8.

4.3 SCAMR para Sistemas con Forma Asociada 67

0 1 2 3 4 5 6 7 80

1

2

3

4

5

POSI

CIÓN

q [ra

d]

0 1 2 3 4 5 6 7 8−1

0

1

2

3

4

5

TIEMPO [S]

CONT

ROL u

Fig. 4.2: Posicion angular controlada del brazo del MR1. Caso: seguimiento.

0 1 2 3 4 5 6 7 80

0.1

0.2

0.3

0.4

POSI

CIÓN

q [r

ad]

0 1 2 3 4 5 6 7 8−20

−10

0

10

20

30

TIEMPO [S]

CONT

ROL

u

Fig. 4.3: Posicion angular controlada del brazo del MR1. Caso: regulaciono.

4.3. SCAMR para Sistemas con Forma Asociada

Hemos visto que el procedimiento de diseno descrito en la subseccion 4.2.4tambien se aplica a sistemas que poseen una entrada. Sin embargo, en esta seccion sedisena un SCAMR para sistemas no lineales de una entrada y una salida que poseenuna descripcion dinamica asociada [3].

4.3.1. Formulacion del Problema y la Ley de Control

En lo que sigue, la notacion f (q) denota la q-esima derivada total de f con respectoal tiempo. Es decir:

f (q) , dqf

dtq


Consideremos el siguiente sistema no lineal en su forma asociada:

y(n) +m∑

i=1

α∗i fi(x, t) = bu (4.19)

donde x = [y y . . . y(n)]T es el vector de estado de orden n, α∗i y b son constantesdesconocidas, y fi son funciones no lineales conocidas. Dividiendo ambos miembrosde (4.19) por b, se obtiene:

h y(n) +m∑

i=1

αifi(x, t) = u h =1b

αi =α∗ib

(4.20)

Definamos el error de seguimiento a la salida:

e = y − yd

donde yd es la trayectoria deseada, de modo tal que el error combinado s se puedaexpresar como:

s = e(n−1) + λn−2 e(n−2) + · · ·+ λ0 e = ∆(p)e = y(n−1) − y(n−1)r (4.21)

donde:∆(p) = pn−1 + λn−2 pn−2 + · · ·+ λ0 = (p− p1) . . . (p− pn)

y(n−1)r = y

(n−1)d − λn−2 e(n−2) − · · · − λ0 e

en donde los λi, i = 0 . . . (n−2), son constantes enteras, p es el operador de Laplace y∆(p) es un polinomio estable Hurwitz, lo cual significa que todas las raıces complejaspi = σi + jωi, i = 1, . . . , n de ∆(p) = 0 verifican la condicion σi < 0. Asumamos lasiguiente ley de control:

u = h y(n)r − k s +

m∑

i=1

αifi(x, t) (4.22)

donde las constantes k y h poseen el mismo signo. La variable y(n)r , denotada como

la variable de referencia de y(n), se determina de:

y(n)r = y

(n)d − λn−2e

(n−1) − · · · − λ0e

Sustituyendo (4.22) en (4.20) nos conduce al error de seguimiento dinamico:

h s + k s = 0 s = e−kh

t (4.23)

Notar que s = e−kh

t, la solucion de la ecuacion diferencial (4.23), es exponencial-mente convergente en s. Este hecho garantiza la convergencia del error de seguimientodinamico dado en (4.23).

4.3 SCAMR para Sistemas con Forma Asociada 69

4.3.2. La Ley de Adaptacion

Reemplazando los parametros h y αi de (4.22) por sus valores estimados h yαi respectivamente, entonces la ley de control del SCAMR toma la forma:

u = h y(n)r − k s +

m∑

i=1

αifi(x, t) (4.24)

Definamos las desviaciones:

h = h− h αi = αi − αi (4.25)

Sustituyendo (4.24) y (4.25) en (4.20) produce el error de seguimiento dinamico:

hs + k s = h y(n)r +

m∑

i=1

αifi(x, t) (4.26)

Considere la siguiente ley de adaptacion:

˙h = −γ sgn(h)s y(n)

r

˙α = −γ sgn(h)s fi (4.27)

donde γ es la ganancia de adaptacion. Para determinar si el SCAMR garantiza con-vergencia de seguimiento global, consideremos la siguiente funcion de Lyapunov (versubseccion A.1.2):

V = |h|s2 + γ−1

[h2 +

m∑

i=1

α2i

](4.28)

Usando el hecho de que h sign(h) = |h| y k sign(k) = |k| y dado que k y h poseen elmismo signo, se puede demostrar facilmente que:

V = −2|k|s2 < 0 (4.29)

lo cual garantiza convergencia de seguimiento global del SCAMR en el sentido delmetodo directo de Liapunov (subseccion A.1.3). Ahora, considere la ley de adaptacion:

˙h = −γh sgn(h)s yn

r

˙αi = −γα sgn(h)s fi (4.30)

donde las ganancias de adaptacion γh y γk son diferentes para cada parametro des-conocido. Seleccionando la siguiente candidata para funcion de Lyapunov:

V = |h|s2 + γ−1h h2 + γ−1

k

m∑

i=1

α2i (4.31)

se puede demostrar facilmente que V nos conduce a (4.29), lo cual garantiza conver-gencia de seguimiento global del SCAMR.


4.3.3. Procedimiento de Diseno

El procedimiento de diseno del SCAMR para sistemas de una entrada con formaasiciada es el siguientes:

(1) Formular el problema: describir el sistema a controlar, definir las especifica-ciones de diseno y determinar el modelo no lineal del sistema en su formaasociada dada en (4.19).

(3) Disenar la ley de adaptacion dada en (4.27).(2) Disenar la ley de control dada en (4.22).(4) Si fuera necesario, formular las ecuaciones de la zona–muerta dada en (4.17)

para evitar el corrimiento de los parametros.(5) Simular el sistema de control adaptativo empleando los resultados de los pasos

anteriores.(6) Implementar el hardware del sistema de control adaptativo.(7) Elaborar el software de control en tiempo real del sistema.(8) Ejecutar pruebas de funcionamiento en tiempo real.

4.4. Aplicaciones

4.4.1. Control Adaptativo del Manipulador Robotico Esferico

El modelo dinamico de Lagrange del MRE se muestra en la ecuacion (2.121).Para fines de parametrizacion lineal, tal modelo dinamico toma la forma dad en (4.14)

[M11 00 M22

]qr +

[P11 P12

P21 P22

]qr +

[0

d21

]=

[u1

u2

]

Este sistema puede ser parametrizado definiendo:

M11 = a1 +a4

2sin2 q2 a1 =

Ra

nKmKA(J1 + Jeq a4 =

Ram2L22

2nKmKA

M22 = a2 a2 =Ra

nKmKA

(J2 + Jeq +

14m2L

22

)

P11 = a3 a3 =Ra

nKmKA

(Beq +

n2KmKb

Ra

)

P12 = a4q1 sin q2 cos q2

P21 =a4

2q1 sin q2 cos q2

P22 = a3

d21 = a5 sin q2 a5 =Ram2L2g

2nKmKA

Por consiguiente, la propiedad de parametrizacion lineal dada en (4.14) queda como:

Y(q, q, qr, qr)a =[

qr1 0 qr112 sin2 q2 + qr1 0

0 qr2 qr212 q2

r1 sin q2 cos q2 sin q2

]

a1

a2

a3

a4

a5

4.4 Aplicaciones 71

donde el vector de parametros estimados a se calcula integrando la ley de adaptacion:a = −ΓY T s. Para determinar el vector de deslizamiento s dada en (4.5), se requiereemplear el observador de velocidad descrito en (4.16). Finalmente, la ley de controlse determina de: u = Ya−Kds.

Las Figs. 4.4 y 4.5 muestran los resultados de la simulacion del sistema decontrol adaptativo disenado para controlar las posiciones angulares de los brazosdel MRE para los casos de seguimiento y regulacion respectivamente. Para obtenertales resultados, ejecutar los programas scmres.m y scmrer.m (ver listados en el CDadjunto). Notar que las especificaciones de diseno porcentaje de sobreimpulso nulo,error en estado estacionario nulo y tiempo de estabilizacion menor de 1 s se cumplensatisfactoriamente para ambos casos. Los parametros de sintonizacion en los dos casosse seleccionaron: Λ = 4, γ = 0.1, Ld = 80 y Kd = 20.

0 2 4 6 8 10 12 14 160

5

10

PO

SIC

IÓN

q1

[rad

]

0 2 4 6 8 10 12 14 16−1

0

1

TIEMPO [s]

CO

NT

RO

L u1

[V]

0 2 4 6 8 10 12 14 160

5

10

PO

SIC

IÓN

q2

[rad

]

0 2 4 6 8 10 12 14 16−1

0

1

TIEMPO [s]

CO

NT

RO

L u2

[V]

Fig. 4.4: Posiciones angulares controladas de los brazos del MRE. Caso: seguimiento.

4.4.2. Control Adaptativo del Manipulador Robotico Traslacional

El modelo de Lagrange del MRT se muestra en (2.90). Para proposito deparametrizacion lineal, tal modelo se formula como:

[M11 M12

M21 M22

]qr +

[P11 P12

0 P22

]qr +

[0

d21

]

Para determinar la ecuacion de parametrizacion definimos:

a1 = M11 a2 =RarpmbLb

2nKmKAa3 =

RambLb

2nKmKA


0 1 2 3 4 5 6 7 80

0.5

1

PO

SIC

IÓN

q1

[rad

]

0 1 2 3 4 5 6 7 8−50

0

50

CO

NT

RO

L u1

[V]

0 1 2 3 4 5 6 7 80

0.5

1

PO

SIC

IÓN

q2

[rad

]

0 1 2 3 4 5 6 7 8−50

0

50

TIEMPO [segundos]

CO

NT

RO

L u2

[V]

Fig. 4.5: Posiciones angulares controladas de los brazos del MRE. Caso: regulacion.

a4 = M22 a5 = P11 a6 = P22

Este sistema puede ser parametrizado definiendo: Y(q, q, qr, qr)a toma la forma:

[qr1 cos q2qr2 − sin q2q2qr2 0 0 qr1

0 0 0 cos q2qr1 − g sin q2 qr2 0 −qr2

]

a1

a2

a3

a4

a5

a6

donde el vector de parametros estimados a se calcula integrando la ley de adaptacion:a = −ΓY T s. Luego se calcula la ley de control u = Ya−Kds.

Las Figs. 4.6 y 4.6 muestran los resultados de la simulacion del sistema decontrol adaptativo disenado para controlar las posiciones angulares de los brazosdel MRE para los casos de seguimiento y regulacion respectivamente. Para obtenertales resultados, ejecutar los programas acmrts.m y acmrtr.m (ver listados en el CDadjunto). Notar que las especificaciones de diseno porcentaje de sobreimpulso nulo,error en estado estacionario nulo y tiempo de estabilizacion menor de 1 s se cumplensatisfactoriamente para ambos casos. Los parametros de sintonizacion en los dos casosse seleccionaron: Λ = 10, γ = 0.01, Ld = 40 y Kd = 17. El modelo dinamico del MREpara propositos de simulacion se da en la ecuacion (??).

4.4 Aplicaciones 73

0 1 2 3 4 5 6 7 8−5

0

5

PO

SIC

IÓN

q1

[rad

]

0 1 2 3 4 5 6 7 8−20

0

20

TIEMPO [s]

CO

NT

RO

L u1

[V]

0 1 2 3 4 5 6 7 80

2

4

PO

SIC

IÓN

q2

[rad

]

0 1 2 3 4 5 6 7 8−100

0

100

TIEMPO [s]

CO

NT

RO

L u1

[V]

Fig. 4.6: Posiciones angulares de la base y del brazo del MRE controladas. Caso:seguimiento.

4.4.3. Control Adaptativo del Manipulador Robotico MR1

El manipulador robotico MR1 mostrado en la figura 2.1 se describe en la subsec-cion 2.1.1. La forma asociada del sistema MR1 se determino en (2.27). Para propositosde simulacion en el caso de seguimiento, la trayectoria deseada y sus derivadas tomanla forma:

yd(t) = sin Wt yd = W cos Wt yd = −W 2 sin Wtdy3

d

dt3= −W 3 cos Wt

Para el caso de regulacion, ya que la trayectoria deseada es constante, las derivadasde orden superior son nulas. Volviendo al primer caso, el error de seguimiento y susderivadas se formulan como:

e = y − yd e = f2 − yd e = f1 − yd

La variable de referencia y la funcion de error se formulan respectivamente como:

yr = yd − λ1e− λ0e s = f1 − yr

mientras que la ley de adaptacion de parametros genera las relaciones:

h = −γsign(h) sdy3

dr

dt3

α1 = −γsign(h) s f1



0 2 4 6 8 10 12 14 160

0.5

PO

SIC

IÓN

q1

[rad

]

0 2 4 6 8 10 12 14 16−100

0

100

TIEMPO [s]

CO

NT

RO

L u1

[V]

0 2 4 6 8 10 12 14 16−0.5

0

0.5

PO

SIC

IÓN

q2

[rad

]

0 2 4 6 8 10 12 14 16−100

0

100

TIEMPO [s]

CO

NT

RO

L u1

[V]

Fig. 4.7: Posiciones angulares de la base y del brazo del MRE controladas. Caso:regulaciono.



Finalmente, la ley de control se formula:

u(t) = hdy3

r

dt3− k s + α1 f1 + α2 f2 + α3 f3 + α4 f4

Dado que:

y =y(k)− y(k − 1)

Ty =

y(k)− y(k − 1)T 2

dy3

dt3=

y(k)− y(k − 1)T 3

donde k = t/T , siendo T el tiempo de muestreo, entonces se puede demostrar queel modelo discretizado del sistema resulta:

y(k+1) = 3y(k)−3y(k−1)+y(k−2)+T 3

h(−α1f1(k)−α2f2(k)−α3f3(k)−α4f4(k)+u)

Las Figs. 4.8 y 4.9 muestran el brazo del MR1 controlado para los casos de seguimientoy regulacion. Para obtener tales resultados ejecutar los programas acmr1asociadas.m(para el caso de seguimiento) y acmr1asociadar.m (para el caso de regulacion),cuyos listados se encuentra en el CD adjunto. Para regulacion, los parametros desintonizacion para las raıces deseadas r1 = −3 y r2 = −2 fueron: λ0 = r1r2,λ1 = −(r1 + r2), k = 5, γ = 10, con un tiempo de muestreo T = 0.005 s. Paraseguimiento, solo el parametro k cambio al valor 10. ♣

4.5 Problemas 75

0 5 10 15 20 25−1

−0.5

0

0.5

1

Pos

ició

n y

[rad

]

0 5 10 15 20 25−5

0

5

Con

trol

u [V

]

Tiempo en segundos

Fig. 4.8: Posicion angular controlada del brazo del manipulador MR1. Caso:seguimiento.

4.5. Problemas


Disenar un sistema de control de posicion adaptativo para el sistema de plataformasmostrado en la Fig. 2.11 y descrito en el problema 2.4.


En el problema 2.5 se describe la columna de destilacion para fraccionar petroleopesado, mostrado en La Fig. 2.12. Disenar un sistema de control adaptativo paraeste sistema.


Disenar un sistema de control adaptativo para el reactor quımico con chaqueta deenfriamiento mostrado en la Fig. 2.13 y descrito en el problema 2.6.


En el problema 2.7 se describe un motor DC en el cual el voltaje de armadurase mantiene constante mientras que el voltaje de campo es variable (ver Fig. 2.14.Disenar un sistema de control adaptativo para este motor.



0 1 2 3 4 5 6 7 8 9 100

0.2

0.4

0.6

0.8

1

Pos

ició

n y

[rad

]

0 1 2 3 4 5 6 7 8 9 10−20

−10

0

10

20

30

Con

trol

u [V

]

Tiempo en segundos

Fig. 4.9: Posicion angular controlada del brazo del manipulador MR1. Caso: regu-lacion.

La Fig. 2.15 (problema ) muestra un manipulador polar vertical. Disenar un sistemade control adaptativo para este manipulador.


La Fig. 2.16 (problema ) muestra un manipulador polar horizontal. Disenar un sis-tema de control adaptativo para este manipulador.


Disenar un sistema de control adaptativo para el manipulador robotico traslacional–esferico mostrado en la Fig. 2.17 y descrito en el problema 2.10.


Disenar un sistema de control adaptativo con modelo referencial para el manipuladorrobotico esferico mostrado en la Fig. 2.17 y descrito en el problema 2.11.


La dinamica del motor sıncrono de iman permanente se describe en el problema 2.12.Disenar un sistema de control adaptativo del torque para este motor.

Capıtulo 5

Control por Modos Deslizantes

Este capıtulo se ocupa del control de sistemas no lineales usando la metodologıadel denominado control por modos deslizantes, o simplemente control deslizante. Paraeste control, la descripcion dinamica del sistema puede ser imprecisa; esto es, su modelodinamico puede presentar incertidumbre parametrica en su estructura o dinamica no mod-elada en su representacion. Dado que la descripcion del sistema permite incertidumbres,el control deslizante puede ser considerado como una aproximacion particular del controlrobusto.

La metodologıa del control deslizante incluye una ley de control no lineal de reali-mentacion que conmuta discontinuamente sobre una superficie que pertenece al espaciode estado del sistema, de forma tal que si una trayectoria de estado que se origina en susuperficie (como respuesta al comportamiento natural del sistema dinamico a lazo abier-to), trata de desviarse de dicha superficie, entonces se aplica una fuerza de control conel fin hacer retornar tal trayectoria a su superficie original. Por consiguiente, trayectoriasde estado naturales del sistema controlado estan restringidos a deslizarse a lo largo de susuperficie.

Cualquier trayectoria de estado en una superficie de deslizamiento debe de satis-facer la relacion algebraica que describe dicha superficie. El control deslizante es un tipoparticular de Control con Estructura Variable (CEV) [9], [10]. Tal tipo de control empleaen su diseno dos o mas leyes de control de realimentacion y una regla de decision: lafuncion de conmutacion.

Este capıtulo describe la la metodologıa para disenar sistemas de control deslizantepara una cierta clase de sistemas multivariables no lineales. Con el proposito de validarel procedimiento de diseno propuesto, sistemas de control deslizante seran disenados eimplementados en tiempo real para los sistemas:(1) Manipulador robotico de 1GDL.(2) Manipulador robotico esferico.(3) Manipulador robotico traslacional.(4) Sistema Tanque con Agua.

5.1. Conceptos Basicos

Para explicar la notacion empleada y los conceptos basicos del control conmodos deslizantes, emplearemos un sistema dinamico de una entrada y lineal en u.

78 Control por Modos Deslizantes

Este sistema posee la forma:

x(n) = f(x) + b(x)u x =

xx

x(2)

...x(n−1)

(5.1)

donde el estado escalar x es la salida de interes del sistema, el escalar u es la entradade control, x es el vector de estado y las funciones f(x) y g(x) no son exactamenteconocidas pero son acotadas por funciones conocidas dependientes de x. En adicion,b(x) es de signo conocido. Notar que la notacion para expresar derivadas totales deorden superior es:

x(n) , dxn

dtn

Dada una trayectoria de estado deseada y variante con el tiempo:

xd =

xd

xd

x(2)d...

x(n−1)d

xd(0) = x(0) (5.2)

El problema de control a resolver consiste en disenar un control finito u que fuerce alestado x seguir a la trayectoria deseada xd a pesar de la presencia de incertidumbresen los parametros y dinamica no modelada.

Definamos el error de seguimiento x y el vector de error de seguimiento x como:

x = x− xd x = x− xd =

x˙x

x(2)

...x(n−1)

(5.3)

Ademas, consideremos la superficie S(t) variante con el tiempo en el espacio de estadoRn definido mediante la ecuacion escalar s(x, t) = 0, tal que:

s(x, t) = (d

dt+ λ)n−1x = (p + λ)n−1x = x(n−1) − x(n−1)

r (5.4)

donde λ es una constante positiva cuya seleccion se discutira luego, p es el operadorde Laplace y x

(n−1)r es una funcion que puede ser computada de x y xd. Por ejemplo,

para un sistema de orden n = 3, s toma la forma:

s = (p + λ)2x = (p2 + 2λp + λ2)x = ¨x + 2λ ˙x + λ2x

= x− xr

xr = xd − 2λ ˙x− λ2x (5.5)

5.1 Conceptos Basicos 79

Notar que s resulta la suma ponderada del error de aceleracion ¨x, del error de veloci-dad ˙x y el error de posicion x.

La relacion (5.4) establece que un problema de control de trayectoria de ordenn se puede reemplazar por un problema de estabilizacion de primer orden, es decir,por el problema de mantener el escalar s en cero. Tal problema de estabilizacion sepuede resolver seleccionando la ley de control u de (5.1) de forma tal que fuera de lasuperficie S(t):

12

d

dts2 = s s ≤ −η|s| (5.6)

donde η es una constante positiva. Como se ilustra en la figura 5.1(a) para el cason = 2, todas las trayectorias de estado que satisfacen la condicion (5.6), la condicionde deslizamiento, hacen de la superficie S(t) un conjunto invariante en el sentido deLyapunov (ver Apendice A), implicando que las trayectorias del sistema fuera de S(t)apuntaran a tal superficie, y las trayectorias del sistema en S(t) permaneceran en ella.Tambien se puede establecer que dinamica no modelada, incertidumbre parametricao ciertos disturbios, seran tolerados por un sistema que satisfaga la condicion dadaen (5.6). S(t) es conocida como la superficie de deslizamiento porque satisface lacondicion de deslizamiento. El comportamiento del sistema sobre una superficie dedeslizamiento se denomina modo de deslizamiento.

0

0

dxdt

dxdt

x

x

(a)

(b)

(c)

.

.

x d

x d

S(t)

s = 0

s = 0

Fig. 5.1: (a) La superficie de deslizamiento S(t). (b) Convergencia exponencial. (c)Fenomeno del “chattering”.

Consideremos el caso de aquellos sistemas que satisfacen la condicion (5.6),pero no la condicion dada en (5.2), esto es, xd(0) 6= x(0). Para tales sistemas, lasuperficie de deslizamiento s(t) = 0 sera golpeada por alguna trayectoria del sistema


en un tiempo thit, el cual se puede computar como sigue. Asumiendo que s(t = 0) > 0e integrando (5.6) entre t = 0 y t = thit:

∫ thit

0s dt =

∫ s(t=thit)

s(t=0)ds ≤ −

∫ thit

0η dt (5.7)

nos conduce a thit ≤ s(t = 0)/η. Se puede obtener el mismo resultado si se arrancacon s(t = 0) < 0. Por consiguiente:

thit ≤ |s(t = 0)|/η (5.8)

La figure 5.1(b) ilustra el caso de una trayectoria de estado que evoluciona con unacondicion inicial arbitraria, y luego golpea a la superficie s(t) = 0 en un tiempo finitothit ≤ |s(t = 0)|/η. En el modo de deslizamiento, tal trayectoria “se desliza” a lolargo de S(t) con el objeto de alcanzar exponencialmente a xd con una constante detiempo igual a 1/λ. Por cierto, la expresion de (5.4) para n = 2:

s = (p + λ)x → x =1/λ

(1/λ)p + 1s

posee una constante de tiempo igual a 1/λ.La implementacion de sistemas de control deslizantes requiere de una ley de

control realimentada, la cual se puede obtener de (5.4) y (5.1) de modo tal que s2 enla ecuacion (5.6) se comporte muy parecido a una funcion de Lyapunov (ApendiceA) con el fin de garantizar estabilidad asintotica del sistema a lazo cerrado. Enmodo deslizante para el caso ideal, por ejemplo, cuando el modelo del sistema (5.1)representa exactamente al sistema actual, la ley de control disenada forzara a todaslas trayectorias de estado a deslizarse a lo largo de s = 0, tal como se observa en lafigura 5.1(b).

Sin embargo, debido a la presencia de imprecisiones en el modelado (incertidum-bres en los parametros y dinamica no modelada) y de disturbios, la ley de controlforzara a todas las trayectorias de estado a deslizarse discontinuamente a lo largode s = 0 tal como se muestra en la figura 5.1(c); es decir, la ley de control en mo-do deslizante necesita ser discontinua a traves de S(t), produciendo ası el fenomenoconocido como chattering. Desde que el chattering implica una muy elevada actividadde control, entonces, por consideraciones practicas, la fuerza de control u necesita sersuavizada adecuadamente (por ejemplo, mediante una accion de saturacion) a pesarde la perdida de precision en el seguimiento y en el ancho de banda.

Ejemplo 5.1

Para el sistema x = u definamos la superficie s(t) = x(t). Consideremos una ley decontrol de la forma:

u = x = −sgn(x) =

u+ = −1 if s(t) > 0u− = +1 if s(t) < 0

donde sgn(.) es la funcion signo definida como:

sgn(x) = +1 si x > 0

5.2 Control Deslizante para Sistemas Multivariables 81

sgn(x) = −1 si x < 0

La figura 5.2 muestra las trayectorias del sistema x(t) = −t y x(t) = t originadaspor la ley de control u+ y u− respectivamente. La superficie s(t) = x(t) = 0 es unasuperficie de deslizamiento porque satisface la condicion (5.6) para η ≤ 1. ♣

x

t

s = 0

Fig. 5.2: La superficie de deslizamiento s(t) = 0, por ejemplo 5.1.

5.2. Control Deslizante para Sistemas Multivariables

5.2.1. El Sistema a Controlar

Esta seccion sigue el procedimiento desarrollado en [28]. La representaciondinamica del sistema no lineal multivariable, el modelo de Lagrange, esta dado por:

M(q)q + P(q, q)q + d(q) = u (5.9)

donde q es un m × 1 vector de coordenadas generalizadas, M(q) es una matriz deinercia definida positiva de orden m×m, P(q, q) es una matriz de orden m×m querepresenta las fuerzas de Coriolis y centrıpeta, d(q) es un vector de orden m × 1que representa las fuerzas gravitacionales y u es un vector de orden m× 1 de fuerzasgeneralizadas. El vector de estado correspondiente a (5.9) posee la forma x = [q q]T .Sean qdi(t) y qdi(t) para i = 1, . . . , m las trayectorias deseadas, las cuales se suponenser funciones del tiempo continuamente diferenciables. Los vectores de error se definencomo:

q(t) = q− qd˙q(t) = q− qd

o lo que es lo mismo empleando sus componentes:

qi(t) = qi(t)− qdi(t) ˙qi(t) = qi(t)− qdi(t)

5.2.2. La Superficie de Conmutacion

Sea la siguiente superficie de conmutacion:

si(x, t) = si(q, q, t) = `iiqi(t) + ˙qi(t) i = 1, . . . , m (5.10)

o en forma matricial:s(x, t) = s(q, q, t) = Lq + ˙q = (5.11)


s1(x, t)...

sm(x, t)

=

s1(q, q, t)...

sm(q, q, t)

=

`11 · · · 0...

. . ....

0 · · · `mm

q1...

qm

+

˙q1...

˙qm

donde las constantes positivas `ii son los elementos de una matriz diagonal L deorden m × m. Asumiendo que una fuerza de control disenada es capaz de confinartodas las trayectorias que se originan en la interseccion de tales superficies y hacerlaspermanecer allı, entonces en tal situacion se cumple, de acuerdo a (5.10), que:

si(q, q, t) = 0 = `iiqi(t) + ˙qi(t) i = 1, . . . , m

Esta ultima relacion nos indica que qi(t) y ˙qi(t) deben converger exponencialmente acero, esto es:

qi(t) = qi(t)− qdi(t) = 0 ˙qi(t) = qi(t)− qdi(t) = 0

Por consiguiente: qi(t) = qdi(t) y qi(t) = qdi(t), con lo cual se logra el objetivo decontrol.

5.2.3. Diseno de la Fuerza de Control Multivariable

El diseno de la fuerza o ley de control requerida para confinar las trayectorias delsistema que se originan en la interseccion de las superficies de deslizamiento y hacerlaspermanecer allı emplea el metodo directo de Lyapunov. Omitiendo por simplicidadla dependencia de los argumentos, consideremos la siguiente candidata para funcionde Lyapunov:

V =12

sTMs

Definamos ahora la siguiente ley de control:

u = u0 −Usgn(s) (5.12)

u1...

um

=

12

u+1 − u−1

...u+

m − u−m

− 1

2

u+1 + u−1 · · · 0

.... . .

...0 · · · u+

m − u−m

sign(s1)...

sign(sm)

o en funcion de sus elementos:

u0j =12

(u+

j + u−j)

Uj =12

(u+

j − u−j)

La derivada de s (ecuacion (5.11)) produce:

s = L ˙q + ¨q = L ˙q + (q− qd)

Despejando q de (5.9) y reemplazando la expresion resultante en la ecuacion anteriorse obtiene:

s = M−1 (u0 −U sgn(s)− ueq)

donde:ueq = −ML¨q + Pq + d + Mqd

5.2 Control Deslizante para Sistemas Multivariables 83

Por consiguiente:

V = sTMs +12

sTMs = sT [u0 −Usgn(s)− ueq] +12sTMs (5.13)

En la referencia [27] se establece que:

P =12

[M− J

](5.14)

donde J es una matriz antisimetrica, es decir: J = −JT . Empleando (5.14) en (5.13)nos conduce a:

V = sT [u0 −Usgn(s) + Ps− ueq] +12sTJs

Dado que sTJs = 0 debido a que J es antisimetrica, entonces:

V = sT [u0 + Ps− ueq]− sTUsgn(s) =m∑

j=1

sj [u0 + Ps− ueq]j − Ui

m∑

j=1

|sj |

≤m∑

j=1

|sj [u0 + Ps− ueq]j | −m∑

j=1

Uj |sj | (5.15)

Seleccionando:Uj ≥ |[u0 + Ps− ueq]j |+ ε ε > 0 (5.16)

y reemplazando esta ultima expresion en (5.15) se obtiene:

V ≤ −εm∑

j=1

|sj | ε > 0

lo que significa que se ha cumplido la condicion de deslizamiento y a la vez se garantizaque q(t) y ˙q(t) convergen exponencialmente a cero.

Sean ueq y P los estimados de u y P respectivamente. Los controles u−j y u+j se

pueden seleccionar para satisfacer:

u+j = [ueq − Ps]j + u+

j

u−j = [ueq − Ps]j + u−j

i = 1, . . . , m (5.17)

Si seleccionamos:u−j = Kj u+

j = −Kj (5.18)

entonces de (5.17) obtenemos:

u0j =12(u+

j + u−j ) = [ueq − Ps]j Uj = Kj

o lo que es lo mismo, en forma matricial:

u0 =12

u+1 + u−1

...u+

m + u−m

= ueq − Ps

U =12

u+1 − u−1 · · · 0

.... . .

...0 · · · u+

m − u−m

=

K1 · · · 0...

. . ....

0 · · · Km

(5.19)


Asumiendo que el termino gravitacional se puede expresar como:

d = ueq − Ps (5.20)

entonces la ley de control dada por (5.12) toma la forma:

u = u0 −Usign(s) = d−

K1 · · · 0...

. . ....

0 · · · Km

sgn(s) (5.21)

y la relacion (5.16) con Uj = Kj se expresa como:

Kj ≥ |[ueq −Ps− d]i|+ η

Ahora, dado que ueq = −ML˙q + Pq + d + Mqd−, entonces las ganancias Kj sepueden seleccionar siempre que:

Kj ≥ |(−MP¨q + P q + Mqd −Ps)j |+ η (5.22)

en donde M and P son las cotas superiores de M y P respectivamente.


El procedimiento de diseno de un sistema de control con modos deslizante,como el desarrollado en la seccion 5.2, comprende los pasos siguientes.

(1) Formular el problema: describir el sistema a controlar, definir las especifica-ciones de diseno y determinar el modelo no lineal del sistema en la forma dadaen (5.9).

(2) Determinar la ley de control con modos deslizantes dada en (5.21). Para ello serequiere primero determinar las cotas superiores de M y P. Luego, formular elobservador para determinar el vector ˙q:

˙q = qdLd(q− q)

donde Ld = `I es una matriz diagonal siendo ` una constante positiva. El vectorestimado q se calcula integrando ˙q, mientras que ¨q se determina del modelodinamico de Lagrange:

¨q = M−1(q)[u−P(q, ˙q)− d(q)]

El vector de deslizamiento s se calcula como sigue:

q = q− qd˙q = ˙q− qd

¨q = ¨q− qd

s = Λq + ˙q

siendo Λ = λI una matriz diagonal, donde λ es una constante positiva. Lasconstantes Kj (j = 1, . . . , m) se calculan de (5.22):

Kj ≥ |(−MP¨q + P q + Mqd −Ps)j |+ η (5.23)

5.4 Aplicaciones 85

donde M and P son las cotas superiores de M y P respectivamente y η unaconstante positiva. Para suavizar la accion de control introducimos las funcionde saturacion satj , j = 1, . . . ,m:

u

u

sΦΦ

if (sj/Φ > 1)satj = 1

elseif(sj/Φ < 1)satj = −1

elsesatj = sj/Φ

end

Finalmente, la ley de control se calcula de:

u = d−

K1 · · · 0. . .

0 · · · Km

sat1...

satm

(5.24)

(3) Simular el sistema de control con modos deslizantes empleando los parametrosde sintonizacion: Λ, η, Ld y Φ.

(4) Implementar el sistema de control optimo (hardware).

(5) Desarrollar el software de control en tiempo real del sistema.

(6) Ejecutar pruebas de funcionamiento en tiempo real.

5.4. Aplicaciones

5.4.1. Control Deslizante del Manipulador Esferico

El modelo dinamico de Lagrange del MRE se describe en la subseccion 2.2.2,ecuacion (2.121). La determinacion de la ley de control requiere la formulacion de lascotas superiores de M, P:

M11 =Ra

nKmKA

(J1 + Jeq +

14m2L

22

)

M12 = M21 = 0

M22 =Ra

nKmKA

(J2 +

14Jeq + m2L

22

)

P 11 =Ra

nKmKA

(Beq +

n2KmKb

Ra

)= P 22

P 12 =Ram2L

22

2nKmKA

P 21 =Ram2L22

4nKmKA


Por consiguiente:

M(q) =[ Ra

nKmKA

(J1 + Jeq + 1

4m2L22 sin q2

2

)0

0 M22

]

P(q, q) =[

P 11 P 12q1 sin q2 cos q2

P 21q1 sin q2 cos q2 P 22

]

d(q) =[

0Ram2L2g2nKmKA

sin q2

]

Las senales de referencia deseada qd para propositos de simulacion se formulan parael caso de seguimiento como:

qd1 = A sinWk + Bk

qd2 = A cosWk + Bk (5.25)

donde A y B son constantes, k = t/T es el tiempo discreto y T es el tiempo demuestreo. Para el caso de regulacion, qd es del tipo escalon. Los parametros de sin-tonizacion K1 y K2 se determinan de (5.23) con:

M =[

M11 00 M22

]P =

[P 11 P 12

P 21 P 22

]

Luego, la ley de control se calcula de (5.24).Las Figs. 5.3 y 5.4 muestran el resultado de la simulacion del sistema de control

deslizante disenado para controlar las posiciones angulares de la base y del brazo delMRE para los casos de seguimiento y regulacion respectivamente. Para obtener talesresultados, ejecutar los programas flmres.m y flmrer.m, cuyos listados se encuentranen el CD adjunto. Notar que las especificaciones de diseno porcentaje de sobreimpulsonulo, error en estado estacionario nulo y tiempo de estabilizacion menor de 1 s secumplen satisfactoriamente para ambos casos. Los parametros de sintonizacion paralos dos casos se fijaron en: λ = 7, η = 2, `d = 30 y Φ = 0,4.

5.4.2. Control Deslizante del Manipulador Traslacional

El modelo de Lagrange del MRT se describe en la subseccion 2.2.1, ecuacion(2.90).

Las cotas superiores de M, P y d, necesarias para determinar la ley de control,se definen como:

M11 =Rarp

nKmKA

(mc + mb +

Jeq

r2p

)

M12 =RarpmbLb

2nKmKA;

M21 =RambLb

2nKmKA;

M22 =Ra

nKmKA

(14mbL

2b + Jb + Jeq

)

5.4 Aplicaciones 87

0 1 2 3 4 5 6 7 80

2

4

PO

SIC

IÓN

q1

[rad

]

0 1 2 3 4 5 6 7 80

0.5

1

TIEMPO [s]

CO

NT

RO

L u1

[V]

0 1 2 3 4 5 6 7 80

5

PO

SIC

IÓN

q2

[rad

]

0 1 2 3 4 5 6 7 8−10

0

10

TIEMPO [s]

CO

NT

RO

L u1

[V]


0 1 2 3 4 5 6 7 80

0.2

0.4

PO

SIC

IÓN

q1

[rad

]

0 1 2 3 4 5 6 7 8−5

0

5

TIEMPO [s]

CO

NT

RO

L u1

[V]

0 1 2 3 4 5 6 7 80

0.2

0.4

PO

SIC

IÓN

q2

[rad

]

0 1 2 3 4 5 6 7 8−10

0

10

TIEMPO [s]

CO

NT

RO

L u1

[V]


P 11 =Rarp

nKmKA

(Ff +

Beq

r2p

+n2KmKb

Rar2p

)


P 12 = −RarpmbLb

2nKmKA

P 21 = 0

P 22 =Ra

nKmKA

(Beq +

n2KmKb

Ra

)

Por consiguiente:

M(q) =[

M11 M12 cos q2

M21 cos q2 M22

]

P(q, q) =[

P 11 P 12q2 sin q2

0 P 22

]d(q) =

[0

−RambLbg2nKmKA

sin q2

]

Las senales deseadas para propositos de simulacion son las mismas que las dadas en5.25. Los parametros de sintonizacion K1 y K2 se determinan de (5.23) con:

M =[

M11 M12

M21 M22

]P =

[P 11 P 12

0 P 22

]

Finalmente, la ley de control se calcula de (5.24).Las Figs. 5.5 y 5.6 muestran los resultados de las simulaciones del sistema

de control deslizante disenados para controlar las posiciones angulares de los brazosdel MRT para los casos de seguimiento y regulacion respectivamente. Para obtenertales resultados, ejecutar los programas scmrts.m y scmrtr.m respectivamente (versus listados en el CD adjunto). Notar que las especificaciones de diseno porcentaje desobreimpulso nulo, error en estado estacionario nulo y tiempo de estabilizacion menorde 1 s se cumplen satisfactoriamente en ambos casos. Los parametros de sintonizacionpara los dos csos se fijaron en: Λ = 5, η = 8, Ld = 50 y Φ = 0.1.

5.4.3. Control Deslizante del Sistema Tanque con Agua

El modelo de Lagrange del MRE se describe en la subseccion 2.1.3, ecuacion(2.61).

Las cotas superiores de P se definen como:

P 11 = A)P 12 = 0P 21 = −CpρθiA;P 22 = AρCp

P(q, q) =[

P 11 0P 11 P 22q1

]

d(q) =[

a√

q1

aρCpq2√

q1 + q2−θa

Rt− θiρCpa

√q1

]

Las senales deseadas para propositos de simulacion son del tipo escalon. Las funcionesde deslizamiento se calcularon separadamente para mejorar el rendimiento del sistemacontrolado:

s1 = λ1q1 + ˙q1 s2 = λ2q2 + ˙q2

5.4 Aplicaciones 89

0 2 4 6 8 10 12 14 16−10

0

10

PO

SIC

IÓN

q1

[rad

]

0 2 4 6 8 10 12 14 160

10

20

TIEMPO [s]

CO

NT

RO

L u1

[V]

0 2 4 6 8 10 12 14 160

5

10

PO

SIC

IÓN

q2

[rad

]

0 2 4 6 8 10 12 14 16−20

0

20

TIEMPO [s]

CO

NT

RO

L u1

[V]

Fig. 5.5: Posiciones angulares controladas de los brazos del MRT. Caso: seguimiento.

0 2 4 6 8 10 12 14 160

0.2

0.4

PO

SIC

IÓN

q1

[rad

]

0 2 4 6 8 10 12 14 16−20

0

20

TIEMPO [s]

CO

NT

RO

L u1

[V]

0 2 4 6 8 10 12 14 16−0.5

0

0.5

PO

SIC

IÓN

q2

[rad

]

0 2 4 6 8 10 12 14 16−10

0

10

TIEMPO [s]

CO

NT

RO

L u1

[V]

Fig. 5.6: Posiciones angulares controladas de los brazos del MRT. Caso: regulacion.

Los parametros de sintonizacion K1 y K2 se determinan de (5.23) con:

P =[

P 11 0P 21 P 22

]


Luego, la ley de control se calcula de (5.24) sin considerar M.La Fig. 5.7 muestra el resultado de la simulacion del sistema de control deslizante

para el caso regulacion: senales deseadas constantes. Para obtener tal resultado, eje-cutar el programa sctanquer.m (ver su listado completo en el CD adjunto). Observarque las especificaciones de diseno porcentaje de sobreimpulso nulo, error en estadoestacionario nulo y tiempo de estabilizacion menor de 1 s tambien se cumplen satis-factoriamente. Los parametros de sintonizacion son: Λ1 = 0.08, Λ2 = 0.014, η = 0.1,Ld = 0.1 y Φ = 0.8.

0 1000 2000 3000 4000 5000 6000 7000 80000.1

0.15

NIV

EL

h [m

]

0 1000 2000 3000 4000 5000 6000 7000 80005

10

15

TIEMPO [s]

FLU

JO u

1 [V

]

0 1000 2000 3000 4000 5000 6000 7000 80000

50

TE

MP

q2

[K]

0 1000 2000 3000 4000 5000 6000 7000 8000−50

0

50

TIEMPO [s]

CA

LOR

u2

[V]

Fig. 5.7: Nivel y temperatura controladas del sistema tanque con agua.

5.4.4. Control Deslizante del Manipulador MR1

El modelo de Lagrange del MR1 se describe en la subseccion 2.1.1, ecuacion(2.23).

Las cotas superiores de M y P se definen como:

M =JeqRa

nKmKA+

nKb

KA

P =BeqRa

nKmKA

Por consiguiente:M = M P = P

Las senales deseadas para propositos de simulacion son las mismas que las dadas en5.25, pero para el caso escalar. El parametro de sintonizacion en linea K se determina

5.5 Problemas 91

de (5.23) para j = 1, con M y P definidos anteriormente. Luego, la ley de control secalcula de (5.24):

u = d−Ksat

donde d = RaQ sin qnKmKA

.Las Figs. 5.8 y 5.9 muestran el resultado de la simulacion del sistema de con-

trol deslizante disenado para controlar la posicion angular del brazo del MR1 paralos casos de seguimiento y regulacion respectivamente. Para obtener tales resultados,ejecutar los programas scmr1s.m y scmr1r.m (ver su listado en el CD adjunto). Notarque las especificaciones de diseno porcentaje de sobreimpulso nulo, error en estadoestacionario nulo y tiempo de estabilizacion menor de 1 s se cumplen satisfactoria-mente. Los parametros de sintonizacion para ambos casos se seleccionaron: Λ = 9,eta = 10, Ld = 50 y Phi = 0.6. El modelo dinamico del MRT para propositos desimulacion se da en la ecuacion (??).

0 2 4 6 8 10 12 14 160

2

4

6

8

10

POSI

CIÓN

q [r

ad]

0 2 4 6 8 10 12 14 16−1

0

1

2

3

4

TIEMPO [S]

CONT

ROL

u

Fig. 5.8: Posicion angular controlada del brazo del MR1. Caso: seguimiento.

5.5. Problemas


Disenar un sistema de control de posicion por modos deslizantes para el sistema deplataformas mostrado en la Fig. 2.11 y descrito en el problema 2.4.


En el problema 2.5 se describe la columna de destilacion para fraccionar petroleopesado, mostrado en La Fig. 2.12. Disenar un sistema de control por modos deslizantespara este sistema.



0 1 2 3 4 5 6 7 80

0.1

0.2

0.3

0.4

POSI

CIÓN

q [r

ad]

0 1 2 3 4 5 6 7 8−20

−15

−10

−5

0

5

10

15

TIEMPO [S]

CONT

ROL

u

Fig. 5.9: Posicion angular controlada del brazo del MR1. Caso: regulacion.

Disenar un sistema de control por modos deslizantes para el reactor quımico conchaqueta de enfriamiento mostrado en la Fig. 2.13 y descrito en el problema 2.6.


En el problema 2.7 se describe un motor DC en el cual el voltaje de armadurase mantiene constante mientras que el voltaje de campo es variable (ver Fig. 2.14.Disenar un sistema de control por modos deslizantes para este motor.


La Fig. 2.15 (problema ) muestra un manipulador polar vertical. Disenar un sistemade control por modos deslizantes para este manipulador.


La Fig. 2.16 (problema ) muestra un manipulador polar horizontal. Disenar un sis-tema de control por modos deslizantes para este manipulador.


Disenar un sistema de control por modos deslizantes para el manipulador roboticotraslacional–esferico mostrado en la Fig. 2.17 y descrito en el problema 2.10.


Disenar un sistema de control por modos deslizantes para el manipulador roboticoesferico mostrado en la Fig. 2.17 y descrito en el problema 2.11.


La dinamica del motor sıncrono de iman permanente se describe en el problema 2.12.Disenar un sistema de control por modos deslizantes del torque para este motor.

Capıtulo 6

Control Backstepping

Este capıtulo describe la la metodologıa para disenar sistemas de control backstep-ping para una cierta clase de sistemas multivariables no lineales. Tal metodologıa, basadaen el metodo directo de Lyapunov, comprende varios pasos en concordancia con el ordendel sistema. En cada paso es necesario introducir un estado virtual y una fuerza de controlvirtual que permitan reescribir la ecuacion de estado actual del sistema a controlar enterminos de estos. La seleccion adecuada de una funcion de Lyapunov, va a permitir de-terminar un control virtual, que aplicado al sistema a controlar, permita la estabilizaciondel mismo.

Con el proposito de validar el procedimiento de diseno propuesto, se presentanvarios sistemas de control backstepping operando en tiempo real para los procesos:(1) Manipulador robotico de 1GDL.(2) Manipulador robotico esferico.(3) Manipulador esferico traslacional.(4) Sistema Tanque con Agua.

6.1. Introduccion

El metodo directo de Lyapunov se emplea extensivamente para el analisis ysıntesis de sistemas. Los sistemas de control adaptativo con modelo referencial y conmodos deslizantes descritos en los capıtulos 4 y 5 respectivamente, fueron sintetizadosempleando dicho metodo.

El metodo directo de Lyapunov, descrito en el Apendice A, emplea una funcionde Lyapunov (FL) que contiene cierta informacion de la dinamica del sistema. Sila derivada en el tiempo de la FL seleccionada es negativa, entonces se dice en elsentido de Lyapunov que el sistema en estudio es estable, tal como se puede ver enel siguiente ejemplo.

Ejemplo 6.1

Determinar una FL para el sistema escalar:

x = − cosx− x3 + u

donde x es la variable de estado y u es la senal de control.

94 Control Backstepping

Solucion.- Es claro que una fuerza de control de la forma u = cosx + x3 − kx,donde k es una constante, convierte tal sistema a su forma lineal x = −kx, y por lotanto, lo puede estabilizar. Si tomamos V (x) = x2/2 como una FL para el sistema,vemos que:

1. V (x) es definida positiva.

2. dVdt = xdx

dt = −kx2 es definida negativa.

Por consiguiente, el sistema es globalmente asintoticamente estable en el sentido deLyapunov. Observar que el termino x3 en la ley de control u = cosx+x3−kx, puedehacerla crecer significativamente.

Si seleccionamos en cambio como ley de control u = α(x) = − cosx − kx yla misma FL V = x2/2, obtenemos V = xx = −x4 − kx2 ≤ −x4. Este resultado esventajoso porque demuestra que la magnitud de la fuerza de control u se incrementalinealmente con x en lugar de hacerlo con x3 y que la FL V decrece mas rapido cuantomas grande sea x. ♣

La Formula de Sontag

La formula de Sontag [13] nos permite determinar una adecuada ley de controlu = αs(x) para sistemas dinamicos descritos como:

x = f(x) + g(x)αs

Tal formula supone que existe una FL V (x) para dicho sistema. Entonces, una leyde control αs(x) capaz de estabilizar tal sistema se formula como:

αs(x) =

−

∂V∂x

f+q

( ∂V∂x

f)2+( ∂V

∂xg)4

( ∂V∂x

g) , ∂V∂x g 6= 0;

0, ∂V∂x g = 0.

(6.1)

La ley de control de Sontag permite generar una ley de control de magnitud apropiada(no grandes magnitudes) y rapida convergencia al estado estacionario a pesar de lapresencia de grandes valores iniciales de x, tal como se demuestra en el siguienteejemplo.

Ejemplo 6.2

Determinar una FL para el sistema escalar:

x = − cosx− x3 + u

Solucion.- Asumamos la ley de control u = cosx−αs(x), donde αs(x) se determinausando la formula de Sontag con f(x) = −x3, g(x) = −1 y V (x) = x2/2. Luego:

∂V

∂xg = −x

∂V

∂xf = −x4 αs(x) = x3−x

√x4 + 1 u(x) = − cosx−x3−x

√x4 + 1

Podemos observar que para grandes valores de x, αs(x) tiende a cero, mientras quepara pequenos valores de x, αs(x) tiende a x. Por consiguiente, la magnitud de uusando la formula de Sontag resulta menor que en los casos anteriores. ♣

6.1 Introduccion 95

El Control Backstepping

La tecnica de control backstepping comprende varios pasos, de acuerdo al ordendel sistema. Cada paso se puede descomponer en las partes siguientes:

(1) Introducir un estado virtual y una fuerza de control virtual, y reescribir laecuacion de estado actual en terminos de estos.

(2) Seleccionar una FL para el sistema.

(3) Buscar una ecuacion para el control virtual que haga que la FL sea una del tipoestabilizable, es decir, que su aplicacion en el sistema permita determinar lascondiciones para estabilizar al sistema, sujeto a las restricciones del caso.

En los pasos subsiguientes, se aumenta la FL para reflejar la presencia de nuevosestados virtuales. En el ejemplo siguiente se aplica el metodo descrito.

Ejemplo 6.3

Disenar un controlador backstepping para el sistema:

x1 = −x31 + x2 (6.2)

x2 = x22 + u (6.3)

Solucion.- Apliquemos los pasos descritos anteriormente.

(1) Para la ecuacion (6.2) definamos una fuerza de control virtual α, y una estadovirtual z = x2 − α. Por consiguiente:

x1 = −x31 + z + α

Definamos ahora una FL candidata: V = x21/2. Entonces:

V = x1x1 = x1(−x31 + z + α) = x1(−x3

1 + α) + zx1

En este punto se puede usar la formula de Sontag para calcular α con el finde estabilizar al sistema propuesto. Por simplicidad usaremos: α = −k1x1 parak1 ≥ 0. Por lo tanto:

α = −k1x1 = −k1(−x31 + x2)

z = x2 − α = x2 + u + k1(−x31 + x2)

(2) Seleccionemos ahora una FL para el sistema. En este caso, una apropiada se-leccion resulta la siguiente FL aumentada: Va = V + z2/2. Por consiguiente:

Va = V + zz = −x41 − kx2

1 + z(u + x1 + x22 + k1(−x3

1) + x2)

(3) Seleccionemos una apropiada ley de control u que pueda estabilizar al sistemade segundo orden. Una posible seleccion, de las muchas que pueden existir,puede ser:

u = −k2z−(x1+x22+k1(−x3

1+x2)) = −k2(x2+k1x1)−(x1+x22+k1(−x3

1+x2))

La Fig. 6.1, obtenida ejecutando el programa bscej33.m, muestra las respuestasx1 y x2 del sistema estabilizado para x1(0) = 1.5, x2(0) = 0.8, k1 = 1.5 y k2 =2. ♣


En la siguiente seccion se desarrolla un sistema de control backstepping apropiadopara controla una gran clase de sistemas representados mediante un modelo dinamicode lagrange.

0 1 2 3 4 5 6−0.5

0

0.5

1

1.5

SA

LID

A

x1

0 1 2 3 4 5 6−1

−0.5

0

0.5

1

SA

LID

A

x2

0 1 2 3 4 5 6−6

−4

−2

0

2

TIEMPO [s]

CO

NT

RO

L u

Fig. 6.1: Respuesta x del sistema x1 = −x31 + x2, x2 = x2

2 + u a una senal de controlbackstepping.

6.2. Caracterısticas del Modelo

El modelo dinamico de una gran clase sistemas no lineales multivariables sepuede representar mediante la siguiente ecuacion matricial [25], [3]:

M(q)q + P(q, q)q + d(q) = u (6.4)

donde el vector q de orden n es el vector de estado, M de dimension n × n es unamatriz definida positiva que por construccion depende de q, P de dimension n×n esotra matriz que depende de los vectores q y q, d de orden n es un vector que dependede q por construccion, y u de orden n es el vector de entrada de control. Para el casode los manipuladores roboticos, q es el vector posicion, M es la matriz de inercia, Pes la matriz de Coriolis–centripetal y d es el vector de gravedad.

De (6.4), la ecuacion para q resulta:

q = M−1(q)[u−P(q, q)q− d(q)] (6.5)

Asumiremos que solo se dispone de la medicion del vector q.

6.3 Diseno Backstepping No Lineal 97

6.3. Diseno Backstepping No Lineal

El diseno backstepping descrito a continuacion ha sido desarrollado [37]. Defi-namos el error de seguimiento e de la posicion angular de un brazo robotico como:

e = q− qd (6.6)

donde qd es la trayectoria deseada de la posicion angular. El objetivo de control con-siste en resolver el problema de seguimiento de la trayectoria usando solo medicionesde la posicion. Definamos z1 = e como la variable regulada dentro del procedimientode diseno backstepping. Computando la derivada de z1 se obtiene:

z1 = e = q− qd = eν (6.7)

Usemos ahora eν como la variable virtual de control. Seleccionemos la siguiente fun-cion de estabilizacion:

α1 = −Kz1 (6.8)

donde K es una matriz diagonal de la forma K = kI, donde k es una constantepositiva e I es la matriz identidad. El correspondiente error de la variable de estadose define como:

z2 = eν − α1 = q− qd + Kz1 = q− qr (6.9)

donde qr se define como:qr = qd −Kz1 (6.10)

Entonces, ecuacion (6.7) se puede reescribir como:

z1 = z2 + α1 = −Kz1 + z2 (6.11)

Tambien, la derivada de la variable de error z2 toma la forma:

z2 = q− qd + Kz1 (6.12)

Empleando las ecuaciones (6.5) y (6.11), la ecuacion (6.12) se puede formular como:

z2 = M−1(q)[u−P(q, q)q− d(q)]− qd + Kz2 −K2 z1 (6.13)

Empleando el analisis de estabilidad de Lyapunov descrito en el Apendice A, en lareferencia [37] se demuestra que la siguiente entrada de control es capaz de estabilizaral sistema:

u = M(q)q + P(q, ˙q)qr + d(q)−Kd( ˙q− qr)−K1 z1 (6.14)

donde el estimado de la velocidad angular ˙q toma la forma:

˙q = qd + Ld(q− q) (6.15)

Las ganancias de control Kd, K1 y Ld son matrices diagonales definidas positivascon Kd = kdI, K1 = k1I y Ld = `dI, donde kd, k1 y `d son constantes positivas.


6.4. Procedimiento de Diseno Backstepping

El procedimiento de diseno de un sistema de control backstepping, como eldesarrollado en la seccion 6.3, comprende los pasos siguientes:

(1) Formular el problema: describir el sistema a controlar, definir las especifica-ciones de diseno determinar el modelo no lineal del sistema en la forma dadaen (6.4).

(2) Determinar la ley de control backstepping dada en (6.14). Para ello se requieredefinir el vector de referencias deseadas qd. Luego, formular el vector de errore y el vector qr:

e = z1 = q− qd qr = qd −Kz1

En la ultima relacion, K = kI es una matriz diagonal donde k es una constantepositiva e I es la matriz identidad. El observador se expresa como:

˙q = qdLd(q− q)

En esta expresion, Ld = `I es una matriz diagonal donde ` es una constantepositiva. El vector q se puede calcular integrando ˙q. Con los datos anterioresse puede formular la ley de control backstepping:

u = M(q)q + P(q, ˙q)qr + d(q)−Kd( ˙q− qr)−K1 z1

En dicha ley de control, Kd = kdI y K1 = k1I son matrices diagonales dondekd y k1 son constantes positivas.

(3) Simular el sistema de control con modos deslizantes empleando los parametrosde sintonizacion kd, k1 y `d.

(4) Implementar el sistema de control optimo (hardware).(5) Desarrollar el software de control en tiempo real del sistema.(6) Ejecutar pruebas de funcionamiento en tiempo real.

6.5. Aplicaciones

6.5.1. Control Backstepping del Manipulador Esferico

El modelo dinamico de Lagrange del MRE se describe en la subseccion 2.2.2,ecuacion (2.121). Las senales de referencias deseadas qd para propositos de simulacionse formulan para el caso de seguimiento como:

qd1 = A sinWk + Bk

qd2 = A cosWk + Bk

donde A, W y B son constantes, k = t/T es el tiempo discreto y T es el tiempo demuestreo. Para el caso de regulacion, qd es del tipo escalon. La ley de control dadaen (6.14) toma la forma:


6.5 Aplicaciones 99

donde:

M(q) =

[Ra

nKmKA

(J1 + Jeq + 1

4m2L22 sin2 q2

)0

0 RanKmKA

(J2 + Jeq + 1

4m2L22

))

]

P(q, ˙q) =

RanKmKA

(Beq + n2KmKb

Ra

)Ram2L2

2 bq1 sin q2 cos q2

2nKmKA

Ram2L22 bq1 sin q2 cos q2

4nKmKA

RanKmKA

(Beq + n2KmKb

Ra

)

d(q) =[

0Ram2L2g sin q2

2nKmKA

]

Las Figs. 6.2 y 6.3 muestran los resultados de las simulaciones del sistema decontrol backstepping disenado para controlar la posicion angular de los dos brazosdel MRE para los casos de seguimiento y regulacion respectivamente. Tales Figs. seobtiene ejecutando los programa bscmres.m (caso seguimiento) y bscmrer.m (casoseguimiento). Sus listados se encuentran en el CD adjunto. Notar que en ambos casoslas especificaciones de diseno: porcentaje de sobreimpulso nulo, error en estado esta-cionario nulo y tiempo de estabilizacion menor de 1 s se cumplen satisfactoriamente.Los parametros de sintonizacion se seleccionaron: k = 10, k1 = 20, ld = 20 y kd =5 para regulacion, y k = 8; k1 = 8, ld = 30 y kd = 10 para seguimiento. El modelodinamico del MRE para propositos de simulacion toma la forma:

q = M−1[u−Pq− d]

6.5.2. Control Backstepping del Manipulador Traslacional

El modelo de Lagrange del MRT se describe en la subseccion 2.2.1, ecuacion(2.90). Las senales de referencias deseadas contenidas en qd para propositos de sim-ulacion son las mismas que para el caso del sistema MRE:

qd1 = A sinWk + Bk

qd2 = A cosWk + Bk

donde A, W y B son constantes, k = t/T es el tiempo discreto y T es el tiempo demuestreo. Para el caso de regulacion, qd es del tipo escalon. La ley de control dadaen (6.14) toma la forma:


donde Kd = kdI y K1 = k1I son matrices diagonales y:

M(q) =

Rarp

nKmKA

(mc + mb + Jeq

r2p

)RarpmbLb

2nKAKmcos q2

RambLb2nKmKA

cos q2Ra

nKAKm

(mbL

2b

4 + Jb + Jeq

)

P(q, ˙q) =

Rarp

nKmKA

(Fc + Beq

r2p

+ n2KmKbRar2

p

)−RarpmbLb

2nKAKmq2 sin q2

RanKAKm

(Beq + n2KmKb

Ra

)−RambLbg

2nKAKmsin q2


0 1 2 3 4 5 6 7 80

2

4

PO

SIC

IÓN

q1

[rad

]

0 1 2 3 4 5 6 7 8−2

0

2

TIEMPO [S]

CO

NT

RO

L u1

[v]

0 1 2 3 4 5 6 7 80

5

PO

SIC

IÓN

q2

[rad

]

0 1 2 3 4 5 6 7 8−50

0

50

TIEMPO [S]

CO

NT

RO

L u2

[v]

Fig. 6.2: Control backstepping de la posicion angular de los brazos del MRE. Casoseguimiento.

d(q) =[

0−RambLbg

2nKAKmsin q2

]

Las Figs. 6.4 y 6.5 muestran los resultados de las simulaciones del sistema decontrol backstepping disenado para controlar la posicion angular de los dos brazosdel MRT para los casos de seguimiento y regulacion respectivamente. Tales Figs.se obtiene ejecutando los programa bscmrts.m (caso seguimiento) y bscmrtr.m (casoseguimiento). Sus listados se encuentran en el CD adjunto. En ambos casos las especi-ficaciones de diseno: porcentaje de sobreimpulso nulo, error en estado estacionarionulo y tiempo de estabilizacion menor de 1 s se cumplen satisfactoriamente. Losparametros de sintonizacion se seleccionaron: k = 4, k1 = 5, ld = 10 y kd = 8 pararegulacion, y k = 4; k1 = 5, ld = 15 y kd = 20 para seguimiento. El modelo dinamicodel MRE para propositos de simulacion toma la forma:

q = M−1[u−Pq− d] (6.16)

6.5.3. Control Backstepping del Sistema Tanque con Agua

El modelo de Lagrange del MRE se describe en la subseccion 2.1.3, ecuacion(2.61). Las senales deseadas qd para propositos de simulacion son del tipo escalon.La ley de control dada en (6.14) toma la forma:


6.5 Aplicaciones 101

0 1 2 3 4 5 6 7 80

0.5

1

PO

SIC

IÓN

q1

[rad

]

0 1 2 3 4 5 6 7 8−50

0

50

TIEMPO [S]

CO

NT

RO

L u1

[v]

0 1 2 3 4 5 6 7 80

0.5

1

PO

SIC

IÓN

q2

[rad

]

0 1 2 3 4 5 6 7 8−50

0

50

TIEMPO [S]

CO

NT

RO

L u2

[v]

Fig. 6.3: Control backstepping de la posicion angular de los brazos del MRE. Casoregulacion.

donde Kd = kdI y K1 = k1I son matrices diagonales y:

P(q, ˙q) =[

A 0−AρCpθi AρCpq1

]

d(q) =[

a√

q1

Cpρaq2√

q1 − Cpρa√

q1θi + q2−θa

Rt

]

La Fig. 6.6 muestra el resultado de la simulacion del sistema de control back-stepping disenado para controlar el nivel y la temperatura en el tanque con agua. Paraobtener dicho resultado, ejecutar el programa bsctanquer.m (ver su listado completoen el CD adjunto). Notar que las especificaciones de diseno porcentaje de sobreim-pulso nulo, error en estado estacionario nulo y tiempo de estabilizacion menor de 300s se cumplen satisfactoriamente. Los parametros de sintonizacion se seleccionaron: k= 0.1, k1 = 0.1, ld = 0.02 y kd = 0.002. El modelo dinamico del sistema tanque conagua para simulacion toma la forma:

q = P−1[u− d]

6.5.4. Control Backstepping del Manipulador MR1

El modelo de Lagrange del MR1 se describe en la subseccion 2.1.1, ecuacion(2.23). Para propositos de simulacion, la senal de referencia deseada qd para el caso


0 2 4 6 8 10 12 14 160

5

10

PO

SIC

IÓN

q1

[rad

]

0 2 4 6 8 10 12 14 16−5

0

5

TIEMPO [S]

CO

NT

RO

L u1

[v]

0 2 4 6 8 10 12 14 160

5

10

PO

SIC

IÓN

q2

[rad

]

0 2 4 6 8 10 12 14 16−20

0

20

TIEMPO [S]

CO

NT

RO

L u2

[v]

Fig. 6.4: Control backstepping de la posicion angular de la base y del brazo del MRT.Caso seguimiento.

de seguimiento se formula como:

qd = A sinWk + Bk

donde A y B son constantes, k = t/T es el tiempo discreto y T es el tiempo demuestreo. Para el caso de regulacion, qd es del tipo escalon. El error de seguimientoe = z1 y la variable qr se definen como:

e = q − qd = z1 qr = qd −Kz1

donde q = θ es las posicion angular medida y K es una constante positiva. El obser-vador se expresa como:

˙q = qdLd(q − q) (6.17)

donde Ld es una constante positiva. y q se puede calcular integrando ˙q. La ley decontrol dada en (6.14) toma la forma:

u = M(q)q1 + P (q, ˙q)qr + d(q)−Kd( ˙q − qr)−K1 z1

donde Kd y K1 son constantes positivas y:

M(q) =(

JeqRa

nKmKA+

nKb

KA

)P (q, ˙q) =

BeqRa

nKmKAd(q) =

RaQ sin q

nKmKA

Las Figs. 6.8 y 6.7 muestran los resultados de las simulaciones del sistema decontrol backstepping disenado para controlar la posicion angular del brazo del MRE

6.6 Problemas 103

0 2 4 6 8 10 12 14 160

0.2

0.4

PO

SIC

IÓN

q1

[rad

]

0 2 4 6 8 10 12 14 16−50

0

50

TIEMPO [S]

CO

NT

RO

L u1

[v]

0 2 4 6 8 10 12 14 16−0.5

0

0.5

PO

SIC

IÓN

q2

[rad

]

0 2 4 6 8 10 12 14 16−50

0

50

TIEMPO [S]

CO

NT

RO

L u2

[v]

Fig. 6.5: Posicion controlada del carro del MRT.

para los casos de seguimiento y regulacion respectivamente. Tales Figs. se obtiene eje-cutando los programa bscmr1s.m (caso seguimiento) y bscmr1r.m (caso seguimiento).Sus listados se encuentran en el CD adjunto. Notar que en ambos casos las especifica-ciones de diseno: porcentaje de sobreimpulso nulo, error en estado estacionario nulo ytiempo de estabilizacion menor de 1 s se cumplen satisfactoriamente. Los parametrosde sintonizacion se seleccionaron: k = 8, k1 = 8, ld = 30 y kd = 10 para regulaciony seguimiento. El modelo dinamico del MR1 para propositos de simulacion toma laforma:

q = M−1[u− P q − d]

6.6. Problemas


Disenar un sistema de control backstepping por modos deslizantes para el sistema deplataformas mostrado en la Fig. 2.11 y descrito en el problema 2.4.


En el problema 2.5 se describe la columna de destilacion para fraccionar petroleopesado, mostrado en La Fig. 2.12. Disenar un sistema de control backstepping paraeste sistema.


0 100 200 300 400 500 600 700 800 900 10000.1199

0.12

NIV

EL

h [m

]

0 100 200 300 400 500 600 700 800 900 10008

8.5

9

TIEMPO [s]

FLU

JO u

h [V

]

0 100 200 300 400 500 600 700 800 900 100028.4

28.5

28.6

TE

MP

thet

ao [C

]

0 100 200 300 400 500 600 700 800 900 10000.32

0.34

0.36

TIEMPO [s]

CA

LOR

uP

hi [V

]

Fig. 6.6: Nivel y temperatura controladas en el sistema tanque con agua.

0 1 2 3 4 5 6 7 80

0.1

0.2

0.3

0.4

POSI

CIÓN

q

[ra

d]

0 1 2 3 4 5 6 7 8−30

−20

−10

0

10

20

30

TIEMPO [S]

CONT

ROL

u

Fig. 6.7: Posicion angular controlada del MR1. Caso: seguimiento


Disenar un sistema de control backstepping para el reactor quımico con chaqueta deenfriamiento mostrado en la Fig. 2.13 y descrito en el problema 2.6.


6.6 Problemas 105

0 2 4 6 8 10 12 14 160

2

4

6

8

10

POSI

CIÓN

q

[ra

d]

0 2 4 6 8 10 12 14 16−1

0

1

2

3

4

TIEMPO [S]

CONT

ROL

u

Fig. 6.8: Posicion angular controlada del MR1. Caso: regulacion

En el problema 2.7 se describe un motor DC en el cual el voltaje de armadurase mantiene constante mientras que el voltaje de campo es variable (ver Fig. 2.14.Disenar un sistema de control backstepping para este motor.


La Fig. 2.15 (problema ) muestra un manipulador polar vertical. Disenar un sistemade control backstepping para este manipulador.


La Fig. 2.16 (problema ) muestra un manipulador polar horizontal. Disenar un sis-tema de control backstepping para este manipulador.


Disenar un sistema de control backstepping para el manipulador robotico traslacional–esferico mostrado en la Fig. 2.17 y descrito en el problema 2.10.


Disenar un sistema de control backstepping para el manipulador robotico esfericomostrado en la Fig. 2.17 y descrito en el problema 2.11.


La dinamica del motor sıncrono de iman permanente se describe en el problema 2.12.Disenar un sistema de control backstepping del torque para este motor.

Capıtulo 7

Linealizacion porRealimentacion de Estados

El diseno de sistemas de control empleando el metodo de linealizacion por re-alimentacion de estados se basa en las herramientas de la geometrıa diferencial paradeterminar si un sistema no lineal puede ser descrito mediante una descripcion dinamicaaparentemente lineal. Tal descripcion lineal del sistema permite emplear para su con-trol fuerzas de estabilizacion lineales, favoreciendo de esta manera la disminucion de lacomplejidad en el diseno del controlador.

El metodo es aplicable a una gran clase de sistemas multivariables que sean descritosmediante una ecuacion de estado de la forma: x = f(x)−G(x)u, donde x es el vectorde estado del sistema y las funciones vectoriales f y G describen la dinamica del sistema.Previamente, tales sistemas deben de cumplir ciertos requerimientos a ser detallados enlas secciones siguientes.

A fin de validar el procedimiento de diseno propuesto en las secciones 7.2 y 7.3,sistemas de control por linealizacion de la realimentacion de estados seran disenados eimplementados en tiempo real para el:(1) Manipulador robotico de 1GDL.(2) Manipulador robotico esferico.

7.1. Herramientas de la Geometrıa Diferencial

Los metodos de la geometrıa diferencial se pueden aplicar a sistemas no linealespara determinar si tales sistemas son linealizables mediante realimentacion de estados;esto es, si la descripcion dinamica de un sistema en particular se puede hacer queparezca lineal, luego de efectuar una apropiada transformacion de coordenadas yaplicar la correspondiente linealizacion de estados no lineal. En concordancia conla terminologıa empleada en geometrıa diferencial [11], [3], [14], la siguiente funcionvectorial n-dimensional:

f(x) =

f1(x)...

fn(x)

=

f1(x1, . . . , xn)...

fn(x1, . . . , xn)

(7.1)

108 Linealizacion por Realimentacion de Estados

se denomina un campo vectorial, si a cada funcion vectorial f le corresponde uncampo de vectores en un espacio n-dimensional Rn. En lo que sigue, nosotros nosocuparemos solo de campos vectoriales suaves de la forma f(x), significando quetales funciones vectoriales poseen derivadas parciales continuas de cualquier orden.El concepto de suavidad se aplica tambien a funciones escalares.

El gradiente de una funcion escalar suave h(x) se define como:

∇h(x) =∂h

∂x=

[∂h∂x1

· · · ∂h∂xn

](7.2)

De la misma manera, el jacobiano de una funcion vectorial suave f(x) se define como:

∇f(x) =∂f(x)∂x

=

∂f1

∂x1· · · ∂f1

∂xn...

. . ....

∂fn

∂x1· · · ∂fn

∂xn

(7.3)

7.1.1. Derivadas y Corchetes de Lie

Derivadas de Lie

La derivada de Lie de una funcion escalar h(x) con respecto al campo vectorialf(x) es una nueva funcion escalar Lfh definida como:

Lfh = ∇h f =∂h

∂x1f1 + · · ·+ ∂h

∂xnfn (7.4)

Observar que la derivada de Lie es el producto interno entre ∇h(x) y f(x). Derivadasde Lie repetidas se pueden formular en forma recursiva como:

L0f h = h

Lifh = Lf (Li−1

f h) = ∇(Li−1f h) f for i = 1, 2, . . . (7.5)

Si f y g son campos vectoriales, entonces:

LgLf = ∇(Lf )g (7.6)

Corchetes de Lie

El corchete de Lie de dos campos vectoriales f y g es otro campo vectorial [f ,g]definido como:

[f ,g] = ∇g f −∇f g (7.7)

La notacion adfg (donde ad significa adjunta) se emplea frecuentemente en lugar de[f ,g]. Corchetes de Lie repetidos se pueden formular en forma recursiva:

ad 0f g = g

ad ifg = [f , ad i−1

f g] para i = 1, 2, . . . (7.8)

Siempre que f , f1, f2, g, g1 y g2 sean campos vectoriales suaves, α1 and α2 seanconstantes escalares y h(x) sea una funcion escalar suave de x, entonces se puedenformular las siguientes propiedades del corchete de Lie:

7.1 Herramientas de la Geometrıa Diferencial 109

1) Bilinealidad:

[α1f1 + α2f2,g] = α1[f1,g] + α2[f2,g][f , α1g1 + α2g2] = α1[f ,g1] + α2[f ,g2] (7.9)

2) Anti-conmutatividad:

[f ,g] = −[g, f ] (7.10)

3) Identidad de Jacoby:Ladfg h = LfLg h− LgLf h (7.11)

7.1.2. Difeomorfismos y Transformacion de Coordenadas

Una funcion Φ definida en una region Ω se conoce como un difeomorfismo siambos, Φ y su inversa Φ−1 son funciones suaves. Si la region Ω es Rn (el espa-cio total), entonces, Φ(x) se denomina un difeomorfismo global. Por otra parte, undifeomorfismo local se defined solo en una vecindad finita de un punto dado x0.

Una funcion suave Φ(x) definida en una region Ω en Rn es un difeomorfismolocal, siempre que la matriz jacobiana ∇x sea no singular en un punto x = x0 de laregion Ω.

Empleando difeomorfismo, nosotros podemos transformar los estados de unsistema no lineal en un nuevo conjunto de estados correspondiente al sistema no linealtransformado. La metodologıa es bien conocida. Consideremos un sistema SISO (deuna entrada y una salida) no lineal descrito por:

x = f(x) + g(x)u y = h(x) (7.12)

donde u es la unica entrada e y es la unica salida. Definamos un nuevo conjunto deestados z = Φ(x). Efectuando diferenciacion en z:

z =∂Φ∂x

x =∂Φ∂x

(f(x) + g(x)u) = f∗(z) + g∗(z)u y = h∗(z) (7.13)

donde

f∗ =∂Φ∂x

f g∗ =∂Φ∂x

g x = Φ−1(z) h∗ = h

7.1.3. El Teorema de Frobenius

Suponiendo que f1, f2, . . ., fm forman un conjunto de campos vectoriales lineal-mente independientes en Rn, el teorema de Frobenius establece que tal conjunto escompletamente integrable sı y solo si dicho conjunto es involutivo.

Se dice que el conjunto de campos vectoriales arriba definido es completamenteintegrable sı y solo si existen n −m funciones escalares h1(x), h2(x), . . ., hn−m(x)que satisfacen el siguiente sistema de ecuaciones diferenciales parciales.

∇hi fj = 0 1 ≤ i ≤ n−m 1 ≤ j ≤ m (7.14)

donde los gradientes ∇h1, ∇h2, . . ., ∇hn−m son tambien linealmente independientes.


El conjunto de campos vectoriales en consideracion se dice que es involutivo,sı y solo si existen funciones escalares αijk en R (el espacio unidimensional) quesatisfacen:

[fi, fj ](x) =m∑

k=1

αijk(x) fk(x) ∀ i, j (7.15)

La ultima ecuacion indica que el campo vectorial resultante [fi, fj ](x) es una com-binacion lineal del conjunto original de campos vectoriales f1, f2, . . ., fm. De (7.15),podemos postular:

1) El conjunto de campos vectoriales constantes f1, f2, . . ., fm es siempre involutivoporque el corchete de Lie de cualquier par de tales campos siempre es nulo; estoes:

[fi, gj ] = 0

lo cual significa que estos campos se pueden representar como una combinacionlineal.

2) Un conjunto que contiene un unico campo vectorial f es involutivo porque:[f , f ] = 0.

3) El conjunto de campos vectoriales f1, f2, . . ., fm es involutivo si ∀ x y ∀ i, j

rank[f1(x) . . . fm(x)

]= rank

[f1(x) . . . fm(x) [fi(x), fj ](x)

]

donde la notacion rank[.]

representa el rango de una matriz de campos vecto-riales columna.

7.2. Linealizacion por Realimentacion. Caso: SISO

Esta seccion presenta la metodologıa para generar una relacion entrada–salidapara procesos SISO no lineales con el proposito de disenar controladores estables. Elsistema no lineal en consideracion se describe como:

x = f(x) + g(x)u y = h(x) (7.16)

x =

x1...

xn

f =

f1(x)...

fn(x)

g =

g1...

gn

donde x es el vector de estado de orden n × 1, u es la entrada de control, y es lasalida del sistema, f y g son campos vectoriales suaves de orden n × 1, y h es unafuncion suave.

7.2.1. Condiciones para Linealizacion

El sistema no lineal x = f(x) + g(x)u es linearizable por realimentacion deestados, sı y solo si las siguientes condiciones son verdaderas para una region Ω:

7.2 Linealizacion por Realimentacion. Caso: SISO 111

1) Los campos vectoriales g, adfg, . . ., adn−1f g son linealmente independientes en

la region Ω.

2) El conjunto g, adfg, . . ., adn−2f g es involutivo en Ω.

Para sistemas SISO lineales se sabe que f(x) = Ax y g(x) = B, donde A de ordenn × n y B de orden n × 1 son las matrices de estado y de control (o de distribu-cion) respectivamente. Por consiguiente, la primera condicion se convierte en la bienconocida condicion de estabilidad completa [15], [16], a saber, un sistema lineal de laforma:

x = Ax + Bu y = Cx (7.17)

es controlable en sus estados si su matriz de controlabilidad C posee rango completo:

rank C = rank [B AB · · · An−1B] = n (7.18)

La primera condicion descrita arriba puede ser interpretada como la Condicion deControlabilidad Generalizada.

Ejemplo 7.1

La descripcion en el espacio de estado del manipulador MR1 con inductancia dearmadura despreciable se muestra en la ecuacion (2.22), de la cual se formula (pre-scindiendo de los argumentos para mayor claridad):

x = f(x) + g(x)u y = h(x) = x1

x =[

x1

x2

]f =

[f1

f2

]=

[x2

−a1 sinx1 − a2x2

]g =

[g1

g2

]=

[0−b

]

Determinar si el sistema MR1 es exactamente linearizable.

Solucion.- La primera condicion establecida en la subseccion 7.2.1 requiere formarla matriz [g adfg], donde adfg = [f , g] = ∇g f −∇f g se calcula como sigue:

∇g f −∇f g =

[∂g1

x1

∂g1

x2∂g2

x1

∂g2

x2

][f1

f2

]−

[∂f1

x1

∂f1

x2∂f2

x1

∂f2

x2

][g1

g2

]=

[b

−a2b

]

Luego:

det[g adfg] = det

[0 b−b −a2b

]6= 0

Como el determinante de [g adfg] es diferente de cero, entonces g y adfg formanun conjunto de campos vectoriales linealmente independientes. Ademas, el conjunto[g adfg] es involutivo porque es constante. ♣


7.2.2. El Grado Relativo de un Sistema SISO

Diferenciemos la salida y de (7.16):

y = ∇h(x)(f + gu) = Lfh(x) + Lgh(x)u

Si Lgh(x) 6= 0 para algun x = x0, entonces la siguiente transformacion en la entrada:

u =1

Lgh(x)(−Lfh(x) + v)

genera una relacion diferencial lineal entre la salida y y la nueva entrada v, de laforma: y = v. Por el contrario, si Lgh(x) = 0 para todo x, la diferenciacion de yproduce:

y = L2f h(x) + LgLfh(x)u

Si ahora LgLfh(x) = 0 para todo x, necesitamos diferenciar y para obtener:

y(3) =d 3y

dt 3= L3

f h(x) + LgL2f h(x)u

y ası sucesivamente:

y(i) =d iy

dt i= Li

fh(x) + LgLi−1f h(x)u

hasta que para algun entero r = i y para algun x = x0, se obtenga:

LgLr−1f h(x) 6= 0

Sustituyendo la siguiente ley de control:

u =1

LgLr−1f h(x)

(−Lrfh(x) + v) (7.19)

en:y(r) = Lr

fh(x) + LgLr−1f h(x)u (7.20)

genera una relacion diferencial lineal entre la salida y y la nueva entrada v de laforma:

y(r) =d ry

dt r= v

Por consiguiente, un sistema SISO posee un grado relativo r en el punto x0 enuna region Ω si, para todo x ε Ω:

LgLifh(x) = 0 0 ≤ i < r − 1 (7.21)

LgLr−1f h(x) 6= 0 (7.22)

Observar que r es el numero de diferenciaciones ejecutadas en la salida y requeridaspara que la entrada u aparezca. En general: r ≤ n (recordar que n es el orden delsistema). Si r = n, entonces la linealizacion entrada–salida se denomina exacta yen esta situacion todos los estados se realimentan.

Ejemplo 7.2

7.2 Linealizacion por Realimentacion. Caso: SISO 113

Determinar el grado relativo del sistema MR1.

Solucion.- Usemos el modelo del sistema MR1 descrito en el ejemplo ??. Calculemos(7.21) y (7.22):

Lfh(x) = ∇h(x)f = x2 LgLfh(x) = Lgx2 = ∇x2g = −b 6= 0

Como el exponente en LgLfh(x) es r − 1 = 1, entonces el grado relativo del sistemaes r = 2. ♣

7.2.3. Forma Normal SISO con Linealizacion Exacta

El sistema no lineal (7.16) se puede transformar a su forma normal usando losresultados establecidos en la subseccion 7.1.2. Sabemos que linealizacion exacta deun sistema no lineal descrito por (7.16) ocurre cuando el grado relativo r es igual alorden del sistema n. Para linealizacion exacta, la transformacion de estados:

z =

z1

z2...

zn

= Φ(x) =

φ1(x)φ2(x)

...φn(x)

=

h(x)Lfh(x)

...Ln−1

f h(x)

=

yy...

yn

(7.23)

conduce a la siguiente descripcion en el espacio de estado:

z =

z1

z2...

zn−1

zn

=

z2

z3...

zn

b(z) + a(z)u

y = z1 (7.24)

donde (ver ecuacion (7.19)):

a(z) = LgLn−1f h(Φ−1(z))

b(z) = Lnf h(Φ−1(z)) (7.25)

Ejemplo 7.3

Determinar la forma normal del sistema MR1.

Solucion.- El modelo del sistema MR1 descrito en el ejemplo ?? ya esta en su formanormal debido a que su transformacion lineal resulta en el mismo sistema:

z =[

z1

z2

]=

[h(x)

Lfh(x)

]=

[x1x2

]


7.2.4. La Ley de Control SISO para Linealizacion

Consideremos la siguiente ley de control de linealizacion:

u =1

a(z)[−b(z) + v] (7.26)

donde v es una nueva entrada a ser determinada, a(z) y b(z) estan dadas en (7.25),y z es el nuevo estado para linealizacion. Substituyendo (7.26) en (7.24) produce lasiguiente representacion canonica invariante con el tiempo:

z = Mz + Nv y = Cz (7.27)

donde:

M =

0 1 0 · · · 00 0 1 · · · 0...

......

......

0 0 0 0 10 0 0 0 0

N =

00...01

C =[

1 0 · · · 0 0]

La funcion de transferencia del sistema es:

y(s)v(s)

= H(s) = C(sI−M)−1N =1sn

(7.28)

donde s es el operador de Laplace. La entrada v se disena para ubicar los polosdel sistema lineal equivalente. Entonces, la entrada u se computa usando (7.26).Empleando (7.28), el sistema lineal equivalente se puede seleccionar de:

v =dny

dtn= y(n) = ρ(n) + K1y

(n−1) + · · ·+ Kn−1 ˙y + Kny (7.29)

donde ρ(t) es la trayectoria deseada e y(t) = ρ(t) − y(t) es la senal de error deseguimiento. La ecuacion caracterıstica del sistema lineal equivalente es:

y(n) + K1y(n−1) + · · ·+ Kn−1 ˙y + Kny = 0 (7.30)

En el dominio de Laplace, la ecuacion (7.30) toma la forma:

(sn +K1sn−1 + · · ·+Kn−1s+Kn)y = (s−µ1)(s−µ2) · · · (s−µn−1)(s−µn)y (7.31)

Observar en (7.30) que para comportamiento asintotico estable se requiere que y =(ρ−y) → 0 con t →∞. Con este proposito, ninguna de las raıces µ1, µ2, · · · , µn−1, µn

de (7.31) se deben de localizar en el semiplano derecho del plano s, incluyendo el ejeimaginario. Cumpliendo este requerimiento, es facil de determinar los parametros decontrol Ki, i = 1, . . . , n.

Ejemplo 7.4

7.3 Linealizacion por Realimentacion: Caso MIMO 115

Determinar la ley de control para el sistema MR1.

Solucion.- Las ecuaciones en (7.25) para el sistema MR1 con n = 2 toman la forma:

a(z) = LgLfh(Φ−1(z)) = −b b(z) = Lfh(Φ−1(z)) = x2

Por consiguiente, la ley de control (ecuacion (7.26)) produce:

u =1

a(z)[−b(z) + v]

donde:

v =d 2y

dt 2= y = ρ + K1 ˙y + K2y ¨y + K1 ˙y + K2y = 0

donde los parametros K1 y K2 se calculan (fijando las raıces deseadas µ1 y µ2 en elsemiplano derecho del plano s) de:

(s2 + K1s + K2) = (s− µ1)(s− µ2)

7.3. Linealizacion por Realimentacion: Caso MIMO

7.3.1. Modelando Sistemas MIMO Cuadrados

Un sistema MIMO no lineal se denomina cuadrado cuando el numero de susentradas iguala al numero de sus salidas. El sistema cuadrado por considerar, en lavecindad del punto x0, se describe por:

x = f(x) + G(x)u = f(x) +m∑

j=1

gj(x)uj(x) y = h(x) (7.32)

x =

x1...

xn

f(x) =

f1(x)...

fn(x)

u =

u1...

um

y =

y1...

ym

h(x) =

h1(x)...

hm(x)

G(x) =

G11(x) . . . G1m(x)... . . .

Gm1(x) . . . Gmm(x)

=

[g1(x) · · · gm(x)

]

donde x es el vector de estado de orden n× 1, u es el vector de control (la entrada)de orden m×1, y es el vector de salida de orden m×1, f es un campo vectorial suavede orden n × 1, h es un campo vectorial suave de orden m × 1, y G es una matrizde dimension n ×m cuyas columnas son campos vectoriales gj de orden n × 1. Loselementos de gj y h son funciones suaves.


7.3.2. Grado Relativo Total

En la referencia [14], se establece que el sistema cuadrado descrito por (7.32)posee un grado relativo total r = r1 + . . . + rm si:

1) Para todo x en una vecindad de x0

LgjLkf hi(x) = 0 j, i = 1, . . . , m k < ri − 1

2) La siguiente matriz de orden m×m es no singular en x = x0:

A(x) =

Lg1Lr1−1f h1(x) · · · LgmLr1−1

f h1(x)Lg1L

r2−1f h2(x) · · · LgmLr2−1

f h2(x)...

. . ....

Lg1Lrm−1f hm(x) · · · LgmLrm−1

f hm(x)

(7.33)

Observando las filas de A, podemos postular que cada entero ri esta relacionado conla i-esima salida del sistema. Tambien, notar que ri es el numero de diferenciacionesejecutadas en la salida yi requeridas para que aparezca al menos uno de los compo-nentes del vector de entrada u. La no singularidad de A(x) en x = x0 es la versionmultivariable de la condicion impuesta por la ecuacion (7.22).

Un sistema MIMO de orden n que posee m entradas y m salidas es completa-mente linearizable y desacoplable si su grado relativo total r = r1 + · · ·+ rm es igualal orden n del sistema.

Ejemplo 7.5

La descripcion en el espacio de estado del sistema MRE de dos entradas y dos sal-idas se muestra en la ecuacion (2.122). Conforme a (7.32), la ecuacion (2.122) setransforma en:

x = f(x)+G(x)u = f(x)+2∑

j=1

gj(x)uj(x) y =[

y1

y2

]= h(x) =

[h1

h2

]=

[x1

x2

]

f =

f1

f2

f3

f4

=

x3

x4

M−111 (−P11x3 − P12x4)

M−122 (−P21x3 − P22x4 − d21)

; G(x) = [g1 g2] =

0 00 0

M−111 00 M−1

22

Determinar el grado relativo total del MRE.

Solucion.– Para la salida y1 tenemos:

Lfh1 = f1 = x3 Lg1Lfh1 = M−111 6= 0

Por consiguiente, r1 − 1 = 1 y r1 = 2. Para la salida y2 calculamos:

Lfh2 = f2 = x4 Lg2Lfh2 = M−122 6= 0

Por lo tanto, r2 − 1 = 1 y r2 = 2. La matriz A dada en (7.33) toma la forma:

A(x) =[

Lg1Lfh1 Lg2Lfh1

Lg2Lfh2 Lg2Lfh2

]=

[M−1

11 00 M−1

22

]

Claramente, la matriz A es no singular. Por consiguiente, el grado relativo total delsistema MRE es: r = r1 + r2 = 4 = n.


7.3.3. Forma Normal MIMO para Linealizacion Exacta

Si el grado relativo total del sistema cuadrado descrito en (7.32) es r, entonces:

r = r1 + r2 + · · ·+ rm ≤ n

Un sistema MIMO descrito por (7.32) posee linealizacion exacta, si su grado relativototal r = r1 + . . . + rm es igual al orden n del sistema, es decir, la dimension n delvector de estados. Para linealizacion exacta, la transformacion de estados:

z = Φ(x) =

φ1(x)...

φr1(x)ψ1(x)

...ψr2(x)

...ξ1(x)

...ξrm(x)

=

z1...

zr1

zr1+1...

zr1+r2

...zr1+r2+···+1

...zr1+r2+···+rm

(7.34)

donde:

φ1(x) = h1(x) = y1(x); φ2(x) = Lfh1(x); · · · ;φr1(x) = Lr1−1f h1(x)

ψ1(x) = h2(x) = y2(x); ψ2(x) = Lfh2(x); · · · ; ψr2(x) = Lr2−1f h2(x)

......

...ξ1(x) = hm(x) = ym(x); ξ2(x) = Lfhm(x); · · · ; ξrm(x) = Lrm−1

f hm(x)

conduce a la siguiente descripcion en el espacio de estado:

y1 = φ1(x) = φ2(x)

...

y(r1−1)1 = φr1−1(x) = φr1(x)

y(r1)1 = φr1(x) = Lr1

f h1(Φ−1(z)) +m∑

j=1

LgjLr1−1f h1(Φ−1(z))uj = v1

y2 = ψ1(x) = ψ2(x)

...

y(r2−1)2 = ψr2−1(x) = ψr2(x)

y(r2)2 = ψr2(x) = Lr2

f h2(Φ−1(z)) +m∑

j=1

LgjLr2−1f h2(Φ−1(z))uj = v2

...


ym = ξ1(x) = ξ2(x)

...

y(rm−1)m = ξrm−1(x) = ξrm(x)

y(rm)m = ξrm(x) = Lrm

f hm(Φ−1(z)) +m∑

j=1

LgjLrm−1f hm(Φ−1(z))uj = vm

(7.35)

Ejemplo 7.6

Determinar la forma normal MIMO del proceso MRE.

Solucion: Del ejemplo 7.5, la condicion para linealizacion exacta se cumple para elsistema MRE porque r = r1 + r2 = 4 = n (orden del sistema). Aplicacion de lasrelaciones (7.34) y (7.35) en el sistema MRE nos conduce a:

z =

z1

z2

z3

z4

= Φ(x) =

φ1(x)φ2(x)ψ1(x)ψ2(x)

=

h1

Lfh1(x)h2(x)

Lfh2(x)

=

x1

x3

x2

x4

=

y1

y1

y2

y2

x = Φ−1(z) =

z1

z3

z2

z4

z =

z1

z2

z3

z4

=

z2

v1

z4

v2

= Mz + Nv y = Cz

donde:

y =[

y1

y2

]=

[z1

z3

]v =

[v1

v2

]M =

0 1 0 00 0 0 00 0 0 10 0 0 0

N =

0 01 00 00 1

C =

[1 0 0 00 0 1 0

]

7.3.4. La Ley de Control MIMO Desacoplada

Es importante anotar que el grado relativo ri, i = 1, . . . , m, es el entero maspequeno requerido para que al menos una de las entradas aparezca en (ver (7.35)):

yrii = Lri

f hi(Φ−1(z)) +m∑

j=1

LgjLri−1f hi(Φ−1(z))uj


Por consiguiente, Lri−1f hi(Φ−1(z))uj 6= 0 para al menos un j en la vecindad de x0.

Ahora consideremos la siguiente ley de control desacoplada:

u =

u1...

um

= A−1(z)[−B(z) + v] (7.36)

donde v = [v1 . . . vm]T es una nueva entrada por determinar, y A(z) (ver (7.33)) yB(z) son matrices con elementos:

aij = LgiLrj−1f hj(Φ−1(z)) i, j = 1, . . . , m

bi = Lrif hi(Φ−1(z)) i = 1, . . . , m

respectivamente. Sustitucion de los elementos ui, i = 1, . . . , m (ecuacion (7.36)) en(7.35) conduce a la siguiente representacion invariante con el tiempo:

y(ri)i = d riyi/dt ri = vi i = 1, . . . , m

cuya descripcion en el dominio de Laplace es:

yi(s) =1sri

vi i = 1, . . . ,m

Por extension podemos formular entonces:

y(s) = H(s)v(s)

donde la matriz de transferencia H(s) del sistema MIMO linealizado posee la forma:

H(s) =

1/sr1 0 · · · 00 1/sr2 · · · 0...

.... . .

...0 0 · · · 1/srm

(7.37)

Cada entrada vi produce un sistema lineal equivalente, similar al descrito en (7.29),(7.30) y (7.31) para el caso SISO. Por consiguiente, para el caso MIMO:

vi =d riyi

dt ri= y

(ri)i = ρ

(ri)i +Ki,1 y

(ri−1)i +· · ·+Ki,ri−1 ˙yi+Ki,ri yi i = 1, . . . , m (7.38)

donde ρi(t) es la i-esima trayectoria deseada y, yi(t) = ρi(t)−yi(t) es la i-esima senalde error de seguimiento. La i-esima ecuacion caracterıstica resulta:

y(ri)i + Ki, 1 y

(ri−1)i + · · ·+ Ki, ri−1 ˙yi + Ki, ri yi = 0 i = 1, . . . , m (7.39)

En el dominio de Laplace, la ecuacion (7.39) toma la forma:

(sri + Ki, 1sri−1 + · · ·+ Ki, ri−1s + Ki, ri)y =

(s− µi, 1)(s− µi, 2) · · · (s− µi, ri−1)(s− µi, ri)y (7.40)

Para comportamiento asintotico estable, es decir, para que yi → 0, o lo que es lomismo: yi → ρi para t →∞, ninguna de las raıces de (7.39) debe de estar localizadaen el semiplano derecho del plano-s, incluyendo el eje imaginario.


Ejemplo 7.7

Determinar la ley de control MIMO desacoplada para el proceso MRE.

Solucion.– Usando (7.38), las entradas v1 y v2 toman la forma:

v1 = y1 = ρ1 + K1,1 ˙y1 + K1,2y1

v2 = y1 = ρ2 + K2,1 ˙y2 + K2,2y2

donde ρi(t) y yi(t) = ρi(t)−yi(t) son la i-esima trayectoria deseada y el i-esimo errorde seguimiento respectivamente, para i = 1, 2. Los parametros Ki,j , para i, j = 1, 2,se determinan de las siguientes ecuaciones caracterısticas:

s2 + K1,1s + K1,2 = (s− µ1,1)(s− µ1,2)

s2 + K2,1s + K2,2 = (s− µ2,1)(s− µ2,2)

donde µi,j , para i, j = 1, 2, son las raıces deseadas y deben de estar ubicadas enel semiplano derecho del plano–s, sin incluir el eje imaginario. La ley de control sedetermina de (7.36):

u =[

u1

u2

]= A−1(z)[−B(z) + v]

donde A(z) (ver ejemplo 7.5) y B toman la forma:

A(x) =[

M−111 00 M−1

22

]B =

[L2

f h1

L2f h2

]=

[f3

f4

]

7.4. Observadores No Lineales con Polos Prescritos

El diseno de controladores por ubicacion de polos para sistemas lineales [16],[17] asume que todos los estados del sistema estan disponibles en la realimentacion.En esta situacion es posible forzar al sistema de modo tal que posea polos pre-determinados a lazo cerrado; es decir, hacer que el sistema posea polos prescritos (oeigenvalores) en localizaciones deseadas. En la practica, solo parte de los estados sondisponibles para procesamiento, y ademas, debemos siempre evitar la diferenciacionde variables de estado con el fin de generar nuevas. Es bien conocido que la simplediferenciacion de una senal puede hacer decrecer en varias veces la relacion senal aruido.

Los observadores de estados para sistemas lineales son capaces de estimar losestados no medibles. El diseno de un observador lineal de estados es similar al disenode un controlador lineal por ubicacion de polos. En otras palabras, la expresion de lamatriz de ganancia de un observador de estados es la expresion dual de la matriz deganancia de un controlador de estados.

Vimos que la linealizacion exacta (subseccion 7.3.3) nos permite disenar una leyde control desacoplada (subseccion 7.3.4) usando eigenvalores prescritos para asegurarla estabilizacion del sistema descrito por (7.32). Apelando al concepto de dualidadcomo en el caso lineal discutido lıneas arriba, nosotros enfrentaremos el problema desıntesis de observadores no lineales con eigenvalores prescritos para la estimacion deestados.

7.4 Observadores No Lineales con Polos Prescritos 121

7.4.1. Observador SISO No Lineal con Polos prescritos

Sistemas lineales SISO de la forma dada en (7.27) son observables si su matrizde observabilidad O posee rango completo (ver (3.24) por ejemplo); es decir:

rango O = rango

CCM

...CMn−1

= n (7.41)

Se puede demostrar facilmente que la matriz de observabilidad del sistema (7.27)posee rango completo. Para sistemas no lineales con entrada y salida escalares des-critos por:

x = f(x) + g(x)u y = h(x) (7.42)

la matriz de observabilidad generalizada se puede definir como;

O(x) , ∂

∂x

h(x)Lfh(x)

...Ln−1

f h(x)

z = Φ(x) =

h(x)Lfh(x)

...Ln−1

f h(x)

(7.43)

donde O es de orden n×n y z = Φ(x) es la transformacion de estados descritaen (7.23). Es facil de verificar que la ecuacion (7.43) se convierte en (7.41) cuandof(x) = Ax y h(x) = Cx.

La descripcion en el espacio de estado del sistema en el dominio de z esta dadopor la ecuacion (7.24), mientras que la ecuacion (7.27) describe su correspondienterepresentacion canonica invariante en el tiempo. Empleando (7.24) y la transforma-cion z = Φ(x), podemos formular:

z =∂Φ∂x

x = O(x)(f(x) + g(x)u) = Mz + Nv

v = Lnf h(Φ−1(z)) + LgLn−1

f h(Φ−1(z))uy = Cz (7.44)

El observador no lineal para el sistema descrito por las ecuaciones (7.24) y (7.27)posee la forma:

˙z = Mz + Nv + P(y −Cz)y = Cz (7.45)

donde z e y son los estimados de z e y, respectivamente, y P de orden n × 1 es lamatriz de ganancia del observador. Notar que (7.45) se convierte en un observadorlineal cuando v es una entrada lineal.

Asumamos la existencia de O−1(x). Para z = z y x = x, y usando el hecho deque y = Cz = h(x), entonces la ecuacion (7.44) toma la forma:

O(x)(f(x) + g(x)u) = Mz + Nv Cz = h(x) (7.46)


Substituyendo (7.46) en (7.45) nos conduce al siguiente observador no lineal en eldominio de x:

˙x = f(x) + g(x)u +O−1(x)H(y − h(x)) (7.47)

Sea e = z−z el error de estimacion. Substrayendo (7.27) de (7.46) y usando el hechode que y = Cz, es facil verificar que:

e = (M−HC)e (7.48)

La matriz de ganancia H del observador requiere ser seleccionada de modo talque los eigenvalores de la ecuacion caracterıstica del observador no lineal:

det [sI−M + HC] = 0

hagan que el error de estimacion e tienda a 0 con suficiente rapidez. Tal matriz deganancia H se puede computar usando los comandos place o acker de Mathscript.Tales comandos se pueden tambien emplear para calcular la ganancia K del contro-lador del sistema z = Mz + Nv y = Cz como sigue:

H = place(M,N,[mu1 ... mun])’H = acker(M,N,[mu1 ... mu2])’

donde µ1, . . . µn (mu1, ..., mun) son las raıces (o polos) deseadas del sistema controla-do. Debido a la dualidad que existe entre controlabilidad y observabilidad, la matrizla matriz de ganancia H del observador se puede calcular de:

H = place(M’,C’,[nu1 ... nun])’H = acker(M’,C’,[nu1 ... nun])’

donde ν1, . . . νn (nu1, ... nun) son las raıces (o polos) deseadas del observador y elapostrofe indica la operacion matricial transpuesta. Con el comando place los polosdel observador deben de estar en diferentes posiciones. Esto no es necesario si se usa elcomando acker. Es conveniente que la dinamica del observador sea mucho mas rapidaque la del mismo sistema, por ello se recomienda ubicar los polos del observador almenos 5 veces mas alejados hacia la izquierda de los polos dominantes del sistemarealimentado.

Ejemplo 7.8

Determinar el observador SISO con polos prescritos para el sistema MR1.

Solucion.– La ecuacion (7.47) es el observador SISO pedido:

˙x = f(x) + g(x)u +O−1(x)P(y − h(x))

donde: y = x1 y h(x) = x1. Ademas:

f =[

f1(x)f2(x)

]=

[x2

−a1 sin x1 − a2x2

]g =

[0−b

]

O(x) =∂

∂x

[h(x)

Lfh(x)

]=

∂

∂x

[x1

x2

]=

[1 00 1

]

La matriz de ganancia H del observador se halla de cualesquiera de las relaciones enMathscript:

7.4 Observadores No Lineales con Polos Prescritos 123

H = place(M’,C’,[nu1, nu2])’H = acker(M’,C’,[nu1, nu2])’

donde ν1 y ν2 (nu1 y nu2) son las raıces (o polos) deseadas del observador y elapostrofe indica la operacion matricial transpuesta. Recordar que con el comandoplace los polos del observador deben de estar en diferentes posiciones.

7.4.2. Observador MIMO No Lineal con Polos Prescritos

El observador MIMO no lineal es una extension del observador SISO descritoen la subseccion 7.4.1. Considere que el sistema MIMO no lineal cuadrado descritopor (7.32) posee un grado relativo total r = r1+ · · ·+rm. Para linealizacion exacta, latransformacion de estados dada en (7.34) nos conduce a la descripcion en el espacio deestado dada por (7.35). Por consiguiente, la correspondiente matriz de observabilidadgeneralizada se puede formular como:

O(x) , ∂Φ(x)∂x

z = Φ(x) (7.49)

por lo tanto (ver ecuacion (7.44)):

z =∂Φ∂x

x = O(x)(f(x) + g(x)u) = Mz + Nv (7.50)

v = Lnf h(Φ−1(z)) + LgLn−1

f h(Φ−1(z))u v = [v1 . . . vm]T (7.51)y = Cz (7.52)

El observador MIMO toma la forma:

˙z = Mz + Nv + H(y −Cz) (7.53)y = Cz (7.54)

donde z e y son los estimados de z e y, respectivamente, y H de orden n ×m es lamatriz de ganancia del observador. La ecuacion no lineal del observador en el dominiode x esta dada por:

˙x = f(x) + G(x)u +O−1(x)H(y − h(x)) (7.55)

Sea e = z− z el error de estimacion. Sustraendo (7.53) de (7.50) se obtiene:

e = (M−HC)e (7.56)

Como en el caso SISO, la matriz la matriz de ganancia H del observador se puedecalcular de:

H = place(M’,C’,[nu1 ... nun])’H = acker(M’,C’,[nu1 ... nun])’

donde ν1, . . . νn (nu1, ... nun) son las raıces (o polos) deseados del observador y elapostrofe indica la operacion matricial transpuesta. Con el comando place los polosdel observador deben de estar en diferentes posiciones. Esto no es necesario si se usael comando acker. Cabe anotar tambien la recomendacion, como en el caso SISO, deubicar los polos del observador al menos 5 veces mas alejados hacia la izquierda delos polos dominantes del sistema realimentado.


Ejemplo 7.9

Determinar el observador MIMO no lineal para el proceso MRE.

Solucion.– La ecuacion (7.55) es el observador MIMO requerido:

˙x = f(x) + G(x)u +O−1(x)H(y − h(x))

donde (ver ejemplo 7.5):

y =[

y1

y2

]=

[x1

x2

]h(x) =

[h1(x)h2(x)

]=

[x1

x2

]

f(x) =

f1(x)f2(x)f3(x)f4(x)

=

x3

x4

M−111 (−P11x3 − P12x4)

M−122 (−P21x3 − P22x4 − d21)

G(x) = [g1(x) g2(x)] =

0 00 0

M−111 00 M−1

22

O(x) =∂

∂x

[h(x)

Lfh(x)

]=

∂

∂x

h1

Lfh1

h2

Lfh2

=

∂

∂x

x1

x3

x2

x4

=

1 0 0 00 0 1 00 1 0 00 0 0 1

= O−1

La matriz de ganancia H del observador se determina usando cualesquiera de lasrelaciones:

H = place(M’,C’,[nu1 nu2 nu3 nu4])’H = acker(M’,C’,[nu1 nu2 nu3 nu4])’

donde ν1, ν2, ν3 y ν4 son las raıces (o polos) deseadas del observador y el apostrofeindica la operacion matricial transpuesta. Tener en cuenta que con el comando placelos polos del observador deben de estar en diferentes posiciones.


El procedimiento de diseno de un sistema de control empleando el metodo dela linealizacion por realimentacion de estados comprende los pasos siguientes:

(1) Determinar el modelo dinamico del sistema a controlar en forma de su ecuacionde estado, tal como se muestra en (7.16) para el caso SISO y en (7.32) para elcaso MIMO.

(2) Determinar si se cumplen las condiciones de linealizacion exacta descritas en lasubseccion 7.2.1 para el caso SISO. Si este es el caso, calcular su grado relativor de acuerdo a la subseccion 7.2.2. Para el caso MIMO calcular el grado relativototal de acuerdo con la subseccion 7.3.2 con el fin de determinar si el sistemaes exactamente linealizable.

7.6 Aplicaciones 125

(3) Determinar la forma normal del sistema (subsecciones 7.2.3 y 7.3.3 para loscasos SISO y MIMO respectivamente) para linealizacion exacta.

(4) Formular el observador de estados completo del sistema descrito en la subseccion7.4.1 para el caso SISO y 7.4.2 para el caso MIMO.

(5) Determinar la ley de control desacoplada descrita en las subsecciones 7.2.4 y7.3.4 para los casos SISO y MIMO respectivamente.

(6) Simular el sistema para las especificaciones de diseno pre–establecidas.

(7) Determinar el hardware y programar el software de control para implementar elsistema de control disenado. Realizar las pruebas experimentales del caso paravalidar el diseno.

7.6. Aplicaciones

7.6.1. Control por Linealizacion del Manipulador MR1

La descripcion en el espacio de estado del manipulador MR1 con inductanciade armadura despreciable y la aplicacion de las condiciones para linealizacion exactaen tal sistema ha sido materia del ejemplo 7.1. En el ejemplo 7.2 se determino que elgrado relativo r = 2 del sistema MR1 coincide con el orden n =2 de dicho sistema.La forma normal del manipulador fue determinada en el ejemplo 7.3, mientras queen los ejemplos 7.4 y 7.8 se dedujeron la ley de control y el observador no lineal delsistema, respectivamente.

Las Figs. 7.1 y 7.2 muestran el resultado de la simulacion del sistema de control dela posicion angular del brazo del MR1 para los casos de seguimiento y regulacion re-spectivamente. Para obtener dichas Figs. ejecutar los programas flmr1s.m y flmr1r.m,cuyos listados se encuentran en el CD adjunto. La senal de referencia deseada parael caso de seguimiento se formulo como:

qd = A sinWk + A3Wk

donde A y W son constantes, k = t/T es el tiempo discreto y T es el tiempo demuestreo. Para el caso de regulacion,la senal de referencia es del tipo escalon. Notaren tales Figs. que las especificaciones de diseno porcentaje de sobreimpulso nulo,error en estado estacionario nulo y tiempo de estabilizacion menor de 1 s se cumplensatisfactoriamente. Para el caso de seguimiento las raıces deseadas del controlador sefijaron en -30, mientras que las del observador se fijaron en -150 y -151. Para el casode regulacion las raıces deseadas del controlador se fijaron en -10, mientras que lasdel observador se fijaron en -50 y -51.

7.6.2. Control por Linealizacion del Manipulador MRE

La descripcion en el espacio de estado y la determinacion del grado relativototal del manipulador MRE con inductancias de armadura de sus servomotores des-preciables es materia del ejemplo 7.5. Dao que el grado relativo total r = 4 coincidecon el orden n = 4 del sistema MRE, entonce dicho sistema es exactamente lineariz-able. La forma normal del manipulador MRE fue hallada en el ejemplo ??, mientras


0 1 2 3 4 5 6 7 80

0.5

1

1.5

POSI

CIÓN

x1 [r

ad]

0 1 2 3 4 5 6 7 8−1

0

1

2

3

4

TIEMPO [S]

CONT

ROL

u

Fig. 7.1: Posicion angular controlada del brazo del MRE. Caso: seguimiento.

0 1 2 3 4 5 6 7 80

0.1

0.2

0.3

0.4

0.5

POSI

CIÓN

x1 [r

ad]

0 1 2 3 4 5 6 7 8−10

−5

0

5

10

15

TIEMPO [S]

CONT

ROL

u

Fig. 7.2: Posicion angular controlada del brazo del MRE. Caso: regulacion.

que en los ejemplos 7.4.1 y 7.9 se dedujeron la ley de control y el observador no linealdel sistema, respectivamente.

Las Figs. 7.3 y 7.4 muestran el resultado de la simulacion del sistema de controlde la posicion angular del brazo del MRE para los casos de seguimiento y regulacionrespectivamente. Para obtener dichas Figs. ejecutar los programas flmres.m y flmr-er.m, cuyos listados se encuentran en el CD adjunto. La senal de referencia deseadapara el caso de seguimiento se formulo como:

qd = A sinWk + Bk

donde A y W son constantes, k = t/T es el tiempo discreto y T es el tiempo demuestreo. Para el caso de regulacion,la senal de referencia es del tipo escalon. Notaren tales Figs. que las especificaciones de diseno porcentaje de sobreimpulso nulo,

7.7 Problemas 127

error en estado estacionario nulo y tiempo de estabilizacion menor de 2 s se cumplensatisfactoriamente. Tanto para los casos de seguimiento y de regulacion las raıcesdeseadas del controlador se fijaron en -2, mientras que las del observador se fijaronen -100, -101, -102 y -103.

0 2 4 6 8 10 12 14 16 18 200

5

10

PO

SIC

IÓN

q1

[rad

]

0 2 4 6 8 10 12 14 16 18 200

0.1

0.2

TIEMPO [s]

CO

NT

RO

L u1

[V]

0 2 4 6 8 10 12 14 16 18 200

10

20

PO

SIC

IÓN

q2

[rad

]

0 2 4 6 8 10 12 14 16 18 20−2

0

2

TIEMPO [s]

CO

NT

RO

L u1

[V]


7.7. Problemas


Disenar un sistema de control por linealizacion de la realimentacion de estados parael sistema de plataformas mostrado en la Fig. 2.11 y descrito en el problema 2.4.


En el problema 2.5 se describe la columna de destilacion para fraccionar petroleopesado, mostrado en La Fig. 2.12. Disenar un sistema de control por linealizacion dela realimentacion de estados para este sistema.


Disenar un sistema de control por linealizacion de la realimentacion de estados parael reactor quımico con chaqueta de enfriamiento mostrado en la Fig. 2.13 y descritoen el problema 2.6.



0 2 4 6 8 10 12 14 16 18 200

1

2

PO

SIC

IÓN

q1

[rad

]

0 2 4 6 8 10 12 14 16 18 20−1

0

1

TIEMPO [s]

CO

NT

RO

L u1

[V]

0 2 4 6 8 10 12 14 16 18 200

1

2

PO

SIC

IÓN

q2

[rad

]

0 2 4 6 8 10 12 14 16 18 20−5

0

5

TIEMPO [s]

CO

NT

RO

L u1

[V]


En el problema 2.7 se describe un motor DC en el cual el voltaje de armadurase mantiene constante mientras que el voltaje de campo es variable (ver Fig. 2.14.Disenar un sistema de control por linealizacion de la realimentacion de estados paraeste motor.


La Fig. 2.15 (problema ) muestra un manipulador polar vertical. Disenar un sistemade control por linealizacion de la realimentacion de estados para este manipulador.


La Fig. 2.16 (problema ) muestra un manipulador polar horizontal. Disenar un sis-tema de control por linealizacion de la realimentacion de estados para este manipu-lador.


Disenar un sistema de control por linealizacion de la realimentacion de estados parael manipulador robotico traslacional–esferico mostrado en la Fig. 2.17 y descrito enel problema 2.10.


Disenar un sistema de control por linealizacion de la realimentacion de estados parael manipulador robotico esferico mostrado en la Fig. 2.17 y descrito en el problema2.11.

7.7 Problemas 129


La dinamica del motor sıncrono de iman permanente se describe en el problema 2.12.Disenar un sistema de control por linealizacion de la realimentacion de estados deltorque para este motor.

Apendice A

El Metodo Directo de Lyapunov

A.1. Estabilidad vıa el Metodo Directo de Lyapunov

A. M. Lyapunov trata el problema de la estabilidad de sistemas descritos median-te ecuaciones diferenciales empleando dos metodos. El denominado primer metodoanaliza el comportamiento de la estabilidad de una solucion explıcita del modelo nolineal del sistema y se aplica solamente a ciertos casos. El segundo metodo, o metododirecto de Lyapunov, es de gran generalidad y potencia porque no requiere de lasolucion de la descripcion del sistema, como sı lo requiere el primer metodo.

A.1.1. Conceptos de Estabilidad

Un sistema no lineal de la forma:

x = f(x, t) (A.1)

se dice que es no autonomo si f depende del tiempo, por ejemplo, si f posee parametrosvariantes con el tiempo. Por consiguiente, un sistema autonomo puede ser descritopor: x = f(x). Las trayectorias de estado para procesos autonomos son independientesdel tiempo inicial, mientras que para los no autonomos generalmente no lo son.

Un estado o punto de equilibrio xe (realmente un vector constante) de unsistema autonomo se puede determinar de:

0 = f(xe) (A.2)

Ya que nosotros debemos de tratar la estabilidad en el origen del sistema autonomobasico:

x = f(x) x(0) = 0 (A.3)

Entonces debemos de hacer ciertas suposiciones con relacion a la figura A.1. Deno-taremos como B(R) a la region esferica (balon) ||x|| < R y como S(R) a la esfera||x|| = R en sı. La region esferica anular cerrada r ≤ ||x|| ≤ R sera denotada co-mo BR

r . Asumiremos que en una cierta region esferica Ω : ||x|| < B(R), todas lasderivadas parciales ∂xi/∂xj existen y son continuas en Ω. Entonces diremos que elorigen es:

estable si alguna trayectoria que empieza en B(r) en un punto arbitrario xo

nunca logra alcanzar la esfera frontera S(R) de B(R);

132 El Metodo Directo de Lyapunov

asintoticamente estable cuando es estable y en adicion cada trayectoria de es-tado que empieza en B(R) en un punto arbitrario xo, tiende hacia el origenconforme el tiempo se incremente indefinidamente;

inestable cuando para algun R y r, ya sea grande o pequeno, alguna trayectoriade estado que empieza en B(R) en un punto arbitrario x0 logra alcanzar laesfera frontera S(R). Observar en la figura A.1 que para la trayectoria T elorigen es inestable en el sentido de Lyapunov, a pesar de que tal trayectoria deestado muestre convergencia.

Stable

Asymptoticallystable

Unstable

B(R)

S(R)

S(A)

H(A)

x 0

0

T

B(r)

Rr

Fig. A.1: Estabilidad en sistemas autonomos.

A.1.2. Funciones de Lyapunov

Un tipo especial de funcion escalar V (x), la denominada funcion de Lyapunovjuega un importante rol en el analisis de la estabilidad y el diseno de sistemas decontrol. Una funcion de Lyapunov V (x) verifica las siguientes propiedades:

(a) V (x) y sus primeras derivadas parciales

∂V (x)∂x

= ∇V (x)

son continuas en una cierta region abierta Ω alrededor del origen.

(b) V (0) = 0

(c) Fuera del origen, pero siempre en Ω, V (x) es positiva. Por consiguiente, el origenes un mınimo aislado de V (x).

(d) V (x) = ∇V (x) x = ∇V (x) f(x) ≤ 0 en Ω.

A.1 Estabilidad vıa el Metodo Directo de Lyapunov 133

V (x) es una funcion definida positiva si satisface las propiedades (a)–(c). La figuraA.2 ilustra una funcion de Lyapunov para un sistema de segundo orden. Notar queV (x1, x2) tiene el aspecto general de un espejo parabolico apuntando hacia arriba. SiV fuera definida negativa, el espejo parabolico deberıa de apuntar hacia abajo. Porconsiguiente, V (x) es definida negativa si −V (x) es definida positiva. Tambien, V (x)es semidefinida positiva si V (0) = 0 y V (x) ≥ 0 para x 6= 0; V (x) es semidefinidanegativa si −V (x) es semidefinida positiva.

Para una matriz cuadrada V de orden n × n, las expresiones V > 0, V ≥ 0,V < 0 y V ≤ 0 denotan que V es definida positiva, semidefinida positiva, definidanegativa y semidefinida negativa respectivamente, siempre y cuando V este asociadaa su forma cuadratica.

V es definida positiva (V > 0), es decir, xTVx > 0, si la funcion cuadraticaxTVx es definida positiva para x 6= 0. Tambien, V es definida positiva si todos suseigenvalores o sus menores principales son mayores que cero.

En general, los menores principales mi de V = [vij ] (de orden n× n) son:

m0 = 1; m1 = v11; m2 = det

([v11 v12

v21 v22

]); m3 = det

v11 v12 v13

v21 v22 v23

v31 v32 v33

;

y ası sucesivamente hasta llegar a mn = det(V).V es semidefinida positiva (V ≥ 0), es decir, xTVx ≥ 0, si la funcion cuadratica

xTVx es semidefinida positiva para x 6= 0. Tambien, V ≥ 0 si V es singular de rangor < n, y r eigenvalores o r menores principales de V son positivos y el resto (n− r)son nulos.

V definida negativa (V < 0), es decir, xTVx < 0, si la funcion cuadraticaxTVx es definida negativa para x 6= 0. Tambien, V < 0 si V es no singular y todoslos eigenvalores o los menores principales de V son negativos.

V semidefinida negativa (V ≤ 0), es decir, xTVx ≤ 0, si la funcion cuadraticaxTVx ≤ 0 a para x 6= 0. V ≤ 0 si V es singular de rango r < n, y r eigenvalores o rmenores principales de V son negativos y el resto (n− r) son nulos.

Si la matriz cuadrada V de orden n×n posee eigenvalores positivos y negativos,entonces V es indefinida.

V(x , x ) x

x

x x

1

12

2

V(x , x )21

1 2

Fig. A.2: Representacion grafica de una funcion de Lyapunov.

Ejemplo A.1


La funcion V (x) = (x1 + x2)2 con x = [x1 x2]T es semidefinida positiva desdeque V (0) = 0 y V (x) ≥ 0 para x 6= 0 (por ejemplo, para x1 = −x2, V (x) = 0),mientras que la funcion V (x) = −x2

1 + x22 no es definida positiva ni negativa porque

V (x) > 0 para x1 = 0 y V (x) < 0 para x2 = 0. Es facil de demostrar que la funcionV (x) = x2

1 + x22 es definida positiva.

Ejemplo A.2

El circuito mostrado en la figura A.3 contiene un resistor no lineal RN que obedecela ley i = Ne3, N > 0. Determine si la energıa almacenada en el capacitor C es unafuncion de Lyapunov.

+

-

u

R

RNC e

+

-

i

Fig. A.3: Circuito no lineal.

Solucion: Sumando las corrientes que salen del nodo superior derecho (ver la figuraA.3) produce:

Ce +e− u

R+ Ne3 = 0

La energıa almacenada en el capacitor esta dada por V (e) = 12Ce2. Para el sistema

no actuado (u = 0) tenemos:

V (e) = Cee = −e2

(1R

+ Ne2

)≤ 0

Por consiguiente, la funcion V (e) es una funcion de Lyapunov.

Ejemplo A.3

La figura A.4 muestra un sistema masa–amortiguador–resorte no lineal cuyo modelodinamico es:

Mx + Box + B1x|x|+ K0x + K1x3 = 0

donde (B0x+B1x|x|) caracteriza un amortiguador no lineal con coeficientes de amor-tiguacion B0, B1 > 0 constantes, y donde (K0x + K1x

3) representa un resorte nolineal con coeficientes de resorte K0,K1 > 0 constantes. Demostrar que la energıatotal almacenada en el sistema es una funcion de Lyapunov.Solucion: La energıa del sistema es:

V (x) =12Mx2 +

∫ x

0(K0x + K1x

3)dx =12Mx2 +

12K0x

2 +14K1x

4

Se puede demostrar facilmente que:

V (x) = Mxx + (K0x + K1x3)x = [−B0x−B1x|x|]x = −B0 x2 −B1|x|3 ≤ 0

Por consiguiente, V (x) es una funcion de Lyapunov.


M

K

KBb(t)

0

1

Fig. A.4: Sistema masa–amortiguador–resorte.

Funciones de Lyapunov para Sistemas No Autonomos

El sistema no autonomo en consideracion se describe en la region Ω: ||x|| < Amediante:

x = f(x, t) f(0, t) = 0 t ≤ 0 (A.4)

Siempre que W (x) es una funcion de Lyapunov en Ω, entonces V (x, t) es unafuncion de Lyapunov si:

(a) V (x, t) esta definida en Ω para algun t ≥ 0;

(b) V (0, t) = 0 para algun t ≥ 0;

(c) V (x, t) ≥ W (x) para algun t ≤ t0;

(d) V (x, t) ≤ 0 para algun t ≥ 0, donde:

V =dV

dt=

∂V

∂t+

∂V

∂xx =

∂V

∂t+

∂V

∂xf(x, t)

Se dice que una funcion V (x, t) es definida positiva si satisface las condiciones(a)–(c). Tambien se dice que V (x, t) es una funcion definida positiva si esta funciondomina a otra funcion definida positiva W (x), por ejemplo, cuando V (x, t) ≥ W (x).Tambien, V (x, t) es definida negativa si −V (x, t) es definida positiva; V (x, t) essemidefinida positiva si esta funcion domina a otra funcion semidefinida positivaW (x); V (x, t) es semidefinida negativa si −V (x, t) es semidefinida positiva.

Ejemplo A.4

Desprecie el termino no lineal x|x| del amortiguador descrito en el ejemplo A.3 yconsidere un coeficiente de amortiguacion b(t) variante con el tiempo en lugar deB0, de modo tal que el sistema se convierta en uno no autonomo. Demostrar que lasiguiente funcion V (x, t) es una funcion de Lyapunov.

V (x, t) =M

2(x + αx)2 +

12

(K0 +

12K2

1 −Mα2 + α b(t))

x2

Solucion: El computo de V (x, t) produce:

V (x, t) = (Mα− b(t))x2 +12α(b(t)− 2k0)− αK1x

4 < 0


siempre que α > 0, b(t) > Mα y b(t) < 2K0. De acuerdo al ejemplo A.3, la energıadel sistema es una funcion de Lyapunov, a saber:

W (x) =12Mx2 +

12K0x

2 +14K1x

4

Podemos observar que V (x, t) > W (x). Por consiguiente, V (x, t) es una funcion deLyapunov.

A.1.3. Teoremas de Estabilidad de Lyapunov

Los teoremas de estabilidad de Lyapunov generalizan la idea de que cerca al estadode equilibrio de un sistema f1sico, la energıa del sistema es siempre decreciente.

Teoremas de Estabilidad para Sistemas Autonomos

I. Teorema de Estabilidad. El equilibrio en el origen es estable si allı existeen alguna vecindad Ω del origen, una funcion de Lyapunov V (x).

II. Teorema de Estabilidad Asintotica. El equilibrio en el origen es asintotica-mente estable si −V es definida positiva (esto es: −V > 0) en Ω.

III. Teorema de Estabilidad Completa (Global). Considere una funcionescalar V (x) con primeras derivadas parciales continuas para todo x 6= 0 tal queV (x) > 0, V (x) < 0, y V (x) →∞ cuando ||x|| → ∞. entonces el sistema autonomo(A.4) es completamente (globalmente) asintoticamente estable.

IV. teorema de Inestabilidad of Ceteav. Sea Ω una vecindad en el origen.Sea Ω` una region en Ω. Dada una funcion V (x) en Ω, entonces el equilibrio en elorigen es inestable si:

(a) V (x) posee derivadas parciales continuas en Ω`.

(b) V (x) y V (x) son definidas positivas en Ω`.

(c) V (x) = 0 en los puntos de frontera de Ω` dentro de Ω.

(d) El origen es un punto de frontera de Ω`. La figura A.5 ilustra el teorema deinestabilidad de Ceteav.

El teorema de inestabilidad de Ceteav se convierte en el denominado primer teoremade inestabilidad si Ω = Ω1`, cuando Ω es una cierta vecindad del origen. Si, en adiciona la condicion Ω = Ω`, la condicion V > 0 es reemplazada por:

V (x)− λV (x) ≥ 0 ∀ t ≥ 0 ∀ x ε Ω

donde λ es una constante positiva, de este modo el teorema de inestabilidad de Ceteavse convierta en el denominado segundo teorema de inestabilidad. Las demostracionesde los teoremas descritos anteriormente se realizan basicamente en forma geometricaen [19], [3].


. .x 0

0 Ω

V = constant

V = 0

1Ω

Fig. A.5: Representacion grafica del teorema de estabilidad de Ceteav.

Teoremas de Estabilidad de Lyapunov para Sistemas no Autonomos

V. teorema de Estabilidad. El equilibrio en el origen es estable, si allı existeen alguna vecindad Ω del origen, una funcion de Lyapunov V (x, t).

VI. Teorema de Estabilidad Asintotica Uniforme. El equilibrio en el origenes uniformemente asintoticamente estable si la funcion definida positiva V (x, t) iesdecreciente (lo que significa que V esta dominado por una funcion definida positivaW (x) para algun t ≥ 0) y −V (x, t) es definida positiva(es decir, −V > 0) en Ω.

VII. Teorema de Inestabilidad. Sea Ω una vecindad del origen. Sea Ω` unaregion en Ω. Dada una funci2n V (x, t) en Ω, entonces el equilibrio del origen en eltiempo t0 es inestable si:

(a) V (x, t) posee derivadas parciales continuas en Ω`.

(b) V (x, t) y V (x, t) son definidas positivas en Ω1.

(c) V (x, t) = 0 para algun t ≥ t0 en los puntos de frontera de Ω` dentro de Ω.

(d) El origen es un punto de frontera de Ω` dentro de Ω.

En forma similar, el teorema de inestabilidad anterior se convierte en el deno-minado primer teorema de inestabilidad si Ω = Ω`, donde Ω es una cierta vecindaddel origen. Si en adicion a la condicion Ω = Ω`, la condicion V > 0 es reemplazadapor

V (x, t)− λV (x, t) ≥ 0 ∀ t ≥ t0 ∀ x ε Ω

donde λ es una constante positiva, entonces el teorema de inestabilidad se convierteen el denominado segundo teorema de inestabilidad. Las demostraciones de estosteoremas se pueden encontrar en [3].

Ejemplo A.5

Determine la estabilidad del sistema autonomo descrito en los ejemplos A.2 y A.3aplicando el metodo directo de Lyapunov.


Solucion: Del ejemplo A.2 podemos establecer que la funcion de Lyapunov V (e) =12Ce2 → ∞ cuando ||e|| → ∞. Por consiguiente, el sistema autonomo no linealdescrito en dicho ejemplo es completamente (globalmente) asintoticamente estable.

Del ejemplo A.3 podemos establecer que la funcion de Lyapunov:

V (x) =12Mx2 +

12K0x

2 +14K1x

4 →∞

cuando ||x|| → ∞. Por consiguiente, el sistema autonomo no lineal descrito en dichoejemplo es completamente (globalmente) asintoticamente estable.

Ejemplo A.6

Determine la estabilidad el sistema no autonomo descrito en el ejemplo A.4 aplicandoel metodo directo de Lyapunov.

Solucion: Del ejemplo A.4 se puede establecer que la funcion de Lyapunov:

V (x, t) =M

2(x + αx)2 +

12

(K0 +

12K2

1 −Mα2 + α b(t))

x2 →∞

conforme ||x|| → ∞, siempre que α > 0, b(t) > Mα, y b(t) < 2K0. Por consigu-iente, el sistema no autonomo descrito en tal ejemplo es completamente (globalmente)asintoticamente estable.

A.1.4. Teoremas del Conjunto Invariante

En aplicaciones relacionadas con sistemas de control, estabilidad asintotica es masimportante que estabilidad. Claramente, pequenas desviaciones de las salidas contro-ladas con respecto a senales de referencia deseadas se pueden cancelar como resultadode la operacion de un sistema asintoticamente estable. Sin embargo, la aplicacion delsegundo teorema de estabilidad nos conduce a menudo a la relacion −V ≥ 0 en lugarde la requerida condicion −V > 0 para estabilidad asintotica. Para tales casos, puedeser de gran utilidad emplear el denominado teorema del conjunto invariante atribuidoa La Salle [19] con la finalidad de obtener mas conclusiones acerca de la estabilidadasintotica.

Conjunto Invariante. Se dice que un conjunto G es el conjunto invariante de unsistema dinamico x = f(x) si cada trayectoria de estado x(t) que comienza desde unpunto x0 en G permanece en G para todo tiempo. por consiguiente, una trayectoriade estado cerrada en G es un conjunto invariante. De acuerdo a tal definicion, algunpunto de equilibrio es un conjunto invariante. El dominio de atraccion del punto deequilibrio es tambien un conjunto invariante.

VIII. Teorema del Conjunto Invariante Local. Considere el sistema dado en(A.3). Sea V (x) una funcion escalar con primeras derivadas parciales continuas. SeaΩ` una region acotada definida por V (x) < `, con ` > 0. Asumamos que:

V (x) ≤ 0 (A.5)


para todo x en Ω`. Sea R el conjunto de todos los puntos dentro de Ω` donde V (x) = 0,y sea M el mas grande conjunto invariante en R. Entonces, cada solucion x(t) en Ω`

tiende a M conforme t →∞.

Que M sea el conjunto invariante mas grande en R significa que M es la unionde todos conjuntos invariantes dentro de R. La interpretacion geometrica de esteteorema se ilustra en la figura A.6.

VV = l

M

R

x

x

x1

Ω

2

0

l

Fig. A.6: Interpretacion geometrica del teorema del conjunto invariante.

Si la condicion (A.5) se sustituye por

V (x) < 0 for all x 6= 0 in Ω` (A.6)

y el origen esta en Ω`, entonces tal origen es asintoticamente estable, y cada solucionen Ω` tiende hacia el origen conforme t →∞.

IX. Teorema del Conjunto Invariante Global. Considere el sistema dadoen (A.3) Sea V (x) una funcion escalar con primeras derivadas parciales continuas.Suponga que V (x) > 0 para todo x 6= 0 y V (x) ≤ 0. Sea R el conjunto de todoslos puntos donde V (x) = 0, y M el conjunto invariante mas grande en R. Entoncestodas las soluciones convergen completamente (globalmente) asintoticamente en Mconforme t →∞.

En vista de los teoremas del conjunto invariante, una funcion de Lyapunov Vtiene que desaparecer gradualmente. Esto es, V tiene que converger a cero debido aque V es acotado inferiormente. Demostracion de los teoremas del conjunto invariantese pueden encontrar en [19], [3].

Ejemplo A.7


Considere el sistema dinamico:

x1 = x1(x21 + x2

2 − 4)− 4x1x22

x2 = 4x21x2 + x2(x2

1 + x22 − 4)

para el punto de equilibrio x = 0 considere la funcion:

V (x) = x21 + x2

2

A lo largo de una trayectoria de estado, su derivada V es:

V (x) = 2(x21 + x2

2)(x21 + x2

2 − 4)

Observe que V (x) < 0 dentro de un cırculo de radio 2. Por consiguiente, usando elteorema de estabilidad II de Lyapunov, podemos inferir que el origen es asintotica-mente estable. Para ` = 4, la region Ω` definida por V (x) = x2

1+x22 < 4 es acotada y el

conjunto R es el origen, el cual es un conjunto invariante. Por consiguiente, cualquiertrayectoria que se inicia dentro del cırculo de radio 2 converge hacia el origen y estaregion constituye el dominio de atraccion.

Bibliografıa

[1] H. Goldstain, Mecanica Clasica, segunda edicion. Editorial Reverte, S.A., 1996,ISBN: 84-291-4306-8

[2] , Dinamica de Lagrange. McGraw-Hill de Mexico, S.A., 1972

[3] Jean-Jacques E. Slotine and Weiping Li, Applied Nonlinear Control, PrenticeHall, Englewood Cliffs, New Jersey 07632, 1991.

[4] K. S. Fu, R. C. Gonzales, and C. S. G. Lee, “Dinamica del Brazodel Robot,” Robotica, Control,Deteccion, Vision e Inteligencia, McGraw-Hill/Interamericana, Madrid, 1988.

[5] R. P. Paul, “Dynamics,” Robot Manipulators, Mathematics, Programming andControl, The MIT Press, Massachussets, 1982.

[6] J. J. Craig, “Manipulator Dynamics,” Introduction to Robotics, Addisson Wesley,2nd edition, 1989.

[7] Mohsen Shahinpoor, A Robot Engineering Textbook, Harper & Row, Publishers,New York, Cambridge, Philadelphia, and others, 1987.

[8] Murray R. Spiegel, Mathematical handbook, Shaum’s Outline Series, McGraw-Hill, Inc., New York et. al. 1991.

[9] V. I. Utkin, “Variable structure systems with sliding modes,” IEEE Trans. Au-tomat. Contr., vol. 22, pp. 2-22, Feb. 1993.

[10] J. Y. Hung, W. Gao, and A. Homaifa, “Variable structure control: a survey,”IEEE Trans. Ind. Electron., vol. 42, pp. 212-222, Feb. 1986.

[11] M. Vidyasagar, Nonlinear Systems Analysis (Second Edition), Prentice Hall,Englewood Cliffs, New Jersey 07632, 1993.

[12] W. F. Hughes and J. A. Brighton, Theory and Problems of Fluid Dynamics,Shaum’s outline series, McGraw-Hill, 2nd edition, Inc., 1991.

[13] Lin, Y. and E.D. Sontag, Lin, Y. and E.D. Sontag, “A universal formula forstabilization with bounded controls” Report 90-10, SYCON-Rutgers Center forSystems and Control, July 1990.

[14] Alberto Isidori, Nonlinear Control Systems (Second Edition), Springer-VerlagBerlin Heidelberg New York London Paris Tokyo Hong Kong, 1989.

142 BIBLIOGRAFIA

[15] M. G. Sofonov, Stability and Robustness of Multivariable Feedback Systems, TheMIT Press Cambridge, MA, and London, England, 1980.

[16] Katsuhiko Ogata, Designing Linear Control Systems with MATLAB, PrenticeHall, Englewood Cliffs, New Jersey 07632, 1944.

[17] Bernard Friedland, Control System Design. An Introduction to State-SpaceMethods, McGraw-Hill, Inc., New York St. Louis y otras, 1986.

[18] A. M. Lyapunov, Probleme general de la stabilite du mouvement. Reprinted inAnnals of Mathematics Study No. 17 (Princeton Univ. Press, Princeton, NewJersey) of the 1907 French translation of the fundamental Russian paper byLyapunov, published in 1892. 1980.

[19] Joseph La Salle and Solomon Lefschetz, Stability by Liapunov’s Direct MethodWith Applications, Academic Press new York, London, 1961.

[20] I. Gustavsson, “Comparison of different methods for identification of linear mod-els for industrial processes,” in Preprints IFAC Symp. on Identif., 1970, paper11.4.

[21] G. N. Saridis, “Comparison of five popular identification algorithms,” Automat-ica, vol. 10, no. 1, pp. 69–79, Jan. 1974.

[22] B. D. O. Anderson, “Exponential stability of linear systems arising from adaptiveidentification,” IEEE Trans. on Auto. Contr., 22-2 (1977).

[23] A. P. Morgan and K. S. Narendra, “On the uniform asymptotic stability ofcertain linear nonautonomous differential equations,” S.I.A.M. of Control andOptimization, 15 (1977).

[24] Olle I. Elgerd, Control Systems Theory, McGraw-Hill Kogakusha, Ltd., Tokyo,Auckland, Dusseldorf, and others, 1967.

[25] A. Barrientos, L. F. Penin, C. Balaguer, and R. Aracil, Fundamentos de Robotica,McGraw-Hill/Interamericana de Espana, S. A., Madrid, Buenos aires, Caracas,and others, 1997.

[26] A. F. Filippov, “Differential Eequations with discontinuous right-hand sides,”Mathematicheskii Sbornik, 51.1 (1960), in Russian. Trnaslated in English, Aw.Math. Soc. Trans., 62, 199 (1964). Addisson Wesley, 2nd edition, 1989.

[27] D. E. Koditschek, “Natural Motion for Robot Arms´´Proc. 23rd I.E.E.E. Conf.on Decision and Control, Las Vegas, p. 733, 1984.

[28] E. Bailey and A. Arapostathis, “Simple sliding mode control scheme applied torobot manipulators,” Int. J. Control, 1987, vol. 45, No. 4, p. 1197–1209.

[29] Lab-PC+ User Manual, National Instruments Corporation, Part Number320502B-01, August 1994.

[30] Eduardo F. Camacho y Carlos Bordons, Model Predictive Control, Springer-Verlag London Limited 1999.

BIBLIOGRAFIA 143

[31] D.M. Prett and M. Morari, “Shell Process Control Workshop,”Butterworths,1987.

[32] T. Alvarez, M. Sanzo, and C. Prada, “Identification and Constrained Multivaria-ble Predictive Control of Chemical Reactors,”4th IEEE Conference on ControlApplications, Albany, pages 21:577-582, 1977.

[33] Manfred Morari y Evanghelos Zafiriou, Robust Process Control. PTR PrenticeHall, Englewood Cliffs, New Jersey 07632, 1989.

[34] William H. Press, Brian P. Flannery y Saul A. Teukolosky, Numerical Recipesin C, Cambridge University Press, Cambridge, 1988.

[35] MathWorks, Inc., MATLAB Reference Guide, Prentice Hall, Englewood Cliffs,New Jersey, primera edicion, 1998.

[36] MathWorks, Inc., SIMULINK User’s Guide, Prentice Hall, Englewood Cliffs,New Jersey, primera edicion, 1996.

[37] Fang-Shiung Chen and Jung-Shan Lin, “Nonlinear backstepping design of robotmanipulators with velocity estimation feedback,”5th Asian Control Conference,July 2004, vol. 1, no. 6, pp 351–356. New Jersey 07632, 1989.

[38] R. De Keyser, “A Gentle Introduction to Model Based Predictive Control”. InPADI2 International Conference on Control Engineering and Signal Processing,Piura, Peru, 1998.

[39] A. Rojas-Moreno, Design of Self-tuning Controllers for Processes Having Multi-ple Unknown Time-varying Delays, Ph.D. Thesis, Utah State University, Logan,UT, 1995.

Indice alfabetico

Control cuadratico gaussiano, 50Controlador PI optimo, 51Controlador PI de realimentacion de

estados, 53Coordenadas generalizadas, 24

Ecuacion de Riccati, 55Ecuaciones de Lagrange, 24, 25

del Proceso MRT, 27

Funcion de costo cuadraticaaumentada, 54

Funcion lagrangiana, 24

Implementacion en tiempo real, 1

Manipulador robotico traslacional sub-actuado, 39

Manipulador robotico con articulacionelastica (MRAE), 17

Manipulador robotico de 1GDL, 11Manipulador robotico esferico subactu-

ado (MRES).–, 40Manipulador Robotico Translacional, 25Matrices de Covarianza, 54Matriz de ganancia de realimentacion

de estados aumentada, 53Matriz de ganancia del filtro de Kalman,

55Modelo de Lagrange, 19

del MRES, 40del MRTS, 39del sistema MRT, 30

Observabilidadcondicion de, 55matriz de, 55

Observador no lineal de estados, 54

Teorema de los ejes paralelos, 14

controlnlv10

Documents