Sei sulla pagina 1di 106

Instituto Politécnico Nacional

Centro de Investigación y Desarrollo de


Tecnología Digital

Maestría en Ciencias en Sistemas Digitales

Diseño de Control H∞ No Lineal para Regulación de Posición


y Control de Movimiento de Rueda Inercial

Tesis

Que para obtener el grado de


Maestro en Ciencias en Sistemas Digitales

Presenta:
Ing. Adrián Enrique Gómez Ruiz

Bajo la dirección de:


Dr. Luis Tupak Aguilar Bustos
M.C. Isaura González Rubio Acosta

Enero 2015 Tijuana, B.C., México


Agradecimientos

Al Instituto Politécnico Nacional (IPN) y al Consejo Nacional de Ciencia y


Tecnología (CONACYT) por el apoyo económico brindado.

Al Dr. Luis Tupak Aguilar Bustos y a la M.C. Isaura González Rubio Acosta por el
conocimiento y enseñanzas compartidas durante el desarrollo de este trabajo de tesis.

A los miembros del comité tutorial por sus comentarios y consejos que permitieron
cumplir oportunamente este proceso.

A mis compañeros de CITEDI por su apoyo y experiencias memorables que vivimos


juntos durante estos años de aprendizaje en el centro.

A mi familia, en especial a mis padres y mis hermanos, por su apoyo y comprensión a


través de esta importante etapa de mi vida personal y profesional.
Diseño de Control H∞ No Lineal para Regulación de Posición y Control de
Movimiento de Rueda Inercial

Resumen

En los últimos años ha existido un gran interés por el estudio de sistemas de péndulo
invertido, los cuales se han posicionado como una de las referencias más importantes
en control debido a su dinámica similar a varias aplicaciones físicas, en especial en el
campo de la robótica. Entre los dispositivos experimentales de péndulo invertido, el
péndulo con rueda inercial resulta de particular interés debido a su no-linealidad, sub-
actuación y una dinámica relativamente sencilla. En esta tesis se resuelve el problema
de regulación de posición del péndulo con rueda inercial basados en la teoría de control
H-infinito no lineal que es una técnica de control robusto. El objetivo es estabilizar el
péndulo en el punto de equilibrio superior y asegurar que permanezca allí a pesar de
la perturbaciones externas. Ya que las condiciones iniciales se encuentran lejos de la
región de atracción del punto de equilibrio deseado, se sintetiza un controlador híbrido
consistente en una parte de “swing-up” y otra de estabilización. Para la parte de swing-
up, se propone una trayectoria periódica de referencia generada por el oscilador de Van
der Pol, la cual es seguida por un controlador H-infinito no lineal que conduce al péndulo
a una región cercana al punto de equilibrio deseado. Para la parte de estabilización, se
conmuta a un regulador de posición H-infinito para el sistema linealizado que equilibra
el péndulo alrededor de este punto. Ambos controladores se sintetizan para el caso
de retroalimentación de estados y de salida. Se incluyen resultados experimentales
realizados en la plataforma Mechatronics Control Kit, que verifican el desempeño de
los controladores propuestos.

Palabras clave: Péndulo con rueda inercial, control H-infinito no lineal, control hí-
brido, retroalimentación de estados, retroalimentación de salida.
Nonlinear H∞ Control Design for the Position Regulation and Motion
Control of the Inertia Wheel Pendulum

Abstract

For the last years, there has been great interest on the study of inverted pendulum
systems, which have been ranked among the most important benchmarks in control
because of their dynamic similarity with several physical applications, especially in the
field of robotics. Among the inverted pendulum experimental devices, the inertia wheel
pendulum becomes particularly interesting because its non-linearities, underactuation,
and a relatively simple dynamics. In this thesis, we present the solution to the position
regulation problem for the inertia wheel pendulum using nonlinear H-infinity control
theory, which is a robust control technique. The main objective is to stabilize the
pendulum at the upright equilibrium point despite the external disturbances. Since the
initial conditions are far from the region of attraction of the desired equilibrium point,
a hybrid controller is synthesized consisting on a swing-up part and a stabilization part.
For the swing-up part, a reference periodic trajectory generated by the Van der Pol
oscillator is first proposed where a nonlinear H-infinity tracking controller is synthesized
to drive the trajectory of the pendulum to a region near the desired equilibrium point.
For the stabilization part, it is switched to a H-infinity position regulator for the
linearized system that balances the pendulum around this point. Both controllers are
synthesized assuming state and output measurements. Experimental results made on
the Mechatronics Control Kit platform are included, verifying the performance of the
proposed controllers.

Keywords: Inertia wheel pendulum, nonlinear H-infinity control, hybrid control,


state-feedback, output-feedback.
Índice general

Resumen IV

Abstract V

Índice General VI

Índice de Figuras VIII

Índice de Tablas X

1. Introducción 1
1.1. Estado del arte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.1. Sistemas tipo péndulo . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.2. Antecedentes en el control del péndulo con rueda inercial . . . . 8
1.1.3. Control H∞ no lineal y algunas aplicaciones en sistemas subac-
tuados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2. Objetivos de la tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.1. Objetivo general . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.2. Objetivos específicos . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3. Lista de contribuciones . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.4. Organización de la tesis . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2. Teoría de Control H∞ No Lineal 14


2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.2. Solución del problema de control H∞ de sistemas no lineales por medi-
ción de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2.1. Enunciado del problema . . . . . . . . . . . . . . . . . . . . . . 15
2.2.2. Solución del problema de atenuación local de la perturbación . . 20
2.2.3. Solución del problema de estabilidad asintótica local . . . . . . . 24
2.3. Solución del problema de control H∞ de sistemas no lineales por medi-
ción de salida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

vi
ÍNDICE GENERAL vii

2.3.1. Enunciado del problema . . . . . . . . . . . . . . . . . . . . . . 30


2.3.2. Solución del problema de control H∞ no lineal global . . . . . . 35
2.3.3. Solución del problema de control H∞ no lineal local . . . . . . . 36

3. Modelo Dinámico de Péndulo con Rueda Inercial y Definición del


Problema 43
3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.2. Modelo dinámico de péndulo con rueda inercial . . . . . . . . . . . . . 44
3.3. Descripción de la planta experimental . . . . . . . . . . . . . . . . . . . 49
3.3.1. Parámetros del sistema . . . . . . . . . . . . . . . . . . . . . . . 50
3.4. Enunciado del problema . . . . . . . . . . . . . . . . . . . . . . . . . . 51

4. Solución al Problema de Control H∞ por Retroalimentación de Esta-


dos para Estabilización del Péndulo 53
4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.2. Síntesis de controlador H∞ . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.2.1. Controlador de swing-up . . . . . . . . . . . . . . . . . . . . . . 54
4.2.2. Controlador de estabilización . . . . . . . . . . . . . . . . . . . 58
4.3. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . 60

5. Solución al Problema de Control H∞ por Retroalimentación de Salida


para Estabilización del Péndulo 66
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
5.2. Síntesis de controlador H∞ . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.2.1. Controlador de swing-up . . . . . . . . . . . . . . . . . . . . . . 67
5.2.2. Controlador de estabilización . . . . . . . . . . . . . . . . . . . 70
5.3. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . 73

6. Conclusiones y Trabajo Futuro 77


6.1. Comentarios y conclusiones . . . . . . . . . . . . . . . . . . . . . . . . 77
6.2. Artículos derivados de la investigación . . . . . . . . . . . . . . . . . . 78
6.3. Trabajo futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

A. Código para Simulaciones 86

B. Controlador en Simulink 94
Índice de figuras

1.1. El péndulo con rueda inercial. . . . . . . . . . . . . . . . . . . . . . . . 1


1.2. El péndulo simple. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3. Plano de fase del oscilador armónico simple. . . . . . . . . . . . . . . . 4
1.4. Plano de fase del péndulo simple. . . . . . . . . . . . . . . . . . . . . . 5
1.5. Sistemas tipo péndulo. . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.6. Sistemas tipo péndulo. . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.7. Dispositivos experimentales: péndulo invertido, pendubot, péndulo ro-
tativo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.1. Configuración para control H∞ con retroalimentación de estados. . . . 15


2.2. Configuración para control H∞ con retroalimentación de salida. . . . . 31

3.1. Representación esquemática del péndulo con rueda inercial. . . . . . . . 44


3.2. Mechatronics Kit de Quanser. . . . . . . . . . . . . . . . . . . . . . . . 49
3.3. Comunicación entre sistema y computadora . . . . . . . . . . . . . . . 50

4.1. Diagrama de bloques del controlador híbrido por medición de estados. . 54


4.2. Diagrama de bloques del controlador de swing-up por medición de estados. 56
4.3. Diagrama de bloques del control de estabilización por medición de estados. 58
4.4. Oscilador Van der Pol modificado . . . . . . . . . . . . . . . . . . . . . 61
4.5. Ángulo del péndulo y posición deseada. . . . . . . . . . . . . . . . . . . 62
4.6. Respuesta del sistema en lazo cerrado asumiendo retroalimentación de
estados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
4.7. Entrada de control. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
4.8. Errores de posición por retroalimentación de estados. . . . . . . . . . . 64
4.9. Plano de fase del péndulo asumiendo retroalimentación de estados. . . . 65
4.10. Evidencia de presencia de fricción seca en el mecanismo. . . . . . . . . 65

viii
ÍNDICE DE FIGURAS ix

5.1. Diagrama de bloques del controlador híbrido por medición de salida. . . 67


5.2. Diagrama de bloques del controlador de swing-up por medición de salida. 69
5.3. Diagrama de bloques del control de estabilización por medición de salida. 71
5.4. Ángulo del péndulo y posición deseada. . . . . . . . . . . . . . . . . . . 73
5.5. Respuestas del sistema en lazo cerrado. . . . . . . . . . . . . . . . . . . 74
5.6. Entrada de control. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.7. Errores de posición por retroalimentación de salida. . . . . . . . . . . . 75
5.8. Plano de fase del péndulo asumiendo retroalimentación de salida. . . . 76
5.9. Evidencia de presencia de fricción seca en el mecanismo. . . . . . . . . 76

B.1. Modelo de controlador híbrido en Simulink . . . . . . . . . . . . . . . . 94


B.2. Controlador en Simulink, parte de swing-up . . . . . . . . . . . . . . . 95
B.3. Controlador en Simulink, parte de estabilización . . . . . . . . . . . . . 95
Índice de tablas

3.1. Variables físicas del sistema. . . . . . . . . . . . . . . . . . . . . . . . . 45


3.2. Parámetros físicos de la planta experimental. . . . . . . . . . . . . . . . 51
3.3. Parámetros físicos del motor PITTMAN. . . . . . . . . . . . . . . . . . 51

4.1. Parámetros para experimento, retroalimentación de estados. . . . . . . 61

5.1. Parámetros para experimento, retroalimentación de salida. . . . . . . . 73

x
Capítulo 1

Introducción

En esta tesis se discute el modelado y control H∞ no lineal de un péndulo en posición


invertida conocido como péndulo con rueda inercial, mostrado en la Figura 1.1. Este
mecanismo fue presentado por primera vez en [45], y ha sido considerado uno de los
sistemas de péndulo más simples en términos de sus propiedades dinámicas y de con-
trolabilidad. A la vez, el Péndulo con Rueda Inercial exhibe varias propiedades, tales
como sub-actuación y no-linealidad, que lo hacen un sistema atractivo y útil para la
investigación y educación avanzada [8].

θ2

Rueda de
inercia
θ1

Péndulo

Figura 1.1: El péndulo con rueda inercial.

Desde un punto de vista mecánico, el Péndulo con Rueda Inercial es un péndulo


simple con un disco giratorio, o rueda de inercia, en su extremo. La rueda está acoplada

1
1.1 Estado del arte 2

al eje de un motor de corriente directa, mientras que el péndulo no está actuado. El par
de fuerzas acoplado entre la rueda y el péndulo, y generado por la aceleración angular
de la rueda se puede utilizar para controlar el movimiento del sistema. El péndulo con
rueda inercial también puede ser considerado como un péndulo simple en paralelo con
una inercia controlada por un par, por lo tanto un doble integrador [8].
Debido a sus características, el péndulo con rueda inercial puede usarse con técnicas
de control de diferentes niveles de complejidad. Algunos ejemplos de problemas que se
pueden estudiar con este sistema son los siguientes: modelado, identificación, control de
posición y velocidad, swing-up, entre otros. En los capítulos subsecuentes, el problema
abordado consiste en un controlador híbrido que combina seguimiento y regulación.

1.1. Estado del arte


El péndulo es uno de los ejemplos más importantes en dinámica y control, habiendo sido
estudiado de forma extensiva a través de los siglos. Galileo fue el primero en reportar
sus observaciones y estudio empírico del movimiento del péndulo simple. Él notó en
sus experimentos que un péndulo siempre regresa a una altura ligeramente inferior
a la que fue liberado y eventualmente llega al reposo tras una serie de oscilaciones
cada vez más pequeñas. También descubrió que el periodo de oscilación de un péndulo
es independiente del peso de la plomada, dependiendo sólo del largo del péndulo, y
que el periodo es casi independiente de la amplitud para amplitudes pequeñas. Todas
estas propiedades despertaron preguntas importantes en mecánica, las cuales fueron
contestadas posteriormente con la formulación de las leyes de movimiento de Newton
y otros trabajos posteriores.
Para iniciar, se presentan algunas propiedades de un péndulo simple como el mos-
trado en la Figura 1.2. Aquí, θ representa el ángulo del péndulo con respecto al eje
vertical, ` y M son el largo y la masa del péndulo, respectivamente; y g es la aceleración
de la gravedad (9.8 m/s2 en la superficie de la tierra). La ecuación de movimiento del
1.1 Estado del arte 3

péndulo simple es
g
θ̈ + sin(θ) = 0 (1.1)
`
La ecuación diferencial ordinaria (ODE) (1.1) es no lineal debido al término sin(θ).

mg

Figura 1.2: El péndulo simple.

Una forma de linealizarla es aproximando sin(θ) como θ, lo cual es valido para valores
pequeños de θ. De esta forma se obtiene el sistema lineal

θ̈ + ω 2 θ = 0 (1.2)

donde se define ω 2 = g/`. La ecuación (1.2) se conoce como oscilador armónico simple.
Es posible verificar por sustitución directa que la Ecuación (1.2) tiene la solución
general
θ̇(0)
θ(t) = θ(0) cos(ωt) + sin(ωt). (1.3)
ω
La tasa de cambio del oscilador armónico está dada por la expresión

θ̇(t) = θ̇(0) cos(ωt) − θ(0)ω sin(ωt) (1.4)

y un cálculo directo muestra que

1 2
θ2 (t) + θ̇ (t) = r2 (1.5)
ω2
1.1 Estado del arte 4

donde r2 = θ(0)2 + (θ̇(0)/ω)2 . La ecuación (1.5) es la ecuación de la elipse parametri-


zada por el tiempo. Esta curva parametrizada es llamada una trayectoria del sistema
oscilador armónico (véase Figura 1.3). La totalidad de estas trayectorias, una para ca-
da par de condiciones iniciales (θ(0), θ̇(0)/ω), es llamada el plano de fase del sistema.
Notar que el periodo de oscilación del oscilador armónico simple ω es independiente de
la amplitud.

.
θ

Figura 1.3: Plano de fase del oscilador armónico simple.

En la Ecuación (1.2) se mencionó que la forma linealizada de la ecuación del péndulo


sólo es válida para pequeñas oscilaciones del ángulo θ. A diferencia de la ecuación
para el oscilador armónico simple, no existe una solución general para la ecuación del
péndulo simple (1.1) para deslazamientos angulares arbitrariamente grandes análoga
a la Ecuación (1.3). Sin embargo una solución para este problema puede expresarse
haciendo uso de las integrales elípticas, pero ese tema está más allá del alcance de este
texto. Por lo tanto, para el modelo lineal el plano de fase del péndulo simple puede
ser generado por simulaciones numéricas como se muestra en la Figura 1.4. Se puede
obtener mayor conocimiento de este plano de fase considerando la función escalar

1 g
E = θ̇2 + (1 − cos(θ)) (1.6)
2 `

que es proporcional a la energía total (cinética + potencial) del péndulo simple. Al


1.1 Estado del arte 5

calcular la derivada con respecto al tiempo se obtiene

g
Ė = θ̇θ̈ + sin(θ)θ̇
`
g
 
= θ̇ θ̈ + sin(θ) . (1.7)
`

En la Ecuación (1.7) se observa que Ė = 0 a lo largo de las soluciones (θ = 0, θ̇ = 0) de


la ecuación del péndulo simple. Esto significa que la función E es constante a lo largo de
las trayectorias, es decir, las curvas de nivel de E son trayectorias. En mecánica clásica,
una función con estas características es llamada una primera integral de movimiento.
Cada trayectoria en la Figura 1.4 es, por lo tanto, una curva de nivel de la función E.
Esto proviene del hecho de que sin fricción viscosa la energía del péndulo es constante.
En los siguientes capítulos se incluyen más detalles sobre la dinámica del péndulo y
sistemas similares.

10

4
Velocidad angular

−2

−4

−6

−8

−10
−4 −2 0 2 4 6 8 10
Posición angular

Figura 1.4: Plano de fase del péndulo simple.

1.1.1. Sistemas tipo péndulo

Varios sistemas de ingeniería prácticos pueden modelarse de forma aproximada como un


sistema de péndulo. En el caso particular del péndulo invertido, éste ha sido considerado
1.1 Estado del arte 6

como uno de los puntos de referencia más importantes en robótica [10]. En biomecánica
el péndulo se usa con frecuencia para modelar la caminata bípeda [48]. La Figura 1.5a
muestra como en los robots bípedos la pierna fija en contacto con el suelo con frecuencia
se modela como un péndulo invertido, mientras que la pierna oscilante se comporta
como un péndulo simple suspendido libremente desde la cadera. De hecho, los estudios
de la dinámica de la postura humana y locomoción han encontrado que durante el
caminar los músculos de las piernas están activos primariamente durante los inicios de
la fase de oscilación, después de la cual se apagan y permiten a la pierna balancearse
libremente como un péndulo, contribuyendo en parte a la eficiencia de energía [8]. De
forma similar, permanecer de pie requiere control del balance (véase Figura 1.5b). La
llamada oscilación de postura resulta de los reflejos de elongación en los músculos, lo
cual es un tipo de estabilización por retroalimentación local de la dinámica del péndulo
involucrada en estar de pie. Al tratar de identificar los mecanismos de balanceo de
la postura humana de pie, las investigaciones con frecuencia utilizan como modelo
simplificado el péndulo invertido [21, 52].

θ1 θ2

Pierna oscilante
Pierna de postura (péndulo simple) ℓ
(péndulo invertido) mg

(a) Caminata bípeda o balística. (b) Postura humana.

Figura 1.5: Sistemas tipo péndulo.

Un cohete actúa como péndulo invertido balanceado sobre el vector de propulsión


del motor. Se requiere un control activo para mantener la altitud apropiada del cohete
durante el ascenso. La Figura 1.6a muestra un diagrama de un cohete cuyo ángulo de
inclinación Θ puede ser controlado durante el ascenso al variar el ángulo Ψ del vector
de propulsión. La dinámica de inclinación del cohete puede ser aproximada como un
1.1 Estado del arte 7

péndulo invertido controlado.


El diseño e implementación de sistemas de péndulo invertido móviles y robóticos
ha llamado mucho la atención recientemente [19, 28]. Tales sistemas han sido cons-
truidos en distintos laboratorios de investigación para estudiar problemas en control,
navegación autónoma, coordinación de grupos, entre otros. El transportador personal
Segway [58], mostrado en la Figura 1.6b, es uno de estos sistemas que ha alcanzado
éxito comercial. Basado en la entrada sensorial de los giroscopios montados en la base
del Segway, un sistema de control por computadora mantiene el balance mientras la
persona lo utiliza.

Dirección
Θ

Propulsión
Ψ

(a) Dirección de un cohete. (b) Transportador personal Segway.

Figura 1.6: Sistemas tipo péndulo.

Existen otros ejemplos de problemas de control en sistemas de ingeniería donde


la dinámica del péndulo provee información útil. La estabilización de grúas aéreas o
grúas de pórtico suele realizarse en base a un modelo tipo péndulo, el cual puede ser
un péndulo simple [44] o péndulo doble [43]. La estabilización de alabeo en navíos y
camiones puede modelarse de manera parcial como un péndulo invertido con longitud
variable. El movimiento de agitación de fluidos dentro de un contenedor (sloshing)
puede ser modelado como un péndulo simple o doble [18].
Finalmente, varios mecanismos experimentales se han desarrollado para ilustrar
1.1 Estado del arte 8

la dinámica de los péndulos y para facilitar el diseño e implementación de sistemas


de control. La más vieja de estas ideas es el péndulo invertido de carro y barra [31],
mostrado del lado izquierdo en la Figura 1.7. En este sistema, el punto de pivote del
péndulo se mueve de forma lineal para poder controlar el movimiento del péndulo.

θ y z

θ2
l l2 θ

l1 y
θ1 x
x ϕ

Figura 1.7: Dispositivos experimentales: péndulo invertido,


pendubot, péndulo rotativo.

Innovaciones posteriores de esta idea fueron el pendubot [9] y el péndulo rotativo o de


Furuta [23], mostrados en la Figura 1.7(centro, derecha). En estos dos dispositivos más
recientes el segundo eslabón (o eslabón distal) es un péndulo simple cuyo movimiento
es controlado por el movimiento rotacional (en vez de lineal) del primer eslabón (o
eslabón proximal). El pendubot está diseñado de forma que los ejes de rotación de los
dos eslabones sean paralelos, mientras que en el péndulo de Furuta, los ejes de rotación
son perpendiculares.

1.1.2. Antecedentes en el control del péndulo con rueda iner-


cial

El péndulo de rueda inercial (IWP, por sus siglas en inglés) es uno de los más recientes y
simples de los varios experimentos de péndulo debido a la simetría de la rueda acoplada
al extremo del péndulo. Como se observará en el Capítulo 3, esta simetría resulta en
menos no-linealidades de acoplamiento en las ecuaciones dinámicas de movimiento [8]
y por lo tanto un sistema más sencillo para analizar, simular y controlar. Un problema
1.1 Estado del arte 9

crítico e interesante del IWP es la estabilización del péndulo en la posición superior


debido a que el punto de equilibrio es inestable en lazo abierto y el sistema en lazo
cerrado puede ser sensible a perturbaciones no acopladas.
Existen en la literatura varios controladores locales diseñados para estabilizar el
péndulo con rueda inercial. Cuando fue estudiado por primera vez, Spong et al. [45]
presentaron una ley de control por retroalimentación de salida parcial. Olfati-Saber
[32] propuso estabilización asintótica de forma global del punto de equilibrio superior
usando el procedimiento estándar de backstepping. En su estrategia la magnitud de la
entrada de control incrementa con la norma de la condición inicial del estado.
Fantoni & Lozano [16] presentan un controlador de swing-up no lineal basado en
la energía total del sistema. Para el balanceo del péndulo alrededor de su posición
invertida inestable, diseñaron dos leyes de control que explotan la propiedad de pasivi-
dad de la dinámica completa del sistema Lagrangiano [17]. En la primera, la velocidad
angular de la rueda converge a cero, pero la rueda no se lleva necesariamente a una po-
sición angular deseada. En la segunda, la posición angular de la rueda converge a cero.
Usando el teorema de LaSalle demuestran que las trayectorias del sistema convergen
asintóticamente a una órbita homoclínica con ambas estrategias.
En [8], Block et al. muestran varias técnicas de control híbrido para el sistema.
Dan un enfoque importante a un tipo de controlador conmutado en donde la parte
de swing-up está también basada en la energía total del sistema [38], mientras que
para el control de estabilización prueban leyes de control basadas en combinaciones
de controladores proporcional, derivativo e integral. Para compensar los errores indu-
cidos por los sensores para la medición de la velocidad, se propone una estrategia de
retroalimentación de salida.
Ye et al. [57] proponen una técnica backstepping para sistemas no lineales en cascada
cuyos subsistemas controlados tienen una estructura feed-forward e incluyen términos
de alto orden. En su propuesta, un control pequeño es asignado primero para estabilizar
el subsistema controlado, seguido luego de un procedimiento simple de backstepping. En
vez de basar el diseño en funciones de Lyapunov, su estrategia usa un control pequeño
1.1 Estado del arte 10

para atenuar el término de alto orden en el subsistema. El análisis de estabilidad se


hace usando información de acotamiento para computar de forma explícita el término
de alto orden, y la estabilidad asintótica de forma global del sistema completo en lazo
cerrado se obtiene usando el criterio de estado acotado de entrada convergente.
López-Martínez et al. [29] consideran un controlador de estructura variable usando
una superficie de modos deslizantes no lineal para atenuar las perturbaciones en el
péndulo con rueda inercial. Su enfoque asegura estabilidad exponencial del punto de
equilibrio y estabilidad robusta ante incertidumbres paramétricas, evitando la aparición
de fenómenos no deseados como los ciclos límite.
Recientemente, Turker et al. [51] desarrollaron un procedimiento de estabilización
alternativo para una clase de sistemas mecánicos subactuados de dos grados de libertad
basado en un cambio de coordenadas, linealización de salida parcial y una función de
Lyapunov. Se alcanza estabilidad asintótica del punto de equilibrio en una región de
atracción grande y se prueba mediante el teorema de LaSalle.

1.1.3. Control H∞ no lineal y algunas aplicaciones en sistemas


subactuados

El control H∞ no lineal [1, 15, 22] es una herramienta usada ampliamente para resolver
diversos problemas de control robusto. En [12], se aplica al control de robots manipula-
dores, y se estudia especialmente la relación entre las ganancias individuales del control
PID, la tasa de rendimiento del control H∞ óptimo y la estabilidad entrada-a-estado
ante la perturbación extendida, para casos por retroalimentación de estado completo.
En [56], el problema de control de slosh en líquidos se modela como un péndulo
amortiguado. Se calcula una trayectoria de referencia para la posición y la elevación de
la superficie resolviendo un problema de control óptimo no lineal. Después se diseña
una ley de control H∞ retroalimentado para el modelo linealizado.
Westerberg et al. [55] consideran la planeación y control de movimiento para un
sistema mecánico subactuado de 3 DOF, en específico estudian los grados de libertad
1.2 Objetivos de la tesis 11

de rotación de un helicóptero. El diseño del controlador está basado en la linelización


transversa a lo largo de una trayectoria deseada y se asegura estabilidad exponencial
orbital.
Bentsman et al. [7] desarrollaron un regulador H∞ no suave para unidades de cal-
dera/turbina con zona muerta en el actuador. Sus resultados demuestran que este con-
trolador consigue un error de regulación en estado estable de cero, a la vez que reduce
las oscilaciones indeseables en las señales de control y salidas de la planta producidas
por el control H∞ lineal estándar.
Un esquema de control unificado no lineal y variante en el tiempo para servo siste-
mas de control de discos duros se propone en [50]. El problema consiste en los modos
de búsqueda de pista y seguimiento de pista. Para éste último modo están involucrados
modelos de perturbación y ruido; se diseña un controlador H∞ sub-óptimo de manera
que se alcance alta precisión de posicionamiento de los cabezales.
Por último, el método de control H∞ se utiliza en [49] para actuadores electro-
hidráulicos. El problema consiste en la supresión de la vibración en sistemas de sus-
pensión activa en vehículos. Los controladores obtenidos muestran robustez ante las
incertidumbres paramétricas y las no-linealidades inciertas de los actuadores.

1.2. Objetivos de la tesis

1.2.1. Objetivo general

Se aplicará la teoría de control H∞ no lineal para resolver el problema de regulación de


posición y control de movimiento en el sistema sub-actuado de dos grados de libertad
conocido como péndulo con rueda inercial sujeto a perturbaciones externas.

1.2.2. Objetivos específicos

Resolver el problema de regulación H∞ no lineal [2, 22] para la rueda inercial


asumiendo retroalimentación de salida.
1.4 Lista de contribuciones 12

Diseño y verificación de una señal de referencia oscilatoria mediante un generador


de Van der Pol modificado.

Resolver el problema de seguimiento H∞ no lineal para el control de swing-up de


la rueda inercial asumiendo retroalimentación de salida.

Resolver problema de regulación y seguimiento mediante el controlador híbrido


para la rueda inercial y verificación experimental en Mechatronics Kit .

Resolver problema de regulación y seguimiento mediante el controlador híbrido


para la rueda inercial, asumiendo retroalimentación de estados, y verificación
experimental en Mechatronics Kit .

1.3. Lista de contribuciones


Se proponen controladores de seguimiento en base a una referencia oscilatoria,
con compensación H∞ no lineal, para el swing-up del péndulo con rueda inercial
acercándolo al punto de equilibrio superior inestable, para los casos de retroali-
mentación de estados y de salida.

Se presentan reguladores de posición H∞ que estabilizan la rueda inercial alre-


dedor del punto de equilibrio superior, para los casos de retroalimentación de
estados y retroalimentación de salida.

Bajo los dos puntos anteriores, se proponen dos controladores híbridos asumien-
do retroalimentación de estados y de salida que llevan al sistema al punto de
equilibrio deseado a partir del reposo. El funcionamiento de ambos controladores
es comprobado mediante experimentos.
1.4 Organización de la tesis 13

1.4. Organización de la tesis


Este trabajo está organizado de la siguiente forma. En el Capítulo 2 se incluyen los
preliminares teóricos sobre soluciones al problema de control H∞ no lineal para siste-
mas autónomos, con retroalimentación de estados y retroalimentación de salida. En el
Capítulo 3 se muestra el desarrollo del modelo dinámico del sistema, las características
de la planta y el objetivo de control. El controlador híbrido H∞ por retroalimentación
de estados para la rueda inercial propuesto es diseñado y probado en el Capítulo 4. El
Capítulo 5 contiene el diseño y pruebas experimentales del controlador híbrido H∞ por
retroalimentación de salida para el sistema. Finalmente, las conclusiones se presentan
en el Capítulo 6.
Capítulo 2

Teoría de Control H∞ No Lineal

2.1. Introducción
En este capítulo se presenta la solución general al problema de control H∞ no lineal para
sistemas autónomos y continuos en el tiempo. La solución del problema se divide en
dos casos de acuerdo a la configuración del sistema retroalimentado: retroalimentación
de estados y retroalimentación de salida. Con fines didácticos, se ha decidido incluir el
desarrollo de la solución de cada problema con bases distintas.
En la Sección 2.2 se incluye el problema por retroalimentación de estados. El con-
tenido de esta Sección está basado en [3, cap. 5]. La estrategia divide el problema en
dos: alcanzar atenuación de la perturbación y lograr estabilidad asintótica, ambos de
forma local. Aliyu aborda el problema desde una perspectiva de la teoría de juegos
diferenciales [6] y luego desde un punto de vista disipativo no incluido en este trabajo,
pero que puede consultarse en [3, 20, 36].
El contenido del capítulo está organizado de la siguiente manera. En la Sección
2.3 se discute el problema por retroalimentación de salida. El desarrollo de la solución
se basa en los desarrollos de Isidori y Astolfi [22] y Aguilar et al. [2]. Primero se
resuelve el problema en forma global, para después encontrar las condiciones suficientes
y necesarias para la existencia de la solución local. Puede consultarse también [33] para

14
2.2 Solución del problema de control H∞ de sistemas no lineales por medición de estados 15

sistemas variantes en el tiempo, y [13] para sistemas periódicos en el tiempo.

2.2. Solución del problema de control H∞ de siste-


mas no lineales por medición de estados

2.2.1. Enunciado del problema

Primero se muestra la solución al problema H∞ con retroalimentación de estados.


El diseño para esta configuración se muestra en la Figura 2.1, donde la planta está
representada por un sistema en espacio de estados afín y causal definido en una variedad
suave n-dimensional X ⊆ Rn en las coordenadas locales x = [x1 , . . . , xn ]T :

ẋ = f (x) + g1 (x)w + g2 (x)u; x(t0 ) = x0

z = h1 (x) + k12 (x)u (2.1)

y = x + k21 (x)w

donde x ∈ X es el vector de estados, u ∈ U ⊆ Rm es la entrada de control de dimensión


m, que pertenece a un conjunto de controles admisibles U, w ∈ W es la señal de pertur-
bación, que pertenece al conjunto W ⊂ L2 ([t0 , ∞), Rr ) de perturbaciones admisibles, la
salida y ∈ Rn es el vector de estados del sistema que es medido directamente, y z ∈ Rl
es la salida a ser controlada. Antes de comenzar el desarrollo de este controlador, se
hacen las siguientes suposiciones con el fin de simplificarlo.

w z
Planta
u y=x
K

Figura 2.1: Configuración para control H∞ con retroalimentación de estados.


2.2 Solución del problema de control H∞ de sistemas no lineales por medición de estados 16

Suposición 2.2.1. Las funciones f : X → V ∞ (X ), g1 : X → Mn×r (X ), g2 : X →


Mn×m (X ), h1 : X → Rl , k12 : X → Ml×m (X ), y k21 : X → Mn×r (X ) se asumen
como funciones-C ∞ reales en x.

En la Suposición 2.2.1, V ∞ (X ) es una función de valores reales en X , V : Rn → R


diferenciable de clase C ∞ , donde C k denota el conjunto de funciones con un número
k de derivadas continuas [54, p. 5]. Por otra parte, el conjunto Mp×q (X ) representa el
anillo de matrices p × q sobre X . (Para la definición de anillo véase [14, cap. 4]).

Suposición 2.2.2. [3, p. 103] Se asume, sin pérdida de generalidad, que x = 0 es un


único punto de equilibrio del sistema (2.1) con u = 0, w = 0, y es tal que f (0) = 0,
h1 (0) = 0.

Suposición 2.2.3. [25] El sistema (2.1) está bien definido, esto es, para cualquier
estado inicial x(t0 ) ∈ X y cualquier entrada admisible u(t) ∈ U, existe una solución
única x(t, t0 , x0 , u) para (2.1) en [t0 , ∞) que depende continuamente en las condiciones
iniciales, o en otras palabras el sistema satisface el teorema de existencia y unicidad
local para ecuaciones diferenciales ordinarias (ODE).

Como se muestra en la Figura 2.1, para este tipo de sistema todos los estados de la
planta se encuentran accesibles y pueden ser medidos directamente para el propósito
del control retroalimentado. Con el fin de facilitar la explicación se comienza con el
concepto de estabilicidad suave y la definición de ganancia L2 del sistema (2.1).

Definición 2.2.1. [3, p. 104] (Estabilicidad suave). El sistema no lineal (2.1) es local
y suavemente estabilizable si existe una función-C 0 F : U ⊂ X → Rm , F (0) = 0, tal
que ẋ = f (x) + g2 (x)F (x) es local y asintóticamente estable. El sistema es suavemente
estabilizable si U = X .

Definición 2.2.2. [3] Se dice que el sistema no lineal (2.1) tiene localmente una ga-
nancia L2 de w(t) a z(t) en U ⊂ X , menor o igual a γ, si para cualquier condición
inicial x0 ∈ U y u fija, la respuesta z del sistema correspondiente a cualquier w ∈ W
2.2 Solución del problema de control H∞ de sistemas no lineales por medición de estados 17

satisface:
Z t1 Z t1
2
kz(t)k dt ≤ γ 2
kw(t)k2 dt + β(x0 ), ∀ t1 > t0 ,
t0 t0

para alguna función-C 0 acotada β : U → R tal que β(0) = 0. El sistema tiene ganancia
L2 ≤ γ si la desigualdad anterior es satisfecha para todo x ∈ X , o U = X .

Ya que el interés es diseñar una ley de control retroalimentado suave para hacer
el sistema asintóticamente estable, el requisito de estabilicidad suave para el sistema
(2.1) será fundamental para que exista la solución del problema. Después de todo lo
anterior, el problema en cuestión se define de la siguiente manera.

Definición 2.2.3. [3, p. 104] (Problema de Control H∞ (Subóptimo) No Lineal por


Retroalimentación de Estados (HINLRE)). El problema de control subóptimo H∞ por
retroalimentación de estados, o problema local de atenuación de perturbación con es-
tabilidad interna, para el sistema (2.1), consiste en encontrar una función estática de
control retroalimentado por estados de la forma

u = α(x, t), α : R+ × N → Rm , N ⊂X (2.2)

para alguna función suave α(x, t) dependiente de x(t) y posiblemente de t, tal que el
sistema en lazo cerrado:

ẋ = f (x) + g1 (x)w + g2 (x)α(x, t)


(2.3)
z = h1 (x) + k12 (x)α(x, t)

tiene, para todas las condiciones iniciales x(t0 ) ∈ N , ganancia localmente L2 desde
la señal de perturbación w(t) a la salida z(t) menor o igual que algún número dado
γ ∗ > 0 con estabilidad interna, o equivalentemente, el sistema en lazo cerrado consigue
atenuación local de la perturbación menor o igual a γ ∗ con estabilidad interna.

Estabilidad interna del sistema en la definición previa significa que todas las señales
internas en el sistema, o trayectorias, están acotadas, lo cual es también equivalente a
2.2 Solución del problema de control H∞ de sistemas no lineales por medición de estados 18

estabilidad local y asintótica del sistema en lazo cerrado con w = 0 en este caso. El
problema óptimo consiste en encontrar el valor γ ∗ > 0 mínimo para el cual la ganancia
L2 es mínima. Este problema, sin embargo, es más difícil de resolver.
Una forma de medir la ganancia L2 del sistema (2.1), consiste en excitarlo con una
entrada periódica wt1 ∈ W , donde W ⊂ W es el subespacio de funciones periódicas
continuas en el tiempo (por ejemplo, una señal sinusoidal), y medir la respuesta de
salida en estado estable zss (t) correspondiente a la respuesta en estado estable xss (t).
Entonces la ganancia L2 puede ser calculada de la siguiente manera

kzss kt1
sup
w∈W kwkt1

donde

1 1
1
Z t0 +t1
1
Z t0 +t1
2 2
2 2
kwkt1 = kw(s)k ds , kzss kt1 = kw(s)k ds .
t1 t0 t1 t0

Regresando al problema HINLRE, para derivar condiciones suficientes para la exis-


tencia de la solución del problema, Aliyu propone aplicar la teoría de juegos diferencia-
les [3, caps. 2, 5]. De acuerdo a este autor el problema de elegir una función de control
u(t) tal que la ganancia L2 del sistema en lazo cerrado de w(t) a z(t) sea menor o igual
a γ > 0, se puede formular como un juego diferencial de suma-cero de dos jugadores,
siendo u la decisión del jugador minimizante, w la decisión del jugador maximizante,
y la función objetivo:

1 Z t1
mı́n máxJ(u, w) = [kz(t)k2 − γ 2 kw(t)k2 ]dt, (2.4)
u∈U w∈W 2 t0

sujeto a las ecuaciones dinámicas (2.1) sobre un horizonte de tiempo finito t1 > t0 .
La función objetivo es una medición cuantitativa del rendimiento del sistema a tra-
vés del tiempo. Así pues, un controlador óptimo (u∗ , w∗ ) se define como un controlador
admisible que maximiza la función objetivo. Los problemas de juegos diferenciales re-
presentan una generalización de los problemas de control óptimo en casos donde existe
2.2 Solución del problema de control H∞ de sistemas no lineales por medición de estados 19

más de un controlador o jugador. En teoría de juegos y optimización, un juego de suma-


cero de dos jugadores es una representación matemática de una situación en la cual la
ganancia de uno de los participantes es equivalente a la pérdida del otro, y viceversa.
Si las ganancias y pérdidas de los participantes se suman, entonces el resultado es cero.
En contraste, en los juegos de suma no cero la suma total de ganancias y pérdidas de
los participantes es diferente de cero. A continuación se incluye la siguiente definición.

Definición 2.2.4. [42] Considérese la ecuación de estados

ẋ = f (x, u, v, t), x(0) = x0 ,

donde u y v denotan los controladores aplicados por los jugadores 1 y 2, respectivamen-


te. Se asume que
u(t) ∈ U, v(t) ∈ V, t ∈ [0, t1 ],

donde U y V son conjuntos convexos en R, y t1 > 0 es un horizonte de tiempo finito


especificado para el sistema. Considérese además la función objetivo

Z T
J(u, v) = S[x(T )] + F (x, u, v, t)dt,
0

donde el jugador 1 es maximizante y el jugador 2 es minimizante. Ya que la ganancia


del jugador 1 representa una pérdida para el jugador 2, tales juegos son denominados
juegos diferenciales de suma-cero. El problema consiste en encontrar trayectorias de
control admisibles u∗ y v ∗ tales que

J(u∗ (t), v(t)) ≥ J(u∗ (t), v ∗ (t)) ≥ J(u(t), v ∗ (t)).

La solución (u∗ (t), v ∗ (t)) se conoce como solución minimax.

En este punto, se propone separar el problema en dos sub-problemas: (i) lograr


atenuación de la perturbación en forma local y (ii) conseguir estabilidad asintótica
local. Para resolver el primer problema, se permite a w(t) variar sobre todos las po-
2.2 Solución del problema de control H∞ de sistemas no lineales por medición de estados 20

sibles perturbaciones incluyendo el “peor caso”, y se busca una función de control


retroalimentado u : X × R → U dependiente de la información del estado actual, que
minimice la función objetivo J(u, w) y se vuelva no-positiva para todo w comenzando
desde x0 = 0.

2.2.2. Solución del problema de atenuación local de la pertur-


bación

Aliyu propone que el sistema en lazo cerrado (2.3) tiene una ganancia localmente
L2 ≤ γ ∗ si se asume que para γ = γ ∗ existe una función de control retroalimentado
localmente definida u∗ : N × R → Rm , 0 ∈ N ⊂ X , la cual es posiblemente variante en
el tiempo, y genera una J(u, w) no-positiva para la peor perturbación posible w∗ ∈ W
(y por lo tanto para toda w ∈ W) para todo t1 > 0. Para esto nótese que

J(u∗ , w∗ ) ≤ 0 ⇒ kzkL2 [t0 ,t1 ] ≤ γ ∗ kwkL2 [t0 ,t1 ] ∀ t1 > 0.

Para derivar las condiciones suficientes para la existencia de la solución del primer
sub-problema, se define la “función de valor” para el juego V : X × [0, t1 ] → R como

1 Z t1
V (t, x) = ı́nf sup [kz(τ )k2 − γ kw(τ )k2 ]dτ (2.5)
u w 2 t

y luego se aplica el Teorema 2.4.2 de [3]. En consecuencia se obtiene el siguiente teorema.

Teorema 2.1. [3, Teorema 5.1.1] Considerar el problema de control HINLRE como
un juego diferencial de suma-cero con dos jugadores, con la función de costo (2.4). De
acuerdo con la Definición 2.2.4, un par de estrategias (u∗ (x, t), w∗ (x, t)) proveen, bajo
la estructura de información de retroalimentación, una solución de punto de equilibrio
para el juego tal que
J(u∗ , w) ≤ J(u∗ , w∗ ) ≤ J(u, w∗ ),

si la función de valor (2.5) para el juego V (t, x) es continuamente diferenciable y


2.2 Solución del problema de control H∞ de sistemas no lineales por medición de estados 21

satisface la ecuación diferencial parcial de Hamilton-Jacobi-Isaacs (EHJI):


( )
∂V ∂V 1 2 2 2
− (x, t) = mı́n sup (x, t)[f (x) + g1 (x)w + g2 (x)u] + (kzk − γ kwk )
∂t u w ∂x 2
( )
∂V 1 2 1 2 2
= sup mı́n (x, t)[f (x) + g1 (x)w + g2 (x)u] + kzk − γ kwk
w u ∂x 2 2
∂V
= (x, t)[f (x) + g1 (x)w∗ (x, t) + g2 (x)u∗ (x, t)]
∂x
1 1
+ kh1 (x) + k12 (x)u∗ (x, t)k2 − γ 2 kw∗ (x, t)k2 ; (2.6)
2 2

en donde V (x, t1 ) = 0.

A continuación, para encontrar el par de estrategias de retroalimentación (u∗ , w∗ )


que satisfagan la ecuación de Isaacs (2.6), se forma la ecuación Hamiltoniana para el
problema

1 1
H(x, p, u, w) = pT (f (x) + g1 (x)w + g2 (x)u) + kh1 (x) + k12 (x)uk2 − γ 2 kwk2 , (2.7)
2 2

y se busca un punto de equilibrio único (u∗ , w∗ ) tal que

H(x, p, u∗ , w) ≤ H(x, p, u∗ , w∗ ) ≤ H(x, p, u, w∗ ) (2.8)

para cada (u, w) y cada (x, p) donde p es la variable adjunta.


Ya que la función H(x, p, u, w) es C 2 tanto en u como en w, el problema anterior pue-
de ser resuelto aplicando las condiciones necesarias para un problema de optimización
sin restricciones. Un único inconveniente que podría surgir, sin embargo, es si la matriz
de coeficientes de u es singular. Este problema se profundiza en [3, cap. 9] donde se
resuelve usando dos aproximaciones: una modificación de las técnicas aquí mostradas,
o usando retroalimentación de alta ganancia para “casi desacoplar” la perturbación.
Tanto para el caso de retroalimentación de estados como el de salida, referirse a este
autor y a [5, 30] para la solución en sistemas no lineales afines; o a [41, 46, 47], para el
caso de los sistemas lineales.
2.2 Solución del problema de control H∞ de sistemas no lineales por medición de estados 22

En el presente caso, para evitar la posibilidad de que la matriz u sea singular será
necesaria la siguiente suposición.

Suposición 2.2.4. [3, p. 106] La matriz

T
R(x) = k12 (x)k12 (x)

es no singular para todo x ∈ X .

Bajo la Suposición 2.2.4, las condiciones necesarias para obtener u y w óptimas


provistas por el principio de mínimos/máximos [27] son

∂H ∗
(u , w) = 0
∂u
∂H
(u, w∗ ) = 0
∂w

para todo (u, w). La aplicación de estas condiciones da

u∗ (x, p) = −R−1 (x)(g2T (x)p + k12


T
(x)h1 (x)), (2.9)
1 T
w∗ (x, p) = g (x)p. (2.10)
γ2 1

Además, ya que por suposición R(x) es no-singular y por lo tanto positiva definida, y
γ > 0, el punto de equilibrio de arriba resulta ser un optimizador de J(u, w). Más aún,
es posible escribir

1 1
H(x, p, u, w) = H ∗ (x, p) + ku − u∗ k2R(x) − γ 2 kw − w∗ k2 , (2.11)
2 2

en donde
H ∗ (x, p) = H(x, p, u∗ (x, p), w∗ (x, p))

donde la notación kakQ representa aT Qa para cualquier a ∈ Rn , Q ∈ Rn×n . Sustitu-


2.2 Solución del problema de control H∞ de sistemas no lineales por medición de estados 23

yendo u∗ y w∗ por turnos en (2.11) muestra que

1
H(x, p, u∗ , w) = H ∗ (x, p) − γ 2 kw − w∗ k2
2
≥ H ∗ (x, p),
1
H(x, p, u, w∗ ) = H ∗ (x, p) + ku − u∗ k2R(x)
2
≤ H ∗ (x, p),

de tal forma que las condiciones de punto de equilibrio del juego diferencial indicadas
en la Definición 2.2.4 y representadas por la desigualdad (2.8) se satisfacen.
Ahora, asumir que existe una solución C 1 positiva semidefinida V : X → R para la
ecuación de Isaacs (2.6) definida en una vecindad N del origen, la cual se vuelve cero
en x = 0, es decir V (0) = 0, y es invariante en el tiempo (lo cual se considera plausible
ya que H(x, p, u∗ , w∗ ) también es invariante en el tiempo). Aliyu [3, p. 107] asegura
que si esta solución V existe, entonces las retroalimentaciones (u∗ , w∗ ) necesariamente
existen, y elegir una p tal que
!T
∂V
p= (x)
∂x
en (2.11) otorga la identidad:
 !T 
∂V ∂V 1
H x, (x) , w, u = (x)(f (x) + g1 (x)w + g2 (x)u) + kh1 (x) + k12 (x)uk2
∂x ∂x 2
1
− γ 2 kwk2
2
!T 
∂V 1 1
= H ∗ x, (x)  + ku − u∗ k2R(x) − γ 2 kw − w∗ k2 .
∂x 2 2

Finalmente, nótese que para u = u∗ y w = w∗ , la identidad anterior genera


 !T   !T 
∂V ∂V
H x, (x) , w∗ , u∗  = H ∗ x, (x) 
∂x ∂x

que, usando la igualdad (2.7), es exactamente el lado derecho de (2.6), y para que esta
2.2 Solución del problema de control H∞ de sistemas no lineales por medición de estados 24

ecuación se pueda satisfacer, V (x, t) debe ser tal que


 !T 
∂V
H ∗ x, (x)  = 0. (2.12)
∂x

La condición (2.12) es la EHJI invariante en el tiempo para el problema de atenuación


de perturbación. Integrando (2.12) a lo largo de las trayectorias del sistema en lazo
cerrado con α(x) = u∗ (x, (∂V (x)/∂x)T ) (independiente de t) iniciando desde t = t0 y
x(t0 ) = x0 , hasta t = t1 > t0 y x(t1 ) lleva a

1 Z t1 2
V (x(t1 )) − V (x0 ) ≤ (γ kwk2 − kzk2 )dt ≥ 0 ∀ w ∈ W.
2 t0

Esto significa que J(u∗ , w) es no-positivo para todo w ∈ W, y en consecuencia implica


que la ganancia L2 del sistema es menor o igual a γ. En consecuencia, también se
resuelve la parte (i) del problema de control H∞ subóptimo por retroalimentación de
estados.

2.2.3. Solución del problema de estabilidad asintótica local

Antes de considerar la parte (ii) del problema, y con el fin de simplificarlo, considérese
la siguiente suposición.

Suposición 2.2.5. [3, p. 107] El vector de salida h1 (x) y la matriz de peso k12 (x) son
tales que

T
k12 (x)k12 (x) = I

hT1 (x)k12 (x) = 0

para todo x ∈ X .

La suposición anterior implica que no existen términos de producto cruzado en


la función de costo (2.4) y que la matriz de peso en el control es la unidad. Bajo la
2.2 Solución del problema de control H∞ de sistemas no lineales por medición de estados 25

Suposición 2.2.5, la EHJI (2.12) se vuelve

" # !T
∂V 1 ∂V 1 ∂V 1
(x)f (x) + (x) 2 g1 (x)g1T (x) − g2 (x)g2T (x) (x) + hT1 (x)h1 (x) = 0
∂x 2 ∂x γ ∂x 2
(2.13)
y las retroalimentaciones (2.9), (2.10) se convierten en

!T
∗ ∂V
u (x) = −g2T (x) (x) (2.14)
∂x
!T
∗ 1 ∂V
w (x) = 2 g1T (x) (x) . (2.15)
γ ∂x

De esta forma, la condición (2.13) en conjunto con las retroalimentaciones asociadas


(2.14), (2.15) proporcionan una condición suficiente para la existencia de la solución del
problema H∞ subóptimo por retroalimentación de estados, en el horizonte de tiempo
infinito cuando t1 → ∞.
A continuación, se considera el problema de estabilidad asintótica para el sistema
en lazo cerrado (2.3), lo cual es parte (ii) del problema. Para esto, sea

!T
∗ ∂V
α(x) = u (x) = −g2T (x) (x) ,
∂x

donde V (x) es una solución suave positiva semidefinida de la EHJI (2.13). Entonces,
derivando V a lo largo de las trayectorias del sistema en lazo cerrado con w = 0 y
usando (2.13), se obtiene
!
∂V ∂V
V̇ (x) = (x) f (x) − g2 (x)g2T (x) (x)
∂x ∂x
1 1 1
= − ku∗ k2 − γ 2 kw∗ k2 − hT1 (x)h1 (x) ≤ 0,
2 2 2

donde se ha hecho uso de la EHJI (2.13). Así entonces, V̇ es no-creciente a lo largo


de las trayectorias del sistema en lazo cerrado, y por consiguiente el sistema es estable
en el sentido de Lyapunov. Aún así, para probar estabilidad asintótica de forma local,
2.2 Solución del problema de control H∞ de sistemas no lineales por medición de estados 26

será necesaria una suposición adicional sobre el sistema.

Definición 2.2.5. [3, p. 109] Se dice que el sistema no lineal (2.1) es localmente
detectable en estado-cero si existe una vecindad U ⊂ X de x = 0 para la cual, pa-
ra todo x(t0 ) ∈ U , si z(t1 ) ≡ 0, u(t1 ) ≡ 0 para todo t1 ≥ t0 , lo que implica que
lı́mt1 →∞ x(t1 , t0 , x0 , u) = 0. El sistema es detectable en estado-cero si U = X .

De este modo, si se asume que el sistema (2.1) es localmente detectable en estado-


cero, entonces puede verse que para cualquier trayectoria del sistema x(t1 ) ∈ U tal que
V̇ (x(t1 )) ≡ 0 para todo t1 ≥ ts para algún ts ≥ t0 , es necesario que u(t1 ) ≡ 0 y z(t1 ) ≡ 0
para todo t1 ≥ ts . Detectabilidad de estado-cero significa que lı́mt1 →∞ x(t1 ) = 0. Por
último, dado que x = 0 es el único punto de equilibrio del sistema en U , por el principio
de invarianza de LaSalle [24, Teorema 2.7], es posible concluir estabilidad asintótica de
forma local.
Este resultado se encuentra resumido como la solución del problema de control
sub-óptimo H∞ por retroalimentación de estados (HINLRE) en el siguiente teorema.

Definición 2.2.6. [35] Una función continua f : X → Y entre dos espacios topológicos
X, Y es llamada propia si la imagen inversa de cada subconjunto compacto de Y es un
subconjunto compacto de X.

Teorema 2.2. [3, Teorema 5.1.2] Considérese el sistema no lineal (2.1) y el problema
de control HINLRE para el sistema. Asumir que el sistema es suavemente estabilizable
y localmente detectable en estado-cero en una vecindad del origen N ⊂ X . Suponer
también que existe una solución suave positiva semidefinida para la EHJI (2.13) en N .
Entonces la ley de control

!T
∗ ∂V
u = α(x) = −g2T (x) (x) , x∈N (2.16)
∂x

resuelve el problema de control sub-óptimo HINLRE de forma local en la vecindad N .


Si además de esto, (2.1) es detectable en estado-cero de forma global y V es una función
propia, entonces u∗ resuelve el problema de forma global.
2.2 Solución del problema de control H∞ de sistemas no lineales por medición de estados 27

Demostración. La primera parte del teorema ya ha sido probada en los desarrollos an-
teriores. Respecto a la estabilidad asintótica global, nótese que, si V es propia, entonces
V es una solución global del problema de la EHJI (2.12), y el resultado se obtiene tras
aplicar el principio de invarianza de LaSalle.

La existencia de una solución C 2 , es decir doblemente diferenciable de forma conti-


nua, para la EHJI (2.13) está relacionada con la existencia de una variedad invariante
para el sistema Hamiltoniano correspondiente:

∂Hγ∗ (x,p)
 dx =


dt ∂p
XHγ∗ : (2.17)
 dp
 ∂H ∗ (x,p)
= − γ∂x ,

dt

donde
" #
1 1 1
Hγ∗ (x, p) = p f (x) + pT 2 g1 (x)g1T (x) − g2 (x)g2T (x) p + hT1 (x)h1 (x).
T
2 γ 2

Puede observarse entonces que, si V es una solución C 2 de la ecuación de Isaacs,


entonces derivando H ∗ (x, p) en (2.12) con respecto a x se tiene obtiene

!T
∂Hγ∗ ∂Hγ∗
! !
∂ ∂V
+ = 0,
∂x p= ∂V
T ∂p p= ∂V
T ∂x ∂x
∂x ∂x

y ya que la matriz Hessiana


!T
∂ ∂V
∂x ∂x
es simétrica, implica que la sub-variedad
 !T 
 ∂V 
M= (x, p) : p = (x) (2.18)
 ∂x 
2.2 Solución del problema de control H∞ de sistemas no lineales por medición de estados 28

es invariante bajo el flujo del campo vectorial Hamiltoniano XHγ∗ , es decir,

!T
∂Hγ∗ ∂Hγ∗
! !
∂ ∂V
=− .
∂x p= ∂V
T ∂p p= ∂V
T ∂x ∂x
∂x ∂x

Con p = (∂V (x)/∂x)T , para alguna solución suave V ≥ 0 de la EHJI (2.13), la per-
turbación w∗ = γ −2 g1 (x)(∂V (x)/∂x)T , x ∈ X es referida como la peor perturbación
posible que afecta al sistema. De ahí el título de diseño del “peor caso” para el diseño
de control H∞ .
Ahora se especializarán los resultados del Teorema 2.4 para el sistema lineal

ẋ = Ax + B1 w + B2 u; x(0) = x0

z = C1 x + D12 u (2.19)

y = x + D21 w,

donde

∂f1
A= (0), B1 = g1 (0), B2 = g2 (0)
∂x
∂h1
C1 = (0), D12 = k12 (0), D21 = k21 (0), (2.20)
∂x

son matrices constantes. También, sea Tzw la función de transferencia w 7→ z, y asu-


miendo x(0) = 0. Entonces la norma H∞ del sistema de w a z se define de la siguiente
manera
kzk2
kTzw k∞ , sup
06=w∈L2 [0,∞) kwk2

Tras esto se tiene el siguiente Corolario para el Teorema 2.2.

Corolario 2.2.1. [3, Corolario 5.1.1] Considérese el sistema lineal (2.19) y el problema
de control HINLRE para éste. Asumir que (A, B2 ) es estabilizable y (C1 , A) es detec-
table. Además, suponer que para algún γ > 0, existe una solución simétrica positiva
2.2 Solución del problema de control H∞ de sistemas no lineales por medición de estados 29

semidefinida P ≥ 0 a la ecuación algebraica de Riccati


" #
T 1
PA + A P + C1T C1 + P 2 B1 B1T − B2 B2T P = 0. (2.21)
γ

Entonces la ley de control


u = −GT2 P x

resuelve el problema de control HINLRE para el sistema (2.19), es decir, vuelve su nor-
ma H∞ menor o igual a un número prescrito γ > 0, y (F −G2 GT2 P ) es asintóticamente
estable o Hurwitz.

Notar que las suposiciones (A, B2 ) estabilizable y (C1 , A) detectable en el corolario


anterior, realmente garantizan la existencia de una solución simétrica P ≥ 0 para la
ecuación de Riccati (2.21) [59]. Aún más, cualquier solución P = P T ≥ 0 de (2.21)
es estabilizante. Además de esto, si (C1 , A) es detectable, gracias al equivalente lineal
de la suposición de detectabilidad en estado-cero para el caso no lineal, se sabe que el
sistema no tiene un modo estable no-observable en el eje jω.
El opuesto del Corolario 2.2.1 también se cumple, como se establece en el siguiente
teorema también conocido como el lema de la cota real [26].

Teorema 2.3. [3, Teorema 5.1.3] Supóngase que (C1 , A) es detectable y sea γ > 0.
Existe entonces un control retroalimentado lineal

u = Kx

tal que el sistema en lazo cerrado (2.19) con esta retroalimentación es asintóticamente
estable y tiene ganancia L2 ≤ γ sí, y sólo sí, existe una solución P ≥ 0 para (2.21).
Además, si P = P T ≥ 0 es tal que
!
1
σ A− B2 B2T P + 2 B1 B1T P ⊂ C− ,
γ

donde σ(·) indica el espectro de (·), entonces kTzw k∞ < γ.


2.3 Solución del problema de control H∞ de sistemas no lineales por medición de salida 30

Finalmente, de acuerdo con el lema de la cota real estricto (véase [4] o [11, p. 295])
la Ecuación (2.21) asegura que existe una constante positiva ε0 tal que la ecuación
algebraica de Riccati perturbada
" #
1
Pε A1 + AT1 Pε + C1T C1 + Pε B1 B1T − B2 B2T Pε + εI = 0 (2.22)
γ2

tiene una solución única, simétrica, positiva definida Pε para cada ε ∈ (0, ε0 ). Basado
en esto se construye el siguiente controlador.

Teorema 2.4. [2] Asúmase que la condición (2.21) se satisface para el sistema autó-
nomo (2.1), y sea Pε una solución positiva definida de (2.22) bajo algún valor ε > 0.
Entonces la retroalimentación de salida invariante en el tiempo

u = −g2T (x)Pε x (2.23)

es una solución local del problema de control HINLRE.

2.3. Solución del problema de control H∞ de siste-


mas no lineales por medición de salida

2.3.1. Enunciado del problema

En esta sección se desea resolver el problema con retroalimentación de salida, por lo


cual se desea sintetizar un controlador dinámico basado en observador mostrado en la
Figura 2.2. Para esto, considérese un sistema en espacio de estados causal, afín no-
lineal definido en una variedad suave n-dimensional X ⊆ Rn en las coordenadas locales
x = [x1 , . . . , xn ]T :

ẋ = f (x) + g1 (x)w + g2 (x)u,

z = h1 (x) + k12 (x)u, (2.24)

y = h2 (x) + k21 (x)w,


2.3 Solución del problema de control H∞ de sistemas no lineales por medición de salida 31

donde x ∈ X es el vector de estados, u ∈ U ⊆ Rm es la entrada de control de dimensión


m, que pertenece al conjunto de controladores admisibles U, w ∈ W es la señal de
perturbación desconocida, que pertenece al conjunto W ⊂ L2 ([t0 , ∞), Rr ), z ∈ Rl es la
salida desconocida a ser controlada, y ∈ Y ⊂ Rp es la única medición disponible del
sistema. Por simplicidad, para el sistema referido y a lo largo de esta sección, se hacen
las siguientes suposiciones.

w z
Planta
u y
K

Figura 2.2: Configuración para control H∞ con retroalimentación de salida.

Suposición 2.3.1. Las funciones f : X → V ∞ (X ), g1 : X → Mn×r (X ), g2 : X →


Mn×m (X ), h1 : X → Rl , h2 : X → Rp , k12 : X → Ml×r (X ), y k21 : X → Mp×r (X )
son localmente Lipschitz continuas en x para todo t.

Al igual que en la sección anterior, V ∞ (X ) es una función de valores reales en (X ),


diferenciable de clase C ∞ , Mp×q (X ) representa el anillo de matrices p × q sobre X [3].

Suposición 2.3.2. El sistema (2.24) tiene un punto de equilibrio único en x = 0, tal


que f (0) = 0, h1 (0) = h2 (0) = 0 para todo t.

Suposición 2.3.3. Las matrices del sistema son tales que

hT1 (x)k12 (x) = 0,


T
k12 (x)k12 (x) = I,

k21 (x)g1T (x) = 0,


T
h21 (x)k21 (x) = I.
2.3 Solución del problema de control H∞ de sistemas no lineales por medición de salida 32

De acuerdo con [2], la Suposición 2.3.1 garantiza que el sistema dinámico anterior
sea bien definido, mientras está sujeto a entradas exógenas integrables. En el análisis
subsecuente se considera que todos los términos son suficientemente suaves. La Supo-
sición 2.3.2 asegura que el origen es un punto de equilibrio del sistema dinámico no
controlado (u = 0) y libre de perturbaciones (w = 0) (2.24). La Suposición 2.3.3 es
una versión simplificada no lineal de la heredada del problema de control H∞ estándar
[15]. La primera y tercera igualdades significan que no existen términos con productos
cruzados entre esas matrices. La segunda y cuarta indican que las matrices de peso son
la identidad en la función norma para z y y, respectivamente.
El problema en cuestión se establece entonces de la siguiente forma.

Definición 2.3.1. [2] (Problema de Control H∞ (Subóptimo) No Lineal por Retro-


alimentación de Salida (HINLRS)). Dada la representación del sistema (2.24) y dado
un número real γ > 0, se requiere encontrar, si es que existe, un compensador de
retroalimentación de salida invariante en el tiempo

u = K(ξ, t)
(2.25)
ξ˙ = F(y, ξ),

donde el estado interno ξ ∈ Ξ ⊆ Rs es una vecindad del origen, y K : Ξ × Rp → Rm ,


K(0, 0) = 0, F : Ξ × Rp → V ∞ (Ξ), F(0, 0) = 0, son funciones suaves que procesan la
variable y de la planta (2.24) y generan una acción de control apropiada u globalmente
(localmente) admisible tal que la ganancia L2 del sistema en lazo cerrado (2.24), (2.25)
sea menor a γ.

Definición 2.3.2. [2] (Controlador admisible). Se dice que el controlador (2.25) es


globalmente admisible si el sistema en lazo cerrado (2.24), (2.25) es asintóticamente
estable de forma global cuando w = 0. Por otra parte, el controlador será localmente
admisible si el sistema en lazo cerrado (2.24), (2.25) no perturbado es uniforme y
asintóticamente estable alrededor del origen.
2.3 Solución del problema de control H∞ de sistemas no lineales por medición de salida 33

Definición 2.3.3. [2] Se dice que el sistema (2.24), (2.25) tiene una ganancia L2 menor
que γ si la respuesta z, resultando de la perturbación w para un estado inicial x(t0 ) = 0,
ξ(t0 ) = 0, satisface
Z t1 Z t1
2
kz(t)k dt < γ 2
kw(t)k2 dt (2.26)
t0 t0

para todo t1 > t0 y todas las funciones continuas definidas por tramos w(t) = [w1 wy ]T .

En consecuencia, un controlador localmente admisible (2.25) constituye una solu-


ción local del problema de control H∞ si existe una vecindad U del equilibrio tal que
la desigualdad (2.26) sea satisfecha para todo t1 > t0 y todas las funciones continuas
definidas por tramos w(t) para las cuales las trayectoria del estado del sistema en lazo
cerrado correspondiente, comenzando desde el punto inicial x(t0 ) = 0 (y ξ(t0 ) = 0),
permanezcan en U para todo t ∈ [t0 , t1 ].
Ya que la información de uno o más estados no está disponible para su medición,
el método más simple a seguir es estimar los estados con un observador, y luego usar
este estimado para la retroalimentación. Siguiendo la propuesta de [3], para este estudio
considérese un estimador compuesto por una copia exacta de la dinámica de x, corregido
por un término proporcional al error de observación entre la salida real y de la planta
(2.24) y la salida estimada ŷ, descrito por las ecuaciones

ξ˙ = f (ξ) + g1 (ξ)w + g2 (ξ)u + G(ξ)[y − ŷ]


(2.27)
ŷ = h2 (ξ) + k21 (ξ)w,

donde G(ξ) es la matriz de ganancia de inyección de salida a ser determinada. Una ley
de control por retroalimentación de salida puede imponerse en el sistema basándose en
este estado estimado (y los resultados de la Sección 2.2) como:

!T
∂V
u = α2 (ξ) = −g2T (ξ) (ξ) , (2.28)
∂ξ

donde V resuelve la EHJI 2.13. Con la retroalimentación anterior, el estimador (2.27)


2.3 Solución del problema de control H∞ de sistemas no lineales por medición de salida 34

se convierte en
ξ˙ = f (ξ) + g1 (ξ)w + g2 (ξ)α2 (ξ) + G(ξ)[y − ŷ]. (2.29)

Ya que por lo general no se tiene un conocimiento explícito sobre la perturbación w,


una aproximación es remplazar su valor real por el del “peor caso”, el cual como se
señala en la Sección 2.2 está dado por

!T
∗ 1 ∂V
w = α1 (x) = 2 g1T (x) (x)
γ ∂x

para alguna γ > 0. Sustituyendo esta expresión en (2.29) y remplazando x por ξ,


resulta en el siguiente estimador equivalente para el peor caso

ξ˙ = f (ξ) + g1 (ξ)α1 (ξ) + g2 (ξ)α2 (ξ) + G(ξ)[y − h2 (ξ) − k21 (ξ)α1 (ξ)]. (2.30)

Considerando que el estado interno ξ converge a x, y en base a la Suposición 2.3.3,


se determina que k21 (ξ)α1 (ξ) = k21 (x)α1 (x) = 0. Por lo que el sistema en lazo cerrado
que describe la dinámica de la planta (2.24) y el controlador retroalimentado dinámico
(2.30), (2.28) queda expresado como

ẋ = f (x) + g1 (x)w + g2 (x)α2 (ξ)

ξ˙ = f (ξ) + g1 (ξ)α1 (ξ) + g2 (ξ)α2 (ξ) + G(ξ)[h2 (x) − h2 (ξ)] (2.31)

z = h1 (x) + k12 (x)α2 (ξ).

Si es posible elegir una matriz de ganancia G(ξ) tal que el sistema en lazo cerrado
(2.31) sea disipativo con una función de almacenamiento C 1 , con respecto a la tasa
de suministro s(w, z) = 21 (γ 2 kwk2 − kzk2 ) y es asintóticamente estable de forma local
alrededor de (x, ξ) = (0, 0), entonces se habrá resuelto el problema de control HINLRS
para (2.24).
2.3 Solución del problema de control H∞ de sistemas no lineales por medición de salida 35

2.3.2. Solución del problema de control H∞ no lineal global

A continuación se listan las hipótesis bajo cuales se deriva una solución global del
problema de control H∞ .
(H1) Existe una función positiva definida F (x) y una función suave, acotada en t,
positiva definida V (x), tal que la desigualdad Hamilton-Jacobi-Isaacs

∂V ∂V
+ f (x) + γ 2 α1T (x)α1 (x) − α2T (x)α2 (x) + hT1 (x)h1 (x) + F (x) ≤ 0 (2.32)
∂t ∂x

se cumple para casi todo t ∈ R con

!T
1 ∂V
α1 = 2 g1T (x) , (2.33)
2γ ∂x
!T
1 ∂V
α2 = − g2T (x) . (2.34)
2 ∂x

De aquí en adelante, V (x) está acotada en t y es positiva definida sí, y sólo sí, existen
funciones continuas, invariantes en el tiempo, positivas definidas V0 (x) y V1 (x) tal
que las desigualdades V0 (x) ≤ V (x) ≤ V1 (x) se cumplen para todo x ∈ Rn , t ∈ R y
V0 (x) → ∞ mientras x → ∞.
(H2) Existe una función continua definida por tramos G(t), y una función positiva
semidefinida Q(x, ξ) sujeta a que Q(0, ξ) es definida positiva, y una función suave,
acotada en t, positiva semidefinida W (x, ξ) sujeta a que W (0, ξ) está acotada en t y es
positiva definida, tal que la desigualdad Hamilton-Jacobi-Isaacs
!
∂W ∂W ∂W
+ fe (x, ξ) + hTe (x, ξ)he (x, ξ) + γ 2 φT (x, ξ)φ(x, ξ) + Q(x, ξ) ≤ 0 (2.35)
∂t ∂x ∂ξ

se cumple para todo t ∈ R con

feT (x, ξ) = ((fe1 )T , (fe2 )T ), (2.36)

fe1 = f (x) + g1 (x)α1 (x) + g2 (x)α2 (ξ),


2.3 Solución del problema de control H∞ de sistemas no lineales por medición de salida 36

fe2 = f (ξ) + g1 (ξ)α1 (ξ) + g2 (ξ)α2 (ξ) + G(t)(h2 (x) − h2 (ξ)), (2.37)

he (x, ξ) = α2 (ξ) − α2 (x), (2.38)


 T 
∂W
1 T
φ(x, ξ) = g (x)  ∂x T  , (2.39)
 
2γ 2 e ∂W
∂ξ
 
g1 (x) 
ge (x) = 
 . (2.40)
G(t)k21 (x)

Bajo las Hipótesis (H1) y (H2) una solución del problema de control H∞ expuesto
anteriormente es la siguiente.

Teorema 2.5. [2, Teorema 1] Supóngase que las Hipótesis (H1) y (H2) se satisfacen.
Entonces la retroalimentación de salida

ξ˙ = f (ξ) + g1 (ξ)α1 (ξ) + g2 (ξ)α2 (ξ) + G(t)[y(t) − h2 (ξ)],

u = α2 (ξ) (2.41)

estabiliza asintóticamente de forma global el sistema libre de perturbaciones (2.24) y


hace la ganancia L2 del sistema en lazo cerrado (2.31) menor a γ.

La prueba del Teorema 2.5 puede encontrarse en [33]. Nótese que el Teorema 2.5
asegura la existencia de un controlador estabilizante de retroalimentación de medición
bajo ninguna condición de estabilicidad-detectabilidad, por lo tanto removiendo la
necesidad de verificar explícitamente estas condiciones. En lo sucesivo, este Teorema
será fundamental en el análisis local del problema en cuestión.

2.3.3. Solución del problema de control H∞ no lineal local

Para el análisis local se asume lo siguiente:

Suposición 2.3.4. Para todo t ∈ R las funciones f1 (x), g1 (x), g2 (x), h1 (x), h2 (x),
k12 (x), k21 (x) son doble y continuamente diferenciables en x localmente alrededor del
2.3 Solución del problema de control H∞ de sistemas no lineales por medición de salida 37

origen x = 0, mientras que sus derivadas de primer y segundo orden son continuas
definidas por tramos y uniformemente acotadas en t para todo x en alguna vecindad
del origen.

Las Suposiciones 2.3.1–2.3.4 permiten linealizar las desigualdades de Hamilton-


Jacobi-Isaacs correspondientes, así pues otorgando una solución local del problema de
control H∞ . El desarrollo subsecuente involucra el problema de control H∞ para el
sistema

ẋ = A1 x + B1 w + B2 u,

z = C1 x + D12 u,

y = C2 x + D21 w, (2.42)

donde

∂f1 ∂h1
A= (0), B1 = g1 (0), B2 = g2 (0), C1 = (0),
∂x ∂x (2.43)
∂h2
C2 = (0), D12 = k12 (0), D21 = k21 (0).
∂x

La solución al problema local es claro si el sistema lineal (2.42) es estabilizable y detec-


table desde u y y, respectivamente. Con base lo anterior, se introducen las siguientes
condiciones:
(C1) Existe una solución simétrica positiva semidefinida de la ecuación
" #
1
P A + AT P + C1T C1 + P 2 B1 B1T − B2 B2T P = 0 (2.44)
γ

tal que el sistema


h i
ẋ = A − (B2 B2T − γ −2 B1 B1T )P x(t) (2.45)

es asintóticamente estable.
2.3 Solución del problema de control H∞ de sistemas no lineales por medición de salida 38

(C2) Existe una solución simétrica positiva semidefinida de la ecuación


" #
1
A1 Z + ZAT1 + B1 B1T + Z 2 P B2 B2T P − C2T C2 Z = 0, (2.46)
γ

especificada con A1 = A + γ −2 B1 B1T P , tal que el sistema

ẋ = [A1 − Z(C2T C2 − γ −2 P B2 B2T P )]x(t) (2.47)

es asintóticamente estable.

Definición 2.3.4. [2] Se dice que los sistemas (2.45), (2.47) son asintóticamente esta-
bles si las matrices [A − (B2 B2T − γ −2 B1 B1T )P ] y [A1 − Z(C2T C2 − γ −2 P B2 B2T P )] tienen
todos sus valores propios con parte real negativa.

Debido a que se estudia el caso autónomo, las ecuaciones diferenciales de Riccati


(DRE) (vistas en [39]) se vuelven en las ecuaciones algebraicas de Riccati (ARE) (2.44),
(2.46) tras establecer Ṗ = 0, Ż = 0.
Las Condiciones (C1) y (C2) son conocidas de [15] como suficientes y necesarias para
que exista una solución del problema de control H∞ lineal para la versión invariante
en el tiempo del sistema (2.42). De acuerdo con el lema de la cota real estricto [11,
p. 295], descrito abajo, las condiciones (C1) y (C2) aseguran que existe una constante
positiva ε0 tal que el conjunto de ecuaciones algebraicas de Riccati perturbadas
" #
1
Pε A1 + AT1 Pε + C1T C1 + Pε 2 B1 B1T − B2 B2T Pε + εI = 0, (2.48)
γ
" #
T T 1 T T
Aε Zε + Zε Aε + B1 B1 + Zε 2 Pε B2 B2 Pε − C2 C2 Zε + εI = 0 (2.49)
γ

tengan una solución única, simétrica, positiva definida (Pε , Zε ) para cada ε ∈ (0, ε0 )
donde Aε = A1 + γ −2 B1 B1T Pε .

Definición 2.3.5. [4] (Lema de la cota real estricto). Supóngase que las condiciones
(C1) y (C2) se satisfacen. Existe entonces una ε0 > 0 tal que el sistema (2.48), (2.49)
2.3 Solución del problema de control H∞ de sistemas no lineales por medición de salida 39

tiene una solución única, positiva definida, simétrica (Pε (t), Zε (t)) para cada ε ∈ (0, ε0 ).

A continuación, (2.48), (2.49) se utilizan para derivar una solución local del proble-
ma de control H∞ no lineal para (2.24).

Teorema 2.6. [2, Teoremas 2, 3] Considérese el sistema invariante en el tiempo (2.24)


bajo las Suposiciones 2.3.1–2.3.4. Asúmase que las condiciones (C1) y (C2) se satisfa-
cen con una cierta γ > 0, y sea (Pε (t), Zε (t)) una solución simétrica positiva definida
de (2.48), (2.49) bajo algún ε > 0. Entonces las hipótesis (H1) y (H2) se cumplen en
forma local alrededor del equilibrio (x, ξ) = (0, 0) con

V (x) = xT Pε x, (2.50)

W (x, ξ) = γ 2 (x − ξ)T Zε−1 (x − ξ), (2.51)


ε
F (x) = kxk2 , (2.52)
2
G = Zε C2T , (2.53)
ε 2
Q(x, ξ) = γ 2 mı́n Zε−1 kx − ξk2 , (2.54)

2 t∈R

y el compensador de retroalimentación de salida invariante en el tiempo


" #
1
ξ˙ = f (ξ) + 2 g1 (ξ)g1T (ξ) − g2 (ξ)g2T (ξ) Pε ξ + Zε C2T [y − h2 (ξ)], (2.55)
γ
u = −g2T (ξ)Pε ξ (2.56)

es una solución local del problema de control H∞ con el nivel de atenuación de pertur-
bación γ.

Demostración. Primero, se demuestra que en una vecindad del origen x = 0 y para


todo t ∈ R la función V (x) = xT Pε (t)x, siendo diferenciable, acotada en t y positiva
definida por construcción, satisface la desigualdad de Hamilton-Jacobi-Isaacs (2.32)
2.3 Solución del problema de control H∞ de sistemas no lineales por medición de salida 40

sujeta a (2.52). De hecho,

∂V
= xT Ṗε x, (2.57)
∂t
∂V
f (x) = xT [Pε A1 + AT1 Pε ]x + ot (kxk2 ), (2.58)
∂x
1
γ α1 (x)T α1 (x) = 2 xT Pε B1 B1T Pε x + ot (kxk2 ),
2
(2.59)
γ
−α2T (x)α2 (x) = −xT Pε B2 B2T Pε x + ot (kxk2 ), (2.60)

hT1 (x)h1 (x) = xT C1T C1 x + ot (kxk2 ) (2.61)

donde por virtud de la Suposición 2.3.4, ot (kxk2 )/ kxk2 → 0 uniformemente en t mien-


tras kxk2 → 0. Entonces debido a (2.48), se tiene

∂V ∂V
+ f (x) + γ 2 α1T (x)α1 (x) − α2T (x)α2 (x) + hT1 (x)h1 (x)
∂t ∂x ( " #
1
≤ xT Ṗε + Pε A1 + AT1 Pε + Pε 2 B1 B1T − B2 B2 T Pε
γ

+ C1T C1 x + ot (kxk2 )

≤ −ε kxk2 + ot (kxk2 )
ε
≤ − kxk2 (2.62)
2

para todo t ∈ R y kxk suficientemente pequeña. Por lo tanto, la hipótesis (H1) se


cumple localmente con V (x) y F (x) definidas por (2.50) y (2.52).
Tras esto, obsérvese que por construcción la función (2.51) es suave, acotada en t,
positiva semidefinida, y tal que W (x, ξ) está acotada en t y es positiva definida. Más
aún, en una vecindad del origen (x, ξ) = (0, 0) y para todo t ∈ R, W (x, ξ) satisface la
desigualdad de Hamilton-Jacobi-Isaacs (2.32) sujeta a (2.53) y (2.54). De forma que

∂W
= γ 2 (x − ξ)T Żε−1 (x − ξ), (2.63)
! ∂t
∂W ∂W
fe (x, ξ) ≤ γ 2 (x − ξ)T {Zε−1 Aε + ATε Zε−1
∂x ∂ξ
2.3 Solución del problema de control H∞ de sistemas no lineales por medición de salida 41

− 2C2T C2 }(x − ξ) + ot (kx − ξk2 ), (2.64)

hTe (x, ξ)he (x, ξ) = (x − ξ)T [Pε B2 B2T Pε ](x − ξ) + ot (kx − ξk2 ), (2.65)

γ 2 φT (x, ξ)φ(x, ξ) = γ 2 (x − ξ)T {Zε−1 B1 B1T Zε−1 + C2T C2 }(x − ξ) (2.66)

+ ot (kx − ξk2 ) (2.67)

y tomando en consideración la ecuación


" #
1
−Żε−1 = Zε−1 Aε + ATε Zε−1 + 2 Pε B2 B2T Pε − C2T C2
γ
+ Zε−1 B1 B1T Zε−1 + εZε−2 , (2.68)

obtenida desde (2.49), se tiene


!
∂W ∂W ∂W
+ fe (x, ξ) + hTe (x, ξ)he (x, ξ) + γ 2 φT (x, ξ)φ(x, ξ)
∂t ∂x ∂ξ
( " #
1
2
≤ γ (x − ξ) T
Żε−1 + Zε−1 Aε + ATε Zε−1 2
Pε B2 B2T Pε − C2T C2
γ

+ Zε−1 B1 B1T Zε−1 (x − ξ) + ot (kx − ξk2 )

= −εγ 2 (x − ξ)T Zε−2 (x − ξ) + ot (kx − ξk2 )


ε 2
≤ − γ 2 mı́n Zε−1 kx − ξk2 (2.69)
2 t∈R

para todo t ∈ R y kxk, kx − ξk suficientemente pequeñas. Por lo tanto, la Hipótesis


(H2) se cumple localmente con W (x, ξ), G, y Q(x, ξ) definidos por (2.51), (2.53) y
(2.54), respectivamente.
Finalmente, aplicando el Teorema 2.5, se concluye que la retroalimentación de salida
(2.41), la cual, debido a (2.50)–(2.54), toma la forma (2.55), (2.56), es una solución
local del problema de control H∞ . De está forma queda probado el Teorema 2.6.

Así pues, las condiciones (C1) y (C2) aseguran la existencia de una solución local
del problema de control H∞ no lineal. Nótese que bajo las suposiciones apropiadas,
estas condiciones son suficientes y necesarias para que exista dicha solución [33]. En
2.3 Solución del problema de control H∞ de sistemas no lineales por medición de salida 42

efecto, asúmase que existe una solución local para el problema de control H∞ no lineal
tal que la ganancia L2 del sistema en lazo cerrado correspondiente (2.24) es menor
que γ y la aproximación lineal de la versión libre de perturbación de este sistema es
exponencialmente estable. Sigue entonces que (2.42) es estabilizable y detectable para
u y y, respectivamente. Más aún, tomando la Proposición 6 en [53] y extendiéndola a
sistemas variantes en el tiempo, se muestra que la ganancia L2 del sistema linealizado
correspondiente (2.42) también es menor que γ, y por lo tanto (ver [39]) las condiciones
(C1) y (C2) son satisfechas.
Capítulo 3

Modelo Dinámico de Péndulo con


Rueda Inercial y Definición del
Problema

3.1. Introducción
En este capítulo se presenta el modelo dinámico del péndulo con rueda inercial. Este
modelo es un conjunto de ecuaciones diferenciales que describen la manera en que se
produce el movimiento en un sistema mecánico debido a las fuerzas aplicadas a las
articulaciones mediante los actuadores. El desarrollo del modelo aquí presentado está
basado en las metodologías mostradas en [8, 16].
En la Sección 3.2 se obtienen las ecuaciones dinámicas del sistema siguiendo el
método de Euler-Lagrange [40]. Esta metodología presenta las dos ventajas siguientes:
primero, el planteamiento está basado en la energía del sistema así que sólo se requieren
funciones escalares y segundo, si el sistema consta de más de un cuerpo rígido, se puede
calcular la energía de cada uno de ellos de forma independiente para ser sumada luego.
En la Sección 3.3 se ofrece una descripción de la planta experimental y su funciona-
miento. Además se incluyen los parámetros físicos utilizados durante las simulaciones

43
3.2 Modelo dinámico de péndulo con rueda inercial 44

del sistema y la síntesis de los controladores presentados en los capítulos subsecuentes.


Finalmente, el enunciado de control del problema abordado en este trabajo se indica
en la Sección 3.4.

3.2. Modelo dinámico de péndulo con rueda iner-


cial
En la Figura 3.1 se muestra un esquema del péndulo con rueda inercial utilizado durante
este trabajo. En esta figura, la variable q1 representa el ángulo del péndulo, mientras
que q2 representa el ángulo de la rueda, ambos medidos en sentido anti-horario respecto
a la vertical. Se ha elegido esta convención de modo que, estando en reposo, ambos
ángulos sean iguales a cero, o en otras palabras, la condición inicial del sistema se
considera como (q1 , q2 ) = (0, 0).

Figura 3.1: Representación esquemática del péndulo con rueda inercial.

La plataforma experimental del péndulo con rueda inercial consta de dos encoders
ópticos como sensores de las posiciones angulares. Estos encoders son del tipo relativo,
por lo que siempre inician en cero y sólo miden el ángulo relativo entre su posición
actual y la inicial. Uno de estos sensores se encuentra unido a la base fija, con su
3.2 Modelo dinámico de péndulo con rueda inercial 45

rotor acoplado al péndulo, así que mide el ángulo relativo entre éste y la base fija. El
otro sensor está unido al motor en el otro extremo del péndulo, con su rotor acoplado
sobre la rueda de inercia, de forma que provee el ángulo relativo de la rueda respecto
al péndulo. Si se denotan los ángulos medidos por estos dos encoders como ϕp y ϕr ,
respectivamente, se tiene que

q 1 = ϕp (3.1)

q2 = ϕp + ϕr . (3.2)

El sistema es de dos grados de libertad, siendo el ángulo del péndulo q1 y el ángulo


de la rueda q2 las coordenadas generalizadas. El resto de los parámetros del sistema
están descritos en la Tabla 3.1.
Tabla 3.1: Variables físicas del sistema.

m1 :Masa del péndulo


m2 :Masa de la rueda
`1 :Longitud del péndulo
`c1 :Distancia al centro de masa del péndulo
Jp :Momento de inercia del péndulo
Jr :Momento de inercia de la rueda
q1 :Ángulo del péndulo respecto a la vertical
q2 :Ángulo de la rueda respecto a la vertical
τ :Par de fuerzas aplicado en la rueda

Definición 3.2.1. [40] Se consideran como coordenadas generalizadas aquellas que es-
pecifican por completo la configuración en el espacio (posición y orientación) de todos
los cuerpos rígidos de un sistema mecánico. Aquellas que pueden moverse libremente,
es decir, que no se encuentran sujetas a restricciones impuestas por las articulaciones,
se denominan coordenadas generalizadas independientes. El número de coordenadas ge-
neralizadas independientes es igual al número de grados de libertad (DOF) del sistema.

El desarrollo del modelo dinámico se hará mediante el método de las ecuaciones de


3.2 Modelo dinámico de péndulo con rueda inercial 46

Euler-Lagrange. Este método permite calcular las ecuaciones dinámicas de un sistema


mecánico de n grados de libertad en base solamente a sus coordenadas generalizadas
(q1 , . . . , qn ) y a una función escalar conocida como Lagrangiano, la cual se define como
la diferencia entre la energía cinética y la energía potencial de este sistema, es decir,

L(q1 , . . . , qn ) = K − U

donde el Lagrangiano L es una función de las coordenadas generalizadas y sus derivadas,


y K y U representan la energía cinética y potencial del sistema, respectivamente. Una
de las ventajas de utilizar este método es que permite calcular las energías para cada
cuerpo del sistema de forma independiente y luego sumarlas para formar las energías
totales del sistema.
Las ecuaciones de movimiento de Euler-Lagrange se obtienen luego en términos del
Lagrangiano de la forma
!
d ∂L ∂L
(qi , q̇i ) − (qi , q̇i ) = τi , i = 1, . . . , n (3.3)
dt ∂ q̇i ∂qi

donde qi son las coordenadas generalizadas, y τi son las fuerzas generalizadas aplicadas
en la dirección qi .
Una vez mencionado esto, el primer paso para obtener el modelo del péndulo con
rueda inercial consiste en calcular la energía cinética del sistema, definida en este caso
como la suma de la energía cinética del péndulo K1 y la de la rueda K2 , es decir

1
K1 = (m1 `2c1 + Jp )q̇12
2
1 1
K2 = m2 `21 q̇12 + Jr (q̇1 + q̇2 )2
2 2

Por lo tanto, la energía cinética total está dada por

K = K1 + K2
3.2 Modelo dinámico de péndulo con rueda inercial 47

1 1
= (m1 `2c1 + m2 `21 + Jp + Jr )q̇12 + Jr q̇1 q̇2 + Jr q̇22 . (3.4)
2 2

Después, el cálculo de la energía potencial, despreciando los efectos de la elasticidad,


está indicado por
U = (m1 `c1 + m2 `1 )g(1 − cos q1 ) (3.5)

donde g es la aceleración de la gravedad. Nótese que la energía potencial es cero cuando


el péndulo se encuentra colgado en el equilibrio estable hacia abajo, la cual es su
posición inicial. Como se aclara en [8], la energía potencial no depende de la posición
del rotor ya que su masa está distribuida simétricamente alrededor del eje de rotación.
A continuación se obtiene el Lagrangiano del sistema, el cual se define como la
diferencia entre (3.4) y (3.5), esto es

1 1
L = (Ja + Jr )q̇12 + Jr q̇1 q̇2 + Jr q̇22 − h(1 − cos q1 ) (3.6)
2 2

donde Ja = m1 `2c1 + m2 `21 + Jp y h = (m1 `c1 + m2 `1 )g.


Desarrollando las ecuaciones parciales requeridas para el cálculo del Lagrangiano
(3.3), se encuentra
" #
∂L d ∂L
= (Ja + Jr )q̇1 + Jr q̇2 = (Ja + Jr )q̈1 + Jr q̈2
∂ q̇1 dt ∂ q̇1
∂L
= −h sin q1
∂q1
" #
∂L d ∂L
= Jr q̇1 + Jr q̇2 = Jr q̈1 + Jr q̈2
∂ q̇2 dt ∂ q̇2
∂L
= 0.
∂q2

Sustituyendo luego estos términos en (3.3), se obtiene

(Ja + Jr )q̈1 + Jr q̈2 + h sin q1 = 0


(3.7)
Jr q̈1 + Jr q̈2 = τ
3.3 Modelo dinámico de péndulo con rueda inercial 48

De forma experimental, Block et al. [8] concluyeron que si bien el efecto de la fuerza
de fricción en el péndulo es menospreciable, en la rueda éste no es el caso. Identifican que
la fricción en la rueda tiene un componente de fricción de Coulomb y un componente
lineal a la velocidad, obteniendo el siguiente modelo aproximado

0.99 + 0.0116 q̇2 si q̇2 > 0



F = (3.8)

−0.97 + 0.0117 q̇

si q̇2 < 0
2

donde ω es la velocidad angular de la rueda.


Tomando en cuenta el sistema (3.7), la fricción en la rueda descrita por (3.8), y agre-
gando un componente de perturbación al sistema, las ecuaciones dinámicas finalmente
están dadas por
    
(Ja + Jr ) Jr  q̈1  h sin(q1 )
   +   = B(τ + w1 ) (3.9)
Jr Jr q̈2 Fr (q̇2 )
| {z }
J

donde τ (t) ∈ R es la entrada de control, w1 (t) ∈ R es el vector de perturbación


desconocido que se asume es doblemente integrable en el tiempo infinito (pertenece a
L2 ), t es el tiempo, I es la matriz de inercia que es definida positiva, Fr (q̇2 ) es la fuerza
de fricción descrita en (3.8), y B = [0, 1]T .
Por último, se obtiene una representación en espacio de estados del sistema. Para
esto se define el vector de estados [q1 q2 q̇1 q̇2 ]T y entonces (3.9) queda representado
de la forma    
 q1   q̇1 
   
d  q2  q̇2
   
 
  =   (3.10)
dt  
 q̇ 

−J1 (h sin q1 − Fr (x4 ) + τ + w1 )

 1
 
 
   
q̇2 J1 h sin q1 + J2 (−Fr (x4 ) + τ + w1 )

donde por simplicidad se definen J1 = Ja−1 y J2 = Ja−1 + Jr−1 .


3.3 Descripción de la planta experimental 49

3.3. Descripción de la planta experimental


Durante esta investigación las pruebas experimentales se implementaron mediante el
Mechatronics Control Kit fabricado por quanser inc. (ver Fig. 3.2). Éste es un kit
de desarrollo creado para la investigación de control de sistemas en tiempo real. El
Mechatronics Kit puede configurarse para representar cuatro plantas distintas: control
de motor de corriente directa, pendubot, péndulo rotativo o de Furuta, y péndulo con
rueda inercial; siendo el último el enfoque de este trabajo.

Figura 3.2: Mechatronics Kit de Quanser.

A grandes rasgos, el hardware del sistema está controlado por una tarjeta de pro-
cesamiento digital de señales (PDS) modelo TMS320C6713DSK de texas instru-
mentsr y está programado como un sistema esclavo (denominado por los desarrolla-
dores como “modo dummy”), el cual cuenta con un algoritmo muy sencillo que sólo
cumple con las siguientes tareas básicas:

Adquisición de los datos proporcionados por los encoders.

Amplificación del modulador de ancho de pulso (PWM) para control del motor.
3.3 Descripción de la planta experimental 50

Recepción e interpretación de la señal de control recibida desde la computadora.

El objetivo de esta configuración es reducir la carga de trabajo de la tarjeta, de forma


que pueda funcionar más cerca del tiempo real y el procesamiento se realice en un
sistema externo. Más detalles sobre el funcionamiento de este modo y de la plataforma
en general pueden encontrarse en la documentación del proveedor en [37].
El procesamiento y control del sistema se llevan a cabo en una computadora perso-
nal mediante la plataforma matlab/simulinkr de mathworks, inc., usando espe-
cíficamente Real Time Workshop (RTW) y Real-Time Windows Target (WT). Para
utilizar el sistema, la computadora se comunica con la tarjeta PDS a través de dos
interfaces: el entorno de desarrollo Code Composer StudioTM (CCS) de Texas Instru-
ments utiliza un puerto USB para la programación y debugging; y MATLAB/Simulink
usan un puerto paralelo para el intercambio bidireccional de datos de entrada/salida.
La Figura 3.3 muestra un diagrama simplificado de este sistema de comunicación.

Figura 3.3: Comunicación entre sistema y computadora mediante el modo “dummy”.

3.3.1. Parámetros del sistema

Una vez establecido el modelo dinámico a seguirse y descrita la configuración de la


planta, se procede a determinar los parámetros del sistema. Los valores obtenidos por
medición de dimensiones y masas de los componentes se muestran en la Tabla 3.2.
Con los valores de la Tabla 3.2 se encuentran

Ja = 4.572 × 10−3 kg m2

J1 = 218.733
3.4 Enunciado del problema 51

Tabla 3.2: Parámetros físicos de la planta experimental.

Parámetro Valor Unidades


m1 0.2164 kg
m2 0.0850 kg
`1 0.1270 m
`c1 0.1173 m
Jp 2.233 × 10−4 kg m2
Jr 2.495 × 10−5 kg m2

J2 = 40080.16

h = 0.3545

Estos valores son los encontrados en [8] para el mismo sistema. Por último la Tabla
3.3 incluye los valores provistos por la hoja de datos del motor marca PITTMANr ,
modelo LO-COG 8x22.

Tabla 3.3: Parámetros físicos del motor PITTMAN.

k = 27.4 × 10−3 Nm/A Constante de Torque del Motor


R = 12.1 Resistencia del Inducido
Imax = 1.8 A Máxima Corriente del Motor
L = 0.00627 Inductancia
Tpico = 38.7 × 10−3 Nm Máximo Torque del Motor
Te = 0.5 ms Constante de Tiempo Eléctrica
ωmax = 822 rad/s Máxima Velocidad del Motor
Vmax = 22 V Máximo Voltaje del Motor

3.4. Enunciado del problema


En esta Sección se define el enunciado del problema de la tesis. Dado el sistema sub-
actuado de péndulo invertido con rueda inercial descrito por el sistema de ecuaciones
3.4 Enunciado del problema 52

dinámicas (3.9), el objetivo de control consiste en estabilizar asintóticamente el ángulo


del péndulo q1 (t) en el punto de equilibrio superior deseado π rad, esto es,

lı́m kq1 (t) − πk = 0 (3.11)


t→∞

para todo tiempo t > 0, comenzando desde la condición inicial q1 (0) = q2 (0) = q̇1 (0) =
q̇2 (0) = 0 y a pesar de la perturbación externa w1 (t) ∈ R. Las posiciones angulares de
la rueda y el péndulo son las únicas mediciones disponibles para retroalimentación y
se encuentran corrompidas por el vector wy (t) ∈ R2 .
Capítulo 4

Solución al Problema de Control


H∞ por Retroalimentación de
Estados para Estabilización del
Péndulo

4.1. Introducción
El objetivo en este capítulo es diseñar un controlador H∞ para estabilizar el péndulo
en la posición superior a pesar de las perturbaciones externas y utilizando retroali-
mentación de estados, basada en la teoría que se mostró en la Sección 2.2. Ya que las
condiciones iniciales del sistema se encuentran lejos de la región de atracción del punto
de equilibrio deseado, se construye un controlador híbrido que consiste en una parte
de swing-up y una parte de estabilización (véase Figura 4.1).
Para el control de swing-up, se propone una trayectoria de referencia que conduce
al péndulo a la región de atracción del punto de equilibrio deseado. Para este caso se
utilizará un controlador H∞ no lineal para sistemas variantes en el tiempo [12] para
asegurar que las posiciones angulares no se desvíen de la trayectoria deseada. En la

53
4.2 Síntesis de controlador H∞ 54

∣q1∣
q1
q2 q
⃗ τ swing
IWP . Swing-up
q1
.
q2
qd
⃗ τ estab
Estabilización ±10
Van der Pol
τhib

Figura 4.1: Diagrama de bloques del controlador híbrido por medición de estados.

parte de estabilización, se linealiza el modelo alrededor del punto de equilibrio donde


un controlador H∞ lineal para sistemas autónomos [22] se aplica para estabilizar el
péndulo.
La señal de referencia para el control de swing-up se generará a través de un gene-
rador armónico asintótico [34]. Por último se realiza una verificación experimental del
controlador utilizando el péndulo con rueda inercial de Mechatronics Control Kit de
Quanser (veáse Figura 3.2).
Este capítulo está organizado de la siguiente forma. En la Sección 4.2 se sintetiza el
controlador híbrido para el péndulo con rueda inercial, en donde la parte de swing-up y
de estabilización se explican en 4.2.1 y 4.2.2, respectivamente. Para concluir el capítulo,
en la Sección 4.3 se presentan los resultados obtenidos tras aplicar este controlador en
la planta experimental.

4.2. Síntesis de controlador H∞

4.2.1. Controlador de swing-up

El papel del control de swing-up es conducir al péndulo dentro de la región de atracción


del punto de equilibrio deseado [q1e q2e q̇1e q̇2e ]T = [π 0 0 0]T , partiendo de la condición
inicial. Para este propósito, se tomó como referencia el oscilador armónico asintótico
4.2 Síntesis de controlador H∞ 55

propuesto por Orlov et al. [34], donde el oscilador de Van der Pol modificado
" ! #
q̇ 2
q̈d + α qd2 + d2 − ρ2v q̇d + µ2 qd = 0, α, ρv , µ > 0 (4.1)
µ

se usó para generar una trayectoria de referencia periódica para el péndulo. Aquí,
qd (t) ∈ R representa la trayectoria periódica deseada para el oscilador, el parámetro ρv
controla la amplitud del ciclo límite, µ controla su frecuencia, y α controla la velocidad
del transitorio del ciclo límite.
Ya que en esta etapa, el principal interés es solamente el comportamiento del pén-
dulo, para la síntesis del controlador de seguimiento H∞ , considérese el siguiente vector
de espacio de estados    
 x1   q 1 − qd 
x=  = . (4.2)
x3 q̇1 − q̇d

Entonces el modelo en lazo abierto (3.9), representado en términos del vector de estados
(4.2), toma la forma

ẋ1 = x3
(4.3)
ẋ3 = −J1 h sin(x1 + qd ) + J1 Fr (q̇2 ) − J1 w1 − J1 τ − q̈d .

donde J1 = Ja−1 . Debe señalarse que se asume que la velocidad de la rueda q̇2 permanece
acotada para todo t ∈ [0, ts ) donde ts es el instante de transición entre el controlador
de swing-up y el controlador de estabilización.
El objetivo entonces es diseñar un controlador de la forma

τ = −Ja (J1 h sin(x1 + qd ) − J1 Fr (q̇2 ) + q̈d + u − kp x1 − kd x3 ) (4.4)

que imponga en el sistema libre de perturbaciones las propiedades de estabilidad desea-


das alrededor de qd (t), mientras que también atenúe de manera local el efecto de las
perturbaciones. Por lo tanto, el controlador a construir consiste en un precompen-
sador, el atenuador de perturbaciones u(t), las ganancias proporcional y derivativa
4.2 Síntesis de controlador H∞ 56

(kp , kd > 0); que estabilicen internamente el sistema en lazo cerrado alrededor de la
trayectoria deseada.
En la Figura 4.2 se muestra un diagrama del esquema de control propuesto.

sin J 1h
q1 + x1
Σ −k p
− + +
q
⃗ q2 τ swing
+ u +
−g T2 P ε Σ −J −1
. Σ
x3
+ 1
q1
− ++
−k d
qd . ..
qd
⃗ qd
qd

. 0.99+ 0.116 q˙2


Fr
q2
∣q 1∣
−0.97+0.117 q̇2

Figura 4.2: Diagrama de bloques del controlador de swing-up por medición de estados.

A continuación, se confina el objetivo de diseño al control de movimiento donde

1. La salida a ser controlada está dada por


 
 u 
 
z= ρx1  (4.5)
 

 
 
ρx2

con un coeficiente de peso positivo ρ, y

2. Todos los estados del sistema, en este caso la posición y velocidad del péndulo,
se encuentran disponibles para retroalimentar y éstos se encuentran corrompidos
por wy (t) ∈ R2 , por lo que se define
 
x 1 + qd 
y=
  + wy (t). (4.6)
x3 + q̇d
4.2 Síntesis de controlador H∞ 57

El sistema (4.3)–(4.6) puede especificarse como en (2.1) con


 
x3
f (x) = 
 ,

(4.7)
−kp x1 − kd x3
   
 0 0 0
g1 (x) =  , g2 (x) =  ,

−J1 0 1
   
0  1 
h1 (x) = 
 , k12 (x) = 
 , (4.8)
ρx 02×1
 
 x1 + q d 
 
h2 (x) =  , k21 (x) = 02×1 I2 .
x3 + q̇d

De aquí en adelante, In y 0n×m representan la matriz identidad de dimensión n × n y


la matriz de ceros de dimensión n × m, respectivamente.
De este modo, una solución de la síntesis del controlador de seguimiento H∞ invo-
lucra el problema de control H∞ lineal estándar para el sistema autónomo linealizado
(2.19) donde las matrices (2.20) están dadas explícitamente por
 
 0 1 
A= , (4.9)
−kp −kd
   
0 0 0
B1 = 
 , B2 = 
 , (4.10)
−J1 0 1
   
01×2   1 
C1 =  , D12 =  ,
ρI2 02×1
 
C2 = I2 , D21 = 02×1 I2 .

Finalmente, aplicando el Teorema 2.4 sujeto a (4.7) y (4.9), se resuelve el problema de


control H∞ .
4.2 Síntesis de controlador H∞ 58

4.2.2. Controlador de estabilización

Para esta etapa, el sistema no lineal (3.9) será linealizado alrededor del punto de
equilibrio deseado. Por lo tanto la entrada de control τ será inyectada desde el control
H∞ (2.23) sin términos de compensación no lineal, es decir, τ = u. Ahora, considérese
el vector de estados    
 x1   q1 − π 
   
 x2   q2 
   
x=


 =

.
 (4.11)

 x3 


 q̇1 

   
x4 q̇2

Entonces el modelo en lazo abierto (3.10), representado en términos del vector de


estados (4.11), toma la forma

ẋ1 = x3

ẋ2 = x4
(4.12)
ẋ3 = −J1 h sin(x1 + π) + J1 Fr (x4 ) − J1 w1 − J1 u

ẋ4 = J1 h sin(x1 + π) − J2 Fr (x4 ) + J2 w1 + J2 u

donde Fr (x4 ) es la fuerza de fricción en la rueda tal como se define en (3.8), J1 = Ja−1
y J2 = Jr−1 + Ja−1 .
Un diagrama del controlador propuesto se observa en la Figura 4.3.

π

q1 + x1
Σ
q
⃗ x2 u=τestab
T
x3 −g P ε
2

x4

Figura 4.3: Diagrama de bloques del control de estabilización por medición de estados.
4.2 Síntesis de controlador H∞ 59

Esta vez se confina el objetivo de diseño a la regulación de posición donde la salida


a ser controlada está dada por  
u 
z=
 . (4.13)
ρx

Todos los estados del sistema se encuentran disponibles para retroalimentar y éstos se
encuentran corrompidos por wy (t) ∈ R4 , por lo que se define

 
 x1 + π 
 
 x2 
 
y=

 + wy (t).
 (4.14)

 x3 

 
x4

El sistema (4.12)–(4.14) puede especificarse como en (2.1) con


 
 x3 
 

 x4 

f (x) = 

,

−J h sin(x + π) + J1 Fr (x4 )
 1 1 
 
J1 h sin(x1 + π) − J2 Fr (x4 )
   
02×1 02×4   02×1 
   
g1 (x) =  −J1

01×4 

, g2 (x) =  −J1  ,
 
(4.15)
   
   
J2 01×4 J2
   
0  1 
h1 (x) =   , k12 (x) =  ,
ρx 04×1
 
 x1 + π 
 
 x2 
   
h2 (x) = 

,
 k21 (x) = 04×1 I4 .

 x3 

 
x4

Por lo tanto, una solución a la síntesis del regulador de posición H∞ involucra el


4.3 Resultados experimentales 60

problema de control H∞ lineal estándar para el sistema autónomo linealizado (2.19)


donde las matrices (2.20) están dadas explícitamente por
 
 0 0 1 0 
 
 0 0 0 1 


A=

,


 J1 h 0 0 J1 fr 

 
−J1 h 0 0 −J2 fr
   
02×1 02×4  02×1 
   
B1 =  −J1

01×4 

, B2 =  −J1  ,
 
(4.16)
   
   
J2 01×4 J2
   
01×4   1 
C1 =  , D12 =  ,
ρI4 04×1
 
C2 = I4 , D21 = 04×1 I4 .

Finalmente, el Teorema 2.4 asegura que si la condición (2.21) se satisface para el sistema
autónomo descrito por (4.15), (4.16), y siendo Pε una solución positiva definida de
(2.22) bajo algún ε > 0, entonces la retroalimentación de salida invariante en el tiempo
(2.23) es una solución local que resuelve el problema de control H∞ .

4.3. Resultados experimentales


Los siguientes resultados están basados en el péndulo de rueda inercial del Mechatronics
Control Kit instalado en el laboratorio de control de citedi, prototipo manufacturado
por quanser, inc., donde J1 = 218.733, J2 = 40080, h = 0.3545. Como se ha indicado
anteriormente, las condiciones iniciales se establecieron en q1 (0) = q2 (0) = 0 rad y
q̇1 (0) = q̇2 (t) = 0 rad/s. Los parámetros utilizados para el controlador híbrido por
retroalimentación de estados se indican en la Tabla 4.1. El comportamiento de la señal
de referencia para el seguimiento puede observarse en la Figura 4.4.
4.3 Resultados experimentales 61

Tabla 4.1: Parámetros para experimento, retroalimentación de estados.

α = 100
Ecuación de Van der Pol modificada ρv = 0.9π
µ=8
ρ = 1.1
Regulador H∞ para swing-up ε = 0.05
kp = 100
kd = 120
ρ = 1.1
Seguimiento H∞ para estabilización
ε = 0.1

3 25

20

2 15

10
1
dqd/dt (rad/s)

5
qd (rad)

0 0

−5

−1
−10

−15
−2
−20

−3 −25
0 2 4 6 8 10 −3 −2 −1 0 1 2 3
Tiempo (s) qd (rad)

(a) Tiempo (s) vs qd rad. (b) Plano de fase.

Figura 4.4: Oscilador producido por la ecuación de Van der Pol modificada con
parámetros α = 100, ρv = 0.9π, y µ = 8; inicializada en qd (0) = 0.1 y q̇d (0) = 0.

En el caso del controlador por retroalimentación de estados, los parámetros especi-


ficados para la ecuación de Van der Pol modificada (4.1) fueron α = 100, ρv = 0.9π y
µ = 8 (ver Fig. 4.4). Para el controlador de swing-up fueron arbitrariamente elegidos
ρ = 1.1, ε = 0.05, kp = 100, y kd = 120; y para el controlador de estabilización se
seleccionó ρ = 1.1, y ε = 0.1.
Las pruebas experimentales demostraron que existe una robustez menos fiable (des-
4.3 Resultados experimentales 62

crita como un menor porcentaje de éxito en la recuperación tras una fuerte perturba-
ción externa) de este controlador respecto al de retroalimentación de salida presentado
en el siguiente capítulo. Por tal razón este experimento se realizó principalmente sin
introducir perturbaciones externas fuertes al sistema (ver Figs. 4.5 y 4.6).
4

2
Ángulo del péndulo (rad)

−1

−2 q1
q
d

−3
0 1 2 3 4 5 6 7 8 9 10
Tiempo (s)

Figura 4.5: Ángulo del péndulo y posición deseada.


En particular, la Figura 4.6 muestra la respuesta de los estados del sistema bajo
el controlador híbrido propuesto. Como era de esperarse, el sistema no perturbado
alcanza de manera asintótica la posición deseada y permanece estable alrededor de este
punto de equilibrio durante el resto del experimento. La convergencia a esta posición
deseada ocurre aproximadamente en un tiempo ts = 6 s. Cabe destacar que todos los
experimentos realizados con este controlador tuvieron duración de 30 segundos, igual a
los del caso por retroalimentación de estados presentados en el siguiente Capítulo, sin
embargo, debido a que la respuesta en estado estable permanece casi inalterable para
todos los casos, por claridad se despliegan sólo los primeros 10 s.
Las Figuras 4.7 y 4.8 muestran el comportamiento de la señal de control y el error
de posición del péndulo a través del tiempo, respectivamente. Ambas figuras muestran
por separado los datos correspondientes al controlador de swing-up, el de estabilización
y el sistema híbrido, en ese orden.
Es importante observar que aunque el controlador de estabilización demanda una
4.3 Resultados experimentales 63

q1 (rad) 0

−5
0 1 2 3 4 5 6 7 8 9 10
5
q2 (rad)

−5
0 1 2 3 4 5 6 7 8 9 10
20
dq1/dt (rad/s)

−20
0 1 2 3 4 5 6 7 8 9 10
dq2/dt (rad/s)

2000

−2000
0 1 2 3 4 5 6 7 8 9 10
Tiempo (s)
Figura 4.6: Respuesta del sistema en lazo cerrado
asumiendo retroalimentación de estados.
Swing−up (Nm)

50

−50
0 1 2 3 4 5 6 7 8 9 10
4
x 10
Estabilización (Nm)

−1

0 1 2 3 4 5 6 7 8 9 10
Señal de control (EU)

10

−5

−10
0 1 2 3 4 5 6 7 8 9 10
Tiempo (s)

Figura 4.7: Entrada de control.


4.3 Resultados experimentales 64

10

Swing−up (rad)
5

−5

−10
0 1 2 3 4 5 6 7 8 9 10
Estabilización (rad)

0
0 1 2 3 4 5 6 7 8 9 10

10
Híbrido (rad)

−5

−10
0 1 2 3 4 5 6 7 8 9 10
Tiempo (s)
Figura 4.8: Errores de posición por retroalimentación de estados.

señal de control mucho mayor a la del control de swing-up , en la práctica ambas señales
se encuentran saturadas mediante software y hardware en un rango conformado por ±10
EU. Durante los experimentos, EU es una unidad arbitraria definida por el fabricante
de la plataforma y enviada al sistema como señal de control, donde éste se encarga de
convertirla apropiadamente en la señal PWM alimentada al motor (véase [37]).
El plano de fase del péndulo (posición respecto a velocidad) puede verse en la Figura
4.9, demostrando la estabilidad asintótica del péndulo alrededor del origen descrita
también por las Figuras 4.5 y 4.6.
De interés particular es el comportamiento del elemento de fricción en la rueda
Fr (q̇2 ) añadido al modelo. En la Figura 4.10 se observa del lado izquierdo su comporta-
miento respecto a la velocidad angular de la rueda, mientras que su evolución respecto
al tiempo se muestra en la gráfica del lado derecho.
4.3 Resultados experimentales 65

20

15

10

5
dq /dt (rad/s)

0
1

−5

−10

−15

−20
−3 −2 −1 0 1 2 3 4
q1 (rad)

Figura 4.9: Plano de fase del péndulo asumiendo retroalimentación de estados.

30 30

20 20

10 10
F (Nm)

Fr (Nm)

0 0
r

−10 −10

−20 −20

−30 −30
−2500 −2000 −1500 −1000 −500 0 500 1000 1500 2000 2500 0 1 2 3 4 5 6 7 8 9 10
x4 (rad/s) Tiempo (s)

(a) En función de q̇2 . (b) Evolución respecto al tiempo.

Figura 4.10: Evidencia de presencia de fricción seca en el mecanismo.


Capítulo 5

Solución al Problema de Control


H∞ por Retroalimentación de
Salida para Estabilización del
Péndulo

5.1. Introducción
En este capítulo se discute el diseño de un controlador H∞ para estabilizar el péndulo
en la posición superior a pesar de las perturbaciones externas y utilizando retroalimen-
tación de salida, cuya teoría se mostró en la Sección 2.3. Al igual que en el caso de
retroalimentación de estado, considerando que las condiciones iniciales del sistema se
encuentran lejos de la región de atracción del punto de equilibrio deseado, se deberá
diseñar un controlador híbrido que consiste en una parte de swing-up y una parte de
estabilización(véase Figura 4.1).
Para el control de swing-up, se utilizará la trayectoria periódica deseada propuesta
en el capítulo anterior que conduzca al péndulo a la región de atracción del punto
de equilibrio deseado. Para este caso se utilizará un controlador H∞ no lineal para

66
5.2 Síntesis de controlador H∞ 67

∣q1∣
q1
ξ
τ swing
IWP
q2
ξ̇=F ( y , ξ) ∫ Swing-up

qd
⃗ τestab
Van der Pol Estabilización ±10
τhib

Figura 5.1: Diagrama de bloques del controlador híbrido por medición de salida.

sistemas variantes en el tiempo [12] para asegurar que las posiciones angulares no se
desvíen de la trayectoria deseada. En la parte de estabilización, se linealiza el modelo
alrededor del punto de equilibrio, en donde un controlador H∞ lineal para sistemas
autónomos [22] se aplica para estabilizar el péndulo.
Este capítulo está organizado de la siguiente forma. En la Sección 5.2 se diseña el
controlador híbrido H∞ para el péndulo con rueda inercial por retroalimentación de
salida, en donde la parte de swing-up y de estabilización se describen en 5.2.1 y 5.2.2,
respectivamente. Para concluir el capítulo, los resultados obtenidos tras aplicar este
controlador en la planta experimental se muestran en la Sección 5.3.

5.2. Síntesis de controlador H∞

5.2.1. Controlador de swing-up

Se comienza diseñando la parte de swing-up del controlador H∞ para el péndulo con


rueda inercial. Una vez más e igual que en el caso por retroalimentación de estados
presentado en el capítulo anterior, se propone el oscilador de Van der Pol modificado
(4.1) para generar la trayectoria de referencia para esta etapa. Recordar que en la
etapa de swing-up sólo interesa el comportamiento del péndulo, por lo que el vector
de estados se define en (4.2) como [x1 x3 ]T = [q1 − qd q̇1 − q̇d ]T . En base a esto, el
5.2 Síntesis de controlador H∞ 68

modelo en lazo abierto del sistema está representado de la forma (4.3), esto es

ẋ1 = x3

ẋ3 = −J1 h sin(x1 + qd ) + J1 Fr (q̇2 ) − J1 w1 − J1 τ − q̈d ,

donde J1 = Ja−1 . De nueva cuenta se asume que la velocidad de la rueda q̇2 permanece
acotada para todo t ∈ [0, ts ), siendo ts el instante de transición entre el controlador de
swing-up y el de estabilización.
El objetivo entonces es diseñar un controlador de la forma

τ = −Ja (J1 h sin(ξ1 + qd ) − J1 Fr (ξ4 ) + q̈d + u − kp ξ1 − kd ξ3 ) (5.1)

que imponga en el sistema libre de perturbaciones las propiedades de estabilidad desea-


das alrededor de qd (t), mientras que también atenúe de manera local el efecto de las
perturbaciones. En la Ecuación (5.1), ξ ∈ R4 es el vector de estados observados cuya
dinámica está descrita por (2.55). Por lo tanto, el controlador a construir consiste en un
precompensador, el atenuador de perturbaciones u(t), las ganancias proporcional y de-
rivativa (kp , kd > 0); que estabilicen internamente el sistema en lazo cerrado alrededor
de la trayectoria deseada.
Un diagrama del esquema de control propuesto se muestra en la Figura 5.2.
A continuación, el objetivo de diseño es confinado al control de movimiento donde

1. La salida a ser controlada está dada por


 
 u 
z=  (5.2)
ρξ1

con un coeficiente de peso positivo ρ, y

2. La posición angular de la rueda y la del péndulo son las únicas mediciones dis-
ponibles para retroalimentar y éstas se encuentran corrompidas por wy (t) ∈ R2 ,
5.2 Síntesis de controlador H∞ 69

sin J 1h
ξ1 + x1
Σ −k p
− + +
ξ ξ2 τ swing
+ u +
T
−g P ε Σ −J −1
1
Σ 2
+
ξ3 x3
− ++
−k d
qd . ..
qd
⃗ qd
qd

0.99+ 0.116 ξ 4
Fr
ξ4 ∣q 1∣
−0.97+0.117 ξ 4

Figura 5.2: Diagrama de bloques del controlador de swing-up por medición de salida.

ya que en este caso sólo estudiaremos el comportamiento del péndulo, se define

y = (ξ1 + qd ) + w2 (t). (5.3)

Entonces, el sistema (4.3), (5.2), (5.3) puede especificarse como en (2.24) con
 
ξ3
f (ξ) = 
 ,

(5.4)
−kp ξ1 − kd ξ3
   
 0 0 0
g1 (ξ) =  , g2 (ξ) =  ,

−J1 0 1
   
0  1
h1 (ξ) = 
 , k12 (ξ) = 
 , (5.5)
ρξ1 0
   
h2 (ξ) = ξ1 + qd , k21 (ξ) = 0 1 .

De este modo, una solución de la síntesis del controlador de seguimiento de salida


H∞ involucra el problema de control H∞ lineal estándar para el sistema autónomo
5.2 Síntesis de controlador H∞ 70

linealizado (2.42) donde las matrices (2.43) están dadas explícitamente por
 
0 1 
A=
 , (5.6)
−kp −kd
   
 0 0 0
B1 =  , B2 =   ,
−J1 0 1
   
0 0 1
C1 = 
 , D12 = 
 , (5.7)
ρ 0 0
   
C2 = 1 0 , D21 = 0 1 .

Finalmente, aplicando el Teorema 2.6 sujeto a (5.4) y (5.6), se resuelve el problema de


control H∞ .

5.2.2. Controlador de estabilización

Siguiendo el caso por retroalimentación de estados, se propone una entrada de control


H∞ sin términos de compensación, es decir τ = u. Considérese el vector de estados
(4.11) definido en el capítulo anterior x = [x1 x2 x3 x4 ]T , donde x1 = q1 − π,
x2 = q2 , x3 = q̇1 , x4 = q̇2 . Ya que no todos los estados se encuentran disponibles
para su medición, se usará el vector de estados observados ξ ∈ R4 descrito por (2.55).
Entonces el modelo (3.10) en lazo cerrado, representado en términos del vector de
estados (4.11), toma la forma

ẋ1 = ξ3

ẋ2 = ξ4
(5.8)
ẋ3 = −J1 h sin(ξ1 + π) + J1 Fr (ξ4 ) − J1 w1 − J1 τ

ẋ4 = J1 h sin(ξ1 + π) − J2 Fr (ξ4 ) + J2 w1 + J2 τ


5.2 Síntesis de controlador H∞ 71

donde Fr (ξ4 ) es la fuerza de fricción en la rueda tal como se define en (3.8), J1 = Ja−1
y J2 = Jr−1 + Ja−1 .
En la Figura 5.3 se observa un diagrama del controlador propuesto.

π

ξ1 + x1
Σ
x2 u=τestab
ξ
x3 −g T2 P ε
x4

Figura 5.3: Diagrama de bloques del control de estabilización por medición de salida.

En el caso del control por retroalimentación de salida, el objetivo de diseño está


dado por  
 u 
 
z= 
 ρξ1 

. (5.9)
 
 
ρξ2

La posición angular de la rueda y la del péndulo son las únicas mediciones disponibles
para retroalimentar y éstas se encuentran corrompidas por wy (t) ∈ R2 , en este caso
 
ξ1 + π 
y=
  + wy (t). (5.10)
ξ2

El sistema (5.8)–(5.10) puede especificarse como en (2.24) con


 
 ξ3 
 

 ξ4 

f (ξ) = 

,

−J h sin(ξ + π) + J1 Fr (ξ4 )
 1 1 
 
J1 h sin(ξ1 + π) − J2 Fr (ξ4 )
5.3 Síntesis de controlador H∞ 72

   
02×1 02×2   02×1 
   
g1 (ξ) =  −J1 01×2  , g2 (ξ) =  −J1  , (5.11)
   
   
   
J2 01×2 J2
 
 0   
  1 
h1 (ξ) = ρx1  , k12 (ξ) =  ,
  

02×1
 
 
ρx2
 
ξ1 + π 
 
h2 (ξ) =  , k21 (ξ) = 02×1 I2 .
ξ2

Por lo tanto, una solución a la síntesis del regulador de posición H∞ involucra el


problema de control H∞ lineal estándar para el sistema autónomo linealizado (2.42)
donde las matrices (2.43) están dadas explícitamente por
 
 0 0 1 0 
 
 0 0 0 1 


A=

,


 J1 h 0 0 J1 fr 

 
−J1 h 0 0 −J2 fr
   
02×1 02×2   02×1 
   
B1 =  −J1

01×2 

, B2 =  −J1  ,
 
(5.12)
   
   
J2 01×2 J2
   
01×2 01×2   1 
C1 =  , D12 =  ,
ρI2 02×2 02×1
   
C2 = I2 02×2 , D21 = 02×1 I2 .

Finalmente, el Teorema 2.4 asegura que si la condición (2.21) se satisface para el sistema
autónomo descrito por (5.11), (5.12), y siendo Pε una solución positiva definida de
(2.22) bajo algún ε > 0, entonces la retroalimentación de salida invariante en el tiempo
(2.23) es una solución local que resuelve el problema de control H∞ .
5.3 Resultados experimentales 73

5.3. Resultados experimentales


Nuevamente, las pruebas experimentales se realizaron en el péndulo con rueda inercial
del Mechatronics Kit , con condiciones iniciales establecidas como q1 (0) = q2 (0) = 0 rad
y q̇1 (0) = q̇2 (t) = 0 rad/s. Para el caso del controlador híbrido por retroalimentación
de salida, los parámetros utilizados se muestran en la Tabla 5.1.
Tabla 5.1: Parámetros para experimento, retroalimentación de salida.

α = 100
Ecuación de Van der Pol modificada ρv = 0.9π
µ=8
ρ = 1.1
ε = 0.05
Regulador H∞ para swing-up
kp = 100
kd = 200
ρ = 0.7
Seguimiento H∞ para estabilización
ε = 0.05

Los resultados mostrados en esta sección corresponden a un experimento en que el


sistema se vio afectado por fuertes perturbaciones externas a fin de evaluar su robustez.
Debido a esto, la posición del péndulo sale y regresa a la región de atracción del control
de estabilización (ver Fig. 5.4).
10
q1
qd

6
Ángulo del péndulo (rad)

−2

−4
0 5 10 15 20 25 30
Tiempo (s)

Figura 5.4: Ángulo del péndulo y posición deseada.


5.3 Resultados experimentales 74

La Figura 5.5 muestra la respuesta de los estados del sistema bajo el controlador
híbrido propuesto. A pesar de que el comportamiento es distinto al sugerido por las
simulaciones, se observa que el sistema finalmente converge a la posición deseada apro-
ximadamente en ts = 6 s y permanece estable durante el resto del experimento si no
se somete a perturbaciones externas. Nótese que después de ser sujeto a varias pertur-
baciones fuertes que obligan a la salida de la zona de atracción del punto de equilibrio,
el controlador regresa al sistema a la posición deseada casi de forma inmediata.

10
q1 (rad)

−5
0 5 10 15 20 25 30
5
q2 (rad)

−5
0 5 10 15 20 25 30
20
dq1/dt (rad/s)

−20
0 5 10 15 20 25 30
dq2/dt (rad/s)

2000

−2000
0 5 10 15 20 25 30
Tiempo (s)
Figura 5.5: Respuestas del sistema en lazo cerrado.

Las Figuras 5.6 y 5.7 muestran el comportamiento de la señal de control y el error


de posición del péndulo a través del tiempo, respectivamente. Ambas figuras muestran
por separado los datos correspondientes al controlador de swing-up , el de estabilización
y el sistema híbrido, en ese orden. Una vez más, se recuerda que durante el experimento
las señales se encuentran saturadas mediante software y hardware en un rango de ±10
EU, siendo EU las unidades de control para el sistema definidas por el fabricante.
5.3 Resultados experimentales 75

Swing−up (Nm)
50

−50

0 5 10 15 20 25 30
Estabilización (Nm)

5000

−5000
0 5 10 15 20 25 30
Señal de control (EU)

10

−5

−10
0 5 10 15 20 25 30
Tiempo (s)

Figura 5.6: Entrada de control.

15
Swing−up (rad)

10

−5
0 5 10 15 20 25 30

15
Estabilización (rad)

10

0
0 5 10 15 20 25 30

15
Híbrido (rad)

10

−5
0 5 10 15 20 25 30
Tiempo (s)
Figura 5.7: Errores de posición por retroalimentación de salida.

En la Figura 5.8 se observa el plano de fase del péndulo (posición respecto a velo-
cidad), demostrando estabilidad alrededor de más de un equilibrio debido a las carac-
terísticas particulares de este experimento.
5.3 Resultados experimentales 76

20

15

10

5
dq1/dt (rad/s)

−5

−10

−15

−20
−4 −2 0 2 4 6 8 10
q1 (rad)

Figura 5.8: Plano de fase del péndulo asumiendo retroalimentación de salida.

Finalmente, la Figura 5.9 muestra el comportamiento de la fricción en el péndulo


durante el experimento. Del lado izquierdo se observa su comportamiento respecto a la
velocidad angular de la rueda, mientras que su evolución respecto al tiempo se muestra
en la figura del lado derecho.
30 30

20 20

10 10
F (Nm)

Fr (Nm)

0 0
r

−10 −10

−20 −20

−30 −30
−2500 −2000 −1500 −1000 −500 0 500 1000 1500 2000 2500 0 5 10 15 20 25 30
x4 (rad/s) Tiempo (s)

(a) En función de q̇2 . (b) Evolución respecto al tiempo.

Figura 5.9: Evidencia de presencia de fricción seca en el mecanismo.


Capítulo 6

Conclusiones y Trabajo Futuro

6.1. Comentarios y conclusiones


El oscilador armónico asintótico [34] permitió generar trayectorias periódicas al-
rededor del origen con la amplitud y frecuencia deseadas, facilitando al péndulo
alcanzar el ángulo de conmutación entre controladores requerido.

Los experimentos iniciales destacaron la importancia de tener un modelo aproxi-


mado de forma suficiente al sistema físico. Tras incluir el término de fricción en
la rueda (3.8), el cual no se había considerado en un inicio en el modelo, mejoró
de forma notable el desempeño de los controladores.

A pesar de que las simulaciones demuestran lo contrario, sin una ganancia pro-
porcional al error de posición, el controlador de swing-up difícilmente genera un
par suficiente para alcanzar su objetivo.

La elección del ángulo en que se activa la conmutación entre los dos controladores
es fundamental. Aparte del tiempo de convergencia, influye en las ganancias de
los controladores y la inercia y energía total del sistema durante el instante de
conmutación, afectando la permanencia del péndulo en la región de atracción del
control de estabilización.

77
6.3 Artículos derivados de la investigación 78

Las simulaciones numéricas y algunos experimentos demostraron que el regulador


de posición es, bajo ciertas condiciones, capaz por sí mismo de llevar al péndulo
hasta el punto de equilibrio deseado partiendo desde el reposo. Sin embargo, el
comportamiento del sistema tiende a volverse inestable.

Los experimentos mostraron que el comportamiento de los controladores de swing-


up fue próximo al deseado, tanto para el caso de retroalimentación de estados
como el de salida. Sin embargo, utilizar sólo la ganancia H∞ como control de
estabilización resultó insuficiente. Deberá investigarse más al respecto.

Los resultados mostrados aquí y los obtenidos en otros experimentos permiten


determinar que el controlador de estabilización por retroalimentación de salida
propuesto tiene un mejor desempeño que el de retroalimentación de estados para
este sistema. Ésto se concluye comparando robustez ante perturbaciones, tiempo
de convergencia y capacidad de recuperación ante fallas.

6.2. Artículos derivados de la investigación


Durante la investigación se produjo el siguiente artículo,

A. Gómez and L. Aguilar, “Position feedback nonlinear H-infinity control for


inertia wheel pendulum stabilization”, Research in Computing Science, vol. 69,
pp. 47-58, 2014.

6.3. Trabajo futuro


Las conclusiones indican varios aspectos dignos de seguir siendo investigados. En este
estudio las variables de la señal de referencia se seleccionaron en base a resultados
empíricos, por lo que un problema interesante consiste en buscar los valores óptimos de
frecuencia y amplitud de la oscilación que minimicen el tiempo necesario para elevar
el péndulo hasta la región de conmutación. Relacionado a esto, también es posible
6.3 Trabajo futuro 79

optimizar el ángulo de conmutación entre controladores de forma que se minimice la


energía del sistema en ese instante y el tiempo de convergencia.
Queda abierta también la posibilidad de realizar mejoras en el modelo, de forma
que aproxime de forma más fiel al sistema físico. En especial considerar indagar en
el comportamiento de la fricción en el sistema y en otras técnicas de linealización.
Otra opción es trabajar con un modelo no linealizado. En el aspecto del control de
estabilización, se debe investigar agregar otros términos de compensación, como por
ejemplo PID o un control discontinuo.
Finalmente, cabe mencionar que este proyecto se vio en parte limitado por las
condiciones impuestas por el sistema experimental y su entorno de trabajo. Será muy
importante verificar el desempeño de los controladores aquí propuestos bajo otras pla-
taformas que permitan menores tiempos de muestreo y mayor velocidad de procesa-
miento de las entradas y salidas del sistema, de forma que se encuentren más cercanas
al funcionamiento en tiempo real.
Bibliografía

[1] L. Acho, Y. Orlov, and V. Solis. Non-linear measurement feedback H∞ -control of


time periodic systems with application to tracking control of robot manipulators.
Internationa Journal of Control, 74(2):190–198, 2010.

[2] L. T. Aguilar, Y. Orlov, and L. Acho. Nonlinear H∞ -control of nonsmooth time-


varying systems with application to friction mechanical manipulators. Automatica,
39(9):1531–1542, 2003.

[3] M. D. S. Aliyu. Nonlinear H∞ -Control, Hamiltonian Systems and Hamilton-Jacobi


Equations. CRC Press, Boca Raton, FL, 2011.

[4] B. D. Anderson and R. Vreugdenhil. Network analysis and synthesis. Prentice-


Hall, Englewood Cliffs, NJ, 1973.

[5] A. Astolfi. Singular H∞ -control for nonlinear systems. International Journal of


Robust and Non-linear Control, 7:727–740, 1997.

[6] T. Başar and P. Bernhard. H∞ -Optimal Control and Related Minimax Design
Problems: A Dynamic Game Approach. Birkhäuser, Boston, 2nd edition, 1995.

[7] J. Bentsman, Y. Orlov, and L. Aguilar. Nonsmoth H∞ output regulation with


application to a coal-fired boiler/turbine unit with actuator deadzone. In American
Control Conference ACC’13, pages 3900–3905, Washington DC, USA, 2013.

[8] D. J. Block, K. J. Åström, and M. W. Spong. The Reaction Wheel Pendulum.


Synthesis Lectures on Control and Mechatronics # 1. Morgan & Claypool, 2007.

[9] D. J. Block and M. W. Spong. Mechanical design & control of the pendubot. In
SAE Earthmoving Industry Conference, pages 4–5, 1995.

80
6.3 BIBLIOGRAFÍA 81

[10] O. Boubaker. The inverted pendulum: A fundamental benchmark in control theory


and robotics. In Education and e-Learning Innovations (ICEELI), 2012 Interna-
tional Conference on, pages 1–6, 2012.

[11] B. Brogliato, R. Lozano, B. Maschke, and O. Egeland. Dissipative Systems Analy-


sis and Control. Springer, London, 2nd edition, 2006.

[12] Y. Choi and W. Chung. PID Trajectory Tracking Control for Mechanical Systems.
Lecture Notes in Control and Information Sciences. Springer, Berlin, 2004.

[13] C. C. Chung and J. Hauser. Nonlinear H∞ -control around periodic orbits. Systems
Control Letters, 30:127–137, 1997.

[14] P. M. Cohn. Basic Algebra: Groups, Rings, and Fields. Springer-Verlag, UK, 2003.

[15] J. Doyle, K. Glover, P. Khargonekar, and B. Francis. State-space solutions to


standard H2 and H∞ control problems. IEEE Transactions on Automatic Control,
34(8):831–847, 1989.

[16] I. Fantoni and R. Lozano. Non-linear Control for Underactuated Mechanical Sys-
tems, chapter The reaction wheel pendulum. Springer, London, 2002.

[17] I. Fantoni, R. Lozano, and M. W. Spong. Stabilization of the reaction wheel


pendulum using an energy approach. In Proceedings of the European Control
Conference ECC’01, Porto, Portugal, 2001.

[18] J. Feddema, C. Dohrmann, G. Parker, R. Robinett, V. Romero, and D. Sch-


mitt. Control for slosh-free motion of an open container. Control Systems, IEEE,
17(1):29–36, 1997.

[19] F. Grasser, A. D’Arrigo, S. Colombi, and A. Rufer. Joe: a mobile, inverted pen-
dulum. Industrial Electronics, IEEE Transactions on, 49(1):107–114, 2002.

[20] D. Hill and P. Moylan. The stability of nonlinear dissipative systems. IEEE
Transactions on Automatic Control, 21:708–711, 1976.

[21] T. Huryn, J. Blouin, E. Croft, M. Koehle, and H. Van der Loos. Experimental
performance evaluation of human balance control models. Neural Systems and
Rehabilitation Engineering, IEEE Transactions on, 22(6):1115–1127, 2014.
6.3 BIBLIOGRAFÍA 82

[22] A. Isidori and A. Astolfi. Disturbance attenuation and H∞ -control via measure-
ment feedback in nonlinear systems. IEEE Transactions on Automatic Control,
37(9):1283–1293, 1992.

[23] M. Iwashiro, K. Furuta, and K. J. Åström. Energy based control of pendulum. In


Control Applications, Proceedings of the 1996 IEEE International Conference on,
pages 715–720, 1996.

[24] R. Kelly, V. Santibáñez, and A. Loría. Control of Robot Manipulators in Joint


Space. Advanced Textbooks in Control and Signal Processing. Springer, 2006.

[25] H. K. Khalil. Nonlinear Systems. Mcmillan Academic Pub., New York, 1992.

[26] P. P. Khargonekar, I. Petersen, and M. A. Rotea. H∞ optimal control with state-


feedback. IEEE Transactions on Automatic Control, 33(8):786–788, 1988.

[27] E. B. Lee and B. Markus. Foundation of Optimal Control. SIAM Series in Applied
Math. John Wiley, New York, 1967.

[28] H. Lee and J. Lee. Driving control of mobile inverted pendulum. In Ubiquitous
Robots and Ambient Intelligence (URAI), 2012 9th International Conference on,
pages 449–453, 2012.

[29] M. Lopez-Martinez, J. Acosta, and J. Cano. Nonlinear sliding mode surfaces for a
class of underactuated mechanical systems. IET Control Theory and Applications,
4(10):2195–2204, 2010.

[30] W. C. A. Maas and A. J. Van Der Schaft. Nonlinear H∞ -control: the singular
case. International Journal of Robust and Non-linear Control, 6:669–689, 1996.

[31] R. Olfati-Saber. Fixed point controllers and stabilization of the cart-pole system
and the rotating pendulum. In Decision and Control. Proceedings of the 38th
IEEE Conference on, volume 2, pages 1174–1181, 1999.

[32] R. Olfati-Saber. Nonlinear Control of Underactuated Mechanical Systems with Ap-


plication to Robotics and Aerospace Vehicles. PhD thesis, Department of Electrical
Engineering and Computer Science of the Massachusetts Institute of Technology,
Cambridge, USA, 2001.
6.3 BIBLIOGRAFÍA 83

[33] Y. Orlov, L. Acho, and V. Solis. Nonlinear H∞ -control of time-varying systems.


Proceedings of the 38th conference on decision and control, pages 3764–3769, 1999.

[34] Y. Orlov, L. Aguilar, L. Acho, and A. Ortiz. Asymptotic harmonic generator


and its application to finite time orbital stabilization of a friction pendulum with
experimental verification. International Journal of Control, 81(2):227–234, 2008.

[35] R. S. Palais. When proper maps are closed. Proceedings of the American Mathe-
matical Society, 24:835–836, 1970.

[36] L. Pavel and F. W. Fairman. Robust stabilization of nonlinear plants: an L2 -


approach. International Journal of Robust and Nonlinear Control, 6(7):691–726,
1996.

[37] Quanser, Inc. Mechatronics Control Kit User’s Manual, 2006.

[38] K. J. Åström and K. Furuta. Swinging up a pendulum by energy control. Auto-


matica, 36:287– 295, 2000.

[39] R. Ravi, K. Nagpal, and P. Khargonekar. H∞ -control of linear time-varying sys-


tems: A state-space approach. SIAM Journal Control and Optimization, 29:1394–
1413, 1991.

[40] S. K. Saha. Introduction to robotics. Tata McGraw-Hill, India, 2008.

[41] C. E. Scherer. H∞ -optimizaton without assumptions on finite or infinite zeros.


SIAM Journal on Control and Optimization, 30:143–166, 1992.

[42] S. P. Sethi and G. M. Thompson. Optimal Control Theory. Applications to Ma-


nagement Science and Economics. Springer, 2000.

[43] W. Singhose and S. Towell. Double-pendulum gantry crane dynamics and control.
In Control Applications. Proceedings of the 1998 IEEE International Conference
on, volume 2, pages 1205–1209, 1998.

[44] H. Sira-Ramirez, Z. Gao, and L. Cuevas-Ramirez. Tracking in interconnected


gantry crane systems: A decentralized active disturbance rejection control. In
Control Conference (CCC), 2014 33rd Chinese, pages 4342–4347, 2014.
6.3 BIBLIOGRAFÍA 84

[45] M. W. Spong, P. Corke, and R. Lozano. Nonlinear control of the inertia wheel
pendulum. Automatica, 37(11):1845–1851, 2001.

[46] A. A. Stoorvogel. The H∞ -Control Problem: A State-Space Approach. Prentice


Hall, Englewood Cliffs, NJ, 1992.

[47] A. A. Stoorvogel and H. L. Trentelmann. The quadratic matrix inequality in singu-


lar H∞ -control with state-feedback. SIAM Journal on Control and Optimization,
28:1190–1208, 1990.

[48] T. Sugihara, Y. Nakamura, and H. Inoue. Real-time humanoid motion generation


through zmp manipulation based on inverted pendulum control. In Robotics and
Automation. Proceedings. ICRA ’02. IEEE International Conference on, volume 2,
pages 1404–1409, 2002.

[49] W. Sun, H. Gao, and B. Yao. Adaptive robust vibration control of full-car ac-
tive suspensions with electrohydraulic actuators. IEEE Transactions on Control
Systems Technology, 21(6):2417–2422, 2013.

[50] C. Thum, C. Du, B. Cheng, E. H. Ong, and K. P. Tan. A unified control scheme for
track seeking and following of a hard disk drive servo system. IEEE Transactions
on Control Systems Technology, 18(2):294–306, 2010.

[51] T. Turker, H. Gorgun, and G. Cansever. Stabilisation of a class of 2-dof underac-


tuated mechanical systems via direct lyapunov approach. International Journal
Control, 86(6):1137–1148, 2013.

[52] H. van der Kooij, S. Donker, M. de Vrijer, and F. van der Helm. Identification of
human balance control in standing. In Systems, Man and Cybernetics, 2004 IEEE
International Conference on, volume 3, pages 2535–2541 vol.3, 2004.

[53] A. J. Van Der Schaft. L2 -gain analysis of nonlinear systems and nonlinear state
feedback control. IEEE Transactions on Automatic Control, 37(6):770–784, 1992.

[54] F. W. Warner. Foundations of Differentiable Manifolds and Lie Groups, volume 94


of Graduate Texts in Mathematics. Springer, New York, 1983.
.0 BIBLIOGRAFÍA 85

[55] S. Westerberg, U. Mettin, A. Shiriaev, L. Freidovich, and Y. Orlov. Motion plan-


ning and control of a simplified helicopter model based on virtual holonomic cons-
traints. In Proc. 14th International Conference on Advanced Robotics, pages 1–6,
Munich, Germany, 2009.

[56] K. Yano, T. Yoshida, M. Hamaguchi, and K. Terashima. Liquid container transfer


considering the suppression of sloshing for the change of liquid level. In Proceedings
of the 13th IFAC World Congress, San Francisco, CA, 1996.

[57] H. Ye, W. Gui, and Z. Jiang. Backstepping design for cascade systems with
relaxed assumption on lyapunov functions. IET Control Theory and Applications,
5(5):700–712, 2011.

[58] W. Younis and M. Abdelati. Design and implementation of an experimental seg-


way model. AIP Conference Proceedings, 1107(1):350–354, 2009.

[59] K. Zhou, J. C. Doyle, and K. Glover. Robust and Optimal Control. Prentice-Hall,
Englewoog Cliffs, NJ, 1996.
Apéndice A

Código para Simulaciones

Código en Matlab para cálculo de la matriz de ganancia H∞ y simulaciones con el


controlador por retroalimentación de estados.

% IWP_Hybrid2Full
%

% parametros del sistema


h = 0.354544; % h = mbar*g = (m1*lc1 + m2*l1)*g;
Ia = 4.5717e-3; % Ia = m1*lc1^2 + m2*l1^2 + Ip
Ir = 2.495e-5;
J1 = 1/Ia;
J2 = 1/Ia + 1/Ir;
fs = 0.0117;

tauSat = 10;
switchAngle = 150;

% parametros del oscilador


alpha = 100;
rhov = 0.9*pi;
mu = 8;

% Controlador de Swing-up

rho = 1.1;
kp = 100;

86
A.0 87

kd = 120;

% matrices del sistema - caso z2


A = [0 1; -kp -kd];
B1 = [0 0; -J1 0];
B2 = [0; 1];
C1 = [0 0; rho*eye(2)];
%D12 = [1; 0; 0];
C2 = eye(2);
%D21 = [0 1 0; 0 0 1];

% minimizacion de gamma
[gw Pw Zw] = MinimizeGamma(A,B1,B2,C1,C2,0.5);

% Controlador de Estabilización

rho = 1.1;

% matrices del sistema


F = [0 0 1 0; 0 0 0 1; J1*h 0 0 J1*fs; -J1*h 0 0 -J2*fs];
G1 = [zeros(2,5); -J1 0 0 0 0; J2 0 0 0 0];
G2 = [0; 0; -J1; J2];
H1 = [0 0 0 0; rho*eye(4)];
%K12 = [1; 0; 0; 0; 0];
H2 = eye(4);
%K21 = [zeros(4,1) eye(4)];

% minimizacion de gamma
[gt Pt Zt] = MinimizeGamma(F,G1,G2,H1,H2,0.1);

% solución del sistema

t0 = 0; % intervalo de tiempo
tf = 10;
delta = 0.0001; % tamaño de paso
IC = [0.1, 0, 0, 0,... % valor inicial de x
0.1, 0]; % valor inicial de oscilador

n = (tf-t0)/delta + 1; % número de pasos

% Preasignación de memoria
t = zeros(n,1);
y = zeros(n,6);
A.0 88

ci = zeros(n,1);
fss = zeros(n,1);

% Valores iniciales
t(1) = t0;
y(1,:) = IC;

% método de Euler
for i = 1:(n-1)
t(i+1) = t(i) + delta;

% vector de perturbaciones
w = [0.1*cos(2*t(i));
0.001*cos(5*t(i));
0.002*cos(3*t(i))];

% señal de referencia
qd = y(i,5);
dqd = y(i,6);
ddqd = -alpha*((qd^2 + dqd^2/mu^2) - rhov^2)*dqd - mu^2*qd;

q1 = y(i,1) + w(2);
x2 = y(i,2) + w(3); % = q2
x4 = y(i,4); % = dq2

% cálculo de fricción en el péndulo


if x4 > 0
fs = 0.99 + 0.0116*x4;
elseif x4 < 0
fs = -0.97 + 0.0117*x4;
else
fs = 0;
end
fss(i+1) = fs;

if q1 < rhov
% control de swingup
x1 = q1 - qd;
x3 = y(i,3) - dqd;
u = -B2.’*Pw*[x1; x3];
tau = -Ia*(J1*h*sin(q1) + ddqd + u - kp*x1 - kd*x3 - J1*fs);
else
% control de estabilización
A.0 89

x1 = q1 - pi;
x3 = y(i,3);
u = -G2.’*Pt*[x1; x2; x3; x4];
tau = u;
end

% saturación de la señal de control


if abs(tau) > tauSat
tau = tauSat*sign(tau);
end
ci(i+1) = tau;

% asigna el ángulo de la rueda a (-pi, pi)


y2k = y(i,2) + delta*x4;
if y2k > pi
y2k = y2k - 2*pi*floor((y2k+pi)/(2*pi));
elseif y2k < -pi
y2k = y2k - 2*pi*ceil((y2k-pi)/(2*pi));
end

% saturación de la velocidad de la rueda


y4k = y(i,4) + delta*(J1*h*sin(q1) + J2*(w(1)+tau-fs));
if abs(y4k) > 820
y4k = 820*sign(y4k);
end

y(i+1,1) = y(i,1) + delta*y(i,3);


y(i+1,2) = y2k;
y(i+1,3) = y(i,3) + delta*(-J1*h*sin(q1) - J1*(w(1)+tau-fs));
y(i+1,4) = y4k;
y(i+1,5) = y(i,5) + delta*dqd;
y(i+1,6) = y(i,6) + delta*ddqd;
end

Código en Matlab para caso de controlador por retroalimentación de salida.

% parametros del sistema


h = 0.354544; % h = mbar*g = (m1*lc1 + m2*l1)*g;
Ia = 4.5717e-3; % Ia = m1*lc1^2 + m2*l1^2 + Ip
Ir = 2.495e-5;
J1 = 1/Ia;
A.0 90

J2 = 1/Ia + 1/Ir;
fs = 0.0117;

tauSat = 10;
switchAngle = 150;

% parametros del oscilador


alpha = 100;
rhov = 0.9*pi;
mu = 8;

% Controlador de Swing-up

rho = 1.1;
kp = 100;
kd = 200;

% matrices del sistema - caso z2


A = [0 1; -kp -kd];
B1 = [0 0; -J1 0];
B2 = [0; 1];
C1 = [0 0; rho 0];
%D12 = [1; 0];
C2 = [1 0];
%D21 = [0 1];

% minimizacion de gamma
[gw Pw Zw] = MinimizeGamma(A,B1,B2,C1,C2,0.05);

% Controlador de Estabilización

rho = 0.7;

% matrices del sistema


F = [0 0 1 0; 0 0 0 1; J1*h 0 0 J1*fs; -J1*h 0 0 -J2*fs];
G1 = [zeros(2,3); -J1 0 0; J2 0 0];
G2 = [0; 0; -J1; J2];
H1 = [0 0 0 0; rho 0 0 0; 0 rho 0 0];
%K12 = [1; 0; 0];
H2 = [eye(2) zeros(2)];
%K21 = [[0; 0] eye(2)];

% minimizacion de gamma
A.0 91

[gt Pt Zt] = MinimizeGamma(F,G1,G2,H1,H2,0.05);

% solución del sistema

t0 = 0; % intervalo de tiempo
tf = 10;
delta = 0.0001; % tamaño de paso
IC = [0.1, 0, 0, 0,... % valor inicial de x
0.1, 0]; % valor inicial de oscilador

n = (tf-t0)/delta + 1; % número de pasos

% Preasignación de memoria
t = zeros(n,1);
y = zeros(n,6);
ci = zeros(n,1);
fss = zeros(n,1);

% Valores iniciales
t(1) = t0;
y(1,:) = IC;

% método de Euler
for i = 1:(n-1)
t(i+1) = t(i) + delta;

% vector de perturbaciones
w = [0.1*cos(2*t(i));
0.001*cos(5*t(i));
0.002*cos(3*t(i))];

% señal de referencia
qd = y(i,5);
dqd = y(i,6);
ddqd = -alpha*((qd^2 + dqd^2/mu^2) - rhov^2)*dqd - mu^2*qd;

q1 = y(i,1) + w(2);
x2 = y(i,2) + w(3); \% = q2
x4 = y(i,4); \% = dq2

% cálculo de fricción en el péndulo


if x4 > 0
fs = 0.99 + 0.0116*x4;
A.0 92

elseif x4 < 0
fs = -0.97 + 0.0117*x4;
else
fs = 0;
end
fss(i+1) = fs;

if q1 < 2.618
% control de swingup
x1 = q1 - qd;
x3 = y(i,3) - dqd;
u = -B2.’*Pw*[x1; x3];
tau = -Ia*(J1*h*sin(q1) + ddqd + u - kp*x1 - kd*x3 - J1*fs);
else
% control de estabilización
x1 = q1 - pi;
x3 = y(i,3);
u = -G2.’*Pt*[x1; x2; x3; x4];
tau = u;
end

% saturación de la señal de control


if abs(tau) > tauSat
tau = tauSat*sign(tau);
end
ci(i+1) = tau;

% asigna el ángulo de la rueda a (-pi, pi)


y2k = y(i,2) + delta*x4;
if y2k > pi
y2k = y2k - 2*pi*floor((y2k+pi)/(2*pi));
elseif y2k < -pi
y2k = y2k - 2*pi*ceil((y2k-pi)/(2*pi));
end

% saturación de la velocidad de la rueda


y4k = y(i,4) + delta*(J1*h*sin(q1) + J2*(w(1)+tau-fs));
if abs(y4k) > 820
y4k = 820*sign(y4k);
end

y(i+1,1) = y(i,1) + delta*y(i,3);


y(i+1,2) = y2k;
A.0 93

y(i+1,3) = y(i,3) + delta*(-J1*h*sin(q1) - J1*(w(1)+tau-fs));


y(i+1,4) = y4k;
y(i+1,5) = y(i,5) + delta*dqd;
y(i+1,6) = y(i,6) + delta*ddqd;
end

Función de minimización de γ

function [gammaMin, Pe, Ze] = MinimizeGamma(A,B1,B2,C1,C2,epsilon)


% Minimiza gamma a partir del valor inicial
%

eI = epsilon*eye(length(A));
Cp = C1.’*C1 + eI;
Cz = B1*B1.’ + eI;

gamma = 0:0.01:100;

for i = 2:length(gamma)
g2 = gamma(i)^(-2);
Bp = B2*B2.’ - g2*(B1*B1.’);
try
Pe = are(A, Bp, Cp);
Ae = A + g2*(B1*B1.’)*Pe;
Bz = C2.’*C2 - g2*Pe*(B2*B2.’)*Pe;
Ze = are(Ae.’, Bz, Cz);
gammaMin = 1;
catch err
gammaMin = 0;
end
if gammaMin;
gammaMin = gamma(i);
break
end
end
if (i == length(gamma)) && ~gammaMin
novalid = 1;
end
Apéndice B

Controlador en Simulink

|u|

Abs Switch between SwingUp


Pendulum angle q1 and Balancing Controllers
q2
tau
vel velk dq1
PWM output Pendulum angle mod
dq2 Saturation
filtered velocity
Balance Controller

Wheel angle

q1
Plant u fcn y vel velk
dq1
tau
filtered velocity1 qd
q2 dq2 Saturation1
qd Swing−up Controller

Van der Pol


tsim oscillator
Clock To Workspace

Figura B.1: Modelo de controlador híbrido en Simulink

94
B.0 95

1 sin −K−
q1
sin(q1) J1*h

−kp

x1
P
u
2 K*u
dq1
hinf −K− 1
x3
tau
−kd Gain

D
3
qd

f(u)
dq2 > 0
4 −K−
dq2
f(u) fr(dq2) −J1
dq2 < 0 Add

Figura B.2: Controlador en Simulink, parte de swing-up

pi

Constant

1
q1 x1
2
x2
q2
K*u 1
tau
3
x3 hinf
dq1

4
x4
dq2

Figura B.3: Controlador en Simulink, parte de estabilización

Potrebbero piacerti anche