Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Tesis
Presenta:
Ing. Adrián Enrique Gómez Ruiz
Al Dr. Luis Tupak Aguilar Bustos y a la M.C. Isaura González Rubio Acosta por el
conocimiento y enseñanzas compartidas durante el desarrollo de este trabajo de tesis.
A los miembros del comité tutorial por sus comentarios y consejos que permitieron
cumplir oportunamente este proceso.
Resumen
En los últimos años ha existido un gran interés por el estudio de sistemas de péndulo
invertido, los cuales se han posicionado como una de las referencias más importantes
en control debido a su dinámica similar a varias aplicaciones físicas, en especial en el
campo de la robótica. Entre los dispositivos experimentales de péndulo invertido, el
péndulo con rueda inercial resulta de particular interés debido a su no-linealidad, sub-
actuación y una dinámica relativamente sencilla. En esta tesis se resuelve el problema
de regulación de posición del péndulo con rueda inercial basados en la teoría de control
H-infinito no lineal que es una técnica de control robusto. El objetivo es estabilizar el
péndulo en el punto de equilibrio superior y asegurar que permanezca allí a pesar de
la perturbaciones externas. Ya que las condiciones iniciales se encuentran lejos de la
región de atracción del punto de equilibrio deseado, se sintetiza un controlador híbrido
consistente en una parte de “swing-up” y otra de estabilización. Para la parte de swing-
up, se propone una trayectoria periódica de referencia generada por el oscilador de Van
der Pol, la cual es seguida por un controlador H-infinito no lineal que conduce al péndulo
a una región cercana al punto de equilibrio deseado. Para la parte de estabilización, se
conmuta a un regulador de posición H-infinito para el sistema linealizado que equilibra
el péndulo alrededor de este punto. Ambos controladores se sintetizan para el caso
de retroalimentación de estados y de salida. Se incluyen resultados experimentales
realizados en la plataforma Mechatronics Control Kit, que verifican el desempeño de
los controladores propuestos.
Palabras clave: Péndulo con rueda inercial, control H-infinito no lineal, control hí-
brido, retroalimentación de estados, retroalimentación de salida.
Nonlinear H∞ Control Design for the Position Regulation and Motion
Control of the Inertia Wheel Pendulum
Abstract
For the last years, there has been great interest on the study of inverted pendulum
systems, which have been ranked among the most important benchmarks in control
because of their dynamic similarity with several physical applications, especially in the
field of robotics. Among the inverted pendulum experimental devices, the inertia wheel
pendulum becomes particularly interesting because its non-linearities, underactuation,
and a relatively simple dynamics. In this thesis, we present the solution to the position
regulation problem for the inertia wheel pendulum using nonlinear H-infinity control
theory, which is a robust control technique. The main objective is to stabilize the
pendulum at the upright equilibrium point despite the external disturbances. Since the
initial conditions are far from the region of attraction of the desired equilibrium point,
a hybrid controller is synthesized consisting on a swing-up part and a stabilization part.
For the swing-up part, a reference periodic trajectory generated by the Van der Pol
oscillator is first proposed where a nonlinear H-infinity tracking controller is synthesized
to drive the trajectory of the pendulum to a region near the desired equilibrium point.
For the stabilization part, it is switched to a H-infinity position regulator for the
linearized system that balances the pendulum around this point. Both controllers are
synthesized assuming state and output measurements. Experimental results made on
the Mechatronics Control Kit platform are included, verifying the performance of the
proposed controllers.
Resumen IV
Abstract V
Índice General VI
Índice de Tablas X
1. Introducción 1
1.1. Estado del arte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.1. Sistemas tipo péndulo . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.2. Antecedentes en el control del péndulo con rueda inercial . . . . 8
1.1.3. Control H∞ no lineal y algunas aplicaciones en sistemas subac-
tuados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2. Objetivos de la tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.1. Objetivo general . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.2. Objetivos específicos . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3. Lista de contribuciones . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.4. Organización de la tesis . . . . . . . . . . . . . . . . . . . . . . . . . . 13
vi
ÍNDICE GENERAL vii
B. Controlador en Simulink 94
Índice de figuras
viii
ÍNDICE DE FIGURAS ix
x
Capítulo 1
Introducción
θ2
Rueda de
inercia
θ1
Péndulo
1
1.1 Estado del arte 2
al eje de un motor de corriente directa, mientras que el péndulo no está actuado. El par
de fuerzas acoplado entre la rueda y el péndulo, y generado por la aceleración angular
de la rueda se puede utilizar para controlar el movimiento del sistema. El péndulo con
rueda inercial también puede ser considerado como un péndulo simple en paralelo con
una inercia controlada por un par, por lo tanto un doble integrador [8].
Debido a sus características, el péndulo con rueda inercial puede usarse con técnicas
de control de diferentes niveles de complejidad. Algunos ejemplos de problemas que se
pueden estudiar con este sistema son los siguientes: modelado, identificación, control de
posición y velocidad, swing-up, entre otros. En los capítulos subsecuentes, el problema
abordado consiste en un controlador híbrido que combina seguimiento y regulación.
péndulo simple es
g
θ̈ + sin(θ) = 0 (1.1)
`
La ecuación diferencial ordinaria (ODE) (1.1) es no lineal debido al término sin(θ).
mg
Una forma de linealizarla es aproximando sin(θ) como θ, lo cual es valido para valores
pequeños de θ. De esta forma se obtiene el sistema lineal
θ̈ + ω 2 θ = 0 (1.2)
donde se define ω 2 = g/`. La ecuación (1.2) se conoce como oscilador armónico simple.
Es posible verificar por sustitución directa que la Ecuación (1.2) tiene la solución
general
θ̇(0)
θ(t) = θ(0) cos(ωt) + sin(ωt). (1.3)
ω
La tasa de cambio del oscilador armónico está dada por la expresión
1 2
θ2 (t) + θ̇ (t) = r2 (1.5)
ω2
1.1 Estado del arte 4
.
θ
1 g
E = θ̇2 + (1 − cos(θ)) (1.6)
2 `
g
Ė = θ̇θ̈ + sin(θ)θ̇
`
g
= θ̇ θ̈ + sin(θ) . (1.7)
`
10
4
Velocidad angular
−2
−4
−6
−8
−10
−4 −2 0 2 4 6 8 10
Posición angular
como uno de los puntos de referencia más importantes en robótica [10]. En biomecánica
el péndulo se usa con frecuencia para modelar la caminata bípeda [48]. La Figura 1.5a
muestra como en los robots bípedos la pierna fija en contacto con el suelo con frecuencia
se modela como un péndulo invertido, mientras que la pierna oscilante se comporta
como un péndulo simple suspendido libremente desde la cadera. De hecho, los estudios
de la dinámica de la postura humana y locomoción han encontrado que durante el
caminar los músculos de las piernas están activos primariamente durante los inicios de
la fase de oscilación, después de la cual se apagan y permiten a la pierna balancearse
libremente como un péndulo, contribuyendo en parte a la eficiencia de energía [8]. De
forma similar, permanecer de pie requiere control del balance (véase Figura 1.5b). La
llamada oscilación de postura resulta de los reflejos de elongación en los músculos, lo
cual es un tipo de estabilización por retroalimentación local de la dinámica del péndulo
involucrada en estar de pie. Al tratar de identificar los mecanismos de balanceo de
la postura humana de pie, las investigaciones con frecuencia utilizan como modelo
simplificado el péndulo invertido [21, 52].
θ1 θ2
Pierna oscilante
Pierna de postura (péndulo simple) ℓ
(péndulo invertido) mg
Dirección
Θ
Propulsión
Ψ
θ y z
θ2
l l2 θ
l1 y
θ1 x
x ϕ
El péndulo de rueda inercial (IWP, por sus siglas en inglés) es uno de los más recientes y
simples de los varios experimentos de péndulo debido a la simetría de la rueda acoplada
al extremo del péndulo. Como se observará en el Capítulo 3, esta simetría resulta en
menos no-linealidades de acoplamiento en las ecuaciones dinámicas de movimiento [8]
y por lo tanto un sistema más sencillo para analizar, simular y controlar. Un problema
1.1 Estado del arte 9
El control H∞ no lineal [1, 15, 22] es una herramienta usada ampliamente para resolver
diversos problemas de control robusto. En [12], se aplica al control de robots manipula-
dores, y se estudia especialmente la relación entre las ganancias individuales del control
PID, la tasa de rendimiento del control H∞ óptimo y la estabilidad entrada-a-estado
ante la perturbación extendida, para casos por retroalimentación de estado completo.
En [56], el problema de control de slosh en líquidos se modela como un péndulo
amortiguado. Se calcula una trayectoria de referencia para la posición y la elevación de
la superficie resolviendo un problema de control óptimo no lineal. Después se diseña
una ley de control H∞ retroalimentado para el modelo linealizado.
Westerberg et al. [55] consideran la planeación y control de movimiento para un
sistema mecánico subactuado de 3 DOF, en específico estudian los grados de libertad
1.2 Objetivos de la tesis 11
Bajo los dos puntos anteriores, se proponen dos controladores híbridos asumien-
do retroalimentación de estados y de salida que llevan al sistema al punto de
equilibrio deseado a partir del reposo. El funcionamiento de ambos controladores
es comprobado mediante experimentos.
1.4 Organización de la tesis 13
2.1. Introducción
En este capítulo se presenta la solución general al problema de control H∞ no lineal para
sistemas autónomos y continuos en el tiempo. La solución del problema se divide en
dos casos de acuerdo a la configuración del sistema retroalimentado: retroalimentación
de estados y retroalimentación de salida. Con fines didácticos, se ha decidido incluir el
desarrollo de la solución de cada problema con bases distintas.
En la Sección 2.2 se incluye el problema por retroalimentación de estados. El con-
tenido de esta Sección está basado en [3, cap. 5]. La estrategia divide el problema en
dos: alcanzar atenuación de la perturbación y lograr estabilidad asintótica, ambos de
forma local. Aliyu aborda el problema desde una perspectiva de la teoría de juegos
diferenciales [6] y luego desde un punto de vista disipativo no incluido en este trabajo,
pero que puede consultarse en [3, 20, 36].
El contenido del capítulo está organizado de la siguiente manera. En la Sección
2.3 se discute el problema por retroalimentación de salida. El desarrollo de la solución
se basa en los desarrollos de Isidori y Astolfi [22] y Aguilar et al. [2]. Primero se
resuelve el problema en forma global, para después encontrar las condiciones suficientes
y necesarias para la existencia de la solución local. Puede consultarse también [33] para
14
2.2 Solución del problema de control H∞ de sistemas no lineales por medición de estados 15
y = x + k21 (x)w
w z
Planta
u y=x
K
Suposición 2.2.3. [25] El sistema (2.1) está bien definido, esto es, para cualquier
estado inicial x(t0 ) ∈ X y cualquier entrada admisible u(t) ∈ U, existe una solución
única x(t, t0 , x0 , u) para (2.1) en [t0 , ∞) que depende continuamente en las condiciones
iniciales, o en otras palabras el sistema satisface el teorema de existencia y unicidad
local para ecuaciones diferenciales ordinarias (ODE).
Como se muestra en la Figura 2.1, para este tipo de sistema todos los estados de la
planta se encuentran accesibles y pueden ser medidos directamente para el propósito
del control retroalimentado. Con el fin de facilitar la explicación se comienza con el
concepto de estabilicidad suave y la definición de ganancia L2 del sistema (2.1).
Definición 2.2.1. [3, p. 104] (Estabilicidad suave). El sistema no lineal (2.1) es local
y suavemente estabilizable si existe una función-C 0 F : U ⊂ X → Rm , F (0) = 0, tal
que ẋ = f (x) + g2 (x)F (x) es local y asintóticamente estable. El sistema es suavemente
estabilizable si U = X .
Definición 2.2.2. [3] Se dice que el sistema no lineal (2.1) tiene localmente una ga-
nancia L2 de w(t) a z(t) en U ⊂ X , menor o igual a γ, si para cualquier condición
inicial x0 ∈ U y u fija, la respuesta z del sistema correspondiente a cualquier w ∈ W
2.2 Solución del problema de control H∞ de sistemas no lineales por medición de estados 17
satisface:
Z t1 Z t1
2
kz(t)k dt ≤ γ 2
kw(t)k2 dt + β(x0 ), ∀ t1 > t0 ,
t0 t0
para alguna función-C 0 acotada β : U → R tal que β(0) = 0. El sistema tiene ganancia
L2 ≤ γ si la desigualdad anterior es satisfecha para todo x ∈ X , o U = X .
Ya que el interés es diseñar una ley de control retroalimentado suave para hacer
el sistema asintóticamente estable, el requisito de estabilicidad suave para el sistema
(2.1) será fundamental para que exista la solución del problema. Después de todo lo
anterior, el problema en cuestión se define de la siguiente manera.
para alguna función suave α(x, t) dependiente de x(t) y posiblemente de t, tal que el
sistema en lazo cerrado:
tiene, para todas las condiciones iniciales x(t0 ) ∈ N , ganancia localmente L2 desde
la señal de perturbación w(t) a la salida z(t) menor o igual que algún número dado
γ ∗ > 0 con estabilidad interna, o equivalentemente, el sistema en lazo cerrado consigue
atenuación local de la perturbación menor o igual a γ ∗ con estabilidad interna.
Estabilidad interna del sistema en la definición previa significa que todas las señales
internas en el sistema, o trayectorias, están acotadas, lo cual es también equivalente a
2.2 Solución del problema de control H∞ de sistemas no lineales por medición de estados 18
estabilidad local y asintótica del sistema en lazo cerrado con w = 0 en este caso. El
problema óptimo consiste en encontrar el valor γ ∗ > 0 mínimo para el cual la ganancia
L2 es mínima. Este problema, sin embargo, es más difícil de resolver.
Una forma de medir la ganancia L2 del sistema (2.1), consiste en excitarlo con una
entrada periódica wt1 ∈ W , donde W ⊂ W es el subespacio de funciones periódicas
continuas en el tiempo (por ejemplo, una señal sinusoidal), y medir la respuesta de
salida en estado estable zss (t) correspondiente a la respuesta en estado estable xss (t).
Entonces la ganancia L2 puede ser calculada de la siguiente manera
kzss kt1
sup
w∈W kwkt1
donde
1 1
1
Z t0 +t1
1
Z t0 +t1
2 2
2 2
kwkt1 = kw(s)k ds , kzss kt1 = kw(s)k ds .
t1 t0 t1 t0
1 Z t1
mı́n máxJ(u, w) = [kz(t)k2 − γ 2 kw(t)k2 ]dt, (2.4)
u∈U w∈W 2 t0
sujeto a las ecuaciones dinámicas (2.1) sobre un horizonte de tiempo finito t1 > t0 .
La función objetivo es una medición cuantitativa del rendimiento del sistema a tra-
vés del tiempo. Así pues, un controlador óptimo (u∗ , w∗ ) se define como un controlador
admisible que maximiza la función objetivo. Los problemas de juegos diferenciales re-
presentan una generalización de los problemas de control óptimo en casos donde existe
2.2 Solución del problema de control H∞ de sistemas no lineales por medición de estados 19
Z T
J(u, v) = S[x(T )] + F (x, u, v, t)dt,
0
Aliyu propone que el sistema en lazo cerrado (2.3) tiene una ganancia localmente
L2 ≤ γ ∗ si se asume que para γ = γ ∗ existe una función de control retroalimentado
localmente definida u∗ : N × R → Rm , 0 ∈ N ⊂ X , la cual es posiblemente variante en
el tiempo, y genera una J(u, w) no-positiva para la peor perturbación posible w∗ ∈ W
(y por lo tanto para toda w ∈ W) para todo t1 > 0. Para esto nótese que
Para derivar las condiciones suficientes para la existencia de la solución del primer
sub-problema, se define la “función de valor” para el juego V : X × [0, t1 ] → R como
1 Z t1
V (t, x) = ı́nf sup [kz(τ )k2 − γ kw(τ )k2 ]dτ (2.5)
u w 2 t
Teorema 2.1. [3, Teorema 5.1.1] Considerar el problema de control HINLRE como
un juego diferencial de suma-cero con dos jugadores, con la función de costo (2.4). De
acuerdo con la Definición 2.2.4, un par de estrategias (u∗ (x, t), w∗ (x, t)) proveen, bajo
la estructura de información de retroalimentación, una solución de punto de equilibrio
para el juego tal que
J(u∗ , w) ≤ J(u∗ , w∗ ) ≤ J(u, w∗ ),
en donde V (x, t1 ) = 0.
1 1
H(x, p, u, w) = pT (f (x) + g1 (x)w + g2 (x)u) + kh1 (x) + k12 (x)uk2 − γ 2 kwk2 , (2.7)
2 2
En el presente caso, para evitar la posibilidad de que la matriz u sea singular será
necesaria la siguiente suposición.
T
R(x) = k12 (x)k12 (x)
∂H ∗
(u , w) = 0
∂u
∂H
(u, w∗ ) = 0
∂w
Además, ya que por suposición R(x) es no-singular y por lo tanto positiva definida, y
γ > 0, el punto de equilibrio de arriba resulta ser un optimizador de J(u, w). Más aún,
es posible escribir
1 1
H(x, p, u, w) = H ∗ (x, p) + ku − u∗ k2R(x) − γ 2 kw − w∗ k2 , (2.11)
2 2
en donde
H ∗ (x, p) = H(x, p, u∗ (x, p), w∗ (x, p))
1
H(x, p, u∗ , w) = H ∗ (x, p) − γ 2 kw − w∗ k2
2
≥ H ∗ (x, p),
1
H(x, p, u, w∗ ) = H ∗ (x, p) + ku − u∗ k2R(x)
2
≤ H ∗ (x, p),
de tal forma que las condiciones de punto de equilibrio del juego diferencial indicadas
en la Definición 2.2.4 y representadas por la desigualdad (2.8) se satisfacen.
Ahora, asumir que existe una solución C 1 positiva semidefinida V : X → R para la
ecuación de Isaacs (2.6) definida en una vecindad N del origen, la cual se vuelve cero
en x = 0, es decir V (0) = 0, y es invariante en el tiempo (lo cual se considera plausible
ya que H(x, p, u∗ , w∗ ) también es invariante en el tiempo). Aliyu [3, p. 107] asegura
que si esta solución V existe, entonces las retroalimentaciones (u∗ , w∗ ) necesariamente
existen, y elegir una p tal que
!T
∂V
p= (x)
∂x
en (2.11) otorga la identidad:
!T
∂V ∂V 1
H x, (x) , w, u = (x)(f (x) + g1 (x)w + g2 (x)u) + kh1 (x) + k12 (x)uk2
∂x ∂x 2
1
− γ 2 kwk2
2
!T
∂V 1 1
= H ∗ x, (x) + ku − u∗ k2R(x) − γ 2 kw − w∗ k2 .
∂x 2 2
que, usando la igualdad (2.7), es exactamente el lado derecho de (2.6), y para que esta
2.2 Solución del problema de control H∞ de sistemas no lineales por medición de estados 24
1 Z t1 2
V (x(t1 )) − V (x0 ) ≤ (γ kwk2 − kzk2 )dt ≥ 0 ∀ w ∈ W.
2 t0
Antes de considerar la parte (ii) del problema, y con el fin de simplificarlo, considérese
la siguiente suposición.
Suposición 2.2.5. [3, p. 107] El vector de salida h1 (x) y la matriz de peso k12 (x) son
tales que
T
k12 (x)k12 (x) = I
para todo x ∈ X .
" # !T
∂V 1 ∂V 1 ∂V 1
(x)f (x) + (x) 2 g1 (x)g1T (x) − g2 (x)g2T (x) (x) + hT1 (x)h1 (x) = 0
∂x 2 ∂x γ ∂x 2
(2.13)
y las retroalimentaciones (2.9), (2.10) se convierten en
!T
∗ ∂V
u (x) = −g2T (x) (x) (2.14)
∂x
!T
∗ 1 ∂V
w (x) = 2 g1T (x) (x) . (2.15)
γ ∂x
!T
∗ ∂V
α(x) = u (x) = −g2T (x) (x) ,
∂x
donde V (x) es una solución suave positiva semidefinida de la EHJI (2.13). Entonces,
derivando V a lo largo de las trayectorias del sistema en lazo cerrado con w = 0 y
usando (2.13), se obtiene
!
∂V ∂V
V̇ (x) = (x) f (x) − g2 (x)g2T (x) (x)
∂x ∂x
1 1 1
= − ku∗ k2 − γ 2 kw∗ k2 − hT1 (x)h1 (x) ≤ 0,
2 2 2
Definición 2.2.5. [3, p. 109] Se dice que el sistema no lineal (2.1) es localmente
detectable en estado-cero si existe una vecindad U ⊂ X de x = 0 para la cual, pa-
ra todo x(t0 ) ∈ U , si z(t1 ) ≡ 0, u(t1 ) ≡ 0 para todo t1 ≥ t0 , lo que implica que
lı́mt1 →∞ x(t1 , t0 , x0 , u) = 0. El sistema es detectable en estado-cero si U = X .
Definición 2.2.6. [35] Una función continua f : X → Y entre dos espacios topológicos
X, Y es llamada propia si la imagen inversa de cada subconjunto compacto de Y es un
subconjunto compacto de X.
Teorema 2.2. [3, Teorema 5.1.2] Considérese el sistema no lineal (2.1) y el problema
de control HINLRE para el sistema. Asumir que el sistema es suavemente estabilizable
y localmente detectable en estado-cero en una vecindad del origen N ⊂ X . Suponer
también que existe una solución suave positiva semidefinida para la EHJI (2.13) en N .
Entonces la ley de control
!T
∗ ∂V
u = α(x) = −g2T (x) (x) , x∈N (2.16)
∂x
Demostración. La primera parte del teorema ya ha sido probada en los desarrollos an-
teriores. Respecto a la estabilidad asintótica global, nótese que, si V es propia, entonces
V es una solución global del problema de la EHJI (2.12), y el resultado se obtiene tras
aplicar el principio de invarianza de LaSalle.
donde
" #
1 1 1
Hγ∗ (x, p) = p f (x) + pT 2 g1 (x)g1T (x) − g2 (x)g2T (x) p + hT1 (x)h1 (x).
T
2 γ 2
!T
∂Hγ∗ ∂Hγ∗
! !
∂ ∂V
+ = 0,
∂x p= ∂V
T ∂p p= ∂V
T ∂x ∂x
∂x ∂x
!T
∂Hγ∗ ∂Hγ∗
! !
∂ ∂V
=− .
∂x p= ∂V
T ∂p p= ∂V
T ∂x ∂x
∂x ∂x
Con p = (∂V (x)/∂x)T , para alguna solución suave V ≥ 0 de la EHJI (2.13), la per-
turbación w∗ = γ −2 g1 (x)(∂V (x)/∂x)T , x ∈ X es referida como la peor perturbación
posible que afecta al sistema. De ahí el título de diseño del “peor caso” para el diseño
de control H∞ .
Ahora se especializarán los resultados del Teorema 2.4 para el sistema lineal
ẋ = Ax + B1 w + B2 u; x(0) = x0
z = C1 x + D12 u (2.19)
y = x + D21 w,
donde
∂f1
A= (0), B1 = g1 (0), B2 = g2 (0)
∂x
∂h1
C1 = (0), D12 = k12 (0), D21 = k21 (0), (2.20)
∂x
Corolario 2.2.1. [3, Corolario 5.1.1] Considérese el sistema lineal (2.19) y el problema
de control HINLRE para éste. Asumir que (A, B2 ) es estabilizable y (C1 , A) es detec-
table. Además, suponer que para algún γ > 0, existe una solución simétrica positiva
2.2 Solución del problema de control H∞ de sistemas no lineales por medición de estados 29
resuelve el problema de control HINLRE para el sistema (2.19), es decir, vuelve su nor-
ma H∞ menor o igual a un número prescrito γ > 0, y (F −G2 GT2 P ) es asintóticamente
estable o Hurwitz.
Teorema 2.3. [3, Teorema 5.1.3] Supóngase que (C1 , A) es detectable y sea γ > 0.
Existe entonces un control retroalimentado lineal
u = Kx
tal que el sistema en lazo cerrado (2.19) con esta retroalimentación es asintóticamente
estable y tiene ganancia L2 ≤ γ sí, y sólo sí, existe una solución P ≥ 0 para (2.21).
Además, si P = P T ≥ 0 es tal que
!
1
σ A− B2 B2T P + 2 B1 B1T P ⊂ C− ,
γ
Finalmente, de acuerdo con el lema de la cota real estricto (véase [4] o [11, p. 295])
la Ecuación (2.21) asegura que existe una constante positiva ε0 tal que la ecuación
algebraica de Riccati perturbada
" #
1
Pε A1 + AT1 Pε + C1T C1 + Pε B1 B1T − B2 B2T Pε + εI = 0 (2.22)
γ2
tiene una solución única, simétrica, positiva definida Pε para cada ε ∈ (0, ε0 ). Basado
en esto se construye el siguiente controlador.
Teorema 2.4. [2] Asúmase que la condición (2.21) se satisface para el sistema autó-
nomo (2.1), y sea Pε una solución positiva definida de (2.22) bajo algún valor ε > 0.
Entonces la retroalimentación de salida invariante en el tiempo
w z
Planta
u y
K
De acuerdo con [2], la Suposición 2.3.1 garantiza que el sistema dinámico anterior
sea bien definido, mientras está sujeto a entradas exógenas integrables. En el análisis
subsecuente se considera que todos los términos son suficientemente suaves. La Supo-
sición 2.3.2 asegura que el origen es un punto de equilibrio del sistema dinámico no
controlado (u = 0) y libre de perturbaciones (w = 0) (2.24). La Suposición 2.3.3 es
una versión simplificada no lineal de la heredada del problema de control H∞ estándar
[15]. La primera y tercera igualdades significan que no existen términos con productos
cruzados entre esas matrices. La segunda y cuarta indican que las matrices de peso son
la identidad en la función norma para z y y, respectivamente.
El problema en cuestión se establece entonces de la siguiente forma.
u = K(ξ, t)
(2.25)
ξ˙ = F(y, ξ),
Definición 2.3.3. [2] Se dice que el sistema (2.24), (2.25) tiene una ganancia L2 menor
que γ si la respuesta z, resultando de la perturbación w para un estado inicial x(t0 ) = 0,
ξ(t0 ) = 0, satisface
Z t1 Z t1
2
kz(t)k dt < γ 2
kw(t)k2 dt (2.26)
t0 t0
para todo t1 > t0 y todas las funciones continuas definidas por tramos w(t) = [w1 wy ]T .
donde G(ξ) es la matriz de ganancia de inyección de salida a ser determinada. Una ley
de control por retroalimentación de salida puede imponerse en el sistema basándose en
este estado estimado (y los resultados de la Sección 2.2) como:
!T
∂V
u = α2 (ξ) = −g2T (ξ) (ξ) , (2.28)
∂ξ
se convierte en
ξ˙ = f (ξ) + g1 (ξ)w + g2 (ξ)α2 (ξ) + G(ξ)[y − ŷ]. (2.29)
!T
∗ 1 ∂V
w = α1 (x) = 2 g1T (x) (x)
γ ∂x
ξ˙ = f (ξ) + g1 (ξ)α1 (ξ) + g2 (ξ)α2 (ξ) + G(ξ)[y − h2 (ξ) − k21 (ξ)α1 (ξ)]. (2.30)
Si es posible elegir una matriz de ganancia G(ξ) tal que el sistema en lazo cerrado
(2.31) sea disipativo con una función de almacenamiento C 1 , con respecto a la tasa
de suministro s(w, z) = 21 (γ 2 kwk2 − kzk2 ) y es asintóticamente estable de forma local
alrededor de (x, ξ) = (0, 0), entonces se habrá resuelto el problema de control HINLRS
para (2.24).
2.3 Solución del problema de control H∞ de sistemas no lineales por medición de salida 35
A continuación se listan las hipótesis bajo cuales se deriva una solución global del
problema de control H∞ .
(H1) Existe una función positiva definida F (x) y una función suave, acotada en t,
positiva definida V (x), tal que la desigualdad Hamilton-Jacobi-Isaacs
∂V ∂V
+ f (x) + γ 2 α1T (x)α1 (x) − α2T (x)α2 (x) + hT1 (x)h1 (x) + F (x) ≤ 0 (2.32)
∂t ∂x
!T
1 ∂V
α1 = 2 g1T (x) , (2.33)
2γ ∂x
!T
1 ∂V
α2 = − g2T (x) . (2.34)
2 ∂x
De aquí en adelante, V (x) está acotada en t y es positiva definida sí, y sólo sí, existen
funciones continuas, invariantes en el tiempo, positivas definidas V0 (x) y V1 (x) tal
que las desigualdades V0 (x) ≤ V (x) ≤ V1 (x) se cumplen para todo x ∈ Rn , t ∈ R y
V0 (x) → ∞ mientras x → ∞.
(H2) Existe una función continua definida por tramos G(t), y una función positiva
semidefinida Q(x, ξ) sujeta a que Q(0, ξ) es definida positiva, y una función suave,
acotada en t, positiva semidefinida W (x, ξ) sujeta a que W (0, ξ) está acotada en t y es
positiva definida, tal que la desigualdad Hamilton-Jacobi-Isaacs
!
∂W ∂W ∂W
+ fe (x, ξ) + hTe (x, ξ)he (x, ξ) + γ 2 φT (x, ξ)φ(x, ξ) + Q(x, ξ) ≤ 0 (2.35)
∂t ∂x ∂ξ
fe2 = f (ξ) + g1 (ξ)α1 (ξ) + g2 (ξ)α2 (ξ) + G(t)(h2 (x) − h2 (ξ)), (2.37)
Bajo las Hipótesis (H1) y (H2) una solución del problema de control H∞ expuesto
anteriormente es la siguiente.
Teorema 2.5. [2, Teorema 1] Supóngase que las Hipótesis (H1) y (H2) se satisfacen.
Entonces la retroalimentación de salida
u = α2 (ξ) (2.41)
La prueba del Teorema 2.5 puede encontrarse en [33]. Nótese que el Teorema 2.5
asegura la existencia de un controlador estabilizante de retroalimentación de medición
bajo ninguna condición de estabilicidad-detectabilidad, por lo tanto removiendo la
necesidad de verificar explícitamente estas condiciones. En lo sucesivo, este Teorema
será fundamental en el análisis local del problema en cuestión.
Suposición 2.3.4. Para todo t ∈ R las funciones f1 (x), g1 (x), g2 (x), h1 (x), h2 (x),
k12 (x), k21 (x) son doble y continuamente diferenciables en x localmente alrededor del
2.3 Solución del problema de control H∞ de sistemas no lineales por medición de salida 37
origen x = 0, mientras que sus derivadas de primer y segundo orden son continuas
definidas por tramos y uniformemente acotadas en t para todo x en alguna vecindad
del origen.
ẋ = A1 x + B1 w + B2 u,
z = C1 x + D12 u,
y = C2 x + D21 w, (2.42)
donde
∂f1 ∂h1
A= (0), B1 = g1 (0), B2 = g2 (0), C1 = (0),
∂x ∂x (2.43)
∂h2
C2 = (0), D12 = k12 (0), D21 = k21 (0).
∂x
es asintóticamente estable.
2.3 Solución del problema de control H∞ de sistemas no lineales por medición de salida 38
es asintóticamente estable.
Definición 2.3.4. [2] Se dice que los sistemas (2.45), (2.47) son asintóticamente esta-
bles si las matrices [A − (B2 B2T − γ −2 B1 B1T )P ] y [A1 − Z(C2T C2 − γ −2 P B2 B2T P )] tienen
todos sus valores propios con parte real negativa.
tengan una solución única, simétrica, positiva definida (Pε , Zε ) para cada ε ∈ (0, ε0 )
donde Aε = A1 + γ −2 B1 B1T Pε .
Definición 2.3.5. [4] (Lema de la cota real estricto). Supóngase que las condiciones
(C1) y (C2) se satisfacen. Existe entonces una ε0 > 0 tal que el sistema (2.48), (2.49)
2.3 Solución del problema de control H∞ de sistemas no lineales por medición de salida 39
tiene una solución única, positiva definida, simétrica (Pε (t), Zε (t)) para cada ε ∈ (0, ε0 ).
A continuación, (2.48), (2.49) se utilizan para derivar una solución local del proble-
ma de control H∞ no lineal para (2.24).
V (x) = xT Pε x, (2.50)
es una solución local del problema de control H∞ con el nivel de atenuación de pertur-
bación γ.
∂V
= xT Ṗε x, (2.57)
∂t
∂V
f (x) = xT [Pε A1 + AT1 Pε ]x + ot (kxk2 ), (2.58)
∂x
1
γ α1 (x)T α1 (x) = 2 xT Pε B1 B1T Pε x + ot (kxk2 ),
2
(2.59)
γ
−α2T (x)α2 (x) = −xT Pε B2 B2T Pε x + ot (kxk2 ), (2.60)
∂V ∂V
+ f (x) + γ 2 α1T (x)α1 (x) − α2T (x)α2 (x) + hT1 (x)h1 (x)
∂t ∂x ( " #
1
≤ xT Ṗε + Pε A1 + AT1 Pε + Pε 2 B1 B1T − B2 B2 T Pε
γ
+ C1T C1 x + ot (kxk2 )
≤ −ε kxk2 + ot (kxk2 )
ε
≤ − kxk2 (2.62)
2
∂W
= γ 2 (x − ξ)T Żε−1 (x − ξ), (2.63)
! ∂t
∂W ∂W
fe (x, ξ) ≤ γ 2 (x − ξ)T {Zε−1 Aε + ATε Zε−1
∂x ∂ξ
2.3 Solución del problema de control H∞ de sistemas no lineales por medición de salida 41
hTe (x, ξ)he (x, ξ) = (x − ξ)T [Pε B2 B2T Pε ](x − ξ) + ot (kx − ξk2 ), (2.65)
Así pues, las condiciones (C1) y (C2) aseguran la existencia de una solución local
del problema de control H∞ no lineal. Nótese que bajo las suposiciones apropiadas,
estas condiciones son suficientes y necesarias para que exista dicha solución [33]. En
2.3 Solución del problema de control H∞ de sistemas no lineales por medición de salida 42
efecto, asúmase que existe una solución local para el problema de control H∞ no lineal
tal que la ganancia L2 del sistema en lazo cerrado correspondiente (2.24) es menor
que γ y la aproximación lineal de la versión libre de perturbación de este sistema es
exponencialmente estable. Sigue entonces que (2.42) es estabilizable y detectable para
u y y, respectivamente. Más aún, tomando la Proposición 6 en [53] y extendiéndola a
sistemas variantes en el tiempo, se muestra que la ganancia L2 del sistema linealizado
correspondiente (2.42) también es menor que γ, y por lo tanto (ver [39]) las condiciones
(C1) y (C2) son satisfechas.
Capítulo 3
3.1. Introducción
En este capítulo se presenta el modelo dinámico del péndulo con rueda inercial. Este
modelo es un conjunto de ecuaciones diferenciales que describen la manera en que se
produce el movimiento en un sistema mecánico debido a las fuerzas aplicadas a las
articulaciones mediante los actuadores. El desarrollo del modelo aquí presentado está
basado en las metodologías mostradas en [8, 16].
En la Sección 3.2 se obtienen las ecuaciones dinámicas del sistema siguiendo el
método de Euler-Lagrange [40]. Esta metodología presenta las dos ventajas siguientes:
primero, el planteamiento está basado en la energía del sistema así que sólo se requieren
funciones escalares y segundo, si el sistema consta de más de un cuerpo rígido, se puede
calcular la energía de cada uno de ellos de forma independiente para ser sumada luego.
En la Sección 3.3 se ofrece una descripción de la planta experimental y su funciona-
miento. Además se incluyen los parámetros físicos utilizados durante las simulaciones
43
3.2 Modelo dinámico de péndulo con rueda inercial 44
La plataforma experimental del péndulo con rueda inercial consta de dos encoders
ópticos como sensores de las posiciones angulares. Estos encoders son del tipo relativo,
por lo que siempre inician en cero y sólo miden el ángulo relativo entre su posición
actual y la inicial. Uno de estos sensores se encuentra unido a la base fija, con su
3.2 Modelo dinámico de péndulo con rueda inercial 45
rotor acoplado al péndulo, así que mide el ángulo relativo entre éste y la base fija. El
otro sensor está unido al motor en el otro extremo del péndulo, con su rotor acoplado
sobre la rueda de inercia, de forma que provee el ángulo relativo de la rueda respecto
al péndulo. Si se denotan los ángulos medidos por estos dos encoders como ϕp y ϕr ,
respectivamente, se tiene que
q 1 = ϕp (3.1)
q2 = ϕp + ϕr . (3.2)
Definición 3.2.1. [40] Se consideran como coordenadas generalizadas aquellas que es-
pecifican por completo la configuración en el espacio (posición y orientación) de todos
los cuerpos rígidos de un sistema mecánico. Aquellas que pueden moverse libremente,
es decir, que no se encuentran sujetas a restricciones impuestas por las articulaciones,
se denominan coordenadas generalizadas independientes. El número de coordenadas ge-
neralizadas independientes es igual al número de grados de libertad (DOF) del sistema.
L(q1 , . . . , qn ) = K − U
donde qi son las coordenadas generalizadas, y τi son las fuerzas generalizadas aplicadas
en la dirección qi .
Una vez mencionado esto, el primer paso para obtener el modelo del péndulo con
rueda inercial consiste en calcular la energía cinética del sistema, definida en este caso
como la suma de la energía cinética del péndulo K1 y la de la rueda K2 , es decir
1
K1 = (m1 `2c1 + Jp )q̇12
2
1 1
K2 = m2 `21 q̇12 + Jr (q̇1 + q̇2 )2
2 2
K = K1 + K2
3.2 Modelo dinámico de péndulo con rueda inercial 47
1 1
= (m1 `2c1 + m2 `21 + Jp + Jr )q̇12 + Jr q̇1 q̇2 + Jr q̇22 . (3.4)
2 2
1 1
L = (Ja + Jr )q̇12 + Jr q̇1 q̇2 + Jr q̇22 − h(1 − cos q1 ) (3.6)
2 2
De forma experimental, Block et al. [8] concluyeron que si bien el efecto de la fuerza
de fricción en el péndulo es menospreciable, en la rueda éste no es el caso. Identifican que
la fricción en la rueda tiene un componente de fricción de Coulomb y un componente
lineal a la velocidad, obteniendo el siguiente modelo aproximado
0.99 + 0.0116 q̇2 si q̇2 > 0
F = (3.8)
−0.97 + 0.0117 q̇
si q̇2 < 0
2
A grandes rasgos, el hardware del sistema está controlado por una tarjeta de pro-
cesamiento digital de señales (PDS) modelo TMS320C6713DSK de texas instru-
mentsr y está programado como un sistema esclavo (denominado por los desarrolla-
dores como “modo dummy”), el cual cuenta con un algoritmo muy sencillo que sólo
cumple con las siguientes tareas básicas:
Amplificación del modulador de ancho de pulso (PWM) para control del motor.
3.3 Descripción de la planta experimental 50
Ja = 4.572 × 10−3 kg m2
J1 = 218.733
3.4 Enunciado del problema 51
J2 = 40080.16
h = 0.3545
Estos valores son los encontrados en [8] para el mismo sistema. Por último la Tabla
3.3 incluye los valores provistos por la hoja de datos del motor marca PITTMANr ,
modelo LO-COG 8x22.
para todo tiempo t > 0, comenzando desde la condición inicial q1 (0) = q2 (0) = q̇1 (0) =
q̇2 (0) = 0 y a pesar de la perturbación externa w1 (t) ∈ R. Las posiciones angulares de
la rueda y el péndulo son las únicas mediciones disponibles para retroalimentación y
se encuentran corrompidas por el vector wy (t) ∈ R2 .
Capítulo 4
4.1. Introducción
El objetivo en este capítulo es diseñar un controlador H∞ para estabilizar el péndulo
en la posición superior a pesar de las perturbaciones externas y utilizando retroali-
mentación de estados, basada en la teoría que se mostró en la Sección 2.2. Ya que las
condiciones iniciales del sistema se encuentran lejos de la región de atracción del punto
de equilibrio deseado, se construye un controlador híbrido que consiste en una parte
de swing-up y una parte de estabilización (véase Figura 4.1).
Para el control de swing-up, se propone una trayectoria de referencia que conduce
al péndulo a la región de atracción del punto de equilibrio deseado. Para este caso se
utilizará un controlador H∞ no lineal para sistemas variantes en el tiempo [12] para
asegurar que las posiciones angulares no se desvíen de la trayectoria deseada. En la
53
4.2 Síntesis de controlador H∞ 54
∣q1∣
q1
q2 q
⃗ τ swing
IWP . Swing-up
q1
.
q2
qd
⃗ τ estab
Estabilización ±10
Van der Pol
τhib
Figura 4.1: Diagrama de bloques del controlador híbrido por medición de estados.
propuesto por Orlov et al. [34], donde el oscilador de Van der Pol modificado
" ! #
q̇ 2
q̈d + α qd2 + d2 − ρ2v q̇d + µ2 qd = 0, α, ρv , µ > 0 (4.1)
µ
se usó para generar una trayectoria de referencia periódica para el péndulo. Aquí,
qd (t) ∈ R representa la trayectoria periódica deseada para el oscilador, el parámetro ρv
controla la amplitud del ciclo límite, µ controla su frecuencia, y α controla la velocidad
del transitorio del ciclo límite.
Ya que en esta etapa, el principal interés es solamente el comportamiento del pén-
dulo, para la síntesis del controlador de seguimiento H∞ , considérese el siguiente vector
de espacio de estados
x1 q 1 − qd
x= = . (4.2)
x3 q̇1 − q̇d
Entonces el modelo en lazo abierto (3.9), representado en términos del vector de estados
(4.2), toma la forma
ẋ1 = x3
(4.3)
ẋ3 = −J1 h sin(x1 + qd ) + J1 Fr (q̇2 ) − J1 w1 − J1 τ − q̈d .
donde J1 = Ja−1 . Debe señalarse que se asume que la velocidad de la rueda q̇2 permanece
acotada para todo t ∈ [0, ts ) donde ts es el instante de transición entre el controlador
de swing-up y el controlador de estabilización.
El objetivo entonces es diseñar un controlador de la forma
(kp , kd > 0); que estabilicen internamente el sistema en lazo cerrado alrededor de la
trayectoria deseada.
En la Figura 4.2 se muestra un diagrama del esquema de control propuesto.
sin J 1h
q1 + x1
Σ −k p
− + +
q
⃗ q2 τ swing
+ u +
−g T2 P ε Σ −J −1
. Σ
x3
+ 1
q1
− ++
−k d
qd . ..
qd
⃗ qd
qd
Figura 4.2: Diagrama de bloques del controlador de swing-up por medición de estados.
2. Todos los estados del sistema, en este caso la posición y velocidad del péndulo,
se encuentran disponibles para retroalimentar y éstos se encuentran corrompidos
por wy (t) ∈ R2 , por lo que se define
x 1 + qd
y=
+ wy (t). (4.6)
x3 + q̇d
4.2 Síntesis de controlador H∞ 57
Para esta etapa, el sistema no lineal (3.9) será linealizado alrededor del punto de
equilibrio deseado. Por lo tanto la entrada de control τ será inyectada desde el control
H∞ (2.23) sin términos de compensación no lineal, es decir, τ = u. Ahora, considérese
el vector de estados
x1 q1 − π
x2 q2
x=
=
.
(4.11)
x3
q̇1
x4 q̇2
ẋ1 = x3
ẋ2 = x4
(4.12)
ẋ3 = −J1 h sin(x1 + π) + J1 Fr (x4 ) − J1 w1 − J1 u
donde Fr (x4 ) es la fuerza de fricción en la rueda tal como se define en (3.8), J1 = Ja−1
y J2 = Jr−1 + Ja−1 .
Un diagrama del controlador propuesto se observa en la Figura 4.3.
π
−
q1 + x1
Σ
q
⃗ x2 u=τestab
T
x3 −g P ε
2
x4
Figura 4.3: Diagrama de bloques del control de estabilización por medición de estados.
4.2 Síntesis de controlador H∞ 59
Todos los estados del sistema se encuentran disponibles para retroalimentar y éstos se
encuentran corrompidos por wy (t) ∈ R4 , por lo que se define
x1 + π
x2
y=
+ wy (t).
(4.14)
x3
x4
Finalmente, el Teorema 2.4 asegura que si la condición (2.21) se satisface para el sistema
autónomo descrito por (4.15), (4.16), y siendo Pε una solución positiva definida de
(2.22) bajo algún ε > 0, entonces la retroalimentación de salida invariante en el tiempo
(2.23) es una solución local que resuelve el problema de control H∞ .
α = 100
Ecuación de Van der Pol modificada ρv = 0.9π
µ=8
ρ = 1.1
Regulador H∞ para swing-up ε = 0.05
kp = 100
kd = 120
ρ = 1.1
Seguimiento H∞ para estabilización
ε = 0.1
3 25
20
2 15
10
1
dqd/dt (rad/s)
5
qd (rad)
0 0
−5
−1
−10
−15
−2
−20
−3 −25
0 2 4 6 8 10 −3 −2 −1 0 1 2 3
Tiempo (s) qd (rad)
Figura 4.4: Oscilador producido por la ecuación de Van der Pol modificada con
parámetros α = 100, ρv = 0.9π, y µ = 8; inicializada en qd (0) = 0.1 y q̇d (0) = 0.
crita como un menor porcentaje de éxito en la recuperación tras una fuerte perturba-
ción externa) de este controlador respecto al de retroalimentación de salida presentado
en el siguiente capítulo. Por tal razón este experimento se realizó principalmente sin
introducir perturbaciones externas fuertes al sistema (ver Figs. 4.5 y 4.6).
4
2
Ángulo del péndulo (rad)
−1
−2 q1
q
d
−3
0 1 2 3 4 5 6 7 8 9 10
Tiempo (s)
q1 (rad) 0
−5
0 1 2 3 4 5 6 7 8 9 10
5
q2 (rad)
−5
0 1 2 3 4 5 6 7 8 9 10
20
dq1/dt (rad/s)
−20
0 1 2 3 4 5 6 7 8 9 10
dq2/dt (rad/s)
2000
−2000
0 1 2 3 4 5 6 7 8 9 10
Tiempo (s)
Figura 4.6: Respuesta del sistema en lazo cerrado
asumiendo retroalimentación de estados.
Swing−up (Nm)
50
−50
0 1 2 3 4 5 6 7 8 9 10
4
x 10
Estabilización (Nm)
−1
0 1 2 3 4 5 6 7 8 9 10
Señal de control (EU)
10
−5
−10
0 1 2 3 4 5 6 7 8 9 10
Tiempo (s)
10
Swing−up (rad)
5
−5
−10
0 1 2 3 4 5 6 7 8 9 10
Estabilización (rad)
0
0 1 2 3 4 5 6 7 8 9 10
10
Híbrido (rad)
−5
−10
0 1 2 3 4 5 6 7 8 9 10
Tiempo (s)
Figura 4.8: Errores de posición por retroalimentación de estados.
señal de control mucho mayor a la del control de swing-up , en la práctica ambas señales
se encuentran saturadas mediante software y hardware en un rango conformado por ±10
EU. Durante los experimentos, EU es una unidad arbitraria definida por el fabricante
de la plataforma y enviada al sistema como señal de control, donde éste se encarga de
convertirla apropiadamente en la señal PWM alimentada al motor (véase [37]).
El plano de fase del péndulo (posición respecto a velocidad) puede verse en la Figura
4.9, demostrando la estabilidad asintótica del péndulo alrededor del origen descrita
también por las Figuras 4.5 y 4.6.
De interés particular es el comportamiento del elemento de fricción en la rueda
Fr (q̇2 ) añadido al modelo. En la Figura 4.10 se observa del lado izquierdo su comporta-
miento respecto a la velocidad angular de la rueda, mientras que su evolución respecto
al tiempo se muestra en la gráfica del lado derecho.
4.3 Resultados experimentales 65
20
15
10
5
dq /dt (rad/s)
0
1
−5
−10
−15
−20
−3 −2 −1 0 1 2 3 4
q1 (rad)
30 30
20 20
10 10
F (Nm)
Fr (Nm)
0 0
r
−10 −10
−20 −20
−30 −30
−2500 −2000 −1500 −1000 −500 0 500 1000 1500 2000 2500 0 1 2 3 4 5 6 7 8 9 10
x4 (rad/s) Tiempo (s)
5.1. Introducción
En este capítulo se discute el diseño de un controlador H∞ para estabilizar el péndulo
en la posición superior a pesar de las perturbaciones externas y utilizando retroalimen-
tación de salida, cuya teoría se mostró en la Sección 2.3. Al igual que en el caso de
retroalimentación de estado, considerando que las condiciones iniciales del sistema se
encuentran lejos de la región de atracción del punto de equilibrio deseado, se deberá
diseñar un controlador híbrido que consiste en una parte de swing-up y una parte de
estabilización(véase Figura 4.1).
Para el control de swing-up, se utilizará la trayectoria periódica deseada propuesta
en el capítulo anterior que conduzca al péndulo a la región de atracción del punto
de equilibrio deseado. Para este caso se utilizará un controlador H∞ no lineal para
66
5.2 Síntesis de controlador H∞ 67
∣q1∣
q1
ξ
τ swing
IWP
q2
ξ̇=F ( y , ξ) ∫ Swing-up
qd
⃗ τestab
Van der Pol Estabilización ±10
τhib
Figura 5.1: Diagrama de bloques del controlador híbrido por medición de salida.
sistemas variantes en el tiempo [12] para asegurar que las posiciones angulares no se
desvíen de la trayectoria deseada. En la parte de estabilización, se linealiza el modelo
alrededor del punto de equilibrio, en donde un controlador H∞ lineal para sistemas
autónomos [22] se aplica para estabilizar el péndulo.
Este capítulo está organizado de la siguiente forma. En la Sección 5.2 se diseña el
controlador híbrido H∞ para el péndulo con rueda inercial por retroalimentación de
salida, en donde la parte de swing-up y de estabilización se describen en 5.2.1 y 5.2.2,
respectivamente. Para concluir el capítulo, los resultados obtenidos tras aplicar este
controlador en la planta experimental se muestran en la Sección 5.3.
modelo en lazo abierto del sistema está representado de la forma (4.3), esto es
ẋ1 = x3
donde J1 = Ja−1 . De nueva cuenta se asume que la velocidad de la rueda q̇2 permanece
acotada para todo t ∈ [0, ts ), siendo ts el instante de transición entre el controlador de
swing-up y el de estabilización.
El objetivo entonces es diseñar un controlador de la forma
2. La posición angular de la rueda y la del péndulo son las únicas mediciones dis-
ponibles para retroalimentar y éstas se encuentran corrompidas por wy (t) ∈ R2 ,
5.2 Síntesis de controlador H∞ 69
sin J 1h
ξ1 + x1
Σ −k p
− + +
ξ ξ2 τ swing
+ u +
T
−g P ε Σ −J −1
1
Σ 2
+
ξ3 x3
− ++
−k d
qd . ..
qd
⃗ qd
qd
0.99+ 0.116 ξ 4
Fr
ξ4 ∣q 1∣
−0.97+0.117 ξ 4
Figura 5.2: Diagrama de bloques del controlador de swing-up por medición de salida.
Entonces, el sistema (4.3), (5.2), (5.3) puede especificarse como en (2.24) con
ξ3
f (ξ) =
,
(5.4)
−kp ξ1 − kd ξ3
0 0 0
g1 (ξ) = , g2 (ξ) = ,
−J1 0 1
0 1
h1 (ξ) =
, k12 (ξ) =
, (5.5)
ρξ1 0
h2 (ξ) = ξ1 + qd , k21 (ξ) = 0 1 .
linealizado (2.42) donde las matrices (2.43) están dadas explícitamente por
0 1
A=
, (5.6)
−kp −kd
0 0 0
B1 = , B2 = ,
−J1 0 1
0 0 1
C1 =
, D12 =
, (5.7)
ρ 0 0
C2 = 1 0 , D21 = 0 1 .
ẋ1 = ξ3
ẋ2 = ξ4
(5.8)
ẋ3 = −J1 h sin(ξ1 + π) + J1 Fr (ξ4 ) − J1 w1 − J1 τ
donde Fr (ξ4 ) es la fuerza de fricción en la rueda tal como se define en (3.8), J1 = Ja−1
y J2 = Jr−1 + Ja−1 .
En la Figura 5.3 se observa un diagrama del controlador propuesto.
π
−
ξ1 + x1
Σ
x2 u=τestab
ξ
x3 −g T2 P ε
x4
Figura 5.3: Diagrama de bloques del control de estabilización por medición de salida.
La posición angular de la rueda y la del péndulo son las únicas mediciones disponibles
para retroalimentar y éstas se encuentran corrompidas por wy (t) ∈ R2 , en este caso
ξ1 + π
y=
+ wy (t). (5.10)
ξ2
02×1 02×2 02×1
g1 (ξ) = −J1 01×2 , g2 (ξ) = −J1 , (5.11)
J2 01×2 J2
0
1
h1 (ξ) = ρx1 , k12 (ξ) = ,
02×1
ρx2
ξ1 + π
h2 (ξ) = , k21 (ξ) = 02×1 I2 .
ξ2
Finalmente, el Teorema 2.4 asegura que si la condición (2.21) se satisface para el sistema
autónomo descrito por (5.11), (5.12), y siendo Pε una solución positiva definida de
(2.22) bajo algún ε > 0, entonces la retroalimentación de salida invariante en el tiempo
(2.23) es una solución local que resuelve el problema de control H∞ .
5.3 Resultados experimentales 73
α = 100
Ecuación de Van der Pol modificada ρv = 0.9π
µ=8
ρ = 1.1
ε = 0.05
Regulador H∞ para swing-up
kp = 100
kd = 200
ρ = 0.7
Seguimiento H∞ para estabilización
ε = 0.05
6
Ángulo del péndulo (rad)
−2
−4
0 5 10 15 20 25 30
Tiempo (s)
La Figura 5.5 muestra la respuesta de los estados del sistema bajo el controlador
híbrido propuesto. A pesar de que el comportamiento es distinto al sugerido por las
simulaciones, se observa que el sistema finalmente converge a la posición deseada apro-
ximadamente en ts = 6 s y permanece estable durante el resto del experimento si no
se somete a perturbaciones externas. Nótese que después de ser sujeto a varias pertur-
baciones fuertes que obligan a la salida de la zona de atracción del punto de equilibrio,
el controlador regresa al sistema a la posición deseada casi de forma inmediata.
10
q1 (rad)
−5
0 5 10 15 20 25 30
5
q2 (rad)
−5
0 5 10 15 20 25 30
20
dq1/dt (rad/s)
−20
0 5 10 15 20 25 30
dq2/dt (rad/s)
2000
−2000
0 5 10 15 20 25 30
Tiempo (s)
Figura 5.5: Respuestas del sistema en lazo cerrado.
Swing−up (Nm)
50
−50
0 5 10 15 20 25 30
Estabilización (Nm)
5000
−5000
0 5 10 15 20 25 30
Señal de control (EU)
10
−5
−10
0 5 10 15 20 25 30
Tiempo (s)
15
Swing−up (rad)
10
−5
0 5 10 15 20 25 30
15
Estabilización (rad)
10
0
0 5 10 15 20 25 30
15
Híbrido (rad)
10
−5
0 5 10 15 20 25 30
Tiempo (s)
Figura 5.7: Errores de posición por retroalimentación de salida.
En la Figura 5.8 se observa el plano de fase del péndulo (posición respecto a velo-
cidad), demostrando estabilidad alrededor de más de un equilibrio debido a las carac-
terísticas particulares de este experimento.
5.3 Resultados experimentales 76
20
15
10
5
dq1/dt (rad/s)
−5
−10
−15
−20
−4 −2 0 2 4 6 8 10
q1 (rad)
20 20
10 10
F (Nm)
Fr (Nm)
0 0
r
−10 −10
−20 −20
−30 −30
−2500 −2000 −1500 −1000 −500 0 500 1000 1500 2000 2500 0 5 10 15 20 25 30
x4 (rad/s) Tiempo (s)
A pesar de que las simulaciones demuestran lo contrario, sin una ganancia pro-
porcional al error de posición, el controlador de swing-up difícilmente genera un
par suficiente para alcanzar su objetivo.
La elección del ángulo en que se activa la conmutación entre los dos controladores
es fundamental. Aparte del tiempo de convergencia, influye en las ganancias de
los controladores y la inercia y energía total del sistema durante el instante de
conmutación, afectando la permanencia del péndulo en la región de atracción del
control de estabilización.
77
6.3 Artículos derivados de la investigación 78
[6] T. Başar and P. Bernhard. H∞ -Optimal Control and Related Minimax Design
Problems: A Dynamic Game Approach. Birkhäuser, Boston, 2nd edition, 1995.
[9] D. J. Block and M. W. Spong. Mechanical design & control of the pendubot. In
SAE Earthmoving Industry Conference, pages 4–5, 1995.
80
6.3 BIBLIOGRAFÍA 81
[12] Y. Choi and W. Chung. PID Trajectory Tracking Control for Mechanical Systems.
Lecture Notes in Control and Information Sciences. Springer, Berlin, 2004.
[13] C. C. Chung and J. Hauser. Nonlinear H∞ -control around periodic orbits. Systems
Control Letters, 30:127–137, 1997.
[14] P. M. Cohn. Basic Algebra: Groups, Rings, and Fields. Springer-Verlag, UK, 2003.
[16] I. Fantoni and R. Lozano. Non-linear Control for Underactuated Mechanical Sys-
tems, chapter The reaction wheel pendulum. Springer, London, 2002.
[19] F. Grasser, A. D’Arrigo, S. Colombi, and A. Rufer. Joe: a mobile, inverted pen-
dulum. Industrial Electronics, IEEE Transactions on, 49(1):107–114, 2002.
[20] D. Hill and P. Moylan. The stability of nonlinear dissipative systems. IEEE
Transactions on Automatic Control, 21:708–711, 1976.
[21] T. Huryn, J. Blouin, E. Croft, M. Koehle, and H. Van der Loos. Experimental
performance evaluation of human balance control models. Neural Systems and
Rehabilitation Engineering, IEEE Transactions on, 22(6):1115–1127, 2014.
6.3 BIBLIOGRAFÍA 82
[22] A. Isidori and A. Astolfi. Disturbance attenuation and H∞ -control via measure-
ment feedback in nonlinear systems. IEEE Transactions on Automatic Control,
37(9):1283–1293, 1992.
[25] H. K. Khalil. Nonlinear Systems. Mcmillan Academic Pub., New York, 1992.
[27] E. B. Lee and B. Markus. Foundation of Optimal Control. SIAM Series in Applied
Math. John Wiley, New York, 1967.
[28] H. Lee and J. Lee. Driving control of mobile inverted pendulum. In Ubiquitous
Robots and Ambient Intelligence (URAI), 2012 9th International Conference on,
pages 449–453, 2012.
[29] M. Lopez-Martinez, J. Acosta, and J. Cano. Nonlinear sliding mode surfaces for a
class of underactuated mechanical systems. IET Control Theory and Applications,
4(10):2195–2204, 2010.
[30] W. C. A. Maas and A. J. Van Der Schaft. Nonlinear H∞ -control: the singular
case. International Journal of Robust and Non-linear Control, 6:669–689, 1996.
[31] R. Olfati-Saber. Fixed point controllers and stabilization of the cart-pole system
and the rotating pendulum. In Decision and Control. Proceedings of the 38th
IEEE Conference on, volume 2, pages 1174–1181, 1999.
[35] R. S. Palais. When proper maps are closed. Proceedings of the American Mathe-
matical Society, 24:835–836, 1970.
[43] W. Singhose and S. Towell. Double-pendulum gantry crane dynamics and control.
In Control Applications. Proceedings of the 1998 IEEE International Conference
on, volume 2, pages 1205–1209, 1998.
[45] M. W. Spong, P. Corke, and R. Lozano. Nonlinear control of the inertia wheel
pendulum. Automatica, 37(11):1845–1851, 2001.
[49] W. Sun, H. Gao, and B. Yao. Adaptive robust vibration control of full-car ac-
tive suspensions with electrohydraulic actuators. IEEE Transactions on Control
Systems Technology, 21(6):2417–2422, 2013.
[50] C. Thum, C. Du, B. Cheng, E. H. Ong, and K. P. Tan. A unified control scheme for
track seeking and following of a hard disk drive servo system. IEEE Transactions
on Control Systems Technology, 18(2):294–306, 2010.
[52] H. van der Kooij, S. Donker, M. de Vrijer, and F. van der Helm. Identification of
human balance control in standing. In Systems, Man and Cybernetics, 2004 IEEE
International Conference on, volume 3, pages 2535–2541 vol.3, 2004.
[53] A. J. Van Der Schaft. L2 -gain analysis of nonlinear systems and nonlinear state
feedback control. IEEE Transactions on Automatic Control, 37(6):770–784, 1992.
[57] H. Ye, W. Gui, and Z. Jiang. Backstepping design for cascade systems with
relaxed assumption on lyapunov functions. IET Control Theory and Applications,
5(5):700–712, 2011.
[59] K. Zhou, J. C. Doyle, and K. Glover. Robust and Optimal Control. Prentice-Hall,
Englewoog Cliffs, NJ, 1996.
Apéndice A
% IWP_Hybrid2Full
%
tauSat = 10;
switchAngle = 150;
% Controlador de Swing-up
rho = 1.1;
kp = 100;
86
A.0 87
kd = 120;
% minimizacion de gamma
[gw Pw Zw] = MinimizeGamma(A,B1,B2,C1,C2,0.5);
% Controlador de Estabilización
rho = 1.1;
% minimizacion de gamma
[gt Pt Zt] = MinimizeGamma(F,G1,G2,H1,H2,0.1);
t0 = 0; % intervalo de tiempo
tf = 10;
delta = 0.0001; % tamaño de paso
IC = [0.1, 0, 0, 0,... % valor inicial de x
0.1, 0]; % valor inicial de oscilador
% Preasignación de memoria
t = zeros(n,1);
y = zeros(n,6);
A.0 88
ci = zeros(n,1);
fss = zeros(n,1);
% Valores iniciales
t(1) = t0;
y(1,:) = IC;
% método de Euler
for i = 1:(n-1)
t(i+1) = t(i) + delta;
% vector de perturbaciones
w = [0.1*cos(2*t(i));
0.001*cos(5*t(i));
0.002*cos(3*t(i))];
% señal de referencia
qd = y(i,5);
dqd = y(i,6);
ddqd = -alpha*((qd^2 + dqd^2/mu^2) - rhov^2)*dqd - mu^2*qd;
q1 = y(i,1) + w(2);
x2 = y(i,2) + w(3); % = q2
x4 = y(i,4); % = dq2
if q1 < rhov
% control de swingup
x1 = q1 - qd;
x3 = y(i,3) - dqd;
u = -B2.’*Pw*[x1; x3];
tau = -Ia*(J1*h*sin(q1) + ddqd + u - kp*x1 - kd*x3 - J1*fs);
else
% control de estabilización
A.0 89
x1 = q1 - pi;
x3 = y(i,3);
u = -G2.’*Pt*[x1; x2; x3; x4];
tau = u;
end
J2 = 1/Ia + 1/Ir;
fs = 0.0117;
tauSat = 10;
switchAngle = 150;
% Controlador de Swing-up
rho = 1.1;
kp = 100;
kd = 200;
% minimizacion de gamma
[gw Pw Zw] = MinimizeGamma(A,B1,B2,C1,C2,0.05);
% Controlador de Estabilización
rho = 0.7;
% minimizacion de gamma
A.0 91
t0 = 0; % intervalo de tiempo
tf = 10;
delta = 0.0001; % tamaño de paso
IC = [0.1, 0, 0, 0,... % valor inicial de x
0.1, 0]; % valor inicial de oscilador
% Preasignación de memoria
t = zeros(n,1);
y = zeros(n,6);
ci = zeros(n,1);
fss = zeros(n,1);
% Valores iniciales
t(1) = t0;
y(1,:) = IC;
% método de Euler
for i = 1:(n-1)
t(i+1) = t(i) + delta;
% vector de perturbaciones
w = [0.1*cos(2*t(i));
0.001*cos(5*t(i));
0.002*cos(3*t(i))];
% señal de referencia
qd = y(i,5);
dqd = y(i,6);
ddqd = -alpha*((qd^2 + dqd^2/mu^2) - rhov^2)*dqd - mu^2*qd;
q1 = y(i,1) + w(2);
x2 = y(i,2) + w(3); \% = q2
x4 = y(i,4); \% = dq2
elseif x4 < 0
fs = -0.97 + 0.0117*x4;
else
fs = 0;
end
fss(i+1) = fs;
if q1 < 2.618
% control de swingup
x1 = q1 - qd;
x3 = y(i,3) - dqd;
u = -B2.’*Pw*[x1; x3];
tau = -Ia*(J1*h*sin(q1) + ddqd + u - kp*x1 - kd*x3 - J1*fs);
else
% control de estabilización
x1 = q1 - pi;
x3 = y(i,3);
u = -G2.’*Pt*[x1; x2; x3; x4];
tau = u;
end
Función de minimización de γ
eI = epsilon*eye(length(A));
Cp = C1.’*C1 + eI;
Cz = B1*B1.’ + eI;
gamma = 0:0.01:100;
for i = 2:length(gamma)
g2 = gamma(i)^(-2);
Bp = B2*B2.’ - g2*(B1*B1.’);
try
Pe = are(A, Bp, Cp);
Ae = A + g2*(B1*B1.’)*Pe;
Bz = C2.’*C2 - g2*Pe*(B2*B2.’)*Pe;
Ze = are(Ae.’, Bz, Cz);
gammaMin = 1;
catch err
gammaMin = 0;
end
if gammaMin;
gammaMin = gamma(i);
break
end
end
if (i == length(gamma)) && ~gammaMin
novalid = 1;
end
Apéndice B
Controlador en Simulink
|u|
Wheel angle
q1
Plant u fcn y vel velk
dq1
tau
filtered velocity1 qd
q2 dq2 Saturation1
qd Swing−up Controller
94
B.0 95
1 sin −K−
q1
sin(q1) J1*h
−kp
x1
P
u
2 K*u
dq1
hinf −K− 1
x3
tau
−kd Gain
D
3
qd
f(u)
dq2 > 0
4 −K−
dq2
f(u) fr(dq2) −J1
dq2 < 0 Add
pi
Constant
1
q1 x1
2
x2
q2
K*u 1
tau
3
x3 hinf
dq1
4
x4
dq2