Apunte - María Marta Seron

Sistemas No Lineales
Notas de Clase
Por Mar a Marta Seron Laboratorio de Sistemas Din amicos y Procesamiento de Se nales (LSD) Universidad Nacional de Rosario Primer Cuatrimestre 2000 Revisadas y ampliadas por Julio H. Braslavsky Automatizaci on y Control Industrial Universidad Nacional de Quilmes Primer Cuatrimestre 2001 Basadas en Khalil, H. Nonlinear Systems. Segunda edici on. Prentice Hall, NJ, 1996.
Indice General
I An alisis 1
3 29 49 77 97
1 Introducci on 2 Propiedades Fundamentales 3 Estabilidad Seg un Lyapunov. Sistemas Estacionarios 4 Estabilidad Seg un Lyapunov. Sistemas Inestacionarios 5 Estabilidad de Sistemas Perturbados
II
Control
113
115 137 161
6 Control en Realimentaci on 7 Linealizaci on Exacta por Realimentaci on 8 Dise nos Basados en Lyapunov
Parte I An alisis
Cap tulo 1 Introducci on

1.1
1.1.1
Introducci on
Sistemas No Lineales de Control
La teor a de sistemas de control se ocupa del an alisis y el dise no de componentes interactuantes de un sistema en una conguraci on que brinde un comportamiento deseado. La conguraci on esencial usada en teor a de sistemas de control se basa en el concepto fundamental de realimentaci on, que consiste en el proceso de medir las variables de inter es en el sistema y usar esa informaci on para controlar su comportamiento. La teor a y la pr actica del control tienen un amplio rango de aplicaciones en los campos de la ingenier a aeron autica, qu mica, mec anica, ambiental, civil y el ectrica, as como en muchas otras disciplinas no ingenieriles. Las ventajas del control eciente en la industria son inmensas, e incluyen mejoras en la calidad de los productos, reducci on en el consumo de energ a, minimizaci on de los material de desecho, mayores niveles de seguridad y reducci on de la contaminaci on. El punto de partida en el an alisis de un sistema de control es su representaci on por un modelo matem atico, generalmente como un operador entre entradas y salidas del sistema, o como un conjunto de ecuaciones diferencia y/o diferenciales. La mayor a de los modelos matem aticos usados tradicionalmente por te oricos y pr acticos del control son lineales. De hecho, los modelos lineales son mucho m as manejables que los no lineales, y pueden representar en forma precisa el comportamiento de sistemas reales en muchos casos u tiles. Sin embargo, los avances tecnol ogicos actuales han generado una enorme variedad de nuevos problemas y aplicaciones que son no lineales en esencia. Por ejemplo, fen omenos no lineales tales como equilibrios m ultiples, ciclos l mite, bifurcaciones, corrimiento de frecuencias y caos, se observan com unmente en aplicaciones modernas importantes en ingenier a, tales como sistemas de comando de vuelo, manipuladores robot, sistemas de autopistas automatizadas, estructuras de ala de avi on, y sistemas de inyecci on de combustible de alto rendimiento. Tales fen omenos no lineales no se pueden describir mediante din amica de modelos lineales una raz on ineludible para el uso de modelos no lineales y el desarrollo de conceptos y herramientas de sistemas no lineales de control. Alentada por la sosticaci on de la tecnolog a actual, la teor a de sistemas no lineales de control ha experimentado en la d ecada pasada una vigorosa expansi on, reejada por un n umero r apidamente creciente de monograf as y libros de texto cient cos de sistemas no lineales de control [Isidori, 1995, Krsti c et al., 1995, Khalil, 1996, Sepulchre et al., 1997, Isidori, 1999, Sastry, 1999, van der Schaft, 2000]. Una caracter stica dominante de esta expansi on ha sido la aparici on de conceptos importantes, tales como los de pasivaci on por realimentaci on [van der
Introducci on
Schaft, 2000] y estabilidad entrada-estado [Sontag, 1989], y procedimientos sistem aticos de dise no, tales como backstepping y forwarding [Krsti c et al., 1995, Sepulchre et al., 1997]. La importancia de estos procedimientos sistem aticos de dise no es que, aunque restringidos a sistemas con estructura especial, incluyen sistemas de importancia pr actica, tales como barcos, motores a reacci on, motores turbo-diesel y motores el ectricos de inducci on.
1.1.2
El Curso
Este curso brinda una introducci on rigurosa y en profundidad a los conceptos fundamentales de la teor a de sistemas no lineales y a t ecnicas modernas de an alisis y dise no de sistemas de control no lineal. Vamos a trabajar en general con sistemas din amicos modelados por un n umero nito de ecuaciones diferenciales ordinarias de primer orden acopladas entre s , que representaremos en forma compacta con la ecuaci on diferencial vectorial de primer orden x = f (x, u) , (1.1)
donde x Rn es el vector de estado y u Rp es el vector de entradas (de control). A veces vamos a considerar tambi en una ecuaci on de salida y = h(x, u) , (1.2)
donde y Rm es un vector de variables de inter es, por ejemplo variables f sicamente medibles o variables que deseamos se comporten de alguna forma especial. u f (x, u) x x h(x, u)
(x) Figura 1.1: Sistema no lineal
Muchas veces la entrada u no aparece expl citamente en (1.1), ya sea porque la entrada es cero o porque fue especicada como una funci on del estado u = (x) control por realimentaci on. En este caso la ecuaci on de estado es la ecuaci on no forzada x = f (x) . (1.3)
Vamos a trabajar, en general, con sistemas estacionarios o invariantes en el tiempo, es decir que su comportamiento es invariante al corrimiento del origen temporal. Cuando el sistema es inestacionario o variante en el tiempo, el lado derecho de (1.3) es una funci on expl cita del tiempo. Un concepto importante relacionado con la ecuaci on de estado (1.3) es el de puntos de equilibrio.
1.2 Ejemplos
Denici on 1.1 (Puntos de Equilibrio). Un punto x = x en el espacio de estado es un punto de equilibrio (PE) de (1.3) si tiene la propiedad de que cuando el estado inicial del sistema es x , el estado permanece en x en todo tiempo futuro. Los PE de (1.3) son las ra ces de la ecuaci on f (x) = 0 . Un PE puede ser aislado, es decir no tiene otros PE en la vecindad, o puede existir un continuo de PE. Cuando el sistema es lineal, (1.3) tiene la forma conocida x = Ax + Bu , y el u nico PE aislado posible (tomando u = 0) es x = 0. Como las t ecnicas de an alisis y control lineales son bien conocidas, siempre es conveniente, al analizar un sistema no lineal, comenzar linealizando el sistema alrededor de alg un punto de equilibrio y estudiar el sistema lineal resultante. Sin embargo esto no es suciente debido b asicamente a dos razones: (i) la linealizaci on s olo predice el comportamiento local, no sirve para estudiar el comportamiento lejos del punto de operaci on; (ii) la din amica de un sistema no lineal es mucho m as rica que la de un sistema lineal debido a la presencia de fen omenos no lineales como: escape en tiempo nito, m ultiples PE aislados, ciclos l mite, oscilaciones sub-arm onicas, arm onicas o casi-peri odicas, caos, etc. En el transcurso del curso s olo vamos a encontrar los fen omenos de escape en tiempo nito, m ultiples equilibrios y ciclos l mite. Ver por ejemplo Guckenheimer and Holmes [1983] para m as referencia sobre caos, bifurcaciones y oscilaciones.
1.2
1.2.1
Ejemplos
Ecuaci on del P endulo
Uno de los problemas m as simples en rob otica es el de controlar la posici on de una junta de robot usando un motor ubicado en el punto de giro. Matem aticamente esto no es m as que un p endulo, representado en la Figura 1.2.
mg
Figura 1.2: P endulo
Introducci on
Usando la segunda ley de Newton podemos escribir la ecuaci on de movimiento en la direcci on tangencial: = mg sen kl , ml donde m es la masa de la bola, l es la longitud del brazo, es el angulo entre la vertical y el brazo, g es la aceleraci on de la gravedad, y k es el coeciente de fricci on. Tomando como variables de estado x1 = y x2 = podemos escribir las ecuaciones de estado x 1 = x2 , g k x 2 = sen x1 x2 . l m (1.4)
Los PE son (haciendo x 1 = x 2 = 0) (n, 0), n = 0, 1, 2, . . .. Obviamente s olo los PE (0, 0) y (, 0) son no triviales ya que el resto son repeticiones de los mismos. F sicamente podemos ver que el PE en (0, 0) es estable mientras que el PE en (, 0) es inestable, como ya vamos a estudiar en m as detalle. Otra versi on de la ecuaci on del p endulo consiste en agregarle una entrada de control, por ejemplo aplicando una cupla T : x 1 = x2 , g k 1 x 2 = sen x1 x2 + 2 T . l m ml (1.5)
Varios sistemas f sicos pueden describirse con ecuaciones similares a las del p endulo, e.g., un generador sincr onico conectado a un bus innito [Khalil, 1996, Ejercicio 1.7], el circuito de una juntura Josephson [Khalil, 1996, Ejercicio 1.8], un lazo de PLL (phase locked loop ) [Khalil, 1996, Ejercicio 1.10].
1.2.2
Circuito con Diodo T unel

L + vL iR iC
+
i mA
iL
i = h(v ) 0.5
+ vC
+ vR
0 0 0.5 1 vV
Figura 1.3: Diodo T unel
La Figura 1.3 muestra un circuito con diodo t unel, donde la relaci on constitutiva del diodo es iR = k (vR ). Usando las leyes de Kirchho y tomando como variables de estado x1 = vC
1.2 Ejemplos
(tensi on en el capacitor) y x2 = iL (corriente en la inductancia), el circuito puede describirse con las siguientes ecuaciones de estado x 1 = 1 [h(x1 ) + x2 ] , C 1 x 2 = [x1 Rx2 + u] , L
(1.6)
donde u = E e i = h(v ) es la caracter stica v i del diodo t unel. Los PE son las ra ces de la ecuaci on h(x1 ) = E 1 x1 . R R
Seg un el valor de E/R puede haber uno o tres PE, como se ve el la Figura 1.4.
1 iR Q1 Q2 0.5
Q3 0 0 0.5 1 vR
Figura 1.4: Puntos de equilibrio del circuito de diodo t unel
1.2.3
Sistema Masa-Resorte
Consideramos el sistema masa-resorte de la Figura 1.5. Usando la ley de Newton: my + Ff + Fr = F , donde Ff es una fuerza resistiva de fricci on, Fr es la fuerza de recuperaci on del resorte, y F es una fuerza externa a nuestra disposici on. Asumimos que Fr es s olo funci on del desplazamiento y , es decir Fr = g (y ), g (0) = 0. Para desplazamientos peque nos, Fr puede modelarse como la relaci on lineal g (y ) = ky . Para grandes desplazamientos, la fuerza de recuperaci on puede depender no linealmente de y . Por ejemplo, hay resortes suaves donde g (y ) = k (1 a2 y 2 )y, o resortes duros donde g (y ) = k (1 + a2 y 2 )y . |ay | < 1 ,
F F F y
f r
Introducci on
Figura 1.5: Sistema masa-resorte
Un ejemplo de fuerza de fricci on es la fuerza viscosa o amortiguamiento del aire, que suele modelarse como una funci on no lineal de la velocidad Fv = h(y ), h(0) = 0. Para velocidades peque nas podemos asumir Fv = cy . Combinando un resorte duro con amortiguamiento lineal y una fuerza externa peri odica F = A cos t obtenemos la ecuaci on de Dung my + cy + ky + ka2 y 3 = A cos t (1.7)
que es un ejemplo cl asico en el estudio de excitaci on peri odica de sistemas no lineales. Otro ejemplo de fuerza de fricci on es la fricci on est atica o de Coulomb. Este tipo de amortiguamiento aparece cuando la masa se desliza sobre una supercie seca. Cuando la masa est a en reposo, existe una fuerza de fricci on est atica Fs que act ua paralela a la supercie y est a limitada por los valores s mg , donde 0 < s < 1 es el coeciente de fricci on est atica. Esta fuerza toma cualquier valor, dentro de sus l mites, para mantener la masa en reposo. Para que haya movimiento, debe ejercerse una fuerza en la masa que venza a la fuerza de fricci on. En ausencia de la fuerza exterior, F = 0, la fuerza de fricci on est atica compensa la fuerza de recuperaci on del resorte y mantiene el equilibrio si |g (y )| s mg . Una vez que la masa entra en movimiento, aparece una fuerza de fricci on de deslizamiento de magnitud k mg que se opone al movimiento, donde k es el coeciente de fricci on cin etica, que asumimos constante. Un modelo ideal de la fuerza de fricci on es for y <0 k mg , Fd = Fs , for y =0 k mg , for y >0 Combinando un resorte lineal con amortiguamiento viscoso, fricci on est atica y fuerza externa nula tenemos my + ky + cy + (y, y ) = 0 donde ) , k mg sign(y (y, y ) = ky , s mg sign(y ) , for |y | > 0 for y = 0 and |y | s mg/k for y = 0 and |y | > s mg/k
El valor de (y, y ) para y = 0 y |y | s mg/k resulta de la condici on de equilibrio y =y = 0. Tomando x1 = y y x2 = y , la ecuaci on de estado es x 1 = x2 x 2 = c 1 k x1 x2 (x1 , x2 ) m m m (1.8)
1.2 Ejemplos Dos caracter sticas de esta ecuaci on son: (i) tiene un conjunto de equilibrio en lugar de PE aislados; (ii) la funci on del lado derecho es una funci on discontinua del estado.
Considerando x2 > 0 o x2 < 0 se obtienen dos modelos lineales diferentes. El comportamiento del sistema no lineal puede estudiarse en cada regi on v a an alisis lineal. Este es un ejemplo de an alisis seccionalmente lineal.
1.2.4
Oscilador de Resistencia Negativa
La gura 1.6 muestra la estructura b asica de una importante clase de osciladores electr onicos. Asumimos L > 0, C > 0, y que el elemento resistivo tiene una caracter stica i = h(v ) como se muestra en la Figura 1.6.
i + i C iC L v iL
Figura 1.6: Oscilador de resistencia negativa Escribiendo la ley de Kirchho de corriente y derivando con respecto a t, obtenemos CL d2 v dv + v + Lh (v ) = 0 2 dt dt
Haciendo el cambio de escala de tiempos = t/ CL tenemos (denotando v = dv/d ) v + h (v )v +v =0 donde = L/C . Esta ecuaci on es un caso particular de la ecuaci on de Lienard (1.9)
v + f (v )v + g (v ) = 0 Cuando 1 h(v ) = v + v 3 3 la ecuaci on toma la forma de la ecuaci on de Van der Pol v (1 v 2 )v +v =0
(1.10)
Esta ecuaci on tiene una soluci on peri odica que atrae toda otra soluci on excepto la trivial correspondiente al u nico PE v = v = 0. Tomando x1 = v y x2 = v llegamos al modelo de estado x 1 = x2 x 2 = x1 h (x1 )x2 (1.11)
10
Introducci on
1.2.5
Control Adaptable
Sea la planta y = ay + ku donde u es la entrada de control e y es la salida medida. Supongamos que se quiere obtener un sistema a lazo cerrado cuyo comportamiento entradasalida sea el del modelo de referencia y m = am y m + k m r donde r es la entrada de referencia y el modelo se eligi o de forma que ym (t) represente la salida deseada para el sistema a lazo cerrado. Este objetivo puede alcanzarse mediante el control en realimentaci on
u(t) = 1 r(t) + 2 y (t)
siempre que los par ametros de la planta a y k sean conocidos, k = 0, y los par ametros del control se elijan como
1 =
km k
1 =
am a . k
Cuando a y k son desconocidos, podemos considerar el control u(t) = 1 (t)r(t) + 2 (t)y (t) donde las ganancias variables 1 (t) y 2 (t) van a ser ajustadas on-line usando los datos disponibles: r( ), ym ( ), y ( ) y u( ) con < t. La adaptaci on debe ser tal que 1 (t) y 2 (t) evolucionen hacia sus valores nominales 1 y 2 . La regla de adaptaci on se elige en base a consideraciones de estabilidad, por ejemplo, el algoritmo del gradiente [Khalil, 199613.4]: 1 = (y ym )r 2 = (y ym )y donde es una constante positiva que determina la velocidad de adaptaci on. Para escribir un modelo de estado, es conveniente denir los errores: de salida e = y ym y param etricos 1 = 1 1 y 2 = 2 2 . Con un poco de manipulaci on algebraica (ejercicio) se llega al lazo cerrado descripto por la ecuaci on de estado no lineal, no aut onoma e (t) = am e(t) + k1 (t)r(t) + k2 (t)(e(t) + ym (t)) 1 (t) = e(t)r(t) 2 (t) = e(t)(e(t) + ym (t)) (1.12)
donde las se nales r(t) e ym (t) son entradas externas. Un modelo m as simple se obtiene cuando se conoce k . En este caso se puede tomar 1 = 1 y s olo 2 debe ajustarse on line. Ejercicio: escribir el modelo en este caso y hallar los PE cuando r(t) 0.
1.3 Sistemas de Segundo Orden
11
1.3
1.3.1
Sistemas de Segundo Orden

Sistemas Lineales
Es u til repasar el retrato de fase de sistemas lineales de segundo orden como herramienta para estudiar el comportamiento local del sistema no lineal alrededor de un PE. Consideremos el sistema de segundo orden x = Ax La soluci on para un estado inicial x0 est a dada por x(t) = M eJr t M 1 x0 donde Jr es la forma real de Jordan de A y M es una matriz real no singular tal que M 1 AM = Jr . Dependiendo de los autovalores de A, la forma real de Jordan toma alguna de las siguientes tres formas 1 0 0 2 k 0 (1.13)
donde k es 0 o 1. La primera forma corresponde al caso en que los autovalores 1 y 2 son reales y distintos, la segunda corresponde al caso en que los autovalores son reales e iguales, y la tercera corresponde al caso de autovalores complejos 1,2 = j . En el caso de autovalores reales, hay que separar el caso en que al menos uno de los autovalores es cero. En este caso, el origen no es un PE aislado y el comportamiento cualitativo del sistema es distinto de los otros casos. Autovalores Reales 1 = 2 = 0 En este caso M = [v1 , v2 ], donde v1 y v2 son los autovectores asociados con 1 y 2 . El retrato de fase es el de un: nodo estable si ambos autovalores son negativos. Las trayectorias en el plano de fase son par abolas que se hacen tangentes al autovector lento (correspondiente al mayor autovalor) cuando se acercan al origen, y paralelas al autovector r apido (correspondiente al menor autovalor) lejos del origen. nodo inestable si ambos autovalores son positivos. Las trayectorias en el plano de fase son par abolas con formas similares a la del nodo estable pero con sentido invertido. ensilladura si los autovalores tienen distinto signo. Las trayectorias en el plano de fase (excepto las correspondientes a los autovectores, que son rectas) son hip erbolas que comienzantangentes al autovector estable (correspondiente al autovalor estable) en innito, y terminantangentes al autovector inestable (correspondiente al autovalor inestable), tambi en en innito. Autovalores Complejos 1,2 = j En coordenadas polares r y el modelo de estado se desacopla, tomando la forma r = r =
12
Introducci on
v1
v2
x2
x1
Figura 1.7: Retrato de fase de un nodo estable.
x2
v2
.
x1
v1
Figura 1.8: Retrato de fase de una ensilladura.
13
de forma que el radio es una funci on exponencial de la parte real de los autovalores, , y el angulo crece linealmente con la parte imaginaria . El retrato de fase es el de un foco estable si es negativa. Las trayectorias en el plano de fase son espirales logar tmicas que convergen al origen.
x2
x1
Figura 1.9: Retrato de fase de un foco estable
foco inestable si es positiva. Las trayectorias en el plano de fase son espirales logar tmicas que divergen del origen. centro si = 0. Las trayectorias en el plano de fase son elipses centradas en el origen.
x2
x1
Figura 1.10: Retrato de fase de centro
Autovalores M ultiples No Nulos 1 = 2 = 0 El retrato de fase en este caso se asemeja al de un nodo (estable o inestable seg un sea negativo o positivo. Las trayectorias no tienen en este caso el comportamiento asint otico r apidolento como en el caso de autovalores distintos.
14
x2
Introducci on
x1
Figura 1.11: Retrato de fase del caso de autovalores m ultiples no nulos
Nota 1.1 (Resumen del caso en que el origen es un PE aislado). El sistema puede tener 6 retratos de fase diferentes asociados con diferentes tipos de equilibrio: nodo estable, nodo inestable, ensilladura, foco estable, foco inestable y centro. El tipo de equilibrio est a completamente especicado por la ubicaci on de los autovalores de A. El comportamiento global del sistema (en todo el plano de fase) est a cualitativamente determinado por el tipo de equilibrio. Uno o Ambos Autovalores Es Cero En este caso A tiene un kernel o espacio nulo no trivial, es decir existe un subespacio no trivial del espacio de estado cuyos elementos son mapeados al cero bajo la transformaci on lineal denida por A. Todo vector en el kernel de A es un punto de equilibrio del sistema. La dimensi on del kernel puede ser uno o dos; si es dos, entonces A es la matriz nula y todo punto en el espacio de estado es un punto de equilibrio. Cuando la dimensi on del kernel de A es uno, la forma de Jordan de A depender a de la multiplicidad del cero como autovalor. Cuando la multiplicidad del cero como autovalor es uno, el autovector correspondiente dene el conjunto o subespacio de equilibrio del sistema. Todas las trayectorias en el plano de fase convergen al subespacio de equilibrio cuando el autovalor no nulo es negativo, y divergen cuando es positivo; el caso mostrado en la Figura 1.12. Cuando la multiplicidad del cero como autovalor es dos, el autovector v1 , donde M = [v1 , v2 ] es la transformaci on que lleva a la forma de Jordan, es el conjunto o subespacio de equilibrio del sistema. Las trayectorias que comienzan fuera del subespacio de equilibrio se mueven paralelas a el, como se ve en la Figura 1.13. Nota 1.2 (Persistencia del Tipo de Equilibrio Frente a Perturbaciones). Veamos el caso de perturbaciones lineales. Supongamos que A tiene autovalores distintos y consideremos la matriz A + A, donde A es una matriz real de 2 2 cuyos elementos son arbitrariamente peque nos. Por la teor a de perturbaciones de matrices (ver por ejemplo Golub and van Loan 19967) sabemos que los autovalores de una matriz dependen continuamente de sus par ametros. Es decir, dado > 0, existe > 0 tal que si la magnitud de la perturbaci on de cada elemento de A es menor que , los autovalores de la matriz perturbada A + A estar an en una bola de radio centrada en los autovalores de A. En consecuencia, todo autovalor de A que est e en el semiplano derecho (o izquierdo) abierto, permanecer a en ese semiplano frente a perturbaciones arbitrariamente peque nas. Por otro lado, los autovalores sobre el eje imaginario pueden moverse hacia cualquiera de los semiplanos frente a perturbaciones por m as peque no que sea .
15
x2
v2
v1
.
x1
Figura 1.12: Retrato de fase para 1 = 0, 2 > 0
x2
x1
Figura 1.13: Retrato de fase para 1 = 0 = 2
16
Introducci on
Por lo tanto, podemos concluir que si el PE x = 0 de x = A x es un nodo, foco o ensilladura, entonces el PE x = 0 de x = (A + A) x ser a del mismo tipo frente a perturbaciones sucientemente peque nas. La situaci on es muy distinta si el PE es un centro. Consideremos la siguiente perturbaci on de la forma real de Jordan correspondiente a un centro 1 1 donde es el par ametro de perturbaci on. Cuando es positivo, el PE del sistema perturbado es un foco inestable; cuando es negativo es un foco estable. Esto pasa para cualquier valor de = 0. Dado que el retrato de fase de un foco es cualitativamente distinto del de un centro, vemos que un centro no persiste frente a perturbaciones. El nodo, foco y ensilladura se dicen estructuralmente estables porque mantienen su comportamiento cualitativo frente a perturbaciones innit esimamente peque nas, mientras que el centro no es estructuralmente estable. La diferencia entre ambos casos es debida a la ubicaci on de los autovalores de A, siendo los autovalores sobre el eje imaginario vulnerables a perturbaciones. Esto lleva a la denici on de PE hiperb olico. El origen x = 0 es un PE hiperb olico de x = A x si A no tiene autovalores con parte real nula. Cuando A tiene autovalores reales m ultiples, perturbaciones innit esimamente peque nas pueden transformarlos en autovalores complejos. Es decir que un nodo puede permanecer como nodo o transformarse en un foco. Cuando A tiene autovalores nulos, existe una diferencia importante entre los casos en que uno o los dos (A = 0) autovalores sean cero. En el primer caso, una perturbaci on del autovalor en cero resulta en un autovalor 1 = donde puede ser positivo o negativo. Como el otro autovalor 2 es distinto de cero, la perturbaci on lo mantiene fuera del cero. Es decir que resultan dos autovalores reales distintos y el PE del sistema perturbado es un nodo o una ensilladura, dependiendo de los signos de 2 y . Sin embargo, como la perturbaci on es muy peque na, de forma que |1 | << |2 |, la forma de las trayectorias mantienen cierta similitud con las del caso en que un autovalor es nulo (comparar los retratos de fase en la Figura 1.14 con las Figuras 1.7 y 1.8). El comportamiento de este sistema es el de un sistema singularmente perturbado [Khalil, 1996, Cap tulo 9].
x2 x2
x1
x1
Figura 1.14: Retrato de fase de un sistema perturbado cuando 1 = 0 y 2 < 0 con < 0 (izquierda) y > 0 (derecha) Cuando ambos autovalores de A son nulos, el efecto de una perturbaci on es m as dram atico.
1.3 Sistemas de Segundo Orden Consideremos las siguientes posibles perturbaciones de la forma de Jordan 0 1 2 0 1 2 1 0 1 0
17
donde puede ser positivo o negativo. Es f acil de ver que el PE en cada uno de estos cuatro casos puede ser un centro, un foco, un nodo o una ensilladura, respectivamente.
1.3.2
Equilibrios M ultiples
Un sistema lineal tiene un PE aislado en x = 0 si det A = 0, y un continuo de PE o subespacio de equilibrio cuando det A = 0. Un sistema no lineal, en cambio, puede tener m ultiples PE aislados. Ejemplo 1.1 (Diodo T unel). Consideremos otra vez el modelo del diodo t unel (1.6), con par ametros u = 1.2V , R = 1.5k , C = 2pF , L = 5H . Midiendo tiempo en nanosegundos y corrientes en mA, el modelo de estado resulta x 1 = 0.5 [h(x1 ) + x2 ] x 2 = 0.2 (x1 1.5 x2 + 1.2) Supongamos que h es
3 4 5 h(x1 ) = 17.76 x1 103.79 x2 1 + 229.62 x1 226.31 x1 + 83.72 x1
El retrato de fase obtenido por simulaci on en computadora puede verse en la Figura 1.15. Hay tres PE aislados Q1 , Q2 y Q3 ; todas las trayectorias en el plano de fase tienden hacia Q1 o Q3 , excepto dos u nicas trayectorias que tienden hacia Q2 y que denen la curva separatriz que divide el plano de fase en 2 mitades, en cada una de las cuales las trayectorias tienden hacia Q1 o Q3 , respectivamente. Ejemplo 1.2 (P endulo). Consideremos el modelo de estado del p endulo (1.4) con k/l = 1 y k/m = 0.5. El retrato de fase obtenido por simulaci on en computadora puede verse en la Figura 1.16. Puede verse que es peri odico con un per odo de 2 , por lo cual el comportamiento puede estudiarse en la franja x1 . Salvo dos trayectorias especiales que terminan en el PE inestable (, 0), toda otra trayectoria converge al PE estable (0, 0).
1.3.3
Comportamiento Cualitativo Cerca de un PE
Salvo en casos especiales, el comportamiento de un sistema no lineal en la vecindad de un PE puede determinarse v a la linealizaci on alrededor de ese punto. Sea p = (p1 , p2 ) un PE del sistema no lineal x 1 = f1 (x1 , x2 ) x 2 = f2 (x1 , x2 ) (1.14)
y supongamos que las funciones f1 y f2 son continuamente diferenciables (derivables con derivada continua). Expandiendo el lado derecho de (1.14) en series de Taylor alrededor de (p1 , p2 ) obtenemos x 1 = f1 (p1 , p2 ) + a11 (x1 p1 ) + a12 (x2 p2 ) + T.O.S x 2 = f2 (p1 , p2 ) + a21 (x1 p1 ) + a22 (x2 p2 ) + T.O.S
18
Introducci on
x2
Q1
Q2
Q3
.
x1
Figura 1.15: Retrato de fase del circuito con diodo t unel
x2
x1
.
Figura 1.16: Retrato de fase de la ecuaci on del p endulo
19
donde aij es la derivada parcial de fi respecto de xj evaluada en x1 = p1 , x2 = p2 , y T.O.S son t erminos de orden superior, es decir de la forma (x1 p1 )2 , (x2 p2 )2 , (x1 p1 )(x2 p2 ) y potencias superiores de los mismos. Como (p1 , p2 ) es un PE tenemos que f1 (p1 , p2 ) = f2 (p1 , p2 ) = 0 Como nos interesa el comportamiento cerca de (p1 , p2 ), denimos y1 = x1 p1 , y2 = x2 p2
con lo cual el sistema toma la forma y 1 = a11 y1 + a12 y2 + T.O.S y 2 = a21 y1 + a22 y2 + T.O.S o m as concisamente, y despreciando los T.O.S., y = Ay = La matriz A= f x =
x= p
f x
y
x= p
a11 a12 a21 a22
es la matriz Jacobiana de f (x) = [f1 (x), f2 (x)]t evaluada en el PE p. Analizando los autovalores de la matriz Jacobiana podemos determinar las propiedades del PE en el origen del sistema linealizado. Si el origen del sistema linealizado es un nodo estable (inestable) con autovalores distintos, un foco estable (inestable) o una ensilladura, entonces en un entorno del PE las trayectorias del sistema no lineal se comportan como las de un nodo estable (inestable), un foco estable (inestable) o una ensilladura, respectivamente. En estos casos el PE del sistema no lineal tambi en se llama, por extensi on, nodo, foco o ensilladura. Esta propiedad de la linealizaci on de un sistema no lineal alrededor de un PE s olo vale si el equilibrio del sistema linealizado es hiperb olico. En este caso decimos que el correspondiente PE del sistema no lineal es hiperb olico si la matriz Jacobiana evaluada en el PE no tiene autovalores en el eje imaginario. Ejercicio: estudiar los PE del modelo del diodo t unel y el p endulo. Cuando el PE no es hiperb olico nada puede inferirse acerca del comportamiento de las trayectorias del sistema no lineal a partir de las del sistema lineal. Por ejemplo, el sistema
2 x 1 = x2 x1 (x2 1 + x2 ) 2 x 2 = x1 x2 (x2 1 + x2 )
tiene un PE en el origen; la linealizaci on del sistema alrededor del origen tiene autovalores j , es decir que el origen es un centro para el sistema linealizado. Transformando a coordenadas polares x1 = r cos , x2 = r sen se obtiene r = r3 =1 Se ve claramente que las trayectorias del sistema no lineal se asemejan a las de un foco (estable si > 0 e inestable si < 0).
20
Introducci on
1.4
Ciclos L mites
x(t + T ) = x(t) , t0
Un sistema oscila cuando tiene una soluci on peri odica no trivial 1
para alg un T > 0. La imagen de una soluci on peri odica en el retrato de fase es la de una orbita peri odica o una orbita cerrada. Un sistema lineal con autovalores en el eje imaginario es un oscilador arm onico ya que como el PE en el origen es un centro, las trayectorias son orbitas cerradas cuya amplitud depende de la condici on inicial. Sin embargo, un oscilador lineal no es robusto (estructuralmente estable) ya que cualquier perturbaci on (como ya vimos en la Nota 1.2), destruye la oscilaci on porque el PE deja de ser un centro. Con sistemas no lineales es posible construir osciladores tales que sean estructuralmente estables; la amplitud de la oscilaci on (en r egimen permanente) no dependa de la condici on inicial. Un ejemplo de oscilador no lineal es el oscilador de resistencia negativa de la secci on 1.2.4, con modelo de estado (1.11). El origen es un PE inestable debido a la resistencia negativa del elemento resistivo cerca del origen, lo que signica que el elemento resistivo es activoy entrega energ a. Esto se puede ver escribiendo la expresi on anal tica de la tasa de intercambio de energ a. La energ a total almacenada en el capacitor y la inductancia para cada tiempo t es 1 1 1 2 2 2 + Li2 E = vC L = C x1 + [h(x1 ) + x2 ] 2 2 2 La tasa de intercambio de energ a es = Cx1 h(x1 ) E Esta expresi on conrma que cerca del origen la trayectoria gana energ a ya que para |x1 | peque no el t ermino x1 h(x1 ) es negativo. Tambi en se ve que hay una regi on a x1 b tal que la trayectoria gana energ a dentro de la franja y pierde energ a fuera de ella, como se ve en la Figura 1.17. Una oscilaci on estacionaria va a tener lugar si, a lo largo de una trayectoria, el intercambio neto de energ a durante el ciclo es cero. Tal trayectoria es una orbita cerrada.
x1 a b
Figura 1.17: Esbozo de h(x1 ) (l nea continua) y x1 h(x1 ) (l nea de trazos) El oscilador de resistencia negativa tiene una orbita cerrada aislada, como vemos en el ejemplo del oscilador de Van der Pol siguiente.
1
Es decir, excluyendo soluciones constantes correspondientes a PE.
1.4 Ciclos L mites
21
Ejemplo 1.3 (Oscilador de Van der Pol). Las Figuras 1.18 y 1.19 muestran los retratos de fase de la ecuaci on de Van der Pol x 1 = x2 x 2 = x1 + (1 x2 1 )x2 (1.15)
para tres valores distintos del par ametro : un valor peque no de 0.2, mediano de 1, y grande de 5. En todos los casos las guras muestran que existe una u nica orbita cerrada que atrae todas las trayectorias que comienzan fuera de la orbita. Para = 0.2 la orbita cerrada es suave y cercana a un c rculo de radio 2, lo cual es t pico para valores < 0.3. Para el caso medio de = 1 la forma circular se ha distorsionado a lo que se ve a la derecha en la Figura 1.18. Para el valor grande = 5 la orbita cerrada est a severamente distorsionada, como se ve en la Figura 1.19 (izquierda). Un retrato de fase m as ilustrativo en el caso de = 5 puede obtenerse mediante el cambio de variables z1 = iL y z2 = vC , que resulta en la ecuaci on de estado 1 z 1 = z2 1 3 z 1 = (z1 z2 + z2 ) 3 El retrato de fase en el plano z1 z2 se muestra en la Figura 1.19 (derecha). La orbita cerrada 1 3 est a muy cerca de la curva z1 = z2 3 z2 excepto en las esquinas, donde es pr acticamente vertical. Este tramo vertical en la orbita cerrada puede verse como si la orbita cerrada saltara de una rama a otra de la curva cuando llega a una esquina. Oscilaciones donde ocurre este fen omeno de salto se llaman usualmente oscilaciones de relajaci on. El retrato de fase es t pico para valores grandes de > 3.
x2 x2
x1
x1
Figura 1.18: Retratos de fase del oscilador de Van der Pol, con = 0.2 (izquierda) y con = 1 (derecha)
La orbita cerrada del oscilador de Van der Pol es diferente de las del oscilador lineal arm onico. En el primer caso, la orbita cerrada es aislada mientras que en el segundo, hay un continuo de orbitas cerradas. Una orbita peri odica aislada se denomina ciclo l mite. Si todas las trayectorias en la vecindad del ciclo l mite tienden a (se alejan de) el cuando t se dice que el ciclo l mite es estable (inestable).
22
x2 z2
Introducci on
x1
z1
Figura 1.19: Retratos de fase del oscilador de Van der Pol, con = 0.5; en el plano x1 x2 (izquierda) y en el plano z1 z2 (derecha)
1.5
Construcci on Num erica de Retratos de Fase
No es dif cil hoy en d a conseguir programas de computaci on que resuelvan ecuaciones diferenciales ordinarias. Estos programas pueden usarse en forma efectiva para construir retratos de fase para sistemas de segundo orden. En esta secci on damos algunas ayudas que pueden resultar u tiles. El primer paso en la construcci on de un retrato de fase es encontrar todos lo puntos de equilibrio del sistema y determinar el tipo de aquellos que son aislados mediante linealizaci on. El dibujo de las trayectorias involucra tres tareas:2 (i) Seleccionar una ventana del espacio de estados donde se van a dibujar las trayectorias. La ventana toma la forma x1 min x1 x1 max , x2 min x2 x2 max .
(ii) Seleccionar las condiciones inciales dentro de la ventana. (iii) Calcular las trayectorias. Veamos c omo calcular las trayectorias. Para encontrar la trayectoria pasante por un punto x0 , resolvemos la ecuaci on x = f (x), x(0) = x0
hacia adelante en el tiempo (con t positivo) y en tiempo invertido (con t negativo). La soluci on en tiempo invertido es equivalente a resolver hacia adelante en el tiempo la ecuaci on x = f (x),
2
x(0) = x0 ,
Cuatro si inclu mos agregar las echas de direcci on de las trayectorias, que para nuestros prop ositos pueden hacerse a mano.
1.6 Ejercicios
23
puesto que el cambio de variable = t cambia el signo del lado derecho de la ecuaci on. La soluci on en tiempo invertido facilita dibujar bien las trayectorias cerca de equilibrios inestables. La ventana debe elegirse de forma que todas las caracter sticas esenciales se vean, por ejemplo todos lo puntos de equilibrio. Si esta informaci on no es disponible al comenzar habr a que iterar. Algunos programas permiten dibujar la distribuci on del campo vectorial f (x) para una grilla en la ventana seleccionada. Este gr aco es muy u til para tener idea somera de la distribuci on de las trayectorias antes de dibujarlas. Esto es posible por ejemplo con Scilab,3 usando la funci on portrait que dibuja retratos de fase de sistemas de segundo orden. Una buena forma de elegir las condiciones iniciales es distribuirlas en una grilla regular en la ventana elegida. Una forma mejor es ir eligi endolas en forma interactiva a medida que se van viendo las trayectorias (que se puede hacer con el portrait de Scilab). Para una ensilladura es conveniente usar linealizaci on para calcular las trayectorias estables e inestables correspondientes a los autovectores de la matriz Jacobiana. La conveniencia viene de que estas trayectorias son separatrices en el plano de fase.
1.6
Ejercicios
Ejercicio 1.1 Un modelo matem atico usado frecuentemente para describir sistemas no lineales es la ecuaci on diferencial de orden n dn y dn1 y = g t, y, y, . . . , ,u , dtn dtn1 donde u e y son variables escalares. Tomando u como entrada e y como salida, obtener un modelo en ecuaciones de estado. Ejercicio 1.2 Tomando las variables escalares u e y como entrada y salida respectivamente, obtener un modelo en ecuaciones de estado del sistema descripto por la ecuaci on diferencial de orden n dn y dn1 y dn2 y = g t, y, y, . . . , , u + g t, y, y, . . . , u, 1 2 dtn dtn1 dtn2 donde g2 es una funci on diferenciable en todos sus argumentos. Ayuda: Tomar xn = Ejercicio 1.3 Las ecuaciones din amicas no lineales de un robot de m juntas tiene la forma M (q ) q + C (q, q )q + g (q ) = u, donde q Rm representa la posici on de las juntas, u Rm representa las entradas de torque, y M (q ) es una matriz sim etrica (de inercia) denida positiva para todo valor de q . El t ermino
Scilab es un programa gratuito http://www-rocq.inria.fr/scilab/
3
dn1 y dtn1
y g2 (t, y, y, ..., d )u. dtn1
n1
similar
Matlab
desarrollado
por
el
INRIA
24
Introducci on
C (q, q )q representa el efecto de fuerzas centr fugas y de Coriolis. El t ermino g (q ) representa el efecto de la gravedad. Elegir variables de estado para el sistema y escribir las ecuaciones de estado. Ejercicio 1.4 La Figura muestra una conexi on en realimentaci on de un sistema lineal estacionario (representado por su funci on transferencia G(s)) y un elemento no lineal inestacionario. Las variables r, u, e y son vectores de la misma dimensi on, y (t, y ) es a valores vectoriales. Encontrar un modelo en espacio de estados del sistema realimentado tomando r como entrada e y como salida.
r + u Sistema Lineal G(s) = C (sI A)1 B y
(t, y )
Elemento No Lineal
Ejercicio 1.5 Un generador sincr onico conectado a un bus innito puede representarse por las ecuaciones = P D 1 Eq sen , M q = 2 Eq + 3 cos + E, E donde es un angulo en radianes, Eq es tensi on, P es potencia mec anica, E es tensi on de entrada, D es un coeciente de amortiguamiento, M es un coeciente de inercia, es una constante de tiempo, y 1 , 2 , 3 son par ametros constantes. y Eq como variables de estado obtener las ecuaciones de estado. (a) Usando , (b) Encontrar todos los puntos de equilibrio corrrespondientes a los valores P = 0.815 3 = 1.7 E = 1.22 = 6.6 1 = 2 M = 0.0147 2 = 2.7 D/M = 4
q 0, mostrar que el (c) Suponiendo que es sucientemente grande como para tomar E modelo del sistema se reduce a la ecuaci on del p endulo. Ejercicio 1.6 Un PLL (phase-locked loop) es un dispositivo en realimentaci on que genera una oscilaci on cuya fase sigue a una se nal de referencia ( util para generar se nales moduladas en fase). Puede representarse con el diagrama de bloques de la Figura 1.20. Sea (A, B, C ) una realizaci on m nima de la funci on transferencia de orden m, escalar y estrictamente propia, G(s). Asumir que todos los autovalores de A tiene parte real negativa, G(0) = 0, y i es constante. Si z es el estado de la realizaci on (A, B, C ),
1.6 Ejercicios
i + e sen() u G(s) y
25
1 s
Figura 1.20: PLL
(i) Mostrar que el sistema a lazo cerrado puede representarse por la ecuaci on z = Az + B sen e e = Cz. (ii) Encontrar todos los PE del sistema y determinar su tipo. (iii) Mostrar que cuando G(s) = 1/( s + 1) el lazo cerrado coincide con el modelo de la ecuaci on de un p endulo. Ejercicio 1.7 Para cada uno de los siguientes sistemas encontrar todos los PE y determinar el tipo de cada PE aislado. x 1 = x2 x 2 = x1 + x3 1 x2 6
x 1 = x1 + x2 3 x 2 = 0.1x1 2x2 x2 1 0.1x1 x 1 = (1 x1 )x1 x 2 = 2 2x1 x2 1 + x1
x2 x2 1 + x1
x 1 = x2 2 x 2 = x1 + x2 (1 3x2 1 2x2 ) Ejercicio 1.8 Encontrar todos los PE del sistema x 1 = ax1 x1 x2 x 2 = bx2 1 cx2 para todos los valores positivos de a, b, c y determinar el tipo de cada equilibrio.
26 Ejercicio 1.9 El sistema x 1 = x1 x 2 = x2 + x2 log log

2 x2 1 + x2 x1 2 x2 1 + x2
Introducci on
tiene un PE enn el origen. (i) Linealizar el sistema alrededor del origen y encontrar el tipo del origen como PE. (ii) Obtener el retrato de fase del sistema no lineal cerca del origen y mostrar que se asemeja al de un foco estable. Ayuda: transformar las ecuaciones a coordenadas polares. (iii) Explicar la discrepancia entre (v) y (vi). Ejercicio 1.10 Para el sistema x 1 = (x1 x2 1 ) + 1 x1 x2 x 2 = (x2 x2 2 ) + 1 x1 x2 (i) Encontrar todos los PE y determinar su tipo. (ii) Obtener el retrato de fase, preferentemente usando simulaci on en computadora, y discutir el comportamiento cualitativo del sistema.
Ejercicio 1.11 Los retratos de fase de los siguientes sistemas se muestran en la Figura 1.21. Identicar qu e sistema corresponde a qu e retrato de fase, marcar los sentidos de las trayectorias, y discutir el comportamiento cualitativo de cada sistema. x 1 = x2 x 2 = x1 /2 x3 1 x 1 = x2 x 2 = x2 /2 2x1 x2 1 x 1 = x2 4 x 2 = x1 x2 (1 x2 1 + x1 /10) x 1 = x2 x 2 = x1 + x2 3 arctan(x1 + x2 )
1.6 Ejercicios
27
5 4 3 2 1 0 -1 -2 -3 -4 -5 -5 10 8 6 4 2 0 -2 -4 -6 -8 -10 -10 -8 -6 -4 -2 -4 -3 -2 -1 0
.
x2
10 8 6 4 2 0
.
x2
x1
-2 -4 -6 -8 -10 1 2 3 4 5 5 4 3 2 1
.
x1
-10
-8
-6
-4
-2
10
x2
x2
x1
-1 -2 -3 -4 -5 0 2 4 6 8 10 -5 -4 -3 -2 -1 0 1 2 3 4
x1
Figura 1.21: Retratos de fase
28 Ejercicio 1.12
Introducci on
Para cada uno de los siguientes sistemas contruir el retrato de fase y discutir el comportamiento cualitativo del sistema. x 1 = x2 x 2 = x1 2 arctan(x1 + x2 ) x 1 = x2
2 x 2 = x1 + x2 1 3x2 1 2x2
x 1 = 2x1 x1 x2 x 2 = 2x2 1 x2 x 1 = x1 + x2 x1 (|x1 | + |x2 |) x 2 = 2x1 + x2 x2 (|x1 | + |x2 |).
Cap tulo 2 Propiedades Fundamentales

En este cap tulo repasamos elementos de an alisis matem atico que vamos a usar en el resto del curso, incluyendo las propiedades fundamentales de ecuaciones diferenciales ordinarias que hacen que x = f (t, x) sea un modelo apropiado para representar sistemas f sicos. Estas propiedades son esencialmente las de existencia y unicidad de soluci on dependencia continua respecto de par ametros y condiciones iniciales. Vamos a presentar los resultados para sistemas aut onomos (sin entrada), y en general no estacionarios, es decir, representados por x = f (t, x).
2.1
Preliminares
x p = (|x1 |p + + |xn |p )1/p , x = max |xi |
i
Vamos a considerar frecuentemente las normas p en Rn , denidas como 1p<
Todas las normas p son equivalentes en el sentido de que si diferentes, existen constantes positivas c1 y c2 tales que c1 x
son dos normas p
c2 x
para todo x Rn . Un resultado cl asico relativo a normas p es la desigualdad de H older 1 1 + =1 |xt y | x p y q , p q para todo x, y Rn . Una matriz A Rmn dene un mapeo lineal y = Ax de Rn en Rm . La norma p inducida de A est a denida como Ax p A p = sup = max Ax p x p =1 x p x=0 que para p = 1, 2, est a dada por
m m
= max
j i=1
|aij | ,
= [max (A A)]
1/2
= max
i j =1
|aij |
donde max (At A) es el m aximo autovalor de At A.
30
Propiedades Fundamentales
2.1.1
Desigualdad de Gronwall-Bellman
Lema 2.1 (Desigualdad de Gronwall-Bellman). Sea : [a, b] R una funci on continua y : [a, b] R continua y nonegativa. Si una funci on continua y : [a, b] R satisface
t
y (t) (t) +
a
(s)y (s) ds
para a t b, entonces en el mismo intervalo

t
y (t) (t) +
a
(s)(s)e
t s
( )d
ds
Si (t) es constante, entonces y (t) e

t a
( )d
y si adem as (t) es constante: y (t) e(ta) Demostraci on. Denamos z (t) = diferenciable y
t a
(s)y (s) ds y v (t) = z (t) + (t) y (t) 0. Entonces z es
z = (t)y (t) = (t)z (t) + (t)(t) (t)v (t). Esta es una ecuaci on de estado escalar cuya funci on de transici on de estados es (t, s) = e
t s
( )d
Como z (a) = 0, entonces tenemos que

t
z (t) =
a
(t, s)((s)(s) (s)v (s))ds.

t a
El t ermino z (t)
(t, s)(s)v (s)ds es no negativo, por lo que

t
e
a
t s
( )d
(s)(s)ds,
que, usando el hecho que y (t) (t) + z (t), completa la prueba en el caso general. En el caso especial de (t) tenemos
t
(s)e
a
t s
t ( )d
ds =
a
d e ds
( )d
t s
t s
( )d s=t
ds
= e
t s
= 1 + e
s=a ( )d
que termina la prueba en el caso de constante. Por integraci on se obtiene f acilmente el resultado en el caso de tambi en constante.
2.1 Preliminares
31
2.1.2
Mapeo Contractivo
Consideremos una ecuaci on de la forma x = T (x). Una soluci on x de esta ecuaci on se denomina punto jo del mapeo T porque T deja a x invariante. Vamos a enunciar el teorema del mapeo contractivo en el marco de espacios de Banach, para lo cual recordamos las siguientes deniciones. Denici on 2.1 (Espacio lineal normado). Un espacio lineal X es un espacio lineal normado si, para cada vector x X , existe una funci on a valores reales, llamada norma y denotada x , que satisface x 0 para todo x X , con x = 0 s x = 0. x + y x + y para todo x, y X . x = || x para todo R y x X . Si no estuviera claro del contexto si X para la norma de X . es una norma en X o en Rn , vamos a escribir
Denici on 2.2 (Convergencia). Una secuencia {xk } en X converge a un vector x X si xk x 0 cuando k . Denici on 2.3 (Conjunto cerrado). Un conjunto S X es cerrado s toda secuencia convergente con elementos en S tiene l mite en S . Denici on 2.4 (Secuencia de Cauchy). Una secuencia {xk } en X se dice secuencia de Cauchy si xk xm 0 cuando k, m . Notar que toda secuencia convergente es Cauchy, pero no toda secuencia Cauchy es convergente. Denici on 2.5 (Espacio de Banach). Un espacio lineal normado X es completo si toda secuencia de Cauchy converge a un vector en X . Un espacio lineal normado completo es un espacio de Banach. Ejemplo 2.1. Consideremos el conjunto de funciones continuas f : [a, b] Rn , al que denotamos como C [a, b]. Este conjunto es un espacio vectorial sobre R. La suma x + y se dene como (x + y )(t) = x(t)+ y (t). La multiplicaci on por un escalar se dene como (x)(t) = x(t). El vector nulo es la funci on id enticamente nula en [a, b]. Denimos una norma como x
C
= max x(t)
t[a,b] C
donde la norma en el lado derecho es cualquier norma p en Rn . Claramente x cero s x es la funci on nula. La desigualdad triangular sigue de max x(t) + y (t) max[ x(t) + y (t) ] max x(t) + max y (t) Adem as max x(t) = max || x(t) = || max x(t)
0 y es
32
donde los m aximos se toman sobre [a, b]. Por lo tanto, C [a, b] junto con la norma C es un espacio lineal normado. Vamos a probar que es tambi en un espacio de Banach. Para eso debemos probar que toda secuencia de Cauchy en C [a, b] converge a un vector en C [a, b]. Supongamos que {xk } es una secuencia de Cauchy en C [a, b]. Para cada t [a, b] jo, xk (t) xm (t) xk xm
C
0 cuando k, m
Por lo tanto {xk (t)} es una secuencia de Cauchy en Rn . Pero Rn con cualquier norma p es completo porque convergencia implica convergencia componente a componente y R es completo. Entonces existe un vector real x(t) al cual la secuencia converge: xk (t) x(t). Esto prueba convergencia puntual. Ahora probamos que la convergencia es uniforme en t [a, b]. Dado > 0 elegimos N tal que xk xm C < /2 para k, m > N . Entonces, para k > N , xk (t) x(t) xk (t) xm (t) + xm (t) x(t) xk xm C + xm (t) x(t) Eligiendo m sucientemente grande (lo cual puede depender de t), cada t ermino en el lado derecho puede hacerse menor que /2; entonces xk (t) x(t) < para k > N . Por lo tanto {xk } converge a x, uniformemente en t [a, b]. Para completar la prueba, debemos mostrar que x(t) es continua y que {xk } converge a x en la norma de C [a, b]. Para probar continuidad consideremos x(t + ) x(t) x(t + ) xk (t + ) + xk (t + ) xk (t) + xk (t) x(t) Como {xk } converge uniformemente a x, dado > 0, podemos elegir k lo sucientemente grande para hacer el primer y tercer t erminos del lado derecho menores que /3. Como xk (t) es continua, podemos elegir lo sucientemente peque no para hacer el segundo t ermino menor que /3. Por lo tanto x(t) es continua. La convergencia de {xk } a x en la norma de C [a, b] es una consecuencia directa de la convergencia uniforme. Teorema 2.2 (Mapeo Contractivo). Sea S un subconjunto cerrado de un espacio de Banach X y sea T un mapeo de S en S . Supongamos que T (x) T (y ) x y , x, y S , 0 < 1.
Entonces T tiene un u nico punto jo en S , es decir, existe un u nico vector x S que satisface x = T (x ). Adem as, x puede obtenerse por el m etodo de aproximaciones sucesivas comenzando de cualquier vector en S . Demostraci on. Tomemos un vector arbitrario x1 S y denamos la secuencia {xk } por la f ormula xk+1 = T (xk ). Como T mapea S en S , xk S para todo k 1. El primer paso de la prueba es mostrar que {xk } es una secuencia de Cauchy. Tenemos xk+1 xk = T (xk ) T (xk1 ) x k x k 1 2 xk1 xk2 . . . k 1 x 2 x 1 .
2.2 Existencia y Unicidad Sigue que xk+r xk xk+r xk+r1 + xk+r1 xk+r2 + + xk+1 xk k + r 2 + k + r 3 + + k 1
33
x2 x1
k1
i=0 k 1
i x 2 x 1
x2 x1 . 1
El lado derecho tiende a cero cuando k . Por lo tanto, la secuencia es Cauchy. Como X es un espacio de Banach, xk x X cuando k . Adem as, como S es cerrado, en particular x S . Ahora mostramos que x = T (x ). Para cualquier xk = T (xk1 ) tenemos que x T (x ) x xk + xk T (x ) x x k + x k 1 x . Eligiendo k sucientemente grande, el lado derecho de la desigualdad puede hacerse arbitrariamente peque no. As , x T (x ) = 0; o sea que x = T (x ). Falta probar que x es el u nico punto jo de T en S . Supongamos entonces que hay dos puntos jos x y y . Entonces x y = T (x ) T (y ) x y . Como < 1, necesariamente x = y .
2.2
Existencia y Unicidad
En esta secci on se dan condiciones sucientes para la existencia y unicidad de la soluci on del problema de valor inicial x = f (t, x) , x(t0 ) = x0 . (2.1)
Entendemos por soluci on en un intervalo [t0 , t1 ] a una funci on continua x : [t0 , t1 ] Rn tal que x est e denida y x (t) = f (t, x(t)) para todo t [t0 , t1 ]. Vamos a asumir que f (t, x) es continua en x pero s olo seccionalmente continua en t (esto nos va a permitir considerar entradas con saltos o escalones). Una ecuaci on diferencial con una dada condici on inicial puede tener varias soluciones. Por ejemplo, la ecuaci on escalar x = x 1/ 3 , x(0) = 0
tiene como soluciones tanto x(t) = (2t/3)3/2 como x(t) 0. Vemos que f (x) = x1/3 es una funci on continua de x, por lo tanto es claro que la condici on de continuidad de f (t, x) en sus argumentos no es suciente para asegurar unicidad de la soluci on, aunque esta condici on asegura la existencia de al menos una soluci on. En el Teorema 2.3 vamos a utilizar una condici on que garantiza a la vez ambas propiedades.
34
Teorema 2.3 (Existencia local y unicidad). Sea f (t, x) seccionalmente continua en t y supongamos que satisface la condici on de Lipschitz f (t, x) f (t, y ) L x y
n
(2.2)
x, y Br = {x R | x x0 r}, t [t0 , t1 ]. Entonces existe > 0 tal que (2.1) tiene una soluci on u nica en [t0 , t0 + ]. Demostraci on. Notar que si x(t) es una soluci on de (2.1) entonces, integrando, tenemos
t
x(t) = x0 +
t0
f (s, x(s)) ds
(2.3)
Es decir, x(t) satisface (2.1) s satisface (2.3), por lo que el estudio de existencia y unicidad de la soluci on de la ecuaci on diferencial (2.1) es equivalente al estudio de existencia y unicidad de la soluci on de la ecuaci on integral (2.3). Vamos a considerar el lado derecho de (2.3) como un mapeo de la funci on continua x : [t0 , t1 ] Rn ; denot andolo como (P x)(t), podemos re-escribir (2.3) como x(t) = (P x)(t) (2.4) Notar que (P x)(t) es continua en x. Una soluci on de (2.4) es un punto jo del mapeo P que lleva x a P x. La existencia de un punto jo de (2.4) se puede probar usando el teorema del mapeo contractivo. Para eso necesitamos denir un espacio de Banach X y un conjunto cerrado S X tal que P mapee S en S y sea una contracci on en S . Denamos X = C [t0 , t0 + ] , con norma
C
t[t0 ,t0 + ]
max
x(t)
S = {x X | x x0
r}
donde r es el radio de la bola Br y es una constante positiva a elegir. Nos vamos a restringir a elegir tal que satisfaga t1 t0 de forma que [t0 , t0 + ] [t0 , t1 ]. Notar que x(t) es una norma en Rn mientras que x C es una norma en X ; de la misma forma Br es una bola en Rn mientras que S es una bola en X . Por denici on, P mapea X en X . Para probar que mapea S en S escribimos
t t
(P x)(t) x0 =
t0
f (s, x(s)) ds =
t0
[f (s, x(s)) f (s, x0 ) + f (s, x0 )] ds
Como f es seccionalmente continua, sabemos que f (t, x0 ) es acotada en [t0 , t1 ]. Sea h = max
t[t0 ,t1 ]
f (t, x0 )
Usando la condici on Lipschitz (2.2) y el hecho de que para cada x S x(t) x0 r , t [t0 , t0 + ] obtenemos
t
(P x)(t) x0
t0 t
[ f (s, x(s)) f (s, x0 ) + f (s, x0 ) ] ds [L x(s) x0 + h] ds

t0 t

t0
(Lr + h) ds
= (t t0 )(Lr + h) (Lr + h)
2.2 Existencia y Unicidad y tambi en P x x0

C
35
t[t0 ,t0 + ]
max
(P x)(t) x0 (Lr + h) r ,
si elegimos r/(Lr + h). Entonces P mapea S en S . Ahora vamos a probar que P es una contracci on en S . Sean x e y S y consideremos
t
(P x)(t) (P y )(t) =
t0 t
[f (s, x(s)) f (s, y (s))] ds f (s, x(s)) f (s, y (s)) ds

t0 t

t0
L x(s) y (s) ds
C
(t t0 ) L x y Entonces Px Py
C
L x y
xy
con
Eligiendo < 1 y /L aseguramos que P es un mapeo de contracci on en S . Por el teorema del mapeo contractivo, si min t1 t0 , r , Lr + h L , <1 (2.5)
entonces (2.3) tiene una u nica soluci on en S . Nos falta probar que la soluci on es u nica en X . Para eso vamos a probar que toda soluci on de (2.3) en X tiene que estar en S . Notemos primero que, como x(t0 ) = x0 est a en la bola Br , toda soluci on continua x(t) debe permanecer en Br durante alg un tiempo. Supongamos que x(t) deja la bola Br y sea t0 + el primer instante en que x(t) intersecta la frontera de Br . Entonces x(t0 + ) x0 = r Por otro lado, para todo t t0 + ,
t
x(t) x0
t0 t
[ f (s, x(s)) f (s, x0 ) + f (s, x0 ) ] ds [L x(s) x0 + h] ds

t0 t

t0
(Lr + h) ds
Por lo tanto r = x(t0 + ) x0 (Lr + h) = r Lr + h
lo que signica que x(t) no puede dejar Br durante el intervalo [t0 , t0 + ], es decir, toda soluci on en X debe estar en S . En consecuencia, unicidad de la soluci on en S implica unicidad de la soluci on en X .
36
Una funci on que satisface (2.2) se dice Lipschitz en x y L es la constante de Lipschitz. Decimos que f (x) es localmente Lipschitz en un dominio (conjunto abierto y conexo) D Rn si cada punto de D tiene un entorno D0 tal que f satisface (2.2) con alguna constante de Lipschitz L0 . Decimos que f (x) es Lipschitz en un conjunto W si satisface (2.2) en todos los puntos de W , con la misma constante de Lipschitz L. Toda funci on localmente Lipschitz en un dominio D es Lipschitz en todo subconjunto compacto (cerrado y acotado) de D. Decimos que f (x) es globalmente Lipschitz si es Lipschitz en Rn . Decimos que f (t, x) es localmente Lipschitz en x en [a, b] D R Rn si cada punto x D tiene un entorno D0 tal que f satisface (2.2) en [a, b] D0 con alguna constante de Lipschitz L0 . Decimos que f (t, x) es localmente Lipschitz en x en [t0 , ) D si es localmente Lipschitz en x en [a, b] D para todo intervalo compacto [a, b] [t0 , ). Decimos que f (t, x) es Lipschitz en [a, b] W si satisface (2.2) para todo t [a, b] y todo punto en W , con la misma constante de Lipschitz L. Para funciones escalares, la condici on de Lipschitz se puede escribir como |f (y ) f (x)| L |y x| lo que implica que la pendiente est a siempre acotada por L, es decir toda funci on f (x) que tenga pendiente innita en un punto no puede ser localmente Lipschitz en ese punto. Por otro lado, si el valor absoluto de la derivada f est a acotado por una constante k sobre un intervalo de inter es, entonces f es Lipschitz en ese intervalo con constante de Lipschitz L = k . Lo mismo vale para funciones vectoriales, como lo probamos en el siguiente Lema. Lema 2.4 (La cota de la derivada es la constante de Lipschitz). Sea f : [a, b] D Rm una funci on continua, D un dominio en Rn . Supongamos que f /x existe y es continua en [a, b] D. Si, para alg un subconjunto convexo W D existe una constante L 0 tal que f (t, x) L x en [a, b] W , entonces f (t, x) f (t, y ) L x y t [a, b], x W , y W . Demostraci on. Sea p , p [1, ] la norma utilizada, y calculemos q [1, ] mediante la relaci on 1/p + 1/q = 1. Fijamos t [a, b], x W e y W . Denamos (s) = (1 s) x + s y para todo s R tal que (s) D. Como W D es convexo, (s) W para 0 s 1. Tomemos z Rn tal que z
q
= 1 y z t [f (t, y ) f (t, x)] = f (t, y ) f (t, x)
Denamos g (s) = z t f (t, (s)). Como g (s) es una funci on a valores reales continuamente diferenciable en un intervalo abierto que contenga al [0, 1], concluimos mediante el teorema del valor medio que existe s1 (0, 1) tal que g (1) g (0) = g (s1 )
2.2 Existencia y Unicidad Evaluando g en s = 0, s = 1, y calculando g (s) usando la regla de la cadena, obtenemos z t [f (t, y ) f (t, x)] = z t f (t, y ) f (t, x)
p
37
f (t, (s1 ))(y x) x f yx z q (t, (s1 )) x p

q
L yx
donde usamos la desigualdad de H older |z t w| z
w p.
La propiedad de Lipschitzidad es m as fuerte que la de continuidad. Si f (x) es Lipschitz en W , entonces es uniformemente continua en W . La propiedad de Lipschitzidad es m as d ebil que la de poseer derivada continua, como vemos en el siguiente Lema. Lema 2.5 (C 1 implica Lipschitz). Sea f : [a, b] D Rm una funci on continua, D un n dominio en R . Si f /x existe y es continua en [a, b] D entonces f es localmente Lipschitz en x en [a, b] D. Demostraci on. Dado x0 D, sea r tan peque no que la bola D0 = {x Rn | x x0 r} est e contenida en D. El conjunto D0 es convexo y compacto. Por continuidad, f /x est a acotada en [a, b] D. Sea L0 una cota para f /x en [a, b] D. Por el Lema 2.4, f es Lipschitz en [a, b] D con constante de Lipschitz L0 . Lema 2.6 (Condiciones para Lipschitz global). Sea f : [a, b] Rn una funci on continua. n Si f /x existe y es continua en [a, b] R , entonces f es globalmente Lipschitz en x en [a, b] Rn s f /x est a uniformemente acotada en [a, b] Rn . Ejemplo 2.2. La funci on f (x) = x1 + x1 x2 x2 x1 x2
es continuamente diferenciable en R2 . Por lo tanto, es localmente Lipschitz en R2 . No es globalmente Lipschitz porque f 1 + x2 x1 = x2 1 x1 x (2.6)
no es uniformemente acotada en R2 . En cualquier subconjunto compacto de R2 , f es Lipschitz. Supongamos que queremos calcular una constante de Lipschitz sobre el conjunto convexo W = {x R2 | |x1 | a1 , |x2 | a2 } Usando en (2.6) para vectores en R2 y la norma matricial inducida para matrices, tenemos f = max{| 1 + x2 | + |x1 | , |x2 | + |1 x1 |} x Todo punto en W satisface | 1 + x2 | + |x1 | 1 + a2 + a1 |x2 | + |1 x1 | a2 + 1 + a1 Por lo tanto, f x 1 + a2 + a1
y una constante de Lipschitz es entonces L = 1 + a2 + a1 .
38
Notar que la elecci on de la norma en Rn no afecta la propiedad de Lipschitzidad de una funci on pero si el valor de la constante de Lipschitz. Teorema 2.3 es un resultado local porque s olo garantiza existencia y unicidad sobre un intervalo [t0 , t0 + ], y no tenemos control sobre ; por lo tanto no podemos asegurar existencia y unicidad sobre un intervalo dado [t0 , t1 ]. Se puede tratar de extender el intervalo de existencia mediante la aplicaci on repetida del teorema: usar t0 + como el nuevo instante inicial y x(t0 + ) como el nuevo estado inicial, y as sucesivamente. Sin embargo, en general, el intervalo de existencia de la soluci on no puede extenderse indenidamente porque las condiciones del teorema pueden dejar de valer. Hay un intervalo m aximo [t0 , T ) donde la u nica soluci on que comienza en (t0 , x0 ) existe. En general, T puede ser menor que t1 , en cuyo caso, cuando t T la soluci on deja cualquier conjunto compacto sobre el cual f es localmente Lipschitz en x. Ejemplo 2.3. Consideremos el sistema escalar x = x2 , x(0) = 1
La funci on f (x) = x2 es localmente Lipschitz para todo x R. Por lo tanto, es Lipschitz en todo subconjunto compacto de R. La soluci on u nica x(t) = 1 t1
existe sobre [0, 1). Cuando t 1, x(t) deja cualquier conjunto compacto.
Una forma de garantizar que la soluci on pueda extenderse indenidamente, es la de requerir condiciones adicionales que aseguren que la soluci on x(t) siempre est e en un conjunto donde f (t, x) es uniformemente Lipschitz en x. Esto lo hacemos en el siguiente teorema donde pedimos que f sea globalmente Lipschitz. Teorema 2.7 (Existencia global y unicidad). Supongamos que f (t, x) es seccionalmente continua en t y satisface f (t, x) f (t, y ) L x y f (t, x0 ) h x, y Rn , t [t0 , t1 ]. Entonces, la ecuaci on (2.1) tiene una soluci on u nica en [t0 , t1 ]. Demostraci on. La clave de la prueba es mostrar que la constante del Teorema 2.3 se puede hacer independiente del estado inicial x0 . Vemos en (2.5) que la dependencia de del estado inicial es a trav es de la constante h en el t ermino r/(Lr + h). Como ahora la condici on de Lipschitz es global, podemos elegir r arbitrariamente grande. Por lo tanto, para cada h nito, elegimos r tal que r/(Lr + h) > /L. Esto reduce (2.5) a min t1 t0 , L , <1
Si t1 t0 /L, podemos elegir = t1 t0 y probamos el resultado. De lo contrario, elegimos que satisfaga /L, dividimos [t0 , t1 ] en un n umero nito de subintervalos de longitud y aplicamos repetidamente el Teorema 2.3.
2.2 Existencia y Unicidad Ejemplo 2.4. Consideremos el sistema lineal x = A(t)x + g (t) = f (t, x)
39
donde A() y g () son seccionalmente continuas. Sobre un intervalo nito [t0 , t1 ], los elementos de A(t) y g (t) son acotados, es decir A(t) a, y g (t) b, donde g puede ser cualquier norma en Rn y A es la norma matricial inducida. Las condiciones del Teorema 2.7 se satisfacen porque f (t, x) f (t, y ) = A(t) (x y ) A(t) (x y ) a (x y ) , x, y Rn , t [t0 , t1 ] y f (t, x0 ) = A(t) x0 + g (t) a x0 + b h , para todo x0 nito , t [t0 , t1 ] Por lo tanto, el Teorema 2.7 muestra que el sistema lineal tiene soluci on u nica en [t0 , t1 ]. Como t1 puede ser arbitrariamente grande, concluimos que si A(t) y g (t) son seccionalmente continuas t t0 , entonces el sistema tiene una soluci on u nica t t0 . Para un sistema lineal es razonable pedir Lipschitzidad global. Pero para sistemas no lineales esto es muy restrictivo. No as la condici on de Lipschitz local, que est a garantizada si la funci on del lado derecho es continuamente diferenciable. Ejemplo 2.5. Consideremos el sistema escalar x = x3 = f (x) (2.7)
La funci on f (x) no satisface la condici on de Lipschitz global porque el Jacobiano f /x = 2 3x no est a globalmente acotado. Sin embargo, la ecuaci on tiene la u nica soluci on x(t) = sign x0 x2 0 2 1 + 2x0 (t t0 )
que est a bien denida para todo x0 y para todo t t0 .
Como la condici on de Lipschitz global es muy conservadora, es u til disponer de otro resultado que, a expensas de pedir un mayor conocimiento acerca de la soluci on del sistema, s olo requiera que la funci on sea localmente Lipschitz. Teorema 2.8 (Existencia global y unicidad de vuelta). Sea f (t, x) seccionalmente continua en t y localmente Lipschitz en x para todo t t0 y todo x en un dominio D Rn . Sea W un subconjunto compacto de D, x0 W , y supongamos que se sabe que toda soluci on de (2.1) permanece todo el tiempo en W . Entonces existe una soluci on u nica que est a denida para todo t t0 . Demostraci on. Por el Teorema 2.3, existe una soluci on local u nica en [t0 , t0 + ]. Sea [t0 , T ) el m aximo intervalo de existencia. Si T es nito, entonces la soluci on debe abandonar todo subconjunto compacto de D (Ejercicio 2.33). Como la soluci on nunca deja el conjunto compacto W , concluimos que debe ser T = .
40
El truco al aplicar el Teorema 2.8 es vericar que toda soluci on permanezca en un conjunto compacto sin resolver la ecuaci on diferencial. Vamos a ver en el Cap tulo 3 que el m etodo de Lyapunov va a ser u til para esto. Ejemplo 2.6. Consideremos nuevamente el sistema (2.7). La funci on f (x) es localmente Lipschitz en R. Si en alg un instante x(t) es positiva, la derivada x (t) va a ser negativa, y viceversa. Por lo tanto, comenzando con una condici on inicial x(0) = a, la soluci on no puede dejar el conjunto compacto {x R | |x| |a|}, y el Teorema 2.8 garantiza que (2.7) tiene una soluci on u nica para todo t t0 .
2.3
Dependencia Continua Con Respecto a Condiciones Iniciales y Par ametros
Para que la soluci on de la ecuaci on de estado (2.1) sea de alg un inter es, debe depender continuamente del instante inicial t0 , del estado inicial x0 , y de la funci on del lado derecho f (t, x). La forma integral (2.3) muestra que la dependencia continua del instante inicial es obvia. Por dependencia continua de la condici on inicial entendemos lo siguiente: sea y (t) la soluci on de (2.1) que comienza en y (t0 ) = y0 y est a denida en el intervalo compacto [t0 , t1 ]; dado > 0, existe > 0 tal que para todo z0 en la bola {x Rn | x y0 < }, la ecuaci on x = f (t, x) tiene una soluci on u nica z (t) denida en [t0 , t1 ], con z (t0 ) = z0 , y satisface z (t) y (t) < para todo t [t0 , t1 ]. Para denir dependencia continua de la funci on del lado derecho f , vamos a precisar en qu e forma f es perturbada. Vamos a asumir que f depende continuamente de un conjunto de par ametros constantes, es decir, f = f (t, x, ), donde Rp . Sea x(t, 0 ) una soluci on de x = f (t, x, 0 ) denida en [t0 , t1 ], con x(t0 , 0 ) = x0 . Se dice que la soluci on depende continuamente de si dado > 0, existe > 0 tal que para todo en la bola { Rp | 0 < }, la ecuaci on x = f (t, x, ) tiene una soluci on u nica x(t, ) denida en [t0 , t1 ], con x(t0 , ) = x0 , y satisface x(t, ) x(t, 0 ) < para todo t [t0 , t1 ]. Antes de estudiar los dos tipos de continuidad reci en denidos, necesitamos el siguiente resultado. Teorema 2.9. Sea f (t, x) seccionalmente continua en t y Lipschitz en x en [t0 , t1 ] W , con constante de Lipschitz L, donde W Rn es un conjunto abierto y conexo. Sean y (t) y z (t) soluciones de y = f (t, y ) , y z = f (t, z ) + g (t, z ) , z (t0 ) = z0 y (t0 ) = y0
tal que y (t), z (t) W para todo t [t0 , t1 ]. Supongamos que g (t, x) , para alg un > 0, y y0 z0 Entonces y (t) z (t) eL(tt0 ) + para todo t [t0 , t1 ]. L(tt0 ) [e 1] L (2.8) (t, x) [t0 , t1 ] W ,
2.3 Dependencia Continua Con Respecto a Condiciones Iniciales y Par ametros41 Demostraci on. Las soluciones y (t) y z (t) est an dadas por
t
y (t) = y0 +
t0 t
f (s, y (s)) ds [f (s, z (s)) + g (s, z (s))] ds

t0
z (t) = z0 +
Restando ambas ecuaciones y tomando normas obtenemos

t t
y (t) z (t) y0 z0 +
t0
f (s, y (s)) f (s, z (s)) ds +

t0 t
g (s, z (s)) ds
+ (t t0 ) +
t0
L y (s) z (s) ds
Aplicando la desigualdad de Gronwall-Bellman a la funci on y (t) z (t) resulta

t
y (t) z (t) + (t t0 ) +
t0
L[ + (s t0 )]eL(st0 ) ds
Integrando el lado derecho por partes se obtiene (2.8). Tenemos entonces el siguiente teorema. Teorema 2.10 (Continuidad en condiciones iniciales y par ametros). Sea f (t, x, ) continua en sus argumentos y localmente Lipschitz en x (uniformemente en t y ) en [t0 , t1 ] D { 0 c}, donde D Rn es un conjunto abierto y conexo. Sea y (t, 0 ) una soluci on de x = f (t, x, 0 ) con y (t0 , 0 ) = y0 D. Supongamos que y (t, 0 ) est a denida y permanece en D para todo t [t0 , t1 ]. Entonces, dado > 0, existe > 0 tal que si y0 z0 < y 0 < la ecuaci on x = f (t, x, ) tiene una soluci on u nica z (t, ) denida en [t0 , t1 ], con z (t0 , ) = z0 , y satisface z (t, ) y (t, 0 ) < , t [t0 , t1 ]
Demostraci on. Por continuidad de y (t, 0 ) en t y la compacidad de [t0 , t1 ], sabemos que y (t, 0 ) est a uniformemente acotada en [t0 , t1 ]. Denamos un tubo U alrededor de la soluci on y (t, 0 ) de la siguiente manera U = {(t, x) [t0 , t1 ] Rn | x y (t, 0 ) }, como se ilustra en la Figura 2.1. Supongamos que se eligi o lo sucientemente peque no para que U [t0 , t1 ] D. El conjunto U es compacto; por lo tanto f (t, x, ) es Lipschitz en x en U con constante de Lipschitz L, digamos. Por continuidad de f en , para cada > 0, existe > 0 (con < c) tal que f (t, x, ) f (t, x, 0 ) < , (t, x) U , 0 <
Tomemos < y y0 z0 < . Por el teorema de existencia local y unicidad, existe una soluci on u nica z (t, ) en alg un intervalo [t0 , t0 + ]. La soluci on comienza dentro del tubo
42
z (t)
z0 y0
y (t)
t t0
Figura 2.1: Tubo construido alrededor de la soluci on y (t)
t1
U y mientras permanezca en el tubo puede extenderse. Vamos a mostrar que, eligiendo lo sucientemente peque no, la soluci on permanece en el tubo U para todo t [t0 , t1 ]. En particular, sea el primer instante en que la soluci on deja el tubo; vamos a probar que > t1 . En el intervalo [t0 , ], todas las condiciones del Teorema 2.9 se satisfacen con = = . Por lo tanto z (t, ) y (t, 0 ) eL(tt0 ) + [eL(tt0 ) 1] L (1 + L) L(tt0 ) < e L Si elegimos LeL(t1 t0 ) /(1+ L) aseguramos que la soluci on z (t, ) no deja el tubo durante [t0 , t1 ]. Por lo tanto z (t, ) est a denida en [t0 , t1 ] y satisface z (t, ) y (t, 0 ) < . La prueba se completa tomando = min{, }.
2.4
Diferenciabilidad de la Soluci on y Ecuaciones de Sensibilidad
Supongamos que f (t, x, ) es continua en sus argumentos y tiene derivadas parciales continuas con respecto a x y para todo (t, x, ) [t0 , t1 ] Rn Rp . Sea 0 un valor nominal de y supongamos que la ecuaci on de estado nominal x = f (t, x, 0 ) , x(t0 ) = x0 (2.9)
tiene una soluci on u nica x(t, 0 ) en [t0 , t1 ]. Por el Teorema 2.10 sabemos que para todo sucientemente cercano a 0 , la ecuaci on de estado x = f (t, x, ) , x(t0 ) = x0
tiene una soluci on u nica x(t, ) en [t0 , t1 ] que es cercana a la soluci on nominal x(t, 0 ). Escribamos esta soluci on como
t
x(t, ) = x0 +
t0
f (s, x(s, ), ) ds
2.5 Principio de Comparaci on y derivemos parcialmente con respecto a

t
43
x (t, ) =
t0
f f (s, x(s, ), ) x (s, ) + (s, x(s, ), ) ds x
donde x (t, ) = x(t, )/ y x0 / = 0 porque x0 es independiente de . Derivando ahora con respecto a t obtenemos x (t, ) = A(t, )x (t, ) + B (t, ) , t donde A(t, ) = f (t, x, ) x ,
x=x(t,)
x (t0 , ) = 0
(2.10)
B (t, ) =
f (t, x, )
x=x(t,)
Para sucientemente cercano a 0 las matrices A(t, ) y B (t, ) est an denidas en [t0 , t1 ], por lo tanto x (t, ) est a denida en el mismo intervalo. Para = 0 , el lado derecho de (2.10) depende s olo de la soluci on nominal x(t, 0 ). Sea S (t) = x (t, 0 ); S (t) es la soluci on u nica de (t) = A(t, 0 )S (t) + B (t, 0 ) , S S (t0 ) = 0 (2.11)
La funci on S (t) se denomina funci on de sensibilidad y (2.11) es la ecuaci on de sensibilidad. Las funciones de sensibilidad proporcionan estimas de primer orden del efecto de variaciones de los par ametros en las soluciones; tambi en sirven para aproximar la soluci on cuando 0 es sucientemente peque no: x(t, ) puede expandirse en serie de Taylor alrededor de la soluci on nominal x(t, 0 ) y, despreciando t erminos de orden superior, se obtiene x(t, ) x(t, 0 ) + S (t)( 0 ) (2.12)
Una forma de calcular S (t) es resolver (en general num ericamente) simult aneamente (2.9) y (2.10) evaluando la soluci on de (2.10) en = 0 .
2.5
Principio de Comparaci on
Como la desigualdad de Gronwall-Bellman, el principio de comparaci on sirve para obtener cotas de la soluci on de (2.1) sin necesidad de calcular la soluci on misma. Se aplica a desigualdades diferenciales de la forma v f (t, v (t)) para todo t en un cierto intervalo. El principio de comparaci on compara la soluci on de la desigualdad diferencial v f (t, v (t)) con la de la ecuaci on diferencial u = f (t, u). Lema 2.11 (Principio de Comparaci on). Consideremos la ecuaci on diferencial escalar u = f (t, u) , u(t0 ) = u0
donde f (t, u) es continua en t y localmente Lipschitz en u, para todo t 0 y todo u J R. Sea [t0 , T ) (T puede ser innito) el m aximo intervalo de existencia de la soluci on u(t) y supongamos que u(t) J para todo t [t0 , T ). Sea v (t) una funci on diferenciable que satisface la desigualdad diferencial v (t) f (t, v (t)) , v (t0 ) u0
44 con v (t) J para todo t [t0 , T ). Entonces v (t) u(t) para todo t [t0 , T ). Ejemplo 2.7. La ecuaci on diferencial escalar x = f (x) = (1 + x2 ) x , x(0) = a
tiene una soluci on u nica en [0, t1 ] para alg un t1 > 0, porque f (x) es localmente Lipschitz. Sea 2 v (t) = [x(t)] . Su derivada es v (t) = 2x(t)x (t) = 2[x(t)]2 2[x(t)]4 2[x(t)]2 Por lo tanto v (t) satisface la desigualdad diferencial v (t) 2v (t) , v (0) = a2
Sea u(t) la soluci on de la ecuaci on diferencial u = 2u , u(0) = a2 = u(t) = a2 e2t
Por el principio de comparaci on la soluci on x(t) est a denida para todo t 0 y satisface |x(t)| = v (t) |a|et , t 0
2.6
Ejercicios
Ejercicio 2.1 Sea f (x) una funci on continuamente diferenciable. Mostrar que el punto de equilibrio x de x = f (x) es aislado si la matriz Jacobiana [f /x](x ) es no singular. Ayuda: Usar el Teorema de la Funci on Impl cita enunciado a continuaci on. Teorema 2.12 (Teorema de la Funci on Impl cita). Sea f : Rn Rm Rn una funci on continuamente diferenciable en cada punto (x, y ) de un conjunto cerrado S Rn Rm . Sea (x0 , y0 ) un punto en S para el cual f (x0 , y0 ) = 0 y para el cual la matriz Jacobiana [f /x](x0 , y0 ) es no singular. Entonces existen entornos U Rn de x0 y V Rm de y0 tales que para cada y V la ecuaci on f (x, y ) = 0 tiene una soluci on u nica x U . Adem as, esta soluci on puede expresarse como x = g (y ), donde g es continuamente diferenciable en y = y0 . Ejercicio 2.2 Sea y (t) una funci on escalar no negativa que satisface la desigualdad
t
y (t) k1 e(tt0 ) +
t0
e(t ) [k2 y ( ) + k3 ]d,
k1 , k2 , k3 0, > k2 .
Usando la desigualdad de Gronwall-Bellman mostrar que y (t) k1 e(k2 )(tt0 ) + k3 1 e(k2 )(tt0 ) . k2
2.6 Ejercicios Ayuda: Tomar z (t) = y (t)e(tt0 ) y encontrar la desigualdad que satisface z . Ejercicio 2.3
45
Usando el Teorema del Mapeo Contractivo mostrar que el sistema de ecuaciones no lineales 1+ x1 1 + x2 1 x1 + x2 = 1 x2 1 + x2 2 x2 = 2,
x1 + 1 +
donde < 1 , tiene una u nica soluci on real. 2 Ejercicio 2.4 Sea f : Rn Rn localmente Lipschitz en un dominio D RN . Sea S D un conjunto compacto (cerrado y acotado). Mostrar que existe una constante L > 0 tal que f (x) f (y ) L x y , x, y S.
Ayuda: Por ser compacto, el conjunto S puede cubrirse por un n umero nito de entornos: S N (a1 , r1 ) N (a2 , r2 ) N (ak , rk ). Considerar los dos casos siguientes por separado: x, y S N (ai , ri ) para alg un i [1, 2, . . . , k ]. x, y / S N (ai , ri ) para ning un i [1, 2, . . . , k ]; en este caso notar que x y mini ri y usar el hecho de que f (x) est a uniformemente acotada en S . Ejercicio 2.5 Recordar que una funci on f : S1 S2 se dice continua en un punto x S1 si dada una constante > 0 existe alguna constante > 0 tal que x y < f (x) f (y ) < . Una funci on f es continua en un conjunto S si es continua en todo punto de S , y es uniformemente continua en S si, dada > 0, existe > 0 dependiente s olo de tal que la desigualdad vale para todo x, y S . Mostrar que si f : Rn Rn es Lipschitz en W Rn , entonces f (x) es uniformemente continua en W . Ejercicio 2.6 Mostrar que si f : Rn Rn es Lipschitz en un dominio D = {x Rn : x < r} y f (0) = 0, entonces existe una constante k > 0 tal que f (x) k x para todo x D.
46 Ejercicio 2.7 Sea el problema de valor inicial x = f (t, x), x(t0 ) = x0 ,
(2.13)
y sea D Rn un dominio que contiene x = 0. Suponer que f (t, 0) = 0 y f (t, x) es Lipschitz en x sobre [t0 , ) D con constante de Lipschitz L en 2 , y que la soluci on x(t) est a denida para todo t t0 y pertenece a D. (i) Mostrar que d T x (t)x(t) dt (ii) Mostrar que x0 Ejercicio 2.8 Sea Dr = {x Rn : x < r}. Para cada uno de los siguientes sistemas representados como x = f (t, x) e introducidos en el Cap tulo 1 determinar si f es: (a) localmente Lipschitz en x Dr para r sucientemente peque no; (b) localmente Lipschitz en x Dr para cualquier r > 0 nito; (c) globalmente Lipschitz en x. (i) La ecuaci on del p endulo con entrada de control. (ii) El circuito con diodo t unel. (iii) El sistema de masa-resorte con resorte lineal, amortiguamiento viscoso, fricci on est atica y fuerza externa nula. (iv) El oscilador de Van der Pol. (v) La ecuaci on de estado a lazo cerrado de tercer orden del ejemplo de control adaptable. (vi) El sistema x = Ax B (Cx), donde A Rnn , B Rn1 , C R1n son matrices constantes y () es una alinealidad de zona muerta, denida por y + d, (y ) = 0, y d, para y < d para d y d para y > d
2
2L x(t) 2 2.
eL(tt0 ) x(t)
x0
eL(tt0 )
(Este sistema representa un sistema lineal realimentado con alinealidad est atica, como se ve en la gura, en particular con estacionaria y r = 0.)
2.6 Ejercicios
r + u y
47
Sistema Lineal G(s) = C (sI A)1 B
(t, y )
Elemento No Lineal
Ejercicio 2.9 Sea f (t, x) seccionalmente continua en t y localmente Lipschitz en x sobre [t0 , t1 ] D para alg un dominio D Rn . Sea W un subconjunto compacto de D. Sea x(t) la soluci on de x = f (t, x) con x(t0 ) = x0 W . Asumiendo que x(t) est a denida y pertenece a W para todo t [t0 , T ), T < t1 , mostrar que (i) x(t) es uniformemente continua sobre [t0 , T ), (ii) x(T ) est a denida y pertenece a W , y que entonces x(t) es una soluci on sobre [t0 , T ], (iii) existe > 0 tal que la soluci on x(t) pueda extenderse sobre [t0 , T + ].
Ejercicio 2.10 Sea f (t, x) seccionalmente continua en t y localmente Lipschitz en x sobre [t0 , t1 ] D para alg un dominio D Rn . Sea y (t) una soluci on de (2.13) sobre un intervalo abierto m aximo [t0 , T ) [t0 , t1 ] con T < . Sea W cualquier conjunto compacto de D. Mostrar que existe alg un t [t0 , T ) tal que y (t) / W. Ayuda: Usar el ejercicio anterior.
Ejercicio 2.11 Sea f (t, x) seccionalmente continua en t, localmente Lipschitz en x, y f (t, x) k1 + k2 x , (t, x) [t0 , ) Rn .
(i) Mostrar que la soluci on de (2.13) satisface x(t) x0 ek2 (tt0 ) + k1 k2 (tt0 ) e 1 k2
para todo t t0 para el cual la soluci on existe. (ii) Puede haber escape en tiempo nito de la soluci on?
48 Ejercicio 2.12
Sean f (t, x) y su derivada parcial respecto de x continuas en (t, x) para todo (t, x) R Rn . Sea x(t, a, ) la soluci on de x = f (t, x) que comienza en x(a) = y supongamos que x(t, a, ) est a denida en [a, t1 ]. Mostrar que x(t, a, ) es continuamente diferenciable con respecto de a y . Sean xa (t) y x (t) las respectivas derivadas parciales. Mostrar que satisfacen xa (t) + x (t)f (a, ) 0 , t [a, t1 ]
Cap tulo 3 Estabilidad Seg un Lyapunov. Sistemas Estacionarios

La teor a de estabilidad juega un rol central en teor a de sistemas e ingenier a. Existen distintos tipos de problemas de estabilidad en los sistemas din amicos. En este cap tulo vamos a tratar estabilidad de puntos de equilibrio; m as adelante en el curso veremos otros problemas de estabilidad, como el de estabilidad entrada-salida. La estabilidad de puntos de equilibrio generalmente se caracteriza en el sentido de Lyapunov, un matem atico e ingeniero ruso que estableci o las bases de la teor a que hoy lleva su nombre. Un punto de equilibrio se dice estable si todas las soluciones que se inicien en las cercan as del punto de equilibrio permanecen en las cercan as del punto de equilibrio; de otro modo el punto de equilibrio es inestable. Un punto de equilibrio se dice asint oticamente estable si todas las soluciones que se inicien en las cercan as del punto de equilibrio no s olo permanecen en las cercan as del punto de equilibrio, sino que adem as tienden haAleksandr Lyapunov cia el equilibrio a medida que el tiempo se aproxima a innito. 1857-1918 Vemos estas nociones en m as detalle en 3.1, donde presentamos tambi en los teoremas b asicos de Lyapunov para sistemas estacionarios. En 3.2 damos una extensi on de la teor a b asica de Lyapunov que se debe a LaSalle. En 3.3 analizamos regi on de atracci on de un punto de equilibrio, y en 3.4 vemos c omo la estabilidad de un punto de equilibrio puede determinarse mediante linealizaci on. Los teoremas de estabilidad de Lyapunov dan condiciones sucientes para estabilidad de puntos de equilibrio. Existen teoremas conversos que establecen que, al menos conceptualmente, en los teoremas de Lyapunov muchas de estas condiciones son tambi en necesarias. Trataremos estos teoremas conversos en el cap tulo siguiente, junto a extensiones de los resultados para sistemas inestacionarios.
3.1
El Teorema de Estabilidad de Lyapunov

x = f (x) (3.1)
Consideremos el sistema estacionario
donde f : D Rn es un mapa localmente Lipschitz desde un dominio D Rn en Rn . Supongamos que x D es un PE de (3.1), es decir f ( x) = 0. Vamos a caracterizar y estudiar
50
Estabilidad Seg un Lyapunov. Sistemas Estacionarios
la estabilidad de x . Por conveniencia, vamos a asumir que x = 0 (esto no nos hace perder generalidad porque, si no es as , denimos y = x x y trabajamos con la ecuaci on y = g (y ), donde g (y ) f (y + x ), que tiene un equilibrio en el origen.) Denici on 3.1. El PE x = 0 de (3.1) es estable, si para cada > 0 existe = ( ) tal que x(0) < = x(t) < , t 0
inestable si no es estable. asint oticamente estable (AE) si es estable y puede elegirse tal que x(0) < = lim x(t) = 0
t
Los tres tipos de estabilidad se pueden ver en la ecuaci on del p endulo (1.4) del Ejemplo 1.2.1. Los PE son (0, 0) y (, 0). Considerando que no hay fricci on, o sea tomando k = 0, las trayectorias en el entorno del primer PE son orbitas cerradas. Empezando sucientemente cerca del PE se puede garantizar que las trayectorias van a permanecer en cualquier bola preespecicada alrededor del PE. Por lo tanto, el PE es estable. No es AE, sin embargo, porque las trayectorias que comienzan fuera del PE nunca tienden a el. Si consideramos fricci on (k > 0), el PE en el origen es un foco estable. La inspecci on del retrato de fase de un foco estable muestra que el requisito para estabilidad se satisface; m as a un, las trayectorias que comienzan cerca del PE tienden a el cuando t tiende a . El segundo PE en (, 0) es un punto de ensilladura. Es obvio que el requisito para estabilidad no se satisface porque, para cualquier > 0, siempre hay una trayectoria que deja la bola {x Rn | x x }, a un cuando x(0) sea arbitrariamente cercano al PE. La Denici on 3.1 tiene como condici on impl cita la existencia de la soluci on para todo t 0. Esta propiedad de existencia global (en el tiempo) de la soluci on no est a garantizada, como ya vimos, por la Lipschitzidad local de f . Vamos a ver, sin embargo, que las condiciones adicionales que requiere el Teorema de Lyapunov van a garantizar la existencia global (en el tiempo) de la soluci on. Reci en vimos que para el ejemplo del p endulo se pueden determinar las propiedades de estabilidad analizando el retrato de fase. Este enfoque es dif cil de extender a sistemas de orden mayor que dos. Vamos a ver que las conclusiones a las que llegamos analizando el retrato de fase del p endulo se pueden obtener tambi en usando conceptos de energ a. Denamos la energ a del p endulo E (x) como la suma de sus energ as cin etica y potencial, con referencia de energ a potencial elegida tal que E (0) = 0, es decir,
x1
E (x) =
0
1 2 1 (g/l) sen y dy + x2 2 = (g/l )(1 cos x1 ) + x2 2 2
(3.2)
Cuando no hay fricci on (k = 0), el sistema es conservativo, es decir, no hay disipaci on de energ a. Por lo tanto, E = constante durante la evoluci on del sistema, o sea, dE/dt = 0 sobre las trayectorias del sistema. Como E (x) = c forma contornos cerrados alrededor de x = 0 para c peque no, concluimos que x = 0 es un PE estable. Cuando consideramos fricci on (k > 0), se disipa energ a durante la evoluci on del sistema, o sea, dE/dt 0 sobre las trayectorias del sistema. Es decir que la energ a decrece hasta que llega a cero, mostrando que la trayectoria tiende a x = 0 cuando t .
3.1 El Teorema de Estabilidad de Lyapunov
51
En 1892, Lyapunov mostr o que algunas otras funciones, no s olo la energ a, pueden usarse para determinar la estabilidad de un PE. Sea V : D R una funci on continuamente diferenciable en un dominio D Rn que contiene el origen. La derivada de V a lo largo de las trayectorias de (3.1) est a dada por f1 (x) n n V V V V V f2 (x) V V (x) = x i = fi (x) = f (x) , , ..., . = . x x x x x x . i i 1 2 n i=1 i=1 fn (x) Teorema 3.1 (Lyapunov). Sea el origen x = 0 un PE de (3.1) y sea D Rn un dominio que contiene el origen. Sea V : D R una funci on continuamente diferenciable tal que V (0) = 0 y V (x) > 0 en D {0} (x) 0 en D V Entonces x = 0 es estable. M as a un, si (x) < 0 en D {0} V entonces x = 0 es AE. Demostraci on. Dado > 0, elijamos r (0, ] tal que Br = {x Rn | x r} D Sea = min
x =r
(3.3) (3.4)
(3.5)
V (x). Entonces > 0 por (3.3). Tomemos (0, ) y sea
= {x Br | V (x) } Entonces est a en el interior de Br ;

1
ver la Figura 3.1. El conjunto tiene la propiedad
D r 0 B Br
Figura 3.1: Representaci on geom etrica de los conjuntos en la prueba del Teorema 3.1 de que toda trayectoria que comienza en en t = 0 permanece en para todo t 0. Esto sigue de (3.4) ya que (x(t)) 0 = V (x(t)) V (x(0)) , V
1
t 0
Si no fuera as , existir a un punto p que se encuentra sobre la frontera de Br . En este punto, V (p) > , pero para todo x , V (x) , lo cual es una contradicci on.
52
Como es un conjunto compacto (cerrado por denici on y acotado porque est a contenido en Br ), concluimos por el Teorema 2.9 que (3.1) tiene una soluci on u nica denida para todo t 0 cuando x(0) . Como V es continua y V (0) = 0, existe > 0 tal que x = V (x) < Entonces B Br y x(0) B = x(0) = x(t) = x(t) Br , Por lo tanto x(0) < = x(t) < r , t 0 t 0
lo que muestra que el PE en x = 0 es estable. Supongamos ahora que (3.5) tambi en vale. Para mostrar EA debemos probar que x(t) 0 cuando t . Como V es continua y V (0) = 0, es suciente mostrar que V (x(t)) 0 cuando t . Como V (x(t)) es monot onicamente decreciente y acotada inferiormente por cero, V (x(t)) c 0 cuando t Mostramos que c = 0 por contradicci on. Supongamos que c > 0. Por continuidad de V (x), existe d > 0 tal que Bd c . El l mite V (x(t)) c > 0 implica que la trayectoria x(t) (x), el cual existe permanece fuera de la bola Bd para todo t 0. Sea = maxd x r V (x) alcanza un m porque la funci on continua V aximo sobre el conjunto compacto {d x (x) tenemos que r}. Sabemos que < 0 por (3.5). Integrando V
t
V (x(t)) = V (x(0)) +
0
(x( )) d V (x(0)) t V
Como el lado derecho se va a hacer negativo despu es de un cierto tiempo, la desigualdad contradice la suposici on de que c > 0. Una funci on continuamente diferenciable que satisface (3.3) y (3.4) se denomina funci on de Lyapunov. La supercie V (x) = c se denomina supercie de Lyapunov o supercie de nivel. Usando supercies de Lyapunov, la Figura 3.2 da una interpretaci on intuitiva del Teorema 3.1. La condici on V 0 implica que cuando la trayectoria cruza la supercie de Lyapunov V (x) = c se introduce en el conjunto c = {x Rn | V (x) c} y nunca puede salir de el. Cuando V < 0, la trayectoria se mueve de una supercie de Lyapunov a otra supercie de Lyapunov interior con un c menor. A medida que c decrece, la supercie de Lyapunov V (x) = c se achica hasta transformarse en el origen, mostrando que la trayectoria tiende al origen cuando 0, no podemos asegurar que la trayectoria tienda al origen, t . Si s olo sabemos que V pero podemos concluir que el origen es estable porque la trayectoria puede ser encerrada en cualquier bola B s olo con requerir que el estado inicial x(0) pertenezca a una supercie de Lyapunov contenida en dicha bola. Una funci on V (x) que satisface (3.3) se dice denida positiva. Si satisface la condici on m as d ebil V (x) 0 para x = 0, se dice semidenida positiva. Una funci on se dice denida negativa
3.1 El Teorema de Estabilidad de Lyapunov c3 c2 V (x) = c1 c1 < c 2 < c 3
53
Figura 3.2: Curvas de nivel de una funci on de Lyapunov
o semidenida negativa si V (x) es denida positiva o semidenida positiva, respectivamente. Si V (x) no tiene signo denido con respecto a alguno de estos cuatro casos se dice indenida. El teorema de Lyapunov se puede enunciar, usando esta nueva terminolog a como: el origen (x) es estable si existe una funci on denida positiva y continuamente diferenciable tal que V (x) es denida negativa. es semidenida negativa, y es AE si V Ejemplo 3.1. Sea V la forma cuadr atica V (x) = xt P x donde P es una matriz real y sim etrica. V (x) es (semi)denida positiva s todos los autovalores de P son (no negativos) positivos, lo que vale s todos los menores principales de P son (no negativos) positivos. Si V (x) = xt P x es (semi)denida positiva, decimos que la matriz P es (semi)denida positiva y escribimos (P 0) P > 0. Por ejemplo, si a 0 1 P = 0 a 2 1 2 a entonces V (x) es positiva denida si a > 5 y denida negativa si a < 5. Ejemplo 3.2. Consideremos la ecuaci on diferencial de primer orden x = g (x) donde g (x) es localmente Lipschitz en (a, a) y satisface g (0) = 0 ;
x
x g (x) > 0 ,
x = 0 , x (a, a)
Este sistema tiene un PE aislado en el origen. Consideremos la funci on V (x) =

0
g (y ) dy
En el dominio D = (a, a), V (x) es continuamente diferenciable, V (0) = 0 y V (x) > 0 para todo x = 0, es decir, es una candidata a funci on de Lyapunov v alida. Calculemos su derivada a lo largo de las trayectorias del sistema: (x) = V [g (x)] = [g (x)]2 < 0 , x D {0} V x Concluimos usando el Teorema 3.1 que el origen es AE.
54
Ejemplo 3.3 (P endulo sin fricci on). Consideremos la ecuaci on del p endulo sin fricci on (ecuaci on (1.4) con k = 0) con la funci on de energ a (3.2) como funci on de Lyapunov. Tenemos que V (0) = 0 y V (x) es denida positiva en el dominio 2 x1 2 . Adem as (x) = (g/l)x V 1 sen x1 + x2 x 2 = 0 Por lo tanto se satisfacen las condiciones (3.3) y (3.4) del Teorema 3.1 probando que el origen (x) 0 podemos tambi es estable. Como V en concluir que el origen no es AE. Ejemplo 3.4 (P endulo con fricci on). Consideremos la ecuaci on del p endulo con fricci on (ecuaci on (1.4) con k > 0) con la funci on de energ a (3.2) como funci on de Lyapunov. Tenemos que (x) = (g/l)x V 1 sen x1 + x2 x 2 = (k/m) x2 2 (x) es semidenida negativa pero no es denida negativa porque se anula sobre todo el eje V x2 = 0. Por lo tanto s olo podemos concluir que el origen es estable. Sin embargo ya sabemos, analizando el retrato de fase, que en este caso el origen es AE, por lo tanto esta elecci on de funci on de Lyapunov junto con el Teorema 3.1 no son concluyentes para probar las propiedades de estabilidad del PE (vamos a ver m as adelante que el Teorema de invariancia de LaSalle nos va a permitir probar AE usando la funci on de energ a). Partiendo de la funci on de energ a, t por la forma cuadr a tica general (1 / 2) x P x y tratemos de reemplacemos el t ermino (1/2)x2 2 elegir los elementos de P tal que V (x) sea una funci on de Lyapunov v alida, 1 g V (x) = xT P x + (1 cos x1 ) 2 l 1 g p11 p12 x1 x1 x2 = + (1 cos x1 ). p12 p22 x2 2 l Para que la forma cuadr atica xT P x sea denida positiva los elementos de P deben satisfacer p11 > 0; p11 p22 p2 12 > 0. (x) est La derivada V a dada por (x) = p11 x1 + p12 x2 + g sen x1 x2 + (p12 x1 + p22 x2 ) g sen x1 V l l g g k = (1 p22 )x2 sen x1 p12 x1 sen x1 + p11 p12 x1 x2 l l m k + p12 p22 x2 2 m k m x2
(x) sea denida negativa. Como los t Ahora queremos elegir p11 , p12 y p22 para que V erminos de productos cruzados x2 sen x1 y x1 x2 son de signo indenido, los cancelamos tomando p22 = 1 y p11 = (k/m)p12 . Con esta elecci on p12 debe satisfacer k m para que V (x) sea denida positiva. Una posible elecci on es p12 = 0.5(k/m), y as 0 < p12 < (x) = gk x1 sen x1 1 x2 V . 2lm 2 2 El t ermino x1 sen x1 > 0 para todo x1 : 0 < |x1 | < . Tomando D = {x Rn : |x1 | < } (x) es denida negativa en D. Por el Teorema 3.1 tenemos que V (x) es positiva denida y V concluimos que el origen es AE.
55
El ejemplo anterior muestra que las condiciones del Teorema 3.1 son s olo sucientes. Si una dada candidata a funci on de Lyapunov no alcanza para probar que el PE es AE, esto no signica que no lo sea. En el Ejemplo 3.4 enfocamos el problema en una forma inversa. Investigamos una expresi on propuesta para V (x) y determinamos sus par ametros de forma que V (x) fuera denida positiva (x) denida negativa. Esta idea es u yV til para buscar funciones de Lyapunov, y se aprovecha en el procedimiento siguiente.
3.1.1
M etodo del Gradiente Variable
El m etodo del gradiente variable es un m etodo para construir funciones de Lyapunov. Sea V (x) una funci on escalar de x y g (x) = (V /x)t . Entonces (x) = V f (x) = g t (x)f (x) V x La idea es tratar de encontrar g (x) tal que sea el gradiente de una funci on denida positiva V (x) y tal que V (x) sea denida negativa. Es f acil de probar que g (x) es el gradiente de una funci on escalar s la matriz Jacobiana [g/x] es sim etrica, es decir gi gj = , xj xi i, j = 1, 2, . . . , n
Bajo esta restricci on, elegimos g (x) tal que g t (x)f (x) sea denida negativa. Luego V (x) se computa mediante la integral
x x n
V (x) =
0
g (y )dy =
0 i=1
gi (y )dyi
Como la integral de un gradiente no depende del camino, podemos integrar a lo largo de los ejes:
x1 x2
V (x) =
0
g1 (y1 , 0, . . . , 0)dy1 +
0
g2 (x1 , y2 , . . . , 0)dy2
xn
+ +
0
gn (x1 , x2 , . . . , yn )dyn
Ejemplo 3.5. Consideremos el sistema x 1 = x2 , x 2 = h(x1 ) ax2 donde a > 0, h es localmente Lipschitz, h(0) = 0 y adem as y h(y ) > 0 para todo y = 0, y (b, c) para ciertas constantes positivas b y c. La ecuaci on del p endulo es un caso particular de este sistema. Queremos elegir un vector de dos componentes g (x) tal que g1 g2 = x2 x1 V (x) = g1 (x)x2 g2 (x)[h(x1 ) + ax2 ] < 0 ,
x
(3.6) x=0
V (x) =
0
g t (y ) dy > 0 ,
x=0
56 Probemos con g (x) = (x)x1 + (x)x2 (x)x1 + (x)x2
(3.7)
donde las funciones escalares , , y son a determinar. (x): Empecemos calculando V

2 (x) = (x)x1 x2 + (x)x2 V 2 a (x)x1 x2 a (x)x2 (x)x2 h(x1 ) (x)x1 h(x1 )
y para cancelar los productos cruzados (que no tienen signo denido) elegimos (x)x1 a (x)x1 (x)h(x1 ) = 0 de forma que (x) = [a (x) (x)]x2 (x)x1 h(x1 ) V 2 Para simplicar elegimos (x) = constante, (x) = constante, y (x) = constante, por lo cual en (3.8) depende s olo de x1 . La condici on de simetr a (3.6) se reduce entonces a = . La expresi on de g (x) en (3.7) resulta g (x) = ax1 + h(x1 ) + x2 x1 + x2 (3.8)
Integrando obtenemos
x1 x2
V (x) =
0
[ay1 + h(y1 )]dy1 +

0 x1 0
(x1 + y2 )dy2
1 = ax2 1+ 2 1 = xt P x + 2 donde P = a
1 h(y )dy + x1 x2 + x2 2 2 h(y )dy
x1 0
(x) es denida Eligiendo > 0 y 0 < < a aseguramos que V (x) es denida positiva y V negativa. Por ejemplo, tomando = ka con 0 < k < 1, obtenemos la funci on de Lyapunov ka2 ka V (x) = xt x+ ka 1 2
x1
h(y )dy
0
(3.9)
que satisface las condiciones (3.3) y (3.4) del Teorema 3.1 en el dominio D = {x R2 | b < x1 < c}. Concluimos que el origen es AE.
57
3.1.2
Sobre la Regi on de Atracci on. Estabilidad Asint otica Global
Sea (t; x) la soluci on de (3.1) que comienza en t = 0 y supongamos que el origen x = 0 es un PE AE. Denimos como regi on (dominio) de atracci on (RA) del PE al conjunto de todos los puntos x tal que limt (t; x) = 0. Es en general dif cil o imposible encontrar anal ticamente la RA. Sin embargo se pueden usar funciones de Lyapunov para estimarla con conjuntos contenidos en la RA. Por la prueba del Teorema 3.1 sabemos que si existe una funci on de Lyapunov que satisface las condiciones de estabilidad asint otica en un dominio D, y si c = {x Rn | V (x) c} est a acotado y contenido en D, entonces toda trayectoria que comienza en c permanece en c y tiende al origen cuando t . Por lo tanto c es una estima de la RA. Esta estima puede ser conservadora, es decir, puede ser mucho m as chica que la RA real. Queremos saber bajo que condiciones la RA es todo el espacio Rn . Esto ser a as si podemos probar que para todo estado inicial x, la trayectoria (t; x) tiende al origen cuando t , sin importar cuan grande es x . Si un PE AE tiene esta propiedad se dice que es globalmente AE (GAE). Recordando otra vez la prueba del Teorema 3.1 vemos que se puede probar GAE si se puede asegurar que cada punto x Rn puede incluirse en el interior de un conjunto acotado c . Esto no siempre va a ser posible porque para valores grandes de c el conjunto c puede no ser acotado. Consideremos por ejemplo la funci on V (x) = x2 1 + x2 2 1 + x2 1
cuyas supercies de nivel V (x) = c se ven gracadas en la Figura 3.3.

x2
x1
Figura 3.3: Supercies de Lyapunov de V (x) =
x2 1 1+x2 1
+ x2 2
Las supercies de nivel son cerradas s olo para valores peque nos de c. En este caso, c es acotado porque puede incluirse en una bola cerrada Br para alg un r > 0. A medida que c crece, se llega a un valor a partir del cual la supercies de nivel V (x) = c es abierta y c no es acotado. Para que c est e en el interior de una bola Br , c debe satisfacer c < inf x r V (x). Si = lim inf V (x) <
r x r
58
entonces c ser a acotado si c < . En el ejemplo anterior, = lim min x2 x2 1 1 2 + x = lim =1 2 | x | 1 + x2 1 + x2 1 1 1
r x =r
Por lo tanto c ser a acotado s olo para c < 1. Una condici on adicional que asegura que c es acotado para todo valor de c es V (x) cuando x
Una funci on que satisface esta condici on se dice radialmente no acotada. Teorema 3.2 (Barbashin-Krasovskii). Sea x = 0 un PE de (3.1). Sea V : Rn R una funci on continuamente diferenciable tal que V (0) = 0 y V (x) > 0 x = 0 x = V (x) (x) < 0 V x = 0 entonces x = 0 es GAE. Demostraci on. Dado cualquier punto p Rn , sea c = V (p). La condici on (3.11) implica que para cualquier c > 0, existe r > 0 tal que V (x) > c cuando x > r. Por lo tanto c Br , lo que implica que c es acotado. El resto de la prueba es similar a la del Teorema 3.1. Ejemplo 3.6. Consideremos otra vez el sistema del Ejemplo 3.5, pero supongamos que la condici on yh(y ) > 0 vale y = 0. La funci on de Lyapunov (3.9) satisface (3.10) y (3.11) para todo x R2 . Su derivada (x) = a (1 k )x2 V 2 akx1 h(x1 ) es denida negativa para todo x R2 porque 0 < k < 1. Por lo tanto el origen es AE. Notemos que si el origen es GAE, entonces debe ser el u nico PE del sistema. (3.10) (3.11) (3.12)
3.1.3
Inestabilidad
Vamos a ver un teorema que prueba que un PE es inestable. Sea V : D R una funci on n continuamente diferenciable en un dominio D R que contiene al origen x = 0. Supongamos que V (0) = 0 y que hay un punto x0 arbitrariamente cercano al origen tal que V (x0 ) > 0. Elijamos r > 0 tal que la bola Br = {x Rn | x r} est e contenida en D, y sea U = {x Br | V (x) > 0} (3.13)
El conjunto U es no vac o. Su frontera est a dada por la supercie V (x) = 0 y la esfera x = r. Como V (0) = 0, el origen est a sobre la frontera de U en el interior de Br . Teorema 3.3 (Chetaev). Sea x = 0 un PE de (3.1). Sea V : D R una funci on continuamente diferenciable tal que V (0) = 0 y V (x0 ) > 0 para alg un x0 con x0 arbitrariamente (x) > 0 en U . Entonces peque na. Denamos el conjunto U como en (3.13) y supongamos que V x = 0 es inestable.
59
Demostraci on. El punto x0 est a en el interior de U y V (x0 ) = a > 0. La trayectoria x(t) que comienza en x(0) = x0 debe dejar el conjunto U . Para probar esto, notemos que mientras x(t) (x) > 0 en U . Sea permanezca en U , V (x(t)) a porque V (x) | x U y V (x) a} = min{V (x) tiene un m que existe porque la funci on continua V nimo en el conjunto compacto {x U y V (x) a} = {x Br | V (x) a}. Entonces > 0 y
t
V (x(t)) = V (x0 ) +
0
(x(s))ds a + t V
Esta desigualdad muestra que x(t) no se puede quedar indenidamente en U porque V (x) est a acotada en U . Ahora, x(t) no puede dejar U a trav es de la supercie V (x) = 0 porque V (x(t)) a. Por lo tanto debe dejar U a trav es de la esfera x = r. Como esto pasa para x0 arbitrariamente peque na, el origen es inestable. Ejemplo 3.7. Consideremos el sistema de segundo orden x 1 = x1 + g1 (x) x 2 = x2 + g2 (x) donde g1 y g2 satisfacen |gi (x)| k x
2 2
en un entorno D del origen. Esta desigualdad implica que gi (0) = 0, por lo tanto el origen es un PE. Consideremos la funci on 1 x2 V (x) = (x2 2 ). 2 1
Br
x2
x2 = x1
U x1
x2 = x1
1 2 (x2 Figura 3.4: El conjunto U para V (x) = 2 1 x2 )
Sobre el eje x2 = 0, V (x) > 0 en puntos arbitrariamente cercanos al origen. El conjunto U est a gracado en la Figura 3.4. La derivada de V (x) sobre las trayectorias del sistema es
2 (x) = x2 V 1 + x2 + x1 g1 (x) x2 g2 (x)
60
La magnitud del t ermino x1 g1 (x) x2 g2 (x) satisface

2
|x1 g1 (x) x2 g2 (x)|

i=1
|xi ||gi (x)| 2k x
3 2
Por lo tanto, (x) x V

2 2
2k x
3 2
= x 2 2 (1 2k x 2 )
Eligiendo r tal que Br D y r < 1/(2k ), vemos que todas las condiciones del Teorema 3.3 se satisfacen. Entonces el origen es inestable.
3.2
El Principio de Invariancia
En el Ejemplo 3.4 vimos que la funci on de energ a no era suciente para probar que el origen 2 (x) es siempre es AE porque V (x) = (k/m)x2 es s olo semidenida negativa. Sin embargo V (x) = 0. Para que el sistema pueda mantener la negativa salvo en el eje x2 = 0, donde V condici on V (x) = 0, la trayectoria debe quedar connada al eje x2 = 0. Pero esto es imposible a menos que x1 = 0 porque x2 (t) 0 = x 2 (t) 0 = sen x1 (t) 0 Por lo tanto, en el segmento < x1 < del eje x2 = 0, el sistema puede mantener la (x) = 0 s condici on V olo en el origen. Es decir V (x(t)) debe decrecer a cero y en consecuencia x(t) 0 cuando t . Esta idea puede formalizarse en el principio de invariancia de LaSalle, que vamos a enunciar y demostrar luego de introducir algunos conceptos. Sea x(t) una soluci on de (3.1). Un punto p es un punto l mite positivo de x(t) si existe una secuencia {tn }, con tn cuando n , tal que x(tn ) p cuando n . El conjunto de todos los puntos l mites positivos de x(t) se denomina el conjunto l mite positivo de x(t). Un conjunto M es un conjunto invariante con respecto a (3.1) si x(0) M = x(t) M , t R
Un conjunto M es un conjunto invariante positivo si x(0) M = x(t) M , t 0 > 0 existe T > 0
Decimos que x(t) tiende a M cuando t tiende a innito si para cada tal que dist(x(t), M ) < , t > T
donde dist(p, M ) denota la distancia de un punto p a un conjunto M , es decir, dist(p, M ) = inf xM p x .
3.2 El Principio de Invariancia
61
Un PE AE es el conjunto l mite positivo de toda soluci on que comience sucientemente cerca del PE. Un ciclo l mite estable es conjunto l mite positivo de toda soluci on que comience sucientemente cerca del ciclo l mite. La soluci on tiende al ciclo l mite cuando t pero no necesariamente a alg un punto espec co del ciclo l mite, es decir el limt x(t) no necesariamente existe. El PE y el ciclo l mite son conjuntos invariantes porque toda soluci on que n comience sobre ellos se queda all para todo t R. El conjunto c = {x R | V (x) c} con V (x) 0 para todo x c es un conjunto invariante positivo. Lema 3.4. Si una soluci on x(t) de (3.1) es acotada y permanece en D para todo t 0, entonces su conjunto l mite positivo L+ es un conjunto invariante, no vac o y compacto. Adem as, x(t) L+ cuando t . Teorema 3.5 (LaSalle). Sea D un conjunto compacto que es invariante positivo con (x) 0 respecto a (3.1). Sea V : D R una funci on continuamente diferenciable tal que V (x) = 0. Sea M el mayor conjunto en . Sea E el conjunto de todos los puntos de donde V invariante en E . Entonces toda soluci on que comienza en tiende a M cuando t . (x) 0 en , Demostraci on. Sea x(t) una soluci on de (3.1) que comienza en . Como V V (x(t)) es una funci on decreciente de t. Como V (x) es continua en el conjunto compacto , est a acotada inferiormente en , por lo tanto V (x(t)) tiene un l mite a cuando t . Notemos tambi en que el conjunto l mite positivo L+ est a en porque es un conjunto cerrado. Para cada p L+ , existe una secuencia tn tal que tn y x(tn ) p cuando n . Por continuidad de V (x), V (p) = limn V (x(tn )) = a, lo que implica V (x) = a en (x) = 0 en L+ . Por lo tanto, L+ . Como L+ es un conjunto invariante (por Lema 3.4), V L+ M E Como x(t) es acotada, x(t) tiende a L+ cuando t (por Lema 3.4). Por lo tanto x(t) tiende a M cuando t . A diferencia del Teorema de Lyapunov, el Teorema 3.5 no requiere que V (x) sea denida positiva. Tampoco el conjunto est a necesariamente ligado a la construcci on de V (x). Sin embargo, en muchas aplicaciones, la construcci on de V (x) en si misma va a garantizar la existencia de un conjunto . En particular, si c = {x Rn | V (x) c} es acotado y (x) 0 en c , entonces podemos tomar = c . Cuando V (x) es denida positiva, c V es acotado para c > 0 sucientemente peque no. Esto no es verdad en general si V (x) no es denida positiva. Por ejemplo si V (x) = (x1 x2 )2 , el conjunto c no es acotado por m as peque no que sea c. Si V (x) es radialmente no acotada (o sea, verica (3.11)), el conjunto c es acotado para todo valor de c, sea V (x) denida positiva o no. Cuando nuestro inter es es el de mostrar que x(t) 0 cuando t , tenemos que probar que el m aximo conjunto invariante en E es el origen. Esto se hace mostrando que ninguna soluci on, excepto la trivial x(t) = 0, puede permanecer id enticamente en E . Especializando el Teorema 3.5 a este caso, obtenemos los siguientes corolarios, que extienden los Teoremas 3.1 y 3.2. Corolario 3.6. Sea x = 0 un PE de (3.1). Sea V : D R una funci on continuamente diferenciable y denida positiva en un dominio D que contiene al origen x = 0, y tal que (x) 0 en D. Sea S = {x D | V (x) = 0} y supongamos que ninguna soluci V on, excepto la trivial x(t) = 0, puede permanecer id enticamente en S . Entonces el origen es AE.
62
Corolario 3.7. Sea x = 0 un PE de (3.1). Sea V : Rn R una funci on continuamente diferenciable, radialmente no acotada y denida positiva, y tal que V (x) 0 en Rn . Sea (x) = 0} y supongamos que ninguna soluci S = {x R n | V on, excepto la trivial x(t) = 0, puede permanecer id enticamente en S . Entonces el origen es GAE. Ejemplo 3.8. Consideremos el sistema x 1 = x2 x 2 = g (x1 ) h(x2 ) donde g y h son localmente Lipschitz y satisfacen g (0) = 0 , h(0) = 0 , yg (y ) > 0 , yh(y ) > 0 , y = 0 , y (a, a) y = 0 , y (a, a)
El sistema tiene un PE aislado en el origen. Dependiendo de las funciones g y h, podr a tener otros PE. La ecuaci on de este sistema puede verse como una generalizaci on de la del p endulo con h(x2 ) como el t ermino de fricci on. Tomemos como candidata a funci on de Lyapunov la funci on de energ a
x1
V (x) =
0
1 g (y )dy + x2 2 2
(3.14)
Sea D = {x R2 | a < xi < a}. V (x) es denida positiva en D. La derivada de V (x) sobre las trayectorias del sistema es (x) = g (x1 )x2 + x2 [g (x1 ) h(x2 )] = x2 h(x2 ) 0 V (x) es semidenida negativa. Para caracterizar el conjunto S = {x D | Por lo tanto, V (x) = 0}, notemos que V (x) = 0 = x2 h(x2 ) = 0 = x2 = 0 , ya que a < x2 < a V Por lo tanto S = {x D | x2 = 0}. Supongamos que x(t) es una trayectoria que pertenece id enticamente a S . Entonces x2 (t) 0 = x 2 (t) 0 = g (x1 (t)) 0 = x1 (t) 0 Por lo tanto, la u nica soluci on que puede quedarse id enticamente en S es la trivial; concluimos que el origen es AE. Supongamos ahora que el par ametro a = y adem as g satisface la condici on adicional
y
g (z )dz cuando |y |
0
La funci on de Lyapunov (3.14) es radialmente no acotada. En forma similar a lo hecho arriba (x) 0 en R2 , y el conjunto se puede probar que V (x) = 0} = {x R2 | x2 = 0} S = {x R2 | V contiene ninguna otra soluci on salvo la trivial. Concluimos que en este caso el origen es GAE.
3.2 El Principio de Invariancia
63
El teorema de LaSalle no s olo relaja el requisito del teorema de Lyapunov de que la derivada sea denida negativa, sino que lo extiende en tres direcciones: da una estima de la regi on de atracci on que no es necesariamente de la forma c = {x n R | V (x) c}; se puede usar en casos donde exista un conjunto de equilibrio en lugar de un PE aislado; la funci on V (x) no tiene que ser denida positiva. Ejemplo 3.9. Consideremos el sistema de primer orden (cf. 1.2.5) y = ay + u y la ley de control adaptable u = ky , = y 2 , > 0 k
Tomando x1 = y y x2 = k , el sistema a lazo cerrado se representa como x 1 = (x2 a)x1 x 2 = x2 1 El eje x1 = 0 es un conjunto de equilibrio del sistema. Queremos probar que toda trayectoria del sistema tiende a este conjunto de equilibrio cuando t , lo que signica que el control adaptable logra regular y a cero. Consideremos la candidata a funci on de Lyapunov 1 1 V (x) = x2 (x2 b)2 1+ 2 2 donde b > a. La derivada de V (x) sobre las trayectorias del sistema est a dada por 1 (x) = x1 x V 1 + (x2 b)x 2 2 = x2 1 (x2 a) + x1 (x2 b) = x2 1 (b a) 0 Como V (x) es radialmente no acotada, el conjunto c = {x R2 | V (x) c} es un conjunto invariante positivo compacto. Por lo tanto, tomando = c se cumplen todas las condiciones del Teorema 3.5. El conjunto E est a dado por E = {x c | x1 = 0} Como todo punto en el eje x1 = 0 es un PE, E es un conjunto invariante. Por lo tanto, en este ejemplo, M = E . Por el Teorema 3.5 concluimos que toda trayectoria que comienza en c tiende a E cuando t ; es decir, x1 0 cuando t . m as a un, como V (x) es radialmente no acotada, esta conclusi on es global. Notemos que si no conocemos la constante a, o una cota de ella, la funci on de Lyapunov del ejemplo anterior no se conoce, s olo se sabe que existe.
64
3.3
Regi on de Atracci on
x = f (x) (3.15)
Sea el origen x = 0 un PE AE del sistema no lineal
donde f : D Rn es localmente Lipschitz y D Rn es un dominio que contiene el origen. Sea (t; x) la soluci on de (3.15) con estado inicial x en t = 0. La regi on de atracci on (RA) del origen, RA , se dene como RA = {x D | (t; x) 0 cuando t } El siguiente Lema enuncia algunas propiedades de la RA. Lema 3.8. Si x = 0 es un PE AE de (3.15), entonces su RA RA es un conjunto conexo e invariante. m as a un, la frontera de RA est a formada por trayectorias. Ejemplo 3.10. El sistema x 1 = x2 x 2 = x1 + (x2 1 1) x2 es la ecuaci on de Van der Pol en tiempo invertido, es decir, reemplazando t por t. El sistema tiene un PE en el origen y un ciclo l mite (CL) inestable (ver Figura 3.5). El retrato de fase
x2
x1
Figura 3.5: Retrato de fase para el Ejemplo 3.10
muestra que el origen es un foco estable, por lo tanto es AE. Esto se conrma linealizando, ya que obtenemos A= V x =
x=0
0 1 1 1
(3.16)
que tiene autovalores en 1/2 j 3/2. La RA es acotada porque las trayectorias que comienzan afuera del CL no lo pueden cruzar para llegar al origen. Como no hay otro PE, la frontera de RA tiene que ser el CL.
3.3 Regi on de Atracci on Ejemplo 3.11. Consideremos el sistema x 1 = x2 1 x 2 = x1 + x3 x2 3 1
65
(3.17)
que tiene tres PE aislados en (0, 0), ( 3, 0) y ( 3, 0). El retrato de fase, gracado en la Figura 3.6, muestra que el origen es un foco estable y los otros dos PE son ensilladuras. Por lo tanto, el origen es AE y los otros PE son inestables, lo que se puede conrmar linealizando. De la gura se puede ver que las trayectorias estables de la ensilladura forman dos separatrices que son la frontera de la RA, la cual es no acotada.
x2
x1
Figura 3.6: Retrato de fase para el Ejemplo 3.11
Ejemplo 3.12. El sistema

2 x 1 = x1 (1 x2 1 x2 ) 2 x 2 = x2 (1 x2 1 x2 )
tiene un PE aislado en el origen y un continuo de PEs sobre el c rculo unitario: cada punto sobre el c rculo unitario es un PE. Es claro que RA debe estar connada al interior del c rculo unitario. Las trayectorias de este sistemas son los radios del c rculo unitario, lo que se puede ver transformando a coordenadas polares: x1 = cos , x2 = sen 2 = (1 ) Toda trayectoria que comienza con < 1 tiende al origen cuando t . Por lo tanto, RA es el interior del c rculo unitario. El m etodo de Lyapunov puede usarse para encontrar estimas de la RA. Por una estima de la RA entendemos un conjunto RA tal que toda trayectoria que comienza en tienda al origen cuando t . Vamos primero a mostrar que el dominio D del Teorema 3.1 no es una estima de RA . Vimos en el Teorema 3.1 que si D es un dominio que contiene el origen, y (x) es si podemos encontrar una funci on de Lyapunov V (x) que es denida positiva en D y V denida negativa en D, entonces el origen es AE. Se podr a pensar que D es una estima de la RA. Esto no es cierto, como lo demuestra el siguiente ejemplo.
66
Ejemplo 3.13. Consideremos otra vez el sistema (3.17), que es un caso especial del sistema del Ejemplo 3.5 con h(x1 ) = x1 1 x3 y a = 1. Por lo tanto, una funci on de Lyapunov es (3.9), 3 1 donde tomamos, por ejemplo, = 1, k = 1/2: 1 V (x) = xt 2
1 2 1 2 1 2 x1
x+
0
1 (y y 3 )dy 3
1 4 1 3 1 = x2 x1 + x1 x2 + x2 1 4 12 2 2 2 Deniendo el dominio D como D = {x R2 | 3 < x1 < 3} (x) < 0 en D {0}. Sin embargo, se puede ver en el retrato de vemos que V (x) > 0 en D y V fase de la Figura 3.6 que D no est a incluido en RA . (x) < 0 en una regi El ejemplo anterior muestra que el hecho de que V on no implica que la regi on sea una estima de la RA. Aunque una trayectoria que comienza en D se va a mover de una supercie de nivel V (x) = c1 a otra interior V (x) = c2 con c2 < c1 , no hay garant a de que la trayectoria permanecer a para siempre en D. Una vez que la trayectoria sale de D, no (x) sea negativa. Para que una regi hay garant a de que V on sea una estima de la RA debe ser un conjunto invariante positivo, es decir, toda trayectoria que comienza en el conjunto debe permanecer dentro de el en todo tiempo futuro. La estima m as simple de la RA es el conjunto c = {x Rn | V (x) c} cuando c es acotado y est a contenido en D. Esto sigue como corolario del Teorema 3.5. Usando los resultados de linealizaci on de 3.4, sabemos que si la matriz Jacobiana A= f (x) x
x=0
es Hurwitz, entonces siempre podemos encontrar una funci on de Lyapunov cuadr atica V (x) = xt P x resolviendo la ecuaci on de Lyapunov (3.20). Entonces, si A es Hurwitz, podemos siempre estimar la RA del origen. Esto lo ilustramos en el ejemplo siguiente. Ejemplo 3.14. Consideremos nuevamente el sistema del Ejemplo 3.10. Vimos que el origen es AE. Tomando Q = I y A de (3.16), obtenemos como u nica soluci on de la ecuaci on de t Lyapunov P A + A P = Q, la matriz denida positiva P = 1.5 0.5 0.5 1
La funci on cuadr atica V (x) = xt P x > 0 es una funci on de Lyapunov para el sistema en un (x) entorno del origen. Tenemos que determinar un dominio D alrededor del origen donde V sea denida negativa y un conjunto c D que sea acotado. Nos va a interesar encontrar c lo m as grande posible, es decir, el mayor valor para la constante c, porque c ser a nuestra estima de la RA. La derivada de V (x) sobre las trayectorias del sistema es (x) = (x2 + x2 ) (x3 x2 2x2 x2 ) V 1 2 1 1 2
3.4 Sistemas Lineales y Linealizaci on
67
El primer t ermino del lado derecho es la contribuci on de la parte lineal Ax, mientras que el segundo es la contribuci on de la parte no lineal g (x) = f (x) Ax, que llamaremos el t ermino de perturbaci on. Como g (x) 2 0 cuando x 2 x
2
(x) es denida sabemos que hay una bola abierta D = {x R2 | x 2 < r} en donde V negativa. Una vez que encontremos D, podemos encontrar c D eligiendo c < min V (x) = min (P )r2
x
2 =r
donde min () denota el m nimo autovalor de una matriz. Por lo tanto, para agrandar la RA (x) es denida negativa. Tenemos tenemos que encontrar la bola m as grande para la cual V que 2 2 (x) x + |x1 ||x1 x2 ||x1 2x2 | x + 5 x 4 V 2 2 2 2 2 (x) es donde usamos |x1 | x 2 , |x1 x2 | 1 x y | x 2 x | 5 x 2 . Por lo tanto, V 1 2 2 2 2 denida negativa en la bola D con radio dado por r = 2/ 5 = 0.8944. En este ejemplo se puede encontrar una estima menos conservadora trabajando en coordenadas polares. Tomando x1 = cos , tenemos = 2 + 4 cos2 sen (2 sen cos ) V 2 + 4 | cos2 sen ||2 sen cos | 2 + 4 0.3849 2.2361 2 + 0.8614 < 0 , para 2 < 1/0.861 Usando (3.18) junto con min (P ) 0.69, elegimos c = 0.8 < 0.69 0.861 x2 = sen
(3.18)
El conjunto c con c = 0.8 es una estima de la RA.
3.4
Sistemas Lineales y Linealizaci on

x = Ax (3.19)
El sistema lineal invariante
tiene un equilibrio en el origen, que es aislado s det A = 0. Si det A = 0, todo punto en el kernel o subespacio nulo de A es un PE. Un sistema lineal no puede tener m ultiples PE aislados, porque si x yz son dos PE de (3.19), entonces, por linealidad, todo punto en la recta que conecta a x yz es un PE. Las propiedades de estabilidad del origen pueden caracterizarse mediante la ubicaci on de los autovalores de A.
68
Teorema 3.9 (Estabilidad del Origen en Sistemas Lineales). El PE x = 0 de (3.19) es estable s todos los autovalores de A tienen parte real no positiva y cada autovalor con parte real nula tiene un bloque de Jordan asociado de orden 1. El PE x = 0 es GAE s todos los autovalores de A tienen parte real negativa. Cuando todos los los autovalores de A tienen parte real negativa, se dice que A es una matriz de estabilidad o matriz Hurwitz. La estabilidad del origen puede tambi en investigarse usando el m etodo de Lyapunov. Consideremos la candidata a funci on de Lyapunov V (x) = xt P x donde P es una matriz real sim etrica denida positiva. La derivada de V (x) sobre las trayectorias del sistema est a dada por (x) = xt P x V +x t P x = xt (P A + At P )x = xt Qx donde Q es una matriz sim etrica denida por P A + At P = Q (3.20)
Si Q es denida positiva, podemos concluir por el Teorema 3.1 que el origen es AE. En el caso de sistemas lineales, es posible revertir los pasos del m etodo de Lyapunov. Supongamos que comenzamos eligiendo Q como una matriz real sim etrica denida positiva, y resolvemos (3.20) para encontrar P . Si (3.20) tiene una soluci on denida positiva, podemos nuevamente concluir que el origen es AE. La ecuaci on (3.20) se denomina ecuaci on de Lyapunov. Teorema 3.10. Una matriz A es Hurwitz, o sea, todos sus autovalores tienen parte real negativa, s dada una matriz Q sim etrica y denida positiva, existe una matriz P sim etrica y denida positiva que satisface la ecuaci on de Lyapunov (3.20). M as a un, si A es Hurwitz, entonces P es la u nica soluci on de (3.20). Demostraci on. La suciencia sigue del Teorema 3.1 con la funci on de Lyapunov V (x) = xt P x, como ya mostramos. Para probar la necesidad, supongamos que todos los autovalores de A tienen parte real negativa y consideremos la siguiente matriz P
P =
0
eA t QeAt dt
(3.21)
El integrando es una suma de t erminos de la forma tk1 ei t con Re i < 0. Por lo tanto, la integral existe. La matriz P es sim etrica. Para probar que es denida positiva, suponemos lo contrario, es decir, que existe un vector x = 0 tal que xt P x = 0. Sin embargo,
x P x = 0 =
0 At
xt eA t QeAt xdt = 0
= e x 0 , t 0 = x = 0 porque eAt es nosingular para todo t. Esta contradicci on muestra que P es denida positiva. Sustituyendo (3.21) en (3.20) se obtiene

PA + A P =
0
At t
Qe Adt +
0
At
At eA t QeAt dt
d At t At = e Qe dt 0 t = eA t QeAt 0 = Q
3.4 Sistemas Lineales y Linealizaci on
69
lo que muestra que P es una soluci on de (3.20). Para mostrar que es la u nica soluci on, supongamos que existe otra soluci on P = P . Entonces, )A + At (P P ) = 0 (P P Premultiplicando por eA t y postmultiplicando por eAt , obtenemos 0= d At t )eAt e (P P dt
t
Por lo tanto,
t )eAt constante t eA t (P P
= P. Evaluando en t = 0 y t = obtenemos P La resoluci on de la ecuaci on de Lyapunov (3.20) no es num ericamente m as ventajosa que calcular los autovalores de A. La ventaja de este m etodo es que nos provee de una funci on de Lyapunov cuando A es Hurwitz. Esto nos va a servir para sacar conclusiones sobre el sistema cuando el lado derecho Ax est e perturbado. Volvamos al sistema no lineal (3.1) x = f (x) donde f : D Rn es una funci on continuamente diferenciable desde un dominio D Rn en n R . Supongamos que el origen x = 0 est a en el interior de D y es un PE del sistema; es decir f (0) = 0. Por el teorema del valor medio fi (x) = fi (0) + fi (zi )x x (3.22)
donde zi es un punto sobre el segmento de l nea que conecta x al origen. La igualdad (3.22) vale para todo punto x D tal que el segmento de l nea que conecta x al origen est e totalmente contenido en D. Como f (0) = 0, podemos escribir fi (x) como fi (x) = Por lo tanto f (x) = Ax + g (x) donde A= f (0) , x gi (x) = fi fi (zi ) (0) x x x fi fi fi fi (zi )x = (0)x + (zi ) (0) x x x x x
La funci on gi (x) satisface |gi (x)| fi fi (zi ) (0) x x x
Por continuidad de f /x vemos que g (x) 0 cuando x x 0
70
Esto sugiere que en un entorno peque no del origen podemos aproximar al sistema no lineal (3.1) por su linealizaci on alrededor del origen x = Ax donde A = f (0) x
El siguiente teorema, conocido como el m etodo indirecto de Lyapunov, da condiciones para determinar la estabilidad del origen del sistema no lineal, a trav es del estudio de la estabilidad del sistema linealizado. Teorema 3.11 (M etodo Indirecto de Lyapunov). Sea x = 0 un PE del sistema no lineal x = f (x) donde f : D Rn es una funci on continuamente diferenciable y D Rn es un entorno del origen. Sea A= Entonces (i) El origen es AE si todos los autovalores de A tienen parte real negativa. (ii) El origen es inestable si uno o m as autovalores de A tiene parte real positiva. Demostraci on. Para probar la primera parte, asumamos que A es Hurwitz. Por el Teorema 3.10 sabemos que dada cualquier Q > 0 sim etrica, la soluci on P de (3.20) es denida positiva. Usamos V (x) = xt P x como candidata a funci on de Lyapunov para el sistema no lineal. La derivada de V (x) sobre las trayectorias del sistema est a dada por (x) = xt P f (x) + [f (x)]t P x V = xt P [Ax + g (x)] + [xt At + g t (x)]P x = xt (P A + At P )x + 2xt P g (x) = xt Qx + 2xt P g (x) El primer t ermino en el lado derecho es denido negativo, mientras que el segundo es, en general, indenido. La funci on g (x) satisface g (x) 2 0 cuando x 2 x
2
f (x) x
x=0
Por lo tanto, dado > 0 existe r > 0 tal que g (x) Entonces (x) < xt Qx + 2 P V
2 2
< x
<r
2 2
<r
3.4 Sistemas Lineales y Linealizaci on pero xt Qx min (Q) x

2 2
71
Notar que min (Q) es real y positivo porque Q es sim etrica y denida positiva. Por lo tanto (x) < [min (Q) 2 P V
2]
2 2
<r
(x) es negativa denida. Por el Teorema 3.1, Eligiendo < min (Q)/(2 P 2 ) aseguramos que V el origen es AE. Para probar la segunda parte, consideremos primero el caso en que A no tiene autovalores en el eje imaginario, es decir A tiene un grupo de autovalores en el semiplano derecho abierto y otro grupo en el semiplano izquierdo abierto. Entonces existe una matriz no singular T tal que T AT 1 = A1 0 0 A2
donde A1 y A2 son matrices Hurwitz. Sea z = Tx = z1 z2
donde la partici on de z es compatible con las dimensiones de A1 y A2 . El cambio de variables z = T x transforma el sistema original x = f (x) = Ax + g (x) a la forma z 1 = A1 z1 + g1 (z ) z 2 = A2 z2 + g2 (z ) (3.23)
donde las funciones gi (z ) tienen la propiedad de que para todo > 0 existe r > 0 tal que gi (z )
2
< z
r , i = 1, 2
(3.24)
El origen z = 0 es un PE para el sistema en las coordenadas z . Notemos que toda propiedad de estabilidad de z = 0 se aplica directamente al PE x = 0 en las coordenadas originales ya que T es no singular. Para mostrar que el origen es inestable, vamos a usar el Teorema 3.3. La funci on V (z ) del teorema se va a construir como en el Ejemplo 3.7, s olo que ahora trabajamos con vectores en lugar de escalares. Sean Q1 y Q2 matrices sim etricas, denidas positivas, con las mismas dimensiones que A1 y A2 , respectivamente. Como A1 y A2 son Hurwitz, sabemos por el Teorema 3.10 que las ecuaciones de Lyapunov
t P i A i + At i Pi = Qi ,
i = 1, 2
(3.25)
tienen soluciones u nicas denidas positivas P1 y P2 . Sea

t t V (z ) = z1 P1 z1 z2 P2 z2 = z t
P1 0 z 0 P2
72
En el subespacio z2 = 0, V (z ) > 0 en puntos arbitrariamente cercanos al origen. Sea U = {z Rn | z

2
y V (z ) > 0}
En U , usando (3.23), (3.24) y (3.25), tenemos

t t t t t = z1 V (P1 A1 + At 1 P1 )z1 + 2z1 P1 g1 (z ) z2 (P2 A2 + A2 P2 )z2 2z2 P2 g2 (z ) t t Q2 z2 + 2z t Q1 z1 + z2 = z1
P1 g1 (z ) P2 g2 (z )
2 2
min (Q1 ) z1 2 2 + min (Q2 ) z2 > ( 2 2 ) z 2 2
2 z
P1
2 2
g1 (z )
2 2
+ P2
2 2
g2 (z )
2 2
donde = min{min (Q1 ), min (Q2 )} y = max{ P1 2 , P2 2 }. Eligiendo < /(2 2 ) nos > 0 en U . Por lo tanto, el origen es inestable por el Teorema 3.3. aseguramos que V Notar que deniendo las matrices P = Tt P1 0 T, 0 P2 Q = Tt Q1 0 T 0 Q2
que satisfacen la ecuaci on P A + At P = Q > 0 se puede probar el resultado aplicando el Teorema 3.3 en las coordenadas originales, usando el hecho de que la funci on V (x) = xt P x es positiva en puntos arbitrariamente cercanos al origen. Supongamos ahora que A tiene adem as autovalores sobre el eje imaginario. El truco para tratar este caso es trasladar el eje imaginario. Supongamos que todos los autovalores de A en el semiplano derecho abierto tienen parte real mayor que > 0. Entonces la matriz A (/2)I tiene el mismo n umero que A de autovalores en el semiplano derecho abierto, y ning un autovalor sobre el eje imaginario. Usando argumentos similares a los utilizados reci en podemos calcular matrices P = P t y Q = Qt > 0 tales que P [A (/2)I ] + [A (/2)I ]t P = Q y adem as V (x) = xt P x es positiva en puntos arbitrariamente cercanos al origen. La derivada de V (x) sobre las trayectorias del sistema satisface (x) = xt (P A + At P )x + 2xt P g (x) V = xt [P [A (/2)I ] + [A (/2)I ]t P ] x + xt P x + 2xt P g (x) = xt Qx + V (x) + 2xt P g (x) En el conjunto {x R n | x
2
y V (x) > 0}
2
donde r se elige tal que g (x) (x) min (Q) x V

2 2
< x 2, x
2
2 2
(x) satisface r, V
2)
2 P
g (x)
2 ).
(min (Q) 2 P
2 2
que es positiva para < min (Q)/(2 P origen es inestable.
Aplicando el Teorema 3.3, concluimos que el
3.5 Ejercicios Ejemplo 3.15. Consideremos el sistema escalar x = ax3 Linealizando alrededor del origen obtenemos A= f (x) x = 3ax2
x=0 x=0
73
=0
El autovalor est a sobre el eje imaginario, por lo que no podemos decir nada acerca de la estabilidad del origen como PE del sistema no lineal usando el sistema linealizado. Esta conclusi on es genuina ya que el origen puede ser AE, estable o inestable dependiendo del valor del par ametro a. Si a < 0, el origen es AE como puede probarse usando la funci on de 4 Lyapunov V (x) = x . Si a = 0, el sistema es lineal y el origen es estable. Si a > 0, el origen es inestable, como puede concluirse usando el Teorema 3.3 y la funci on V (x) = x4 , cuya derivada (x) = 4ax6 > 0 si a > 0. sobre las trayectorias del sistema es V
3.5
Ejercicios
Ejercicio 3.1 Sea el sistema escalar x = axp + g (x), donde p es un entero positivo y g (x) satisface |g (x)| k |x|p+1 en alg un entorno del origen x = 0. (i) Mostrar que el origen es AS si p es impar y a < 0. (ii) Mostrar que el origen es inestable si p es impar y a > 0 o p es par y a = 0. Ejercicio 3.2 Para cada uno de los siguientes sistemas usar una candidata a funci on de Lyapunov cuadr atica para mostrar que el origen es AS. Luego investigar si el origen es GAE. x 1 = x1 + x2 2 x 2 = x2
2 x 1 = (x1 x2 )(x2 1 + x2 1) 2 x 2 = (x1 + x2 )(x2 1 + x2 1)
(a)
(b)
x 1 = x1 + x2 1 x2 x 2 = x1 x2 x 1 = x1 x2 x 2 = x1 x3 2 Ejercicio 3.3
2 Usando V (x) = x2 1 + x2 estudiar la estabilidad del origen del sistema 2 2 2 2 x 1 = x1 (k 2 x2 1 x2 ) + x2 (x1 + x2 + k ) 2 2 2 2 x 2 = x1 (k 2 + x2 1 + x2 ) + x2 (k x1 x2 )
(c)
(d)
74 (i) Cuando k = 0. (ii) Cuando k = 0. Ejercicio 3.4
Usando el m etodo del gradiente variable, encontrar una funci on de Lyapunov V (x) para mostrar estabilidad asint otica del origen del sistema x 1 = x2 x 2 = (x1 + x2 ) sen(x1 + x2 ). Ejercicio 3.5
2 2 Sea V (x) = x2 1 /(1 + x1 ) + x2 y sea el sistema de segundo orden
6x1 + 2x2 2 (1 + x2 1) 2(x1 + x2 ) x 2 = 2 (1 + x2 1) x 1 = (x) < 0 para todo x R2 {0}. (i) Mostrar que V (x) > 0 y V (ii) Sea la hip erbola x2 = 2/(x1 2). Mostrar, investigando el campo vectorial sobre la frontera de esta hip erbola, que las trayectorias a la derecha de la rama en el primer cuadrante no pueden cruzar esa rama. (iii) Mostrar que el origen no es globalmente asint oticamente estable. Ayuda: En la parte (ii) mostrar que x 2 /x 1 = 1/(1 + 2 2x1 + 2x2 erbola, y 1 ) sobre la hip comparar con la pendiente de las tangentes a la hip erbola. Ejercicio 3.6 Sea el sistema x 1 = x2 x 2 = x1 sat(2x1 + x2 ). (i) Mostrar que el origen es asint oticamente estable. (ii) Mostrar que todas las trayectorias que comienzan a la derecha de la curva x1 x2 = c (con c > 0 sucientemente grande) no pueden alcanzar el origen. (iii) Mostrar que el origen no es GAE. (x) y mostrar que sobre la curva Ayuda: En la parte (ii) considerar V (x) = x1 x2 ; calcular V V (x) = c la derivada V (x) > 0 cuando c es sucientemente grande.
3.5 Ejercicios Ejercicio 3.7
75
M etodo de Krasovskii. Sea el sistema x = f (x) con f (0) = 0, con f (x) continuamente diferenciable y tal que el Jacobiano [f /x] satisface P f f (x) + (x) x x
T
P I,
x Rn ,
donde P = P T > 0. mostrar que
(i) Usando la representaci on f (x) =
1 f (x)x d , 0 x
xT P f (x) + f T (x)P x xT x,
x Rn .
(ii) Mostrar que V (x) = f T (x)P f (x) es denida positiva para todo x Rn . (iii) Mostrar que V (x) es radialmente no acotada. (iv) Usando V (x) como candidata a funci on de Lyapunov, mostrar que el origen es GAE. Ejercicio 3.8 Mostrar que el origen del sistema x 1 = x1 + x6 2 6 x 2 = x3 + x 2 1 es inestable. Ejercicio 3.9 Mostrar que el origen del sistema x 1 = x3 1 + x2 6 x 2 = x1 x3 2 es inestable.
2 o y Ayuda: Mostrar que el conjunto = {0 x1 1} {x2 x3 1 } {x2 x1 } es no vac positivamente invariante. Luego investigar el comportamiento de las trayectorias dentro de .
Ejercicio 3.10 Dado el sistema x 1 = x2 2 x 2 = x1 x2 sat(x2 2 x3 ) 2 x 3 = x3 sat(x2 2 x3 ) donde sat() es la funci on saturaci on, mostrar que el origen es el u nico PE y usar V (x) = xT x para mostrar que es GAE.
76 Ejercicio 3.11 Para el sistema
2 x 1 = (x1 x2 1)x3 1 + (x1 x2 1 + x2 )x1 x 2 = x2
(i) Mostrar que x = 0 es el u nico punto de equilibrio. (ii) Mostrar, por linealizaci on, que x = 0 es AE. (iii) Mostrar que = {x R2 : x1 x2 2} es positivamente invariante en el primer cuadrante. (iv) Es el equilibrio GAE? Justicar la respuesta. Ejercicio 3.12 Mostrar que el origen de x 1 = x2 x 2 = x1 + x3 1 x2 es AE y estimar la regi on de atracci on. Ejercicio 3.13 Para cada uno de los siguientes sistemas usar linealizaci on para mostrar que el origen es AE. Luego mostrar que el origen es GAE. x 1 x 2 = x1 + x2 = (x1 + x2 ) sen x1 3x2 x 1 x 2 = x3 1 + x2 = ax1 bx2 ,
a, b > 0.
Ejercicio 3.14 Mostrar que el sistema x 1 = x1 + 2 x 2 = 2x2 + x1 (3 x1 x2 ) tiene un equilibrio GAE. Ayuda: Encuentre el equilibrio y haga un cambio de coordenadas (x1 , x2 ) (y1 , y2 ) para correrlo al origen. Luego use una funci on de la forma V (y1 , y2 ) = k1
2 y1 y2 y4 + k2 2 + k3 1 2 2 4
para mostrar que el origen es GAE en las coordenadas (y1 , y2 ).
Cap tulo 4 Estabilidad Seg un Lyapunov. Sistemas Inestacionarios

Este cap tulo extiende el m etodo de Lyapunov a sistemas no lineales inestacionarios. Denimos los conceptos de estabilidad uniforme, estabilidad asint otica uniforme, y estabilidad exponencial de un punto de equilibrio, y damos sus teoremas correspondientes. Presentamos adem as teoremas conversos, que establecen la existencia de funciones de Lyapunov para clases de sistemas no lineales. Finalmente, extendemos el principio de invariancia de LaSalle a sistemas inestacionarios.
4.1
El Teorema de Estabilidad de Lyapunov

x = f (t, x) (4.1)
Consideremos el sistema inestacionario
donde f : [0, ) D Rn es seccionalmente continua en t y localmente Lipschitz en x en [0, ) D, y D Rn es un dominio que contiene al origen x = 0. El origen es un PE de (4.1) para t = 0 si f (t, 0) = 0 , t 0
Un equilibrio en el origen puede ser la translaci on de un PE que no est a en cero o, m as generalmente, la translaci on de una soluci on no nula del sistema. Para ver este u ltimo punto, supongamos que y ( ) es una soluci on del sistema dy = g (, y ) d denida para todo a. El cambio de variables x=yy ( ) ; t= a
transforma al sistema en la forma (t + a) x = g (t + a, x + y (t + a)) y Como (t + a) = g (t + a, y y (t + a)) , t 0 f (t, x)
78
Estabilidad Seg un Lyapunov. Sistemas Inestacionarios
el origen x = 0 es un PE del sistema transformado para t = 0. Por lo tanto, examinando la estabilidad del origen como un PE del sistema transformado, determinamos la estabilidad de la soluci on y ( ) del sistema original. Notar que si y ( ) no es constante, el sistema transformado es inestacionario aunque el sistema original sea estacionario. Por lo tanto, el estudio de estabilidad de soluciones en el sentido de Lyapunov s olo puede hacerse mediante el estudio de la estabilidad de equilibrios de sistemas inestacionarios. Antes de denir estabilidad para el sistema (4.1), veamos un par de ejemplos. Ejemplo 4.1 (Estabilidad no uniforme en t). El sistema lineal de primer orden x = (6t sen t 2t)x tiene como soluci on
t
x(t) = x(t0 ) exp

t0
(6t sen 2 )d
= x(t0 ) exp 6 sen t 6t cos t t2 6 sen t0 + 6t0 cos t0 + t2 0 Para cualquier t0 , el t ermino t2 va a dominar, lo que muestra que la exponencial est a acotada para todo t t0 por una constante c(t0 ) dependiente de t0 . Por lo tanto |x(t)| < |x(t0 )|c(t0 ) , t t0
Para cualquier > 0, la elecci on = /c(t0 ) muestra que el origen es estable. Supongamos ahora que t0 toma sucesivamente los valores t0 = 2n con n = 0, 1, . . . , y supongamos que x(t) es evaluada segundos m as tarde en cada caso. Tenemos x(t0 + ) = x(t0 ) exp[(4n + 1)(6 ) ] Esto implica que, para x(t0 ) = 0, x(t0 + ) cuando n x(t0 ) Por lo tanto, dado > 0, no existe independiente de t0 tal que la propiedad de estabilidad valga uniformemente en t0 . Ejemplo 4.2 (Estabilidad asint otica no uniforme). El sistema lineal de primer orden x x = 1+t tiene como soluci on
t
x(t) = x(t0 ) exp

t0
1 d 1+
1 + t0 = x(t0 ) 1+t Como |x(t)| |x(t0 )| para todo t t0 , el origen es estable; es m as, dado > 0 podemos elegir independiente de t0 . Tambi en es claro que x(t) 0 cuando t Es decir, dado > 0, existe T ( , t0 ) tal que |x(t)| < para todo t t0 + T . Por lo tanto, de acuerdo a la Denici on 3.1, el origen es AE. Notemos, sin embargo, que la convergencia de x(t) al origen no es uniforme con respecto a t0 porque T no puede elegirse independiente de t0 .
79
Nos va a interesar entonces denir estabilidad del origen como una propiedad uniforme con respecto al instante inicial. Denici on 4.1 (Estabilidad Uniforme). El PE x = 0 de (4.1) es estable, si para cada > 0 existe = ( , t0 ) > 0 tal que x(t0 ) < = x(t) < , t t0 (4.2)
uniformemente estable, si para cada que (4.2) se satisface. inestable, si no es estable.
> 0 existe = ( ) > 0, independiente de t0 , tal
asint oticamente estable, si es estable y existe c = c(t0 ) tal que x(t) 0 cuando t , para todo x(t0 ) < c. uniformemente asint oticamente estable, si es uniformemente estable y existe c > 0 independiente de t0 tal que para todo x(t0 ) < c, x(t) 0 cuando t , uniformemente en t0 ; es decir, para cada > 0 existe T = T ( ) tal que x(t) < , t t0 + T ( ) , x(t0 ) < c
globalmente uniformemente asint oticamente estable, si es uniformemente estable y para cada par de n umeros positivos y c, existe T = T ( , c) tal que x(t) < , t t0 + T ( , c) , x(t0 ) < c Podemos caracterizar las propiedades introducidas en Denici on 4.1 en t erminos de un tipo especial de funciones escalares, conocidas como funciones clase K y clase KL. Denici on 4.2 (Funci on de Clase K). Una funci on continua : [0, a) [0, ) pertenece a la clase K si es estrictamente creciente y (0) = 0. Se dice que pertenece a la clase K si a = y (r) cuando r . Denici on 4.3 (Funci on de Clase KL). Una funci on continua : [0, a) [0, ) [0, ) pertenece a la clase KL si, para cada s jo, el mapeo (r, s) es clase K con respecto a r, y, para cada r jo, el mapeo (r, s) es decreciente con respecto a s y (r, s) 0 cuando s . Ejemplo 4.3 (Funciones clase K y KL). (r) = arctan r es clase K pero no K .
(r) = rc con c cualquier n umero real positivo, es clase K . (r, s) = r/(ksr + 1), con k cualquier n umero real positivo, es clase KL. (r, s) = rc es , con c cualquier n umero real positivo, es clase KL. Lema 4.1. [Propiedades de funciones clase K y KL] Sean 1 () y 2 () funciones clase K en 1 [0, a), 3 () y 4 () funciones clase K , y (, ) una funci on clase KL. Denotemos i () a la inversa de i (). Entonces
80

1 1 est a denida en [0, 1 (a)) y es clase K. 1 3 est a denida en [0, ) y es clase K .
1 2 es clase K. 3 4 es clase K . (r, s) = 1 ( (2 (r), s)) es clase KL. El siguiente lema da deniciones equivalentes para estabilidad uniforme y EA uniforme usando funciones clase K y KL. Lema 4.2 (Estabilidad uniforme y funciones clase K y KL). El PE x = 0 de (4.1) es uniformemente estable s existe una funci on () clase K y una constante positiva c, independiente de t0 , tal que x(t) ( x(t0 ) ) , t t0 0 , x(t0 ) < c (4.3)
uniformemente asint oticamente estable s existe una funci on (, ) clase KL y una constante positiva c, independiente de t0 , tal que x(t) ( x(t0 ) , t t0 ) , t t0 0 , x(t0 ) < c (4.4)
globalmente uniformemente asint oticamente estable s (4.4) se satisface para cualquier estado inicial x(t0 ). Para sistemas estacionarios, estabilidad y EA seg un la Denici on 3.1 implican la existencia de funciones clase K y KL que satisfacen (4.3) y (4.4). Esto es porque para sistemas estacionarios, la estabilidad y EA del origen son uniformes con respecto al instante inicial. Un caso especial de estabilidad asint otica uniforme ocurre cuando la funci on en (4.4) s tiene la forma (r, s) = kre . Denici on 4.4 (Estabilidad Exponencial). El PE x = 0 de (4.1) es exponencialmente estable si la desigualdad (4.4) se satisface con (r, s) = kres , k > 0, > 0
y es globalmente exponencialmente estable si esta condici on se satisface para cualquier estado inicial. Una funci on denida positiva puede acotarse con funciones clase K, como lo muestra el siguiente lema. Lema 4.3 (Signo denido y funciones clase K). Sea V (x) : D R una funci on continua n denida positiva, denida en un dominio D R que contiene al origen. Sea Br D para alg un r > 0. Entonces existen 1 y 2 , funciones clase K denidas en [0, r), tal que 1 ( x ) V (x) 2 ( x ) para todo x Br . M as a un, si D = Rn y V (x) es radialmente no acotada, entonces 1 y 2 pueden elegirse clase K y la desigualdad anterior vale para todo x Rn .
4.1 El Teorema de Estabilidad de Lyapunov Demostraci on. Denamos (s) como (s) =
s x r
81
inf
V (x) para 0 s r
La funci on (s) es continua, denida positiva, y creciente. M as a un, V (x) ( x ) para 0 x r. Como () no es necesariamente estrictamente creciente, denimos una funci on 1 (s) clase K tal que 1 (s) k (s) con 0 < k < 1. Entonces, V (x) ( x ) 1 ( x ) para Por otro lado, denamos (s) como (s) = sup V (x) para 0 s r
x s
x r
La funci on (s) es continua, denida positiva, y creciente (no necesariamente estrictamente creciente). M as a un, V (x) ( x ) para x r. Sea 2 (s) una funci on clase K tal que 2 (s) k(s) con k > 1. Entonces, V (x) ( x ) 2 ( x ) para x r
Si V (x) es radialmente no acotada, entonces existen constantes positivas c y r1 tales que V (x) c para todo x > r1 . Las deniciones de (s) y (s) son ahora (s) = inf V (x) ,
x s
(s) = sup V (x) ,

x s
para s 0
Estas funciones son continuas, denidas positivas, crecientes, y tienden a innito cuando s . Por lo tanto, las funciones 1 y 2 pueden elegirse clase K . Si V (x) = xt P x es una funci on denida positiva cuadr atica, el lema anterior sigue de las desigualdades min (P ) x
2 2
xt P x max (P ) x
2 2
Vamos a ver ahora el m etodo de Lyapunov para demostrar estabilidad asint otica uniforme para sistemas inestacionarios. Este m etodo da condiciones sucientes para que la desigualdad (4.4) se satisfaga. La funci on (, ) de clase KL en dicha desigualdad resultar a de la soluci on de una ecuaci on diferencial escalar aut onoma, cuyas propiedades se dan en el siguiente resultado. Lema 4.4. Consideremos la ecuaci on diferencial escalar y = (y ) , y (t0 ) = y0
donde () es una funci on localmente Lipschitz y clase K denida en [0, a). Para toda 0 y0 < a, esta ecuaci on tiene una u nica soluci on y (t) denida para todo t t0 . M as a un, y (t) = (y0 , t t0 ) donde (r, s) es una funci on clase KL denida en [0, a) [0, ). Dos simples ejemplos del Lema 4.4 son:
82
(i) y = k y , k > 0, cuya soluci on es y (t) = y0 ek(tt0 ) = (r, s) = reks
(ii) y = k y 2 , k > 0, cuya soluci on es y (t) = y0 ky0 (t t0 ) + 1 = (r, s) = r krs + 1
El siguiente es el teorema principal de esta secci on. Teorema 4.5 (Estabilidad Asint otica Uniforme). Sea x = 0 un PE de (4.1) y sea D Rn un dominio que contiene al origen. Sea V : [0, ) D R una funci on continuamente diferenciable tal que W1 (x) V (t, x) W2 (x) V V + f (t, x) W3 (x) t x (4.5) (4.6)
t 0, x D, donde Wi (x) son funciones continuas denidas positivas en D. Entonces x = 0 es uniformemente AE. Demostraci on. La derivada de V sobre las trayectorias de (4.1) satisface (t, x) = V + V f (t, x) W3 (x) V t x Elijamos r > 0 y > 0 tales que Br D y < min x =r W1 (x). Entonces el conjunto {x Br | W1 (x) } est a en el interior de Br . Denamos el conjunto variante en el tiempo t, = {x Br | V (t, x) } El conjunto t, contiene al conjunto {x Br | W2 (x) } ya que W2 (x) = V (t, x) Por otro lado, t, es un subconjunto de {x Br | W1 (x) } ya que V (t, x) = W1 (x) Por lo tanto {x Br | W2 (x) } t, {x Br | W1 (x) } Br D para todo t 0. Para cualquier t0 0 y cualquier x0 t0 , , la soluci on que comienza en (t0 , x0 ) permanece en t, para todo t t0 . Esto es porque V (t, x) es negativa en D {0} y por lo tanto V (t, x) es decreciente. Entonces la soluci on que comienza en (t0 , x0 ) est a denida para todo t t0 y x(t) Br . En el resto de la demostraci on vamos a asumir que x0 {x Br | W2 (x) }. Por el Lema 4.3, existen funciones 1 , 2 y 3 clase K, denidas en [0, r], tales que W1 (x) 1 ( x ) , W2 (x) 2 ( x ) , W3 (x) 3 ( x )
4.1 El Teorema de Estabilidad de Lyapunov satisfacen las desigualdades Por lo tanto, V y V 1 ( x ) V (t, x) 2 ( x ) (t, x) 3 ( x ) V Entonces
1 3 ( x ) 3 (2 V (V ))
83
(V )
La funci on () es clase K denida en [0, r] (ver Lema 4.1). Supongamos (sin p erdida de generalidad) que () es localmente Lipschitz. Sea y (t) la soluci on de la ecuaci on diferencial y = (y ) , y (t0 ) = V (t0 , x(t0 )) 0
Por el Lema 2.11 (principio de comparaci on) V (t, x(t)) y (t) , t t0
Por el Lema 4.4, existe una funci on (r, s) de clase KL denida en [0, r) [0, ) tal que V (t, x(t)) (V (t0 , x(t0 )), t t0 ) V (t0 , x(t0 )) [0, ]
Por lo tanto, toda soluci on que comienza en t0 , , satisface la desigualdad

1 1 x(t) 1 (V (t, x(t))) 1 ( (V (t0 , x(t0 )), t t0 )) 1 1 ( (2 ( x(t0 ) ), t t0 ))
( x(t0 ) , t t0 )
Por el Lema 4.1, la funci on (, ) es clase KL. Por lo tanto, la desigualdad (4.4) se satisface para toda x(t0 ) {x Br | W2 (x) }, lo que implica que x = 0 es uniformemente asint oticamente estable. Una funci on V (t, x) que satisface la desigualdad (4.5) se denomina denida positiva ; una funci on V (t, x) que satisface la desigualdad (4.6) se denomina decreciente. Una funci on V (t, x) que satisface (4.5) y (4.6) se denomina funci on de Lyapunov. En la prueba del Teorema 4.5 se da una estima de la regi on de atracci on del origen a trav es del conjunto {x Br | W2 (x) } Esta estima nos permite obtener una versi on global del Teorema 4.5. Corolario 4.6 (Estabilidad Asint otica Uniforme Global). Supongamos que las condiciones del Teorema 4.5 se satisfacen para todo x Rn y W1 (x) es radialmente no acotada. Entonces x = 0 es globalmente uniformemente AE. El siguiente corolario da la versi on para estabilidad exponencial. Corolario 4.7 (Estabilidad Exponencial Uniforme). Supongamos que las condiciones del Teorema 4.5 se satisfacen con W1 (x) k1 x
c
W2 (x) k2 x
W3 (x) k3 x
para ciertas constantes positivas k1 , k2 , k3 y c. Entonces x = 0 es exponencialmente estable. M as a un, si las condiciones valen globalmente, entonces x = 0 es globalmente exponencialmente estable.
84
satisfacen las desigualdades Demostraci on. V y V V (t, x) k2 x c , (t, x) k3 x c k3 V (t, x) . V k2 k1 x Por el principio de comparaci on (Lema 2.11), V (t, x(t)) V (t0 , x(t0 ))e(k3 /k2 )(tt0 ) Por lo tanto, V (t, x(t)) x(t) k1
1/c c
V (t0 , x(t0 ))e(k3 /k2 )(tt0 ) k1

1/c
1/c
k2 x(t0 ) c e(k3 /k2 )(tt0 ) k1
k2 k1
1/c
x(t0 ) e(k3 /k2 )(tt0 )
La cota de arriba muestra que el origen es exponencialmente estable. Si todas las hip otesis valen globalmente, la desigualdad vale para todo x(t0 ) Rn . Ejemplo 4.4 (Sistema globalmente exponencialmente estable). Consideremos el sistema x 1 = x1 g (t) x2 x 2 = x1 x2 donde g (t) es continuamente diferenciable y satisface 0 g (t) k , g (t) g (t) , t 0
2 Tomemos V (t, x) = x2 on de Lyapunov. Es f acil de ver 1 + [1 + g (t)] x2 como candidata a funci que 2 2 2 2 x2 1 + x2 V (t, x) x1 + (1 + k ) x2 , x R
Por lo tanto, V (t, x) es denida positiva, decreciente, y radialmente no acotada. La derivada de V sobre las trayectorias del sistema est a dada por (t, x) = 2x2 + 2x1 x2 [2 + 2g (t) g V (t)]x2 1 2 Usando la desigualdad 2 + 2g (t) g (t) 2 + 2g (t) g (t) 2 obtenemos x1 2 (t, x) 2x2 V 1 + 2x1 x2 2x2 = x2
t
2 1 1 2
x1 x2
xt Qx
(t, x) es denida negativa. Todas las condiciones donde Q es denida positiva; por lo tanto V del Teorema 4.5 se satisfacen globalmente con funciones cuadr aticas W1 , W2 y W3 denidas positivas. Por el Corolario 4.7, concluimos que el origen es globalmente exponencialmente estable.
4.1 El Teorema de Estabilidad de Lyapunov Ejemplo 4.5 (Sistema lineal inestacionario). El sistema lineal no estacionario x = A(t)x
85
(4.7)
tiene un PE en x = 0. Sea A(t) continua para todo t 0. Supongamos que existe una matriz P (t) sim etrica, , acotada y denida positiva, es decir, 0 c1 I P (t) c2 I , t 0
Supongamos adem as que P (t) es continuamente diferenciable y satisface la ecuaci on diferencial matricial (t) = P (t)A(t) + At (t)P (t) + Q(t) P donde Q(t) es continua, sim etrica y denida positiva; es decir, Q(t) c3 I > 0 , t 0 (4.8)
Consideremos la candidata a funci on de Lyapunov V (t, x) = xt P (t)x La funci on V (t, x) es denida positiva, decreciente y radialmente no acotada, ya que c1 x
2 2
V (t, x) c2 x
2 2
La derivada de V sobre las trayectorias del sistema (4.7) est a dada por (t, x) = xt P (t)x + xt P (t)x V +x t P (t)x (t) + P (t)A(t) + At (t)P (t)]x = x t [P = xt Q(t)x c3 x 2 2 (t, x) es denida negativa. Todas las condiciones del Corolario 4.7 se satisfacen Por lo tanto, V globalmente con c=2. Concluimos que el origen es globalmente exponencialmente estable. Si la matriz Q(t) se elige tambi en acotada, adem as de denida positiva, es decir 0 < c3 I Q(t) c4 I , t 0
y si A(t) es continua y acotada, entonces puede probarse que cuando el origen es uniformemente asint oticamente estable, existe una soluci on de (4.8) con las propiedades requeridas, como lo muestra el siguiente resultado. Teorema 4.8. Sea x = 0 un PE uniformemente asint oticamente estable de (4.7). Supongamos que A(t) es continua y acotada. Sea Q(t) una matriz continua, acotada, sim etrica y denida positiva. Entonces, existe una matriz P (t) continuamente diferenciable, sim etrica, acotada y t denida positiva, que satisface (4.8), y V (t, x) = x P (t)x es una funci on de Lyapunov para el sistema (4.7) que satisface las condiciones del Teorema 4.5.
86
4.2
Teoremas Conversos
El Teorema 4.5 y sus corolarios establecen estabilidad asint otica uniforme (o estabilidad exponencial) del origen requiriendo la existencia de una funci on de Lyapunov que satisfaga ciertas condiciones. Aqu cabe preguntarnos: existe una funci on que satisfaga las condiciones del teorema?, c omo la encontramos si existe? Los teoremas conversos dan una respuesta armativa a la primera pregunta. Para responder a la segunda pregunta vamos a ver m as adelante que ser a necesario especializar el an alisis a ciertas clases de sistemas no lineales. Teorema 4.9. Sea x = 0 un PE del sistema no lineal x = f (t, x) donde f : [0, ) D Rn es continuamente diferenciable, D = {x Rn | x < r}, y la matriz Jacobiana f /x es acotada en D, uniformemente en t. Sean k, y r0 constantes positivas con r0 < r/k . Sea D0 = {x Rn | x < r0 }. Supongamos que las trayectorias del sistema satisfacen x(t) k x(t0 ) e (tt0 ) , x(t0 ) D0 , t t0 0
Entonces existe una funci on V : [0, ) D0 R que satisface las desigualdades c1 x 2 V (t, x) c2 x 2 V V + f (t, x) c3 x t x V c4 x x (4.9)
2
(4.10) (4.11)
para ciertas constantes positivas c1 , c2 , c3 y c4 . M as a un, si r = y el origen es globalmente exponencialmente estable, entonces V (t, x) est a denida y satisface las desigualdades de arriba en todo Rn . Si el sistema es estacionario, V puede elegirse independiente de t. Demostraci on. Debido a la equivalencia de normas, es suciente probar el teorema para la norma 2. Sea (, t, x) la soluci on del sistema que comienza en (t, x); es decir, (t, t, x) = x. Para todo x D0 , (, t, x) D para todo t. Sea
t+T
V (t, x) =
t
t (, t, x)(, t, x)d
donde T es una constante positiva que se va a elegir despu es. Dada la cota exponencial decreciente de las trayectorias, tenemos
t+T
V (t, x) =
t t+T
(, t, x) 2 2 d k 2 e2 ( t) d x
t 2 2
k2 (1 e2T ) x 2
2 2
(4.12)
Por otro lado, la matriz Jacobiana f /x es acotada en D. Sea f (t, x) x L,

2
xD
(4.13)
4.2 Teoremas Conversos
87
La funci on f (t, x) es Lipschitz en D con constante de Lipschitz L. Por lo tanto, la soluci on (, t, x) tiene la cota inferior (ver Ejercicio 2.7) (, t, x) Entonces,
t+T 2 2 2L( t) x 2 2e
V (t, x)
t
e2L( t) d x
2 2
1 (1 e2LT ) x 2L
2 2
(4.14)
Combinando (4.12) y (4.14) vemos que V (t, x) satisface (4.9) con c1 = 1 e2LT 2L y c2 = k 2 (1 e2T ) 2
Para calcular la derivada de V sobre las trayectorias del sistema, denamos las funciones de sensibilidad t (, t, x) = Entonces, V V + f (t, x) =t (t + T, t, x)(t + T, t, x) t (t, t, x)(t, t, x) t x
t+T t+T
(, t, x) ; t
x (, t, x) =
(, t, x) ; x
+
t t
2 (, t, x)t (, t, x)d +
t 2 2 t+T
2t (, t, x)x (, t, x)d f (t, x)
= (t + T, t, x)(t + T, t, x) x +
t
2t (, t, x)[t (, t, x) + x (, t, x) f (t, x)]d
Es f acil de probar (ver Ejercicio 2.12) que t (, t, x) + x (, t, x) f (t, x) 0 , Por lo tanto V V + f (t, x) = t (t + T, t, x)(t + T, t, x) x t x (1 k 2 e2T ) x 2 2
2 2
Eligiendo T = ln(2k 2 )/(2 ), la desigualdad (4.10) se satisface con c3 = 1/2. Para probar la desigualdad (4.11), notemos que x (, t, x) satisface la ecuaci on de sensibilidad f x = (, (, t, x))x , x x (t, t, x) = I
Por la condici on (4.13), x satisface la cota (ver Ejercicio 2.7) x (, t, x)

2
eL( t)
88 Por lo tanto, V (t, x) x

t+T
=
2 t t+T
2t (, t, x)x (, t, x)d
2
t t+T
2 t (, t, x)
x (, t, x) 2 d
2
2ke ( t) eL( t) d x 2k [1 e( L)T ) ] x L

2
Vemos que la desigualdad (4.11) se satisface con c4 = 2k [1 e( L)T ) ]/( L). Si todas las hip otesis valen globalmente, entonces r0 puede tomarse arbitrariamente grande. Si el sistema es aut onomo, (, t, x) depende s olo de t; es decir (, t, x) = ( t, x). Entonces
t+T T
V (t, x) =
t
t ( t, x) ( t, x)d =
0
t (s, x) (s, x)ds
que es independiente de t. El siguiente teorema vincula la estabilidad exponencial del origen del sistema no lineal con la estabilidad exponencial de su linealizaci on alrededor del origen. Teorema 4.10. Sea x = 0 un PE del sistema no lineal x = f (t, x) donde f : [0, ) D Rn es continuamente diferenciable, D = {x Rn | x matriz Jacobiana f /x es acotada y Lipschitz en D, uniformemente en t. Sea A(t) = f (t, x) x
2
< r}, y la
x=0
Entonces el origen es un PE exponencialmente estable del sistema no lineal s es un PE exponencialmente estable para el sistema lineal x = A(t)x Demostraci on. Como la matriz Jacobiana f /x es acotada y Lipschitz en D, uniformemente en t, tenemos que fi fi (t, x1 ) (t, x2 ) x x L1 x 1 x 2
2 2
x1 , x 2 D , t 0
para todo 1 i n. Por el teorema del valor medio fi (t, x) = fi (t, 0) + fi (t, zi )x x
donde zi es un punto en el segmento que conecta x al origen. Como f (t, 0) = 0 (porque el origen es un PE), podemos escribir fi (t, x) = fi fi fi fi (t, zi )x = (t, 0)x + (t, zi ) (t, 0) x x x x x
4.2 Teoremas Conversos Por lo tanto f (t, x) = A(t)x + g (t, x) donde A(t) = f (t, 0) x y gi (t, x) = fi fi (t, zi ) (t, 0) x x x
89
La funci on g (t, x) satisface

n
g (t, x)
i=1
fi fi (t, zi ) (t, 0) x x
2 2
1/2
L x
2 2
donde L = nL1 . Ahora supongamos que el origen es un PE exponencialmente estable del sistema lineal y A(t) es continua y acotada. Entonces el Teorema 4.8 garantiza la existencia de una matriz P (t) continuamente diferenciable, sim etrica, acotada y denida positiva, que satisface (4.8), donde Q(t) es continua, acotada, sim etrica y denida positiva. Vamos a usar V (t, x) = xt P (t)x como candidata a funci on de Lyapunov para el sistema no lineal. La derivada de V (t, x) sobre las trayectorias del sistema satisface (t, x) = xt P (t)f (t, x) + f t (t, x)P (t)x + xt P (t)x V (t)]x + 2xt P (t)g (t, x) = xt [P (t)A(t) + At (t)P (t) + P = xt Q(t)x + 2xt P (t)g (t, x) 3 c3 x 2 2 + 2c2 L x 2 x (c3 2c2 L) x 2 2,
<
(t, x) es denida negativa en x 2 < . Eligiendo < min{r, c3 /(2c2 L)} nos aseguramos que V Vemos que todas las condiciones del Corolario 4.7 se satisfacen en x 2 < , por lo tanto el origen es exponencialmente estable. Supongamos ahora que el origen es un PE exponencialmente estable del sistema no lineal. Entonces existen constantes k , y c tales que x(t)
2
k x(0)
e (tt0 ) ,
t t0 0 ,
x(0)
<c
Eligiendo r0 < min{c, r/k }, todas las condiciones del Teorema 4.9 se satisfacen. Sea V (t, x) la funci on de Lyapunov dada por el Teorema 4.9, la que tomamos como candidata a funci on de Lyapunov para el sistema lineal x = A(t)x = f (t, x) [f (t, x) A(t)x] = f (t, x) g (t, x) Entonces V V V V V + A(t)x = + f (t, x) g (t, x) t x t x x 3 c3 x 2 2 + c4 L x 2 (c3 c4 L) x 2 x 2< 2, (t, x) denida negativa en x 2 < . Entonces Eligiendo < min{r0 , c3 /(c4 L)}, resulta V todas las condiciones del Corolario 4.7 se satisfacen en x 2 < , por lo tanto el origen es un PE exponencialmente estable para el sistema lineal.
90
Ejemplo 4.6. Consideremos el sistema de primer orden x = x3 Vimos en el Ejemplo 3.15 que el origen es AE, pero la linealizaci on alrededor del origen es x = 0 cuya matriz A no es Hurwitz. Usando el Teorema 4.10, concluimos que el origen no es exponencialmente estable. El siguiente teorema es un teorema converso para estabilidad asint otica uniforme. Teorema 4.11. Sea x = 0 un PE del sistema no lineal x = f (t, x) donde f : [0, ) D Rn es continuamente diferenciable, D = {x Rn | x < r}, y la matriz Jacobiana f /x es acotada en D, uniformemente en t. Sea (, ) una funci on clase KL y r0 una constante positiva tal que (r0 , 0) < r. Sea D0 = {x Rn | x < r0 }. Supongamos que las trayectorias del sistema satisfacen x(t) ( x(t0 ) , t t0 ) , x(t0 ) D0 , t t0 0
Entonces existe una funci on V : [0, ) D0 R que satisface las desigualdades 1 ( x ) V (t, x) 2 ( x ) V V + f (t, x) 3 ( x ) t x V 4 ( x ) x
(4.15)
donde 1 (), 2 (), 3 () y 4 () son funciones clase K denidas en [0, r0 ]. Si el sistema es estacionario, V puede elegirse independiente de t.
4.3
Teoremas de Invariancia
Para sistemas estacionarios, el teorema de invariancia de LaSalle muestra que las trayectorias del sistema tienden al m aximo conjunto invariante contenido en el conjunto E = {x : (x) = 0}. En el caso de sistemas inestacionarios, no est V a claro, en principio, como denir el conjunto E , ya que V (t, x) es funci on tanto del tiempo como del estado. La situaci on se simplica si se puede probar que (t, x) W (x) 0 V porque entonces E puede denirse como el conjunto de puntos donde W (x) = 0. Ser a de esperar que las trayectorias del sistema tiendan a E cuando t tiende a innito. Ese es precisamente el resultado del siguiente teorema, que enunciamos despu es de un Lema preliminar. Lema 4.12 (Lema de Barbalat). Sea : R R una funci on uniformemente continua en t [0, ). Supongamos que limt 0 ( ) d existe y es nito. Entonces (t) 0 , cuando t
4.3 Teoremas de Invariancia
91
Demostraci on. Supongamos que no es cierto, entonces existe una constante positiva k1 tal que para todo T > 0 se puede encontrar T1 T tal que |(T1 )| k1 . Como (t) es uniformemente continua, existe una constante positiva k2 tal que |(t + ) (t)| < k1 /2 para todo t 0 y todo 0 k2 . Entonces |(t)| = |(t) (T1 ) + (T1 )| |(T1 )| + |(t) (T1 )| > k1 k1 /2 = k1 /2 , t [T1 , T1 + k2 ] Por lo tanto
T1 +k2 T1 +k2
(t) dt =
T1 T1
|(t)| dt > k1 k2 /2
donde la igualdad es v alida porque (t) conserva el signo para t [T1 , T1 + k2 ]. Por lo tanto la t integral 0 ( ) d no puede tener un l mite nito cuando t , lo cual es una contradicci on. Teorema 4.13 (Principio de invariancia para sistemas inestacionarios). Sea D = {x Rn | x < r} y supongamos que f (t, x) es seccionalmente continua en t y localmente Lipschitz en x, uniformemente en t, en [0, ) D. Sea V : [0, ) D R una funci on continuamente diferenciable tal que W1 (x) V (t, x) W2 (x) (t, x) = V + V f (t, x) W (x) V t x
(4.16)
t 0, x D, donde W1 (x) y W2 (x) son funciones continuas denidas positivas y W (x) es una funci on continua y semidenida positiva en D. Sea < min x =r W1 (x). Entonces todas las soluciones de x = f (t, x) con x(t0 ) {x Br | W2 (x) } son acotadas y satisfacen W (x(t)) 0 , cuando t
M as a un, si todas las hip otesis valen globalmente y W1 (x) es radialmente no acotada, el resultado vale para toda x(t0 ) Rn . Demostraci on. Como en la demostraci on del Teorema 4.5, se puede probar que x(t0 ) {x Br | W2 (x) } = x(t) t, , t t0
(t, x) 0. Por lo tanto, x(t) < r para todo t t0 . Como V (t, x(t)) es ya que V monot onicamente no creciente y acotada por abajo por cero, tiene l mite nito cuando t . De (4.16) tenemos
t t
W (x( ))d
t0 t t0
(, x( ))d = V (t0 , x(t0 )) V (t, x(t)) V
Por lo tanto, limt t0 W (x( ))d existe y es nito. Como x(t) < r para todo t t0 y f (t, x) es localmente Lipschitz en x, uniformemente en t, concluimos que x(t) es uniformemente continua en t en [t0 , ). En consecuencia, W (x(t)) es uniformemente continua en t en [t0 , ) ya que W (x) es uniformemente continua en x en el conjunto compacto Br . Por el Lema de Barbalat concluimos que W (x(t)) 0 cuando t . Si todas las hip otesis valen globalmente y W1 (x) es radialmente no acotada, entonces para cada x(t0 ) podemos elegir lo sucientemente grande tal que x(t0 ) {x Rn | W2 (x) }.
92
Estabilidad Seg un Lyapunov. Sistemas Inestacionarios El l mite W (x(t)) 0 implica que x(t) tiende a E cuando t , donde E = {x D | W (x) = 0}
Por lo tanto, el conjunto l mite positivo de x(t) es un subconjunto de E . Esta conclusi on (de que x(t) tiende a E ) es mucho m as d ebil que el principio de invariancia de LaSalle para sistemas estacionarios, que concluye que x(t) tiende al mayor conjunto invariante contenido en E . Esta conclusi on m as fuerte para sistemas estacionarios es consecuencia de la propiedad de estos sistemas enunciada en el Lema 3.4, que dice que el conjunto l mite positivo es un conjunto invariante. Existen algunos casos especiales de sistemas inestacionarios para los cuales el conjunto l mite positivo tiene una cierta propiedad de invariancia. Sin embargo, para un sistema inestacionario gen erico, el conjunto l mite positivo no es invariante. El hecho de que, para sistemas estacionarios, x(t) tiende al mayor conjunto invariante contenido en E , nos permiti o llegar al Corolario 3.6, que prueba estabilidad asint otica del origen mostrando que el conjunto E no contiene ninguna trayectoria completa del sistema salvo la soluci on trivial. Para sistemas inestacionarios no existe una extensi on del Corolario 3.6 que permita demostrar estabilidad asint otica. (t, x) 0, la integral de V (t, x) satisface cierta Sin embargo, si adem as de satisfacer V desigualdad, se puede concluir estabilidad asint otica, como establece el siguiente teorema. (t, x) semidenida positiva). Sea D = Teorema 4.14 (Estabilidad asint otica con V n {x R : x < r} y supongamos que f (t, x) es seccionalmente continua en t y localmente Lipschitz en x sobre [0, ) D. Sea x = 0 un punto de equilibrio de x = f (t, x) en t = 0. Sea V : [0, ) D R una funci on continuamente diferenciable que satisface W1 (x) V (t, x) W2 (x) (t, x) = V + V f (t, x) 0 V t x
t+
(, (, t, x)) d V (t, x), V

t
0<<1
para todo t 0 y x D para alg un > 0, donde W1 (x) y W2 (x) son funciones denidas positivas en D, y (, t, x) es la soluci on del sistema que comienza en (t, x). Entonces, el origen es uniformemente asint oticamente estable. Si todas las condiciones valen globalmente y W1 (x) es radialmente no acotada, entonces el origen es globalmente uniformemente asint oticamente estable. Si W1 (x) k1 x c , W2 (x) k2 x c , k1 > 0, k2 > 0, c > 0,
entonces el origen es exponencialmente estable. Demostraci on. Como en la demostraci on del Teorema 4.5, se puede probar que x(t0 ) {x Br | W2 (x) } donde < min
x =r
x(t) t, ,
t t0
(t, x) 0. Adem W1 (x), ya que V as, para todo t t0 , tenemos

t+
V (t + , x(t + )) = V (t, x(t)) +

t
(, (, t, x)) d V
(1 )V (t, x(t))
4.3 Teoremas de Invariancia (t, x) 0 M as a un, como V V (, x( )) V (t, x(t)) , [t, t + ]
93
Para cualquier t t0 , sea N el menor n umero natural tal que t t0 + N . Dividamos el intervalo [t0 , t0 + (N 1) ] en N 1 subintervalos iguales de longitud . Entonces, V (t, x(t)) V (t0 + (N 1), x(t0 + (N 1) )) (1 )V (t0 + (N 2), x(t0 + (N 2) )) . . . (1 )N 1 V (t0 , x(t0 )) 1 (1 )(tt0 )/ V (t0 , x(t0 )) 1 1 b(tt0 ) = e V (t0 , x(t0 )) 1 donde b = (1/ ) ln(1/(1 )). Tomando (r, s) = r bs e 1
puede verse f acilmente que (r, s) es una funci on clase KL y que V (t, x(t)) satisface V (t, x(t)) (V (t0 , x(t0 )), t t0 ) , V (t0 , x(t0 )) [0, ]
Desde aqu la prueba es id entica a la del Teorema 4.5 y sus corolarios. Ejemplo 4.7 (Sistema lineal inestacionario revisitado). Sea el sistema x = A(t)x donde A(t) es continua t 0. Supongamos que existe una matriz sim etrica P (t) que satisface 0 < c1 I P (t) c2 I, t 0
y la ecuaci on diferencial matricial (t) = P (t)A(t) + AT (t)P (t) + C T (t)C (t) P donde C (t) es continua. La derivada de la funci on cuadr atica V (t, x) = xT P (t)x a lo largo de las trayectorias del sistema es (t, x) = xT P (t) + P (t)A(t) + AT (t)P (t) x V = xT C T (t)C (t)x 0. De la teor a de sistemas lineales inestacionarios sabemos que las trayectorias del sistema que comienzan en el punto x est an dadas por (, t, x) = (, t)x,
94
donde (, t) es la matriz de transici on de estados. Entonces,

t+ t+
(, (, t, x)) d = xT V
t T t
T (, t)C T ( )C ( )(, t) d x
= x W (t, t + )x, donde

t+
W (t, t + ) =
t
T (, t)C T ( )C ( )(, t) d.
Supongamos que existe una constante k < c2 tal que W (t, t + ) kI, Entonces
t+
t 0.
(, (, t, x)) d k x V
t
2 2
k V (t, x). c2
As , todas las hip otesis del Teorema 4.14 se satisfacen globalmente y concluimos que el origen es globalmente exponencialmente estable. Los lectores familiares con la teor a de sistemas lineales reconocer an que la matriz W (t, t+ ) es el Gramiano de observabilidad del par (A(t), C (t)) y que la desigualdad W (t, t + ) kI est a garantizada si el par (A(t), C (t)) es uniformemente observable. Comparando este ejemplo con el Ejemplo 4.5 vemos que el Teorema 4.14 permite relajar el requerimiento de que la matriz Q(t) en (4.8) sea denida positiva a pedir que Q(t) = C T (t)C (t) con el par (A(t), C (t)) sea uniformemente observable.
4.4
Ejercicios
Ejercicio 4.1 Dado el sistema x 1 = x2 x 2 = 2x1 x2 + 3t + 2 3x1 2(t + 1)x2 (i) Vericar que x1 (t) = t, x2 (t) = 1 es una soluci on.
t (ii) Mostrar que si x(0) est a sucientemente cerca de [ 0 1 ] entonces x(t) se aproxima a [ 1 ] a medida que t .
Ejercicio 4.2 Considerar el sistema x 1 = 2x1 + g (t)x2 x 2 = g (t)x1 2x2 donde g (t) es continuamente diferenciable y |g (t)| 1 para todo t 0. Mostrar que el origen es uniformemente asint oticamente estable. Es el origen globalmente uniformemente asint oticamente estable?
4.4 Ejercicios Ejercicio 4.3 Sea el sistema

2 x 1 = x2 g (t)x1 (x2 1 + x2 ) 2 x 2 = x1 g (t)x2 (x2 1 + x2 )
95
donde g (t) es una funci on continuamente diferenciable, acotada, y g (t) k > 0 para todo t 0. Es el origen uniformemente asint oticamente estable?Es exponencialmente estable? Ejercicio 4.4 Considerar el sistema
2 x 1 = x1 + (x2 1 + x2 ) sen t 2 x 2 = x2 + (x2 1 + x2 ) cos t.
Mostrar que el origen es exponencialmente estable y estimar la regi on de atracci on.
Cap tulo 5 Estabilidad de Sistemas Perturbados

Consideremos el sistema x = f (t, x) + g (t, x) (5.1)
donde f : [0, ) D Rn y g : [0, ) D Rn son seccionalmente continuas en t y localmente Lipschitz en x en [0, ) D y D Rn es un dominio que contiene el origen x = 0. Pensamos a (5.1) como una perturbaci on del sistema nominal x = f (t, x). (5.2)
El t ermino de perturbaci on g (t, x) puede provenir de errores de modelado, envejecimiento, incertidumbres, etc. T picamente no conocemos el t ermino g (t, x) pero tenemos alguna informaci on sobre el, como por ejemplo una cota superior de g (t, x) . La representaci on aditiva de la perturbaci on en (5.1) modela, por ejemplo, perturbaciones que no modican el orden del sistema. Supongamos que el sistema nominal (5.2) tiene un PE uniformemente AE en el origen. Qu e podemos decir acerca de la estabilidad del sistema perturbado (5.1)? Una forma natural de encarar esta cuesti on es la de usar una funci on de Lyapunov del sistema nominal como candidata a funci on de Lyapunov para el sistema perturbado. Esto es lo que hicimos con el an alisis de la linealizaci on en la secci on 3.4. El elemento nuevo que introducimos ahora es que el t ermino de perturbaci on puede ser mucho m as general que en el caso de linealizaci on. En las primeras dos secciones, vamos a analizar el caso en que el t ermino de perturbaci on se anula en el origen, es decir g (t, 0) = 0, de forma que el origen x = 0 sigue siendo un PE del sistema perturbado. El caso g (t, 0) = 0 se tratar a en la secci on 5.3. Un caso particular de perturbaci on que no necesariamente se anula en el origen nos servir a para introducir el concepto de estabilidad entrada-estado (ISS) en la secci on 5.4.
5.1
Perturbaci on de un PE Exponencialmente Estable
Supongamos entonces que g (t, 0) = 0 y que x = 0 es un PE exponencialmente estable del sistema nominal (5.2). Sea V (t, x) una funci on de Lyapunov que satisface c1 x 2 V (t, x) c2 x 2 V V + f (t, x) c3 x t x V c4 x x (5.3)
2
(5.4) (5.5)
98
Estabilidad de Sistemas Perturbados
para todo (t, x) [0, ) D y para ciertas constantes positivas c1 , c2 , c3 y c4 . La existencia de una funci on de Lyapunov que satisface (5.3)-(5.5) est a garantizada por el Teorema 4.9, con algunas hip otesis adicionales. Supongamos adem as que el t ermino de perturbaci on g (t, x) satisface la cota de crecimiento lineal g (t, x) x , t 0 , x D (5.6)
donde es una constante no negativa. La propiedad (5.6) es natural dadas las hip otesis que hicimos sobre g (t, x). Como g (t, x) se anula en el origen y es localmente Lipschitz en un entorno acotado del origen, entonces es f acil de probar que satisface (5.6) en dicho entorno. Usamos V como candidata a funci on de Lyapunov para el sistema perturbado (5.1). Planteamos (t, x) = V + V f (t, x) + V g (t, x). V t x x de la siguiente manera Usando (5.4)-(5.6), acotamos V (t, x) c3 x V
2
V x
g (t, x) c3 x
+ c4 x 2 .
Si es lo sucientemente peque na tal que satisface la cota < entonces (t, x) (c3 c4 ) x V
2
c3 c4
(5.7)
< 0,
x D {0}.
Por lo tanto, usando el Corolario 4.7, podemos probar el siguiente lema. Lema 5.1 (Estabilidad exponencial robusta). Sea x = 0 un PE exponencialmente estable del sistema nominal (5.2). Sea V (t, x) una funci on de Lyapunov del sistema nominal que satisface (5.3)-(5.5) en [0, ) D. Supongamos que el t ermino de perturbaci on g (t, x) satisface (5.6)-(5.7). Entonces el origen es un PE exponencialmente estable del sistema perturbado (5.1). M as a un, si las hip otesis valen globalmente, entonces el origen es globalmente exponencialmente estable. Este lema es conceptualmente importante porque muestra que la estabilidad exponencial del origen es robusta con respecto a una clase de perturbaciones que satisface (5.6)-(5.7). Para poder enunciar esta propiedad de robustez no es necesario conocer V (t, x) expl citamente, s olo hace falta saber que el origen es un PE exponencialmente estable del sistema nominal, porque entonces, usando el Teorema 4.9 (asumiendo adem as que la matriz Jacobiana f /x es acotada), podemos garantizar la existencia de una V (t, x) que satisface (5.3)-(5.5). Sin embargo, si no conocemos a V (t, x) expl citamente, entonces no podemos calcular la cota (5.7), en cuyo caso s olo podemos decir que el origen es exponencialmente estable para toda perturbaci on que satisface (5.6) con sucientemente peque na. Ejemplo 5.1. Consideremos el sistema x = Ax + g (t, x) donde A es Hurwitz y g (t, x) satisface (5.6) con D = Rn . Sea Q = Qt > 0 y calculemos la soluci on P de la ecuaci on de Lyapunov P A + At P = Q. Por el Teorema 3.10 sabemos
5.1 Perturbaci on de un PE Exponencialmente Estable
99
que hay una u nica soluci on P = P t > 0. La funci on de Lyapunov cuadr atica V (x) = xt P x satisface (5.3)-(5.5). En particular,
t 2 min (P ) x 2 2 x P x max (P ) x 2 V Ax = xt Qx min (Q) x x
2 2
V x
= 2xt P
2
2 P
= 2max (P ) x 2 .
La derivada de V (x) sobre las trayectorias del sistema satisface (x) min (Q) x V
2 2
+ 2max (P ) x 2 2.
Por lo tanto el origen es globalmente exponencialmente estable si < min (Q) 2max (P ) (5.8)
Esta cota depende de la elecci on de Q, sin embargo el m aximo del lado derecho de (5.8) se obtiene para Q = I (ver el Ejercicio 5.1). Ejemplo 5.2. Consideremos el sistema x 1 = x2 x 2 = 4x1 2x2 + x3 2 donde la constante 0 es desconocida. Este sistema tiene la forma (5.1) con f (x) = Ax = 0 1 4 2 x1 , x2 g (x) = 0 x3 2.
Los autovalores de A son 1 j 3, por lo tanto A es Hurwitz. La soluci on de la ecuaci on de Lyapunov P A + At P = I es P = 3/2 1/8 1/8 5/16 (5.9)
La funci on de Lyapunov V (x) = xt P x satisface (5.4)-(5.5) con c3 = 1 y c4 = 2max (P ) = 3.026 El t ermino de perturbaci on g (x) satisface g (x)
2 2 2 x = |x2 |3 k2 |x2 | k2 2
para todo |x2 | k2 , donde k2 es una constante que vamos a determinar despu es, porque a esta altura no sabemos una cota para x2 (t), aunque s sabemos que estar a acotada cuando la trayectoria x(t) se mueva dentro de un conjunto compacto. Usando V (x) como candidata a funci on de Lyapunov para el sistema perturbado, obtenemos (x) x V
2 2 2 + 3.026 k2 x 2 2
100 (x) es denida negativa si Por lo tanto, V < 1 2 3.026 k2
(5.10)
Para estimar una cota de k2 , sea c = {x R2 | V (x) c}. Para cualquier constante positiva c, el conjunto c es cerrado y acotado. La frontera de c es la supercie de nivel 1 3 5 2 V (x) = x2 x =c 1 + x1 x2 + 2 4 16 2 El mayor valor de |x2 | sobre la supercie V (x) = c se puede determinar derivando la ecuaci on de la supercie con respecto a x1 e igualando a cero. Esto da 1 3x1 + x2 = 0 4 Por lo tanto, los valores extremos de x2 se obtienen en la intersecci on de la recta x1 = x2 /12 con la supercie de nivel. Haciendo esto da un m aximo para x2 de 96 c/29. Por lo tanto, todos 2 los puntos en el interior de c satisfacen la cota 96 c 2 |x2 | k2 donde k2 = 29 Entonces, usando (5.10), si < 29 0.1 96 c 3.026 c (5.11)
(x) ser V a denida negativa en c y podemos concluir que el origen x = 0 es exponencialmente estable, siendo c una estima de la RA. Vamos a aprovechar este ejemplo para mostrar que la cota (5.7) puede ser muy conservadora. Usando esa cota, llegamos a la desigualdad (5.10). Esta desigualdad permite al t ermino de perturbaci on g (t, x) ser cualquier vector de dos componentes que satisfaga 2 g (t, x) 2 k2 x 2 . Esta clase de perturbaciones es m as general que la perturbaci on espec ca que tenemos en este problema. Aqu tenemos una perturbaci on estructurada en el sentido de que la primera componente de g es siempre cero, mientras que nuestro an alisis permit a perturbaciones no estructuradas donde el vector g puede cambiar en todas las direcciones. No tener en cuenta la estructura de la perturbaci on lleva en general a resultados conservadores. Repitamos el an alisis, esta vez teniendo en cuenta la estructura de la perturbaci on. Volvemos a calcular la derivada de V (x) sobre las trayectorias del sistema: t (x) = x 2 V 2 + 2x P g (x) 1 5 2 + 2x2 x) 2 ( x1 x2 + 8 16 2 5 2 1 x 2 x 2 x 2 2 + 2x2 ( 2+ 2) 16 16 3 2 2 x 2 2 + k2 x 2 4 (x) es denida negativa si < 4/(3k 2 ). Usando otra vez el hecho de que para Por lo tanto, V 2 c 2 todo x c , |x2 |2 k2 = 96 , llegamos a la cota 29 = x
2 2
0.4 c que es cuatro veces mayor que (5.11). <
5.2 Perturbaci on de un PE Uniformemente AE
101
5.2
Perturbaci on de un PE Uniformemente AE
Cuando el origen del sistema nominal (5.2) no es exponencialmente estable sino s olo uniformemente AE, el an alisis se hace m as complicado. Supongamos que el sistema nominal tiene una funci on de Lyapunov denida positiva y decreciente V (t, x) que satisface V V + f (t, x) W3 (x) t x para todo (t, x) [0, ) D, donde W3 (x) es denida positiva y continua. La derivada de V (t, x) sobre las trayectorias del sistema (5.1) satisface (t, x) = V + V f (t, x) + V g (t, x) W3 (x) + V g (t, x) V t x x x (t, x) sea denida negativa necesitamos probar que Para lograr que V V g (t, x) < W3 (x) x para todo (t, x) [0, ) D. Es claro que esto requiere que pongamos una cota a g (t, x) que va a depender de la naturaleza de la funci on de Lyapunov del sistema nominal. Una clase de funciones de Lyapunov para las cuales el an alisis es tan simple como para el caso de estabilidad exponencial es el caso en que V (t, x) es denida positiva, decreciente, y satisface V V + f (t, x) c3 2 (x) t x V c4 (x) x (5.12) (5.13)
para todo (t, x) [0, ) D, para ciertas constantes positivas c3 y c4 , y donde : Rn R es denida positiva y continua. Una funci on de Lyapunov que satisface (5.12)-(5.13) se denomina tipo-cuadr atica. Es claro que una funci on de Lyapunov que satisface (5.3)-(5.5) es de tipo cuadr atica, pero una funci on de Lyapunov tipo cuadr atica puede existir aunque el origen no sea exponencialmente estable (ver Ejemplo 5.3 m as abajo). Si el sistema nominal (5.2) tiene una funci on de Lyapunov tipo cuadr atica, entonces su derivada sobre las trayectorias del sistema (5.1) satisface (t, x) c3 2 (x) + c4 (x) g (t, x) V Supongamos ahora que el t ermino de perturbaci on satisface la cota g (t, x) (x) , Entonces (t, x) (c3 c4 )2 (x) V (t, x) es denida negativa. lo que muestra que V < c3 c4
102 Ejemplo 5.3. Consideremos el sistema escalar x = x3 + g (t, x)
El sistema nominal x = x3 tiene un PE globalmente AE en el origen, pero como vimos en el Ejemplo 4.6, el origen no es exponencialmente estable. Por lo tanto no existe una funci on de Lyapunov que satisfaga (5.3)-(5.5). La funci on de Lyapunov V (x) = x4 satisface (5.12)-(5.13) con (x) = |x|3 y c3 = c4 = 4. Supongamos que el t ermino de perturbaci on satisface la cota 3 |g (t, x)| |x| para todo x, con < 1. Entonces la derivada de V (t, x) sobre las trayectorias del sistema perturbado satisface (t, x) 4(1 )x2 V Por lo tanto, el origen es un PE globalmente uniformemente AE del sistema perturbado.
En contraste con el caso de estabilidad exponencial, es importante remarcar que un sistema nominal con un PE en el origen uniformemente AE, pero no exponencialmente estable, no es robusto a perturbaciones con cotas de crecimiento lineal arbitrariamente peque nas del tipo (5.6). Vemos esto con un ejemplo. Ejemplo 5.4. Consideremos el sistema del ejemplo anterior con g (x) = x, > 0, es decir x = x3 + x Se puede ver f acilmente, mediante linealizaci on, que para cualquier > 0, sin importar cuan chica sea, el origen es inestable.
5.3
Perturbaci on No Evanescente
Veamos ahora el caso m as general en que no sabemos si g (t, 0) = 0. En este caso, el origen x = 0 puede no ser un PE del sistema perturbado (5.1); no podemos entonces estudiar estabilidad del origen como PE o asumir que la soluci on del sistema perturbado tiende a cero cuando t . Lo m as que podemos esperar es que si el t ermino de perturbaci on g (t, x) es chico en alg un sentido, entonces la trayectoria x(t) est e nalmente acotada por una cota peque na, es decir, que x(t) sea peque na para t sucientemente grande. Denici on 5.1 (Soluci on nalmente acotada). Las soluciones de x = f (t, x) se dicen uniformemente nalmente acotadas si existen constantes positivas b y c, y para cada (0, c) existe una constante positiva T = T () tales que x(t0 ) < = x(t) b , t t0 + T (5.14)
Se dicen globalmente uniformemente nalmente acotadas si (5.14) vale para arbitrariamente grande. La constante b en (5.14) se denomina cota nal. En el caso de sistemas aut onomos no necesitamos usar el t ermino uniforme ya que la soluci on depende s olo de t t0 . El siguiente teorema estilo Lyapunov es muy u til para probar cota nal.
5.3 Perturbaci on No Evanescente
103
Teorema 5.2 (Soluci on nalmente acotada). Sea D Rn un dominio que contiene al origen y sea f : [0, ) D Rn seccionalmente continua en t y localmente Lipschitz en x. Sea V : [0, ) D R una funci on continuamente diferenciable tal que W1 (x) V (t, x) W2 (x) V V + f (t, x) W3 (x) , t x (5.15) x >0 (5.16)
t 0, x D, donde Wi (x) son funciones continuas denidas positivas en D. Tomemos r > 0 tal que Br D y supongamos que es lo sucientemente peque na tal que max W2 (x) < min W1 (x)
x x =r
(5.17)
Tomemos tal que < < min x =r W1 (x). Entonces existe un tiempo nito t1 (dependiente de x(t0 ) y ) y una funci on (, ) de clase KL tales que x(t0 ) {x Br | W2 (x) }, las soluciones de x = f (t, x) satisfacen x(t) ( x(t0 ) , t t0 ) , t0 t < t1 x(t) {x Br | W1 (x) } , t t1 (5.18) (5.19)
M as a un, si D = Rn y W1 (x) es radialmente no acotada, entonces (5.18) y (5.19) valen para todo estado inicial x(t0 ) y todo . Demostraci on. La prueba tiene mucho en com un con la prueba del Teorema 4.5, por lo tanto vamos a usar ideas y terminolog a de dicha prueba a medida que necesitemos. Denamos el conjunto variante en el tiempo t, = {x Br | V (t, x) }. Entonces, B {x Br | W2 (x) } t, {x Br | W1 (x) } {x Br | W1 (x) } t, t, {x Br | W1 (x) } Br D Los conjuntos t, y t, tienen la propiedad de que una soluci on que comience en cualquiera (t, x) es negativa en la frontera. Por lo tanto, si x(t0 ) de ellos no sale del conjunto ya que V {x Br | W2 (x) }, la soluci on x(t) quedar a en t, para todo t t0 . Para una soluci on que comienza en t, , la relaci on (5.19) vale para todo t t0 . Para una soluci on que comienza dentro de t, pero fuera de t, , sea t1 el primer instante en que entra a t, (que podr a ser si la soluci on nunca entra en dicho conjunto). Para todo t [t0 , t1 ), las desigualdades (5.15) y (5.16) valen. Por lo tanto, de manera similar a la prueba del Teorema 4.5, existe una (V ). En consecuencia, existe una funci funci on () clase K tal que V on (, ) de clase KL que satisface (5.18). Como ( x(t0 ) , t t0 ) 0 cuando t , existe un tiempo nito a partir del cual ( x(t0 ) , t t0 ) < para todo t. Por lo tanto, t1 debe ser nito, es decir, la soluci on debe entrar en t, en tiempo nito. Una vez dentro del conjunto, la soluci on se queda ah para todo t t1 . Entonces tambi en x(t) {x Br | W1 (x) } para todo t t1 . Si D = Rn y W1 (x) es radialmente no acotada, entonces para cualquier estado inicial x(t0 ) y cualquier , podemos elegir r y lo sucientemente grandes para que (5.17) se satisfaga y x(t0 ) {x Br | W2 (x) }. Corolario 5.3 (Cota Final). Bajo las hip otesis del Teorema 5.2, sean 1 () y 2 () funciones clase K denidas en [0, r] tales que 1 ( x ) W1 (x) and W2 (x) 2 ( x ) , x D
1 1 Supongamos que < 2 (1 (r)) y x(t0 < 2 (1 (r)). Entonces las soluciones de x = f (t, x) 1 est an uniformemente nalmente acotadas con cota nal 1 (2 ()).
104
Corolario 5.4. Bajo las hip otesis del Corolario 5.3, las soluciones de x = f (t, x) satisfacen
1 x(t) ( x(t0 ) , t t0 ) + 1 (2 ())
(5.20)
Corolario 5.5. Supongamos que las hip otesis del Teorema 5.2 se satisfacen con W1 (x) k1 x
c
W2 (x) k2 x
W3 (x) k3 x
para ciertas constantes positivas ki y c. Supongamos adem as que < r(k1 /k2 )1/c y x(t0 < r(k1 /k2 )1/c . Entonces (5.18) y (5.19) toman la forma x(t) k x(t0 ) e (tt0 ) , x(t) k , t t1 t0 t < t1 (5.21) (5.22)
donde k = (k2 /k1 )1/c y = k3 /(k2 c).
Es importante notar que la cota nal obtenida en el Corolario 5.3 es una funci on clase K de , porque cuanto m as chico sea , m as chica va a ser la cota nal. Cuando 0, la cota nal tambi en tiende a cero. Ejemplo 5.5. Consideremos el sistema x 1 = x2 x 2 = 4x1 2x2 + x3 2 + d(t) donde la constante 0 es desconocida y d(t) es una perturbaci on uniformemente acotada que satisface |d(t)| para todo t 0. Este sistema ya fue analizado en el Ejemplo 5.2, s olo que ahora le agregamos el t ermino de perturbaci on d(t). Nuevamente el sistema puede pensarse como una perturbaci on de un sistema lineal nominal con funci on de Lyapunov V (x) = xt P x, con P dada en (5.9). Usamos V (x) como candidata a funci on del Lyapunov para el sistema 3 perturbado, pero tratamos los t erminos x2 y d(t) en forma diferente ya que el primero se anula en el origen mientras que el segundo no. La derivada de V (x) sobre las trayectorias del sistema satisface (t, x) = x V x
2 2 2 2 2 + 2x2 2 (x1 x2 /8 + 5x2 /16) + 2d(t)(x1 /8 + 5x2 /16) 2 29 x 2 /8 + 3k2 x 2 2+
donde usamos la desigualdad |2x1 + 5x2 | x 2 4 + 25, y k2 es una cota superior de |x2 |. 2 Supongamos que 4(1 )/(3k2 ), donde 0 < < 1. Entonces (t, x) = x 2 29 x 2 /8 V + 2 29/(8) (5.23) (1 ) x 2 , x = 2 2 donde 0 < < 1. Como vimos en el Ejemplo 5.2, |x2 |2 est a acotado en c = {x R2 | V (x) 2 c} por k2 = 96c/29. Por lo tanto, si < 0.4(1 )/c y es tan peque na que 2 max (P ) < c, entonces B c y todas las trayectorias que comienzan dentro de c permanecen dentro de c para todo tiempo futuro (ya que, por (5.23), V (x) decrece afuera de B y c es una supercie de nivel de V (x)). M as a un, las condiciones del Teorema 5.2 (y Corolario 5.5) se
5.4 Estabilidad Entrada-Estado
105
satisfacen en c . Por lo tanto, las soluciones del sistema perturbado est an uniformemente nalmente acotadas con cota nal 29 max (P ) b= min (P ) 8 Veamos ahora c omo se puede usar el Teorema 5.2 para analizar la estabilidad del sistema perturbado (5.1) cuando el origen del sistema nominal es UAE. Lema 5.6. Sea x = 0 un PE UAE del sistema nominal (5.2). Sea V (t, x) una funci on de Lyapunov del sistema nominal que satisface las desigualdades (4.15) en [0, ) D, donde D = {x Rn | x < r} y i , i = 1, 2, 3, 4 son funciones clase K 1 . Supongamos que el t ermino de perturbaci on g (t, x) satisface la cota uniforme
1 (1 (r))) 3 (2 g (t, x) < 4 (r)
(5.24)
para todo t 0, todo x D y cierta constante positiva < 1. Entonces, para todo x(t0 ) < 1 2 (1 (r)), la soluci on x(t) del sistema perturbado (5.1) satisface x(t) ( x(t0 ) , t t0 ) , x(t) ( ) , t t1 t0 t < t1
para cierta funci on (, ) de clase KL y cierto tiempo nito t1 , donde ( ) es una funci on clase K denida por
1 1 2 3 ( ) = 1
4 (r)
Demostraci on. Usamos V (t, x) como candidata a funci on de Lyapunov para el sistema perturbado (5.1). La derivada de V (t, x) sobre las trayectorias de (5.1) satisface (t, x) 3 ( x ) + V V g (t, x) x 3 ( x ) + 4 ( x ) (1 )3 ( x ) 3 ( x ) + 4 (r) , 0 < < 1 4 (r) 1 (1 )3 ( x ) , x 3 La prueba se completa usando el Teorema 5.2 y el Corolario 5.3.
5.4
Estabilidad Entrada-Estado
x = f (t, x, u) (5.25)
Consideremos ahora el sistema con entrada
El Teorema 4.11 da condiciones para la existencia de dicha funci on.
106
donde f : [0, ) D Du Rn es seccionalmente continua en t y localmente Lipschitz en x y u, D Rn es un dominio que contiene a x = 0, y Du Rm es un dominio que contiene a u = 0. La entrada u(t) es una funci on acotada y seccionalmente continua de t para todo t 0. Supongamos que el sistema x = f (t, x, 0) (5.26)
tiene un PE UAE en el origen x = 0. Una forma de analizar el comportamiento entradaestado del sistema forzado (5.25), es considerar a (5.25) como una perturbaci on del sistema no forzado (5.26), y aplicar las t ecnicas de la secci on anterior. Por ejemplo, si el sistema no forzado satisface las hip otesis del Lema 5.6 y el t ermino de perturbaci on satisface la cota f (t, x, u) f (t, x, 0) L u L0
para todo t 0 y todo (x, u) en alg un entorno de (0, 0), entonces el Lema 5.6 garantiza que para x(t0 ) y suptt0 u(t) sucientemente peque nos, la soluci on de (5.25) satisface x(t) ( x(t0 ) , t t0 ) + L sup u( )
t0
t t0
Esto motiva la siguiente denici on de la propiedad de estabilidad entrada-estado (Input to State Stability, ISS). Denici on 5.2 (Estabilidad Entrada-Estado, ISS). El sistema (5.25) es localmente estable entrada-estado si existen una funci on de clase KL, una funci on de clase K, y constantes positivas k1 y k2 tales que, para cualquier estado inicial x(t0 ) con x(t0 ) < k1 y cualquier entrada u(t) con suptt0 u(t) < k2 , la soluci on x(t) existe y satisface x(t) ( x(t0 ) , t t0 ) + sup
t0 t
u( )
(5.27)
para todo t t0 0. Es estable entrada-estado si D = Rn , Du = Rm , y la desigualdad (5.27) se satisface para cualquier estado inicial x(t0 ) y cualquier entrada acotada u(t). La desigualdad (5.27) garantiza que para cualquier entrada acotada u(t), el estado x(t) se va a mantener acotado. M as a un, cuando t aumenta, el estado x(t) va a tener una cota nal que es una funci on clase K de suptt0 u(t) . Puede probarse que si u(t) converge a cero cuando t , tambi en lo hace x(t). Notar que, con u(t) 0, (5.27) se reduce a x(t) ( x(t0 ) , t t0 ) Por lo tanto, ISS local implica que el origen del sistema no forzado es UAE, mientras que ISS implica que es GUAE. El siguiente teorema tipo Lyapunov da una condici on suciente para ISS.2 Teorema 5.7. Sea D = {x Rn | x < r}, Du = {u Rm | u < ru }, y f : [0, ) D Du Rn seccionalmente continua en t y localmente Lipschitz en x y u. Sea V : [0, )D R una funci on continuamente diferenciable tal que 1 ( x ) V (t, x) 2 ( x ) V V + f (t, x, u) 3 ( x ) , t x
2
x ( u ) > 0
Para sistemas estacionarios se ha mostrado que las condiciones del Teorema 5.7 son tambi en necesarias [Sontag and Wang, 1995].
5.4 Estabilidad Entrada-Estado
107
(t, x, u) [0, ) D Du , donde 1 , 2 , 3 y son funciones clase K. Entonces el sistema 1 1 (5.25) es localmente ISS con = 1 2 , k1 = 2 (1 (r)), y k2 = 1 (min{k1 , (ru )}). 1 M as a un, si D = Rn , Du = Rm , y 1 es clase K , entonces (5.25) es ISS con = 1 2 . Demostraci on. Usando el Teorema 5.2 y sus Corolarios 5.3 y 5.4, sabemos que para x(t0 ) y u(t) tales que
1 x(t0 ) < 2 (1 (r)) ,
sup u(t)
tt0
1 < min{2 (1 (r)), (ru )}
(5.28)
la soluci on x(t) existe y satisface x(t) ( x(t0 ) , t t0 ) + sup u( )

t0
t t0
(5.29)
Como x(t) depende s olo de u( ) para t0 t, el supremo en el lado derecho de (5.29) 1 puede tomarse en [t0 , t], lo que prueba (5.27). En el caso global, la funci on 2 1 es clase K . Entonces, para cualquier x(t0 ) y u(t) acotada, podemos elegir r y ru lo sucientemente grandes para que se cumplan las desigualdades (5.28). Los siguientes Lemas son consecuencia de los teoremas conversos de Lyapunov. Lema 5.8 (Estabilidad asint otica uniforme e ISS). Supongamos que en alg un entorno de (x, u) = (0, 0), la funci on f (t, x, u) es continuamente diferenciable y las matrices Jacobianas [f /x] y [f /u] est an acotadas, uniformemente en t. Si el sistema no forzado (5.26) tiene un PE UAE en el origen x = 0, entonces el sistema (5.26) es localmente ISS. Demostraci on. Por el Teorema 4.11 (converso de Lyapunov), el sistema no forzado (5.26) tiene una funci on de Lyapunov V (t, x) que satisface las desigualdades (4.15) en alg un entorno acotado de x = 0. Como [f /u] est a acotada, el t ermino de perturbaci on satisface f (t, x, u) f (t, x, 0) L u , L>0 (5.30)
para todo t t0 y todo (x, u) en alg un entorno acotado de (x, u) = (0, 0). Puede vericarse que V (t, x) satisface las condiciones del Teorema 5.7 en alg un entorno acotado de (x, u) = (0, 0). Para sistemas estacionarios, las hip otesis del Lema 5.8 de que los Jacobianos est en acotados se satisfacen trivialmente si f (x, u) es continuamente diferenciable. Por lo tanto, para sistemas estacionarios el Lema dice que si f (x, u) es continuamente diferenciable y el origen de (5.26) es AE, entonces (5.25) es localmente ISS. Lema 5.9 (Estabilidad exponencial e ISS). Supongamos que f (t, x, u) es continuamente diferenciable y globalmente Lipschitz en (x, u), uniformemente en t. Si el sistema no forzado (5.26) tiene un PE globalmente exponencialmente estable en el origen x = 0, entonces el sistema (5.25) es ISS. Demostraci on. Por el Teorema 4.11 (converso de Lyapunov), el sistema no forzado (5.26) tiene una funci on de Lyapunov V (t, x) que satisface las desigualdades (4.15) globalmente. Como f es globalmente Lipschitz en (x, u), el t ermino de perturbaci on satisface (5.30) para todo t t0 y todo (x, u). Puede vericarse que V (t, x) satisface las condiciones del Teorema 5.7 globalmente.
108
Si el origen del sistema no forzado (5.26) es GUAE pero no globalmente exponencialmente estable, el sistema (5.25) no es necesariamente ISS incluso cuando f es globalmente Lipschitz en (x, u) (Ver el Ejercicio 5.5). Los siguientes ejemplos ilustran el uso del Teorema 5.7. Ejemplo 5.6. El sistema x = x3 + u tiene un PE GAE en el origen cuando u = 0. Tomando V = x2 /2, tenemos = x4 + xu = (1 ) x4 x4 + xu (1 ) x4 , V |x| |u|
1/3
donde es una constante tal que 0 < < 1. Probamos entonces que el sistema es ISS con (a) = (a/)1/3 . Ejemplo 5.7. El sistema x = f (x, u) = x 2x3 + (1 + x2 )u2 tiene un PE globalmente exponencialmente estable en el origen cuando u = 0, pero el Lema 5.9 no se aplica porque f no es globalmente Lipschitz en x. Sin embargo, tomando V = x2 /2 obtenemos = x2 2x4 + x(1 + x2 )u2 x4 , V Por lo tanto el sistema es ISS con (a) = a2 . Ejemplo 5.8. Consideremos el sistema x = f (x, u) = x + (1 + x2 )u Como en el ejemplo anterior, cuando u = 0 el origen es un PE exponencialmente estable, pero el Lema 5.9 no se aplica porque f no es globalmente Lipschitz en x. En este case puede verse que el sistema no es ISS tomando u(t) 1, ya que la soluci on del sistema resultante x = x + x2 que comienza en x(0) = 0 diverge a innito (notar que x 3/4 para todo x). De acuerdo al Lema 5.8, el sistema es localmente ISS. El Teorema 5.7 puede usarse para estimar las cotas del estado inicial y la entrada (las constantes k1 y k2 de la Denici on 5.2). Sea D = {|x| < r} y Du = R. Con V (x) = x2 /2, tenemos = x2 + x(1 + x2 )u V (1 )x2 x2 + |x|(1 + r2 )|u| (1 + r2 )|u| |x| < r (1 )x2 , donde 0 < < 1. Por lo tanto, el sistema es localmente ISS con k1 = r, k2 = r/(1 + r2 ), y (a) = a(1 + r2 )/. |x| u2
5.5 Ejercicios
109
5.5
Ejercicios
Ejercicio 5.1 Sea la ecuaci on de Lyapunov P A + AT P = Q, donde Q = QT > 0 y A es Hurwitz. Sea (Q) = min (Q)/max (P ). (i) Mostrar que (kQ) = (Q) para cualquier n umero positivo k . =Q T > 0 tal que min (Q ) = 1. Mostrar que (I ) (Q ). (ii) Sea Q (iii) Mostrar que (I ) (Q) para toda Q = QT > 0. Ayuda: Para la parte ((ii)), si P1 y P2 son las soluciones de la ecuaci on de Lyapunov para Q = I y Q = Q respectivamente, mostrar que
P1 P 2 =
0
T )eAt dt 0. eA t (I Q
Ejercicio 5.2 Sea el sistema x = Ax + Bu y sea u = F x una realimentaci on de estados estabilizante; es decir, tal que la matriz (A + BF ) es Hurwitz. Supongamos que, debido a limitaciones f sicas, debemos usar un limitador para evitar que el valor de las componentes ui de u no superen en valor absoluto el m aximo preestablecido L > 0, o sea que |ui (t)| L.
E B
x E l E T
A '
Fx
'
F '
Figura 5.1: Realimentaci on de estados saturada
El sistema a lazo cerrado, ilustrado en la Figura 5.1, puede representarse por x = Ax + BLsat(F x/L), donde sat(v ) es un vector cuya componente i- esima es la funci on saturaci on 1, para v1 < 1 sat(vi ) = vi , para |vi | 1 1, para vi > 1
110
Sumando y restando el t ermino BF x, podemos reescribir el sistema lazo cerrado como x = (A + BF )x + Bh(F x), donde h(v ) = Lsat(v/L) v . As , el efecto del limitador puede verse como una perturbaci on del sistema nominal sin limitaciones en la entrada. (i) Mostrar que |hi (v )| /(1 + )|vi | si |vi | L(1 + ). (ii) Sea P la soluci on de P (A + BF ) + (A + BF )T P = I . Mostrar que la derivada de V (x) = xT P x a lo largo de las trayectorias del sistema a lazo cerrado es denida negativa en la regi on {x : |(F x)i | L(1 + )} si /(1 + ) < 1/(2 P B 2 F 2 ). (iii) Mostrar que el origen es asint oticamente estable y discutir c omo puede estimarse la regi on de atracci on. (iv) Aplicar los resultados anteriores al caso A= 1 1 , 1 1 B= 1 0 , 0 1 F = 0 1 , 1 1.9
y L = 1. Estimar la regi on de atracci on del origen. Ejercicio 5.3 Sea el sistema x 1 = x1 + (t)x2 x 2 = (t)x1 x2 + h(t) cos x1 donde (t) y h(t) son funciones continuas, y |h(t)| H para todo t 0. Mostrar que las soluciones del sistema son globalmente uniformemente nalmente acotada y estimar la cota nal. Ejercicio 5.4 Sea el sistema
2
x 1 =
sen x2
1 x1
x 2 = bx1 (1 + b)x2 . (i) Con b = 0, mostrar que el origen es exponencialmente estable y globalmente asint oticamente estable. (ii) Con b = 0, mostrar que el origen es exponencialmente estable para |b| sucientemente peque no, pero que no puede ser GAE por m as peque no que sea |b|. (iii) Discutir los resultados de las partes (i) y (ii) en relaci on a los resultados de perturbaci on de puntos de PE, y mostrar que cuando b = 0 el origen no es globalmente exponencialmente estable.
5.5 Ejercicios Ejercicio 5.5 Sea el sistema escalar x = x 1 + x2
111
y V (x) = x4 . (i) Mostrar que las desigualdades (4.15) se satisfacen con 1 (r) = 2 (r) = r4 , 3 (r) = 4r4 , 1 + r2 4 (r) = 4r3
(ii) Vericar que estas funciones son clase K . (iii) Mostrar que el lado derecho de (5.24) tiende a cero cuando r . (iv) Considerar el sistema perturbado x = x + 1 + x2
donde es una constante positiva. Mostrar que para toda > 1/2 la soluci on x(t) escapa a innito para cualquier condicion inicial x(0). Ejercicio 5.6 Investigar la estabilidad entrada-estado (ISS) de cada uno de los siguientes sistemas escalares x = (1 + u)x3 , x = x + x2 u, Ejercicio 5.7 Sea el sistema x 1 = x1 sen x2 2
2
x = (1 + u)x3 x5 , x = x x3 + u.
x 2 = x2 + u. (i) Con u = 0, mostrar que el origen es GAE. (ii) Mostrar que para cualquier entrada acotada u(t), el estado x(t) es acotado. (iii) Con u(t) 1, x1 (0) = a, y x2 (0) = 1, mostrar que la soluci on es x1 (t) a,x2 (t) 1. (iv) Es el sistema ISS?
Parte II Control
Cap tulo 6 Control en Realimentaci on

Los u ltimos cap tulos tratan sobre el dise no de control en realimentaci on. Introducimos varias herramientas de dise no, incluyendo linealizaci on, tabulaci on de ganancia, linealizaci on exacta por realimentaci on, control integral, etc. La mayor a de las herramientas de an alisis que hemos visto en los cap tulos anteriores entran en juego en estos u ltimos cap tulos. En particular, en este cap tulo comenzamos con una secci on general sobre problemas de control a modo de introducci on a los cap tulos que siguen. Luego presentamos dos secciones sobre dise no v a linealizaci on, y dise no por tabulaci on de ganancia (gain scheduling ).
6.1
Problemas de Control
Muchas tareas de control requieren el uso de control por realimentaci on. En general, un objetivo b asico de un sistema de control es hacer que alguna salida, digamos y , se comporte de forma deseada mediante la manipulaci on de alguna entrada, digamos u. El objetivo m as simple puede ser tratar de mantener y peque na (o cercana a alg un punto de equilibrio) un problema de regulaci on o estabilizaci on o tratar de mantener la diferencia y r peque na, donde r es una se nal de entrada de referencia perteneciente a cierta clase de se nales deseadas un problema de servomecanismo o seguimiento. Por ejemplo: En un avi on comercial la aceleraci on vertical debe mantenerse por debajo de cierto valor para garantizar comodidad a los pasajeros. En un amplicador de audio la potencia de se nales de ruido en la salida debe ser sucientemente peque na para obtener buena delidad. En la fabricaci on de papel el contenido de humedad debe mantenerse entre ciertos valores especicados. Cada problema de control, a su vez, puede tener distintas versiones, dependiendo de los elementos disponibles para resolverlo. Por ejemplo, uno puede resolver un problema de regulaci on por realimentaci on de estados, si es que todos los estados necesarios son medibles, o bien, por realimentaci on de salida. En un problema de control t pico existen objetivos de dise no adicionales a los b asicos de regulaci on o seguimiento. Por ejemplo, pueden existir requerimientos especiales sobre la respuesta transitoria de y , o restricciones en los valores de la entrada de control u. Estos objetivos adicionales pueden no ser completamente compatibles entre s , por lo que en muchos
116
Control en Realimentaci on
casos forzosamente se cae en soluciones de compromiso. El deseo de optimizar estas soluciones de compromiso da lugar a la formulaci on de varios problemas de control optimo. Un objetivo de control adicional particularmente importante es el de mantener los objetivos b asicos de dise no ante la presencia de incertidumbres en el modelo matem atico del sistema. El dise no de control con tolerancia de incertidumbres de modelado lleva a la formulaci on de problemas de control robusto, o bien problemas de control adaptable. En control robusto, la incertidumbre de modelado se caracteriza como una perturbaci on de un modelo nominal. En control adaptable, por otro lado, la incertidumbre se caracteriza en t erminos de un conjunto de par ametros desconocidos, y se dise na la realimentaci on de forma que estos par ametros puedan estimarse mientras el sistema se encuentra en operaci on. Existen tambi en formulaciones mixtas, que combinan control robusto y adaptable. En este curso nos limitamos a describir los problemas b asicos de estabilizaci on, seguimiento, y rechazo de perturbaciones. Comenzamos con el problema de estabilizaci on, en sus versiones de realimentaci on de estados, y realimentaci on de salida.
6.1.1
Estabilizaci on
Realimentaci on de estados. El problema de estabilizaci on para el sistema x = f (t, x, u) es el problema de dise nar una ley de control u = (t, x) tal que el origen x = 0 sea un punto de equilibrio uniformemente asint oticamente estable del sistema a lazo cerrado x = f (t, x, (t, x)). Una vez que sabemos como resolver este problema, podemos estabilizar el sistema con respecto a un punto p arbitrario mediante traslaci on del origen con el cambio de variables = x p. M as a un, p no tiene que ser un punto de equilibrio del sistema a lazo abierto (basta que exista q tal que f (t, p, q ) = 0, t). La ley de control en realimentaci on u = (t, x) suele llamarse realimentaci on est atica, puesto que es una funci on est atica de x. Alternativamente, puede usarse una ley de control din amica u = (t, x, z ) z = g (t, x, z ), donde z es la soluci on de un sistema din amico cuya entrada es x. Un ejemplo t pico de realimentaci on din amica es el control con acci on integral, que veremos m as adelante. Realimentaci on de salida. El problema de estabilizaci on por realimentaci on de salida para el sistema x = f (t, x, u) y = h(t, x, u)
6.1 Problemas de Control consiste en dise nar el control est atico u = (t, y )
117
o bien (mas com un en este caso ya que por lo general se necesita construir un observador para estimar el estado x) el control din amico u = (t, y, z ) z = g (t, y, z ) tal que x = 0 (z = 0) sea un punto de equilibrio uniformemente asint oticamente estable del sistema a lazo cerrado x = f (t, x, ()). Sistemas lineales estacionarios. Naturalmente, el problema de estabilizaci on por realimentaci on se simplica si el sistema es lineal y estacionario, x = Ax + Bu y = Cx + Du El control u = Kx preserva la linealidad del sistema, y el origen del sistema a lazo cerrado x = (A + BK )x es exponencialmente estable sii A + BK es Hurwitz. La teor a de sistemas lineales establece que si el par (A, B ) es controlable, se pueden asignar arbitrariamente todos los autovalores de A + BK mediante elecci on apropiada de F . Si (A, B ) es estabilizable, s olo pueden asignarse los autovalores controlables, pero los no controlables de A (a lazo abierto) deben tener parte real negativa. Cuando los estados no est an disponibles para realimentaci on, se puede construir un observador, y se realimentan los estados estimados x , = Ax x + Bu + H (C x + Du y ) u = Kx En este caso, para asegurar que x (t) converge a x(t), la matriz A + HC debe ser Hurwitz. La teor a de sistema lineales garantiza que si el par (A, C ) es observable, se pueden asignar arbitrariamente todos los autovalores de A + HC mediante elecci on apropiada de H . Una propiedad importante de los sistemas lineales es el principio de separaci on, que establece que el problema de estabilizaci on por realimentaci on de salida puede resolverse combinando las soluciones de (i) El problema de estabilizaci on mediante realimentaci on est atica de estados, u = Kx, (ii) El problema de observaci on de x a partir de la medici on de u e y . Si las matrices A + BK y A + HC son Hurwitz, el sistema a lazo cerrado realimentado v a observador es estable, y con los autovalores a lazo cerrado deseados. Esto puede comprobarse planteando la din amica del sistema total planta/error de estimaci on, x =xx , x A + BK BK = 0 A + HC x x x
118
Sistemas no lineales. Para sistemas no lineales generales el problema de estabilizaci on es m as dif cil y no hay una soluci on unicada como en el caso lineal. La forma m as pr actica de encararlo es recurrir a los resultados disponibles en el caso lineal, es decir, v a linealizaci on. Vamos a estudiar dos m etodos de este tipo: (i) Dise no v a linealizaci on (Secci on 6.2): linealizamos el sistema alrededor del origen, y dise namos un control lineal estabilizante para la linealizaci on. La estabilidad alcanzada en el sistema no lineal ser a local, aunque podemos estimar la regi on de atracci on. La validez de esta idea est a garantizada por el M etodo Indirecto de Lyapunov (Teorema 3.11). (ii) Control por ganancia tabulada (Secci on 6.3): linealizamos el sistema alrededor de una familia de puntos de equilibrio deseados, dise namos un control lineal estabilizante para cada linealizaci on, y usamos alg un mecanismo para conmutar de uno a otro. En el Cap tulo 7 veremos una idea de linealizaci on distinta; trabajaremos con clases especiales de sistemas no lineales que pueden transformarse en sistemas lineales mediante realimentaci on y (posiblemente) cambio de coordenadas. Luego de esta transformaci on se puede dise nar un controlador lineal estabilizante para el sistema lineal obtenido. A diferencia de la anterior, este tipo de linealizaci on no involucra ninguna aproximaci on; es exacta. Esta exactitud, sin embargo, asume conocimiento perfecto de las ecuaciones de estado del sistema y usa este conocimiento para cancelar en forma exacta las alinealidades del sistema. Como en la pr actica es imposible el conocimiento exacto del modelo del sistema, este m etodo siempre resulta en un sistema a lazo cerrado que es una perturbaci on del sistema a lazo cerrado nominal. La validez del m etodo, entonces, utiliza los resultados de teor a de Lyapunov para sistemas perturbados vistos en el Cap tulo 5. Cuando un sistema lineal se estabiliza por realimentaci on, el origen del sistema a lazo cerrado es globalmente asint oticamente estable. Para sistemas no lineales hay distintas posibilidades de estabilizaci on, que ilustramos sobre un ejemplo. Ejemplo 6.1. Supongamos que deseamos estabilizar el origen del sistema escalar x = x2 + u usando realimentaci on. Estabilizaci on Local: PE AE sin estima de la RA. Linealizando sobre el PE x = 0 obtenemos el sistema x = u, para el cual calculamos un control lineal local u = k x, k > 0, obteniendo x = k x + x2 El PE x = 0 del sistema a lazo cerrado de arriba es AE, por lo tanto u = k x consigue estabilizaci on local. Estabilizaci on Regional: PE AE con una RA garantizada. Es f acil de ver que la RA de u = k x es {x R : x < k }, por lo tanto obtenemos estabilizaci on regional en {x R : x < k }.
6.1 Problemas de Control Estabilizaci on Semiglobal: PE AE con RA compacta arbitrariamente grande.
119
Se puede dise nar el control tal que cualquier conjunto compacto (tan grande como se quiera) est e contenido en la RA. En el ejemplo, aumentando k agrandamos la RA; dado cualquier conjunto compacto Br = {|x| r}, lo podemos incluir en la RA tomando k > r. Estabilizaci on Global: PE GAE. Para el ejemplo, u = k x no consigue estabilizaci on global. Esto es f acil de ver ya que, dado r, elegimos k > r, pero una vez que k est a ja, las condiciones iniciales en la regi on {x > k } dan soluciones que divergen. Sin embargo, el control no lineal u = x2 k x consigue estabilizaci on global, ya que el sistema a lazo cerrado x = k x es GAE.
6.1.2
Seguimiento en Presencia de Perturbaciones
Pasemos ahora a describir un problema de control m as general; concretamente, el problema de seguimiento en presencia de perturbaciones. En este caso el sistema est a modelado por x = f (t, x, u, w) y = h(t, x, u, w) ym = hm (t, x, u, w) donde x es el estado, u es la entrada de control, w es la se nal de perturbaci on, y es la salida a controlar, e ym es la salida medida. El objetivo de control b asico es dise nar la entrada de control de forma que la salida controlada y siga una se nal de referencia yR , por ejemplo, asint oticamente: e(t) = y (t) yR (t) 0 cuando t . A veces esto es imposible para cierto tipo de se nales de perturbaci on w, entonces se puede pedir, alternativamente, que e(t) est e nalmente acotada, es decir e(t) < , t T
o, si w L2 , minimizar la ganancia L2 del operador a lazo cerrado entre w y e. Una clase importante de problemas de seguimiento se da cuando yR es una se nal constante. En este caso el problema se convierte en uno de regulaci on, y se resuelve estabilizando el lazo cerrado alrededor de un PE en donde y = yR . Las leyes de control por realimentaci on para el problema de seguimiento se clasican de la misma forma vista para el problema de estabilizaci on. Hablamos de realimentaci on de estados si x puede medirse; o sea, ym = x; de lo contrario hablamos de realimentaci on de salida. En forma an aloga, la realimentaci on puede ser est atica o din amica, y puede alcanzar seguimiento local, regional, semiglobal o global. La diferencia en este caso es que la localidad o globalidad se reere no s olo al tama no de las condiciones iniciales, sino tambi en al tama no de las se nales externas. Por ejemplo, en un problema t pico, seguimiento local signica que se alcanza seguimiento para estados iniciales y se nales externas sucientemente peque nas, mientras que seguimiento global signica que se alcanza seguimiento para cualquier estado inicial y cualquier (y, w) en una determinada clase de se nales.
120
6.2
Dise no V a Linealizaci on
Ilustramos el dise no v a linealizaci on para los problemas de estabilizaci on y regulaci on. En cada caso, comenzamos con el control por realimentaci on de estados y luego presentamos el control por realimentaci on de salidas.
6.2.1
Estabilizaci on
Realimentaci on de estados Consideramos el sistema x = f (x, u), x Rn , u Rp , (6.1)
donde f (0, 0) = 0, f (x, u) es continuamente diferenciable en un dominio que contiene el origen (x, u) = (0, 0). Linealizando alrededor de (x, u) = (0, 0) obtenemos el sistema lineal x = Ax + Bu donde A= f x B=
(x,u)=(0,0)
(6.2)
f u
.
(x,u)=(0,0)
(6.3)
De la teor a de sistemas lineales, recordamos ahora algunas propiedades que vamos a usar en adelante. Para m as detalles y demostraciones ver por ejemplo Chen [1999, Cap tulos 6 y 8] o Bay [1999, Cap tulos 8 y 10]. Denici on 6.1 (Controlabilidad). La ecuaci on de estados (6.2), o el par (A, B ), se dice controlable si para cualquier estado inicial x(0) = x0 Rn y cualquier estado nal x1 Rn , existe una entrada u que transere el estado x de x0 a x1 en tiempo nito. En caso contrario, la ecuaci on (6.2), o el par (A, B ), se dice no controlable. Proposici on 6.1 (Test de Controlabilidad). El par (A, B ), A Rnn , B Rnp , es controlable si y s olo si la matriz de controlabilidad, C = B AB A2 B An1 B , es de rango n (rango la pleno). C Rnnp ,
Proposici on 6.2 (Invariancia de la controlabilidad respecto a realimentaci on). El pn par (A + BK, B ), para cualquier matriz K , es controlable si y s olo si el par (A, B ) es controlable. Proposici on 6.3 (Controlabilidad y asignabilidad de autovalores). Todos los autovalores de (A + BK ) pueden asignarse arbitrariamente (siempre y cuando los autovalores complejos conjugados se asignen en pares) eligiendo la matriz constante real K si y s olo si (A, B ) es controlable. Asumiendo (A, B ) controlable, calculamos K tal que A + BK sea Hurwitz, y aplicamos u = Kx al sistema no lineal, obteniendo el sistema a lazo cerrado x = f (x, Kx).
6.2 Dise no V a Linealizaci on Obviamente x = 0 es un PE del sistema y la linealizaci on es x = f f (x, Kx) + (x, Kx) K x u = (A + BK )x.
x=0
121
Como A + BK es Hurwitz, el Teorema 3.11 garantiza que x = 0 es un PE exponencialmente estable del sistema no lineal. Como subproducto del enfoque de linealizaci on, disponemos adem as de una funci on de Lyapunov para estimar la RA: V (x) = xt P x , donde P = P t > 0 se calcula de la ecuaci on de Lyapunov P (A + BK ) + (A + BK )t P = I. Ejemplo 6.2 (Control del p endulo por linealizaci on y realimentaci on de estados). Consideremos la ecuaci on del p endulo = a sen b + cT donde a = g/l > 0, b = k/m 0, c = 1/(ml2 ) > 0, es el angulo entre la cuerda y el eje vertical, y T es el par aplicado al p endulo. Usando el par como entrada de control, queremos estabilizar al p endulo en un angulo = . Tomando como variables de estado x1 = y x2 = se obtiene el modelo de estado x 1 = x2 , x 2 = a sen(x1 + ) b x2 + c T (6.4)
Para que (6.4) tenga un PE en el origen, el par debe tener una componente est atica Tf que satisfaga a sen + c Tf = 0 es decir Tf = a sen c (6.5)
Denimos la variable de control u = T Tf y reescribimos (6.4) como x 1 = x2 , x 2 = a [sen(x1 + ) sen ] b x2 + c u que est a en la forma (6.1) con f (0, 0) = 0. Linealizando alrededor del origen obtenemos las matrices A= 0 1 , a cos b B= 0 c (6.6)
El par (A, B ) es controlable. Tomando K = [k1 k2 ], obtenemos A + BK = 0 1 , k1 c a cos k2 c b
122
cuyo polinomio caracter stico es () = 2 +(k1 c a cos ) +(k2 c b). No es dif cil comprobar que A + BK es Hurwitz si k1 < a cos , c b k2 < . c
Usando (6.5), el par de control que consigue, localmente, estabilizar el angulo en un valor es T = a sen a sen +Kx= + k1 ( ) + k2 . c c Realimentaci on de salida Consideramos el sistema x = f (x, u) , y = h(x) donde f (0, 0) = 0, h(0) = 0, f y h son continuamente diferenciables en un dominio que contiene al origen (x, u) = (0, 0). Linealizando alrededor de (x, u) = (0, 0), obtenemos el sistema lineal x = Ax + Bu y = Cx donde A y B est an denidas en (6.3), y C= h x .
x=0
(6.7)
De la teor a de sistemas lineales, recordemos ahora los conceptos y resultados relativos a observabilidad. Denici on 6.2 (Observabilidad). La ecuaci on de estado (6.7) es observable si para cualquier estado inicial x(0) (desconocido), existe un tiempo nito t1 tal que el conocimiento de la entrada u y la salida y sobre el intervalo [0, t1 ] es suciente para determinar en forma u nica el estado inicial x(0). En caso contrario el sistema no observable. Proposici on 6.4 (Dualidad entre controlabilidad y observabilidad). El par (A, C ) es observable si y s olo si el par (AT , C T ) es controlable. Si el sistema (6.7) es observable, entonces es posible estimar asint oticamente el vector de estados x(t) a partir del conocimiento de la entrada u(t) y la salida y (t) del sistema. La estima x (t) puede calcularse construyendo el observador = Ax x + Bu + H (C x y ). Si la matriz A + HC es Hurwitz, la estima x (t) se aproximar a asint oticamente a x(t) a medida que t crece, es decir, limt x (t) x(t) = 0. Si (A, C ) es observable, es posible asignar arbitrariamente los autovalores de A + HC .
6.2 Dise no V a Linealizaci on
123
Proposici on 6.5 (Asignaci on de autovalores en observadores). Dado el par (A, C ), todos los autovalores de (A + HC ) pueden asignarse arbitrariamente seleccionando una matriz real H si y s olo si (A, C ) es observable. Volviendo a nuestro sistema (6.7), asumimos (A, B ) controlable, (A, C ) observable, y dise namos el control din amico z = F z + Gy u = Lz + M y tal que la matriz de lazo cerrado del sistema aumentado (6.7)(6.8), ALC = A + BM C BL , GC F (6.9) (6.8)
sea Hurwitz. Un ejemplo es el control basado en observador (la variable z corresponde entonces a la estima del estado x ) = Ax x + Bu + H (C x y) u = Kx donde K y H se calculan de forma tal que A + BK y A + HC sean Hurwitz, lo que resulta en ALC = A BK . HC A + BK + HC
Aplicando el control (6.8) al sistema no lineal obtenemos x = f (x, Lz + M h(x)) z = F z + Gh(x). Es claro que (x, z ) = (0, 0) es un PE del sistema no lineal a lazo cerrado. Linealizando nos queda la matriz (6.9), por lo que el origen resulta un PE exponencialmente estable. Adem as, resolviendo una ecuaci on de Lyapunov para la matriz (6.9), disponemos de una funci on de Lyapunov, para estimar la RA. Ejemplo 6.3 (Control del p endulo por linealizaci on y realimentaci on de salida). Volvemos a considerar el p endulo del Ejemplo 6.2. Supongamos que el objetivo de control es . Tomamos el mismo, pero ahora medimos el angulo pero no medimos la velocidad angular como variable de salida y = x1 = , y construimos un control din amico de salida usando el observador = Ax x + Bu + H ( x1 y ) Tomando H = [h1 h2 ], puede vericarse que A + HC es Hurwitz si h1 < b , h2 < a cos b h1
El par de control es ahora T = a sen +Kx . c
124
6.2.2
Regulaci on V a Control Integral
En el Ejemplo 6.2 consideramos el problema de regular el angulo del p endulo a un valor constante , para lo cual redujimos el problema a uno de estabilizaci on mediante corrimiento del punto de equilibrio deseado al origen. Aunque este enfoque es adecuado cuando se conocen los par ametros del sistema con exactitud, puede no ser aceptable si existen perturbaciones de los valores nominales de los par ametros del modelo. En esta secci on presentamos una mejora al esquema de realimentaci on de estados, el agregado de acci on integral, que permitir a regulaci on robusta frente a perturbaciones param etricas. La ley de control de par a la que arribamos en el Ejemplo 6.2, T = a sen + Kx, c
est a formada por (i) una componente est atica de r egimen estacionario Tf = (a/c) sen que da el valor de equilibrio de , digamos f , en el valor deseado de angulo , y (ii) una componente de realimentaci on Kx que hace que A + BK sea Hurwitz. Mientras el c alculo de ambas componentes depende de los par ametros del sistema, la parte de realimentaci on puede dise narse para que sea robusta dentro de un rango de valores de los par ametros. Por otro lado, el c alculo de Tf puede ser sensible a variaciones en los par ametros del modelo respecto de sus valores nominales, lo cual cambiar a el valor estacionario de del valor deseado . El esquema que presentamos a continuaci on permitir a que el valor de regule al valor deseado tambi en en forma robusta. Consideramos el sistema x = f (x, u) y = h(x) donde x Rn , u Rp , f y h son funciones continuamente diferenciables en un dominio incluido en Rn Rp , y Rp es la salida a regular. Sea yR Rp una se nal de referencia constante. Queremos dise nar un control en realimentaci on tal que y (t) yR cuando t
Asumimos que medimos la salida y . Vamos a estabilizar el sistema a lazo cerrado en un PE tal que y = yR . Es claro que, para que esto sea posible, deben existir valores xf y uf tales que 0 = f (xf , uf ) 0 = h(xf ) yR Asumimos que (6.10) tiene una soluci on u nica en el dominio de inter es. Integramos el error de seguimiento e y yR : = e = y yR y aumentamos el sistema con el integrador x = f (x, u) = h(x) yR (6.10)
6.2 Dise no V a Linealizaci on
125
El control se va a dise nar como una realimentaci on de los estados x y y tal que el sistema a lazo cerrado tenga un PE en ( x, ) con x = xf . Si linealizamos alrededor de (x, , u) = (xf , , uf ), obtenemos = A 0 + B v C 0 0 con = y donde A= f x B=
(x,u)=(xf ,uf )
A + B v
x xf
v = u uf
f u
C=
(x,u)=(xf ,uf )
h x
x= xf
A B ] es n+p, entonces (A, B ) es controlable. Supongamos Si (A, B ) es controlable y el rango de [ C 0 que es as y calculemos K tal que A + B K sea Hurwitz. Partimos K como K = K1 K2 , donde K2 es p p y no singular (si fuera singular, puede mostrarse que A + B K ser a singular, lo que contradice el hecho de que es Hurwitz). El control es entonces
u = K1 (x xf ) + K2 ( ) + uf El control integral introduce un grado de libertad que puede usarse para asignar el valor de . Si elegimos
1 = K2 (uf K1 xf )
el control din amico obtenido queda = e = y yR u = K1 x + K2 con lo que ya no necesitamos incluir un t ermino est atico en el control para obtener el valor de r egimen permanente deseado. La Figura 6.1 muestra un diagrama de bloques del sistema controlado con este esquema de realimentaci on de estados con acci on integral. yR + u c E j E e E K2 E j +T +T x
E E
x
e E h(x)
f (x, u)
Ec
K1 '
Figura 6.1: Esquema de realimentaci on de estados con acci on integral.
126 El sistema no lineal a lazo cerrado es x = f (x, K1 x + K2 ) = h(x) yR
que tiene un PE en (xf , f ). Si linealizamos sobre este PE queda =

f x
f K u 1 h x
f K u 2
(x, )=(xf ,f )
= (A + B K ), que es exponencialmente estable. Por lo tanto y (t) yR cuando t (para condiciones iniciales en la regi on de atracci on). Ejemplo 6.4 (Control del p endulo por linealizaci on y realimentaci on de estados con acci on integral). Volvemos a considerar el p endulo del Ejemplo 6.2, donde el objetivo , y = x1 de control es estabilizar al p endulo en un angulo = . Tomando x1 = , x2 = y u = T obtenemos el modelo de estado x 1 = x2 , x 2 = a sen(x1 + ) b x2 + c u y = x1 = e Tomando la referencia yR = 0 puede verse que el equilibrio deseado es xf = 0 , 0 uf = a sen c
Las matrices A y B est an dadas por (6.6), y C = [ 1 0 ]. Como (A, B ) es controlable y el A B rango de [ C 0 ] es n + p = 3, entonces (A, B ) es controlable. Tomando K = [k1 k2 k3 ], puede vericarse usando el criterio de Routh-Hurwitz que A + B K es Hurwitz si b k2 c > 0 (b k2 c)(a cos k1 c) + k3 c > 0 k3 c > 0
Supongamos ahora que no conocemos los valores exactos de los par ametros a > 0, b 0, c > 0, pero conocemos una cota superior 1 de a y una cota inferior 2 de c. Entonces, tomando k2 < 0 , k3 < 0 , k1 < 1 2 1+ k3 k 2 1
nos aseguramos que A + B K es Hurwitz para toda perturbaci on de los par ametros que satisfaga las cotas a 1 y c 2 . La ley de control del par es + k3 T = k1 ( ) + k2 = que es un cl asico control PID (proporcional-integral-derivativo). Comparando con el par de control obtenido en el Ejemplo 6.2, podemos ver que no es necesario usar el par estacionario para mantener el equilibrio deseado.
6.3 Control por Ganancia Tabulada
127
La robustez del control integral puede explicarse intuitivamente de la siguiente manera. El control en realimentaci on de estados crea un PE AE. Cuando el sistema est a en este punto de equilibrio, todas las se nales deben ser constantes. Para que el integrador = e tenga una salida constante , su entrada e debe ser cero. Por lo tanto, el control integral fuerza que el error de seguimiento sea cero en equilibrio. Si hay variaciones param etricas, el PE va a cambiar en general, pero la condici on e = 0 en el equilibrio se mantiene. Por supuesto, como el resultado de estabilizaci on es local, esto va a valer para condiciones iniciales (x(0), (0)) lo sucientemente cercanas al PE (xf , f ). Si no disponemos de los estados x pero medimos y , el control integral puede implementarse mediante un observador de la siguiente manera u = K1 x + K2 = e = y yR = Ax x + Bu + H (C x y ), representado en el esquema de la Figura 6.2. Notar que usamos el observador para estimar solamente x, ya que est a siempre disponible para la realimentaci on. yR +T
e E K 2
c E j E
E j
+ u +T
x
E E
x
e
f (x, u)
. E h(x)
Ec
Sistema a lazo abierto c
B x K1 '
E e '
+c ' j + T
H '
A + HC
Observador
Figura 6.2: Esquema de realimentaci on de salida con acci on integral.
6.3
Control por Ganancia Tabulada
La principal limitaci on del control por linealizaci on es que s olo se puede garantizar que el control cumple su objetivo localmente alrededor de un u nico PE, o punto de operaci on (PO). Una forma de extender la validez del control por linealizaci on a un conjunto de POs es usar control por ganancia tabulada (gain scheduling). Este enfoque asume que se puede representar el sistema mediante un modelo parametrizado por ciertas variables, llamadas variables de tabulaci on (scheduling variables), de modo que cuando estas variables asumen un valor constante obtenemos un PO. En estos casos, se linealiza el sistema alrededor de distintos POs de inter es, obteni endose una familia de modelos lineales para la cual dise namos una familia de
128
controladores lineales. Luego, se implementa el esquema de control en un u nico controlador cuyos par ametros son cambiados acorde a los valores que toman las variables de tabulaci on, que deber an monitorearse continuamente. El concepto de control por ganancia tabulada se origina en sistemas de control de aeronaves. En estas aplicaciones, las ecuaciones no lineales de movimiento de la aeronave se linealizan alrededor de ciertos POs que capturan los modos principales de operaci on de la aeronave a lo largo del patr on de vuelo deseado. Se dise nan, entonces, controladores lineales para alcanzar la estabilidad y el desempe no deseados para cada una de las linealizaciones del sistema en cada PO. Luego se interpolan los valores de los par ametros de los controladores como funciones de las variables de tabulaci on; t picamente, presi on, velocidad, altitud, etc. Finalmente, el controlador por ganancia tabulada se implementa como un sistema no lineal. Vamos a presentar la idea de control por ganancia tabulada a trav es de un ejemplo simple de control de nivel. Ver Khalil [1996, pp.499506] para una formulaci on general y m as referencias. Ejemplo 6.5 (Control de nivel). El sistema, representado en la Figura 6.3, puede modelarse por las ecuaciones d dt
h
(z )dz
0
= q c 2h,
donde h es el nivel del l quido en el tanque, q es el caudal de entrada y c es una constante positiva. Tomando x = h como variable de estado y u = q como entrada de control obtenemos el modelo de estado 1 (u c 2x) f (x, u) x = (x) El objetivo de control es que el nivel y = x siga a una referencia yR . Usamos yR como variable de tabulaci on. Cuando yR = constante, y debe mantenerse igual a , para lo cual necesitamos que u se mantenga en el valor u () = c 2.
i Ti i i i
cq
t t t
Figura 6.3: Control de nivel de un tanque. Linealizando alrededor del PO inducido por yR = constante, obtenemos el modelo lineal parametrizado por x = a() x + b() u , donde x = x , u = u u (), f a() = x b() = f u
x= u= u
c 2 , = 2 () = 1 ()
x= u= u
6.3 Control por Ganancia Tabulada Consideremos el control PI (proporcional-integral) u = K1 e + K2 = y y R = x = x r , donde r = yR . El sistema lineal a lazo cerrado es x a() + b()K1 b()K2 = 1 0 cuyo polinomio caracter stico es s2 (a + bK1 )s bK2 . x b()K1 + r , 1
129
2 Si, por ejemplo, proponemos tener un polinomio caracter stico de la forma s2 +2n s + n , con determinados valores deseados de y , podemos lograrlo eligiendo las ganancias del control
K1 () =
2n + a() , b()
K2 () =
2 n b()
El control por ganancia tabulada se obtiene cuando reemplazamos por yR , con lo que las ganancias variar an directamente con la altura deseada. Antes de seguir, veamos primero una reparametrizaci on del controlador PI que simplicar a la tarea de tabulaci on. Parametrizaci on simplicada del control PI. A veces es posible simplicar la tarea de monitoreo y tabulaci on mediante una elecci on adecuada de los par ametros del controlador. Por ejemplo, si reparametrizamos el controlador PI como u = K e + 1 , T K = K1 , T = K1 , K2
y suponiendo que |a()| 2n (o sea que la parte real deseada para los polos a lazo cerrado es mucho mayor que el polo a lazo abierto), entonces obtenemos K () = 2n + a() 2n , b() b() T () = 2n + a() 2 2 n n
Tomando K () = 2n /b() = 2n () y T = 2/n , vemos que s olo hace falta tabular una u nica variable: K (). Con este control PI parametrizado en , la linealizaci on del sistema a lazo cerrado alrededor de (x, ) = (, ()), e y = , resulta x x = A () + B r y = C donde A () =
2 a() 2n n , 1 0
x ,
B =
2n , 1
C = 1 0 .
(6.11)
La funci on de transferencia a lazo cerrado correspondiente, de r a y = x , resulta

2 2n s + n 2 s2 + [2n a()]s + n
130
Control PI de ganancia tabulada por yR . Dejemos por ahora este an alisis lineal y consideremos el controlador PI de ganancia tabulada u = K (yR ) e + = e = y yR donde la ganancia K se tabula como una funci on de la se nal de referencia yR , no necesariamente constante. Cuando se aplica este control a la ecuaci on de estado no lineal, el sistema no lineal a lazo cerrado resulta n 1 x = 2n (yR ) x yR + c 2x (x) 2 = x yR y = x. Cuando yR es una constante positiva, yR = , el sistema tiene un PE en c 2 x = , () , 2 () n y el valor de equilibrio de u correspondiente es u = c 2. Es decir, el control por ganancia tabulada logra el PO deseado. La linealizaci on del sistema alrededor de este PO (x, ) = (, ()), e yR = , resulta en la ecuaci on lineal de lazo cerrado = An () + Bn () r , y = Cn las matrices An (), Bn () y Cn () son An () =
2 a() 2n n , 1 0
1 T
= 2n (yR ) e +
n 2
(6.12)
donde =
x ()
Bn =
2n + () , 1
Cn = 1 0 ,
yR =
(6.13)
y la ganancia () = K () ()/(T ()) donde K () = K/yR transferencia a lazo cerrado de r a y = x resulta en este caso
2 [2n + ()]s + n 2 s2 + [2n a()]s + n
. La funci on de
Comparando (6.11) con (6.13), vemos que los dos modelos lineales representados por (A , B , C ) y (An , Bn , Cn ) son distintos (en la matriz B ): (A , B , C ) representa el modelo a lazo cerrado de la familia de modelos lineales parametrizados usados para el dise no del control; (An , Bn , Cn ) representa la linealizaci on alrededor del PO deseado del sistema no lineal a lazo cerrado con el control por ganancia tabulada. Estos modelos linealizados dieren porque en (A , B , C ) la ganancia est a ja en K (), y no hay que derivar K (yR ) con respecto a yR y evaluarla en yR = . Ambos modelos dieren en la posici on del cero de la funci on transferencia de lazo cerrado, lo que puede dar respuestas transitorias muy diferentes. Idealmente quisi eramos que ambos modelos sean iguales a n de que se d e el desempe no deseado en las vecindades de cada PO. Vamos a presentar dos trucos para que ambos modelos resulten iguales.
6.3 Control por Ganancia Tabulada Truco 1. No imponer la condici on c 2 () = 2 n ()
131
(que evita el uso de t erminos constantes en el control) y en cambio usar el grado de libertad de asignar () arbitrariamente. El control entonces es u = K (yR ) e + = e = y yR y (yR ) arbitrario. El control (6.12) que usamos antes es un caso particular de (6.14) que surge de imponer la condici on K (yR ) (yR ) = u (yR ). T El sistema a lazo cerrado puede escribirse como x = fc (x, yR ). Linealizando alrededor de (x, yR ) = (, ) obtenemos fc x donde () = K () () 1 u () + . T () () = a() 2n , fc yR = 2n + (), 1 ( (yR )) + u (yR ) , T u (yR ) = c 2yR (6.14)
x= yR =
x= yR =
Si elegimos () tal que () = 0, es decir tal que K () () u () = T conseguimos que Bn = B , y de esta forma los modelos (6.11) y (6.13) coinciden. Truco 2. Reemplazar el controlador u = K (yR ) e + =e por el controlador u = K (yR )e + z = K (yR )e que, para K constante, puede interpretarse como conmutar la ganancia K con el integrador. 1 z T 1 T
132
Resumen. En base al ejemplo, podemos resumir los pasos a seguir para dise nar un control por ganancia tabulada de la siguiente manera. (i) Linealizar el modelo no lineal alrededor de una familia de POs parametrizada por las variables de tabulaci on. (ii) Dise nar una familia parametrizada de controladores lineales que consigan el desempe no deseado para la familia de modelos lineales en cada PO. (iii) Construir un control por ganancia tabulada tal que, en cada PO, el control genere un valor est atico que d e error est atico nulo, la linealizaci on del sistema no lineal a lazo cerrado en cada PO sea la misma que la de la conexi on en realimentaci on del modelo lineal parametrizado y el correspondiente control lineal. (iv) Vericar por simulaci on el desempe no no local del control por ganancia tabulada para el modelo no lineal. El paso (ii) puede conseguirse resolviendo el problema de dise no para una familia de modelos lineales parametrizados por variables de tabulaci on, como hicimos en el ejemplo, o bien, resolviendo el problema s olo en un n umero nito de POs usando la misma estructura de control para todos ellos pero permitiendo que los par ametros del controlador cambien de un PO a otro; luego los par ametros del controlador se interpolan para producir una familia de controladores lineales. Este proceso de interpolaci on se hace usualmente ad hoc, y se basa en conocimiento del sistema f sico. Como vimos, la elecci on del controlador por ganancia tabulada no es u nica. Poder satisfacer el requerimiento sobre los modelos linealizados enunciado en el paso (iii) depende de la estructura de control elegida. Adem as, la decisi on de hasta qu e punto debe insistirse en que las linealizaciones del modelo no lineal a lazo cerrado y del modelo lineal parametrizado a lazo cerrado coincidan depender a de las especicaciones y objetivos de control. Notar que el an alisis de lazo cerrado del controlador por ganancia tabulada s olo considera el comportamiento local alrededor de un PO constante. Qu e puede decirse del comportamiento regional, o global? Qu e sucede cuando la variable de tabulaci on no es constante? En la pr actica, la regla es que puede implementarse un controlador de este tipo siempre que las variables de tabulaci on var en en forma sucientemente lenta. La estabilidad de sistemas inestacionarios lentos puede justicarse usando los resultados en Khalil [1996, Secci on 5.7].
6.4
Ejercicios
Ejercicio 6.1 La Figura 6.4 muestra un esquema de un sistema de suspensi on magn etica, en el que una bola de material met alico se suspende mediante un electroim an de corriente controlada por realimentaci on a trav es de una medici on optica de la posici on de la bola. Este sistema tiene los ingredientes b asicos de sistemas para levitaci on de masas usados en gir oscopos, aceler ometros y trenes de alta velocidad. B asicamente, la ecuaci on de movimiento de la bola es my = k y + mg + F (y, i)
6.4 Ejercicios
133
donde m es la masa de la bola, y 0 es la posici on vertical (hacia abajo) de la bola medida desde un punto de referencia (y = 0 cuando la bola est a pegada al electroim an), k es el coeciente de fricci on viscosa, g es la aceleraci on de la gravedad, F (y, i) es la fuerza generada por el electroim an, e i es la corriente. La inductancia del electroim an depende de la posici on de la bola, y puede modelarse como L(y ) = L1 + L0 1 + y/a
donde L1 , L0 y a son constantes positivas. Este modelo representa el caso en el que la inductancia tiene su m aximo valor cuando la bola est a cerca del eleci troim an, y decrece a un valor constante a medida que la + 1 bola se aleja a y = . Tomando E (y, i) = 2 L(y )i2 como v R, L(y ) la energ a almacenada en la bobina, la fuerza F (y, i) est a y dada por
m mg v
F (y, i) =
E L 0 i2 = y 2a(1 + y/a)2
Figura 6.4: Sistema de suspensi on magn etica
Comandando el circuito de la bobina con una fuente de tensi on v , la ley de tensiones de Kirchho da la relaci on + Ri, v=
donde R es la resistencia del circuito y = L(y )i es el ujo magn etico. (i) Usando x1 = y, x2 = y y x3 = i como variables de estado, y u = v como entrada de control, mostrar que la ecuaci on de estado del sistema est a dada por x 1 = x2 x 2 = g k L0 ax2 3 x2 m 2m(a + x1 )2 1 L0 ax2 x3 x 3 = Rx3 + +u L(x1 ) (a + x1 )2
(ii) Suponer que se desea equilibrar la bola en una posici on deseada yR > 0. Encontrar los valores de r egimen permanente i y v , de i y v respectivamente, necesarios para mantener el equilibrio. (iii) Mostrar que el punto de equilibrio obtenido tomando u = v es inestable. (iv) Usando linealizaci on dise nar un control por realimentaci on de estados para estabilizar la bola en la posici on deseada; o sea, hacer el equilibrio asint oticamente estable. (v) Ensayo de robustez: considerando los datos num ericos nominales m = 0.01kg L0 = 0.01H k = 0.001N/m/s L1 = 0.02H g = 9.81m/s2 R = 10 a = 0.05m yR = 0.05m
estudiar el desempe no del sistema a lazo cerrado mediante simulaci on digital. En particular, estudiar el comportamiento transitorio y el efecto de una variaci on del 20% en todos los valores nominales de los par ametros del sistema.
134
(vi) Estima de la regi on de atracci on: con los mismos datos num ericos del punto anterior, realizar el siguiente experimento: comenzando con la bola en el equilibrio, desplazarla una distancia peque na hacia arriba y luego soltarla. Repetir el experimento gradualmente incrementando la distancia de desplazamiento inicial. Determinar mediante simulaci on digital el m aximo rango de captura para el cual la bola vuelve al equilibrio deseado. Repetir la experiencia para desplazamientos hacia abajo. (vii) Redise nar el control por realimentaci on de estados del punto (iv) para incluir acci on integral. Repetir los ensayos de los puntos (v) y (vi) y comparar el desempe no de este dise no con el del punto (iv). (viii) Asumiendo que s olo puede medirse la posici on de la bola y y la corriente i, dise nar un control lineal por realimentaci on de salida, con acci on integral, para estabilizar la bola en la posici on deseada yR . Repetir los ensayos de los puntos (v) y (vi) y comparar el desempe no de este dise no con los de los puntos (iv) y (vii). (ix) Asumiendo que s olo puede medirse la posici on de la bola y y la corriente i, dise nar un control por ganancia tabulada con acci on integral y por realimentaci on de salida para que la posici on de la bola siga una posici on de referencia yR . Estudiar por simulaci on digital el desempe no del sistema a lazo cerrado y compararlo con el dise no via linealizaci on del punto anterior. Ejercicio 6.2 La Figura 6.5 representa un sistema de p endulo invertido. El pivote del p endulo est a montado sobre un carrito que puede moverse horizontalmente mediante la acci on de una fuerza F . Manipulando F como variable de control, el objetivo es estabilizar el p endulo en posici on vertical en una posici on deseada del carrito. m Los par ametros del sistema, y sus valores nominales, son los siguientes,
mg
Figura 6.5: P endulo invertido y su comportamiento din amico puede describirse por las ecuaciones diferenciales ordinarias 1 m+M mL cos = y () mL cos I + mL2 donde () = (I + mL2 )(m + M ) m2 L2 cos2 (I + mL2 )M + m > 0. mgL sen 2 sen k y F + mL
m = 0.1kg M = 1kg L = 0.5m I = 1/120kg m2 k = 0.1N/m/s g = 9.81m/s2 y
masa del p endulo, masa del carrito, distancia pivote/centro de gravedad, momento de inercia del p endulo, coeciente de fricci on viscosa, aceleraci on de la gravedad, desplazamiento del pivote, rotaci on angular del p endulo,
L F M y
6.4 Ejercicios
135
, x3 = y y x4 = y (i) Usando x1 = , x2 = como variables de estado y u = F como entrada de control, escribir las ecuaciones de estado. (ii) Mostrar que el sistema tiene un conjunto de equilibrio. (iii) Se pretende estabilizar el p endulo en su posici on vertical, = 0. Determinar un punto de equilibrio a lazo abierto para el cual = 0 y mostrar que es inestable. (iv) Linealizar la ecuaci on de estado alrededor del punto de equilibrio elegido y comprobar que la ecuaci on de estado linealizada es controlable. (v) Usando linealizaci on, dise nar un control por realimentaci on de estados para estabilizar el sistema alrededor del punto de equilibrio deseado. (vi) Ensayo de robustez: estudiar el desempe no del sistema a lazo cerrado mediante simulaci on digital. Estudiar en particular el efecto de variaciones de 10% en los valores nominales de los par ametros del sistema sobre la respuesta transitoria. (vii) Estima de la regi on de atracci on: determinar, mediante simulaci on digital, el rango m aximo de angulo inicial que puede tener el p endulo, comenzando en reposo, para que el control dise nado pueda llevarlo al equilibrio = 0. (viii) Asumiendo que s olo puede medirse el angulo y la posici on y del carrito, dise nar por linealizaci on un control por realimentaci on de salidas para estabilizar el p endulo en = 0. Repetir los ensayos (vi) y (vii) y comparar el desempe no de este dise no con el obtenido con el control por realimentaci on de estados del punto (v).
Cap tulo 7 Linealizaci on Exacta por Realimentaci on

En este cap tulo introducimos elementos de la teor a moderna de control geom etrico de sistemas no lineales de control. Esta teor a se inici o alrededor de los a nos 70 con intentos de extender resultados de la teor a de sistemas lineales a sistemas no lineales; resultados tales como los que se reeren a controlabilidad y observabilidad del sistema. M as tarde, en 1981 se mostr o [Isidori et al., 1981] que no s olo estas extensiones eran posibles, sino tambi en gran parte de la teor a de control geom etrico de sistemas lineales al estilo Wonham [1985]. El art culo de Isidori et al. fue seguido durante los a nos 80 por un gran n umero de resultados que generaron un fant astico juego de herramientas para sistemas no lineales [Isidori, 1995, 1999]. Una herramienta central en este juego de herramientas es la linealizaci on exacta por realimentaci on, que presentamos en este cap tulo. Consideramos sistemas no lineales anes en la entrada de control, es decir, de la forma x = f (x) + g (x)u, y = h(x), y planteamos qu e condiciones se necesitan para que exista una realimentaci on de estados u = (x) + (x)v y un cambio de variables z = T (x) que transformen al sistema no lineal a una forma lineal equivalente. Esta linealizaci on no se reere a la linealizaci on Jacobiana aproximada del sistema, vista en el Cap tulo 6, sino que convierte exactamente al sistema en lineal. Comenzaremos con linealizaci on entrada-estado, en la que la ecuaci on de estado completa se linealiza exactamente. Luego introduciremos la linealizaci on entrada-salida, en la que s olo la respuesta entrada-salida se linealiza, mientras que una parte del sistema permanece no lineal. Finalmente, presentamos la estabilizaci on de sistemas por medio de linealizaci on exacta por realimentaci on.
7.1
Linealizaci on Entrada-Estado
Vamos a introducir la idea de linealizaci on exacta por realimentaci on a trav es del Ejemplo 6.2 de estabilizaci on del p endulo.
138
Linealizaci on Exacta por Realimentaci on
Ejemplo 7.1 (Linealizaci on exacta del p endulo). La inspecci on del modelo de estado del p endulo x 1 = x2 , x 2 = a [sen(x1 + ) sen ] b x2 + c u, muestra que podemos elegir u= v a [sen(x1 + ) sen ] + c c
para cancelar el t ermino no lineal de la segunda ecuaci on y obtener el sistema lineal x 1 = x2 , x 2 = b x2 + v. De esta manera, el problema de estabilizaci on del sistema no lineal se transforma en el problema de estabilizaci on de un sistema lineal controlable. Podemos elegir, por ejemplo v = k1 x 1 + k2 x 2 tal que los autovalores del sistema a lazo cerrado x 1 = x2 , x 2 = k1 x1 + (k2 b) x2 tengan parte real negativa. Finalmente, el control completo no lineal que convierte al sistema en lineal y estabiliza su equilibrio es entonces u= 1 a [sen(x1 + ) sen ] + k1 x1 + k2 x2 . c c Vamos a ver ahora cu an general es este procedimiento. Es claro que no podemos esperar cancelar alinealidades en cualquier sistema no lineal; debe haber ciertas propiedades estructurales que permiten tal cancelaci on. Del ejemplo podemos ver que para cancelar un t ermino no lineal (x) por substracci on, el control u y el t ermino (x) siempre deben aparecer juntos en forma de suma u + (x); para cancelar un t ermino no lineal (x) por divisi on, el control u y el t ermino (x) siempre deben aparecer juntos en forma de producto (x)u; si (x) es no singular en el dominio de inter es, puede cancelarse con u = (x) v , con (x) = 1 (x). Es decir que la posibilidad de convertir una ecuaci on de estado no lineal en una lineal controlable cancelando alinealidades requiere que la ecuaci on no lineal tenga la estructura x = Ax + B (x)1 [u (x)] (7.1)
donde A Rnn , B Rnp , el par (A, B ) es controlable, y las alinealidades : Rn Rp , : Rn Rpp , est an denidas en un dominio Dx Rn que contiene al origen. Asumimos
7.1 Linealizaci on Entrada-Estado
139
que la matriz (x) es no singular x Dx . Si el sistema tiene la estructura (7.1), entonces podemos usar el control u = (x) + (x) v para obtener la ecuaci on lineal x = A x + B v. Ahora para estabilizar el sistema podemos simplemente calcular v = Kx tal que A + BK sea Hurwitz. El control estabilizante completo es no lineal y tiene la forma u = (x) + (x)Kx. Y si el sistema no tiene la estructura (7.1); quiere decir que no es posible linealizarlo por realimentaci on? La respuesta es no. Recordemos que la representaci on en espacio de estados de un sistema no es u nica; depende de la elecci on de las variables de estado. A un cuando el sistema no tenga inicialmente la estructura (7.1) es posible que un cambio de variables lo lleve a la forma (7.1) en otras coordenadas, como vemos en el siguiente ejemplo. Ejemplo 7.2 (Sistema exactamente linealizable despu es de cambio de coordenadas). Sea el sistema x 1 = a sen x2 , x 2 = x2 1 + u. (7.2)
ermino no lineal, la primera ecuaci on sigue siendo no Si elegimos u = x2 1 + v para cancelar el t lineal. Sin embargo, si hacemos el cambio de variables z1 = x1 z2 = a sen x2 = x 1 obtenemos el sistema z 1 = z2 z 2 = a cos x2 (x2 1 + u) que tiene la forma (7.1), v alida en la regi on /2 < x2 < /2. Usando u = x2 1+ 1 v a cos x2 (7.3)
el sistema queda linealizado en las nuevas variables. La ecuaci on de estados en las nuevas variables se obtiene invirtiendo la transformaci on (7.3), es decir, x1 = z1 x2 = arcsen z2 a
que est a bien denida para a < z2 < a. La ecuaci on de estado transformada es z 1 = z2 z 2 = a cos arcsen z2 a
2 (z1 + u).
140
Denici on 7.1 (Difeomorsmo). Un difeomorsmo es un cambio de variables T tal que z = T (x) est a denido en un dominio Dx , su transformaci on inversa x = T 1 (z ) est a denida en Dz = T (Dx ), y ambos T y T 1 son continuamente diferenciables en Dx y Dz , respectivamente. Tenemos ya todos los elementos para hacer la siguiente denici on. Denici on 7.2 (Sistema Linealizable Entrada-Estado). Un sistema no lineal x = f (x) + g (x)u (7.4)
con f , g denidas en un dominio Dx Rn y sucientemente suaves (con derivadas continuas hasta el orden que sea necesario), es linealizable entrada-estado si existe un difeomorsmo T : Dx Rn tal que Dz = T (Dx ) contiene al origen y el cambio de variables z = T (x) transforma a (7.4) en z = Az + B (x)1 [u (x)] con (A, B ) controlable y (x) no singular en Dx . (7.5)
Tomando 0 (z ) = (T 1 (z )) , 0 (z ) = (T 1 (z )) nos queda el sistema expresado en las nuevas coordenadas: z = Az + B0 (z )1 [u 0 (z )] Y cu ando ser a posible encontrar un difeomorsmo que pueda llevar un sistema dado a la forma (7.5)? Derivando la ecuaci on z = T (x), es decir z = T T x = [f (x) + g (x)u] x x
e igual andola a (7.5), concluimos que el difeomorsmo T debe satisfacer las condiciones T f (x) = AT (x) B (x)1 (x) x T g (x) = B (x)1 . x En resumen: La existencia de T , , , A y B que satisfagan las ecuaciones en derivadas parciales (7.6) es una condici on necesaria y suciente para que x = f (x) + g (x)u sea linealizable entrada-estado. As , la determinaci on de si un sistema no lineal dado es linealizable exactamente por realimentaci on se reduce a la resoluci on de las ecuaciones en derivadas parciales (7.6). La resoluci on de estas ecuaciones puede simplicarse, como explicamos a continuaci on.
(7.6)
141
7.1.1
Condiciones simplicadas para la linealizaci on exacta por realimentaci on
Cuando un sistema es linealizable entrada-estado, la transformaci on z = T (x) no es u nica. La forma m as simple de ver esto es aplicando la transformaci on lineal = M z , con M no singular; as obtenemos = M AM 1 + M B (x)1 [u (x)] que tiene la misma estructura (7.5) pero con matrices A y B diferentes. Vamos a ver ahora que podemos aprovechar la no unicidad de T para simplicar las ecuaciones en derivadas parciales (7.6). Consideremos el caso p = 1 (una entrada). Dado cualquier par (A, B ) controlable, existe M no singular que lo transforma a la forma can onica controlable, es decir, M AM 1 = Ac + Bc t , M B = Bc , con 0 1 0 ... 0 0 1 0 0 1 . . . 0 0 2 Ac = . = . Bc = . , . . . ... . . . . . . . . . . . . . 0 0 ... ... 0 1 n Es decir, = (Ac + Bc t ) + Bc (x)1 [u (x)] = Ac + Bc (x)1 [u (x)] donde (x) = (x) (x)t M T (x). Vemos que podemos, sin p erdida de generalidad, considerar que A y B est an en la forma can onica controlable Ac y Bc . Ahora escribamos T1 (x) T2 (x) T (x) = . . . . Tn (x) Es f acil vericar que Ac T (x) Bc (x)1 (x) = , Tn (x) (x)/ (x) T2 (x) . . . y que Bc (x)1 = . 0 1/ (x) 0 . . .
Usando estas expresiones en las ecuaciones en derivadas parciales (7.6) se obtiene el siguiente conjunto de ecuaciones T1 f (x) = T2 (x), x T2 f (x) = T3 (x), x . . . Tn1 f (x) = Tn (x), x Tn f (x) = (x)/ (x), x T1 g (x) = 0, x T2 g (x) = 0, x . . . Tn1 g (x) = 0, x Tn g (x) = 1/ (x). x
142
Las primeras n 1 ecuaciones de la izquierda muestran que las componentes T2 a Tn de T son funciones de la primera componente T1 . Combinando todas las ecuaciones, la b usqueda se reduce a una funci on T1 (x) que satisfaga Ti g (x) = 0 , x Tn g (x) = 0 x donde Ti+1 (x) = Ti f (x) , x i = 1, 2, . . . , n 1. i = 1, 2, . . . , n 1; (7.7)
Las funciones y est an dadas por (x) = 1 , (Tn /x)g (x) (x) = (Tn /x)f (x) . (Tn /x)g (x) (7.8)
Finalmente, para simplicar los c alculos en las nuevas variables, vamos a imponerle a T1 (x) la condici on adicional de que T1 (x ) = 0, donde x es un PE del sistema a lazo abierto en las coordenadas originales (f (x ) = 0) con respecto al cual queremos estabilizar al sistema. Ejemplo 7.3 (C alculo del difeomorsmo z = T (x)). Consideremos nuevamente el sistema x = a sen x2 0 + u x2 1 1 f (x) + g u
que tiene un PE en x = 0. Buscamos T1 (x) tal que T1 (0) = 0 y T1 T1 g= x x1 T2 T2 g= x x1 donde T2 (x) = T1 T1 f (x) = x x1 T1 x2 a sen x2 . x2 1 (7.11) T1 x2 T2 x2 T1 0 = = 0, 1 x2 T2 0 = 0, = 1 x2 (7.9) (7.10)
Vemos de (7.9) que T1 (x) no depende de x2 . Usando este dato en (7.11) obtenemos T2 (x) = T1 a sen x2 . x1 (7.12)
Derivando (7.12) con respecto a x2 , y reemplazando el resultado en (7.10) tenemos que T2 T1 = a cos x2 = 0, x2 x1 que se satisface para cos x2 = 0 si tomamos, por ejemplo, T1 (x) = x1 . Reemplazando T1 /x1 = 1 en (7.12) obtenemos T2 (x) = a sen x2 , que junto con T1 (x) = x1 da el mismo cambio de variables propuesto en (7.3). Otras elecciones de T1 son posibles; por ejemplo, T1 (x1 ) = x1 + x3 a otro cambio de variables que lleva al sistema a la forma (7.6). 1 dar
143
Ejemplo 7.4 (Generador sincr onico). Un generador sincr onico conectado a un bus innito puede representarse con el modelo x = f (x) + g u con x2 f (x) = a[(1 + x3 ) sen(x1 + ) sen ] bx2 , cx3 + d[cos(x1 + ) cos ] 0 g = 0 , 1
donde a, b, c, d y son constantes positivas. El sistema tiene un PE en x = 0. Buscamos T1 (x) tal que T1 (0) = 0 y T1 T1 g= =0 x x3 T2 T2 g= =0 x x3 T3 T3 g= = 0, x x3 donde T2 (x) = T1 f (x) x T2 f (x). T3 (x) = x (7.16) (7.17) (7.13) (7.14) (7.15)
Usando (7.13) en (7.16) tenemos T2 (x) = T1 T1 x2 {a[(1 + x3 ) sen(x1 + ) sen ] bx2 }. x1 x2 (7.18)
Derivando (7.18) con respecto a x3 , y reemplazando el resultado en (7.14) tenemos que T2 T1 = a sen(x1 + ) = 0. x3 x2 Elegimos T1 independiente de x2 , y reemplazando T1 /x2 = 0 en (7.18) obtenemos T2 (x) = T1 x2 . x1 (7.19)
Usamos (7.19) (recordando que T1 es independiente de x2 y x3 ) en (7.17), T3 (x) = T1 T2 x2 {a[(1 + x3 ) sen(x1 + ) sen ] bx2 }. x1 x1 (7.20)
Derivando (7.20) con respecto a x3 , y reemplazando el resultado en (7.15) tenemos que T3 T1 = a sen(x1 + ) = 0, x3 x1
144
que se satisface en el dominio 0 < x1 + < eligiendo, por ejemplo, T1 (x) = x1 . Usando T1 (x) = x1 en (7.19) y (7.20), completamos el c alculo del difeomorsmo z = T (x), dado por z1 = T1 (x) = x1 z2 = T2 (x) = x2 z3 = T3 (x) = a[(1 + x3 ) sen(x1 + ) sen ] bx2 , cuya transformaci on inversa x1 = z1 x2 = z2 x3 = 1 z3 + b z2 a sen a sen(z1 + )
est a denida en 0 < z1 + < . Las funciones y est an dadas por (7.8) (con n = 3), es decir 1 (x) = a sen(x1 + ) (T3 /x) f (x) (x) = a sen(x1 + ) El modelo de estado en las coordenadas z es entonces z 1 = z2 z 2 = z3 z 3 = a sen(x1 + )[u (x)].
7.2
Linealizaci on Entrada-Salida
La linealizaci on exacta de la ecuaci on de estado que describimos en la secci on anterior no necesariamente linealiza la ecuaci on de salida. Consideremos otra vez el ejemplo (7.2). Si tomamos como salida y = x2 , el cambio de variables y el control z1 = x1 , resultan en z 1 = z2 z 2 = v y = arcsen z2 a z2 = a sen x2 , u = x2 1+ 1 v a cos x2
que tiene un modelo de estado lineal con salida no lineal. Si, en cambio, tomamos u = x2 1 + v, obtenemos el modelo x 1 = a sen x2 x 2 = u y = x2
7.2 Linealizaci on Entrada-Salida
145
que tiene una transformaci on lineal entrada-salida (de u a y ) y una din amica (la de x1 ) que es inobservable a la salida, ya que y no depende de x1 . Si s olo nos interesara la variable y , el control v podr a dise narse usando t ecnicas lineales para que y tenga el desempe no deseado. Sin embargo, no hay que descuidar la din amica inobservable; por ejemplo, si y fuera estabilizada en un valor constante yR = 0, la variable x1 tendr a una evoluci on x1 (t) = x1 (0) + t a sen yR , que crece con t! Veamos esta idea m as formalmente. Sea el sistema mono-entrada mono-salida x = f (x) + g (x)u, y = h(x). El caso m as simple de sistema linealizable entrada-salida se da cuando es linealizable entradaestado y la salida de inter es es h(x) = T1 (x). En ese caso, el cambio de variables z = T (x) y el control u = (x) + (x)v lo transforman en z = Ac z + Bc v y = Cc z = 1 0 . . . 0 z
donde (Ac , Bc , Cc ) son la forma can onica de una cadena de integradores. Para una dada salida y = h(x) = 1 (x) no necesariamente igual a T1 (x) podemos vericar si satisface la condici on en derivadas parciales (7.7) directamente por substituci on, es decir i g (x) = 0 , x i = 1, 2, . . . , n 1; n g (x) = 0, x
donde i+1 (x) = (i /x)f (x) , i = 1, 2, . . . , n 1. Esta condici on es una restricci on en la forma en que las derivadas de y dependen de u. Esto es f acil de ver si calculamos las derivadas temporales de la salida, y = 1 [f (x) + g (x)u] = x 2 [f (x) + g (x)u] = y = x 1 f (x) = 2 (x) x 2 f (x) = 3 (x) x
Si seguimos, vemos que u no aparece en las primeras n 1 derivadas de y , pero aparece en la derivada de orden n con un coeciente no nulo, y (n) = n n f (x) + g (x)u. x x
Es obvio que el control u= 1 n f (x) + v (n /x)g (x) x
da la transformaci on entrada salida igual a una cadena de n integradores y (n) = v. Qu e pasar a si u apareciera en una derivada de orden menor a n con coeciente no nulo? En este caso todav a podr amos linealizar la transformaci on entrada-salida, pero nos quedar a una cadena de menos integradores, y la ecuaci on de estado tendr a una parte no linealizada. Como en los sistemas lineales, el n umero de veces que hay que derivar la salida hasta que aparezca la entrada con un coeciente no nulo dene el grado relativo del sistema.
146
Denici on 7.3 (Grado Relativo). El sistema x = f (x) + g (x)u y = h(x), (7.21)
donde f , g y h, denidas en un dominio D Rn , son sucientemente suaves, tiene grado relativo r, con 1 r n, en una regi on D0 D si i g (x) = 0 , x i = 1, 2, . . . , r 1; r g (x) = 0 x i f (x) , i = 1, 2, . . . , r 1. x
para todo x D0 , donde 1 (x) = h(x) y i+1 (x) =
Si el sistema tiene grado relativo (GR) r, entonces es linealizable entradasalida; si tiene GR n, entonces es linealizable tanto entrada-salida como entrada-estado. Ejemplo 7.5 (Ecuaci on de Van der Pol). Consideremos la ecuaci on de Van der Pol controlada x 1 = x2 x 2 = x1 + (1 x2 1 ) x2 + u ,
>0
con salida y = x1 . Calculemos las derivadas de la salida: y =x 1 = x2 y =x 2 = x1 + (1 x2 1 ) x2 + u Por lo tanto el sistema tiene GR 2 en R2 . Si la salida es y = x2 , entonces y = x1 + (1 x2 1 ) x2 + u y el sistema tiene GR 1 en R2 . Si la salida es y = x1 + x2 2 , entonces y = x2 + x2 [x1 + (1 x2 1 ) x2 + u] y el sistema tiene GR 1 en D0 = {x R2 | x2 = 0}. Ejemplo 7.6 (Sistema sin grado relativo bien denido). Consideremos el sistema x 1 = x1 x 2 = x2 + u y = x1 Las derivadas de la salida son y =x 1 = x1 = y = y (n) = y = x1 , n 1 Vemos que en ninguna derivada de la salida aparece la entrada u. En este caso el sistema no tiene un GR bien denido porque la salida y (t) = x1 (t) = et x1 (0) es independiente de la entrada.
147
Ejemplo 7.7 (Motor de corriente continua controlado por campo). Un motor de corriente continua controlado por corriente de campo puede describirse por las ecuaciones x 1 = ax1 + u x 2 = bx2 + cx1 x3 x 3 = x1 x2 donde x1 , x2 y x3 son respectivamente la corriente de campo, de armadura, y velocidad angular. Para problemas de control de velocidad elegimos como salida y = x3 . Las derivadas de la salida son y =x 3 = x1 x2 y = x1 x 2 + x 1 x2 = () + x2 u, donde () contiene t erminos que son funciones de x. El sistema tiene GR 2 en la regi on D0 = {x R3 |x2 = 0}. Ejemplo 7.8 (Sistema lineal). Consideremos el sistema lineal representado por la funci on transferencia H (s) = bm sm + bm1 sm1 + + b0 , sn + an1 sn1 + + a0 = 0. Un modelo de estado para este sistema es 0 1 0 ... 0 0 1 ... 0 0 , B = . . . . .. . . . . . . . . . a1 . . . . . . an1 1 bm 0 . . . 0 .
donde m < n y bm 0 0 A= . . . a0
C = b0 b1 . . .
Este sistema es un caso particular de (7.21) con f (x) = Ax, g (x) = B y h(x) = Cx. Veamos el GR del sistema calculando las derivadas de la salida. La primera derivada es y = CAx + CBu. Si m = n 1, entonces CB = bn1 = 0 y el sistema tiene GR 1. En caso contrario, CB = 0 y seguimos derivando. Notemos que CA es un vector la que se obtiene moviendo los elementos de C una posici on a la derecha, CA2 se obtiene moviendo los elementos de C dos posiciones a la derecha, y as sucesivamente. Entonces vemos que CAi1 B = 0 , i = 1, 2, . . . , n m 1 CAnm1 B = bm = 0. Por lo tanto, u aparece por primera vez en la ecuaci on de y (nm) , que est a dada por y (nm) = CAnm x + CAnm1 Bu, y el GR del sistema es n m, o sea la diferencia entre el grado de los polinomios denominador y numerador de H (s).
148
7.2.1
Linealizaci on Entrada-Salida y Estabilidad Interna. Forma Normal
Vamos a introducir una forma can onica para sistemas no lineales en la que el grado relativo del sistema es expl cito. Esta forma can onica se conoce como la forma normal, y permite extender a sistemas no lineales el concepto de sistema de m nima fase (en un sistema lineal: sin ceros con parte real no negativa). Primero veamos c omo llevar un sistema lineal a una realizaci on en la que los ceros del sistema queden expl citos. Caso lineal Empecemos escribiendo el sistema lineal de grado relativo r = n m como 1 N (s) Q(s) , = H (s) = 1 R(s) D(s) 1+ Q(s) N (s)
D(s) = Q(s)N (s) + R(s),
donde los grados de D, N y Q son n, m < n, y r, respectivamente. Entonces H puede representarse como una interconexi on en realimentaci on negativa con 1/Q(s) en la cadena directa y R(s)/N (s) en el camino de realimentaci on (ver Figura 7.1).
u
+ e E E T w
1 Q(s) R(s) N (s)
Ec
'
Figura 7.1: Representaci on en realimentaci on de H (s) La funci on transferencia 1/Q(s) no tiene ceros, y puede realizarse tomando el vector de estados = y, y, . . . , y (r1)
t
Esto nos da el modelo de estados = (Ac + Bc t ) + Bc bm e y = Cc donde (Ac , Bc , Cc ) son la forma can onica de una cadena de r integradores, Rr y e es la se nal de salida del sumador (e = u [R(s)/N (s)]y ). Sea (A0 , B0 , C0 ) una realizaci on m nima de la funci on transferencia R(s)/N (s), con estado . Notar que los autovalores de A0 son los ceros de N (s), o sea, de H (s). Entonces H (s) puede realizarse como = A0 + B0 Cc = Ac + Bc (t bm C0 + bm u) y = Cc
(7.22)
7.2 Linealizaci on Entrada-Salida Usando la estructura de (Ac , Bc , Cc ) es f acil vericar que y (r) = t bm C0 + bm u El control (linealizante entrada-salida) u= 1 [t + bm C0 + v ] bm
149
resulta en el sistema = A0 + B0 Cc = Ac + Bc v y = Cc cuya funci on transferencia de v a y es una cadena de r integradores, y cuyo subvector de estado es inobservable desde y . Supongamos que queremos estabilizar al sistema con una realimentaci on v = K tal que Ac + Bc K sea Hurwitz. El correspondiente sistema a lazo cerrado es A0 B0 Cc = 0 Ac + Bc K (7.23)
Sabemos que para cualquier condici on inicial (0) tenemos que (t) 0 cuando t . Notemos que los estados tienen como entrada la salida y = Cc . Para asegurar que (t) se mantenga acotada para toda evoluci on acotada de y (t) es necesario que A0 sea Hurwitz, es decir, los ceros de H (s) deben tener parte real negativa. Vemos que la matriz de evoluci on en (7.23) tiene una forma triangular en bloques, y por lo tanto los autovalores de todo el sistema son la uni on de los autovalores de los bloques diagonales A0 y Ac + Bc K . Es decir, este control dise nado siguiendo el procedimiento de linealizaci on entrada-salida ubica r autovalores del sistema a lazo cerrado como los autovalores de Ac + Bc K , y los restantes n r autovalores iguales a los ceros del sistema a lazo abierto. Caso no lineal Busquemos una versi on no lineal del modelo (7.22). Las variables se toman igual que en el caso lineal, ya que la transformaci on de entrada-salida va a seguir siendo una cadena de r integradores. Para elegir las variables , va a ser importante respetar la caracter stica fundamental del modelo (7.22), que es que la entrada u no aparece en la ecuaci on de . Tomamos entonces 1 (x) . . . (x) (x) z = T (x) = nr (7.24) (x 1 (x) . . . r (x)
150
i donde 1 (x) = h(x) y i+1 (x) = f (x) , i = 1, 2, . . . , r 1, y las i se eligen tales que T (x) x sea un difeomorsmo en un dominio Dx D0 y
i g (x) = 0 , x
1 i n r , x Dx .
(7.25)
Esto siempre es posible para sistemas mono-entrada con grado relativo r. La condici on (7.25) asegura que = [ f ( x ) + g ( x ) u ] = f ( x ) no depende de u . x x En las nuevas variables el sistema queda en la forma normal = f0 (, ) = Ac + Bc (x)1 [u (x)] y = Cc donde Rr , Rnr , (Ac , Bc , Cc ) son la forma can onica de una cadena de r integradores y f0 (, ) = (x) = f (x) x
(7.26)
x=T 1 (z )
1 (r /x)g (x)
(x) =
(r /x)f (x) (r /x)g (x)
(7.27)
Notar que (x) y (x) no dependen de la elecci on de . La estructura del sistema en forma normal se representa (en coordenadas z ) en el diagrama de bloques de la Figura 7.2. u 1 y
E e E j T T
E r
' ' . . ' . '
E r 1 E
Ee
z
0 (z )1 '
0 (z ) '
' f0 (, ) '
x = f (x, u), y = h(x) Figura 7.2: Sistema en forma normal
7.2.2
Din amica de los Ceros
La forma normal (7.26) tiene una parte externa, representada por las variables , y una parte interna, representada por las variables . El control u = (x) + (x)v linealiza la parte externa y hace inobservable la parte interna. Haciendo = 0 en la primera ecuaci on tenemos la din amica de los ceros = f0 (, 0) (7.28)
151
que es la contraparte no lineal de = A0 , donde los autovalores de A0 son los ceros de H (s). El sistema se dice de m nima fase si la din amica de los ceros tiene un PE AE en el dominio de inter es. La ecuaci on (7.28) representa la din amica de los ceros en las nuevas variables. Podemos tambi en caracterizarla en las coordenadas originales. Notar que y (t) 0 = (t) 0 = u(t) (x(t)). Entonces, mantener la salida id enticamente cero implica que la soluci on de la ecuaci on de estados debe quedar connada al conjunto Z = {x D0 | 1 (x) = 2 (x) = = r (x) = 0}, y la entrada debe ser u = u (x) (x)|xZ .
La din amica de los ceros es entonces la din amica restringida x = f (x) = [f (x) + g (x)(x)]|xZ . Ejemplo 7.9 (Sistema de m nima fase). Consideremos el sistema x 1 = x1 + 2 + x2 3 u 1 + x2 3
x 2 = x3 x 3 = x1 x3 + u y = x2 que tiene un PE en el origen. Las derivadas de la salida son y =x 2 = x3 y =x 3 = x1 x3 + u Por lo tanto el sistema tiene GR 2 en R3 . Las variables de la transformaci on (7.24) son 1 (x) = x2 y 2 (x) = x3 . Usando (7.27) obtenemos = 1, = x1 x3
Para caracterizar la din amica de los ceros en las coordenadas originales, restringimos el estado al conjunto Z = {x R3 | x2 = x3 = 0} y tomamos u = u (x) = 0. Esto da como resultado x 1 = x1 lo que muestra que el sistema es de m nima fase. Para llevar al sistema a la forma normal tenemos que elegir la funci on (x) de la transformaci on (7.24) tal que (0) = 0 , g (x) = 0 x
152
y tal que T (x) sea un difeomorsmo en alg un dominio que contenga al origen. La ecuaci on en derivadas parciales 2 + x2 3 + =0 2 x1 1 + x3 x3 puede resolverse por el m etodo de separaci on de variables; esto da (x) = x1 + x3 + arctan x3 que satisface la condici on (0) = 0. La transformaci on T (x) es un difeomorsmo global, ya 3 que para cualquier z R , la ecuaci on T (x) = z tiene una soluci on u nica. Por lo tanto, la forma normal = ( 2 + arctan 2 ) 1 +
2 2 + 2 2 2 1 + 2
1 = 2 2 = ( 2 + arctan 2 ) 2 + u y = 1 est a denida en forma global.
7.3
7.3.1
Control por Realimentaci on de Estados

Estabilizaci on
Consideremos el sistema linealizable entrada-estado z = Az + B (x)1 [u (x)] , z = T (x)
donde T (x) es un difeomorsmo en un dominio Dx Rn , Dz = T (Dx ) contiene al origen, (A, B ) es controlable, (x) es no singular para todo x Dx , y y son continuamente diferenciables. Dise namos K tal que A + BK es Hurwitz. El control u = (x) + (x)KT (x) da el sistema lineal a lazo cerrado z = (A + BK )z (7.29)
Este resultado, sin embargo, est a basado en la cancelaci on exacta de t erminos no lineales. En general, debido a incertidumbre param etrica y errores computacionales, el control va a , que son aproximaciones de las ideales , implementar en la realidad funciones , y T y T . Es decir, el control real va a tener la forma (x)K T (x) u= (x) + El sistema a lazo cerrado con este control es entonces (x)K T (x) (x)] z = Az + B (x)1 [ (x) +
7.3 Control por Realimentaci on de Estados Sumando y restando el t ermino BKz , podemos re-escribir la ecuaci on anterior como z = (A + BK )z + B (z ) donde (x) (x)]KT (x) + (x)K [T (x) T (x)] (x) (x) + [ (z ) = (x)1
153
x=T 1 (z )
Vemos que el sistema a lazo cerrado es una perturbaci on del sistema nominal (7.29). Sea P = P t la soluci on de la ecuaci on de Lyapunov P (A + BK ) + (A + BK )P t = I y supongamos que en un entorno del origen el t ermino de error satisface (z )
2
1 z
+ 2 ,
1 , 2 > 0
Usando V (z ) = z t P z como candidata a funci on de Lyapunov para el sistema a lazo cerrado tenemos (z ) = z 2 + 2z t P B (z ) V 2 2 z 2 2 + 2 P B 2 1 z 2 + 2 P B 2 2 z 2 = (1 2 P B 2 1 ) z 2 2 + 2 P B 2 2 z 2 Si 1 < 1 4 PB
tenemos que (z ) 1 z V 2
2 2
+ 2 P B 2 2 z
< 0,
4 P B 2 2
lo que demuestra que las trayectorias del sistema perturbado son nalmente acotadas con cota nal proporcional a 2 .
7.3.2
Sistema Parcialmente Linealizable
Consideremos ahora el caso en que el sistema es linealizable s olo parcialmente, es decir, la ecuaci on de estado tiene la forma = f0 (, ) = A + B (x)1 [u (x)] donde z = T (x) = T1 (x) T2 (x) (7.30)
T (x) es un difeomorsmo en un dominio Dx Rn , Dz = T (Dx ) contiene al origen, (A, B ) es controlable, (x) es no singular para todo x Dx , f0 (0, 0) = 0, y f0 (, ), (x) y (x) son continuamente diferenciables. La forma (7.30) est a basada en la forma normal (7.26),
154
pero en este caso no consideramos la salida porque no juega ning un papel en el problema de estabilizaci on. El control u = (x) + (x)K = (x) + (x)KT2 (x) con K tal que A + BK es Hurwitz, lleva el sistema a la forma triangular = f0 (, ) = (A + BK ) (7.32) (7.31)
donde el subsistema es tiene un PE GAE en = 0. Para analizar la estabilidad de todo el sistema (7.32) vamos a usar los resultados de la Secci on 5.4 del Cap tulo 5. El sistema (7.32) va a tener un PE AE en el origen si el subsistema es (localmente) ISS cuando se considera su entrada. El Lema 5.8 garantiza que el subsistema de (7.32) es localmente ISS si el sistema no forzado = f0 (, 0) tiene un PE AE en = 0. Por lo tanto, un sistema linealizable entrada-salida que sea m nima fase es localmente estabilizado asint oticamente por el control (7.31). Para probar estabilizaci on asint otica global debemos garantizar que el subsistema de (7.32) sea ISS (globalmente). Usando el Lema 5.9 vemos que esto es as , por ejemplo, si el origen de = f0 (, 0) es globalmente exponencialmente estable y f0 (, ) es globalmente Lipschitz en (, ), aunque estas condiciones son bastante exigentes. Si el origen de = f0 (, 0) es GAE, se podr a pensar que el sistema triangular (7.32) se estabilizar a globalmente si los estados decaen a cero arbitrariamente r apido. Esto indicar a que la soluci on de = f0 (, ) se aproxima r apidamente a la de = f0 (, 0), que tiende a cero. Vamos a ver en el ejemplo siguiente que esta no es necesariamente una buena estrategia debido al fen omeno de peaking. Ejemplo 7.10 (Peaking). Consideremos el sistema 1 = (1 + 2 ) 3 2 1 = 2 1 = v. El control lineal v = 2 1 22 K
asigna los autovalores de A + BK en (, ). Para la condici on inicial (0) = 0 , 1 (0) = 1, 2 (0) = 0, el estado 2 tiene la evoluci on 2 (t) = 2 tet
7.3 Control por Realimentaci on de Estados
155
cuyo valor absoluto alcanza un pico proporcional a antes de decaer a cero. Vamos a ver que este pico puede interferir con la estabilidad del sistema aunque tienda a cero r apidamente. El estado satisface 1 = (1 2 tet ) 3 2 Durante el per odo de peaking, el coeciente de 3 es positivo, lo que hace que | (t)| crezca. En alg un momento el coeciente de 3 se har a negativo, pero esto puede que no suceda lo sucientemente r apido para evitar que el sistema tenga escape en tiempo nito. Para ver esto, consideremos la variable = 1/ 2 , que satisface la ecuaci on = 1 [(1 + 2 ) 3 ] = 1 + 2 3
de la cual, integrando, obtenemos (t) = (0) + m(t) (0) + t + (1 + t)et 1
Por lo tanto, la variable 2 satisface 2 (t) = 1 = (t)

1 2 (0)
1 + m(t)
(7.33)
La funci on m(t) se hace negativa para alg un t nito si es sucientemente grande. Esto quiere decir que, si es elegido sucientemente grande, siempre van a existir condiciones iniciales (0) tal que el denominador de (7.33) pase por cero, con lo cual la variable escapa a innito en tiempo nito. Vamos a volver al sistema triangular (7.30) en el Cap tulo 8, y vamos a ver c omo dise nar v como funci on no lineal de y para alcanzar estabilidad asint otica global, a un cuando la din amica de los ceros no sea ISS. Concluimos esta secci on discutiendo una limitaci on de la linealizaci on exacta por realimentaci on. B asicamente, esta t ecnica de linealizaci on se basa en la cancelaci on de los t erminos no lineales del sistema. Sin embargo, no siempre es buena idea cancelar alinealidades, dado que puede haber alinealidades convenientes desde el punto de vista de desempe no del sistema. Ilustramos la idea con un ejemplo. Ejemplo 7.11 (No siempre es bueno cancelar alinealidades). Consideremos el sistema escalar x = ax bx3 + u, donde a y b son constantes positivas. Podemos tomar el control linealizante y estabilizante u = ( + a)x + bx3 , > 0,
que resulta en el sistema a lazo cerrado x = x. Este control cancela el t ermino bx3 , que provee amortiguamiento no lineal al sistema. De hecho, este t ermino garantiza que las soluciones del sistema sean acotadas, sin ning un control, y a pesar de que el origen sea inestable. Por qu e cancelarlo entonces? Alternativamente, usando el control lineal u = ( + a)x, > 0,
156 obtendr amos el sistema a lazo cerrado x = x bx3 ,
cuyo origen es globalmente asint oticamente estable y sus trayectorias se aproximan al origen m as r apido que las de x = x. M as a un, el control lineal es m as simple de implementar y usa menos esfuerzo de control. La idea del ejemplo anterior es ilustrar que la teor a de linealizaci on por realimentaci on da una herramienta muy valiosa para representar al sistema en una forma en la que todos los t erminos alineales entran a la ecuaci on de estado en el mismo punto en que entra el control. En el pr oximo cap tulo vamos a ver t ecnicas que explotan esta estructura. La misma estructura permite que se puedan cancelar las alinealidades por realimentaci on, pero, no hay que perder de vista, dado el ejemplo anterior, que esta no siempre es la alternativa m as adecuada.
7.3.3
Regulaci on con Acci on Integral
Usando el esquema de la secci on anterior linealizaci on exacta por realimentaci on m as dise no de una ganancia de realimentaci on de estados lineal podemos dise nar un sistema para regular la salida y a un valor constante de referencia yR , como se muestra en la Figura 7.3. La ganancia est atica N = [C (A + BK )1 B ]1 sirve, como en el caso lineal, para compensar el error est atico de seguimiento. yc R u + +T T +T (x)
T
E N
E E j E j
x
E E
x
e E h(x)
f (x, u)
Ec
(x)
T
K '
T (x) '
Figura 7.3: Esquema de regulaci on v a linealizaci on exacta
Como en el caso lineal, tambi en podemos agregar acci on integral al esquema de la Figura 7.3 para lograr regulaci on de la salida en forma robusta. Consideramos el sistema mono-entrada mono-salida, linealizable entrada-salida, y representado en la forma normal (7.26) = f0 (, ) = Ac + Bc 1 [u (x)] (x) y = Cc . Sin p erdida de generalidad, asumimos que f0 (0, 0) = 0. Pretendemos dise nar un control de forma que la salida y siga en forma asint otica una referencia constante yR usando acci on integral para preservar regulaci on a un en presencia de incertidumbres param etricas.
7.3 Control por Realimentaci on de Estados
157
Adem as de asumir que el vector de estados es medible, suponemos que la salida es tambi en f sicamente medible no es suciente calcular y de x usando y = h(x), ya que si hubiera incertidumbres en h podr amos perder la regulaci on. Integramos entonces el error de seguimiento e = y yR aumentando el sistema con el integrador = e, obteniendo = f0 (, e + YR ) a = Aa + B 1 [u (x)], (x) donde Ac 0 , Cc 0 Bc , 0 yR 0 YR = . , e = YR , . . 0 r 1 e .
A=
B=
y a =
Notar que el agregado de la ecuaci on de no modica la estructura de la forma normal. El par de matrices aumentadas (A, B ) es controlable, como puede vericarse, y por lo tanto podemos calcular una matriz K tal que A + B K sea Hurwitz, procediendo en forma id entica a como hicimos en la secci on anterior. Particionando K = [K1 K2 ], donde K1 R1r y K2 R, armamos el control u = (x) + (x){K1 [T2 (x) YR ] + K2 }, que da el lazo cerrado = f0 (, e + YR ) a = (A + B K )a . El esquema de regulaci on con acci on integral se representa en la Figura 7.4. yR +T
e E K 2
c E j E
E j E E j +T T +T
u
E E
x f (x, u)
E e
x
E h(x)
Ec
(x)
T
(x)
T
+ ' T2 (x) ' K1 ' j T YR Figura 7.4: Regulador con acci on integral v a linealizaci on por realimentaci on Para sistemas de m nima fase, la ecuaci on = f0 (, e + YR ) es localmente ISS y el control calculado resuelve el problema de regulaci on local. Una condici on suciente para obtener seguimiento global es pedir que el sistema = f0 (, e + YR ) sea ISS.
158
7.4
Ejercicios
Ejercicio 7.1 El mecanismo de control de una articulaci on simple de robot puede modelarse mediante las ecuaciones x 1 = x2 M gL k x 2 = sen x1 (x1 x3 ) I I x 3 = x4 k x 4 = (x1 x3 ) + u, J donde M, g, L, I y J son constantes positivas. Mostrar que el sistema es linealizable entradaestado.
Ejercicio 7.2 Para cada uno de los siguientes sistemas mostrar que el sistema es linealizable entrada-estado. Dar la transformaci on que lleva al sistema a la forma z = Az + B 1 (x)[u (x)] y especicar el domino sobre el cual es v alida. x 1 = ex2 u x2 x 2 = x1 + x2 2+e u x 3 = x1 x2 x 1 = x3 (1 + x2 ) x 2 = x1 + (1 + x2 )u x 3 = x2 (1 + x1 ) x3 u Ayuda: Para (7.34) usar T1 = T1 (x3 ) y para (7.35) T1 = T1 (x1 ).
(7.34)
(7.35)
Ejercicio 7.3 Sea el sistema x 1 = x1 + x2 x3 x 2 = x1 x3 x2 + u x 3 = x1 + u. (i) Es el sistema linealizable entrada-estado? (ii) Si s , encontrar un control en realimentaci on y un cambio de coordenadas que linealice la ecuaci on de estados.
7.4 Ejercicios Ejercicio 7.4 Sea el sistema x 1 x 2 x 3 y = x1 + x2 x3 = x1 x3 x2 + u = x1 + u = x3 .
159
(i) Es el sistema linealizable entrada-salida? (ii) Si s , transformarlo a la forma normal y especicar la regi on sobre la cual la transformaci on es v alida. (iii) Es el sistema de m nima fase? Ejercicio 7.5 Un generador sincr onico conectado a una l nea innita puede representarse por el modelo x = f (x) + gu donde x2 f (x) = a[(1 + x3 ) sen(x1 + ) sen ] bx2 , cx3 + d[cos(x1 + ) cos ] 0 g = 0 , 1
donde a, b, c y d son constantes positivas. Considerar las siguientes dos posibles salidas, y1 = h1 (x) = x1 ; y2 = h2 (x) = x1 + x2 ,
= 0.
En cada caso, estudiar el grado relativo del sistema y transformarlo a la forma normal. Especicar la regi on sobre la cual la transformaci on es v alida. Si existe din amica de ceros no trivial, determinar si el sistema es de m nima fase o no. Ejercicio 7.6 Considerar el sistema de p endulo invertido del Ejercicio 6.2. Suponiendo que la salida es y = , es el sistema linealizable entrada-salida? Es de m nima fase? Ejercicio 7.7 Considerar el sistema x 1 = tan x1 + x2 x 2 = x1 + u y = x2 . Es el sistema linealizable entrada-salida? Es de m nima fase?
160 Ejercicio 7.8 Sea el sistema del p endulo x 1 = x2 x 2 = a[sen(x1 + ) sen ] bx2 + cu,
y u = T a sen . Para los valores a = 1 = c, b = 0 y = /4, dise donde x1 = , x2 = nar c un control estabilizante v a linealizaci on exacta por realimentaci on de estados, ubicando los autovalores del sistema a lazo cerrado en 1 j 3/2. Comparar el desempe no obtenido con el del control v a linealizaci on aproximada. Ejercicio 7.9 Mostrar que el sistema x 1 = a(x2 x1 ), a > 0, x 2 = bx1 x2 x1 x3 + u, b > 0, x 3 = x1 + x1 x2 2ax3 , es linealizable entrada-estado y dise nar un control por realimentaci on de estados para estabilizar globalmente el origen. Ejercicio 7.10 Considerar el sistema de suspensi on magn etica del Ejercicio 6.1. (i) Mostrar que el sistema es linealizable entrada-estado. Ayuda: Probar con T1 (x) = T1 (x1 ). (ii) Usando linealizaci on exacta por realimentaci on, dise nar un control por realimentaci on de estados para estabilizar la bola en una posici on deseada yR > 0. (iii) Repetir los puntos (e) y (f) del Ejercicio 6.1. Comparar el desempe no obtenido con el del controlador dise nado en el punto (d) de ese ejercicio. (iv) Usando linealizaci on exacta por realimentaci on, dise nar un control integral por realimentaci on de estados para estabilizar la bola en una posici on deseada yR > 0. (v) Repetir el punto (iii) anterior para el control dise nado en (iv). Comparar el desempe no del control integral con el dise nado en el punto (ii).
Cap tulo 8 Dise nos Basados en Lyapunov

El m etodo de Lyapunov, originalmente utilizado como herramienta de an alisis de sistemas, es adem as una herramienta u til en el dise no de control por realimentaci on. Existen muchos m etodos basados en la idea de dise nar el control de forma que la derivada de una funci on de Lyapunov tenga ciertas propiedades que garanticen estabilidad de las trayectorias del sistema a lazo cerrado con respecto a un punto o un conjunto de equilibrios. En este cap tulo presentamos dos m etodos de este tipo. El primero (8.1) es el m etodo de redise no Lyapunov por amortiguamiento no lineal (nonlinear damping), que permite robusticar un dise no dado para que tolere cierto tipo de incertidumbres y errores de modelado que satisfacen la condici on de apareamiento (matching condition) es decir, incertidumbre y errores que ocurren en el mismo punto del lazo donde se aplica el control. El segundo m etodo (8.2) es backstepping, un poderoso m etodo recursivo que permite obtener dise nos robustos frente a incertidumbres y errores que no necesariamente satisfagan la condici on de apareamiento. Referimos a Khalil [1996, Cap tulo 13] para ver otras t ecnicas basadas en Lyapunov, como redise nos Lyapunov, que generalizan la idea de amortiguamiento no lineal, y el control adaptable, que muestra una aplicaci on pr actica de los teoremas de invariancia vistos en 4.14.
8.1
Redise no Lyapunov para Robusticar por Amortiguamiento No Lineal

x = f (t, x) + g (t, x)[u + (t, x) (t, x, u)], (8.1)
Consideremos el sistema af n en el control
donde x Rn es el estado y u Rp la entrada de control. Las funciones f , g , y est an p n denidas para (t, x, u) [0, ) D R , donde D R es un dominio que contiene el origen. Asumimos que f, g, y son seccionalmente continuas en t y localmente Lipschitz en x y u para todo (t, x, u) en el dominio de inter es. Asumimos que las funciones f, g y son conocidas, mientras que representa incertidumbres de modelado, y de la cual s olo se sabe que es uniformemente acotada para todo (t, x, u). Las incertidumbres representadas en tienen una estructura especial: satisfacen la condici on de apareamiento vale decir que afectan a la ecuaci on de estado en los mismos puntos que lo hace la entrada de control. Suponiendo que se conoce un control por realimentaci on de estados u = (t, x) que alcanza estabilidad asint otica global del origen del sistema nominal x = f (t, x) + g (t, x)u (8.2)
162
Dise nos Basados en Lyapunov
pretendemos redise nar u de forma de robusticar el dise no nominal y hacer que el sistema a lazo cerrado preserve sus propiedades de estabilidad frente a las incertidumbres . Sea entonces (t, x) tal que el origen de x = f (t, x) + g (t, x) (t, x) (8.3)
es globalmente asint oticamente estable, y sea V (t, x) una funci on de Lyapunov conocida que satisface 1 ( x ) V (t, x) 2 ( x ) V V + [f (t, x) + g (t, x) (t, x)] 3 ( x ) t x (8.4) (8.5)
para todo [t, x) [0, ) D, donde 1 , 2 y 3 son funciones clase K . Consideremos el sistema (8.1) y apliquemos el control u = (t, x) + v . El sistema a lazo cerrado obtenido, x = f (t, x) + g (t, x) (t, x) + g (t, x)[v + (t, x) (t, x, (t, x) + v ))], (8.6)
es una perturbaci on del sistema a lazo cerrado nominal (8.3). Calculemos la derivada de V a lo largo de las trayectorias de (8.6),1 = V + V [f + g ] + V g [v + ] V t x x V 3 + g [v + ]. x Introduzcamos la notaci on wT 3 + wT v + wT . V Tomando v = w 2 2, obtenemos 3 w V
2 2 V g, x
con la que la desigualdad anterior queda
> 0,
(8.7)
2 2
+ w
2 k,
donde k es una cota (desconocida pero nita) de . El t ermino w

2 2
2 2
+ w
k2 4
2k
2
alcanza un m aximo
en w
k . 2
Por lo tanto,
2 (x) 3 ( x ) + k V 4
siempre ser Como 3 es clase K , V a negativa fuera de alguna bola, con lo que las soluciones del sistema a lazo cerrado ser an uniformemente acotadas. El redise no de Lyapunov (8.7) se llama amortiguamiento no lineal. Resumimos nuestras conclusiones en el siguiente lema.
1
Para simplicar la notaci on omitimos la dependencia de las variables t y x.
8.2 Backstepping
163
Lema 8.1 (Amortiguamiento no lineal). Sea el sistema (8.1) y sea (t, x) un control por realimentaci on estabilizante para el sistema nominal (8.2) con funci on de Lyapunov V (t, x) que satisface (8.4)(8.5) para todo t 0 y todo x Rn , con ciertas funciones 1 (), 2 () y 3 () clase K . Supongamos que el t ermino de incertidumbres es uniformemente acotado para (t, x, u) [0, ) Rn Rp . Sea v dada por (8.7) y u = (t, x) + v . Entonces, para cualquier x(t0 ) Rn la soluci on del sistema a lazo cerrado es uniformemente acotada. Ejemplo 8.1 (Robusticaci on por amortiguamiento no lineal). Sea el sistema escalar x = x3 + u + x (t) donde (t) es una funci on acotada de t. Con el control estabilizante (x) = x3 x, la funci on 2 2 de Lyapunov V (x) = x satisface (8.4)(8.5) globalmente con 1 (r) = 2 (r) = 3 (r) = r . La componente de amortiguamiento no lineal (8.7), con = 1, es v = 2x3 . El sistema a lazo cerrado x = x 2x3 + x (t) tiene soluciones acotadas independientemente de cuan grandes sean las perturbaciones , gracias al t ermino de amortiguamiento no lineal 2x3 .
8.2
Backstepping
Backstepping es un procedimiento recursivo que combina la elecci on de una funci on de Lyapunov con el dise no de un control en realimentaci on. Descompone el problema original en una secuencia de problemas de dise no para sistemas de orden reducido (que hasta pueden llegar a ser escalares). Explotando la exibilidad adicional que existe con sistemas de bajo orden y escalares, backstepping a menudo puede resolver problemas de estabilizaci on, seguimiento y control robusto bajo condiciones menos restrictivas que las encontradas en otros m etodos.
8.2.1
Backstepping de un integrador
Introducimos la t ecnica de backstepping en el caso especial de backstepping de un integrador. Consideremos el sistema = f ( ) + g ( ) =u (8.8) (8.9)
donde Rn , R son los estados y u R es la entrada de control. Las funciones f : D Rn y g : D Rn son suaves en un dominio D Rn que contiene a = 0, y f (0) = 0. Queremos dise nar un control por realimentaci on de estados que estabilice el origen = 0, = 0. El sistema (8.8)(8.9) puede pensarse como la conexi on en cascada de dos componentes, como se ve en la Figura 8.1. La primera componente es (8.8), con como entrada, y la segunda es el integrador (8.9). Supongamos que sabemos que la componente (8.8) puede estabilizarse con un control suave = ( ), con (0) = 0, vale decir, el origen de = f ( ) + g ( )( )
164
E t t ( ( E g ( ) T
E m T
t t ( (
Ed
f ( ) f () '
Figura 8.1: Diagrama de bloques del sistema (8.8)(8.9)
es asint oticamente estable. M as a un, supongamos que se conoce una funci on de Lyapunov V ( ) (suave, denida positiva) que satisface V [f ( ) + g ( )( )] W ( ) , D, (8.10)
donde W ( ) es denida positiva. Sumando y restando g ( )( ) al lado derecho de (8.8), obtenemos la representaci on equivalente = [f ( ) + g ( )( )] + g ( ) [ ( )] = u, que se muestra en la Figura 8.2.
d
u
E
t t E m E g ( ) ( ( T T d
E m T
t t ( (
Ed
f () + g ()() '
Figura 8.2: Introducci on de ( )
Con el cambio de variables z = ( ) , obtenemos el sistema = [f ( ) + g ( )( )] + g ( ) z z = v, (8.11) v = u ,
que se muestra en la Figura 8.3. Notar que, como f , g y son conocidas, podemos calcular usando la expresi la derivada on = [f ( ) + g ( ) ].
8.2 Backstepping
165
dE m E T
z
t t ( ( E g ( ) T
E m T
t t ( (
Ed
f () + g ()() '
Figura 8.3: Backstepping de ( ) a trav es del integrador
El sistema (8.11) tiene la misma estructura que el sistema original, pero ahora la primera componente = [f ( ) + g ( )( )] + g ( ) z tiene un punto de equilibrio asint oticamente estable en el origen cuando su entrada z es cero. Esta caracter stica va a ser explotada en el dise no de un control v que estabilice todo el sistema. Consideremos como candidata a funci on de Lyapunov para (8.11) la funci on Va (, z ) = V ( ) + 1 z2 2 cuya derivada a lo largo de las trayectorias de (8.11) satisface a = V [f ( ) + g ( )( )] + V g ( ) z + z v V V W ( ) + g ( ) + v z. Eligiendo v= obtenemos a W ( ) k z 2 , V que muestra que el origen = 0, z = 0 es asint oticamente estable. Como (0) = 0, concluimos que el origen = 0, = 0 es asint oticamente estable. Substituyendo las expresiones de v , z y , obtenemos el control en realimentaci on de estados u= V [f ( ) + g ( ) ] g ( ) k [ ( )] (8.13) V g ( ) k z , k>0 (8.12)
Si las hip otesis valen globalmente y V ( ) es radialmente no acotada, concluimos que el origen es globalmente asint oticamente estable. Esta t ecnica se denomina integrator backstepping 2 ya que el control virtual = ( ) se corre un integrador para atr as para obtener el control real u (ver la secuencia en las Figuras 8.1, 8.2 y 8.3). Resumimos el resultado en el siguiente lema.
2
De step back an integrator: retroceder un integrador.
166
Lema 8.2 (Backstepping de un integrador). Sea el sistema (8.8)(8.9). Sea ( ) un control por realimentaci on de estados estabilizante para (8.8) con (0) = 0 y sea V ( ) una funci on de Lyapunov que satisface (8.10) con alguna funci on denida positiva W ( ). Entonces, el control por realimentaci on de estados (8.13) estabiliza el origen de (8.8)(8.9) con V ( ) + 1 2 [ ( )] como funci o n de Lyapunov. Adem as, si todas las hip otesis valen globalmente y 2 V ( ) es radialmente no acotada, el origen ser a globalmente asint oticamente estable. Ejemplo 8.2. Consideremos el sistema
3 x 1 = x2 1 x1 + x2 x 2 = u,
que tiene la forma (8.8) con = x1 y = x2 . Empezamos con el sistema escalar

3 x 1 = x2 1 x1 + x2 ,
tomando a x2 como entrada, y dise namos un control x2 = (x1 ) que estabilice el origen x1 = 0. Tomamos, por ejemplo x2 = (x1 ) = x2 1 x1 y V (x1 ) = x2 1 /2, que satisfacen = x2 x4 x2 , V 1 1 1 x1 R
El control por backstepping (8.13) para este ejemplo es u= 2 V (x1 x3 [x2 (x1 )] 1 + x2 ) x1 x1 3 2 = (2x1 + 1)(x2 1 x1 + x2 ) x1 (x2 + x1 + x1 )
(8.14)
y la funci on de Lyapunov total (8.12) es Va (x1 , x2 ) = 1 2 1 2 x + (x2 + x2 1 + x1 ) 2 1 2 (8.15) Para sistemas de mayor orden, se puede aplicar backstepping en forma recursiva, como ilustramos en el siguiente ejemplo. Ejemplo 8.3. El sistema de tercer orden
3 x 1 = x2 1 x1 + x2 x 2 = x3 x 3 = u
est a formado por el sistema de segundo orden del ejemplo anterior con un integrador adicional a la entrada. Por el ejemplo anterior sabemos que el subsistema formado por las dos primeras ecuaciones puede estabilizarse con el control virtual (8.14), o sea
3 2 x3 = (2x1 + 1)(x2 1 x1 + x2 ) x1 (x2 + x1 + x1 )
1 (x1 , x2 )
8.2 Backstepping
167
y (8.15) es la funci on de Lyapunov correspondiente. Ahora podemos considerar al sistema de tercer orden como un caso especial del sistema (8.8)(8.9) con = x1 , x2 = x3 f=
3 x2 1 x1 + x2 , 0
g=
0 1
y aplicar nuevamente backstepping. El control u de la forma (8.13) es entonces u= 1 V1 1 2 (x1 x3 x3 [x3 1 (x1 , x2 )] 1 + x2 ) + x1 x2 x2 1 [x3 1 (x1 , x2 )] 2
donde V1 est a dada por (8.15), y la funci on de Lyapunov total es V2 (x1 , x2 , x3 ) = V1 (x1 , x2 ) +
8.2.2
Backstepping de sistemas en realimentaci on estricta
M as generalmente, backstepping de un integrador puede aplicarse al sistema = f ( ) + g ( ) = fa (, ) + ga (, ) u (8.16)
donde fa , ga son suaves y ga (, ) = 0 en el dominio de inter es. Notar que el segundo subsistema de (8.16) no es un integrador puro sino un integrador perturbado por la presencia de las alinealidades fa y ga . Esta perturbaci on es f acilmente manejable, sin embargo, mediante la transformaci on de entrada 1 [ua fa (, )], (8.17) u= ga (, ) = ua . Si conocemos, como que reduce al segundo subsistema de (8.16) al integrador puro antes, el par de funciones ( ) y V ( ) correspondientes a la estabilizaci on del primer subsistema de (8.16), podemos tomar ua igual al control (8.13), y combin andolo con (8.17) obtener el control por backstepping para (8.16) u = a (, ) 1 ga (, ) V [f ( ) + g ( ) ] g ( ) k [ ( )] fa (, ) , (8.18)
con k > 0. La correspondiente funci on de Lyapunov total es 1 [ ( )]2 . (8.19) 2 Aplicando recursivamente el control por backstepping de un integrador, pueden estabilizarse sistemas en forma de realimentaci on estricta (strict feedback) Va (, ) = V ( ) + x = f0 (x) + g0 (x) 1 1 = f1 (x, 1 ) + g1 (x, 1 ) 2 2 = f2 (x, 1 , 2 ) + g2 (x, 1 , 2 ) 3 . . . n1 = fn1 (x, 1 , . . . , n1 ) + gn1 (x, 1 , . . . , n1 ) n n = fn (x, 1 , . . . , n ) + gn (x, 1 , . . . , n ) u (8.20)
168
donde x Rm , u, 1 , . . . , n R, y las funciones f0 , . . . , fn se anulan en el origen. Asumimos que gi (x, 1 , . . . , i ) = 0 en el dominio de inter es, para i = 1, . . . , n. La raz on por la cual llamamos a sistemas de este tipo en realimentaci on estricta es que las funciones fi y gi en las n i dependen s ecuaciones de olo de x, 1 , . . . , i , es decir, s olo de variables que son realimentadas. El procedimiento recursivo de backstepping comienza, como antes, con el sistema x = f0 (x) + g0 (x) 1 donde 1 se considera la entrada de control virtual. Asumimos que es posible encontrar un control 1 = 0 (x), con 0 (0) = 0, y una funci on de Lyapunov V0 (x) tal que V0 [f0 (x) + g0 (x)0 (x)] W0 (x) x en el dominio de inter es para alguna funci on W0 (x) denida positiva. El siguiente paso es considerar el sistema x = f0 (x) + g0 (x) 1 1 = f1 (x, 1 ) + g1 (x, 1 ) 2 que est a en la forma (8.16) con = x, = 1 , u = 2 , f = f0 , g = g0 , fa = f1 y ga = g1 . Usando (8.18) y (8.19), tenemos que 1 (x, 1 ) = V0 1 0 (f0 + g0 1 ) g0 k1 (1 0 ) f1 , g1 x x 1 V1 (x, 1 ) = V0 (x) + [1 0 (x)]2 2 k1 > 0
son el control estabilizante y la correspondiente funci on de Lyapunov para este sistema. Luego consideramos el sistema x = f0 (x) + g0 (x) 1 1 = f1 (x, 1 ) + g1 (x, 1 ) 2 2 = f2 (x, 1 , 2 ) + g2 (x, 1 , 2 ) 3 como un caso particular de (8.16) para = x , 1 = 2 , f= f0 + g0 1 , f1 g= 0 , g1 fa = f2 , ga = g2 .
Usando (8.18) y (8.19), obtenemos el control estabilizante y la correspondiente funci on de Lyapunov para este sistema 2 (x, 1 , 2 ) = 1 1 1 V1 (f0 + g0 1 ) + (f1 + g1 2 ) g1 k2 (2 1 ) f2 , g2 x 1 1 1 V2 (x, 1 , 2 ) = V1 (x, 1 ) + [2 1 (x, 1 )]2 2 k2 > 0
y as el procedimiento se repite n veces hasta obtener un control estabilizante u = n (x, 1 , . . . , n ) y la funci on de Lyapunov correspondiente Vn (x, 1 , . . . , n ) para el sistema completo.
8.3 Ejercicios Ejemplo 8.4. El sistema monoentrada monosalida en la forma normal especial x = f0 (x) + g0 (x) 1 1 = 2 . . . r1 = r r = [u (x, 1 , . . . , r )]/ (x, 1 , . . . , r ) y = 1
169
(8.21)
es un caso particular de la forma (8.20). Si el sistema es m nima fase, el origen de la din amica de los ceros x = f0 (x) es asint oticamente estable, y en el primer paso de backstepping podemos tomar simplemente 0 (x) = 0, y V0 (x) cualquier funci on de Lyapunov para la din amica de los ceros. Si el sistema es nom nima fase, lo que vimos en este cap tulo muestra que backstepping puede estabilizar al sistema si podemos resolver el problema de estabilizaci on de la din amica de los ceros. Por ejemplo, si la primera ecuaci on de (8.21) es x = x + x2 1 el sistema es m nima fase ya que la din amica de los ceros x = x es globalmente exponencialmente estable. Entonces podemos iniciar el procedimiento de backstepping a trav es de los r 2 integradores con 0 (x) = 0 y V0 (x) = x /2, por ejemplo. Por otro lado, si la primera ecuaci on de (8.21) es x = x2 x 1 (8.22) el sistema es de no m nima fase ya que la din amica de los ceros x = x2 es inestable. En este caso tenemos que resolver primero el problema de estabilizaci on del sistema (8.22) con entrada 2 1 . Un posible par 0 , V0 para este sistema es 0 (x) = x + x y V0 (x) = x2 /2; luego se continua con el procedimiento de backstepping.
8.3
Ejercicios
Ejercicio 8.1 Para cada uno de los siguientes sistemas escalares, usar amortiguamiento no lineal para dise nar un control por realimentaci on de estados que garantice que el estado x(t) est e siempre acotado y uniformemente nalmente acotado con cota nal . La funci on (t) es acotada para todo t 0 aunque la cota es desconocida. (i) x = x + x2 [u + (t)] (ii) x = x2 [1 + (t)] xu Ejercicio 8.2 Usando backstepping, dise nar un control por realimentaci on de estados que estabilice globalmente el origen del sistema x 1 = x1 x2 x 2 = x1 + u
170
Puede el origen estabilizarse globalmente mediante linealizaci on exacta? Ejercicio 8.3 Sea el sistema
3 x 1 = x2 3x2 1 /2 x1 /2 x 2 = u
(i) Usando backstepping, dise nar un control por realimentaci on de estados lineal que estabilice globalmente el origen del sistema. Ayuda: No cancelar los t erminos no lineales. (ii) Dise nar control por realimentaci on de estados que estabilice globalmente el origen del sistema usando realimentaci on exacta. (iii) Comparar ambos dise nos. Ejercicio 8.4 Sea el sistema x 1 = x1 + x2 1 [x2 + (t)] x 2 = u donde (t) es acotada para todo t 0 aunque la cota es desconocida. Combinando backstepping y amortiguamiento no lineal dise nar un control por realimentaci on de estados que 2 garantice que el estado x(t) est e globalmente acotado para todo x(0) R . Ejercicio 8.5 Considerar el sistema de suspensi on magn etica del Ejercicio 6.1. Usando backstepping, dise nar un control por realimentaci on de estados para la entrada de tensi on u que estabilice la bola en la posici on deseada y = yR . Ejercicio 8.6 Considerar el sistema del Ejercicio 7.9. (i) Comenzando con las dos primeras ecuaciones, usar backstepping para dise nar un control por realimentaci on de estados u = (x) tal que el origen (x1 , x2 ) = (0, 0) sea globalmente exponencialmente estable. (ii) Mostrar que con el control del apartado anterior, el origen x = 0 del sistema completo es globalmente asint oticamente estable. (iii) Comparar este control con el que se dise n o en el Ejercicio 7.9.
8.3 Ejercicios Ejercicio 8.7 Considerar el sistema x = + x2 = 3 + x =u
171
Sea xr (t) una se nal de referencia suave (con derivadas continuas de todo orden). Se pide dise nar el control u tal que
t
lim [x(t) xr (t)] = 0
manteniendo todos los estados acotados para todo t. Justicar la respuesta. Ayuda: Considerar primero el subsistema (, x) con como la entrada de control, tomar una nueva variable z = x xr y calcular un control = (, z, xr , x r ) que consiga que z 0. z 2 y la ley de control hallada en el punto anterior para calcular u Usar V1 (z ) = 1 2 usando backstepping. Ejercicio 8.8 Considerar el modelo rotacional de una nave espacial r gida: = H () = J 1 S ( ) J + J 1 u (8.23) (8.24)
donde R3 es la velocidad angular, R3 es la orientaci on o posici on angular (en 3 coordenadas especiales, llamadas par ametros de CayleyRodrigues), u R es el torque de entrada o control, J > 0 es la matriz de inercia. La matriz S (x), para x = [x1 , x2 , x3 ] es antisim etrica y dada por 0 x3 x2 x1 S (x) = x3 0 x2 x1 0 y la matriz H () est a denida como H () = 1 [I S () + ] 2
Considerar como la entrada de control para la primera ecuaci on (8.23) y calcular un control = () que consiga estabilidad exponencial global del PE = 0 con respecto a la funci on de Lyapunov V1 () = 1 = 1 2. 2 2 Dise nar el control u usando backstepping para que el PE (, ) = (0, 0) del sistema (8.23)(8.24) sea GAE.
Bibliograf a
John S. Bay. Fundamentals of Linear State Space Systems. WCB/McGraw-Hill, 1999. Chi-Tsong Chen. Linear System Theory and Design. Oxford University Press, 3rd edition, 1999. G.H. Golub and C.F. van Loan. Matrix computations. Johns Hopkins University Press, 3 edition, 1996. J. Guckenheimer and P. Holmes. Nonlinear oscillations, dynamical systems and bifurcations of vector elds. Springer, 1983. A. Isidori, A.J. Krener, C. Gori-Giorgi, and S. Monaco. Nonlinear decoupling via feedback: A dierential geometric approach. IEEE Trans. Automat. Contr., 26:331345, 1981. Alberto Isidori. Nonlinear control systems. Springer-Verlag, 3rd edition, 1995. Alberto Isidori. Nonlinear control systems II. Springer-Verlag, 1999. H. K. Khalil. Nonlinear systems. Prentice-Hall, 2nd edition, 1996. M. Krsti c, I. Kanellakopoulos, and P. V. Kokotovi c. Nonlinear and adaptive control design. John Wiley & Sons, 1995. Shankar Sastry. Nonlinear Systems: Analysis, Stability and Control. Interdisciplinary Applied Mathematics. Springer, 1999. R. Sepulchre, M. Jankovi c, and P. V. Kokotovi c. Constructive Nonlinear Control. CCES Series. Springer-Verlag, 1997. E. D. Sontag. Smooth stabilization implies coprime factorization. IEEE Trans. Automat. Contr., 34:435443, 1989. E.D. Sontag and Y. Wang. On characterizations of the input-to-state stability property. Systems and Control Letters, 24:351359, 1995. A. J. van der Schaft. L2 -gain and passivity techniques in nonlinear control. Springer-Verlag, 2000. W. M. Wonham. Linear Multivariable Control: A Geometric Approach. Third Edition. Springer-Verlag, 1985.
Indice de Materias
amortiguamiento no lineal, 161 backstepping, 163 de sistemas en realimentaci on estricta, 167 de un integrador, 163 Banach, v ease espacio de Banach Barbalat, v ease lema de Barbalat Barbashin-Krasovskii, v ease teorema de BarbashinKrasovskii Cauchy, v ease secuencia de Cauchy centro, 13 Chetaev, v ease teorema de Chetaev ciclo l mite, 20 clausura, 31 condici on de apareamiento, 161 condici on de Lipschitz, 33 conjunto cerrado, 31 control adaptable, 10, 161 convergencia de secuencias, 31 Coulomb, v ease fricci on de Coulomb desigualdad de Gronwall-Bellman, 30 umlaut older, 29 difeomorsmo, 140 din amica de los ceros, 150 diodo t unel, 6, 17 ecuaci on de Lienard, 9 ecuaci on de sensibilidad, 43 ecuaci on de Van der Pol, 9, 21 ensilladura, 11 equilibrios denici on, 4 hiperb olicos, 16 m ultiples, 17 perturbaci on, 14 espacio de Banach, 31 espacio lineal normado, 31 estabilidad, 50 estabilidad asint otica global, 57 estabilidad de sistemas perturbados, 97 estabilidad entrada-estado, 105 estabilidad estructural, 16 estabilidad exponencial, 80 robusta, 98 estabilidad uniforme, 79 foco, 13 forma de Jordan, 17 forma normal, 150 fricci on de Coulomb, 8 fricci on est atica, 8 funci on de Lyapunov, 52 funci on de sensibilidad, 43 funci on denida positiva, 52 funciones de clase K y KL, 79 grado relativo, 145 Gronwall-Bellman, v ease desigualdad de GronwallBellman inestabilidad, 50, 58 ISS, v ease estabilidad entrada-estado Jacobiana, 19 Jordan, v ease forma de Jordan LaSalle, v ease teorema de LaSalle lema de Barbalat, 90 Lienard, v ease ecuaci on de Lienard linealizaci on an alisis de puntos de equilibrio, 17 y estabilidad, 67 Lipschitz, v ease condici on de Lipschitz Lyapunov funci on, 52 m etodo directo, 51 m etodo indirecto, 70 supercie, 52 teorema de estabilidad, 51, 77 teoremas conversos, 86 m etodo del gradiente variable, 55 m etodo indirecto de Lyapunov, 70 m nima fase, 151 mapeo contractivo, 31 matriz Jacobiana, 19
176
nodo, 11 norma, 31 oscilador arm onico, 20 de relajaci on, 21 de resistencia negativa, 9 de Van der Pol, v ease ecuaci on de Van der Pol p endulo, 5, 17 perturbaci on de equilibrios, 14 principio de comparaci on, 43 principio de invariancia, 60 sistemas inestacionarios, 90 punto jo, 31 puntos de equilibrio, 4 tilde no Lyapunov, 161 regi on de atracci on, 57, 64 retrato de fase, 11 construcci on num erica, 22 secuencia convergente, 31 secuencia de Cauchy, 31 sensibilidad, 43 separatriz, 17 sistema en realimentaci on estricta, 167 sistema linealizable entrada-estado, 140 sistema masa-resorte, 7 supercie de Lyapunov, 52 teorema de Barbashin-Krasovskii, 58 teorema de Chetaev, 58 teorema de estabilidad de Lyapunov, 51 teorema de LaSalle, 61 teoremas conversos, v ease Lyapunov Van der Pol, v ease ecuaci on de Van der Pol
Indice de Materias

Apunte - María Marta Seron

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Apunte - María Marta Seron

Caricato da

Copyright:

Formati disponibili

Sistemas No Lineales

Cap tulo 1 Introducci on

(x) Figura 1.1: Sistema no lineal

Figura 1.2: P endulo

Circuito con Diodo T unel

Figura 1.3: Diodo T unel

Figura 1.4: Puntos de equilibrio del circuito de diodo t unel

Figura 1.5: Sistema masa-resorte

Oscilador de Resistencia Negativa

v + f (v )v + g (v ) = 0 Cuando 1 h(v ) = v + v 3 3 la ecuaci on toma la forma de la ecuaci on de Van der Pol v (1 v 2 )v +v =0

1.3 Sistemas de Segundo Orden

Sistemas de Segundo Orden

Figura 1.7: Retrato de fase de un nodo estable.

Figura 1.8: Retrato de fase de una ensilladura.

1.3 Sistemas de Segundo Orden

Figura 1.9: Retrato de fase de un foco estable

Figura 1.10: Retrato de fase de centro

Figura 1.11: Retrato de fase del caso de autovalores m ultiples no nulos

1.3 Sistemas de Segundo Orden

Figura 1.12: Retrato de fase para 1 = 0, 2 > 0

Figura 1.13: Retrato de fase para 1 = 0 = 2

Comportamiento Cualitativo Cerca de un PE

Figura 1.15: Retrato de fase del circuito con diodo t unel

Figura 1.16: Retrato de fase de la ecuaci on del p endulo

1.3 Sistemas de Segundo Orden

a11 a12 a21 a22

Un sistema oscila cuando tiene una soluci on peri odica no trivial 1

Es decir, excluyendo soluciones constantes correspondientes a PE.

1.4 Ciclos L mites

Construcci on Num erica de Retratos de Fase

y g2 (t, y, y, ..., d )u. dtn1

Figura 1.20: PLL

x 1 = x1 + x2 3 x 2 = 0.1x1 2x2 x2 1 0.1x1 x 1 = (1 x1 )x1 x 2 = 2 2x1 x2 1 + x1

26 Ejercicio 1.9 El sistema x 1 = x1 x 2 = x2 + x2 log log

Figura 1.21: Retratos de fase

x 1 = 2x1 x1 x2 x 2 = 2x2 1 x2 x 1 = x1 + x2 x1 (|x1 | + |x2 |) x 2 = 2x1 + x2 x2 (|x1 | + |x2 |).

Cap tulo 2 Propiedades Fundamentales

Vamos a considerar frecuentemente las normas p en Rn , denidas como 1p<

son dos normas p

donde max (At A) es el m aximo autovalor de At A.

para a t b, entonces en el mismo intervalo

Si (t) es constante, entonces y (t) e

(s)y (s) ds y v (t) = z (t) + (t) y (t) 0. Entonces z es

Como z (a) = 0, entonces tenemos que

(t, s)((s)(s) (s)v (s))ds.

(t, s)(s)v (s)ds es no negativo, por lo que

[f (s, x(s)) f (s, x0 ) + f (s, x0 )] ds

[ f (s, x(s)) f (s, x0 ) + f (s, x0 ) ] ds [L x(s) x0 + h] ds

2.2 Existencia y Unicidad y tambi en P x x0

[f (s, x(s)) f (s, y (s))] ds f (s, x(s)) f (s, y (s)) ds

[ f (s, x(s)) f (s, x0 ) + f (s, x0 ) ] ds [L x(s) x0 + h] ds

Por lo tanto r = x(t0 + ) x0 (Lr + h) = r Lr + h

= 1 y z t [f (t, y ) f (t, x)] = f (t, y ) f (t, x)

f (t, (s1 ))(y x) x f yx z q (t, (s1 )) x p

donde usamos la desigualdad de H older |z t w| z

y una constante de Lipschitz es entonces L = 1 + a2 + a1 .

que est a bien denida para todo x0 y para todo t t0 .

Dependencia Continua Con Respecto a Condiciones Iniciales y Par ametros

f (s, y (s)) ds [f (s, z (s)) + g (s, z (s))] ds

Restando ambas ecuaciones y tomando normas obtenemos

f (s, y (s)) f (s, z (s)) ds +

Aplicando la desigualdad de Gronwall-Bellman a la funci on y (t) z (t) resulta

Diferenciabilidad de la Soluci on y Ecuaciones de Sensibilidad

2.5 Principio de Comparaci on y derivemos parcialmente con respecto a