Sei sulla pagina 1di 160

Fondamenti di Automatica - II Parte

Antonio Bicchi
Universit`a di Pisa
Versione del 12 Novembre 2014.
Alcune parti della dispensa sono in corso di integrazione o
riscrittura.
Si consiglia di procedere ad aggiornarle circa mensilmente.

Indice
1 Introduzione
1.1 Finalit`a e Organizzazione del Corso . . . . .
1.1.1 Obiettivi . . . . . . . . . . . . . . . .
1.1.2 Metodologia del Corso . . . . . . . .
1.1.3 Pre-requisiti . . . . . . . . . . . . . .
1.1.4 Modalit`a di verifica . . . . . . . . . .
1.1.5 Contenuti e Articolazione Temporale
1.1.6 Testi suggeriti . . . . . . . . . . . . .
1.2 Di che si tratta . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

2 Stabilit`
a
2.1 Definizioni . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Sistemi LTI . . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Peculiarit`a dei Sistemi Nonlineari . . . . . . . . . . . . .
2.4 Teoremi di Lyapunov . . . . . . . . . . . . . . . . . . . .
2.4.1 Metodo indiretto di Lyapunov . . . . . . . . . . .
2.4.2 Metodo diretto di Lyapunov. . . . . . . . . . . . .
2.4.3 Teoremi del Metodo Diretto di Lyapunov . . . . .
2.4.4 Estensione al caso di Globale Asintotica Stabilit`a
2.5 Teorema dellInsieme Invariante Massimo . . . . . . . . .
2.5.1 Applicazione alla Stima della R.A.S. . . . . . . .
2.5.2 Applicazioni alla sintesi del controllo . . . . . . .
2.6 Teoremi inversi e di instabilit`a . . . . . . . . . . . . . . .
2.7 Stabilit`a dei Sistemi Lineari Stazionari con Lyapunov . .
2.7.1 Sistemi Lineari Tempo-Continui . . . . . . . . . .
2.7.2 Sistemi Lineari Tempo-Discreti . . . . . . . . . .
2.7.3 Dimostrazione del metodo di linearizzazione . . .
2.8 Stima numerica della RAS . . . . . . . . . . . . . . . . .
2.9 Velocit`a di Convergenza . . . . . . . . . . . . . . . . . .
2.10 Costruzione di Krasovski . . . . . . . . . . . . . . . . . .
2.11 Sistemi non stazionari . . . . . . . . . . . . . . . . . . .
3

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

7
. 7
. 7
. 8
. 8
. 8
. 8
. 9
. 10

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

11
11
14
17
19
19
20
21
23
24
25
30
33
35
35
37
38
39
40
42
43

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

INDICE
2.11.1 Studio di sistemi non stazionari con il metodo di Lyapunov 44
2.12 Appendice: Simulazioni con Matlab . . . . . . . . . . . . . . . 48

3 Raggiungibilit`
a e Controllabilit`
a
3.1 Insieme di raggiungibilit`a . . . . . . . . . .
3.1.1 Sistemi LTITC . . . . . . . . . . .
3.1.2 Sistemi LTITD . . . . . . . . . . .
3.1.3 Controllabilit`a allorigine . . . . . .
3.1.4 Raggiungibilit`a di sistemi non LTI
3.2 Cambiamenti di Coordinate . . . . . . . .
3.3 Scomposizione Standard dei Sistemi . . . .
3.3.1 Sottospazi invarianti . . . . . . . .
3.3.2 Forma Standard di Raggiungibilit`a
3.4 Lemma P.B.H. . . . . . . . . . . . . . . .
3.5 Forma canonica di controllo . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

53
54
54
56
57
58
60
60
60
62
64
67

4 Pianificazione Ottima
71
4.1 Minimizzazione del costo di controllo . . . . . . . . . . . . . . 71
4.1.1 Sistemi LTITD . . . . . . . . . . . . . . . . . . . . . . 72
4.1.2 Sistemi LTITC . . . . . . . . . . . . . . . . . . . . . . 73
4.1.3 Sistemi LTITC: Campionamento e Approssimazione TD 74
4.2 Applicazioni ed Estensioni . . . . . . . . . . . . . . . . . . . . 76
4.2.1 Minima norma del controllo non vincolato . . . . . . . 77
4.2.2 Minima norma del controllo e controllo vincolato . . . 85
4.2.3 Minima norma del controllo e delluscita di prestazione con controllo vincola
4.2.4 Variazione del tempo di campionamento e autorit`a del controllo 89
5 Retroazione degli stati
5.1 Retroazione lineare degli stati nei sistemi LTI . . . .
5.1.1 Formule per lAllocazione dei Poli . . . . . . .
5.1.2 Invarianza degli zeri per retroazione . . . . . .
5.1.3 Retroazione degli stati in sistemi a pi`
u ingressi
6 Osservabilit`
a e Ricostruibilit`
a
6.1 Insieme indistinguibile per sistemi LTI
6.1.1 Sistemi LTITC . . . . . . . . .
6.1.2 Sistemi LTITD . . . . . . . . .
6.1.3 Ricostruibilit`a . . . . . . . . . .
6.1.4 Cambiamenti di Coordinate . .
6.2 Stima ottima . . . . . . . . . . . . . .
6.2.1 Stima ottima LTITD . . . . . .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

91
91
94
96
96

.
.
.
.
.
.
.

99
99
100
102
104
105
105
106

INDICE

6.3
6.4
6.5
6.6
6.7
6.8

5
6.2.2 Stima ottima LTITC . .
Dualit`a . . . . . . . . . . . . . .
Osservabilit`a di sistemi non LTI
Forma Standard di Osservabilit`a
Lemma P.B.H. . . . . . . . . .
Forma canonica di osservazione
Iniezione delle Uscite . . . . . .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

107
108
109
109
112
113
114

7 Realizzazioni e Connessioni di Sistemi


7.1 Scomposizione canonica (o di Kalman) . . . . . . . . . .
7.2 Realizzazione di sistemi . . . . . . . . . . . . . . . . . .
7.3 Effetti di Retroazione dello Stato e Iniezione delle Uscite
7.4 Grado Relativo . . . . . . . . . . . . . . . . . . . . . . .
7.5 Raggiungibilita e Osservabilita di Sistemi Connessi . . .
7.5.1 Connessione in Parallelo . . . . . . . . . . . . . .
7.5.2 Connessione in Serie . . . . . . . . . . . . . . . .
7.5.3 Connessione in Retroazione . . . . . . . . . . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

117
. 117
. 119
. 126
. 127
. 128
. 128
. 131
. 132

8 Regolazione dei sistemi


8.1 Osservatore asintotico dello stato (o di Luenberger)
8.2 Sintesi del regolatore . . . . . . . . . . . . . . . . .
8.2.1 Esempio . . . . . . . . . . . . . . . . . . . .
8.3 Retroazione delle uscite . . . . . . . . . . . . . . .
8.3.1 Progetto del Regolatore e Specifiche . . . . .
8.3.2 Alcune varianti di montaggio dei controllori.
8.3.3 Esempio . . . . . . . . . . . . . . . . . . . .
8.4 Sintesi analitica . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

153
. 153
. 155
. 157
. 157
. 157
. 158
. 160

A Richiami di Algebra Lineare


A.1 Sistemi lineari di equazioni . . . . . . . . . . . . . .
A.2 Scomposizione ai Valori Singolari e Pseudoinversa .
A.3 Interpretazioni e applicazioni della SVD . . . . . .
A.3.1 Pseudoinversa . . . . . . . . . . . . . . . . .
A.3.2 Norma matriciale . . . . . . . . . . . . . . .
A.3.3 Condizionamento di un sistema di equazioni
A.3.4 Compressione di dati . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

135
136
138
140
142
146
146
148
149

INDICE

Capitolo 1
Introduzione
Queste dispense di Fondamenti di Automatica II Parte sono rivolte agli
studenti di un corso di secondo livello (Laurea specialistica) in Ingegneria, e coprono materiale didattico corrispondente a circa 6 Crediti Formativi
Universitari, tra cui 1 di attivit`a di laboratorio.

1.1

Finalit`
a e Organizzazione del Corso

Il corso si propone di fornire agli allievi nozioni e strumenti avanzati per


lanalisi di sistemi meccanici dinamici, e per il progetto dei dispositivi per il
loro controllo. Oltre a fornire metodologie di progetto, il corso si occupa di
fornire agli allievi nozioni sulle tecnologie degli attuatori, dei sensori, e dei
processori adottati nei sistemi di controllo per macchine e impianti meccanici.

1.1.1

Obiettivi

Lo studente al termine del corso sar posto in grado di:


Analizzare e controllare sistemi meccanici complessi;
Stimare i limiti di applicazione delle metodologie di controllo lineare
nel caso di sistemi non lineari e utilizzare strumenti per ampliare tali
limiti;
Leggere e capire le specifiche dei dispositivi commerciali utilizzati nel
controllo delle macchine e dei sistemi meccanici, e progettare sistemi
di controllo che usino tali componenti.

CAPITOLO 1. INTRODUZIONE

1.1.2

Metodologia del Corso

Le lezioni sono prevalentemente tenute proiettando in aula il materiale di


queste dispense, che sono peraltro rese disponibili agli studenti in rete. Il
corso si avvale per le esercitazioni di strumenti informatici (software di analisi
e simulazione) disponibili presso le strutture della facolt`a.

1.1.3

Pre-requisiti

Un corso di base in Fondamenti di Automatica, che fornisca le basi di analisi


dei sistemi lineari e di controllo ingresso-uscita.

1.1.4

Modalit`
a di verifica

La prova e articolata in uno o piu esercizi da svolgere autonomamente, con


luso del materiale del corso e di ogni altro materiale ritenuto utile; ed in una
o piu domande cui rispondere oralmente interagendo con la commissione.
Le prove saranno differenziabili nelle due parti di cui si compone il corso
integrato. La commissione determina il voto basandosi su tutti gli elementi
raccolti durante le prove.

1.1.5

Contenuti e Articolazione Temporale

1. Introduzione. Presentazione del corso. Problematiche di controllo di


sistemi lineari ottenuti per linearizzazione da sistemi non lineari. Esempi delle limitazioni connesse alla progettazione classica (ingresso-uscita)
del controllo.
2. Stabilit`a. Stabilit`a di un movimento e di un punto di equilibrio. Stabilit`a semplice ed asintotica. Stabilit`a di sistemi lineari. Metodo diretto
ed indiretto di Lyapunov. Teoremi di Lasalle e Krasovskii. Cicli limite
ed insiemi invarianti. Dominio di attrazione di un equilibrio. Globale
asintotica attrattivit`a. Velocit`a di convergenza. Equazione matriciale di Lyapunov e stabilit`a di sistemi lineari. Analisi della regione di
attrattivit`a di un sistema non lineare mediante linearizzazione.
3. Raggiungibilit`a e Controllabilit`a. Propriet`a strutturali di un sistema
dinamico. Insieme raggiungibile di sistemi lineari tempo invarianti (
TC e TD ). Matrice di raggiungibilit`a in funzione del tempo. Raggiungibilit`a e cambiamenti di coordinate lineari. Controllabilit`a allorigine.

` E ORGANIZZAZIONE DEL CORSO


1.1. FINALITA

Pianificazione ottima, pseudoinversa di Moore-Penrose e decomposizione ai valori singolari di una matrice. Raggiungibilit`a di sistemi lineari
tempo varianti. Definizione di sottospazi invarianti e forma standard di
controllabilit`a. Ripartizione degli autovalori della matrice di aggiornamento dello stato tra sottospazio raggiungibile e non. Verifiche dirette
di raggiungibilit`a. Raggiungibilit`a di sistemi SISO. Lemma P.B.H..
Forma canonica di controllo. Raggiungibilit`a di sistemi MIMO.
4. Retroazione degli stati. Controllo di sistemi lineari mediante retroazione degli stati. Invarianza delle propriet`a di raggiungibilit`a di un
sistema rispetto alla retroazione degli stati. Autovalori fissi e autovalori modificabili dalla retroazione. Algoritmi di allocazione degli autovalori. Invarianza degli zeri di trasmissione. Sistemi a pi ingressi.
Stabilizzabilit`a di un sistema lineare.
5. Osservabilit`a e Ricostruibilit`a. Osservabilit`a di sistemi lineari tempo
invarianti (TC e TD). Insieme indistinguibile in funzione del tempo.
Osservabilit`a e cambiamenti di coordinate lineari. Ricostruibilit`a dello
stato. Sottospazi invarianti e forma standard di osservabilit`a. Stima
Ottima. Osservabilit`a di sistemi lineari tempo varianti. Ripartizione
degli autovalori della matrice di aggiornamento dello stato tra sottospazio inosservabile e non. Funzione di trasferimento e sottospazio
inosservabile. Verifiche dirette di osservabilit`a. Osservabilit`a di sistemi
SISO. Lemma P.B.H. di osservabilit`a. Forma canonica di osservazione.
Scomposizione di Kalman.
6. Regolazione di sistemi e retroazione delle uscite. Retroazione statica
delle uscite. Retroazione dinamica delle uscite. Osservatore asintotico
dello stato. Realizzazione di sistemi. Regolatore.

1.1.6

Testi suggeriti

E. Fornasini, G. Marchesini: Appunti di Teoria dei Sistemi (ed Esercizi di Teoria dei Sistemi), Ed. Libreria Progetto;
P. Bolzern, R. Scattolini, N. Schiavoni: Fondamenti di Controlli Automatici, McGraw-Hill
G. Marro, Controlli Automatici, Zanichelli

10

CAPITOLO 1. INTRODUZIONE

1.2

Di che si tratta

Si consideri il sistema pendolo inverso rappresentato in figura

le cui equazioni dinamiche sono date da



(M + m)
x + bx mL cos + mL sin 2 = Fext
.
2
(I + mL ) mgL sin = mL cos
x
Nellesempio di progetto di un controllore per la stabilizzazione del pendolo
ottenuta con i metodi lineari per sistemi ingresso-uscita (si veda la soluzione
della esercitazione scritta del 17/7/2002), si `e ottenuto un controllore lineare
soddisfacente le specifiche date (che riguardavano solo la posizione angolare
del pendolo) mediante progetto in cascata con controllore interno C(s) =
(1+s)(1+0.2s)
, e anello esterno progettato con i metodi in frequenza.
30 (12s)(1+0.1s)
Nella applicazione di questo controllore alloriginale sistema fisico, si evidenziano alcune importanti limitazioni di quelle tecniche:
la stabilizzazione ottenuta per il modello linearizzato vale solo localmente; condizioni iniziali perturbate di una quantit`a finita possono
provocare instabilit`a;
la posizione del carrello non `e in generale stabilizzata, anzi pu`o divergere allontandosi dalla regione ammissibile;
il progetto del controllore stabilizzante mediante luogo delle radici non `e
sistematico, essendo affidato alla capacita ed esperienza del progettista.
Per alcuni sistemi (in particolare, ad esempio, per quelli che abbiano
zeri e/o poli a parte reale positiva) questa tecnica puo richiedere un
lungo tempo di progetto;
Questo seconda parte del corso di Fondamenti di Automatica si rivolge
allo studio di tecniche che permettano di evitare questi inconvenienti.

Capitolo 2
Stabilit`
a
Consideriamo un sistema tempoinvarianti generale definito in uno spazio di
stato x IRn del tipo
IDx = f (x, u), x(0) = x0
e le sue soluzioni (o movimenti) x(x0 , u, t), tra cui in particolare quelli che
abbiamo chiamato di equilibrio (per i quali u e x sono costanti). Sia inoltre
data una norma k k per i vettori in IRn .
Intuitivamente associato al concetto di equilibrio `e quello di stabilit`a (si
pensi al caso di un pendolo), in particolare rispetto alle variazioni delle condizioni iniziali. Considereremo cio`e comparativamente le soluzioni del sistema
in condizioni nominali x(x0 , u, t) e in condizioni perturbate x(x , u, t), e diremo stabili quei movimenti che sono poco alterati da piccole alterazioni
delle condizioni iniziali. Cercheremo di rendere preciso questo concetto, e di
stabilire tecniche per decidere della stabilit`a o meno di un equilibrio.

2.1

Definizioni

Poiche in quel che segue considereremo sempre u come una particolare funzione o successione di ingresso, si potr`a fare a meno di citarla esplicitamente
nella descrizione del sistema e delle sue soluzioni:
Dx = f (x), x(0) = x0

(2.1)

Un movimento x(t) = x(x0 , t) `e stabile per il sistema (2.1) se tutti i


movimenti che originano da condizioni iniziali sufficientemente vicine a x0
rimangono arbitrariamente vicine a x(x0 , t) stesso; ovvero, pi`
u precisamente,

se > 0, > 0 tale che se kx x0 k < , allora kx(x , t) x(x0 , t)k < , t
(vedi fig. 2.1).
11

12

`
CAPITOLO 2. STABILITA

Figura 2.1: Illustrazione del concetto di stabilit`a di un movimento

Un movimento x = x(x0 , t) `e attrattivo per il sistema (2.1) (ovvero il


sistema `e convergente rispetto a quel movimento) se, per tempi sufficientemente lunghi, tutti i movimenti che originano da condizioni iniziali sufficientemente vicine a x0 tendono a x(t); ovvero, se > 0 : kx x0 k <
limt kx(x , t) x(x0 , t)k = 0.
Un movimento `e asintoticamente stabile se `e stabile ed attrattivo (vedi
` instabile se non `e stabile.
fig. 2.2). E
Sia x(
x, t) il movimento di un sistema x = f (x) a partire da x(0) = x.
Si dice orbita (o traiettoria) Tx del sistema passante per x la curva (cio`e
linsieme dei punti) percorsa dallo stato, ovvero Tx = { X|t, = x(
x, t)}.
Si dice distanza di un punto x IRn da unorbita Tx la quantit`a d (x, T (
x)) =
minzTx kx zk.
Unorbita Tx `e stabile per il sistema (2.1) se tutti i movimenti che originano da condizioni iniziali sufficientemente vicine a Tx rimangono arbitrariamente vicine a Tx ; ovvero se > 0, > 0 tale che se d (x , Tx0 ) < ,
allora d (x , t), Tx0 ) < , t. Lorbita `e attrattiva per il sistema se > 0 :
d (x , Tx0 ) < limt d (x(x , t), Tx0 ) = 0.
Questi concetti si specializzano per le particolari soluzioni che sono i punti
di equilibrio (vdi fig. 2.3):
Uno stato di equilibrio x `e stabile per il sistema (2.1) se > 0, > 0 :
kx xk < kx(x , t) xk < , t.
Uno stato di equilibrio x `e attrattivo per il sistema (2.1) se > 0 :

kx xk < limt kx(x , t) xk = 0.


Uno stato di equilibrio `e asintoticamente stabile se `e stabile ed attrattivo.
`
E instabile se non `e stabile. Un equilibrio stabile, ma non asintoticamente
stabile, viene talvolta detto semplicemente o marginalmente stabile.

2.1. DEFINIZIONI

13

Figura 2.2: Illustrazione del concetto di asintotica stabilit`a di un movimento.

Equilibrio stabile

Equilibrio asintoticamente stabile

Figura 2.3: Illustrazione dei concetti di stabilit`a di un equilibrio


I problemi di stabilit`a e attrattivit`a di un qualsiasi stato di equilibrio di
un sistema possono essere riportati allo studio delle analoghe propriet`a dellorigine per un sistema opportuno. Allo stesso modo, i problemi relativi ai
movimenti di un sistema possono sempre essere riportati ad analoghi problemi di stati di equilibrio di un differente sistema, i cui stati sono le differenze
tra il movimento perturbato e quello di riferimento. Infatti, se definiamo
x(t) = x(x , t) x(x0 , t) = x(t) x(t), si ottiene da (2.1)
def
D
x = f (x, t) f (
x, t) = f(
x, t)

con condizioni iniziali x(0) = x x0 , ed equilibrio in x = 0. Si noti che il


sistema ottenuto pu`o essere non stazionario, anche se il sistema per il quale

`
CAPITOLO 2. STABILITA

14

si voleva studiare la stabilit`a del movimento era stazionario.


Ad esempio, si consideri il sistema x = sin(x) + u, con u = 1 e x0 = 1.
La soluzione di riferimento `e in questo caso calcolabile esplicitamente come
x(t) = 2 arctan( 2+tc
), con c = 2/(1 + tan(0.5)) (ovviamente, in altri casi
tc
una soluzione esplicita pu`o non essere disponibile). Si ha
def
x = sin(x) + 1 sin(
x) 1 = sin(
x + x) sin(
x) = f(
x, t)

con x(0) = x(0) 1. Il modello linearizzato attorno allequilibrio x = 0


(f(0, t) 0) `e dato da
x = A
x



) (si osservi incidentalmente che
= cos 2 arctan( 2+tc
con A = fx
tc
x
=0
A > 0 per t < T 0.3, e A < 0 per t > T ).

2.2

Sistemi LTI

Per i sistemi LTI, conoscendo gi`a le soluzioni esplicite, `e possibile applicare


questi concetti immediatamente:
1. Lorigine `e un punto di equilibrio asintoticamente stabile per il sistema
x = Ax se tutti i modi del sistema sono convergenti a zero (ovvero se
tutti gli autovalori di A hanno parte reale strettamente negativa); `e
semplicemente stabile se tutti i modi del sistema sono limitati (ovvero
se tutti gli autovalori hanno parte reale non positiva, e quelli a parte
reale nulla hanno tutti molteplicit`a geometrica pari a quella algebrica);
`e instabile altrimenti.
2. Lorigine `e un punto di equilibrio stabile e attrattivo per il sistema
x(t + 1) = Ax(t) se tutti i modi del sistema sono convergenti a zero
(ovvero se tutti gli autovalori di A hanno modulo strettamente minore
di uno); `e semplicemente stabile se tutti i modi del sistema sono limitati
(ovvero se tutti gli autovalori hanno modulo non maggiore di uno, e
quelli a modulo unitario hanno tutti molteplicit`a geometrica pari a
quella algebrica); `e instabile altrimenti.
3. Se uno stato (in particolare lorigine) di un sistema LTI `e stabile [rispettivamente, as. stabile], allora ogni altro stato di equilibrio, ed ogni
movimento di riferimento sono stabili [as. stabili]. Si pu`o quindi parlare
di stabilit`a del sistema.

2.2. SISTEMI LTI

15

4. La asintotica convergenza a zero degli stati vale a partire da qualsiasi


condizione iniziale: un sistema LTI asintoticamente stabile `e anche
globalmente asintoticamente convergente.
5. In un sistema LTI, la attrattivit`a comporta la stabilit`a, e la instabilit`a
comporta la divergenza (cio`e la illimitatezza) dei movimenti.
6. In un sistema LTI asint. stabile, tutti i modi convergono a zero esponenzialmente.
Riguardo al punto 3, si osservi che, se lorigine `e asintoticamente stabile,
allora `e anche lunico punto di equilibrio per il sistema. Si pu`o ciononostante
parlare di asintotica stabilit`a di movimento, ad esempio in corrispondenza
a ingressi u 6= 0. Se invece esiste un punto di equilibrio x 6= 0, allora
ovviamente esiste un intero sottospazio di punti di equilibrio, coincidente
con il kernel di A. Perch`e ci`o accada, `e necessario e sufficiente che A abbia
un autovalore nullo.
Esempio: Si considerino i sistemi meccanici di figura, tutti dotati
di massa. Gli elementi elastici e gli smorzatori hanno caratteristica lineare non precisata. Per i sistemi 5, 6 e 7, si consideri impossibile lo
strisciamento sul piano.

Lo stato di equilibrio del sistema 1) rappresentato in figura `e instabile


in assenza di attrito di strisciamento. Infatti, condizioni iniziali arbitrariamente piccole, ma non nulle, portano il sistema a divergere (in particolare, una velocit`a iniziale non nulla genera un moto uniforme e quindi
la divergenza della posizione). Analiticamente, il sistema `e lineare e pu`o
essere considerato esso stesso instabile: ha infatti un autovalore in zero
con molteplicit`a algebrica pari a due e geometrica pari a uno.

16

`
CAPITOLO 2. STABILITA

Lequilibrio del sistema 2) `e marginalmente stabile. Infatti, stabiliti


limiti arbitrari agli stati (posizioni e velocit`a), `e sempre possibile trovare
condizioni iniziali non nulle ma sufficientemente piccole, tali che i limiti
non siano mai superati nella evoluzione libera del sistema. In termini
analitici, il sistema lineare 2) ha un autovalore in zero e un autovalore
reale negativo.
Lequilibrio del sistema 3) `e anchesso marginalmente stabile: se inizializzato in uno stato non di equilibrio, ha un moto oscillatorio non
smorzato, che `e pu`o essere limitato a regioni arbitrariamente piccole dello spazio di stato scegliendo condizioni iniziali sufficientemente prossime
allequilibrio. Il sistema ha due autovalori immaginari puri.
Il punto di equilibrio del sistema 4) rappresentato in figura `e asintoticamente stabile: leffetto della molla `e quello di fare oscillare il sistema
attorno allorigine, mentre lo smorzatore causa la continua dissipazione
di energia e la diminuzione della velocit`a, quindi attenua lampiezza delle
oscillazioni. Lo stato del sistema tende quindi asintoticamente allorigine.
Il sistema ha due autovalori a parte reale negativa.
In assenza di attrito di rotolamento, lo stato di equilibrio del sistema
5) rappresentato in figura `e instabile. Infatti, anche in presenza di attrito
di strisciamento tra le superfici in contatto, `e sufficiente che allistante
iniziale la velocit`a di rotazione sia non nulla perche il sistema si allontani indefinitamente dallo stato di equilibrio con velocit`a costante. Nel
caso invece in cui sia presente attrito di rotolamento lequilibrio `e marginalmente stabile: infatti lattrito volvente introduce nel sistema una
dissipazione di energia che fa diminuire la velocit`a, e quindi rende possibile limitare le traiettorie a regioni arbitrariamente piccole dello spazio
di stato scegliendo opportune condizioni iniziali.

Nel caso del sistema 6), `e necessario considerare moti perturbati che consistono di rotazioni attorno agli spigoli con transizioni modellabili come urti
col piano. Se gli urti sono perfettamente elastici, lequilibrio `e marginalmente
stabile, in quanto il corpo si manterrebbe indefinitamente in oscillazione (di
ampiezza limitata e proporzionale alle condizioni iniziali). Se gli urti sono
anelastici, lequilibrio `e asintoticamente stabile.
Lo stato di equilibrio del sistema 7) rappresentato in figura `e instabile,
poiche se lo stato iniziale non coincide esattamente con quello di equilibrio il
sistema si allontana indefinitamente da questultimo.

` DEI SISTEMI NONLINEARI


2.3. PECULIARITA

2.3

17

Peculiarit`
a dei Sistemi Nonlineari

Nei sistemi nonlineari i fenomeni sono pi`


u complessi che nei sistemi lineari:
Non tutti gli equilibri hanno le stesse caratteristiche di stabilit`a per
un sistema. Ad esempio, lequilibrio inferiore di un pendolo `e stabile,
quello superiore `e instabile. Per condizioni iniziali abbastanza prossime
allequilibrio inferiore, se vi `e attrito, lequilibrio inferiore `e anche attrattivo, quindi asintoticamente stabile, ma non globalmente: esistono
condizioni iniziali (quale appunto lequilibrio superiore) a partire dalle
quali le traiettorie non convergono.
Non necessariamente gli equilibri attrattivi sono stabili. Un esempio di
equilibrio attrattivo ma non stabile in TD `e offerto dal sistema

2x(t) se kxk 1
x(t + 1) =
0
se kxk > 1
Un esempio analogo in TC `e dato dal sistema (di Vinograd) x = f (x),
con
( x2 (x2 x1 )+x5
1

f (x) =

(x21 +x22 )[1+(x21 +x22 )2 ]


x22 (x2 2x1 )
(x21 +x22 )[1+(x21 +x22 )2 ]

per x 6= 0, e f (0) = 0, ha unico equilibrio nellorigine. I movimenti


di questo sistema a partire da punti vicini allorigine sono descritti in
fig. 2.4
La convergenza ad un equilibrio asintoticamente stabile pu`o essere meno che esponenziale, ovvero pi`
u lenta di quella di qualsiasi sistema
lineare. Ad esempio, il sistema x = x3 , con x(0) = x0 , ha soluzione
x(t) = x0 2 . Converge quindi allequilibrio per t , come t1/2 ,
1+2x0 t

cio`e molto lentamente, e pi`


u lentamente di qualsiasi sistema lineare
convergente. Infatti, la convergenza di qualsiasi lineare asintoticamente stabile = a (a > 0) `e un esponenziale (t) = 0 eat , ma per
qualsiasi a > 0 e qualsiasi condizione iniziale 0 > 0, esiste un t tale
per cui, t > t, si ha
1
1
x0 p
> 0 eat , ovvero t > c + log(1 + 2x20 t),
2
2
1 + 2x0 t

con c = a1 (log 0 log x0 ).

`
CAPITOLO 2. STABILITA

18
1.5

0.5

0.5

1.5
1.5

0.5

0.5

1.5

Figura 2.4: Traiettorie di un sistema di Vinograd, con equilibrio nellorigine


instabile ma attrattivo.

Possono esistere moti che divergono da un equilibrio instabile senza


allontanarsene indefinitamente, ma rimanendo a distanza limitata. Ad
esempio, il sistema detto oscillatore di Van der Pol x = (x2 1)xx,

ovvero, in forma di stato,


x 1 = x2
x 2 = x1 + (1 x21 )x2

(2.2)
(2.3)

ha un equilibrio nellorigine. Ogni traiettoria che inizia fuori dallorigine


per`o converge asintoticamente ad una orbita chiusa che costituisce un
ciclo limite delloscillatore (fig. 2.5).
` quindi necessario, per studiare sistemi nonlineari, disporre di definizioni
E
pi`
u articolate di stabilit`a:
Il sottoinsieme dello spazio di stato formato dalle condizioni iniziali le
cui corrispondenti traiettorie convergono ad un dato equilibrio asintoticamente stabile, `e detto bacino di attrattivit`
a o regione di asintotica
stabilit`
a (RAS);
Un equilibrio si dice globalmente asintoticamente stabile (GAS) se la
sua RAS coincide con tutto lo spazio di stato;
Lorigine si dice esponenzialmente stabile per un sistema se, per
sufficientemente piccoli, esistono due reali positivi , tali per cui

2.4. TEOREMI DI LYAPUNOV

19

4
2.5

1.5

0.5

0.5

1.5

2.5

Figura 2.5: Traiettorie di un oscillatore di Van der Pol che divergono


dallorigine e vengono attratte da un ciclo limite.

x(0) : kx(0)k < , kx(x(0), t)k et , t > 0. Il numero si


dice velocit`a di convergenza esponenziale. 1

2.4

Teoremi di Lyapunov

I pi`
u importanti strumenti di cui disponiamo per lo studio della stabilit`a dei
sistemi nonlineari sono i teoremi di Lyapunov:

2.4.1

Metodo indiretto di Lyapunov

Si consideri la approssimazione lineare Dx = Ax del sistema nonlineare


stazionario Dx = f (x):
1. Se Dx = Ax `e asintoticamente stabile, lorigine `e (localmente) asintoticamente stabile anche per il sistema originale Dx = f (x);
2. Se Dx = Ax ha almeno un modo esponenzialmente divergente, lorigine
`e instabile anche per Dx = f (x);
p
La norma usata `e tipicamente la norma Euclidea, o norma 2 (kxk2 = (xT x)). Peraltro, poich`e per qualsiasi norma k ki e k kj , si pu`
o dimostrare che esistono 1 > 0 e
2 > 0 tali che 1 kxki kxkj 2 kxki , la velocit`
a di convergenza `e la stessa qualsiasi
norma si consideri.
1

`
CAPITOLO 2. STABILITA

20

Si osservi che, sulla base di queste due proposizioni, nulla si pu`o dire sulla stabilit`a della origine per Dx = f (x) se Dx = Ax non ha modi esponenzialmente
divergenti, ma ne possiede almeno uno non convergente.
Si osservi che il caso 2) occorre per sistemi TC se A ha almeno un autovalore a parte reale strettamente positiva, e per sistemi TD se A ha almeno
un autovalore con modulo strettamente maggiore di uno.
La inconcludenza del teorema si verifica nei sistemi TC se il linearizzato
ha tutti autvalori a parte reale non positiva e almeno un autovalore a parte
reale nulla; per sistemi TD se il linearizzato ha tutti autovalori a modulo non
maggiore di uno, con almeno un autovalore a modulo unitario.
Il metodo indiretto, il cui contenuto `e abbastanza intuitivo, necessita
` stato presentato prima in
per la dimostrazione del successivo teorema. E
quanto metodo di rapida applicazione, anche se di molto minor potenza, del
successivo.

2.4.2

Metodo diretto di Lyapunov.

Il metodo diretto di Lyapunov pu`o essere visto come una importante generalizzazione dei criteri di stabilit`a per sistemi meccanici basati sullo studio
della energia del sistema. Qualitativamente, una funzione di energia generalizzata `e una funzione scalare dello stato, che `e sempre positiva eccetto che
nella configurazione di quiete (equilibrio) del sistema, dove ha un minimo.
` opportuno introdurre alcune definizioni. Una funzione V (x) : IRn IR si
E
dice
positiva definita (p.d.) se V (0) = 0 e se esiste un intorno Br dellorigine
per cui vale x Br \ 0, V (x) > 0;
positiva semidefinita (p.s.d.) se Br tale che V (x) 0, x Br ;
negativa definita e semidefinita risp. se V (x) `e p.d. o p.s.d.;
globalmente positiva definita se V (x) > 0 x IRn \ 0, positiva semi
definita se V (x) 0 x IRn \ 0; etc..
Esempio: Per x IR2 , V = x21 + x22 `e globalmente p.d.; V = x21 +
x22 x31 `e localmente p.d.; V = x21 + sin2 (x2 ) `e p.d. localmente, p.s.d.
globalmente; V = x21 + sin2 (x1 ) `e globalmente p.s.d.; V (x) = x21 x22 si
dice non-definita.

2.4. TEOREMI DI LYAPUNOV

21

Esempio: Tipiche funzioni che verranno spesso usate nel metodo di


Lyapunov sono le forme quadratiche V = xT P x, con P matrice n n.
Ai fini della forma
V
, la parte 
antisimmetrica
di P `e irrilevante:
 quadratica

(P +P T )
(P +P T )
(P P T )
T
T
T
x=x
x. Assumeremo quindi
V = x Px = x
+ 2
2
2
che P sia simmetrica.
Ricordiamo che V `e p.d. (p.s.d.), cio`e xT P x > 0, x 6= 0 (xT P x 0) se
la matice P `e p.d. (rispettivamente p.s.d).
Ricordiamo due criteri per stabilire se una matrice `e p.d. (p.s.d):
gli autovalori di P sono tutti positivi (non negativi);
det(P (1 : i, 1 : i)) > 0, i = 1, . . . , n (det(Pi ) 0, Pi sottomatrici
principali);
Se P `e p.d. (p.s.d), allora
langolo formato tra x e P x `e strettamente minore di /2, x (minore
o uguale se p.s.d.);
R, det(R) 6= 0 : P = RT R (R : P = RT R, det(R) = 0).
Lultima condizione ci dice che una forma quadratica pu`o essere vista
come (il quadrato) di una norma euclidea di un vettore in opportune coordinate: xT P x = xT RT Rx = y T y = kyk2 , y= Rx.pLa scelta di Rnon `e unica;
una particolare determinazione `e R = P = QQ1 = Q QT , che `e
simmetrica e p.d. (p.s.d., risp.).

2.4.3

Teoremi del Metodo Diretto di Lyapunov

Sistemi a tempo continuo. Sia x = 0 un punto di equilibrio per il sistema


tempo-invariante x = f (x). Si consideri una funzione V (x) C 1 positiva definita, e si consideri la sua derivata direzionale lungo il campo
f (x), cio`e Lf V (x) = Vx(x) f (x, t). Se Lf V (x) `e negativa semidefinita,
lorigine `e stabile; se `e negativa definita, lorigine `e asintoticamente
stabile; se `e positiva definita, lorigine `e instabile.
Sistemi a tempo discreto. Sia x = 0 un punto di equilibrio per il sistema tempo invariante x(t + 1) = f (x(t)). Si consideri una funzione
V (x) C positiva definita, e si consideri la sua differenza direzionale
lungo il campo f (x), cio`e f V (x) = V (f (x) V (x). Se f V (x) `e negativa semidefinita, lorigine `e stabile; se `e negativa definita, lorigine
`e asintoticamente stabile; se `e positiva definita, lorigine `e instabile.

22

`
CAPITOLO 2. STABILITA
Dimostrazione del metodo diretto di Lyapunov T.C.:

Stabilit`
a: Si consideri un intorno sferico B dellorigine, tutto contenuto in una regione S in cui Lf V 0: poiche V `e continua e p.d.,
esiste M = minx(B ) V (x), ed esister`a un B : V (x) < M, x
B . Supponiamo per assurdo che una traiettoria del sistema x(x0 , t)
che parta da x0 B al tempo 0, esca da B per t > 0: sarebbe
V (x(x0 , t)) > M > V (x0 )). Daltronde, se si considera la funzione
V (x(t, x0 )) come funzione del tempo, si ha che la sua derivata totale
x(x0 ,t)
vale V = dtd V = V
= V
f (x) = Lf V , quindi dalla ipotesi che
x
t
x
Lf V (x) sia negativa semi-definita discende che V `e monotona non crescente nel tempo, il che dimostra lassurdo.
Asintotica stabilit`
a: si consideri ancora un intorno B che garantisce che
la traiettoria non esca mai da B . Poich`e V `e limitata inferiormente e
strettamente decrescente nel tempo (V = Lf V n.d.), essa deve tendere
ad un limite limt V (x(t)) = W 0. Dobbiamo escludere il caso
W > 0: se cos` fosse, infatti, le traiettorie iniziate in B al tempo 0 non
potrebbero mai entrare in un intorno BW : maxxBW V (x) < W . Ma,
poich`e anche V `e continua e n.d., deve avere un massimo (negativo)
w < 0 sullinsieme B \ BW , quindi V decresce almeno con velocit`a
|w|. Una traiettoria del sistema, in x0 B al tempo 0, dopo al piu un
tempo t = (V (x0 )W )/w, porterebbe a V (t > t) < W , che dimostra
lassurdo.
Instabilit`
a: Dato > 0, si supponga per assurdo che esista un quale richiesto nella definizione di stabilit`a. Sia V = minxB V (x).
Si consideri inoltre 0 < < e gli intorni sferici B e B . Sia
minxB \B Lf V (x) = m > 0. Una evoluzione dello stato che inizi in
B \B uscir`a certamente da B in un tempo non superiore a t = V /m,
dimostrando lassurdo.
Una funzione V (x) p.d. tale che Lf V (x) ovvero f V (x) `e n.s.d. (compreso il caso n.d.), si dice una funzione di Lyapunov per il sistema x = f (x)
nellequilibrio considerato.

Esempio: Per il sistema monodimensionale x = x3 , lorigine `e unico


equilibrio. Il metodo approssimato non fornisce indicazioni in questo

2.4. TEOREMI DI LYAPUNOV

23

caso: infatti, lunico autovalore del linearizzato `e zero. Si consideri una


candidata di Lyapunov V (x) = x2 . Si ha Lf V (x) = 2x(x3 ) = x4 , che
`e n.d.. La funzione V (x) `e quindi una funzione di Lyapunov, e si pu`o
concludere per la stabilit`a asintotica dellequilibrio.
Pi`
u in generale, per sistemi del primo ordine x = c(x), con c(x)
una qualsiasi funzione con grafico strettamente nel primo e terzo quadrante (xc(x) > 0, x 6= 0), una candidata V (x) = x2 mostra la G.A.S.
dellorigine.
Si consideri adesso x = x3 . Si osservi che il linearizzato coincide con
quello del sistema precedente. Si consideri la stessa candidata V (x) = x2 .
Si ha Lf V (x) = 2x(x3 ) = x4 , che `e p.d.. Si pu`o quindi concludere per
la instabilit`a dellequilibrio.
Si osservi che il linearizzato approssimato nellorigine dei due sistemi
x = x3 e x = x3 `e identico.
Esempio: Sia dato il sistema lineare t.d. x(t + 1) = ax(t), e studiamolo con il metodo diretto mediante la candidata V (x) = x2 . Si ha
V = a2 x2 x2 = x2 (a2 1). Si ottiene quindi che per |a| = 1 lequilibrio
nellorigine `e stabile, per |a| < 1 `e asintoticamente stabile, per |a| > 1 `e
instabile.
Esempio: Sia dato il sistema t.d. x(t + 1) = ax3 (t), e la candidata
V (x) = x2 . Si ha V = a2 x6 x2 = x2 (a2 x4 1). Si ottiene quindi che,
per x sufficientemente piccoli (x2 < 1/|a|), V < 0, quindi V `e n.d. ed
il sistema `e asintoticamente stabile, qualsiasi sia a.

2.4.4

Estensione al caso di Globale Asintotica Stabilit`


a

Se, oltre alle ipotesi del metodo diretto di Lyapunov nel caso di asintotica
stabilit`a di un equilibrio, vale anche
lim V (x) =

kxk

(cio`e, se V (x) `e radialmente illimitata, e quindi le sue superfici di livello sono


chiuse), allora lequilibrio `e anche G.A.S.
La dimostrazione `e una diretta riapplicazione del metodo diretto; la condizione di chiusura delle superfici di livello `e necessaria per evitare che traiettorie
con V strettamente decrescente possano divergere.

`
CAPITOLO 2. STABILITA

24

x1
x1 +x2
Esempio: Analizzare il sistema x 1 = 2x2 6 (1+x
2 = 2 (1+x
2 )2 ;, x
2 )2 ,

mediante una candidata V (x) =


riportate in fig. 2.6).

x21
1+x21

x22

(le cui curve di livello sono

50

45

40

35

30

25

20

15

10

10

15

20

25

30

35

40

Figura 2.6: Curve di livello di una V (x) on radialmente illimitata

Esercizio: Si dimostri che lorigine `e equilibrio G.A.S per il sistema


x 1 = x2 x1 (x21 + x22 )
x 2 = x1 x2 (x21 + x22 )

2.5

Teorema dellInsieme Invariante Massimo

Il metodo diretto di Lyapunov non permette di concludere sulla attrattivit`a


dellequilibrio nel caso Lf V sia solo n.s.d.. In questo caso, `e assai utile il
teorema dellinsieme invariante massimo.
Un insieme M `e invariante per un sistema dinamico se tutte le orbite
del sistema che intersecano M sono interamente contenute in M . Ad esempio, gli equilibri sono insiemi invarianti, cos` come ogni orbita del sistema `e
(ovviamente) un insieme invariante. I cicli limite, ovvero le orbite chiuse di
un sistema, sono anchessi insiemi invarianti di particolare interesse. Ogni
unione di insiemi invarianti `e un insieme invariante. Ogni insieme invariante

2.5. TEOREMA DELLINSIEME INVARIANTE MASSIMO

25

`e una unione di orbite. Anche una regione contenuta allinterno di una superficie di livello chiusa di una funzione di Lyapunov per un sistema dato, `e
un insieme invariante (come consegue direttamente dalla dimostrazione del
teorema di Lyapunov).
Teorema dellInsieme Invariante Massimo.
Sia V (x) p.d. e sia S un sottoinsieme aperto dello spazio di stato contenente
lorigine nel quale vale Lf V (x) 0, x S. Si supponga che, per qualche
l, le superfici di livello V (x) = l siano curve chiuse e delimitino linsieme
l = {x|V (x) < l}, e sia l S.
Sia R = {x l |Lf V (x) = 0} e M il massimo (nel senso insiemistico)
insieme invariante contenuto in R. Allora, ogni traiettoria x(x0 , t) con x0
l converge allinsieme M (cio`e, limt inf m(t)M kx(x0 , t) mk = 0).
Dimostrazione (cenno). V (x(t)) `e non crescente, limitata inferiormente: quindi possiede un limite per t . Inoltre Lf V (x(t)) `e uniformemente continua rispetto a t e di conseguenza (per il lemma di Barbalat)
limt V (x(t)) = 0 (overo V = 0 in t.d.). Poiche l `e limitato, la traiettoria non pu`o che tendere a M .
Osservazione Si noti che il teorema vale per funzioni V non esplicitamente dipendenti dal tempo. Nel caso fosse V (x, t), il teorema resta valido
nella ulteriore ipotesi (in t.c.) che Lf V (x(t), t) sia uniformemente continua
in t, ci`o che si pu`o dimostrare ad es. facendo vedere che dtd Lf V `e limitata
per ogni t.
Corollario: se per una funzione di Lyapunov V (x) p.d. con Lf V (x)
n.s.d. lunica orbita del sistema contenuta in R `e un equilibrio, allora questo
`e stabile asintoticamente.
Il teorema dellInsieme Invariante Massimo `e noto anche come teorema
di LaSalle, che lo ha formulato in questa forma; oppure come teorema di
Krasovski, che ne aveva dimostrato in precedenza il corollario.

2.5.1

Applicazione alla Stima della R.A.S.

Supponiamo che V (x) sia una funzione di Lyapunov per il sistema x = f (x)
con origine asintoticamente stabile. Dato uno stato iniziale x, come possiamo
sapere se la traiettoria a partire da x converger`a allorigine?
Ovviamente, la condizione Lf V (
x) < 0 non `e sufficiente: la traiettoria
x(
x, t) `e infatti costretta a portarsi verso livelli inferiori di V sino a che rimane in S, ma potrebbe poi uscirne e quindi allontanarsi (vedi fig. 2.7). Una
condizione sufficiente `e la seguente:

`
CAPITOLO 2. STABILITA

26

Figura 2.7: Applicazione del Teorema di Lasalle alla stima della RAS

Teorema Sia lorigine un punto di equilibrio A.S. per il sistema x = f (x),


e sia V (x) una funzione di Lyapunov con Lf V (x) n.d.. Se nella regione chiusa
delimitata da una curva di livello V (x) = vale Lf V (x) < 0 (ovunque
eccetto che nellorigine) , allora `e compresa nella R.A.S. dellorigine.
` quindi possibile ottenere una stima per difetto (quindi cautelativa) della
E
RAS di un equilibrio cercando la pi`
u ampia curva V (x) = cost. > 0 contenuta
in una regione Lf V (x) = cost. < 0.
Il metodo di stima della RAS basato sul teorema dellI.I.M. pu`o essere
usato pi`
u volte con diverse funzioni di Lyapunov V (x), per raffinare successivamente le stime: lunione di insiemi contenuti nella RAS `e ovviamente
ancora contenuta nella RAS. Inoltre, il metodo si estende al caso in cui
Lf V (x) sia solo negativa semidefinita e si sia usato Krasovski per dimostrare
che lorigine `e A.S., e infine, se V (x) `e radialmente illimitata, alla G.A.S.
Esempio:
x 1 = x1 (x21 + x22 1) x2
x 2 = x1 + x2 (x21 + x22 1)

Il metodo indiretto indica gi`a la asintotica stabilit`a dellorigine. Il metodo


diretto, con la funzione di Lyapunov V (x) = xT x, offre lo stesso risultato.
Il teorema dellI.I.M. con la stessa candidata permette di affermare che
la regione x21 + x22 < 1 `e compresa nella R.A.S. Infatti Lf V (x) 0 in l
per l = 1, e R = {0}. Lorigine `e un equilibrio, e quindi lI.I.M. in R `e
lorigine stessa. Tutte le traiettorie che partono da dentro il cerchio unitario convergono quindi allorigine, che quindi `e contenuto nella R.A.S..
In effetti, `e facile vedere che la R.A.S. coincide col cerchio unitario aperto:
questo sistema ha un ciclo limite instabile sulla circonferenza unitaria.
La caratterizzazione degli insiemi invarianti per un sistema `e in generale

2.5. TEOREMA DELLINSIEME INVARIANTE MASSIMO

27

difficile. Spesso per`o la restrizione allo studio degli insiemi invarianti contenuti in R permette una facile e completa analisi: basta infatti utilizzare le
relazioni che definiscono R stessa (cio`e Lf V (x) 0, x R) e applicarle
alla dinamica del sistema x = f (x).
Esempio: Si consideri lequazione di un pendolo
mR2 + b + mgR sin = 0,
ovvero, in forma di stato,
x 1 =
x2
b
x 2 = mR2 x2 Rg sin x1 .

(2.4)

Gli equilibri sono in x2 = 0, sin(x1 ) = 0.


Il metodo di linearizzazione porta immediatamente a concludere che
lequilibrio in (0, 0) `e A.S. se b > 0, instabile se b < 0, mentre non si pu`o
concludere nulla nel caso b = 0. Lequilibrio in (, 0) `e invece sempre
instabile.
Per applicare il metodo diretto, si consideri come candidata di Lyapunov la somma della energia potenziale e della energia cinetica del
pendolo,
x2
V (x) = mgR(1 cos x1 ) + mR2 2 .
2
Si ha
Lf V (x) = mgRx2 sin x1 + mR2 x2 (

g
b
x2 sin x1 ) = bx22
2
mR
R

Per b 0 si ha Lf V (x) n.s.d., quindi in base al metodo diretto si pu`o


concludere per la stabilit`a (ma non per la convergenza).
Possiamo per`o adesso applicare il teorema di Krasovski con la stessa
candidata. Si osservi infatti che le curve di livello definite da V (x) =
sono chiuse quando 2mgR (si trovino le intercette della curva di
livello con lasse x1 ). Fissato , per b > 0 si ha poi
Lf V 0 x2 0 x 2 0
Avendo cos` caratterizzato linsieme R, dobbiamo trovare quale sia linsieme invariante massimo al suo interno. Questo significa imporre lappartenenza a R delle soluzioni della dinamica (2.4). Sostituendo quindi

`
CAPITOLO 2. STABILITA

28

in (2.4) le relazioni x2 = 0, x 2 = 0, si ottiene facilmente la ulteriore


relazione
sin(x1 ) 0
che deve essere soddisfatta da ogni punto di un insieme invariante in R.
Si ha quindi M = {x|x2 = 0, x1 = k, k IN} . Per = 2mgR, M
comprende la sola origine (infatti i punti di equilibrio in x1 = sono
sul bordo di , e non vi appartengono). La origine `e quindi equilibrio
asintoticamente stabile per b > 0, con bacino di attrazione lintera regione
. Ovviamente, per b = 0 si ha solo stabilit`a, in quanto in questo caso
si ha R = , ed M `e formato da tutte le traiettorie periodiche contenute
in R del sistema
x 1 = x2
x 2 = Rg sin x1
Nella sua versione pi`
u generale, il teorema dellI.I.M. pu`o essere usato per
determinare anche la attrattivit`a dei cicli limite. Nella formulazione del teorema dellinsieme invariante, lipotesi che V (x) sia p.d. non `e strettamente
necessaria: infatti nella dimostrazione si chiede solo che l sia limitato. Si
possono usare V (x) non p.d. ad esempio per la stabilit`a dei cicli limite.

Esempio: (Ciclo limite attrattivo)


x 1 = x2 x1 (x41 + 2x22 10)
x 2 = x31 3x52 (x41 + 2x22 10)
Linsieme descritto da C(x) = x41 + 2x22 10 = 0 `e invariante per questo
sistema: infatti
Lf C(x) = (4x41 + 12x62 )(x41 + 2x22 10)
si annulla sullinsieme. Il sistema, inizializzato su C(x) = 0, vi rimane,
muovendosi in senso orario (x 1 = x2 , ovvero x 2 = x31 ). Si consideri
V (x) = C 2 (x) (che soddisfa le ipotesi dellI.I.M. ma non `e p.d. propriamente): Lf V = 2C(x)Lf C(x) 0, x, e R `e formato dal ciclo limite pi`
u
lorigine, che sono entrambe insiemi invarianti. Lorigine `e per`o instabile: ogni traiettoria che inizi nellinsieme V (x) < 100 (che contiene ogni
punto interno al ciclo limite, ma esclude lorigine, ed `e limitato) converge
al ciclo limite.

2.5. TEOREMA DELLINSIEME INVARIANTE MASSIMO

29

Esempio: Si consideri il sistema di figura, in cui lo smorzatore e la


molla siano elementi nonlineari, rispettivamente con caratteristica fs =
cy 3 e fm = ky 3 . Si studi la stabilit`a del sistema al variare dei parametri
c 0 e k 0.

Scelto come vettore di stato x = (y, y)


= (x1 , x2 ), si ottiene la dinamica:

x 1 = x2
k 3
x 2 = m
x1 mc x32
Per k 6= 0, c 6= 0, lunico punto di equilibrio risulta lorigine x = (0, 0). Il
linearizzato del sistema e il seguente:


f
0
1
=
x2 3c
x2
3k
x
m 1
m 2
che, calcolato nellorigine, vale


0 1
0 0

Avendo il linearizzato autovalori nulli, non ci permette di dedurre alcunche riguardo alla stabilita del sistema. Introduciamo allora una candidata di Lyapunov definita come lenergia meccanica del sistema, che `e
data dalla somma Rdella energia cinetica T = 21 my 2 e della energia poteny
ziale elastica U = 0 kw3 dw = k4 y 4 . Posto V = U + T = k4 x41 + 21 mx22 , si
ottiene
V = cx42 ,
quindi il sistema, per k > 0 e c > 0, `e stabile. Per concludere sulla asintotica stabilit`a `e necessario studiare ulteriormente il sistema col criterio
dellI.I.M.: le traiettorie che rimangono nel luogo in cui si verifica V 0
hanno x2 0, quindi anche x 2 = 0, e ci`o, per la seconda equazione

30

`
CAPITOLO 2. STABILITA

dinamica del sistema, `e possibile solo dove x1 = 0. Quindi, essendo il


massimo insieme invariante interno al luogo in cui V = 0 costituito dalla
sola origine, lequilibrio nellorigine `e asintoticamente stabile. Essendo
poi V (x) illimitata radialmente, possiamo concludere anche sulla globale
asintotica stabilit`a.
Nel caso k 6= 0, c = 0, la V `e identicamente nulla al variare di x1 e x2 ,
quindi non si pu`o concludere per la asintotica stabilit`a. In effetti in tal
caso il sistema `e marginalmente stabile, essendo le traiettorie confinate
a curve di livello della V : se il sistema `e inizializzato in una condizione
tale da avere V (x(0)) = V0 , essendo V 0 sar`a V (x(t)) V0 .
Nel caso k = 0, c 6= 0, la funzione V sopra considerata non `e positiva
definita, ne ha curve di livello chiuse, quindi non `e a rigore una candidata
di Lyapunov. Si pu`o per`o osservare in questo caso che il sistema `e di
fatto dissaccoppiato, essendo la dinamica di x2 indipendente da x1 :

x 1 = x2
x 2 = mc x32
Per il sistema x 2 = mc x32 , la candidata V = m2 x22 `e p.d., e V = cx42
`e n.d., quindi x2 converge globalmente asintoticamente a zero. Naturalmente, altrettanto non si pu`o dire per x1 , del quale sappiamo solo che
tender`a ad un valore costante tanto pi`
u piccolo quanto minori sono le
condizioni iniziali in x1 e x2 . Tutti gli stati con x2 = 0, x1 sono dunque
tutti equilibri marginalmente stabili.
Infine, nel caso k = 0, c = 0, il sistema `e lineare, ed `e instabile
avendo due autovalori nulli con molteplicit`a geometrica uno (il sistema
`e ridotto ad una massa libera di muoversi sulla retta, per la quale una
condizione iniziale arbitrariamente piccola sulla velocit`a y = x2 porta
a divergenza della posizione y = x1 ). Vale la pena osservare che, se
il teorema di Lyapunov venisse applicato scorrettamente in questo caso
(k = c = 0), cio`e trascurando la necessaria ipotesi che V sia definita
positiva, si potrebbe giungere (essendo V = 0) a concludere falsamente
per la stabilita del sistema.

2.5.2

Applicazioni alla sintesi del controllo

Le tecniche di analisi alla Lyapunov possono essre molto utili anche nella
sintesi di leggi di controllo per sistemi non lineari. Si consideri il problema

2.5. TEOREMA DELLINSIEME INVARIANTE MASSIMO

31

seguente:
Dato un sistema controllato x = f (x) + g(x)u, trovare una legge di retroazione degli stati sugli ingressi u = u(x) tale che per il nuovo sistema
autonomo x = f(x) = f (x) + g(x)u(x) lorigine sia A.S..
Per una candidata di Lyapunov V (x), sia V = Lf V (x) + Lg V (x)u(x): se
posso scegliere u(x) tale che V sia una funzione di Lyapunov, si `e ottenuto
lo scopo.
Esempio: Per il sistema
x 1 = x32
x 2 = x31 + u
si consideri V (x) = x21 + x22 . Si ha Lf V = 2x1 x32 + 2x2 x31 e Lg V = 2x2 ,
per cui la scelta
2x1 x32 + 2x2 x31
u(x) =
+ x2
2x2
fa s` che V si n.s.d. Il controllore proposto in questo caso rende
marginalmente stabile lorigine.

Esempio: Algoritmi per gli zeri di funzioni. Sia h(q) = 0 un sistema


di n equaz. in n incognite; si vuole trovare una legge di aggiornamento
delle stime q = u(q) che converga agli zeri q a partire da q suff. vicini a
T
q. Si ponga V (q) = h 2 h e quindi V = hT h
u:
q
A) scegliendo u(q) = k
T

h
q

T

h(q) con k > 0, si ha V =

h
h n.s.d.. Questa tecnica `e nota nel calcolo numerico come
khT h
q q
metodo del gradiente ( o speepest descent).
 1
B) scegliendo (dove possibile!) u(q) = k h
h(q) si ha V =
q

khT h = kV (q) n.d.. Questa tecnica `e nota come metodo di Newton


Raphson, e garantisce convergenza esponenziale con velocit`a k (quindi
arbitrariamente veloce).
Lanalisi della convergenza del metodo (A), e della fattibilit`a del metodo (B), dipendono dalla invertibilit`a del jacobiano h
. In un intorno
q
sufficientemente piccolo di una soluzione isolata del sistema di equazioni,

`
CAPITOLO 2. STABILITA

32

questo `e garantito, ma non in grande: i metodi possono non convergere,


o convergere a minimi locali.

Esempio: Riconsideriamo la soluzione di equazioni algebriche


nonlineari h(q), ma tenendo conto della realizzazione in TD, cio`e
laggiornamento sia dato da q(t + 1) = q(t) + u(t).
Sia V (q) = hT h, la differenza direzionale `e
V = hT (q(t + 1))h(q(t + 1)) hT (q(t))h(q(t)).
Per u(t) suff. piccoli, si ha
h(t + 1) = h(q(t)) +
quindi
V = 2hT

h
u(t) + O(u2 (t)),
q

h
u(t) + O(u2 (t)).
q

Scegliendo
u(t) = k
ovvero
u(t) = k

T

h(q(t))

1

h(q(t)),

h
q

h
q

` evidente che per k elevati, questa


si ha convergenza locale per k piccoli. E
analisi non `e pi`
u valida.
Una funzione V (x) si dice funzione di Lyapunov di controllo (o Control
Lyapunov Function, CLF) per il sistema x = f (x) + g(x)u, f (0) = 0, se per
ogni x dove vale Lg V (
x) = 0 si ha Lf V (
x) < 0.
Se un sistema ammette una CLF, `e possibile realizzare un controllore.
Ad esempio, quando fosse possibile definire una retroazione
u(x) =

Lf V
Lg V, > 0
Lg V

si otterrebbe immediatamente
V = L2g V

`
2.6. TEOREMI INVERSI E DI INSTABILITA

33

che `e almeno semidefinita negativa. Questa legge potrebbe non essere applicabile in seguitro alle possibili discontinuit`a della retroazione in vvicinanza
dellequilibrio.
In casi abbastanza generali la formula (di Artstein-Sontag) fornisce una
retroazione continua nella forma
(
se Lg V (x) = 0
0, 2
4
u(x) =
(L
V
)
+(L
V
)
g
L V
f
Lfg V
altrove
Lg V
che stabilizza globalmente asintoticamente il sistema nellorigine.
Esempio: Si consideri il sistema

  3 
x1
x1
x =
u
+
3
x2
0
T

e la candidata funzione di Lyapunov di controllo V = x 2 x .


Si ha Lf V = 2(x21 x42 ) e Lg V = 2x41 , per cui le funzione data `e una
funzione di Lyapunov di controllo. Una retroazione stabilizzante (C
quasi ovunque) `e
(
0,
x1 = 0

16
2
4
2
4
u(x) =
16x1 +2(x1 x2 )
(x x )
1x4 2
x1 6= 0
2x4
1

2.6

Teoremi inversi e di instabilit`


a

Il criterio diretto di Lyapunov `e solo sufficiente: se non conosco una funzione


di Lyapunov, non posso concludere nulla. Esiste peraltro una serie di teoremi
inversi, di importanza soprattutto teorica, tra i quali i seguenti
Se lorigine `e un equilibrio stabile per il sistema x = f (x), allora esiste
una funzione di Lyapunov V (x);
Se lorigine `e un equilibrio asintoticamente stabile per il sistema x =
f (x), allora esiste una funzione di Lyapunov V (x) con Lf V (x) (o V (x)
in T.D.) negativa definita;
Se lorigine `e un equilibrio esponenzialmente stabile per il sistema x =
f (x), allora esiste una funzione di Lyapunov quadratica V (x) = xT P x;

`
CAPITOLO 2. STABILITA

34

(corollario del precedente) lorigine `e un equilibrio esponenzialmente


stabile per il sistema x = f (x) se e solo se il sistema linearizzato
approssimato in quel punto `e esponenzialmente stabile.
Esempio: La stabilit`a asintotica di un pendolo con smorzamento `e
stata dimostrata in precedenza con una funzione di Lyapunov con derivata solo negativa semi-definita, usando il teorema di Lasalle. Dal secondo
dei teoremi inversi, sappiamo che deve esistere una funzione di Lyapunov con derivata negativa definita. Infatti, per un pendolo con costanti
g
b
1 2
1
2
= mR
2 = 1, la V (x) = 2 x2 + 2 (x1 + x2 ) + 2(1 cos x1 ) ha Lf V (x)
R
negativa definita.
In taluni casi si pu`o dover dimostrare la instabilit`a di un sistema. Abbastanza ovviamente, se si dispone di una V p.d. e si verifica Lf V (o V (x)
in T.D.) anchessa p.d., si avr`a instabilit`a. Ma vi sono risultati pi`
u precisi.
Il primo teorema rinuncia alla definitezza di V (x):
Teorema di instabilit`
a di Lyapunov. Sia V (x) C 1 , V (0) = 0,
e Lf V (x) (o V (x) in T.D.) p.d.. Se V (x) pu`o assumere valori positivi
arbitrariamente vicino allorigine, lequilibrio nellorigine `e instabile.
Esempio: Lorigine `e un equilibrio instabile per il sistema
x 1 = x32
.
x 2 = x31
Infatti, posto V = x1 x2 , con V > 0 nel primo quadrante, si ha V = x41 +x42
p.d.

Esempio: Lorigine `e instabile per il sistema


x 1 = x2
.
x 2 = x32
2
e positiva per
Infatti, usando V = x31 x2 , si ha V = x21 x
2 (3 x1 x2 ), che `
tutti i punti di un cerchio di raggio R < 3.

Nel secondo teorema, si rinuncia anche alla definitezza di Lf V (x) (o


V (x)):

` DEI SISTEMI LINEARI STAZIONARI CON LYAPUNOV35


2.7. STABILITA
Teorema di instabilit`
a di Cetaev. Sia V (x) C 1 . Se, dato un intorno
del punto di equilibrio nellorigine W , esiste un insieme aperto U tale che
0 (U ) U ;
x U W , V (x 6= 0) > 0 e Lf V (x 6= 0) > 0 (ovvero V (x 6= 0) > 0);
Per x = 0 e x (U ) W , V (x) = 0
allora lequilibrio `e instabile per il sistema x = f (x).
Esempio: Per il sistema x = x3 , linstabilit`a della origine pu`o essere
evidenziata anche con il teorema di Cetaev: scegliendo V = x, per la
quale si ha V = x3 , le ipotesi di Cetaev sono verificate nella regione
U = {x > 0}.
Esempio: Per il sistema
x 1 = x1 x2
x 2 = x1 x2
lorigine `e instabile: infatti, scelta V = x1 x2 le ipotesi di Cetaev sono
verificate in U = {x1 > 0, x2 > 0}.

2.7
2.7.1

Stabilit`
a dei Sistemi Lineari Stazionari
con Lyapunov
Sistemi Lineari Tempo-Continui

Per il sistema x = Ax, si consideri la funzione quadratica candidata di


Lyapunov V = xT P x, e
def
V = 2xT P x = 2xT P Ax = xT (P A + AT P )x = xT Qx.

dove definiamo Q la parte simmetrica di 2P A.


Il sistema sar`a stabile se, per P p.d., anche Q risulter`a p.s.d., e asintoticamente stabile se Q `e p.d. In generale, preso P arbitrariamente, Q non
risulter`a definita.

`
CAPITOLO 2. STABILITA

36

Conviene procedere in questo caso in senso inverso: fissiamo Q p.d., e


cerchiamo P risolvendo lequazione
P A + AT P = Q.
Questa equazione matriciale, detta equazione di Lyapunov, `e equivalente ad
un sistema di n(n + 1)/2 equazioni lineari in n(n + 1)/2 incognite. Questo
sistema pu`o essere riscritto come M p = q, dove p e q sono vettori a n(n+1)/2
componenti formati ad es. giustapponendo le colonne di P e Q. Si dimostrer`a
che lequazione di Lyapunov con Q p.d. ha ununica soluzione P p.d. se e
solo se tutti gli autovalori di A sono a parte reale strettamente negativa
(s(A) OLHP ).
In queste ipotesi la soluzione esiste: infatti se A `e asintoticamente stabile,
posso porre
Z
T
P =
eA t QeAt dt
0

e quindi verificare che


AT P + P A =
=
=

R
0


T
T
AT eA t QeAt + eA t QeAt A dt
R  AT t At 
=
d e Qe
i
h 0
T
eA t QeAt
= 0 Q,
0

dove si `e usato il fatto che eA0 = I e che, se tutti gli autovalori di A sono a
parte reale negativa, limt eAt = 0.
Poich`e la soluzione del problema M p = q esiste per qualsiasi q, lo spazio
nullo di M `e vuoto, quindi la soluzione `e unica2 .
Nota: se x = Ax `e marginalmente stabile, lequazione di Lyapunov
AT P + P A = Q non pu`o ovviamente avere soluzioni P p.d. per Q p.d..
Sappiamo comunque dal teorema inverso di Lyapunov che una funzione di
Lyapunov esiste per il sistema: si tratta quindi di cercare una soluzione con
Q semidefinita positiva.
Questa soluzione non esister`a sempre, ma solo per opportune Q. Quando
la soluzione P esiste, non sar`a di conseguenza unica.

Lequazione di Lyapunov pu`


o essere risolta con laiuto del comando Matlab
P=lyap(M,Q). Si faccia per`
o attenzione che questo comando risolve lequazione M P +
P M T = Q, quindi deve essere invocato utilizzando al posto di M la trasposta di A,
ovvero P=lyap(A,Q).

` DEI SISTEMI LINEARI STAZIONARI CON LYAPUNOV37


2.7. STABILITA

Esempio: Un esempio semplicissimo `e il sistema x = 0, ovvero A = 0.


Lequazione di Lyapunov 0 P + P 0 = Q `e risolubile solo per Q = 0 (che
`e p.s.d). In questo caso, qualsiasi P `e soluzione.
Nel caso in cui x = Ax sia marginalmente stabile con m autovalori nellorigine, possiamo assumere senza perdere di generalit`a di esserci
messi nelle coordinate della forma di Jordan, per cui


J0 0
A=
0 Jn
dove Jn IR(nm)(nm) `e asintoticamente stabile, e J0 IRmm = 0
(essendo A per ipotesi marginalmente stabile, lautovalore in zero `e associato a m minimblocchi indipendenti). Lequazione di Lyapunov `e quindi
in questo caso


0 0
0 Jn

T 

P0 Pd
Pd Pn

P0 Pd
Pd Pn



0 0
0 Jn

Q0 Qd
Qd Qn

Assumendo Q diagonale (Qd = 0), la soluzione `e possibile solo se Q0 = 0.


In questo caso le soluzioni hanno Pd = 0, Pn soluzione di JnT Pn + PnT Jn =
Qn , e qualsiasi P0 .
Il caso di matrice A con autovalori immaginari puri `e lasciato per
esercizio.

2.7.2

Sistemi Lineari Tempo-Discreti

Per il sistema x(t + 1) = Ax(t), si consideri V = xT P x, e


Lf V

=
=
def

xT (t + 1)P x(t + 1) xT (t)P x(t)


x(t)T AT P A P x(t)
xT Qx

Lequazione Q = AT P AP `e detta equaz. di Lyapunov t.d.: si procede


anche in questo caso alla soluzione per P dato Q, soluzione che esiste ed `e
unica se e solo se s(A) OUC . La soluzione `e
P =

(AT )k QAk

k=0

serie che esiste se i modi di A convergono, e che `e p.d. perch`e composta dalla
somma di un primo termine (Q) p.d., con latri tutti p.s.d.

`
CAPITOLO 2. STABILITA

38
infatti
AT P A P = AT
=
=

AT

P
k=


P

k=
T k
k
T k
k
A

(A
)
QA
(A
)
QA
k=0
k=0


T
Q + A QA + . . . A Q + AT QA + . . .
Q

Lunicit`a discende ancora dalla linearit`a dellequazione negli elementi di


P.

2.7.3

Dimostrazione del metodo di linearizzazione

Per il sistema x = f (x) = Ax + h(x), con limx0 kh(x)k


= 0, si consideri
kxk
T
la funzione candidata di Lyapunov V = x P x, con P p.d. soluzione di
AT P + P A = I. Si ha Lf V = xT P f (x) + f T (x)P x = xT (P (Ax + h(x)) +
(Ax + h(x))T P )x = xT Ix + 2xT P h(x). Per cui, per kxk sufficientemente
kxk
, quindi Lf V n.d.
piccoli, kh(x)k < 2kP
k
Supponiamo invece che A abbia n1 autovalori a parte reale positiva, e
n2 = n n1 a parte reale negativa (non zero per il momento). Scegliendo
opportunamente la base della rappresentazione di stato, si avr`a


A1 0
x
x =
0 A2
dove s(A1 ) OLHP e s(A2 ) OLHP . Consideriamo lequazione

cio`e

AT1 0
0 AT2



P1
0
0 P2

P1
0
0 P2



A1 0
0 A2

I 0
0 I

(AT1 )P1 + P1 (A1 ) = I


= I
AT2 P2 + P2 A2

che ammettono una


d.p.. Se considero una funzione V (x) =

 unica soluzione,
P1
0
, essa ha dunque Lf V = xT x + 2xT P h(x) p.d.,
xT P x, con P =
0 P2
ma V (x) assume valori positivi arbitrariamente vicino allorigine, quindi, per
il criterio di Lyapunov, lequilibrio `e instabile.
Nel caso che A abbia anche qualche autovalore sullasse immaginario,
baster`a considerare una diversa scrittura del sistema, x = f (x) = Ax+h(x) =

2.8. STIMA NUMERICA DELLA RAS

39

(A + I)x + h(x), cos` che nessun autovalore di A = A I (pari a quelli di A


meno ) sia sullasse immaginario ma quelli a parte reale positiva rimangano
si trova Lf V = xT x+2xT P h(x)+2V (x).
tali. Ragionando come sopra su A,
Nella regione dellintorno dellorigine contenuta nel cono in cui V (x) > 0 `e
anche Lf V > 0, quindi (ora per Cetaev) si ha instabilit`a.
Linteresse della applicazione del metodo diretto di Lyapunov ai sistemi
lineari risiede nel fatto che esso non richiede il calcolo esplicito degli autovalori
di A (che per sistemi di grandi dimensioni `e problema difficile). Daltronde, le
indicazioni date sono minori, e riguardano solo le propriet`a qualitative delle
soluzioni. Il risultato `e quindi analogo allutilizzo del criterio di Routh (e
la sua controparte TD Jury) per determinare il segno della parte reale delle
radici di un polinomio, che, se applicato al polinomio caratteristico di A, ci
d`a indicazioni sulla stabilit`a di x = Ax.
Unaltra applicazione comune della equazione di Lyapunov riguarda sistemi nonlineari, per i quali la V (x) = xT P x con P calcolata in base al
linearizzato, ma applicata al vero sistema, pu`o dire qualcosa di pi`
u sulla
R.A.S. di quanto non dica il metodo indiretto da solo.

2.8

Stima numerica della RAS

Si consideri un sistema

x = f (x, u)
y = h(x)

per il cui modello linearizzato x = Ax + Bu, y = Cx sia stato progettato un


controllore stabilizzante di equazioni x r = Ar xr + Br y, u = Cr xr + Dr y.
Il sistema costituito dalla connessione in retroazione dellimpianto effettivo con il controllore progettato `e quindi descritto dalle equazioni
x = f (x, u) = (A + Br Dr C) x + BCr xr + g(x, xr )

x r = Ar xr + Br y = Ar xr + Br Cx + Br h(x)
Indicando con z = [xT , xTr ]T lo stato complessivo, si pu`o riscrivere
z = Af z + f(z), dove




g(x, xr )
A + Br Dr C BCr

Af =
; f (z) =
.

Br C
Ar
Br h(x)
Si noti che, quando il termine di errore f() fosse nullo, il sistema non-lineare
complessivo coinciderebbe con quello linearizzato che sappiamo essere stato
stabilizzato. Per tale sistema linearizzato si pu`o agevolmente trovare una funzione di Lyapunov del tipo VQ = z T PQ z, con PQ soluzione della equazione di

`
CAPITOLO 2. STABILITA

40

Lyapunov PQ Af + ATf PQ = Q (ad esempio col comando Pq=lyap(Af,Q)3 ,


per qualche Q simmetrica positiva definita.
Per stimare (per difetto) la regione di asintotica stabilit`a del sistema
nonlineare stabilizzato, si deve quindi valutare la regione in cui vale la disequazione V Q = z T Qz + 2z T PQ f(z) < 0, e trovare la pi`
u grande curva di
livello di VQ interamente contenuta in quella regione. Che questa regione non
sia vuota `e garantito dal fatto che il secondo ed il terzo addendo sono infinitesimi rispettivamente di almeno terzo e quarto ordine rispetto a kzk, mentre
il primo addendo `e di secondo ordine. Solo in casi rari la disequazione pu`o
` per`o possibile verificarla numericamente in
essere studiata analiticamente. E
un grande numero di casi, per giungere ad una conclusione non perfettamente
rigorosa, ma comunque molto affidabile. Questo pu`o essere fatto ad esempio
generando numeri casualmente distribuiti sulla curva VQ = R e guardando al
segno di V Q al variare di R, come descritto nella semplice procedura seguente:
function evalvdot(P,Q,R)
M=inv(sqrtm(P));
for i=1:1:500000
% Numero di tentativi casuali
x = (rand(size(P,1),1)-0.5);
y=sqrt(R)*x/norm(x);
% Vettore di direzione random e lunghezza sqrt(R)
z=M*y;
% Punto random sulla curva di livello
% ftilde = ...;
% definizione della funzione ftilde(x)
vdot=-z*Q*z+2*z*P*ftilde(z);
if vdot > 0 disp(Punto forse esterno alla R.A.S.!), break; end
end

2.9

Velocit`
a di Convergenza

Nelle applicazioni, `e importante determinare se la convergenza allequilibrio


`e pi`
u o meno veloce: se `e esponenziale innanzitutto, e con quale esponente
nel caso che lo sia.
Vale qui la pena ricordare che, tra i teoremi di esistenza, abbiamo incontrato un risultato che esclude la possibilit`a di convergenza esponenziale
verso un equilibrio per un sistema nonlineare il cui linearizzato non fosse
asintoticamente stabile.
Ricordiamo che in generale si dice velocit`a di convergenza di un sistema
verso un equilibrio esponenzialmente stabile il pi`
u grande scalare > 0 tale
che, per condizioni iniziali 0 sufficientemente vicine allequilibrio, una norma
dello stato decresca come k(0 , t)k et per qualche > 0.
3

si faccia attenzione alla sintassi del comando

` DI CONVERGENZA
2.9. VELOCITA

41

Se si riesce a determinare una relazione tra una funzione di Lyapunov e


la sua derivata direzionale del tipo
V = Lf V (x) V (x), > 0
si ha che lungo le traiettorie V (t) + V (t) = Z(t) 0, quindi
V (t) et V (0).
Rt
Infatti la soluzione di V = V +Z(t) `e V (t) = et V (0)+ 0 e(t ) Z( )d ,
e lintegrale `e non positivo.
Ad esempio, per una funzione di Lyapunov V (x) = xT x = kxk2 , si avrebt
be kx(t)k2 et kx(0)k2 ovvero kx(t)k e 2 kx(0)k, quindi convergenza
esponenziale con velocit`a (almeno) /2.
Nel caso TD si ha analogamente che V (x(t + 1)) < V (x(t)) con < 1
implica V (t) t V (0).
Analagomente a quanto visto per la stabilit`a, ci possiamo chiedere fino a
che punto una specifica di progetto del controllore per il sistema linearizzato
quale il tempo di assestamento si conservi quando il controllore `e applicato
al sistema effettivo nonlineare.
Per ricollegare il concetto di polo dominante, tipico della analisi in frequenza, con il concetto di velocit`a di convergenza introdotto nello studio
della stabilit`a, si consideri quanto segue.
Si osservi preliminarmente che, detti max (R), min (R) il massimo e minimo autovalore di una matrice R simmetrica e definita positiva, valgono le
seguenti relazioni
T R min (R)kk2 ;
T R max (R)kk2 ;
R max (R)I;
R min (R)I,

dove con la disequazione matriciale R1 R2 si intende che la matrice R1 R2


`e semi-definita positiva (ovvero definita positiva se vale > strettamente). Applicando queste relazioni alle matrici P e Q della equazione di Lyapunov relativa al sistema linearizzato controllato la cui matrice dinamica `e Af , ovvero
P Af + ATf P = Q, e ricordando che queste determinano una funzione di
Lyapunov per il sistema V = T P , si pu`o scrivere
T (max (P )I)
V = T Q min (Q)kk2 = min (Q)
V,
max (P )
dove =

min (Q)
.
max (P )

`
CAPITOLO 2. STABILITA

42

Dalla relazione V (t) V (t) si ha immediatamente che V (t) V (0)et ,

(P )
quindi kk2 min1 (P ) V (t) max
k0 k2 et da cui infine kk e 2 t . In
min (P )
conclusione, la velocit`a di convergenza di un sistema lineare `e non inferiore
min (Q)
a /2 = 12 max
.
(P )
Questa stima dipende ovviamente dalla scelta di Q. Si pu`o dimostrare
che la migliore stima della velocit`a di convergenza si ottiene nel caso in cui
si scelga Q = I. In questo caso, supponendo per semplicit`a che la matrice
dinamica abbia tutti autovalori reali e distinti, possiamo porre il sistema nelle coordinate in cui la matrice dinamica Af `e diagonale. La soluzione della
equazione di Lyapunov P Af + ATf P = I `e in questo caso P = 1/2A1
f ,
da cui si ha che = 2max (Af ): quindi, lautovalore pi`
u lento (dominante)
del sistema rappresenta proprio la velocit`a di convergenza.
Dato un sistema nonlineare il cui linearizzato approssimato ha velocit`a
di convergenza esponenziale /2, si pu`o dimostrare che il sistema nonlineare
ha la stessa velocit`a di convergenza verso lequilibrio. Infatti, la definizione
di velocit`a di convergenza `e locale, cio`e per condizioni iniziali 0 sufficientemente piccole. Usando la stessa funzione di Lyapunov T P per il sistema
()k
nonlineare, si ha V = T Q + 2 T P f(), con lim0 kfkk
0. Fissato > 0,

()k
min (P )
con > , si pu`o scegliere quindi 0 tale per cui kfkk
< max
, quindi
(P )
V ( )V , dove pu`o essere fissato arbitrariamente piccolo.

2.10

Costruzione di Krasovski

Quando il linearizzato di un sistema non `e asintoticamente stabile, non abbiamo alcun metodo generale per costruire funzioni di Lyapunov per il sistema. Una tecnica talvolta utile `e la costruzione di Krasovski. Per il sistema
x = f (x), con x = 0 punto di equilibrio, si consideri la candidata V (x) =
il jacobiano di f (x) e F (x) = A(x) + AT (x) la
f (x)T f (x). Detto A(x) = f
x
sua parte simmetrica, se F (x) `e negativa definita (localmente o globalmente),
allora si ha asintotica stabilit`a (locale o globale) dellequilibrio 4 .
Si ha infatti
Lf V (x) = f T (x)A(x)f (x) + f T (x)AT (x)f (x) = f (x)T F (x)f (x).
che `e definita negativa. Infatti, F (x) `e negativa definita per ipotesi: per
dimostrare che Lf V (x) = 0 solo in x = 0 (almeno localmente), dobbiamo an

Si osservi esplicitamente che A(0) = f
`e la matrice dinamica del linearizzato,
x
x=0
che ovviamente non si richiede qui essere definita negativa.
4

2.11. SISTEMI NON STAZIONARI

43

cora escludere il caso che f (x) possa annullarsi in punti x 6= 0. Ma se F (x) `e


n.d., allora A(x) `e nonsingolare localmente per ogni x 6= 0: se cos` non fosse,
e fosse per assurdo A(x)v = 0, sarebbe anche v T F (x)v = 2v T A(x)v = 0, contraddizione. Quindi, per il teorema del Dini, f (x) `e invertibile univocamente
laddove F (x) `e definita negativa, cio`e lequilibrio nellorigine `e isolato.
Si noti che questa tecnica pu`o essere utile per casi in cui il metodo indiretto non d`a risultati perch`e A(0) ha autovalori a parte reale nulla. In questi
casi non `e possibile costruire una V (x) quadratica col metodo della equazione
di Lyapunov, e quindi non si potr`a mai avere esponenziale stabilit`a.
Esempio: Per il sistema x = x3 , si ha A(x) = 3x2 e F (x) =
6x2 n.d.. Lorigine `e stabile asintoticamente, anche se la velocit`a di
convergenza sar`a meno che esponenziale.

2.11

Sistemi non stazionari

Nel caso di un sistema non stazionario, ovvero con dipendenza esplicita dal
tempo del tipo IDx = f (x, t), i metodi di studio della stabilit`a devono essere
posti con maggiore cautela.
Questo `e gi`a evidente dallo studio dei sistemi lineari tempo varianti, nei
quali gi`a si osservano importanti differenze col caso tempo invariante.
Per un sistema lineare tempo variante
x = A(t)x
la condizione che la parte reale degli autovalori di A(t) sia negativa per ogni
t non `e sufficiente per affermare la stabilit`a.
Si consideri infatti ad esempio il sistema LTCTV


1 a(t)
x
(2.5)
x = Ax =
0 1
che ha spettro (A(t) = {1, 1} per ogni t. Questo non `e sufficiente a
garantire la sua stabilit`a: basta considerare ad esempio il caso a(t) = e2t , le
cui soluzioni chiaramente divergono.
Non `e sufficiente neppure aggiungere unipotesi di limitatezza delle funzioni che formano A(t), ad esempio imponendo che una norma di A(t) sia

`
CAPITOLO 2. STABILITA

44

limitata (cio`e che M : kA(t)k M, t 0): un controesempio in tal senso


`e fornito da




cos t sin t
1 5
T
R(t), con R(t) =
A(t) = R (t)
sin t cos t
0 1
il cui spettro `e (A(t)) = {1}, ma `e comunque instabile.
In effetti, la condizione di negativit`a della parte reale degli autovalori di
A(t) non `e neppure necessaria, come mostrato da questo sistema
A(t) =

15 sin 12 t11
2
15 cos 12 t
2

15 cos 12 t
2
t+11
15 sin 12
2

per il quale (A(t) = {2, 13}, ma che `e esponenzialmente stabile.


In effetti, ci si pu`o attendere che quando il sistema fosse tempo variante in
modo sufficientemente lento, le propriet`a di stabilit`a possano essere derivate
da quelle del corrispondente modello a tempo congelato. Una condizione
di questo tipo `e espressa da un teorema di H. H. Rosenbrock per sistemi
lineari tempo varianti x = A(t)x.
Teorema Sia A(t) : IR+ IRnn differenziabile, uniformemente limitata
(cio`e M > 0 tale che kA(t)k M, t), con autovalori a parte reale uniformemente negativa nel tempo (cio`e > 0 tale che Re((A(t))) ,
(A(t))). Lequilibrio nellorigine `e esponenzialmente stabile se vale
una delle condizioni:
i) > 4M ;

ii) kA(t)k
, t con > 0 sufficientemente piccolo
Una determinazione quantitativa esplicita (ma solo sufficiente) del bound
4n2
2
. Le
del teorema di Rosenbrock `e disponibile nella forma < 2n1
2M 4n4
dimostrazioni di questi ultimi risultati si appoggiano sulluso di funzioni di
Lyapunov tempo varianti, oggetto del prossimo paragrafo.

2.11.1

Studio di sistemi non stazionari con il metodo


di Lyapunov

Per studiare i sistemi non stazionari, anche quando lineari, pu`o dunque
essere necessario usare tecniche alla Lyapunov, anche se queste richiedono
particolare attenzione.

2.11. SISTEMI NON STAZIONARI

45

Nel caso di sistemi tempo-varianti, `e innanzitutto utile precisare le nozioni


di stabilit`a e convergenza, introducendo il concetto di uniformit`
a nel tempo.
Considerando il sistema non-stazionario
Dx = f (x, t), x(t0 ) = x0

(2.6)

il suo movimento generico x(t) = x(x0 , t0 , t t0 ) dipende in generale oltre


che da x0 anche dal tempo t0 in cui questa condizione `e verificata. Diremo che il movimento `e uniformemente stabile per il sistema (2.1) se tutti
i movimenti che originano in qualsiasi tempo t da condizioni iniziali sufficientemente vicine a x0 rimangono arbitrariamente vicine a x(x0 , t0 , t t0 )
stesso; ovvero, se > 0, > 0 indipendente da t0 tale che se kx x0 k < ,
allora kx(x , t , t t ) x(x0 , t0 , t t0 )k < , t, t0 , t . Estensioni analoghe
definiscono la uniforme convergenza, la uniforme asintotica stabilit`a etc.

Candidate stazionarie
Per studiare la stabilit`a di un equilibrio, consideriamo innanzitutto il caso in cui si usi una candidata di Lyapunov stazionaria V (x). La funzione V = Lf V (x, t) `e in generale non stazionaria: una condizione sufficiente
per lasintotica stabilit`a dellequilibrio `e che Lf V (x, t) sia uniformemente
negativa definita, cio`e che m > 0 : Lf V (x, t) < mkxk, x Br (0), t.
La necessit`a della condizione di uniforme n.d. `e illustrata da questo
esempio: sia x = a(t)x, con a(t) < 0, t, e sia V (x) = x2 . Pur avendosi
Lf V (x) = 2a(t)x2 < 0 in ogni istante, la uniformit`a nel tempo di questa
propriet`a non `e garantita per qualsiasi a(t). In effetti, se si pone ad esempio
a(t) = e2t , il sistema non converge allequilibrio nellorigine.
Dal precedente risultato si deriva immediatamente che una condizione
sufficiente per la stabilit`a di un sistema LTCTV `e che gli autovalori della sua
parte simmetrica abbiano parte reale uniformemente negativa. Dato infatti
x = A(t)x, si consideri la candidata tempo invariante V (x) = 21 xT x, per la
T (t)
)x.
quale si ha V = xT ( A(t)+A
2
Nellesempio (2.5), il polinomio caratteristico della parte simmetrica di
A(t) vale () = 2 + 2 + 1 a2 /4, quindi Lf V (x, t) `e uniformemente n.d.
se M tale che, t, valga |a(t)| M < 2. Questa condizione `e ovviamente
molto cautelativa: basta pensare che nel caso di a costante, il sistema `e
stabile per qualsiasi valore di a.

`
CAPITOLO 2. STABILITA

46
Candidate non stazionarie

Per studiare la stabilit`a di sistemi non stazionari `e spesso utile, e talvolta


necessario, usare candidate di Lyapunov esse stesse non stazionarie, cio`e del
tipo V (x, t).
La possibilit`a che la V (x, t), e quindi le sue curve di livello, cambino
nel tempo introduce per`o la necessit`a di riformulare il concetto di positiva
definitezza. Per evidenziare il possibile assurdo in cui si potrebbe incorrere
altrimenti, `e sufficiente considerare il sistema a una dimensione x = x e la
candidata V (x, t) = x2 et , che soddisfa la condizione V (x, t) > 0 x 6= 0,
e per la quale si avrebbe V = (2 )x2 et . Per > 2, V (x, t) < 0
x 6= 0, che indicherebbe asintotica stabilit`a anche per positivi, il che `e
chiaramente assurdo. La ragione di questo fenomeno `e che le curve di livello
della V si allargano ad una velocit`a maggiore di quella con cui le traiettorie
del sistema divergono.
Il teorema diretto di Lyapunov deve essere opportunamente riformulato
in questo caso, mediante le seguenti definizioni:
Una funzione scalare : [0, a) [0, ) si dice di classe K se (0) = 0
ed `e strettamente crescente (quindi in particolare (x) > 0, x > 0). Si dice
di classe K se `e di classe K, `e definita sulla semiretta positiva (a = ) e
limr (r) = .
I teoremi del metodo diretto di Lyapunov possono essere formulati per un
sistema x = f (x, t), con equilibrio nellorigine (cio`e con f (0, t) = 0 t 0) e
con f (x, t) sufficientemente regolare (cio`e Lipschitz rispetto a x e continua a
tratti rispetto a t), come segue:
Teorema. Si consideri un intorno IRn dellorigine. Se esiste una
funzione differenziabile V (x, t) tale che, t 0 e x , vale
1 (kxk) V (x, t) 2 (kxk)
e

V
V
V =
+
f (x, t) 3 (kxk)
t
x
allora si ha che lequilibrio `e:
1. uniformemente stabile se 1 e 2 sono funzioni di classe K e 3 (x) 0,
x ;
2. uniformemente asintoticamente stabile se tutte le i sono funzioni di
classe K in , i = 1, 2, 3;

2.11. SISTEMI NON STAZIONARI

47

3. globalmente uniformemente asintoticamente stabile se se 1 e 2 sono


funzioni di classe K e 3 (x) `e di classe K su = IRn ;
4. esponenzialmente stabile se tutte le i sono funzioni esponenziali del
tipo i (x) = ki x su , con ki > 0 e > 0, i = 1, 2, 3 (globalmente
esponenzialmente stabile se = IRn ).
Consideriamo infine la generalizzazione del principio di invarianza di LaSalle al caso di funzioni V (x, t) non stazionarie. Questa `e non banale: infatti,
linsieme R = {x|V (x, t) = 0} pu`o essere esso stesso tempo-variante. Se per`o
per una opportuna funzione W (x) 0 vale V (x, t) W (x) 0, allora si
pu`o affermare che il sistema converger`a, a partire da condizioni iniziali contenute in opportune regioni, allinsieme in cui si annulla W (x). Il teorema si
enuncia pi`
u precisamente cos`:
Teorema (LaSalle-Yoshizawa). Dato il sistema x = f (x, t) si consideri
una funzione V (x, t) con
1 (kxk) V (x, t) 2 (kxk)
dove 1 , 2 sono funzioni di classe K in , e valga
V
V
V =
+
f (x, t) W (x) 0
t
x
per una funzione W () 0. Allora, tutte le traiettorie che partono da sono
limitate, e limt W (x(t)) = 0, quindi x(t) S = {x|W (x) = 0}.
Un risultato simile al precedente teorema `e spesso usato nelle dimostrazioni relative al controllo adattivo:
Lemma di Barbalat applicato alla stabilit`
a Dato il sistema x =
f (x, t), si consideri una funzione V (x, t) 0, sia V (x, t) = V
+ V
f (x, t)
t
x
uniformemente continua, e valga V (x, t) 0. Allora vale limt V (x(t)) = 0,
quindi x(t) {x|V (x) = 0}.
La condizione di uniforme continuit`a di V (x, t) in t `e richiesta dal lemma
di Barbalat: infatti, esistono funzioni che, pur convergendo ad un valore
costante, hanno derivata che non si annulla (ad esempio f (t) = sin(t2 )/t,
t > 1).
Si ricorda che una condizione sufficiente per la uniforme continuit`a di
V (x, t) `e che V (x, t) sia limitata, cosa questa spesso pi`
u facile da dimostrare.

`
CAPITOLO 2. STABILITA

48

2.12

Appendice: Simulazioni con Matlab

Il metodo piu semplice di simulare i sistemi dinamici in Matlab e quello


di usare le routine di integrazione numerica delle eq. diff. ordin. ODE23,
ODE45, etc.:
>>help ode23
ODE23 Solve non-stiff differential equations, low order method.
[T,Y] = ODE23(F,TSPAN,Y0) with TSPAN = [T0 TFINAL] integrates the system of differential equations y = F(t,y) from time T0 to TFINAL with initial
conditions Y0. F is a string containing the name of an ODE file. Function F(T,Y)
must return a column vector. Each row in solution array Y corresponds to a time
returned in column vector T. To obtain solutions at specific times T0, T1, ...,
TFINAL (all increasing or all decreasing), use TSPAN = [T0 T1 ... TFINAL].

Si fa uso quindi di funzioni Matlab che devono essere scritte dalutente


usando un normale editor.
% Esempio: oscillatore di Van der Pol

>> type vdp.m


function dx = vdp(t,x);
% ODE file for Van der Pol oscillator
dx(1,1) = x(2);
dx(2,1) = -x(1) + (1-x(1)^2)*x(2);
>> [t,x]=ode23(vdp, [0, 10], [.1, .1]);
>> plot(x(:,1), x(:,2),g)
>> hold on; grid
>> [t,x]=ode23(vdp, [0, 10], [-.1, -.1]);
>> plot(x(:,1), x(:,2),r)
...etc.
>> print -deps vanderpol.eps

2.12. APPENDICE: SIMULAZIONI CON MATLAB

49

4
2.5

1.5

0.5

% Esempio: sistema di Vinograd

>>type vinograd.m
function dx = vinograd(t,x);
% ODE file for Vinograd system
x1=x(1);
x2=x(2);
r=x1^2+x2^2;
q=1+(x1^2+x2^2)^2;
dx(1,1) = x1^2*(x2-x1)+x2^5;
dx(2,1) = x2^2*(x2-2*x1);
dx=dx/(r*q);

0.5

1.5

2.5

`
CAPITOLO 2. STABILITA

50
1.5

0.5

0.5

1.5
1.5

0.5

0.5

1.5

>>>>help meshgrid
MESHGRID X and Y arrays for 3-D plots. [X,Y] = MESHGRID(x,y) transforms
the domain specified by vectors x and y into arrays X and Y that can be used for
the evaluation of functions of two variables and 3-D surface plots. The rows of the
output array X are copies of the vector x and the columns of the output array Y
are copies of the vector y.
[X,Y] = MESHGRID(x) is an abbreviation for [X,Y] = MESHGRID(x,x).
[X,Y,Z] = MESHGRID(x,y,z) produces 3-D arrays that can be used to evaluate
functions of three variables and 3-D volumetric plots.

>>[X,Y]=meshgrid(-10:.5:10, -5:.2:5);
>>V=0.2*X.^2 + Y.^2;
>>mesh(V)
>>print -deps mesh.eps

45
40
35
30
25
20
15
10
5
0
60
50

50

40

40

30

30
20

20
10

10
0

2.12. APPENDICE: SIMULAZIONI CON MATLAB

51

>>contour(V)
>>grid
>>print -deps contour.eps

50

45

40

35

30

25

20

15

10

10

15

20

25

30

35

40

>>V=(X.^2)./(1+X.^2) + Y.^2;
>>mesh(V)
>>print -deps mesh2.eps

30
25
20
15
10
5
0
60
50

50

40

40

30

30
20

20
10

10
0

>>contour(V)
>>contour(V,[0.01:.2:2])
>>print -deps contour2.eps
>>diary off

`
CAPITOLO 2. STABILITA

52
50

45

40

35

30

25

20

15

10

>>diary off

10

15

20

25

30

35

40

Capitolo 3
Raggiungibilit`
ae
Controllabilit`
a
Un problema di rilievo nella teoria dei sistemi che coinvolge gli stati e gli
ingressi `e quello del raggiungimento di un desiderato stato finale a partire
da un dato stato iniziale, mediante applicazione di un opportuna azione di
controllo.
Questo problema ha applicazioni dirette nel senso della pianificazione
delle azioni di controllo da esercitare su un sistema in anello aperto, cio`e
basandosi esclusivamente sulla conoscenza a priori del modello del sistema e
del suo stato iniziale.
Inoltre, esso ha importantissime conseguenze sulle propriet`a ottenibili dal
sistema in anello chiuso, cio`e quando nella scelta del controllo si utilizzino
anche misure effettuate sullo stato o sulle uscite.
Nei problemi di pianificazione, ci troveremo spesso di fronte a problemi
che possono essere ricondotti a sistemi di equazioni in pi`
u incognite, per i
quali si pongono i problemi di esistenza delle soluzioni (problema di raggiungibilit`a) e di nonunicit`a, e quindi di scelta, tra le soluzioni (problema di
controllo ottimo).
Consideriamo un sistema tempo invariante in forma di stato
IDx(t) = f (x(t), u(t)),
con x IRn , e u() U , dove U `e lo spazio di funzioni o successioni in cui `e
possibile scegliere i controlli. Sia al solito x(x0 , u(), t) il valore della soluzione
corrispondente a x(0) = x0 e controllo u( ), [0, t], al tempo t.
U pu`o ad esempio rappresentare un insieme di controlli ad ampiezza limitata (U = {u|ku()k 1}), o a quadrato sommabile limitato (U =
{u|ku()k2 1}); la classe pi`
u generale usualmente considerata `e quella dei
53

54

` E CONTROLLABILITA
`
CAPITOLO 3. RAGGIUNGIBILITA

controlli quasicontinui (con un numero finito di discontinuit`a su qualsiasi


intervallo finito).
Si definisce insieme dei punti raggiungibili al tempo t da x0 linsieme
{
x IRn |
u U : x(x0 , u, t) = x}.

3.1
3.1.1

Insieme di raggiungibilit`
a
Sistemi LTITC

Consideriamo linsieme di raggiungibilit`a per il sistema


x = Ax + Bu, x(0) = x0

(3.1)

nellipotesi che tutte le componenti dellingresso u(t) siano funzioni analitiche in [0, t], cio`e funzioni lisce (differenziabili con continuit`a infinite volte)
e sviluppabili in serie di potenze. Usando per semplicit`a ft per indicare la
funzione f (t) valutata in t (quindi ad esempio u0 indica u(0)), si ha
ut =

(k) t
u0

k!

k=0

(0)

dove con ut si intende la funzione non derivata.


In queste ipotesi, anche la soluzione della equazione differenziale (3.1) `e
sviluppabile in serie di potenze:
x(x0 , u, t) =

(k) t

x0

k=0

Differenziando (3.1) si
nella serie:
x(1)
x(2)
x(3)
..
.
x(k)

k!

ottengono le espressioni delle derivate che appaiono


=
Ax + Bu
2
=
A x + ABu + Bu(1)
= A3 x + A2 Bu + ABu(1) + Bu(2)
..
=
.
P
k
k
=
A x + i=1 Aki Bu(i1)

da cui, valutando in t = 0 e sostituendo, si ha


x(x0 , u, t) =

X
k=0

Ak

k
X
k
X
tk
(i1) t
Aki Bu0
x0 +
.
k!
k!
k=1 i=1

`
3.1. INSIEME DI RAGGIUNGIBILITA

55

La prima sommatoria a sinistra vale eAt x(0) e rappresenta levoluzione libera


del sistema. Scrivendo i primi termini dello sviluppo esplicito della seconda
sommatoria,
2
3
3
t2
t3
(1) t
(1) t
(2) t
+ Bu0
+ A2 Bu0 + ABu0
+ Bu0
+
2
2
3!
3!
3!
si osserva che le somme possono essere riorganizzate in un prodotto matriciale scrivendo

Bu0 t + ABu0

k=0
P
Pk=0

k=0

(k) tk+1
(k+1)!
(k) tk+2
u0 (k+2)!
(k) tk+3
u0 (k+3)!

u0




At
2
r1
x(x0 , u, t) = e x0 + B|AB|A B| |A B|
..

.
P
u(k) tk+r
k=0 0 (k+r)!
..
.

Si osservi a questo punto che le serie che appaiono nel vettore di infinite componenti a destra convergono agli integrali indefiniti successivi degli
ingressi ut . Infatti, poich`e si `e ipotizzato ut liscia, quindi senza impulsi
nellorigine, si ha
def

(1)

ut

(2)

ut

=
=

Rt
(1)
(1) 2
u(t1 )dt1 = u0 + u00 t + u0 t2 + =
0
P
(k) tk+1

k=0 u0 (k+1)!

R t R t1
2
(2)
(1)
u(t2 )dt2 dt1 = u0 + u0 t + u00 t2 + =
0 0
P
(k) tk+2

k=0 u0 (k+2)!

def

=
=

e in generale

rvolte
(r)

ut

zZ Z}| Z{

t
k+r
X
(k) t
=
u() =
u0
(k + r)!
0
k=0

Si pu`o dunque riscrivere

(1)

ut
(2)
ut
(3)
ut
..
.



x(x0 , u, t) = eAt x0 + B|AB|A2 B| |Ar1 B|

(r)
ut
..
.

56

` E CONTROLLABILITA
`
CAPITOLO 3. RAGGIUNGIBILITA

Essendo le funzioni di ingresso lisce ma peraltro non vincolate in alcun


modo, esse possono assumere valori arbitrari nellintervallo [0, t]. Pertanto,
anche i loro integrali valutati al tempo t possono assumere valori arbitrari.
Consideriamo innanzitutto linsieme degli stati raggiungibili al tempo
t a partire dallorigine x(0) = 0. Tenendo conto del teorema di Cayley
Hamilton, esso risulta in effetti indipendente da t e vale


def
R = Im (R) = Im ( B AB An1 B

Linsieme raggiungibile dallorigine al tempo t `e dunque raggiungibile in effetti in tempo arbitrario, lo stesso stato essendo raggiunto in tempo pi`
u breve
a costo di un pi`
u energico controllo. Questo insieme `e poi un sottospazio vettoriale, detto sottospazio di raggiungibilit`a del sistema. La matrice R viene
detta matrice di raggiungibilit`a del sistema.
Linsieme degli stati raggiungibili a partire dallo stato generico x(0) = x0
al tempo t `e pertanto dato da


Rt (x0 ) = x = eAt x0 + r, r R
ed `e quindi un iperpiano, parallelo al sottospazio di raggiungibilit`a, passante
per eAt x0 . Al variare di t, linsieme raggiungibile descrive una famiglia di
iperpiani paralleli, la cui unione costituisce linsieme degli stati raggiungibili.
Si noti che linsieme dei punti raggiungibili `e lintero spazio di stato nel
caso in cui dim (R) = rank (R) = n; tutti gli stati sono in effetti raggiungibili in tempo arbitrariamente piccolo. In questo caso, il sistema stesso si
dice completamente raggiungibile.

3.1.2

Sistemi LTITD

Consideriamo linsieme di raggiungibilit`a per il sistema


x(t + 1) = Ax(t) + Bu(t), x(0) = x0

(3.2)

La soluzione della equazione alle differenze (3.2) (che indicheremo con


x(x0 , u, t)) `e data da
t

x(x0 , u, t) = A x0 +

t1
X

Atk1 Bu(k)

k=0

che si pu`o riscrivere nella forma

x(x0 , u, t) = At x0 + B|AB|A2 B| |At1 B

u(t 1)
u(t 2)
u(t 3)
..
.
u(0)

`
3.1. INSIEME DI RAGGIUNGIBILITA

57

Consideriamo innanzitutto linsieme degli stati raggiungibili in t passi a


partire dallorigine x(0) = 0:

def
Rt = Im (Rt ) = Im ( B AB

At1 B

che, in modo del tutto analogo al caso TC, viene detto sottospazio di raggiungibilit`
a in t passi del sistema, mentre la matrice R viene detta matrice
di raggiungibilit`a in t passi del sistema.
` evidente che il sottospazio di raggiungibilit`a in t+1 passi Rt+1 contiene
E
Rt , e che quindi la successione definita dalle dimensioni dei sottospazi di raggiungibilit`a al crescere del numero di passi `e non decrescente; essa `e peraltro
superiormente limitata dalla dimensione dello spazio di stato n, per cui la successione si stabilizzer`a in un valore finito. Per il teorema di CayleyHamilton,
il sottospazio di raggiungibilit`a in un numero arbitrariamente grande di passi
pu`o essere calcolato arrestandosi allnesimo passo,

def
R = Im (R) = Im ( B AB


An1 B ).

Questo viene detto sottospazio di raggiungibilit`a del sistema, mentre la matrice R viene detta matrice di raggiungibilit`a del sistema. Ogni stato raggiungibile a partire dallorigine in un numero qualsiasi di passi pu`o essere
anche raggiunto in non pi`
u di n passi.
Linsieme degli stati raggiungibili a partire dallo stato generico x(0) = x0
al tempo t `e pertanto dato da


Rt (x0 ) = x = At x0 + r, r Rt

ed `e quindi ancora un iperpiano, parallelo al sottospazio di raggiungibilit`a,


passante per At x0 .
Linsieme dei punti raggiungibili `e lintero spazio di stato nel caso in cui
dim (R) = rank (R) = n. In tal caso, il sistema stesso si dice completamente
raggiungibile.

3.1.3

Controllabilit`
a allorigine

Un particolare interesse riveste talvolta il raggiungimento dellorigine dello


spazio degli stati, che rappresenta spesso la condizione di riposo o di riferimento per il sistema. Si definisce per questo motivo un ulteriore insieme,
linsieme degli stati controllabili a zero al tempo t come
Ct = {
x IRn |u U : x(
x, u, t) = 0} .

58

` E CONTROLLABILITA
`
CAPITOLO 3. RAGGIUNGIBILITA

Esplicitando la definizione nel caso LTITD, si ha


0 = At x +

t1
X

Atk1 Bu(k)

k=0

ovvero, x `e controllabile a zero se At x `e raggiungibile dallorigine. Dato


uno stato x controllabile a zero in t passi, ogni stato x + x con x ker (At ) lo
`e anchesso. Linsieme controllabile a zero in t passi `e dunque un sottospazio
vettoriale, dato da


Ct = x|x = x + x, At x Rt , x ker (At )

Se ogni stato `e controllabile a zero in t passi, si dice che il sistema `e


controllabile a zero in t passi. Ci`o significa che
Im (At ) Im (Rt )

Se esiste un tempo t per il quale questa relazione `e soddisfatta, il sistema si


dice controllabile. Dal teorema di CayleyHamilton segue che un sistema `e
controllabile se e solo se `e controllabile in n passi, quindi se


Im (An ) R = Im B|AB| |An1 B

Naturalmente, la raggiungibilit`a implica la controllabilit`a, ma non viceversa. Ad esempio, un sistema con matrice A nulla `e certamente controllabile,
mentre non `e raggiungibile a meno che vi siano almeno tanti ingressi quanti
stati e rank (B) = n. Controllabilit`a e raggiungibilit`a nei sistemi LTITD
sono sinonimi se A `e nonsingolare.
Nei sistemi LTITC, linsieme controllabile a zero in tempo t `e definito in
modo analogo come linsieme degli stati che risolvono lequazione
Z t
At
0 = e x +
eA(t ) Bu( )d
0

quindi, per quanto visto sopra, essendo sempre eAt invertibile Ct = Rt . Nei
sistemi tempocontinui, i concetti di controllabilit`a e raggiungibilit`a di uno
stato sono coincidenti.

3.1.4

Raggiungibilit`
a di sistemi non LTI

Lanalisi della raggiungibilit`a per sistemi tempovarianti e nonlineari in generale `e sostanzialmente pi`
u complessa che nei casi sinora visti. Daremo perci`o

`
3.1. INSIEME DI RAGGIUNGIBILITA

59

solo alcune indicazioni generali, lasciando lo studio dei casi pi`


u generali a
corsi pi`
u avanzati.
Per un sistema lineare tempo variante TC, gli argomenti usati nella dimostrazione della raggiungibilit`a LTITC possono essere estesi: sviluppando
la soluzione di
x = A(t)x + B(t)u, x(0) = x0
(3.3)
con ingresso u(t) analitico in [0, t], si ha
x(x0 , u, t) =

X
k=0

x(k) (0)

tk
k!

dove
x(1)
x(2)
x(3)
..
.

= Ax + Bu
+ Bu

= A2 x + ABu + B u + Ax
+ AAx

+ Bu
+ Ax

= A3 x + A2 Bu + AB u + B u + AAx
+ ABu
+ ABu
.
= ..


def
Introducendo loperatore = A dtd , valutando le derivate in t = 0,
sostituendo e raccogliendo opportunamente si ottiene, per x0 = 0


x(0, u, t) Im B|B|2 B| |r1 B|

In questo caso non `e detto che si possa arrestare la costruzione della


matrice allnesimo blocco di colonne.
Per sistemi nonlineari la situazione `e pi`
u complessa. Si pu`o dimostrare
che vale il seguente teorema:
Teorema. Se per il sistema x = f (x, u) il sistema linearizzato approssimato attorno a x, u (f (
x, u) = 0), z = Az + Bu `e raggiungibile, allora
linsieme raggiungibile da x contiene un intorno di x.
Quindi, la raggiungibilit`a (globale) del linearizzato approssimato implica
la raggiungibilit`a (locale) del sistema effettivo. Questa condizione `e solo
sufficiente: ad esempio, il sistema che rappresenta la cinematica di un veicolo
su ruote che avanza con velocit`a lineare u1 = v e angolare u2 = w, data da


x
v cos
y = v sin
w

ha un linearizzato (in un equilibrio qualsiasi) con A = 0 e B IR32 , quindi


non `e raggiungibile. Comunque, il vero sistema `e certamente raggiungibile.

60

3.2

` E CONTROLLABILITA
`
CAPITOLO 3. RAGGIUNGIBILITA

Cambiamenti di Coordinate

Le propriet`a di raggiungibilit`a e controllabilit`a non sono alterate da cambiamenti di coordinate (si dicono per questo propriet`a strutturali). Si consideri infatti il cambiamento di coordinate x = T z, e il sistema IDz =
T 1 AT z + T 1 Bu, per il quale si ha


= T 1 B|T 1 AT T 1 B| |T 1 An1 T T 1 B = T 1 R
R

che ha lo stesso rango di R. Per la controllabilit`a, basta osservare che anche


(T 1 AT )t = T 1 At T , quindi entrambe i membri dellequazione che definisce
il sottospazio di controllabilit`a a zero sono premoltiplicati per T 1 .
Date due rappresentazioni in coordinate diverse dello stesso sistema raggiungibile, e note le matrici di raggiungibilit`a nei due casi, `e possibile trova =
re la matrice che trasforma la prima nella seconda. Infatti avendosi R
1
T
1
T
R
= T RR
, da cui (essendo R
a pieno rango righe)
T R, si ha R

1
T R
R
T
T = RR
.
sono quadrate e invertibili, per cui si ha sempliceNel caso SISO, R e R
mente
1
T = RR

Si osservi che, per sistemi SISO, la matrice R `e quadrata di dimensione


n, quindi se la condizione di completa raggiungibilit`a per il sistema viene
ottenuta, R `e invertibile. Nei sistemi MIMO con m ingressi, invece, R
IRnnm . La condizione rank ([B|AB| |Ap1 B]) = n pu`o ottenersi per
qualche p < n: il minimo di tali p si dice indice di raggiungibilit`a del sistema
MIMO (nel caso TD, p rappresenta il minimo numero di passi con i quali `e
possibile raggiungere un punto arbitrario). Perch`e sia p < n `e necessario e
sufficiente che sia rank (B) 2.

3.3
3.3.1

Scomposizione Standard dei Sistemi


Sottospazi invarianti

Un sottospazio vettoriale V IRn di dimensione nv pu`o essere descritto


mediante una sua matrice di base V , cio`e una matrice n nv tale che, xv
V, !y : xv = V y, ovvero V = Im (V ) (notazione: anche V = R(V ), V =
span (V )).
Supponiamo che un vettore xv V sia descritto in certe coordinate correnti. Consideriamo un cambiamento di coordinate x = T z, dove T = [V |Vc ]

3.3. SCOMPOSIZIONE STANDARD DEI SISTEMI

61

`e invertibile, e Vc rappresenta una matrice n (n nv ) di colonne indipendenti tra loro e da quelle di V (cio`e una matrice di base complementare a V
per IRn ). Se le nuove coordinate di xv sono zv , cio`e se xv = T zv , allora le
ultime n nv coordinate di zv sono nulle.
Infatti, suddividendo a blocchi, si deve poter scrivere



 z1
xv = V y = V V c
= V z1 + Vc z2
z2
z1 = y, z2 = 0nnv 1
Un sottospazio V si dice invariante rispetto ad una matrice A se xv V,
anche Axv V.
Ad esempio, lo spazio generato da un numero qualsiasi di autovettori
associati allo stesso autovalore `e uno sottospazio invariante; cos` anche per
gli autospazi generalizzati incontrati nella forma di Jordan. Lintero spazio,
cos` come lo spazio banale (comprendente solo lorigine) sono ovviamente
spazi invarianti.
Nelle coordinate T sopra associate ad un sottospazio, se questo `e A
invariante, la matrice A ha anchessa struttura a blocchi, e poiche vale
 

1
v
T Axv =
= T 1 AT zv = Az
0
 


A11 A12
=

0
A21 A22
(dove denota un vettore non nullo in generale la cui espressione qui non
interessa), deve essere A21 = 0, cio`e
A =

A11 A12
0 A22

Questa propriet`a delle coordinate adattate ad un sottospazio A-invariante


sono molto utili a caratterizzare levoluzione di un sistema.
Se lo stato iniziale di un sistema LTI (A, B, C, D) appartiene ad un sottospazio Ainvariante, allora tutta la evoluzione libera appartiene allo stesso
sottospazio. Infatti, sia eAt in TC, che At in TD, mantengono la struttura triangolare a blocchi della matrice A (supponendo di essersi gi`a posti in
coordinate adatte).
Date le condizioni iniziali x0 , il pi`
u piccolo sottospazio W che contiene
tutta la evoluzione libera dello stato `e dato da


W = Im x0 Ax0 An1 x0

62

` E CONTROLLABILITA
`
CAPITOLO 3. RAGGIUNGIBILITA

(sottospazio ciclico generato da x0 ).


Infatti, nel caso TC, si ha
x(t) = eAt x0 =
=

tk
k=0 k! Ak x0

x0 Ax0 A2 x0


t
t2
2
..
.

Per il teorema di CayleyHamilton, se () = n + an1 n1 + . . . + a0


`e il polinomio caratteristico di A, allora (A) = 0, quindi Ak = a0 . . .
an1 An1 ; cio`e Ak (e tutte le successive potenze di A) sono combinazioni
lineari delle prime n 1 potenze; e ci`o vale anche a fortiori per Ak x0 , quindi
la tesi.
Nel caso TD, la dimostrazione `e del tutto simile, usando la formula della
evoluzione libera relativa.

3.3.2

Forma Standard di Raggiungibilit`


a

Il sottospazio di raggiungibilit`a, sia nel caso LTITC che LTITD, ha una


importante caratterizzazione geometrica: esso `e il pi`
u piccolo sottospazio
Ainvariante che contiene Im (B) (che si denota < A|B >).
` ovvio infatti che Im ([B|AB| |An1 B]) contiene Im (B) e che `e A
E
invariante. Inoltre, se S contiene Im (B) ed `e Ainvariante, esso contiene
anche Im (Ak B), k, e quindi S R.
Sia TR IRnr una matrice di base per il sottospazio di raggiungibilit`a
R = Im (R) del sistema LTI
IDx = Ax + Bu,
e TN IRn(nr) una matrice di base complementare. Nelle nuove coordinate
descritte da


 zR
def 
x = T z = TR TN
zN
il sistema diviene IDz = T 1 AT z + T 1 B, ovvero


 

 
IDzR
AR ARN
zR
BR
u
=
+
IDzN
0
AN
zN
0

dove zR IRr e zN IRnr .

3.3. SCOMPOSIZIONE STANDARD DEI SISTEMI

63

In queste coordinate, il sistema `e dunque riscritto nella forma


IDzR = AR zR + ARN zN + BR u
IDzN = AN zN

(3.4)

cio`e effettivamente scomposto in due sottosistemi, dei quali il secondo, con


stato zN , evolve autonomamente (secondo la zN (t) = eAN t zN (0), ovvero la
zN (t) = AtN zN (0)), quindi non dipende dallingresso ne direttamente, ne
indirettamente attraverso lo stato zR . Il sottospazio di raggiungibilit`a del
sottosistema zN `e vuoto.
Per quanto riguarda il sottosistema con stato zR e matrici (AR , BR ), esso `e
completamente raggiungibile: infatti, la matrice di raggiungibilit`a dellintero
sistema nelle nuove coordinate `e


n1
BR AR BR AR
BR

R =
= T 1 R
0
0

0
quindi, avendo R rango r come R, le sue prime r righe, le sole non nulle,
sono indipendenti. La presenza del termine incrociato ARN non influenza
la raggiungibilit`a di un arbitrario stato zN (t) desiderato a partire da qualsiasi stato iniziale zN (0) del sottosistema (in tempo t arbitrario per sistemi
TC, e almeno in t = r passi per sistemi TD), essendo questo sottosistema
completamente controllabile.
La forma (3.4) viene detta forma standard di raggiungibilit`a del sistema.
Il sottosistema (AR , BR ) (o (AR , BR , CR = CTR , D) se si include lequazione
di uscita) `e detto sottosistema raggiungibile; il sottosistema (AN , BN , CN =
CTN , D) `
e detto sottosistema non raggiungibile.
La scelta delle matrici di base TR e complementare TN `e arbitraria: qualsiasi matrice TR = TR QR e TN = TN QN , con QR IRrr e QN IR(nr)(nr)
invertibili, potrebbero essere usate per costruire la forma standard. Si avrebbe in tal caso T = [TR QR |TN QN ] = T diag (QR , QN ) e la forma standard
risultante


IDwR
IDwN

1
Q1
R AR QR QR ARN QN
0
Q1
N AN QN



wR
wN

B R QR
0

che evidentemente ha blocchi diagonali diversi ma simili (algebricamente


equivalenti) a quelli ottenuti in altra base. Gli autovalori di AR e quelli
di AN sono quindi invarianti in numero e in posizione con i cambiamenti di
coordinate, e sono quindi propriet`a strutturali del sistema. I primi vengono
detti autovalori interni al sottospazio di raggiungibilit`a, i secondi esterni.

` E CONTROLLABILITA
`
CAPITOLO 3. RAGGIUNGIBILITA

64

La funzione di trasferimento di un sistema non dipende dalla sua parte


non raggiungibile. Infatti,
G(s) = C (sI A)1 B + D =


1 
 sIr AR

ARN
BR
CR CN
=
+D =
0
sInr AN
0
=

CR CN

(sIr AR )1
M
0
(sInr AN )1



BR
0

+D =

= CR (sIr AR )1 BR + D
(dove M indica una matrice il cui calcolo esplicito `e superfluo).
Il fatto che la f.d.t di un sistema non dipenda dal sottosistema non raggiungibile, e che quindi il sottosistema non raggiungibile non influenzi il rapporto ingressouscita, ha importanti implicazioni. In particolare, tra i poli
della G(s) non appariranno gli autovalori di AN : ci`o significa che questi ultimi
vengono sistematicamente cancellati da zeri coincidenti nella espressione
G(s) =

3.4

C adj (sI A) B
+D
det (sI A)

Lemma P.B.H.

La condizione di completa raggiungibilit`a `e verificabile per ispezione diretta


delle matrici del sistema in alcuni casi.
Se la matrice dinamica A di un sistema SISO `e diagonale, A = diag (1 , . . . , n ),
la matrice di raggiungibilit`a `e

B1 1 B1 21 B1
B2 2 B2 22 B2
R=

Bn n Bn 2n Bn

1n1 B1
2n1 B2


nn1 Bn

Perch`e questa sia di pieno rango, `e necessario che tutte le componenti di B


siano diverse da zero, e che tutti gli autovalori siano distinti (si avrebbero
altrimenti righe nulle o righe proporzionali). Queste condizioni sono anche

3.4. LEMMA P.B.H.

65

sufficienti: infatti si pu`o riscrivere

1
1
R = diag (B1 , B2 , . . . , Bn )

1

1
2

21
22

2n

1n1
2n1


nn1

ed il determinante della matrice a destra (che `e una matrice di Vandermonde)


non si annulla per i distinti.
Nel caso pi`
u generale di sistema MIMO con forma di Jordan nota, la verifica di raggiungibilit`a pu`o essere fatta ricorrendo al Lemma P.B.H. (Popov,
Belevitch, Hautus):
Teorema Il sistema LTI con matrici (A, B) `e raggiungibile se e solo se la
matrice


P () = I A B
(3.5)
ha rango pieno per ogni C.
l

Dimostrazione. Baster`a considerare = i s(A), i. Supponiamo che


per qualche i , rank (P (i )) < n: allora esister`a un vettore q 6= 0 tale che
q T P (i ) = 0, ovvero tale che al contempo
q T B = 0 e q T A = i q T

(3.6)

Postmoltiplicando la seconda per B, si ha


q T AB = i q T B = 0
e postmoltiplicando per AB si ha
q T A2 B = i q T AB = 0
Iterando questa procedura, si trova che
qT

B AB

An1 B

=0

per cui R non ha rango n, e il sistema non `e raggiungibile.


Di converso, supponiamo che il sistema non sia raggiungibile; senza perdere in generalit`a possiamo assumere che A, B siano in forma standard di
raggiungibilit`a, e dobbiamo far vedere che, se AN ha dimensione n r > 0,

66

` E CONTROLLABILITA
`
CAPITOLO 3. RAGGIUNGIBILITA

allora esiste un q che soddisfa (3.6).


Per questo q sar`a




BR
T
T
q B = q
= 0 qT = 0 qRT
0

e inoltre baster`a scegliere

qRT AN = i qRT
Applichiamo il lemma PBH al caso di una coppia (A, B) con A
di Jordan, con p miniblocchi:

1 1 0

0 1 0

0
...

0 1

.
; B =
.
A=
.
0
0

p 1 0

...


0
0 p

in forma
B11
B12
..
.
B1,m1
..
.
Bp,1
Bp,2
..
.
Bp,mp

Risulta che, per essere raggiungibile, le ultime righe Bi,mi per ogni miniblocco corrispondente ad autovalori coincidenti, devono essere linearmente
indipendenti. Infatti la matrice i I A ha tante righe nulle quante sono
i miniblocchi associati a i , cio`e la molteplicit`a geometrica i di i , ed il
rango di P (i ) non diminuisce se e solo se le corrispondenti righe estratte da
B hanno rango i .
In particolare, per un sistema SISO, `e necessario che la molteplicit`a geometrica di tutti gli autovalori sia pari a uno, e che B abbia almeno tanti
elementi diversi da zero quanti gli autovalori distinti di A
Se in un sistema SISO vi sono pi`
u catene di autovalori generalizzati corrispondenti ad uno stesso autovalore, solo i modi di (al pi`
u) la pi`
u lunga di
queste catene potranno apparire nella risposta forzata del sistema. In altri
termini, nella f.d.t. il polo corrispondente apparir`a con molteplicit`a pari (al
pi`
u) alla dimensione del miniblocco di ordine pi`
u elevato.
Esempio: Per il sistema
T

C1
B1
1 1
0
A = 0 1 0 , B = B2 ; C = C2 ; D = 0
C3
B3
0
0 1

3.5. FORMA CANONICA DI CONTROLLO

67

si ha

( + 1)2 ( + 1)
0
B
0
( + 1)2
0
C
2
0
0
( + 1)
C1 B2 + (C1 B1 + C2 B2 + C3 B3 )( + 1)
=
G(s) =
3
( + 1)
( + 1)2

Un sistema con i miniblocchi associati ad un unico autovalore i pu`o


essere raggiungibile solo se ha almeno i ingressi.

3.5

Forma canonica di controllo

Si consideri un sistema SISO con matrici (Ac , Bc ) nella particolare forma


1
0
0
0
0

0
1
0

.
..
..
..
...
Ac = ...
; Bc = .. .
.
.
.

0
0
0
1
1
a0 a1 a2 an1

La forma di Ac si dice compagna orizzontale inferiore. Il polinomio caratteristico (o compagno) c (s) di una matrice Ac,n di dimensione n in questa
forma, si pu`o calcolare ricorsivamente sviluppando il determinante secondo
gli elementi della prima colonna:

0
s 1 0
0 s 1

..

.
.
.
.
.
.
.
.
c (s) = det(sI Ac,n ) =
det .
=
.
.
.
.

0 0

0
1
a0 a1 a2 s + an1
=
(1)n1
a0(1)n1 + s det(sI Ac,n1 ) =
0
s 1 0

0 s 1
0

..
..
..
.. . .
= a0 + s det .

.
.
.
.

0 0
0
1
a1 a2 a3 s + an1

` E CONTROLLABILITA
`
CAPITOLO 3. RAGGIUNGIBILITA

68
da cui

c (s) = a0 + a1 s + + an1 sn1 + sn .

I coefficienti dellultima riga della forma compagna orizzontale inferiore


sono quindi i coefficienti del polinomio caratteristico della matrice stessa,
ordinati secondo le potenze crescenti di s da sinistra a destra e cambiati di
segno.
La matrice di raggiungibilit`a per il sistema (Ac , Bc )vale

0
0

1
0
0
0
0
an1

..

..
..
.
.

.
.
Rc = .

0
1

1
an1

2
1 an1 an2 + an1

(dove indica elementi il cui calcolo esplicito `e tralasciato), che `e invertibile.


Un sistema in questa forma `e quindi sempre raggiungibile, a prescindere dai
valori dei coefficienti del polinomio caratteristico.
Ricordiamo che il polinomio caratteristico di una matrice non cambia
per trasformazioni di similitudine (la similitudine non cambia infatti gli
autovalori di una matrice, che sono le radici del polinomio caratteristico
stesso).
Dato quindi un qualsiasi altro sistema SISO (A, B) che abbia lo stesso
polinomio caratteristico con matrice di raggiungibilit`a R, si ha:
se (A, B) `e algebricamente equivalente a (Ac , Bc ) (ovvero A = T Ac T 1 ,
B = T Bc ), allora `e raggiungibile: infatti R = T Rc ha rango pieno;

Se (A, B) `e raggiungibile, R ha rango pieno, quindi esiste una T invertibile, data da T = RRc1 , che trasforma le coordinate in modo tale da
avere T 1 AT = Ac , T 1 B = Bc .
La forma (Ac , Bc ) in cui possono essere messi tutti e soli i sistemi completamente raggiungibili si chiama canonica di controllo.
La matrice Rc1 ha una forma particolare (detta di Hankel) di facile
memorizzazione (verificare per esercizio):

a1 a2 an1 1
a2 a3
1
0

0
0
Rc1 = a3 a4

.. .. . .
..
..
. .
.
.
.
1 0
0
0

3.5. FORMA CANONICA DI CONTROLLO

69

Sulla base di queste osservazioni, `e facile portare un sistema LTI raggiungibile SISO (A, B, C, D) nella forma canonica di controllo. Si procede infatti
come segue:
1. Si costruisce la matrice di raggiungibilit`a R e se ne verifica linvertibilit`a;
2. Si calcola il polinomio caratteristico di A, det(sI A) = sn +an1 sn1 +
+ a1 s + a0 ;
3. Con i coefficienti del polinomio caratteristico si costruiscono le matrici
Ac e Rc ;
4. Si calcola T = RRc1 ;
5. Si trova Cc = CT .
Si ricorda che la matrice D rimane invariata per cambiamento di variabili di
stato.
Ricordiamo che, dato un sistema SISO in forma normale
n

ID y(t) =

n1
X
i=0

ai ID y(t) +

n
X

bj IDj u(t)

i=0

ovvero in forma di f.d.t.


Y (s) =

b0 + b1 s + + bn s n
U (s)
a0 + a1 s + + an s n

si pu`o porlo in forma di stato direttamente ponendo

0
0
1
0
0
0

0
0
1
0
0

.
..
.
.
.
.
.
.
..
..
..
..
..
..
IDz = .
z + ..
0

0
0
0
0
0
0

1
1
a0 a1 a2 am am+1 an1


y = bo bn a0 b1 bn a1 b2 bn a2 . . . bn1 bn an1 x + [bn ] u

Dato un sistema LTI SISO in forma normale, `e dunque sempre possibile scrivere un sistema in forma di stato con matrici (A, B, C, D) ad esso
equivalente con (A, B) in forma canonica di controllo (quindi raggiungibile).
Equivalente si intende nel senso che, dato un ingresso e delle condizioni iniziali per il primo, esistono degli stati iniziali tali per cui luscita del secondo
sistema corrispondente allo stesso ingresso `e la stessa.

70

` E CONTROLLABILITA
`
CAPITOLO 3. RAGGIUNGIBILITA

Esempio: Data lequazione y + y = 2u + u,


un sistema in forma di stato
che la realizza (in forma canonica di controllo) `e

 

0
0 1
;
, B=
A =
1
 1 0 
2 1 , D = 0.
C =

Lo stesso rapporto ingresso-uscita `e realizzato anche ad esempio ponendo


x1 = y, x2 = y e x3 = y + y,
quindi dal sistema

0
0 1 0

1 0 0 , B = 1 ;
A =
1
 1 1 0 

2 1 0 , D =0
C =

In questo secondo caso per`o la coppia (A , B ) non `e raggiungibile.

Capitolo 4
Pianificazione Ottima
Come gi`a discusso nel capitolo precedente, qualora il problema di raggiungimento di uno stato x a partire da x0 abbia soluzione per un qualche t,
esso pu`o averne infinite. Si desidera in questo capitolo studiare tecniche per
scegliere una tra queste possibili soluzioni. La scelta potr`a essere fatta ad
esmepio seguendo un criterio di ottimalit`a - la massimizzazione di una prestazione, o la minimizzazione di un costo. Vedremo anche che talvolta la
scelta dellingresso pu`o essere soggetta a vincoli imposti sugli ingressi o sulla evoluzione degli stati del sistema, e accenneremo ai metodi per trattare
questi problemi.

4.1

Minimizzazione del costo di controllo

Inizieremo dal caso in cui il problema sia quello di minimizzare un costo,


rappresentato dalla norma del segnale di ingresso applicato, senza alcun altro vincolo che il raggiungimento del valore desiderato dello stato al tempo
richiesto. In particolare, consideriamo come costo la somma dei valori degli ingressi applicati al quadrato, ovvero la norma due della sequenza di
controllo, definita per controlli TD applicati tra 0 e t come
ku()k2[0,t] =

t
X

uT ( )Wu u( )

=0

e generalizzata in TC come
ku()k2[0,t] =

uT ( )Wu u( )d
0

In queste espressioni, la matrice simmetrica e positiva definita Wu rappresenta un fattore di peso relativo tra i diversi ingressi di un sistema MIMO,
71

72

CAPITOLO 4. PIANIFICAZIONE OTTIMA

utile ad esempio per esprimere correttamente norme di ingressi MIMO i cui


canali abbiano dimensioni fisiche diverse. In generale, possiamo pensare che
le matrici di peso varino nel tempo (scrivendo quindi Wu ( ) nelle espressioni
precedenti), restando sempre comunque simmetriche e p.d..

4.1.1

Sistemi LTITD

Per portare il sistema al tempo t nello stato assegnato x, si deve risolvere


lequazione
x At x0 = Rt ut

nel vettore incognito ut = [u(t 1) u(0)]T . Supponendo che una soluzione


esista (cio`e che (
x At x0 ) Rt ), si desidera trovare
ut = arg minut kut k2
soggetto a
x At x0 = Rt ut
Si tratta quindi di un problema di minimo vincolato, che pu`o essere risolto
con la tecnica dei moltiplicatori di Lagrange:

L(ut , ) = uTt W ut + T x At x0 Rt ut

dove W = diag (Wu (t 1) Wu (0)).


Ponendo uguale a zero il differenziale di questa espressione rispetto alla
incognita ut ,
L
= 2uTt W T Rt = 0
ut
si ottiene
1
ut = W 1 RtT ,
2
che sostituita nella soluzione al tempo t d`a
1
x At x0 = Rt W 1 RtT ,
2

da cui `e possibile (per lipotesi di esistenza di una soluzione) risolvere per .


Se infatti Rt ha righe indipendenti, si pu`o scrivere
= 2(Rt W 1 RtT )1 (x(t) At x0 )
che sostituita nel controllo d`a
t+
ut = W 1 RtT (Rt W 1 RtT )1 (
x At x 0 ) = R W
(
x At x0 ).

4.1. MINIMIZZAZIONE DEL COSTO DI CONTROLLO

73

t+
La matrice RW
= W 1 RtT (Rt W 1 RtT )1 , che nel caso particolare W = I
diviene RtT (Rt RtT )1 , `e la pseudoinversa (pesata con W 1 ) di Rt : questa
definizione `e valida se Rt ha pieno rango colonne, cio`e righe indipendenti.
Nel caso in cui Rt non abbia righe indipendenti (ma resti valida la ipotesi
di esistenza di una soluzione), si dovr`a utilizzare una formula pi`
u generale
della pseudoinversa di matrice (vedi appendice).

4.1.2

Sistemi LTITC

Si desidera risolvere lequazione


At

x(t) e x0 =

eA(t ) But ( )d

nella funzione incognita ut () definita tra 0 e t. Supponendo che una soluzione


esista (cio`e che x(t) eAt x0 R), si desidera trovare
ut = arg minut kut k2
Rt
soggetto a
x(t) eAt x0 = 0 eA(t ) But ( )d

Si tratta quindi di un problema di minimo vincolato di un funzionale rispetto


ad una variabile che `e una funzione, cio`e un problema di calcolo variazionale.
Il vincolo pu`o essere messo in conto ancora con la tecnica dei moltiplicatori
di Lagrange:
L(ut , ) =
=

Rt
0

uTt ()Wu ut ( )d +

Rt
0

F (ut )d + T

Rt

eA(t ) But ( )d
0

x(t) eAt x0

+T x(t) eAt x0

dove F (ut , ) = uTt ( )Wu ut ( ) T eA(t ) But ( ), con = cost.


Lequazione di Eulero per la soluzione del problema variazionale `e data
da

d F
F

=0
dt u t ut
che in questo caso, essendo F () indipendente dalle derivate di ut , si semplifica
in
F
= 2uTt ( )Wu T eA(t ) B = 0.
ut
Da questa si ottiene
1
T
ut ( ) = Wu1 B T eA (t ) ,
2

74

CAPITOLO 4. PIANIFICAZIONE OTTIMA

che sostituita nella soluzione al tempo t d`a


1
x(t) e x0 =
2
At

Z

A(t )

T
BWu1 B T eA (t ) d

def

1
Gt
2

La matrice integrale che appare in questa equazione `e detta Gramiano di


raggiungibilit`a (al tempo t, con peso Wu ) per il sistema. Si pu`o dimostrare che
` quindi possibile (per lipotesi di esistenza
rank Gt = rank R = dim R, t. E
di una soluzione) risolvere questa equazione per : se ad esempio Gt ha righe
indipendenti, cio`e il sistema `e completamente raggiungibile, questa soluzione
si pu`o scrivere
= 2 (Gt )1 (x(t) eAt x0 )
che sostituita nel controllo d`a

ut = Wu1 B T eA

4.1.3

T (t )

(Gt )1 (x(t) eAt x0 )

Sistemi LTITC: Campionamento e Approssimazione TD

Per quanto si siano descritti in precedenza gli strumenti teorici della pianificazione ottima in tempo continuo, nella pratica del calcolo la soluzione
numerica si ottiene spesso mediante una discretizzazione dellasse dei tempi.
Questo comporta che la legge di controllo in grado di risolvere il problema di
pianificazione venga pensata come una funzione anchessa discretizzata, ad
esempio costante a tratti (a scalinata). Inoltre, il modello tempo continuo
del sistema deve essere trasformato in un modello tempo discreto, che dovr`a
approssimare quanto meglio possibile il primo.
Sia T il periodo di discretizzazione considerato. La nota tecnica detta di
Eulero in avanti corrisponde alla approssimazione
x

xk+1 xk
,
T

dove xk rappresenta lo stato del sistema tempo discreto al passo k. Sostituendo in (4.2) si ottiene
xk+1 xk
= Axk + Buk
T
= xk+1 = (T A + I) xk + T Buk
= xk+1 = Ad xk + Bd uk ,

4.1. MINIMIZZAZIONE DEL COSTO DI CONTROLLO

75

avendo definito le matrici del sistema discretizzato come


Ad , T A + I
Bd , T .
Come noto, il modello TD cos` ottenuto fornisce una buona approssimazione
del sistema LTITC solo se T `e molto piccolo rispetto alle costanti di tempo
della dinamica considerata, il che implica la necessit`a di un elevato numero
di periodi per coprire un intervallo temporale di pianificazione dato, e una
pari dimensione del vettore dei valori degli ingressi da calcolare.
Per sistemi LTITC soggetti a ingressi costanti a tratti `e possibile utilizzare
un metodo di discretizzazione migliore, in grado di produrre valori esatti ad
ogni multiplo del tempo di campionamento. Questo modello, detto modello
discretizzato Zero Order Hold o ZOH, utilizza la formula di soluzione dei
sistemi lineari,

x(t ) = e

A(t t0 )

x(t0 ) +

eA(t t0 ) Bu( )d
t0

ponendo t0 = kTs , t = (k + 1)Ts . Osservando che, essendo u = u(k) costante


tra kTs e (k + 1)Ts , si ha
x((k + 1)Ts ) = e

A(Ts )

x(kTs ) +

Z

Ts

A(Ts )

Bu(k)

si ottiene il sistema LTITD


xZ (k + 1) = AZ xZ (k) + BZ u(k)
con
AZ = eATs ,
e
BZ =

Ts

eA(Ts ) d B,

per il quale vale lesatta uguaglianza con il sistema originale tempo continuo
agli istanti di campionamento, cio`e xZ (kTs ) = x(t = kTs ).
Il calcolo delle matrici AZ e BZ `e reso molto semplice dalluguaglianza

  

AZ BZ
A B
,
(4.1)
Ts =
exp
0
I
0 0

76

CAPITOLO 4. PIANIFICAZIONE OTTIMA

dove exp(a) = ea , e gli zeri nella matrice che appare nellesponenziale sono
di dimensioni opportune per rendere la matrice stessa quadrata. La formula
`e verificata applicando la definizione di esponenziale di matrice,
exp



A B
0 0

Ts

k k

X
Ts
A B
=
0 0
k!
k=0

Osserviamo che, per k > 0,




A B
0 0

k

Ak Ak1 B
0
0

mentre per k = 0 si ha la matrice identica. Si ha quindi


   P

P
k
k 
A B
Ak Tk!s
Ak1 B Tk!s
k=0
k=1
.
Ts =
exp
0 0
0
I
Vale ovviamente eATs =
funzione

Ak Tk!s per definizione. Considerando poi la


Z t
F (t) =
eA(t ) d,
k=0

ed il suo sviluppo di Taylor nellorigine

P
k
(k)
F (t) =
(0) tk!
k=0 F
2
= F (0) + F (0)t + F (2) (0) t 2! + . . .

Rt
Rt


= 0 + (A 0 eA(t ) d + I) t + (A2 0 eA(t ) d + A)
t=0
t=0
P
k1 tk
=
A
,
k=1
k!

t2
2!

+ ...

si ottiene il risultato anticipato. Questo algoritmo si pu`o applicare in Matlab


usando il comando expm per lesponenziale di matrici. Si pu`o anche direttamente trasformare un sistema TC SysC in un sistema TD SysD campionato
con periodo Ts con il comando SysD = c2d(SysC,Ts,zoh), ed ottenere le
matrici semplicemente con Az = SysD.a, Bz = SysD.b, etc.

4.2

Applicazioni ed Estensioni

Al fine di illustrare lapplicazione delle tecniche di pianificazione ottima viste


ed estenderle ad altri problemi interessanti, si consideri il sistema meccanico riportato in figura 4.1, costituito da un carrello di massa m, da uno
smorzatore di costante c e da una molla di costante K.

4.2. APPLICAZIONI ED ESTENSIONI

77

Figura 4.1: Schema meccanico di un sistema massa molla e smorzatore


azionato mediante una forza esterna F .
Il carrello `e libero di muoversi su un piano privo di attrito ed `e soggetto
ad una forza esterna (segnale di controllo) F . Il sistema `e descritto dalla
equazione differenziale ordinaria del secondo ordine
m
z + cz + K z = F ,
in cui z indica lo scostamento del carrello dalla sua posizione di riposo zo .
Supponendo per semplicit`a m, c e K unitari in opportune unit`a di misura,
e definendo come stato x = [x1 x2 ]T = [z z]
T , il sistema pu`o essere scritto
nella consueta forma di stato
   
  
0
x1
0
1
x 1
f,
+
=
1
1 1 x2
x 2
ovvero in notazione matriciale
x = Ax + Bu


0
1
,
A=
1 1

(4.2)
 
0
.
B=
1

Per tale sistema meccanico consideriamo il problema di calcolare la legge


di controllo u = F (t) in grado di portare il carrello da una condizione iniziale
xo ad una finale data xf , ovvero da posizione e velocit`a date ad altri valori
desiderati.

4.2.1

Minima norma del controllo non vincolato

Disponendo del sistema discretizzato possiamo agilmente risolvere non solo


il problema di pianificazione in tempo minimo, ma contemporaneamente di
pianificazione a norma minima del controllo u. In altri termini possiamo
trovare la legge di controllo che risolve il problema di pianificazione in, ad

78

CAPITOLO 4. PIANIFICAZIONE OTTIMA

esempio, p passi che minimizza la norma euclidea del vettore di controllo


u Rp ottenuto impilando i valori assunti dal controllo stesso nei p passi di
pianificazione. Problemi di questo tipo si presentano quando considerazioni
di carattere energetico coinvolgono la progettazione di una legge di controllo. Si pensi ad esempio ai satelliti o ai veicoli autonomi in cui le risorse
energetiche, ad esempio carburante o batterie, sono fortemente limitate.
Questo tipo di problema di Pianificazione Ottima pu`o essere formulato
come segue:
min kuk2

(4.3)

soggetto a:
xk+1 = Ad xk + Bd uk
x0 = xo
xp = xf .
Questultimo ammette soluzione se lo stato xf `e raggiungibile da xo in un
numero di passi l p. Per calcolare tale soluzione `e sufficiente esplicitare i
primi p passi dellevoluzione completa del sistema
xp = Apd x0 + Ap1
d Bd u0 + . . . + Bd up1

up1

= Apd x0 + Rp ... ,
u0

(4.4)

dove Rp `e la matrice di raggiungibilit`a in p passi. Si ha, pertanto, che xf `e


raggiungibile da x0 in p passi se e solo se xf Apd x0 Rp = Im (Rp ), dove
Rp `e il sottospazio di raggiungibilit`a in p passi. Di conseguenza, il problema
di Pianificazione Ottima (4.3) diviene
min kuk2

(4.5)

soggetto a:

up1

xf = Apd xo + Rp ... .
u0

Si tratta quindi di un problema di minimo vincolato, che pu`o essere risolto


con la tecnica dei moltiplicatori di Lagrange, ottenendo
u = Rp (xf Apd xo )

(4.6)

4.2. APPLICAZIONI ED ESTENSIONI

79

dove la pseudoinversa Rp = RT (RRT ) consente di trovare la u a minima norma euclidea (o pi`


u generalmente in norma pesata uT W u, usando la
pseudoinversa pesata in W - vedi Appendice sullalgebra lineare).
Per quanto riguarda il tempo minimo, si ricorda che in un sistema tempo
discreto esso `e dato dal numero minimo di passi necessari per raggiungere lo
stato xf da xo . Esso `e pari al pi`
u alla dimensione del sottospazio raggiungibile
del sistema tempo discreto.

Riconsideriamo il sistema carrello-molla-smorzatore e discretizziamolo utilizzando la tecnica Eulero in avanti. Scegliendo un tempo di campionamento T = 0.05 s, otteniamo:


1
0.05
Ad =
0.05 0.95


0
.
Bd =
0.05
Supponiamo di avere come stato iniziale xo = [0 0]T , cio`e posizione e velocit`a
nulle, e di voler raggiungere la posizione z = 10 con velocit`a nulla, cio`e xf =
[10 0]T . Se la completa raggiungibilit`a del sistema `e conservata attraverso la
discretizzazione del sistema tempo continuo (questa propriet`a non `e detto che
si conservi, e deve quindi essere verificata), lo stato xf pu`o essere raggiunto
da xo in due passi, ma non in uno, dal sistema precedente. Quindi il tempo
minimo con questa discretizzazione `e 2T = 0.1 sec. Usando la (4.6) si ottiene:

  
4000
u0
.
=
u2passi =
3800
u1
Si fa notare che nella precedente relazione il vettore di controllo `e ordinato
per tempi crescenti, al contrario di come `e fornito dalla (4.6), in modo da
rispettare lordine temporale con cui i valori sono forniti al sistema. Di
seguito si riportano i grafici degli stati per il sistema tempo discreto e per il
tempo continuo (fig. 4.2-a,-b).
Come si nota i valori dei controlli sono piuttosto elevati. Questo dipende
dal fatto che si `e forzato il sistema a raggiungere lo stato finale in tempo
minimo. Se si allunga lorizzonte temporale in cui si desidera raggiungere
tale stato, senza modificare il tempo di campionamento, si ottengono valori di
controllo pi`
u bassi e andamenti degli stati pi`
u morbidi. Queste considerazioni
risultano evidenti gi`a con una pianificazione ottima a 6 passi (fig. 4.3 e fig. 4.4a,-b).

80

CAPITOLO 4. PIANIFICAZIONE OTTIMA

200

200
z
dz / dt

z
dz / dt

150

150

100

100

50

50

10
0

10
0

0.05

0.1

0.15

0.05

0.1

Tempo [s]

Tempo [s]

a)

b)

0.15

Figura 4.2: Stati del sistema controllato a partire da xo = [0 0]T e con


controllo u2passi : a) sistema discreto con Eulero in avanti e T = 0.05; b)
sistema tempo continuo.

In fig. 4.5 `e riportato anche landamento del controllo in p = 35 passi,


mentre in fig. 4.6-a,-b) i relativi andamenti dello stato dei sistemi tempo
discreto e tempo continuo.
Come si pu`o facilmente notare dalle figure rappresentanti gli andamenti
dello stato del sistema ottenuti applicando i tre controlli calcolati per differenti orizzonti temporali (p = 2, p = 6 e p = 35 passi), solo il sistema
tempo discreto riesce a raggiungere lo stato finale desiderato xf = [10 0]T . Il
vero sistema, tempo continuo, infatti non raggiunge in nessun caso lo stato
desiderato, come risulta particolarmente evidente in fig. 4.6-b. Lerrore commesso pu`o essere ridotto diminuendo il tempo di campionamento e quindi
ottenendo un sistema tempo discreto che approssima meglio quello tempo
continuo.
Un metodo pi`
u efficace per risolvere tale problema consiste nellutilizzare
metodi di approssimazioni pi`
u precisi di Eulero in avanti (senza la necessit`a di diminuire il tempo di campionamento), ed in particolare, per ingressi
costanti a tratti (detti Zero Order Hold o ZOH), che produce valori esatti ad
ogni multiplo del tempo di campionamento, come gi`a riportato in precedenza.
Riconsideriamo quindi il sistema massa-molla-smorzatore di fig. 4.1 e discretizziamolo utilizzando questa volta la formula di (4.1). Scegliendo ancora

4.2. APPLICAZIONI ED ESTENSIONI

81

600

400

Forza di controllo [N]

200

200

400

600

0.05

0.1

0.15
Tempo [s]

0.2

0.25

0.3

Figura 4.3: Controlli calcolati secondo la legge (4.6) con 6 passi (sistema
discretizzato con Eulero in avanti T = 0.05 s).
60

60
z
dz / dt

z
dz / dt

50

50

40

40

30

30

20

20

10

10

10

0.05

0.1

0.15
Tempo [s]

a)

0.2

0.25

0.3

10

0.05

0.1

0.15
Tempo [s]

0.2

0.25

0.3

b)

Figura 4.4: Stati del sistema controllato a partire da xo = [0 0]T e con


controllo u6passi : a) sistema discretizzato con Eulero in avanti per T = 0.05;
b) sistema tempo continuo.
una volta un tempo di campionamento T = 0.05 s, otteniamo:


0.9988 0.0488
Ad =
0.0488 0.95


0.0012
.
Bd =
0.0488
A partire dal sistema tempo discreto caratterizzato dalle matrici sopra ripostate, usando la (4.6) con numero di passi p = 6 e p = 35, si ottengono,
per il sistema tempo continuo, i risultati riportati in fig. 4.7. Come si pu`o

82

CAPITOLO 4. PIANIFICAZIONE OTTIMA


20

15

Forza di controllo [N]

10

10

0.2

0.4

0.6

0.8
1
Tempo [s]

1.2

1.4

1.6

Figura 4.5: Controlli calcolati secondo la legge (4.6) con 35 passi (sistema
discretizzato con Eulero in avanti T = 0.05 s).
10

10

z
dz / dt

0.2

0.4

0.6

0.8
1
Tempo [s]

a)

1.2

1.4

1.6

z
dz / dt

0.2

0.4

0.6

0.8
1
Tempo [s]

1.2

1.4

1.6

b)

Figura 4.6: Stati del sistema controllato a partire da xo = [0 0]T e con


controllo u35passi : a) sistema discretizzato con Eulero in avanti per T = 0.05;
b) sistema tempo continuo.
osservare, questa volta il sistema tempo continuo raggiunge esattamente la
posizione desiderata (si confronti, ad esempio, la fig. 4.7-b con la fig. 4.6-b).

I controlli ottenuti fino ad ora risolvono il problema di pianificazione ottima (4.5), permettendo al sistema carrello-molla-smorzatore di raggiungere
lo stato desiderato in un prefissato numero di passi. Il raggiungimento di un
prefissato stato mediante una opportuna legge di controllo in generale non
garantisce che il sistema si mantenga in tale stato per un tempo indefinito.

4.2. APPLICAZIONI ED ESTENSIONI


60

83

12
z
dz / dt

z
dz / dt

50

10

40

30

20

10

0.05

0.1

0.15
Tempo [s]

0.2

0.25

a)

0.3

0.2

0.4

0.6

0.8
1
Tempo [s]

1.2

1.4

1.6

b)

Figura 4.7: Stati del sistema tempo continuo controllato con la sequenza
calcolata sulla base del modello tempo discreto ZOH, a partire da xo = [0 0]T :
a) controllo u6passi ; b) controllo u35passi .
Per soddisfare ad un tale requisito, si pu`o procedere imponendo che il valore
dello stato al passo p coincida con quello al passo p 1, ovvero pari al valore
desiderato xf


    p1 
x
X(p 1)
Ad xo
+
= f =
xf
X(p)
Apd xo

0
Bd Ad Bd A2d Bd

2
Bd Ad Bd A2d Bd AN
Bd
d

u(p)
u(p 1)


u(p 2)
N 2
Ad Bd

..
1
AN
B

d
.
d

u(1)
u(0)

La sequenza di controlli u in grado di risolvere tale sistema garantisce anche


che il sistema rimanga nella nuova configurazione desiderata per un tempo
indefinito. Tale soluzione si ottiene come

u(p)
u(p 1)

   p1 
u(p 2)
xf
A x

,
dp o

= Rp
..
xf
Ad xo

u(1)
u(0)

84

CAPITOLO 4. PIANIFICAZIONE OTTIMA

p `e la pseudoinversa della matrice


dove R


2
0
Bd Ad Bd A2d Bd

AN
Bd
d

.
Rp =
2
1
Bd Ad Bd A2d Bd AN
Bd AN
Bd
d
d
Alternativamente si poteva procedere calcolando preliminarmente il valore della forza F di attuazione capace di mantenere il carrello in equilibrio in
xf , ovvero u(p) = F = Kzo = 10 N. Lo stato al passo p `e dato da

u(p)
u(p 1)

u(p 2)



p1
X(p) = xf = Apd xo + Bd Ad Bd A2d Bd Ap2

..
d Bd Ad Bd

u(1)
u(0)
ovvero,

u(p 1)
u(p 2)

..
p
xf = Apd xo + Bd u(p) + R

u(1)
u(0)

(4.7)

p = [Ad Bd A2 Bd Ap2 Bd Ap1 Bd ] e con u(p) pari il valore della


con R
d
d
d
forza F . La soluzione per i primi p 1 valori della sequenza di controllo sono
dati da

u(p 1)
u(p 2)

..
p (xf Ap xo Bd u(p)) ,

=R
.
d

u(1)
u(0)

dove il simbolo indica ancora la pseudoinversa. Si noti che in ogni caso, il


vincolo imposto sulla forza al passo p non garantisce pi`
u una soluzione con
p = 2 passi, servendone almeno 3.
In fig. 4.8 `e rappresentato landamento dello stato per il sistema tempo
continuo. In entrambi i casi, una volta raggiunto lo stato desiderato, viene
mantenuto come controllo lultimo valore della sequenza. Se il sistema viene controllato con una sequenza di controllo calcolata con la (4.6), allora il
sistema una volta raggiunto lo stato desiderato, tende poi ad allontanarsene (fig. 4.8-a). Se invece il sistema viene controllato con una sequenza di
controllo calcolata con la (4.7), allora il sistema non solo raggiunge lo stato

4.2. APPLICAZIONI ED ESTENSIONI

85

desiderato, ma riesce anche a mantenersi in tale configurazione (fig. 4.7). In


effetti in tal caso lultimo valore della sequenza di controllo `e esattamente
quello che mantiene il sistema in equilibrio nella configurazione desiderata,
ovvero F = 10 N (fig. 4.9).
12

12
z
dz / dt

10

z
dz / dt
10

6
8
4

0
4
2

4
2
6

0.5

1.5

2.5

0.5

Tempo [s]

1.5

2.5

Tempo [s]

a)

b)

Figura 4.8: Stati del sistema tempo continuo controllato a partire da xo =


[0 0]T ed entrambi con controllo calcolato in p = 35 passi e con la tecnica di
discretizzazione ZOH: a) il sistema raggiunge lo stato finale senza mantenerlo
(controllo calcolato con la (4.6)); b) il sistema raggiunge lo stato finale e lo
mantiene (controllo calcolato con la (4.7)).

4.2.2

Minima norma del controllo e controllo vincolato

Valori troppo elevati del segnale di controllo potrebbero danneggiare il sistema e gli attuatori, o semplicemente potrebbero non essere generabili. In
tali situazioni `e utile formulare un problema di ottimizzazione che prevede
esplicitamente dei vincoli sul valore massimo dei segnali di controllo. Purtroppo non possiamo pi`
u fare ricorso alla soluzione mediante pseudoinversa
della matrice di raggiungibilit`a, ma dobbiamo risolvere un nuovo problema
di ottimizzazione vincolata:
min kuk2
u

soggetto a:
xk+1 = Ad xk + Bd uk
x0 = x0
xp = xt
l b uk ub .

(4.8)

86

CAPITOLO 4. PIANIFICAZIONE OTTIMA


20

15

Forza di controllo [N]

10

10

15

0.5

1.5

1.75

2.5

Tempo [s]

Figura 4.9: Controlli calcolati secondo la legge (4.7) in p = 35 passi.


dove lb e ub sono i limiti massimi inferiore e superiore ammissibili per i segnali
di controllo ad ogni passo. Facendo uso della (4.4) il precedente problema si
riformula in modo compatto come segue:
min kuk2

(4.9)

soggetto a:
xt Apd x0 = Rp u
l b uk ub ,
T

con u = up1 u0 . Questo problema appartiene alla classe dei problemi di minimi quadrati vincolati e non pu`o essere cos` facilmente risolto
come i precedenti, ma richiede strumenti di calcolo numerico pi`
u complessi.
Lesistenza stessa di una soluzione non `e garantita per un numero di passi
fissato a priori.
Matlab mette a disposizione la funzione lsqlin per risolvere problemi ai
minimi quadrati vincolati1 . Se lapplicazione dellalgoritmo non trova soluzioni in un numero p di passi, si incrementa p e si prova ancora. In questo
modo si pu`o ottenere anche una soluzione del problema di trovare il numero
di passi minimo con vincoli sul controllo.
1

Lalgoritmo lsqlin risolve problemi ai minimi quadrati della forma


min k Cx d k22
u

tale che:

Axb
Aeq x = beq
lb x u b ,

dove C, A e Aeq sono matrici mentre d, b, beq , lb , ub e x sono vettori.

4.2. APPLICAZIONI ED ESTENSIONI

87

Imponendo il vincolo 15 uk 15 sul controllo e risolvendo il problema (4.9) per il sistema discretizzato con Eulero in avanti facendo uso della
funzione lsqlin di Matlab, si ottengono i risultati riportati nelle fig. 4.10.
Controlli (Eul. in avanti, u vincolato T = 0.05 p = 35)

Stati sistema tenpo discreto (Eul. in avanti, u vincolato, T = 0.05 p = 35)

15

z
dz/dt

10

Stati del sistema tempo continuo (Eul. in avanti, u vincolato, T = 0.05 p = 35)
z
dz/dt

10

10
8

10
0

15
0

0.2

0.4

0.6

0.8
Time (sec)

1.2

1.4

1.6

0.2

0.4

0.6

(a)

0.8
1
Time (sec)

1.2

1.4

1.6

0.2

0.4

0.6

(b)

0.8
1
Time (sec)

1.2

1.4

1.6

(c)

Figura 4.10: Soluzione del problema di minimi quadrati vincolati (4.9) con
35 passi e discretizzazione con Eulero in avanti per T = 0.05s: a) Controlli;
b) Stati del sistema TD; c) Stati del sistema TC.
Per verificare la differenza insita nella soluzione del problema (4.9) rispetto al problema (4.3), calcoliamo la legge di controllo con la formula (4.6) per
lo stesso numero di passi e tempo di campionamento (cio`e stesso orizzonte
temporale). Come si pu`o notare dalla fig. 4.11 (a) i segnali di controllo nei
primi e ultimi istanti violano il vincolo 15 uk 15 anche se producono un
andamento per la velocit`a pi`
u morbido (fig. 4.11 (b) e (c)). Una soluzione al
problema con controlli vincolati si sarebbe potuta ottenere anche nella forma
(4.6), ma avrebbe richiesto un numero maggiore di passi. Limpiego di un
numero minore di passi, di contro, ha leffetto di alzare il valore della norma
del controllo. A parit`a di passi, infatti, il problema (4.9) produce vettori di
controllo con norme maggiori uguali di quelle dei vettori soluzione di (4.3).
Controlli (Eul. in avanti, T = 0.05 p = 35)

Stati sistema tempo discreto (Eul. in avanti, T = 0.05 p = 35)

20

z
dz/dt

10

Stati sistema tempo continuo (Eul. in avanti, T = 0.05 p = 35)


z
dz/dt

10

15
10
5

0
5
10
15
0

20
0

0.2

0.4

0.6

0.8
1
Time (sec)

(a)

1.2

1.4

1.6

0.2

0.4

0.6

0.8
1
Time (sec)

(b)

1.2

1.4

1.6

0.2

0.4

0.6

0.8
1
Time (sec)

1.2

1.4

(c)

Figura 4.11: Soluzione del problema di minimi quadrati senza vincoli (4.6)
con 35 passi e discretizzazione con Eulero in avanti per T = 0.05s: a)
Controlli; b) Stati del sistema TD; c) Stati del sistema TC.

1.6

88

CAPITOLO 4. PIANIFICAZIONE OTTIMA

4.2.3

Minima norma del controllo e delluscita di prestazione con controllo vincolato

Lindice di costo che definisce il problema di ottimo pu`o essere arricchito


incorporando un termine relativo agli stati del sistema. In particolare, si
pu`o definire unuscita di prestazione il cui errore, rispetto ad un valore finale
desiderato, si vuole minimizzare ad ogni passo. Casi pratici che motivano
tale indice di costo derivano dalla necessit`a (o desiderio) di mantenere limitati i valori di alcune uscite, evitando sovraelongazioni eccessive. Il nuovo
problema di ottimo pu`o essere formulato come segue:
minu ky yt k22 + kuk22
soggetto a: xt Apd x0 = Rp u
l b uk ub ,
T
T

T


con u = up1 u0 , y = yp1 y0 , yt = yt yt , yk =
Cxk e yt = C xt . Il peso serve per bilanciare il ruolo del controllo e delluscita nella formazione dellindice. Valori di elevati produrranno soluzioni
simili a quelle prodotte dal problema (4.9). Anche per problemi di questo
tipo Matlab mette a disposizione alcune funzioni. Quella utilizzata in questo
contesto per risolvere il problema (4.2.3) `e la fmincon2
Tornando allesempio
 del carrello e prendendo come uscita di prestazione
la velocit`a z,
cio`e C = 0 1 , e come valore del peso = 0.01, facendo uso
della funzione fmincon di Matlab, si ottiene una soluzione in 37 passi come
illustrato nella fig. 4.12. Si vede che rispetto alla soluzione analoga in 35
passi trovata per il problema (4.9) la velocit`a subisce una forte limitazione
nella zona centrale (si confronti con la fig. 4.10).
2

Lalgoritmo fmincon risolve problemi di ottimizzazione con vincoli del tipo


minu
soggetto a:

f (x)
c(x) 0
ceq (x) = 0
Axb
Aeq x = beq
lb x u b ,

dove f (x) `e lindice di costo da minimizzare e pu`


o essere in generale rappresentato da una
funzione anche non lineare che restituisce uno scalare, c and ceq sono funzioni anche non
lineari che restituiscono vettori, C, A e Aeq sono matrici mentre d, b, beq , lb , ub e x sono
vettori.

4.2. APPLICAZIONI ED ESTENSIONI


Controlli (Eul. in avanti, u vincolato, indice misto, T = 0.05 p = 37 = 0.01)
15

89

Stati sistema tempo discreto (u vincolato, indice misto, T = 0.05 p = 37 = 0.01)

Stati sistema tempo continuo (u vincolato, indice misto, T = 0.05 p = 73 = 0.01)

10

10

z
dz/dt

z
dz/dt

10

10

15
0

0.2

0.4

0.6

0.8
1
Time (sec)

(a)

1.2

1.4

1.6

1.8

0
0

0.2

0.4

0.6

0.8
1
Time (sec)

(b)

1.2

1.4

1.6

1.8

0.2

0.4

0.6

0.8
1
Time (sec)

1.2

1.4

1.6

(c)

Figura 4.12: Soluzione del problema di ottimizzazione (4.2.3) con vincoli con
37 passi e discretizzazione con Eulero in avanti per T = 0.05s: a) Controlli;
b) Stati del sistema TD; c) Stati del sistema TC.

4.2.4

Variazione del tempo di campionamento e autorit`


a del controllo

Per concludere consideriamo leffetto della variazione del tempo di campionamento sul problema di pianificazione. Se T viene ridotto e non si impone
alcun vincolo sul valore massimo dei segnali di controllo, allora il sistema
tempo continuo raggiunge lo stato desiderato in meno tempo. Le matrici dei
sistemi discretizzati varieranno in conformit`a al nuovo valore di T , ma non
cambier`a il numero di passi necessario per raggiungere lo stato desiderato
(salvo violazione delle propriet`a di raggiungibilit`a, che si pu`o avere per alcuni particolari valori di T ). Ovviamente, perche ci`o sia possibile, aumenter`a
il valore dei segnali di controllo. Questo legame si capisce intuitivamente se
si pensa al fatto che per far raggiungere al carrello la sua posizione finale in
minor tempo, bisogner`a spingerlo con pi`
u forza. Daltro canto se T tende
a zero, lapprossimazione discreta della derivata tende al suo valore tempo
continuo e la condizione di raggiungibilit`a torna ad essere quella in tempo
nullo dei sistemi continui, ammissibile solo con controlli illimitati.
Se, invece, si riduce T , ma si conserva il vincolo sui controlli, il numero
di passi che il sistema tempo discreto dovr`a effettuare per raggiungere lo
stato desiderato aumenter`a. Questo `e dovuto al fatto che la soluzione del
problema (4.9) con numero minimo di passi tende a saturare il valore del
controllo, cio`e a fornire segnali che assumono quasi sempre i valori minimo
e massimo. In tal senso la soluzione a tale problema `e unapprossimazione
della soluzione dellequivalente problema di ottimo tempo continuo e per esso
fornisce una soluzione in tempo minimo pT . Diminuire T , comporta pertanto
un aumento di p in modo da avvicinarsi al precedente valore pT . In molti casi
il valore di p aumenta anche oltre quello indicato dalla precedente relazione

1.8

90

CAPITOLO 4. PIANIFICAZIONE OTTIMA

di proporzionalit`a a causa della migliore approssimazione della dinamica del


sistema tempo continuo fornita dai sistemi discretizzati.

Capitolo 5
Retroazione degli stati
Nella grande maggioranza delle applicazioni, il controllo basato esclusivamente sulla esatta conoscenza dello stato iniziale e del modello del sistema
(come lo si `e visto nel caso della pianificazione in anello aperto) non d`a risulatati soddisfacenti, in seguito alla presenza di disturbi (che possono alterare
lo stato del sistema) e di errori di modello.
Lo strumento principale dellingegnere del controllo `e la retroazione, cio`e
lutilizzo di informazioni provenienti da opportuni sensori sullo stato attuale
effettivo del sistema. Tipicamente, come gi`a si `e visto nellintroduzione, si
dovr`a pensare di avere a disposizione solo la conoscenza dei valori di un certo
numero di uscite misurabili, cio`e di note funzioni degli stati incogniti. Per il
momento, comunque, supporremo di avere a disposizione la misura di tutti
gli stati.
Il concetto di retroazione degli stati sugli ingressi per un sistema IDx =
f (x, u) consiste nel realizzare ingressi calcolati istante per istante in funzione
dello stato presente: u(t) = (x(t)) + (x(t))v(t). Come gi`a accennato trattando della stabilit`a, la retroazione `e spesso usata al fine di rendere stabile
un sistema che originalmente non lo `e, ovvero di migliorarne le caratteristiche
di stabilit`a (ad esempio, migliorando la velocit`a di convergenza).

5.1

Retroazione lineare degli stati nei sistemi


LTI

Nel caso di sistemi lineari tempo invarianti, se si desidera che il sistema


mantenga le sue caratteristiche, anche la retroazione sar`a di tipo lineare e
tempo invariante, cio`e si ha
u = Kx + Hv
91

92

CAPITOLO 5. RETROAZIONE DEGLI STATI

con K IRmn e H IRmm .


La matrice H si assume invertibile (nel caso opposto, alcuni ingressi o loro
combinazioni sarebbero di fatto disconnesse dal sistema), e di conseguenza
IDx = (A + BK)x + BHv
y = (C + DK)x + DHv
La retroazione cambia il sistema in modo assai importante, ad esempio
alterando la posizione degli autovalori. Comunque, la raggiungibilit`a del
sistema non `e modificata. Infatti dopo la retroazione si ha
Rf =

BH (A + BK)BH

(A + BK)n1 BH

dalla quale si pu`o osservare che

Rf =

B AB A B

H KBH KABH + KBKBH


0
H
KBH
0
0
H
..
..
..
.
.
.

...

ed essendo H invertibile, si ha Im (Rf ) = Im (R).


Gli autovalori esterni al sottospazio di raggiungibilit`a non vengono alterati dalla retroazione. Infatti, ponendo il sistema in forma standard di
raggiungibilit`a, si ha
A + BK =

AR ARN
0
AN

AR + BR KR ARN + BR KN
0
AN

BR
0

KR KN

Considerando invece le modifiche imposte agli autovalori del sottosistema


raggiungibile dalla retroazione, `e particolarmente utile considerare il caso
SISO in cui le coordinate scelte siano quelle corrispondenti ad una forma
canonica di controllo per il sistema (caso che abbiamo visto generale per
sistemi raggiungibili).
in questo caso ha dimensione 1 n, K =

 La matrice di retroazione
k0 k1 kn1 , e la matrice dinamica retroazionata viene scritta

5.1. RETROAZIONE LINEARE DEGLI STATI NEI SISTEMI LTI

A + BK =

0
0
..
.

1
0
..
.

0
1
..
.

...

0
0
0

a0 + k0 a1 + k1 a2 + k2

0
0
0
1
an1 + kn1

93

Il polinomio caratteristico della matrice diviene pertanto


(s) = (a0 + k0 ) + (a1 + k1 )s + (a2 + k2 )s2 +
+ + (an1 + kn1 )sn1 + sn .
` evidente come, scegliendo opportunamente i coefficienti che appaiono
E
in K, si possa fare in modo che gli autovalori risultino in posizioni arbitrariamente scelte nel piano complesso (purch`e reali o complesse coniugate).
Trovata la retroazione Kc che alloca i poli nelle posizioni desiderate per
le coordinate della forma canonica, si pu`o facilmente scrivere la retroazione
direttamente nelle coordinate originali (nelle quali per esempio potrebbero
essere date le misure degli stati) ponendo K = Kc T 1 = Kc Rc R1 .
Esempio. Sia data

1
1 0 1


A = 2 1 0 ; B = 0 ; C = 1 0 0 ; D = 0;
1
0 1 0
Il sistema `e raggiungibile:

1 2 2
R = 0 2 6 ,
1 0 2

ed ha polinomio caratteristico (s3 2s2 + s 2), quindi autovalori in 2 e in


j. Le matrice Ac , Bc in forma canonica di controllo sono quindi

0
0 1 0
Ac = 0 0 1 ; Bc = 0
1
2 1 2
Essendo poi

94

CAPITOLO 5. RETROAZIONE DEGLI STATI

1 0 1
1 2 1
0 0 1
2 0
Rc = 0 1 2 ; Rc1 = 2 1 0 ; T = 2
3 2 1
1
0 0
1 2 3



si ha Cc = CT = 1 0 1 .
Se si desidera porre gli autovalori
in 3, 2 j, si calcola il
P2ad esempio
3
i
3
nuovo polinomio caratteristico s + i=0 ci s = s +7s2 +17s+15, e si risolvono in ki le equazioni ai + ki = ci , ottenendo k0 = 17, k1 = 16, k2 = 9.
La legge di controllo, espressa nelle originali coordinate, `e dunque data da
u(x) = Kc T 1 x + v =

5.1.1

T

1
22 29 5
x1 x2 x3
+v
3

Formule per lAllocazione dei Poli

Le procedure di calcolo sopra esposte possono essere riassunte come segue:


Sia dato un sistema SISO (A, B) con matrice di raggiungibilit`a R invertibile, e siano a = [a0 , . . . , an1 ] i coefficienti del polinomio caratteristico ()
di A (quindi, () = n + an1 n1 + . . . + a1 + a0 ); sia dato anche un
polinomio caratteristico desiderato
() con coefficienti a
= [
a0 , . . . , a
n1 ].
La retroazione u = Kx che fa s` che A+BK abbia polinomio caratteristico

() `e data da
K = (a a
)Rc R1
con

Rc1 =

a1 a2 1
a2 a3 0
.. .. . .
. 0
. .
1 0 0

Una formula ancor pi`


u semplice per il calcolo di K `e quella detta di
Ackermann:


K = 0 0 1 R1
(A)

dove
(A) = An + a
n1 An1 + . . . + a
1 A + a
0 I. Il comando Matlab K =
acker(A, B, a) esegue questo algoritmo.
Le formule di allocazione dei poli possono essere numericamente instabili
per diversi motivi. Innanzitutto, se vengono applicate ad un sistema che sia

5.1. RETROAZIONE LINEARE DEGLI STATI NEI SISTEMI LTI

95

s` completamente raggiungibile, ma con matrice di raggiungibilit`a R malcondizionata, cio`e pressoch`e non invertibile1 , produrr`a ovviamente un risultato
molto elevato in termini dei coefficienti che appaiono in K e molto sensibile a variazioni anche piccole della posizione degli autovalori di partenza e
desiderati.
Un secondo caso in cui si ha forte sensibilit`a dei risultati alle piccole
variazioni numeriche dei dati `e quello in cui si richieda di allocare pi`
u poli in
posizioni coincidenti o molto vicine: questo tipo di allocazione `e quindi da
evitare.
Infine, anche al di fuori di questi casi, gli algoritmi diretto e di Ackermann
sopra visti possono essere numericamente instabili, e non produce risultati
attendibili, per sistemi con un elevato numero di stati (dellordine di alcune
decine). Esistono algoritmi pi`
u robusti numericamente, ad esempio quello
realizzato nel comando Matlab K = place(A, B, a).
Osservazione. Dalla discussione precedente, risulta che la retroazione degli stati pu`o assegnare dinamica arbitrariamente veloce ad un sistema
purche raggiungibile. Naturalmente questo `e vero solo allinterno delle ipotesi di validit`a del modello che stiamo considerando, in particolare della sua
linearit`a e della illimitata autorit`a del controllo.
Si consideri come esempio un sistema costituito da un veicolo di massa
inerziale m, spinto dalla azione u di un propulsore, e si consideri come uscita
y la sua velocit`a. Una retroazione opportuna pu`o piazzare lautovalore del sistema tanto a sinistra sullasse reale, da fare in modo che il sistema raggiunga
il valore di regime di un gradino di riferimento, ad esempio i 100Km/h dei
test stradali, in tempo arbitrariamente piccolo. Questo sarebbe ovviamente
ottenuto mediante valori molto elevati di K, che si traducono in valori elevati
del segnale di controllo u - corrispondenti ad azioni che il propulsore non `e
in realt`a in grado di fornire.
Questo semplice esempio mostra come la saturazione, ed in generale la
limitata autorit`a ed il costo delle azioni di controllo, siano i limiti fisici che si
frappongono in realt`a allottenimento di modifiche arbitrarie alle dinamiche
di sistemi reali. Ne segue in generale che la scelta della dinamica da assegnarsi
in anello chiuso `e da farsi con attenzione alle richieste che ne risultano sugli
ingressi, come si vedr`a pi`
u avanti nel corso.
1

si ricorda che una matrice `e malcondizionata quando il rapporto tra il suo valore
singolare massimo e quello minimo `e molto maggiore di uno. I valori singolari di una
matrice R sono le radici quadrate degli autovalori di RT R. Una matrice che ha un valore
singolare nullo non `e invertibile. Per le matrici normali, ed in particolare per le matrici
simmetriche, i valori singolari coincidono con i valori assoluti degli autovalori.

96

5.1.2

CAPITOLO 5. RETROAZIONE DEGLI STATI

Invarianza degli zeri per retroazione

La f.d.t. di un sistema (A, B) retroazionato con una matrice K dipende


solo dal suo sottosistema raggiungibile. Scritto questo in forma canonica di
controllabilit`a con matrici Ac , Bc Cc , Dc , i coefficienti del polinomio degli zeri
sono gli elementi della matrice delle uscite. Poiche la retroazione degli stati
in non altera la forma compagna orizzontale inferiore della matrice dinamica
Ac +Bc Kc , anche dopo la retroazione il sistema `e in forma canonica, e quindi,
restando Cc invariato, il polinomio degli zeri della f.d.t. non cambia per
retroazione. Si deve notare per`o la possibilit`a che la retroazione porti un
polo a cancellare uno degli zeri.

5.1.3

Retroazione degli stati in sistemi a pi`


u ingressi

Per un sistema SISO, la allocazione degli autovalori consiste nella soluzione


di n equazioni lineari (una per ogni autovalore) in n incognite, le componenti
della matrice K IR1n .
Cosa avviene per un sistema MIMO? Se il sistema ha m ingressi, vi sono
mn incognite per n equazioni. Se tra le colonne di B ne esiste una, diciamo
B1 , tale che


rank B1 AB1 An1 B1 = n,

per allocare i poli baster`a scegliere opportunamente gli elementi K1,1 , . . . , Kn,1
e porre tutti gli altri a 0 in K per ottenere lo scopo.
Se, nonostante il sistema sia raggiungibile, non esiste nessuna colonna di
B che da sola pu`o garantire la raggiungibilit`a, rimane possibile retroazionare
gli stati in modo da allocare gli autovalori arbitrariamente mediante il Lemma
di Heymann. Questo consiste nellapplicare preventivamente al sistema una
retroazione u = KHi x + v tale che (A + BKHi , Bi ) sia controllabile, per poi
allocare gli autovalori di A+BKHi con una ulteriore retroazione v = Kx+w.
Il lemma di Heymann afferma che una tale matrice esiste, purch`e il sistema sia raggiungibile e Bi sia non nulla, e fornisce la seguente formula per il
calcolo della matrice KHi (data nel caso i = 1 senza perdere generalit`a).
Si costruisca la successione di vettori B1 , AB1 , A2 B1 , . . . , A1 1 B1 , arrestandosi al passo in cui si trova A1 B1 linearmente dipendente dai precedenti.
Si procede in modo analogo con B2 , calcolando B2 , AB2 , . . . , A2 1 B2 , arrestandosi al passo in cui si trova A2 B2 linearmente dipendente da B1 , . . .,
A1 1 , B2 , . . ., A2 1 .
Se necessario, si procede con B3 etc. sinche si ottiene una matrice invertibile

5.1. RETROAZIONE LINEARE DEGLI STATI NEI SISTEMI LTI

97

Q =
= B1 AB1 A1 1 B1 B2 AB2 A2 1 B2

Bp1 ABp1 Ap1 1 Bp1 Bp ABp Ap 1 Bp
Si costruisce inoltre la matrice S IRmn

S = 0 0 e2 0 0 e3 0

0 ep 0

0 0

dove ei `e liesima colonna della matrice identit`a. La matrice di Heymann `e


KH1 = SQ1 (la dimostrazione `e omessa).
Naturalmente, la scelta fatta per la allocazione degli autovalori del sistema MIMO `e solo una delle possibili soluzioni, che sono una infinit`a di
dimensione (m 1)n. La libert`a di scelta garantita dai sistemi MIMO pu`o
venir sfruttata per raggiungere altri scopi, oltre che la allocazione degli autovalori (ad esempio, alcuni degli autovettori) Questo argomento `e oggetto
di studio in corsi pi`
u avanzati.
Vale la pena notare che, nella condizione in cui si applica il lemma
di Heymann, cio`e con una coppia (A, B) raggiungibile per la quale pero
nessuna colonna Bi di B da sola garantisce la raggiungibilit`a, quasi tutte le retroazioni K dello stato rendono tutte le coppie (A + BK, Bi ) raggiungibili. Con quasi si intende precisamente che, scegliendo casualmente la matrice K, la probabilit`a di ottenere la propriet`a indicata `e uno:
infatti, gli mn elementi di una matrice K IRmn che non verificassero la propriet`a, dovrebbero soddisfare esattamente una equazione algebrica
(det[Bi , (A + BK)Bi , . . . , (A + BK)n1 Bi ] = 0), che definisce una variet`a di
dimensione mn 1 nello spazio degli elementi di K, il quale ha ovviamente
misura (e quindi probabilit`a) zero.
Questo suggerisce una rapida procedura di piazzamento dei poli MIMO: si applica prima una retroazione arbitraria K che renda raggiungibile
(A + BK, Bi ), per poi applicare una successiva retroazione K IR1n che
allochi i poli di A + BK + Bi Ki nelle posizioni desiderate. Si deve notare che il metodo della scelta casuale della retroazione pu`o portare a coppie
(A+BK, Bi ) raggiungibili, ma con piccolo valore singolare minimo, rendendo
quindi malcondizionato il successivo problema di allocazione.
Naturalmente, i gradi di libert`a di progetto messi a disposizione nella
retroazione dello stato di un sistema con pi`
u ingressi pu`o essere a frutto
in modo migliore che quanto descritto. Ad esempio, il comando Matlab
K = place(A, B, a), che si applica anche a sistemi multi-ingresso, alloca gli

98

CAPITOLO 5. RETROAZIONE DEGLI STATI

autovalori scegliendo tra le infinite retroazioni K possibili quella che minimizza la sensitivit`a della posizione degli autovalori in anello chiuso alle
perturbazioni dei dati del modello, cio`e dei coefficienti delle matrici A e B.

Capitolo 6
Osservabilit`
a e Ricostruibilit`
a
Si `e in passato gi`a sottolineato il fatto che, nel modello in forma di stato di un
sistema, luscita (di misura) ha il significato di specificare quelle grandezze di
cui, a differenza dello stato, si ha a disposizione una misura ad ogni istante
del processo. Essendo la conoscenza degli stati necessaria per effettuare la
loro retroazione, `e perci`o fondamentale determinare se, dalla conoscenza delle
uscite (e degli ingressi, che sono ovviamente a nostra disposizione), `e possibile
conoscere (o pi`
u in generale stimare) lo stato attuale del sistema.
La capacit`a di stimare lo stato di un sistema `e daltronde importante
anche in senso diretto in molte applicazioni, dove `e importante risalire dalla
osservazione di fenomeni misurabili alla situazione interna del sistema, di
per se non accessibile.
Se i dati di ingresso/uscita sono misurati in un intervallo [0, t], il problema
di ricavare informazione sullo stato x(0) al tempo 0 si dice di osservazione
dello stato; viceversa, il problema di ricavare lo stato x(t) al tempo t si dice
di ricostruzione dello stato. Si vedr`a che i due problemi sono equivalenti per
sistemi LTITC, ma non per sistemi LTITD.
Nelle questioni di osservazione/ricostruzione, ci troveremo spesso di fronte a problemi che possono essere ricondotti a sistemi di equazioni lineari
sovradeterminati (con meno incognite che equazioni), che in pratica saranno spesso inconsistenti. Per questi problemi si porranno quindi questioni di
approssimazione ottima ad una soluzione impossibile.

6.1

Insieme indistinguibile per sistemi LTI

Consideriamo un sistema tempo invariante in forma di stato


Dx(t) = f (x(t), u(t)),
y(t) = h(x(t), u(t))
99

` E RICOSTRUIBILITA
`
CAPITOLO 6. OSSERVABILITA

100

con x IRn , y IRp e u IRm . Sia al solito x(


x, u(), t) il valore della
soluzione corrispondente a x(0) = x e controllo u( ), [0, t], al tempo t; si
indichi poi con y(
x, u(), t) = h (x(
x, u(), t), u(t)).
Ci chiediamo se, conoscendo
il modello del sistema
lingresso u() sullintervallo [0, t];
luscita y() sullintervallo [0, t],
`e possibile osservare x(0) = x (ricostruire x(t)).
` ovvio (almeno in linea teorica) che, se `e possibile osservare x, la conoE
scenza dellingresso, del modello e quindi della sua soluzione (che si suppone
unica nel futuro per il determinismo del modello) implica che si possa determinare univocamente x(t) = x(
x, u, t). Il viceversa non `e detto: per i
sistemi TD, in particolare, abbiamo gi`a visto che le traiettorie di un sistema
non sono univocamente determinate nel passato (si pensi alla possibile non
invertibilit`a di At per sistemi LTITD).
Poniamo adesso la questione della osservabilit`a dello stato in termini leggermente diversi. Due stati iniziali x e x1 si dicono indistinguibili (nel futuro)
nellintervallo [0, t] (si scrive xIt x1 ) se, qualsiasi ingresso u() U venga applicato al sistema, le uscite corrispondenti alle evoluzioni relative sono uguali,
cio`e
xIt x1 u U, y(
x, u, ) = y(
x1 , u, ) [0, t]
Gli stati sono detti indistinguibili toutcourt se sono indistinguibili per ogni
t (si scrive xI x1 ).
Si definisce insieme dei punti indistinguibili nellintervallo [0, t] da x linsieme
def

It (
x) = {
x1 IRn |y(
x, u, ) = y(
x1 , u, ) [0, t], u U } .
Ovviamente, se questo insieme contiene altri punti diversi da x stesso, non
sar`a possibile determinare univocamente lo stato dalle uscite.

6.1.1

Sistemi LTITC

Consideriamo linsieme di indistinguibilit`a per il sistema


x = Ax + Bu,
y = Cx + Du

(6.1)

6.1. INSIEME INDISTINGUIBILE PER SISTEMI LTI

101

con x(0) = x, e la corrispondente soluzione per le uscite:


Z
A
CeA( ) Bu()d + Du( )
y(
x, u, ) = Ce x +
0

Confrontando le uscite per due stati iniziali diversi, si ha

x1 It x CeA x1 = CeA x, [0, t] CeA (


x1 x) = 0, [0, t]
per cui lo studio della indistinguibilit`a di x1 da x pu`o essere riformulato come
def
lo studio della indistinguibilit`a dello stato x = x1 x dallorigine. Inoltre `e
evidente che in questo problema, gli ingressi non giocano alcun ruolo (questo
`e ero solo perch`e il sistema `e lineare!)
Uno stato x indistinguibile dallorigine nellintervallo [0, t] viene detto
non osservabile in [0, t]. Non si specifica lintervallo se questo vale per ogni
intervallo. Se per un sistema linsieme dei punti non osservabili contiene solo
lorigine, si dice che il sistema `e (completamente) osservabile.
Dunque, la distinguibilit`a di uno stato x1 da x su [0, t] dipende dalla
eguaglianza dei due corrispondenti vettori di uscita per ogni istante dellintervallo. Supponiamo ancora una volta che gli ingressi applicati al sistema
(e quindi anche le sue soluzioni) siano analitici. Luguaglianza di due funzioni analitiche in ogni punto di un intervallo implica ed `e implicata dalla
uguaglianza delle funzioni e di tutte le loro derivate nel punto iniziale dellintervallo. Considerando quindi ancora lespressione della kesima derivata
dello stato
k
X
x(k) = Ak x +
Aki Bu(i1) ,
i=1

si ha

y(
x, u, 0) y(
x1 , u, 0)
y(
x, u, 0) y(
x1 , u, 0)
..
.

= C(
x x1 )
= CA(
x x1 )
..
= .

y (k) (
x, u, 0) y (k) (
x1 , u, 0) = CAk (
x x1 )

Queste equazioni, che definiscono gli stati x1 indistinguibili da x, possono


essere riscritte in forma matriciale:

y(0)
C
y(1) (0) CA
(2)

y (0) CA2

.
..

= . x
.

.
(k)

y (0) CAk
..
..
.
.

` E RICOSTRUIBILITA
`
CAPITOLO 6. OSSERVABILITA

102

dove y(t) = y(
x, u, t) y(
x1 , u, t).
Dunque x `e non osservabile (ovvero x1 `e indistinguibile da x) se appartiene allo spazio nullo della matrice composta con infinite righe sopra riportata. In seguito al teorema di CayleyHamilton, sappiamo comunque che
ogni gruppo di righe CAr con r n `e combinazione lineare delle prime n
righe della matrice stessa. Possiamo dunque dire che linsieme dei punti non
osservabili nellintervallo [0, t] `e in effetti un sottospazio, detto sottospazio di
inosservabilit`a, dato da

= ker (O) = ker


O

def

C
CA
CA2
..
.
CAn1

La matrice O viene detta matrice di osservabilit`a del sistema.


Il sottospazio di inosservabilit`a nellintervallo [0, t] non dipende in effetti
dalla durata dellintervallo di osservazione t: se uno stato `e indistinguibile
dallorigine in un tempo t, tale rimarr`a per ogni durata della osservazione.
Viceversa, se uno stato `e osservabile con osservazioni della uscita di una
certa durata, lo sar`a anche con osservazioni di durata arbitrariamente breve.
Quindi, per sistemi in TC, si ometter`a di specificare la durata del tempo di
osservazione. Un sistema `e completamente osservabile se e solo se ker (O) =
{0}.
Linsieme dei punti indistinguibili dal generico punto x `e dunque dato da


It (
x) = x = x + r, r O

ed `e quindi un iperpiano, parallelo al sottospazio di inosservabilit`a, passante per x ed anchesso indipendente da t. Nessun punto, eccetto x, `e
indistinguibile da x nel caso che il sistema sia osservabile.

6.1.2

Sistemi LTITD

Consideriamo linsieme di inosservabilit`a per il sistema


x(t + 1) = Ax(t) + Bu(t),
y(t)
= Cx(t) + Du(t)
con x(0) = x

(6.2)

6.1. INSIEME INDISTINGUIBILE PER SISTEMI LTI

103

La soluzione per le uscite della equazione alle differenze (6.2) (che indicheremo con y(
x, u, )) `e data da

y(
x, u, ) = CA x +

1
X

CA k1 Bu(k)

k=0

Consideriamo la differenza tra le uscite corrispondenti a due diversi stati


iniziali x e x1 , indicandola con
def

y( ) = y(
x, u, ) y(
x1 , u, ).
Impilando in un solo vettore i vettori di differenze tra le uscite negli istanti
0, 1, . . . , t si pu`o scrivere

C
y(0)
y(1) CA
def

x x1 ) = Ot x
.. = .. (
. .
CAt
y(t)

Due stati iniziali sono quindi indistinguibili in t passi se la loro differenza


x appartiene allo spazio nullo della matrice di osservabilit`a in t passi Ot , che
t def
viene detto sottospazio di inosservabilit`a in t passi, O
= ker (Ot ).
`
t contiene O
t+1 ,
E evidente che il sottospazio di inosservabilit`a in t passi O
e che quindi la successione definita dalle dimensioni dei sottospazi di inosservabilit`a al crescere del numero di passi `e non crescente; per cui la successione
si stabilizzer`a in un valore finito 0. Per il teorema di CayleyHamilton, il
sottospazio di inosservabilit`a in un numero arbitrariamente grande di passi
pu`o essere calcolato arrestandosi all(n 1)esimo passo,

C
CA

= ker (O) def


O
= ker

..

.
n1
CA

che viene detto sottospazio di inosservabilit`a del sistema, mentre la matrice


O viene detta matrice di osservabilit`a del sistema. Ogni stato distinguibile
dallorigine in un numero qualsiasi di passi pu`o essere anche distinto in non
pi`
u di n 1 passi.
Linsieme degli stati indistinguibili dallo stato generico x al passo t `e
pertanto dato da


t
It (
x) = x = x + r, r O

104

` E RICOSTRUIBILITA
`
CAPITOLO 6. OSSERVABILITA

ed `e quindi ancora un iperpiano, parallelo al sottospazio di inosservabilit`a in


t passi, passante per x.
Linsieme dei punti indistiguibili da x si riduce al solo punto x se rank (O) =
n. In tal caso, il sistema stesso si dice completamente osservabile.

6.1.3

Ricostruibilit`
a

Il problema di ricostruire, a partire dalle misure delle uscite in un intervallo [T t, T ], lo stato allistante T stesso riveste particolare importanza in
relazione alla possibilit`a di retroazionare lo stato.
Due stati del sistema al tempo T , x1 (T ) e x2 (T ), si dicono indistinguibili
nel passato in t passi se entrambi sono possibili soluzioni del sistema a partire
da condizioni iniziali compatibili con le misure compiute sullintervallo [T
t, T ].
Per la tempoinvarianza del sistema considerato, posso porre T = t.
Scrivendo la soluzione dello stato al tempo t a partire dallo stato iniziale x1
si ha
1
X
def
t
x1 (t) = x(
x1 , u, t) = A x1 +
Atk1 Bu(k)
k=0

Se, in base alle misure delle uscite fatte nei passi da 0 a t, posso osservare x1 ,
certamente potr`o anche stabilire univocamente x1 (t). Nel caso per`o in cui
esista un insieme non banale di indistinguibilit`a in t passi, non sar`o in grado
di distinguere, sulla base delle misure di uscita, lo stato iniziale x1 da uno
stato x2 se (
x2 x1 ) = x ker Ot . Daltronde, lo stato al passo t a partire
da x2 vale
P 1 tk1
def
x2 (t) = x(
x2 , u, t) = At x2 + k=0
A
Bu(k) =
= At x + x(
x1 , u, t) = At x + x1 (t)

quindi lindistinguibilit`a dello stato iniziale `e irrilevante ai fini della determinazione dello stato al tempo t (linsieme dei punti indistinguibili nel passato
da x1 in t passi contiene solo x1 ) se x ker (At ).
Questo vale in generale per qualsiasi stato iniziale indistinguibile (nel
futuro) se e solo se
ker (O)t ker (At )
Se questa condizione `e verificata, si dice che il sistema `e ricostruibile in t
passi.
Il sistema si dice ricostruibile se `e ricostruibile per qualche t. Per il
teorema di CayleyHamilton, questo equivale alla condizione ker (O)
ker (An )

6.2. STIMA OTTIMA

105

Naturalmente, la osservabilit`a implica la ricostruibilit`a, ma non viceversa.


Ad esempio, un sistema con matrice A nulla `e certamente ricostruibile (lo
stato al passo n essendo certamente 0 a meno della evoluzione forzata che `e
nota) mentre non `e osservabile a meno che vi siano almeno tante uscite quante
stati e rank (C) = n. Ricostruibilit`a e osservabilit`a nei sistemi LTITD sono
sinonimi se A `e nonsingolare.
Nei sistemi LTITC, linsieme ricostruibile in tempo t `e definito in modo
analogo. Per la invertibilit`a di eAt , comunque, nei sistemi tempocontinui i
concetti di ricostruibilit`a e osservabilit`a sono coincidenti.

6.1.4

Cambiamenti di Coordinate

Le propriet`a di osservabilit`a e ricostruibilit`a non sono alterate da cambiamenti di coordinate (sono propriet`a strutturali). Si consideri infatti il cambiamento di coordinate x = T z, e il sistema
Dz = T 1 AT z + T 1 Bu
y =
CT z + Du,
per il quale si ha

=
O

CT
CT T 1 AT
..
.
CT T 1 An1 T

= OT

che ha lo stesso spazio nullo di O (per la ricostruibilit`a, basta osservare che


anche (T 1 AT )t = T 1 At T )
Date due rappresentazioni in coordinate diverse dello stesso sistema osservabile, e note le matrici di osservabilit`a nei due casi, `e possibile trovare la
= OT , si ha
matrice che trasforma la prima nella seconda. Infatti avendosi O
= OT OT , da cui (essendo O a pieno rango colonne) T = (OT O)1 OT O;

OT O
sono quadrate e invertibili, per cui si ha semplicemente
nel caso SISO, O e O

T = O1 O

6.2

Stima ottima

Torniamo a considerare il problema di stimare lo stato iniziale x di un sistema conoscendone esattamente il modello e gli ingressi nellintervallo [0, t],
oltreche le uscite nello stesso intervallo. Nel caso LTITD la conoscenza esatta
del valore delle uscite su n campioni determina esattamente lo stato: se il

106

` E RICOSTRUIBILITA
`
CAPITOLO 6. OSSERVABILITA

numero di misure N `e maggiore, se ne possono in linea di principio trascurare N n. Nel caso LTITC ci troviamo davanti ad una serie continua di
misure su [0, t]: anche in questo caso `e concepibile utilizzare solo il numero strettamente necessario di misure prese ad istanti discreti nellintervallo,
trascurando le altre infinite misure disponibili che non possono che essere
linearmente dipendenti da quelle considerate.
Naturalmente questo approccio alla stima dello stato `e molto riduttivo, e
non ci dice nulla ne sul come scegliere le misure da utilizzare, ne sul perche si
debbano scartare misure che comunque contengono informazione sul sistema.
Per una migliore comprensione del problema, `e necessario considerare che
la conoscenza delle uscite ad un dato istante non pu`o che essere pensata,
nella grande maggioranza delle applicazioni, come affetta da errori di misura.
Questi ultimi possono essere introdotti nel modello del sistema aggiungendo
un termine non noto di errore y, cio`e
Dx(t) = Ax(t) + Bu(t)
y(t) = Cx + Du + y(t)
Non si faranno in questa sede considerazioni sulla caratterizzazione del
termine di errore di misura, che potrebbe essere fatta in termini probabilistici
(media, varianza etc.) o deterministici (massimo valore dellerrore nel peggior
caso), lasciandole a corsi specialistici. Ci limiteremo qui a supporre che y
sia piccolo rispetto alle misure y.

6.2.1

Stima ottima LTITD

Considerando la funzione di uscita in dipendenza dal punto iniziale, si ha per


un sistema LTITD
y(
x, u(), ) = CA x + yf ( ) + y( )
che rappresenta, ad ogni istante , un sistema di p equazioni lineari nelle
n incognite x. Il termine forzato yf ( ) `e noto se si suppone noto lingresso
ed il modello: pertanto possiamo pensare di inglobarlo nelle misure, e lo
trascureremo dora innanzi. Linsieme delle misure su un intervallo [0, t] pu`o
dunque essere scritto
Y = Ot x + Y.
Essendo il vettore dei termini di rumore dY IRpt ignoto, la stima dello stato
deve essere fatta cercando una soluzione al sistema di pt equazioni lineari in
n incognite
Y = Ot x,

6.2. STIMA OTTIMA

107

il quale, assumendo di avere misure sufficienti a rendere determinato il problema, quindi pt > n, risulter`a inconsistente (non esister`a cio`e alcuna soluzione
esatta). Avr`a senso quindi porsi il problema di trovare la stima migliore di
x nel senso di minimizzare una norma degli errori residui, cio`e
x = arg min kY Ot xk
x

Scegliendo in particolare la norma due pesata, o meglio il suo quadrato,


si ottiene un problema di minimi quadrati
xLS = arg min(Y Ot x)T Wy (Y Ot x)
x

che `e risolto, derivando la funzione da minimizzare rispetto a x e uguagliando


a zero la derivata
2(Y Ot x)T Wy Ot = 0
da

x = (OtT Wy Ot )1 OtT Wy Y
Il significato che pu`o essere dato alla matrice di pesi Wy `e quello di affidabilit`a
delle misure (per un sistema SISO, lelemento diagonale i-esimo `e tanto maggiore quanto maggiore `e laffidabilit`a della misura al passo iesimo); questo
concetto si formalizza meglio, in presenza di una caratterizzazione statistica
degli errori di misura, con la inversa della covarianza degli stessi. Altra importante funzione di Wy `e quella di normalizzare le dimensioni fisiche delle
equazioni, e di rendere quindi la soluzione invariante al variare dei sistemi di
riferimento e di unit`a di misura.

6.2.2

Stima ottima LTITC

Nel caso LTITC, si procede in modo analogo a scrivere una equazione di


misura (in cui si tenga gi`a conto della risposta forzata) y( ) = CeA x +y( ),
in ognuno degli (infiniti) istanti dellintervallo continuo [0, t]. Ci troviamo
quindi anche qui di fronte ad un sistema di equazioni inconsistente (infinite
equazioni in n incognite con errori), e al problema di stimare
x = arg min ky(t) CeAt xk
x

dove la norma della funzione residuo `e da intendersi come una norma su uno
spazio di funzioni definite su [0, t].
Considerando in particolare la norma due pesata, o meglio il suo quadrato, si ha

` E RICOSTRUIBILITA
`
CAPITOLO 6. OSSERVABILITA

108

x = arg min
x

t
0

(y( ) CeA x)T Wy ( )(y( ) C exp A x)d

e, ancora ponendo uguale a zero la derivata rispetto a x, si ottiene


Z

AT

C Wy ( )y( )d =

def

eA C T Wy ( )CeA xd = GOt x

Se il sistema `e osservabile, la matrice di integrali che moltiplica x nel


termine a destra (detta Gramiano di Osservabilit`
a) `e invertibile. Sappiamo
infatti che se il sistema `e osservabile, `e osservabile per qualsiasi t: se quindi
la matrice `e invertibile, lo deve essere per qualsiasi intervallo di integrazione.
Inoltre, dal fatto che il Gramiano `e perlomeno semi-definito positivo (integrale di prodotti di matrici una trasposta dellaltra, con Wy definita positiva), e
dal consueto sviluppo dellesponenziale di matrice, segue che il Gramiano `e
noninvertibile se e solo se esiste un vettore x che annulla tutti i prodotti del
tipo C x, CA
x, CA2 x, . . ., quindi se e solo se il sistema `e nonosservabile.
Per un sistema osservabile, si ha dunque
Z t
1

x = GOt
eA C T Wy y( )d
0

La matrice p p Wy ( ), eventualmente funzione del tempo, ha ancora il


significato di pesare la affidabilit`a delle p misure prese allistante tra di
loro, e rispetto a quelle prese in altri istanti.

6.3

Dualit`
a

Come si `e potuto osservare, molte delle considerazioni svolte con riguardo


alle propriet`a di osservabilit`a di sistemi sono in stretta relazione con quelle
fatte per le propriet`a di raggiungibilit`a. In effetti questa simmetria di
trattamento `e formalizzabile nel concetto di dualit`a di sistemi. Dato il sistema
LTI

Dx = Ax + Bu
:
y = Cx + Du,
si definisce come suo sistema duale il sistema

Dx = AT x + C T u

:
y = B T x + Du

` DI SISTEMI NON LTI


6.4. OSSERVABILITA

109

Ovviamente, il duale del duale `e il sistema stesso, detto talvolta primale:


( ) = .
Per le matrici di ragiungibilit`a e osservabilit`a tra sistemi duali valgono le
relazioni
RT = O
O T = R .
Le propriet`a (nonche gli algoritmi) studiati a riguardo della raggiungibilit`a
di un sistema possono quindi dare luogo ad analoghi per la osservabilit`a, se
applicate al sistema duale.

6.4

Osservabilit`
a di sistemi non LTI

Come `e logico attendersi, lanalisi della osservabilit`a per sistemi tempo


varianti e nonlineari in generale `e pi`
u complessa che nei casi LTI. Osserviamo
solamente che vale il seguente
Teorema. Se per il sistema x = f (x, u) con uscita y = h(x), il sistema
linearizzato approssimato attorno a x, u (f (
x, u) = 0), z = Az + Bu, y = Cz
`e osservabile, allora linsieme indistinguibile da x contiene, in un intorno di
x, il solo punto x.
Quindi, la osservabilit`a (globale) del linearizzato approssimato implica la
osservabilit`a (locale) del sistema effettivo. Questa condizione `e solo sufficiente: ad esempio, il sistema che rappresenta la localizzazione di un veicolo
su ruote mediante triangolazione di due traguardi ottici in posizione (0, 0) e
(0, d), che si scrive

x
v cos
v sin
y =
w

y1
= + arctan( xy )
y1
= + arctan( yd
)
x

ha un linearizzato (in un equilibrio qualsiasi) con A = 0 e C IR23 , quindi


non `e osservabile. Comunque, il vero sistema `e certamente osservabile.

6.5

Forma Standard di Osservabilit`


a

Il sottospazio di inosservabilit`a, sia nel caso LTITC che LTITD, ha anchesso una caratterizzazione geometrica: esso `e il pi`
u grande sottospazio

` E RICOSTRUIBILITA
`
CAPITOLO 6. OSSERVABILITA

110

` ovvio infatti che


Ainvariante contenuto in ker (C). E

C
CA

ker

..

.
CA(n1)

`e contenuto in ker (C), e che `e Ainvariante. Inoltre, se S `e contenuto in


ker (C) ed `e Ainvariante, esso `e contenuto anche in ker (CAk ), k, e quindi

S O.
Sia TO IRno una matrice di base per il sottospazio di inosservabilit`a
= ker (O) del sistema LTI
O
Dx = Ax + Bu,
y = Cx + Du
e TO IRn(no) una matrice di base complementare. Nelle nuove coordinate
descritte da


 zO
def 
x = T z = TO TO
zO
il sistema diviene

ovvero

Dz = T 1 AT z + T 1 B
y =
CT z + Du

DzO
DzO
y

=
=




0
AO
AOO AO
CO



 

zO
BO
+
u
zO
 BO
 zO
+ Du
zO

dove zO IRno e zO IRo.


In queste coordinate, il sistema `e dunque riscritto nella forma
DzO = AO zO + BO u
DzO = AOO zO + AO zO + BO u
y
= CO zO + Du

(6.3)

cio`e scomposto in due sottosistemi, dei quali il secondo `e completamente


inosservabile: infatti, lo stato zO non influenza luscita ne direttamente, n`e
attraverso lo stato zO (il contributo di zO alla evoluzione del secondo sottosistema si pu`o guardare come un ulteriore ingresso, che mostreremo ora essere
noto).

`
6.5. FORMA STANDARD DI OSSERVABILITA

111

Per quanto riguarda il sottosistema con stato zO e matrici (AO , BO , CO , D),


esso `e completamente osservabile: infatti, la matrice di osservabilit`a dellintero sistema nelle nuove coordinate `e

O =

CO
CO AO
..
.

0
0
..
.

n1
CO AO
0

= OT

quindi, avendo O rango n o come O, le sue prime n o colonne, le sole


non nulle, sono indipendenti.
La forma (6.3) viene detta forma standard di osservabilit`a del sistema. Il
sottosistema (AO , BO , CO , D) `e detto sottosistema osservabile; il sottosistema
(AO , BO , CO = 0, D) `
e detto sottosistema non osservabile.
La scelta delle matrici di base TO e complementare TO `e arbitraria: qualsiasi altra scelta porterebbe ad una forma analoga, con blocchi diagonali
diversi ma simili (algebricamente equivalenti) a quelli ottenuti in altra base.
Gli autovalori di AO e quelli di AO sono quindi invarianti in numero e in
posizione con i cambiamenti di coordinate, e sono quindi propriet`a strutturali del sistema. I primi vengono detti autovalori interni al sottospazio di
inosservabilit`a, i secondi esterni.
La parte non osservabile di un sistema non influenza la sua funzione di
trasferimento. Infatti,
G(s) = C (sI A)1 B + D =

1 


 sI(no) AO
0
BO
CO 0
=
+D =
AOO
sIo AO
BO
=

CO 0

"

sI(no) AO
M

1

= CO (sIno AO )1 BO + D

0
(sIo AO )1

# B
O

+D =
BO

(dove M indica una matrice il cui calcolo esplicito `e superfluo).


Il fatto che la f.d.t di un sistema non dipenda dal sottosistema non osservabile, e che quindi il sottosistema non osservabile non influenzi il rapporto
ingressouscita, implica che tra i poli della G(s) non appariranno gli autovalori di AO : ci`o significa che questi ultimi vengono sistematicamente cancellati

` E RICOSTRUIBILITA
`
CAPITOLO 6. OSSERVABILITA

112

da zeri coincidenti nella espressione


G(s) =

6.6

C adj (sI A) B
+D
det (sI A)

Lemma P.B.H.

La verifica di osservabilit`a pu`o essere fatta anche ricorrendo al Lemma P.B.H.


(Popov, Belevitch, Hautus):
Teorema Il sistema LTI con matrici (A, C) `e osservabile se e solo se la
matrice


I A
Po () =
(6.4)
C
ha rango pieno per ogni C.
l
Dimostrazione. La dimostrazione verte sulla possibilit`a di trovare un
vettore q tale che Po ()q = 0. Si riconduce direttamente a quella del lemma
PBH per la raggiungibilit`a considerando lequazione q T PoT () = 0.
Applichiamo il lemma PBH al caso di una coppia (A, C) con A in forma
di Jordan, con p miniblocchi:

1
0

A =

C =

1
1

0
0

0
0
...

C11 C21

Cm1 ,1

;
0

1 0

p 0

...

0 p
0

...
p
0

Cp,1 C2,p

Cmp ,p

6.7. FORMA CANONICA DI OSSERVAZIONE

113

Risulta che, per essere osservabile, le prime colonne per ogni miniblocco
corrispondente ad autovalori coincidenti, devono essere linearmente indipendenti. In particolare, per un sistema SISO, `e necessario che la molteplicit`a
geometrica di tutti gli autovalori sia pari a uno, e che C abbia almeno tanti
elementi diversi da zero quanti gli autovalori distinti di A. Un sistema con
i miniblocchi associati ad un unico autovalore i pu`o essere osservabile solo
se ha almeno i uscite indipendenti.

6.7

Forma canonica di osservazione

Per un sistema SISO con matrici dinamica e di uscita nella particolare forma

0 0 0 a0
1 0 0 a1

Ao = .. .. . . ..
;
..
. .

. .
.

 0 0 1 an1
1
0 0 0
Co =

(la forma di Ao si dice compagna verticale destra), la matrice di osservabilit`a ha la stessa forma della matrice di raggiungibilit`a della forma canonica
di controllo. Infatti

0
0

1
0
0
0
0
an1

..

..
..
.
.

.
.
Oo = .

0
1

1
an1

2
1 an1 an2 + an1

quindi `e osservabile. Un qualsiasi altro sistema SISO (A, B, C, D) con matrice


di osservabilit`a O pu`o essere posto per cambiamento di coordinate in questa
forma (canonica di osservazione) se e solo se `e completamente osservabile.
La matrice dinamica in forma compagna verticale destra `e la trasposta
della forma compagna orizzontale inferiore usata nella forma canonica di
controllo, cos` come la matrice Co = BcT . I coefficienti dellultima colonna
della forma compagna verticale destra sono quindi i coefficienti del polinomio
caratteristico della matrice stessa, ordinati secondo le potenze crescenti di s
dallalto in basso. Per porre un sistema SISO osservabile in forma canonica
di osservazione, baster`a dunque
1. Calcolare il polinomio caratteristico di A, det(sI A) = sn +an1 sn1 +
+ a1 s + a0 ;

114

` E RICOSTRUIBILITA
`
CAPITOLO 6. OSSERVABILITA

2. costruire la matrice di osservabilit`a O e verificarne il rango;


3. costruire Ao , Co ;
4. calcolare T 1 = Oo1 O;
5. trovare Bo = T 1 B
Se il sistema `e strettamente proprio, bn = 0 quindi D = 0 e B =
b0 b1 bn1 .
Dato un sistema LTI SISO in forma normale, `e dunque sempre possibile
scrivere un sistema in forma di stato con matrici (Ao , Bo , Co , Do ) in forma canonica di osservazione (quindi osservabile) che ha lo stesso rapporto
ingresso/uscita.
La funzione di trasferimento per un sistema SISO strettamente proprio
in forma canonica di osservazione vale G(s) = Co (sI Ao )1 Bo . Si verifica
facilmente che
bm s m + + b1 s + b0
G(s) = n
s + an1 sn1 + + a1 s + a0
In altre parole, nella forma canonica di osservazione di un sistema strettamente proprio si trovano i coefficienti del polinomio caratteristico nellultima
colonna della matrice dinamica Ao , e i coefficienti del polinomio degli zeri
nella matrice degli ingressi Bo .
Per un sistema proprio non strettamente, operando una opportuna divisione tra i polinomi a numeratore e denominatore, cio`e scrivendo G(s) =
G (s)+bn con G (s) strettamente proprio, si hanno in Bo i primi n coefficienti
del polinomio degli zeri di G (s), ed in Do il coefficiente del termine di grado
n, bn .


6.8

Iniezione delle Uscite

Loperazione duale della reazione degli stati sugli ingressi `e una operazione
mediante la quale luscita di un sistema viene riportata a influenzare direttamente l evoluzione degli stati, e si dice iniezione delle uscite. Anche se
questa operazione pu`o apparire fisicamente impossibile in questi termini, ne
troveremo pi`
u avanti una spiegazione ed una specifica utilit`a. Liniezione
lineare delle uscite sugli stati avviene attraverso una matrice G IRnp :
Dx = Ax + Bu + Gy = (A + GC)x + (B + GD)u
y = Cx + Du
Cos` come la retroazione degli stati non altera la raggiungibilit`a di un sistema,
la iniezione delle uscite non ne altera la osservabilit`a (la dimostrazione `e

6.8. INIEZIONE DELLE USCITE

115

` evidente (ricorrendo
analoga, e pu`o essere fatta ad esempio per dualit`a). E
ancora alla dualit`a) che, in un sistema completamente osservabile, la scelta
opportuna della matrice G pu`o allocare gli autovalori della matrice A + GC
dove desiderato.

116

` E RICOSTRUIBILITA
`
CAPITOLO 6. OSSERVABILITA

Capitolo 7
Realizzazioni e Connessioni di
Sistemi
7.1

Scomposizione canonica (o di Kalman)

Si `e visto in precedenza che un sistema LTI pu`o essere scritto in due forme
standard, che riflettono le sue propriet`a di raggiungibilit`a e osservabilit`a.
Combinando questi due risultati, si giunge ad una forma pi`
u articolata, che
li contiene entrambe.
Siano dunque per il sistema LTI con matrici (A, B, C) rispettivamente
i sottospazi di raggiungibilit`a e inosservabilit`a. Essendo entrambe
R e O

Ainvarianti, lo sar`a anche la loro intersezione R O.


Esempio: Siano TR e TO due matrici di base rispettivamente per R
Una base TRO per la intersezione si trova risolvendo lequazione
e O.
TR 1 = TO 2 . Se


N1
N=
N2

`e una base di ker [TR |TO ], allora TRO = TR N1 = TO N2 `e una base del
sottospazio cercato. Unalgoritmo `e realizzato ad esempio in linguaggio
Matlab come segue:
function [C]=intersect(A,B);
% C: Basis Matrix for Intersection
%
of Range(A) with Range(B)
[ra,ca]=size(A);
[rb,cb]=size(B);
117

118

CAPITOLO 7. REALIZZAZIONI E CONNESSIONI DI SISTEMI

C=null([A B]);
if length(C) > 0
C=orth(A*C(1:ca,:));
else
C=[];
end
Le funzioni Matlab null.m e orth.m sono usate per calcolare rispettivamente lo spazio nullo di una matrice, e per operare una ortogonalizzazione
di GramSchmidt sulle colonne di una matrice (luso della ortogonalizzazione non `e necessario, ma migliora il condizionamento numerico della
base ottenuta).
Si consideri inoltre una matrice di base TRO complementare a TRO per R.
Esempio: Anche questa operazione si pu`o effettuare con un semplice
algoritmo, espresso in linguaggio Matlab come segue:
function [D] = base_compl(A,B)
% D : base di range(A) complementare a B
[ra,ca] = size(A);
[rb,cb] = size(B);
D = gramschmidt([B A]);
[rd,cd] = size(D);
D = D(:,cb+1:cd);

Si proceda allo stesso modo a costruire una matrice di base TR O com Infine, si costruisca una matrice di base TRO
plementare a TRO per O.

n
complementare a [TRO |TRO |TR O ] per lintero spazio IR .
La matrice [TRO |TRO |TRO
e quadrata e invertibile. Se usata per
|TR
O
] `
cambiare le coordinate del sistema, si ottiene la forma

A =

C =

ARO
0
ARO,RO ARO
0
0
0
0
CRO
0

ARO,RO
0
BRO

ARO,R
A
BRO

O
RO,RO
; B=

AR,O
0
0

ARO,
A
0
R
O

O
R

CRO
0
.

7.2. REALIZZAZIONE DI SISTEMI

119

Dalla interpretazione di questa forma, risulta evidente che solo la parte


raggiungibile e osservabile del sistema partecipa al rapporto ingressouscita.
I poli di G(s) saranno pertanto tutti e soli gli autovalori di ARO :
G(s) = C (sI A)1 B = CRO (sI ARO )1 BRO

7.2

Realizzazione di sistemi

Il problema della trasformazione di un modello ingressouscita di un sistema


in forma di stato `e stato gi`a affrontato alcune volte in passato, in relazione
alla trasformazione delle forme normali in forma di stato. Il problema `e
importante perch`e, nonostante le tecniche di regolazione, di identificazione, e
di controllo ottimo siano risolte nel modo pi`
u semplice nello spazio di stato,
spesso il modello del sistema a nostra disposizione `e dato da una relazione
ingressouscita. Inoltre, la questione `e rilevante ai fini della scrittura di
algoritmi numerici e programmi che implementino su un computer date f.d.t.
ottenute ad esempio come risultato di un progetto classico di controllore,
algoritmi che usano naturalmente la scrittura nello spazio di stato. A questo
problema si d`a il nome di problema della realizzazione.
Si `e visto in particolare come per i sistemi SISO LTI sia possibile facilmente, a partire da una funzione di trasferimento, ottenere due realizzazioni
che garantiscono rispettivamente la raggiungibilit`a e la osservabilit`a. Si `e anche gi`a visto che, dato un sistema nello spazio di stato, solo gli autovalori del
sottosistema raggiungibile ed osservabile sono poli della f.d.t. corrispondente.
Ci chiediamo ora quale sia il pi`
u piccolo numero di stati che possa essere
utilizzato per realizzare una data f.d.t. SISO. Iniziamo dal considerare che
la f.d.t. che esprime un dato rapporto ingresso/uscita non `e unica. Infatti,
si consideri ad esempio il sistema in forma normale
y(t + 2) + 2y(t + 1) + y(t) = u(t + 1) + u(t)
con condizioni iniziali y(0) = y(1) = 0, cui corrisponde una rappresentazione
nelloperatore z del tipo
(z 2 + 2z + 1)Y (z) = (z + 1)U (z)
z+1
ovvero una f.d.t. G(z) = (z+1)
2.
Confrontando il precedente al sistema

y(t + 1) + y(t) = u(t)

120

CAPITOLO 7. REALIZZAZIONI E CONNESSIONI DI SISTEMI

con condizioni iniziali y(0) = 0, si ottiene che le evoluzioni dei due sistemisono coincidenti per qualsiasi sequenza di ingresso, quindi sono equivalenti.
1
Al secondo sistema corrisponde la f.d.t. G(z) = z+1
, eguale alla precedente eccetto che per la semplificazione tra i fattori comuni a numeratore e
denominatore.
Dato un rapporto ingressouscita LTI, esiste una e una sola rappresentazione in termini di f.d.t. che abbia grado minimo e coefficiente unitario della
potenza pi`
u alta della variabile complessa (che indicheremo con p) a denominatore. Una tale f.d.t, che pu`o essere ottenuta semplicemente mediante
divisione di polinomi, si dir`a ridotta ai minimi termini o coprima.
Diremo che un sistema LTI descritto dalle sue matrici (A, B, C, D) `e una
realizzazione della m.d.t. G(p) se vale
G(p) = C (pI A)1 B + D.
Una realizzazione (A, B, C, D) nello spazio di stato si dice minima se qualsiasi altra realizzazione (A , B , C , D ) che d`a luogo alla stessa f.d.t. coprima,
ha numero di stati uguale o superiore. Una realizzazione `e minima solo se
`e completamente raggiungibile ed osservabile. Se cos` non fosse, infatti, il
sistema
(ARO , BRO , CRO , D),
che realizza la stessa f.d.t. a meno di cancellazioni polozero, avrebbe numero
di stati inferiore.
Una realizzazione di una data f.d.t. non pu`o avere dimensione inferiore
al numero di poli della f.d.t. stessa (si ricordi che i poli sono un sottoinsieme
degli autovalori). Pertanto, una realizzazione in foma canonica di controllo
di un sistema SISO descritto da una f.d.t coprima, `e minimo, quindi anche
osservabile. Vale il viceversa per una realizzazione in forma canonica di
osservazione.
Se si applica la costruzione delle forme canoniche ad una f.d.t. non coprima, si otterranno invece delle realizzazioni raggiungibili ma non osservabili,
ovvero osservabili ma non raggiungibili, quindi non minime.
Ogni realizzazione minima di una f.d.t. `e algebricamente equivalente ad
ogni altra, cio`e esiste una matrice di trasformazione di coordinate che le lega.
Le formule esplicite per il calcolo di tale cambiamento di base utilizzano le
matrici di raggiungibilit`a o osservabilit`a dei due sistemi, e sono gi`a state viste
in passato.
Esempio: Con riferimento alla figura, si discuta la raggiungibilit`a
e la osservabilit`a del sistema sottoposto ad ingresso f al variare della

7.2. REALIZZAZIONE DI SISTEMI

121

costante elastica della molla, nei due casi in cui la misura disponibile sia
alternativamente la posizione della prima o della seconda massa.

Indicando con y1 e y2 le posizioni delle due masse m1 e m2 , le equazioni


del moto del sistema sono le seguenti:
m1 y1 + k(y1 y2 ) = f
m2 y2 + k(y2 y1 ) = 0

Ponendo x1 = y1 , x2 = y2 , x3 = y 1 e x4 = y 2 , si ha la forma di stato

0
0
0
1 0

0
0
0 1
x + 0 f,
x =
1/m1
k/m1 k/m1 0 0
k/m2 k/m2 0 0
0



 

1 0 0 0
C1
y1
x.
x=
=
0 1 0 0
C2
y2

Si trova immediatamente

0
1/m1
0
k/m21
0
0
0
k/(m1 m2 )
R=
2
1/m1
0
k/m1
0
0
0
k/(m1 m2 )
0
Per la prima uscita y1 si ha

1
0
0
0

0
0
1
0
O1 =
k/m1 k/m1
0
0
0
0
k/m1 k/m1

mentre per y2 vale

0
1
0
0

0
0
0
1
.
O2 =

k/m2 k/m2
0
0
0
0
k/m2 k/m2

122

CAPITOLO 7. REALIZZAZIONI E CONNESSIONI DI SISTEMI

` dunque facile osservare che si ha completa raggiungibilit`a e osservabilit`a


E
da entrambe le uscite se k 6= 0. Se k = 0, il sottospazio raggiungibile
consiste nelle sole posizioni e velocit`a della prima massa. Il sottospazio
inosservabile dalla prima uscita consiste nelle posizioni e velocit`a della
seconda massa, mentre quello inosservabile dalla seconda uscita consiste
nella posizione e velocit`a della prima.
Studiamo adesso il problema usando le trasformate. Si consideri il
caso in cui la misura disponibile sia la posizione y1 della massa m1 ; la
funzione di trasferimento che descrive il sistema `e la seguente:
Y1 (s) =

m 2 s2 + k
F (s).
s2 [m1 m2 s2 + (m1 + m2 )k]

Per k 6= 0 la funzione di trasferimento non presenta cancellazioni polo zero, quindi il sistema `e completamente raggiungibile e osservabile. Per
k = 0, invece, si hanno due cancellazioni nella funzione di trasferimento,
e si ottiene Y1 (s) = m11s2 F (s). Questa relazione esprime nel dominio delle
frequenze la legge del moto della massa m1 soggetta alla sola forza f .
Questa funzione di trasferimento `e coprima, quindi i due stati di una
realizzazione minima sono sono sia raggiungibili che osservabili. Se si
sceglie una realizzazione in forma canonica di controllo, si ottiene ancora
la dinamica della massa m1 con stati y1 e y 1 . Gli stati y2 e y 2 sono invece
non raggiungibili e non osservabili.
Si consideri ora il caso in cui luscita disponibile sia la posizione y2
della massa m2 ; la funzione di trasferimento che descrive il sistema `e la
seguente:
k
F (s)
Y2 (s) = 2
s [m1 m2 s2 + (m1 + m2 )k]
Per k 6= 0 la funzione di trasferimento non presenta cancellazioni, quindi
il sistema `e completamente raggiungibile e osservabile (come gi`a visto per
altra via). Per k = 0, invece, la funzione di trasferimento `e nulla. Questo `e
conseguente al fatto prima osservato che gli stati y1 e y 1 sono raggiungibili
ma non osservabili, mentre gli stati y2 e y 2 sono non osservabili ma non
raggiungibili. Non vi `e quindi alcuna connessione tra lingresso e luscita,
il che `e rappresentato da una f.d.t. nulla.

Esempio: Si discuta la raggiungibilit`a e la osservabilit`a del sistema


in figura, sottoposto ad ingresso f e con misura della posizione della

7.2. REALIZZAZIONE DI SISTEMI

123

prima massa y1 , al variare delle costanti elastiche delle molle. Si vogliono


trovare i casi nei quali alcune di tali propriet`a non sono verificate e fornire
una interpretazione fisica di tali casi.

Indicando con yi le posizioni della massa mi , i = 1, 2, 3 le equazioni del


moto del sistema sono le seguenti:
m1 y1 + k1 (y1 y2 ) + k3 (y1 y3 ) = f
m2 y2 + k1 (y2 y1 ) + k2 y2 = 0
m3 y3 + k3 (y3 y1 ) + k4 y3 = 0
Applicando la trasformata di Laplace alle equazioni appena scritte,
e ponendo p1 (s) = m1 s2 + k1 + k3 , p2 (s) = m2 s2 + k1 + k2 , p3 (s) =
m3 s2 + k3 + k4 , si ottengono le relazioni:
p1 (s)Y1 (s) k1 Y2 (s) k3 Y3 (s) = F (s)
1
Y2 (s) = p2k(s)
Y1 (s)
k3
Y3 (s) = p3 (s) Y1 (s),
da cui

e infine

k2
k2
p1 (s) 1 3
p2 (s) p3 (s)

Y1 (s) = F (s),

p2 (s)p3 (s)
Y1 (s)
=
.
F (s)
p1 (s)p2 (s)p3 (s) k12 p3 (s) k32 p2 (s)

Essendo il denominatore della f.d.t. considerata di ordine 6 (ogni polinomio pi (s) `e del secondo ordine), il sistema di tre masse `e completamente raggiungibile ed osservabile se e solo se non vi sono cancellazioni
polo/zero.
Si pu`o avere una cancellazione se k1 = 0: in tal caso infatti, le radici
(immaginarie) di p2 (s) = 0 sono comuni a numeratore e denominatore.
Il modo oscillante corrispondente `e quindi non osservabile, oppure non
raggiungibile, o entrambe. Dalla osservazione fisica del sistema, si capisce

124

CAPITOLO 7. REALIZZAZIONI E CONNESSIONI DI SISTEMI

facilmente che `e il terzo il caso che si applica al nostro esempio: infatti


il moto della massa m2 non `e influenzato dallingresso f , ne influenza
luscita y1 quando k1 = 0.
Analoghe conclusioni si raggiungono nel caso k3 = 0, per quel che riguarda la irraggiungibilit`a e la inosservabilit`a dei modi propri della massa
m2 .
Un ultimo caso, meno banale, di cancellazione si pu`o avere con k1 e
k2 non nulle, quando p2 (s) e p3 (s) hanno radici comuni, cio`e quando
k1 + k2
k3 + k4
=
.
m2
m3
Ponendo ad esempio p2 (s) = p(s) e p3 (s) = p(s), si ha
Y1 (s)
p2 (s)
p(s)
=
=
2
2
2
F (s)
p1 (s)p (s) (k1 + k3 )p(s)
p1 (s)p(s) (k12 + k32 )
In questo caso, la cancellazione `e causata dalla uguaglianza dei rapporti
tra coefficienti elastici e inerziali dei due sottosistemi oscillanti collegati
alla prima massa. La raggiungibilit`a del sistema `e compromessa, in quanto non `e possibile far raggiungere al sistema complessivo stati arbitrari
a partire da condizioni niziali arbitrarie: i due sottosistemi interni, se
inizializzati con posizioni e velocit`a uguali, non potranno evidentemente
essere mai portati ad avere stati diversi in quanto eccitati dallo stesso
moto di m1 .
Anche la osservabilit`a `e persa: infatti, una oscillazione di pari ampiezza e frequenza delle due masse, ma in opposizione di fase, darebbe
effetto risultante nullo sulla massa m1 , quindi sulla misura.
` naturalmente possibile trovare identici risultati studiando il sistema
E
nello spazio di stato, con le matrici

0
0
0

0
0
0

0
0
0

A=
k1
k3
k1m+k3
m1
m1
1

k1
2

k1m+k
0
m2
2
k3
k3 +k4
0
m3
m3
C=

1
0
0
0
0
0

0
1
0
0
0
0

1 0 0 0 0 0

0
0
1
0
0
0

B=

0
0
0
1
0
0

7.2. REALIZZAZIONE DI SISTEMI

125

Le matrici di raggiungibilit`a e osservabilit`a

3
0 1
0
k1m+k
1
k1
0 0
0

m2
0 0
k3
0

m3
R=
3
0
1 0 k1m+k
1

k1
0 0
0
m2
k3
0
0 0
m3

sono

1
0

0
1
0

0
0
0

0
0
0

3
k1m+k
1
0

k1
m2

k3
m3

k1 +k3
O=
m1

0
a

0
0

0
0

k1
m2

k3
m3

0
b

0
c

0
0
0
a
b
c

a
b
c
0
0
0

dove si `e posto

a=
b=

k12
k32
(k1 +k3 )2
+ m1 m
+ m1 m
,
m21 
2
 3
3
2
+ k1m+k
,
mk12 k1m+k
1
2

c = mk33

k1 +k3
m1

k3 +k4
m3

Mediante scambio di righe o colonne (operazioni che non cambiano il


rango di una matrice), si pu`o riscrivere


 T

M
0
M 0
; O=
R=
0 MT
0 M
dove

3
a
1 k1m+k
1
k1
b .
M = 0
m2
k3
0
c
m3

Sia R che O perdono rango esattamente dove perde rango M , cio`e quando
c
ovvero quando
k1 k3
m2 m3
da cui

k1
k3
b
= 0,
m2
m3

k1 + k2 k3 + k4

m2
m3

= 0,

126

CAPITOLO 7. REALIZZAZIONI E CONNESSIONI DI SISTEMI

2
4
se k1 6= 0, k3 6= 0, e k1m+k
6= k3m+k
, il sistema `e completamente
2
3
controllabile con f e osservabile da y1 ;

se k1 = 0 e k3 6= 0, oppure se k1 6= 0 e k3 = 0, il sottosistema non


raggiungibile e non osservabile ha dimensione due;
4
2
= k3m+k
, il sottosistema non
se k1 6= 0, k3 6= 0, ma k1m+k
2
3
raggiungibile e non osservabile ha ancora dimensione due.

7.3

Effetti di Retroazione dello Stato e Iniezione delle Uscite

Abbiamo visto in precedenza che la retroazione degli stati non altera la


raggiungibilit`a di un sistema, e la iniezione delle uscite non ne altera la
osservabilit`a.
Come corollario, una retroazione delle uscite, ovvero la particolare scelta
u(x) = KGy, non altera ne raggiungibilit`a ne osservabilit`a di un sistema,
essendo essa equivalente sia ad una particolare retroazione dello stato u =
con K
= KGC, che ad una particolare iniezione delle uscite Gy,
con
Kx,
1
= BKG .
G
Al contrario, la retroazione degli stati pu`o alterare la osservabilit`a, e la
iniezione delle uscite pu`o alterare la raggiungibilit`a. Si noti in particolare
che la retroazione degli stati sposta la posizione degli autovalori interni al
sottospazio di raggiungibilit`a, e quindi anche di quelli tra questi esterni al
sottospazio di inosservabilit`a, cio`e quelli che coincidono con i poli della f.d.t.
corrispondente. Dalla forma canonica di raggiungibilit`a applicata al sottosistema raggiungibile e osservabile, in cui i coefficienti del polinomio degli
zeri appaiono nella matrice C, si osserva che la retroazione lascia invariati gli
` quindi possibile che i poli vengano spostati in modo che
zeri della f.d.t.. E
uno o pi`
u tra loro venga a coincidere con uno o pi`
u zeri, dando cos` luogo
ad una cancellazione: in tal caso, il sistema realizzato in forma di controllo non sarebbe pi`
u di dimensione minima, il che implica che si sia persa la
osservabilit`a.
1

Di questo risultato `e possibile dare una interpretazione in termini di luogo delle radici
per la f.d.t. del sistema con retroazione proporzionale delluscita e guadagno k = KG IR:
i poli sono tutti spostati dalla reazione lungo i rami del luogo, ma non raggiungono gli zeri
per nessun k finito

7.4. GRADO RELATIVO

127

In modo analogo, si consideri il (sotto)sistema raggiungibile e osservabile in forma canonica di osservazione (Ao , Bo , Co , Do ), e si proceda ad una
iniezione delle uscite sugli stati, cio`e
x = Ao x + Bo u + GCo x = (Ao + GCo )x + Bo u
Anche in questo caso, gli autovalori di Ao , cio`e i poli della f.d.t. corrispondente, sono spostati ad arbitrio dalla retroazione, mentre gli zeri restano fissi (i
coefficienti del polinomio degli zeri sono in Bo ). Se qualche coppia polo/zero
si cancella, la realizzazione non `e pi`
u minima, nel qual caso la propriet`a
venuta a mancare non pu`o che essere la raggiungibilit`a.

7.4

Grado Relativo

Si dice grado relativo di una f.d.t. SISO la differenza tra il grado del denominatore e quello del numeratore, ovvero tra il numero dei poli (n) e quello
degli zeri (m):
b0 + b1 s + + bm s m
G(s) =
a0 + a1 s + + s n
Per il grado relativo n m = r di un sistema proprio vale r 0; se
strettamente proprio, r > 0.
Il grado relativo ha una diretta interpretazione fisica nei sistemi TD: esso
rappresenta il tempo (numero di istanti) dopo il quale si manifesta nella
uscita leffetto dellingresso. Si ricordi infatti che (per D = 0) vale
y(0)
y(1)
y(2)
..
.

= Cx(0)
= CAx(0) + CBu(0)
= CA2 x(0) + CABu(0) + CBu(1)
.
= ..

e si consideri per il sistema una realizzazione in forma canonica di controllo:


si osserva che


CB CAB CA2 B

b0

bm 0

= CR
=
0
0
0
0
0
0

.
..
.
 .
..
.
0 .
0
0
1

0
1
an1
1 an1 an2 + a2n1

1
an1
...

128

CAPITOLO 7. REALIZZAZIONI E CONNESSIONI DI SISTEMI

quindi che CB = CAB = = CAnm1 B = 0, mentre CA(nm) B = bm 6=


0.
Nel caso TC, il grado relativo rappresenta il numero di volte per il quale
si deve derivare luscita prima che lingresso appaia esplicitamente nella sua
espressione. Infatti si ha adesso che (per D = 0) vale
y (0) = Cx
y (1) = CAx + CBu(0)
y (2) = CA2 x + CABu(0) + CBu(1)
etc.

7.5

Raggiungibilit
a e Osservabilit
a di Sistemi
Connessi

Si supponga adesso che due sistemi LTI 1 e 2 , alternativamente in tempo


continuo o in tempo discreto, siano descritti nel rapporto ingresso-uscita da
(p)
(p)
e G2 (p) = nd22(p)
in cui tutte le eventuali cancellazioni
f.d.t. G1 (p) = nd11(p)
siano state effettuate, cosicche i polinomi ni (p) e di (p) sono primi tra loro
per i = 1, 2. Sia inoltre disponibile per entrambe una realizzazione in forma
minima, ovvero


IDx1 = A1 x1 + B1 u
IDx2 = A2 x2 + B2 u
,
.
(7.1)
y 1 = C 1 x 1 + D1 u
y2 = C2 x2 D2 u,
Per quanto detto, questi sistemi sono siano sia raggiungibili che osservabili.
Ci chiediamo se tali propriet`a possono essere alterate quando i sistemi siano
connessi tra loro, in partioclare secondo le tre modalit`a fondamentali della
cosiddetta algebra dei blocchi, cio`e in parallelo, in serie, o in retroazione.

7.5.1

Connessione in Parallelo

Possiamo facilmente costruire una realizzazione del sistema risultante dalla connessione in parallelo dei sistemi 1 e 2 , costruendo un nuovo stato
aggregato xT = (xT1 , xT2 ) e ponendo u1 = u2 = u e y = y1 + y2 in (7.1):




B1
A1 0
u
x +
ID
x=
B2
(7.2)
 0 A2 
y = C1 C2 x + (D1 + D2 )u

Proposizione Il sistema parallelo (7.2) `e raggiungibile e osservabile se


e soltanto se 1 e 2 non hanno modi comuni.

E OSSERVABILITA
DI SISTEMI CONNESSI129
7.5. RAGGIUNGIBILITA

Figura 7.1: Connessione in parallelo di due sistemi LTI.

Consideriamo la rappresentazione con f.d.t. della connessione. Si ha


G(p) =

n1 (p)d2 (p) + n2 (p)d1 (p)


n1 (p) n2 (p)
+
=
d1 (p) d2 (p)
d1 (p)d2 (p)

si pu`o avere quindi una cancellazione se e solo se d1 (p) e d2 (p) hanno una
radice in comune, cio`e se i due sistemi hanno un polo in comune. In questo
caso, la f.d.t. risultante pu`o essere semplificata: pertanto, la rappresentazione
in forma di stato sopra ottenuta, che usa tutti gli stati di 1 e 2 , non risulta
pi`
u minima: si deve essere persa almeno una delle propriet`a strutturali di
raggiungibilit`a e/o di osservabilit`a.
` possibile stabilire che in realt`a la cancellazione polo/zero che interviene
E
per due sistemi in parallelo con un polo a comune implica che lautovalore
corrispondente perde entrambe le propriet`a.
Infatti, per il lemma PBH la matrice
(sI A|B) =

sI1 A1
0
0
sI2 A2

B1
B2

(7.3)

valutata per s pari allautovalore in comune, non pu`o aver rango pieno (il
rango del blocco a sinistra diminuisce di due, mentre il blocco a destra `e una
singola colonna). In modo del tutto analogo si procede per il caso duale della
osservabilit`a:


sI A
C

sI1 A1
0

0
sI2 A2
C1
C2

(7.4)

Una dimostrazione alternativa dello stesso risultato si pu`o dare in termini


degli schemi di fig. 7.2. Nello schema superiore, il polo a comune `e fattorizzato a sinistra. Guardando alla realizzazione del sottosistema racchiuso in

130

CAPITOLO 7. REALIZZAZIONI E CONNESSIONI DI SISTEMI

Figura 7.2: Schemi equivalenti di connessione inparalleo di sistemi con un


polo a comune

tratteggio, si ha


  



1
x1
p1 0
IDx1
u
+
=
1
x2
0 p1
IDx2


 

x1
y1
1 0
=
x2
0 1
y2

per il quale la matrice di raggiungibilit`a vale




1 p1
R=
1 p1
il cui rango `e uno, dimostrando cos` che un autovalore in p1 `e esterno al
sottospazio di raggiungibilit`a.
Nello schema inferiore, invece, il polo a comune `e fattorizzato a destra, e
la realizzazione del sottosistema racchiuso in tratteggio vale
 

 



u1
x1
1 0
IDx1
p1 0
+
=
0 1
u2
0 p1
x2
IDx2


 

 x1
y
1 1
=
x2

per il quale la matrice di osservabilit`a vale




1 1
O=
p1 p1

E OSSERVABILITA
DI SISTEMI CONNESSI131
7.5. RAGGIUNGIBILITA

Figura 7.3: Connessione in serie di due sistemi LTI.

Si dimostra cos` che lautovalore in p1 `e anche interno al sottospazio di


inosservabilit`a.

7.5.2

Connessione in Serie

Nella connessione in serie luscita del primo sistema costituisce lingresso del
secondo. Ponendo u2 = y1 , u = u1 e y = y2 in (7.1), si ha




B1
A1
0
u
x +
ID
x=
B 2 D1
B2 C1 A2 
(7.5)
y = D2 C1 C2 x + D2 D1 u

Proposizione Il sistema serie (7.5)`e raggiungibile se e solo se 1 non


ha zeri coincidenti con poli di 2 ; osservabile se e solo se 1 non ha poli
coincidenti con zeri di 2 .
Nella rappresentazione con f.d.t. della connessione in serie, si ha
G(p) =

n1 (p) n2 (p)
n1 (p)n2 (p)
=
d1 (p) d2 (p)
d1 (p)d2 (p)

si pu`o avere quindi una cancellazione se e solo se n1 (p) e d2 (p) hanno una
radice in comune, ovvero se la hanno n2 (p) e d1 (p). In entrambe i casi, la
f.d.t. risultante pu`o essere semplificata: pertanto, unaa rappresentazione in
forma di stato che usi tutti gli stati di 1 e 2 , non risulta pi`
u minima.
Il fatto che nel primo caso si perda la raggiungibilit`a dellautovalore corrispondente al polo cancellato in d2 (p) `e piuttosto intuitivo: infatti, il rapporto
tra gli stati del sistema 2 e luscita non viene alterato in alcun modo dalla
connessione, e pertanto lautovalore corrispondente al polo cancellato non
pu`o aver perso la sua osservabilit`a.
Viceversa, che nel secondo caso si perda la osservabilit`a dellautovalore
corrispondente al polo cancellato in d1 (p) discende dal fatto che il rapporto

132

CAPITOLO 7. REALIZZAZIONI E CONNESSIONI DI SISTEMI

tra gli ingressi e gli stati del sistema 1 non viene alterato dalla connessione,
e pertanto lautovalore corrispondente al polo cancellato non pu`o aver perso
la sua raggiungibilit`a.

7.5.3

Connessione in Retroazione

Nella connessione in retroazione (fig. 7.4) lingresso u2 del sistema 2 in


` utile
retroazione coincide con luscita y1 del sistema 1 in catena diretta. E

Figura 7.4: Connessione in retroazione di due sistemi LTI.


considerare in questo schema anche la presenza di un ulteriore ingresso di
riferimento r(t), cui luscita y2 del sistema 2 in retroazione si sottrae a
formare il segnale di errore e che entra nel sistema 1 in catena diretta (si
noti che la scelta dei segni al nodo sommatore e puramente convenzionale).
Ponendo quindi u2 = y1 e u1 = e = r y2 in (7.1), si ottiene

IDx1 = A1 x1 B1 C2 x2 + B1 r B1 D2 y
IDx2 = A2 x2 + B2 y
Per quanto riguarda luscita, si pu`o poi scrivere
y = C 1 x 1 D1 C 2 x 2 + D1 r D1 D2 y
ovvero
(1 + D1 D2 )y = C1 x1 D1 C2 x2 + D1 r
da cui risulta che il sistema `e ben posto solo se D1 D2 6= 1. In tale ipotesi
si ha



B1 C1 D2
B1 D1 D2 
1 C2 D1 D2
A1 1+D
B1 C2 + B1+D
B1 1+D
D2
D2
1
1
1 D2
ID
x=
r
x +
B2 C2 D1
1
B
D
A2 1+D
B2 C1 1+D11 D2
2
1
1+D1 D2
1 D2

D1
r
y = C1 1+D11 D2 D1 C2 1+D11 D2 x + 1+D
1 D2
(7.6)

E OSSERVABILITA
DI SISTEMI CONNESSI133
7.5. RAGGIUNGIBILITA
La situazione sinora descritta in massima generalit`a, che ammette che
entrambe i sistemi siano proprii ma non strettamente (abbiano cio`e grado
relativo nullo) creando cosi un cosidetto anello algebrico, `e comunque
assai rara anche quando ammissibile. Il caso di gran lunga pi`
u frequente nelle
applicazioni `e quello in cui sia il sistema in catena diretta sia strettamente
proprio (D1 = 0), per cui si ha




B1
A1 B1 C1 D2 B1 C2
r
x +
ID
x=
0
B2 C1
A2

y = C1 0 x .
Se il sistema in catena diretta non `e strettamente proprio, il sistema in
retroazione viene spesso scelto in modo da esserlo (D2 = 0), per cui si ha




B1
A1
B1 C2
r
x +
ID
x=
B 2 D1
B2 C1 A2 B2 C2 D1

y = C1 D1 C2 x + D1 r .

Proposizione Il sistema retroazionato (7.6) `e raggiungibile e osservabile se e solo se 1 non ha zeri coincidenti con poli di 2 . Non `e completamente raggiungibile ne osservabile altrimenti.

Figura 7.5: Sistemi equivalenti a quello nella figura precedente.

Nella rappresentazione con f.d.t. della connessione in serie, si ha


G(p) =

n1 (p)d2 (p)
.
d1 (p)d2 (p) n1 (p)n2 (p)

134

CAPITOLO 7. REALIZZAZIONI E CONNESSIONI DI SISTEMI

Si pu`o avere quindi una cancellazione se e solo se n1 (p) e d2 (p) hanno una
radice in comune. Il fatto che lautovalore corrispondente al polo cancellato
divenga sia irraggiungibile che inosservabile, pu`o essere spiegata come segue.
Si consideri lo schema equivalente a quello di figura (7.4) riportato in alto
nella figura (7.5): la cancellazione di un polo in d2 comporta la perdita
di osservabilit`a del sistema-serie in catena diretta. Sappiamo che peraltro
la retroazione della uscita non altera ne la raggiungibilit`a ne losservabilit`a
di un sistema, quindi lautovalore corrispondendte al polo cancellato resta
inosservabile anche nel sistema retroazionato.
Si consideri adesso lulteriore schema equivalente riportato nella stessa
figura in basso. La cancellazione di un polo in d2 comporta questa volta la
perdita di raggiungibilit`a del sistema-serie in catena diretta. Per i motivi
sopra detti, anche il sistema in retroazione resta irraggiungibile.

Capitolo 8
Regolazione dei sistemi
Si `e visto in passato che la retroazione degli stati sugli ingressi u(t) =
Kx(t) + v(t) `e in grado di allocare arbitrariamente tutti gli autovalori interni al sottospazio raggiungibile. Difficilmente per`o nei casi pratici lo stato
`e noto direttamente: linformazione sullo stato disponibile al progettista del
sistema di controllo `e infatti contenuta nelle uscite, e in particolare in quelle
di misura. Queste, in numero di p in un sistema MIMO, sono in generale insufficienti a determinare lo stato (che ha dimensione n) direttamente,
essendo in ogni caso pratico p < n.
Lutilizzo di una retroazione statica delle sole uscite per il controllo, cio`e
la sintesi di un controllore del tipo u(t) = K y(t) + v(t), pu`o essere talvolta
usata utilmente. Nel caso generale, per`o, i gradi di libert`a del progetto (che
sono gli elementi della matrice K , in numero di mp) sono insufficienti ad
ottenere comportamenti adeguati alle specifiche. Nel caso SISO, ad esempio,
la retroazione delle uscite `e specificata dalla scelta di un solo scalare: al
variare di K, la posizione di ciascun autovalore (del sottosistema osservabile
e raggiungibile) descrive una variet`a unidimensionale, cio`e una curva nel
piano complesso, detta luogo delle radici.
Gli autovalori esterni al sottospazio raggiungibile e interni a quello inosservabile sono invece fissi. I primi sono fissi anche per retroazione dello stato,
di cui la retroazione delle uscite `e solo un caso particolare (K = K C).
Per mostrare che anche gli autovalori del sottosistema inosservabile sono
fissi con la retroazione delle uscite, basta applicare la reazione u = K Cx al
sistema nella base canonica di Kalman, e osservare che in quella base vale

BRO K CRO

BK C =

0
0
135

0
0
0
0

0
0

0
0

0
0

136

CAPITOLO 8. REGOLAZIONE DEI SISTEMI

che, sommata alla matrice A, ne lascia inalterata la struttura triangolare a blocchi, e ne altera unicamente gli autovalori corrispondenti al blocco
ARO + BRO K CRO .
Per ovviare alle limitazioni della retroazione statica delle uscite, si pu`o
ricorrere al fatto che, come si `e visto, se il sistema `e osservabile `e possibile
ottenere dalle uscite una stima dello stato iniziale, e da questa, per soluzione
esplicita del sistema, lo stato attuale al tempo t, che `e quanto serve per
calcolare la retroazione.
Questo procedimento non `e per`o spesso praticabile direttamente per due
principali motivi:
1. per la complicazione del calcolo numerico necessario a ottenere la stima
dello stato iniziale;
2. per la sensibilit`a che la ricostruzione dello stato finale a partire da quello
iniziale e dalla conoscenza degli ingressi mostra agli errori di stima dello
stato iniziale, tanto maggiori quanto pi`
u `e lungo il tempo per il quale
si deve integrare il modello.

8.1

Osservatore asintotico dello stato (o di


Luenberger)

Si procede dunque con un altro approccio, quello di costruire un altro sistema


dinamico i cui stati replichino, quanto meglio possibile, quelli del sistema
originale. Questo sistema pu`o essere costruito artificialmente, ad esempio
con un circuito elettronico analogico o, come nella grande maggioranza dei
casi, in un computer. I nuovi stati saranno accessibili alla misura e quindi
utilizzabili nella retroazione. Si consideri ad esempio il problema di stimare
lo stato x di un sistema LTI con matrici (A, B, C, D) mediante il sistema
ID
x = A
x + Bu
Evidentemente, se lo stato iniziale del sistema da osservare fosse noto esattamente, lo stato x dellosservatore sarebbe una copia esatta dello stato ignoto
x. Altrimenti, lerrore di stima, rappresentato dal vettore e = x x, `e
soggetto ad una evoluzione dinamica data da
IDe = Ae, e(0) = x(0) x(0)
quindi completamente fissata dalla dinamica del sistema da osservare, cosa
che in generale non `e accettabile.

8.1. OSSERVATORE ASINTOTICO DELLO STATO (O DI LUENBERGER) 137


La dinamica dellerrore di stima pu`o essere modificata utilizzando la conoscenza delle uscite, che non `e stata ancora sfruttata. In particolare, si pu`o
modificare la dinamica dello stato stimato sommandovi un termine proporzionale alla differenza tra luscita effettiva del sistema e quella che si ottiene
dallo stato stimato:
ID
x = A
x + Bu L(y C x)
La matrice L IRnp si dice di iniezione delle uscite sugli stati. La dinamica
dellerrore `e in questo caso data da
IDe = Ae + L(y C x) = (A + LC)e
e quindi `e influenzata dalla scelta di L.
In che misura si possa riuscire a modificare la posizione degli autovalori
della matrice A mediante iniezione delle uscite dipende dalla propriet`a di
osservabilit`a della coppia (A, C). Infatti, avendosi
det(pI A LC) = det(pI A LC)T = det(pI AT C T LT )
i coefficienti del polinomio caratteristico di (A + LC) possono essere scelti
a piacimento se (AT , C T ) `e raggiungibile, ovvero (per dualit`a), se (A, C) `e
osservabile.
Quando possibile, gli autovalori di (A + LC) sono allocati ad arbitrio
semplicemente seguendo la procedura di allocazione degli autovalori per un
sistema (AT , C T ) e ponendo L = K T . Se invece esiste un sottosistema non
osservabile, i suoi autovalori non sono alterati dalla iniezione delle uscite,
restando fissi. La possibilit`a di ottenere quindi un osservatore i cui stati
convergano asintoticamente a quelli da stimare dipende dalla stabilit`a degli
autovalori interni al sottospazio di inosservabilit`a. Un sistema il cui sottosistema inosservabile `e asintoticamente stabile si dice detettabile. Nel caso
TD, se gli autovalori del sottosistema inosservabile sono tutti in zero, `e possibile costruire un osservatore deadbeat, per il quale cio`e lerrore di stima
si annulla in un numero finito di passi (minore o uguale alla dimensione del
sistema), a partire da qualsiasi errore iniziale.
La costruzione di un osservatore come quello sopra descritto, detto anche
osservatore identit`
a, non `e lunica soluzione possibile. In particolare, si consideri che, disponendo direttamente delle p combinazioni lineari degli stati
che formano le uscite, `e in effetti necessario solamente stimare altre n p
combinazioni indipendenti da queste per poter ottenere tutti gli stati. Un
tale osservatore si dice osservatore ridotto.

138

CAPITOLO 8. REGOLAZIONE DEI SISTEMI

8.2

Sintesi del regolatore

Avendo da un osservatore una stima x dello stato presente, che asintoticamente converge al valore vero, si pu`o pensare di utilizzarla per il calcolo della
retroazione dello stato al posto dello stato inaccessibile x. Si realizza in questo modo un sistema a 2n stati (se si usa un osservatore identit`a), con la
struttura (nel caso strettamente proprio)
IDx
ID
x
y
u

=
=
=
=

Ax + Bu
A
x + Bu L(y C x)
Cx
K x + v

che `e rappresentata in fig. 8.1


V

DX

X
1
s

B* u
Step

Y
C* u
C

Scope

A* u
A
K

K*u
L* u
B* u

DXs

1
s

Xs

G
C* u
C

A* u
A

Figura 8.1: Schema di montaggio di un regolatore costituito da un osservatore


identit`a e da una retroazione degli stati stimati.

Sostituendo le espressioni del controllo e della uscita, e calcolando la dinamica dellerrore IDe = IDx ID
x, si ha
IDx = Ax + BK x + Bv = (A + BK)x BKe + Bv
ID
x = (A + BK + LC)
x LCx + Bv
IDe = (A + LC)e

8.2. SINTESI DEL REGOLATORE

139

La dinamica del sistema completo pu`o essere scritta quindi in forma di


stato aggregato:



  

IDx
A + BK BK
x
B
=
+
v
IDe
0  A+ LC
e
0
(8.1)

 x
C 0
y
=
e
Gli autovalori del sistema con regolatore sono dati dalle radici del polinomio caratteristico


pI A BK
BK
det
=
0
pI A LC
= det (pI A BK) det (pI A LC)

quindi sono lunione degli autovalori del sistema regolato (nelle posizioni allocate dalla scelta di K) e degli autovalori dellosservatore (nelle posizioni
allocate dalla scelta di L): questo risultato, per nulla ovvio a priori, va sotto
il nome di propriet`
a di separazione, e garantisce che le allocazioni dei poli
dellosservatore e del sistema retroazionato possono essere fatte indipendentemente luna dallaltra. Ci`o vale anche nel caso in cui si usino osservatori
ridotti anziche identit`a.
Il sistema globale (sistema originale + regolatore) pu`o essere dunque reso
asintoticamente stabile se la coppia (A, B) `e stabilizzabile, e la coppia (A, C)
`e detettabile. In TD, si pu`o costruire un regolatore deadbeat che porti lo
stato a zero in un numero finito di passi se e solo se tutti gli autovalori esterni
al sottospazio di raggiungibilit`a, ed interni al sottospazio di inosservabilit`a,
sono nulli.
La funzione di trasferimento di questo sistema con 2n stati `e data da
G(p) =

= C

(pI A BK)1

0
0
(pI A LC)1
= C (pI A BK)1 B




B
0

quindi coincide con quella ottenuta dalla retroazione degli stati effettivi: lutilizzo degli stati stimati non ha effetti da questo punto di vista. Gli autovalori relativi allerrore di osservazione sono irraggiungibili dallingresso (come
evidente dalla espressione (8.1)).
Osservazione. Dalla discussione precedente, risulta che la dinamica assegnata allerrore di osservazione non partecipa al rapporto ingresso/uscita
del sistema complessivo. Questo significa che la risposta forzata, ad esempio al gradino, di due sistemi identici ma regolati con differente scelta della

140

CAPITOLO 8. REGOLAZIONE DEI SISTEMI

matrice di iniezione delle uscite L, `e uguale. Naturalmente, altrettanto non


`e vero per la evoluzione libera, che dipende dalle condizioni iniziali ed in
particolare da quelle dellerrore di stima, che non `e ragionevole supporre nulle in pratica. Una L che renda lenta la convergenza della stima si riflette
in un lungo transitorio, che degrada fortemente la prestazione del sistema
complessivo. Viceversa, per rendere tale dinamica molto veloce `e necessario
usare valori elevati nella matrice L, il che comporta grandi sovraelongazioni
nella risposta transitoria, e una forte sensibilit`a ai possibili disturbi di misura presenti nelle uscite y, che devono essere misurate da sensori reali. Ne
consegue in generale che la scelta della dinamica dellosservatore `e da farsi
con attenzione alla presenza di rumore sulle misure di uscita, come si vedr`a
pi`
u avanti nel corso.

8.2.1

Esempio

Si consideri la f.d.t. tra la tensione di armatura e la posizione dellasse


meccanico di un comune motore in corrente continua, data da
G(s) =

1
Km
2
s (Js + B)(La s + Ra ) + Km

con Km , J, B, Ra , La rispettivamente la costante magnetica del motore, il


momento di inerzia dellasse, il coeff. di attrito viscoso, la resistenza e la
induttanza di armatura. Si ponga per semplicit`a
G(s) =

K
s3 + s2 + s

Possiamo pensare di costruire il regolatore a partire da una retroazione degli stati di una qualsiasi realizzazione raggiungibile di G(s), che inizialmente
possiamo supporre noti, grazie al principio di separazione.
La scelta della matrice di retroazione K `e fatta semplicemente nel caso
che questa realizzazione sia in forma canonica di controllo, cio`e
x c = Ac xc + Bc u
y = C c x c + Dc u
con

0 1
0
1 ;
Ac = 0 0
0  
Cc = K 0 0 ;

0
Bc = 0 ;
1
D = [0].

8.2. SINTESI DEL REGOLATORE

141

In tal caso infatti, se si desidera allocare gli autovalori ad esempio nelle


radici del polinomio pc (s) = s3 + ac2 s2 + ac1 s + ac0 , baster`a porre ac0 = k1 ,
ac1 = + k2 , e ac2 = + k3 .
Dobbiamo ora calcolare la matrice di iniezione delle uscite per un osservatore dello stato xc tale che gli autovalori propri della dinamica dellerrore
di stima ec = xc xc , che vale
e c = (Ac + LCc )ec
siano allocati dove si desidera. Si noti che questo `e possibile perch`e la realizzazione data `e certamente anche osservabile: infatti, `e una realizzazione
minima (usa tre stati per una f.d.t. coprima di ordine 3).
Una tipica scelta per la posizione di questi autovalori `e quella di averli
circa 10 volte pi`
u veloci di quelli della dinamica imposta al sistema (con la
precedente retroazione). Si desidera dunque scegliere L tale che il polinomio caratteristico di Ac + LCc coincida con uno desiderato, che poniamo sia
po (s) = s3 + ao2 s2 + ao1 s + ao0 .
Per ottenere questo scopo possiamo procedere direttamente, scrivendo
il polinomio caratteristico di Ac + LCc in funzione dei parametri incogniti
in L, calcolando il polinomio caratteristico e imponendo leguaglianza dei
coefficienti. Questa tecnica `e in genere conveniente per sistemi di dimensione
piccola (2 o 3).
Pi`
u in generale, conviene procedere usando un cambiamento di coordinate
nello spazio di stato, che posti il sistema in forma canonica di osservazione.
1
Poniamo dunque xc = Tco xo e calcoliamo Tco tale che (Tco
Ac Tco = Ao ,
Cc Tco = Co ) siano in forma canonica di osservazione.
Sappiamo da quanto visto in precedenza che possiamo ottenere la matrice
di cambiamento di coordinate dalla relazione tra le matrici di osservabilit`a
1
nelle due basi: infatti Oo = Oc Tco Tco
= O1
o Oc , e, ricordando che

a1 a2 an1 1
a2 a3
1
0

a3 a4

0
0
O1
=

o
.. .. . .
..
..
. .
.
.
.
1 0
0
0
possiamo facilmente ottenere nel nostro

=
O1
o
1

caso

1
1 0
0 0

142

CAPITOLO 8. REGOLAZIONE DEI SISTEMI

Inoltre, direttamente dalla definizione di matrice di osservabilit`a per il


caso specifico, Oc = KI.
Nelle coordinate della forma canonica di osservazione, il calcolo di Lo `e
immediato: baster`a porre ao0 = Lo1 , ao1 = + Lo2 , e ao2 = + Lo3 .
Questa iniezione delle uscite sugli stati xo assolve il compito: la dinamica
e o = (Ao + Lo Co )eo
ha gli autovalori assegnati. Nello schema da realizzare, comunque, si tratta
di iniettare le uscite sulla dinamica degli stati xc , che sono quelli usati per la
retroazione. Si ha in questo caso
1
e c = Tco e o = Tco (Ao + Lo Co )Tco
ec = Ac + Tco Lo Cc ec

il che significa che la matrice di iniezione cercata, nelle coordinate scelte per
la realizzazione del regolatore, `e data da

Lo1
0 0
1
Lo2
L = Tco Lo = 0 1
2
Lo3
1

Lo3

Lo2 Lo3
2
Lo1 Lo2 + ( )Lo3

8.3

Retroazione delle uscite

Consideriamo il problema di progettare un controllore per un dato sistema,


rappresentato nello spazio di stato dalle matrici (A, B, C, D), ovvero dalla
sua f.d.t. G(p) = C(pI A)1 B + D. Si supporr`a per semplicit`a che il
sistema sia strettamente proprio, cio`e D = 0.
Abbiamo visto in passato per i sistemi SISO che una reazione statica delle
uscite (cio`e un controllo calcolato come funzione lineare dellerrore tra uscita
e riferimento u = K(v y)) offre possibilit`a alquanto limitate: gli autovalori del sistema in anello chiuso infatti si muoveranno esclusivamente lungo il
luogo delle radici corrispondente. Daltronde, lutilizzo di un regolatore (osservatore asintotico e retroazione dello stato stimato) permette di allocare
tutti gli autovalori raggiungibili e osservabili (ovvero, tutti i poli della f.d.t.
ridotta ai minimi termini).
` naturale chiedersi se una retroazione pi`
E
u complessa delle uscite pu`o
essere in grado di offrire gli stessi risultati. In particolare, `e opportuno considerare la classe delle leggi di retroazione lineari dinamiche, ovvero quelle in
cui il controllo `e calcolato come u(p) = C(p)(v(p) y(p)) (vedi fig. 8.2)

8.3. RETROAZIONE DELLE USCITE


v

Reference
Generator

143

u
C

Controller

Plant

Figura 8.2: Montaggio del regolatore in retroazione in catena diretta

Il significato di una tale retroazione `e che il progettista del sistema di


regolazione crea un vero e proprio sistema dinamico per il quale la uscita
del sistema da regolare e il riferimento fungono da ingresso, e la cui uscita
costituisce lingresso al sistema originale. Il nuovo controllore con f.d.t.
C(p) pu`o essere pensato come una realizzazione nello spazio di stato
(AC , BC , CC , DC ).
Le dimensioni delle matrici sono in parte dettate dal problema: BC accetta
tanti ingressi quante sono le uscite di misura di G(p) (ed i riferimenti relativi
v), CC d`a luogo a tante uscite regolate quanti sono gli ingressi di G(p).
La scelta del numero di stati (cio`e dellordine della C(p)) `e invece compito del progettista. In questa scelta, si dovr`a trovare il miglior compromesso
tra la versatilit`a del progetto (ordine minore del controllore implica minor
numero di specifiche raggiungibili) e complicazione del controllore (se implementato analogicamente, un controllore di ordine elevato sar`a di pi`
u difficile
realizzazione e pi`
u sensibile alle tolleranze dei componenti; se numericamente,
lordine elevato allunga i tempi di calcolo).
Per dare alcune indicazioni di massima sui criteri della scelta dellordine
del controllore, si consideri da un lato che i controllori di ordine zero altro
non sono che retroazioni statiche delluscita (AC = BC = CC = 0; DC = K),
di cui si conoscono le limitazioni. Daltro lato, se al controllore `e concesso
ordine n pari a quello del sistema da regolare, si pu`o ottenere da esso la stessa
flessibilit`a di scelta che si ha da un regolatore composto da osservatore identit`a e retroazione degli stati stimati. Per dimostrarlo, si scrivano le equazioni
di stato del sistema da regolare (strettamente proprio per semplicit`a) e del
controllore (con stato xC ) collegati in retroazione negativa secondo lo schema
di fig. 8.2. Si ha
IDx = Ax + ByC
IDxC = AC xC + BC (v y)
y
= Cx
yC = CC xC + DC (v y)

144

CAPITOLO 8. REGOLAZIONE DEI SISTEMI

ovvero, esplicitando e ponendo in forma matriciale,



 

 

BDC
x
A BDC C BCC
IDx
v
+
=
BC
xC
BC C
AC
IDxC
Si considerino daltronde ancora le equazioni del regolatore negli stati
(x, x) del sistema e dellosservatore, come ottenute in precedenza:
IDx = Ax + BK x + Bv
ID
x = (A + BK + LC)
x LCx + Bv
quindi

IDx
ID
x

A
BK
LC A + BK + LC



x
x

B
B

Si osserva che ponendo DC = 0, CC = K, BC = L, AC = A + BK + LC,


la matrice dinamica dei sistemi coincide. Pertanto un controllore a n stati
con f.d.t.
C(p) = K (pI A BK LC)1 L
(8.2)

posto in retroazione come in fig. 8.2 ottiene la identica allocazione dei poli
ottenuta dal regolatore standard.
Si noti esplicitamente che questo controllore pu`o avere sia poli che zeri
a parte reale positiva, non potendosi dire nulla a priori sulla posizione degli
autovalori di A+BK+LC. In taluni casi, quando il sistema da stabilizzare ha
esso stesso singolarit`a a parte reale positiva, un controllore di per se instabile
`e strettamente necessario (pu`o essere utile qui ricordare alcuni risultati di
stabilizzazione sul luogo delle radici).
Introducendo la variabile x = x xC , le equazioni del sistema con questo
controllore sono

  
 

0
x
A + BK BK
Dx
v.
(8.3)
+
=
L
x
0
A + LC
D
x
La f.d.t. in anello chiuso tra v e y risulta quindi
G (p) =

= C

= CM L,

(pI A BK)1
M
0
(pI A LC)1



0
L

dove M = (pI A BK)1 BK (pI A LC)1 . Con semplici passaggi si


ha in definitiva
G (p) = G(p)G0 (p)

8.3. RETROAZIONE DELLE USCITE

145

dove
G0 (p) = K(pI A LC)1 L,
da cui si vede che la f.d.t. ottenuta dal montaggio con osservatore completo
di fig. 8.1 `e alterata nel montaggio di fig. 8.2 per aggiunta in serie di un
termine con i poli (tipicamente in alta frequenza) scelti per losservatore.
Le differenze tra il controllore (8.2) ed il regolatore standard sono quindi
gli autovalori relativi alla dinamica di x = x xC non sono pi`
u in
generale irraggiungibili dallingresso v (la forma (8.3) non `e standard
di raggiungibilit`a). Di conseguenza, lo stato del controllore xC non
insegue asintoticamente lo stato x, essendo la dinamica della differenza
x eccitata dallingresso v;
nella f.d.t. in anello chiuso dellintero sistema compaiono anche gli
autovalori dellosservatore (cio`e di A + LC).
Sarebbe possibile eliminare la presenza dei poli dellosservatore con un
precompensatore F (p) che realizzasse una f.d.t pari alla inversa di Go (p), come mostrato in fig. 8.3 Questo precompensatore non `e fisicamente realizzabile
V

Y
fsys

rsys

sys

PRECOMPENSATORE

CONTROLLORE

IMPIANTO

Figura 8.3:
Montaggio del compensatore in catena diretta con
precompensatore.

perche Go (p) `e strettamente causale. Posto Go (p) =


usare un precompensatore del tipo
F (p) =

no (p)
,
do (p)

si pu`o comunque

do (p) 1
,
no (p) df (p)

dove df1(p) ha poli stabili convergenti molto rapidamente a zero, e guadagno


statico pari a G1o . Si osservi che F (p) ha zeri stabili per costruzione, ma pu`o
essere instabile. Si ricorda anche che luso di precompensatori `e soggetto
ad una elevata sensibilit`a alle variazioni parametriche. Un compensatore di
questo tipo si dice basato sul regolatore.

146

8.3.1

CAPITOLO 8. REGOLAZIONE DEI SISTEMI

Progetto del Regolatore e Specifiche

Il progetto di un compensatore basato sul regolatore consiste fondamentalmente nella scelta delle due matrici di guadagno K e L. Questa scelta,
direttamente legata alla posizione dei poli dellanello chiuso, deve venir fatta
sulla base delle specifiche imposte al funzionamento del sistema.
Lallocazione dei poli dellanello chiuso pu`o essere spesso fatta in modo da
avere un comportamento a uno o due poli dominanti, e quindi le specifiche di
rapidit`a di risposta e di sovraelongazione possono esssere implementate come
vincoli sulle regioni del piano complesso in cui piazzare i poli stessi. Non `e
questo il caso per sistemi complessi, o con zeri in prossimit`a della origine, o
peggio a fase non minima. In questi casi, le approssimazioni a poli dominanti non valgono ed `e necessario procedere con tecniche di progettazione pi`
u
sofisticate, quali quelle di controllo ottimo (ad es. LQR/LQG) che verranno
viste in corsi pi`
u avanzati.
` invece opportuno considerare qui una tecnica per ottenere che il sistema
E
in anello chiuso insegua riferimenti (ovvero reietti disturbi) costanti con errore
nullo a regime. Se il sistema non ha di per se un polo nellorigine, questo
dovr`a essere presente nel controllore.
Per ottenere questo, una semplice procedura consiste nel predisporre un
integratore in serie allimpianto, come illustrato in fig. 8.4, e nel calcolare un
compensatore (di dimensione n + 1) che allochi dove desiderato gli autovalori
in anello chiuso del sistema esteso dato da
x = Ax + Bu
u = w
y = Cx
ovvero

x
u

A B
0 0



x
u

0
1

w.

Si osservi che il sistema esteso rimane completamente raggiungibile ed osservabile se tale `e il sistema originale. Una volta progettate le matrici di
retroazione e iniezione per questo sistema esteso, il polo nellorigine sar`a poi
realizzato nel compensatore stesso (che diviene quindi di dimensione n + 2).

8.3.2

Alcune varianti di montaggio dei controllori.

Un compensatore basato sul regolatore pu`o essere montato alternativamente nella catena di retroazione, come mostrato in fig. 8.5, dove si considera
anche laggiunta di un precompensatore F (p). Le equazioni del sistema in

8.3. RETROAZIONE DELLE USCITE


v

w
rsys

Reference
Generator

Controller

147

u 1
s

Integrator

y
G
Plant

Figura 8.4: Montaggio di un compensatore basato su regolatore per rispondere ad una specifica di errore nullo a regime per ingresso a gradino.

V
Reference
Generator

fsys

sys

PRECOMPENSATORE

IMPIANTO

Scope

rsys
CONTROLLORE

Figura 8.5: Montaggio di un controllore basato su regolatore con azione


compensatrice in azione diretta.

retroazione (senza precompensatore) divengono in questo caso


IDx
IDxC
y
yC
da cui si ha

=
=
=
=

Ax ByC + Br
AC xC + BC y
Cx
C C x C + DC y


G (p) = G(p) 1 + K(pI A LC)1 B ,

da cui si vede che la f.d.t. G(p) ottenuta dal montaggio con osservatore
completo di fig. 8.1 `e alterata per aggiunta in parallelo di un termine con i
poli (tipicamente in alta frequenza) scelti per losservatore.
Il precompensatore permette di recuperare esattamente la f.d.t. G(p)
complessiva del sistema con osservatore, se si pone
F (p) = 1 + K (pI A LC)1 B.
Si noti per`o che questo montaggio richiede in effetti la realizzazione di un
sistema di controllo di complessit`a maggiore (con un numero di stati doppi). Inoltre, se il controllore C(p) che risulta dal progetto `e instabile, anche
F (p) lo `e: trovandosi questa, a differenza di C(p), in anello aperto, gli stati di

148

CAPITOLO 8. REGOLAZIONE DEI SISTEMI

ogni sua realizzazione divergono, il che rende questo montaggio inutilizzabile.


Un diverso modo di montare un controllore quando le specifiche statiche richiedano la presenza di un polo nellorigine in anello aperto `e quello
riportato in fig. 8.6. In questo caso, il progetto `e lievemente diverso, ma pu`o
Z
V

1
s
Integrator

K
Gain

sys

LTI System1
rsys
LTI System

Figura 8.6: Montaggio alternativo di un controllore con specifica statica di


errore nullo nellinseguimento del gradino

essere ricondotto alle tecniche usuali se si considera un sistema complessivo


di n + 1 stati (lo stato x aggregato al nuovo stato scalare z dellintegratore)
con n + 1 guadagni (quelli della matrice di retroazione K pi`
u quello scalare
Kz sullanello diretto), ovvero
x =
z =

Ax + Bu
v Cx
 
 x

K Kz
u =
z

Si noti che non vi `e bisogno di osservare lo stato w, che `e noto per costruzione.

8.3.3

Esempio

Consideriamo il sistema TC
G(s) =

s2 + 2s + 3
s3 3s2 2s 1

Desideriamo allocare gli autovalori del sistema in (1, 2, 3), e quelli dellosservatore in (5, 10, 15) Usando ad esempio il comando place di Matlab,
si trovano la matrice di retroazione `e K = [4.5, 3.25, 1.75] e la matrice

8.4. SINTESI ANALITICA

149

di iniezione L = [247, 195, 9.34]T (nelle coordinate di una realizzazione in


forma canonica di controllo).
Applicando queste matrici in uno schema con osservatore e retroazione
dello stato, si ottiene la f.d.t. in anello chiuso
G(s) =

(s2 + 2s + 3)(s + 5)(s + 10)(s + 15)


(s2 + 2s + 3)
=
(s + 5)(s + 10)(s + 15)(s + 1)(s + 2)(s + 3)
(s + 1)(s + 2)(s + 3)

da cui si vede come i tre modi dellosservatore sono cancellati in quanto non
raggiungibili.
Applicando invece il controllore in retroazione sopra visto, la cui espressione risulta
C(s) = K(sI A BK LC)1 L =

493.9847(s + 0.77)(s + 3.804)


(s + 36.38)(s + 3.781)(s 1.159)

(si noti che il controllore `e instabile), si ottiene


Gc (s) =

8.4

493.9847(s + 3.804)(s + 0.77)(s2 + 2s + 3)


(s + 15)(s + 10)(s + 5)(s + 3)(s + 2)(s + 1)

Sintesi analitica

Dalle considerazioni svolte sinora sulla retroazione delle uscite e sulle propriet`a dei sistemi connessi, posiamo trarre alcune importanti conclusioni sulle
possibilit`a offerte dalla scelta dei compensatori dinamici per sistemi LTI.
Con riferimento alla figura (8.7), si consideri il compensatore C(p) =
nc (p)
in catena diretta col sistema G(p) = n(p)
, e la f.d.t. in anello chiuso
dc (p)
d(p)
risultante, Gc (p) =

nc (p)n(p)
.
nc (p)n(p)+dc (p)d(p)

Risulta evidente che la f.d.t. in anello

Figura 8.7: Sintesi analitica di un compensatore in catena diretta.


chiuso ha tra i suoi zeri quelli del sistema in anello aperto (come sappiamo
per il fatto che gli zeri sono invarianti per retroazione degli stati), oltre a
quelli aggiunti dal compensatore. Lunico caso in cui uno zero di G(p) non

150

CAPITOLO 8. REGOLAZIONE DEI SISTEMI

appare anche nella Gc (p) `e quello nel quale C(p) presenta un polo nella stessa
posizione, cio`e se si ha una cancellazione tra dc (p) e n(p). In questo caso,
lautovalore corrispondente al polo cancellato diviene sia irraggiungibile che
inosservabile (valgono infatti le stesse considerazioni fatte sulla connessione
in retroazione), e rimane pertanto fisso con la retroazione. Nel caso in cui
lo zero cancellato (e quindi il polo) fosse al di fuori della regione di stabilit`a
(semipiano sinistro per LTITC o cerchio unitario per LTITD), il risultato `e
inaccettabile, in quanto il sistema conterrebbe un modo instabile che, per
quanto non influenzi il rapporto ingresso-uscita, divergerebbe allontanando
irrimediabilmente il sistema dalla zona di funzionamento in cui il modello
lineare adottato `e valido. La cancellazione di uno zero a parte reale positiva
con un polo instabile del compensatore `e peraltro inaccettabile anche per altri
motivi: si pensi infatti al caso in cui uno zero instabile del sistema G(p) della
forma (p a) sia imperfettamente cancellato (come non pu`o che avvenire in
pratica) da un polo (p a ) in Gc (p), con || > 0 arbitrariamente piccolo.
Nella f.d.t. in anello chiuso, si trover`a un polo situato tra a e a + (si pensi
al luogo delle radici corrispondente), quindi ancora certamente instabile (per
piccolo), il quale darebbe luogo a divergenza della uscita.
Anche nel caso in cui il compensatore venisse scelto in modo da cancellare
con uno zero uno dei poli del sistema, cio`e se nc (p) avesse fattori comuni a
d(p), il sistema perderebbe raggiungibilit`a e osservabilit`a, e lautovalore corrispondente resterebbe immodificabile per retroazione. Per gli stessi motivi
esposti sopra, questo comportamento `e inaccettabile se il polo in questione `e
instabile.
Le cancellazioni tra compensatore e impianto sono spesso usate nei pi`
u
elementari approcci alla regolazione dei sistemi, quali la cosiddetta sintesi
analitica, che si riassume qui a titolo esemplificativo. La tecnica consiste nella
soluzione di una semplice equazione tra la f.d.t. in anello chiuso del sistema
compensato Gc (p) ed una f.d.t. obiettivo Go (p) assegnata come desiderabile,
nella incognita rappresentata dalla f.d.t. del compensatore C(p):
Gc (p) =

C(p)G(p)
nc (p)n(p)
no (p)
=
= Go (p) =
,
1 + C(p)G(p)
nc (p)n(p) + dc (p)d(p)
do (p)

che ha per soluzione


C(p) =

Go (p)
no (p)
1
d(p)
=
.
1 Go (p) G(p)
do (p) no (p) n(p)

Il metodo consiste praticamente nel cancellare tutti i poli e gli zeri del sistema
originale, rendendoli inosservabili e irraggiungibili, e nellintrodurne di nuovi;
`e pertanto da attendersi che il metodo abbia forti limitazioni nella sua pratica
applicazione.

8.4. SINTESI ANALITICA

151

` innanzitutto da notare che la condizione di fisica realizzabilit`a del comE


pensatore impone che il modello obiettivo debba avere grado relativo non
inferiore al grado relativo del sistema di partenza, come risulta evidente dalle
espressioni sopra riportate.
Nel caso in cui il sistema abbia zeri a parte reale positiva, la sintesi
analitica non pu`o essere impiegata, a meno di specificare che anche il sistema
obiettivo contenga quegli stessi zeri (in tal caso infatti no (p) e n(p) hanno lo
zero a fattor comune nella espressione di C(p)).
Anche quando il sistema G(p) ha poli instabili in anello aperto, la sintesi
analitica non pu`o essere applicata senza la precauzione di porre una f.d.t.
obiettivo tale che eviti la cancellazione dei poli instabili: la contromisura da
prendere in questo case consiste nel fare in modo che il polinomio do (p)no (p)
contenga gli stessi poli instabili.
Per il resto del progetto per sintesi analitica, si svolgono considerazioni
analoghe a quelle fatte per il progetto basato sul regolatore.

152

CAPITOLO 8. REGOLAZIONE DEI SISTEMI

Appendice A
Richiami di Algebra Lineare
A.1

Sistemi lineari di equazioni

Si consideri il sistema di equazioni lineari


Ax = b,

A IRnm

1. Il sistema ha soluzione se e solo se b Im A;


2. Il sistema ha soluzione b se e solo se Im A = IRn , quindi se rank A = n
(si dice che A ha pieno rango righe). E necessario perci`o che m n;
3. Il sistema ha al pi`
u ununica soluzione se ker A = {0};
Per n = m, si ha ovviamente una soluzione per ogni b, che `e anche unica,
se e solo se A `e invertibile: x = A1 b.
Consideriamo il caso 2, in cui la soluzione di Ax = b esiste ma non `e
unica. Poniamoci il problema di trovare, tra le soluzioni, quella di lunghezza
minima. Vogliamo in altri termini risolvere il problema di minimo vincolato
x = arg minx xT x
Ax = b
Questo problema `e risolto facilmente col metodo dei moltiplicatori di Lagrange, definendo L = xT x + T (Ax b) e imponendo L
= L
= 0. Dalla prima
x

condizione si ha
AT
x=
,
2
quindi
AAT = 2b
153

154

APPENDICE A. RICHIAMI DI ALGEBRA LINEARE

Nella ipotesi che A abbia pieno rango righe, AAT `e invertibile: infatti,
questa matrice `e quadrata, ed essendo le righe di A indipendenti, tali sono
anche le colonne di AT , che quindi non ha spazio nullo (cio`e, non esiste alcun
y tale che AT y = 0). Inoltre, poich`e sappiamo dal teorema fondamentale
dellalgebra che Im (AT ) = ker (A), nessun vettore nellimmagine di AT
pu`o appartenere al kernel di A. Quindi si ha che la soluzione di minima
lunghezza `e
x = AT (AAT )1 b
def

Si osservi che la matrice AR = AT (AAT )1 `e una inversa destra di A: AAR =


In .
Se la lunghezza del vettore x fosse stata misurata in un altra metrica,
kxk2 = xT W x (con W simmetrica e positiva definita), la soluzione sarebbe
def
1 T
risultata x = W 1 AT (AW 1 A)T b. La matrice AR
A (AW 1 A)T `e
W = W
anchessa una inversa destra, pesata in W (quindi, le inverse destre non sono
uniche).
` interessante anche osservare come una metrica considerata su uno spaE
zio si trasformi cambiando le coordinate. Siano x = T z le nuove coordinate.
Si ha: xT W x = z T T T W T z. La matrice della metrica si trasforma quindi per
congruenza. Essendo W simmetrica e positiva definita (non avrebbe senso
altrimenti), esiste sempre un sistema di coordinate nel quale la matrice della
metrica `e diagonale: baster`a prendere per T la matrice ortogonale diagonalizzante Q (QT W Q = ). Scegliendo poi T = Q1/2 , si ha xT W x = z T z,
cio`e la matrice metrica `e identica.
Si consideri adesso invece il caso (3) in cui una soluzione (in generale) non
esista, ma che dim ker (A) = 0. Ha senso in questo caso cercare la miglior
approssimazione, cio`e la x che minimizza la norma del residuo
x = arg min kAx bk2
Ponendo

(Ax b)T (Ax b)


= 2(AT Ax AT b)T = 0
x
si ha la soluzione ai minimi quadrati
x = (AT A)1 AT b.
Linvertibilit`a `e garantita dallipotesi che A non abbia spazio nullo.
La matrice AL = (AT A)1 AT `e una inversa sinistra: AL A = Im . Se si considera una metrica Wb sullo spazio dei residui, si ottiene ALWb = (AT Wb A)1 AT Wb .
Chiaramente, inverse destre e sinistre sono diverse in generale (anche nelle
dimensioni). Se una inversa destra e una sinistra coincidono, allora questa `e
lunica inversa A1 di una matrice quadrata A.

A.2. SCOMPOSIZIONE AI VALORI SINGOLARI E PSEUDOINVERSA155


Ci chiediamo ora se esiste una espressione unica per una inversa di una
matrice A (chiamiamola A+ ) che fornisca, nei diversi casi, le soluzioni viste.
Cio`e, A+ = A1 se esiste linversa; A+ = AR se esiste linversa destra sopra
definita (cio`e se A ha pieno rango righe); A+ = AL se esiste linversa sinistra
sopra definita (cio`e se A ha pieno rango colonne).
Desideriamo anche considerare i casi dove non esista ne inversa destra ne
sinistra, cio`e dove il sistema Ax = b non abbia alcuna soluzione in generale,
ma per i particolari b per cui ha soluzione, questa non e unica. In questo
caso, vorremmo che x = A+ b fornisse, tra le soluzioni che approssimano la
soluzione con minima norma del residuo, quella che possiede norma minima.

A.2

Scomposizione ai Valori Singolari e Pseudoinversa

Data una matrice A n m, e rank (A) = r, si consideri la diagonalizzazione


delle matrici (simmetriche e semi-definite positive) ottenute per prodotto con
la trasposta:
AAT = U M U T
AT A = V N V T
dove U `e n n, composta da n autovettori ortonormali di AAT ordinati in
modo che in M si trovino gli autovalori di AAT decrescenti in modulo lungo
la diagonale; e V `e m m, composta da m autovettori ortonormali di AT A
ordinati in modo che in N si trovino gli autovalori di AT A decrescenti in
modulo lungo la diagonale.
Naturalmente, si ha che le ultime n r colonne di U , e le ultime m r
colonne di V , sono contenute rispettivamente nel ker (AAT ) = ker AT e
nel ker (AT A) = ker A, e formano una base ortogonale di questi sottospazi.
Infatti, gli elementi sulla diagonale di M e N sulle righe e colonne di indice
superiore a r sono nulli.
Si osservi che i primi r valori diagonali (non nulli) di M e di N sono eguali
e positivi: i > 0, i = 1, . . . , r. Entrambe le matrici hanno poi min(n, m) r
autovalori nulli sulla diagonale. Infine, se n > m, la matrice N ha n m altri
autovalori nulli sulla diagonale; se n < m, `e la matrice M ad avere m n
altri autovalori nulli sulla diagonale.
Questa `e una conseguenza del fatto che gli autovalori di un prodotto
quadrato di matrici rettangolari, ad esempio BC, coincidono con quelli del
prodotto commutato, CB, eccetto che per un numero di autovalori nulli pari
alla differenza di dimensioni tra le due matrici quadrate.

156

APPENDICE A. RICHIAMI DI ALGEBRA LINEARE


Possiamo quindi scrivere M = T e N = T , con n m, e
def
ii =
i = i , i = 1, . . . , r
jk = 0,
altrimenti

Gli r numeri positivi i sono detti valori singolari di A.


Le matrici U e V sinora considerate rappresentano basi ortonormali arbitrariamente scelte (eccetto per il fatto che le ultime colonne sono una base
di ker AT e ker A, e le prime colonne sono una base di Im A e Im AT , rispettivamente). Possiamo quindi scegliere una base, o meglio una relazione
tra le basi dei quattro sottospazi, particolarmente utile. Faremo ora vedere
che `e possibile fare questo in modo che si possa scrivere
A = U V T
cio`e in modo da ottenere quella che viene chiamata Decomposizione ai Valori
Singolari (S.V.D.) di A.
Per far questo, fissiamo ad esempio arbitariamente una base ortonormale
di Im AT nelle prime r colonne di V , e cerchiamo le corrispondenti colonne
di U risolvendo AV = U , ovvero
1
U (:, i) = AV (:, i), i = 1, . . . , r
i
` facile verificare che queste soluzioni sono effettivamente colonne orE
tonormali (U (:, i)T U (:, j) = ij ) e che formano una base di Im A: sono
quindi legittime scelte per le prime r colonne di U . Per le altre colonne
di U e V , baster`a prendere i complementi ortonormali (usando ad esempio
Gram-Schmidt).
Per costruire la SVD di una matrice A n m (qualunque!) basta dunque:

1. Costruire AT A e trovarne gli r autovalori non nulli i . Porre i = i


e costruire n m con i sulla diagonale;
2. Costruire una matrice ortonormale m m V le cui cui prime r colonne
siano una base di Im AT ;
3. Porre U (:, i) =

1
AV
i

(:, i) per le prime r colonne di U ;

4. Estendere queste r colonne di U ad una base ortonormale di IRn .


5. Scrivere A = U V .
Si noti che quanto sopra si applica sia al caso n m che m n. Nel
secondo caso per`o, `e pi`
u conveniente trovare gli autovalori di AAT , in numero
di n, e quindi applicare la procedura alla matrice AT . La procedura non
`e daltronde numericamente efficiente ne stabile: per algoritmi migliori, si
vedano testi di analisi numerica.

A.3. INTERPRETAZIONI E APPLICAZIONI DELLA SVD

A.3
A.3.1

157

Interpretazioni e applicazioni della SVD


Pseudoinversa

Mediante la SVD, il problema di ottenere la soluzione di un sistema lineare


Ax = b qualunque, nel senso di trovare la miglior approssimazione di minima
norma, ha soluzione immediata. Riscriviamo infatti U V T x = b, e cambiamo
le coordinate in entrambe gli spazi dominio e codominio ponendo x = V x e
b = U b. Si ha, nelle nuove coordinate
x = b, cio`e
1 x1 = b1
..
.
. = ..
r xr = br
0 = br+1
..
.
. = ..
0 = bn
La soluzione che minimizza la somma dei quadrati dei residui `e dunque x1 =
b1

, . . ., xr = brr , con le altre m r componenti di x che non influenzano


1
il residuo e che quindi sono arbitrarie. Daltronde, per minimizzare xT x =
xT V T V x = xT x, tali componenti si dovranno scegliere nulle. Tornando alle
vecchie coordinate, si trova cos` la soluzione desiderata.
La matrice A+ che risolve il problema Ax = b nel senso che x = A+ b `e,
tra i valori della x che minimizzano la norma due dei residui, quello a norma
due minima, `e dunque
A+ = V + U T
dove + `e una matrice m n che ha sulla diagonale gli inversi dei valori
singolari di A, e zeri altrove. Questa matrice `e detta pseudoinversa (di MoorePenrose) di A.

A.3.2

Norma matriciale

In base alle relazioni sopra viste, il vettore della base canonica x = ei (le cui
componenti sono nulle eccetto che la i-esima, che vale 1) viene trasformato
da in i ei , quindi la sua lunghezza passa da 1 a i . Le lunghezze (o norme
euclidee) dei vettori corrispondenti nelle coordinate originali stanno nello
stesso rapporto. Infatti, posto xi = V ei = V (:, i), si ha
kAxi k2
=
kxi k2

p
p
p
i2
xi
xTi AT Axi
xTi T
p
= p
=
= i
1
xTi xi
xTi xi

158

APPENDICE A. RICHIAMI DI ALGEBRA LINEARE

Se si rappresenta graficamente la immagine di Ax al variare di x sulla sfera


unitaria in IRm (cio`e si normalizza xT x = 1), si ottiene quindi un ellissoide
in IRn , il cui semiasse maggiore vale 1 ed `e allineato con U (:, 1); il secondo
semiasse maggiore `e lungo 2 ed `e allineato con U (:, 2), etc.. Il semiasse
minore dellellissoide `e allineato con U (:, r) ed `e lungo r . Se r < n (ricorda
che n `e la dimensione dello spazio immagine di A), lellissoide `e in effetti
degenere, cio`e giace nella intersezione degli n r iperpiani generati da U (:
, r + 1), , U (:, n).
Esempio: In un problema di pianificazione di un sistema dinamico
del tipo x = Rut , lasse maggiore dellellissoide associato alla matrice di
raggiungibilit`a R rappresenta la direzione nella quale, a parit`a di costo
del controllo, il sistema pu`o essere portato a stati finali pi`
u lontani; il
semiasse minore viceversa `e la direzione meno raggiungibile. Se si ha
perdita di raggiungibilit`a, cio`e di rango di R, lellissoide diviene degenere, rimanendo contenuto nelliperpiano Im R (quindi con semiasse di
lunghezza nulla nella direzione perpendicolare a questo).
Il massimo valor singolare di una matrice `e quindi la massima amplificazione prodotta da A su un vettore x, se i vettori sono misurati in norma
euclidea. La definizione di norma euclidea (o norma due) indotta su A dalla
norma euclidea vettoriale `e proprio data da

kAxk2
xT AT Ax
kAk2 = max
,
= max
x
x
kxk2
xT x
per cui
kAk2 = 1
Si noti che la norma due di una matrice coincide col massimo autovalore solo
se A `e simmetrica.

A.3.3

Condizionamento di un sistema di equazioni

Si consideri un sistema di n equazioni in n incognite Ax = b in cui A = U V T


sia invertibile, per cui si ha r = n e A1 = V 1 U T .
Si desidera valutare leffetto x che una perturbazione b del termine noto
pu`o avere sulla soluzione,
A(x + x) = b + b

A.3. INTERPRETAZIONI E APPLICAZIONI DELLA SVD

159

ovvero
Ax = b.
Vale la maggiorazione tra norme
kxk kA1 k kbk
che, nel caso si scelga la norma due, diviene
kxk2 1/n kbk2 .
Nel peggior caso, quindi, una perturbazione pu`o venire amplificata nella soluzione tanto pi`
u quanto pi`
u `e piccolo il minimo valore singolare della matrice.
La sensibilit`a alla perturbazione tende a infinito quando il minimo valore
singolare tende a zero - nel qual caso, A tende a perdere rango.
Esempio: In un problema di stima ottima del tipo Y = O
x con
Y IRt e x IRn , n < t, supponendo il sistema osservabile, siano
1 , . . . , n i valori singolari della matrice di osservabilit`a. La stima ai
minimi quadrati risente quindi massimamente degli errori di misura nella
direzione associata al valore singolare minimo: quando questo tende a
zero (cio`e il sistema tende a perdere osservabilit`a), un errore di misura
anche piccolo pu`o provocare grandi errori di stima.
Pi`
u in generale, una misura di quanto una matrice sia vicina alla perdita
di rango (in particolare, vicino alla singolarit`a nel caso di matrici quadrate
n = m) `e il minimo
 valore singolare, e non il minimo autovalore: si consideri
1 1/
, in cui gli autovalori sono sempre 1, ma i valori
ad esempio A =
0 1
singolari sono invece dellordine di e 1/ per piccoli (la matrice tende
chiaramente alla singolarit`a per 0).
In molti casi, invece della valutazione della massima perturbazione assoluta kxk (che pu`o cambiare semplicemente moltiplicando entrambe i termini dellequazione per una costante), `e interessante valutare quella relativa,
kk/kxk. Essendo kAkkxk kbk, si pu`o scrivere
kxk
kbk
kAk kA1 k
kxk
kbk
Nel caso in cui si abbia perturbazione dei termini della matrice A, si pu`o
scrivere
(A + A)(x + x) = b

160

APPENDICE A. RICHIAMI DI ALGEBRA LINEARE

da cui
Ax + A(x + x) = 0
quindi
x = A1 A(x + x).
Passando alle norme, si ha
kxk kA1 kkAkkx + xk
quindi, in termini relativi, si ha
kxk
kAk
kAk kA1 k
.
kx + xk
kAk
La quantit`a kAk kA1 k che determina la sensibilit`a delle soluzioni sia alle
prturbazioni dei dati che a quelle della matrice, `e detta numero di condizione
di A. Se si usa la norma due, si ha
kA1 k kAk =

1
,
n

cio`e il numero di condizione `e il rapporto tra minimo e massimo valore


singolare, ovviamente sempre maggiore di uno.

A.3.4

Compressione di dati

Si consideri per esempio una immagine di dimensione N N , con N grande,


e si desideri isolare (per limiti di risorse) i dati di maggior rilievo contenuti
nella matrice. Scrivendo la SVD della matrice dei dati,
A = U V T = U (:, 1)1 V (:, 1)T + U (:, 2)2 V (:, 2)T + . . .
ogni termine della sommatoria contiene solo 2N dati. Troncando la sommatoria quando i valori singolari (ordinati in senso decrescente) diminuiscono
al di sotto di un certo valore , si ottengono approssimazioni dellimmagine
di crescente risoluzione per 0.