Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
CONTROLLI AUTOMATICI
A.A. 2017/2018
Introduzione al Corso
Per valutare le prestazioni del sistema è, allora, possibile sollecitarlo con opportuni
andamenti temporali delle grandezze di ingresso e rilevare i corrispondenti andamenti
temporali delle grandezze di uscita.
Tale valutazione può essere condotta nei seguenti due modi:
L'approccio teorico si basa sulla conoscenza di un modello matematico del sistema reale,
costituito da un insieme di grandezze e dalle relazioni matematiche far tali grandezze, che sia
in grado di riprodurre il comportamento del sistema reale, entro prefissati margini di
tolleranza, quando il modello e il sistema reale sono sollecitati con gli stessi ingressi ed
evolvono a partire dalle stesse condizioni iniziali.
In tali ipotesi, è possibile effettuare lo studio del sistema reale utilizzando il modello
matematico ad esso associato. Un aspetto importante riguarda la determinazione degli
andamenti temporali delle grandezze di uscita corrispondenti a certi andamenti temporali delle
grandezze di ingresso, risolvendo le equazioni che costituiscono il modello stesso. L’altro
aspetto, ancora più importante, riguarda la individuazione di proprietà del modello che si
riflettono sulle prestazioni che il sistema reale è in grado di fornire.
Per quanto concerne la determinazione della soluzione delle equazioni che costituiscono il
modello matematico, si osservi che, in molti casi, risulta impossibile o oneroso dal punto di
vista computazionale, risolvere analiticamente tali equazioni per via analitica. In generale,
conviene determinare una soluzione numerica delle equazioni stesse avvalendosi dell’ausilio
di un computer. A tal fine occorre implementare il modello sul computer stesso. Poiché, di
solito, il modello matematico che viene associato ad un sistema reale è costituito da equazioni
differenziali mentre i computer sono in grado di eseguire solamente operazioni logiche e
aritmetiche, l'implementazione del modello richiede l'impiego di opportuni metodi che
dipendono dalla sua struttura.
La costruzione di un adeguato modello matematico può essere effettuata:
Sintesi
In generale, i sistemi reali sono solo “potenzialmente” in grado di conseguire gli obiettivi
prefissati (ovvero di comportarsi nella maniera desiderata), nel senso che il conseguimento di
tali obiettivi è possibile solamente se su tali sistemi vengono esercitate adatte azioni
dall’esterno denominate azioni di controllo. Il controllo può esercitarsi con o senza
l’intervento diretto dell’uomo; il controllo che si esercita senza l’intervanto diretto dell’uomo
viene denominato controllo automatico. Le succitate azioni di controllo vengono generate dal
un secondo sistema, denominato sistema controllante o controllore, che viene
opportunamente interconnesso con il sistema al quale si desidera imporre il comportamento
desiderato, denominato sistema controllato.
Esempio 1.1.1
Per illustrare gli aspetti fondamentali di un problema di controllo si consideri il seguente
problema analogo a quello del controllo di un pendolo inverso. Il sistema controllato è un’asta
poggiata sul palmo della mano di un uomo e il comportamento desiderato è mantenere
verticale l’asta stessa muovendo solamente la mano (modalità di controllo 1); altre modalità
che potrebbero essere utilizzate sono quelle di mantenere ferma la mano (modalità di
controllo 2) e spostarsi nello spazio circostante, oppure muovere nel contempo la mano e
spostarsi nello spazio circostante (modalità di controllo 3). Ovviamente, il controllo avviene
con l’intervento dell’uomo ed è quindi manuale, cioè non automatico.
E’ facile verificare che quale che sia la modalità di controllo si riesce sempre a conseguire
l’obiettivo prefissato. Naturalmente, è più facile conseguire il succitato obiettivo utilizzando
la terza modalità di controllo poiché non esistono vincoli sulle azioni di controllo che possono
4
L’uomo spostandosi in varie direzioni o spostando il palmo della mano esercita delle
azioni sul sistema controllato; gli organi motori dell’uomo agiscono come attuatori.
La decisione delle azioni più idonee vengono prese dal cervello dell’uomo che agisce
da controllore.
Le decisioni vengono prese sulla base delle osservazioni della posizione attuale
dell’asta e della sua tendenza che esprimono il comportamento effettivo del sistema e
sulla posizione desiderata dell’asta che esprime il comportamento desiderato o set-
point. Più precisamente, le decisioni vengono elaborate a partire dal confronto fra set-
point e comportamento effettivo. Il dispositivo di confronto viene denominato
comparatore.
Le osservazioni della posizione attuale dell’asta e della sua tendenza futura vengono
catturate dagli occhi che agiscono da sensori di misura e vengono trasmesse al
cervello mediante il sistema nervoso.
Il risultato delle elaborazioni del controllore (il cervello), costituisce la legge di
controllo che viene trasmessa agli organi motori dal sistema nervoso centrale. Tale
legge viene elaborata a partire dai risultati del confronto fra comportamento effettivo e
desiderato. L’insieme costituito dal comparatore e dal compensatore viene denominato
controllore.
Uno schema a blocchi strutturale che evidenzia i meccanismi succitati è illustrato nella Fig.
1. Lo schema a blocchi di Fig. 1 ha validità del tutto generale.
Gli obiettivi considerati nell’esempio illustrato sono analoghi a quelli che è chiamato a
perseguire un pendolo inverso il cui schema è riportato nella Fig. 2. Il pendolo è incernierato
alla sommità di un carrello che è azionato da motori elettrici; il movimento del carrello che
trasporta il pendolo può avvenire solamente in una direzione e l’obiettivo che si pone è quello
di mantenere il pendolo in posizione verticale. Con riferimento allo schema di Fig. 1, valgono
le seguenti considerazioni.
Set-point disturbo
Compensato sistema
Comparator Attuatore
re controllato
e
Sensori di
misura
Per quanto concerne la determinazione della legge di controllo, o ciò che è lo stesso, la
progettazione o la sintesi del controllore, esistono vari approcci fra i quali l’approccio basato
su modello, quello basato su regole e l’approccio basato sulle reti neurali. L’approccio basato
su modello utilizza informazioni a priori sul sistema fornite dal modello matematico, e
consente di tener conto a priori delle incertezze con cui il modello rappresenta il sistema reale.
L’approccio basato su regole richiede la conoscenza di una descrizione linguistica del
comportamento del sistema. Un esempio tipico di controllori basati su regole che coinvolgono
variabili linguistiche è costituito dai controllori fuzzy. Infine, l’approccio basato su reti neurali
permette l’apprendimento on-line del comportamento del sistema in presenza di certe azioni
di controllo, e di adattare il controllore on-line in funzione delle informazioni rilevate.
6
Sia T l’insieme dei valori del tempo, che può coincidere, o meno, con (, +). Una funzione
del tempo v definita su T verrà indicata con v () . Il valore che essa assume all’istante generico
t sarà invece indicato con v (t ) .
Si consideri ora un intervallo di osservazione contenuto in T, definito come segue:
t0 , t : t0 t; t0 , t T
e una funzione del tempo v () . Dicesi restrizione di v () nell’intervallo t0 , t , o segmento
della funzione v () , l’insieme delle coppie ordinate , v( ) con t0 , t . In simboli:
La fig. 1 chiarisce le definizioni precedenti nel caso in cui v () sia scalare.
v () vt0 ,t
v (t)
t t0 t
Fig. 1
Una classe di funzioni scalari del tempo si indica con R[v ()] . Con R[v (t )] invece si indica
l’insieme dei valori che le funzioni v () assumono nei vari istanti di tempo t (codominio) e, in
genere, è un insieme indipendente dal tempo. La classe delle restrizioni delle funzioni v ()
nell’intervallo t0 , t si indica infine con R vt ,t o, in maniera più sintetica, con R v .
0
Quanto detto può facilmente essere esteso al caso di funzioni vettoriali, definite come n–pla di
funzioni scalari del tempo. Una generica funzione vettoriale si indica con v () e può essere
rappresentata mediante notazione matriciale, come segue:
v1 ()
v ()
v () 2
v n ()
v1 (t )
v (t )
v (t ) 2 .
v n (t )
Inoltre, si ha:
v vt ,t ( , v ( )) : t 0 t; t 0 , t T , v( ) v() .
0
t t
T -2 -1 0 1 2 3 4 5
T
Fig. 2 Fig. 3
Una grandezza a tempo discreto è costituita da una sequenza di valori assunti dalla
grandezza in corrispondenza a valori discontinui del tempo, indicati usualmente con t k , con
k Z . Esse si possono rappresentare graficamente tramite diagrammi costituiti da sequenze
di punti (cfr. fig. 3).
Per gli scopi di questo corso, è importante considerare grandezze a tempo continuo, alla cui
classe appartengono le grandezze continue a tratti (cfr. fig. 4). In breve, si considerano
continue quelle grandezze che, in un dato intervallo temporale di definizione, sono funzioni
univoche del tempo, salvo in un insieme numerabile di istanti, in cui la grandezza medesima
risulta discontinua.
t1 t2 t
Fig. 4 Grandezza continua a tratti.
8
t
t
Nel primo passo il segnale viene sottoposto alla operazione di campionamento. Nel
caso ideale, tale operazione consiste nel prelevare valori del segnale (campioni) in
corrispondenza a istanti discreti del tempo, generalmente ugualmente spaziati di
T s (periodo di campionamento) (cf. Fig. 7).
Nel secondo passo tali campioni vengono convertiti in formato digitale (sequenza di
bit) da un convertitore analogico digitale (ADC, Analog-to-Digital Converter). Poiché
un ADC fornisce in uscita una configurazione precisa di bit (12, 14, 16 bit), la
grandezza digitale di uscita appare anche quantizzata.
9
a) grandezza analogica
b) grandezza campionata
Fig. 7 Campionamento di un segnale analogico
10
1.1 Introduzione
Come già detto nell’introduzione al corso, lo studio di un sistema reale verrà effettuato a
partire dalla costruzione di un modello matematico del sistema stesso, validato
sperimentalmente, ed effettuando lo studio del modello stesso.
Lo studio dei modelli matematici si è evoluto come segue:
Tale approccio consente di effettuare lo studio dei sistemi reali prescindendo dalla loro natura
fisica, chimica, etc. Infatti, se sono noti i metodi di studio per una certa classe di modelli
matematici si è in grado di effettuare lo studio di tutti quei sistemi reali che possono essere
rappresentati da modelli appartenenti a tale classe.
T
può essere rappresentata mediante la matrice colonna o vettore u(t ) u1 (t ) u p (t )
appartenente ad un insieme U che coincide con R p o con un suo sottoinsieme. In maniera
analoga la q-pla di numeri y1 (t ), , y q (t ) può essere rappresentata mediante la matrice
T
colonna o vettore y(t ) y1 (t ) y q (t ) appartenente a un insieme Y che coincide con
R q o con un suo sottoinsieme.
Si assuma l'insieme dei valori del tempo T ( , ) e siano:
R u() e R y() due insiemi costituiti, rispettivamente, di tutte le possibili funzioni
di ingresso e di uscita definiti sull’insieme dei valori del tempo T, con le quali è
possibile sollecitare il sistema astratto e che tale sistema è in grado di generare
ut0 ,t e yt0 ,t , rispettivamente, un segmento di ingresso e un segmento di uscita
nell'intervallo di osservazione t0 , t , così definiti:
u[t0 ,t ] ( , u( )) : [t 0 , t ], u( ) u(), t 0 , t T
y[t ,t ] ( , y( )) : [t
0 0
, t ], y( ) y(), t 0 , t T
denominati spazio dei segmenti di ingresso e spazio dei segmenti di uscita. Gli insiemi U e Y
dei valori che tutte le funzioni u() e y() assumono all’istante t sono, per ipotesi,
indipendenti da t e vengono denominati spazio di ingresso e spazio di uscita. Nel seguito si
supporrà che U R p e Y R q .
Il modello (1.2.1) si dice statico se l’uscita all’istante t dipende solamente dall’ingresso
allo stesso istante t. Il modello si dice dinamico se l’uscita all’istante t dipende dai valori
passati dell’ingresso ed, eventualmente, anche dall’ingresso all’istante t. Nel seguito si
supporrà che il modello matematico associato a un generico sistema reale sia sempre di tipo
dinamico.
Un modello matematico dinamico può essere rappresentato in due modi: il modello
matematico ingresso-uscita (i-u) e il modello matematico ingresso-stato-uscita (i-s-u).
lineare se le equazioni differenziali sono lineari, altrimenti viene detto non lineare. Un
modello i-u si dice stazionario o tempo-invariante se i coefficienti che figurano nelle
equazioni differenziali sono costanti, altrimenti viene detto non stazionario o tempo-variante.
Una caratteristica del modello dinamico i-u è che la corrispondenza ingresso-uscita non è
univoca nel senso che a una generica funzione di ingresso applicata a partire dall’istante t 0
incluso possono corrispondere infinite funzioni di uscita dipendentemente dalla storia passata
del sistema fino all’istante t 0 , prodotta dai valori passati dell’ingresso fino all’istante t 0
escluso. Si noti che t 0 viene escluso poiché si è ammesso che l'intervallo di osservazione
comprenda tale istante.
qi
qi l
qu
qu
dl 1
( qi q u ) ,
dt A
ml 2 b mgl sin( ) fl ,
l f
m
Una ulteriore forma in cui può essere rappresentato il meccanismo R( ut0 ,t , yt0 ,t ) 0
nell’intervallo di osservazione [ t 0 ,t ] è il modello matematico ingresso-stato-uscita.
Tale modello trae origine dalla osservazione che per i sistemi dinamici è possibile, in molti
casi, definire una nuova variabile ausiliaria vettoriale, denotata con x () , che evolve nel
tempo unitamente alle variabili di ingresso e di uscita, il cui valore all'istante t,
x (t ) X C n , unitamente a quello dell'ingresso nello stesso istante t, u( t ) , consente di
determinare univocamente l'uscita all'istante t, y( t ) , in accordo alle relazioni:
y1 (t ) g1 ( x1 (t ), x2 (t ), , xn (t ); u1 (t ), u2 (t ), , u p (t ); t ),
y2 (t ) g2 ( x1 (t ), x2 (t ), , xn (t ); u1 (t ), u2 (t ), , u p (t ); t ),
yq (t ) g q ( x1 (t ), x2 (t ), , xn (t ); u1 (t ), u2 (t ), , u p (t ); t ),
x (t ) x1 (t ) xn (t ) , u(t ) u1(t ) u2 (t )
T
u p (t ) ,
T
x2 (t )
T T
y(t ) y1 (t ) y2 ( t ) yq (t ) , g g1 g2 g q .
x1 (t ) f1 ( x1 (t ), x2 (t ), , xn (t ); u1 (t ), u2 (t ), , u p (t ); t ),
x2 (t ) f 2 ( x1 (t ), x2 (t ), , xn (t ); u1 (t ), u2 (t ), , u p (t ); t ),
xn (t ) f n ( x1 (t ), x2 (t ), , xn (t ); u1(t ), u2 (t ), , u p (t ); t ),
x (t ) f ( x (t ), u(t ), t ) , (1.3.3)
la funzione generatrice dipende dall’ingresso e non dalle sue derivate). Il modello (1.3.3) e
(1.3.1) viene denominato modello i-s-u in forma implicita.
Nel seguito verrà considerato il caso in cui X C n . I modelli (1.3.3) e (1.3.1) per i quali
U R p , Y R p e X C n vengono denominati sistemi a stato vettore o a dimensione finita.
La funzione t , t0 , x0 , u[t0 ,t ) gode delle seguenti proprietà
Osservazione 1.3.1
Osservazione 1.3.2
Conviene osservare che non è sempre possibile riassumere la storia passata di un sistema
con una n-pla di numeri. In alcuni casi occorre definire lo stato come una funzione di una o
più variabili piuttosto che una n-pla di numeri. In tali casi, la determinazione di un modello i-
s-u può risultare molto complessa. Un esempio è costituito da un elemento di puro ritardo
descritto dal modello i-u:
y (t ) u (t ) .
L'esame delle (1.3.1) e (1.3.3) mette in luce l'esistenza di una funzione (, , , ) tale che:
dove A(t ), B(t ), C (t ) e D(t ) sono matrici dipendenti dal tempo, rispettivamente di ordine
n n, n p, q n e q p , il modello risultante dato da:
u
y
t0
a)
u
y
t0
b)
Fig. 1.3.1 Principio di causalità: a) sistema causale; b) sistema non causale.
17
Esempio 2.4 Rappresentazione con lo stato per un sistema reale costituito da un insieme
massa-molla-smorzatore.
molla, k f
carrello, m
smorzatore, b
Indicando con s lo spostamento del carrello, valutato positivamente verso destra, il modello
del sistema di Fig. 1.3.2 è dato da:
ms bs ks f .
Assumendo:
x1 s, x 2 s ,
si ha:
x1 x 2 ,
k b 1
x 2 x1 x 2 f .
m m m
0 1 0
x1 x
x k b 1 u ,
1
2 x 2
m m m
0 1 0
x1
x , A k b , b 1 , c 1 0 ,
T
x2
m m m
e scegliendo come uscita y s , si ottiene il modello i-s-u lineare e stazionario dato da:
x Ax b u .
y (t ) cT x .
Osservazione 1.3.4
l’operatore di traslazione che applicato a una funzione f () : T F produce una funzione
Th f () : T F tale che:
Th f (t ) f (t h) .
Pertanto, per lo studio dei sistemi stazionari è possibile porre t 0 0 , senza ledere la generalità.
Osservazione 1.3.5
Siano x1() e y1() ( x2 () e y2 () ) le risposte corrispondenti all’ingresso u1 () (u2 ()) e allo
stato iniziale x10 (x 20 ) . Allora, le risposte all’ingresso k1u1() k 2u2 () e allo stato iniziale
k1 x10 k 2 x20 sono date, rispettivamente, da k1 x1() k 2 x2 () e k1 y1() k 2 y2 () .
Th u Th y
u y
Th y
t
t0 t0 h
Osservazione 1.3.6
Non esistono sistemi reali che possano essere rappresentati da modelli rigorosamente
stazionari. Infatti, tutti i sistemi reali modificano il loro comportamento nel corso del loro
funzionamento. A titolo di esempio, tutti i sistemi realizzati mediante dispositivi elettronici
modificano le proprie caratteristiche e prestazioni con il tempo a causa dell’invecchiamento
dei componenti, o delle modifiche di condizioni ambientali; un missile che viaggia nello
spazio modifica il suo comportamento a causa del consumo di carburante che produce
variazioni di pesi, momenti di inerzia, etc.
Tuttavia, dal punto di vista ingegneristico e per assegnato intervallo di osservazione, se le
caratteristiche del sistema variano lentamente rispetto all’intervallo di osservazione, al sistema
stesso è possibile associare un modello stazionario.
Osservazione 1.3.7
19
Analogamente alla proprietà di stazionarietà, non esistono sistemi reali che possano essere
rappresentati da modelli rigorosamente lineari. Se le escursioni delle grandezze in gioco non
superano determinati livelli è possibile associare al sistema reale un modello lineare.
1. La struttura del modello i-s-u è indipendente dal numero delle variabili di ingresso e di
uscita, e quindi è la stessa sia per sistemi SISO (single input, single output) che per i
sistemi MIMO (multi inputs, multi outputs).
2. La conseguenza di 1 è che le proprietà di tali modelli possono essere definite e studiate
utilizzando le stesse metodologie, nei casi SISO e MIMO.
3. Il modello i-s-u consente di studiare in modo semplice la classe di sistemi reali a struttura
variabile, che possono essere descritti da una famiglia di modelli, ognuno dei quali
descrive il sistema reale in certe condizioni di funzionamento (vedi ad esempio i
convertitori DC/DC).
20
Cap. 2 Studio nel dominio del tempo di modelli i-s-u, lineari, stazionari, differenziali,
propri, a dimensioni finite e a tempo continuo.
x (t ) Ax (t ) Bu(t ) , (2.1.1)
y(t ) Cx (t ) Du(t ) , (2.1.2)
A : n n, B : n p, C : q n, D : q p .
Asserzione 2.1.1 Le risposte nello stato e nell’uscita all’istante t t0 corrispondente allo stato
iniziale x 0 all’istante t 0 e all’ingresso u[t0 ,t ] sono date da:
t
x (t ) (t, t0 , x0 , u[t0 ,t ) ) (t t0 ) x0 H (t )u( )d , (2.1.3)
t0
t
y(t ) (t, t0 , x0 , u[t0 ,t ] ) (t t0 ) x0 W (t )u( )d , (2.1.4)
t0
dove:
(t ) e At , H (t ) e At B, (t ) Ce At , W (t ) Ce At B D (t ) . (2.1.5)
e At [ x (t ) Ax (t )] e At Bu(t ) . (2.1.6)
d At
e x (t ) e At x (t ) e At Ax (t ) .
dt
d At
e x (t ) e At Bu(t ) . (2.1.7)
dt
t d A t
t e x ( )d e A Bu( )d ,
0 d t0
la cui soluzione è:
t
e At x (t ) e At0 x (t0 ) e A Bu( )d .
t0
t
x (t ) e A( t t0 ) x (t 0 ) e A( t ) Bu( )d , (2.1.8)
t0
Osservando che, per la proprietà campionatrice dell’impulso, Du(t ) può essere scritto come
segue:
t
Du(t ) Du( ) (t )d ,
t0
la (2.1.9) diviene:
t
y(t ) Ce A(t t0 ) x(t0 ) Ce A(t ) B D (t ) u( )d ,
t0
Si noti che la conoscenza della matrice esponenziale permette il calcolo di tutte le matrici
del modello esplicito. Inoltre, al fine di tenere conto di eventuali discontinuità e della presenza
di impulsi all’istante t 0 nella funzione d’ingresso, il limite inferiore di entrambi gli integrali è
esteso a t 0 , cioè a t0 con piccolo a piacere.
La matrice ( t ) viene denominata matrice di transizione di stato, mentre le matrici H (t )
e W (t ) vengono denominate, rispettivamente, matrice delle risposte impulsive nello stato e
matrice delle risposte impulsive nell’uscita o, più semplicemente, matrice delle risposte
impulsive.
22
t
x f (t ) (t, t 0 , 0, u[t0 ,t ) ) H (t )u( )d , (2.1.12)
t0
t
y f (t ) (t, t0 , 0, u[t0 ,t ] ) W (t )u( )d , (2.1.13)
t0
Osservazione (2.1.1). Le relazioni (2.1.3) e (2.1.4) mostrano che la linearità del modello
matematico implica che le due cause di evoluzione del sistema, cioè lo stato iniziale x 0 e
l’ingresso ut ,t danno luogo a due evoluzioni indipendenti fra loro, le risposte libera e
0
Osservazione (2.1.2). Dalle relazioni (2.1.3) e (2.1.4) si evince che la stazionarietà del
modello matematico implica che la risposta corrispondente allo stato iniziale x 0 all’istante t 0
e all’ingresso ut ,t si ottiene traslando di t 0 la risposta corrispondente allo stato x 0
0
all’istante 0 e all’ingresso Tt0 ut ,t . Infatti, con riferimento alla risposta nello stato, si ha:
o
t
(t ,0, x0 , Tt0 u[t0 ,t ) ) (t ) x 0 H (t )u( t 0 )d , (2.1.14)
0
t t0
Tt0 (t ,0, x0 , T t0 u[t0 ,t ) ) (t t 0 ) x0 H (t t 0 )u( t 0 )d , (2.1.15)
0
t
Tt0 (t ,0, x0 , Tt0 u[t0 ,t ) ) (t t0 ) x0 H (t )u( )d (t, t 0 , x0 , u[t0 ,t ) ) . (2.1.16)
t0
Osservazione (2.1.3). La struttura delle (2.1.3) e (2.1.4) rende immediata la verifica del
principio generalizzato di sovrapposizione degli effetti.
k [0 0 1 0 0]T
, (2.2.17)
k -esimo
23
xlk (t ) (t ) k k (t ) , (2.2.18)
u(t ) k (t ) , (2.2.19)
la risposta forzata nello stato, x f k (t ) , per la proprietà campionatrice dell’impulso, è data da:
t
x f k (t ) H (t ) k ( )d H (t ) k hk (t ) , (2.2.20)
0
H (t ) 0, t 0 , (2.2.21)
che è una conseguenza della proprietà di causalità del modello con lo stato. Infatti, tale
proprietà implica che l’effetto segue sempre la causa e, di conseguenza, la generica colonna k-
esima di H (t ) deve risultare nulla per tempi negativi che precedono l’applicazione
dell’ingresso.
In maniera del tutto analoga, la risposta libera nell’uscita corrispondente allo stato iniziale
(2.2.17), ylk (t ) , e la risposta forzata nell’uscita corrispondente all’ingresso (2.2.19), y f k (t ) ,
sono date da:
ylk (t ) (t ) k k (t ) , (2.2.21)
t
y f k (t ) W (t ) k ( )d W (t ) k w k (t ) . (2.2.22)
0
W (t ) 0, t 0 .
n
x(t ) ti xˆi (t ) ,
i 1
dove T è una matrice n n non singolare le cui colonne sono costituite dai vettori della base.
Gli elementi xˆ i (t ) di xˆ (t ) sono le componenti di x ( t ) nella base t i . Tali componenti
n
i1
1, i j
( rtj , ti ) rtjT ti , (2.3.2)
0, i j
n n
( rtj , x(t )) (rtj , ti xˆi (t )) ( rtj , ti xˆi (t )) ( rtj , t j xˆ j (t )) xˆ j (t )( rtj , t j ) xˆ j (t ) .
i 1 i 1
Osservazione (2.2.1) Si ricorda che se X è uno spazio vettoriale a dimensione finita, a tale
spazio si può associare l’operatore prodotto scalare, denotato con ( xi , x j ) , con
xi , x j X C n , che soddisfa le seguenti proprietà:
( x, x ) 0, x 0 ,
( xi , x j ) ( x j , xi )* ,
( xi , x j ) * ( xi , x j ) ,
( xi x j , xk ) ( xi , x j ) ( x j , xk ) .
( xi , x j ) ( x j , xi )* [ * ( x j , xi )]* ( x j , xi )* ( xi , x j ) .
25
ˆ ˆ (t ) Bu
xˆ (t ) Ax ˆ (t ) , (2.3.3)
y(t ) Cxˆ ˆ (t ) Du(t ) , (2.3.4)
dove:
Aˆ T 1 AT , Bˆ T 1B, Cˆ CT , Dˆ D . (2.3.5)
Inoltre, i modelli (2.1.1) - (2.1.2) e (2.3.3) - (2.3.4) sono equivalenti, nel senso che generano
le stesse coppie ingresso-uscita, e fra gli stati iniziali x0 e x̂0 vale la relazione invertibile
x0 Txˆ 0 .
t
xˆ (t ) ˆ (t, t0 , xˆ 0 , u[t0 ,t ) ) ˆ (t t0 ) xˆ 0 Hˆ (t )u( )d , (2.3.9)
t0
t
y(t ) ˆ (t, t0 , xˆ 0 , u[t0 ,t ] ) ˆ (t t0 ) xˆ 0 Wˆ (t )u( )d , (2.3.10)
t0
dove:
ˆ 1 ˆ2 2 1
ˆ (t ) e At I Aˆ t A t T 1T T 1 AT T 1 ATT 1 ATt 2
2! 2!
1
=T 1 ( I At A 2t 2 )T T 1e AtT ,
2!
26
(2.3.11)
Aˆ t
Hˆ (t ) e Bˆ T 1e AtTT 1B T 1e At B , (2.3.12)
ˆ
ˆ (t ) Cˆe At CTT 1e AtT Ce AtT , (2.3.13)
Aˆ t
Wˆ (t ) Cˆe Bˆ Dˆ (t ) CTT 1e AtTT 1B D (t ) Ce At B D (t ) W (t ) . (2.3.14)
La (2.3.10) mostra che x0 xˆ 0 T 1x0 tale che l’uscita del modello (2.1.1) e (2.1.2)
coincide con quella del modello (2.3.3) e (2.3.4) per tutte le funzioni di ingresso. Ovviamente,
vale anche il viceversa, cioè xˆ 0 x0 Tx0 tale che l’uscita del modello (2.1.1) e (2.1.2)
coincide con quella del modello (2.3.3) e (2.3.4) per tutte le funzioni di ingresso. Ciò implica
che la due rappresentazioni sono equivalenti.
Nel paragrafo precedente è stato mostrato che una trasformazione di coordinate nello
spazio di stato porta a un nuovo modello con lo stato equivalente a quello di partenza ma con
matrici Aˆ , Bˆ e Cˆ diverse dalle matrici A, B e C del modello di partenza. Scegliendo
opportunamente la base nello spazio di stato è possibile, in certe condizioni, pervenire a un
modello le cui matrici Aˆ , Bˆ e Cˆ aventi struttura conveniente per risolvere alcuni problemi di
analisi e sintesi. Tali modelli vengono denominati forme canoniche.
Nel caso di modelli con ingresso e uscita unidimensionali, le forme canoniche di interesse
sono la forma canonica di controllo, la forma canonica di osservazione e la forma canonica
diagonale.
0 1 0 0 0 0
0 0 1 0 0 0
A , b , (2.3.15)
0 0 0 0 1 0
a 0 a1 a 2 a n 2 a n 1 1
mentre la matrice c T è arbitraria. Gli elementi dell’ultima riga della matrice A sono i
coefficienti del polinomio caratteristico ( ) della matrice A, dato da:
a n 1 1 0 0 0 1
a 0 1 0 0 0
n 2
A , c , (2.3.17)
a1 0 0 0 1 0
a 0 0 0 0 0 0
mentre la matrice b è arbitraria. Gli elementi della prima colonna sono i coefficienti del
polinomio caratteristico ( ) dato dalla (2.3.16).
1 0 0
0 0
A 2 , (2.3.18)
0 0 n
mentre le matrici b e c T sono arbitrarie. Gli elementi della diagonale principale della matrice
(2.3.18) sono gli zeri del polinomio caratteristico (2.3.16), ovvero gli autovalori della matrice
A.
Osservazione 2.3.1 Come verrà illustrato nel seguito, l’esistenza di una trasformazione di
coordinate nello spazio di stato, che permetta di passare dal modello assegnato a una delle
forme canoniche mostrate in precedenza, è condizionata dal soddisfacimento di ben precise
condizioni sul modello di partenza.
Si ammetta che la matrice A abbia autovalori distinti. Ne consegue che il suo polinomio
caratteristico ( ) , ossia il determinante della matrice I A , è dato da:
28
n
( ) ( i ) ,
i1
dove le costanti i (i 1, , n) , cioè gli zeri del polinomio caratteristico, sono gli autovalori.
In tali condizioni, gli autovettori vi associati agli autovalori i , definiti come quei vettori non
nulli tali che:
Avi i vi , (2.4.1)
risultano linearmente indipendenti e possono quindi essere scelti come base per lo spazio di
stato X.
Ne consegue che il generico elemento x ( t ) dello spazio di stato può essere rappresentato
geometricamente come combinazione lineare degli autovettori, come segue:
n
x (t ) xˆ i (t )vi , (2.4.2)
i 1
xˆ1
xˆ
x (t ) v1 v 2 v n 2 Txˆ (t ) , (2.4.3)
ˆ
xn
T v1 v2 vn , (2.4.4)
xˆ (t ) xˆ1 xˆ 2 xˆ n .
T
La (2.4.3) stabilisce una trasformaione di coordinate dalla base arbitraria di partenza alla
base costituita dagli autovettori. La matrice T viene denominata matrice modale. Dal par.
(2.3.2) è noto che il modello matematico del sistema nella nuova base è dato dalle (2.3.6) e
(2.3.7) dove le matrici Aˆ , Bˆ e Cˆ assumono le espressioni seguenti.
Matrice Â
q1T
T 1 ,
q T
n
da cui deriva:
1, i j
qiT v j .
0, i j
Ne consegue che i vettori qi coincidono con i vettori coniugati della base reciproca della base
costituita dagli autovettori. Più pecisamente, denotando con ri i vettori della base reciproca, si
ha ri* qi i 1, , n , e quindi:
r1*T
T 1 . (2.4.5)
r *T
n
dove diag(1, n , , n ) .
Matrice B̂
B b1 b p ,
si ha:
( r1, b1 ) ( r1, b p )
Bˆ T 1B . (2.4.7)
( rn , b1 ) ( rn , b p )
30
Le (2.4.5) e (2.4.7) mostrano che la dinamica delle componenti di x ( t ) lungo gli auovettori
vi è espressa dalla relazione:
p
xˆ i (t ) i xˆ i (t ) ( ri , b j )u j (t ) , (2.4.8)
j 1
la quale mostra che le componenti del vettore di stato lungo gli autovettori evolvono
indipendentemente l’una dall’altra risultando, quindi, disaccoppiate. Tale evoluzione,
corrispondente allo stato iniziale xˆ 0 T 1x0 , è descritta dalla relazione:
p
xˆ i (t ) e it xˆ i 0 ( ri , b j ) e i ( t )u j ( )d ,
t
0
j 1
dove xˆ i 0 , componente di x 0 lungo vi , è data da xˆ i 0 ( ri , x0 ) . Ne consegue che:
p
xˆ i (t ) e it ( ri , x0 ) ( ri , b j ) e i (t )u j ( )d .
t
(2.4.9)
0
j 1
n n p
x (t ) e it ( ri , x0 )vi ( ri , b j )vi e i ( t )u j ( )d .
t
(2.4.10)
0
i 1 i 1 j 1
Ponendo nella (2.4.10) u(t ) 0 t , si ottiene la seguente espressione della risposta libera
nello stato:
n
xl (t ) e it ( ri , x0 )vi . (2.4.11)
i 1
La (2.4.11) mette in evidenza che la risposta libera nello stato corrispondente a un generico
stato iniziale x 0 è una combinazione lineare di modi elementari di evoluzione del sistema dati
da e it vi . I coefficienti di tale combinazione sono le componenti di x 0 lungo gli autovettori
vi . Il generico coefficiente ( ri , x0 ) viene denominato eccitazione del modo i dovuta allo stato
iniziale.
Ponendo nella (2.4.10) x 0 0 si ottiene la seguente espressione della risposta forzata nello
stato:
n p n p
x f (t ) e vi ( ri , b j ) ei u j ( )d , (2.4.12)
t t
( ri , b j )vi e i ( t )u j ( )d
i t
0 0
i 1 j 1 i 1 j 1
31
che mette in evidenza che i modi elementari del sistema influiscono anche sulla risposta
forzata ma in modo non lineare.
Sollecitando, adesso, il sistema con un ingresso u(t) avente componenti tutte nulle eccetto
la componente k-esima pari a un impulso localizzato nell’origine, si ha:
n n
x f k (t ) hk (t ) ( ri , bk )vi e i ( t ) ( )d ( ri , bk )e it vi ,
t
(2.4.13)
0
i 1 i 1
Teorema 2.4.1 Condizione necessaria e sufficiente affinché il modo i–esimo sia eccitabile
mediante impulsi in ingresso è che esista almeno una colonna della matrice B tale che risulti
(ri , bk ) 0 , ovvero si abbia ri*T B 0 .
Osservazione 2.4.2 I vettori della base reciproca dipendono dalla matrice A e, pertanto, la
condizione di eccitabilità dei modi è una proprietà di tipo strutturale che dipende, cioè, dalla
struttura del modello.
n n p p
y(t ) e it ( ri , x0 ) ( ri , b j ) e i (t )u j ( )d Cvi d j u j (t ) .
t
(2.4.14)
i 1 i 1 j 1
0
j 1
Ponendo nella (2.4.14) u(t ) 0 t , si ottiene la seguente espressione della risposta libera
nell’uscita:
n
yl (t ) e it ( ri , x0 )Cvi . (2.4.15)
i 1
La (2.4.15) mostra che assumendo che il modo i-esimo sia eccitato dallo stato iniziale x 0 ,
esso figurerà nella risposta libera nell’uscita se Cvi 0 . Tale modo evolve lungo il vettore
Cvi che può essere considerato come la proiezione di vi nello spazio di uscita.
Sussistono, in proposito, la seguente definizione e il seguente teorema.
Definizione 2.4.2 Un modo si dice osservabile attraverso l’uscita se compare nella espressione
della risposta libera nell’uscita.
32
Teorema 2.4.2 Condizione necessaria e sufficiente affinché il modo i–esimo sia osservabile
attraverso l’uscita è che risulti Cvi 0 .
Osservazione 2.4.2 I vettori della base dipendono dalla matrice A e, pertanto, la condizione di
osservabilità attraverso l’uscita è una proprietà di tipo strutturale che dipende, cioè, dalla
struttura del modello.
n p p
y f (t ) ( ri , b j )Cvi e i ( t )u j ( )d d j u j (t )
t
0
i 1 j 1 j 1
n p p
e itCvi ( ri , b j ) ei u j ( )d d j u j (t ) ,
t
(2.4.16)
0
i 1 j 1 j 1
da cui emerge che la risposta forzata nell’uscita dipende dai modi elementari del sistema in
maniera non lineare. Assumendo che l’ingresso abbia la forma u(t ) k (t ) , la (2.4.16) si
particolarizza come segue:
n
y f k (t ) wk (t ) ( ri , bk )e itCvi d k (t ) , (2.4.17)
i 1
la quale mostra che la k-esima colonna della matrice delle risposte impulsive, per t 0 , è una
combinazione linere di quei modi che risultano nel contempo eccitabili mediante impulsi in
ingresso e osservabili attraverso l’uscita. Inoltre, per t 0 , tal colonna contiene un impulso
nell’origine se d k 0 .
(ri , x0 )e it vi .
dove:
M k ( rka , x0 ) 2 ( rkb , x0 ) 2
(rk b ,x0 )
k arctg
(rk a ,x0 )
Ne consegue che:
avendo posto Ck 2 M k .
Se si ammette allora che, degli n autovalori della matrice A, siano reali e siano a coppie
complessi e coniugati, si ottiene:
x l (t ) Ri e it vi C k e k t [cos(k t k )v ka sin(k t k )vkb ] , (2.4.19)
i 1 k 1
t
Il modo aperiodico (ri , x0 )e i vi evolve lungo una traiettoria rettilinea, adagiata
t
sull’autovettore vi , con legge oraria definita dalla funzione aperiodica Ri e i , con
Ri ( ri , x0 ) . Tale traiettoria converge all’origine dello spazio di stato, degenera in un
34
i 0 i 0
i 0
i 0
Ri i 0
i 0
x 0
vi t
Il modo pseudoperiodico:
evolve nel piano individuato dai vettori reali vka e v kb ; le componenti del modo lugo tali
vettori evolvono con leggi orarie date dalle funzioni pseudoperiodiche:
Ck e k t cos(k t k ), Ck e k t sin(k t k )
che assumono l’andamento illustrato nella Fig. 2.4.1. Si osserva che il modo converge a zero,
diverge o oscilla in maniera persistene a seconda che k risulti minore di zero, maggiore di
zero o zero, rispettivamente. Inoltre, è facile verificare che il modo converge a zero o diverge
tanto più rapidamente quanto più risulta elevato il modulo di k .
2 2 10
8
1.5 1.5
6
1 1
4
0.5 0.5
2
0 0 0
-0.5 -0.5 -2
-4
-1 -1
-6
-1.5 -1.5
-8
-2 -2 -10
0 0.5 1 1.5 2 0 0.1 0.2 0.3 0.4 0.5 0 0.5 1 1.5 2
t [s] t [s] t [s]
k 2 k 0 k 0.8
vkb
k 0 k 0 k 0
nk
jk
k
k sin( k )
k
Fig. 2.4.3
36
1
0.1
0.7
0.5
ampiezza 0
-0.5
-1
0 2 4 6 8 10
t [s]
Fig. 2.4.4 Andamento della funzione e knk t sin(nk 1 k2 t ) per k pari a 0.1 e 0.7.
Il caso di autovalori multipli sarà trattato successivamente, nell’ambito dello studio dei
sistemi LTI nel dominio di s.
t
y f ( t ) = w( t ) u( ) d , (2.5.1)
0
dove w( t ) denota la risposta impulsiva che, come detto, è la risposta forzata nell’uscita
corrispondente a un ingresso costituito da un impulso di Dirac. La (2.5.1) mostra che la
risposta impulsiva è una risposta canonica poiché permette di calcolare la risposta forzata
nell’uscita corrispondente all’ingresso u ( t ) .
Si può dimostrare che i segnali ottenuti integrando ripetutamente l’impulso di Dirac, dati
da:
tk
( k 1) ( t ) = 1 ( t ) , (2.5.2)
k!
37
sono segnali canonici. Questi segnali, a differenza dell’impulso, sono realizzabili fisicamente
o approssimabili con segnali reali.
A titolo di esempio verrà considerata la risposta indiciale.
t t
w 1 ( t ) = w( t ) 1 ( ) d w( )d , (2.5.3)
0 0
0 t
poiché 1( ) = 1 per 0 e 0 w(t ) 1 ( )d è un infinitesimo rispetto a 0 w( )d .
1( t )
t
Fig. 2.5.1 Segnale a gradino unitario localizzato nell’origine.
La (2.5.3) mette in luce che la risposta impulsiva è la derivata (nel senso delle distribuzioni)
della risposta indiciale. Ne consegue che la (2.5.1) può essere scritta come segue:
d w 1( t )
t t d u( )
y f ( t) = u( ) d w 1( t ) d , (2.5.4)
0 d ( t ) 0 d
che mostra che è una risposta canonica poiché la sua conoscenza e quella dell’ingresso
permettono di determinare univocamente la risposta forzata nell’uscita corrispondente
all’ingresso. La derivata dell’ingresso che figura nella (2.5.4) va considerata “nel senso delle
distribuzioni”, il che implica che eventuali discontinuità nell’ingresso devono essere
considerate esplicitamente.
Esempio 2.5.1
Si consideri la funzione d’ingresso mostrata in fig. 2.5.2, avente una discontinuità nell’origine. In
accordo alla fig. 2.5.2, essa si può scomporre come segue:
u1( t )
u( t ) u(0 ) 1( t )
Fig. 2.5.2
38
u( t ) = u(0 ) 1( t ) + u1( t ) .
d u( t ) d u ( t)
= u(0 ) ( t ) + 1 .
dt dt
t d u( ) t d u ( t)
y f ( t ) w 1( t ) d w 1 ( t ) u(0 ) ( t ) + 1 d =
0 d 0 dt
t d u ( t)
u (0 ) w 1 ( t ) + + w 1 ( t ) 1 d .
0 dt
2.6 Linearizzazione
x (t ) f ( x (t ), u(t )) , (2.6.1)
y (t ) g ( x (t ), u(t )) . (2.6.2)
0 f ( x, u) , (2.6.3)
e che si desideri studiare il comportamento del sistema nell’intorno del succitato punto di
equilibrio. Tale studio può essere effettuato linearizzando il modello non lineare (2.6.1) -
(2.6.2) nell’intorno di esso e utilizzando le metodologie di studio per sistemi lineari.
Il sistema linearizzato corrispondente al sistema non lineare (2.6.1) - (2.6.2), si ottiene
come segue. Si assuma:
x (t ) x x (t ) , (2.6.4)
u(t ) u u(t ) , (2.6.5)
y (t ) y y (t ) . (2.6.6)
f f
x(t ) f ( x , u ) x x u u O f ( x, u) , (2.6.7)
x x x u x x
uu uu
g g
y y (t ) g ( x , u ) x x u u Og ( x, u) , (2.6.8)
x x x u x x
u u u u
f f g g
A( x , u ) , B( x , u ) , C ( x, u) x x , D( x , u ) ,
x x x u x x x x x u x x
u u u u u u u u
x (t ) A( x , u ) x B( x , u ) u , (2.6.9)
y (t ) C ( x , u ) x D( x , u ) u . (2.6.10)
40
APPENDICE A
Integrale di convoluzione
Siano f1 () e f 2 () due generiche funzioni del tempo definite nell’intervallo (, +). Si
definisce convoluzione delle due funzioni, o integrale di convoluzione, la funzione del tempo
data da:
f1 f 2 f1( ) f 2 (t ) d (A.1)
f1 f 2 f1 ( ) f 2 (t ) d f 2 f1 f1(t ) f 2 ( ) d , (A.2)
dk d k
f1 f 2( k ) f1( ) [ f ( t )] d f (k )
f d k [ f1( )] f 2 (t ) d (A.3)
d (t ) k
2 1 2
t
f1 f 2 f1 ( ) f 2 (t ) d f1 ( ) f 2 (t ) d (A.4)
0
Impulso di Dirac
(t t0 ) 0 t t0 , (A.5)
(t t0 )dt 1 . (A.6)
t0
Fig. A.2 Rappresentazione grafica di (t t0 ) .
41
1 (t t 0 ) 1 (t (t 0 ))
(t t 0 , ) . (A.7)
1
1 (t t0 )
t
t0
1
1 (t (t 0 ))
1/
t
t0 t0+
(t t 0 , )
1/
t
t0 t0+
lim (t t0 , ) (t t0 ) . (A.8)
0
t0 t0+
Si noti che la proprietà (A.6) vale anche per limiti di integrazione finiti, purché t0 sia
contenuto entro tali limiti. In particolare, si ha:
t 0 t t0
(t t0 )dt 1 t t0
,
da cui si ottiene:
42
t
(t t0 )dt 1(t t0 ) . (A.9)
Per mostrare che l’impulso è la derivata (nel senso delle distribuzioni) del segnale a
gradino, si può procedere nel modo seguente (vedi Giovanni Marro, Controlli Automatici, Ed.
Zanichelli). Nella Fig. A.5 e A.6 sono riportati gli andamenti dell’impulso rettangolare
(t t0 , ) di Fig. A.3 per 2 e 0.5 , rispettivamente. Inoltre, com’è facile verificare,
(t t0 , ) è la derivata del segnale a rampa lineare saturata. Ne consegue che, al tendere di
a zero, la rampa lineare saturata tende al gradino unitario e la sua derivata tende all’impulso
di Dirac. Quindi, si ha:
d
1 (t t0 ) (t t0 ) . (A.10)
dt
f (t ) f1(t ) [ f (t 0 ) f (t0 )] 1(t t0 ) ,
f (1) (t ) f1(1) (t ) [ f (t0 ) f (t0 )] (t t 0 ) .
f (t )
t
t0
f 1 (t )
t
[ f (t 0 ) f (t 0 )] 1(t t 0 )
Fig. A.7
t t t
2 (t t0 ) 1( t0 )d
( t0 )d , (A.11)
che è la funzione a rampa lineare localizzata all’istante t 0 ; integrando la (A.11) si ottiene una
funzione la rampa parabolica:
t t t t t
3 (t t0 )
1
( t0 )d ( t0 )d , (A.12)
Le funzioni a gradino, a rampa lineare e a rampa parabolica sono illustrate nella Fig. A.6,
assumendo t 0 0 .
f (t ) (t t0 ) f (t0 ) (t t 0 ) ,
f (t ) (t t0 )dt
f (t 0 ) (t t 0 )dt f (t 0 )
(t t 0 )dt f (t 0 ) , (A.13)
44
che esprime la proprietà campionatrice dell’impulso. Tale proprietà vale anche se i limiti di
integrazione sono finiti, purché contengano l’istante t 0 . Inoltre, essa vale anche per la
convoluzione di una funzione f (t ) continua in t e della funzione generalizzata ( t ) . Infatti,
si ha:
f f ( ) (t )d f (t ) ( )d f (t ) ( )d f (t ) (A.14)
a) b) c)
Fig. A.6 a) segnale a gradino; b) segnale a rampa lineare; c) segnale a rampa parabolica.
Oltre alla funzione a gradino a gradino, anche la funzione di Gauss data da:
1 (t t 0 ) 2
(t t 0 , ) exp 2
, (A.15)
2 2
soddisfa la (A.8) e può essere utilizzata per definire l’impulso di Dirac (cfr. Fig. A.7). Il
vantaggio di tale funzione è connesso al fatto che a partire dalle sue derivate e facendo
tendere a zero è possibile definire le derivate successive dell’impulso, come illustrato nella
Fig. A.8.
Matrice esponenziale
1 22 1 33 1 k k 1
e t 1 t
2!
t t
3!
k!
t k ! kt k . (A.16)
k 0
45
1 22 1 33 1 k k 1
e At I At
2!
At At
3!
k!
A t k ! Ak t k , (A.17)
k 0
che risulta convergente per tutti i t finiti. La matrice esponenziale soddisfa le proprietà:
1. det(e At ) 0, t ;
2. e A( t1 t2 ) e At1 e At2 , t1, t 2 ;
3. (e At ) 1 e At ;
d At 1 1
4. e A A 2t A3t 2 A k t k 1 Ae At e At A
dt 2! (k 1)!
5. e At e Bt e( A B)t , se AB BA .
1
3.1 Introduzione
Lo studio di un modello matematico nel dominio di s è di gran lunga più semplice di quello
nel dominio del tempo in quanto, con opportune operazioni, si riesce a trasformare il modello
costituito, in generale, da equazioni differenziali nel dominio del tempo in un modello costituito
da equazioni algebriche nel dominio della variabile complessa s. Tali equazioni possono essere
manipolate mediante operazioni algebriche. Poiché però il dominio in cui si riesce a interpretare
fisicamente un fenomeno è il dominio del tempo, occorrerà dopo adeguate manipolazioni
algebriche effettuare l’operazione inversa di trasformazione nel dominio del tempo (cf. Fig.
3.1.1)
Si considera insomma un sistema di equazioni differenziali, da cui, mediante particolari
funzioni come l’operatore trasformata di Laplace, si passa a un sistema di equazioni algebriche
nella variabile s, a cui corrisponde un insieme di risposte in t, ricavabile mediante l’operatore
inverso (fig. 37).
MODELLO
L [⋅] L−1 [⋅]
sistema di risposte
(equazioni equazioni in t
algebriche in
In questa Sezione viene illustrato un metodo di studio basato sull’impiego della trasformata
di Laplace, i cui elementi vengono presentati in Appendice 2, considerando modelli lineari e
stazionari dati da:
ɺx (t ) = Ax (t ) + Bu(t ) , (3.2.1)
y(t ) = Cx (t ) + Du(t ) . (3.2.2)
dove x (0) = x 0 .
( sI − A) X ( s ) = x 0 + BU ( s ) ,
X ( s ) = ( sI − A) −1 x 0 + ( sI − A) −1 BU ( s )
(3.2.5)
2
che sostituita nella (3.2.4) fornisce la seguente espressione della trasformata di Laplace
dell’uscita:
Y ( s ) = C ( sI − A) −1 x 0 + [C ( sI − A) −1 B + D]Us) . (3.2.6)
Trasformando, adesso, secondo Laplace le risposte nello stato e nell’uscita date da:
si ottiene:
X ( s ) = Φ ( s ) x 0 + H ( s )U ( s ) , (3.2.7)
Y ( s ) = Ψ ( s ) x 0 + W ( s )U ( s ) .
(3.2.8)
Φ ( s ) = ( sI − A) −1 ,
H ( s ) = ( sI − A) −1 B ,
Ψ ( s ) = C ( sI − A) −1 ,
W ( s ) = C ( sI − A) −1 B + D .
La matrice W(s) data dalla trasformata di Laplace della matrice delle risposte impulsive viene
denominata “matrice di trasferimento”
Dall’analisi precedente emerge che per il calcolo delle risposte libere e forzate nello stato e
nell’uscita occorre calcolare la matrice di transizione di stato Φ (t ) . Dalla formula di inversione
delle matrici, si ha:
( sI − A) a P ( s )
Φ ( s) = ( sI − A) −1 = = , (3.3.1)
∆( s) ∆( s)
dove:
∆ ( s ) = s n + a n −1s n −1 +⋯ a 0 ,
è il polinomio caratteristico della matrice A. Poiché gli elementi della matrice P(s) minori di
ordine n-1 della matrice (sI-A), essi sono polinomi di grado al più n-1. Ne consegue che P(s)
può esse scritto come segue:
P ( s) = Pn −1s n −1 +⋯ + P0 ,
3
dove le Pi ( s ) sono matrici di ordine n × n ad elementi costanti. Ne consegue che gli elementi
della matrice Φ ( s) sono funzioni razionali strettamente proprie di s e, come tali, possono essere
sviluppati in frazioni parziali.
Conviene osservare che il calcolo manuale di tali elementi risulta difficile per n ≥ 3 .
Pertanto, per valori elevati di n conviene eseguire il calcolo utilizzando adatti algoritmi. Un
algoritmo diffuso è quello di Souriaux-Faddeeva basato sulle seguenti formule ricorsive:
Pn − k = a n − k +1 I + APn − k +1 ,
1
a n − k = − tr ( APn − k ) ,
k
k = 2,⋯ , n ,
Pn −1 = I , a n-1 = −tr ( A) ,
essendo tr(Q) la traccia della matrice Q che è pari alla somma degli elementi della diagonale
principale. La correttezza dei risultati ottenuti può essere valutata verificando il
soddisfacimento della equazione:
a 0 I + AP0 = 0 .
n
∆ ( s ) = ∏ ( s − λi ) .
i =1
n Ri
Φ ( s) = , (3.3.2)
i =1 ( s − λi )
Ri = lim ( s − λi )Φ ( s ) .
s → λi
n
Φ (t ) = Ri e λit , (3.3.3)
i =1
4
n
x l (t ) = Ri x 0e λit , t ≥ 0 ,
i =1
(3.3.4)
dove i termini Ri x0e λit vengono ancora denominati modi elementari di evoluzione.
Nell’ipotesi, adesso, che i coefficienti del polinomio caratteristico siano reali, gli autovalori
sono reali e a coppie complessi e coniugati. Assumendo che gli autovalori reali e complessi
siano, rispettivamente, µ e 2ν , separando il contributo dei modi corrispondenti ad autovalori
reali, σ i , da quello dei modi corrispondenti alle coppie di autovalori complessi e coniugati,
λk = σ k + jωk e λk +1 = λk* = σ k − jωk , la (3.3.4) diviene:
µ ν
x l (t ) = Ri x 0eσ it + ( Rk x 0e λk t + Rk* x 0e λk t ),
*
(3.3.5)
i =1 k =1
dove si è tenuto conto del fatto che le matrici dei residui corrispondenti ad autovalori complessi
e coniugati sono a loro volta complesse e coniugate. Ponendo:
Rk = Rka + jRkb ,
µ ν
x l (t ) = Ri x 0eσ it + eσ k t [2 Rka x 0 cos(ωk t ) − 2 Rkb x 0 sin(ωk t )] . (3.3.6)
i =1 k =1
I termini:
Ri x 0eσ it ,
eσ k t [2 Rka x 0 cos(ω k t ) − 2 Rkb x0 sin(ω k t )] ,
e σ it ,
eσ k t cos(ωk t + ϕ k ) ,
r
∆(s) = ∏ (s − λi ) M i (3.3.7)
i =1
5
( sI − A) a
Φ ( s) = . (3.3.8)
∆( s )
Nel caso di autovalori multipli può accadere che esistano fattori comuni fra tutti gli elementi
della matrice ( sI − A) a e il polinomio caratteristico ∆(s) . Cancellando tali fattori, si ha:
Q( s)
Φ ( s) = , (3.3.9)
ψ ( s)
∆( s )
ψ ( s) = . (3.3.10)
m.c.d di tutti gli elementi di (sI − A) a
Il polinomio minimo ha gli stessi zeri del polinomio caratteristico ma con molteplicità inferiore
o, al più, uguale:
r
ψ ( s) = ∏ ( s − λi ) mi , (3.3.11)
i =1
dove mi ∈ [1, M i ] .
Lo sviluppo in frazioni parziali della matrice Φ ( s) è dato da:
r mi −1 Rik
Φ ( s) = ,
i =1 k = 0 ( s − λi ) k +1
(3.3.12)
dove:
1 d mi −1− k Q( s)
Rik = lim [( s − λi ) mi ].
s → λi ( mi − 1 − k )! ds i
m −1− k
ψ ( s)
r mi −1 t k λit
Φ (t ) = Rik e . (3.3.13)
i =1 k = 0 k!
r mi −1 t k λi t
xl (t ) = Rik x 0 e . (3.3.14)
i =1 k = 0 k!
Il generico termine:
mi −1 t k λit
xli (t ) = Rik x0 e , (3.3.15)
k =0 k!
6
Le matrici che compaiono nella rappresentazione esplicita del sistema nel dominio di s hanno
tutte struttura razionale fratta. In particolare:
Φ ( s ) = ( sI − A) −1 è strettamente propria;
H ( s ) = ( sI − A) −1 B è strettamente propria;
Ψ ( s ) = C ( sI − A) −1 è strettamente propria;
strettamente propria per D = 0
W ( s ) = C ( sI − A) −1 B + D è .
propria per D ≠ 0
Inoltre, si ha:
(sI − A) a
∆( s ) per autovalori distinti o multipli ma in assenza di fattori comuni
Φ ( s) = .
Q ( s )
per autovalori multipli e in presenza di fattori comuni
ψ ( s )
Conseguentemente, denominando poli di una matrice di funzioni di s gli zeri del minimo
denominatore comune di tutti gli elementi della matrice stessa, si ha che:
Risulta chiaro, quindi, che la matrice di trasferimento non contiene, in generale, tutte le
informazioni sul sistema.
In proposito, nel caso di autovalori distinti, si dimostra che fra i poli della matrice W ( s ) non
figurano gli autovalori di A che corrispondono a modi inosservabili attraverso l’uscita o non
eccitabili mediante impulsi in ingresso. Infatti, trasformando secondo Laplace la risposta
forzata nell’uscita (2.4.16), si ha:
n p p
1
Y f ( s ) = ( ri , b j )Cvi U j ( s ) + d jU j (t ) =
i =1 j =1 s − λi j =1
(3.3.1)
n
Cvi n (Cvi )( ri*T B)
s − λ ( ri , b1 ) ⋯ (ri , b p ) U ( s) + DU ( s) = s − λ + D U ( s)
i =1 i i =1 i
da cui si ottiene:
7
n
(Cvi )( ri*T B)
W ( s) = + D, (3.3.2)
i =1 s − λi
Quindi, se Cvi = 0 (modo i inosservabile) o ri*T B = 0 (modo i non eccitabile mediante impulsi
in ingresso) l’autovalore λ i non figura fra i poli di W(s).
2017/2018 1
Cap. 4
Le funzioni di s razionali fratte possono essere scritte, com’è noto, come segue:
l l −1
L( s )
bi s i L' ( s )
s l + bi' s i
i =0 i =0
W (s) = = n
= Kw = Kw n −1
, (4.1.1)
N ( s) N ' ( s)
ai s i s n + ai' s i
i =0 i =0
dove:
bl b ai
Kw = , bi' = i i = 1, l − 1, ai' = i = 1, l −1 .
an bl an
r mi −1
1
W ( s) = Rik (4.1.2)
i =1 k = 0 ( s − pi ) k +1
dove si è considerata una coppia di poli complessi e coniugati). Ovviamente, i coefficienti del
polo pi +1 sono i complessi coniugati dei coefficienti Rik , k = 1, , mi − 1 .
Ri 0 , Ri ,mi -1 j
pi
pi +1
Fig. 4.1.1 Rappresentazione poli e coefficienti relativa a una coppia di poli c.c. di molteplicità
mi .
Poiché questo tipo di rappresentazione non è basato sullo sviluppo in frazioni parziali,
esiste qualunque siano l e n . Essa assume due forma diverse a seconda che venga messo in
evidenza il fattore di trasferimento o il guadagno.
Tale rappresentazione si ottiene fattorizzando i polinomi L' ( s) e N ' ( s) . Assumendo che
L' ( s ) abbia r zeri di cui zeri reali, i , e coppie di zeri complessi e coniugati,
k jk , si ha:
r
L' ( s) = ( s − zi ) mi = ( s − i ) mi ( s − k − jk ) mk ( s − k + jk ) mk =
i =1 i =1 k =1
= ( s − i ) mi [( s − k ) 2 + k2 ]mk . (4.1.3)
i =1 k =1
Assumendo che N ' ( s) abbia r zeri di cui zeri reali, i , e coppie di zeri complessi e
coniugati, k jk , e assumendo che 1 = 0 , si ha:
r
N ( s ) = ( s − pi )
' mi
= (s − i ) mi
(s − k − jk ) m k ( s − k + jk ) mk =
i =1 i =1 k =1
= s m1 ( s − i ) mi [( s − k ) 2 + k2 ]mk . (4.1.4)
i =2 k =1
Assumendo che L' (s) e N ' (s) siano primi fra loro, la rappresentazione poli-zeri e fattore di
trasferimento della W(s) è allora data da:
2017/2018 3
r
( s − zi ) mi
( s − i ) m [( s − k ) 2 + k2 ]m
i k
i =1 i =1 k =1
W ( s) = K w r
= Kw
. (4.1.5)
( s − pi ) mi
s m1
( s − i ) [( s − k )
mi 2
+ k2 ]mk
i =1 i =2 k =1
La (4.1.5) suggerisce una rappresentazione grafica nel piano di Gauss ottenuta denotando gli
zeri con un cerchietto, i poli con una crocetta e indicando K w in un apposito riquadro. A
titolo di esempio, nella Fig. 4.1.2 è riportata la rappresentazione della funzione:
( s − 1)( s + 5) 3
W ( s) = 10 ,
s 2 ( s + 1 + j 3)( s + 1 − j 3)
Pole-Zero Map
3
2
K =10
w
1
Imaginary Axis
0
m=3 m=2
-1
-2
-3
-6 -5 -4 -3 -2 -1 0 1 2
Real Axis
Fig. 4.1.2
Ponendo:
1 k
Ti = − , nk = k2 + k2 , k = − ,
i nk
1
Ti = − , nk = k2 + k2 , k = − k ,
i nk
la (4.1.5) diviene:
2017/2018 4
1
( s + T ) m [s 2 + 2 knk s + nk2 ]m
i k
i =1 k =1
W ( s) = K w
i
. (4.1.6)
1
s ( s + ) mi [ s 2 + 2 knk s + nk
m1 2 mk
]
i =2 Ti k =1
1
T m nk2m
i
k
i =1 k =1
K gw = lim s m1W ( s ) = K w
i
, (4.1.7)
s →0 1
Tm i
nk
2 mk
i =1 i k =1
2 k s2
(1 + sTi ) mi [1 +
nk nk
2
s+ ] mk
W ( s ) = K gw i =1 k =1
, (4.1.8)
2 s 2
s m (1 + sTi ) m [1 + k s + 2 ]m
1 i k
i =2 k =1 nk nk
1
y0 = lim su0W ( s ) = K gwu0 .
s →0 s
2017/2018 5
W ( j) = W ( s) s = j .
W ( j ) = R( ) + jI ( ) = M ( )e j ( ) (4.2.1)
R ( ) = M ( ) cos[ ( )],
I ( ) = M ( )sin[ ( )],
M ( ) = R 2 ( ) + I 2 ( ),
I ( )
( ) = tg −1 ( ).
R ( )
R ( − ) = R ( ),
M ( − ) = M ( ),
I ( − ) = − I ( ),
( − ) = − ( ).
I ( ) M ( )
( )
R ( )
I diagrammi di Bode sono costituiti da due curve: la prima riporta il logaritmo del modulo
di W ( j ) in funzione del logaritmo di , la seconda riporta la fase sempre in funzione del
logaritmo di .
I diagrammi di Nyquist sono curve tracciate sul piano di Nyquist, avente per ascisse la
parte reale R ( ) e per ordinate la parte immaginaria jI ( ) . La variabile è l’ascissa
corrente sulla curva.
I diagrammi di Nichols sono delle curve tracciate sul piano di Nichols, avente per ascisse
la fase ( ) e per ordinate il logaritmo del modulo M () : anche in questo caso è l’ascissa
corrente sulla curva.
Di solito i moduli vengono espressi in decibel (dB) o in neper (nep), definiti come segue:
M db = 20log10 [ M ( )],
M nep = ln[ M ( )]
È opportuno premettere che il ricorso ai logaritmi nella costruzione dei diagrammi di Bode
consente sia di risolvere il problema della rappresentazione grafica di M (), ( ) e di ,
che sono suscettibili di variazioni molto ampie, sia di effettuare in modo semplice la
composizione dei diagrammi dei moduli di più funzioni.
Data, infatti, il modulo della funzione:
F2 ( j )
F ( j ) = F1 ( j ) ,
F3 ( j )
è dato da:
F2 ( j )
F ( j ) = F1( j ) ,
F3 ( j )
F ( j ) db = F1 ( j ) db + F2 ( j ) db − F3 ( j ) db ,
2 m 2 k
(1 + jTi ) mi [1 +
nk nk
2
] j − k
i =1 k =1
W ( j ) = K gw
. (4.2.2)
2 2
( j ) m (1 + jTi ) m [1 + k j − 2 ]m
1 i k
i =2 k =1 nk nk
Ponendo adesso:
Lm[W ( j )] = 20log10[ W ( j ] ,
2 k 2
Lm[W ( j )] = Lm[K gw ]+ mi Lm[1 + jTi ]+ m k Lm[1 + j − ] + m1Lm( j ) -1
i =1 k =1 nk nk
2
2 −1
2
+ mi Lm[(1 + jTi ) ]+ m k Lm 1 + k
-1
j − 2 (4.2.3)
i =1 k =1 nk nk
2 k 2
[W ( j )] = [K gw ]+ mi [1 + jTi ]+ m k [1 + j − ] + m1( j ) −1
i =1 k =1 nk nk
2
2 −1
2
+ mi [(1 + jTi ) ]+ mk 1 +
-1 k
j − 2 (4.2.4)
i =1 k =1 nk nk
Le (4.2.3) e (4.2.4) mettono in luce che i diagrammi del modulo e della fase di una
funzione possono essere ottenuti costruendo i diagrammi dei fattori che compongono la
funzione e componendo tali diagrammi eseguendo le operazioni in esse indicate. I fattori in
questione sono:
1
2 2
K gw , ( j ) , (1 + jTi ) , 1 + k j − 2
1 1
(4.2.5)
nk nk
Osservando che:
1
Lm[ F −1 ( j )] = 20log10 = −20log10 ( F ( j ) ) , (4.2.6)
F ( j )
1
[ F −1 ( j )] = = −F ( j ) , (4.2.7)
F ( j )
2017/2018 8
−1
2 2
K gw , ( j ) , (1 + jTi ) , 1 + k j − 2 .
−1 −1
(4.2.8)
nk nk
log10 ( )
0 1 2 3
1 10 100 10 3
Fattore guadagno K gw .
M dB = 20log10 (| K gw |) . (4.2.9)
0 K gw 0
= . (4.2.10)
180 K gw 0
I diagrammi del modulo e della fase del fattore guadagno per K gw 0 e K gw 0 sono
mostrati nelle Figure 4.2.3 e 4.2.4.
2017/2018 9
Bode Diagram
40
30
Magnitude (dB)
20
10
0
90
45
Phase (deg)
-45
-90
-135
-180
0 1
10 10
Frequency (rad/sec)
30
Magnitude (dB)
20
10
0
270
Phase (deg)
180
90
0
0 1
10 10
Frequency (rad/sec)
Fattore monomio, ( j ) −1 .
M dB = −20log10 ( ) . (4.2.11)
Nel piano (log10 ( ), M dB ) , ovvero nel piano (, M dB ) con scala delle ascisse logaritmica, la
(4.2.11) è rappresentata da una retta passante per il punto di coordinate (1,0). Al fine di
determinare la pendenza di tale retta, si osservi che nel diagramma del modulo la pendenza si
2017/2018 10
misura in decibel/decade (dB/dec), dove la decade viene definita come l’intervallo fra due
valori di , 1 e 2 1 , tali che 2 = 10 .
1
La pendenza della retta (4.2.11) si ottiene osservando che la variazione del modulo, M dB
corrispondente a una variazione di da 1 a 2 = 101 risulta:
2
M dB = −20 log10 ( 2 ) − ( −20 log10 (1 )) = −20 log( ) = −20 dB , (4.2.12)
1
= −90 ( 0 + , + ) . (4.2.13)
I diagrammi del modulo e della fase di n fattore monomio ( j ) −1 sono illustrati nella Fig.
4.2.5.
Bode Diagram
20
10
Magnitude (dB)
-10
-20
0
-45
Phase (deg)
-90
-135
-180
-1 0 1
10 10 10
Frequency (rad/sec)
Tenendo conto delle (4.2.6) e (4.2.7), i diagrammi di bode del fattore monomio al
numeratore ( j ) sono quelli illustrati nella Fig. 4.2.6. Il diagramma del modulo è costituito
da una retta passante per il punto (1,0) avente pendenza pari a +20 dB/dec . Il diagramma di
fase è costituito da un retta parallela all’asse delle , = +90 .
2017/2018 11
Bode Diagram
20
10
Magnitude (dB)
0
-10
-20
180
135
Phase (deg)
90
45
0
-1 0 1
10 10 10
Frequency (rad/sec)
Fig. 4.2.6 Diagrammi di Bode del fattore monomio ( j ) .
= −tg −1(Ti ) ,
− tg -1 (Ti ) Ti 0
= . (4.2.15)
+tg -1 ( | Ti |) Ti 0
Ne consegue che per Ti 0 il diagramma di fase è simmetrico rispetto all’asse delle del
diagramma corrispondente a Ti 0 . Nella Fig. 4.2.7 è riportato il diagramma del modulo e
della fase di un fattore binomio al denominatore con Ti = 10 .
2017/2018 12
Bode Diagram
0
System: W
-10 Frequency (rad/sec): 0.101
Magnitude (dB)
Magnitude (dB): -3.06
-20
-30
-40
0
Phase (deg)
-45
System: W
Frequency (rad/sec): 0.1
Phase (deg): -45
-90
-3 -2 -1 0 1
10 10 10 10 10
Frequency (rad/sec)
L’esame della Fig. 4.2.7 mostra che la curva del modulo presenta due asintoti, la retta di
1 1
equazione M dB = 0 , per , e un’altra retta di pendenza −20 db/dec per . Ciò
Ti Ti
può essere giustificato dalla (4.2.12), osservando che:
1
• per , (Ti ) 2 può essere trascurato rispetto a 1 e, pertanto, la (4.2.12) diviene:
Ti
M dB = 0 ; (4.2.16)
1
• per , 1 può essere trascurato rispetto a (Ti ) 2 e, pertanto, la (4.2.12) diviene:
Ti
M dB = −20log10 ( | Ti |) . (4.2.17)
1
= 0
Ti
; (4.2.18)
1
= −90
Ti
1
• la curva di fase passa per il punto di coordinate ( , −45 ) .
Ti
Al fine di associare al fattore binomio un diagramma asintotico della fase, i due asintoti
1
paralleli vengono raccordati mediante una retta passante per il punto ( , −45 ) e avente
Ti
pendenza pari a −45 / dec . I diagrammi asintotici del modulo e della fase di un fattore
binomio sono riportati nella Fig. 4.2.8.
-20
-40 -3 -2 -1 0 1
10 10 10 10 10
45
Fase [gradi]
0
-45
-90
-135 -3 -2 -1 0 1
10 10 10 10 10
Pulsazione [rad/s]
Fig. 4.2.8 Diagrammi asintotici del fattore (1 + jTi ) −1 con Ti 0 .
Può essere facilmente verificato che (cfr. successive Figg. 4.2.18 e 4.2.19):
Nella Fig. 4.2.9 sono riportati i diagrammi di bode del fattore (1 + jTi ) −1 con Ti = −10 .
L’esame delle Figg. 4.2.7 e 4.2.9 mostra che la curva del modulo è indipendente dal segno di
Ti , mentre la curva della fase è simmetrica, rispetto all’asse delle , di quella relativa a
2017/2018 14
Ti = +10 . Le stesse considerazioni valgono per i diagrammi asintotici. Per questi ultimi, si
osservi che il punto di rottura ha coordinate ( (1 Ti , 0) ).
Bode Diagram
0
System: W
Magnitude (dB) -10 Frequency (rad/sec): 0.101
Magnitude (dB): -3.04
-20
-30
-40
90
Phase (deg)
45
System: W
Frequency (rad/sec): 0.101
Phase (deg): 45.3
0
-3 -2 -1 0 1
10 10 10 10 10
Frequency (rad/sec)
Nella Fig. 4.2.10 soni riportati i diagrammi di bode del fattore (1 + jTi ) con Ti = +10 .
L’esame delle Figg. 4.2.7 e 4.2.10 mostra che i diagrammi di Bode del fattore binomio a
numeratore sono i simmetrici di quelli per lo stesso fattore binomio a denominatore.
L’esame delle Figg. 4.2.8 e 4.2.10 mostra che il diagramma di fase del fattore binomio a
denominatore con Ti 0 è lo stesso del diagramma di fase dello stesso fattore binomio con
Ti 0 ma a numeratore. In definitiva, un fattore binomio relativo a un polo positivo della
funzione di s, si comporta come tale con riferimento alla curva del modulo e come un fattore
relativo a uno zero negativo per quanto concerne la fase.
Bode Diagram
40
30
Magnitude (dB)
20
10
0
90
Phase (deg)
45
0
-3 -2 -1 0 1
10 10 10 10 10
Frequency (rad/sec)
Fig. 4.2.10 Diagrammi di Bode del fattore (1 + jTi ) con Ti = +10 .
2017/2018 15
−1
2 2
Fattore trinomio 1 + k j − 2 con k positivo o negativo.
nk nk
2
2 2 ,
2
M dB = −20log10 1 − 2
+ 4 (4.2.19)
nk
k 2
nk
e risulta indipendente dal segno di k . La fase del fattore trinomio è data da:
2 k 2
− tg −1 1 − 2
per k 0
nk nk
= , (4.2.20)
−1 2 | k | 2
tg 1 − 2
per k 0
nk nk
Bode Diagram
20
Magnitude (dB)
-20
-40
-60
-80
0
-45
Phase (deg)
-90
-135
-180
0 1 2 3
10 10 10 10
Frequency (rad/sec)
= 0 nk
; (4.2.23)
= −180
nk
Modulo M [db]
0
-20
-40 0 1 2
10 10 10
0
Fase [gradi]
-45
-90
-135
-180
0 1 2
10 10 10
Pulsazione [rad/s]
Fig. 4.2.12 Diagrammi asintotici di bode del fattore trinomio a denominatore;
k = 0.2 e nk = 10 rad/s .
Nella Fig. 4.2.13 sono riportati i diagrammi asintotici del fattore trinomio a denominatore
corrispondente a k = 0.4 e nk = 10 rad/s . Il confronto delle Figg. 4.2.12 e 4.2.13 mostra
che:
0
Modulo M [db]
-20
-40
0 1 2
10 10 10
0
Fase [gradi]
-45
-90
-135
-180
0 1 2
10 10 10
Pulsazione [rad/s]
• per k 0.707 la curva del modulo varia con andamento monotono decrescente (cfr.
Fig. 4.2.14)
Bode Diagram
0
-20
Magnitude (dB)
-40
-60
-80
0
-45
Phase (deg)
-90
-135
-180
-1 0 1 2 3
10 10 10 10 10
Frequency (rad/sec)
Nella Fig. 4.2.15 sono riportati i diagrammi di Bode del fattore trinomio per
k = −0.2 e nk = 10 rad/s . Il confronto delle Figg. 4.2.11 e 4.2.15 mostra che il modulo
rimane inalterato al variare del segno di k , mentre il diagramma di fase coincide con quello
di un fattore trinomio a numeratore con gli stessi valori di k e nk , ma con segno di
k opposto.
Infine, nelle Figg. 4.2.16 e 4.2.17 sono riportati i diagrammi di Bode del fattore trinomio a
denominatore i funzione di nk per diversi valori di k .
2017/2018 19
Bode Diagram
10
Magnitude (dB)
-10
-20
-30
-40
-180
-225
Phase (deg)
-270
-315
-360
0 1 2
10 10 10
Frequency (rad/sec)
10
0.2
0.3
0 0.4
0.5
0.6
-10 0.7
0.8
0.9
-20 1
-30
-40
-50
-60
-70
-80
-90
-2 -1 0 1 2
10 10 10 10 10
Fig. 4.2.16 Diagrammi asintotici normalizzati del modulo del fattore trinomio a
denominatore, M d B vs. n k .
Nella Fig. 4.2.18 è riportata una famiglia di curve, parametrizzate , che mostrano gli
scostamenti fra diagramma asintotico e diagramma effettivo per un fattore trinomio al
denominatore in funzione di n . L’esame di tali curve mostra che l’entità degli
scostamenti cresce al diminuire di k . La curva caratterizzata da k = 1 fornisce il doppio
degli scostamenti relativi a un fattore binomio al denominatore. Infatti, per k = 1 il fattore
trinomio diviene:
−1 −2
2 k 2 −2
1 + j − 2 = 1 j = (1 + j nk ) , (4.2.26)
nk nk nk
2017/2018 20
dove:
1 nk , k = 1;
Tnk = .
−1 nk , k = −1;
Nella Fig. 4.2.19 è riportata una famiglia di curve, parametrizzate , che mostrano gli gli
andamenti effettivi della fase per un fattore trinomio al denominatore in funzione di n . Si
precisa che la differenza fra le Figg. 4.2.17 e Fig. 4.2.19 è dovuta semplicemente alla diversa
risoluzione prevista per l’asse delle .
-10 0.2
0.3
-20 0.4
0.5
-30 0.6
-40 0.7
0.8
-50 0.9
1
-60
-70
-80
fase [gradi]
-90
-100
-110
-120
-130
-140
-150
-160
-170
-180
-2 -1 0 1 2
10 10 10 10 10
omega/omega n [rad/s]
Fig. 4.2.17 Diagrammi asintotici normalizzati della fase del fattore trinomio a
denominatore, vs. n k .
Le curve riportate nella Fig. 4.2.18 viene utilizzata per correggere il diagramma asintotico
di una funzione costituita da uno o più fattori, al fine di ottenere un diagramma prossimo a
quello effettivo. Le curve di Fig. 4.2.19 vengono utilizzate per tracciare i diagrammi effettivi
di fase di una funzione costituita da uno o più fattori. Ovviamente, l’utilità delle curve di
Figg. 4.2.18 e 4.2.19 cessa se si dispone di software adeguato per il tracciamento dei
diagrammi di Bode.
2017/2018 21
Fig. 4.2.18 Diagramma degli scostamenti fra diagramma asintotico del modulo e diagramma
effettivo del modulo per diversi valori di k , per un fattore trinomio al denominatore.
2017/2018 22
Fig. 4.2.19 Diagramma della fase di un fattore trinomio al denominatore per diversi valori di k .
2017/2018 23
Il diagramma di Bode del modulo di una generica funzione W ( j ) può essere ottenuto
costruendo prima il diagramma asintotico e, successivamente, correggendo tale diagramma
utilizzando le curve di Fig. 4.2.18.
Diagramma asintotico
Il diagramma asintotico del modulo può essere ottenuto costruendo quelli dei vari fattori
che compongono la funzione e, successivamente, componendoli fra loro come indicato in
precedenza. Dal punto di vista pratico questo metodo risulta insoddisfacente. Conviene,
infatti, costruire il diagramma asintotico direttamente.
Ciò può essere fatto osservando che:
1. gli unici due fattori che contribuiscono al modulo per tutti i valori di , da 0+ a + , sono
il guadagno K gw e il fattore monomio ( j ) m1 ;
2. il fattore binomio (1 + jTi ) mi fornisce un contributo diverso da zero soltanto a partire dal
punto di rottura 1 Ti , dato da una retta passante per il punto di rottura e inclinata di
20mi dB dec ;
3. il fattore trinomio fornisce un contributo diverso da zero soltanto a partire dal punto di
rottura nk , dato da una retta passante per il punto di rottura e inclinata di 40mi dB dec ;
Le considerazioni di cui al punto 1. mettono in luce che il primo tratto del diagramma di
Bode della funzione W ( j ) giace su di una retta passante per il punto di coordinate
Esempio 4.2.2
Si consideri la funzione:
10 (1 + j 0.01) ,
W ( j ) =
j (1 + j 0.1)
0
-20
-40
-60
0 1 2 3
10 10 10 10
Fase [gradi]
-90
-135
0 1 2 3
10 10 10 10
Pulsazione [rad/s]
Fig. 4.2.19 Diagramma asintotico della funzione dell’esempio 4.2.2
Il diagramma asintotico del modulo può essere corretto utilizzando le curve degli
scostamenti riportate nella Fig. 4.2.18. In particolare, poiché i fattori che compongono la
funzione sono fattori binomi, viene utilizzata la curva per k = 1 . Infatti, per k = 1 , il
fattore trinomio si riduce a un fattore binomio di molteplicità 2:
−1 −2
2 2 j
1 j − 2
= 1
nk nk nk
2017/2018 25
I ( ) = 0 ,
R ( ) = 0 ,
j I ( )
P
( )
M ( ) R ( )
Esempio 4.2.3 Tracciamento del diagramma polare della funzione W ( j) = W ( s) s = j , dove:
Kw
W ( s) = , p1, p 2 reali e negativi. (4.2.26)
( s − p1 ) ( s − p 2 )
j
j
Kw
2 1 kw
p2 p1
Kw
W ( j ) = , (4.2.27)
( j − p1 ) ( j − p 2 )
W ( j ) = − ( j − p1 ) − ( j − p 2 ) = − 1 − 2 , (4.2.28)
assumendo K w 0 .
Per → 0 + , i vettori ( j − p1 ) e ( j − p 2 ) sono adagiati sull’asse reale e diretti verso il
semiasse reale positivo (cfr. Fig. 4.2.20). Ne consegue che:
l i m W ( j ) = 0,
x →0 +
Kw . (4.2.29)
l i m+ W ( j ) = = K gw
x →0 p1 p 2
j
Kw
+
j0 kw
p2 p1
l i m W ( j ) = − 1 8 0 ,
x →+
. (4.2.30)
l i m W ( j ) = 0
x →+
j j
Kw
+
j0 kw
p2 p1
(1 − j 1 ) (1 − j 2 )
W ( j ) = K g w , (4.2.31)
(1 + 12 ) (1 + 22 )
dove:
T1 = − 1 p1, T2 = − 1 p 2 .
(T1 + T2 ) = 0 = 0,
I ( ) = 0 2 2
(4.2.32)
(1 + 1 ) (1 + 2 ) = = .
1
(1 − T1T 2 ) = 0 = ,
R( ) = 0 T1T2 (4.2.33)
(1 + 2 ) (1 + 2 ) = = .
1 2
La (4.2.33) mostra che il diagramma polare ha intersezioni con l’asse immaginario. Più precisamente,
1
il diagramma per 0 ha intersezione per = + , mentre quello per 0 ha intersezione
T1T2
1
per = − . Il diagramma qualitativo è riportato nella Fig. 4.2.22.
T1T2
I m [W ( j ) ]
R e [W ( j ) ]
+
0+
È opportuno, adesso, analizzare come si modifica il diagramma polare di Fig. 4.2.22 aggiungendo
un altro polo alla funzione di trasferimento (4.2.26), ottenendo così la funzione:
2017/2018 29
Kw
W ( s) = , p1, p 2 , p 3 reali e negativi. (4.2.34)
( s − p1 ) ( s − p 2 ) ( s − p 3 )
l i m W ( j ) = 0,
x →0 +
Kw , (4.2.35)
l i m+ W ( j ) = = K gw
x →0 p1 p 2 p 3
l i m W ( j ) = − 2 7 0 ,
x →+
. (4.2.36)
l i m W ( j ) = 0
x →+
Com’è facile verificale, la funzione (4.2.34) presenta, per 0 e per valori finiti di , una
intersezione sia con l’asse reale che con l’asse immaginario. Ne consegue che il diagramma polare
qualitativo della funzione (4.2.34) è quello di fig. 4.2.23.
L’esame della Fig. 4.2.23 mostra che l’aggiunta di un polo a una funzione comporta una rotazione
oraria di + 90 gradi per → + .
Si consideri, adesso, la funzione data da:
K w (s − z)
W ( s) = , p1, p 2 , p 3 , z reali e negativi. (4.2.37)
( s − p1 ) ( s − p 2 ) ( s − p 3 )
che differisce dalla funzione (4.2.34) per l’aggiunta dello zero s = z . L’esecuzione dei passi
a), b) e c) porta ai seguenti risultati.
j I ( )
R ( )
= +
= 0+
l i m W ( j ) = 0,
x →0 +
Kw z , (4.2.35)
l i m+ W ( j ) = = K gw
x →0 p1 p 2 p 3
l i m W ( j ) = − 1 8 0 ,
x →+
. (4.2.36)
l i m W ( j ) = 0
x →+
b.1) z p1 , p 2 , p 3 .
La distribuzione poli-zeri è mostrata nella Fig. 4.2.24. L’esame della Fig. 4.2.24 mostra
che per piccoli valori di il contributo di fase fornito dallo zero è maggiore di quello fornito
dai poli. Ne consegue che per piccoli valori di la fase della funzione è positiva, cresce a
partire da 0 + e fino a un certo valore di e, successivamente, decresce con andamento
monotono fino a − 1 8 0 . Il diagramma qualitativo risultante, per valori positivi di , è
quello di Fig. 4.2.25.
j
j
p3 p 2 p1 z
j I ( )
+ R ( )
+
0
Fig. 4.2.25 Diagramma polare corrispondente alla distribuzione poli-zeri di Fig. 4.2.24.
b.2) p1 p 2 z p 3 .
2017/2018 31
La distribuzione poli-zeri è mostrata nella Fig. 4.2.26. L’esame della Fig. 4.2.26 mostra
che per piccoli valori di il contributo di fase fornito dai poli p1 e p 2 è maggiore di
quello fornito dallo zero. Ne consegue che per piccoli valori di la fase della funzione è
negativa e decrescente. Se non ci fossero nè lo zero z né il polo p 3 , la fase decrescerebbe con
andamento monotono fino a − 1 8 0 . Per la presenza dello zero z, la fase aumenta e se non ci
fosse il polo p 3 tenderebbe a − 9 0 . A causa del polo p 3 la fase riprende a decrescere fino a
− 1 8 0 . Il diagramma qualitativo risultante è quello di Fig. 4.2.27. Si noti che la dentatura
presente nel terzo quadrante di solito non si evidenzia in modo così netto, dipendentemente
dalla distanza dello zero dai poli.
j
j
p3 z p2 p1
j I ( )
+ 0+
R ( )
b.3) p1 p 2 p 3 z .
La distribuzione poli-zeri è mostrata nella Fig. 4.2.28. L’esame della Fig. 4.2.28 mostra
che per piccoli valori di il contributo di fase fornito dai tre poli è maggiore di quello
fornito dallo zero. Ne consegue che per piccoli valori di la fase della funzione è negativa,
al crescere di decresce con andamento monotono da 0 + a un valore inferiore a − 1 8 0 e,
successivamente, cresce fino al valore − 1 8 0 . Il diagramma qualitativo risultante è quello di
Fig. 4.2.29. Si noti che la parte del diagramma presente nel secondo quadrante, di solito, non
si evidenzia in modo così netto, dipendentemente dalla distanza dello zero dai poli.
2017/2018 32
j
j
z p3 p2 p1
j I ( )
+ R ( )
0+
Dall’esame delle Figg. 4.2.25, 4.2.27 e 4.2.29 si nota che lo zero provoca un anticipo di
fase di 90° per elevati valori di . Nelle Figg. 4.2.30-4.2.32 sono riportati i diagrammi polari
della funzione 4.2.37 tracciati utilizzando Matlab.
-4
Nyquist Diagram x 10 Nyquist Diagram
1
0.8 2
0.6 1.5
0.4 1
Imaginary Axis
Real: -2.2e-005
Imag: -2.97e-005
0 0
Frequency (rad/sec): 2.94e+003
-0.2 -0.5
-0.4 -1
-0.6 -1.5
-0.8 -2
-1 -2.5
-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 -2.5 -2 -1.5 -1 -0.5 0
Real Axis Real Axis -4
x 10
0.01
0.8 System: W
Real: 1.47
Imag: 0.469
0.6
Frequency (rad/sec): 1.09
0.4 0.005
System: W
Real: 1
0.2 Imag: 0.0315
Imaginary Axis
Imaginary Axis
Frequency (rad/sec): 0.0375
0 0
System: W
-0.2 Real: -0.00105
System: W Imag: -0.000251
Real: 0.162 Frequency (rad/sec): 2.44e+004
-0.4 Imag: -0.572 System: W -0.005
Frequency (rad/sec): 187 Real: 1.92
-0.6 Imag: -0.326
Frequency (rad/sec): 11.4
-0.8 -0.01
-1
-1 -0.5 0 0.5 1 1.5 2 -14 -12 -10 -8 -6 -4 -2 0 2 4 6
Real Axis Real Axis -3
x 10
-5
Nyquist Diagram x 10 Nyquist Diagram
1
0.8 4
System: W
0.6 3
Real: -0.000177
Imag: 3.67e-005
2 Frequency (rad/sec): 519
0.4
1
0.2
Imaginary Axis
Imaginary Axis
0
0
-1
-0.2
-2
-0.4
-3
-0.6
-4
-0.8
-5
-1
-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 -9 -8 -7 -6 -5 -4 -3 -2 -1 0
Real Axis Real Axis -4
x 10
Una funzione complessa di variabile complessa s si dice a fase minima se non ha poli o
zeri sul semipiano destro. Una funzione complessa di variabile complessa si dice a fase non
minima se presenta qualche polo o zero a parte reale positiva. Corrispondentemente, un
sistema si dice a fase minima o non minima a seconda che la sua funzione di trasferimento
sia, rispettivamente, a fase minima o non minima.
Si osservi che una funzione a fase minima è tale che, fra tutte le funzioni che hanno lo
stesso modulo, ha la fase più piccola. Si consideri, in proposito, l’esempio 4.2.4.
Esempio 4.2.4
j j
p z p -z
a) b)
s−z
Wa = , z 0, p 0 , (4.2.37)
s− p
s+z
Wb = , z 0, p 0 . (4.2.38)
s− p
1. denominazione
-5
modulo [dB
-10
]
Wb
Wa
-15
-20 -3 -2 -1 0 1 2
10 10 10 10 10 10
omega [rad/s]
Fig. 4.2.34 Modulo vs. : z = 2, p = −20 .
180
Wb
160 Wa
140
120
fase [gradi]
100
80
60
40
20
0 -3 -2 -1 0 1 2
10 10 10 10 10 10
omega [rad/s]
Fig. 4.2.35 Fase vs. : z = 2, p = −20 .
2017/2018 35
Le risposte indiciali dei sistemi descritti dalle funzioni di trasferimento a fase minima e
non minima, Wb ( s) e Wa ( s ) , rispettivamente, sono date da:
z z
w−1,a (t ) = + (1 − )e pt , t 0 , (4.2.39)
p p
z z
w−1,b (t ) = − + (1 + )e pt , t 0 , (4.2.40)
p p
Step Response
0.8
0.6
Amplitude
0.4
0.2
-0.2
0 0.05 0.1 0.15 0.2 0.25 0.3
Time (sec)
Step Response
1.2
0.8
0.6
Amplitude
0.4
0.2
-0.2
0 0.05 0.1 0.15 0.2 0.25 0.3
Time (sec)
L’esame delle Figg. 4.2.36 e 4.2.37 mostra che il sistema a fase non minima presenta una
risposta indiciale che inizialmente evolve nella direzione opposta a quella di regime.
Il controllo perfetto è un controllo che consente di ottenere istante per istante la risposta
desiderata. Si supponga, ad esempio, che la risposta desiderata sia data da
2017/2018 36
1 s−z
Yd ( s) = = U (s) . (4.2.41)
s +1 s − p
2
s− p
U (s) = . (4.2.42)
( s + 1)( s − z ) 2
Per il sistema a fase non minima (4.2.39) ciò è possibile se esiste un ingresso u (t ) tale che:
1 s−z
Yd ( s) = = U (s) . (4.2.43)
s +1 s − p
2
s− p
U (s) = . (4.2.44)
( s + 1)( s − z )
2
Gli andamenti dell’ingresso per i due sistemi sono illustrati nelle Figg. 4.2.38 e 4.2.39.
L’esame della Fig. 4.2.38 mostra che l’ingresso che consente al sistema a fase non mimima di
inseguire perfettamente l’uscita desiderata, diverge e, quindi, non esiste. L’esame della Fig.
4.2.39 mostra che l’ingresso che consente al sistema a fase non mimima di inseguire
perfettamente l’uscita desiderata, converge a una sinusoide e, quindi, può essere costruito in
laboratorio.
9
x 10
2.5
1.5
u(t)
0.5
0
0 1 2 3 4 5 6 7 8 9 10
t [s]
Fig. 4.2.38 Andamento dell’ingresso per il sistema a fase non minima.
2017/2018 37
10
u(t)
0
-5
-10
0 1 2 3 4 5 6 7 8 9 10
t [s]
Fig. 4.2.39 Andamento dell’ingresso per il sistema a fase minima.
4. Ricostruzione della fase di una funzione a partire dal modulo della funzione stessa
Si può dimostrare che per una funzione a fase minima è possibile ricostruire la fase della
funzione a partire dal modulo della funzione stessa. Infatti sussiste il Teorema di Bode che
afferma che per tali sistemi esiste la seguente relazione fra modulo e fase:
dQ + dQ dQ
(0 ) = + − ln cot gh . (4.2.45)
2 d =0 − d d =0 2
dove Q = ln( M ( )) , = ln e ln cot gh è la funzione diagrammata qualitativamente
0 2
dQ
nella Fig. 4.2.40. Si noti che è la pendenza del diagramma del modulo valutata per un
d
generico valore di .
lncoth(|m|/2)
− − − −
m
m
Fig. 4.2.40 Andamento della funzione ln cot gh .
2
2017/2018 38
dQ d log( M ( )) dM dB )
(0 ) = = = . (4.2.46)
2 d =0 2 d log( ) = 40 d log( ) =
0 0
1
2013/2014
Cap. 5
q T A
Fig. 5.1.1 Schema di un sistema per la produzione dell’energia elettrica.
k p
Yi ( s) = Tij (s) Y j (s) + Tij' ( s) U j ( s), i = 1, k, (5.1.1)
j =1 j =1
Il nome di formulazione causa – effetto dipende dal fatto che la grandezza dipendente al
primo membro può essere interpretata come l’effetto delle variabili al secondo membro che
acquistano così il significato di cause. I coefficienti Tij ( s ) e Tij' ( s) si chiamano trasferenze e
2
2013/2014
Esempio 5.1.1
Si consideri il seguente modello matematico di un sistema reale nel dominio del tempo:
Ay1 + B y1 + Cy1 − Dy2 = Fu1 .
(2) (1)
(5.1.2)
Py2 + Hy2 + Ky1 = − Ju1
(2) (1) (1)
As Y1 ( s ) + BsY1 ( s ) + CY1 ( s ) − DY2 ( s ) = FU1 (s )
2
2 (5.1.3)
Ps Y2 ( s ) + HsY2 ( s ) + KY1 ( s ) = − JsU1 (s )
dove:
D F
T12 ( s) = '
, T11 ( s) = ,
A s + B s+ C
2
A s + B s+ C
2
K Js
T21 ( s) = − '
, T21 − .
Ps + Hs
2
Ps + Hs
2
Bisogna osservare che, data l’arbitrarietà con cui è possibile risolvere le k equazioni che
governano il sistema, si può pervenire a diverse formulazioni causa – effetto; quindi a un
modello matematico si possono associare diversi schemi funzionali. Tutti gli schemi
funzionali associabili allo stesso modello matematico sono equivalenti fra loro, nel senso che
hanno in comune le grandezze d’ingresso, le grandezze d’uscita e le relazioni che intercorrono
fra esse.
Allo scopo di rappresentare graficamente le equazioni della forma causa – effetto (5.1.1), è
necessario scegliere dei simboli per rappresentare le grandezze e i legami matematici fra esse.
Gli schemi funzionali più utilizzati sono gli schemi a blocchi e i grafi di flusso.
Yj−1 +
+ Yi = Yj−1 + Yj − Yj+1 c) BLOCCO SOMMATORE
Yj − Yi
Yj+1
Yi
d) PUNTO DI DIRAMAZIONE
Yi Yi
Yi
Fig. 5.1.1 Convenzioni adottate per gli schemi a blocchi.
Può essere data, infine, la seguente definizione di schema a blocchi. Si dice schema a
blocchi un insieme di blocchi moltiplicatori e di blocchi sommatori, collegati fra loro da
segmenti orientati, sui quali possono esistere dei punti di diramazione. I blocchi
moltiplicatori, i blocchi sommatori e i punti di diramazione sono denominati elementi
fondamentali dello schema a blocchi. Lo schema a blocchi corrispondente all’esempio 5.1.1 è
quelo riportato nella Fig. 5.1.2.
T12 (s)
U1 ( s ) + + Y1 ( s ) T12 (s)
T11' (s)
(s) +
+
T21 (s)
T21 (s) + Y2 ( s)
'
T21 ( s)
(s)
Fig. 5.1.2 Schema a blocchi corrispondente al modello (5.1.4).
4
2013/2014
PROCEDIMENTI DI SPOSTAMENTO
Quale che sia l’elemento fisso, il blocco moltiplicatore scompare dal segmento in cui si
trovava nello schema di partenza e compare nello schema equivalente su tutti gli altri
segmenti orientati facenti capo all’elemento fisso. La trasferenza da associare ad ogni
nuovo blocco è la stessa del blocco spostato o la sua inversa a seconda che, considerando
un percorso attraverso l’elemento fisso, il segmento comune e quello che si considera
hanno verso concorde o discorde (cfr. Fig. 5.1.3 e 5.1.4 a) e b)).
b
G1−1
− b −
a + + d a + d
G1 G1
+ +
c G1 −1
1 1
d = G1 a – b + c c d=[ c+a– b]G1
G1 G1
b b
G1
a a G1 G1−1
a a
S2
S1 S2 S2 S1
a + d a + d a + d
+ +
− + + − −
b c c b b S1
+
a–b+c=d (a + c) – b = d c
a + (c – b) = d
Il blocco da spostare scompare dal segmento su cui era e compare su tutti gli altri
segmenti che fanno capo al punto di diramazione (fig. 82). Anche in questo caso per
assegnare correttamente i segni ai segmenti entranti nei blocchi sommatori basta tener
conto delle condizioni di equivalenza.
+ b
+
b
+ + b
a + +
a
PROCEDIMENTI DI SOSTITUZIONE
Sostituzione di parte dello schema costituita da soli blocchi sommatori con un unico blocco
sommatore
La sostituzione avviene con un blocco sommatore che ha tutti i segmenti d’ingresso della
parte di schema a blocchi di partenza, esclusi i segmenti comuni a due blocchi sommatori (cfr.
Fig. 5.1.6).
c
+
b c
b + e +
+ − f d +
+ f
a + −
d + +
a e
+ f=a+b+c+d–e
f = [(b + c) + (a + d)] – e
Fig. 5.1.6 Sostituzione di parte di schema costituita da blocchi sommatori con un blocco
sommatore
Sostituzione di parte dello schema costituita da soli blocchi moltiplicatori connessi in cascata
con un unico blocco moltiplicatore e viceversa
a b a b
G1 G2 G1G2
b = G2 (G1 a) b = (G1G2) a
Fig. 5.1.7 Sostituzione diparte dello schema costituita da blocchi moltiplicatori in cascata con
un blocco moltiplicatore
a b a b
G1 G1/G2 G2
b = G1 a b = G2 (G1/G2) a
Fig. 5.1.8 Sostituzione di un blocco moltiplicatore con due blocchi moltiplicatori in cascata.
7
2013/2014
Sostituzione di parte dello schema costituita da uno schema elementare a controreazione con
un unico blocco moltiplicatore
Lo schema elementare a controreazione è illustrato nella Fig. 5.1.9. A tale schema è possibile
sostituire uno schema equivalente costituito da un unico blocco moltiplicatore, la cui
trasferenza W(s) è data da:
G ( s)
W ( s) = . (5.1.5)
1 G( s) H ( s)
U + Ud Y
G
Yc
H
Fig. 5.1.9 Schema elementare a controreazione.
La (5.1.5) può essere verificata associando il seguente modello allo schema di Fig. 5.1.9:
U d = U Yc = U HY
(5.1.6)
Y = GU d = G (U HY )
Y (1 GH ) = GU ,
e quindi:
G
Y= U = WU .
1 GH
Sia dato lo schema a blocchi di Fig. 5.1.10, costituito da tre blocchi moltiplicatori in
parallelo. Tale schema è equivalente a un blocco moltiplicatore avente trasferenza G(s) data
da:
G(s) = G1 ( s) + G2 ( s) − G3 ( s) . (5.1.7)
G1
a + b
G2
+
G3 -
Infatti, si ha:
Cap. 6
Nell’ambito dello studio dei modelli LTI, sono di notevole interesse pratico i seguenti tre
problemi.
I tre problemi enunciati trovano soluzione nell’ambito dello studio delle proprietà
strutturali di raggiungibilità, o di interazione fra ingresso e stato, e di osservabilità, o di
interazione fra stato e uscita. In particolare, il problema 1) ammette soluzione se il modello
soddisfa la proprietà di raggiungibilità, il problema 2) ammette soluzione se il modello
soddisfa la proprietà di osservabilità e il problema 3) ammette soluzione se il modello
soddisfa le proprietà di controllabilità e osservabilità.
x (t ) = Ax (t ) + Bu(t ) , (6.1.1)
y(t ) = Cx (t ) + Du(t ) , (6.1.2)
dove:
x(t ) C n , u(t ) R p , y(t ) Rq ,
A : n n , B : n p , C : q n, D : q p .
Definizione 6.1.1
Uno stato x C n si dice raggiungibile (dallo stato zero) se esistono un istante di tempo
finito t f e un segmento di ingresso u[0,t f ] ,in grado di trasferire il sistema dallo stato zero
all’istante zero nello stato x all’istante t f . In simboli, si ha:
x (t f ) = (t f , 0, 0, u[0,t f ] ) = x . (6.1.3)
2
2014/2015
L’insieme degli stati raggiungibili dallo stato zero, X r , è un sottospazio lineare dello
spazio di stato. L’insieme degli stati non raggiungibili, X − X r , non è un sottospazio dello
spazio di stato poiché non contiene l’elemento nullo, ossia lo stato zero. Però, per definizione,
si assume come insieme degli stati non raggiungibili il complemento ortogonale del
sottospazio X r , cioè X r⊥ che contiene lo stato zero. Lo spazio di stato è allora dato da
X = X r X nr , dove denota l’operatore “somma diretta”, che esprime il fatto che un
generico elemento x X si può esprimere come x = xr + xnr , con xr X r e xnr X nr .
Definizione 6.1.2
Il sistema (6.1.1)-(6.1.2) si dice raggiungibile se tutti i suoi stati sono raggiungibili.
Le condizioni per la raggiungibilità del sistema sono espresse dal seguente Teorema.
Teorema 6.1.1
Il sistema (6.1.1)-(6.1.2) è raggiungibile se e solo se le righe della matrice e − At B sono
linearmente indipendenti in un intervallo arbitrario [0, t f ] .
Prova
Sufficienza Si ammetta che le righe di e − At B siano linearmente indipendenti t [0, t f ] . In
tali condizioni, esiste un ingresso u[0,t f ] che trasferisce il sistema dallo stato zero all’istante
zero nello stato x all’istante t f . In simboli, si ha:
tf A(t f − )
x= 0 e Bu( )d . (6.1.4)
Infatti, ponendo:
u( ) = (e − A B ) T k , (6.1.5)
dove k è un vettore n 1 ad elementi costanti, e sostituendo tale ingresso nella (6.1.4), si ha:
tf tf
0 e− A Bu( )d = e 0 e− A BB T e− A kd ,
At f At f T
x=e
− At f
da cui, premoltiplicando ambo i membri per e , si ottiene:
− At f tf
0 e − A BB T e − A d k .
T
e x= (6.1.6)
Se le righe della matrice e− At B sono linearmente indipendenti, l’integrale entro parentesi
quadra risulta invertibile. Infatti, se l’integrale in questione fosse singolare esisterebbe un
vettore 0, n 1 , tale che:
tf
0 e − A BB T e − A d = 0 .
T
(6.1.7)
3
2014/2015
tf tf 2
0 ( T e− A B)( T e− A B)T d = 0 T e− A B d = 0 . (6.1.8)
−1
tf − At
0 e− A BBT e− A d e f x .
T
k= (6.1.9)
Necessità Si dimostra per assurdo ammettendo che il sistema sia raggiungibile e che le righe
della matrice e− At B siano linearmente dipendenti.
T e− At B = 0 T , t [0, t f ] . (6.1.10)
Tale vettore non può essere raggiunto dallo stato zero. Infatti, se esistesse un vettore di
ingresso in grado di trasferire il sistema dallo stato zero all’istante zero allo stato all’istante
t f , risulterebbe:
tf A(t f − ) tf
= e Bu( )d = 0 e A Bu(t f − )d . (6.1.11)
0
tf
T = 0 ( T e A B)u(t f − )d = 0, t [0, t f ] .
2
= (6.1.12)
Poiché le condizioni espresse dal precedente Teorema 6.1.1 sono difficili da verificare,
risulta utile fornire il seguente Criterio di Raggiungibilità, che si fornisce senza
dimostrazione.
Qr = B AB An −1B , (6.1.13)
ha rango pari a n.
4
2014/2015
ˆ ˆ (t ) + Bu
xˆ (t ) = Ax ˆ (t ) , (6.1.14)
y(t ) = Cxˆ ˆ (t ) + Du(t ) , (6.1.15)
dove:
ˆ = T −1 AT , Bˆ = T −1B, Cˆ = CT .
A
Qˆ r = Bˆ ˆˆ
AB Aˆ n −1Bˆ = T −1B T −1 AB T −1 An −1B = T −1Qr . (6.1.16)
Si ammetta, adesso, che il modello (6.1.1) e (6.1.2) non sia raggiungibile. In tal caso,
sussiste il seguente Teorema.
Aˆ Aˆ12 ˆ Bˆ1 ˆ
Aˆ = 1 , B = , C = Cˆ1 Cˆ 2 ,
ˆ
0 A2 0
con Aˆ1 C nr nr , Aˆ 2 C ( n −nr )( n −nr ) , Bˆ1 C nr p , 0 C ( n − nr ) p , Cˆ1 C qnr , and Cˆ 2 C q( n −nr )
Inoltre, la matrice Qˆ1r = Bˆ1 Aˆ1Bˆ1 Aˆ1nr −1Bˆ1 ha rango nr .
Per costruire la matrice Tr , basta scegliere le prime nr colonne coincidenti con nr colonne
linearmente indipendenti della matrice Qr , e le rimanenti (n − nr ) colonne ortogonali alle
precedenti e tali da formare con esse un insieme di vettori linearmente indipendenti.
T
Il Teorema 6.1.2 mette in luce che partizionando il vettore di stato xˆ = xˆ1T xˆ 2T con
xˆ1T C nr e xˆ 2T C ( n − nr ) , il modello diviene:
L’insieme degli stati raggiungibili è quello caratterizzato da xˆ 2 = 0 . In tal caso, infatti, risulta
ˆ
xˆ 2 (t ) = e A2t 0 = 0 , e il modello (6.1.17) si riduce al modello raggiungibile:
Conviene, adesso, osservare che la proprietà di raggiungibilità degli stati è legata alla
proprietà di eccitabilità dei modi mediante impulsi in ingresso. Sussiste, infatti, il Teorema
che segue.
Sia dato un modello LTI nel quale la matrice dinamica abbia autovalori distinti. Allora, tutti i
modi elementari di evoluzione del modello sono eccitabili mediante impulsi in ingresso se e
solo se esso risulta raggiungibile.
Definizione 6.2.1 Uno stato x C n si dice controllabile (allo stato zero) se esistono un
istante di tempo finito t f e un segmento di ingresso u[0,t f ] ,in grado di trasferire il sistema
dallo stato zero x all’istante zero nello stato 0 all’istante t f . In simboli, si ha:
(t f , 0, x, u[0,t f ] ) = 0 . (6.2.1)
Definizione 6.2.2 Un sistema astratto si dice controllabile se tutti i suoi stati sono controllabili.
Qc = B AB An −1B , (6.2.2)
ha rango n.
La proprietà di osservabilità studia le interazioni fra stato e uscita. Tale proprietà verrà
studiata con riferimento ai sistemi LTI.
Definizione 6.3.1 Uno stato x C n si dice inosservabile se la risposta libera nello stato
corrispondente a tale stato è identicamente nulla. In simboli, si ha:
Ce At x = 0, t 0 . (6.3.1)
6
2014/2015
Teorema 6.1.2 Un sistema LTI è osservabile se e solo se le colonne della matrice Ce At sono
linearmente indipendenti nell’intervallo [0, t f ] arbitrario.
Prova
Sufficienza Se le colonne della matrice Ce At sono linearmente indipendenti nell’intervallo
[0, t f ] , con t f arbitrario, la condizione Ce At = 0 implica = 0 e, quindi, solo lo stato zero è
inosservabile.
Necessità Si ammetta che il modello LTI sia osservabile e che le righe della matrice Ce At
siano linearmente dipendenti. Allora, esisterebbe un n-vettore 0 tale che Ce At = 0 , il
che contrasta con l’ipotesi di osservabilità del modello.
Le condizioni espresse dal Teorema 6.1.2 possono essere facilmente verificate mediante il
seguente criterio di osservabilità.
C
CA
Qo = , (6.3.2)
n−1
CA
ha rango uguale a n.
Prova Al fine di verificare l’asserto occorre e basta utilizzare il criterio di osservabilità 6.1.4.
Effettuando la trasformazione di coordinate x = Txˆ , le (6.1.1) e (6.1.2) si trasformano nelle
(6.1.14) e (6.1.15). La corrispondente matrice di osservabilità è data da:
7
2014/2015
Cˆ CT
CAˆ ˆ CAT
ˆ
Qo = =Q T .
= o (6.3.3)
ˆ ˆ n−1 CAn−1T
CA
Proprietà 6.3.1. Lo spazio di stato di un sistema osservabile è ridotto, ossia privo di coppie di
stati equivalenti.
Prova della Proprietà 6.3.1 Si dimostra per assurdo ammettendo che il sistema sia osservabile
e che esista una coppia di stati equivalenti. Per sistemi LTI la Definizione 6.3.1, tenuto conto
del fatto che si può assumere t0 = 0 e che la risposta nell’uscita è data dalla somma delle
risposte libera e forzata, la (6.3.4) si riduce alla espressione:
Ce At xa = Ce At xb ,
da cui si ottiene:
Ce At ( xa − xb ) = 0 . (6.3.5)
Si ammetta, adesso, che il modello (6.1.1) e (6.1.2) non sia osservabile. In tal caso, sussiste
il seguente Teorema.
Aˆ 0 ˆ Bˆ1 ˆ
Aˆ = 1 , B = , C = Cˆ1 0 ,
Aˆ 21 ˆ
A2 Bˆ 2
8
2014/2015
con Aˆ1 C no no , Aˆ 2 C ( n −no )( n −no ) , Bˆ1 C no p , Bˆ 2 C ( n − no ) p , Cˆ1 C qno . Inoltre, la matrice
Qˆ1To = Cˆ1T Cˆ1T Aˆ1T Cˆ1T Aˆ1T ( no −1) ha rango no .
Le (6.3.6)-(6.3.8) mostrano che dal punto di vista ingresso-uscita il modello del sistema
potrebbe essere rappresentato dal modello osservabile (6.3.6) e (6.3.8).
Conviene, adesso, osservare che la proprietà di osservabilità degli stati è legata alla
proprietà di osservabilità dei modi attraverso l’uscita. Sussiste, infatti, il Teorema che segue.
Sia dato un modello LTI nel quale la matrice dinamica abbia autovalori distinti. Allora, tutti i
modi elementari di evoluzione del modello sono osservabili attraverso l’uscita se e solo se
esso risulta osservabile.
xˆ1
xˆ
y = 0 Cˆ 2 0 Cˆ 4 2 + Du . (6.1.10)
xˆ 3
ˆ
x4
Il modello:
xˆ 2 = Aˆ 2 xˆ 2 + Bˆ 2u , (6.1.11)
y = Cˆ xˆ + Du ,
2 2 (6.1.12)
è raggiungibile e osservabile.
Corollario del Teorema 6.1.4 La matrice di trasferimento del modello (6.1.1) - (6.1.2) è data
da:
Prova Assumendo che il modello (6.1.1) - (6.1.2) evolva a partire dallo stato x0 = 0 ,
considerando la trasformazione di coordinate x = Txˆ che trasforma il modello in questione
nel modello strettamente equivalente (6.1.9) - (6.1.10), si ha xˆ 0 = 0 . La dinamica dello stato
x̂4 , per la (6.1.9), evolve in accordo alla equazione:
xˆ 4 = Aˆ 4 xˆ 4 ,
la cui soluzione è:
ˆ
xˆ 4 (t ) = e A4t xˆ 40 = 0 , t 0 .
Sempre dalla (6.1.9) si ricava che l’evoluzione dello stato x̂3 avviene in accordo alla
equazione:
ˆ
xˆ3 (t ) = e A3t xˆ30 = 0 .
xˆ 2 = Aˆ 2 xˆ 2 + Aˆ 24 xˆ 4 + Bˆ 2u = Aˆ 2 xˆ 2 + Bˆ 2u . (6.3.14)
y = Cˆ 2 xˆ 2 + Cˆ 4 xˆ 4 + Du = Cˆ 2 xˆ 2 + Du . (6.3.15)
10
2014/2015
Cap. 7
7.1 Introduzione
La teoria della stabilità studia l’attitudine di un sistema (astratto) che si trova in una certa
situazione dinamica, a reagire alle perturbazioni che possono intervenire sullo stato iniziale
e/o sull’ingresso. In presenza di tali perturbazioni, il sistema può reagire in più modi diversi,
in dipendenza anche dalla loro entità.
In presenza di perturbazioni sullo stato iniziale, il caso di maggiore interesse dal punto di
vista ingegneristico è quello in cui il sistema rimane nell’intorno della situazione dinamica
preesistente, e annulla asintoticamente gli effetti della perturbazione stessa. Il caso peggiore si
ha, invece, quando il sistema si allontana dalla situazione dinamica preesistente, anche in
presenza di perturbazioni di piccola entità.
In presenza di perturbazioni sull’ingresso, il caso di maggiore interesse dal punto di vista
ingegneristico è quello in cui il sistema fornisce una risposta limitata in corrispondenza a un
ingresso limitato e quale che sia lo stato iniziale a partire dal quale evolve il sistema.
Nel seguito verrà, dapprima, affrontato lo studio della stabilità in presenza di perturbazioni
sullo stato iniziale e, successivamente, quello in presenza di perturbazioni sull’ingresso.
7.2 Studio della stabilità in presenza di perturbazioni sullo stato iniziale. Stabilità secondo
Lyapunov
Lo studio della stabilità in presenza di perturbazioni sullo stato iniziale viene effettuato
individuando preliminarmente le situazioni dinamiche di interesse e, successivamente,
studiando il comportamento del sistema in presenza di una perturbazione iniziale che lo
allontana da una delle situazioni dinamiche individuate.
Con riferimento al modello in forma implicita costituito dalle equazioni:
x (t ) = (t , t 0 , x 0 , ut ,t ) ) , (7.2.1)
0
Stati di equilibrio
Definizione 7.2.1 Uno stato xe X si dice stato di equilibrio per il sistema (7.2.1)-(7.2.2), se
ammettendo che il sistema stesso si trovi inizialmente nello stato xe e che l’ingresso sia nullo
o, al più, costante e pari a u , esso rimarrà indefinitamente nello stato xe t t0 . In simboli,
si ha:
x e = (t , t 0 , x e , u ), t t 0 . (7.2.3)
x (t ) = f ( x (t ), u(t ), t ) , (7.2.4)
e dalla (7.2.2). Supponendo nullo l’ingresso e tenendo conto della Definizione 7.2.1, gli stati
di equilibrio sono le soluzioni costanti della equazione vettoriale:
0 = f ( x e , 0, t ) . (7.2.5)
Per quanto concerne gli stati di equilibrio, conviene rilevare che il comportamento dei
sistemi lineari e stazionari è completamente diverso da quello dei sistemi non lineari e/o non
stazionari.
Per i sistemi lineari e stazionari, la (7.2.5) si particolarizza come segue:
Axe = 0 , (7.2.6)
ml 2 + b + mgl sin( ) = fl ,
e ponendo:
x1 (t ) = (t ), x2 (t ) = (t ), u (t ) = f (t ) .
0
xe1 = , xe 2 = ,
0 0
che corrispondono alle due configurazioni in cui il pendolo si trova in posizione verticale con
la sfera metallica in basso e in alto.
Traiettorie nominali
3
Definizione 7.2.2 Si dice traiettoria nominale corrispondente allo stato iniziale x0 = x0* e
all’ingresso u() = u* () , l’insieme degli stati ottenuti dalla (7.2.1):
x X : x(t ) = (t, t , x , u ) ) .
0
*
0
*
t 0 ,t (7.2.7)
Movimento nominale
Definizione 7.2.3. Si dice movimento nominale corrispondente allo stato iniziale x0 = x0* e
all’ingresso u() = u* () , l’insieme delle coppie ordinate (t , x (t )) ottenute dalla (7.2.1), dato
da:
Definizione 7.2.4 Uno stato di equilibrio xe si dice stabile secondo Lyapunov se:
dove:
x l (t ) = (t , t 0 , x 0 , 0t ,t ) ) .
0
Definizione 7.2.5 Uno stato di equilibrio xe si dice asintoticamente stabile secondo Lyapunov
se esso è stabile e se:
x2
x0
xe
x1
x2
x0
xe
x1
a
Fig. 7.2.2 Interpretazione grafica della asintotica stabilità dello stato di equilibrio.
Osservazione 7.2.3 Dal punto di vista ingegneristico, è importante che il sistema sia in grado
di reagire alle perturbazioni sullo stato iniziale in modo tale da annullarne gli effetti
asintoticamente, indipendentemente dall’entità di tali perturbazioni. In tali condizioni, lo stato
di equilibrio viene detto globalmente asintoticamente stabile.
x0 X , lim xl (t ) − xe = 0 ,
t →
Definizione 7.2.7 Un movimento nominale M = (t , x * ) T X : x * (t ) = (t , t 0 , x 0* , u*t0 ,t ) ) ,
corrispondente allo stato iniziale x 0* e all’ingresso u*t ,t ) , si dice stabile se:
0
Definizione 7.2.8 Un movimento nominale M * = (t , x * ) T X : x * (t ) = (t , t 0 , x 0* , u*t0 ,t ) ) ,
corrispondente allo stato iniziale x 0* e all’ingresso u*t ,t ) , si dice asintoticamente stabile se è
0
Lo studio della stabilità del movimento si può ricondurre allo studio della stabilità dello
stato di equilibrio di un particolare sistema dinamico errore, che si ottiene come segue.
Assumendo che il sistema dinamico sia descritto dal modello (7.2.4) e (7.2.2), i movimenti
nominale e perturbato soddisfano, rispettivamente, le equazioni differenziali:
Ponendo z(t ) = x(t ) − x* (t ) , il sistema dinamico errore è descritto dalla equazione ingresso-
stato, data da:
che evolve dallo stato iniziale z0 = x0 − x0* . Il sistema dinamico (7.2.13) viene denominato
sistema non autonomo poiché la funzione h( z(t ), u* (t ), x* (t ), t ) dipende dal tempo, essendo
tale dipendenza generata dalla presenza delle funzioni u* (t ) e x * (t ) , oltre che da quella di t.
Il sistema (7.2.13) risulterebbe, pertanto, non autonomo anche se il modello (7.2.4) e (7.2.2)
fosse tempo-invariante.
Poiché h(0, u* (t ), x* (t ), t ) = 0, t t0 , ne consegue che x (t ) = x * (t ) può essere
interpretato come uno stato di equilibrio per il sistema (7.2.13). Pertanto, lo studio della
stabilità del movimento nominale M * può essere ricondotto a quello della stabilità dello stato
di equilibrio del sistema non autonomo (7.2.13).
6
Tale studio risulta in generale molto complesso. Una notevole semplificazione si ottiene
per sistemi dinamici lineari e tempo-invarianti. In tal caso, il sistema dinamico errore è
descritto dalla equazione:
( )
z (t ) = Ax (t ) + Bu* (t ) − Ax * (t ) + Bu* (t ) = Az (t ) . (7.2.14)
Teorema 7.2.2 In un sistema lineare e stazionario, si può avere stabilità asintotica solamente
per lo stato 0 solamente quando esso è l’unico stato di equilibrio. Inoltre, la stabilità asintotica
locale implica quello globale.
L’analisi precedente mostra che nel caso dei sistemi lineari e stazionari (LTI) è sufficiente
effettuare lo studio della stabilità dello stato zero. Se esso è l’unico stato di equilibrio, può
risultare stabile, asintoticamente stabile o instabile. Se esistono infiniti stati di equilibrio, essi
risultano tutti stabili se lo stato zero è stabile o tutti instabili se lo stato zero è instabile.
Queste ultime considerazioni mettono in luce la possibilità di estendere la proprietà di
stabilità dagli stati di equilibrio all’intero sistema. Poiché nel tipo di stabilità che si sta
esaminando viene coinvolta la risposta libera nello stato, la stabilità in esame viene
denominata interna. La succitata estensione viene effettuata in accordo alla seguente
definizione.
(t ) k , t 0 , (7.2.20)
dove:
(t ) x
(t ) = sup .
xC n , x 0 x
Prova.
Sufficienza. Si consideri lo stato zero come stato di equilibrio del sistema LTI. La risposta
libera nello stato corrispondente al generico stato iniziale x0 è data da:
xl (t ) = (t ) x0 , t 0 , (7.2.21)
xl (t ) = (t ) x0 (t ) x0 k x0 , t 0 . (7.2.22)
x0 ( ) xl (t ) t 0 .
Necessità. Si ammetta che lo stato zero sia stabile e che la condizione (7.2.20) non sia
soddisfatta. Allora, esiste almeno un elemento, ad es. ij (t ) illimitato
( M 0, t : ij (t ) M , t t ). Assumendo come stato iniziale x0 = re j , dove e j è un
vettore avente elementi tutti nulli tranne quello di posto j pari a 1, si ha xl (t ) = r j (t ) , dove
j (t ) è la j-esima colonna della matrice di transizione di stato. Ne consegue che la
componente i-esima di xl (t ) , pari a xl ,i (t ) = rij (t ) , risulta illimitata, il che contrasta con
l’ipotesi di stabilità dello stato zero.
lim (t ) = 0 . (7.2.23)
t →
Prova. Dalla relazione (7.2.21), tenendo presente che la (7.2.23) implica che lim (t ) = 0 si
t →
ha:
Inoltre, si può dimostrare che per i sistemi lineari e stazionari, la condizione (7.2.10) implica
la (7.2.9). Infatti, dalla (7.2.10) particolarizzata per t0 = 0 e xe = 0 , si ottiene:
x0 : x0 a , k 0 t (k ) : xl (t ) k t t (k ) . (7.2.25)
x0 : x0 a , xl (t ) t 0 ,
Condizioni di stabilità più semplici e di verifica immediata sono quelle che si ottengono in
termini degli autovalori della matrice dinamica A.
Teorema 7.2.5 Un sistema LTI è stabile internamente se e solo se gli autovalori della matrice
dinamica sono tutti a parte reale non positiva e quelli a parte reale nulla hanno molteplicità
geometrica unitaria.
Prova.
Sufficienza. Osservando che la matrice di transizione di stato di un sistema LTI nel caso più
generale è data da:
r mi −1 t k i t
(t ) = Rik e , (7.2.26)
i =1 k = 0 k!
se gli autovalori della matrice dinamica hanno tutti parte reale non positiva e quelli a parte
reale nulla hanno molteplicità geometrica unitaria, vale la (7.2.20) e il sistema è stabile
internamente. Infatti, i termini corrispondenti ad autovalori a parte reale negativa convergono
asintoticamente a zero, mentre i termini corrispondenti ad autovalori a parte reale nulla e con
molteplicità geometrica unitaria si mantengono limitati.
Necessità. Si ammetta che il sistema sia stabile internamente e che la matrice A abbia
autovalori a parte reale positiva e/o un autovalore a parte reale nulla, ma di molteplicità
geometrica maggiore o uguale a due. In entrambi i casi, la (7.2.26) implica che
lim (t ) → , e ciò contrasta con l’ipotesi di stabilità.
t →
Prova
Sufficienza. Se gli autovalori della matrice dinamica sono tutti a parte reale negativa, tutti i
termini della (7.2.26) convergono asintoticamente a zero e, quindi, vale la (7.2.23).
Necessità. Si ammetta che il sistema sia asintoticamente internamente stabile e che la matrice
dinamica abbia autovalori a parte reale positiva e/o nulla. In entrambi i casi lim (t ) 0 , il
t →
che contrasta con l’ipotesi di stabilità asintotica.
Lo studio della stabilità esterna si effettua assumendo che il sistema si trovi inizialmente in
un generico stato iniziale e che sia soggetto a un ingresso. In particolare, un sistema è stabile
esternamente, o stabile BIBO (bounded input bounded output), se ad un ingresso limitato
corrisponde una uscita limitata quale che sia lo stato iniziale a partire dal quale evolve il
sistema stesso. La definizione formale è di seguito riportata, con riferimento a un sistema
descritto dal modello con lo stato dato da:
x (t ) = (t , t 0 , x 0 , ut ,t ) ) , (7.3.1)
0
9
y (t ) = (t , t 0 , x 0 , ut ,t ) . (7.3.2)
0
Definizione 7.3.1 Un sistema descritto dalle (7.3.1) e (7.3.2) si dice esternamente stabile se:
(7.3.3)
Definizione 7.3.2 Un sistema descritto dalle (7.3.1) e (7.3.2) si dice esternamente stabile nello
stato zero se:
Teorema (7.3.1). Un sistema LTI è esternamente stabile se e solo se esistono due costanti, k1 e
k 2 , tali che:
(t ) k1, t 0 , (7.3.5)
t
0 W (t ) dt k2 , t 0 . (7.3.6)
Prova.
Sufficienza. Si ammetta che valgano le (7.3.5) e (7.3.6). Com’è noto, la risposta nell’uscita di
un sistema LTI, assumendo t0 = 0 , è data da:
t
y (t ) = (t , 0, x 0 , u[t0 ,t ] ) = (t ) x 0 + W (t − )u( ) d . (7.3.7)
0
Assumendo che l’ingresso sia limitato da M, i.e. u(t ) M t 0 , dalla (7.3.7) si ha:
t t
y(t ) = (t ) x 0 + W (t − )u( )d (t ) x 0 + 0 W (t − )u( )d
0
t t
(t ) x 0 + W (t − ) u( ) d (t ) x 0 + M W ( ) d
0 0
t
(t ) x 0 + M W ( ) d k1 x 0 + Mk 2 .
0
Necessità. Si ammetta, adesso, che il sistema LTI sia esternamente stabile e che sia valida la
(7.3.6), ma non la (7.3.5). Assumendo, ad esempio, che l’elemento ij (t ) sia illimitato e
10
p
W ( )
= max
i
wij ( ) , (7.3.8)
j =1
si ha:
wij ( ) d k , t t .
t
0 max
i
j =1
(7.3.9)
0
t
whj ( ) d k , t t . (7.3.10)
j =1
p p
0 0
t t t
y f ,h (t ) = 0 W ( t − )u( )d =
j =1
whj ( t − ) sgn( whj ( t − ))d =
j =1
whj ( t − ) d =
0
t
= whj ( ) d k ,
j =1
tenuto conto anche della (7.3.10). Ne consegue che la risposta forzata all’ingresso limitato
(7.3.11) è illimitata, il che contrasta con l’ipotesi di stabilità esterna.
Teorema 7.3.2. Un sistema LTI è esternamente stabile nello stato zero se e solo se è valida la
(7.3.6).
Condizioni di stabilità esterna più semplici da verificare, sono quelle che si riferiscono alle
trasformate di Laplace delle matrici (t ) e W (t ) . Tuttavia, prima di enunciare tali
condizioni occorre definire i poli di una matrice di funzioni di s.
11
Definizione 7.3.3 I poli di una matrice di funzioni di s sono gli zeri del minimo denominatore
comune di tutti gli elementi della matrice stessa.
Teorema (7.3.3). Un sistema LTI è esternamente stabile se e solo se: a) i poli della matrice
( s ) hanno tutti parte reale non positiva e quelli a parte reale nulla hanno molteplicità
unitaria; b) i poli della matrice di trasferimento W ( s ) hanno tutti parte reale negativa.
r m i −1
t k pit
(t ) = Rik e , (7.3.12)
i =1 k =0 k!
rw m wi −1 tk
W (t ) = Rw ik e p w it , (7.3.13)
i =1 k = 0 k!
Necessità. Si dimostra per assurdo nell’ipotesi che il sistema sia esternamente stabile e che
siano violate alternativamente le condizioni a) e b).
Teorema (7.3.4). Un sistema LTI è esternamente stabile nello stato zero se e solo se i poli
della matrice di trasferimento W ( s ) hanno tutti parte reale negativa.
7.4 Legami fra la stabilità esterna e quella interna per i sistemi LTI
Nel presente paragrafo vengono stabiliti i legami fra la stabilità esterna e quella interna per
i sistemi LTI, rappresentati dalle equazioni:
x (t ) = Ax (t ) + Bu(t ) , (7.4.1)
y (t ) = Cx (t ) . (7.4.2)
L’avere considerato sistemi strettamente propri non è una limitazione. Infatti, un sistema
proprio, i.e. con D 0 , è costituito da un sistema strettamente proprio connesso in parallelo a
un sistema istantaneo avente legame ingresso-uscita pari a D. La stabilità dell’intero sistema è
ovviamente stabilita da quella del sistema strettamente proprio.
La stabilità interna asintotica implica sempre quella esterna e quella esterna nello stato zero.
I poli delle matrici ( s ) e W ( s ) sono sottoinsiemi degli autovalori di A. Pertanto, se tali
autovalori hanno tutti parte reale negativa, anche i poli di ( s ) e W ( s ) hanno parte reale
negativa.
12
La stabilità esterna nello stato zero implica quella esterna se il sistema è raggiungibile.
Si ammetta che il sistema LTI sia esternamente stabile nello stato zero e completamente
raggiungibile, ma non esternamente stabile. Ciò implica che esiste almeno uno stato iniziale
x0 per il quale la corrispondente risposta libera nell’uscita non è limitata:
t ( ) : yl (t ) = Ce At x0 t t ( ) . (7.4.3)
Poiché x0 è raggiungibile, esiste un ingresso u () che trasferisce il sistema dallo stato 0 allo
stato x0 in un intervallo tempo finito [0, t f ] , in accordo alla relazione:
tf A(t f − )
x0 = 0 e Bu ( )d . (7.4.4)
Sollecitando, adesso, il sistema con l’ingresso u () per t [0, t f ) e con l’ingresso
identicamente nullo a partire da t f , la risposta nell’uscita è data da:
A(t −t f )
(t , 0, 0, u[0,t ] ) = (t , t f , x0 , 0[t f ,t ] ) = Ce x0 , t t f
che risulta illimitata. Ciò contrasta con l’ipotesi che il sistema sia esternamente stabile nello
stato zero.
La stabilità esterna nello stato zero implica la stabilità interna asintotica se il sistema è
raggiungibile e osservabile.
a) le condizioni di asintotica stabilità interna riguardano la verifica che gli zeri del
polinomio caratteristico abbiano tutti parte reale negativa;
b) le condizioni di stabilità interna riguardano la verifica che gli zeri del polinomio minimo
abbiano tutti parte reale negativa o nulla, e che gli zeri a parte reale nulla abbiano
molteplicità unitaria;
c) le condizioni di stabilità esterna nello stato zero si riferiscono alla verifica che gli zeri del
polinomio minimo denominatore comune di tutti gli elementi della matrice di
trasferimento abbiano tutti parte reale negativa;
d) le condizioni di stabilità esterna si riferiscono alla verifica della stabilità esterna nello
stato zero, e alla verifica che gli zeri del polinomio minimo denominatore comune di tutti
13
gli elementi della matrice ( s ) abbiano tutti parte reale negativa o nulla, e che gli zeri a
parte reale nulla abbiano molteplicità unitaria.
In tutti i casi il problema dello studio della stabilità viene ricondotto a quello della
determinazione della dislocazione degli zeri di un opportuno polinomio. Per sistemi LTI
esistono alcuni criteri algebrici di stabilità che permettono di stabilire la succitata dislocazione
degli zeri senza doverli determinare. I criteri algebrici di stabilità più utilizzati sono il criterio
di Routh e quello di Hurwitz. Nel seguito verrà studiato il criterio di Routh.
Prima di illustrare tale criterio, conviene premettere la seguente condizione necessaria
affinchè gli zeri del generico polinomio p ( ) , dato da:
Condizione necessaria affinchè gli zeri del polinomio (7.5.1) abbiano tutti parte reale
negativa, è che i coefficienti ai , i = 0, n − 1 , siano tutti diversi da zero e dello stesso segno.
1 r1,1
0 r0,1
14
Ciò premesso, nell’ipotesi che lo schema di Routh possa essere completato, il criterio di
Routh si enuncia come segue.
Criterio di Routh. Condizione necessaria e sufficiente affinchè gli zeri del polinomio p ( ) ,
dato dalla (7.5.1), abbiano tutti parte reale negativa è che gli elementi della prima colona dello
schema di Routh, i.e. rn,1, rn−1,1, r1, r0 , siano tutti diversi da zero e dello stesso segno.
Nelle ipotesi che lo schema possa essere completato e che gli elementi della prima colona
dello schema di Routh non abbiano tutti lo stesso segno, il Criterio di Routh fornisce
informazioni sul numero di zeri a parte reale positiva del polinomio p ( ) . Sussiste infatti il
seguente corollario.
Corollario del Criterio di Routh. Il numero di zeri a parte reale positiva del polinomio p ( ) è
pari al numero di variazioni di segno fra gli elementi della prima colonna dello schema di
Routh.
L’esame della (7.5.4) mostra che lo schema di Routh non può essere completato se nel
corso della sua costruzione il primo elemento di una riga risulta nullo. In tale caso, la
necessità della condizione espressa dal Criterio di Routh implica che non tutti gli zeri del
polinomio p ( ) hanno parte reale negativa. Volendo, inoltre, determinare il numero di zeri a
parte reale positiva e/o la molteplicità degli eventuali zeri a parte reale nulla, è possibile
procedere come segue.
p() = 4 + 3 + 22 + 2 + 1.
4 1 2 1
3 1 2
2 0 1
Fig. 7.5.2
4 1 2 1
3 1 2
2 0 ( ) 1
1 2 −1
0 1
Fig. 7.5.3
Facendo tendere a zero da sinistra o da destra, gli elementi della prima colonna dello
schema di Routh assumono i segni indicati nella Tabella 7.5.1. L’esame della Tabella mostra
che in entrambi i casi nella prima colonna dello schema do Routh si manifestano due
variazioni di segno, il che implica che il polinomio p ( ) ha due zeri a parte reale positiva.
Tabella 7.5.1
→ 0+ → 0−
+ +
+ +
+ −
− +
+ +
3
5 7
1 2
2
2
6 4 8
Gli zeri a simmetria quadrantale sono gli zeri del polinomio pi +1 ( ) associato alla riga
i + 1 , dato da:
pi +1 ( ) = ri +1,1 i +1 + ri +1,2 i −1 + ri +1,3 i −3 + + ri +1,(i +1) 2 (7.5.5)
Poiché il numero degli zeri di pi +1 ( ) è pari, la riga nulla, se esiste, deve essere
necessariamente di indice dispari. Inoltre, il polinomio p ( ) è dato da:
p( ) = pi +1 ( )d ( ) , (7.5.6)
16
d
pi +1 ( ) = (i + 1)ri +1,1 i + (i − 1)ri +1,2 i −2 + . (7.5.7)
d
b.2) Lo schema non può essere completato poiché si incontra una seconda riga nulla, di indice
dispari j. Ciò si manifesta quando alcuni degli zeri di pi +1 ( ) hanno molteplicità 2. Tali zeri
sono gli zeri del polinomio ausiliario, p j +1 ( ) , associato alla riga j + 1 . La costruzione dello
schema può essere continuata derivando p j +1 ( ) e sostituendo i coefficienti nulli con i
coefficienti del polinomio derivato. Se si incontra una terza riga nulla, alcuni degli zeri di
pi +1 ( ) hanno molteplicità 3. Tali zeri sono gli zeri del polinomio ausiliario associato alla
riga che precede la terza riga nulla. Derivando tale polinomio e sostituendo i coefficienti del
polinomio derivato al posto degli elementi della terza riga nulla si può continuare la
costruzione dello schema, fino al suo completamento.
5 1 2 1
4 1 2 1
3 0 0
Fig. 7.5.5
17
Poiché la riga 3 è nulla, non tutti gli zeri hanno parte reale negativa, e p ( ) ha zeri radiali
e simmetrici rispetto all’origine. Il polinomio ausiliario p4 ( ) è dato da:
p4 ( ) = 4 + 2 2 + 1 ,
d
p4 ( ) = 4 3 + 4 2 ,
d
5 1 2 1
4 1 2 1
3 0 (4) 0 (4)
2 1 1
1 0
Fig. 7.5.6
Poiché la riga di indice 1 ha un solo elemento, si è in presenza di una seconda riga nulla. Pertanto,
alcuni degli zeri di p4 ( ) hanno molteplicità 2. Il polinomio ausiliario associato alla riga nulla
è dato da:
p2 ( ) = 2 + 1 ,
la cui derivata risulta:
d
p2 ( ) = 2 .
d
5 1 2 1
4 1 2 1
3 (0) 4 (0) 4
2 1 1
1 (0) 2
0 1
Fig. 7.5.7
Poiché non esistono variazioni nella prima colonna dello schema di Routh di Fig. 7.5.7, il
polinomio p ( ) ha zeri sull’asse immaginario. La presenza di due righe nulle implica che
p ( ) ha due zeri di molteplicità 2 sull’asse immaginario e uno zero reale negativo.
Lezione Lezione
Stabilitá
Definition 3 Un equilibrio x̄ si dice asintoticamente stabile se, Theorem 1 C.N.E.S. perchè una matrice quadrata simmetrica
se è stabile e inoltre di ordine n sia definita positiva è che siano positivi tutti gli n
minori principali D1,. . . , Dn da essa estraibili
lim kx (t) − x̄k = 0
t→∞
D1 = det(p11)
µ· ¸¶ p11 · · · p1j
p11 p12 . ... ... , j ≤ n
D2 = det , Dj = det ..
p12 p22
p1j . . . pjj
Teoria dei Sistemi/Controlli Automatici 2003 Teoria dei Sistemi/Controlli Automatici 2003
Lezione Lezione
k
Con p22 = 1, (elimino sin(x1)x2) p11 = p12 2 > 0 (elimino
Ml
k
Pendolo x2 e rispetto def-pos 1), p12 − p22 2 < 0 (negativo x22), 0 <
Ml
k k
p12 < 2
(negativo x1+condizione precedente), p12 2 − p212 >
2
Ml Ml
k
Con k > 0 V̇ (x) è semidefinita negativa perchè è indipendente 0 (condizione def-pos 2 noti p11 e p22), p12 = 0.5 2
Ml
da x1. Quindi possiamo solo concludere che l’origine è stabile
mentre l’intuizione ci dice che è asintoticamente stabile. Proviamo k g k
V̇ (x) = −0.5 2 x1 sin (x1) − 0.5 2 x22
con un’altra funzione definita positiva. Ml l Ml
g 1 Quindi poiché x1sinx1 > 0 per 0 ©< |x1| < π, V (x) ª soddisfa
V (x) = (1 − cos x1) + x0P x 2
il Teorema di Lyapunov con D = x ∈ R | |x1| < π e quindi
l 2 · ¸· ¸
g 1£ ¤ p11 p12 x1 l’origine è un punto di equilibrio asintoticamente stabile.
= (1 − cos x1) + x1 x2
l 2 p12 p22 x2
dove P è una matrice definita positiva (i.e. p11 > 0; p11p22 −p212 >
0)
· ¸· ¸
0 g £ ¤ p11 p12 ẋ1
V̇ (x) = x P ẋ + sin x1ẋ1 = x1 x2
l p12 p22 ẋ2
h g i
= p11x1 + p12x2 + sin (x1) ẋ1 + (p12x1 + p22x2)ẋ2
h l i
g
= p11x1 + p12x2 + sin (x1) x2
µl ¶
g k
+(p12x1 + p22x2) − sin (x1) − x2
l Ml2
g k
= −p12 x1 sin (x1) + (p12 − p22 2 )x22
l Ml
k g g
+(p11 − p12 2 )x2 + ( sin (x1) − p22 sin (x1))x2
Ml l l
Teoria dei Sistemi/Controlli Automatici 2003 Teoria dei Sistemi/Controlli Automatici 2003
Lezione Lezione
Esempio
½
ẋ1 = −2x1 − 3x2
Teorema di Lyapunov per sistemi lineari ẋ2 = 4x1 − 2x2
Studiare la stabilità con l’equazione di Lyapunov
· ¸
−2 −3
Theorem 4 Un sistema lineare e invariante è asintoticamente A= ,Q = I
4 −2
stabile se e solo se per ogni matrice simmetrica e definita positiva
Q esiste una matrice simmetrica definita positiva P che soddisfa · ¸· ¸ · ¸· ¸
−2 4 a b a b −2 −3
l’equazione di Lyapunov + = −I
−3 −2 b c b c 4 −2
· ¸
P A + A0P = −Q −2a + 4b − 2a + 4b −2b + 4c − 3a − 2b
= −I
−3a − 2b − 2b + 4c −3b − 2c − 3b − 2c
Inoltre , se il sistema è asintoticamente stabile, allora P è l’unica
soluzione. 1+8b
−4a + 8b = −1 a= 4
Nota che V (x) = x0P x è una funzione di Lyapunov per il sis- −4b + 4c − 3a = 0 c = 1−6b
4
tema ẋ = Ax. Infatti −6b − 4c = −1 −4b + 1 − 6b − 34 (1 + 8b) = 0
½ b = 64
1
V̇ (x) = x0P Ax + x0A0P.x = x0(P A + A0P )x = −x0 Qx 1 9
−16b + = 0 a = 32
4 58 29
c = 64∗4 = 128
· ¸
1 36 2
P = > 0 ⇒ As.Stabile
128 2 29
P = Lyap(A0, Q)
Teoria dei Sistemi/Controlli Automatici 2003 Teoria dei Sistemi/Controlli Automatici 2003
LECTURE 8
2. The ∞-norm,
MATLAB⃝ R
Hint 22.
n
!
norm(A,inf)
computes the ∥A∥∞ := max |ai j |.
1≤i≤m
∞-norm of A. j=1
MATLAB⃝ R
Hint 24. 4. The Frobenius norm,
svd(A) computes $ $
the singular values of %! % n
A, which are the
n
% m ! 2
%!
∥A∥ F := & ai j = & σi [A]2 ,
square roots of the
eigenvalues of A′ A. i=1 j=1 i=1
MATLAB⃝ R
Hint 25. where the σi [A] are the singular values of A. For (column) vectors, the Frobe-
norm(A,’fro’) nius norm coincides with the two-norm (and also with the Euclidean norm),
computes the
Frobenius norm of A. but in general this is not true for matrices.
All matrix norms are equivalent in the sense that each one of them can be upper and
lower bounded by any other times a multiplicative constant:
∥A∥1 √
√ ≤ ∥A∥2 ≤ n∥A∥1 ,
n
∥A∥∞ √
√ ≤ ∥A∥2 ≤ m∥A∥∞ ,
n
∥A∥ F
√ ≤ ∥A∥2 ≤ ∥A∥ F .
n
The four matrix norms above are submultiplicative; i.e., given two matrices A and B
and therefore
∥Ax∥ p
∥A∥ p ≥ max .
x̸=0 ∥x∥ p
The one-, two-, and ∞-norms are also subordinate to the corresponding vector norms;
Note. For subordinate i.e., we actually have
norms, we can view
the value of ∥A∥ p as ∥Ax∥ p
the maximum vector ∥A∥ p = max , p ∈ {1, 2, ∞}. (8.1)
norm amplification x̸=0 ∥x∥ p
that can result from
multiplying a vector The equality in (8.1) arises from the fact that subordinate norms have the property
by A. that for every matrix A there exists a vector x ∗ ∈ Rn for which
∥Ax ∗ ∥ p
∥A∥ p = , p ∈ {1, 2, ∞}. (8.2)
∥x ∗ ∥ p
INTERNAL OR LYAPUNOV STABILITY 65
Attention! The Frobenius norm is submultiplicative but not subordinate, which means
that
∥Ax∥ F ∥Ax∥2
∥A∥ F > max = max = ∥A∥2 .
x̸=0 ∥x∥ F x̸=0 ∥x∥2
' ( √
One can check this, e.g., for the matrix 20 01 , for which ∥A∥ F = 5 ≈ 2.24, and yet
∥Ax∥ F
max = ∥A∥2 = 2.
x̸=0 ∥x∥ F
This example shows that the Frobenius norm typically overestimates how much am-
plification can result from multiplying by A. !
ẋ = Ax, x ∈ Rn (H-CLTI)
in terms of its Lyapunov stability, without explicitly computing the solution to the sys-
tem.
Theorem 8.1 (Eigenvalue conditions). The system (H-CLTI) is
1. marginally stable if and only if all the eigenvalues of A have negative or zero real
parts and all the Jordan blocks corresponding to eigenvalues with zero real parts
are 1 × 1,
2. asymptotically stable if and only if all the eigenvalues of A have strictly negative
real parts ,
Notation. A matrix is
called Hurwitz or a 3. exponentially stable if and only if all the eigenvalues of A have strictly negative
stability matrix if all real parts, or
its eigenvalues have
strictly negative real 4. unstable if and only if at least one eigenvalue of A has a positive real part or zero
parts.
real part, but the corresponding Jordan block is larger than 1 × 1. !
Attention! When all the eigenvalues of A have strictly negative real parts, all entries
of e At converge to zero exponentially fast, and therefore ∥e At ∥ converges to zero ex-
ponentially fast (for every matrix norm); i.e., there exist constants c, λ > 0 such that
Note. When all
Jordan blocks have
multiplicity equal to ∥e At ∥ ≤ c e−λt , ∀t ∈ R.
1, we can choose λ to
be the largest (least
negative) real part of In this case, for a submultiplicative norm, we have
the eigenvalues.
Otherwise, λ has to be ∥x(t)∥ = ∥et−t0 x0 ∥ ≤ ∥e A(t−t0 ) ∥ ∥x0 ∥ ≤ c e−λ(t−t0 ) ∥x 0 ∥, ∀t ∈ R.
strictly smaller than
that. See Exercise 8.3. This means that asymptotic stability and exponential stability are equivalent concepts
for LTI systems. !
Note. The equation 5. There exists a symmetric positive-definite matrix P for which the following Lya-
(8.6) is called a linear punov matrix inequality holds:
matrix inequality
(LMI). The term
“linear” comes from A′ P + P A < 0. (8.6)
the linearity of the
left-hand side in P,
and < refers to the Proof of Theorem 8.2. The equivalence between conditions 1, 2, and 3 has already
fact that the left-hand been proved.
side must be negative-
definite. We prove that condition 2 ⇒ condition 4 by showing that the unique solution to
Note. To prove that (8.5) is given by
multiple statements
P1 , P2 , . . . , Pℓ are ) ∞
′
equivalent, one simply P := e A t Qe At dt. (8.7)
needs to prove a cycle 0
of implications:
P1 ⇒ P2 , To verify that this is so, four steps are needed.
P2 ⇒ P3 , . . . ,
Pℓ−1 ⇒ Pℓ , and 1. The (improper) integral in (8.7) is well defined (i.e., it is finite). This is a conse-
Pℓ ⇒ P1 . quence of the fact that the system (H-CLTI) is exponentially stable, and there-
′
fore ∥e A t Qe At ∥ converges to zero exponentially fast as t → ∞. Because of
this, the integral is absolutely convergent.
2. The matrix P in (8.7) solves the equation (8.5). To verify this, we compute
) ∞
′ ′
′
A P + PA = A′ e A t Qe At + e A t Qe At Adt.
0
But
d * A′ t + ′ ′
e Qe At = A′ e A t Qe At + e A t Qe At A,
dt
therefore
) ∞ , ′ -∞
d * A′ t +
′
A P + PA = e Qe At dt = e A t Qe At
0 dt 0
* A′ t At
+ A′ 0 A0
= lim e Qe − e Qe .
t→∞
Equation (8.5) follows from this and the facts that limt→∞ e At = 0 because of
asymptotic stability and that e A0 = I .
3. The matrix P in (8.7) is symmetric and positive-definite. Symmetry comes from
the fact that
Note.
* At +′Check that ) ∞ ) ∞ ) ∞
e
′
= eA t . * A′ t +
At ′
* At +′ ′ * A′ t ′ ′
(Cf. Exercise 8.5.)
′
P = e Qe dt = e Q e ) dt = e A t Qe At dt = P.
0 0 0
Q := −(A′ P + P A) > 0.
Consider an arbitrary solution to equation (H-CLTI), and define the scalar signal
v̇(t) ≤ µ v(t), ∀t ≥ t0
λmin [Q]
v(t) ≤ e−λ(t−t0 ) v(t0 ), ∀t ≥ 0, λ := − ,
λmax [P]
which shows that v(t) converges to zero exponentially fast and so does ∥x(t)∥ [see
(8.9)].
5. There exists a symmetric positive-definite matrix P for which the following Lya-
punov matrix inequality holds:
A′ P A − P < 0. !
Attention! In discrete time, in the proof of the Lyapunov stability theorem (Theo-
rem 8.4) one studies the evolution of the signal
From this we conclude that v(t) is nonincreasing and, with a little more effort, that
it actually decreases to zero exponentially fast. !
Table 8.1 summarizes the results in this section and contrasts them with the
continuous-time conditions for Lyapunov stability.
ẋ = f (x), x ∈ Rn , (8.13)
with δx := x − x eq and
∂ f (x eq )
Notation. When this A := .
happens, we say that ∂x
x eq is a locally
exponentially stable It turns out that the original nonlinear system (8.13) inherits some of the desirable
equilibrium point of stability properties of the linearized system.
the nonlinear system
(8.13). The qualifier Theorem 8.5 (Stability of linearization). Assume that the function f in (8.13) is twice
“locally” refers to the differentiable. If the linearized system (8.14) is exponentially stable, then there exists a
fact that the ball B ⊂ Rn around x eq and constants c, λ > 0 such that for every solution x(t) to the
exponentially
nonlinear system (8.13) that starts at x(t0 ) ∈ B, we have
decaying
bound (8.15) needs to
hold only for initial ∥x(t) − x eq ∥ ≤ ceλ(t−t0 ) ∥x(t0 ) − x eq ∥, ∀t ≥ t0 . (8.15)
conditions in a ball B
around x eq [8]. !
74 LECTURE 8
Proof of Theorem 8.5. Since f is twice differentiable, we know from Taylor’s theorem
that
. /
r (x) := f (x) − f (x eq ) + A δx = f (x) − A δx = O(∥δx∥2 ),
which means that there exist a constant c and a ball B̄ around x eq for which
∥r (x)∥ ≤ c∥δx∥2 , ∀x ∈ B̄. (8.16)
Since the linearized system is exponentially stable, there exists a positive-definite ma-
trix P for which
A′ P + P A = −I.
Inspired by the proof of the Lyapunov stability theorem (Theorem 8.2), we define the
scalar signal
v(t) := δx ′ P δx, ∀t ≥ 0
and compute its derivative along trajectories to the nonlinear system in equation
(8.13):
Note. In (8.17) we
used the v̇ = f (x)′ P δx + δx ′ P f (x)
submultiplicative
property of the = (A δx + r (x))′ P δx + δx ′ P(A δx + r (x))
two-norm. = δx ′ (A′ P + P A)δx + 2 δx ′ P r (x)
= −∥δx∥2 + 2 δx ′ P r (x)
≤ −∥δx∥2 + 2 ∥P∥ ∥δx∥ ∥r (x)∥. (8.17)
To make the proof work, we would like to make sure that the right-hand side is neg-
ative; e.g.,
1
−∥δx∥2 + 2 ∥P∥ ∥δx∥ ∥r (x)∥ ≤ − ∥δx∥2 .
2
To achieve this, let ϵ be a positive constant sufficiently small so that the ellipsoid
Notation. The set E
was constructed so E := {x ∈ Rn : (x − x eq )′ P(x − x eq ) ≤ ϵ}
that x(t) ∈ E ⇔
v(t) ≤ ϵ. centered at x eq satisfies the following two properties.
1. The ellipsoid E is fully contained inside the ball B̄ arising from Taylor’s theo-
rem (cf. Figure 8.1). When x is inside this ellipsoid, equation (8.16) holds, and
therefore
* +
x(t) ∈ E ⇒ v̇ ≤ −∥δx∥2 + 2 c ∥P∥ ∥δx∥3 = − 1 − 2 c ∥P∥ ∥δx∥ ∥δx∥2 .
Attention! When the linearized system is only marginally stable, not much can be
said about the nonlinear system merely from analyzing the linearized system. For
example, the two systems
ẋ = −x 3 and ẋ = +x 3 (8.19)
around x eq = 0, which is only marginally stable. Yet for the left-hand side system
in (8.19), x always converges to zero, while for the right-hand side system, x always
diverges away from the equilibrium point. !
76 LECTURE 8
Example 8.1 (Inverted pendulum). Consider the inverted pendulum in Figure 8.2
and assume that u = T and y = θ are its input and output, respectively.
The local linearization of this system around the equilibrium point for which θ =
π is given by
Note. This
equilibrium point is ˙ = A δx + Bu,
δx δy = C δx,
x eq = π, u eq = 0,
y eq = π, and
therefore δx := where
x − x eq = x − π , 1 2 3 4
δu := u − u eq = u, 0 1 0 ' (
δy := y−y eq = y−π. A := , B := , C := 1 0 .
− gℓ − mℓb 2 1
DISCRETE-TIME CASE
Consider a discrete-time homogeneous nonlinear system
x + = f (x), x ∈ Rn ,
with an equilibrium point at x eq ∈ Rn ; i.e., f (x eq ) = x eq . The local linearization of
(8.13) around x eq is given by
δx + = A δx, (8.20)
with δx := x − x eq and
∂ f (x eq )
A := .
∂x
Theorem 8.7. Assume that the function f in (8.13) is twice differentiable.
1. If the linearized system (8.20) is exponentially stable, then there exists a ball B
around x eq such that every solution x(t) to the nonlinear system (8.13) that starts
at x(0) ∈ B converges to x eq exponentially fast as t → ∞.
2. If the linearized system (8.20) is unstable, then there are solutions that start arbi-
trarily close to x eq , but do not converge to this point as t → ∞. !
MATLAB⃝ R
Hint 15 (eig). The function eig(A) computes the eigenvalues of the
matrix A. Alternatively, eig(sys) computes the eigenvalues of the A matrix for a
state-space system sys specified by sys=ss(A,B,C,D), where A,B,C,D are a
realization of the system. !
Attention! To solve
MATLAB⃝ R
Hint 26 (lyap). The command P=lyap(A,Q) solves the Lyapunov
A′ P + PA = −Q,
equation
one needs to use
P=lyap(A’,Q). AP + PA′ = −Q. !
Attention! To solve
MATLAB⃝ R
Hint 27 (dlyap). The command P=dlyap(A,Q) solves the Lya-
A′ PA − P = −Q,
punov equation
one needs to use
P=dlyap(A’,Q). APA′ − P = −Q. !
78 LECTURE 8
8.9 EXERCISES
8.1 (Submultiplicative matrix norms). Not all matrix norms are submultiplicative.
Verify that this property does not hold for the norm
∥e At ∥ ≤ c e−λt , ∀t ∈ R.
ẋ = Ax, x ∈ Rn
and suppose that there exists a positive constant µ and positive-definite matrices
P, Q ∈ Rn for the Lyapunov equation
Show that all eigenvalues of A have real parts less than −µ. A matrix A with this
property is said to be asymptotically stable with stability margin µ.
Hint: Start by showing that all eigenvalues of A have real parts less than −µ if and only
if all eigenvalues of A + µI have real parts less than 0 (i.e., A + µI is a stability matrix).
!
INTERNAL OR LYAPUNOV STABILITY 79
8.7 (Stability of nonlinear systems). Investigate whether or not the solutions to the
following nonlinear systems converge to the given equilibrium point when they start
close enough to it.
ẋ 1 = −x1 + x 1 (x12 + x 22 )
ẋ 2 = −x2 + x 2 (x12 + x 22 ),
ẅ + g(w)ẇ + w = 0,
This equation is called the Lienard equation and can be used to model several
mechanical systems, depending on the choice of the function g(·). !
1
Cap. 8
La risposta in frequenza, detta anche risposta armonica, verrà definita per sistemi
unidimensionali (modelli SISO), ma è facilmente generalizzabile per modelli
multidimensionali (modelli MIMO).
La risposta armonica viene definita come la trasformata di Fourier della risposta impulsiva ed
è quindi data da:
+ +
W ( j ) = w(t ) e− jt dt = w(t ) e− jt dt , (8.1.1)
− 0
+
0 w(t ) dt k . (8.1.2)
Com’è noto, la (8.1.2) è condizione necessaria e sufficiente per la stabilità esterna del sistema
nello stato zero.
La risposta armonica è una funzione complessa di variabile reale . Infatti, la (8.1.1) si può
scrivere come segue:
+
W ( j ) = w(t ) cos(t ) − j sin(t ) dt = R( ) + jI ( ) ,
0
dove:
+ +
R( ) = w(t ) cos(t )dt , I ( ) = − w(t )sin(t )dt ,
0 0
Ne consegue che R() è una funzione pari di , mentre I() è una funzione dispari di . La
risposta armonica, essendo una funzione complessa di variabile reale , può anche essere
scritta nella seguente forma polare:
W ( j) = M ()e j ( ) ,
dove:
I ( )
M ( ) = R 2 ( ) + I 2 ( ), ( ) = tg −1 .
R( )
2
Dalle espressioni precedenti, si ottiene facilmente che il modulo e la fase della risposta
armonica sono, rispettivamente, funzioni pari e dispari di .
La risposta armonica caratterizza in modo completo il comportamento in regime
permanente di sistemi asintoticamente stabili internamente, sollecitati da ingressi sinusoidali.
Prima di dimostrare quanto detto, è necessario definire la risposta in regime permanente.
Definizione 8.1.1 Si chiama stato di riferimento quel particolare stato X , definito da:
Si noti che se lo stato di riferimento esiste, esso è unico per il teorema di unicità del limite.
r mi −1 (t − t 0 ) k i (t −t 0 )
x l (t ) = Rik x 0 e , t t 0 . (8.1.5)
i =1 k = 0 k!
un segnale utile per scopi di analisi, ma non fisicamente realizzabile in laboratorio in quanto
complesso. La corrispondente risposta in regime permanente risulta:
y p (t ) = lim (t , t0 , 0, u[t0 ,t ] ) = lim tt w(t − )e j d = lim 0t −t0 w( )e j (t − ) d =
t0 →− t0 →− 0 t0 →−
3
Poiché la stabilità interna asintotica implica quella esterna nello stato zero, la risposta
impulsiva risulta sommabile e, quindi, il limite nella (8.1.8) converge alla trasformata di
Fourier della risposta impulsiva stessa, e quindi alla risposta armonica. Pertanto, si ha:
y p (t ) = e jtW ( j ) . (8.1.9)
y p (t ) = M ( )e j (t + ( )) . (8.1.10)
e j0t − e− j0t
u (t ) = a0 sin(0t ) = a0 . (8.1.12)
2j
a0 a
y p (t ) = W ( j0 )e j0t − W (− j0 )e− j0t = 0 M (0 ) e j (0t + (0 )) − e− j (0t + (0 )) =
2j 2j
= a0 M (0 )sin(0t + (0 )) . (8.1.13)
La (8.1.13) mostra che la conoscenza del modulo e della fase della risposta armonica
permette di determinare immediatamente la risposta in regime permanente a un ingresso
sinusoidale.
L’importanza della risposta armonica è dovuta anche al fatto che essa può essere
determinata sperimentalmente con un buon grado di precisione, grazie al seguente teorema.
Teorema 8.2.1 Per un sistema lineare e stazionario asintoticamente stabile internamente, con
ingresso e uscita unidimensionali, fissato arbitrariamente una quantità > 0 esiste un istante
t ( ) tale che il valore assoluto della differenza tra la risposta forzata corrispondente
4
n( s )
W ( s) r
, u(t ) u0e j0t .
( s pi )mi
i 1
n( s ) u0
Y f ( s) W ( s)U ( s) ,
r
s j0t
( s pi )mi
i 1
r mi 1 Rik R0
Y f ( s) ,
i 1 k 1 ( s pi ) k 1
s j0t
con:
1 d ( mi 1 k )
Rik lim ( m 1 k ) ( s pi )Y f ( s) ,
(mi 1 k )! s pi ds i
n( j0 )
R0 lim s j0 Y f ( s) u0 r W ( j0 )u0 .
s j0
( j0 pi ) mi
i 1
r mi 1 t k pit
y f (t ) L 1 Y f (s) Rik e R0e j0t ytr (t ) y p (t ) ,
i 1 k 1 k!
dove:
r mi 1 t k pit
ytr (t ) Rik e , y p (t ) W ( j0 )u0e j0t .
i 1 k 1 k!
Poiché il sistema è asintoticamente stabile internamente, i poli pi hanno tutti parte reale
negativa e, quindi, la riposta transitoria ytr (t ) converge a zero asintoticamente. In pratica,
5
nk
2
W (s) = , (8.3.1)
s 2 + 2 k nk s + nk
2
−1
2 2
W ( j ) = 1 + k j − 2 ,
nk nk
i cui diagrammi di Bode, per assegnati valori di k e nk sono illustrati nella Fig. 4.2.11 che
si riporta di seguito per comodità del lettore.
6
Bode Diagram
20
Magnitude (dB)
-20
-40
-60
-80
0
-45
Phase (deg)
-90
-135
-180
0 1 2 3
10 10 10 10
Frequency (rad/sec)
Fig. 4.2.11 Diagrammi di bode del fattore trinomio a denominatore;
k = 0.2 e nk = 10 rad/s .
Come già rilevato in precedenza, per k 0.707 il modulo presenta un picco e si manifesta il
fenomeno della risonanza. La frequenza e l’ampiezza corrispondenti al valore di picco della
risposta in frequenza, vengono denominati frequenza di risonanza e ampiezza di risonanza e
sono dati da (cfr. (4.2.24) e (4.2.25)):
rk = nk 1 − 2 k2 ,
M rk = −20log10 2 | k | 1 − 2 .
k
con 1 = 1 rad/s , mentre 2 è pari a 2 rad/s, nel primo esperimento, e 8 rad/s nel secondo
esperimento. I risultati ottenuti nei due esperimenti sono illustrati nelle Figg. 8.3.1-8.3.4.
L’esame di tali figure mostra anzitutto che, dopo un transitorio di breve durata, la risposta del
sistema tende alla risposta in regime permanente che si ripete periodicamente.
2
1.5 u
y
1
0.5
u, y
-0.5
-1
-1.5
-2
0 2 4 6 8 10 12 14 16 18 20
t [s]
0.4
0.3
0.2
u-y
0.1
-0.1
-0.2
0 2 4 6 8 10 12 14 16 18 20
t [s]
3 u
y
2
u, y
0
-1
-2
-3
-4
0 2 4 6 8 10 12 14 16 18 20
t [s]
1.5
0.5
u-y
-0.5
-1
-1.5
-2
0 2 4 6 8 10 12 14 16 18 20
t [s]
che coincide con l’ingresso amplificato M volte e ritardato di a secondi lungo l’asse dei tempi.
Ovviamente, nell’intervallo [1, 2] le precedenti ipotesi sul modulo e sulla fase sono
9
1 +
− U ( j )e
jt
u (t ) = d . (8.3.5)
2
1 +
− Y f ( j )e
jt
y f (t ) = d , (8.3.6)
2
dove:
Infatti, si ha:
1
U ( j )e jt d d
t t
y f (t ) w(t )u ( )d w(t )
0 0 2
1 1
w(t )e jt d d w( )e j (t )
t t
U ( j ) U ( j ) d d .
2 0 2 0
1 1
y f (t ) U ( j ) w( )e j (t )
d d U ( j ) w( )e j
d e jt d
2 0 2 0
1
U ( j )W ( j )e jt d , t tf ,
2
ovvero che il contenuto armonico dell’ingresso si estende fino alla frequenza u . Si ammetta,
inoltre, che W ( j) = Me− ja , a 0 0, u . Allora, la risposta forzata corrispondente
all’ingresso u (t ) , a transitorio esaurito, è data da:
1 + 1 +u
y f (t ) =
2 − Y f ( j )e jt d M
2 − u
U ( j )e j (t −a ) d = u (t − a) . (8.3.8)
La (8.3.8) mostra che anche in tale caso, assumendo che il sistema sia asintoticamente
internamente stabile, esso è in grado di riprodurre, approssimativamente, il segnale di
ingresso, a transitorio esaurito. L’approssimazione consiste nel fatto che il modulo della
U ( j ) si suppone nullo per u .
Per sistemi MIMO stabili esternamente nello stato zero, si definisce la matrice delle risposte
armoniche come trasformata di Fourier della matrice delle risposte impulsive, data da:
+
W ( j ) = 0 W (t )e− jt dt . (8.4.1)
y p (t ) = W ( j ) e jt . (8.4.2)
Assumendo che esista la risposta in regime permanente all’ingresso u() , la risposta forzata
all’ingresso u() : u(t ) = u(t ) −1 (t ) è data da:
y f (t ) = y p (t ) + ytr (t ) , (8.4.3)
dove:
lim ytr (t ) = 0 .
t →
11
I legami globali sono legami fra grandezze caratteristiche di una risposta canonica in un
dominio e caratteristiche di una risposta canonica in un altro dominio. Le risposte canoniche
di interesse sono la risposta al gradino unitario, la risposta in frequenza e la funzione di
trasferimento. Verranno dapprima studiati i legami − t fra le grandezze caratteristiche della
risposta al gradino unitario e quelle della risposta in frequenza, e successivamente i legami
s − t fra le grandezze caratteristiche della risposta al gradino unitario e quelle della funzione
di trasferimento.
Per sistemi dinamici almeno del secondo ordine, asintoticamente stabili internamente, due
tipici andamenti della risposta al gradino unitario sono quelli riportati nella Figg. 8.5.1 e 8.5.2.
Le grandezze caratteristiche della risposta al gradino unitario di Fig. 8.5.1 sono:
• il valore finale K;
• il tempo di salita o di risposta tr , dato dall’intervallo di tempo che intercorre fra
l’istante in cui la risposta al gradino unitario eguaglia il valore 0.1K e l’istante in cui
la risposta al gradino unitario eguaglia il valore 0.9K ;
• il tempo di formazione t f , dato da k-volte la cotangente dell’angolo formato con
l’orizzontale dalla retta tangente alla risposta al gradino unitario nel punto di ordinata
0.5K;
• il tempo all’emivalore te , dato dal tempo necessario affinché la risposta al gradino
unitario raggiunga il valore 0.5K;
• il tempo di assestamento ta , dato dal tempo necessario affinché la risposta al gradino
unitario entra e si mantiene all’interno della fascia (1 − ) K , (1 + ) K ; valori usuali
di sono 0.01, 0.02 e 0.05, in corrispondenza ai quali si definisce il tempo di
assestamento all’1%, al 2% e al 5%;
• il tempo al picco t p , dato dall’istante in cui la risposta al gradino unitario assume il
valore di picco;
• la sovraelongazione S, definita come il massimo scostamento fra la risposta al gradino
unitario e il valore finale, dopo il primo annullamento di tale scostamento;
• lo pseudoperiodo T dato dal periodo della prima oscillazione.
Tali grandezze possono essere associate ad alcuni degli aspetti significativi del
comportamento di un sistema, che sono: la stabilità, il comportamento in regime permanente
e il comportamento transitorio dai punti di vista della prontezza di risposta e della precisione
dinamica.
Il tempo di salita e il tempo di formazione sono indicative della prontezza di risposta del
sistema, ossia della rapidità con cui il sistema si adegua alle brusche variazioni del segnale
12
d’ingresso (che in questo caso è un gradino unitario). Più sono piccoli sono tali tempi, più
pronto è il sistema.
w-1(t )
T
S
(1+)K
K
(1– )K K
0.9 k
0.9 k
0.9K
0.9 k te
0.1K
t
tf
tr
Fig. 8.5.1 Risposta al gradino unitario oscillatoria smorzata.
Il tempo all’emivalore caratterizza il ritardo con cui la risposta al gradino unitario tende a
stabilirsi. Esso dipende dall’eccesso poli-zeri della funzione di trasferimento del sistema. Si
può infatti dimostrare che se tale eccesso è n-m, si annullano le prime n-m-1 derivate della
risposta al gradino unitario calcolate nell’origine, cioè si ha:
w−( k1) (t ) = 0, k = 0, n − m − 1 .
t =0
Ovviamente, maggiore è il numero di derivate nell’origine nulle, maggiore risulta il tempo
all’emivalore. Si noti che esistono sistemi che hanno tempi di salita e di formazione prossimi
fra loro, ma tempi all’emivalore notevolmente diversi.
13
Tipici andamenti della risposta in frequenza sono quelli riportati nelle Figure 8.5.3 e 8.5.4.
W (j)
W (j0) 0.707 Mr
Mr 0.707 W (j0)
0.5 W (j0)
a) modulo
W (j)
2B 2B20
20
b) fase
Fig. 8.5.3 Andamento tipico dei diagrammi del modulo e della fase di una risposta in frequenza con
risonanza.
Con riferimento alla risposta di Fig. 8.5.3, le grandezze caratteristiche della risposta
armonica sono:
• il valore del modulo per = 0 , W ( j 0) , che rappresenta il guadagno della f.d.t. ingresso-
uscita;
• la banda passante a k-decibel, definita come la pulsazione 2 k in corrispondenza alla
quale il modulo si attenua di k decibel rispetto a W ( j 0) , W ( j 0) db − k . Valori usuali di k
sono 3, 6 e 20. La banda passante a 3-db viene indicata con 2 ;
14
• l’ampiezza di risonanza M r , data dal valore di picco del modulo della risposta in
frequenza;
• la pulsazione di risonanza r , data dal valore della pulsazione in corrispondenza alla quale
il modulo della risposta in frequenza assume il valore di picco;
• il valore 2 ' in corrispondenza al quale il modulo della risposta in frequenza assume il
valore 0.707 M r .
Nel caso in cui il modulo della risposta in frequenza non presenta risonanza le ultime tre
grandezze non possono essere definite. In Fig. 8.5.4 sono riportati gli andamenti dei
diagrammi di Bode in assenza di risonanza.
0
-15
W(jw)
-30
-45 -1 0 1
10 10 10
w [rad/s]
a) modulo
-15
Fase [gradi]
-30
-45 -2 -1 0 1
10 10 10 10
w [rad/s]
a. fase
Fig. 8.5.4 Andamento tipico dei diagrammi del modulo e della fase di una risposta in frequenza senza risonanza.
Un sistema semplice del 2° ordine è un sistema descritto da una f.d.t. del tipo:
15
n2
W (s) = . (8.5.1)
s 2 + 2n s + n2
Il guadagno della W(s) è unitario, e i suoi poli sono complessi e coniugati per ( 0,1) , reali
e coincidenti per = 1 , e reali e distinti per 1 .
1
W−1 (s) = W ( s ) .
s
Risposta al gradino unitario nel caso di poli complessi e coniugati: p1,2 = −n jn 1 − 2
Nel caso di poli complessi e coniugati, la risposta al gradino unitario risulta:
w−1 (t ) = 1 −
1
1− 2 ( )
e−nt sin n 1 − 2 t + cos −1 ( ) , t 0 (8.5.2)
e il suo andamento nel tempo è riportato nella Fig. 8.5.5. L’esame di tale figura mostra che la
risposta al gradino unitario ha un andamento oscillatorio smorzato, compreso fra le curve
inviluppo, i1 (t ) e i2 (t ) , date da:
1
i1 (t ) = 1 + e−nt , (8.5.3)
1− 2
1
i2 (t ) = 1 − e−nt . (8.5.4)
1− 2
tp = . (8.5.5)
n 1 − 2
16
Sostituendo tale valore nella risposta al gradino unitario, si ottiene il suo valore di picco, M p ,
dato da:
M p = w−1 (t p ) = 1 + exp(− ),
1− 2
S = exp(− ), (8.5.6)
1− 2
il cui andamento in funzione di è riportato nella Fig. 8.5.6. Tale andamento mostra che la
sovraelongazione cresce al diminuire di , e poiché è inaccettabile che essa superi il 25%
quale che sia il sistema in esame, occorre porre un limite inferiore a che è pari a 0.4.
2.5
2
i1
1.5
0.3
w-1
0.5
i2
-0.5
0 5 10 15
wn t
Fig. 8.5.5 Risposta al gradino unitario per = 0.3 e inviluppi superiore e inferiore.
2
T 2t p , (8.5.7)
n 1 2
e i valori dei tempi tr , t f , te , e ta possono essere ottenuti soltanto per via numerica, poiché tale
calcolo richiede la soluzione di equazioni trascendenti.
Una espressione approssimata del tempo di assestamento può essere determinata
valutandolo a partire da una delle due curve inviluppo di Fig. 8.5.5, invece che dalla effettiva
risposta al gradino. Considerando l’inviluppo i1 (t ) , tale espressione viene determinata a
partire dalla relazione:
17
i1(ta, ) 1 , (8.5.8)
nta
e
,
1 2
se si trascura ln( 1 2 ) rispetto a ln(1 ) , si ottiene un errore massimo del 11% circa per
0.05 . Accettando tale approssimazione, si ottiene la seguente espressione approssimata
del tempo di assestamento:
3
, 0.05
n
ta . (8.5.10)
4
, 0.02
n
n2
W (s) ,
( s n ) 2
n2
W 1 ( s) . (8.5.11)
s( s n )2
nt
w 1 (t ) 1 e (1 nt ) , t 0. (8.5.12)
L’andamento della risposta al gradino è di tipo aperiodico, ed è illustrato nella Fig. 8.4.5 dove
x nt .
s1 n 2 1 , s2 n 2 1
t T1 t T2
T1e T2e
w 1 (t ) 1 ,t 0, (8.5.13)
T1 T2
tipo oscillatorio smorzato, salvo casi particolari, è sempre preferibile alle risposte che si
ottengono per 1 .
Si osservi, però, che al diminuire di diminuisce il tempo di risposta ma aumentano
sovraelongazione e tempo di assestamento. In generale, il valore della sovraelongazione non
deve mai superare il 25%, il che implica che deve risultare 0.4 (cfr. Fig. 8.5.6). La
relazione fra sovraelongazione e il coefficiente di smorzamento mette in luce che, poiché S
caratterizza la precisione dinamica, anche è una misura della precisione dinamica.
A pari valore di , tr diminuisce al crescere di n , e poiché tr è una misura della
prontezza di risposta, anche n è una misura della prontezza di risposta. Si noti che anche i
tempi ta , te e t p diminuiscono al crescere di n .
In sede di sintesi, scelto il valore di in modo da soddisfare la specifica sulla massima
sovraelongazione ammissibile, il valore di n può essere scelto in modo da ottenere valori
accettabili per ta , te e tr .
8.5.3.2 Grandezze caratteristiche della risposta in frequenza per un sistema semplice del 2°
ordine
Con riferimento al modello (8.5.1), nel caso in cui 0,1 la risposta in frequenza è
costituita da un fattore trinomio a denominatore che si riporta di seguito per comodità:
1
W ( j ) .
2 n j j n
2
1
1
M ( ) , (8.5.14)
2
1 n2 4 n
2 2 2
( ) tg 1
2 n 1 2 n2 . (8.5.15)
Dalla (8.5.14) si ricava che per 0, 0.707 il modulo presenta un massimo e si manifesta il
fenomeno della risonanza. I valori dell’ampiezza e della pulsazione di risonanza sono dati da:
1
Mr , r n 1 2 2 .
2 1 2
Il legame fra M r e M p 1 S è illustrato nella Fig. (8.5.8). Tale legame mostra che
nell’intervallo 0.4, 0.707 i valori di M r e M p , praticamente, coincidono. Poiché è
una misura della precisione dinamica, anche M r è una misura della precisione dinamica.
Inoltre, poiché n è una misura della prontezza di risposta, anche r è una misura della
prontezza di risposta.
Il calcolo della banda passante 2 , calcolato mediante la relazione (2 ) 1 2 ,
fornisce il seguente risultato:
20
2 n 1 2 2 2 4 2 4 4 . (8.5.16)
Per sistemi di ordine maggiore di 2, i legami globali − t possono essere ottenuti per via
empirica. In proposito, sono stati ottenuti i seguenti legami.
Tempo di salita - Per sistemi aventi sovraelongazione inferiore o uguale al 10%, esiste il
seguente legame fra tempo di salita e banda passante a 3 decibel:
Tempo di formazione – Per sistemi con sovraelongazione S 8%, 20% , è stato ottenuto il
legame:
La struttura di entrambe le relazioni (8.5.17) e (8.5.18) può essere giustificate per via
teorica.
W j 2 W ( j 0)
te . (8.5.19)
2
1 S 0.85M r . (8.5.20)
r tr 2 0.2 . (8.5.21)
l
( s zi )
W (s) K w in1 . (8.5.22)
( s pi )
i 1
1
W 1 (s) W (s) .
s
R0 n Ri
W 1 ( s) , (8.5.23)
s i 1 s pi
dove:
22
l
( zi )
R0 lim sW 1 ( s) W(0) K w in1 , (8.5.24)
s 0
( pi )
i 1
l
( pi zj)
j 1
Ri lim ( s pi )W 1 ( s ) n
. (8.5.25)
s pi
pi ( pi pj)
j 1
j i
jt
w 1 (t ) R0 Ri e pit 2 Rj e cos( j t Rj ) , t t0 . (8.5.26)
i 1 j 1
nt
w 1 (t ) R0 2 R1 e cos(n 1 2 t R1 ) , t t0 . (8.5.26)
dove:
l l
( p1 z j ) ( p1 z j )
j 1 j 1
R1 Kw n
, R1 Kw n
,
p1 ( p1 pj) p1 ( p1 pj)
j 2 j 2
l n
R1 ( p1 z j ) p1 ( p1 pj) .
j 1 j 2
23
Fig. 8.5.9 Interpretazione dei fattori del tipo p1 zi in termini di vettori nel piano
complesso.
1 l n
tp ( p1 z j ) p1 ( p1 pj) . (8.5.27)
2 j 1 j 2
2
nt p nt p
Mp w 1 (t p ) R0 2 R1 e cos(t p R1 ) R0 2 R1 e (8.5.28)
n
Ne consegue che la sovraelongazione risulta:
2
nt p
S Mp R0 2 R1 e . (8.5.29)
n
Come già detto, in generale, un sistema è solo potenzialmente in grado di soddisfare gli
obiettivi per i quali è stato costruito, e cioè di comportarsi nella maniera desiderata. Per
conseguire tale obiettivo occorre esercitare sul sistema un complesso di azioni, dette azioni di
controllo o, più semplicemente controllo.
Per dare una definizione precisa di controllo si ammetta che:
a) il comportamento effettivo del sistema possa essere riassunto dall’andamento temporale di
una o più grandezze d’uscita;
b) l’informazione sul comportamento desiderato del sistema possa essere riassunta
dall’andamento temporale di una o più grandezze, dette grandezze di comando o grandezze
di riferimento, il cui valore sia, istante per istante, proporzionale al valore desiderato delle
grandezze di uscita.
Forzare il sistema a comportarsi nel modo desiderato significa, allora, far sì che le
grandezze d’uscita risultino proporzionali alle grandezze di comando entro prefissati margini
di tolleranza, contrastando gli effetti dei disturbi e delle variazioni parametriche che agiscono
sul sistema.
È possibile a questo punto fornire la seguente definizione di controllo.
Definizione 9.1 Si chiama controllo un insieme di azioni che consente di far variare nel modo
voluto le grandezze di uscita di un sistema, alle quali sia associato un livello di potenza
notevolmente superiore rispetto a quello delle grandezze di comando.
Il controllo che di esercita senza l’intervento dell’uomo si dice controllo automatico. Un
sistema di controllo automatico è un insieme di elementi fra loro interagenti, nei quali almeno
una interazione rientra nella definizione di azione di controllo automatico.
Il sistema al quale si vuole imporre il comportamento desiderato viene denominato, come
detto sistema controllato, le grandezze che esercitano l’azione di controllo su di esso vengono
denominate grandezze controllanti, quelle di uscita vengono denominate grandezze
controllate.
Il problema del controllo viene risolto associando al sistema controllato un opportuno
sistema controllante, il cui compito è quello di sviluppare le azioni di controllo a partire dalle
grandezze di riferimento ed, eventualmente, da altre grandezze.
Un primo criterio di classificazione dei sistemi di controllo è quello basato sulle modalità
di controllo impiegate. Le modalità di controllo di base sono:
Il controllo si dice a catena aperta se le azioni di controllo vengono esercitate a partire dalle
grandezze di comando e dalle cause di errore, cioè dai disturbi e dalle variazioni
parametriche, qualora questi possano essere misurati.
In proposito, con riferimento ai disturbi si osservi che alcuni tipi di disturbi possono essere
direttamente misurati, mentre altri tipi possono solamente essere stimati indirettamente, cioè a
partire dalle misure di altre grandezze accessibili per la misura. Le variazioni parametriche,
invece, possono solamente essere stimate indirettamente.
Un sistema di controllo si dice a catena aperta se la modalità di controllo impiegata è
quella a catena aperta. Lo schema strutturale di principio di un sistema di controllo a catena
aperta è riportato in Fig. 9.1.1. Si noti che il dispositivo di controllo, usualmente realizzato
mediante l’impiego di sistemi digitali basati su microprocessore, ha il compito di elaborare
2
SISTEMA
CONTROLLANTE
MISURA DISTURBI
MISURA VARIAZ.
PARAMETRICHE
variazioni disturbi
parametriche
DISPOSITIVO
DI MISURA
SISTEMA CONTROLLANTE
lo schema a catena aperta genera le azioni di controllo a partire dalle cause di errore,
disturbi e variazioni parametriche, mentre lo schema a catena chiusa genera le azioni
di controllo a partire dagli effetti che le cause di errore hanno sull’uscita;
se disturbi e variazioni parametriche potessero essere tutti misurati (anche
indirettamente), i dispositivi di misura fossero istantanei e privi di errori, il dispositivo
di controllo fosse in grado di elaborare i segnali di controllo in tempo reale e gli organi
3
sistemi di regolazione;
sistemi di asservimento.
Nei sistemi di controllo cinetici le grandezze controllate sono di natura meccanica (posizione,
velocità, accelerazione), mentre nei sistemi di controllo di processo le grandezze controllate
sono di natura non meccanica (temperature, livelli, portate, tensioni, frequenze).
I sistemi di asservimento di tipo cinetico vengono anche denominati servomeccanismi.
Nelle Figg. 9.1.3 e 9.1.4 vengono illustrati due possibili schemi di controllo, a catena
aperta e a catena chiusa, il cui scopo è quello di mantenere costante il livello del liquido in un
serbatoio.
Nel sistema di Fig. 9.1.3 viene, anzitutto, misurato il disturbo qu . Tale informazione viene
inviata al dispositivo di controllo che riceve anche quella relativa al livello desiderato. A
partire da tali informazioni, il dispositivo di controllo elabora un segnale elettrico che viene
amplificato in livello e in potenza, al fine di forzare un motore a corrente continua a trascinare
in rotazione il rotore di una pompa volumetrica alla velocità idonea a immettere nel serbatoio
liquido con una portata qi idonea a contrastare gli effetti di qu . E’ facile rendersi conto che a
causa di inevitabili errori di misura e di ritardi nel calcolo della legge di controllo, il livello
4
del liquido non si mantiene costante e pari a quello desiderato. Il serbatoio potrebbe, al limite,
svuotarsi del tutto o riempirsi completamente.
POMPA
VOLUMETRICA
qi l qu
MISURA DELLA
PORTATA qu
Fig. 9.1.3 Sistema di regolazione a catena aperta del livello del liquido in un serbatoio.
Nel sistema di Fig. 9.1.4 la grandezza l (t) viene misurata tramite un galleggiante e trasformata in
una grandezza di tipo elettrico, ad essa proporzionale, collegando il galleggiante stesso al cursore di un
potenziometro a due cursori. L’altro cursore viene posizionato in modo da fornire una grandezza
elettrica proporzionale al valore desiderato del livello del liquido. La differenza fra le differenze di
potenziale fra i due cursori e la massa del potenziometro è, quindi, proporzionale all’errore di livello.
A partire da tale grandezza proporzionale all’errore, il dispositivo di controllo elabora una legge di
controllo che forza tale grandezza, e quindi l’errore di livello, a seguire un andamento temporale
desiderato che tende a zero o a un valore inferiore a una soglia prefissata.
AMPLIFICATORE DI DISPOSITIVO DI
POTENZA CONTROLLO
r1 (t )
E DI LIVELLO
r2 (t )
guide
POMPA
VOLUMETRICA
qi l (t) qu
u: grandezza di comando;
G: generatore della grandezza di comando, ammesso che essa sia nota a priori;
T’, T”: trasduttori, cioè dispositivi che modificano la natura fisica dei segnali d’in-
gresso u e y, generando segnali r e yc della stessa natura fisica, ma di natura fisica
diversa da u e y, legati a queste ultime grandezze tramite una legge nota; le grandezze
di uscita dei due trasduttori sono, generalmente, di natura elettrica per la semplicità
5
con cui tali segnali possono essere manipolati, e la notevole disponibilità di dispositivi
in grado di manipolarli;
r: segnale di riferimento in senso stretto;
yc: segnale di controreazione;
u d: segnale agente;
m: grandezza controllante;
C: controllore o dispositivo di controllo, che ha il compito di elaborare la legge di
controllo in modo che la grandezza v1 abbia un andamento temporale desiderato;
Al: amplificatore elettrico di livello (v2 > v1), che agisce in modo che il guadagno della
funzione di trasferimento che lega y a ud sia sufficientemente elevato;
Ap: amplificatore elettrico di potenza (v3 ha un potenza maggiore di v2);
E: esecutore o attuatore, che fornisce in uscita una grandezza fisica m di natura idonea
a poter pilotare il sistema controllato; poiché le grandezze di ingresso e di uscita di E
hanno una potenza elevata, si può ritenere che E sia un trasduttore a livello di potenza
di potenza;
S.C.: sistema controllato.
u r ud v1 v2 v3 m y
G T’ C Al Ap E S.C.
+
– y
c
T”
LINEA DI CONTROREAZIONE
r (t ) hu(t ) ,
yc (t ) hy (t ) ,
ud (t ) r (t ) yc (t ) h( yd (t ) y (t )) he(t ) (9.1.1)
yd (t ) K d u (t ) , (9.1.2)
6
è ancora possibile realizzare un sistema di controllo basato sull’errore disponendo sulla linea
di controreazione un blocco di trasferenza pari a 1 K d , come indicato nella Fig. 9.1.6.
Si ammetta, adesso, che associando a ciascun elemento dello schema di Fig. 9.1.6 il
relativo modello matematico e utilizzando le relazioni di interconnessione, che esprimono il
modo in cui i vari elementi sono interconnessi fra loro, sia possibile pervenire allo schema
funzionale di Fig. 9.1.7.
U (s) U d (s ) Y ( s)
G (s)
+
Yc ( s )
H (s)
Come già detto in precedenza, allo schema di Fig. 9.1.7 è possibile associare la funzione di
trasferimento:
Y ( s) G (s )
W ( s) . (9.1.3)
U ( s ) 1 G ( s ) H ( s)
F ( s ) G (s ) H (s ) , (9.1.4)
D ( s) 1 F ( s ) 1 G ( s ) H ( s ) . (9.1.5)
La funzione differenza gioca un ruolo fondamentale nello studio dei sistemi di controllo.
Infatti, dalla (9.1.3) emerge che gli zeri della funzione differenza coincidono con i poli della
W ( s ) . Inoltre, in certe condizioni, esiste una importante relazione tra la funzione differenza e
il polinomio caratteristico della matrice dinamica, Acl , del modello con lo stato del sistema a
catena chiusa. Al fine di stabilire tale relazione, si consideri il sistema a controreazione di Fig.
9.1.8, dove i due sottosistemi Sd (della linea diretta) e Sc (della linea di controreazione) sono
descritti dai seguenti modelli con lo stato:
7
x d Ad xd bd ud
Sd : T
(9.1.6)
yd cd xd
x c Ac xc bc uc
Sc : T
(9.1.7)
yc cc xc dc uc
u (t ) ud (t ) y (t )
Sd
+
yc (t )
Sc
x d Ad xd bd (u ccT xc d c cdT xd ) ,
x c Ac xc bc cdT xd ,
x u . (9.1.9)
c bc cdT Ac xc 0
Assumendo come stato dell’intero sistema a controreazione l’insieme degli stati dei
T
sottosistemi Sd e Sc , x xdT xcT , il modello a catena chiusa risulta:
dove:
d ( s)
G (s ) cdT (sI Ad ) 1 bd , (9.1.12)
d (s )
( s)
H ( s) ccT ( sI Ac ) 1 bc d c c , (9.1.13)
c (s )
( s ) c ( s )
cl ( s ) det( sI Acl ) d ( s) c ( s) 1 d d ( s) c ( s) d ( s)c ( s) ,(9.1.14)
d (s ) c ( s )
La dimostrazione del Teorema 9.1.1 è riportata nell’Appendice A.
d ( s ) c (s )
D ( s ) 1 G ( s ) H ( s) 1 . (9.1.15)
d ( s) c ( s )
Asserzione 9.1.1 Assumendo che non esistano fenomeni di cancellazione nella funzione di
trasferimento a catena aperta F ( s ) G ( s) H ( s) , gli zeri della funzione differenza coincidono
con gli zeri di cl ( s) , cioè con gli autovalori della matrice dinamica del modello a catena
chiusa.
Si consideri il sistema a catena aperta illustrato nella Fig. 9.1.9, dove Gc ( s) e G p (s ) sono,
rispettivamente, le funzioni di trasferimento del dispositivo di controllo e del sistema
controllato, Z (s ) è la trasformata di Laplace di un disturbo z (t ) , non misurabile, che agisce
all’uscita del sistema controllato e M ( s ) è la trasformata di Laplace della grandezza
controllante. Si noti che l’uscita del blocco G p (s ) non è accessibile per la misura; infatti,
l’insieme dei blocchi da M (s ) a Y (s ) , compreso il disturbo Z (s ) , costituiscono tutti una
schematizzazione del sistema controllato.
Si consideri, inoltre, il sistema a catena chiusa illustrato nella Fig. 9.1.10, dove N (s )
rappresenta la trasformata di Laplace di un segnale equivalente di rumore introdotto dal
dispositivo di misura della grandezza di uscita, H ( s ) rappresenta la funzione di trasferimento
del dispositivo di misura, mentre le altre grandezze e/o funzioni hanno lo stesso significato
illustrato in precedenza.
9
Z ( s)
U ( s) M ( s) +
Gc ( s ) G p (s )
+ Y (s )
Fig. 9.1.9 Schema a catena aperta.
Z (s )
U ( s) M (s ) + Y (s)
Gc ( s ) G p (s )
+ +
+ +
N ( s)
H ( s)
Fig. 9.1.10 Schema a catena chiusa
Con riferimento ai sistemi di Figg. 9.1.9 e 9.1.10, si definisca l’errore e(t ) come segue:
Y (s ) Yz ( s) Yu ( s ) , (9.1.17)
dove:
Yz ( s ) Z ( s ), Yu ( s ) W ( s)U ( s ) ,
E ( s ) K d U ( s ) Y ( s ) K d W ( s ) U (s ) Z (s ) Eu ( s ) E z (s ) , (9.1.18)
Eu ( s ) K d W ( s ) U (s ) , (9.1.19)
Ez ( s ) Z (s ) . (9.1.20)
10
W ( j ) K d , u , (9.1.21)
essendo u la regione della frequenza in cui si suppone confinato il contenuto armonico del
segnale di comando utile, e che il modulo della risposta in frequenza sia ridotto a zero il più
rapidamente possibile all’esterno di tale regione ( u ).
In tale caso, infatti, denotando con u (t ) u (t ) nu (t ) l’effettivo segnale di comando
generato, ivi incluso il segnale di rumore nu (t ) ad esso sovrapposto, l’effettiva uscita yu (t ) ,
nel dominio di , è data da:
Yu ( j ) W ( j )U ( j ) W ( j ) Nu ( j ) ,
la quale mostra che del rumore sovrapposto al segnale di comando viene riprodotta all’uscita
solamente quella parte che ha contenuto armonico all’interno nella regione in cui
W ( j ) ³ , essendo la soglia al disotto della quale si può ritenere trascurabile W ( j ) .
L’esame della (9.1.20) mette in luce che il disturbo z (t ) agisce direttamente sull’errore
senza alcuna possibilità di contrastarlo a meno che non si proceda a una sua misura.
Infine, se si manifestano variazioni nei parametri della funzione G p (s ) , il comportamento
del sistema potrebbe deteriorarsi poiché la condizione W ( j ) Gc ( j )G p ( j ) K d
potrebbe non risultare più soddisfatta.
Y (s ) Z (s ) Gc (s )G p ( s) U ( s ) H ( s) Y (s ) N ( s ) ,
da cui si ottiene:
1
Y ( s) Z ( s ) Gc ( s)G p ( s )U ( s ) F ( s ) N ( s ) , (9.1.22)
1 F (s)
11
dove:
F ( s ) Gc ( s )G p ( s ) H ( s ) . (9.1.23)
E ( s ) K d W (s ) U ( s ) Wz (s ) Z ( s ) Wn ( s ) N (s ) Eu ( s ) E z ( s ) En (s ) , (9.1.24)
Gc ( s )G p ( s )
W (s) , (9.1.25)
1 F (s)
1
Wz (s ) , (9.1.26)
1 F ( s)
F ( s)
Wn ( s) , (9.1.27)
1 F ( s)
Eu ( s ) K d W ( s ) U (s ) , (9.1.28)
E z ( s) Wz ( s ) Z ( s ) , (9.1.29)
En ( s ) Wn ( s) N ( s ) . (9.1.30)
L’esame della (9.1.24) mette che in un sistema a catena chiusa l’errore complessivo è dato
dalla sovrapposizione di tre componenti, dovute alla grandezza di comando, al disturbo e al
rumore di misura della grandezza di uscita. Conviene esaminare in dettaglio il contributo delle
tre succitate componenti.
Dall’analisi svolta per i sistemi a catena aperta, è emerso che conviene scegliere la W ( s ) in
modo tale che la corrispondente risposta in frequenza W ( j ) soddisfi la condizione:
W ( j ) K d , u , (9.1.31)
essendo u la regione della frequenza in cui è confinato il contenuto armonico del segnale di
comando utile, e che il modulo della risposta in frequenza sia ridotto a zero il più rapidamente
possibile all’esterno di tale regione ( u ).
Dall’esame della funzione di trasferimento W ( s ) (cfr. (9.1.25)) emerge che la (9.1.31) può
essere ottenuta progettando Gc (s ) e H ( s) in modo tale che:
F ( j ) Gc ( j )G p ( j ) H ( j ) 1, u . (9.1.32)
1
H ( j ) , u . (9.1.33)
Kd
Gc ( j )G p ( j ) 1
W ( j ) , u . (9.1.34)
Gc ( j )G p ( j ) H ( j ) H ( j )
Eu ( s ) K d W (s )Gu ( s ) U (s ) , (9.1.35)
Z (s )
M (s ) + Y (s )
U (s )
Gu ( s ) Gc ( s ) G p (s )
+ +
+ +
H ( s)
Fig. 9.1.11 Schema a catena chiusa a due gradi di libertà.
13
Tali considerazioni mostrano che lo schema di Fig. 9.1.11 è in grado di contrastare gli
effetti degli errori dovuti al disturbo e al segnale di comando anche se tali grandezze hanno
contenuti armonici in bande di frequenza differenti. Infatti, per contrastare gli effetti del
disturbo z (t ) si sceglie opportunamente la funzione F ( s ) Gc ( s )G p (s ) H (s ) , mentre per
contrastare quelli dovuti al segnale di comando basta scegliere convenientemente la funzione
Gu ( s ) .
Wn ( j ) 1 ,
lim Wn ( j ) 0 .
Ne consegue che il sistema a controreazione è sensibile alle armoniche del rumore di misura
che ricadono nel campo di frequenze u , mentre attenua le armoniche ad alta frequenza. Ciò
costituisce un vantaggio poiché, usualmente, il rumore di misura ha un contenuto armonico
confinato alle alte frequenze.
F ( s ) Gc (s )G p ( s ) . (9.1.36)
F ( s)
W ( s) , (9.1.37)
1 F (s)
1
Wz (s ) , (9.1.38)
1 F ( s)
F ( s)
Wn (s ) , (9.1.39)
1 F ( s)
14
E ( s ) S ( s ) U (s ) Z (s ) C ( s ) N (s ) , (9.1.40)
dove:
1
S (s ) , (9.1.41)
1 F ( s)
F ( s)
C ( s ) Wn ( s) . (9.1.42)
1 F ( s)
S (s ) C (s ) 1 . (9.1.43)
Naturalmente, in tale caso, le considerazioni svolte nel paragrafo precedente sono ancora più
evidenti.
Nell’ambito della teoria classica, lo studio dei sistemi di controllo viene effettuato in
accordo ai criteri della soluzione parziale e del legame diretto fra il comportamento
dell’intero sistema e quello delle singole parti di cui è costituito.
Il criterio della soluzione parziale consiste nell’isolare e analizzare separatamente i vari
aspetti del comportamento del sistema; come già osservato in precedenza, sono aspetti
caratteristici del comportamento di un sistema la stabilità, il comportamento in regime
permanente e il comportamento transitorio dal doppio punto di vista della prontezza di
risposta e della precisione dinamica.
I segnali di comando e i disturbi che si considerano nella valutazione del comportamento di
un sistema sono i segnali canonici, l’impulso di Dirac e i suoi integrali successivi o i segnali
sinusoidali di frequenza opportuna.
Il criterio del legame diretto consiste nella individuazione di metodi di studio che
permettono di ottenere informazioni sull’intero sistema a partire da quelle sulle singole parti
di cui esso è costituito.
15
Appendice A
éM M12 ù
M = ê 11 ú,
ëêM 21 M 22 ûú
(
det ( M ) = det ( M11 ) det M 22 - M 21 M11
-1
M12 . ) (A.1)
(
det ( M ) = det ( M 22 ) det M11 - M12 M 22
-1
M 21 . ) (A.2)
Il polinomio caratteristico della matrice Acl del modello (9.1.10) e (9.1.11) è dato da:
ésI - A + b d c T bd ccT ùú
ê nd d d c d
det( sI - Acl ) = det ê
T ú. (A.4)
êë - bc cd sI nc - Ac úû
cl = det(sI - Acl ) = det( sI nc - Ac ) det éëêsI nd - Ad + bd dc cdT + bd ccT ( sI nc - Ac ) - 1 bc cdT ùûú =
é - 1ù
( ) ( )(
det( sI nc - Ac ) det sI nd - Ad det êI nd + bd d c cdT + bd ccT ( sI nc - Ac ) - 1 bc cdT sI nd - Ad ú =
ë û )
é ù
(
- 1
( ) ) (
det( sI nc - Ac ) det sI nd - Ad det êI nd + bd d c + ccT ( sI nc - Ac ) - 1 bc cdT sI nd - Ad ú .
ë û)
Considerando, adesso, le seguenti relazioni di appartenenza delle matrici:
( )
-1
(
bd dc + ccT ( sI nc - Ac )- 1 bc Î C nd ´ 1, cdT sI nd - Ad ) Î C1´ nd ,
é ù
(
-1
( ) ) (
cl (s ) = det( sI nc - Ac ) det sI nd - Ad det ê1 + d c + ccT ( sI nc - Ac ) - 1 bc cdT sI nd - Ad
ë ) bd ú ,
û
16
é ( s) ( s ) ù
cl (s ) = c ( s )d ( s ) det [1 + H ( s)G ( s)] = c ( s) d ( s) det ê1 + c d ú=
êë c ( s ) d ( s) úû
c (s ) d ( s ) + c ( s ) d ( s ) , (A.5)
17
Lo studio della stabilità dei sistemi di controllo a controreazione può essere effettuato
ricorrendo ai criteri algebrici di stabilità o a criteri basati sulla considerazione di funzioni
associate alle singole parti di cui è costituito il sistema. Al primo gruppo appartiene il già noto
criterio di Routh, mentre al secondo gruppo appartiene il criterio di Nyquist che verrà
illustrato nel presente capitolo.
L’inconveniente principale dei criteri algebrici si manifesta quando si vuole impiegarli per
risolvere un problema di sintesi. In tal caso, infatti, occorre determinare i parametri liberi del
sistema controllante in modo tale che il sistema sia stabile. Utilizzando il criterio di Routh, la
soluzione del problema implica quella del seguente sistema di disequazioni non lineari:
Si consideri il sistema a controreazione e a ciclo unico riportato nella Fig. 10.1.7, che si
riporta di seguito per comodità, e si ammetta che:
U ( s) U d (s ) Y (s )
G (s)
+
Yc (s )
H (s)
1. gli zeri della funzione differenza coincidano con gli autovalori della matrice dinamica
del sistema a catena chiusa;
2. la funzione di trasferimento a catena aperta F ( s ) G (s ) H (s ) sia propria o
strettamente propria;
(s zi )
i 1
D ( s) K D n
. (10.1.1)
(s pi )
i 1
Per lo studio della stabilità interna asintotica occorre e basta verificare che gli zeri della
funzione differenza D( s ) abbiano tutti parte reale negativa, in quanto essi, come detto (cfr.
ipotesi 1), coincidono con quelli del polinomio caratteristico relativo al sistema a retroazione.
Tale verifica può essere effettuata mediante il criterio di Nyquist che si basa sul seguente
principio dell’argomento.
18
Principio dell’argomento Nella ipotesi che la funzione differenza non abbia zeri e/o poli
sull’asse immaginario, la variazione di fase D , della funzione D( j ) quando s descrive
l’asse immaginario da j a j , valutata positivamente in senso antiorario, è uguale a
2 volte la differenza fra il numero di poli, P, e il numero di zeri, Z, a parte reale positiva
della funzione differenza D( s ) . In simboli, si ha:
D, 2 ( P Z ) . (10.1.2)
n
D ( j ) i ( ) i ( ) , (10.1.3)
i 1
ne consegue che:
n
D, i , i , , (10.1.4)
i 1
Assumendo quindi che D( s ) abbia P poli e Z zeri a parte reale positiva, si ha:
e quindi risulta:
T PZ . (10.1.7)
Osservazione 10.1.2 Si noti, adesso, che P è noto poiché i poli della D( s ) coincidono con
quelli della F ( s ) . Ne consegue che se si riesce a calcolare T, è possibile calcolare Z con la
(10.1.7) e quindi valutare la stabilità interna asintotica del sistema a controreazione di Fig.
10.1.1. Avendo escluso che la funzione D( s ) abbia zeri sull’asse immaginario, per la stabilità
del sistema a controreazione occorre e basta che risulti Z 0 . Di conseguenza, la condizione
necessaria e sufficiente di stabilità è T P .
Osservazione 10.1.3 Il calcolo di T può essere effettuato a partire dal diagramma polare della
funzione di trasferimento a catena aperta F ( j ) . Con riferimento alla Fig. 10.1.3,
interpretando 1 come un vettore che ha origine nel punto di coordinate (1, j 0) , denominato
punto critico, ed estremità nell’origine del piano di Nyquist della F ( j ) , la somma vettoriale
di tale vettore e del vettore rappresentativo della F ( j ) , vettore OQ , fornisce proprio il
vettore rappresentativo della D( j ) , vettore che ha origine nel punto critico ed estremità nel
punto Q. Pertanto, il numero di giri che il vettore rappresentativo di D( j ) compie intorno
all’origine del piano di Nyquist di D( j ) è pari al numero di giri che il vettore
rappresentativo di D( j ) compie intorno al punto critico del piano della F ( j ) .
(1, j 0) Im[ F ( j )]
1 O
D( j ) Re[ F ( j )]
F ( j )
Q
Osservazione 10.1.4 Si noti che il numero di giri T dovrebbe essere valutato in corrispondenza
a un percorso chiuso, descritto una sola volta dal punto s, costituito dall’intero asse
immaginario e da una semicirconferenza di raggio infinitamente grande in modo da
racchiudere tutto il semipiano positivo del piano complesso e, di conseguenza, tutti gli
eventuali poli a parte reale positiva della D( s ) . Tuttavia, l’ipotesi che la f.d.t. a catena aperta
20
I casi critici del criterio di Nyquist hanno origine dalla presenza di zeri o poli della
funzione differenza sull’asse immaginario del piano complesso.
U ( s) U d (s ) Y (s )
G (s)
+
Yc ( s )
H (s)
Fig. 10.2.1 Schema elementare a controreazione.
sistema all’ingresso di Fig. 10.2.4 è costituita da una oscillazione di ampiezza crescente, come
illustrato nella Fig. 10.2.5.
Bode Diagram
50
System: Gp
Frequency (rad/s): 2.23
0 Magnitude (dB): -29.5
-50
-100
-150
-90
-180
System: Gp
Frequency (rad/s): 2.24
Phase (deg): -180
-270
10-2 10-1 100 101 102
Frequency (rad/s)
Fig. 10.2.2 Diagrammi di Bode della G ( j )
Fig. 10.2.5 Risposta del sistema a catena chiusa di Fig. 10.2.3, all’ingresso di Fig. 10.2.4, con K p 30.9
Un’analisi più accurata mostra che assumendo K p 30 la risposta del sistema a catena
chiusa diviene quella di Fig. 10.2.6 costituita, a regime, da una oscillazione persistente. Ciò
trova conferma nel fatto che la f.d.t. a catena chiusa, per tale valore di K p , risulta data da
30
W (s) 3 2
i cui poli sono p1 6 , p2 j 2.236 e p3 j 2.236 . La f.d.t. a
s 6 s 5s 30
catena chiusa ha un polo reale e una coppia di poli immaginari e coniugati, il che implica che,
a regime, la risposta del sistema all’ingresso di Fig. 10.2.4 è costituita da una oscillazione
persistente di frequenza 2.236 rad/s. L’ampiezza si ottiene mediante antitrasformata della
1 1
funzione Y (s ) W ( s)U ( s ) con U ( s ) e0.01s . Ovviamente, risulta
s s
y(t ) w1 (t ) w1 (t 0.01) . Da notare che per fare apparire questa oscillazione, è stato
necessario sollecitare il sistema a catena chiusa con un impulso rettangolare di durata 10 ms e
ampiezza 1, mostrato nella Fig. 10.1.6. Inoltre, il diagramma polare della funzione F ( j )
con K p 30 risulta quello di Fig. 10.2.7, che passa per il punto critico -1+j0.
Quanto descritto in precedenza mostra che la condizione F ( j ) 1 è solamente
condizione necessaria ma non sufficiente per il manifestarsi di una oscillazione.
Fig. 10.2.6 Risposta del sistema a catena chiusa di Fig. 10.2.3, all’ingresso di Fig. 10.2.4, con K p 30
23
Nyquist Diagram
2
1.5
0.5
-0.5
System: Gp1
-1
Real: -2.08
Imag: -0.671
-1.5 Frequency (rad/s): 1.48
-2
-4 -3.5 -3 -2.5 -2 -1.5 -1 -0.5 0
Real Axis
Fig. 10.2.7 Diagramma polare della funzione F ( j ) G ( j ) , K p 30 . F ( j ) 1 , with 2.24 rad/s
i cui diagrammi di Bode sono riportati nella Fig. 10.2.8. Assumendo K p 15.8489 (24 dB),
si ha F ( j 4.57) 1 (cfr Fig. 10.2.9) e la risposta del sistema a catena chiusa, con H (s ) 1 ,
all’ingresso 10.2.4 risulta oscillante ma diverge molto lentamente. Assumendo K p 15.8 la
risposta è costituita da un’oscillazione persistente di piccola ampiezza, come illustrato nella
Fig. 10.2.11.
Bode Diagram
0
-20
System: Gp
-40
Frequency (rad/s): 4.57
-60 Magnitude (dB): -24
-80
-100
270
180
System: Gp
Frequency (rad/s): 4.57
90 Phase (deg): 180
0
10-3 10-2 10-1 100 101 102 103
Frequency (rad/s)
Nyquist Diagram
10
System: F
Real: 10.6
5 Imag: 9.22
Frequency (rad/s): 46.1
-5
-10
-5 0 5 10 15 20
Real Axis
Fig. 10.2.8 Diagramma polare della funzione F ( j ) G ( j ) , K p 15.8 . F ( j ) 1 , con 4.57 rad/s
Fig. 10.2.11 Risposta del sistema a catena chiusa di Fig. 10.2.10, all’ingresso di Fig. 10.2.4, con K p 15.8 .
Esempio 10.2.2 L’esempio che segue ha lo scopo di provare che un sistema a catena chiusa
può essere portato nelle condizioni al limite di stabilità anche variando i parametri del
sistema, cioè poli, zeri e guadagno. Più precisamente, si consideri la f.d.t. data da:
e si ammetta che per qualche motivo i parametri subiscano variazioni del 30% nel fattore di
trasferimento, nel polo -5 e nel polo -10. La nuova f.d.t. diviene quindi:
Bode Diagram
20
0
System: Gp
-20 Frequency (rad/s): 5.63
Magnitude (dB): -0.0277
-40
-60
-80
270 System: Gp
Frequency (rad/s): 5.63
Phase (deg): 168
180
90
0
10-3 10-2 10-1 100 101 102 103
Frequency (rad/s)
Fig. 10.2.12 Diagrammi di Bode della F ( j )
Bode Diagram
50
0
System: Gp
Frequency (rad/s): 5.82
-50 Magnitude (dB): -0.0601
-100
270 System: Gp
Frequency (rad/s): 5.84
Phase (deg): 180
180
90
0
10-3 10-2 10-1 100 101 102 103
Frequency (rad/s)
Fig. 10.2.13 Diagrammi di Bode della F ( j )
Il confronto fra i diagrammi di Bode delle Figg. 10.2.12 e 10.2.13 mostra che il sistema a
catena chiusa caratterizzato dalla f.d.t F ( s ) ha un margine di fase di circa 12°, mentre quello
caratterizzato dalla f.d.t F ( s) è praticamente al limite della stabilità.
una brusca variazione di fase del vettore corrispondente j p i il cui segno è indeterminato;
inoltre, il modulo della funzione F ( j ) , e quindi quello della D( j ) , tende a .
Al fine di superare tale problema, si deforma l’asse immaginario mediante un percorso
semicircolare di raggio infinitesimo e centrato nel polo immaginario che lasci alla propria
sinistra o alla propria destra il polo stesso (cfr. Fig. 10.1.4 per il caso di un polo nell’origine).
Come già osservato, quando s passa per il polo j il modulo tende a e il diagramma
polare si spezza in due rami, uno dei quali termina per mentre l’altro inizia da
+ . Tali rami possono essere raccordati osservando che, quando s descrive uno dei due
percorsi semicircolari (a o b), l’estremo del vettore rappresentativo della funzione F ( j )
descrive tante semicirconferenze di raggio infinitamente grande quante ne indica la
molteplicità del polo, in verso orario se si sceglie il percorso a o in verso antiorario se si
sceglie il percorso b.
j
a
b
Esempio 10.1.1
Si supponga che la funzione F ( s) abbia la distribuzione poli e zeri mostrata in Fig. 10.1.5, cui
corrisponde la seguente espressione analitica nella variabile :
KF . (10.2.2)
F ( j )
1 1
j j j
T1 T2
j
a
1 1
b
T2 T1
computato come un polo a parte reale negativa), mentre nel secondo caso P 1 (il polo nell’origine
viene computato come un polo a parte reale positiva), si ha in entrambi i casi T P e Z 2 . Ne
consegue che il sistema è instabile.
Come è facile verificare, scegliendo il percorso a risulta T 0 ed essendo P 0 risulta
T P e il sistema è asintoticamente stabile internamente. Scegliendo il percorso b risulta
T 1 ed essendo P 1 il sistema risulta asintoticamente stabile internamente.
E’ facile rendersi conto che se il punto critico si trovasse alla destra del punto di intersezione del
diagramma polare con il semiasse reale negativo, come illustrato nella Fig. 10.2.4, il sistema sarebbe
instabile. Infatti, per quanto concerne il calcolo di T, scegliendo il percorso a si ha T 2 , mentre
scegliendo il percorso b si ha T 1 . Poiché nel primo caso P 0 (il polo nell’origine viene
computato come un polo a parte reale negativa), mentre nel secondo caso P 1 (il polo nell’origine
viene computato come un polo a parte reale positiva), si ha in entrambi i casi T P e Z 2 . Ne
consegue che il sistema è instabile.
0 a
j Im[ F ( j )]
b
Re[ F ( j )]
0
D (j)
F ( j )
0
Fig. 10.2.3 Diagramma completo per la valutazione della stabilità. Punto critico a sinistra dell’intersezione con il
semiasse reale negativo.
0 a
Im[ F ( j )]
b
Re[ F ( j )]
0
D (j)
F ( j )
0
Fig. 10.2.4 Diagramma completo per la valutazione della stabilità. Punto critico a destra dell’intersezione con il
semiasse reale negativo.
28
I sistemi a stabilità regolare sono caratterizzati dalla esistenza di un solo valore critico del
guadagno kc tale che per k kc il sistema a catena chiusa risulta instabile (IST), mentre
k kc il sistema è asintoticamente internamente stabile (S) (cfr. Fig. 10.3.1). Per tali sistemi,
il diagramma polare della funzione di trasferimento a catena aperta presenta una sola
intersezione con il semiasse reale negativo.
S IST
kc k
Fig. 10.3.1 Influenza del guadagno sulla stabilità: sistemi a stabilità regolare.
Nella Fig. 10.3.2 sono riportati i diagrammi polari per sistemi a stabilità regolare
corrispondenti a modelli stabili, instabili e al limite di stabilità (LS). Il guadagno critico è
quello corrispondente al caso in cui il diagramma polare della funzione di trasferimento a
catena aperta passa per il punto critico (-1, j0).
S
IST LS
10.3.2 Diagrammi polari F ( j ) per sistemi a stabilità regolare.
I sistemi a stabilità condizionata sono caratterizzati da diversi valori critici del guadagno
che individuano regioni contigue all’interno delle quali il sistema risulta alternativamente
stabile (S) o instabile (IST, cfr. Fig. 10.3.3). I sistemi in questione sono caratterizzati da
diversi punti di intersezione del diagramma polare della funzione di trasferimento a catena
aperta presenta con il semiasse reale negativo (cfr. Fig. 10.3.4).
S IST S IST
kc1 kc 2 kc 3 k
Fig. 10.3.3 Influenza del guadagno sulla stabilità: sistemi a stabilità condizionata.
Con riferimento alla Fig. 10.3.4, kc1 è il guadagno corrispondente al caso in cui
l’intersezione C del diagramma polare della F ( j ) con il semiasse reale negativo coincide
con il punto critico (-1, j0), kc 2 corrispondente al caso in cui l’intersezione B del diagramma
polare della F ( j ) con il semiasse reale negativo coincide con il punto critico (-1, j0), e kc3
corrispondente al caso in cui l’intersezione A del diagramma polare della F ( j ) con il
semiasse reale negativo coincide con il punto critico (-1, j0).
29
C A
B O
per k kc1 il punto C è a destra del punto critico e il sistema a catena chiusa risulta
asintoticamente stabile internamente;
per k (kc1 , kc 2 ) il punto critico appartiene al tratto BC e il sistema è instabile;
per k ( kc 2 , kc 3 ) il punto critico appartiene al tratto BA e il sistema è
asintoticamente stabile internamente;
per k kc 3 il sistema risulta instabile.
L’analisi svolta in precedenza mette in luce che mediante il criterio di Nyquist è possibile
studiare la stabilità del modello matematico “nominale” di un sistema reale, cioè di un
modello nel quale figurano i valori nominali dei parametri. Com’è noto, a causa delle
tolleranze dei componenti utilizzati, del loro invecchiamento e delle condizioni operative del
sistema reale stesso i parametri del modello sono noti con un certo margine di incertezza. E’
dunque di fondamentale importanza valutare, oltre alla stabilità nominale, se la stabilità è
anche robusta, nel senso che essa viene mantenuta per tutti i valori previsti per i parametri del
modello.
Nell’ambito della teoria classica del controllo, un modo per valutare la robustezza della
proprietà di stabilità è quello di fare ricorso ai margini di stabilità, il margine di guadagno e il
margine di fase, i quali misurano la distanza del modello dalle condizioni limite di stabilità.
Per definire i margini di stabilità si ipotizza che la curva polare abbia una sola intersezione
con il semiasse reale negativo (cioè che il sistema sia a stabilità regolare) e che abbia una sola
intersezione col cerchio di raggio unitario centrato nell’origine del piano di Nyquist (cfr. Fig.
10.4.1). In tali ipotesi è possibile definire un solo margine di fase e un solo margine di
guadagno.
I ( )
(1, j 0) R ( )
Com’è noto, per i sistemi a stabilità regolare le condizioni limite di stabilità sono
caratterizzate dal fatto che la curva polare della F ( j ) passa per il punto critico: esiste cioè
30
un certo valore * di tale che F ( j*) 1 . Tale equazione equivale alle seguenti due
equazioni scalari:
F ( j*) 1 , (10.4.1)
F ( j*) . (10.4.2)
I margini di stabilità vengono, allora, definiti ammettendo che sia soddisfatta una delle
precedenti condizioni e valutando il margine che rimane perché sia soddisfatta anche la
condizione rimanente.
Per definire il margine di guadagno mg si considera il valore di in corrispondenza
al quale viene soddisfatta la condizione di fase (10.4.2), con il segno positivo o con quello
negativo, e si valuta il margine che rimane affinché sia soddisfatta la condizione sul modulo
(10.4.1). In particolare, il margine di guadagno viene definito come quel numero per cui
occorre moltiplicare il F ( j ) per ottenere un risultato pari a 1. Quindi, si ha:
1
mg . (10.4.3)
F ( j )
1 I ( )
mg
(1, j 0) R ( )
Fig. 10.4.2 Valutazione del margine di guadagno a partire dal diagramma polare della F ( j ) .
In maniera del tutto analoga, per definire il margine di fase m si considera il valore t di
in corrispondenza al quale è soddisfatta la (9.4.1), cioè F ( jt ) 1 ( F ( jt ) dB 0) , e si
valuta il margine che rimane affinché sia soddisfatta la condizione sulla fase (10.4.2).
Dai risultati dell’analisi svolta nel paragrafo 2, esempi 10.2.2, se il vettore rappresentativo
di F ( jt ) è nel terzo o quarto quadrante, per portare il sistema a catena chiusa al limite di
stabilità occorre sottrarre alla F ( jt ) un angolo pari a m 0 in modo tale che
F ( jt ) m , per F ( jt ) 0 , oppure F ( jt ) m , per F ( jt ) 0 . Il
margine di fase m , allora, risulta:
I ( )
F ( jt )
m
R ( )
P
Fig. 10.4.3 Valutazione del margine di fase a partire dal diagramma polare della F ( j ) .
Il margine di fase può anche essere dedotto dai diagrammi di Bode della F ( j ) come
indicato nella Fig. 10.4.4. Più precisamente, si determina, anzitutto, la pulsazione t in
corrispondenza alla quale F ( jt ) dB 0 ; essendo F ( jt ) 0 si valuta l’angolo che si deve
sottrarre a F ( jt ) per ottenere .
F ( j ) dB
t
F ( j ) dB
F ( j )
m
Fig. 10.4.4 Valutazione del margine di guadagno a partire dai diagrammi di Bode della F ( j ) .
32
La definizione di due margini di stabilità è giustificata dal fatto che nessuno dei due
margini è sufficiente a misurare da solo la distanza del modello nominale dalle condizioni per
cui si ha il passaggio alla instabilità. Ciò emerge chiaramente dall’esame della Fig. 10.4.5,
dove sono illustrati i diagrammi polari di due funzioni che di trasferimento a catena aperta
alle quali corrisponde identico valore per il margine di guadagno ma valori ben diversi del
margine di fase. Chiaramente, il sistema caratterizzato dalla funzione II, cui corrisponde il
valore più piccolo del margine di fase, è più vicino alle condizioni per cui si ha il passaggio
alla instabilità rispetto al sistema caratterizzato dalla funzione I.
Valori tipici di m e mg sono, rispettivamente, 40° 60° e 6 8 dB.
I ( )
R ( )
II
I
Fig. 10.4.5
Si noti, adesso, che in un sistema con un solo margine di guadagno e con un solo margine
di fase la stabilità del sistema a catena chiusa implica che il margine di guadagno espresso in
dB e il margine di fase sono entrambi positivi. Il viceversa non è, in generale, vero.
In proposito, esiste una varietà di situazioni molto ampia e, di conseguenza, risulta molto
difficile individuare condizioni sui margini di stabilità in grado di coprire tutte le situazioni
che possono presentarsi in pratica, cioè segni del fattore di trasferimento e del guadagno,
distribuzione poli-zeri, presenza di elementi di ritardo finito nelle funzioni di trasferimento,
presenza di zeri a parte reale positiva, e presenza di poli nell’origine o a parte reale positiva.
L’obiettivo che ci si pone è quello di individuare una classe di funzioni di trasferimento a
catena aperta che portano a sistemi a catena chiusa, la cui stabilità possa essere caratterizzata
dai margini di stabilità.
A tale scopo, conviene considerare le principali caratteristiche delle f.d.t. che descrivono i
sistemi di interesse pratico.
1. La f.d.t. può essere propria o strettamente propria. Nel primo caso, si ha
lim F ( j ) K F , dove K F è il fattore di trasferimento della funzione, mentre nel
secondo caso si ha lim F ( j ) 0 .
2. La f.d.t. può avere poli con parte reale positiva, negativa o nulla. Nel primo e nel
secondo caso si ha lim F ( j ) K gF , mentre nel terzo caso si ha lim F ( j ) .
0 0
3. La f.d.t. può essere a fase minima o non minima. Nel primo caso, la funzione non ha
zeri o poli a parte reale positiva, mentre nel secondo caso ha zeri o poli a parte reale
positiva.
4. La f.d.t. può avere poli a parte reale positiva o meno. Nel secondo caso per lo studio
della stabilità si ha P 0 , e la funzione è a fase minima se non ha zeri a parte reale
positiva.
5. Se la f.d.t. è a fase minima, il guadagno ha lo stesso segno del fattore di trasferimento.
Se la f.d.t. è a fase non minima guadagno e fattore di trasferimento potrebbero avere
segno opposto.
33
6. Il diagramma polare corrispondente alla f.d.t. può non avere intersezioni con il semiasse
reale negativo, oppure può averne una o più. Nel caso in cui ne abbia una, il sistema può
essere a stabilità regolare o meno.
7. Il diagramma polare corrispondente alla f.d.t. può non avere intersezioni con il cerchio
di raggio unitario centrato nell’origine del piano, oppure averne una o più. Nel caso in
cui ne abbia una, il sistema a catena chiusa caratterizzato a catena aperta dalla f.d.t. in
questione ha un solo margine di fase.
Il Criterio di Bode che segue fornisce condizioni necessarie e sufficienti perché i margini di
stabilità forniscano informazioni sia sulla stabilità del sistema, che sulla robustezza della
stabilità stessa in presenza di variazioni parametriche, per una classe di funzioni di
trasferimento a catena aperta di sistemi a catena chiusa. Prima di studiare il Criterio di Bode,
conviene fornire i risultati che seguono.
Lemma 10.4.2 Condizione sufficiente affinché un sistema a controreazione tale che F ( s ) non
abbia poli a parte reale positiva ( P 0 ), sia asintoticamente internamente stabile è che il
diagramma polare completo della F ( j ) non contenga il punto critico.
Prova La necessità si dimostra tenendo conto che i margini di stabilità, definiti per sistemi a
stabilità regolare e con un solo margine di fase, misurano la distanza di un modello LTI
asintoticamente stabile internamente dalle condizioni per cui si ha il passaggio alla instabilità.
Quindi, assumendo il margine di guadagno espresso in dB, nel caso di sistemi asintoticamente
stabili internamente sono entrambi positivi per definizione.
Occorre, adesso, dimostrare la sufficienza nelle ipotesi 1-4. L’ipotesi che F ( s ) sia
strettamente propria implica che il F ( j ) converge a zero per . L’ipotesi che il
margine di fase sia ben definito, cioè esista un’unica pulsazione di attraversamento del
cerchio di raggio unitario da parte del diagramma polare della F ( j ) , implica che tale
modulo sia maggiore di uno per valori di da 0 a t . Tale intersezione avviene dall’esterno
verso l’interno del cerchio unitario, nel primo o secondo quadrante oppure nel terzo o quarto
quadrante. L’ipotesi di sistema a stabilità regolare implica che per portare il sistema al limite
34
di stabilità occorre aumentare il guadagno a catena aperta fino a che si abbia F ( j ) 1 . Le
succitate ipotesi implicano che il diagramma polare completo della F ( j ) , per che va da
a , non contiene il punto critico e, quindi, risulta T 0 . L’ipotesi P 0 implica che
P T , da cui segue l’asintotica stabilità interna del sistema a catena chiusa.
L’importanza della ipotesi di stabilità regolare emerge chiaramente dalle situazioni
illustrate negli esempi che seguono.
(s 1)( s 2)
F ( s ) 0.8 . (10.4.7)
s3
Nella Fig. 10.4.6 è riportato il diagramma di Bode della funzione (10.4.7), da cui si deduce
che il sistema ha un solo margine di guadagno pari a mg 1.7 e un solo margine di fase
dB
pari a m 5 , ma i segni di tali margini sono opposti. In assenza dell’ipotesi di stabilità
regolare, si dovrebbe concludere che il sistema a catena chiusa sia instabile. Invece, la
semplice applicazione del criterio di Nyquist mostra che il sistema risulta asintoticamente
internamente stabile.
Per provare quanto detto, si consideri il diagramma polare della funzione F ( j ) illustrato
in Fig. 10.4.7. Al fine di studiare la stabilità del sistema a catena chiusa con la f.d.t. a catena
aperta (10.4.7), si consideri il corrispondente diagramma polare completo di Fig. 10.4.8. In
tale figura sono indicati:
Bode Diagram
200
150
100 System: Gp
System: Gp
Frequency (rad/s): 2.41
50 Frequency (rad/s): 6.73
Magnitude (dB): 15.6
Magnitude (dB): 0.0672
0
-50
-90
System: Gp
Frequency (rad/s): 2.42
Phase (deg): -180 System: Gp
-180 Frequency (rad/s): 6.73
Phase (deg): -140
-270
10-2 10-1 100 101 102 103
Frequency (rad/s)
Fig. 10.4.6 Diagrammi di Bode della f.d.t. (10.4.7)
35
105
Nyquist Diagram
1.5
0.5
System: F
-0.5
Real: -8.08e+03
Imag: -1.06e+05
Frequency (rad/s): -0.0663
-1
-1.5
-10000 -8000 -6000 -4000 -2000 0 2000
Real Axis
Fig. 10.4.7 Diagramma di Nyquist della f.d.t. (10.4.7)
Nyquist Diagram
1
0.8
0.6
0.4 System: F
Real: -7.17
0.2 Imag: 0.544
Frequency (rad/s): 2.23
0
-0.2
-0.4
-0.6
-0.8
-1
-8 -7 -6 -5 -4 -3 -2 -1 0 1
Real Axis
Fig. 10.4.7 Diagramma di Nyquist della f.d.t. (10.4.7), nell’intorno del punto -1.
Il numero di giri che il vettore rappresentativo della D( j ) centrato nel punto critico del
piano risulta dalla seguente Tabella 1.
Tabella 1
Percorso Numero di giri corrispondente
Percorso I, da a t +1 2
Percorso II, da t a 0 1 4
36
0
IV
V
I
III A
VI1
C
II
0
Esempio 10.4.2 Si consideri, adesso, il sistema a catena chiusa avente la f.d.t. a catena aperta
data da:
F ( s ) 10000
s 10 s 20 s 5 . (10.4.8)
s 0.1 s 0.5 s 0.2 s 1000
I diagrammi di Bode della f.d.t. a catena aperta F ( j ) , illustrati nella Fig. 10.4.9, mostrano
che il sistema a catena chiusa ha un solo margine di fase per t 104 rad/sec, e due
attraversamenti del semiasse negativo, per 1 0.484 e 4.601 , con margini di
guadagno entrambi negativi. Senza l’ipotesi di sistema a stabilità regolare, il sistema sarebbe
instabile. Tuttavia, l’applicazione del criterio di Nyquist, che può essere effettuata
considerando la sequenza di diagrammi di Fig. 10.4.10 a), b), c) e d), mostra che il sistema è
asintoticamente internamente stabile. Infatti, considerando il diagramma polare di Fig.
10.4.10, e applicando il criterio di Nyquist, il numero di giri che il vettore rappresentativo
della funzione D( j ) , centrato nel punto critico del piano e con estremo sulla curva polare,
risulta pari al doppio della somma di 0.5 (cfr. d)), -0.5 (cfr. c), b), a)), -0.5 ( cfr. a)), +0.5 (cfr.
b), c), d)), e quindi pari a zero. Poiché P 0 , il sistema risulta asintoticamente stabile
internamente.
37
Ciò non contrasta con il criterio di Bode, poiché la F ( j ) presenta due intersezioni con il
semiasse negativo e, quindi, l’ipotesi di stabilità regolare non è soddisfatta.
Magnitude (dB)
Phase (deg)
Nyquist Diagram
104
6
System: F
2 Real: -1.5e+03
Imag: 857
Frequency (rad/s): 1.82
0
-2
-4
-6
-5 -4 -3 -2 -1 0 1
Real Axis 104
b) Diagramma polare per 0.631
38
Nyquist Diagram
600
400
System: F
200 Real: -183
Imag: 12.2
Imaginary Axis
Frequency (rad/s): 4.34
0
-200
-400
-600
-2000 -1500 -1000 -500 0 500
Real Axis
c) Diagramma polare per 1.82
Nyquist Diagram
60
40 System: F
Real: -183
Imag: 12.2
20 Frequency (rad/s): 4.34
Imaginary Axis
-20
-40
-60
-200 -150 -100 -50 0
Real Axis
d) Diagramma polare per 4.34
Esempio 10.4.3 Si consideri, adesso, il sistema a catena chiusa avente la f.d.t. a catena aperta
data da:
F ( s ) 10000
s 0.1 s 0.5 s 0.2 . (10.4.9)
s 10 s 20 s 5 s 1000
L’esame della Fig. 10.4.11 mostra che la F ( j ) corrispondente alla (10.4.9) attraversa due
volte sia l’asse reale negativo, sia il cerchio di raggio unitario centrato nell’origine del piano.
Le fasi della f.d.t. in corrispondenza alle due pulsazioni di attraversamento, t1 5.71 e
t 2 1.02 104 , risultano opposti in segno e quindi i margini di fase sono dati da
m1 180 F ( jt1 ) 180 167 13 e m 2 180 F ( jt 2 ) 180 84.3 95.7 . I
39
-60
System: F
Frequency (rad/s): 0.482
-80 Magnitude (dB): -55 System: F
270 Frequency (rad/s): 4.54
Phase (deg): 180
180
System: F System: F
Frequency (rad/s): 0.484
90 Frequency (rad/s): 5.71
Phase (deg): 180 Phase (deg): 167
System: F
0 Frequency (rad/s): 1.04e+04
Phase (deg): -84.3
-90
10-2 100 102 104
Frequency (rad/s)
Fig. 10.4.11 Diagrammi di Bode della f.d.t. (10.4.9)
Nyquist Diagram
8
0
System: F
Real: 9.75
-2 Imag: -0.0618
Frequency (rad/s): 189
-4
-6
-8
-2 0 2 4 6 8 10
Real Axis
Fig. 10.4.12 Diagramma di Nyquist della f.d.t. (10.4.9), per valori positivi di
40
10-4
Nyquist Diagram
4
System: F
0 Real: 9.17e-05
Imag: 5.53e-05
Frequency (rad/s): 0.0334
-1
Fig. 10.4.13 Diagramma di Nyquist della f.d.t. (10.4.9), per valori di prossimi a zero e a .
Nyquist Diagram
1
0.8
0.6
0.4 System: F
Real: -0.633
0.2 Imag: 0.00395
Frequency (rad/s): 4.58
0
-0.2
-0.4
-0.6
-0.8
-1
-2 -1.5 -1 -0.5 0
Real Axis
Fig. 10.4.14 Diagramma di Nyquist della f.d.t. (10.4.9), nell’intorno del punto critico
Con riferimento ai sistemi a stabilità condizionata e ai sistemi con più margini di fase, vale
quanto prima detto a proposito dei sistemi con una sola intersezione con il semiasse reale
negativo e con il cerchio di raggio unitario, purché ci si limiti a considerare il sistema al limite
di stabilità soltanto nel caso peggiore. Più precisamente, con riferimento ai sistemi a stabilità
condizionata (cfr. Fig. 10.3.4), si consideri il sistema al limite di stabilità solamente se C
coincide con il punto critico, mentre per un sistema con più margini di fase (cfr. Fig. 10.4.15)
si consideri ancora il caso C al fine di definire il sistema al limite di stabilità.
Fig. 10.4.15 Esempio di funzione a catena aperta con tre intersezioni con il cerchio unitario
41
e s
G p ( s) K p , (10.4.10)
(1 sT )
Bode Diagram
50
0
System: G
System: G
Frequency (rad/s): 2.17
Frequency (rad/s): 3.31
Magnitude (dB): -0.323
-50 Magnitude (dB): -7.23
-100
0
-180
System: G System: G
Frequency (rad/s): 2.17 Frequency (rad/s): 3.29
-360 Phase (deg): -165 Phase (deg): -180
-540
-720
10-3 10-2 10-1 100 101 102
Frequency (rad/s)
Fig. 10.4.17 Diagrammi di Bode corrispondenti alla f.d.t. (10.4.10). K p 50, 0.1 s, T 10 s .
42
Nyquist Diagram
30
20
10
System: G
-10 Real: 41.6
Imag: -19.7
Frequency (rad/s): 0.042
-20
-30
-10 0 10 20 30 40 50
Real Axis
Fig. 10.4.18 Diagramma polare completo corrispondente alla f.d.t. (10.4.10). K p 50, 0.1 s, T 10 s
Si noti, adesso, che assumendo 0.5 s , il diagramma polare completo della f.d.t. a catena
aperta diviene quello di Fig. 10.4.19. Tale diagramma mostra che T 2, P 0 e quindi il
sistema a catena chiusa è instabile.
Quest’ultimo esempio mostra che un ritardo di tempo superiore a un certo valore, nella
propagazione dei segnali sulla linea di azione diretta, può rendere instabile il corrispondente
sistema a catena chiusa.
Nyquist Diagram
30
20
10
-10
-20
-30
-10 0 10 20 30 40 50
Real Axis
Fig. 10.4.19 Diagramma polare completo corrispondente alla f.d.t. (10.4.10). K p 50, 0.5 s, T 10 s .
sz
F (s) K F , (10.4.11)
(s p1 )(s p2 )
con K F 0.5, z 0.8, p1 0.1, p2 1 , i cui diagrammi di Bode e polare completo sono
illustrati nella Fig. 10.4.20 e 10.4.21, rispettivamente.
Bode Diagram
20
0
System: F
-20 Frequency (rad/s): 0.408
Magnitude (dB): -0.095
-40
-60
180
System: F
Frequency (rad/s): 0.407
90 Phase (deg): 54.6
-90
10-3 10-2 10-1 100 101 102
Frequency (rad/s)
Fig. 10.4.20 Diagrammi di Bode alla f.d.t. (10.4.11).
Nyquist Diagram
2.5
1.5
0.5
-0.5
-1
System: F
-1.5 Real: 0.529
Imag: -0.953
-2 Frequency (rad/s): -0.366
-2.5
-4 -3 -2 -1 0 1
Real Axis
Fig. 10.4.21 Diagramma polare completo corrispondente alla f.d.t. (10.4.11).
L’esame dei diagrammi di Bode di Fig. 10.4.20 mostra che esiste un unico margine di fase
pari a circa 54.6° per t 0.407 rad/s , e che il margine di guadagno è infinitamente grande,
essendo la fase della F ( j ) tendente asintoticamente a 180 . Il diagramma di Bode per
valori positivi di non ha nessuna intersezione con il semiasse reale negativo, ma parte da
un punto di tale asse, per 0 , di ascissa pari a K gF 4 , e per tende
all’origine essendo F ( s ) strettamente propria. Poiché K gF 1 , il diagramma polare
completo della F ( j ) contiene il punto critico, T 1 , e il sistema è instabile. Anche in
44
questo caso, l’ipotesi di sistema a stabilità regolare viene violata e il Criterio di Bode non può
essere applicato.
Per stabilizzare il sistema in questione, ocorre ridurre il guadagno a catena aperta in modo
che risulti K gF 1 . A tal fine, si consideri la f.d.t. F (s ) KF (s ) , con F (s ) data dalla
(10.4.11) e K 1 / 8 . Il diagramma polare completo, riportato nella Fig. 10.4.22, è contenuto
nel cerchio di raggio unitario, e il sistema a catena chiusa caratterizzato dalla f.d.t. a catena
aperta F ( j ) è asintoticamente internamente stabile.
Nyquist Diagram
0.4
0.3
0.2
0.1
-0.1
-0.2
-0.3
-0.4
-1 -0.8 -0.6 -0.4 -0.2 0 0.2
Real Axis
( s z1 )( s z2 )
F ( s) K F , (10.4.12)
(s p1 )(s p2 )(s p3 )
-40
-60
-80
540
System: F
360 Frequency (rad/s): 0.127 System: F
Phase (deg): 467 Frequency (rad/s): 4.92
Phase (deg): 180
180
0
10-3 10-2 10-1 100 101 102 103
Frequency (rad/s)
Fig. 10.4.23 Diagrammi di Bode alla f.d.t. (10.4.12).
45
Nyquist Diagram
1.5
0.5
-0.5
System: F
Real: 0.235
Imag: -0.516
-1 Frequency (rad/s): -0.272
-1.5
-2 -1.5 -1 -0.5 0 0.5
Real Axis
Fig. 10.4.24 Diagramma polare completo corrispondente alla f.d.t. (10.4.12).
L’esame della Fig. 10.4.23 mostra che il margine di guadagno è positivo, ma il margine di
fase è negativo, pari a m 180 467 287 0 . Essendo le 4 ipotesi del Criterio di Bode
verificate, il sistema a catena chiusa è instabile. Ciò è anche evidente dall’andamento del
diagramma polare completo di Fig. 10.4.24, il quale mostra che T 1 .
d F ( j ) dB
F ( jt ) , (10.4.5)
40 d log
t
è possibile giudicare qualitavamente la stabilità del sistema a catena chiusa in base alla
pendenza del diagramma dei moduli in corrispondenza alla pulsazione di attraversamento.
Assumendo infatti P 0 , per il Teorema 10.2 la condizione necessaria e sufficiente per la
stabilità è che risulti:
d F ( j ) dB
F ( jt ) ,
40 d log
t
ovvero che:
d F ( j ) dB
40 dB/dec . (10.4.6)
d log t
46
G (s) n2
W (s) 2 , 10.5.1)
1 G ( s ) s 2n s n2
che, com’è noto, è la funzione di trasferimento di un sistema semplice del secondo ordine.
U + Y
G (s)
n2
Fig. 10.5.1 Sistema semplice del secondo ordine: G ( s ) .
s (s 2n )
Il margine di fase e la pulsazione di attraversamento del sistema di Fig. 10.5.1, sono dati
da:
t n 1 4 4 2 2 , (10.5.2)
1 4 4 2 2
m arctan . (10.5.3)
2
0.01m .
Lo studio della stabilità asintotica interna di sistemi con più anelli di controreazione, può
essere effettuato applicando ripetutamente il criterio di Nyquist a partire dall’anello più
interno. Considerato, ad esempio, il sistema di Fig. 10.6.1, assorbendo l’anello interno, la cui
funzione di trasferimento W1 ( s) è data da:
G1 (s )
W1 (s ) ,
1 G1 (s ) H1( s )
47
U + Ud1 + Ud2 Y
G1
–
H1
H2
U+ Y
W1
-
H2
Fig. 10.6.2 Schema di controllo di Fig. 10.6.1 con l’anello interno assorbito
Per tale sistema il criterio di Nyquist se e solo se TD2 ( j ) PF2 ( s ) , dove TD2 ( j ) è il numero
di giri della funzione differenza D2 ( j ) 1 F2 ( j ) con F2 ( j ) W1 ( j ) H 2 ( j ) , e PF2 ( s )
è il numero di poli a parte reale positiva della funzione F2 ( s ) . Il calcolo di PF2 ( s ) può essere
effettuato applicando il principio dell’argomento all’anello interno di Fig. 10.6.1, riportato
nella figura 10.6.3, dalla relazione PF2 ( s ) Z D1 ( s ) TD1 ( j ) PF1 ( s ) , con F1 (s ) G1 (s ) H1 ( s ) e
D1 ( j ) 1 F1 ( j ) .
G1
–
H1
E ( s ) K d W ( s ) U (s ) Wz ( s ) Z ( s ) Eu ( s ) E z ( s ) , (10.1.1)
tk
( k 1) (t ) 1 (t ) , (10.1.2)
k!
4. nella prima fase di studio, sia presente uno solo dei segnali in gioco: per i sistemi di
asservimento sia presente il segnale di comando e non il disturbo, mentre per i sistemi
di regolazione sia presente il disturbo e non il segnale di comando.
Eu ( s ) K d W ( s ) U (s ) Weu ( s )U (s ) . (10.1.3),
dove:
Weu (s ) K d W (s ) .
U (s) M (s) Y (s )
Gc ( s) G p (s)
+
H ( s)
1 Weu ( s )
euk lim sEu (s ) lim sWeu ( s) k 1
lim . (10.1.4)
s 0 s 0 s s 0 sk
Prova Dall’esame della (10.1.4) emerge che se Weu ( s ) ha uno zero di molteplicità
nell’origine, allora eu è finito e diverso da zero. Inoltre, eu finito e diverso da zero implica
che Weu (s ) abbia uno zero di molteplicità nell’origine. Infatti, se Weu (s ) avesse uno zero
nell’origine di molteplicità maggiore di allora eu 0 , mentre se Weu ( s ) avesse uno zero
nell’origine di molteplicità minore di allora eu .
Adesso, nello spirito del legame diretto fra il comportamento dell’intero sistema e quello
delle singole parti di cui è costituito, conviene determinare condizioni per l’appartenenza di
un sistema al tipo direttamente sulle funzioni G (s ) Gc (s )G p (s ) e H ( s ) . In proposito
conviene distinguere il caso dei sistemi a reazione proporzionale da quello dei sistemi a
reazione dinamica.
50
K d2
Weu ( s) K d W (s ) , (10.1.5)
K d G (s )
dove G (s ) Gc (s )G p (s ) e, pertanto, gli zeri della funzione Weu ( s ) coincidono con i poli
della funzione G (s ) . Si dimostra, allora, la seguante Asserzione.
K d2
eu lim Weu (s ) lim . (10.1.6)
s 0 s 0 K s s G ( s)
d
K d2
, 0
K d K gG
eu . (10.1.7)
K d2
, 1
K gG
La (10.1.7) mostra che l’errore finale diminuisce al crescere del guadagno della funzione di
trasferimento della linea di azione diretta.
Si assuma, adesso, che la retroazione sia dinamica e, cioè, che H ( s ) sia data da:
j s j
j 0
H ( s) P
. (10.1.8)
js j
j 0
In tale caso, il fatto che la funzione G (s ) abbia un polo di molteplicità nell’origine non
implica che il sistema sia di tipo . Ciò può essere verificato osservando che la funzione
Weu (s ) ha uno zero di molteplicità nell’origine se risulta:
51
dk
lim Weu ( s ) 0, k 0, 1 , (10.1.9)
s 0 ds k
d
lim Weu ( s ) 0 e finito . (10.1.10)
s 0 ds
1
G (s ) G ( s ) , G (0) 0 ,
s
G( s) G ( s )
Weu ( s) K d W (s ) K d Kd ,
1 G ( s) H (s) s G ( s ) H (s )
e per s 0 , si ha:
G (0) 1
lim Weu ( s ) K d Kd . (10.1.11)
s 0
G (0) H ( s ) H (0)
Ne consegue che il sistema è di tipo 0, a meno che il guadagno della funzione H ( s ) non
venga scelto pari a:
1
H (0) 0 . (10.1.12)
0 Kd
Osservazione 10.1.1 Si noti che la condizione (10.1.12), molto semplice da realizzare, è anche
semplice da mantenere nel tempo, poiché essa coinvolge parametri della funzione H ( s ) che,
come già detto, deve essere realizzata con tolleranze molto strette.
Assumendo, adesso, che G ( s ) abbia un polo nell’origine di molteplicità 2, ponendo:
1
G (s ) G ( s) 2 , G (0) 0
s
le condizioni per l’appartenenza del sistema di asservimento al tipo 2 sono date dalla
(10.1.12) e dalla relazione:
d
lim Weu (s ) 0 . (10.1.13)
s 0 ds
Poiché risulta:
d d G (s )
Weu (s ) Weu(1) ( s)
ds ds s 2 G ( s ) H ( s )
G (1) ( s) s 2 G ( s) H (s ) G ( s ) 2 s G (1) ( s) H (s ) G ( s) H (1) ( s) , (10.1.14)
s
2
2
G ( s ) H (s )
52
si ottiene:
d
lim Weu ( s )
G (1) (0)G (0) H (0) G (0) G (1) (0) H (0) G (0) H (1) (0)
H (1) (0)
.
s 0 ds 2 2
G (0) H (0) H (0)
(10.1.15)
Essendo inoltre:
L P L P
j j s j s j s j j s j 1
j 1 j j
j 1 j 0 j 0 j 1
H (1) ( s) 2
,
P
js j
j 0
si ha:
1 0 0 1
H (1) (0) ,
02
e la (10.1.13) diviene:
1 0 0 1
d 02 1 0 0 1
lim Weu ( s ) 2
0. (10.1.16)
s 0 ds
0 02
0
0 1
H (0) , (10.1.17)
0 Kd
1 0 1
. (10.1.18)
1 0 Kd
Le (10.1.17) e (10.1.18) sono semplici da realizzare e da mantenere nel tempo per le stesse
motivazioni illustrate nella Osservazione 10.1.1.
eutr (t ) eu (t ) eu 0 , (10.1.19)
1
eu (t ) L1 Eu ( s) L1 K d W ( s ) K d w1 (t ), t 0 .
s
(10.1.20)
Ne consegue che:
Ciò premesso, lo studio del comportamento transitorio dei sistemi di asservimento può
essere effettuato in due modi.
Nel primo vengono utilizzate le grandezze caratteristiche dell’errore transitorio e cioè il
tempo di salita, il tempo di formazione, la eventuale sovraelongazione, il tempo di
assestamento, il tempo all’emivalore e l’eventuale tempo al picco.
Nel secondo vengono impiegati gli indici di qualità. Tali indici permettono di valutare il
comportamento transitorio in maniera globale, in quanto sono dei funzionali che permettono
di associare un numero all’andamento dell’errore transitorio nell’intervallo 0, .
L’espressione generale di un indice di qualità è la seguente:
J 0 f (etr (t ))t i dt , (10.1.22)
dove f (etr (t )) , denominata funzione importanza, pesa gli errori in relazione alla loro entità,
mentre t i , denominata funzione peso, pesa gli errori in relazione al tempo in cui si
manifestano.
Scegliendo come funzione importanza la funzione:
0 etr (t )dt ,
2
ISE (10.1.24)
ITSE etr2 (t )tdt . (10.1.25)
0
IAE 0 etr (t ) dt , (10.1.27)
ITAE 0 etr (t ) tdt . (10.1.28)
Ez ( s) Wz (s ) Z ( s ) . (10.1.29)
Prova L’errore relativo al disturbo è dato dalla (10.1.29); quindi l’errore finale ez 0 ,
corrispondente a un disturbo a gradino, risulta:
1
ez 0 lim sEz (s ) lim sWz (s ) Wz (0) . (10.1.30)
s 0 s 0 s
55
Z (s )
M (s ) + Y (s)
Gc ( s ) G p (s )
+ +
H (s)
1
Wz (s ) .
1 F ( s)
G p ( s)
Wz (s ) . (10.1.31)
1 F ( s)
Osservando che gli zeri di Wz (s ) sono gli zeri di G p (s ) e i poli di Gc ( s ) H ( s ) , che H ( s ) non
può avere poli nell’origine e che G p (s ) non può avere zeri nell’origine, altrimenti l’uscita non
potrebbe risultare costante, si conclude che il polo nell’origine, che rende astatico l’intero
sistema, deve essere contenuto nella Gc ( s ) . Risulta quindi dimostrato il seguente risultato:
eztr (t ) ez (t ) ez 0 , t 0 (10.1.32)
56
dove ez 0 è l’errore finale, che coincide con l’errore a regime , ed ez (t ) è l’errore complessivo
dato da:
1
ez (t ) L1 Ez ( s ) L1 Wz (s ) wz, 1 (t ), t 0 . (10.1.33)
s
Ne consegue che:
Ciò premesso, lo studio del comportamento transitorio dei sistemi di regolazione si effettua
in modo analogo a quello dei sistemi di asservimento.
1
12.1 Introduzione
Z (s)
U (s) M (s) + Y (s)
Gc ( s) G p (s)
+ +
+ +
N (s)
H (s)
F ( s) Gc ( s )G p ( s ) . (12.2.1)
F ( s)
W ( s) , (12.2.2)
1 F ( s)
1
Wz ( s) , (12.2.3)
1 F ( s)
F ( s)
Wn ( s) , (12.2.4)
1 F ( s)
E ( s) Kd W (s) U (s) Wz (s)Z (s) Wn (s) N (s) Eu (s) Ez (s) En (s) . (12.2.5)
2
Z (s)
M (s) + Y (s)
U (s)
Gu ( s) Gc ( s) G p (s)
+ +
+ +
H (s)
1. scelta della struttura della parte controllante fra quelle più semplici ed efficienti;
2. determinazione dei parametri della parte controllante in modo da soddisfare le specifiche di
progetto, e utilizzando i legami diretti fra il comportamento del sistema complessivo e
quello delle sue singole parti;
3. verifica delle prestazioni ottenute;
4. eventuale modifica della struttura e/o dei parametri della parte controllante fino a
conseguire le prestazioni desiderate.
Con riferimento alla fase 1, si osservi che le strutture più semplici ed efficienti per ottenere
le prestazioni usualmente richieste sono quelle a controreazione a uno o due gradi di libertà,
riportate nelle Figg. 12.3.3 e 12.3.4 dove si è supposto K d 1 .
Z
U + Y
Gc (s) Gp (s) +
+ _
Z
U + Y
Gu (s) Gc (s) Gp (s) +
+ _
Con riferimento alla fase 2, la determinazione dei parametri del dispositivo di correzione
viene effettuata in modo tale che il sistema complessivo soddisfi le prestazioni desiderate.
Queste ultime vengono assegnate ispirandosi al criterio della soluzione parziale che, come
detto, consiste nell’isolare e trattare separatamente i diversi aspetti del comportamento del
sistema, ossia la stabilità, il comportamento in regime permanente e il comportamento
transitorio. Poiché i legami diretti relativi al comportamento transitorio sono piuttosto incerti,
affinché il procedimento di sintesi possa essere condotto a buon fine con un numero di
tentativi ragionevole, occorre assegnare le succitate specifiche in maniera non rigida.
La verifica delle prestazioni ottenute viene effettuata utilizzando i procedimenti di analisi
precedentemente studiati. In proposito va ricordato che, poiché le specifiche vengono, di
solito, assegnate sulla risposta al gradino, la valutazione del comportamento transitorio
richiede il calcolo della risposta al gradino relativa all’ingresso o al disturbo o delle relative
grandezze caratteristiche. Il calcolo della risposta al gradino può essere effettuato mediante il
luogo delle radici che permette il calcolo della espressione analitica della f.d.t. ingresso-uscita
o disturbo-uscita, mentre il calcolo delle grandezze grandezze caratteristiche della risposta al
gradino può essere effettuato in modo agevole utilizzando la carta di Hall o la carta di
Nichols.
Nel seguito verranno trattate separatamente la sintesi dei sistemi di asservimento e quella
dei sistemi di regolazione. Questa distinzione è dovuta al fatto che la parte controllante di un
sistema di regolazione, denominata regolatore, ha struttura fissa e parametri aggiustabili. Il
compito del progettista è allora quello di stabilire i valori dei parametri nel loro campo di
escursione. Per i sistemi di asservimento, invece, esiste una certa libertà di scelta della
struttura della parte controllante e la progettazione viene effettuata caso per caso.
Sia per i sistemi di asservimento che per quelli di regolazione, si farà riferimento allo
schema di correzione a reazione unitaria di Fig. 12.3.3. Successivamente, verranno illustrate
le modifiche per sistemi a reazione proporzionale con K d 1 .
Si noti, adesso che il metodo di sintesi per tentativi può essere sviluppato sia nel dominio
di s, sia nel dominio di . Verrà illustrato, dapprima, il metodo di sintesi per tentativi nel
dominio di , e successivamente quello nel dominio di s.
E ( s) S ( s) U ( s) Z ( s) C ( s) N ( s) , (12.4.1)
4
1
S (s) , (12.4.2)
1 F ( s)
F (s)
C (s) . (12.4.3)
1 F ( s)
con:
S (s) C (s) 1 , (12.4.4)
essendo:
F ( s) Gc ( s)G p ( s) .
Il metodo di sintesi denominato loop shaping consiste nella scelta della f.d.t. del
dispositivo di controllo la Gc ( s) in modo da “sagomare” la f.d.t. a catena aperta F ( j ) come
segue:
a) F ( j ) 1, u;
b) F ( j ) 1, in ;
c) la regione di transizione xu , in sia sufficientemente stretta, ma con una adeguata scelta
della pulsazione di attraversamento e della pendenza del diagramma dei moduli, tale da
garantire la stabilità del sistema a catena chiusa;
d) la grandezza m(t ) non sia tale da sollecitare troppo l’attuatore che pilota il sistema
controllato.
S( j ) 1, u , (12.4.5)
C( j ) 1, C( j ) 0, u. (12.4.6)
10
Fig. 12.4.1 Diagrammi di Bode della funzione F ( s ) .
s( s 1)( s 10)
Bode Diagram
50
System: W
Frequency (rad/sec): 1.31
Magnitude (dB): -3.02
0
Magnitude (dB)
-50 System: W
Frequency (rad/sec): 8.68
Magnitude (dB): -40
-100
-150
0
-90
Phase (deg)
System: W
Frequency (rad/sec): 1.3
-180
Phase (deg): -128
-270
-3 -2 -1 0 1 2
10 10 10 10 10 10
Frequency (rad/sec)
10
Fig. 12.4.2 Risposta in frequenza del sistema a catena chiusa corrispondente a F ( s ) .
s( s 1)( s 10)
L’esame della Fig. 12.4.2 conferma quanto già osservato in precedenza, cioè che il sistema
a catena chiusa è in grado di riprodurre fedelmente segnali di comando con contenuto
armonico nell’intervallo 0,0.1 rad/s. Infatti, in tale intervallo di frequenze, il modulo e
6
d F ( j ) db
40 dB/decade . (12.4.7)
d log10 ( )
t
7
Bode Diagram
System: Gp
Frequency (rad/sec): 0.141
40
Magnitude (dB): -0.0805
0
-40
Magnitude (dB)
-90
-180
Phase (deg)
System: Gp
Frequency (rad/sec): 0.148
Phase (deg): -182
-270
-360
-3 -2 -1 0 1 2 3
10 10 10 10 10 10 10
Frequency (rad/sec)
0.2
Fig. 12.4.3 Diagrammi di Bode della funzione F ( s) .
s( s 0.02)( s 1)( s 10)
Come già osservato, il sistema a catena chiusa corrispondente alla f.d.t. a catena aperta di
Fig. 12.4.3 risulta instabile. L’instabilità è dovuta alla coppia di poli complessi e coniugati a
parte reale leggermente positiva presenti nella f.d.t. a catena chiusa data da:
0.2
W ( s) 4 3
,
s 11.02s 10.22s 2 0.2s 0.2
i cui poli sono:
p1 1.0021, p2 10.1997, p3 0.0009 j0.1399, p4 p3* .
2
Amplitude
-1
-2
-3
0 500 1000 1500
Time (sec)
0.2
Fig. 12.4.4 Risposta al gradino del sistema a catena chiusa corrispondente a F ( s) .
s( s 0.02)( s 1)( s 10)
8
12.4.2 Sintesi per tentativi basata su specifiche assegnate sulla risposta al gradino o sulla
risposta in frequenza.
Il metodo di sintesi per tentativi nel dominio di , basato su specifiche assegnate sulla
risposta al gradino o sulla risposta in frequenza, si articola nelle seguenti fasi.
B
S log10 1.5M r , (12.4.10)
B6
B
B6ta ,5% 2.16M r 0.4 , (12.4.11)
B6
e dal legame:
1 S 0.85M r , (12.4.12)
B
dalla (12.4.10) si ottengono vincoli su M r ;
B6
B
dalla (12.4.11), noti ta ,5% e M r ,si ottengono vincoli su B6 ;
B6
B
dalla (12.4.12), si determina M r e, successivamente, e B.
B6
9
La traduzione delle specifiche sulla risposta in frequenza in specifiche sulla f.d.t. a catena
aperta F ( j ) può essere effettuata, in modo semplice, assumendo che la f.d.t. del sistema
controllato soddisfi le ipotesi previste dal criterio di Bode. In tal caso, infatti, i segni positivi
di m g ed m costituiscono condizioni necessarie e sufficienti per la stabilità, e m può essere
considerato come misura della precisione dinamica, oltre che una misura del grado di stabilità
del sistema a catena chiusa.
La traduzione da M r a m può essere effettuata utilizzando i luoghi a M e costanti.
Con riferimento alla Fig. 12.4.7, ammettendo che il vincolo su M r sia dato da M r [1,3] dB ,
i punti di intersezione dei luoghi a M 1 e a M 3 con l’asse 0 dB forniscono vincoli
inferiore e superiore sul margine di fase. In particolare, si ha m [42 ,53 ] .
La prontezza di risposta può essere caratterizzata dalla pulsazione di attraversamento, la
quale è legata alla banda passante a 3 dB dalla relazione:
t [3B,5B] , (12.4.13)
dove B è la banda passante in Hz.
Ovviamente, i succitati legami sul comportamento transitorio, sono noti con un rilevante
margine di incertezza.
La traduzione delle specifiche inerenti il comportamento a regime risulta, invece, semplice
e priva di incertezze. Infatti, l’appartenenza di un sistema a un determinato tipo implica un
ben definito numero di poli nell’origine nella F ( s ) , mentre la specifica sull’errore finale
implica un ben definito limite inferiore sul guadagno della F ( s ) stessa.
Nel caso in cui la f.d.t. del sistema controllato abbia poli a parte reale positiva ( P 0 ) il
margine di fase non è più indicativo né della stabilità né della precisione dinamica. Tale caso
verrà trattato nel seguito.
Con riferimento alla scelta della Gc ( s) , le azioni elementari di correzione utilizzate sono le
azioni attenuatrice, anticipatrice e combinata. Denotando con Gec ( s) la f.d.t. dell’azione
elementare di correzione, il dispositivo di correzione ha la struttura che segue,
Gc ( s) KcGec (s) .
Azione attenuatrice. Viene utilizzata nei casi in cui è necessario attenuare il modulo della
f.d.t. a catena aperta F ( j ) . La f.d.t. di un elemento di correzione ad azione attenuatrice è
caratterizzata da una coppia polo-zero, con il polo più vicino all’origine, ed è data da:
mr
s
1 r
Gecr ( s) . (12.4.14)
mr s 1
r
r
1 j
mr
Gecr ( j ) , (12.4.15)
1 j r
Nichols Chart
20
1 dB -1 dB
15
3 dB
10
-3 dB
6 dB
5
Open-Loop Gain (dB)
0 -6 dB
-5
-12 dB
-10
-15
-20 dB
-20
-180 -170 -160 -150 -140 -130 -120 -110 -100 -90 -80 -70 -60 -50 -40 -30 -20 -10 0.0
Open-Loop Phase (deg)
5
Fig.12.4.7 Diagramma di Nichols della funzione .
s( s 1)( s 5)
sono riportati nella Fig. 12.4.8. L’esame della Fig. 12.4.8 mostra che l’elemento di correzione
Gecr ( j ) fornisce attenuazione al modulo a partire dal punto di rottura relativo al polo; la
massima attenuazione è pari a 20 log mr . Inoltre, l’elemento in questione fornisce un ritardo
di fase indesiderato, da una decade prima del punto di rottura relativo al polo a una decade
dopo il punto di rottura relativo allo zero.
11
Diagramma di Bode
40
20
Modulo M [db]
-20
-40
-60
-1 0 1 2 3
10 10 10 10 10
90
Fase [gradi]
45
-45
-90
-1 0 1 2 3
10 10 10 10 10
Pulsazione [rad/s]
Reti elettrica e meccanica caratterizzate da una f.d.t. del tipo Gecr ( s ) , sono illustrate nella Fig.
12.4.9 e 12.4.10. Il massimo valore di mr è pari a 16.
Il controllore Gc (s) KcGecr (s) , e il guadagno è dato da K c .
1
s
Ta
Geca ( s ) . (12.4.16)
ma
s
Ta
R1
R2
U (s) Y ( s)
C2
12
R1 R2
Fig. 12.4.9 Rete elettrica descritta da una f.d.t. (12.4.14) con mr , r mr R2C2 .
R2
U (s)
K1
Y ( s)
B2
K2
K1 K2 B2
Fig. 12.4.10 Rete meccanica descritta da una f.d.t. (12.4.14) con mr , r mr .
K2 K2
1 1 1 j Ta
Geca ( j ) Geca ( j ) , (12.4.17)
ma ma 1 j Ta
ma
sono riportati nella Fig. 12.4.11. L’esame della Fig. 12.4.11 mostra che l’elemento di
correzione Gecr ( j ) fornisce un anticipo di fase, da una decade prima del punto di rottura
relativo allo zero a una decade dopo il punto di rottura relativo al polo. Inoltre, l’elemento in
questione fornisce una attenuazione al modulo, pari a 20log ma , da 0 al punto di rottura
relativo allo zero, che può essere utilizzato per migliorare il comportamento a regime del
sistema .
Reti elettrica e meccanica caratterizzate da una f.d.t. del tipo Geca ( s ) , sono illustrate nella
Fig. 12.4.12 e 12.4.13. Il massimo valore di ma è pari a 16.
13
Diagramma di Bode
60
40
Modulo M [db]
20
-20
-40
-1 0 1 2 3
10 10 10 10 10
90
Fase [gradi]
45
-45
-90
-1 0 1 2 3
10 10 10 10 10
Pulsazione [rad/s]
C1
R1
U (s) R2 Y (s)
R1 R2
Fig. 12.4.12 Rete elettrica descritta da una f.d.t. (12.4.16) con ma , a R1C1 .
R2
U (s)
B1 K1
Y ( s)
K2
K1 K2 B1
Fig. 12.4.13 Rete meccanica descritta da una f.d.t. (12.4.16) con ma , a .
K1 K1
14
m 1
s s
r Ta
Gecra ( s) . (12.4.18)
1 m
s s
r Ta
1 m 1 m
con . I diagrammi di Bode della funzione:
r r Ta Ta
r
1 j
Gecra ( j ) m 1 j Ta , (12.4.19)
1 j r 1 j Ta
m
Diagramma di Bode
50
Modulo M [db]
-50
-1 0 1 2 3 4
10 10 10 10 10 10
90
Fase [gradi]
45
-45
-90
-1 0 1 2 3 4
10 10 10 10 10 10
Pulsazione [rad/s]
L’esame della Fig. 12.4.11 mostra che l’elemento di correzione ad azione combinata è in
grado di introdurre sia un anticipo di fase sia un’attenuazione nel modulo della F ( j ) ,
sebbene in due intervalli diversi di valori di .
Reti elettrica e meccanica caratterizzate da una f.d.t. del tipo Gecra ( s) , sono illustrate nella
Fig. 12.4.15 e 12.4.16. Il massimo valore di ma è pari a 16.
C1
R1
R2
U(s) Y(s)
C2
Fig. 12.4.15 Rete elettrica descritta da una f.d.t. (12.4.19) con r R1C1 , Ta R2C2 , T12 R1C2 ,
r Ta T12 ( r Ta T12 )2 4 r Ta
m .
2 r
U(s)
B1 K1
B2 Y(s)
K2
Fig. 12.4.16 Rete meccanica descritta da una f.d.t. (12.4.19) con , r B1 K1 , Ta B2 K2 , T12 B2 K1 ,
2
r Ta T12 ( r Ta T12 ) 4 r Ta
m .
2 r
Diagrammi universali
Per agevolare il procedimento di sintesi, sono stati costruiti i diagrammi del modulo e della
fase della funzione:
1 j
Gun ( j ) , (12.4.20)
j
1
m
in funzione di log( ) per diversi valori di m. I diagrammi in questione sono riportati nelle
Figg. 12.4.17 e 12.4.18.
16
17
18
Con riferimento allo schema illustrato nella Fig. 12.4.19, la scelta della struttura e il
calcolo dei parametri del dispositivo di correzione vengono effettuati in modo tale da
soddisfare le specifiche sulla f.d.t. a catena aperta F ( j ) . Le specifiche in questione sono
assegnate come segue:
m m , (12.4.21)
t t, (12.4.22)
K gF K gF , (12.4.23)
sistema di tipo “ ” (12.4.24)
Si desidera, inoltre, un margine di guadagno almeno pari a 6 dB e che tali specifiche siano
soddisfatte quanto più possibile prossime al segno di uguaglianza.
Nelle ipotesi fatte, e cioè che la f.d.t. del sistema controllato non abbia poli a parte reale
positiva, e che siano soddisfatte le ipotesi previste nel criterio di Bode, i segni positivi dei
margini di fase e di guadagno sono condizioni necessarie e sufficiente di stabilità, e il margine
di fase caratterizza la precisione dinamica. Inoltre, la pulsazione di attraversamento
caratterizza la prontezza di risposta, il tipo di sistema definisce i segnali canonici che il
sistema a catena chiusa è in grado di inseguire con errore finale nullo o finito e diverso da
zero, e il guadagno della f.d.t. a catena aperta caratterizza il valore massimo dell’errore finale
stesso.
Ciò premesso, la scelta della struttura del dispositivo di correzione può essere effettuata in
accordo alla seguente procedura per passi.
1
1. Si definisce una funzione G p ( s) G p (s) , dove il numero di poli che occorre
s
aggiungere alla funzione G p ( s ) per soddisfare la specifica (12.4.24) sul tipo di sistema.
2. Si scelgono i valori della pulsazione di attraversamento e del guadagno, ˆt e ˆ gF , nei
rispettivi intervalli (12.4.22) e (12.4.23) previsti dalle specifiche di progetto.
3. Si tracciano i diagrammi di Bode della funzione G p ( j ) e si impongono le condizioni su
tale funzione e sulla f.d.t del dispositivo di correzione a guadagno unitario Gˆ ( j ) , in c
modo da poter soddisfare le specifiche di progetto. Tali condizioni sono:
Gˆ c ( j ˆ t ) G p ( j ˆt ) ˆ
gF dB gp dB . (12.4.26)
dB dB
Con riferimento alla (12.4.25), occorre anzitutto precisare che il contributo alla fase fornito
dalla funzione Gˆ c ( j ) non è tale da alterare il segno della fase complessiva, rispetto a quello
della fase della funzione G ( j ) . Si ha cioè sgn Gˆ ( j ˆ )G ( j ˆ ) sgn G ( j ˆ ) Le
p c t p t p t
19
Dispositivo di
correzione
U Y
Gc (s) Gp (s)
+ _
r
1 j
mr
Gc ( j ) KcGecr ( j ) K gc . (12.4.27)
1 j r
20
Tale dispositivo introduce un’attenuazione nel modulo della f.d.t. a catena aperta e, nel
contempo, un ritardo di fase. Ovviamente, il dimensionamento del dispositivo è giustificato
dal fatto che la procedura descritta in precedenza per la scelta del tipo di azione correttrice ha
dato come risultato Gˆ c ( j ˆ t ) 0 e Gˆ c ( j ˆt ) 0 , entrambi ottenuti dalle (12.4.26) e
dB
(12.4.25), rispettivamente.
Nel caso in questione, si ha Gˆ c ( j ) Gecr ( j ) . Il dimensionamento del dispositivo di
correzione ad azione attenuatrice verrà effettuato in due passi; nel primo verrà dimensionato
l’elemento di correzione a guadagno unitario Gecr ( j ) , mentre nel secondo passo verrà
determinato il guadagno K gc . Il procedimento suggerito è il seguente.
Gecr ( j ˆt ) dB G p ( j ˆt ) Kˆ gF K gp . (12.4.28)
dB db db
ˆt r r. (12.4.29)
K gF = Kt* + K gp ³ Kˆ gF - K gp + K gp = Kˆ gF
dB dB dB dB dB dB dB
U Y
Kt*Gecr ( j ) Gp ( j )
+ _
1 1 j a "
Gc ( j ) K cGeca ( j ) Kc K gcGeca ( j ), (12.4.30)
ma 1 j a
ma
dove K gc K c ma è il guadagno del dispositivo di correzione. Tale dispositivo introduce un
anticipo di fase e un’attenuazione nel modulo della f.d.t. a catena aperta. Ovviamente, il
dimensionamento del dispositivo è giustificato dal fatto che la procedura descritta in
precedenza per la scelta del tipo di azione correttrice ha dato come risultato Gˆ c ( j ˆt ) 0 e
Gˆ ( j ˆ )
c t 0 , entrambi ottenuti dalle (12.4.25) e (12.4.26).
dB
Nel caso in questione, si ha Gˆ c ( j ) G ''eca ( j ) , mentre il guadagno del dispositivo di
correzione è K gc . Il dimensionamento del dispositivo di correzione ad azione anticipatrice
verrà effettuato in due passi; nel primo verrà dimensionato l’elemento di correzione Gˆ ( j ) , c
mentre nel secondo passo verrà determinato il guadagno K gc . Il procedimento suggerito è
quello che segue.
Gˆ c ( j ˆ t ) G p ( j ˆt ) Kˆ gF K gp . (12.4.31)
dB dB dB dB
U Y
Kt*Gˆ c ( j ) Gp ( j )
+ _
r
1 j
Gcra ( j ) K cGecra ( j ) K gcGecr ( j )Geca ( j ) m 1 j Ta ,
K gc
1 j r 1 j Ta
m
(12.4.33)
dove K gc K c . Ovviamente, il dimensionamento del dispositivo è giustificato dal fatto che la
procedura descritta in precedenza per la scelta del tipo di azione correttrice ha dato come
risultato Gˆ c ( j ˆt ) 0 e Gˆ c ( j ˆ t ) 0 , entrambi ottenuti dalle (12.4.25) e (12.4.26). Nel
dB
2. Si sceglie un valore di m in modo tale che la sezione anticipatrice Geca ( j ) sia in grado di
fornire l’anticipo richiesto, e che la sezione attenuatrice Gecr ( j ) sia in grado di fornire
l’attenuazione richiesta, calcolata mediante la (12.4.26), compensando il contributo
positivo al modulo fornito dalla sezione anticipatrice.
23
12.4.2.5 Sintesi per tentativi per sistemi con poli a parte reale positiva ( P 0 )
Come già detto, se il sistema controllato è instabile per la presenza di poli a parte reale
positiva, il margine di fase non è più indicativo della stabilità del sistema e, pertanto, non è
possibile progettare direttamente il controllore nel dominio di , poiché il segno del margine
di fase non è più indicativo della stabilità e, quindi, il valore del margine di fase non è
indicativo della robustezza della proprietà di stabilità stessa.
In tale situazione, è possibile costruire un sistema di controllo, come quello illustrato nella
Fig. 12.4.23, costituito da un anello di controllo interno che ha lo scopo di stabilizzare il
sistema, e da un anello esterno che ha lo scopo di ottenere prestazioni statiche e dinamiche
desiderate. L’anello interno può essere progettato mediante il luogo delle radici, mentre
l’anello esterno può ancora essere progettato mediante le tecniche nel dominio della frequenza
precedentemente illustrate. Più precisamente, la f.d.t. Gc1 ( s) verrà progettata, mediante il
luogo delle radici, in modo da stabilizzare l’anello interno, mentre la f.d.t. Gc 2 ( s ) verrà
progettata in modo da soddisfare specifiche di progetto espresse nel dominio della frequenza
utilizzando i diagrammi di Bode.
U1
U Y
+
Gc2 (s) Gc1 (s) Gp (s)
+ _ _
100 10
G p ( s) ,
( s 1)( s 10) (1 0.1s)(1 s)
Sintesi Il diagramma polare della f.d.t. G p ( j ) è illustrato nella Fig. 12.4.24. L’esame di tale
figura mostra che non esistono valori di guadagno da associare alla G p ( j ) in modo da
stabilizzare il sistema a catena chiusa costruito attorno alla f.d.t. stessa. Poiché P 1 , occorre
progettare un dispositivo di correzione tale che il numero di giri della funzione
D( j ) 1 F ( j ) 1 Gc1 ( j )G p ( j ) attorno al punto critico del piano di Nyquist della
F ( j ) sia pari a +1. Uno di tali dispositivi è costituito da Gc1 ( j ) Kc1 1 illustrato nella
Fig. 12.4.25.
Infatti, il diagramma polare della f.d.t. a catena aperta del sistema di Fig. 12.4.44 diviene
quello di Fig. 12.4.26. L’esame di tale figura mostra che risulta T 1 e, quindi, che il
sistema a catena chiusa risulta stabile.
U1 Kc1G p ( j ) Y
+ _
Ai fini della sintesi del sistema di controllo conviene, allora, aggiungere un guadagno tale
da rendere stabile l’anello di controllo interno e, nel contempo, che i poli della f.d.t. di tale
anello siano in posizione opportuna per conseguire le specifiche di progetto dell’intero
sistema stesso
.
25
100
1 Gc1 ( s)G p ( s) 1 K .
( s 1)( s 10)
Il luogo in questione è riportato nella Fig. 12.4.27. L’esame di tale figura mostra che per
K 0.506 i poli a catena chiusa sono complessi e coniugati con 0.708 e n 6.36 .
Conviene allora scegliere Kˆ p 0.506 . Il corrispondente diagramma polare della funzione
Kˆ pG p ( j ) è riportato nella Fig. 12.4.28. L’esame di tale figura mostra che l’anello interno è
stabile ( T 1 ).
100
Fig.12.4.27 Luogo positivo delle radici della funzione 1 K
( s 1)( s 10)
26
Nyquist Diagram
2.5
1.5
0.5
Imaginary Axis
0
-0.5
System: Gp
Real: -0.907
-1 Imag: -1.29
Frequency (rad/sec): 2.91
-1.5
-2
-2.5
-6 -5 -4 -3 -2 -1 0
Real Axis
50.6 50.6
G p1 ( s) .
( s 4.5 j 4.5)( s 4.5 j 4.5) s2 9s 40.5
G p1 ( j ) K gp1
G p1 ( j ) ,
s s2
s (1 2 ns 2
)
n
dove 0.706 , n 6.37 e K gp1 50.6 / 40.5 1.25 , e il polo nell’origine è stato aggiunto
alla G p1 ( s ) al fine di ottenere un sistema di tipo1. I diagrammi di Bode della G p1 ( j ) sono
illustrati nella Fig. 12.4.29. Le specifiche di progetto sono:
m m 45 , t t 6 , K gF K gF 14 dB .
dB dB
Gˆ c ( j ˆt ) G p ( j ˆt ) 180 m , (12.4.25)
Gˆ c ( j ˆ t ) G p ( j ˆt ) ˆ
gF dB gp1 dB . (12.4.26)
dB dB
Le specifiche sul controllore mostrano che le specifiche potrebbero essere soddisfatte con
la sola azione anticipatrice. Per verificare se ciò è possibile, dai diagrammi universali si
ottiene che le specifiche sul controllore (12.4.41) e (12.4.42) possono essere quasi soddisfatte
per ma 6 e a 1.4 . Infatti, per tale valore di a si ha Gˆ c ( j a ) 4.5 dB , leggermente
dB
maggiore di quello richiesto. Supponendo accettabile il conseguente peggioramento delle
prestazioni ottenute, rispetto a quelle richieste, il controllore Gˆ c ( j ) risulta:
1 j Ta
Gˆ c ( j ) , ma 6, Ta 0.234 s ,
Ta
1 j
ma
Le risposte al gradino e alla rampa lineare del sistema a catena chiusa sono illustrate nelle
Figg. 12.4.31 e 12.4.32. L’andamento delle risposte mostra che le specifiche a regime sono
soddisfatte.
1.4
ingresso
1.2 risposta
1
rispost indiciale
0.8
0.6
0.4
0.2
0
0 1 2 3 4 5 6 7 8 9 10
t [s]
1.8
ingresso
1.6 risposta
1.4
risposta alla rampa
1.2
0.8
0.6
0.4
0.2
0
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
t [s]
Il metodo di sintesi per tentativi nel dominio di s presenta difficoltà rispetto a quella nel
dominio di , per i seguenti motivi:
a) non esistono, in generale, legami globali fra grandezze della risposta indiciale e grandezze
della f.d.t. a catena chiusa W ( s) ;
b) non esistono, legami o relazioni empiriche che permettono di tradurre le specifiche sulla
f.d.t. a catena chiusa W ( s) in specifiche sulla f.d.t. a catena aperta F ( s ) .
Il problema di cui al punto a) viene risolto ammettendo che la W ( s) abbia una coppia di
poli complessi coniugati dominante p1,2 = j = −n jn 1 − 2 . Tali poli vengono
scelti all’interno di un settore che viene determinato a partire dalle specifiche di progetto che
vengono assegnate come segue:
SS , (12.5.1)
tr tr , (12.5.2)
ta , ta , (12.5.3)
tipo , (12.5.4)
F F . (12.5.5)
La procedura per la determinazione del succitato settore è costituita dai seguenti passi.
j
β
2) A partire dalla specifica sul tempo di assestamento (12.5.3), osservando che per sistemi
con poli dominanti a catena chiusa si ha:
ln(1 )
ta, , (12.5.6)
2
dove assume, usualmente, valori pari a 0.02 o 0.05, si determina la retta parallela
all’asse immaginario che delimita la regione ammissibile, data da:
ln(1 )
= . (12.5.7)
ta
j
j
n
1 s−z 1 m 1
Gecr ( s ) = = Gecr ( s ), z = − r , p = − , (12.5.8)
mr s − p mr r r
3
s−z 1 m
Geca ( s ) = , z=− , p=− a . (12.5.9)
s− p Ta Ta
s − zr s − za m 1 1 m
Gecra ( s ) = , z r = − , pr = − , za = − , pa = − . (12.5.10)
s − pr s − pa r r Ta Ta
L’azione combinata viene impiegata per migliorare il comportamento sia a regime che
transitorio del sistema.
m
(s − z pi )
i =1
G p ( s) = K p n
,
(s − p pi )
i =1
G p (s)
Ponendo G p ( s ) = , dove è il numero di poli nell’origine che occorre aggiungere
s K p
alla f.d.t. a catena aperta per soddisfare la condizione sul tipo, si traccia il luogo delle radici
della equazione:
m
(s − z pi )
1 + Kˆ p G p ( s) = 1 + Kˆ p i =1
n
= 0, (12.5.11)
s
(s − p pi )
i =1
4
b) A partire della specifiche di progetto, si determina il settore all’interno del quale debbono
giacere i poli della f.d.t a catena chiusa.
c) Se il luogo originario delle radici giace alla destra del settore desiderato, corrispondente
alle specifiche di progetto assegnate, occorre impiegare un’azione anticipatrice che attrae i
rami del luogo verso sinistra, grazie alla presenza dello zero.
c.1) Se è possibile posizionare i poli dominanti sul nuovo luogo delle radici, e il guadagno
a catena aperta necessario per ottenere tali poli soddisfa le specifiche, l’azione
anticipatrice può risultare sufficiente.
c.2) Se è possibile posizionare i poli dominanti sul nuovo luogo delle radici, ma il
guadagno a catena aperta necessario per ottenere tali poli non soddisfa le specifiche,
occorre impiegare anche un’azione attenuatrice.
d) Se è possibile posizionare i poli dominanti su due dei rami del luogo originario e tutti i
rimanenti rami giacciono, almeno in parte, nel semipiano sinistro, il che implica che è
possibile fare in modo che i poli della f.d.t. a catena chiusa posizionati su tali rami abbiano
parte reale negativa, ma il guadagno relativo ai poli dominanti è inferiore a quello previsto
dalle specifiche di progetto, si impiega un’azione attenuatrice.
( s1 − z ) − ( s1 − p) −5 . (12.5.12)
5
Tal condizione implica, come detto, che il polo e lo zero debbono essere posizionati molto
vicini fra loro. In tali condizioni, indicando con Kˆ p1 il fattore di trasferimento valutato sul
luogo originario per s = s1 , dato da:
n
s1 ( s1 − p pi )
Kˆ p1 = m
i =1
, (12.5.13)
( s1 − z pi )
i =1
m
(− z pi )
Kˆ gp1 = Kˆ p1 i =1
n
. (12.5.14)
(− p pi )
i =1
dove la produttoria al denominatore va estesa ai poli diversi da zero. Il valore del fattore di
trasferimento con il correttore inserito, valutato per s = sn1 , essendo sn1 il nuovo polo
dominante a catena chiusa prossimo come detto a s1 (cfr. Fig. 12.5.4), risulta:
n
( sn1 − p) sn1
(sn1 − p pi )
Kˆ nF 1 = m
i =1
. (12.5.15)
( sn1 − z ) ( sn1 − z pi )
i =1
sn1
x s j
x1
sin −1 ( )
p z
Poiché p e z sono vicini fra loro, si ha (sn1 − p) (sn1 − z) (cf. Fig. 12.5.4). Inoltre, poiché
anche s1 e sn1 sono vicini fra loro, si ha:
6
n
s1 (s1 − p pi )
Kˆ nF 1 m
i =1
= Kˆ p1 . (12.5.16)
(s1 − z pi )
i =1
m m
z
(− z pi ) z
(− z pi ) z
Kˆ gnF 1 = Kˆ nF 1 i =1
n
Kˆ p1 i =1
n
= Kˆ gp1 . (12.5.17)
p p p
(− p pi ) (− p pi )
i =1 i =1
La (12.5.17) mostra che, a parità di fattore di trasferimento, il guadagno della f.d.t. a catena
aperta con il dispositivo di correzione inserito aumenta del rapporto z p = mr . Ne consegue
che, dovendo risultare z e p molto vicini fra loro, se si desidera ottenere valori di mr elevati, è
necessario posizionare z e p sufficientemente vicini all’origine.
Si osservi, adesso, che la coppia polo-zero può essere dimensionata in modo sistematico.
Infatti, ponendo s1 = 1 + j1 , si ha:
1 1
−
−1 1 −1 1 −1 1 − z 1 − p
( s1 − z ) − ( s1 − p ) = tg − tg = tg ,
1 − z 1 − p 1+
1 1
1 − z 1 − p
(12.5.18)
valida per:
1
− 1 1. (12.5.19)
1 − z 1 − p
1 1
−
1 − z 1 − p = tg (− 5 ) ,
1 180
1 + 1
1 − z 1 − p
5
dalla quale, ponendo k = tg (− ) e z = mr p , si ottiene:
180
kmr p2 − (mr + 1)k1 + 1 (mr -1) p + k s1 = 0 .
2
(12.5.20)
Può essere facilmente verificato che la (12.5.20) ammette due radici negative per mr 1.19 .
7
j
P
2
1
x o
2
Fig.12.5.5 Determinazione della coppia zero-polo che fornisce l’anticipo di fase nel punto P
massimizzando il guadagno a catena aperta.
1
1. = (1 − ) ,
2
8
1
2. = 1 − = (1 + ) ,
2
3. − P = tg ( ) ( − P ) ,
4. − P = tg ( ) ( − P ) .
Dalle 3. e 4. si ottiene:
P
za = P − , pa = P − P .
tg ( ) tg ( )
Kp
G p ( s) = , K p = 11.84
s(s + 16.3)( s + 7.2)
Il settore all’interno del quale debbono giacere i poli dominanti viene ottenuto osservando
che:
S S = 25% = 0.4 .
9
0.9
0.8
0.7
0.6
0.5
S
0.4
0.3
0.2
0.1
0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
zita
Dall’andamento del luogo originario delle radici, illustrato nella Fig. 12.5.7, emerge che il
luogo giace parzialmente all’interno del settore considerato. In particolare, scegliendo i poli
dominanti s1,2 = −n n 1 − 2 all’interno del settore desiderato, i cui parametri sono
= 0.5 e n = 4.57 , riportati nella Fig. 12.5.7, sul terzo ramo del luogo si ottiene il terzo
polo s3 = −18.4 . Poiché s3 n = 8.035 , i poli complessi e coniugati sono effettivamente
dominanti. La verifica delle prestazioni ottenute può essere effettuata mediante simulazione. Il
fattore di trasferimento è pari a K F = 438 . Mediante simulazione si ottiene la risposta
indiciale riportata in Fig. 12.5.8. Il guadagno a catena aperta corrispondente al succitato
valore di K F risulta:
1
K gF = K F = 3.73 K F .
7.2 16.3
10
Root Locus
20
0.76 0.64 0.5 0.34 0.16
0.86
15
10 0.94
System: Fcap
Gain: 438
Pole: -2.29 + 3.96i
Imaginary Axis (seconds -1)
Damping: 0.5
System: Fcap Overshoot (%): 16.3
Gain: 439
5 0.985 Pole: -18.4
Frequency (rad/s): 4.57
Damping: 1
Overshoot (%): 0
Frequency (rad/s): 18.4
30 25 20 15 10 5
0
-5 0.985
-10 0.94
-15
0.86
0.76 0.64 0.5 0.34 0.16
-20
-30 -25 -20 -15 -10 -5 0 5 10
Real Axis (seconds -1)
1.4
1.2
0.8
w-1
0.6
0.4
0.2
0
0 1 2 3 4 5
t [s]
Fig.12.5.8 Risposta indiciale del sistema a catena chiusa originario, per K F = 438 .
La risposta alla rampa lineare è mostrata in Fig. 12.5.9. La linea tracciata per y = 7.95 mostra
che l’errore finale è 0.05 .
11
10
6
delta-2, w-2
5
0
0 2 4 6 8 10
t [s]
s + 0.5298
F ( s) = 434 .
s( s + 7.2)( s + 16.3)( s + 0.0988)
Root Locus
20
0.76 0.64 0.5 0.34 0.16
0.86
15
10 0.94
System: Fcap
Gain: 434
Imaginary Axis (seconds -1) Pole: -2.29 + 3.92i
Damping: 0.504
System: Fcap Overshoot (%): 16
Gain: 432
5 0.985 Pole: -18.4
Frequency (rad/s): 4.54
Damping: 1
Overshoot (%): 0
Frequency (rad/s): 18.4
30 25 20 15 10 5
0
-5 0.985
-10 0.94
-15
0.86
0.76 0.64 0.5 0.34 0.16
-20
-30 -25 -20 -15 -10 -5 0 5 10
Real Axis (seconds -1)
Root Locus 20
20
0.21 0.15 0.105 0.07 0.044 0.02
17.5
15
15 0.32
12.5
System: Fcap 10
10 Gain: 434
Pole: -2.29 + 3.92i 7.5
0.55
Imaginary Axis (seconds -1)
Damping: 0.504
Overshoot (%): 16
Frequency (rad/s): 4.54 5
5
2.5
0
System: Fcap
Gain: 438
Pole: -0.601 2.5
-5 Damping: 1
Overshoot (%): 0 5
Frequency (rad/s): 0.601
0.55
7.5
-10
10
12.5
-15 0.32
15
Fig. 12.5.11 Particolare del luogo delle radici del sistema corretto
La risposta alla rampa lineare è mostrata in Fig. 12.5.13. Si è rilevato che l’errore finale per
ingresso a rampa lineare è pari a circa 0.052.
Al fine di soddisfare in pieno tutte le specifiche occorre impiegare l’azione combinata.
13
1.4
1.2
0.8
w-1
0.6
0.4
0.2
0
0 1 2 3 4 5
t [s]
10
6
delta-2,w-2
0
0 2 4 6 8 10
t [s]
− za
Kˆ gF = Kˆ F ,
( − pa )(7.2)(16.3)
Root Locus
10
0.93 0.87 0.78 0.64 0.46 0.24
8
0.97
System: F_cap1
6 Gain: 1.38e+003
Pole: -4.25 + 7.35i
Damping: 0.501
Overshoot (%): 16.3
Imaginary Axis (seconds -1) 4 0.992 Frequency (rad/s): 8.49
30 25 20 15 10 5
0
-2
-4 0.992
-6
0.97
-8
0.93 0.87 0.78 0.64 0.46 0.24
-10
-30 -25 -20 -15 -10 -5 0
Real Axis (seconds -1)
Fig. 12.5.14 Luogo delle radici con il dispositivo di correzione ad azione anticipatrice.
s − za s − z r
Gc ,eq ( s ) = K F ,
s − pa s − pr
con K F = 1380 , ottenuto assumendo il fattore di trasferimento del processo unitario e, quindi,
assumendo che la f.d.t. del processo sia Gˆ ( s ) . Tenendo presente che il processo ha fattore di
p
trasferimento K P = 11.84 e che le azioni attenuatrice e anticipatrice standard sono date da:
1 s − zr s − za
Gecr = , Geca = ,
mr s − p r s − pa
Root Locus
10
0.93 0.87 0.78 0.64 0.46 0.24
8
0.97
System: Fcap
6 Gain: 1.38e+003
Pole: -4.06 + 7.05i
Damping: 0.5
Imaginary Axis (seconds -1) 4 0.992 Overshoot (%): 16.3
System: Fcap System: Fcap Frequency (rad/s): 8.13
Gain: 1.38e+003 Gain: 1.38e+003
Pole: -22.7 Pole: -4.22
2 Damping: 1 Damping: 1
Overshoot (%): 0 Overshoot (%): 0
Frequency (rad/s): 22.7 Frequency (rad/s): 4.22
30 25 20 15 10 5
0
System: Fcap
Gain: 1.27e+003
Pole: -0.904
-2 Damping: 1
Overshoot (%): 0
Frequency (rad/s): 0.904
-4 0.992
-6
0.97
-8
0.93 0.87 0.78 0.64 0.46 0.24
-10
-30 -25 -20 -15 -10 -5 0
Real Axis (seconds -1)
1
Kc K p = KF ,
mr
dalla quale si ottiene:
1
K c = K F mr .
Kp
s − za s − z r
Gc ,eq ( s ) = K F ,
s − pa s − pr
con K F = 1380 , ottenuto assumendo il fattore di trasferimento del processo unitario e, quindi,
assumendo che la f.d.t. del processo sia Gˆ ( s ) . Tenendo presente che il processo ha fattore di
p
trasferimento K P = 11.84 e che le azioni attenuatrice e anticipatrice standard sono date da:
1 s − zr s − za
Gecr = , Geca = ,
mr s − p r s − pa
1
Kc K p = KF ,
mr
16
( − za )( − zr ) 1
K gF = K F = 20 .
( − pa )( − pr ) (7.2)(16.3)
Nelle Figg. 2.5.16 – 2.5.18 sono illustrate le risposte al gradino, alla rampa lineare e l’errore
di inseguimento della rampa lineare.
1.4
1.2
0.8
w-1
0.6
0.4
0.2
0
0 1 2 3 4 5
t [s]
Fig. 2.5.16 Risposta indiciale del sistema a catena chiusa. Fascia per la valutazione del tempo di
assestamento e limite superiore della sovra elongazione desiderata.
10
0
0 2 4 6 8 10
t [s]
Fig. 2.5.17 Ingresso a rampa lineare e risposta del sistema a catena chiusa.
17
0.25
0.15
0.1
0.05
0
0 10 20 30 40 50
t [s]
L’esame delle Figg. 12.5.16 -12.5.18 mostra che le specifiche di progetto sono tutte
soddisfatte.
Si riporta di seguito il listato del file utilizzato per il progetto del controllore. Il file va
usato in maniera interattiva.
s=tf('s');
zp=[];
pp=[0,-7.2,-16.3];
K_cap_p=1;
[np,dp]=zp2tf(zp,pp,K_cap_p);
Gcap_p=tf(np,dp);
%rlocus(Gcap_p)
%poli dominanti desiderati
om_n1=8;
zita1=0.5;
alfad=asind(zita1);
alfar=(pi/180)*alfad;
om1=om_n1*cos(alfar);
sigma1=-om_n1*sin(alfar);
p1=sigma1+j*om1;
%fine poli dominanti desiderati
%anticipo di fase: fase per ottnere i poli dominanti+ compensazione 5 gradi
Gcap_p_p1=1/((p1)*(p1-pp(2))*(p1-pp(3)));
phase_Gcap_p_p1=angle(Gcap_p_p1);
phi=pi-phase_Gcap_p_p1+5*(pi/180);
phi_d=phi*(180/pi);
gamma=0.5*(angle(p1)+phi);
coef_ang_gamma=tan(gamma);
18
zc=(coef_ang_gamma*sigma1-om1)/coef_ang_gamma;
ro=0.5*(angle(p1)-phi);
coef_ang_ro=tan(ro);
pc=(coef_ang_ro*sigma1-om1)/coef_ang_ro;
G_eca=tf([1,-zc],[1,-pc]);
F_cap1=G_eca*Gcap_p;
%rlocus(F_cap1)
%azione attenuatrice
sigma_eca=-4.25;
om_eca=7.35;
zita_eca=0.5;
K_eca=1380;
K_g_eca=K_eca*(-zc)/((-pp(2))*(-pp(3))*(-pc));
mr=1.0*20/K_g_eca;
k=tan(-5*pi/180);
a=k*mr;
b=(mr+1)*k*sigma_eca+om_eca*(mr-1);
c=k*(sigma_eca^2+om_eca^2);
roots([a,-b,c])
%%
pr=-0.196648210942599;
zr=mr*pr;
Gcap_ecr=tf([1,-zr],[1,-pr]);
Fcap=Gcap_ecr*F_cap1;
rlocus(Fcap)
%%
Kcap_F=1380;
Kcap_g_F=Kcap_F*((-zc)*(-zr))/((-pc)*(-pr)*(-pp(2))*(-pp(3)));
%%
Kp=11.84;
Kc=Kcap_F*mr/Kp
% F1=Kc/m*Fcap
1
I. I NTRODUCTION
This handout deals with the use of the Linear Matrix Inequalities (LMIs) applied to the linear system expressed
in the state-space form
ẋ = Ax + Ew
(1)
z = Cx + F w .
In particular this handout starts by developing tools for verifying internal stability and quantifying L2 external
stability for system (1). Then the design of a state-feedback control action will be shown, by treating also the
case of the optimal Linear Quadratic Regulator (LQR) design by means of LMIs. Finally also the observer design
problem will be addressed, adapting the LMI presented for the stability analysis in the case of an asymptotic state
observer, and deriving sufficient conditions for the stability of the estimation error dynamics.
derivative can be obtained by computing the directional derivative of the function in the direction Ax and then
evaluating this function along a solution x(t). This corresponds to the mathematical equation
·
z }| { ∂V (x(t))
V (x(t)) = Ax(t) = h∇V (x(t)), Ax(t)i,
∂x
·
z }| {
where V represents the function, V (x(t)) represents its time derivative along solutions at time t, ∇V (x) ∈ Rn is the
gradient of the function at x and h∇V (x), Axi is the directional derivative of the function at x in the direction Ax.
For a quadratic function V (x) = xT P x, where P is a symmetric matrix, it is easy to prove ∇V (x) = (P +P T )x =
2P x and then the classical chain rule gives that this directional derivative corresponds to
h∇V (x), Axi = xT (P A + AT P )x.
Thus, in order for the time derivative to be negative along solutions, except at the origin, it should be the case that
the directional derivative satisfies
xT (AT P + P A)x < 0, ∀x 6= 0 ,
in other words, AT P + P A < 0. In summary, to certify internal stability for system (1) with a given matrix A,
one looks for a symmetric matrix P satisfying
P ≥ 0
(2)
AT P + P A < 0 .
This is a particular example of a set of linear matrix inequalities (LMIs), which will be discussed in more detail
in Section III. Software for checking the feasibility of LMIs is widely available. It turns out that the LMIs in (2)
are feasible if and only if the system (1) is internally stable, or equivalently A is Hurwitz [4, Theorem 8.3].
C. External stability
Now the external disturbance w is no longer set to zero. Thus, the relevant equation is (1). The goal is to
determine an upper bound γ > 0 of the L2 gain from the disturbance input w to the performance output z , and
simultaneously establish internal stability. More specifically, we search for γ > 0 such that for all w satisfying
Z T 21
T
||w||2 := lim w (t)w(t)dt <∞
T →∞ 0
also satisfies the LMI (12). The convexity property arises from the fact that (12) is affine in the free variable Z .
Now consider the case where Q is taken to be zero and the free variable Z is required to be symmetric and positive
definite. The variable Z will be replaced by the variable P for this case. With the free variable being symmetric,
the parameter A is now required to be a square matrix. Now, recall that the matrix condition AT P + P A < 0 is
equivalent to the existence of ε > 0 such that AT P + P A + εI ≤ 0. Therefore, an extra free variable ε can be
introduced to write the overall conditions as the single LMI
P 0
≥0. (13)
0 −(AT P + P A + εI)
The implicit constraint that P is symmetric reduces the number of free variables in the matrix P to the quantity
n(n + 1)/2 where n is the size of the square matrix P . The feasibility of the LMI (13) is equivalent to the
simultaneous feasibility of the two LMIs
P ≥ 0
(14)
0 > AT P + P A
which match the LMIs (2) that appeared in the analysis of internal stability for linear systems. It is worth noting
that most LMI solvers have difficulty with inequalities that are not strict. This is because sometimes, in this case,
the feasibility is not robust to small changes in the parameters of the LMI. For example, with the choice
0 1
A=
−1 0
the LMIs P > 0 and 0 ≥ AT P + P A are feasible (note that the strictly inequality and the nonstrict inequality
have been exchanged relative to (14)) as can be seen by taking P = I . However, the LMIs are not feasible if one
5
adds to A the matrix εI for any ε > 0. On the other hand, strict LMIs, if feasible, are always robustly feasible.
Fortunately, the feasibility of the LMIs (14) is equivalent to the feasibility of the LMIs
P > 0
(15)
0 > AT P + P A .
This can be verified by letting Pb denote a feasible solution to (14) and observing that Pb + εI must be a feasible
solution to (15) for ε > 0 sufficiently small. From the discussion in Section II-A, it follows that the LMIs (15) are
feasible if and only if the system ẋ = Ax is internally stable.
Next consider the matrix conditions that appeared in Section II-C, the feasibility of which was equivalent to
having L2 external stability with gain less than γ > 0 and internal stability for (1). Using the same idea as above
to pass to a strict inequality for the matrix P , the feasibility of the matrix conditions in (10) is equivalent to the
feasibility of the matrix conditions
P > 0
T
1 CT
A P + PA PE (16)
0 > T + T C F .
E P −γI γ F
The matrices (A, E, C, F ) are parameters that define the problem. If the value γ is specified, then the feasibility of
the resulting LMIs in terms of the free variable P can be checked with an LMI solver. If the interest is in finding
values for γ > 0 to make the matrix conditions feasible, then γ can be taken to be a free variable. However, the
matrix conditions do not constitute LMIs because of the nonlinear dependence on the free parameter γ through the
factor 1/γ that appears. Fortunately, there is a way to convert the matrix conditions above into LMIs in the free
variables γ and P using the following fact:
(Schur complement) Let Q and R be symmetric matrices and let S have the same number of rows as Q
and the same number of columns as R. Then the matrix condition
Q S
>0
ST R
is equivalent to the matrix conditions
R > 0
Q − SR−1 S T > 0 .
This fact can be applied to the matrix conditions (16) to obtain the matrix conditions
γ > 0
P > 0
AT P + P A P E C T
(17)
0 > ET P −γI F T
C F −γI
which are LMIs in the free variables P and γ . If the system ẋ = Ax is internally stable then these LMIs will be
feasible. This follows from the fact that there will exist P > 0 satisfying AT P + P A < 0, which is the matrix that
appears in the upper left-hand corner of the large matrix in (17), and a consequence of Finsler’s Lemma, which is
the following:
(Finsler’s Lemma) Let Q be symmetric and let H have the same number of columns as Q. If ζ T Qζ < 0
for all ζ 6= 0 satisfying Hζ = 0 then, for all γ > 0 sufficiently large, Q − γH T H < 0.
If one applies this fact with the matrix
T
A P + P A P E CT
Q := ET P 0 FT
C F 0
and
0 0 0
H= 0 I 0
0 0 I
6
one sees that the LMIs in (17) will be feasible for an appropriate P matrix and large enough γ > 0.
To determine a tight upper bound on the L2 gain, one is interested in making γ as small as possible. The task of
minimizing γ subject to satisfying the LMIs (17) is an example of an LMI eigenvalue problem and can be written
as:
min γ, subject to
P,γ
P > 0, (18a)
AT P CT
+ PA PE
0> ET P −γI F T . (18b)
C F −γI
Since large block matrices that appear in LMIs must always be symmetric, the entries below the diagonal must
be equal to the transposes of the entries above the diagonal. For this reason, such matrices can be replaced by the
‘?’ symbol without any loss of information. For example, (18) can be written as
min γ, subject to
P,γ
P > 0, (19a)
AT P CT
+ PA PE
0> ? −γI F T . (19b)
? ? −γI
with no loss of information.
An alternative notation that may simplify (18) relies on the use of the function “He” which, given any square
matrix X is defined as HeX := X + X T , so that (18) can be written as
min γ, subject to
P,γ
P > 0, (20a)
PA PE 0
0 > He 0 −γI/2 0 . (20b)
C F −γI/2
The LMI feasibility and eigenvalue problems can be solved efficiently using modern numerical software packages.
As an example, the code needed in MATLAB’s LMI control toolbox to implement the search for the optimal solution
to (18) or, equivalently, of (19) and (20) is given next.
LMIs have played a foundational role in analysis and control of dynamical systems for several decades. A
comprehensive book on this topic is the classic [1], where an extensive list of references can be found. That book
also contains the facts quoted herein concerning Schur complements, Finsler Lemma, the S-procedure, and the
elimination lemma.
Example 1: Implementing LMIs using the MATLAB’s LMI control toolbox requires first defining the LMI
constraints structure and then running the solver on those constraints. The LMI constraints are specified by a start
line (setlmis([]);) and an end line (mylmisys=getlmis;) which also gives a name to the LMI constraints.
Then the LMI constraints consist of a first block where the LMI variables are listed and of a second block where
the LMI constraints are described in terms of those variables. The following code gives a rough idea of how this
should be implemented. Comments within the code provides indications of where the different blocks are located.
For more details, the reader should refer to the MATLAB’s LMI control toolbox user’s guide.
% Initialize the LMI system
setlmis([]);
% decision variables
P=sdpvar(n); % symmetric n-x-n
gamma=sdpvar(1); % scalar
% decision variables
variable P(n,n) symmetric;
variable gamma;
minimize gamma
subject to
gamma>0;
P>0;
M+M’<0;
9
cvx_end
•
There are a few points to make about the variability in solutions to LMI eigenvalue problems returned by using
different commercial solvers. First, notice that the LMI eigenvalue problem in (19) involves an optimization over
an open set of matrices. So, technically, it is not possible to achieve the minimum. It would be more appropriate
to say that the optimization problem is looking for the infimum. Indeed, if a minimum γ ∗ existed and satisfied
the LMIs then it would also be the case that γ − ε satisfied the LMIs for ε > 0 sufficiently small, contradicting
the fact that γ ∗ is a minimum. A consequence of this fact is that, since it is not possible to reach an infimum,
each solver will need to make its own decision about the path to take toward the infimum and at what point to
stop. Different paths to the infimum and different stopping conditions will cause different solvers to return different
solutions. Second, unless the optimization is strictly convex, the solution to the optimization problem may not be
unique. This fact may also contribute to variability in the solutions returned by different solvers. In each of these
cases, the different minima returned should be quite close to one another (because convexity ensures the existence
of a global optimum), whereas the matrices returned that satisfy the LMIs may be quite different.
Regarding the LMI solvers mentioned in Examples 1-3, the LMI control toolbox [2] of MATLAB can be purchased
together with MATLAB. YALMIP [5] is a modeling language for defining and solving advanced optimization
problems. CVX [3] is a package for specifying and solving convex programs. Both [5] and CVX [3] are extensions
of MATLAB which can be downloaded from the web for free and easily installed as toolboxes on a MATLAB
installation. Finally MOSEK [6] in a high performance software for large-scale LP, QP, SOCP, SDP and MIP
including interfaces to C, Java, MATLAB and Python.
This problem can be configured as a stabilization problem, because the system with K = 0 could be unstable,
so the LMIs in (2) are not feasible, but the feedback gain, K , can be designed by looking to the feasibility of
(24), which ensures the internal stability of the closed-loop system between plant (21) and the static state feedback
controller u = Kx.
R EFERENCES
[1] S. Boyd, L. El Ghaoui, E. Feron, and V. Balakrishnan. Linear Matrix Inequalities in System and Control Theory. Society for Industrial
an Applied Mathematics, 1994.
[2] P. Gahinet, A. Nemirovski, A.J. Laub, and M. Chilali. LMI Control Toolbox. The MathWorks Inc., 1995.
[3] M. Grant and S. Boyd. CVX: Matlab software for disciplined convex programming. (web page and software). http://stanford.
edu/ boyd/cvx.
[4] Joao P Hespanha. Linear systems theory. Princeton university press, 2009.
[5] J. Lofberg. YALMIP : A toolbox for modeling and optimization in MATLAB. In IEEE International Symposium on Computer Aided
Control Systems Design, pages 284 –289, Taipei, Taiwan, 2004.
[6] APS Mosek. The mosek optimization software. Online at http://www. mosek. com, 54:2–1, 2010.