Sei sulla pagina 1di 87

“BIGINO” DI DINAMICA E CONTROLLO

DELLE STRUTTURE
1 EQUAZIONI DI BILANCIO IN FORMA EULERIANA
E LAGRANGIANA
IMPORTANTE. Questo bigino fornisce una traccia di base per il corso che dovrebbe essere
complementata dai testi via via suggeriti nel bigino stesso e durante le lezioni.
Lo studente della laurea “magistrale” dovrebbe infatti abituarsi a rivedere e approfondire i vari
argomenti su diversi testi, traendo beneficio dai differenti modi di presentare lo stesso argomento
e maturando cosı́ una sicura conoscenza e un buon senso critico sulle poche cose qui illustrate.
Pertanto si ritiene: “assolutamente sconsigliabile adoperare questo bigino solo per riuscire a
superare l’esame con il minimo sforzo; in effetti questo potrebbe anche riuscire, ma significherebbe
solo impiegare le proprie energie intellettuali per imparare a dare risposte accettabili all’esame, pur
avendo capito il meno possibile, il che é ovviamente sconsigliabile sia dal punto di vista culturale
che da quello professionale” (da: V. Giavotto, Strutture Aeronautiche, Cittá Studi, con alcune
modifiche).
Nota bene. Vettori e tensori sono entità fisiche distinte dalle entità algebriche vettori e matrici.
Ciononostante, nel caso in cui si utilizzino sistemi di riferimento cartesiani ortogonali, gli enti
vettoriali e tensoriali e molte loro operazioni possono essere formalmente rappresentate attraverso
l’algebra delle matrici. In queste brevi note si farà uso di tali similarità con estrema libertà. Si noti
che per svolgere correttamente le operazioni algebriche per vettori e tensori in coordinate arbitrarie
(cartesiane oblique, polari, cilindriche, ecc.) è spesso necessario disporre di alcuni enti, metrica
e simboli di Christoffel, per la cui determinazione funzionale è necessario utilizzare un sistema di
coordinate di appoggio, di solito cartesiano ortogonale. È quindi comunque utile saper agilmente
operare con tensori e vettori in sistemi cartesiani ortogonali. Ciò detto si ricordi sempre che tensori
e vettori sono enti in generale ben diversi dalle matrici.

1.1 TRASFORMAZIONE DI COORDINATE


Definendo la trasformazione che porta dalle coordinate Lagrangiane X a quelle Euleriane x come

x = φ(X, t) (1.1) 01

si può asserire che tale funzione vettoriale è sempre invertibile, in quanto fisicamente deve valere la
condizione di impenetrabilità per cui non può esistere un istante t per cui in una certa posizione x
dello spazio si trovino due particelle diverse, corrispondenti cioé a due diverse posizioni X all’istante
iniziale. Esiste quindi sempre la funzione

X = φ−1 (x, t) (1.2) 02

ed è definita in modo univoco. Definendo la matrice Jacobiana della trasformazione come F ik = φi/k
da cui, con notazione sintetica, F = Grad (φ)1 , si può scrivere

dxi = φi/k dXk (1.3a) 1

o anche

dx = F dX e quindi dX = F −1 dx (1.3b) 3

Chiamando Jacobiano lo scalare J = det F > 0, si ottiene, con tecnica analoga a quella utilizzata
per il cambio di coordinate negli integrali multipli, che il volume elementare in coordinate Euleriane
è pari a dv = JdV . Il tensore F viene di solito denominato gradiente di deformazione.
1 Le notazioni div e grad saranno utilizzate per indicare i relativi operatori Euleriani, cioé con derivate rispetto

a x, mentre Div e Grad si riferiranno alla modalitá Lagrangiana, cioé con derivate rispetto a X.

1
1.2 FORMULA DI NANSON
La formula di Nanson permette di collegare l’area infinitesima vettoriale, cioè orientata secondo la
normale locale diretta verso l’esterno del dominio, espressa in termini Euleriani all’area infinitesima
espressa in termini Lagrangiani. Data un’area dotata di normale n e un vettore dx, il volume
infinitesimo si può scrivere come

dv = dx · nda = dxT nda. (1.4) 4

Identica relazione si può scrivere per le coordinate Lagrangiane per cui si ottiene che

dv = JdV = JdX T N dA. (1.5) 5

Inoltre dalla (1.3b) si ha dx = F dX e quindi dX T = dxT F −T . Sostituendo quest’ultima espressione


nella (1.5) si ottiene

dv = JdxT F −T N dA. (1.6) 6

Uguagliando la (1.4) e la (1.6), dovendo l’uguaglianza valere per qualunque dxT , si ottiene la
formula di Nanson

nda = JF −T N dA. (1.7) 7

Ricordando che una generica superficie sarà rappresentata in forma parametrica da S = X(ξ, η),
allora

N dA = X /ξ × X /η dξdη; (1.8) 8

sostituendo quest’ultima nella (1.7) si avrà

nda = JF −T X /ξ × X /η dξdη. (1.9) 9

Quest’ultima formula, che permette di riferirsi comunque sempre alla configurazione iniziale, è di
pratica utilità quando si devono effettuare i conti sulle superfici deformate. D’altro canto, usando
la (1.1) la superficie S nella posizione deformata diventerà S = x(φ(X(ξ, η))), per cui

nda = F X /ξ × F X /η dξdη, (1.10) 10

che operativamente è analoga alla (1.9), e non richiede l’inversione del tensore gradiente di de-
formazione. Si può però rilevare che in tal modo è stato dimostrata l’interessante proprietà

F X /ξ × F X /η = JF −T X /ξ × X /η dξdη. (1.11)
Quest’ultima può essere generalizzata a un qualsiasi prodotto dello stesso tipo:

A b × A c = det(A) A−T b × c = CmpAlg(A) b × c, (1.12)

in cui si é abusato, un po’ liberamente, della possibilitá di confondere i tensori doppi in coordinate
cartesiane ortogonali con la loro rappresentazione matriciale, poiché, in notazione anglosassone,
CmpAlg(A) è lo adjugate di A.

1.3 BILANCIO DI MASSA


In termini Euleriani il bilancio di massa si ottiene affermando che
Z Z Z
d D
ρ(x, t)dv + ρv · nda = ρ(x, t)dv = 0 (1.13) massa1
dt v ∂v Dt v
che in forma differenziale si scrive
∂ρ
+ div (ρ(x, t)v) = 0 (1.14) massa2
∂t

2
quindi
Z Z
ρ(x, t)dv = ρ0 dV = const., (1.15) massa3
v V

dove ρ0 è la densità del corpo nella condizione indeformata. Applicando alla (1.15) la trasformazione
di coordinate si ottiene:
Z Z Z
ρ(x, t)dv = Jρ(X, t)dV = ρ0 dV, (1.16) massa4
v V V

L’equazione di continuità nel caso lagrangiano si può quindi scrivere come

ρ0 = Jρ(X, t). (1.17) massa5

L’eventuale ulteriore condizione di incomprimibilità ρ(x, t) = const., nel caso Euleriano comporta
che div (ρ(x, t)v) = 0, ossia div v = 0, mentre in termini Lagrangiani l’incomprimibilità si esprime
affermando che J = J(X, t) = 1. Lo Jacobiano rappresenta infatti il rapporto fra il volume
dell’elementino infinitesimo in condizione deformata e quello in condizione indeformata, e quindi
J > 0 sempre. Nel caso incomprimibile J deve essere necessariamente pari a 1.

1.4 BILANCIO DI QUANTITÀ DI MOTO


Definiamo: l’accelerazione a = Dv Dt , le forze per unità di massa (o forze di campo) b e le forze per
unità di superficie p, e ricordando che vale la relazione di Cauchy p = σ T n, l’equazione differenziale
di bilancio di quantità di moto in termini Euleriani si scrive come2
D
(ρ(x, t)v(x, t)) = ρ(x, t)b + div (σ) (1.18) qdm1
Dt
La derivata totale a sinistra si può esplicitare scrivendo anche
µ ¶
Dv ∂ρ
ρ +v + div (ρv) (1.19) qdm2
Dt ∂t

ed essendo il secondo termine nullo per la (1.14) si ottiene

ρa = ρb + div (σ). (1.20) qdm3

La formulazione integrale della (1.20) è pari a


Z Z Z
ρ(x)adv = ρ(x)bdv + pda, (1.21) qdm4
v v a

dove a = ∂v è la superficie di contorno di v. Applichiamo ora la trasformazione di coordinate (1.1)


utilizzando la formula di Nanson per trasformare il prodotto nda dell’ultimo integrale della (1.21)
Z Z Z Z
T
pda = σ nda = σ JF N dA = (JF −1 σ)T N dA.
T −T
(1.22) qdm5
a a A A

La (1.21) diventa
Z Z Z
ρ(X)aJdV = ρ(X)BJdV + (JF −1 σ)T N dA. (1.23) qdm6
V V A

Il simbolo per l’accelerazione è rimasto il medesimo in entrambe le formulazioni (Lagrangiana ed


Dφ(X,t) ∂φ(X,t)
Euleriana) perché il valore è lo stesso, cosı̀ come per la velocità. Infatti Dx
Dt = Dt = ∂t ,
dove X non è funzione del tempo. Introducendo il tensore degli sforzi nominali

Σn = JF −1 σ, (1.24)
2 In notazione indiciale la divergenza si scrive come div σ = σik/i .

3
applicando il teorema della divergenza all’ultimo membro della (1.23), ossia
Z Z
T
S N dA = Div SdV, (1.25)
ZA ZV
Ski Nk dA = Sik/i dV, (1.26) qdm6-1
A V

e ricordando la conservazione della massa (1.17), si ottiene il bilancio di quantità di moto in termini
Lagrangiani

ρ0 a = ρ0 B + Div Σn . (1.27) qdm7

Il tensore degli sforzi nominali ha una definizione simile al tensore di Cauchy eccetto il fatto che è
espresso in termini dell’area e della normale della superficie di riferimento, ossia quella indeformata.
Il tensore degli sforzi nominali non è in generale simmetrico. Risulta inoltre utile definire altre due
misure di sforzo: il primo tensore di Piola-Kirchhoff (PKI), che è semplicemente il tensore trasposto
di quello nominale

ΣI = Jσ F −T , (1.28) qdm8

e il secondo tensore di Piola-Kirchhoff che viene ottenuto semplicemente moltiplicando l’inversa


del gradiente di deformazione per il PKI F −1 ΣI = Σ

Σ = JF −1 σ F −T . (1.29) qdm9

Il secondo tensore di Piola Kirchhoff (PKII) è simmetrico essendo σ simmetrico (vedi bilancio del
momento delle quantità di moto).

1.5 BILANCIO DEL MOMENTO DELLE QUANTITÀ DI MOTO


Il bilancio del momento delle quantità di moto, supponendo che ogni elementino elementare scambi
solo delle forze e non delle coppie, porta semplicemente a scrivere che il tensore degli sforzi di
Chauchy è simmetrico, ossia σ = σ T . Ovviamente essendo σ simmetrico lo sará anche il PKII.
Attenzione però, se si dovessero considerare dei materiali cosiddetti polari, in cui ogni elementino
scambia con gli elementi che lo circondano anche delle coppie, allora il bilancio delle quantià di
moto porterebbe a scrivere una nuova relazione vettoriale e il tensore degli sforzi non sarebbe più
simmetrico.

1.6 BILANCIO DI ENERGIA


Introducendo il calore generato per unità di massa r e il flusso di calore attraverso le superfici di
contorno q, il bilancio energetico in forma integrale si scrive come
Z µ ¶ Z Z Z Z
D 1
ρ(x) e + |v|2 dv = ρ(x)v T bdv + v T pda + ρ(x)rdv − q T nda. (1.30) en1
Dt v 2 v a v a

Questa equazione rappresenta un bilancio di potenze dove si è scritto che la variazione nel tempo
dell’energia interna e e di quella cinetica deve eguagliare la potenza delle forze esterne e la potenza
dovuta alle sorgenti interne di calore r e ai flussi scambiati q. Questo non è niente altro che il primo
principio della termodinamica. Il flusso è con segno negativo perché un flusso positivo è uscente
dal corpo e quindi sottrae energia. La corrispondente forma differenziale nel caso delle coordinate
Euleriane porta all’equazione
De
ρ = ρr + D : σ − div q, (1.31)
Dt
dove D è il tensore di velocità di deformazione definito come

1¡ ¢
D= grad v + (grad v)T . (1.32)
2

4
Passiamo in coordinate Lagrangiane
Z ³ ´ Z Z ³ ´ Z Z
ρ0 Ė + v T a dV = ρ0 v T BdV + v T Div Σn + Ḟ : Σn dV + ρ0 RdV − DivQdV.
V V V V V
(1.33) en2

Il terzo termine della (1.33) è stato ottenuto utilizzando la formula di Nanson per cui 3
Z Z Z
¡ ¢
vj Ni (Σn )ij dA = (vj (Σn )ij )/i dV = vj/i (Σn )ij + vj (Σn )ij/i dV (1.34) en3
A
ZV µ V
¶ Z ³ ´
∂Fji
= (Σn )ij + vj (Σn )ij/i dV = Ḟ : Σn + v T DivΣn dV.
V ∂t V
(1.35)

L’ultimo termine si ottiene applicando la formula di Nanson, definendo Q = JF −1 q e applicando il


teorema della divergenza. Il vettore Q rappresenta il flusso di calore per unità di area di riferimento,
mentre q é il flusso di calore per unità di area corrente. I termini moltiplicati scalarmente per il
vettore velocità sono quelli dell’equazione della quantità di moto e possono quindi essere eliminati.
Il bilancio di energia in termini Lagrangiani si scrive quindi come

ρ0 Ė = ρ0 R − Div Q + Σn : Ḟ , (1.36) en4

tenendo conto del fatto che Σn : Ḟ = Ḟ : Σn . Questa equazione ci dice che il tensore di sforzo
nominale è coniugato energeticamente alla derivata temporale del gradiente di deformazione F . Il
vettore Q può essere espresso in funzione della temperatura come Q = −KGrad T , secondo la ben
nota legge di Fourier.

Un utile e sintetico riferimento sui paragrafi precedenti é: Chadwick, Continuum Mechanics, Dover.

1.7 BILANCIO DI ENTROPIA


In termini Euleriani la disuguaglianza entropica che esprime il secondo principio della
termodinamica si scrive come
Z Z Z T
D r q n
ρ( x)s dv ≥ ρ(x) dv − da, (1.37) ent1
Dt v v T a T

a cui corrisponde l’espressione differenzale


r ³q´
ρṡ ≥ ρ − div . (1.38) ent21
T T
Passando in coordinate Lagrangiane si ottiene
µ ¶
R Q
ρ0 Ṡ ≥ ρ0 − Div . (1.39) ent2
T T
Introduciamo una misura di deformazione attraverso il tensore di Green-Lagrange (GL)
1 T
∈= (F F − I). (1.40) GL
2
che rappresenta la variazione di lunghezza del modulo al quadrato del vettore dX, ossia |dx| 2 −
|dX|2 = 2dX T ∈dX. Se chiamiamo s il vettore spostamento tale per cui x = X + s(X, t), il
3 Nella formula seguente si fa uso del simbolo ‘:’ che denota l’operazione tensoriale di contrazione di una coppia di

indici ripetuti. In questo caso si è usata la definizione: A : B = Aik Bki = B : A = Tr(A B). Ulteriori utili proprietá
dell’operatore traccia sono: Tr(A B) = Tr(B A), giá implicita nella definizione precedente e Tr(A B T ) = Tr(AT B).
Si noti che alcuni testi usano una definizione diversa per cui: A : B = Aik Bik = Tr(A B T ), in questo caso per
ottenere lo stesso risultato bisogna scrivere AT : B.

5
gradiente di deformazione sarà uguale a F = I + Grad s. Sostituendo questa espressione nella
(1.40) si ottiene
1¡ ¢
∈= Grad s + (Grad s)T + (Grad s)T Grad s . (1.41) GL2
2
Il vantaggio di questa misura di deformazione rispetto al gradiente di deformazione F è dato
dall’indipendenza di ∈ da movimenti rigidi4 e dalla possibilità di collegare Σ ad ∈ attraverso una
legge costitutiva che garantisce l’oggettività, ossia l’indipendenza da trasformazioni di coordinate
rigide. Noi ci occuperemo solo di sistemi lineari elastici per cui Σik = Cikrs ∈rs − βik (T − T0 ), legge
ricavabile a partire dall’energia elastica per cui Σik = ∂Ee /∂∈ik . Si può dimostrare che
˙
Σn : Ḟ = Σ : ∈. (1.42) GL3

La derivata temporale del tensore di GL è coniugata dal punto di vista energetico con il secondo
tensore PKII. Allora la (1.39) si può riscrivere come
R Div Q Q
ρ0 Ṡ ≥ ρ0
− + 2 · Grad T, (1.43) ent3
T T T
mentre l’equazione dell’energia diventa
˙
ρ0 Ė = ρ0 R − Div Q + Σ : ∈. (1.44) en5

Sostituendo nella (1.43) l’espressione di ρ0 R − Div Q tratta dalla (1.44) si ottiene


Q
˙ +
ρ0 (T Ṡ − Ė) ≥ −Σ : ∈ · Grad T, (1.45) ent4
T
Introduciamo la funzione energia libera Ψ = E − T S da cui Ψ̇ = Ė − Ṫ S − T Ṡ. Sappiamo
che possiamo determinare una qualunque grandezza termodinamica in funzione di una qualunque
coppia di grandezze termodinamiche. Supponiamo di poter esprimere quindi l’energia libera come
funzione della temperatura, del tensore di GL e del gradiente di temperatura Γ = Grad T . Si ha
quindi che
∂Ψ ∂Ψ ∂Ψ
Ψ̇ = Ṫ + ˙ +
:∈ · Γ̇. (1.46) el
∂T ∂∈ ∂Γ

Si noti che ∂Ψ
∂Γ é Grad di Ψ rispetto a Γ. Per evitare un appesantimento notazionale, con lieve
abuso, riteniamo Grad implicito nella notazione della derivata di uno scalare rispetto a un vettore.
Sostituendo queste espressioni nella (1.45) otteniamo
µ ¶ Ã !
∂Ψ ∂Ψ ∂Ψ Q
ρ0 + S Ṫ + ρ0 −Σ :∈ ˙ + ρ0 · Γ̇ + · Γ ≤ 0. (1.47)
∂T ∂∈ ∂Γ T

Questa disequazione deve valere per qualunque scelta delle variabili di stato, quindi necessariamente
ent5 devono valere le seguenti quattro relazioni
∂Ψ
S=− , (1.48a)
∂T
∂Ψ
Σ = ρ0 , (1.48b)
∂∈
∂Ψ
= 0, (1.48c)
∂Γ
Q = −K Γ. (1.48d)
La terza ci dice che lo stato termodinamico è definito solo da T e ∈. La seconda relazione contiene
la definizione termodinamica degli sforzi, mentre dalla quarta si deduce che il tensore conduttività
di Fourier deve essere simmetrico e definito positivo. Questo indica semplicemente che il calore
passa spontaneamente dal caldo al freddo.
4 Se infatti prendiamo un movimento rigido x = R X + xT composto da una rotazione piú una traslazione rigida,
si vede facilmente che F = R e quindi ∈ = 21 (RT R − I) = 0.

6
1.8 LEGGE COSTITUTIVA
Esprimendo nella (1.36) l’energia interna in funzione dell’entropia, della temperatura e dell’energia
libera (E = Ψ + T S), e quest’ultima in termini delle grandezze di stato (T, ∈), e ricordando le
(1.48) si ottiene

ρ0 T Ṡ = ρ0 R − Div Q. (1.49) lc1

Ma la derivata dell’entropia è uguale a

∂S ∂S ∂2Ψ ∂2Ψ ∂2Ψ 1 ∂Σ ∂2Ψ B


Ṡ = Ṫ + ˙ =−
:∈ Ṫ − : ˙ =−
∈ Ṫ − : ˙ =−
∈ Ṫ + ˙ (1.50)
: ∈, el2
∂T ∂∈ ∂T 2 ∂T ∂∈ ∂T 2 ρ0 ∂T ∂T 2 ρ0

dove il tensore B è il tensore di componenti βik . Sostituendo la (1.50) nella (1.49) si ottiene

∂2Ψ
−ρ0 T ˙ = ρ0 R − Div Q.
Ṫ + T B : ∈ (1.51) lc2
∂T 2
2
∂S
Definendo il calore specifico a volume costante Cv = −T ∂∂TΨ2 = T ∂T , la (1.51) si può riscrivere
come
à !
TB : ∈ ˙
ρ0 Cv Ṫ 1 + = ρ0 R − Div Q. (1.52) lc3
ρ0 Cv Ṫ

Trascurando le forze d’inerzia dovute alla sola dilatazione termica e quindi le accelerazioni dovute
alle deformazioni termiche, e supponendo che la variazione nel tempo della temperatura T sia molto
maggiore di quella del tensore di GL, il termine
˙
TB : ∈
¿ 1. (1.53) lc21
ρ0 Cv Ṫ
e la (1.52) si può approssimare come

ρ0 Cv Ṫ = ρ0 R − Div Q. (1.54) lc4

In questo caso si vede come l’equazione dell’energia risulti disaccoppiata da quella della quantità di
moto; è quindi possibile risolvere il problema termico in maniera indipendente da quello strutturale,
come di solito viene fatto nell’ambito ingegneristico. Attenzione, però: se le temperature in gioco
sono molto alte il secondo termine tra parentesi nella (1.52) può rientrare in gioco. In quest’ultimo
caso il modello presenta una intrinseca non linearità.
In caso di trasformazione adiabatica e in assenza di generazione interna di calore la variazione di
temperatura è sufficientemente rapida da non comportare alcun scambio termico, quindi i termini
a secondo membro della (1.52) sono nulli. Se si considera una piccola variazione di temperatura
nell’intorno di una temperatura di riferimento tale per cui: T = T0 + ∆T , e quindi Ṫ = ∆Ṫ ,
l’equazione (1.52) diventa:
˙ = 0,
ρ0 Cv ∆Ṫ + T0 B : ∈ (1.55) lc5

che integrata, porta ad ottenere un’espressione che mostra una variazione di temperatura associata
alla deformabilità
T0
∆T = − B : ∈. (1.56) lc6
ρ0 Cv

È ora possibile confrontare la legge costitutiva, isoterma e statica, implicitamente sottintesa nelle
usuali e piú comuni analisi dinamiche: Σik = Cikrs ∈rs − βik ∆T , con la sua equivalente adiabatica
per cui
µ ¶
T0 βrs
Σik = Cikrs + βik ∈rs . (1.57) lc7
ρ0 Cv

7
Si vede allora che, se non si trascura la dinamica termoelastica, la parte elastica equivalente a un
comportamento isotermico é diversa dalla corrispondente adiabatica e la (1.57) giustifica, almeno in
piccolo, le rilevazioni sperimentali che danno un incremento del modulo elastico statico equivalente
all’aumentare della velocitá di deformazione. Per avere un’idea dell’ordine di grandezza di tale
variazione consideriamo il caso di un materiale lineare elastico soggetto a sola trazione. In questo
caso è possibile scrivere β = Eα, dove E è il modulo elastico e α è il coefficiente di dilatazione
termica. In questo caso il modulo elastico adiabatico sarà uguale a
µ ¶
T0 α 2 E
E 1+ . (1.58)
ρ0 Cv

In particolare, nel caso di una lega leggera di alluminio


µ ¶
300 6.2510−10 7 1010
E 1+ ≈ E(1 + 0.0049), (1.59)
2800 960

e quindi un effetto spesso trascurabile. Questo risultato giustifica ulteriormente la possibilitá


di separare il calcolo termico da quello strutturale in molte analisi di pratica utilitá, anche in
condizioni non strettamente approssimabili come isoterme. Va peró notato che anche se fosse
accettabile l’approssimazione della separazione delle risposte termoelastiche ció non implica,
necessariamente, che non possano esistere, come sará evidenziato nel paragrafo seguente, accop-
piamenti termoelastici legati alle condizioni al contorno.

Per questo paragrafo puó essere utile consultare il classico: Boley-Weiner, Theory of Thermal
Stresses, Dover.

1.9 CONDIZIONI AL CONTORNO


Le equazioni di bilancio sono equazioni alla derivate parziali che necessitano di condizioni iniziali e
al contorno. Per quanto riguarda le forze o gli spostamenti le condizioni al contorno sono date dalla
relazione di Cauchy p = σ T n nel caso Euleriano, o piú in generale nel caso Lagrangiano p = ΣTn N
sul contorno del corpo. Per quanto riguarda invece la condizione al contorno sulla temperatura
andrà fornito un valore di temperatura in ogni punto del contorno oppure delle condizioni sul flusso
di calore scambiato per cui vale la relazione Q = JF −1 q. Quest’ultima relazione evidenzia un
accoppiamento strutturale grazie alla presenza del tensore F . Fisicamente ciò può essere spiegato
dal fatto che la deformazione del contorno provoca una variazione delle superfici sia in estensione che
in orientamento e, dunque, una variazione dei flussi termici nelle strutture anche quando q ha una
direzione assegnata e fissa nel tempo (es. irraggiamento solare). Quindi il problema termo-elastico,
anche se approssimabile come disaccoppiato dal punto di vista delle equazioni di bilancio interne,
in molte approssimazioni ingegneristiche, ritorna ad essere accoppiato attraverso le condizioni al
contorno, specie nelle strutture spaziali.
Il flusso di calore è la somma di quello per convezione e quello per irraggiamento, e si può
scrivere come

q = h(Ts − Ta ) + σ(εTs4 − αTa4 ), (1.60) cc1

dove Ta è la temperatura dell’ambiente e Ts é la temperatura della struttura, σ è la costante


di Stefan-Boltzmann, ε è il coefficiente di emissione e α è il coefficiente di assorbimento. Tali
coefficienti sono in generale funzioni delle frequenze di emissione, ma per corpi grigi possiamo
prendere dei valori medi. Inoltre per corpi grigi spesso ε = α.
Le cose si complicano ulteriormente quando si ha irraggiamento tra parti della struttura. In
questo caso il flusso di calore per irraggiamento netto viene ottenuto come

q = σεTs4 − αRi − α cos γ q∞ , (1.61) cc2

dove Ri è la radiazione incidente generata dai corpi circostanti che irraggiano sul corpo in questione,
q∞ è il flusso irradiato da sogenti lontane lungo una direzione che forma un angolo γ con la normale

8
locale al corpo. La radiazione emessa da ciascun corpo presenterà anche un contributo dovuto alla
riflessione della radiazione incidente, quindi

Re = σεTs4 + (1 − α)Ri . (1.62) cc3

L’energia radiata incidente in funzione di quella emessa e dei parametri geometrici, è data da
Z
cos γi cos γe
Ri = 2 Re dAe , (1.63) cc4
Ae πrie

che è l’energia incidente sul corpo i dovuta all’energia irradiata dal corpo e; γ i e γe sono gli angoli
formati fra le normali locali alle superfici e la congiungente il punto ricevente con il punto emittente.
Inserendo la (1.62) nella (1.63), e chiamando K = cos γπr i cos γe
2 , si ottiene
ie

Z Z
Ri = σεKT 4 dAe + (1 − α)KRi dAe , (1.64) cc5
Ae Ae

oppure
Z
cos γi cos γe
Re = σεTs4 + (1 − α) 2 Re dAe , (1.65) cc6
Ae πrie

equazioni integrali che permettono di trovare le energie incidenti da inserire nella (1.61) per ottenere
i flussi netti. I termini cos γ indicano la dipendenza delle energie scambiate per irraggiamento dagli
orientamenti delle superfici in gioco e quindi, ancora una volta, dal tensore F , si ricordino le (1.9,
1.10), con conseguente ulteriore accoppiamento con il movimento.
La presenza di equazioni differenziali alle derivate parziali non lineari unita alla presenza di
condizioni al contorno, anche di natura integrale come le (1.64) appena scritte, che accoppiano
tutte le equazioni in maniera non lineare, non permette in generale di trovare agevolmente una
soluzione in forma chiusa. Si deve perciò ricorrere ad un approccio numerico.

Per questo paragrafo puó essere utile rivedere alcuni concetti di Fisica Tecnica su un qualunque
testo della materia che contenga anche i fondamenti di trasmissione del calore.

9
2 PRINCIPIO DEI LAVORI VIRTUALI
Il Principio dei Lavori Virtuali (PLV) può essere considerato un principio “primigenio” che per-
mette di scrivere le equazioni che governano la dinamica di un sistema attraverso l’imposizione
dell’annullamento dei lavori virtuali. In meccanica è possibile postulare il bilancio della quantità
di moto e da esso far discendere il PLV, oppure si può dare come postulato il PLV e da esso far
discendere il bilancio della quantità di moto. Le due formulazioni non sono però equivalenti per
ciò che riguarda il grado di regolarità richiesto alle funzioni che descrivono gli andamenti delle
grandezze in gioco. Più in generale, tutte le formulazioni basate su un principio variazionale han-
no il vantaggio di richiedere minori vincoli di regolarità sulle grandezze in gioco. In particolare
la formulazione variazionale abbassa il numero di derivazioni necessarie e inoltre richiede la sola
integrabilità delle funzioni presenti nell’equazione.
Gli spostamenti virtuali δs rappresentano spostamenti arbitrari, regolari (continui) e compatibili
con i vincoli (cioè congruenti). Il principio dei lavori virtuali ricavato dall’equazione di bilancio
della quantità di moto (1.27) si scrive come
Z Z Z Z
Σik δ∈ki dV − Pi δsi dA = ρ0 Bi δsi dV − ρ0 ai δsi dV. (2.1) plv1
V A V V

I termini a secondo membro si ottengono semplicemente moltiplicando i rispettivi termini dell’e-


quazione della quantità di moto (1.27) per lo spostamento virtuale e integrando sul volume. Il
termine a sinistra deriva dalla moltiplicazione dello spostamento virtuale con la divergenza del
tensore nominale degli sforzi, e dalla applicazione del teorema della divergenza ossia
Z Z µ³ ´ ¶ Z Z
δsk Σik/i dV = δsk Σik − δsk/i Σik dV = δsk Σik Ni dA − δsk/i Σik dV. (2.2) plv2
V n V n /i n A n V n

Della superficie di contorno A ci sarà una parte su cui lo spostamento è vincolato ed un’altra su
cui sono assegnate le forze superficiali; essendo gli spostamenti virtuali delle variazioni fra posizioni
ammissibili il loro valore nella parte di superficie di contorno per cui lo spostamento è vincolato sarà
nullo. L’integrale sull’area A sarà quindi semplicemente uguale al prodotto delle forze di superficie
assegnate al contorno per lo spostamento virtuale come mostra la (2.1). Per il termine di volume
si utilizza la relazione che lega il tensore di sforzo nominale al secondo tensore di Piola-Kirchoff
Σn = Σ F T e il fatto che δsk/i = ∂δs ∂sk
∂Xi = δ ∂Xi = δFki , si ottiene
k 5

Z Z Z Z Z
δsk/i Σik dV = δFki Σi` Fk` dV = δFki Fk` Σi` dV = δ∈i` Σi` dV = δ∈ : ΣdV. (2.3) plv3
V n V V V V

Ancora una volta si può notare che il tensore di sforzo nominale è energeticamente coniugato con il
gradiente di deformazione, mentre il PKII è coniugato al tensore di deformazione di GL. Il PKII ha
il vantaggio di poter essere collegato attraverso una legge costitutiva che garantisce l’oggettività,
ossia l’indipendenza da moti rigidi, al tensore di GL, risulta quindi opportuno operare con tale
tensore. Nel caso di strutture continue elastiche soggette a forze conservative, il PLV può essere
interpretato come ricerca della condizione di stazionarietà (che corrisponde alla minimizzazione) del
funzionale energia totale composto da tre termini: l’energia elastica (o interna), l’energia cinetica
e l’energia delle forze esterne.
Una analoga procedura può essere utilizzata per l’equazione dell’energia (1.54) nella approssi-
mazione ingegneristica di equazione del calore (oppure per la corrispondente (1.52) nel caso più
generale); il principio variazionale termico corrispondente si ottiene utilizzando una variazione vir-
tuale della temperatura, ossia una variazione di temperatura nulla su tutte le parti del contorno
su cui la temperatura è assegnata, e sufficientemente regolare da permettere la valutazione delle
derivate richieste e l’integrazione finita dei termini relativi.
Z ³ ´
δT ρ0 Cv Ṫ − ρ0 R + Div Q dV = 0 (2.4)
V
5 In questo caso sia il tensore Σ che il tensore ∈ sono simmetrici per cui Σ : ∈ = Σ ik ∈ik = Σik ∈ki .

10
Per i primi due termini si procede come nel caso precedente, mentre per il termine della divergenza
dei flussi termici si ha
Z Z ³ ´ Z Z
δT Div QdV = (δT Qi )/i − δT/i Qi dV = δT QT N dA + δT/i Kik T/k dV, (2.5) plvt1
V V A V

avendo utilizzato la relazione che ci dá Q in funzione di Γ delle (1.48). Assemblando i diversi
termini si ottiene:
Z Z Z Z
T
δT ρ0 Cv Ṫ dV = δT ρ0 RdV − δT Q N dA − (Grad δT )T KGrad T dV. (2.6) plvt2
V V A V

Chiaramente si possono unire le due equazioni in un unico principio variazionale unificato, neces-
sario nel caso in cui si debba tener conto della dipendenza del flusso Q dal gradiente di deforma-
zione e della dipendenza dalla temperatura della legge costitutiva. La formulazione variazionale
dell’equazione del calore stazionaria nel tempo può essere ottenuta definendo il funzionale
Z Z Z
1
E(T, t) = 2
ρ0 Cv T dV − ρ0 RT dV + QT N T dA (2.7)
2 V V A

e ottenere la forma differenziale attraverso la ricerca delle condizioni di stazionarietà del funzionale.

2.1 TECNICHE DI APPROSSIMAZIONE NUMERICA


L’idea generale è quella dei metodi cosiddetti alla “Ritz”, che consistono nel cercare una soluzione
approssimata nella forma
n
X
s= N i (x)qi (t) = N (x)q(t), (2.8) ritz
i=1

ove le N i sono funzioni della sola posizione x, scelte a priori, che soddisfano le condizioni al contorno
essenziali, mentre i parametri q sono le coordinate libere del problema, incognite, funzione del solo
tempo, adottando cioè la separazione delle variabili. La matrice delle funzioni di forma N (x) è
in generale una matrice 3 × n, essendo s una grandezza vettoriale nello spazio a tre dimensioni.
Perché una siffatta soluzione possa convergere all’aumentare di n, le funzioni di forma devono
appartenere ad uno sviluppo completo, ossia essere una “base” di funzioni indipendenti dello spazio
funzionale delle soluzioni del problema derivabili sino all’ordine m − 1, dove m è l’ordine massimo
delle derivate presenti nel problema variazionale (quindi funzioni semplicemente continue nel caso
tridimensionale).
Le coordinate libere del sistema divengono le qi presenti nella (2.8), ossia le ampiezze associate
alle funzioni di forma utilizzate. Nel caso particolare degli elementi finiti tali ampiezze corrispon-
dono esattamente agli spostamenti nodali. Analogamente per il caso termico è possibile esprimere
la temperatura attraverso uno sviluppo T = N (x)θ(t) dove N (x) è in questo caso una matrice riga
in quanto la temperatura è una grandezza scalare.
Applichiamo questo approccio all’equazione (2.1), per cui s = N s u, T = N t θ. Le variazioni
dello spostamento e della temperatura si scriveranno come

δs = N s δu = N si δui ,
δT = N t δθ = Nti δθi ,

dove N si rappresenta la colonna i-esima della matrice N s . La variazione del tensore di deformazione
(1.41) potrà allora essere espressa come
1¡ ¢
δ∈ = Grad N si + (Grad N si )T + Grad N si (Grad s)T + Grad s (Grad N si )T δui =
2 (2.9)
= B i (s)δui ,

dove B i (s) è un matrice riga, nel senso di lista ordinata, di tensori doppi dipendenti dalla configu-
razione corrente s. Essi possono a loro volta essere scomposti un una parte lineare B L i
ed una non

11
lineare B N
i
L

1¡ ¢
BL
i
= Grad N si + (Grad N si )T ,
2
1¡ ¢
BN
i
L
= Grad N si (Grad s)T + Grad s (Grad N si )T .
2
In ogni caso va sottolineato come tali variazioni siano sempre lineari in δu e δθ. Ne consegue che
è possibile definire le seguenti forze generalizzate: di volume F v , di superficie F s , elastiche F e , e
termiche F t , e la matrice di massa M come
Z Z Z
ρ0 δsT BdV = ρ0 δuT N Ts BdV = δuT ρ0 N Ts BdV = δuT F v (2.10a) fv
V V V
Z Z Z
δsT P dA = δuT N Ts P dA = δuT N Ts P dA = δuT F s (2.10b) fs
A A A
Z Z
δ∈ki Σik dV = δ∈ki (Cikrs ∈rs − βik ∆T ) dV
V
ZV (2.10c) feft
= δuj Bkij (Cikrs ∈rs − βik ∆T ) dV = δuT (F e + F t )
V
Z Z
T
ρ0 δs adV = δu T
N Ts ρ0 N s dV ü = δuT M ü. (2.10d) massa
V V

Data l’arbitrarietà di δuT , possiamo quindi scrivere che

M ü = −F e − F t + F v + F s . (2.11) explicit

Analogamente per l’equazione (2.6) si ottiene


Z Z
δT T ρ0 Cv Ṫ dV = δθ T N Tt ρ0 Cv N t dV θ̇ = δθT C T θ̇ (2.12a)
V V
Z Z
T
T T
δT Q N dA = δθ N Tt QT N dA = δθ T Qs (2.12b)
A A
Z Z
δT T ρ0 RdV = δθ T N Tt ρ0 RdV = δθ T Qr (2.12c)
ZV V
T
δT/i Kij T/k dV = δθ Qcond , (2.12d)
V

da cui, per l’arbitrarietà di δθ T si ha

C T θ̇ = Qs + Qr − Qcond (2.13) explicitT

La (2.11) e la (2.13) costituiscono un sistema di equazioni differenziali ordinarie accoppiate nelle


incognite u e θ e rappresentano l’approccio esplicito alla Galerkin-Ritz, e quindi solo condiziona-
tamente stabile. Queste equazioni possono essere integrate nel tempo utilizzando un qualunque
integratore esplicito ricordando che i termini a destra non sono costanti, bensı̀ dipendenti dalla con-
figurazione e vanno quindi in generale aggiornati ad ogni nuovo istante e ponendo attenzione alla
scelta del passo di integrazione che deve essere in grado di cogliere anche le costanti di tempo più
veloci presenti nel sistema per rispettare la condizione di stabilità CFL (Courant-Friedrichs-Lewy).

2.2 FORMULAZIONE LAGRANGIANA TOTALE ED AGGIORNA-


TA
Le equazioni di bilancio per stutture elastiche soggette a spostamenti e deformazioni infinitesime
sono delle equazioni alle derivate parziali di tipo lineare. In questo caso si può affermare che
gli spostamenti e le deformazioni sono cosı̀ piccoli da non influenzare il modo in cui si instaura
l’equilibrio, per cui è possibile scrivere i bilanci nella configurazione indeformata. In questo caso le
due formulazioni Euleriana e Lagrangiana risultano identiche.

12
Nel caso di grandi spostamenti, le equazioni di bilancio scritte in formulazione Euleriana devono
essere scritte nella configurazione deformata, altrimenti abbiamo visto che è possibile scrivere le
equazioni in formulazione Lagrangiana, come si è visto nel Capitolo 1, sulla configurazione iniziale.
Le equazioni che si ottengono sono in generale di tipo non lineare.
La formulazione Lagrangiana è quella più utilizzata nell’ambito del calcolo strutturale perché
permette di trattare facilmente domini con contorni complessi e tutti i casi in cui si hanno leggi
costitutive che dipendono dalla storia del materiale. Per la risoluzione numerica delle equazioni
attraverso procedure linearizzate incrementali (tipo Newton-Raphson) si possono utilizzare due
formulazioni Lagrangiane differenti. Nella prima, detta Lagrangiana Totale, tutte le grandezze so-
no descritte nella configurazione originaria, ossia quella iniziale. Nella seconda, detta Lagrangiana
Aggiornata, la configurazione di riferimento è quella corrente. In quest’ultimo caso, la configurazio-
ne di riferimento viene modificata ad ogni passo di integrazione. Per la forma Lagrangiana Totale,
il cui PLV associato è quello scritto in (2.1), supponendo che lo spostamento possa essere scritto
come la somma della posizione di riferimento più una variazione della stessa

s = s0 + ∆s, (2.14) slin

per cui si ha che

δs = δ∆s.

linBP I termini (2.10a) e (2.10b) diverranno allora


Z Z Z
T 0 T 0
ρ0 δ∆s (B + ∆B)dV = ρ0 δ∆s B dV + ρ0 δ∆sT ∆BdV (2.15a)
V V V
Z Z Z
δ∆sT (P 0 + P )dA = δ∆sT P 0 dA + δ∆sT P dA (2.15b)
A A A

slin-1 La linearizzazione del termine elastico (2.10c) è invece un po’ più elaborata in quanto richiede
di linearizzare il tensore di deformazione di Green-Lagrange. In questo caso infatti, utilizzando la
(2.14)
1³ 0 ´
∈ik = si/k + ∆si/k + s0k/i + ∆sk/i + s0r/i s0r/k + s0r/i ∆sr/k + s0r/k ∆sr/i + ∆sr/i ∆sr/k
2 (2.16a)
=∈ + ∆∈ik = ∈ + ∆∈ + ∆∈ ,
0 ik 0 ik 1 ik 2 ik

dove i tre termini esplicitati corrispondono rispettivamente alla parte costante, quella lineare in
∆s, e quella quadratica, ossia
1³ 0 ´
∈ = si/k + s0k/i + s0r/i s0r/k , (2.16b) eps0
0 ik 2
1³ ´
∆∈ = ∆si/k + ∆sk/i + s0r/i ∆sr/k + s0r/k ∆sr/i , (2.16c)
1 ik 2
1¡ ¢
∆∈ = ∆sr/i ∆sr/k . (2.16d)
2 ik 2

Il termine (2.10c), tenuto conto che anche Σik = Σ0ik + ∆Σik e ∆Σik = Cikrs ∆∈rs (la parte βik ∆T
rimane nel Σ0ik ), e che la variazione del termine in (2.16b) è nulla, si puó allora scrivere come
Z µ ¶
¡ 0 ¢
Σik + ∆Σik δ∆∈ + δ∆∈ dV
V 1 ik 2 ik
Z µ ¶ (2.17) SigmaTL
0 0
= Σik δ∆∈ + Σik δ∆∈ + ∆Σik δ∆∈ + ∆Σik δ∆∈ dV
V 1 ik 2 ik 1 ik 2 ik

Per il termine di inerzia si ha


Z Z Z
T 0 T 0
ρ0 δ∆s (a + ∆a)dV = ρ0 δ∆s s̈ dV + ρ0 δ∆sT ∆s̈dV, (2.18) massaUL
V V V

13
Essendo s0 una posizione per cui il bilancio di quantità di moto è verificato, i primi due termini
delle (2.15) assieme al primo della (2.18) si annullano con il primo termine della (2.17), che è l’unico
che contiene i termini lineari in δ∆s. Tutti i termini quadratici nella variazione dello spostamento
∆s vanno mantenuti, in quanto sappiamo che i termini lineari vengono ottenuti dalla variazione dei
termini quadratici dell’energia. L’ultimo termine della (2.17) e il termine derivante dal prodotto del
∆∈ con δ∆∈ compreso nel terzo termine della (2.17) vanno elimininati in quanto termini cubici,
2 ik 1 ik
e quindi infinitesimi di ordine superiore. I termini rimanenti costituiscono il PLV linearizzato nella
forma Lagrangiana Totale.
Nel caso della formulazione Lagrangiana Aggiornata le nuove coordinate Lagrangiane di ri-
ferimento X̃ divengono pari alla configurazione corrente x. È quindi necessario ad ogni passo
aggiornare tutte le grandezze rispetto al nuovo sistema di riferimento. Di conseguenza nelle nuove
coordinate il termine s̃0 è per definizione nullo. Nel nuovo stato di riferimento lo stato di sforzo
iniziale sarà non nullo, essendoci in generale un Σ(X) diverso da zero nelle coordinate originarie.
Questo sforzo andrà riportato nel nuovo sistema di riferimento. Ricordando che nella condizione
iniziale la configurazione coincide con quella di riferimento e il tensore PKII coincide con il tensore
di Cauchy, si può scrivere che
1
Σ0 (X̃) = σ 0 (X̃) = F Σ(X)F T . (2.19)
J
0
Nella nuova formulazione allora si ha Σik = σik + ∆Σik ; il termine ∈ = 0 mentre
0 ik

1¡ ¢
∆∈ = ∆s̃i/k + ∆s̃k/i .
1 ik 2
A questo punto procedendo nel medesimo modo, eliminando i termini che si equilibrano si ottengono
le equazioni del moto in forma variazionale per la formulazione Lagrangiana Aggiornata.

2.3 SVILUPPO DEL PLV PER LA FORMULAZIONE LAGRANGIA-


NA AGGIORNATA
Qui di seguito verranno dettagliati i passaggi per la costruzione di un modello discretizzato linea-
rizzato per il caso della formulazione Lagrangiana Aggiornata. Al fine di facilitare operativamente
la scrittura dei modelli discretizzati a partire dal PLV è utile esprimere gli enti vettoriali e tensoriali
sino ad ora utilizzati in termini di matrici e vettori, in modo da poter operare usando l’algebra
matriciale. Gli enti verranno quindi ridefiniti basandosi sull’equivalenza del risultato delle opera-
zioni algebriche e non attraverso somiglianze formali. Sfruttando la simmetria dei tensori di sforzo
e deformazione, che ci dice che le componenti indipendenti sono solo sei per ciascuno di essi, è
possibile esprimere questi ultimi utilizzando i seguenti vettori

Σ = {Σ11 , Σ22 , Σ33 , Σ12 , Σ13 , Σ23 }T , (2.20)


T
∈ = {∈11 , ∈22 , ∈33 , 2∈12 , 2∈13 , 2∈23 } . (2.21)

Gli incrementi di spostamento e di temperatura, ∆s e ∆T vengono scritti in funzione delle funzioni


di forma come

∆s = N s ∆u, (2.22)
∆T = N t ∆θ. (2.23)

Sappiamo che solo i termini quadratici in ∆s della (2.17) devono essere espressi nelle equazioni
linearizzate, perché quelli lineari si elidono grazie alla condizione di equilibrio dinamico nella con-
figurazione iniziale, e i termini cubici vengono trascurati in quanto infinitesimi di ordine superiore.
L’operatore differenziale che permette di esprimere la parte lineare del tensore di deformazione

14
rappresentato come vettore ∈ è il seguente
 ∂ 
∂x1 0 0
 0 ∂
0 
 ∂x2 
 0 0 ∂ 
 ∂x3 
B= ∂ ∂ . (2.24)
 ∂x2 ∂x 0 
 ∂ 1
∂ 
 ∂x 0 ∂x1

3
∂ ∂
0 ∂x3 ∂x2

Potremo allora dire che

∆∈ = B s = B N s ∆u = B ∆u. (2.25)

Il corrispondente vettore degli sforzi PKII linearizzato é pari a

∆Σ = D ∆∈ − β∆T, (2.26)

dove D é la matrice che contiene le componenti indipendenti del tensore quadruplo C ikrs , e β e
il vettore che rappresenta il tensore doppio che lega la deformazione al salto di temperatura. La
parte quadratica del terzo termine della (2.17) è allora pari a
Z Z
δ∆∈T ∆ΣdV = δ∆uT B T D B dV ∆u = δ∆uT K∆u, (2.27)
V V

dove K è la matrice elastica di rigidezza. Chiamiamo σ 0 = Σ0 il vettore di sforzo nello stato


iniziale 6 . Il termine quadratico dovuto al presforzo, corrispondente al secondo termine della
(2.17), si ottiene definendo la seguente matrice 9 × 9
 0 0 0 
σ11 I 3 σ12 I 3 σ13 I3
0
Σ̃ = σ21 I 3 σ22 I 3 σ23 I 3  ,
0 0 0
(2.28)
0 0 0
σ31 I 3 σ32 I 3 σ33 I3

dove I 3 è la matrice unitaria di dimensione 3 × 3, e l’operatore differenziale G che rappresenta


l’operazione di gradiente sul vettore s
 ∂ 
∂x1 0 0
 0 ∂
0 
 ∂x1 
 ∂ 
 0 0 ∂x1 
 ∂ 
 ∂x 0 0 
 2 
G=  0

∂x2 0 . (2.29)
 0 0 ∂ 
 ∂x2 
 ∂ 0 0 
 ∂x3 
 ∂ 
 0 ∂x3 0 

0 0 ∂x3

Se chiamiamo allora

g = G s = G N s u = G u, (2.30)

possiamo dire che


Z Z Z
0 0
Σ0ik δ∆∈ dV = δg T Σ̃ gdV = δ∆uT GT Σ̃ GdV ∆u = δ∆uT K σ ∆u, (2.31) pre-stress
V 2 ik V V

dove K σ è la matrice di presforzo o rigidezza geometrica. Il contributo dovuto alle variazioni di


temperatura si scrive come
Z Z
T
δ∆∈ β∆T dV = δ∆u T
B T β N t dV ∆θ = δ∆uT K uθ ∆θ. (2.32)
V V
6 Si ricorda che nella condizione di riferimento il tensore di Cauchy e il PKII sono uguali.

15
Infine rimane da definire la matrice di massa seguendo l’equazione (2.18) come
Z
M= N Ts ρ0 N s dV (2.33)
V

I termini F v ed F s vengono definiti utilizzando esattamente le (2.10a) e (2.10b), sostituendo a u


il termine ∆u. Data l’arbitrarietà di δ∆u, l’espressione finale del PLV linearizzato diviene pari a
³ ´
M ∆ü + K + K σ ∆u + K uθ ∆θ − ∆F v − ∆F s = Rs (u, θ). (2.34) expl-lin

Il vettore Rs è detto residuo, e nel caso in cui il sitema sia lineare è nullo. Nel caso generale il
residuo sarà pari a
Z Z Z Z Z
T T T T
Rs = B Σ dv + B β(T − T0 )dV + N s ρ0 ü − N s ρ0 BdV − N Ts P dA. (2.35) rs
V V V V A

Per problemi dinamici prima di passare alla risoluzione numerica si dovrà rendere l’espressione
differenziale dell’accelerazione algebrica, utilizzando un metodo di integrazione numerica.
Nel caso più generale il PLV linearizzato rispetto alla condizione di equilibrio dinamico s0 ,
costituisce la base su cui costruire un metodo iterativo per la risoluzione del sistema non lineare.
Il sistema di equazioni algebriche potrà essere descritto come un insieme di equazioni vettoriali del
tipo f (u) = 0, per la cui risoluzione si potrà, ad esempio, usare l’agoritmo di Newton-Raphson, o
sue variazioni, che dice semplicemente

if R 6= 0
R = −f (un )
∂f
∂u ∆u = R
un = u + ∆u
else convergenza.

In quest’ultimo caso il residuo non sarà più nullo, bensı̀ uguale ai termini contenuti nella (2.11)
calcolati in maniera completa senza linearizzare. Le forze superficiali e di volume possono dipendere
dalla posizione e dalla velocità e potranno dunque contribuire allo Jacobiano fornendo equivalenti
alla “rigidezza” (se dipendono dalla posizione) o “smorzamento” (se dipendono dalla velocità). Al
momento non è stato introdotto alcun termine di smorzamento strutturale. Se, ad esempio, si
introducesse uno smorzamento di tipo proporzionale, comparirà nel primo membro della (2.34) un
termine del tipo
h ³ ´i
C∆u̇ = αM + γ K + K σ ∆u̇. (2.36) damp-prop

Una trattazione più approfondita dello smorzamento strutturale verrà data in seguito, ad ogni
modo possiamo fin d’ora dire che lo smorzamento proporzionale al presforzo K σ potrebbe non
comparire.
Il termine termico è invece lineare se il tensore di conduzione di Fourier K F non dipende dalla
temperatura T . Definendo
Z
KT = Grad N Tt K F Grad N t dV. (2.37)
V

Nel caso in cui K F dipenda dalla temperatura, si preferisce non modificare la definizione di K T
e utilizzare un aggiornamento esplicito definendo un K T (T ). La corretta linearizzazione dovrebbe
invece essere fatta come
Z
∂K F
−K T + Grad N Tt Grad (T )Grad N t dV. (2.38)
V ∂T
Utilizzando le quantità già definite in (2.13) si ottiene

C T ∆θ̇ = K T ∆θ + ∆Qs + ∆Qr + RT (u, θ), (2.39) explT-lin

16
con RT il vettore residuo, in questo caso definito come
Z Z Z Z
−RT (u, θ) = Grad N Tt K F Grad T dV + N Tt ρ0 RdV + N Tt QT N dA− N Tt ρ0 Cv Ṫ dV. (2.40) Rt
V V A V

Il vettore di flussi di calore (convettivo e radiante) può dipendere dal movimento del contorno, e
nel caso della parte radiante ci può anche essere irraggiamento tra parti della struttura. Questo
porta ad un accoppiamento della parte termica con quella strutturale attraverso le condizioni al
contorno anche quando le equazioni di bilancio sono disaccoppiate. Senza esplicitare lo sviluppo dei
calcoli per l’ottenimento di questi termini, in generale si può dire che il vettore dei flussi di calore è
composto da una parte di flusso dipendente dalle condizioni al contorno, e quindi dal movimento,
più una parte di flussi assegnati
∂Qs
∆Qs = ∆u + ∆Qa = K θu ∆u + ∆Qa . (2.41) explT-lin2
∂u
Se è presente anche irraggiamento tra le parti della struttura, valgono le relazioni già viste

Re = σεTs4 + (1 − α)Ri , (2.42) rem


Z
cos γi cos γe
Ri = 2 Re dAe . (2.43) rad-ie
Ae πrie

Può essere utile vedere come impostare la risoluzione di questo problema con condizioni al contorno
di irraggiamento utilizzando una approssimazione a pannelli di ordine zero (vedi NASTRAN). Per lo
schema discreto si definiscono: due nuove matrici 1) A delle aree dei pannelli con cui si discretizzano
le superfici irraggiate, e 2) F dei fattori di vista fra i pannelli7
Z Z
cos γi cos γj
Fij = 2 dAi dAj . (2.44)
Ai Aj πrij

Definiti i due vettori Ri ed Re delle radiazioni incidente ed emessa, è possibile scrivere la versione
discretizzata della (2.43)

A Ri = F Re . (2.45) Fvista

Queste relazioni sono scritte ipotizzando che la radiazione assorbita e quella emessa siano costanti
su ciascun pannello (discretizzazione di ordine zero), anche se in realtà esse posseggono valori
puntuali. La (2.42) è ora una relazione vettoriale; premoltiplicandola per la matrice dei fattori di
vista F e utilizzando la (2.45) si ottiene

F Re = A Ri = σF Diag {εi } T 4s + F Diag {(1 − αi )} Ri , (2.46) Fvista2

da cui si può esplicitare il vettore della radiazione assorbita


£ ¤−1
Ri = σ A − F Diag {(1 − αi )} F Diag {εi } T 4s . (2.47) Fvista3

La (2.47) lega la radiazione incidente alla temperatura della struttura. La matrice che moltiplica
il vettore delle temperature in (2.47) è simmetrica se αi ed εi sono costanti. Nota la radiazione
incidente, è possibile ricavare per sostituzione dalla (2.42) il valore della radiazione emessa in forma
vettoriale. Analogamente dalla (1.61) si ricava il valore dei flussi termici, definendo un’opportuna
matrice di radiazione R

q = R T 4s − Diag {αi cos γi } q ∞


h £ ¤−1 i
= σ Diag {εi } − Diag {αi } A − F Diag {(1 − αi )} F Diag {εi } T 4s − Diag {αi cos γi } q ∞ .
(2.48) flussi-pan
7 In realtà il fattore di vista dimensionalmente corretto sarebbe il rapporto F ij /Aj .

17
La matrice di radiazione e le temperature T s nella (2.48) sono relative ai pannelli superficiali con
cui si sono discretizzate le condizioni di irraggiamento. Per esprimerle in funzione delle variabili
originarie utilizzate nel modello, ossia in funzione dei coefficienti moltiplicativi delle funzioni di
forma8 si ricorre ad uno schema di interpolazione lineare, che nel caso piú semplice può essere
generato dicendo che la temperatura del pannello è pari alla media pesata sulle singole aree delle
temperature associate alle singole funzioni di forma. Introducendo la matrice di interpolazione W

T sPann = W T sNod (2.49)


qs = R W T sNod (2.50)
Pann

qs = W T qs = W T R W T sNod (2.51)
Nod Pann

Quanto sopra è applicato alla sola matrice di radiazione, ma un discorso analogo varrà anche per
la matrice di radiazione diagonale associata al flusso q∞ . Quest’ultima espressione ci dice che in
caso di irraggiamento tra le parti della struttura, ci possa essere un accoppiamento tra le variabili
strutturali e quelle termiche dovuto alla matrice dei fattori di vista all’interno della matrice di
radiazione, la quale contenendo i termini cos γ e quindi le direzioni normali ai pannelli, viene a
dipendere dagli spostamenti del contorno.
Combinando la (2.34) e la (2.39) con la (2.41) e le opportune condizioni al contorno si ottiene
l’espressione finale del Principio dei Lavori Virtuali linearizzato in forma discreta per un sistema
termoelastico
· ¸½ ¾ · ¸½ ¾ ½ ¾
M 0 ∆ü K + K σ −K uθ ∆u ∆F
+ = (2.52) termoel
0 CT ∆θ̇ −K θu KT ∆θ ∆Q

Resta sottinteso che l’equazione di cui sopra, con i relativi sviluppi precedenti, potrá essere scritta
senza nessun ∆ qualora ci riferissimo a sistemi termoelastici intrinsecamente lineari. Cosı́, per
semplicitá di notazione, nel seguito si eviterá l’uso di ∆ ogniqualvolta che dal contesto si potrá
capire se ci si sta riferendo a problemi lineari o linearizzati.
La nuova matrice di “rigidezza” del sistema termoelastico non è in generale, strutturalmente de-
finita positiva. È quindi possibile che in alcune condizioni si creino delle instabilità termoelastiche
del sistema dovute alle interazioni attraverso le condizioni al contorno. Instabilità termoelastiche
si sono verificate su alcuni satelliti in orbita che sono stati persi a causa delle interazioni. In
alcuni casi infatti, i tempi caratteristici della dinamica termica non sono sufficientemente veloci
per smaltire (per irraggiamento) il calore ricevuto per irraggiamento solare, il cui flusso varia a
seconda della deformata assunta dalla struttura. Di conseguenza, ad ogni rivoluzione attorno alla
terra la deformata dovuta alla interazione con i flussi di calore cresce, conducendo in alcuni casi
ad instabilità con conseguente perdita del sistema.

Per le tecniche di risoluzione approssimata si ripassi il materiale dei corsi di matematica nume-
rica giá seguiti (perfino troppi). Puó peró essere utile rivedere le stesse cose da un punto di vista
piú “ingegneristico” e prossimo a quello qui utilizzato. Allo scopo si possono utilmente consultare:
Bathe, Finite Element Procedures in Engineering Analysis, Prentice-Hall;
Taylor, Zienkiewicz, The Finite Element Method, McGraw-Hill.
Per l’approssimazione numerica dell’irraggiamento diffuso qui presentata si vedano i manuali
di NASTRAN, relativi alla parte termica.

8 Per gli elementi finiti tali coefficienti sono esattamente le temperature assunte dal sistema ai nodi.

18
3 RISOLUZIONE NUMERICA ATTRAVERSO
L’ESPANSIONE MODALE
Per la risoluzione numerica di sistemi regolati dalla (2.52), eventualmente con l’aggiunta di un
termine di smorzamento strutturale, si possono utilizzare metodi di tipo implicito od esplicito. Per
non rischiare di violare la condizione CFL (Courant-Friedrichs-Lewy) utilizzando una discretizza-
zione non sufficientemente accurata, si preferisce di solito utilizzare metodi tipo implicito rispetto a
quelli di tipo esplicito. Fra i metodi impliciti verranno preferiti quelli che sono in grado di smorzare
rapidamente le frequenze alte contenute nel problema ma la cui risoluzione non è richiesta; a questa
classe appartengono ad esempio i metodi di tipo BDF (Backward Differentiation Formula), per il
cui uso rimandiamo a quanto verrá presentato in modo generale nelle successive lezioni. Ci occupia-
mo inizialmente della sola parte meccanica, rilevando però che per la parte termica è possibile fare
discorsi analoghi a quelli che vedremo qui di seguito. È possibile ipotizzare di risolvere il sistema
in maniera algebrica, passando attraverso la trasformazione nel dominio delle frequenze con le tra-
sformate di Laplace o Fourier. Se il sitema in analisi è asintoticamente stabile, è possibile procedere
alla trasformazione secondo Fourier 9 . La soluzione diretta del problema nelle coordinate fisiche
originarie attraverso le trasformate risulta estremamente gravosa, tanto da renderla inefficiente dal
punto di vista numerico. Tale metodologia mantiene una certa validità come metodo di risoluzione
o nei casi in cui i modelli analizzati sono di piccole dimensioni, o in tutti i casi in cui è possibile
utilizzare una opportuna tecnica di riduzione dell’ordine del sistema. Utilizzare una tecnica di
riduzione significa, nel caso di un modello lineare come quello qui analizzato, andare alla ricerca
di funzioni di forma globali con le quali è possibile rappresentare correttamente la soluzione del
problema con soli pochi termini dello sviluppo (2.8). Una base spesso utilizzata, perché efficace in
moltissimi casi, è quella dei “Modi Propri”. I modi propri vengono ottenuti risolvendo il problema
omogeneo con condizioni al contorno omogenee, come gli autovettori associati alle soluzioni dell’e-
quazione caratteristica del sistema. Il metodo di soluzione quindi consiste nel costruire un primo
modello utilizzando un numero elevato di semplici funzioni di forma, spesso a supporto locale come
nel caso degli elementi finiti; su questo modello calcolare gli autovettori del sistema omogeneo; e
infine nell’utilizzare un numero ridotto di autovettori come funzioni di forma con cui riproiettare
il modello su un ridotto insieme di gradi di libertà. Il metodo può essere anche utilizzato in alcuni
casi per ottenere le soluzioni analitiche del sistema di equazioni alle derivate parziali, attraverso
l’uso della tecnica di separazione delle variabili, come si vedrà in alcuni esempi nel seguito. Il
sitema ottenuto alla fine di questo procedimento risulta di dimensioni molto contenute, ma grazie
alla elevata efficienza delle funzioni di forma, permette di risolvere efficacemente numerosi casi non
omogenei. E’ necessario quindi studiare le caratteristiche di convergenza per definire il numero
minimo di modi da utilizzare per ottenere una buona approssimazione della soluzione “esatta”.
Il problema strutturale omogeneo è il seguente
M ü + K u = 0. (3.1)
La corrispondente equazione caratteristica è pari al seguente problema generalizzato agli autovalori
ω 2 M u = K u. (3.2) mod-autov

I modi propri saranno allora gli autovettori associati agli autovalori ω 2 , soluzione del problema
(3.2), i quali possono essere riuniti in una matrice U . Possiamo allora passare nel nuovo sistema di
coordinate generalizzate modali q utilizzando la U come matrice di trasformazione, per cui u = U q.
Gli spostamenti saranno ora espressi come
s = N s (x)U q, (3.3)
9 Si noti che utilizzando un approccio energetico alla Lyapunov, detta E l’energia generalizzata, è necessario

verificare che dE
dt
< 0, ossia
M ü + C u̇ + K u = 0
1 T 1
E= u̇ M u̇ + uT Ku
2 2
dE T
“ ”
= u̇ M ü + K u = −u̇T C u̇
dt
Affinche il sistema sia asintoticamente stabile è quindi necessario che la matrice di smorzamento sia definita positiva.

19
e le nuove matrici di massa e di rigidezza generalizzate saranno diagonali (ricordando le proprietà
di ortogonalità dei modi propri)

Diag {mi } = U T M U , (3.4)


© ª
Diag {ki } = Diag mi ω02i = U T K U . (3.5)

Il nuovo sistema in coordinate modali, tenendo conto dell’eventuale presenza di uno smorzamento
proporzionale del tipo (2.36), la cui matrice caratteristica C proiettata in coordinate modali risulta
anch’essa diagonale, diviene il seguente

Diag {mi } q̈ + Diag {ci } q̇ + Diag {ki } q = U T F (t) = QF . (3.6) modal1

La matrice di rigidezza sarà singolare tante volte quanti sono i gradi di libertà non vincolati, cioè
tante volte quanti sono i moti rigidi del sistema, ossia quelli con autovalore associato nullo, ed
autovettori, detti modi rigidi, che saranno anche autovettori della sola matrice K.
La matrice delle funzioni di forma N s idealmente dovrebbe rappresentare uno sviluppo in serie
composto da infiniti termini (2.8). In realtà però se ne usa solo un numero assegnato di tali termini.
Quanto più rapidamente la serie converge tanto minore sarà il numero di termini necessari per
ottenere la soluzione con la dovuta precisione. È utile allora studiare nel dominio delle trasformate
le caratteristiche di convergenza delle serie basate sui modi propri a frequenza assegnata, in modo
da poter stabilire quanti modi n sono sufficienti a raggiungere la convergenza per un modello ad N
gradi di libertà di partenza. Il metodo è effettivamente efficiente se n ¿ N ; in tal modo è possibile
ridurre le dimensioni del modello della dinamica di un sistema continuo ad ordini di grandezza più
manipolabili.
Si ritiene che grazie alla “riduzione ad un sistema algebrico” dell’analisi resa possibile dall’uso
delle trasformate, sia più facile dimostrare le proprietà di convergenza in modo generale. Chia-
ramente si deve assicurare che siano valide tutte le condizioni necessarie affinché la convergenza
in frequenza garantisca anche quella nel tempo. Utilizzando l’analisi in frequenza, ipotizziamo
di sollecitare il sistema in analisi con delle forzanti trasformabili secondo Fourier. Si ricorda che
perché sia possibile la trasformata di Fourier della forzante F (t), definita come
Z +∞
F(ω) = F (t)e−jωt dt, (3.7)
−∞

è sufficiente che F (t) sia una composta da funzioni limitate appartenenti allo spazio L 2 , ossia tali
che
Z +∞
kF (t)k2 dt ≤ M, (3.8)
−∞

con M una costante arbitraria. In realtà questa proprietà è richiesta affinché il segnale sia anti-
trasformabile per riportarlo nel dominio del tempo. In generale noi però saremo interessati alla
anti-trasformazione della sola soluzione, la cui trasformata sarà sempre data dal prodotto della
F(ω) per la risposta in frequenza della struttura, che come vedremo, converge quadraticamente.
In questo caso sarà quindi sufficiente che la F (t) rispetti la seguente condizione
Z +∞
kF (t)kdt ≤ M, (3.9)
−∞

Scegliendo, per comoditá di notazione, di normalizzare i modi propri in modo tale che la matrice di
massa sia coincidente con la matrice unitaria (ossia ponendo come condizione di normalizzazione
l’equazione U Ti M U k = δik , con δik il simbolo di Kronecker), l’equazione (3.6) trasformata in
frequenza, considerando lo smorzamento nullo, diviene
© ª
−ω 2 q(ω) + Diag ω02i q(ω) = U T F(ω). (3.10)

Le coordinate generalizzate saranno quindi uguali a


½ ¾
1
q(ω) = Diag U T F(ω), (3.11)
ω02i − ω 2

20
e quindi per le coordinate originarie u si ottiene
½ ¾ XN
1 T U i U Ti
u(ω) = U Diag U F(ω) = F(ω). (3.12) mod-conv
ω02i − ω 2 ω2 − ω2
i=1 0i

L’ultima espressione ci dice che, i termini della serie che compongono la soluzione, a frequenza
ω assegnata, convergono come 1/ω02i , e quindi ci si può aspettare una convergenza relativamente
rapida con un numero di termini n ¿ N . Si rammenta infatti che ω0i indica il fatto che ω0 = ω0 (i),
ossia che la frequenza dei modi propri dipende da potenze dell’indice i; per cui nella (3.12) i termini
convergono almeno come 1/i2 . Inoltre, anche la forzante può contribuire ad accelerare la convergen-
za attraverso le forze generalizzate in forma modale U T F o componenti attive della sollecitazione.
Se i carichi applicati sono abbastanza regolari in termini di distribuzione spaziale, ovvero se non ci
sono carichi modellabili come forze concentrate, le corrispondenti forze generalizzate tenderanno
ad essere praticamente ortogonali ai modi ad alta frequenza, che sono invece caratterizzati da un
elevato numero di onde nello spazio, e quindi non contribuiranno significativamente alla risposta.

3.1 METODO DEI MODI DI ACCELERAZIONE


È interessante ora analizzare la convergenza delle forze elastiche, le quali possono essere utilizzate
come indicatori per studiare la convergenza dei gradienti degli spostamenti e quindi degli sforzi (o
sollecitazioni). Utilizzando gli sviluppi modali, le forze elastiche si scrivono come
½ ¾
1
K u = K U Diag U T F, (3.13) recdir
ω02i − ω 2
che rappresenta il cosiddetto recupero diretto. Ricordando che
© ª
K U = M U Diag ω02i , (3.14) recdir1

si ottiene
½ ¾
ω02i
K u = M U Diag U T F. (3.15) recdir2
ω02i − ω 2
A differenza degli spostamenti, aggiungendo termini allo sviluppo delle forze elastiche, la serie
può non convergere, a meno che i carichi non tendano ad essere abbastanza ortogonali ai modi
di vibrare ad alta frequenza. Nel caso in cui siano presenti delle azioni esterne concentrate ci si
aspetta quindi ulteriori problemi di convergenza. Inoltre, nell’espressione (3.15), compare anche un
termine inerziale, rappresentato dalla matrice di massa M ; se allora la distribuzione di massa non
è sufficientemente regolare (ovvero quando sono presenti delle masse concentrate) si possono avere
ulteriori problemi nella convergenza delle forze elastiche. Si può quindi affermare che l’approssi-
mazione modale diretta certamente non rappresenta il modo più efficiente/efficace per ottenere il
recupero degli sforzi. Esiste un’altra possibilità che in realtà è stata spesso utilizzata in maniera
naturale per ricavare le azioni interne in corsi precedenti. In Dinamica dei Sistemi ad esempio lo
studio della dinamica dei corpi veniva effettuato utilizzando l’ipotesi che i corpi in gioco fossero
rigidi. I risultati ottenuti in tal modo venivano poi utilizzati per ricostruire, a posteriori, le solle-
citazioni all’interno degli elementi, che a questo punto non erano più considerati corpi rigidi. Le
sollecitazioni venivano calcolate attraverso gli equilibri che sostanzialmente corrispondevano alla
soluzione di
K u = F − M ü, (3.16)
dove le accelerazioni ü erano quelle ottenute considerando il corpo come rigido. Dal punto di
vista modale questo corrisponde a calcolare le accelerazioni utilizzando solo i modi rigidi, che sono
quelli a frequenza più bassa (in particolare nulla), e poi utilizzarle per recuperare gli sforzi che
sollecitano la struttura, attraverso la riscrittura delle equazioni di equilibrio. Possiamo quindi
provare a utilizzare la stessa procedura utilizzando non più solo i modi rigidi ma anche un certo
numero di modi deformabili. L’espressione in frequenza diviene
µ ½ ¾ ¶
ω2 T
K u = F + ω 2 M U q = I + M U Diag U F, (3.17) modacc
ω02i − ω 2

21
Questa modalità viene di solito indicata come recupero degli sforzi attraverso i modi di accelerazio-
ne. Da quest’ultima equazione risulta che la convergenza delle forze elastiche utilizzando i modi di
accelerazione è dello stesso tipo di quella degli ottenuta per gli spostamenti, ossia del tipo 1/ω 02i .
Conseguentemente, anche le deformazioni con il metodo dei modi di accelerazione convergeranno
più rapidamente, e quindi con un minor numero di termini a parità di errore, rispetto a quanto ot-
tenuto attraverso l’uso del recupero diretto (3.12). Si ricorda inoltre che se si ottiene la convergenza
della soluzione modale per gli spostamenti, tale convergenza sarà verificata anche per le velocità e
per le accelerazioni, ottenibili moltiplicando semplicemente tutti i termini rispettivamente per jω
e −ω 2 .
Per comprendere il significato dei modi di accelerazione si può pensare di rappresentare lo spo-
stamento come sovrapposizione di due termini u = ust + udin : un termine di spostamento “statico”
ust più uno spostamento “dinamico” udin . La componente statica viene calcolata annullando tutti
i termini di derivata nel tempo, K ust (t) = F (t), che significa calcolare lo spostamento del sistema
ipotizzando che la struttura si adegui istantaneamente alla sollecitazione applicata, ossia che la
sua dinamica sia talmente veloce rispetto a quella della forzante F (t) tanto da poter trascurare la
dinamica del sistema rispetto a quella della forzante. Riscriviamo ora l’equazione della dinamica
del sistema utilizzando questa rappresentazione dello spostamento

M üst + M üdin + K ust + K udin = F (t). (3.18)

Sostituendo in questa espressione la definizione di spostamento statico

M üdin + K udin = −M K −1 F̈ (t), (3.19)

che trasformata secondo Fourier diventa

−ω 2 M udin + K udin = ω 2 M K −1 F(ω). (3.20)

Trasformando le equazioni in coordinate modali udin = U q din , si potrà ottenere la componente


dinamica dello spostamento modale come
½ ¾
ω2
q din = Diag U T M K −1 F(ω). (3.21)
ω02i − ω 2

Riportando il tutto in coordinate fisiche potremo allora scrivere lo spostamento u come


µ ½ ¾ ¶
−1 ω2 T −1
u = K + U Diag U MK F(ω). (3.22) posacc1
ω02i − ω 2

È facile utilizzando le proprietà di ortogonalità dei modi verificare che questa equazione è equivalen-
te alla (3.17). Utilizzare i modi di accelerazione quindi corrisponde ad approssimare le dinamiche
veloci del sistema in maniera “statica”, ossia come se fossero in grado di adeguarsi istantaneamente
alle variazioni di condizioni di carico sul sistema. In questo modo, considerando il fatto che in pra-
tica non si usa mai un numero infinito di termini (modi) bensı̀ un numero limitato, risulta chiaro
come si ottengano risultati migliori attraverso la tecnica dei modi di accelerazione, di quanto si
otterebbe trascurando semplicemente © leªdinamiche veloci, ossia attraverso il recupero diretto.
Sapendo che U T K U = Diag mi ω02i , invertendo le matrici si verifica facilmente che10
½ ¾
−1 1
K = U Diag UT , (3.23) kmen1
mi ω02i

per cui per normalizzazione a massa generalizzata unitaria sará


½ ¾
−1 1
K = U Diag UT . (3.24) kmen2
ω02i
n o n o
10 K U q = F , quindi U T KU q = Diag mi ω02i q = U T F che comporta u = U q = U Diag mi ω02i U T F . Essendo
u = K −1 F ne consegue la (3.23).

22
GJ, I, L
M

Dalla (3.22), sostiuendo l’espressione (3.23) si ottiene la seguente espressione per lo spostamento
recuperato con i modi di accelerazione
½ ¾ ½ ¾
ω2 T 1
u =ust + U Diag U M U Diag U T F(ω)
ω02i − ω 2 ω02i
½ ¾ (3.25) posacc2
ω2 T
=ust + U Diag U F(ω),
ω02i (ω02i − ω 2 )

che dimostra come anche lo spostamento converge molto piu’ rapidamente con i modi di accelera-
zione (1/ω04i ) rispetto al recupero diretto (1/ω02i ). Conviene quindi utilizzare l’analisi modale per
la risoluzione delle equazioni differenziali alle derivate parziali e poi utilizzare il metodo dei modi
di accelerazione se non c’ è convergenza spaziale e si vuole una convergenza più veloce.

3.2 ESEMPIO: TRAVE INCASTRATA SOGGETTA AD UNA


COPPIA TORCENTE ALL’ESTREMO LIBERO
Si consideri una trave vincolata con un incastro ad un estremo e libera all’altro, a cui all’istante
iniziale viene applicata una coppia torcente a gradino, ossia all’istante iniziale la sollecitazione
passa dal valore nullo ad un valore che viene poi mantenuto costante nel tempo. Si vuole calcolare
l’andamento della torsione θ in funzione del tempo e della posizione.
L’espressione del Principio dei Lavori Virtuali (lavoro interno = lavoro esterno) per una trave
soggetta alla sola sollecitazione torsionale è la seguente
Z L Z L Z L
Mt δθ0 dx = GJθ 0 δθ0 dx = − I θ̈δθdx + M δθ(L), (3.26) PLV-tor
0 0 0

dove GJ è la rigidezza torsionale della sezione della trave, in generale funzione della coordinata
x11 , I è il momento di inerzia polare per unità di lunghezza. Il lavoro esterno è dato dal lavoro
delle forze d’inerzia più quello della coppia applicata all’estremo libero. Integrando per parti si
ottiene
Z L Z L
L 0
[GJθ 0 δθ]0 − (GJθ 0 ) δθdx = − I θ̈δθdx + M δθ(L), (3.27) PLV-tor2
0 0

Questa espressione deve essere valida per qualunque spostamento virtuale possibile (ossia infi-
nitesimo e congruente, quindi compatibile con i vincoli), sappiamo quindi che δθ(0) = 0 a causa
del vincolo di incastro. L’arbitrarietà dello spostamento virtuale ci dice che all’equazione integrale
(3.27) corrispondono due equazioni ossia
0
(GJθ 0 ) = I θ̈, (3.28a)
0
GJθ (L) = M. (3.28b) ccnatT

Il PLV quindi, come sappiamo, contiene in sé le condizioni al contorno cosiddette naturali come
la (3.28b), che non devono essere imposte. La condizione al contorno essenziale è invece stata
imposta a priori nella formulazione integrale attraverso la scelta degli spostamenti virtuali, e va
quindi definita nel momento in cui si passa alla formulazione differenziale. Considerando per
semplicità il caso in cui la trave è omogenea e quindi le sue caratteristiche sono costanti lungo il
11 Si ricorda che la rigidezza torsionale viene convenzionalemente indicata come GJ, ma per una sezione generica

non è pari al prodotto del modulo elastico tangenziale G per il momento d’inerzia polare della sezione J. Questo è
vero solo nel caso di una trave a sezione circolare piena.

23
diff-tor-pb suo asse, si ottiene la seguente formulazione differenziale del problema

GJθ 00 = I θ̈, (3.29a) diff-tor


GJθ 0 (L) = M, (3.29b)
θ(0) = 0. (3.29c)

L’equazione di moto del sistema è un’equazione differenziale alle derivate parziali di tipo iperbolico,
equivalente alla classica equazione delle onde. Potrebbe essere risolta utilizzando la classica tecnica
alla D’Alambert per le equazioni delle onde definendo le linee caratteristiche nel dominio spazio-
temporale. Se infatti poniamo

θ = f (x ± ct),

sostituendo questa espressione nella (3.29) si ottiene

GJ f 00 = If 00 c2 ,

e quindi
r
GJ
c= .
I
Data quindi una f (x) iniziale, la soluzione è composta da due onde che viaggiano nello spazio con
velocità ±c.
È però possibile risolvere l’equazione anche attraverso l’uso della tecnica di separazione delle
variabili. Questo modo conduce naturalmente alla determinazione per via analitica dei modi di
vibrare del sistema e della soluzione come sovrapposizione delle risposte modali, e viene quindi qui
preferito per mostrare le caratteristiche dei modi. I modi di vibrare vengono ottenuti risolvendo
il problema omogeneo con condizioni al contorno anch’esse omogenee. Rappresentiamo quindi la
soluzione del problema omogeneo come

θ(x, t) = f (x)g(t). (3.30) vs1

Sostituendo nella (3.29a) si ottiene

f 00 1 g̈
= 2 , (3.31) vs2
f α g

dove α2 = GJ/I, che ricordando l’analogia con l’equazione delle onde corrisponde al quadrato della
velocità di propagazione delle onde torsionali all’interno della trave elastica (velocità del suono).
Le espressioni della (3.31) devono essere pari ad una costante (unica possibilità perché una funzione
del solo tempo sia uguale ad una funzione del solo spazio). Affinché le soluzioni del problema siano
limitate nel tempo, ossia stabili, e quindi che rispettino la fisica del problema in analisi, è necessario
che la costante sia negativa, per cui scriveremo
f 00 1 g̈
= 2 = −β 2 . (3.32) vs3
f α g
Risolviamo prima il problema spaziale

f 00 + β 2 f = 0, (3.33)

che è una equazione differenziale ordinaria lineare la cui soluzione generale è del tipo

f (x) = A sin βx + B cos βx. (3.34)

Le due condizioni al contorno della (3.29), nel caso omogeneo in cui M = 0, ci dicono che

f (0) = 0 =⇒ B = 0, (3.35)
f 0 (L) = 0 =⇒ βA cos βL = 0. (3.36)

24
La seconda condizione è soddisfatta in maniera non banale per ogni valore di beta del tipo
π
βi = (2i − 1) . (3.37)
2L
Conseguentemente, la lunghezza d’onda spaziale sarà pari a
2π 4L
λi = = . (3.38)
βi 2i − 1
La soluzione spaziale sarà allora ottenuta come sovrapposizione di tutti i termini che rispettano
tali condizioni, e quindi

X πx
f (x) = Ai sin (2i − 1) . (3.39)
i=1
2L

Ciascuna fi (x) rappresenta la forma spaziale di un modo di vibrare del sistema qui analizzato. Le
frequenze associate verranno ottenute analizzando la soluzione del problema temporale
g̈ + βi2 α2 g = 0, (3.40)
da cui si ottiene
r
π GJ
ωi = βi α = (2i − 1) . (3.41)
2L I
La velocità con cui viaggano le onde si ottiene come prodotto della lunghezza d’onda λ i per la
frequenza espressa in Hertz ωi /2π, e quindi
r
λ i ωi GJ
ci = = , (3.42)
2π I
che corrisponde esattamente al risultato che era stato ottenuto utilizzando il metodo alla d’Alam-
bert per la soluzione dell’equazione delle onde: tutte le onde torsionali viaggiano alla stessa velocità
c. Ritornando alla rappresentazione modale la soluzione generale sarà quindi del tipo

X ³ πx ´ ³ ´
θ(x, t) = Ai sin (2i − 1) Ãi sin ωi t + B̃i cos ωi t = N (x)q(t), (3.43) soltors
i=1
2L

X ³ πx ´
θ(x, t) = Ai sin (2i − 1) qi . (3.44) svil-tor
i=1
2L
Ricordando le formule di prostaferesi che dicono
1
Ai à sin βi x sin ωi t = Ai à (cos (βi x − ωi t) − cos (βi x − ωi t)) , (3.45a) prostaferesi
2
1
Ai B̃ cos βi x cos ωi t = Ai B̃ (sin (βi x + ωi t) + sin (βi x − ωi t)) , (3.45b)
2
e mettendo in evidenza il numero d’onda βi
1
Ai à sin βi x sin ωi t = Ai à (cos βi (x − ct) − cos βi (x − ct)) , (3.46a) prostaferesi2
2
1
Ai B̃ cos βi x cos ωi t = Ai B̃ (sin βi (x + ct) + sin βi (x − ct)) , (3.46b)
2
si vede come la (3.43) ottenuta attraverso la separazione di variabili corrisponde alla soluzione
ottenuta attraverso l’equazione delle onde.
È possibile ora utilizzare questo sviluppo modale per ottenere la soluzione del problema non
omogeneo di partenza. Dobbiamo peró scegliere una normalizzazione delle forme modali e quindi
decidere i fattori Ai . Se si sceglie la normalizzazione a massa unitaria si deve verificare che
Z L
N T IN dx = I. (3.47)
0

25
Dobbiamo allora imporre che per un i generico
Z L
INi2 dx = 1, (3.48)
0
Z ³
L
πx ´
A2i I sin2 (2i − 1) dx = 1. (3.49) msuni-T
0 2L
q
2
Svolgendo l’integrale (3.49) si vede che la condizione è verificata se Ai = IL . Si lascia come
esercizio il verificare che tutti gli integrali dei termini misti Ni Nj sono nulli indipendentemente
dalle ampiezze Ai dei modi (ortogonalita dei modi). Riscriviamo ora l’equazione (3.26) utilizzando
lo sviluppo (3.44). Il risultato è costituito da tante equazioni differenziali ordinarie lineari per
ciascuno dei coefficienti qi del tipo 12
r
2 i−1 2
q̈i + ωi qi = (−1) M (3.50)
IL
La soluzione del problema sarà composta dal solito integrale generale più l’integrale particolare,
quindi
r
i−1 2 M
qi = Ãi sin ωi t + B̃i cos ωi t + (−1) (3.51)
IL ωi2

A questo punto è necessario utilizzare le condizioni iniziali che sono


r
i−1 2 M
θ(x, 0) = 0 ⇒ qi (0) = 0 ⇒ B̃i + (−1) = 0,
IL ωi2
θ̇(x, 0) = 0 ⇒ q̇i (0) = 0 ⇒ Ãi = 0,

La soluzione per le q(t)i sarà quindi


r
i−1 2 M
qi (t) = (−1) (1 − cos ωi t) , (3.52)
IL ωi2

e quindi la torsione θ sarà pari a

2

X (−1)i−1 ³ πx ´
θ(x, t) = M 2 sin (2i − 1) (1 − cos ωi t) . (3.53) tor-dir
IL i=1 ωi 2L

Nel caso di recupero diretto qui sopra riportato la serie converge con potenze del tipo 1/ω 2 e quindi
come i−2 con i ∈ N. La velocità sarà ottenuta derivando rispetto al tempo 13 e quindi convergerà
come i−1 , il che unito all’alternanza di segno nei termini della serie, non garantisce la convergenza
della stessa. La situazione è anche peggiore per l’accelerazione.
Per utilizzare il metodo dei modi di accelerazione è necessario riscrivere l’equazione (3.29a)
sostituendo all’espressione della accelerazione la derivata seconda rispetto al tempo della (3.53)

2 X
∞ ³ πx ´
GJθ 00 = M (−1)i−1 sin (2i − 1) cos ωi t. (3.54)
L i=1 2L

Integrando questa espressione due volte nello spazio si ottiene

2 X ∞
(−1)i−1 ³ πx ´
θ(x, t) = − M ¡ ¢ sin (2i − 1) cos ωi t + C1 x + C2 . (3.55)
GJL i=1 (2i − 1) π 2 2L
2L
q P∞ q 2
2 π
12 (−1)i−1 δqi .
P ` ´
M δθ(L) = M ∞ i=1 IL
sin (2i − 1) 2
δq i = M i=1 IL
13 d cos ω t/dt = −ω sin ω t.
i i i

26
Utilizzando le condizioni al contorno della (3.29), si ricava facilemte che C2 = 0 e C1 = M (t)/GJ,
per cui la torsione espressa utilizzando i modi di accelerazione risulta pari a

2 X ∞
(−1)i−1 ³ πx ´ M (t)
θ(x, t) = − M ¡ ¢ 2 sin (2i − 1) cos ωi t + x, (3.56)
GJL i=0 (2i − 1) π 2L GJ
2L

che come si può notare risulta composta da un contributo dinamico più un contributo “statico”
che rappresenta la deformazione ottenuta considerando di applicare il carico esterno M (t) e di
adeguare istantaneamente la struttura al carico stesso. Si può verificare analiticamente che questa
nuova serie converge molto più rapidamente della precedente (3.53), dimostrando le capacità del
metodo dei modi di accelerazione.
Equazioni formalmente identiche al caso di semplice sollecitazione torsionale si ottengono anche
nel caso di una trave soggetta ad una sollecitazione assiale e per un filo pretensionato soggetto
ad una perturbazione, e anche per lo studio della trasmissione del calore monodimensionale. Si
lascia come esercizio lo sviluppo delle forme modali in questi casi ricordando che saranno del tutto
analoghe a quanto visto per il caso torsionale.

3.3 TRATTAMENTO DEI MOTI RIGIDI


Il recupero degli spostamenti attraverso il metodo dei modi di accelerazione, ossia attraverso l’e-
quazione (3.22), richiede l’inversione della matrice di rigidezza K. Se la struttura non è vincolata,
assieme ai modi di deformazione della struttura sono presenti i modi rigidi. In questo caso la ma-
trice K sarà singolare tante volte quanti sono i gradi di libertà non vincolati. Per risolvere questo
problema si può ricorrere all’uso di un vincolo di tipo isostatico con cui bloccare la struttura senza
alterare la soluzione del problema elastico. Questo è possibile se il carico con cui la struttura è
sollecitata è autoequilibrato, e cioè tale per cui le reazioni vincolari siano nulle. In questo modo
la soluzione diviene indipendente dalla topologia del vincolo isostatico scelto. Per ottenere una
sollecitazione autoequilibrata si dovranno applicare alla struttura le forze d’inerzia dovute alle ac-
celerazioni dei modi rigidi che andranno quindi calcolate. Un’ulteriore problema riguarda il calcolo
degli sforzi, che nei modelli ad elementi finiti si ottengono a partire dagli spostamenti. Per un
sistema libero gli spostamenti saranno composti da una componente di spostamento rigido più una
parte dovuta alla deformazione. Gli sforzi interni però non dipendono dal movimento rigido, è
quindi necessario determinare un modo per sottrarre dagli spostamenti la componente rigida. Uti-
lizzando la tecnica dei modi di accelerazione proiettiamo l’equazione di equilibrio sul sottospazio
dei soli modi rigidi
h i
U = U Rig U Def , (3.57)
U TRig K u = U TRig F − U TRig M U Rig q̈ Rig − U TRig M U Def q̈ Def . (3.58)

Sfuttando la proprietà di ortogonalità dei modi attravero la matrice di massa possiamo dire che il
termine U TRig M U Def q̈ Def = 0, e quindi, ricordando che i modi sono normalizzati a massa unitaria,
si ottiene

0 = U TRig F − Diag {mi } q̈ Rig , (3.59)


½ ¾
1
q̈ Rig = Diag U TRig F . (3.60)
mi
In questo modo si ottengono le accelerazioni per sollecitare il sistema con un sistema di carichi
autoequilibrato, e quindi analizzarlo attraverso l’uso di vincoli isostatici. Si ricorda che la scrittura
delle forme modali rigide è facilmente ottenibile partendo dalla conoscenza dei movimenti rigidi
permessi alla struttura in analisi.

3.4 CONDIZIONI INIZIALI


Assegnate delle condizioni iniziali sugli spostamenti espressi in coordinate fisiche u 0 e u̇0 , è neces-
sario determinare come tali condizioni si trasferiscono sulle coordinate modali. E’ possibile scrivere

27
che

u0 = U q 0 . (3.61) cond-ini

Questa relazione non è in generale invertibile perché la matrice U è una matrice rettangolare (il
numero di coordinate modali q è in generale molto minore del numero di coordinate fisiche u). Il
sistema di equazioni (3.61) è un sistema sovradeterminato per il quale non esiste in generale una
soluzione esatta. Una possibile soluzione può essere determinata utilizzando il metodo dei minimi
quadrati. Data una soluzione del problema q 0 , l’equazione (3.61) non sarà esattamente rispettata
per cui ci sarà un residuo ε pari a

u0 − U q 0 = ε(q 0 ). (3.62)

La soluzione ai minimi quadrati si ottiene attraverso la ricerca del minimo del funzionale
1 1³ T ´³ ´
E(q 0 ) = ε(q 0 )T ε(q 0 ) = u0 − q T0 U T u0 − U q 0 , (3.63)
2 2
che corrisponde alla condizione
∂E
= −U T u0 + U T U q 0 = 0. (3.64)
∂q 0

La condizioni iniziali ottenute minimizzando il modulo al quadrato del residuo sono quindi pari a
¡ ¢−1 T
q0 = U T U U u0 . (3.65)

Un’altra possibile soluzione si può ottenere cercando di minimizzare l’energia elastica residua, pari
a
1
Ee (q 0 ) = ε(q )T K ε(q 0 ). (3.66)
2 0
Utilizzando la medesima procedura su questo nuovo funzionale, si ottiene il seguente risultato per
le condizioni iniziali
½ ¾
¡ ¢−1 T 1
q0 = U T K U U K u0 = Diag U T K u0 . (3.67)
mi ω02i

Si puó peró constare che trasponendo la (3.14) e ricordando che le matrici di rigidezza e di massa
sono simmetriche, si avrá:
© ª
U T K = Diag ω02i U T M , (3.68)

che permetterá di scrivere:


½ ¾
1
q 0 = Diag U T M u0 . (3.69)
mi
Per le velocità iniziali si é naturalmente portati alla minimizzazione dell’energia cinetica. Pertanto:
1
Ec (q̇ 0 ) = ε(q̇ )T M ε(q̇ 0 ), (3.70)
2 0
che porta al risultato
½ ¾
¡ ¢−1 T 1
q̇ 0 = U T M U U M u̇0 = Diag U T M u̇0 . (3.71)
mi
Per motivi numerici, la matrice di massa é, specie per grandi problemi, spesso approssimata a masse
concentrate, si preferisce utilizzare la formula basata su detta matrice anche per il trasferimento
delle condizioni iniziali sulla posizione. Per quanto riguarda il caso termico non vi sono sostanziali
differenze, sostituendo alla M la matrice C T e alla K la matrice K t .

28
c
y
q

EJ, I, m, L

3.5 ESEMPIO: TRAVE SU DUE APPOGGI SOGGETTA A FLESSIO-


NE
La trave in figura è soggetta ad un carico q(x, t) distribuito e ad una coppia distribuita c(x, t);
è dotata di rigidezza flessionale EJ, lunghezza L, massa per unità di lunghezza m, momento di
inerzia per unità di lunghezza I. Il Principio dei Lavori Virtuali per il caso in esame si scrive
dicendo che
Z L Z L Z L Z L
EJy 00 δy 00 dx = qδy dx + cδy 0 dx − (mÿδy + I ÿ 0 δy 0 ) dx. (3.72) PLV-flex
0 0 0 0

Anche in questo caso il termine EJ rappresenta la rigidezza flessionale della trave che dipende dal
modo in cui è fatta la sezione e non è sempre pari al prodotto del modulo elastico E per il momento
d’inerzia della sezione J. Integrando due volte per parti si ottiene
h iL Z L
L 0 00
[EJy 00 δy 0 ]0 − (EJy 00 ) δy + (EJy 00 ) δy dx =
0 0
Z L Z L Z L Z L (3.73) PLV-flex2
L 0 0 L 0 0
= qδy dx + [cδy]0 − c δy dx − mÿδy dx − [I ÿ δy]0 + (I ÿ ) δy dx.
0 0 0 0

Per la trave appoggiata le condizioni al contorno essenziali ci dicono che y(0) = y(L) = 0, per cui
l’equazione (3.73) deve valere qualunque siano gli spostamenti virtuali δy e δy 0 , che rispettano tali
condizioni al contorno essenziali. Data l’arbitrarietà degli spostamenti virtuali si ottiene il seguente
problema differenziale per la trave appoggiata
00 0
(EJy 00 ) + mÿ − (I ÿ 0 ) = q − c0 , (3.74) eq-flex-tr
EJy 00 (0) = EJy 00 (L) = 0, (3.75)
y(0) = y(L) = 0, (3.76)

in cui le condizioni al contorno naturali che vengono fuori dal PLV ci dicono che il momento flettente
deve essere nullo ai due estremi. Nel caso in cui all’estremitá siano nulli y 0 (0) o y 0 (L), l’equazione
(3.73) ci dice che le condizioni al contorno naturali avranno una espressione del tipo
0
(EJy 00 ) = −c + I ÿ 0 . (3.77)

che sono condizioni sul taglio agli estremi.


Consideriamo ora il caso semplice di trave scarica con rigidezza EJ costante, per la quale si
può trascurare il termine legato al momento d’inerzia I, di solito infinitesimo di ordine superiore
rispetto al termine di massa. In questo caso si può verifcare facilmente che una soluzione simile a
quella utilizzata nel caso torsionale, ossia con y = f (x ± ct) non soddisfa l’equazione differenziale
(3.74). La soluzione del caso flessionale si presenta quindi di maggiore complessità.
Utilizzando la tecnica di separazione delle variabili

y(x, t) = f (x)g(t), (3.78)

che porta alle equazioni

f IV 1 g̈
= = β4, (3.79)
f −α2 g
che, come nel caso precedente devono essere pari ad una costante, in questo caso positiva per
rispettare il vincolo di stabilità della soluzione. In questo caso α 2 = EJ/m non ha le dimensioni

29
di una velocità al quadrato, bensı̀ quelle di una velocità per unità di lunghezza. Per ottenere la
velocità di propagazione delle onde flessionali dovremo moltiplicare per una lunghezza caratteri-
stica, che vedremo essere la lunghezza d’onda di ciascun modo. Il risultato è che le varie onde
a diversa frequenza viaggiano con velocità diverse, per cui un qualunque segnale composizione di
più armoniche verrà sempre sfasato durante il suo movimento all’interno della trave. L’equazione
differenziale con incognita la funzione del solo spazio f si scrive come

f IV − f β 4 = 0. (3.80)

Le radici caratteristiche di questa equazione sono quattro, due reali ±β, e due immaginarie ±jβ,
le quali danno vita ad una soluzione generale del tipo 14

f (x) = A1 sin βx + A2 cos βx + A3 e−βx + A4 eβx , (3.82)

Le condizioni al contorno ci dicono che

f (0) = 0 ⇒ A2 + A3 + A4 = 0, (3.83)
f 00 (0) = 0 ⇒ −A2 + A3 + A4 = 0, (3.84)
f (L) = A1 sin βL + A3 e−βL + A4 eβL = 0, (3.85)
00 −βL βL
f (L) = −A1 sin βL + A3 e + A4 e = 0. (3.86)

Facendo la somma delle ultime due si verifica facilmente che l’unica soluzione possibile è quella in
cui gli ultimi due termini esponenziali si sommano in modo da dare ovunque un risultato nullo,
per cui la soluzione corretta si ha per A3 = A4 = 0. Dalla prima consegue che anche A2 = 0. Con
queste condizioni la seconda equazione ci dice che A1 6= 0 solo se sin βL = 0 da cui

βi = , (3.87)
L
e la lunghezza d’onda spaziale sarà quindi pari a
2π 2L
λi = = . (3.88)
βi i
Potremo quindi scrivere la generica soluzione come sovrapposizione di modi del tipo

X iπx
y(x, t) = Ai sin qi (t). (3.89)
i=1
L
p
Per ottenere la massa modale unitaria in questo caso il fattore Ai dovrà essere pari a 2/mL. La
soluzione dell’equazione differenziale temporale

g̈ + α2 βi4 g = 0, (3.90)

è del tipo

g(t) = B1 sin ωi t + B2 cos ωi t, (3.91)

con
r r
EJ i2 π 2 EJ
ωi = βi2 = 2 . (3.92)
m L m
Anche in questo caso potremo ottenere le velocità delle singole onde armoniche come
r
ωi iπ EJ
ci = λ i = , (3.93)
2π L m
14 Spesso scritta anche utilizzando le funzioni iperboliche
f (x) = A1 sin βx + A2 cos βx + A3 sinh βx + A4 cosh βx, (3.81)
1 x 1 x
dove sinh x = 2
(e − e−x ) e cosh x = 2
(e + e−x ).

30
Ad ogni onda armonica è associata una velocità differente. Con l’avanzare del tempo nasce uno
sfasamento fra le varie onde armoniche che permettono di ricostruire la f (x) quando t = 0, il quale
genera una distorsione dell’onda stessa. Questo effetto non era presente nel caso delle onde per
il problema torsionale, perché lı̀ la velocità associata a ciascuna onda armonica era la medesima.
Utilizzando le formule di prostaferesi (Eq. (3.45a)) si può ricostrure la soluzione del problema di
tipo ondoso che in questo caso sarà caratterizzata da velocità di propagazione diverse per ciascun
coefficiente della serie di Fourier. Ritornando alla rappresentazione modale la soluzione generale
sarà quindi del tipo
r ∞
2 X iπx
y(x, t) = sin (B1 sin ωi t + B2 cos ωi t) . (3.94)
mL i=1 L
Il calcolo dei coefficienti B1 e B2 si effettua applicano le condizioni iniziali
y(x, 0) = y0 , (3.95)
ẏ(x, 0) = ẏ0 . (3.96)

3.6 CONDENSAZIONE MODALE: IL METODO DELLE POTENZE


Sino ad ora si è lasciato in sospeso il problema del calcolo di un numero limitato di modi a partire
da un modello raffinato, con uno sviluppo fatto da un numero di termini che al limite tende ad
infinito. Sfruttando infatti la buona convergenza della base modale precedentemente dimostrata,
ai fini pratici basterà risolvere il problema del calcolo di un numero finito, e relativamente piccolo,
di modi propri (autosoluzioni), che verranno poi utilizzati per l’analisi della dinamica del sistema.
È però necessario che i modi da utilizzare come funzioni di base siano calcolati con una buona
precisione, ragion per cui va immediatamente rilevata la necessità di disporre di modelli in grado
di permettere un calcolo dei modi necessari in maniera accurata; tali modelli non potranno che
essere composti da un elevato numero di termini di sviluppo (ossia di gradi di libertà). Nel caso
dei modelli ad elementi finiti, che vengono spesso utilizzati come base di partenza, il numero di
incognite può arrivare a parecchie centinaia di migliaia di equazioni nodali. Una soluzione accurata
di un problema di risposta dinamica può essere invece facilemente ottenuta con alcune centinaia,
se non decine di modi propri. Ora, se per problemi con un numero di equazioni inferiore a qualche
migliaio è spesso possibile, pratico e accettabile, utilizzando un qualunque PC, adottare i classici
metodi di utilizzo generale per il calcolo delle autosoluzioni, e.g QR, Jacobi e simili, determinando
quindi tutte le autosoluzioni per poi utilizzarne solo un numero limitato, per problemi di maggiori
dimensioni, tale approccio non risulta più praticabile, anche con l’elevata potenza computaziona-
le oggi disponibile. È pertanto necessario ricorrere a metodi che permettano il calcolo del solo
sottoautospazio (sottospazio delle autosoluzioni) desiderato, che generalmente è quello associato
alle frequenze più basse comprese nello spettro del problema. Nella maggior parte dei problemi
ingegneristici è necessario determinare la risposta dinamica a problemi con forzanti regolari, finite
e di durata limitata, o al piu tendenti ad un valore costante, il cui contenuto in frequenza, teori-
camente infinito, si può praticamente ritenere limitato. Si ricordi che il comportamento asintotico
delle trasformate in frequenza è del tipo 1/ω n+1 , dove n è l’ordine di continuità della forzante
temporale. È possibile quindi utilizzare modelli composti da un numero limitato di modi propri,
quelli a frequenza piú bassa, proprio grazie al fatto che i modi ad alta frequenza non partecipano
significativamente alla risposta, se non per la loro parte statica recuperabile, come visto, tramite
il metodo dei modi di accelerazione. Si noti infine che, nel caso di sistemi lineari, non è di alcun
interesse il calcolo della risposta del sistema quando questi sono instabili mentre, nel caso siano
stabili, non è di alcun interesse la ricerca di soluzioni per forzanti di durata infinita e crescenti nel
tempo, in quanto tali soluzioni comportano di fatto o l’insorgenza di un fenomeno di “rottura” delle
componenti strutturali del sistema, o soluzioni di nessun interesse, o l’invalidazione delle ipotesi di
linearità e l’intervento di fenomeni non lineari che modificano la natura del modello.
Il metodo di base che si presta alle necessità di calcolare un numero ridotto di autosoluzioni è
il metodo delle potenze. Per il problema agli autovalori espresso in forma canonica A x = λx, tale
metodo permette di calcolare l’autovalore di modulo massimo. Partendo da un vettore iniziale di
tentativo z (0) arbitrario, si costruisce la successione
z (k+1) = A z (k) ⇒ z (k) = Ak z (0) . (3.97)

31
Se utilizziamo gli autovettori di A come una base dello spazio Rn , possiamo scrivere z (0) come
combinazione lineare degli elementi di tale base
n
X
z (0) = α j xj , (3.98)
j=1

e quindi, ricordando che Ax = λx ⇒ Ak x = λk x


n
X n
X
(k) k
z = α j A xj = αj λkj xj . (3.99)
j=1 j=1

Se chiamiamo λ1 l’autovalore di modulo massimo, possiamo quindi scrivere che


 
Xn µ ¶k
λ j
z (k) = λk1 α1 x1 + αj xj  , (3.100) met-pot
j=2
λ1

da cui si vede che la successione z (k) per k → ∞ si allinea lungo la direzione del primo autovettore
x1 , a meno che il vettore iniziale di tentativo z (k) non sia ortogonale al primo autovettore, ossia
tale per cui α1 = 0. La (3.100) ci dice anche che la velocità di convergenza della successione al
valore desiderato dipende dal rapporto λ2 /λ1 . Tanto più il primo autovettore è ben separato dagli
altri, tanto più rapida sarà la convergenza. In ogni caso il metodo delle potenze opera come un
filtro “passa alto”, perché tende a far emergere la parte alta dello spettro della matrice A. Il calcolo
dell’autovalore viene effettuato utilizzando il rapporto

|z (k+1) | λk+1
1 α1 |x1 |
(k)
≈ k
= λ1 . (3.101)
|z | λ1 α1 |x1 |
Le proprietà del metodo delle potenze non dipendono in alcun modo dal fatto che la matrice A
sia o meno simmetrica o a coefficienti reali o immaginari. Se si è interessati agli autovalori di
modulo minimo, si utilizza il metodo delle potenze inverse ossia il metodo delle potenze applicato
alla matrice A−1 . In questo caso

1
A−1 x = x, (3.102)
λ
e quindi
µ ¶k
1
lim z (k) = αn xn , (3.103) conv-potenz
k→∞ λn
dove λn è l’autovalore più piccolo. Nel caso dei modi propri di vibrare di una struttura il problema
agli autovalori da risolvere è il seguente

ω 2 M u = K u. (3.104) pot-str

Essendo qui interessati agli autovalori di modulo minimo, utilizziamo il metodo delle potenze
inverse, e quindi riscriviamo la (3.104) nella forma
1
Mu= K u, (3.105)
ω2
Ricordiamo che la matrice di rigidezza è simmetrica definita o semidefinita positiva, mentre la
matrice di massa, generalmente definita positiva, può essere consistente (cioè ottenuta utilizzando
lo stesso sviluppo completo adottato per la matrice di rigidezza), oppure resa diagonale tramite
un’opportuna concentrazione delle masse, cosa possibile per mancanza di ogni derivazione spaziale
nell’integrale che la determina. Si è detto che la matrice di massa è generalmente, cioè non sempre,
definita positiva. Essendo l’energia cinetica intrinsecamente una quantità positiva per qualunque
atto di moto, la mancata definizione positiva della matrice di massa può essere associata solamente

32
all’uso di particolari schemi con matrici di massa concentrate non consistenti. Tali matrici si
ritrovano spesso in modelli con elevati gradi di libertà in cui ci si accontenta di approssimare il
sistema utilizzando solo le masse traslazionali, anche in presenza di gradi di libertà di rotazione. Va
da sè che la mancata definizione positiva della matrice di massa altro non implica che la possibilità
di recuperare una parte dei gradi di liberta per la sola via statica. Potremo infatti scrivere
· ¸½ ¾ · ¸½ ¾
M 0 x¨d K dd K ds xd
+ =0 (3.106)
0 0 x¨s K sd K ss xs

da cui è possibilie ricavare, senza alcuna approssimazione ulteriore

xs = −K −1
ss
K sd xd , (3.107)

riducendo il problema a
³ ´
M x¨d + K dd − K ds K −1
ss
K sd
xd = 0, (3.108)

dove la matrice di massa è definita positiva.


Assumendo dapprima che la matrice K sia definita positiva, il metodo delle potenze applicato
al problema in esame diviene
1
K −1 M u = u, (3.109) pot-str2
ω2
z (k+1) = K −1 M z (k) . (3.110)

È importante rilevare che l’iterazione viene applicata in più passi, moltiplicando prima M per
z (k) , e poi risolvendo il sistema lineare K z (k+1) = M z (k) . L’uso di K −1 nella (3.109) è fatto solo
per sinteticità formale e corrisponde in pratica a fattorizzare la matrice K stessa, con l’agoritmo
di Cholesky o LDL (stabili anche senza pivotaggio) una volta per tutte, per poi eseguire i passi
avanti e indietro della soluzione sui termini noti via via disponibili ad ogni iterazione. Si rileva
qui una ragione per l’utilizzo di masse condensate per migliorare l’efficienza di calcolo senza, dato
l’elevato(issimo) numero di gradi di libertà, intaccare significativamente la bontà della soluzione;
con tali matrici difatti il costo del prodotto M z (k) si riduce significativamente.
Come già visto, nel caso di strutture libere, o contenenti cinematismi, la matrice inversa della
matrice K non esiste perché la matrice è semi-definita, infatti ci saranno tanti autovalori nulli quanti
sono i modi liberi rigidi. Per un velivolo libero, ad esempio, ci saranno 6 autovalori coincidenti a
zero15 , che rappresentano i modi rigidi del velivolo, piú tanti altri per quante sono le superfici di
comando (se non vengono bloccate). Un modo pratico per ovviare a tale problema nella ricerca
numerica dei modi è quello di applicare un cambio di origine degli autovalori in questo modo

(ω 2 + α)M u = (K + αM )u, (3.111)


2
ω̄ M u = K̄ u (3.112)

con α > 0 per non rendere la matrice K̄ definita negativa, la quale quindi non è più semi-definita.
Per ragioni numeriche sarà anche opportuno che tale valore sia approssimativamente dell’ordine
dell’autovalore minimo non rigido. Una tecnica analoga, ma con α negativo, può essere utilizzata
per portare ad una migliore separazione delle frequenze proprie, ma non verrà qui perseguita in
quanto inefficiente perché richiede una non facile decisione sul valore di spostamento dell’origine e su
quando vada applicato, aggravata dal costo di dover rifattorizzare la matrice K̄ ad ogni iterazione.
Per il caso termico il problema agli autovalori si scrive come

λC T θ = K T θ. (3.113)

Anche in questo caso essendo interessati solo agli autovalori di modulo minimo, si utilizzerà il
metodo delle potenze inverse sul problema
1
CT θ = K θ. (3.114)
λ T
15 Molteplicita algebrica e geometrica saranno però coincidenti e quindi il sistema sarà ancora diagonalizzabile.

33
Si ricordi che se le matrici del sistema sono simmetriche e definite positive, eventualmente semide-
finita positiva la K, come quelle di cui sopra, gli autovalori, a parte quelli relativi ai modi rigidi,
saranno reali e positivi. Inoltre se multipli porteranno ad una corrispondente molteplicità degli
autovettori. Perciò tali matrici saranno sempre diagonalizzabili. Se invece le matrici non sono sim-
metriche, come nel caso termoelastico integrato, non è garantito che ad autovalori multipli siano
associati autovettori di pari molteplicità (cioè la molteplicità algebrica potrà essere maggiore di
quella geometrica). L’impossibilità di calcolare tutti gli autovettori rende le matrici non diago-
nalizzabili. In questi casi ci si può ancora ridurre ad una rappresentrazione “minima” che non è
perfettamente diagonale e che conterrà dei sotto-blocchi a cavallo della diagonale del tipo
 
λ 1 0 ... 0
0 λ 1 . . . 0
 
 .. .. .. . . ..  (3.115)
. . . . .
0 0 0 ... λ

La matrice risultante “quasi diagonale” viene detta forma di Jordan.


Il metodo delle potenze calcola un solo autovalore, perciò si deve ricorrere ad una qualche tecnica
di deflazione per calcolare i successivi. Per fare questo, noto il primo autovettore x1 , si parte da un
vettore iniziale di tentativo z 2 e dalla considerazione che gli autovettori sono ortogonali attraverso
la matrice di massa16 e quindi x2 M x1 = 0. Ad ogni iterazione del metodo delle potenze si proietta
(k+1)
il nuovo vettore z 2 in modo da ottenere un vettore che sia sempre ortogonale all’autovettore
x1 , ossia

(k+1) T (k) T
z2 = z2 − αx1 T , (3.116)
(k+1) T (k) T
z2 M x1 = z2 M x1 − αxT1 M x1 , (3.117)
(k) T
z2 M x1
α= . (3.118)
xT1 M x1

Tale procedimento va applicato ad ogni passo, o comunque dopo un certo numero ridotto di passi,
perché spesso gli errori numerici di arrotondamento possono rendere non perfetta l’ortogonalità.
L’algoritmo non è niente altro che una estensione, modificata, del classico metodo di ortogonaliz-
zazione di Graham-Schmidt, e si estende facilmente al calcolo dell’autosoluzione n + 1 una volta
disponibili le prime n.
Nel caso non simmetrico, quale quello che occorrerebbe risolvere se si volesse arrivare ad una
condensazione modale del modello termoelastico accoppiato, non si possono utilizzare le proprietà
di ortogonalità del caso simmetrico 17 ma si possono recuperare proprietá analoghe utilizzando le
autosoluzione sinistre, cioé quelle associate al problema

AT y = λy. (3.119) autv-sin

La denominazione “sinistri” si riferisce al fatto che il problema (3.119), può essere riformulato come
y T A = λy T , cioè senza trasporre la matrice e utilizzando dei vettori riga, che però adesso sono a
sinistra della matrice A. I due problemi

A x = λx, (3.120)
T
A y = λy, (3.121)

posseggono i medesimi autovalori, perciò moltiplicando la prima equazione per y T , la seconda per
x e facendo la differenza delle due si dimostra che per autovalori distinti gli autovettori sinistri sono
ortogonali a quelli destri, sia fra di loro che rispetto alla matrice A. A tutti gli effetti si possono
16Lo sono anche rispetto alla matrice di rigidezza, ma se la massa è diagonale i calcoli risultano più rapidi.
ricorda che nel caso di matrice A simmetrca la matrice diagonale degli autovalori è pari a Λ = X T A X,
17 Si

mentre nei casi generali Λ = X −1 A X, ossia per il caso simmetrico la matrice degli autovettori è ortogonale e quindi
X −1 = X T .

34
quindi utilizzare i trasposti di tali vettori laddove verrebbero utilizzati i trasposti degli autovettori
del problema simmetrico, che sono ovviamente sia destri che sinistri. Assumiamo qui che il sistema
sia diagonalizzabile cosı̀ che, nel caso fosse possibile calcolare tutte le autosoluzioni sinistre, è
chiaro che la corrispondente matrice trasporta altro non sarebbe che l’inversa della matrice degli
autovettori destri, ossia Y T = X −1 e viceversa Y −1 = X T . Pertanto la conoscenza degli autovettori
sinistri corrispondenti al sottospazio degli autovettori destri di interesse permette di determinare
il pezzo dell’inversa della matrice degli autovettori necessaria ad ottenere la trasformazione di
similarità richiesta per la condensazione di un sistema dinamico non simmetrico. È evidente come
sia molto meno costoso calcolare un sottoinsieme di autovettori destri e i corrispondenti autovettori
sinistri piuttosto che fare il calcolo della matrice completa degli autovettori destri e poi invertirla
per ottenere gli autovettori sinistri che ortogonalizzano il problema nel sottospazio di interesse. È
quindi di fondamentale importanza utilizzare una doppia iterazione con il metodo delle potenze,
una per il sottospazio destro, e una per il sottospazio sinistro
(k+1) (k)
zd = A−1 z d , (3.122)
−T
z (k+1)
s =A z (k)
s . (3.123)

Le proprietà di convergenza e la necessità di separazione saranno le stesse per entrambi i proble-


mi, mentre le formule per l’ortogonalizzazione necessaria al fine di calcolare delle autosoluzioni
successive alla prima, per il caso degli autovettori saranno
(k+1) T (k) T
zd = zd − α d x1 T , (3.124)
(k+1) T (k) T
zd y1 = zd y 1 − αd xT1 y 1 , (3.125)
(k) T
zd y1
αd = , (3.126)
xT1 y 1
T T
z (k+1)
s = z (k)
s − αs y 1 T , (3.127)
T T
z (k+1)
s x1 = z (k)
s x1 − αs y T1 x1 , (3.128)
(k) T
z s x1
αs = , (3.129)
y T1 x1
(3.130)

3.7 METODO DELLE POTENZE A BLOCCHI


Come già rilevato nel calcolo dei modi propri è tuttaltro che raro trovare autovalori vicini o addirit-
tura coincidenti; senza pensare al già citato caso dei modi rigidi, si pensi semplicemente a casi per
cui si sia in presenza di simmetrie geometriche, inerziali o elastiche. In questi casi il metodo delle
potenze cosı̀ come è stato presentato sembrerebbe di scarsa utilità pratica. Come già accennato,
in passato si utilizzavano tecniche di cambiamento dell’origine, per portare ad una separazione dei
modi una volta raggiunta la convergenza sul sottospazio dei modi vicini. Tale tecnica è però assai
onerosa in quanto richiede ripetute rifattorizzazioni della matrice K − αM , che deve anche essere
assoggettata a tecniche di pivoting per garantirne la stabilità numerica non essendo più definita
positiva. Si preferisce quindi utilizzare altre tecniche che sono venute evolvendosi in modi nume-
ricamente raffinati con codici liberi, altamente efficienti e facilmente reperibili, in rete. Molti di
questi metodi iterativi appartengono alla classe dei motodi ai sottospazi di Krylov, fra cui ricor-
diamo il metodo di Arnoldi, di Lanczos, semplice e a blocchi, come i più diffusi. Noi presenteremo
qui un metodo più classico, ossia il metodo delle potenze a blocchi o iterazione su sottospazi (detto
anche Stodola/Vianello a blocchi), attualmente un po’ meno “di moda” di un tempo ma comun-
que numericamente assai efficiente e stabile, facilmente utilizzabile anche per la condensazione di
problemi non simmetrici e di sicura validità. Tale metodo risulta comunque propedeutico anche
per gli altri metodi più sofisticati sopra citati 18 . Il metodo delle potenze a blocchi permette di
18 Si rimanda il lettore interessato all’esaustivo testo: Y. Saad. Numerical Methods for Large Eigenvalue Problems.

Manchester University Press. 1992.

35
estendere il calcolo effettuato con il metodo delle potenze, a tutti gli autovettori/autovalori che si
vogliono calcolare sostituendo all’espressione vettoriale

u(k+1) = K −1 M u(k) , (3.131)

l’espressione matriciale

U (k+1) = K −1 M U (k) , (3.132) pot-blok

in cui la matrice U di partenza può essere scelta arbitrariamente, purché al solito non manchi
di componenti nel sottospazio degli autovettori che si vogliono determinare. La matrice U (k+1)
non potrà che arricchirsi sempre piú del sottospazio corrispondente allo spettro di bassa frequenza
d’interesse, grazie alle caratteristiche filtranti del metodo delle potenze evidenziate dalla (3.103).
Al fine di garantire anche la corretta proiezione sui corrispondenti autovettori, e non solo il rag-
giungimento di una base di bassa frequenza, introduciamo il coefficiente di Rayleigh, che esprime
il rapporto tra l’energia elastica e un parente di quella cinetica 19
uT K u
λR = . (3.133) Rayl
uT M u

È facile vedere che se al posto di un vettore u generico si inserisce un autovettore x, il coefficiente


di Rayleigh diviene pari a ω 2 , ossia l’autovalore corrispondente (moltiplicando l’equazione (3.104)
per l’atovettore trasposto). Il valore di questo coefficiente nell’intorno di un autovettore gode di
una interessante proprietá che andiamo a determinare operativamente. Se si definisce un vettore u
costituito dall’autovettore x in esame più una piccola perturbazione, che possiamo rappresentare
come una combinazione lineare delle colonne della matrice di tutti gli autovettori meno x, che
chiameremo X. Si ha quindi che u = X α + x, con α un vettore di coefficienti adeguatamente
piccoli. Il coefficiente di Rayleigh calcolato per u diventa

xT K x + 2xT K X α + αT X T K X α xT K x + αT Diag {ki } α


λR = T
= , (3.134)
xT M x + 2xT M X α + αT X M X α xT M x + αT Diag {mi } α

in cui il doppio prodotto è nullo per l’ortogonalità tra gli autovettori rispetto alle matrici di massa
e rigidezza. Pertanto, risultando dipendente dalla sola variazione quadratica, il coefficiente di
Rayleigh è stazionario in prossimità di un autovettore. Difatti
à !
1 ¡ T T
¢ αT Diag {mi } α xT M x
λR ≈ T x K x + α Diag {ki } α 1 − = + O(|α|2 ) (3.135)
x Mx xT M x xT K x

da cui si vede che non ci sono termini lineari in α e che quindi, a meno di infinitesimi di ordine
superiore, il gradiente ∂λ
∂α è nullo e quindi λR è stazionario nell’intorno di una forma modale. Que-
R

sto spiega perché, anche a partire da forme modali approssimate con errori significativi, attraverso
il coefficiente di Rayleigh, si ottengono errori piccoli sul valore dell’autovalore. Il coefficiente di
Rayleigh ci permette anche di valutare la sensibilità di una certa frequenza relativa ad una forma
modale per piccole variazioni della matrice di massa o di rigidezza. Difatti esso ci dice anche che
se la forma modale cambia significativamente la frequenza relativa si sposta di poco.
Essendo ragionevole supporre che ci siano zone di separazione fra le frequenze proprie, l’uso
delle iterazioni a blocchi del tipo (3.132), grazie alle proprietà di filtraggio del metodo delle potenze,
farà emergere il sottospazio degli autovettori cercati. Ciascuna delle colonne del blocco U (k) che
emergerà non sarà però pari ad un autovettore, bensı̀ una combinazione lineare dei modi che fanno
parte della sottospazio che si vuole far emergere: il metodo non separa i modi. Per separarli utiliz-
ziamo il coefficiente di Rayleigh. Se infatti diciamo che il generico modo proprio sia rappresentabile
come u = U (k) α = U α

uT K u αT U T K U α αT K̃ α
λR = = = . (3.136)
uT M u αT U T M U α αT M̃ α
19 Asserto sbagliato dimensionalmente ma utile come promemoria.

36
Al procedere delle iterazioni la matrice U tende ad essere sempre di più la matrice delle forme
modali e le matrici K̃ e M̃ saranno sempre più simili a matrici diagonali. Sfuttuando ancora una
volta la stazionarietà del coefficiente di Rayleigh possiamo scrivere che

∂λR K̃ α αT M̃ α − αT K̃ α M̃ α
= ³ ´2 = 0, (3.137)
∂α
αT M̃ α
αT K̃ α
K̃ α − M̃ α
∂λR αT M̃ α
= = 0, (3.138)
∂α αT M̃ α
∂λR K̃ α − λR M̃ α
= = 0, (3.139)
∂α αT M̃ α
da cui si ottiene il cosiddetto problema agli autovalori ridotto
K̃ α = λR M̃ α (3.140)
Determinati gli autovettori di questo problema αv , che ricordiamo è di dimensioni ridotte rispetto
al problema originario, potremo ottenere i modi propri del problema originario come
X = U (k) αv . (3.141)

Il metodo di Stodola/Vianello consiste quindi nei seguenti passi: 1) scelta della base iniziale U (0) ; 2)
applicazione di uno o più passi del metodo delle potenze a blocchi, solitamente uno solo; 3) calcolo
della matrici K̃ e M̃ , dei coefficienti di Rayleigh e risoluzione del problema agli autovalori ridotto; 4)
rivalutazione della base in modo che U (k+1) = U (k+1) αv . Si continua ad iterare finché le matrici K̃
e M̃ non sono sufficientemente diagonali. È utile rilevare che il numero di termini da utilizzare per
l’iterazione a blocchi dovrà essere in numero leggermente più elevato delle autosoluzioni richieste.
Una regola empirica spesso utilizzata consiste nel raddoppiare il numero richiesto se inferiore a venti
mentre per sottospazi più ampi si raggiunge il doppio del raggruppamento di autovalori più vicini
al sottospazio di interesse, e in mancanza di informazioni si sceglie un numero fra dieci e venti. Tali
considerazioni sono di massima e vanno utilizzate con un po’ di cautela. Allo scopo di poter valutare
se non si è persa alcuna autosoluzione del sottospazio di interesse si richiama, senza dimostrazione e
per il solo caso simmetrico, il metodo di Sturm. Esso permette di effettuare tale verifica e consiste
nel valutare la fattorizzazione LDL della matrice (K − ω̄ 2 M ) dopodiché il numero di termini
minori di zero della matrice diagonale D corrisponde al numero di frequenze proprie minori di ω̄.
Naturalmente tale tecnica si può applicare a priori, per determinare il numero di autosoluzioni
necessarie, o a posteriori per verificare che non si siano perse soluzioni nell’iterazione a blocchi. In
realtà sarebbe meglio utilizzarla sia prima che dopo ma va rilevato che tale operazione ha un costo
computazionale percentualmente rilevante rispetto al calcolo delle autosoluzioni richieste.
Nel caso di matrici non simmetriche la definizione del coefficiente di Rayleigh necessita degli
autovettori sinistri ed è la seguente
yT A x
λR = , (3.142)
yT x
per cui grazie all’ortogonalità degli autovettori sinistri rispetto ai destri viene mantenuta la proprie-
tà di stazionarietà. In questo casi quindi verranno risolti ad ogni passo due metodi delle potenze
a blocchi
X (k+1) = A−1 X (k) , (3.143)
(k+1) −T (k)
Y =A Y . (3.144)

Il generico modo x = X (k) αd e y = Y (k) αs , per cui il coefficiente di Rayleigh si scrive come

yT A x αTs Y T A X αd αTs à αd
λR = = = , (3.145)
yT x αTs Y T X αd αTs Ĩ αd

37
dove Ĩ è una matrice che approssiama la matrice unità. Scivendo la stazionarietà rispetto ad α s si
ottiene il problema ridotto destro

à αd = λR Ĩ αd , (3.146)

mentre la stazionarietà rispetto ad αd fornisce il problema ridotto sinistro

αTs à = λR αTs Ĩ, (3.147)

pari a
T T
à αs = λR Ĩ αs . (3.148)

Questi due problemi ridotti verranno utilizzati per aggiornare le due basi ad ogni passo.
Come dovrebbe apparire da quanto presentato, le stesse considerazioni valgono per la parte
termica, previa opportuna sostituzione delle matrici di massa e rigidezza con le matrici di capacità
e conduzione termica. Il problema risulterà però simmetrico solo in assenza dello Jacobiano dei
termini radianti, in generale non lineare, anche se la matrice di radiazione è simmetrica, per la
presenza dei termini 4T̃ 3 . La condensazione nel caso termoelastico può avvenire sia attraverso
un doppio calcolo modale distinto della parte elastomeccanica e di quella termica, generalmente
utilizzato nel caso in cui anche il problema delle autosoluzioni termiche è simmetrico, sia attraverso
la risoluzione di un problema agli autovalori non simmetrico unificato termoelastodinamico.

38
4 ESTENSIONE DEI MODELLI PER ELEMENTI
STRUTTURALI
4.1 MODELLI A PIASTRE
Le piastre sono degli elementi strutturali per cui una delle tre dimensioni, lo spessore t, risul-
ta molto minore delle altre due, che invece definiscono il piano caratteristico della piastra. Lo
spessore dell’elemento risulta comunque sufficiente a fornire le capacità di sopportare sollecitazioni
flessionali significative. In questo caso se gli spostamenti elastici in direzione normale al piano della
piastra sono abbastanza piccoli rispetto allo spessore t, i valori degli sforzi normali si annullano in
corrispondenza del piano medio della piastra, essendo essi dovuti sostanzialmente alla sola flessione.
Se la piastra è molto sottile, e quindi non in grado di resistere significativamente a sollecitazioni
flessionali, si ottiene un comportamento che corrisponde a quello di una membrana, per cui gli
spostamenti nella direzione normale al piano della piastra sono paragonabili allo spessore t e gli
sforzi in corrispondenza del piano medio non sono più nulli. Sono infatti tali sforzi che permettono
all’elemento strutturale di equilibrare i carichi applicati attraverso spostamenti trasversali. La rigi-
dezza manifestata dalle membrane è quindi legata alla tensione che in essa si genera, e il problema
va quindi trattato in maniera non lineare. Ovviamente un modello completo non lineare di piastra
può essere in grado di trattare entrambi i fenomeni in maniera congiunta. Nel modello semplificato
che andiamo ora a sviluppare si riterranno poco significative, anche se non nulle, le deformazioni
nella direzione perpendicolare al piano caratteristico della piastra. Dal punto di vista energetico
tali deformazioni, coniugate allo sforzo trasversale normale, contribuiscono in maniera poco signifi-
cativa all’energia di deformazione, in considerazione del fatto che per carichi trasversali distribuiti
gli sforzi traversali sono abbastanza piccoli. Basti infatti notare che un carico distributo di 1 MPa
sarebbe un carico rilevantissimo per la piastra; localmente però essa sarebbe sollecitata a taglio con
un carico che non corrisponde neanche all’1% degli sforzi elastici tipici delle comuni leghe leggere
a base di alluminio. Data poi l’esiguità dello spessore t, tale carico darà origine a sforzi trasversali
altrettanto esigui. Per i casi in cui si sia in presenza di carichi concentrati varranno, ai fini del
comportamento globale, considerazioni analoghe a quelle fatte nella teoria delle travi alla De Saint
Venant: le soluzioni ottenute con questa teoria varranno oltre una certa distanza di diffusione dal
punto di applicazione del carico concentrato. Per la determinazione degli effetti locali non ci si
potrà esimere dalla ricerca di soluzioni complete tridimensionali del problema elastico strutturale.
Potremo quindi in generale affermare che lo stato di sforzo nei vari strati della piastra sarà quindi
essenzialmente piano. In considerazione della trascurabile incidenza degli sforzi/deformazioni tra-
versali in spessore, si potrà correttamente ritenere lo spessore indeformabile, senza però assumere
le relazioni costitutive corrispondenti ad uno stato piano di deformazione.

z y

Il piccolo spessore fa si che le deformazioni dovute alla flessione siano di gran lunga prevalenti
rispetto a quelle a taglio che si possono invece trascurare. Anche per questi elementi quindi si
può considerare valida l’ipotesi di Kirchhoff o della conservazione delle normali, già utilizzata nel
caso delle travi. Tale ipotesi afferma che le sezioni piane normali al piano medio indeformato della
piastra, rimangono piane e normali al piano medio anche nella posizione deformata, non è quindi
presente ingobbamento dovuto a taglio o torsione.
Introducendo un sistema di riferimento cartesiano ortogonale con assi x e y giacenti nel piano
della piastra e z normale a questo, e chiamiamo w lo spostamento verticale. Le ipotesi di compor-
tamento di tipo piastra sopra illustrate ci dicono che i punti del piano medio si muovono solo in
direzione normale al piano stesso e gli altri punti subiscono degli spostamenti dovuti alle rotazioni

39
delle sezioni normali al piano medio. Si possono quindi scrivere le seguenti relazioni relative al
spost-pia campo di spostamento tridimensionale nell’intero volume della piastra
∂w
sx = −z , (4.1a)
∂x
∂w
sy = −z , (4.1b)
∂y
sz = w(x, y). (4.1c)

La piastra è soggetta ad uno stato di sforzo piano, per cui σx 6= 0, σy 6= 0 e σz = 0. Passando alle
deformazioni, l’ipotesi di Kirchhoff ci dice che gli scorrimenti γxz e γyz sono nulli. È facile infatti
vedere che,
¡ ricordando¢ le relazioni fra spostamenti e deformazioni nel caso di piccoli spostamenti
εik = 12 si/k + sk/i , le relazioni (4.1) portano a

∂sx ∂sz ∂w ∂w
γxz = 2εxz = + =− + = 0, (4.2)
∂z ∂x ∂x ∂x
∂sy ∂sz ∂w ∂w
γyz = 2εyz = + =− + = 0. (4.3)
∂z ∂y ∂y ∂y
Le deformazioni in direzione z è trascurabile e non gioca nessun ruolo nella determinazione del-
l’equilibrio o dell’energia di deformazione, a causa del valore trascurabile dei corrispondenti sforzi
σz ; εz è ottenibile a posteriori tenendo conto della legge costitutiva tridimensionale. Si può quindi
verificare che per le piastre varranno le seguenti relazioni

∂2w
εx = −z , (4.4)
∂x2
∂2w
εy = −z 2 , (4.5)
∂y
∂sx ∂sy ∂2w
γxy = + = −2z . (4.6)
∂y ∂x ∂x∂y
Per comodità si possono definire i seguenti vettori di sforzo e deformazione
½ ¾T
∂2w ∂2w ∂2w
ε̂ = − 2
− 2
−2 , (4.7)
∂x ∂y ∂x∂y
T
ε = {εx εy γxy } = zε̂, (4.8)
T
σ = {σx σy τxy } . (4.9)

Nel caso generale di una legge costitutiva ortotropa scriveremo che

σx = Ex εx + Exy εy , (4.10)
σy = Exy εx + Ey εy , (4.11)
τxy = Gxy γxy , (4.12)

che in forma matriciale corrisponde a scrivere


 
Ex Exy 0
σ = Exy Ey 0  ε = D ε. (4.13)
0 0 Gxy

Nel caso particolare di un materiale isotropo si ricorda che Ex = Ey = E/(1 − ν 2 ), Exy = νEx e
Gxy = 12 E/(1 + ν), e quindi
 
1 ν 0
E   ε = D ε.
σ= ν 1 0 (4.14)
1 − ν2 1
0 0 2 (1 − ν)

40
Casi più generali di legami costitutivi che accoppiano tutti i termini dei vettori di sforzo e di
deformazione si possono ottenere nel caso di piastre formate da vari strati di materiale composito
diversamente orientato.
Definiti i vettori di sforzo e di deformazione e il loro legame, è ora possibile scrivere il termine
legato all’energia elastica del Principio dei Lavori Virtuali nella solita forma tridimensionale del-
l’equazione linearizzata (2.17)da cui poi ricavare la corrispondente espressione bidimensionale per
le piastre, in funzione delle deformazioni su definite ε
Z Z Z µZ ¶ Z
T T
δε σ dv = δε D εdv = δε̂ T
z D dz ε̂ da = δε̂T D
2 b ε̂da. (4.15) plv-pia
v v a t a

b sarà quindi semplicemente pari a


Nel caso di un materiale generico la matrice di flessibilità D
Z t
2
b =
D z 2 D dz, (4.16)
− 2t

mentre per un materiale omogeneo e isotropo si ottiene


3
b = t D.
D (4.17)
12
Avendo definito le deformazioni generalizzate ε della piastra alla Kirchhoff come associate alle
2 2
∂2w
curvature ( ∂∂xw2 e ∂∂yw2 ) e alla torsione ( ∂x∂y ), risulta ora utile determinare quali sono i corrispondenti
sforzi generalizzati, cioè quelli coniugati alle deformazioni generalizzate in termini energetici, e
quindi ottenibili applicando la D b al vettore ε̂. Per capirlo riscriviamo il P.L.V. senza utilizzare da
subito la relazione costitutiva
Z Z ½ 2 ¾ Z µZ ¶
T ∂ w ∂2w ∂2w T
δε σ dv = δ − 2 − −2 zσ dv = δε̂ zσdz da. (4.18) plv-pia2
v v ∂x ∂y 2 ∂x∂y a t

Integrando il vettore degli sforzi per la distanza dal piano medio lungo lo spessore si ottengono i
momenti per unità di lunghezza, o flussi di momento
   
Z 2t  σx   Mx 
z σy dz = My =M c. (4.19)
− 2t τ  
Mxy

xy

Mx ed My sono flussi di momento flettente mentre Mxy è un flusso di momento torcente.


Uguagliando le due espressioni ottenute dalla (4.15) e dalla (4.18) si ha
c=D
M b ε̂, (4.20)

che per un materiale omogeneo e isotropo diviene


 
    ∂2w

 Mx  3 1 ν 0 
 ∂x2 

Et ν  ∂2w
My =− 1 0 ∂y 2
. (4.21)
  12(1 − ν 2 ) 1 
 

Mxy 0 0 2 (1 − ν)  ∂2w 
2 ∂x∂y

Come nel caso delle travi con l’ipotesi di Kirchhoff anche in questo caso è possibile recuperare le
azioni di taglio per unità di lunghezza dalle relazioni di equilibrio. Se consideriamo un elemento
di piastra di dimensioni dx, dy l’equilibrio alla rotazione intorno ad una sezione normale ad x dice
che
µ ¶ µ ¶
∂Mx ∂Mxy
Tx dxdy = Mx + dx dy − Mx dy + Mxy + dy dx − Mxy dx, (4.22)
∂x ∂y
da cui si ottiene
∂Mx ∂Mxy
Tx = + . (4.23)
∂x ∂y

41
z z

Myy

p
x x
Mxx

z
z
y
y

Ty

x Mxt
x Tx

Analogamente, scrivendo l’equilibrio alla rotazione intorno ad una sezione normale all’asse y si
ottiene
∂My ∂Mxy
Ty = + . (4.24)
∂y ∂x
Conseguentemente, sulle sezioni normali agli assi x e y ci saranno degli sforzi di taglio i cui integrali
lungo lo spessore saranno pari a tali azioni.
Consideriamo ora il Principio dei Lavori Virtuali nel caso della formulazione Lagrangiana Ag-
giornata. In questo caso si dovrà tener conto della condizione di precarico nella posizione di
riferimento, che darà vita ad un contributo addizionale di presforzo alla matrice di rigidezza del
tipo (2.31)
Z
δg T σ 0 g dv, (4.25) pre-stress-pia
v

dove g è l’operatore che rappresenta il gradiente dello spostamento. Assumiamo che il precarico sia
associato ad una distribuzione di sforzo nello spessore, cosı̀ da poter analizzare un primo modello
per la descrizione del comportamenento membranale, il termine espresso dall’equazione (4.25)
 ∂s T  

  σ I  ∂s 
03 
Z  ∂x 
 x 3 τxy I 3  ∂x 
 
∂s
δ ∂y τxy I σy I 3 03  ∂s
(4.26)
3  ∂y 
v 
 
 ∂s 
 03 03 03   ∂s 

∂z ∂z

Possiamo calcolare il gradiente dello spostamento sfruttando le relazioni (4.1)


∂s © ∂w
ªT
= 0 0 ∂x
(4.27)
∂x
∂s n ∂w
oT
= 0 0 ∂y (4.28)
∂y
∂s n ∂w oT
= − ∂x − ∂w
∂y 0 . (4.29)
∂z
∂s
Le componenti del vettore ∂z risultano in realtà inessenziali in quanto i termini di presforzo che
vanno moltiplicati per essi si possono ritenere nulli. Eliminati i termini trascurabili il contributo
di presforzo nel P.L.V. è pari a
Z ( ∂w )T µZ · ¸ ¶ ( ∂w ) Z ( ∂w )T · ¸ ( ∂w )
∂x σx τxy ∂x ∂x Nx Txy ∂x
δ ∂w dz da = δ ∂w da, (4.30)
a t τ xy σ y
∂w
a T xy N y
∂w
∂y ∂y ∂y ∂y

dove le N sono i flussi di azione normale lungo le sezioni perpendicolari agli assi x ed y e T xy è il
flusso di azioni di taglio nel piano xy, tutti dovuti al presforzo. Possiamo ora scrivere l’equazione

42
del P.L.V. completa che tiene conto sia dei termini di energia elastica che di quelli legati allo stato
di presforzo
Z Z ( ∂w )T · ¸ ( ∂w ) Z Z
T b ∂x Nx Txy ∂x
δε̂ D ε̂da + δ ∂w da = δwq da − δwmẅ da (4.31) plv-piastra
a a Txy Ny ∂w
a a
∂y ∂y

dove q rappresenta il carico distribuito normale alla piastra ed m è la massa per unità di superficie.
Nel caso in cui sia necessario si possono aggiungere i termini relativi a coppie distribuite
Z Z
∂w ∂w
− δ cy da + δ cx da (4.32)
a ∂x a ∂y

e quelli relativi alle coppie d’inerzia


Z Z
∂w ∂ ẅ ∂w ∂ ẅ
− δ Iy da + δ Ix da. (4.33)
a ∂x ∂x a ∂y ∂y
Nel caso espresso dalla (4.31), considerando il materiale omogeneo e isotropo e applicando il teorema
della divergenza, si ottiene la seguente espressione differenziale
µ 4 ¶
Et3 ∂ w ∂4w ∂4w ∂2w ∂2w ∂2w ∂2w
2 4
+ 2 2 2
+ 4
= q + Nx 2 + Ny 2 + 2Txy − m 2 . (4.34)
12(1 − ν ) ∂x ∂ x∂ y ∂y ∂x ∂y ∂x∂y ∂t
Fra le possibili condizioni di vincolo si possono incontrare appoggi, che impongono l’annullamento
dello spostamento e del momento normale, o incastri che impongono spostamento e rotazione nulli.
In ogni caso, come sempre, tutte le condizioni al contorno naturali, ossia quelle associate alle forze
trasversali e ai momenti sui contorni, saranno automaticamente rappresentate nel P.L.V. Per i
casi in cui la piastra presenti geometrie generali, cioè diverse da un semplice rettangolo o una
circonferenza, è difficile trovare soluzioni analitiche in forma chiusa. In tali situazioni si ricorre
quasi sempre all’uso di approcci numerici.
Nel caso di piastra omogenea e isotropa rettangolare, avente due lati di lunghezza a e b, appog-
giata su tutto il contorno e non soggetta a precarichi, le forme modali possono essere ipotizzate
estendendo a due dimensioni il risultato ottenuto per la trave appoggiata
∞ X
X ∞
iπx kπy
w(x, y) = qik (t) sin sin . (4.35) forme-m-piast
i=1 k=1
a b

Per le frequenze proprie si ottiene


s "µ ¶ µ ¶2 #
2
2 Et3 i k
ωik = π + . (4.36) freq-m-piast
12(1 − ν 2 )m a b

È possibile confermare a posteriori che le (4.35) sono effettivamente forme modali attraverso una
semplice verifica di ortogonalità rispetto alla massa, metre le frequenze espresse nella (4.36) si
possono ricavare utilizzando il coefficiente di Rayleigh con le forme modali esatte, che sarà quindi
pari alle frequenze circolari al quadrato. La distribuzione quadratica con gli indici delle frequenze
modali, può portare, per opportuni rapporti geometrici fra le lunghezze caratteristiche, a minori
separazioni fra modi di vibrare successivi rispetto a quanto visto per le travi, e quindi come vedremo
a maggiori problemi per il controllo strutturale.

4.2 TRAVE CON AZIONE ASSIALE DI PRETENSIONE


Come ulteriore esempio dei modi di un’elemento in presenza di un presforzo vediamo ora una
semplice applicazione al caso della trave su due appoggi pretensionata solo assialmente. In questo
caso assieme ai termini già presenti nella (3.72) andrà aggiunto il termine di presforzo. Ricordiamo
che nel caso di una trave modellata con l’ipotesi di Kirchhoff si ha σx 6= 0 e σy = σz = 0, e nel
caso piano il campo di spotamento viene espresso come
sx = u(x), (4.37a)
∂v
sy = −y (x), (4.37b)
∂x

43
dove v è lo spostamento dell’asse della trave in direzione y. Con queste ipotesi, utilizzando ancora
una volta la (2.31) e ritornando alla convenzione utilizzata in (3.72) di chiamare con y invece che
con v lo spostamento verticale, si ottiene sulla equazione in y un termine di pre sforzo dovuto alla
azione assiale di trazione lungo la trave N , che modifica il P.L.V. nel seguente modo
Z L Z L Z L Z L Z L
EJy 00 δy 00 dx + N y 0 δy 0 dx = qδy dx + cδy 0 dx − (mÿδy + I ÿ 0 δy 0 ) dx, (4.38)
0 0 0 0 0

che nel caso in cui le inerzie rotazionali e le coppie e le forze distribuite siano trascurabili o nulle,
attraverso l’applicazione del teorema della divergenza, si giunge al seguente problema differenziale
00 0
(EJy 00 ) − (N y 0 ) + mÿ = 0, (4.39a) beam-pre
EJy 00 (0) = EJy 00 (L) = 0, (4.39b)
y(0) = y(L) = 0. (4.39c)

Nel caso in cui ci sia un estremo libero, ad esempio per x = L, il P.L.V. ci dice che le condizioni al
contorno saranno del tipo
00 0
(EJy 00 ) (L) − (N y 0 ) (L) = F, (4.40)

dove F è la forza di taglio applicata all’estremità (eventualmente nulla). Anche in questo caso, per
una trave omogenea, i modi propri avranno una forma sinusoidale del tutto equivalente a quella
che si era ottenuta nel caso senza pretensione

X iπx
y(x, t) = Ai sin qi (t). (4.41)
i=1
L

la cui correttezza è, ancora una volta, facilmente verificabile tramite la verifica dell’ortogonalità
rispetto alla distribuzione di massa. Le frequenze proprie si possono ottenere facilmente, senza
particolari elaborazioni, sostituendo le forme modali ottenute nella (4.39a), in modo che per ciascun
modo vale la relazione
õ ¶ µ ¶!
4
iπ N L2
mq̈ + EJ + qi = 0, (4.42)
L (iπ)2

da cui si ottiene
s µ ¶ s µ ¶
i2 π 2 EJ N L2 i2 π 2 EJ N
ωi = 2 1+ 2 2 = 2 1+ . (4.43) freq-pre-beam
L m i π EJ L m Ncrit

Alternativamente, come fatto per la piastra si potrà utilizzare il coefficiente di Reyleigh, pervenendo
allo stesso risultato. È da notare che la frequenza propria dipende dal valore del precarico N , e che
esiste, per ciascuna modo, un valore del precarico che rende la frequenza propria nulla. Il valore
di N che rende la prima frequenza propria nulla corrisponde al primo carico critico della trave
soggetta a compressione (perché N dovrà essere negativo per annullare la (4.43)). L’instabilità
cosidetta “statica” difatti corrisponde ad una divergenza del sistema dinamico, ossia al passaggio
di una delle radici caratteristiche nel semi-piano positivo attraverso l’origine degli assi, quindi la
condizione limite è quella che si ottiene quando la frequenza propria si annulla.

4.3 TRAVE ALLA TIMOSHENKO


Il modello di trave alla Timoshenko abbandona l’ipotesi di Kirchhoff di conservazione delle nor-
mali, affermando che ogni sezione pur rimanendo piana può ruotare di una quantità φ piccola
ma indipendente dalla rotazione dell’asse elastico della trave. In questo modo si tiene conto della
possibilità che ci sia scorrimento fra due sezioni vicine a causa della presenza dell’azione di taglio
sulle sezioni; la differenza fra la rotazione della sezione ψ e la rotazione dell’asse elastico y 0 , rappre-
senta lo scorrimento medio t che è energeticamente coniugato con il taglio. Si hanno dunque due

44
dz

t dz

T T

funzioni indipendenti y e φ che dovranno essere espresse, per la risoluzione numerica del proble-
ma, attraverso uno sviluppo completo di funzioni semplicemente continue nello spazio, in quanto
nell’espressione del P.L.V. compaiono al massimo derivate di primo grado. Il Principio dei Lavori
Virtuali in questo caso si scrive dicendo
Z L
(EJφ0 δφ0 + GAT (φ − y 0 )δ(φ − y 0 )) dx
0
Z L Z L Z L³ ´ (4.44)
= qδy dx + cδφdx − mÿ δy + I φ̈δφ dx,
0 0 0

dove GAT rappresenta la rigidezza a taglio della sezione e dipende anche dalla geometria della
sezione. Integrando per parti si ottiene
Z L Z L
L L 0
[EJφ0 δφ]0 − [GAT (φ − y 0 )δy]0 − (EJφ0 ) δφ dx + GAT (φ − y 0 )δφ dx
0 0
Z L Z L Z L Z L (4.45)
0
+ (GAT (φ − y 0 )) δydx = qδydx + cδφdx − (mÿ δy + I φ̈δφ)dx
0 0 0 0

Nel caso di una trave appoggiata agli estremi si ha δy(0) = δy(L) = 0, per cui si ottiene il seguente
problema differenziale
0
(EJφ0 ) − GAT (φ − y 0 ) = I φ̈ − c, (4.46a)
EJφ0 (0) = EJφ0 (L) = 0, (4.46b)
0
(GAT (φ − y 0 )) = q − mÿ, (4.46c)
y(0) = y(L) = 0. (4.46d)

Anche in qusto caso se al posto del vincolo di appoggio abbiamo degli estremi liberi le condizioni
al contorno naturali ci dicono che

GAT (y 0 (L) − φ(L)) = F (L), (4.47)

con F (L) forza di taglio all’estremità, eventualmente nulla.


La modellazione dei vari elementi strutturali qui presentata non dovrebbe essere che l’estensione
dinamica alla d’Alambert di ciò che si conosce già da altri corsi. L’uso del PLV come base sia per
l’approssimazione che per ricavare le equazioni differenziali, ivi comprese le condizioni al contorno
naturali, dovrebbe essere sufficientemente evidenziato in questo bigino. Se interessa complementare
quanto qui presentato può essere utile consultare: Finlayson, The Method of Weighted Residuals
and Variational Principles, Academic Press. Per la determinazione analitica dei modi e delle
frequenze proprie di vibrare su fili, membrane, travi e piastre basta consultare un qualsiasi libro
di dinamica delle strutture. Si riportano, per comodità, solo alcuni riferimenti. Un simpatico
vecchio, ma utile, libro potrebbe essere: Belluzzi, Scienza delle Costruzioni, vol. 4, Zanichelli.
Un’altro vecchio classico, più vecchi meglio sono, è: Meirovitch, Analytical Methods in Vibrations,

45
MacMillan; o il più recente: Meirovitch, Dynamics and Control of Structures, John Wiley; che sarà
utile, insieme ad altri poi richiamati, anche per la parte di controllo delle strutture. Per l’utilizzo
di basi modali per la soluzione dei problemi di dinamica e trasmissione del calore si vedano i libri
già consigliati per le tecniche di approssimazione.

46
5 MINIMIZZAZIONE/MASSIMIZZAZIONE VINCOLA-
TA
Verranno qui spiegate in breve due tecniche per ottimizzare (minimizzare/massimizzare) una fun-
zione a più variabili sottoposta a dei vincoli di uguaglianza. La differenza rispetto al caso non
vincolato è legata alla non indipendenza delle variazioni delle coordinate libere che sono invece
legate dalle equazioni che compongono i vincoli di uguaglianza, il che comporta l’impossibilità di
annullare tutte le componenti del gradiente della funzione stessa. Per presentare la prima tecnica,
prendiamo come esempio il caso di una funzione obiettivo dell’ottimizzazione z = f (x, y), assieme
ad un unico vincolo di uguaglianza fra le variabili g(x, y) = 0. La condizione di stazionarietà della
funzione obiettivo corrisponde all’annullamento della seguente variazione prima
∂f ∂f
δz = δx + δy = 0. (5.1) var-prim
∂x ∂y
La condizione di vincolo impone però che le variazione delle variabili indipendenti non siano
arbitrarie, bensı̀ tali da soddisfare la seguente relazione di uguaglianza
∂g ∂g
δx + δy = 0. (5.2) lin-cos
∂x ∂y
∂g
Supponendo ∂y 6= 0 si potrà esprimere δy in funzione di δx dalla (5.2) e poi sostituire la relazione
ottenuta nella (5.1)
µ ¶
∂f ∂f ∂g/∂x
− δx = 0 (5.3)
∂x ∂y ∂g/∂y

Questa relazione dovrà essere valida qualunque sia la variazione δx, e quindi il problema di
ottimizzazione vincolata porta al seguente sistema di equazioni nelle due incognite x e y

∂f ∂f ∂g/∂x
− = 0, (5.4)
∂x ∂y ∂g/∂y
g(x, y) = 0, (5.5)

la cui soluzione definisce i(l) punti(o) di stazionarietà della funzione f . Generalizzando il pro-
cedimento al caso della ricerca della condizione di stazionarietà di una generica funzione f di n
variabili indipendenti, soggetta a m vincoli di uguaglianza, risulta evidente come sarà possibile
esprimere m variazioni di opportune variabili dipendenti in funzione delle rimanenti m − n varia-
bili indipendenti. La determinazione delle m − n variazioni indipendenti richiedrà la soluzione di
un sistema sottodeterminato di m equazioni lineari. Tale soluzione sarà in generale possibile, a
patto di scegliere opportunamente le variazioni dipendenti. Infatti, l’eventuale non risolubilità di
tale sistema di equazioni è legata al fatto che il rango della matrice del sistema è inferiore ad m,
ossia che i vincoli scelti non sono indipendenti; è quindi necessario modificare il numero di variabili
dipendenti m. Sostituendo le relazioni che legano le m variazioni dipendenti a quelle delle m−n in-
dipendenti nella espressione della variazione prima della funzione f e ricordandosi che l’arbitrarietà
delle variazioni implica l’annullarsi di ciascuno dei termini che moltiplicano le m − n variazioni,
si ottengono m − n equazioni indipendenti, che abbinate alle m equazioni di vincolo forniscono
il sistema di n equazioni in n incognite, generalmente non lineari, la cui soluzione determinerà
i punti di stazionarietà del problema di ottimizzazione vincolata. Dovranno essere chiaramente
soddisfatte tutte le condizioni atte a garantire che le operazioni richieste siano matematicamente
possibili. Inoltre ci accontentiamo qui della determinazione dei punti di stazionarietà senza curarci
del tipo di stazionarietà (minimi o massimi) ad essi associati, il cui studio richiede il calcolo delle
variazioni seconde.
Il metodo sopra delineato è efficiente e di applicabilità generale. Esiste però una seconda
tecnica di risoluzione altrettanto generale e di più facile utilizzo nota con il nome di metodo dei
moltiplicatori di Lagrange. Essa trasforma il problema di ottimizzazione vincolato iniziale in uno
non vincolato attraverso l’aggiunta di ulteriori incognite, dette appunto moltiplicatori di Lagrange

47
λ. Riprendiamo l’esempio di una sola funzione z = f (x, y) e un solo vincolo g(x, y) = 0. Essendo
ancora valide le relazioni (5.1) e (5.2) sarà vera anche una loro generica combinazione, quindi
possiamo scrivere che
µ ¶
∂f ∂f ∂g ∂g
δx + δy + λ δx + δy = 0. (5.6)
∂x ∂y ∂x ∂y

Raccogliendo a fattor comune le variazioni si ottiene


µ ¶ µ ¶
∂f ∂g ∂f ∂g
+λ δx + +λ δy = 0. (5.7)
∂x ∂x ∂y ∂y

Ritenendo indipendenti le variazioni delle due variabili x e y si ottiene il seguente sistema


∂f ∂g
+λ = 0, (5.8)
∂x ∂x
∂f ∂g
+λ = 0, (5.9)
∂y ∂y
g(x, y) = 0. (5.10)

Come si può notare ora si ha un’equazione in più ma anche una incognita in più, il moltiplicatore,
il cui valore si aggiusta in modo da soddisfare il vincolo fra le variabili. In conclusione questo
metodo si riconduce a trovare la condizione di stazionarietà non vincolata della funzione

z(x, y) = f (x, y) + λg(x, y), (5.11)

rispetto alle tre variabili x, y e λ. L’approccio è facilmente estendibile al caso di più variabili, per
cui ci si riconduce a ricercare la condizione di stazionarietà della funzione non vincolata
X
z(x) = f (x) + λT g(x) = f (x) + λi gi (x), (5.12)

rispetto a x e λ. Si fa infine notare la similitudine del primo metodo con la scelta delle coordinate
libere di sistemi olonomi con vincoli lisci, mentre il secondo metodo è simile alla tecnica di calcolo
delle reazioni vincolari normali ai vincoli degli stessi sistemi; non per niente appare il nome di
Lagrange.

48
6 CONTROLLO OTTIMO
NOTA: Nel seguito di questo bigino, per non appesantire troppo la notazione, salvo quando diver-
samente specificato, si utilizzeranno le lettere minuscole per indicare i vettori e le lettere maiuscole
per indicare le matrici.
Un sistema dinamico può essere rappresentato nella forma più generale agli stati nel modo seguente

ẋ = Ax + Bu u + Bd d, (6.1a)
y = Cy x + Dyu u + Dyd d, (6.1b)
r = Cr x + Dru u + Drd d. (6.1c)

Rispetto alla trattazione classica vista nel corso di Automatica si sono aggiunti esplicitamente al
sistema i disturbi d e le uscite di prestazione r con le relative matrici. Il vettore x rimane il vettore
degli stati del sistema, il vettore u è il vettore degli ingressi manipolabili, generalmente ai fini del
controllo e il vettore y è il vettore delle uscite di misura.
Nei casi che verranno trattati in questa parte non si considererà la presenza dei disturbi e si
supporrà, almeno inizialmente di conoscere in maniera completa lo stato del sistema. Tenendo in
conto solo le uscite di prestazione, il sistema precedente viene riscritto nella ben nota forma

ẋ = Ax + Bu (6.2a)
r = Cx + Du. (6.2b)

Immaginiamo di dover controllare un sistema di ordine n con m ingressi e di cui si suppone di


conoscere ad ogni istante l’intero stato. La tecnica del controllo per posizionamento dei poli ci dice
che abbiamo n × m parametri da determinare (i coefficienti della matrice dei guadagni) ma solo
n possibili posizioni da assegnare per il poli del sistema in anello chiuso. Ci saranno quindi una
infinità di possibili combinazioni dei parametri che permettono di ottenere lo stesso risultato. La
scelta fra le diverse possibili soluzioni andrà fatta cercando di raggiungere altri obiettivi assieme al
posizionamento dei poli. Tali obiettivi potranno riguardare le prestazioni del sistema (che non sono
esclusivamente dominate dalla posizione dei poli), la limitazione dei segnali generati dal controllore
al fine di evitare che essi superino i limiti fisici dei sistemi reali atti a realizzare effettivamente
quanto richiesto, o anche la riduzione dell’incidenza del rumore di misura sul sistema di controllo.
Lo strumento base per cercare di raggiungere questi obiettivi é fornito dalla teoria del controllo
ottimo. L’idea di base è quella di definire gli obiettivi attraverso un opportuno indice di merito
e di procedere poi alla ricerca dei parametri, ossia i guadagni del controllore, che forniscano la
soluzione ottima, ossia quella che minimizza l’indice di merito.
Il problema del controllo ottimo viene di solito formulato come la minimizzazione di un funzio-
nale composto da tre termini quadratici pesati noto il vettore degli stati all’istante iniziale. Tale
funzionale si scrive come
à Z T !
1 ¡ ¢
F = xTf Pf xf + rT Wrr r + uT Wuu u dt , (6.3) cont-ott
2 t

dove t è l’istante di tempo attuale, xf rappresenta lo stato al tempo finale T e le matrici Pf , Wrr
e Wuu sono in generale simmetriche. Tale funzionale viene di solito denominato indice di merito
o funzione di costo ed è composto dai seguenti contributi: il primo termine rappresenta il peso
attribuito al raggiungimento dello stato finale xf , attraverso la matrice di peso Pf ; il secondo
termine è una funzione che pesa il valore attribuito agli indici di prestazione, e quindi alla risposta
del sistema durante tutto il tempo in cui si intende applicare il controllo; il terzo termine pesa
i segnali di controllo ed è quindi destinato a mantenere gli stessi entro limiti accettabili. In tal
modo si cerca di ottenere un compromesso fra le diverse funzionalità del controllo usando degli
opportuni pesi di penalizzazione. Più alti saranno i pesi, in valore relativo, di ciascun termine
della (6.3) e meno sarà possibile far variare la quantità ad essi associata, a parità di minimo del
funzionale. La realizzazione del controllo ottimo si riconduce dunque alla scelta opportuna delle
matrici dei pesi. Tali pesi non devono però essere visti come delle entità assolute a cui associare un
significato universale, bensı̀ solo come degli strumenti atti a conseguire obiettivi di controllo espressi

49
da specifiche di progetto multiple20 , spesso non direttamente associabili alla funzione obiettivo qui
sopra descritta. A questo approccio viene comunemente associata la sigla LQR (Linear Quadratic
Regulator).
Vediamo ora come è possibile procede per determinare il minimo da tale funzionale. Prima di
tutto è opportuno manipolare l’espressione (6.3) in maniera da ottenere una espressione in termini
dei vettori di stato e di ingresso
½ ¾T · T ¸ ½ ¾
T x C T£ ¤ x
r Wrr r = (Cx + Du) Wrr (Cx + Du) = T Wrr C D
u D u
½ ¾T · T ¸ ½ ¾ (6.4)
x C Wrr C C T Wrr D x
= .
u DT Wrr C DT Wrr D u

Chiamando Q = C T Wrr C , S = C T Wrr D e R = D T Wrr D + Wuu , è possibile riscrivere la F come


à Z T ½ ¾T · ¸½ ¾ !
1 x Q S x
F = xTf Pf xf + T dt . (6.5) cont-ott2
2 t u S R u

La minimizzazione del funzionale F è vincolata dall’equazione agli stati. Potremo allora risolvere
il problema di minimizzazione vincolato come uno libero introducendo il vettore dei moltiplicatori
di Lagrange λ
à Z T ý ¾T · ¸½ ¾ ! !
1 T x Q S x T
F = x f Pf x f + + 2λ (Ax + Bu − ẋ) dt . (6.6) cont-ott3
2 t u ST R u

Per procedere con la minimizzazione si deve ricercare la condizione di stazionarietà attraverso la


scrittura delle variazioni prime
Z T
¡ T ¢
δF = δxTf Pf xf + δx Qx + δxT Su + δuT S T x + δuT Ru dt
t
Z T ¡ ¢
+ δλT (Ax + Bu − ẋ) + λT (Aδx + Bδu − δ ẋ) dt
t
Z T
(6.7)
¡ ¢
= δxTf Pf xf + T T T T T
δx Qx + δx Su + δu S x + δu Ru dt
t
Z T ¡ ¢
+ δλT (Ax + Bu − ẋ) + δxT Aλ + δuT B T λ − δ ẋT λ dt = 0.
t

L’ultimo termine δ ẋT λ può essere integrato per parti


Z T
T
¡ T ¢
δF = δxf Pf xf + δx Qx + δxT Su + δuT S T x + δuT Ru dt
t
Z T ³ ´ (6.8)
− δxTf λf + T T T T
δλ (Ax + Bu − ẋ) + δx Aλ + δu B λ + δx λ̇ dt = 0. T
t

L’espressione appena scritta deve essere valida per qualunque variazione delle quattro variabili. Si
ottiene perciò il seguente sistema di equazioni

λf = P f x f , (6.9a)
ẋ = Ax + Bu, (6.9b)
T
λ̇ = −Qx − A λ − Su, (6.9c)
¡ ¢
u = −R−1 S T x + B T λ , (6.9d) ott-ing

a cui va aggiunta la condizione iniziale x(0) = x0 . Per risolvere questo problema è quindi neces-
sario in generale che la matrice R di pesatura delle forze di controllo sia non singolare, perché in
20 Come vedremo sia in tempo che in frequenza.

50
caso contrario le forze di controllo tenderebbero a crescere indefinitamente mentre la matrice Q
potrà essere semidefinita positiva. I casi con R non invertibile portano a problemi di controllo
ottimo singolare che non verranno qui trattati. Sostituendo l’espressione degli ingressi (6.9d) nelle
equazioni differenziali del sistema, si ottiene il seguente problema:

ẋ = (A − BR−1 S T )x − BR−1 B T λ, (6.10a)


−1 T T −1 T
λ̇ = −(Q − SR S )x − (A − SR B )λ, (6.10b)
λf = P f x f , (6.10c)
x(0) = x0 , (6.10d)

la cui risoluzione porta alla definizione del controllo ottimo in anello aperto. Rinominando i termini
ott-cl fra parentesi otteniamo il seguente sistema omogeneo di equazioni differenziali lineari

ẋ = Āx − R̄λ, (6.11a)


λ̇ = −Q̄x − ĀT λ, (6.11b)
λf = P f x f , (6.11c)
x(0) = x0 . (6.11d)

Un tale sistema lineare omogeneo, come è noto, ha per soluzione

x(t) = Φ(t, τ )x(τ ), (6.12)

dove è stata introdotta la matrice di transizione Φ che lega il vettore di stato per due istanti
generici, ed è ottenibile come soluzione del problema

Φ̇ = AΦ,
(6.13)
Φ(0+ ) = I.

Partizionando la Φ in questo modo


· ¸
Φxx (t, τ ) Φxλ (t, τ )
Φ(t, τ ) = , (6.14)
Φλx (t, τ ) Φλλ (t, τ )

é possibile scrivere la soluzione del sistema come

x(t) = Φxx (t, τ )x(τ ) + Φxλ (t, τ )λ(τ ),


(6.15)
λ(t) = Φλx (t, τ )x(τ ) + Φλλ (t, τ )λ(τ ).

La soluzione deve valere anche per τ = T , per cui

x(t) = Φxx (t, T )xf + Φxλ (t, T )λf = Φxx (t, T )xf + Φxλ (t, T )Pf xf ,
(6.16) cott-sis1
λ(t) = Φλx (t, T )xf + Φλλ (t, T )λf = Φλx (t, T )xf + Φλλ (t, T )Pf xf .

Sostituendo nella seconda delle (6.16) l’espressione di xf ottenuta dalla prima si ottiene
−1
λ(t) = (Φλx (t, T ) + Φλλ (t, T )Pf ) (Φxx (t, T ) + Φxλ (t, T )Pf ) x(t) = P (t)x(t), (6.17) ott-lambda

dove P sarà una matrice in generale simmetrica e definita positiva. Si può dimostrare che perché
tale problema sia risolvibile è necessario che il sistema sia stabilizzabile. Ricordando l’espressione
che permetteva di ricavare gli ingressi (6.9d), si ottiene
¡ ¢
u(t) = −R−1 S T + B T P (t) x(t) = −G(t)x(t). (6.18) ott-ing1
¡ ¢
dove G(t) = R−1 S T + B T P (t) è a questo punto la matrice dei guadagni.
Si noti che tale relazione di proporzionalità allo stato può apparire solo come una diversa so-
luzione del problema, che permette di eliminare λ dal calcolo dell’azione di controllo ottimale. In

51
realtá essa conduce a un’implementazione della legge di controllo in ciclo chiuso, con i relativi van-
taggi, se u(t) non viene calcolato utilizzando l’x(t) calcolato come soluzione bensı̀ quello misurato
istante per istante durante il movimento.
Tornando al sistema (6.11) e sostituendo l’espressione di λ(t) si ha: (6.17)

λ̇ = Ṗ x + P ẋ = −Q̄x − ĀT P x, (6.19)

e, sostituendo l’espressione di ẋ

Ṗ x + P (Āx − R̄P x) = −Q̄x − ĀT P x, (6.20)

si ottiene la seguente equazione differenziale detta equazione di Riccati (essendo x(0) = x 0 in


generale non nullo)

Ṗ + P Ā + ĀT P − P R̄P + Q̄ = 0,
(6.21)
P (T ) = Pf .

Il problema del controllo ottimo è stato quindi ricondotto alla soluzione dell’equazione differenziale
qui sopra scritta, risolta all’indietro a partire dal suo valore all’istante finale. Determinata la
matrice P , si otterrà la matrice dei guadagni sfruttando la relazione (6.18). Si noti che, anche
se ci si occuperá sempre di sistemi lineari tempo invarianti, quanto finora sviluppato può essere
applicato anche a sistemi lineari tempo varianti.

6.1 SOLUZIONE DELL’EQUAZIONE DI RICCATI


Per sistemi tempi invarianti si può semplificare il problema nel caso in cui si voglia realizzare
un cosiddetto controllo ad orizzonte infinito, ponendo cioè il tempo finale T pari ad infinito e
richiedendo che la posizione finale sia nulla. In questo modo si ottiene un controllo che cerca
sostanzialmente di stabilizzare il sistema. Il funzionale da minimizzare in questo caso diventa
Z ∞ ½ ¾T · ¸½ ¾
1 x Q S x
F = dt. (6.22) cont-ott4
2 0 u ST R u

Essendo il sistema controllato asintoticamente stabile, a regime varrà Ṗ = 0 per cui l’equazione di
Riccati perde il termine differenziale, divenendo una equazione puramente algebrica, comunemente
denominata ARE (Algebraic Riccati Equation) o CARE (Continuous Algebraic Riccati Equation)

P Ā + ĀT P − P R̄P + Q̄ = 0. (6.23)

Per risolvere la ARE si riscrive il sistema (6.11) come


½ ¾ · ¸½ ¾ ½ ¾
ẋ Ā −R̄ x x
= = H (6.24) cott-ham
λ̇ −Q̄ −ĀT λ λ

La matrice H della hamiltoniana gode di una importante proprietà: è una matrice simplettica,
ovvero H è simile −H T . La similarità implica che −H T è ottenibile dalla H attraverso una
trasformazione di similarità con una matrice T non singolare

−H T = T −1 HT. (6.25)

Si dimostra facilmente infatti che questa proprietà è soddisfatta prendendo come matrice T
· ¸
0 I
T = , (6.26)
−I 0

e ricordando che Q̄ e R̄ sono matrici simmetriche. La trasformazione di similarità non modifica gli
autovalori, per cui gli autovalori di H devono essere gli stessi di −H T ; allo stesso tempo sappiamo
che gli autovalori di −H T devono essere pari a quelli di H cambiati di segno. Queste due proprietà
saranno entrambe vere solo se gli autovalori di H sono tutti presenti a coppie, in modo tale che se λ

52
è un autovalore di H allora lo è anche −λ. Pertanto la H avrà n autovalori con parte reale negativa
e n autovalori opposti, con n la dimensione del vettore degli stati. È possibile rappresentare in
forma spettrale H scrivendo

HV = V Λ, (6.27)
−1
H = V ΛV = V ΛU, (6.28)

dove V è la matrice degli autovettori di H, U è la sua inversa, e Λ è la matrice diagonale degli


autovalori ordinati in modo tale che nel blocco superiore ci siano gli autovalori a parte reale
negativa, e i restanti, a parte reale positiva, siano nel blocco inferiore. Pertanto la matrice di
transizione diviene

eHt = V eΛt U (6.29)

dove
" # · ¸
eΛ t
Φ−

Λt 0 0
e = = . (6.30)
Φ+
+
0 eΛ t 0

Partizionando le matrici V ed U in modo analogo a quanto fatto con Λ ed utilizzando le relazioni


appena scritte, la soluzione di (6.24) diventa
½ ¾ · ¸· ¸· ¸½ ¾
x(t) V Vxλ Φ− (t, τ ) 0 Uxx Uxλ x(τ )
= xx , (6.31)
λ(t) Vλx Vλλ 0 Φ+ (t, τ ) Uλx Uλλ λ(τ )

e quindi

x(t) = Vxx Φ− (Uxx x(τ ) + Uxλ λ(τ )) + Vxλ Φ+ (Uλx x(τ ) + Uλλ λ(τ )) . (6.32) sol-cott

Il secondo termine nell’espressione della soluzione di x è moltiplicato per la matrice degli autovalori
a parte reale positiva, quindi è un termine crescente nel tempo. Se la soluzione deve essere asintoti-
camente stabile questo termine deve essere nullo, perciò si ottiene una relazione tra i moltiplicatori
di Lagrange e il vettore degli stati
−1
λ = −Uλλ Uλx x, (6.33)
−1
e quindi la matrice P soluzione dell’equazione di Riccati sarà pari a P = −U λλ Uλx . Si può poi
−1
dimostrare che P = Vλx Vxx .
Pur essendo questa una tecnica di soluzione possibile va notato che richiede che la rappresenta-
zione spettrale della H sia diagonale. Nel caso in cui siano presenti autosoluzioni multiple ciò non
è sempre garantito, anche se sarebbe possibile calcolare la soluzione in maniera analoga partendo
da una rappresentazione spettrale alla Jordan, la quale è però di difficile determinazione dal punto
di vista numerico. In questi casi si preferisce utilizzare una rappresentazione alla Schur, la quale
data una generica matrice A permette di trasformarla in una matrice triangolare superiore
 
λ1 ∗ ∗ ∗ ··· ∗
 0 λ2 ∗ ∗ ··· ∗ 
 
0 0 Re(λ ) Im(λ ) ··· ∗ 
 3 3 
S = U T AU =  0 0 Im(λ3 ) Re(λ3 ) · · · ∗  (6.34) schur
 
 .. .. .. .. . .. . 
.. 
. . . .
0 0 0 0 · · · λn

in cui gli autovalori reali di A giacciono sulla diagonale principale, e quelli complessi formano dei
blocchetti 2 × 2 come riportato nella (6.34); inoltre la forma di Schur è ottenuta usando matrici
ortogonali per cui U U T = I. Si determina allora la scomposizione di Schur della H ordinando gli
autovalori in modo che tutti quelli con parti reali negativa siano nel triangolo superiore
· ¸· ¸· T T
¸
T Uxx Uxλ S−− S−+ Uxx Uλx
H = U SU = T T . (6.35) schur2
Uλx Uλλ 0 S++ Uxλ Uλλ

53
Le prime n colonne della matrice U non saranno altro che una combinazione degli autovettori
associati agli autovalori stabili della H per cui si potrà determinare la matrice soluzione dell’equa-
−1
zione di Riccati come P = Uλx Uxx . Tornando all’espressione della soluzione del sistema (6.32),
ricordando che il secondo termine è nullo, che λ = P x e prendendo t = τ = 0 possiamo scrivere
che
¡ −1
¢ ¡ −1
¢
x(0) = Vxx Φ− (0, 0) Uxx − Uxλ Uλλ Uλx x(0) = Vxx I Uxx − Uxλ Uλλ Uλx x(0), (6.36)

che implica
¡ −1
¢
Vxx Uxx − Uxλ Uλλ Uλx = I (6.37)

e quindi
¡ −1
¢ −1
Uxx − Uxλ Uλλ Uλx = Vxx . (6.38)

La soluzione ad un istante generico in funzione della x(0) = x0 si scriverà allora come

x(t) = Vxx Φ− Vxx


−1
x0 = Vxx eΛ t Vxx
−1

x0 . (6.39)

Essendo il sistema in anello chiuso, sappiamo che la sua soluzione potrà anche essere scritta come

x(t) = e(A−BG)t x0 (6.40)

e quindi

Vxx eΛ t Vxx
−1
= e(A−BG)t

(6.41)

per cui si può vedere che gli autovalori stabili della matrice di transizione sono anche gli autovalori
del sistema controllato che pertanto sarà sempre asintoticamente stabile.
Va infine sottolineato come un generico funzionale da minimizzare, come quello riportato nella
(6.22), in cui sono presenti i termini di pesatura accoppiata S fra stato x e ingressi u, può essere
trasformato in un problema disaccoppiato a patto di utilizzare una opportuna trasformazione di
coordinate. Se prendiamo una trasformazione del tipo
½ ¾ · ¸½ ¾
x I 0 x̄
= , (6.42) eq_trasf_contro
u T I ū

dove rimane da definire l’espressione della matrice T . Il sistema ẋ = Ax + Bu diviene quindi

x̄˙ = Ax̄ + BT x̄ + B ū = (A + BT )x̄ + B ū. (6.43)

La matrice di pesatura diviene


· ¸T · ¸· ¸ · ¸
I 0 Q S I 0 Q + ST + T T RT + T T S T S + TTR
T = . (6.44)
T I S R T I S T + RT R

Se scegliamo T in modo da annullare i termini di accoppiamento nella matrice dei pesi trasformata,
ossia T = −R−1 S T , otteniamo una matrice dei pesi diagonale a blocchi del tipo
· ¸
Q + SR−1 S T 0
. (6.45)
0 R

Questo implica che formulando il problema del controllo ottimo attraverso il funzionale
Z
1 T¡ T ¢
F = x Qx + uT Ru dt, (6.46) F-cott-genel
2 t
si riesce a rappresentare un qualunque problema, anche quelli con termini di accoppiamento fra
stati e ingressi. In considerazione di ciò e ricordando che in fondo i pesi non sono delle entità di
interesse assoluto, bensı̀ solo degli “strumenti” per il soddisfacimento delle specifiche progettuali,
da qui in avanti ci riferiremo principalmente a questa formulazione.

54
7 CONTROLLO SUB-OTTIMO
Il controllo ottimo che è stato presentato nel precedente capitolo richiede, per poter essere effet-
tivamente realizzato la conoscenza dell’intero vettore degli stati ad ogni istante. Se quindi non
è possibile misurare completamente lo stato, sarà necessario progettare assieme al controllore un
osservatore che permetta di ricostruire lo stato dalle misure. Quest’ultimo potrà essere sintetiz-
zato utilizzando la tecnica duale rispetto a quella presentata per il controllore, quindi passando
attraverso la soluzione dell’equazione di Riccati duale, ossia, nel caso della (6.46) in cui non ci sia
il termine di peso accoppiato stati/ingressi,
P AT + AP − P C T R−1 CP + Q = 0, (7.1)
dalla cui soluzione si ricava la matrice dei guadagni dell’osservatore
L = P C T R−1 . (7.2)
Il significato delle matrici di pesatura Q ed R in questo caso verrà meglio analizzato più avanti alla
luce dei risultati riguardanti lo studio di sistemi soggetti a forzanti stocastiche.
Esiste però un’altra possibile soluzione nel caso in cui tutto lo stato non sia disponibile, che si
basa sull’idea di generare dei segnali di controreazione u che siano direttamente proporzionali alle
misure secondo una relazione del tipo
u = −Gy. (7.3)
In questo modo l’osservatore non è più necessario e quindi si ottiene un significativo risparmio del
costo computazionale richiesto durante il funzionamento del regolatore 21 . La maggiore semplicità
è controbilanciata da una riduzione dell’ampiezza dello spazio delle possibili soluzioni ottenibili
con questa architettura, in quanto si riducono la dimensione della matrice dei guadagni e quindi
il numero di parametri che si hanno a disposizione per modificare le caratteristiche del sistema.
Si parla in questo caso di controllo sub-ottimo, per enfatizzare il fatto che si può raggiungere solo
un ottimo su un sottospazio ridotto rispetto a quello raggiungibile dal controllo ottimo classico.
Inoltre, come vedremo, non è più possibile risolvere il problema di minimizzazione del funzionale
(6.46), attraverso l’equazione di Riccati, bensı̀ si dovrà procedere ad una ottimizzazione attraverso
algoritmi numerici di tipo iterativo. Prima di procedere nei dattagli computazionali è utili fare
alcune considerazioni analizzando l’applicazione di un controllo di questo tipo ad un sistema elasto-
meccanico rappresentato attraverso l’equazione
M ẍ + Kx = Bu, (7.4)
che agli stati diventa
½ ¾ · ¸½ ¾ · ¸
ẋ 0 I x 0
= + u. (7.5)
ẍ −M −1 K 0 ẋ B
Supponendo genericamente di effettuare delle misure di spostamento e delle misure di velocità
potremo scrivere
½ ¾ · ¸½ ¾
yp Cp 0 x
= . (7.6)
yv 0 Cv ẋ
Nel caso del controllo sub-ottimo la controreazione potrà essere scritta come
u = − (Gp yp + Gv yv ) = − (Gp Cp x + Gv Cv ẋ) . (7.7)
Sostituendo quest’ultima relazione nell’equazione del sistema si ottiene
M ẍ + BGv Cv ẋ + (K + BGp Cp ) x = 0. (7.8) sub-ott-mec

L’equazione (7.8) ci dice che:


21 L’osservatore non è strettamente necessario però anche in questo caso è possibile pensare di utilizzare un

osservatore che generi alcuni stati da inviare poi in contro-reazione al sistema. In generale il controllo sub-ottimo va
visto come un controllo con struttura imposta a priori dal progettista, ma comunque di architettura estremamente
generale.

55
1. Se non è presente una misura proporzionale alla velocità, e la matrice BG p Cp è simmetrica22 ,
non è possibile modificare lo smorzamento del sistema con il controllo sub-ottimo; se non è
presente una misura proporzionale alle posizioni non è possibile modificare significativamente
le frequenze proprie del sistema.
2. Se il controllo è co-locato, ossia se vengono effettuate delle misure esattamente negli stessi
punti in cui si va ad agire con il sistema di contollo, nel qual caso si avrà che C p = Cv = B T , si
ottengono delle matrici di smorzamento e rigidezza in anello chiuso (rispettivamente BG v B T
e K + BGp B T che sono simmetriche e definite positive, se Gv e Gp sono tali23 ). Questa
caratteristica sarà utile per verificare che questo tipo di controllo risulta sempre stabile anche
quando è sintetizzato utilizzando una base modale ridotta rispetto ai modi della struttura
reale.
Il funzionale da minumizzare in questo caso diventa
Z Z Z
1 ∞¡ T T
¢ 1 ∞ T¡ T T
¢ 1 ∞ T
F = x Qx + u Ru dt = x Q + C G RGC xdt = x W (G) xdt. (7.9)
2 t 2 0 2 0

La matrice dei pesi W (G) è sempre simmetrica definita positiva in quanto sia Q che R lo sono.
Per risolvere il problema del controllo ottimo si deve minimizzare il funzionale F, con il vincolo
che il controllore abbia una ben precisa struttura. Per minimizzare il funzionale F si ricorre
ad un’ottimizzazione numerica che permette, dato un insieme di variabili e noto il gradiente del
funzionale, di calcolarne il minimo in maniera iterativa. Il problema è dunque quello di calcolare
il gradiente del funzionale. Per farè ciò è possibile procedere passando attraverso la soluzione della
seguente equazione di Lyapunov24
T
(A − BGC)T P + P (A − BGC) + W (G) = A P + P A + W (G) = 0. (7.10) lya1

Se la matrice W è simmetrica e definita positiva, anche P sarà simmetrica e definita positiva e


quindi varrà la condizione di stabilità che ci assicura in generale la risolubulità dell’equazione (7.10).
Questo in realtà richiedebbe di generare, per inizializzare la procedura iterativa di ottimizzazione,
una matrice G di tentativo che assicuri la stabilità di A − BGC. Se questo non è realizzabile
facilmente bisognerà pensare a qualche tecnica per inizializzare la procedura su di un sistema in
cui tutti gli autovalori sono traslati di una quantità che li porti in una zona di certa asintotica
stabilità25 . Una volta partiti con gli autovalori nel semipiano stabile, sarà l’ottimizzazione che
porterà il sistema lontano dal semipiano instabile. Sostituendo l’espressione (7.10) nell’equazione
del funzionale F
Z
1 ∞ T³ T ´
F =− x A P + P A xdt. (7.11)
2 0

A è la matrice di stato del sistema in anello chiuso, per cui sappiamo che per il sistema controllato
ẋ = Ax. La F diviene allora
Z Z
1 ∞¡ T T
¢ 1 ∞ d ¡ T ¢ 1£ ¤∞
F =− ẋ P x + x P ẋ dt = − x P x dt = − xT P x 0 . (7.12)
2 0 2 0 dt 2
Essendo il sistema finale asintoticamente stabile possiamo scrivere
1 T 1 ¡ ¢ 1
F = x0 P x0 = Tr P x0 xT0 = Tr (P X0 ) . (7.13)
2 2 2
22 Nel caso in cui la matrice di rigidezza complessiva non sia più simmetrica è possibile generare smorzamento e

portare anche il sistema verso l’instabilità.


23 La simmetria e la definizione positiva delle matrici dei guadagni è una proprietà “naturale” in questo caso, ma

non viene in generale ottenuta a meno che non sia esplicitamente imposta durante la procedura di ottimizzazione.
24 Il perché dell’uso dell’equazione di Lyapunov apparirà chiaro più avanti quando la medesima procedura sarà

utilizzata per la determinazione dell’osservatore ottimo. A questo stadio si può considerare questa semplicemente
come una tecnica particolarmente “geniale” per arrivare ad una soluzione semplice del problema. Si fa infine notare
che la procedura qui presentata può essere anche utilizzata nel caso del controllo ottimo classico per dimostrare che
la soluzione dell’ottimizzazione coincide con la soluzione dell’equazione di Riccati.
25 Si veda in proposito la parte relativa nelle tecniche di pesatura descritte nel capitolo successivo.

56
La matrice X0 è una matrice che rappresenta tutte le possibili combinazione delle condizioni iniziali
e deve essere stabilità a priori facendo una media di tutte le condizioni iniziali attese 26 . Per
poter determinare la soluzione ottimale attraverso un algoritmo numerico è necessario calcolare il
gradiente della funzione obiettivo rispetto ai parametri p, che in questo caso sono i coefficienti della
matrice dei guadagni Gik
µ ¶
1 ∂Tr(P X0 ) 1 ∂P
Grad F = = Tr X0 . (7.14) gradF
2 ∂Gik 2 ∂Gik

Il gradiente di P rispetto ai parametri può essere ottenuto attraverso l’equazione (7.10) come
T T
A/Gik P + A P/Gik + P/Gik A + P A/Gik + W/Gik = 0, (7.15)
T
³ T ´
A P/Gik + P/Gik A + A/Gik P + P A/Gik + W/Gik = 0. (7.16) lya2

Data la matrice P è quindi necessario per determinare ciascuna delle matrice derivate P /Gik (che
sono tante quanti i coefficienti di G) risolvere una equazione di Lyapunov, la (7.16). Il calcolo
del gradiente attraverso questa procedura risulta quindi estremamente oneroso dal punto di vista
computazionale. Si preferisce allora procedere attraverso un metodo alternativo che prevede la
risoluzione del seguente problema di Lyapunov aggiunto
T
AM + M A + X0 = 0. (7.17) lya3

In questo modo possiamo riscrivere la (7.14) come


µ ¶
1 ∂P 1 ³ ³ T
´´
Grad F = Tr X0 = − Tr P/Gik AM + M A . (7.18)
2 ∂Gik 2

Sfruttando le proprietà dell’operatore traccia “Tr”, possiamo riscrivere quest’ultima espressione


come
1 ³ ³ T ´´
Grad F = − Tr M A P/Gik + P/Gik A . (7.19)
2
Usando ora la (7.16) si ottiene
1 ³ ³ T ´´
Grad F = Tr M A/Gik P + P A/Gik + W/Gik (7.20)
2
1³ ³ T ´´
Grad F = M 2A/Gik P + W/Gik . (7.21)
2
In questo modo per il calcolo del gradiente è richiesta la determinazione delle sole derivate
overlineAT/Gik e W/Gik , già richieste dalla procedura precedente senza dover passare dalla riso-
luzione di tante equazioni di Lyapunov quanti sono i coefficienti di G, bensı̀ solo attraverso la
soluzione della equazione (7.17).

8 TECNICHE PER LA SCELTA DEI PESI NEL


CONTROLLO OTTIMO
In questa sezione verrà brevemente presentata una rassegna di possibili tecniche per la scelta dei
pesi da inserire nelle matrici Q ed R della funzione obiettivo del controllo ottimo.

8.0.1 Pesatura attraverso i valori massimi attesi


La scelta più semplice che si può pensare di effettuare è quella di assegnare a ciascuna misura di
prestazione e a ciascun segnale di controllo un peso pari all’inverso del quadrato del valore massimo
26 Anche il significato di questa matrice apparirà più chiaro dopo lo studio dei processi stocastici. Tale matrice è

infatti la matrice di correlazione delle condizioni iniziali.

57
che si può ritenere accettabile. In questo modo si ottengono delle matrici di peso diagonali con
dei valori che sono tanto più grandi quanto più piccola è la variabilità che si vuole ottenere con il
controllo attivo per una determinata misura di prestazione/segnale di controllo. Si ricorda infatti
che i pesi non hanno senso in valore assoluto; quello che conta è bensı̀ il valore relativo che essi
assumono all’interno dell’espressione dell’indice di merito. É allora spesso utile introdurre un
ulteriore fattore di scala ρ che fornisce il rapporto fra le ampiezze dei controlli rispetto a quelle
degli stati
Z
1 ∞¡ T ¢
F = ym Qym + ρuT Ru dt. (8.1)
2 0
Tanto più ρ → ∞ tanto minore sarà il valore dei segnali introdotti per controllare il sistema e
quindi l’autorità del controllore. Al contrario per ρ → 0 si ottengono dei segnali sempre più ampi
e delle frequenze proprie del sistema in anello chiuso che tendono sempre più verso −∞. Usare
ρ = 0 significa non porre alcun limite alle forze di controllo; tale scelta non è però possibile nel
controllo ottimo classico perché abbimo visto che è necessario poter invertire la matrice dei pesi
ρR per poter ottenere la matrice dei guadagni. Dall’espressione della F in funzione delle misure di
prestazione ym bisogna poi passare a quella classica in funzione degli stati attraverso le relazioni
di uscita
Z
1 ∞¡ T T ¢
F = x C QCx + 2uT DT QCx + ρuT Ru dt. (8.2)
2 0
In questo caso la nuova matrice di peso dello stato Q̃ = C T QC, non sarà in generale di forma
diagonale, e inoltre comparirà il termine di accoppiamento fra stato e ingressi.

8.0.2 Traslazione autovalori in direzione dell’asse reale


Se si vuole che gli autovalori del sistema controllato siano tutti con parte reale al di là di una certa
soglia α.Se prendiamo come funzione obiettivo la seguente
Z
1 ∞ 2αt ¡ T ¢
F = e x Qx + uT Ru dt, (8.3)
2 0
Z ∞
1 ¡ αt T ¢
F = e x Qxeαt + eαt uT Rueαt dt (8.4)
2 0
Questo corrisponde a minimizzare la classoca funzione obiettivo
Z
1 ∞¡ T ¢
F = x̄ Qx̄ + ūT Rū dt (8.5)
2 0
dove le variabili sopra-segnate sono legate a quelle originarie attraverso la seguente trasformazione
x = x̄eαt . (8.6)
É possibile infatti verificare che
ẋ = αeαt x̄ + x̄e
˙ αt , (8.7)
x̄˙ = e−αt (ẋ − αx) . (8.8)
Possiamo allora scrivere che
˙ −αt = (A + αI)x + Bu,
x̄e (8.9)
˙ −αt = (A + αI)x̄e−αt + B ūe−αt ,
x̄e (8.10)
x̄˙ = (A + αI)x̄ + B ū. (8.11)
Il sistema con le variabili sopra-segnate ha una matrice degli stati (A + αI) e quindi i suoi auto-
valori sono ottenuti semplicemente traslando di una quantità α verso destra in direzione del’asse
reale quelli del sistema originario. L’applicazione del controllo ottimo sul sistema sopra-segnato
garantisce che tutti gli autovalori dello stesso sistema saranno nel semipiano sinistro. Riportando-
si nelle variabili originarie, tutti gli autovalori saranno quindi a destra dell’asse parallelo all’asse
immaginario e passante per −α.

58
8.0.3 Inseguimento dei modelli in forma implicita: assegnamento delle autosoluzioni
Si parla di inseguimento dei modelli in forma implicita quando si vogliono imporre delle auto-
soluzioni, ossia delle nuove coppie autovalori/autovettori, o comunque più in generale una certa
matrice di stato A, per la dinamica del sistema in anello chiuso. Qui privilegeremo la presentazione
del caso in cui si impone l’autostruttura, ritenendo che quello più generale venga naturalmente di
conseguenza. Assegnate le autosoluzioni desiderate Λd e Φd si può assemblare la matrice di stato
desiderata per il sistema in anello chiuso Ad = Φd Λd Φ−1 d . Come indice di merito da minimizzare
prendiamo la differenza fra lo stato derivato del sistema originario è quello desiderato
Z
1 ∞³ T
´
F = (ẋ − ẋd ) Q (ẋ − ẋd ) + ρuT Ru dt. (8.12)
2 0

Ricordando che

ẋ = Ax + Bu, (8.13)
ẋd = Ad x, (8.14)

possiamo scrivere che


Z
1 ∞³ T
´
F = ((A − Ad )x + Bu) Q ((A − Ad )x + Bu) + ρuT Ru dt,
2 0
Z ∞³
1
F = xT (A − Ad )T Q(A − Ad )x + xT (A − Ad )T QBu + uT B T Q(A − Ad )x
2 0 (8.15)
´
+ uT (B T QB + ρR)u dt.

In questo modo si ottiene un problema di controllo ottimo in cui sono presenti i termini di ac-
coppiamento fra stato e ingressi. La scelta degli autovalori desiderati viene solitamente effettuata
sulla base di esigenze di progetto che possono richiedere l’aumento dello smorzamento del sistema
o lo spostamente di alcune frequenze. Per gli autovettori si può invece scegliere di mantenere le
forme invariate oppure di selezionarli in modo da cercare di insensibilizzare il valore del corrispon-
dente autovalore rispetto ad un parametro. Sappiamo infatti che data una matrice di stato A non
simmetrica, avente autovettori destri xi e autovettori sinistri yi , è facile verificare che
∂λi ∂A
= yiT xi . (8.16)
∂ρ ∂ρ
Infine si ricorda che quando si modella un sistema strutturale agli stati, gli autovettori saranno
in generale complessi e sempre composti da una parte relativa alle coordinate di posizione ed una
relativa alle coordinate di velocità. Queste ultime saranno sempre pari al prodotto dei coefficienti
sulle posizioni per l’autovalore corrispondente. Questo vincolo andrà in ogni caso rispettato, per
cui se si vogliono modificare gli autovalori ma non gli autovettori, la matrice di stato desiderata
dovrà essere scritta come
· ¸
Φ £ ¤
Ad = Λ Φ [λi Φi ] . (8.17)
[λi Φi ]

8.0.4 Pesatura in frequenza


Nell’affrontare un problema di sintesi di un sistema di controllo si parte da delle specifiche di pro-
getto in termini di prestazioni e di robustezza spesso espresse nel dominio delle frequenze. Data la
natura intrisecamente legata al dominio del tempo del controllo ottimo LQR sembrerebbe apparen-
temente complesso tradurre queste specifiche in scelte dei parametri di progetto per il controllore
attraverso LQR. In linea di principio potrebbe essere utile risolvere il problema del controllo ottimo
in frequenza in modo da utilizzare delle matrici di pesatura Q ed R che varino in funzione di ω. Si
potrebbe ad esempio pensare di attenuare i controlli ad alta frequenza introducendo delle matrici
di pesatura R i cui coefficienti aumentano di valore al crescere di ω. In realtà è possibile dimostrare

59
che una pesatura di questo tipo è ottenibile operando direttamente con l’algoritmo LQR nel domi-
nio del tempo su un sistema dinamico modificato rispetto all’originale attraverso l’introduzione di
un opportuno filtro. Dato un sistema dinamico supponiamo di inserire un filtro del primo ordine
del tipo 1/s sugli ingressi u, in modo che il sistema risultate sia pari a
½ ¾ · ¸½ ¾ · ¸
ẋ A B x 0
= + v. (8.18)
u̇ 0 0 u I

Su questo nuovo sistema andiamo ad ottimizzare la funzione obiettivo


Z ý ¾T · ¸½ ¾ !
1 ∞ x Q 0 x T
F = + v Iv dt. (8.19) timew
2 0 u 0 R u

Il teorema di Parseval, che ci dice che27


Z +∞ Z +∞
1
hT (t)h(t)dt = h∗ (jω)h(jω)dω, (8.20)
−∞ 2π −∞

dove con h si è indicata la trasformata di Fourier della h e con ()∗ si indica l’operazione di
coniugazione nel campo complesso. L’equazione (8.19) in frequenza diviene allora pari a
Z µ½ ¾∗ · ¸½ ¾ ¶
1 ∞ x Q 0 x
F = + v ∗ Iv dω. (8.21)
2 0 u 0 R u

Ricordando che in frequenza v = jωu si ottiene


Z
1 ∞¡ ∗ ¢
F = x Qx + u∗ (R + ω 2 I)u dω. (8.22) timef
2 0
Per poter ottenere una pesatura in frequanza di tipo generale è quindi sufficiente definire un
opportuno filtro sugli ingressi del tipo

u˙f = Af uf + Bf v (8.23)
u = C f uf (8.24)

e quindi sintetizzare il controllore ottimo sul sistema


½ ¾ · ¸½ ¾ · ¸
ẋ A BCf x 0
= + v. (8.25)
u˙f 0 Af uf Bf

È evidente che, dato un filtro di ordine n, si otterrà una funzione di pesatura in frequenza degli
ingressi data da un polinomio di ordine 2n nella variabile ω.
Si può pensare di mettere in piedi una procedura di pesatura in frequenza attraverso dei filtri,
del tutto equivalente a questa, anche per dare dei pesi in frequenza alle variabili di prestazione o
agli stati del sistema.

8.0.5 SWLQR
La sigla SWLQR inica la procedura nota come Sensitivity Weighted LQR, ovvero controllo ottimo
con pesatura delle sensitività. L’obiettivo di tale tecnica è quello di scegliere i pesi da utilizzare in
modo da ridurre la sensibilità del sistema in anello chiuso rispetto a certi parametri. In tal modo,
anche nei casi in cui si abbia una grande incertezza sul valore che assumeranno taluni parametri del
sistema durante la vita operativa, è possibile sintetizzare dei controllori che siano sufficientemente
robusti. L’idea è quella di aggiungere alla funzione obiettivo un termine del tipo x T/p Wp x/p
Z ∞ µ ¶
1 T T ∂xT ∂x
F = x Qx + u Ru + Wp dt. (8.26) swlqr-f
2 0 ∂p ∂p
27 Maggiori dettagli saranno forniti nelle lezioni successive.

60
Pesando molto questi termini, il processo di minimizzazione ci assicura di raggiungere un sistema
finale in cui le variazioni dello stato al variare del parametro p sono contenute. Per ottenere la
derivata del vettore di stato rispetto al parametro p possiamo scrivere che

ẋ/p = A/p x + Ax/p + B/p u, (8.27)


¡ ¢
ẋ/p = Ax/p + A/p x + B/p u . (8.28) sys-devp

L’equazione (8.28) ci dice che la derivata si ottiene come soluzione di un sistema dinamico forzato
dai vettori x e u. A regime si otterrà che
¡ ¢
x/p = A−1 A/p x + B/p u , (8.29)

Sostituendo questa espressione nella (8.26) si ottiene una funzione di peso che contiene anche i
termini di accoppiamento fra stato e ingressi.

8.0.6 Combinazione osservatore–controllore


Il controllore ottenuto attraverso l’LQR presenta, se considerato singolarmente, delle ottime doti
di robustezza. Si puó infatti dimostrare che tali controllori presentano sempre un margine di fase
di almeno 60◦ , e un margine di guadagno che può variare fra 0.5 e ∞. Valutazioni analoghe
possono essere fatte per gli osservatori ottenuti nel medesimo modo. Progettando separatamente
il controllore e l’osservatore non è però garantito che l’unione dei due porti ad una condizione di
ottimo globale. Le proprietà di robustezza possono infatti essere completamente cancellate nel
momento in cui si accoppiano i due sistemi. Un modo per riuscire ad ottenere dei controllori che
mantegano le proprietà di robustezza anche in seguito al collegamento con un osservatore è quello
di aggiungere dei pesi del tipo xT C T Cx, ossia di pesare in qualche modo le misure. Un discorso
analogo si può fare per il problema duale dell’osservatore; in questo caso si aggiungerà un peso del
tipo z T BB T z, dove z è la variabile di stato del sistema duale

ż = AT z + C T u,
(8.30)
v = B T z.

61
9 RIDUZIONE BILANCIATA DEI MODELLI
Consideriamo un sistema asintoticamente stabile. Le proprietà di controllabilità e osservabilità
di un sistema dinamico lineare vengono definite a partire dalle caratteristiche delle due seguenti
matrici
Z∞
T
GC := eAt BB T eA t
dt (9.1)
0
Z∞
T
GO := eA t
C T C eAt dt (9.2)
0

dette rispettivamente Gramiano di controllabilità e Gramiano di osservabilità. Perché il sistema


sia controllabile è necessario e sufficiente che i Gramiani siano non singolari. Senza scendere nel
dettaglio28 è comunque utile far notare che il Gramiano di controllabilità è associato alla risposta
impulsiva dello stato del sistema. Se infatti applichiamo una storia temporale impulsiva a tutti gli
ingressi del sistema u = [1]δ(t), utilizzando l’integrale di convoluzione si ottiene che

Zt
x(t) = eA(t−τ ) B[1]δ(τ )dτ = eAt B[1].
0

Il Gramiano di osservabilità è invece associato all’andamento delle uscite in funzione delle condizioni
iniziali, y(t) = CeAt x0 . Il calcolo del Gramiano di controllabilità e del suo duale, il Gramiano di
osservabilità, non si effettua attraverso la risoluzione dell’integrale presente nella definizione, bensı̀
attraverso la risoluzione delle equazioni di Lyapunov associate

AGC + GC AT + BB T = 0, (9.3)
T T
A GO + GO A + C C = 0. (9.4)

Se infatti scriviamo l’espressione AGC + GC AT utilizzando la definizione del Gramiano, ricordando


che la matrice A è costante è può essere portata sotto il segno di integrale,
Z∞ ³ ´ Z∞
At T AT t At T AT t T d ³ At T
´
Ae BB e +e BB e A dt = e BB T eA t dt
dt
0 0

che, essendo il sistema asintoticamente stabile può essere integrata, e risulta pari a −BB T . Ana-
logamente si può dimostrare l’equazione per la determinazione del Gramiano di osservabilità. La
relazione fra la controllabilità (osservabilità) e il Gramiano ad essa associato rimane valida anche
nel caso di sistemi lineari a coefficienti variabili nel tempo, a patto di sostituire al termine e At l’e-
spressione della matrice di transizione. Nel caso particolare di sistemi lineari a coefficienti costanti,
si può verificare che le condizioni sui Gramiani sono verificate, se e solo se vengono verificate le
usuali condizioni algebriche sul rango delle matrici [B AB A2 B . . .] e [C T (CA)T (CA2 )T . . .]. A
differenze del criterio algebrico però, l’uso dei Gramiani, nel caso in cui non si abbia completa
controllabilità o osservabilità, permette di avere un maggior grado di informazioni sulle proprietà
del sistema. Infatti tramite la rappresentazione spettrale, si può scrivere che
N
X
G = V Diag {λ} V T = λi vi viT . (9.5)
i=1

Essendo i Gramiani al più delle matrici semidefinite positive, gli autovalori λ saranno tutti maggiori
di zero o al più nulli. Si potrà allora valutare la controllabilità/osservabilità non solo sulla base
di un’asserzione del tipo “sı̀/no”, come nel caso dei criteri algebrici, bensı̀, essendo gli autovettori
28 Per una dimostrazione di questo risultato ci si può riferire a quanto contenuto nel testo B. Friedland, Control

System Design. An Introduction to State-Space Methods. McGraw–Hill. 1997.

62
normalizzati, si avrà a disposizione una “misura relativa” di tali proprietà, in modo da stabilire quale
parte dell’autospazio del Gramiano contribuisce significativamente al valore dello stesso, e quindi
quali componenti sono più o meno controllabili/osservabili, attraverso l’analisi del sottospazio degli
autovettori associati. Purtroppo però, se non si pone attenzione alla scalatura delle grandezze
fisiche presenti nel modello, i due Gramiani saranno spesso definiti su scale di grandezza diverse;
basti pensare che generalmente si riferiscono a grandezze dimensionalmente diverse. È perciò
essenziale definire uno spazio comune e opportunamente scalato all’interno del quale le due matrici
possano essere confrontate.
Come verrà mostrato più avanti, si possono effetture delle trasformazioni dei Gramiani tali da
renderli uguali fra loro e di struttura diagonale29 . Tale procedimento è detto bilanciamento della
controllabilità e dell’osservabilità del sistema. Per ottenere la trasformazione lineare che porta
alle variabili di stato bilanciate si parte dalla trasformazione in forma spettrale del Gramiano di
controllabilità

GC = VC Λ2C VCT ,

dove per la matrice diagonale degli autovalori è stata indicata con l’esponente due per sottolineare
il fatto che gli autovalori sono tutte quantità posiitive. Si può allora definire una matrice di
trasformazione di controllabilità TC = VC ΛC , che sarà sicuramente non singolare. Applicando tale
trasformazione in modo tale che x = T x̂ 30
d
G −1 −T
C (TC ) = TC GC TC = Λ−1 T T −1
C VC VC ΛC ΛC VC VC ΛC = I, (9.6)
d
G T
O (TC ) = TC GO TC . (9.7)

d
Utilizzando ora la rappresentazione spettrale del nuovo Gramiano di osservabilità G 2 T
O = V O ΛO VO
−1
è possibile definite una nuova matrice di trasformazione TO = VO ΛO 2 . L’applicazione di questa
trasformazione porta ai seguenti nuovi Gramiani
1 1
g
G −1 d −T
C (TO TC ) = TO GC TO = ΛO2 VOT VO ΛO2 = ΛO , (9.8)
g Td −1 −1
G O (TO TC ) = TO GO TO = ΛO 2 VOT VO Λ2O VOT ΛO 2 = ΛO . (9.9)

In questo modo il sistema risultante dopo le due trasformazioni è caratterizzato da due Gramiani
uguali e diagonali. La matrice di trasformazione che porta al sistema bilanciato è quindi T B =
TC TO . A partire dal sistema bilanciato è possibile decidere quali sono gli stati che effettivamente
caratterizzano il sistema, che saranno quelli legati ai valori più elevati sulle diagonali dei Gramiani,
ottenendo quindi buone indicazioni sulle scelte da fare per ottenre dei modelli ridotti.
Nelle applicazioni pratiche, per calcolare la matrice di bilanciamento, non si eseguono tutti
i passaggi appena visti ma si ricorre alla scomposizione a valori singolari SVD (Singular Value
Decomposition), che permette di rappresentare una qualunque matrice, anche rettangolare nel
seguente modo

A = U Σ2 V T ,

dove Σ2 è la matrice diagonale dei valori singolari, che sono dei numeri sempre positivi 31 . Se
prendiamo in considerazione una generica matrice di trasformazione T , potremo scrivere che

GC = T GC (T ) T T , (9.10)
−T −1
GO = T GO (T ) T . (9.11)
29 Quanto presentato nel seguito ha senso per sistemi per cui siano già stati eliminati gli stati completamente non

osservabili o non controllabili.


30 Il sistema trasformato sarà quindi dato da x̂˙ = T −1 AT x̂ + T −1 Bu, con la relazione di uscita y = CT x̂ + Du.
31 I valori singolari di una matrice arbitraria A sono pari alla radice quadrata degli autovalori della matrice A T A,

che risulta essere sempre una matrice semidefinita positiva. Se A è una matrice m × n, la colonne della matrice
U saranno gli autovettori della matrice AAT (dimensioni m × m), e quelle della matrice V saranno gli autovettori
della matrice AT A.

63
Il prodotto dei due Gramiani sarà allora uguale a

GC GO = T GC (T ) T T T −T GO (T ) T −1 = T GC (T ) GO (T ) T −1 (9.12)

Se allora vogliamo ottenere GC = GO = ΛO deve valere la seguente relazione

GC GO = T Λ2O T −1 , (9.13)

che corrisponde ad una decomposizione a valori singolari32 del prodotto dei due Gramiani, con
U = T , Σ2 = Λ2 e V T = T −1 . La matrice di trasformazione TB è quindi pari alla matrice U della
decomposizione a valori singlari del prodotto dei Gramiani. La matrice di bilanciamento T B può
può diventare rettangolare una volta che si sono eliminati i termini non (o poco in termini relativi)
controllabili/osservabili, secondo un criterio di scarsa contribuzione alla relazione ingresso uscita
del sottospazio associato ai valori singolari ritenuti trascurabili.

10 METODI DI INTEGRAZIONE DIRETTA PER IL


PROBLEMA TERMOELASTICO
Nei precedenti capitoli si è visto come il ricorso all’approssimazione modale consentisse di ridurre
ad un numero limitato di equazioni sistemi di dimensioni molto maggiori, consentendone di conse-
guenza una soluzione delle equazioni della dinamica strutturale assai efficiente.In alcuni casi però,
una analisi di bilancio globale fra il costo computazionale della base modale e quello del numero
di condizioni dinamiche da simulare, può consigliare di procedere attraverso una soluzione diretta.
Nei casi invece in cui si debbano analizzare sistemi termoelastici non lineari di grandi dimensioni,
per i quali l’approssimazione modale in senso stretto non è più possibile, il ricorso alla soluzione
diretta diviene obbligato. Si procede allora direttamente all’integrazione del sistema di equazioni
differenziali ordinarie ottenuto dopo aver discretizzato spazialmente il sistema attraverso l’uso del
metodo ad elementi finiti (o differenze finite, o volumi finiti).
Valutato l’approccio più conveniente si deve notare che per entrambe le scelte il conseguimento
del risultato passa attraverso la risoluzione di un sistema lineare33 (nel caso di integrazione diretta
si risolve un sistema tante volte quanti sono i passi temporali considerati), che, affinché sia effi-
cientemente risolubile anche nei casi di milioni di equazioni, deve essere caratterizzato da matrici
sparse.
Un metodo di integrazione diretta alle differenze, del tipo noto in letteratura attraverso la sigla
LMM (Linear Multistep Methods), può essere scritto nella seguente forma
k
X k+1
X
xk+1 = αi x i + βi x i , (10.1)
i=k−r i=k+1−r

dove con xk si è indicato lo stato valutato al tempo tk . Se il termine xk+1 non dipende da se stesso
(βk+1 = 0), si dice che il metodo è esplicito, intendendo che lo stato al tempo k + 1 può essere
determinato direttamente noti i vettori di stato ai passi precedenti. In caso contrario il metodo
sarà implicito. È noto dal corso di Calcolo Numerico che un metodo esplicito è condizionatamente
stabile, ovvero esiste un passo di integrazione massimo utilizzabile, oltre il quale la soluzione risulta
instabile. Tale fatto è fortemente limitante nei casi in cui i tempi caratteristici del sistema siano
sensibilmente maggiori di quelli permessi del metodo, il dominio temporale abbracciato dell’intera
simulazione sia grande, e la precisione del calcolatore non consenta di avvertire le variazioni sulla
soluzione dovute a passi temporali troppo piccoli.
Perciò si ricorre a metodi impliciti che per i quali è possibile dimostrare la legge, note spesso
come barriere di Dalquist, per la quale: nessun metodo esplicito può essere incondizionatamente
stabile, non vi sono metodi impliciti LMM incondizionatamente stabili di ordine superiore al se-
condo, fra tutti i metodi impliciti LMM del secondo ordine incondizionatamente stabili la massima
32 Non corrisponde ad una decomposizione spettrale perchè il prodotto dei due Gramiani non è detto che sia una

matrice simmetrica e definita positiva, e quindi la decomposizione spettrale può dare vita ad una matrice diagonale
degli autovalori con valori negativi o complessi.
33 Anche nel caso di equazioni non lineari, utilizzando il metodo di Newton-Raphson, ci si riduce a risolvere in

maniera iterativa il sistema di equazioni linearizzato localmente.

64
precisione è quella ottenibile con il metodo dei trapezi, noto anche come metodo di Crank-Nicholson.
Tale metodo permette di risolvere il problema ẋ = f (x) attraverso questa semplice espressione
∆t ³ ´
xk+1 = xk + f (xk+1 ) + f (xk ) . (10.2)
2
Essendo possibile una decomposizione modale per un qualsiasi sistema di equazioni differenziali a
coefficienti costanti lo studi delle caratteristiche del metodo d’integrazione potranno essere studiate
molto semplicemente considerando la semplice equazione: ẋ = ax, avendo cura di tenere in conto di
valori per la costante a che possono anche appartenere a dominio dei numeri complessi. Il problema
dello studio della stabilità del metodo si basa sull’analisi delle soluzioni di una equazione scalare
alle differenze. Per risolvere un’equazione alle differenze, si devono studiare le radici ρ del poli-
nomio caratteristico ad essa associato34 . Perché la soluzione sia stabile le soluzioni dell’equazione
caratteristica devono avere un modulo minore o uguale ad uno per qualunque passo d’integrazione
affinché la soluzione sia incondizionatamente stabile.
In genere, a causa del principio di sovrapposizione degli effetti, la stabilità viene studiata
per valori puramente reali e puramente immaginari della soluzione, cosicché se verificata per tali
valori e verificata anche per valori qualsiasi. Nel caso del metodo di Crank-Nicolson l’equazione
caratteristica è pari a
µ ¶ µ ¶
∆t ∆t
ρk+1 1 − a − ρk 1 + a = 0, (10.3)
2 2
da cui si ottiene la seguente soluzione
2 + a∆t
ρ= (10.4) cn
2 − a∆t
Se consideriamo un sistema strutturale non smorzato, il valore di a sarà in generale dato da un
numero complesso puro. In questo caso il modulo di ρ è sempre pari ad 1 per qualsiasi valore del
passo temporale ∆t, e l’unico errore che si commette è un errore di fase. Se a è reale e negativo il
valore di ρ contenuto nella (10.4) è un’approssimazione del relativo esponenziale associato all’inte-
grale generale eaδt . In ogni caso la precisione che si ottiene è del secondo ordine, con coefficiente
del residuo minimo fra tutti i metodi incondizionatamente stabili.
In generale è possibile distinguere due tipi di stabilità incondizionata: la A-stabilità e la L-
stabilità. Si parla di A-stabilità quando, per a nel semipiano sinistro,

lim |ρ| ≤ 1 ma sempre > 0 (10.5)


|a|∆t→∞

e di L-stabilità se

lim |ρ| → 0. (10.6)


|a|∆t→∞

La prima proprietà assicura che il metodo sia inocndizionatamente stabile e che sia in grado di
integrare il sistema in maniera precisa anche quando gli autovalori hanno valori assoluti grandi (si-
stemi molto smorzati o con frequenze proprie molto alte). La seconda proprietà invece ci assicura
che le componenti della soluzione con valori di a in modulo molto elevati, vengono rapidamente
eliminate. Di solito questa proprietà è molto importante perché la scelta del passo di integrazione
temporale viene fatta sulla base delle frequenze massime contenute nel sistema da simulare che si
vogliono rappresentare con precisione. Tutto ciò che è al di fuori di questa banda di frequenza non
deve essere rappresentato e non deve disturbare la soluzione, per cui è opportuno utilizzare metodi
che alle alte frequenze siano L-stabili. A questo punto è necessario effettuare una scelta di compro-
messo, in quanto la A-stabilità fornisce un’integrazione massimamente precisa, ma la L-stabilità
consente il taglio delle soluzioni ad alta frequenza (cioè il metodo diventa un filtro passabasso), so-
luzioni che devono essere appunto smorzate. Alla classe dei metodi A-stabili appartengono i BDF
(Backward Difference Formulas). Riassumendo si è detto che serve un metodo veloce e preciso
(quindi del second’ordine), incondizionatamente stabile, consistente per garantire la convergenza,
34 La soluzione generale di una equazione lineare alle differenze è del tipo Aρ k .

65
ed abbastanza semplice da usare, ovvero un metodo senza troppi passi, possibilmente con dissipa-
zione numerica, comportamento di ρ asintotico, ossia del valore di ρ assunto quando |a| → ∞, al
variare di ∆t controllabile.
I metodi a più passi necessitano di una procedura di avviamento per generare i primi valori
della soluzione, quando non ci sono dati sufficienti ai tempi precedenti. Anticipando considerazioni
successive, per generare i primi passi è possibile applicare, ad esempio, il metodo di Crank-Nicolson
e poi successivamente ripristinare i coefficienti del metodo multipasso utilizzato, ricalcolare la ma-
trice del sistema e ripartire. Questa soluzione è però poco efficiente, perciò si preferisce aggiungere
un grado di complicazione, ma partire con un metodo esplicito di precisione maggiore o uguale
rispetto a quella del metodo implicito successivamente utilizzato. Essendo utilizzato solo per pochi
passi iniziali, spesso uno solo, l’uso di un metodo esplicito non pone particolari problemi, ne di
stabilita’ ne di efficienza, in quanto, ad esempio, per grandi problemi problemi strutturali richiede
solo il calcolo delle accelerazioni e le matrici di massa sono solitamente diagonali.

10.1 METODO DI INTEGRAZIONE IMPLICITA A PRESTAZIONI


MODULABILI
Il metodo che verrà mostrato è il seguente metodo implicito a due passi per equazioni differenziali
del primo ordine:

xk+1 = a0 xk + a−1 xk−1 + b1 ẋk+1 + b0 ẋk + b−1 ẋk−1 , (10.7)

dove i coefficienti possono essere espressi in funzione di due parametri β e δ

a0 = 1 − β
a−1 = β
1
b1 = + δ
2
(1 + β)
b0 = − 2δ
2
β
b−1 = + δ
2

si può verificare che i valori dei coefficienti β e δ sono esprimibili direttamente in funzione del ρ
asintotico ρ∞
2 2
4 |ρ∞ | − (1 − |ρ∞ |)
β= 2 , (10.8)
4 − (1 − |ρ∞ |)
2
1 1 − |ρ∞ |
δ= (10.9)
2 4 − (1 − |ρ∞ |)2

Definendo opportunamente il valore di ρ∞ è possibile trovare il giusto compromesso fra la preci-


sione a basse frequenze e le prorietà di filtraggio del metodo alle alte frequenze. Nel caso in cui
questo valore sia unitario si ottiene una variante del metodo di Crank-Nicolson espansa a due passi
temporali
µ ¶
1 1
xk+1 = xk−1 + ∆t f (xk+1 , tk+1 ) + f (xk , tk ) + f (xk−1 , tk−1 ) . (10.10)
2 2
Nel caso invece esso tenda a zero si ottiene il metodo BDF del second’ordine (differenze finite
all’indietro su due passi) che e’ L-stabile
4 1 2
xk+1 = xk − xk−1 + ∆tf (xk+1 , tk+1 ) . (10.11)
3 3 3
Definendo r (k, k − 1) = a0 uk + a−1 uk−1 + +b0 u̇k + b−1 u̇k−1 , il metodo che si utilizzerà può essere
riscritto nella forma: uk+1 = b1 u̇k+1 + r (k, k − 1) .

66
Quindi :

u̇k+1 = b1 ük+1 + p (k, k − 1)

Il sistema da risolvere è del tipo: M ük+1 + C u̇k+1 + Kuk+1 = Qk+1 che sostituendo diventa :
¡ ¢
M + b1 C + b21 K ük+1 = Qk+1 − R

Dove R = Cp + Kr + b1 Kp
METODO DEI RESIDUI PESATI
Il metodo precedentemente riportato non è l’unico possibile per l’integrazione diretta del pro-
blema termoelastico, anche se permette di risolvere facilmente problemi differenziali misti pri-
mo/secondo ordine e anche sistemi di equazioni algebrico differenziali arbitrarie. E’ possibile uti-
lizzare anche il metodo dei residui pesati per realizzare un approccio ad elementi finiti considerando
funzioni di Lagrange paraboliche.
t
Definendo ξ = ∆t , la soluzione si può scrivere:
1 1
u (ξ) = (ξ + 1) ξuk+1 + (ξ + 1) (ξ − 1) ξuk + (ξ − 1) ξuk−1
2 2
R
k+1
Passando alla formulazione debole si ottiene: (M ü + C u̇ + Ku − Q)wdt = 0 con w opportune
k−1
funzioni peso. Se w è la delta di Dirac nel punto k+1 si ottiene un metodo BDF all’indietro, mentre
se è la delta di Dirac in k si ottengono le differenze finite centrate, L’utilizzo di differenti funzioni
peso porta alla definizione di un pletora di metodi a due punti.
METODO DI NEWMARK
E’ possibile esprimere la soluzione al passo successivo in funzione di quella al passo precedente
nel modo seguente: T RIALREST RICT ION . A questo punto si approssima la soluzione (costante
nell’intervallo, lineare, o in altri modi) e si calcola l’integrale in modo approssimato, ottenendo i
coefficienti del metodo. Nel caso del metodo di Newmark si ottiene:
£¡ ¢ ¤
uk+1 = uk + u̇k ∆t + ∆t2 21 − β ük + β ük+1
u̇k+1 = u̇k + ∆t (1 − γ) ük+1 + γ ük+1

α>0
Con : γ = 0.5 + α e α ottimale pari a 0.05.
β = 0.25γ 2
In assenza di smorzamento il metodo è del second’ordine.
Se γ = 0.5 e β = 0.25 si ottiene il metodo di Crank-Nicolson o ad accelerazione costante.
Esiste anche il metodo HHT (Huges-Hilbert-Taylor) ma non ho scritto a cosa serve.
STABILITA’ DA UN PUNTO DI VISTA ENERGETICO.
Il concetto di A-stabilità si applica a sistemi lineari attorno alla condizione di equilibrio. Per
estendere il concetto di stabilità si considera la stabilità alla Lyapunov, seguendo un approccio ener-
getico. Senza ulteriori approfondimenti si applicherà tale concetto al metodo di Crank-Nicolson,
ricordando però che è di validità generale e particolarmente utile nel caso
³ di problemi
´ non lineari.
Per Crank-Nicolson valgono le seguenti relazioni: uk+1 − uk = ∆t 2 u̇ k+1 + u̇ k e u̇ k+1 − u̇k =
³ ´
∆t
2 ük+1 + ük .
Dato il sistema : M ü + C u̇ + Ku = Q si definiscono le energie cinetica ed elastica come :
³ ´T ³ ´
∆T = 12 u̇k+1 − u̇k M u̇k+1 + u̇k
³ ´T ³ ´
∆E = 21 uk+1 − uk K uk+1 + uk

Sostituendo le relazioni valide per Crank-Nicolson si ottiene:


³ ´T ³ ´
∆T = ∆t4 u̇k+1 + u̇k M ük+1 + ük
³ ´T ³ ´
∆E = ∆t 4 u̇k+1 + u̇k K uk+1 + uk

67
La variazione di energia totale su un passo diventa :
³ ´T h³ ´ i
∆T + ∆E = ∆t 4 u̇ k+1 + u̇ k M ü k+1 + Ku k+1 + (M ü k + Ku k ) =
³ ´T ³ ³ ´´
= ∆t
4 u̇k+1 + u̇k Qk+1 + Qk − C u̇k+1 − u̇k

Nel caso di forze esterne e smorzamenti nulli l’energia è nulla e quindi il metodo è conservativo.
Se sono presenti forze esterne è smorzamento possibile esprimere l’energia come il lavoro di queste,
infatti:
R T
k+1
∆T + ∆E = LF ext = u Qdt
k
³ ´T ³ ´T
∆t 1
4 u̇ k+1 + u̇ k (Q k+1 + Q k ) = 2 u k+1 − u k (Qk+1 + Qk )
³ ´T
∆T + ∆E = 12 uk+1 − uk (Qk+1 + Qk )

Il primo termine dell’ultima espressione è lo spostamento, mentre il secondo è la forza media. Di


conseguenza la variazione di energia è pari al lavoro delle forze esterne calcolato con la formula dei
trapezi.
Perciò il metodo di Crank-Nicolson rappresenta correttamente il teorema dell’energia cinetica.

11 SMORZAMENTO STRUTTURALE
Finora abbiamo considerato problemi di risposta di sistemi strutturali elastici non dissipativi,
basati cioè su equazioni del tipo M ẍ + Kx = F , o al massimo con termini di smorzamento esterno.
Vogliamo ora dire qualcosa sullo smorzamento strutturale. Take smorzamento è un fenomeno
alquanto complesso, per la cui valutazione si deve spesso ricorrere a rilevazioni sperimentali.
Nel campo delle strutture aeronautiche è noto che il fattore di smorzamento ξ ' ωσ e’ dell’ordine
dei millesimi/centesimi per singoli componenti, di centesimi/decimi per la struttura assemblate
con giunzioni rivettate. Questo aumento del fattore di smorzamento è dovuto alla dissipazione
coulombiana che si genera dallo scorrimento relativo fra le parti delle giunzioni. Tale dissipazione
v
è generata da forze del tipo: R = −f (v) N |v| , ovvero è legata alla velocità da una relazione
non lineare, i cui parametri costituenti sono valutabili in modo assai approssimato, anche quando
vengono usate macchine rivettatrici automatiche, comunque ben diversa da R = −Cv che è la
relazione spesso utilizzata praticamente, con poche o nulle giustificazioni (fisiche) se non la linearita.
Ciononostante si deve spesso comunque ricorrere per convenienza di calcolo a rappresentazioni
dell’attrito, lineari e viscose, valutate con coefficienti di proporzionalita’ atti a rappresentare una
dissipazione energeticamente equivalenti alla dissipazione media reale.
D’altro canto i dati sperimentali evidenziano spesso una rappresentazione del sistema strut-
turale in coordinate modali sostanzialmente reali con smorzamento significativamente diagonale,
cioè gli smorzamenti dei singoli modi sono praticamente disaccoppiati. Essendo la formulazione
modale ottenibile da un modello “esatto”, tipicamente basato su una approssimazione ad elementi
finiti ad elevato numero di nodi, sara’ derivabile tramite la: U T M U q + U T CU q̇ + U T KU q = Q,
in cui le matrici di massa e rigidezza sono state diagonalizzate dalle proprietà di ortogonalita’ dei
modi, mentre la matrice di smorzamento è posta diagonale sulla base dell’evidenza sperimentale.
Si evidenzia quindi la necessita’ di poter comprendere sulla basse di quali meccanismi, possibil-
mente fisici e non solo matematici, la matrice originaria C possa soddisfare le stesse condizioni di
ortogonalita’ proprie di M e K.
SMORZAMENTO PROPORZIONALE
E’ facile constatare che utilizzando un termine di smorzamento proporzionale del tipo: C =
αM +βKsi ottiene una forma modale dello smorzamento che e’ diagonale. Si potrà dunque scrivere:
¡ 2
¢
¡M s2 + Cs + K u = 0 ¢
¡M s¡ 2+ αM s¢ + βKs + K ¢u = 0
¡M s 2+ αs ¢ + K (βs + 1) u = 0
−M ω̄ + K = 0
2
ω̄ 2 = − sβs+1
+αs

68
Si puo’ allora vedere che tale problema porti ad autovettori reali con omega segnato reale, ricavato
il quale e poi possibile ottenere gli autovalori smorzati originali s.
Sebbene considerare lo smorzamento di tipo proporzionale rifletta la possibilita’ di diagonaliz-
zare la matrice di smorzamento modale, resta da definire il senso fisico di tale legame con la massa
e la rigidezza. Inoltre dall’ultima relazione scritta si ottengono tante uguaglianze quanti sono i
modi, ma sperimentalmente non si verifica quasi mai che ad ogni frequenza siano associati gli stessi
parametri α e β.
Perciò si possono trarre le seguenti conclusioni: l’approccio modale è vantaggioso perché con-
densando i modi si ottiene uno smorzamento verificabile sperimentalmente, se si introduce uno
smorzamento proporzionale non si riescono ad avere risultati totalmente concordi con gli esperi-
menti. In generale, quando si adotta uno schema a smorzamento proporzionale e’ quindi gioca forza
accettare un’approssimazione di C, che puo’ correlarsi solo grossolanamente ai dati sperimentali,
ad esempio con un’approssimazione ai minimi quadrati. Sono state ipotizzate anche formulazioni
proporzionali a piu’ parametri, in grado quindi di meglio correlarsi alle risultanze sperimentali,
ma tali approssimazioni fanno intervenire le potenze delle matrici di massa e rigidezza, perdendo
sparsità e simmetria del sistema e diventando quindi di dubbia utilita’ in grossi problemi per cui
si voglia utilizzare l’integrazione numerica diretta, cioe’ senza condensazione modale.
Ritornando comunque alla ricerca di meccanismi fisici che giustifichino lo smorzamento propor-
zionale, si deve, perlomeno, dimostrare che è sensato legare il valore di smorzamento a quello delle
masse e delle rigidezze.
Per quanto riguarda la proporzionalita’ alla rigidezza, se si ipotizza che la legge costitutiva del
materiale sia di tipo visco-elastica, lineare e senza memoria: σ = D0 ε + D1 ε̇ , ovvero che gli sforzi
dipendano anche dalle velocità di deformazione, si può riscrivere il contributo del lavoro interno
nel P.L.V. come:
RRR T RRR T RRR T
δLi = δε σdV = δε D0 εdV + δε D1 ε̇dV =
V µ V ¶ µ
V ¶
RRR T RRR T
δLi = δuT B D0 BdV u + δuT B D1 BdV u̇ = δuT Ku + δuT C u̇
V V

Se si puo’ ipotizzare che sia D1 = βD0 sara’ presente la proporzionalità tra smorzamento e rigidezza.
Anche se questa giustificazione fosse accettabile, nel caso di una struttura non omogenea come
accade spesso nel caso aeronautico, se il coefficiente β assumesse, com’e’ ragionevole pensare, più
valori la matrice C non sarebbe comunque diagonale, cosı̀ come i modi non sarebbero reali. E’
pertanto evidente che anche nel caso visco-elastico, lineare e senza memoria, un solo coefficiente di
proporzionalita’, omogeneo e indipendente dal materiale, appare come una sicura forzatura.
Puo’ comunque essere utile comprendere il livello di approssimazione del comportamento visco-
elastico, lineare e senza memoria, considerando il materiale come un sistema micromeccannico
genericamente lineare per il quale gli sforzi non sono altro che le uscite e le forzanti sono legate
all’imposizione di deformazioni. Sara’ pertanto possibile scrivere:
Z∞
σ (t) = d (t − x)ε (t) dt
0

da cui, in frequenza, σ (ω) = d (ω) ε (ω).


Da una residualizzazione dinamica totale, approssimazione quasi stazionaria, del tipo: y =
P
n
Cl x l + Du/i (sbagliate per presenza lento e mancano i punti di derivazione) è possibile ap-
i=1
prossimare la relazione costitutiva viscoelastica come proporzionale alla deformazioni e alle sue
derivate temporali. Tale formulazione potrebbe essere estesa alle accelerazioni di deformazione,
senza variare l’ordine del sistema, e aggiungerebbe, oltre allo smorzamento, un’inerzia apparente.
La possibilita’ di un’approssimazione quasistazionaria della legge costitutiva e’ legata alla possibi-
lita’ di accettare che la risposta del materiale sia assai piu’ rapida della variazione temporale delle
deformazioni dinamiche e puo’ essere accettabile per la dinamica a bassa frequenza delle strutture.
Tale effetto appare microscopicamente come una variazione del modulo di Young, che aumenterà
con la velocità di carico. In ogni caso fermando l’approssimazione quasi stazionaria della visco-
elasticita’ alla velocita’ di deformazione non si puo’ ottenere nessun termine viscoso proporzionale
alla massa.

69
Sara’ quindi necessario cercare una giustificazione diversa per tale termine. Cominciamo col
constatare che tale termine si puo’ ricondurre ad una dipendenza dalle velocità assolute Infatti il
termine inerziale compare nel lavoro esterno e in questo compaiono gli spostamenti assoluti:
 
ZZZ ZZZ
δLe = δsT ρs̈dV =δuT  N T ρN dV  ü = δuT M ü
V V

Analogomante lo smorzamento porta al P.L.V. un contributo del tipo:


 
ZZZ ZZZ
δsT cṡdV =δuT  N T cN dV  u̇ = δuT C u̇
V V

e la presenza di proporzionalità tra massa e smorzamento sara verificata se c = αρ. Ancora


una volta si nota che, qualora cio’ fosse anche vero, e’ da ritenere abbastanza improbabile una
proporzionalita’ con un solo valore costante.
Un ulteriore assurdo si avrebbe nel caso di strutture libere poiche’, essendo al matrice di mas-
sa definita positiva, si avrebbe uno smorzamento associato anche a movimenti rigidi, il che e’
palesemente improponibile senza alcun collegamento al suolo. Si dovrebbe percio’ determinare
una proporzionalita’ associata ai soli modi deformabile, il che, riportato alle cordinate nodali,
distruggerebbe ogni sparsita’ di M ..
Se invece la struttura è vincolata al suolo, allora il problema precedentemente esposto non
sussiste, senza pero’ eliminare la dubbia validita’ fisica della proporzionalita alla massa.
Per garantire una qualche fisicità si puo’ ricorrere alla supposizione di associare uno smorza-
mento al moto della superficie della struttura, affermando che ogni punto di essa è soggetto alla
forza viscosa generata dall’aria:
 
ZZ ZZ
δsT cṡdS = δuT  N T cN dS  u̇
A A

da cui recuperare la proporzionalita alla massa accettando che la relativa distribuzione delle forze
d’inerzia non vari significativamente distribuendo le masse sulla superficie della struttura. Tale ope-
razione non è totalmente perigina per le basse frequenza di strutture diaframmata, ragion per cui la
proporzionalita’ alla massa si puo associare ad un’approssimazione delle forze idro/aerodinamiche.
Per strutture in aria ferma si tratta di una grossolana approssimazione degli effetti aeroelastici,
accettabile solo in quanto mette a disposizione un parametro in piu’.
2
Si noti che dall’espressione: ω̄ 2 = − sβs+1
+αs
si ricava che:
¡ ¢
s2 + α + β ω̄ 2 s + ω̄ 2 = 0
s ' σ + j ω̄
ξ = ω̄σ = ω̄α + β ω̄

Si nota che all’aumentare della frequenza la massa tende a far diminuire lo smorzamento e viceversa
per la rigidezza.
Lo smorzamento strutturale e spesso rappresentato nel modo seguente:
¡ 2 ¢
−ω M + (1 + jg) K u (ω) = F (ω)

introducendo cioe’ lo smorzamento come parte complessa della matrice di rigidezza, tramite un solo
valore costante. In questo modo si ottiene uno smorzamento costante nel dominio delle frequenze,
che riproduce abbastanza bene le risultanze sperimentali su una certa classe di strutture, quali
quelle aeronautiche metalliche costruite con “metodi classici”.
Il problema di questa rappresentazione risiede nel fatto che la matrice di rigidezza non è rap-
presentabile nel tempo e tale artificio e’ utilizzabile solo per analisi armoniche, leggi anche risposte
in frequenza.
Concludiamo ora evidenziando che l’evidenza sperimentale di una sostanziale diagonalita’ della
matrice di smorzamento mondale e’ dimostrabile con una approssimazione tramite uno viluppo

70
fig1

troncato al primo ordine di perturbazioni attorno ad autosoluzioni reali del problem dei modi
propri. ¡ ¢
Dal problema M s2 + K u = 0 si calcolano le frequenza
¡ proprie. Se si¢ introduce una perturba-
zione associata alla matrice di smorzamento, si ottiene: M s2 + Cs + K u = 0 e se lo si considera
diagonale e moderato, per studiare come esso influisce sulle frequenze proprie si sviluppa in serie
l’espressione precedente.
La derivata viene effettuata secondo un generico parametro p della matrice di smorzamento.
¡¡ ¢ ¢
M s2 + Cs + K u /p = 0
¡ ¢ ¡ ¢
(2M s + C) s/p + sC/p u + M s2 + Cs + K u/p = 0

Per calcolare la derivata dell’autovettore, si premoltiplica per uT e si traspone il tutto, considerando


la simmetria delle tre matrici. Si ottiene:
¡ T¡ ¢ ¢T ¡ ¡ ¢ ¢T
u (2M s + C) s/p + sC/p u + uT M s2 + Cs + K u/p = 0
¡ T¡ ¢ ¢T ³ ¡ ¢ T´
u (2M s + C) s/p + sC/p u + uT/p M s2 + Cs + K u =0
¡ T¡ ¢ ¢T
u ¡ (2M s + C) s/p + sC/p¢ u = 0
uT (2M s + C) s/p + sC/p u = 0
La derivata calcolata per C = 0 diventa:
suT C u uT C u
/p
s/p = − 2suT M u
= − 21 uT M/pu = − 2m 1 T
u C/p u
1
s/Cik = − 2m ui uk
P
n Pn
1
∆s = s/Cik Cik = − 2m uT Cui
i i
i,k=1 i,k=1

Si vede cosi’ che per l’espressione precedentemente scritta, troncata al prim’ordine, è ragionevole
considerare la matrice di smorzamento diagonale e i modi tutti reali.

12 OSSERVATORE OTTIMO
Per la determinazione dell’osservatore necessario a realizzare il controllo ottimo era stato suggerito
di utilizzare un procedimento analogo a quello usato per la sintesi del controllore basandosi sul
principio di dualità, ossia applicando il controllo ottimo al sitema duale

ż = AT z + C T u,
(12.1)
v = B T z.
Tale modalità di progettazione conserva per l’osservatore le buone proprietà già ottenute per il
controllore ottimo. Rimaneva però da risolvere il problema di comprendere quale significato fisico

71
attribuire alle matrici di peso Q ed R in questo caso. Questa lacuna può essere colmata, sfruttando
le conoscenze acquisite sulla risposta stocastica di un sistema agli stati, andando ad analizzare il
comportamento dell’osservatore applicato ad un sistema che sia sollecitato da dei disturbi appros-
simabili come dei rumori bianchi e le cui misure siano anch’esse soggette ad errori/disturbi dello
stesso tipo. Tale modello è di validità assolutamente generale, in quanto, il caso di disturbi non
rappresentabili come rumori bianchi può essere ricondotto a questo semplicemente attraverso la
definizione di opportuni filtri di forma, aventi in ingresso un rumore bianco e in uscita il rumore
effettivamente applicato al sistema.
Scriviamo allora le equazioni del sistema soggetto ad dei disturbi esterni sullo stato n e sulle
misure r
ẋ = Ax + Bu + n
(12.2)
y = Cx + r

Le equazioni del sistema dinamico dell’osservatore possono essere scritte come

ẋ = Ax + Bu + L(y − yo ) (12.3)

e quindi

ẋ = Ax + Bu + L(y − r − Cx) = (A − LC)x + LCx − Lr + Bu. (12.4)

L’equazione dell’errore di osservazione e = x − x sarà quindi la seguente

ė = (A − LC)e + Lr + n (12.5)

La varianza σee dell’errore sarà pertanto ottenibile attraverso l’equazione di Lyapunov


2 2
(A − LC)σee + σee (AT − C T LT ) + [ I L ]W [ I L ]T = 0 (12.6) eq-var-err1

dove W è la matrice delle intensità dei rumori bianchi


· ¸
Wnn Wnr
W = .
Wrn Wrr

Nel caso in cui i due rumori bianchi siano generati in maniera indipendente l’uno dall’altro, potremo
supporre che essi siano scorrelati e che quindi i termini di accoppiamento W nr e Wrn siano nulli
(in seguito vedremo che questo vincolo può essere facilmente rimosso). Dalla (12.6) si ottiene
2 2
(A − LC)σee + σee (AT − C T LT ) + Wnn + LWrr LT = 0 (12.7)

L’osservatore ottimo sarà quello in grado di minimizzare la varianza dell’errore di osservazione.


Essendo tale varianza nel caso generale una matrice, dovremo minimizzare una sua misura in
norma, come ad esempio la sua traccia. L’obiettivo sarà quindi la ricerca della matrice dei guadagni
L tale per cui
¡ 2
¢
min Tr(σee ) . (12.8)
L

E’ facile verificare che, in questo caso, la ricerca delle necessarie condizioni di stazionarietà della
funzione obiettivo richiede le stesse operazioni già incontrate per la sintesi del controllore subottimo.
Indicando con ` il generico coefficiente della matrice L, la condizione di minimo per la traccia
richiederà che
∂ ¡ 2 ¢ ³ ´
2
Tr σee I = Tr σee/` I = 0. (12.9) eq-sigmaee-staz
∂`
Analogamente a quanto fatto per il caso sub-ottimo,possiamo introdurre la matrice Λ 35 soluzione
dell’equazione di Lyapunov aggiunta

(AT − C T LT )Λ + Λ(A − LC) + I = 0. (12.10) eq-kalman-aggiun


35 Corrispondente alla matrice M nella procedura del controllore sub-ottimo.

72
Chiamando la matriceA = A − LC, la (12.9) potrà quindi essere riscritta come (nota: l = Lik )
³ ´ ³ ³ T ´´ ³ ³ ´´
2 2 2 2
Tr σee/` I = −Tr σee/` A Λ + ΛA = −Tr Λ σee/` A + Aσee/` = 0. (12.11) eq-sigmaee-staz

Derivando la (12.6) si ottiene


T
³ T
´
2 2 2 2
σee/` A + Aσee/` = − A/` σee + σee A/` + L/` Wrr LT + LWrr LT/`

e, sostituendo quest’ultima espressione nella (12.11),


³ ´ ³ ³ T
´´
2 2 2
Tr σee/` I = Tr Λ A/` σee + σee A/` + L/` Wrr LT + LWrr LT/`
³ ³ T
´´
2
= 2Tr Λ σee A/` + LWrr LT/` (12.12) eq-condiz-ottim
³ ¡ ¢ ´
2
= 2Tr Λ −σee C T + LWrr LT/` = 0.

Essendo il parametro ` un generico elemento della matrice dei guadagni L,è facile verificare che
L/Lik = [1ik ] e LT/Lik = [1ki ]36 ; osserviamo inoltre che, data una matrice U generica, Tr (U [1ik ]) =
¡ 2 T ¢
Uki . Nel nostro caso la matrice U è in realtà la matrice Λ −σee C + LWrr , per cui ciascuna
derivata ci dice che
¡ ¡ 2 T ¢¢
Λ −σee C + LWrr ik = 0 ∀ i, k

il che implica
¡ 2 T ¢
Λ −σee C + LWrr = 0. (12.13)

Questo sarà sicuramente vero se


2
L = σee C T Wrr
−1
, (12.14) eq-kalman-gain

che ha esattamente la stessa forma di quella ottenibile attraverso la progettazione duale del con-
trollore ottimo. Infatti sostituendo i guadagni ottenuti dalla (12.14) nell’equazione (12.6) della
varianza dell’errore si ottiene
¡ ¢ 2 ³ ¡ 2 T −1 ¢T ´ ¡ 2 T −1 ¢T
2
A − σee C T Wrr
−1
C σee +σee2
AT − C T σee C Wrr +Wnn +σee 2
C T Wrr
−1
Wrr σee C Wrr = 0,

e quindi
2 2
Aσee + σee AT + Wnn − σee
2
C T Wrr
−1 2
Cσee = 0,

che altro non è che l’equazione algebrica di Riccati duale rispetto a quella del controllore. In questo
modo si può comprendere più chiaramente il significato da attribuire ai pesi sullo stato e sugli in-
gressi dell’osservatore. Essi non sono altro che l’intensità del rumore bianco di disturbo dello stato
e delle misure. D’ora in poi quindi potremo denominare l’LQR duale progettazione dell’osservatore
ottimo, nel senso sopra citato. Tale osservatore è anche noto come filtro di Kalman stazionario 37 .
A questo punto dovrebbe anche essere evidente che la condizione di correlazione fra il rumore di
stato e di misura, Wnr 6= 0 e Wrn 6= 0 assumono la funzione di S nella formulazione ottima duale,
per cui, in presenza di accoppiamento, non resta che applicare alla forma duale le formule relative
al corrispondente controllo ottimo (eq. (6.42) e seguenti). Il termine di accoppiamento può essere
diverso da zero, ad esempio, se si utilizza un accelerometro la misura sente l’accelerazione e si porta
dentro il disturbo sullo stato.
Anche per queste matrici di peso varranno le stesse linee guida già presentate nel caso del control-
lore ottimo. Potrà essere utile anche in questo caso introdurre un parametro ρ che permetta di
rappresentare il rapporto fra i pesi assocciati al rumore di misura Wrr e quelli dello stato duale
Wnn . Più si pensa che le misure saranno rumorose più grande dovrà essere il valore da dare a ρ,
con il risultato di ottenere un osservatore più “lento”, ossia che filtra le alte frequenze presenti nei
36 [1
ik ] è una matrice nulla con un unico termine diverso da zero e pari all’unità in posizione (i, k)
37 In quanto esisterà anche la soluzione nel caso di orizzonte non infinito.

73
segnali di misura, e predilige per la stima il risultato della simulazione del sistema dinamico. Al
contrario bassi valori di ρ staranno ad indicare che le misure saranno affette da un basso livello
di rumore e quindi si potrà impiegare un osservatore “veloce”, con guadagni L più elevati. In
ogni caso rimane opportuno ricordare che tali indicazioni non vanno mai viste in modo assoluto in
quante, pur essendo fisicamente interpretabili, Wnn e Wrr devono sempre essere considerate come
delle possibili parametrizzazioni manipolabili ai fini di ottenere un compensatore, tale è infatti
l’osservatore, che combinato con il controllore ottimo sia atto a soddisfare le specifiche di progetto.
I medesimi risultati possono essere ottenuti utilizzando un altro modo di procedere, ossia cer-
2
cando il minimo dela varianza dell’errore sotto il vincolo che la σee sia soluzione dell’equazione di
Liapunov (12.6). Possiamo trasformare infatti questo problema di minimizzazione vincolata in un
problema di minimizzaizone libera attraverso la tecnica dei moltiplicatori di Lagrange. Dovendo
imporre come vincolo una equazione matriciale, avremo una matrice di moltiplicatori di Lagrange
Λ, simmetrica in quanto l’equazione di Lyapunov è simmetrica. A questo punto quindi dovremo
2
cercare il minimo non vincolato rispetto a σee , L, Λ del seguente funzionale
¡ 2 ¡ 2 2
¢¢
f = Tr σee + Λ (A − LC)σee + σee (AT − C T LT ) + Wnn + LWrr LT (12.15)

A questo scopo si ricordi che, per quanto visto prima nel caso della (12.12), possiamo in generale
dire che
∂ ¡ ¢
Tr AB T = A,
∂B
dove con la ∂B si intende la derivazione rispetto a tutti i coefficienti della matrice B. In questo
caso allora le condizioni di stazionarietà saranno pari a
∂f 2 2
= (A − LC)σee + σee (AT − C T LT ) + Wnn + LWrr LT = 0
∂Λ
∂f T T T (12.16)
2 = (A − C L )Λ + Λ(A − LC) + I = 0
∂σee
∂f 2
= LWrr − σee C T = 0, da cui L = σee2
C T Wrr
−1
∂L
questo procedimento spiega il perché dell’uso dell’equazione di Lyapunov aggiunta (12.10), sia in
questo caso che in quello visto precedentemente del controllo sub-ottimo.

13 CONTROLLO OTTIMO IN PRESENZA DI DISTUR-


BI STOCASTICI (LQG)
Nel progetto del controllore in presenza di disturbi stocastici la cifra di merito quadratica che si
vorrebbe minimizzare è la stessa cifra di merito già utilizzata per il controllore ottimo rispetto a
perturbazioni delle condizioni iniziali, cioè:
Z
+∞
1
F = (xT Qx + uT Ru)dt. (13.1) cfm-lqg1
2
0

Essendo il sistema assoggettato ad un rumore bianco in ingresso38 , ossia

ẋ = Ax + Bu + N n, (13.2)

l’intergrale fra 0 e ∞ contenuto nella (13.1) non esiste in generale finito. Essendo però il sistema
ergodico, una misura di prestazioni che assume un maggior significato è il valore atteso, ossia
l’integrale in media della medesima quantià considerata nella (13.1)
Z
1 ¡ ¢
E(F ) = M xT Qx + uT Ru dt. (13.3)
2
38 Al solito, se il rumore in ingresso non è bianco si può rappresentare attraverso un opportuno filtro di forma

avente in ingresso un rumore bianco.

74
Le azioni di controllo saranno quindi proporzionali allo stato secondo la relazione u = −Kx e
quindi
ẋ = (A − BK)x + N n = Ax + N n (13.4)
39
Trascurando l’effetto sulla risposta delle condizioni iniziali la risposta del sistema sarà pari a
Z
+∞

x= eAv N n(t − v)dv (13.5)


0

dove non si considera la dinamica eAt x0 dovuta alle condizioni iniziali. Dovremo allora minimizzare
il seguente funzionale
Z Z∞ Z∞
1 T
A v
E(F ) = M (e N n(t − v) dv) (Q + K RK) eAw N n(t − w)dw dt.
T T
2
0 0
T T
Ricordando la proprietà y M y = Tr(M yy ) possiamo riscrivere quest’ultima espressione come
∞∞ 
Z Z µZ ¶
1  T
E(F ) = Tr eA v (Q + K T RK)eAw N Mn(t − v) n(t − w)dt N T dv dw ,
2
0 0

in cui si è portato all’interno l’integrale in media. Quest’ultimo non è niente altro che la varianza
del rumore bianco in ingresso per cui la funzione obiettivo diventa
∞∞ 
Z Z
1  T
E(F ) = Tr eA v (Q + K T RK)eAw N Wnn δ(w − v)N T dv dw .
2
0 0

Integrando rispetto a w si ottiene infine


∞ 
Z
1  T
E(F ) = Tr eA v (Q + K T RK)eAv dv N Wnn N T 
2
0

Si può notare che la struttura dell’espressione sotto integrale ricorda quella del Gramiano di os-
servabilità, per cui il valore assunto dall’integrale, che chiameremo matrice P , si può ottenere
attraverso la soluzione della seguente equazione di Lyapunov
(AT − K T B T )P + P (A − BK) + Q + K T RK = 0. (13.6)
Si tratta quindi di calcolare il minimo di
Tr(P N Wnn N T ), (13.7)
soggetta al vincolo dato dall’equazione di definizione di P . Analogamente a quanto visto sopra il
problema può essere formulato cercando le condizioni di stazionarietà del seguente problema non
vincolato
¡ ¡ ¢¢
f = Tr P N Wnn N T + Λ (AT − K T B T )P + P (A − BK) + Q + K T RK (13.8)
rispetto alle variabili P , K e Λ. Esse sono le seguenti
∂f
= (AT − K T B T )P + P (A − BK) + Q + K T R = 0
∂Λ
∂f
= (A − BK)Z + Z(AT − K T B T ) + N Wnn N T = 0 (13.9)
∂P
∂f
= RK − B T P = 0, da cui K = R−1 B T P
∂K
Il risultato è esattamente il medesimo ottenuto nel caso del controllo ottimo ad orizzonte infinito per
perturbazione delle condizioni inziali. Il senso di questo risultato è legato al fatto che il controllore,
non potendo agire su un disturbo a larga banda, non può far altro che ignorarlo.
39 Questo viene fatto solo per non appesantire troppo i passaggi matematici; i risultati ottenuti sono però di

validità generale, anche nel caso in cui si tenga conto della parte di risposta dipendente dalla condizioni iniziali.

75
14 CONTROLLORE OTTIMO PER DISTURBI DETER-
MINISTICI (MIN-MAX)
Dato il problema ẋ = Ax+Bu+N n, considerando ora n come un disturbo deterministico non meglio
precisato, vogliamo vedere come è possibile determinare un controllo ottimale che attenui il più
possibile l’effetto di n di sul sistema. Non volendo definire nessun ulteriore dato sulla modellazione
del disturbo utilizziamo un approccio min-max, avente cioè l’obiettivo di determinare il controllo
ottimale in modo da minimizzare l’effetto del disturbo massimo. Cerchiamo allora una soluzione
per cui
• gli ingressi u devono tendere a minimizzare il disturbo per avere un buon controllo,
• il disturbo n deve peggiorare la risposta compatibilmente con l’attività accettabile per
l’ingresso di controllo.
In questo modo otterremo un controllo capace di operare senza instabilizzarsi anche in presenza
dei massimi disturbi che si possa ipotizzare agiscano sul sitema; per questo si parla di controllo
min-max. A tale scopo cerchiamo i controlli u e i disturbi n che ottimizzano la cifra di merito
Z
1 ∞¡ T ¢
F = x Qx + uT Ru − γ 2 nT W n dt, (14.1)
2 0
dove l’utilizzo di −γ 2 fa sı̀ che la soluzione ottenuta fornirà il valore massimo del disturbo soppor-
tabile dal controllo. Imponendo il vincolo della dinamica del sistema con i soliti moltiplicatori di
Lagrange scriveremo
Z
1 ∞¡ T ¢
F = x Qx + uT Ru − γ 2 nT W n + λ (Ax + Bu + N n − ẋ) dt, (14.2)
2 0
la cui condizione di stazionarietà si ottiene chiedendo, ∀δx, δλ, δn, δu, che
δxT Qx+δuT Ru−γ 2 δnT W n+δλ(Ax+Bu+N n− ẋ)+δxT AT λ+δuT B T λ+δnT N T λ−δ ẋT λ = 0,
cioè che
ẋ = Ax + Bu + N n
Qx + AT λ + λ̇ = 0
(14.3)
Ru + B T λ = 0
−γ 2 W n + N T λ = 0
da cui si ottiene
u = −R−1 B T λ
(14.4)
n = γ12 W −1 N T λ
e quindi
ẋ = Ax + (−BR−1 B T + N γ12 W −1 N T )λ
(14.5)
λ̇ = −Qx − AT λ
Otterremo, anche in questo caso, una matrice simplettica che rappresenta la dinamica del sistema
con i moltiplicatori di Lagrange
½ ¾ · ¸½ ¾
ẋ A −BR−1 B T + γ12 N W −1 N T x
= , (14.6)
λ̇ −Q −AT λ
che sappiamo avrà, per costruzione, tutti autovalori a coppie con segno opposto (N/2 autovalori
con parte reale di segno positivo e N/2 autovalori con parte reale di segno negativo). La soluzione
ottima si troverà allora cercando il valore di γ più piccolo (e quindi i distubi maggiori) che consente
di mantenere l’asintotica stabilità, cioè tale per cui nessun autovalore della matrice simplettica vada
sull’asse immaginario40 . Allo scopo di trovare il valore di γ minimo che consente di ottenere un
sistema asintoticamente stabile è possibile utilizzare una tecnica di bisezione partendo da un valore
iniziale di γ sufficientemente elevato.
40 Perché sappiamo che gli autovalori con parte reale positiva scompaiono nella soluzione perché moltiplicati per

una matrice nulla.

76
15 LTR (LOOP TRANSFER RECOVERY)
I controllori ottenuti attraverso la tecnica LQR presentano una elevata robustezza, infatti essi
assicurano un margine di guadagno compreso fra 0.5 e infinito, e uno di fase di almeno 60 ◦ su tutti
i canali. Questo però vale rigorosamente solo nel caso in cui si conosce interamente lo stato ad ogni
istante. Per dualità un discorso analogo si può fare riguardo alle prestazioni del filtro di Kalman.
Nel momento in cui il controllore viene realizzato combinandolo con un osservatore (anche ottimo,
i.e. un filtro di Kalman, nel qual caso si parla di controllo LQG), non vengono più garantite
queste proprietà di robustezza, e anzi in alcuni casi i margini sono talmente bassi da trasformare
facilmente il sistema da stabile ad instabile per piccole variazioni dei parametri caratteristici. Il
problema deriva dal fatto che la funzione di trasferimento in anello aperto per il progetto LQR e
totalmente diversa da quella ottenuta con l’insieme controllore ottimo più osservatore. Dato un
sistema generico del tipo di cui si conosce tutto lo stato
ẋ = Ax + Bu, (15.1)
y = Cx, (15.2)
se chiamiamo K la matrice dei guadagni ottenuta con LQR, potremo scrivere la funzione di trasfe-
rimento in anello aperto, quando l’anello è aperto in corrispondenza degli ingressi dell’impianto 41 ,
come
Llqr (s) = K(sI − A)−1 B. (15.3) lqr-ol

u y
R(s) G(s)

anello aperto anello aperto


ingressi−ingressi uscite−uscite

Nel caso in cui è presente un osservatore, la funzione di trasferimento in anello aperto sarà pari
a
Lo (s) = K(sI − A + BK + LC)−1 LC(sI − A)−1 B, (15.4)
che è ben diversa dalla (15.3). La tecnica del Loop Transfer Recovery tenta di selezionare la
matrice dei guadagni dell’osservatore L in modo tale che, per un certo campo di frequenza valga la
relazione Llqr (s) = Lo (s). Quello che verrà qui di seguito presentata, è una procedura che permette
di ottenere questo risultato in termini di un parametro di aggiustamento ρ, in modo tale che per
ρ → ∞ Lo (s) → Lltr (s).
Discorso analogo per dualità si può fare sul filtro di Kalman, e sui risultati che si ottengono
nel momento in cui si accoppia con un controllore. Si può allora utilizzare la tecnica LTR per
selezionare una matrice dei guadagni K in modo tale che per un certo campo di frequenze valga la
relazione Lkalman (s) = Lo (s), dove Lkalman (s) = C(sI − A)−1 L.

15.1 RECUPERO SUGLI INGRESSI TRAMITE PESATURA DEL-


L’OSSERVATORE
Consideriamo l’effetto di utilizzare una matrice dei pesi Q̂ modificata nell’equazione algebrica di
Riccati del filtro di Kalman, in modo da avere la seguente forma
Q̂ = Q + ρ(BW )(BW )T , (15.5)
41 Nel
caso di sitemi MIMO è possibile definire un’altra funzione di trasferimento in anello aperto ottenuta
spezzando il sistema sulle uscite del sistema che risulta pari a
Llqr = (sI − A)−1 BK.

77
con la matrice W ottenuta attraverso la fattorizzazione di una matrice simmetrica e semidefinita
positiva W , in modo che W = W W T 42 . L’equazione di Riccati diverrà allora pari a

AP + P AT − P C T R−1 CP + Q + ρ(BW )(BW )T = 0. (15.6)



Se dividiamo tutta l’equazione per ρ, questa diventa

P P √ P P 1 √
A √ + √ AT − ρ √ C T R−1 C √ + √ Q + ρ(BW )(BW )T = 0. (15.7) ltr-ric1
ρ ρ ρ ρ ρ
P
Supponendo che per ρ → ∞ la quantità √
ρ si mantenga finita possiamo prendere questa come
P
nuova incognita P = √
ρ, e scrivere

√ 1 √
AP + P AT − ρP C T R−1 CP + √ Q + ρ(BW )(BW )T = 0. (15.8)
ρ

Per ρ → ∞ gli unici termini significativi dell’equazione saranno


√ √
− ρP C T R−1 CP + ρ(BW )(BW )T = 0, (15.9)

da cui

−P C T R−1 CP + (BW )(BW )T = 0. (15.10)

Questa equazione mostra chiaramente che la quantità P risulterà finita come effettivamente ipo-
tizzato. Ricordando che il guadagno si può ottenere dalla soluzione dell’equazione di Riccati come
L = P C T R−1 , otteniamo
T
−LRL + (BW )(BW )T = 0 (15.11)

da cui deduciamo che, per ρ → ∞ la matrice dei guadagni assumerà la seguente forma funzionale
L 1
√ = BW R− 2 . (15.12) l-limite
ρ

Chiamiamo G(s) = C(sI − A)−1 B = CΦB la funzione di trasferimento del sistema ed R(s) =
K(sI − A + LC + BK)−1 L quella del regolatore, ossia dell’insieme dato dall’osservatore piú la
matrice dei guadagni. La matrice di trasferimento in anello aperto rispetto agli ingressi sarà allora
pari a

Lo (s) = R(s)G(s) = K(sI − A + BK + LC)−1 LG(s), (15.13) lo1

Ricordiamo ora le seguenti proprietà che saranno utili nel seguito


1. date quattro matrici E, F , H e M tali per cui il prodotto F HM dia una matrice di dimensioni
pari ad A si dimostra che (E + F HM )−1 = E −1 − E −1 F (H −1 + M E −1 F )−1 M E −1 ;
2. I − E(I + E)−1 = (I + E)(I + E)−1 − E(I + E)−1 = (I + E − E)(I + E)−1 = (I + E)−1 ;
3. I − (I + E)−1 E = (I + E)(I + E)−1 − (I + E)−1 E = (I + E)−1 (I + E − E) = (I + E)−1 .
Chiamando Z(s) = (sI − A + BK)−1 = (Φ−1 + BK)−1 , possiamo riscrivere la (15.13) come
¡ ¢−1
Lo (s) = K Z(s)−1 + LC LG(s). (15.14)

Utilizzando la proprietà 1. con E = Z −1 , F = L, H = I e M = C otteniamo


³ ´
−1
Lo (s) = K Z(s) − Z(s)L (I + CZ(s)L) CZ(s) LG(s)
³ ´ (15.15)
−1
= KZ(s)L I − (I + CZ(s)L) CZ(s)L G(s).
42 Ottenibile attraverso una decomposizione spettrale o una decomposizione ai valori singolari.

78
Utilizzando la proprietà 3. con E = CZ(s)B risulta

Lo (s) = KZ(s)L(I + CZ(s)L)−1 G(s). (15.16)

Sostituendo l’espressione della L dell’equazione(15.12)


√ 1 √ 1
Lo (s) = ρKZ(s)BW R− 2 (I + ρCZ(s)BW R− 2 )−1 G(s). (15.17)

Per ρ → ∞,
1 1 −1
Lo (s) = KZ(s)BW R− 2 R 2 W −1 (CZ(s)B) G(s) = KZ(s)B(CZ(s)B)−1 G(s). (15.18) maglia_limite_o

Il termine Z(s)B può essere semplificato utilizzando la proprietà 1.

Z(s)B = (Φ−1 + BK)−1 B


(15.19)
= ΦB − ΦB(I + KΦB)−1 KΦB = ΦB(I − (I + KΦB)−1 )KΦB,

da cui ancora, per la proprietà 3. si ottiene

Z(s)B = ΦB(I + KΦ(s)B)−1 . (15.20) bz

Utilizziamo ora la (15.20) nella (15.18):

Lo (s) = KΦB((I + KΦB)−1 (CΦB(I + KΦB)−1 )−1 G(s)


= KΦB((I + KΦB)−1 (I + KΦB)(CΦB)−1 G(s) (15.21)
−1
= KΦ(s)B = K(sI − A) B = Llqr (s)

cioè la matrice in anello aperto del solo controllore. Utilizzando quindi questo tipo di pesatura
per ρ → ∞ si ottiene un osservatore la cui matrice di trasferimento in anello aperto coincide
con quella ottenuta con l’algoritmo LQR. Va notato che nel controllore al limite per ρ → ∞ è
richiesta l’invertibilità della funzione di trasferimento del sistema CΦB; al limite infatti l’LTR
sostanzialmente opera una cancellazione del tipo poli zeri. Non è quindi possibile il recupero con
LTR se ci sono zeri nel semipiano destro, ossia per sistemi cosiddetti “non a fase minima”. Inoltre,
1
perché sia possibile l’operazione W R− 2 il numero di ingressi deve essere uguale al numero delle
uscite.

15.2 RECUPERO SULLE USCITE TRAMITE PESATURA DEL


CONTROLLORE
Naturalmente, per la dualità, esisterà anche un LTR sulle uscite che permette di recuperare la
funzione di trasferimento in anello aperto dell’osservatore ottimo. Il procedimento è ovviamente il
medesimo, ma viene comunque qui riportato per completezza.
Consideriamo l’effetto di utilizzare una matrice dei pesi Q nell’equazione algebrica di Riccati
modificata, in modo da avere la seguente forma

Q + ρ(W C)T (W C), (15.22)

con la matrice W ottenuta attraverso la fattorizzazione di una matrice simmetrica e semidefinita


positiva W , in modo che W = W T W 43 . L’equazione di Riccati diverra allora pari a

AT P + P A − P BR−1 B T P + Q + ρ(W C)T (W C) = 0. (15.23)



Se dividiamo tutta l’equazione per ρ, questa diventa

P P √ P P 1 √
AT √ + √ A − ρ √ BR−1 B T √ + √ Q + ρ(W C)T (W C) = 0. (15.24) ltr-ric2
ρ ρ ρ ρ ρ
43 Ottenibile attraverso una decomposizione spettrale o una decomposizione ai valori singolari.

79
P
Supponendo che per ρ → ∞ la quantità √
ρ si mantenga finita possiamo prendere questa come
P
nuova incognita P = √
ρ, e scrivere

√ 1 √
AT P + P A − ρP BR−1 B T P + √ Q + ρ(W C)T (W C) = 0. (15.25)
ρ

Per ρ → ∞ gli unici termini significativi dell’equazione saranno


√ √
− ρP BR−1 B T P + ρ(W C)T (W C) = 0, (15.26)

da cui

−P BR−1 B T P + (W C)T (W C) = 0. (15.27)

Questa equazione mostra chiaramente che la quantità P risulterà finita come effettivamente ipo-
tizzato. Ricordando che il guadagno si può ottenere dalla soluzione dell’equazione di Riccati come
K = R−1 B T P , ottentiamo
T
−K RK + (W C)T (W C) = 0 (15.28)

da cui deduciamo che, per ρ → ∞ la matrice dei guadagni assumerà la seguente forma funzionale
K 1
√ = R− 2 W C. (15.29) k-limite
ρ

Chiamiamo G(s) = C(sI − A)−1 B = CΦB la funzione di trasferimento del sistema ed R(s) =
K(sI − A + LC + BK)−1 L quella del regolatore, ossia dell’insieme dato dall’osservatore piú la
matrice dei guadagni. La matrice di trasferimento in anello aperto rispetto alle uscite sarà allora
pari a

Lo (s) = G(s)R(s) = G(s)K(sI − A + BK + LC)−1 L, (15.30) lo2

Chiamando Z(s) = (sI − A + LC)−1 = (Φ−1 + LC)−1 , possiamo riscrivere la (15.30) come

Lo (s) = G(s)K(Z(s)−1 + BK)−1 L. (15.31)

Utilizzando la proprietà 1. con E = Z −1 , F = B, H = I e M = K otteniamo


³ ´
−1
Lo (s) = G(s)K Z(s) + Z(s)B (I + KZ(s)B) KZ(s) L
³ ´ (15.32)
−1
= G(s) I − KZ(s)B (I + KZ(s)B) KZ(s)L.

Utilizzando la proprietà 2. con E = KZ(s)B risulta

Lo (s) = G(s)(I + KZ(s)B)−1 KZ(s)L. (15.33)

Sostituendo l’espressione della K dell’equazione(15.29)


√ − 21 √ 1
Lo (s) = G(s)(1 + ρR W CZ(s)B)−1 ρR− 2 W CZ(s)L. (15.34)

Per ρ → ∞,
1 1
Lo (s) = G(s)(CZ(s)B)−1 W −1 R 2 R− 2 W CZ(s)L = G(s)(CZ(s)B)−1 CZ(s)L. (15.35) maglia_limite

Il termine CZ(s) può essere semplificato utilizzando la proprietà 1.

CZ(s) = C(Φ−1 + LC)−1


(15.36)
= CΦ − CΦL(I + CΦL)−1 CΦ = (I − CΦL(I + CΦL)−1 )CΦ,

80
da cui ancora, per la proprietà 2. si ottiene

CZ(s) = (I + CΦ(s)L)−1 CΦ(s). (15.37) cz

Utilizziamo ora la (15.37) nella (15.35):

Lo (s) = G((I + CΦL)−1 CΦB)−1 (I + CΦL)−1 CΦL = G(CΦB)−1 (I + CΦL)(I + CΦL)−1 CΦL
= CΦ(s)L = C(sI − A)−1 L = Lkalman (s)
(15.38)

cioè la matrice in anello aperto del solo osservatore. Notare che nel compensatore è richiesta al
limite per ρ → ∞ l’invertibilità di CΦB, che comporta la cancellazione poli zeri del sistema. Non è
quindi possibile il recupero se ci sono zeri nel semipiano destro. Inoltre, per effettuare l’operazione
1
R− 2 W il numero di ingressi deve essere uguale al numero delle uscite.

16 SISTEMI DISCRETI
16.1 Dal continuo al dscreto
ẋ = Ax + Bu
(16.1)
y = Cx + Du
può essere ricondotto a

xk+1 = F xk + Guk
(16.2)
yk = Cxk + Duk

Infatti
Z t+∆t
A∆t
x(t + ∆t) = e x(t) + eAτ Bu(t − τ )dτ (16.3)
t

da cui, se u è costante da t a t + ∆t, allora

F = eA∆t
R ∆t (16.4)
G = 0 eAτ Bdτ

16.2 Liapunov
In continuo, stima varianza risposta:

AX + XAT + Q = 0

moltiplichiamo per ∆t

∆tAX + ∆tXAT + ∆tQ = 0

e sommiamo X

X + ∆tAX + ∆tXAT + ∆tQ = X

cosı̀ da ottenere

(I − ∆tA)X = X(I + ∆tAT ) + ∆tQ

Si osserva che lo sviluppo in serie arrestato al prim’ordine


R Aτ di F èRF Aτ ≈ (I + A∆t)
R e di F −1 è
−1
F ≈ (I − ∆tA); Inoltre lo sviluppo in serie di G = e Bdτ è e Bdτ ≈ (I + ∆t)ABdτ
che, se troncato al prim’ordine e con ∆t sufficientemente piccolo può essere scritto come G ≈ B∆t.
L’equazione di Liapunov, riscritta come

X = (I − ∆tA)−1 X(I + ∆tAT ) + (I − ∆tA)−1 ∆tQ

81
diventa, al limite per ∆t → 0,

X = F XF T + ∆tQ (16.5)

dove si è eliminato il termine quadratico da (I − ∆tA)−1 ∆tQ. Nel caso di rumore bianco

Q = BW B T ∆t
W B T ∆t
= B∆t ∆t (16.6)
W GT
= G ∆t

W è l’intensità del rumore bianco visto in forma discreta. L’equazione di Liapunov in forma
dove ∆t
discreta si scriverà quindi come

X = F XF T + Q (16.7)

e la sua aggiunte come

X = F T XF + Q (16.8)

In particolare l’equazione della varianza sarà


2
σxx = F T σxx
2
F + GW GT (16.9)

Infatti
Z Z
R ∆t R ∆t Av T
T
Mxx dt = 0 0 e B Mw(t − v)w T (t − z) B T eA z dtdvdz
| {z }
W δ(z−v)
R ∆t R ∆t T R ∆t
= 0 0 eAv BW δ(z − v)B T eA z) 0 (16.10)
R ∆t Av T
= 0 e BW B T eA v dv
R ∆t
≈ 0 (I + ∆tA)BW B T (I + ∆tAT )dv
≈ ∆tBW B T
dove gli ultimi due termini sono ricavati assumento ∆t piccolo.

16.3 Filtro di Kalman


Ricordiamo che l’equazione dell’errore nel continuo è

ė = A − LC e + n + Lr (16.11)
| {z }
A

2
e la corrispondente equazione di Liapunov per la varianza dell’errore σee è
2 2 T
Aσee + σee A + Wnn + LWrr LT = 0 (16.12)

Nel discreto l’equazione corrispondente sarà


2 2
σee = (F − LC)σee (F − LC)T + Wnn + LWrr LT (16.13)
| {z }
scalatiper∆t

dove le covarianze dei rumori sono state scalate per ∆t, cioè portate nel discreto. Espandendo i
termini si ottiene
2 2
σee = F σee F T − LCσee
2
F T − F σee
2
C T LT + LCσee
2
C T LT + Wnn + LWrr LT (16.14)
2
Come nel continuo, si minimizza la traccia di σee derivando rispetto ai termini della matrice dei
guadagni L. Ricordando che ∂ T
(tr(AB )) = A e notando che gli unici termini da derivare sono
∂B
2
LCσee F T , F σee
2
C T LT , LCσee
2
C T LT e LWrr LT si ricava
2
−F σee C T + L(Cσee
2
C T + Wrr ) = 0,

82
da cui
2
L = F σee C T (Cσee
2
C T + Wrr )−1 (16.15)

dove si nota che nel caso discreto, la soluzione è definita anche in assenza di disturbi W rr .
Sostituendo l’espressione dei guadagni L nell’equazione di Liapunov della varianza dell’errore
si ottiene l’equivalente in tempo discreto dell’equazione algebrica di Riccati: (appunti miei)
L’equazione cosı̀ ottenuta è l’equivalente, in tempo discreto, dell’equazione di Riccati, e è spesso
indicata come DARE (discrete algebraic Riccati equation) (appunti della tipa).

16.4 Controllo ottimo


L’equazione di Liapunov è:

X = F XF T + Q (16.16)

Nel continuo era


(AT − K T B)P + P (A − BK) + Q + K T RK = 0
K = R−1 B T P

Nel discreto
Z X
xT Qx → xTk Q∆txk (16.17)

serve la derivata della traccia di

(F − GK)x(F − GK)T + Q + uT Ru

Ricordiamo che ∂ (tr(AB)) = AT si ricava


∂B
F −1 X + X(−F T ) − Q = 0

APPUNTI miei: Liapunov per Grammiano di controllabilità

Gc = F T GC F + GGT (16.18)

Liapunov per Grammiano di ossrvabilità

Go = F G o F T + C T C (16.19)

APPUNTI DELLA TIPA: AX + XB + 1 = 0 generalizzazione di Liapunov


Si ha una forma simplettica equivalente discreta ricordando che i punti appartenenti al semipiano
negativo vengono trasformati in punti interni alla circonferenza la forma simplettica avrà N
autovalori interni al cerchio unitario e N esterni (analogo del continuo)

Progetto in continuo o discreto? Se si discretizza a priori il sistema nello scegliere il sistema ho


meno voncoli ∆t > ∆tshannon quindi è meno oneroso in termini di calcolo.

17 ultima lezione
17.1 Modello a elementi finiti
Si schematizza in modo adeguato, con il grado di precisione che serve. Serve per ricavare non solo
la risposta nel tempo, ma anche gli sforzi.
Convergenza del gradiente degli spostamenti spaziali.
1) Per verificare la convergenza si possono realizzare dei modelli sempre più raffinati fino a quando
il risultato non cambia.

83
Controllo attivo: bisogna già sapere quello che c’è da fare: risposta prototipale.
Data una struttura si procede analizzandola, si progetta il controllore (modello del nostro
riferimento che è la realtà...) A volte sono necessarie delle informazioni prototipali, non posso
aspettare che ci sia il controllo.
Forzanti armoniche per vedere se c’è convergenza fino agli sforzi.
CONVERGENZA
1) Provare modelli sempre più raffinati
2) Supporti: indicatori di norma
1) Raffinamento
convergenza h : infittisco la griglia a parità di ordine
convergenza p : a parità di griglia aumento l’ordine
Non solo nel movimento, ma anche negli sforzi.
Il modello va poi accoppiato ad un controllore.
Ci sono pochi programmi che riescono agilmente ad integrare la struttura con il controllo, pochi
riescono ad appendere alla struttura un sistema dinamico che comunque ha pochi gradi di libertà
rispetto a tutto il sistema.
Integrazione diretta: risposta modale / risposta diretta
Efficienza confrontabile se sono incodizionatamente stabile, con precisione almeno del secondo
ordine.
Nel problema termoelastico si ha l’accoppiamento di un sistema del primo con uno del secondo
ordine. Ma il controllo quale ordine ha? Il sistema agli stati puo’ essere arbitrario. Anche se la
struttura mantiene la simmetria il controllo la distrugge, anche se garantisce la conservazione della
sparsità.
Metodo non puramente strutturale. Quello proposto a esercitazione non aveva bisogno nè di
simmetria nè di avere un sistema di secondo ordine. Va bene.
Quando non si trova uno strumento completo:
Modello nodale: quello strutturale-termico più il controllo.
Modelli raffinati : condensazione modale e gli applico il controllo.
Quando si fa una verifica del sistema modale: le cose che vengono dal controllo vengono messe
a destra (termine noto).
Problematiche relative al modello di riferimento: la realtà. Verifica di sforzi in termini statici
e di fatica.
Non si puo’ fare il progetto su un modello n/modale(?).
Riduzione modale ibridizzata con soluzioni statiche. Ottengo un modello ridotto con alta
precisione
La condensazione è molto importante per il progetto. Si individuano due livelli di condensazione:
1) Modello modale abbastanza raffinato per fare le verifiche di dettaglio: spill-over...
Manipolabile: sviluppo e verifiche intermedie
2) addensato sul quale fare il controllo.
1) Tramite il metodo a iterazione a sottospazio (potenze a blocchi?)
verifiche di osservabilità e controllabilità
Progetto di posizionamento di sensori ed attuatori
Modello nodale
Moldello nodale raffinato: per la validazione finale
Modello raffinato condensato addensato: deve essere il più piccolo possibile per fare il progetto
del controllo.
Più verifiche di precisione parziale sul modello realle raffinato
Progetto del controllore: verifica fatta sul modello grande, dovrebbe essere quella finale, ma se
qualcosa non funziona devo fare altri cicli.
Nel modello di progetto posso avere più modi per problemi di travaso.
Condensazione sul controllo
Sperando che cio’ non crei problemi
1) Residualizzazione dinamica
2) Bilanciamento
Fine della fase di progettazione ed analisi.
Prototipi e prodotti.

84
Altra filosofia: progetto del controllore ad una struttura vincolata(?)
Passività, quali ingressi parlano con quali uscite(es. collocazione) ordine.
Controllo sub-ottimale: indice di merito ottimizzato per via numerica: non c’è la garanzia che
si trovi un ottimo globale. Con il gradiente trovo un ottimo locale.
LMI (disuguaglianza delle matrici lineari)
Controllo digitale
Acquisizione del segnale, elaborazione, uscita
Frequenza, campionamento, condizionamento del segnale(offset, ampiezza massima), filtro anti
aliasing.
Risoluzione: corrisponde al bit meno significativo.
Uscita del trasduttore più sistema di acquisizione
Come acquisire il segnale:
In parallelo o in serie.
Gli elementi che si vanno a considerare sono:
Condizionatore (signal conditioning, con dentro anche il filtro anti-aliasing)
Circuito Sample and Hold (S&H) (che acquisisce il valore del segnale nell’istante di campio-
namento, utilizzando un condensatore come dispositivo di memorizzazione. Si attiva prima della
conversione)
Convertitore analogico/digitale
Si individuano più architetture (ne vediamo 3)
Scheda a convertitori multipli: ogni canale ha tutti i suoi componenti, le misure risultano
contemporanee, ma costa di più
Scheda a S&H multipli, posti a monte del MUX; dopo il MUX si ha la conversione ana-
logico/digitale. (si ha la conversione di segnali provenienti dallo stesso istante teorico di
acquisizione)
Scheda con S&H posto a valle del MUX: si ha un ritardo fra un canale e l’altro pari al tempo
di conversione.
A volte prima dell’ A/D si ha un amplificatore che puo’ sistemare il guadagno (anziché metterlo
in ogni condizionatore lo metto là).
DSP digital signal processor
GPCPU general purpose cpu. E’ più limitato del DSP, ma meno costoso. DSP ha spesso il
calcolo e l’acquisizione in un unico piccolo...
Il problema dello sfasamento:
Il ritardo di acquisizione abbassa il margine di fase, a meno che uno non vada a modellarlo.
Questo problema va inserito nella scelta dei tempi di campionamento.
Elaborazione DSP/CPU che fa il controllo in via digitale.
uk = kxk xk+1 = Axk + L(yk − Cxk ) + Buk
Deriva dal modo in cui abbiamo implementato uk , xk+1 , uk+1 = kxk+1
Osservatore di tipo predittivo
La conversione da digitale a analogico,porta ad un ulteriore sfasamento. E’ necessaria una certa
rapidità di conversione per non aggiungere sfasamento.
disegno
Scandire il ∆t
Discorso di programmazione: programmata o DMA (direct memory access)
Orologio che scandisce il tempo o qualcosa di esterno che dopo un certo ∆t dice di guardare i
dati che ho memorizzato.
∆tacquisizione
dipende dall’insieme campionamento-conversione, c’è sempre. Dipende da come si programma
e come si decide l’hardware.
Se lo si modella: ibridizzazione non omogenea
Avendo seguito un controllo predittivo non c’è il ∆t di calcolo.
Tutta la somma deve stare all’interno del ∆t di campionamento, anzi deve essere minore, poiché
serve un margine libero per altre operazioni, quali supervisione, monitoraggio, collegamento con
altri sistemi...
Se il progetto è stato fatto analogico: discretizzazione a posteriori
Come scegliere l’intervallo di tempo.

85
Banda passante a ciclo chiuso, qualche volta la banda passante, ma puo’ avere un alto livello
di rumore.
Una volta scelto il ∆t e calcolati F e G, il sistema è esatto se è lineare.
Non so cosa è successo fra un valore e l’altro. Variabilità: sovraelongazioni, inter si.... come
variano all’interno del ∆t di campionamento.

86
LISTA DELLE CORREZIONI
1/6/2005:

• cosmetico: cambiati indici alla 1.26

• aggiunto un ∆ alla 2.15

• corretta la 3.27

• segni delle 2.13, (2.39), (2.40)

87

Potrebbero piacerti anche