Franco Tomarelli
UNITEXT
3a edizione
ABC
UNITEXT – La Matematica per il 3+2
Volume 71
http://www.springer.com/series/5418
Ernesto Salinelli · Franco Tomarelli
Questo volume nasce da una precisa esigenza didattica: intende fornire una
presentazione elementare ed autocontenuta della modellistica matematica di-
screta con una introduzione all’analisi dei sistemi dinamici discreti.
Si illustrano alcuni metodi qualitativi della modellazione matematica, di-
scutendo cosa si intende per soluzione di tali modelli mediante semplici esem-
pi (Capitolo 1); sono presentate alcune tecniche di soluzione di equazioni alle
differenze lineari (Capitolo 2) e sono studiate le proprietà qualitative delle
soluzioni e la loro struttura nel caso di modelli non lineari, con particolare
riferimento alle proprietà di stabilità (Capitoli 3 e 4).
I metodi e le tecniche per lo studio dei modelli discreti sono dispersi nella
letteratura matematica, economica, biologica, demografica e dell’ingegneria.
Qui si è cercato di presentare la materia in modo unitario, sviluppando dap-
prima esempi e motivazioni, per poi affrontare lo studio dei modelli lineari e
successivamente di quelli non lineari, cercando di unificare il punto di vista
modellistico con quelli dell’Analisi Matematica, della Teoria dei Sistemi, del-
l’Algebra Lineare, del Calcolo delle Probabilità, del Calcolo numerico e della
Matematica Finanziaria.
Prefazione vii
I primi due capitoli presentano una introduzione elementare alla materia: gli
unici prerequisiti sono le proprietà dei polinomi.
Il Capitolo 3 richiede la conoscenza della nozione di continuità ed il calcolo
di derivate di funzioni di una variabile, nel Capitolo 4 sono utilizzate alcune
elementari nozioni di Topologia.
Nei Capitoli 5, 6, 7, dedicati al caso vettoriale, si utilizzano alcune tecniche
di Algebra Lineare.
Tutti i prerequisiti, anche se elementari, sono comunque richiamati nel te-
sto o nelle Appendici.
Le dimostrazioni, stampate con un carattere tipografico ridotto, sono utili
per una comprensione approfondita ma possono omesse nel corso di una prima
lettura.
I primi tre capitoli possono essere oggetto di un modulo didattico (o semi-
annualità) della laurea triennale; in una prima lettura possono essere trala-
sciati i paragrafi 2.5, 2.6, 2.7, 2.8, 3.3, 3.4, 3.9 senza inconvenienti per la com-
prensione.
I Capitoli 4, 5 ,6 ,7 possono essere oggetto in un modulo didattico avanzato.
I capitoli successivi al primo sono largamente indipendenti tra loro, in mo-
do tale da rendere possibili vari percorsi di lettura a seconda dell’interesse per
alcune classi di problemi rispetto ad altre. Segnaliamo alcuni possibili percorsi
di lettura dei vari capitoli.
Indice
Prefazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v
Indice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi
Simboli e notazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xv
I n = I × I × · · · × I
n volte
cioè I n denoterà l’insieme delle n-uple (x1 , x2 , . . . , xn ) tali che xj ∈ I per ogni
j = 1, 2, . . . , n.
g : N × I n+1 → R .
2
L’origine del nome si chiarisce nel caso particolare in cui
g (k, Yk , Yk+1 , . . . , Yk+n ) = ψ (k, Yk+1 − Yk , Yk+2 − Yk+1 , . . . , Yk+n − Yk+n−1 )
per una opportuna funzione ψ.
1.1 Definizioni e notazione 3
La (1.2) è una relazione ricorsiva che, a partire dalla conoscenza dei primi n
valori consecutivi della successione Y consente, “con molta pazienza”, di rica-
vare, un passo alla volta, tutti i valori di tale successione. In molti casi questo
calcolo può risultare proibitivo anche con procedure di calcolo automatico.
Risulta così utile conoscere una espressione esplicita, cioè non ricorsiva, di Y .
Xk = f (k) ∀k ∈ N (1.4)
ove f : N → I, è una funzione tale che, sostituendo Yk con f (k) nella (1.1),
si ottiene una identità.
L’insieme di tutte le soluzioni della (1.1) si dice soluzione generale dell’e-
quazione.
Y1 = α1 , Y2 = α2, ..., Yn = αn
1.2 Esempi
che è un esempio di problema con dato iniziale per una equazione alle diffe-
renze del primo ordine.
Yk = (1 + rk) D0 . (1.5)
la cui soluzione è la seguente (anche questa formula si può provare per indu-
zione):
k
Xk = (1 + r) D0 . (1.6)
Questo modello descrive l’andamento di un conto corrente bancario il cui tasso
di interesse non subisce variazioni.
Si noti che, se r > 0 , la crescita del capitale nel caso dell’interesse compo-
sto risulta molto più rapida rispetto al caso dell’interesse semplice; infatti,
trascurando alcuni termini positivi nello sviluppo del binomio di Newton, si
ricava
k (k − 1) 2
(1 + r)k > 1 + kr + r k>2
2
che sostituita nelle (1.5) e (1.6) fornisce un confronto quantitativo tra i due
tipi di regimi finanziari :
k (k − 1) 2
Xk − Yk > r D0 .
2
Esempio 1.7. Una obbligazione di tipo fixed-reverse fornisce cedole che
variano nel tempo ma in modo prefissato all’atto dell’emissione. Un esempio
tipo è dato da un titolo della durata di 15 anni che fornisce una cedola del 7%
per i primi 5 anni ed in seguito una cedola annua del 2, 50% fino a scadenza.
Indicato con Zk la somma fra il capitale investito e le cedole riscosse fino al
tempo k, supponendo di non reinvestire le cedole, il modello corrispondente è
Zk+1 = Zk + r(k) Z0
⎧
⎨ 0, 07 se k = 0, 1, . . . , 5
con r(k) = 0, 025 se k = 5, 6, . . . , 14 .
⎩
0 se k ≥ 15
Osserviamo che tale modello non tiene affatto conto delle variazioni di prezzo
dell’obbligazione sul mercato secondario.
Esempio 1.8. Al tempo k = 0 viene erogato un mutuo d’importo S0 . Tale
somma è restituita in rate costanti di importo R, pagate a partire dal tempo
k = 1. Indicando con r il tasso d’interesse costante con il quale viene calcolato
l’interesse sul debito residuo Sk , quest’ultimo al tempo k + 1, k ≥ 1, è dato
da
Sk+1 = Sk + rSk − R = (1 + r) Sk − R .
Esempio 1.9. Al tempo k = 0, si investe una somma in un titolo che frutta
cedole di importo costante C ai tempi interi k ≥ 0. Se r indica il tasso di
interesse composto al quale si reinvestono le somme percepite, l’ammontare
Mk+1 del capitale posseduto al tempo k + 1 è dato dalla somma dell’ammon-
tare Mk del capitale posseduto al tempo k, degli interessi rMk maturati su
tale capitale e della cedola C “staccata” al tempo k + 1 (con M0 = C):
dove le costanti a, b, c, d > 0 sono note. Ciò significa che al crescere del prez-
zo del bene diminuisce la quantità domandata del bene, mentre aumenta la
quantità offerta. Si noti che la significatività economica imporrebbe di con-
siderare solo prezzi appartenenti all’intervallo [Pmin , Pmax ] := [c/d, a/b], con
parametri tali che c/d < a/b.
La condizione di equilibrio del mercato Qdk+1 = Qok+1 conduce ad un pro-
blema nell’incognita prezzo espresso da una equazione alle differenze con una
condizione iniziale p :
d a+c
Pk+1 = − Pk +
b b .
P 0 = p
Il nome di ragnatela sarà chiarito nel seguito. Il lettore può provare a farsene
una ragione tentando di “risolvere graficamente” il problema.
3
L’intervallo di tempo può essere molto lungo: esso è determinato dalla natura delle
particelle.
1.2 Esempi 7
Osserviamo che nessuna delle due quantità (vita media e tempo di dimezza-
mento) dipende dalla popolazione iniziale: esse dipendono solo dalla frazione
(20%) di particelle che decadono nell’unità di tempo; inoltre vale m > d. Que-
sta tuttavia non è una disuguaglianza valida in generale: a seconda del tipo di
popolazione e delle corrispondenti leggi di decadimento si possono avere tutte
le diverse possibilità: m > d, m = d, m < d.
Consideriamo, ad esempio, una popolazione di 3 particelle (o individui) A, B
e C: A vive 10 anni, C vive 20 anni (vedi Fig. 1.1). Allora:
Osserviamo infine che la vita media potrebbe non essere neppure definita se
il calo della popolazione avviene in modo più lento del decadimento esponen-
8 1 Fenomeni ricorsivi ed equazioni alle differenze
Fig. 1.1. Vita media e tempo di dimezzamento nei tre casi discussi
1
+∞ 1
+∞
1
+∞
1
k (Pk − Pk+1 ) = k − = = +∞.
P0 k k+1 k+1
k=1 k=1 k=1
Invece, per una popolazione che decresce nel tempo è sufficiente la condizione
limk Pk = 0 (cioè che la popolazione tenda ad estinguersi) affinché il tempo
di dimezzamento sia ben definito.
Ad esempio, se, come prima, Pk = k1 P0 , allora d = 2.
Esempio 1.12 (Modello di Malthus4 ). Questo semplice ed ormai classico
modello descrive una popolazione (biologica o di altro genere), nella quale il
numero Yk di individui presenti al tempo k è una proporzione costante τ del
numero di individui Yk−1 al tempo precedente (la quantità τ −1 è detta tasso
intrinseco di crescita):
Yk+1 = τ Yk τ >0
Yk
Yk+1 = τ Yk 1 − τ, H > 0 (1.8)
H
Xk+1 = τ Xk (1 − Xk ) τ >0
Si noti che, l’effetto della predazione è proporzionale agli incontri tra prede e
predatori; questo modello suppone che il numero di incontri sia proporzionale
alla consistenza delle due popolazioni, cioè al prodotto Ck Pk . Tale prodotto
prende il nome di impact factor.
mesi k 0 1 2 3 4 5 6 7 8 9 10 11 12 13
coppie Ck 0 1 1 2 3 5 8 13 21 34 55 89 144 233
n
1
Yk+1 = ϕj Ykj .
j=1
12 1 Fenomeni ricorsivi ed equazioni alle differenze
j
Il numero di individui Yk+1 nelle classi di età più mature (j = 2, 3, . . . , n)
al tempo k + 1 è dato dai “sopravvissuti” fra i componenti la Ykj−1 della
(j − 1)-esima classe al tempo k:
j
Yk+1 = σj−1 Ykj−1 j = 2, . . . , n, 0 ≤ σj−1 ≤ 1.
I valori ϕj e σj sono tipici delle varie popolazioni, sono indicatori statistici del-
le attese di natalità e sopravvivenza, sono tutti non negativi e verosimilmente
ϕj è piccolo per valori estremi di j (j = 0 e j = n).
T
Posto Yk = Yk1 Yk2 . . . Ykn , il modello è descritto in modo sintetico dal-
l’equazione vettoriale
Yk+1 = LYk
cioè, per ciascuna componente j,
j
n
Yk+1 = Lj,hYkh
h=1
dove ⎡ ⎤
ϕ1 ϕ2 ϕ3
. . . ϕn−1 ϕn
⎢ σ1 0 0
... 0 0 ⎥
⎢ ⎥
⎢ 0 ⎥
L=⎢ 0 σ2 0
... 0 ⎥.
⎢ .. .. .... . .. ⎥
⎣ . . . ..
. . ⎦
0 0 0 . . . σn−1 0
Si noti che ad ogni passo temporale k la popolazione complessiva è
data dalla
n j
somma del numero di individui componenti le varie classi di età: j=1 Yk .
Esempio 1.18. In un game di una partita di tennis tra due giocatori il pun-
teggio è 40 a 15. Supponendo di sapere che il giocatore in vantaggio ha una
probabilità nota p ∈ (0, 1) di vincere ciascuna palla, si chiede con quale pro-
babilità si aggiudicherà il gioco.
Per un’analisi di questa situazione si rinvia all’Esempio 6.30.
1.2 Esempi 13
Inoltre
+∞
+∞
ponendo m=n−3
n (n − 1) An xn−2 = 2A2 + n (n − 1) An xn−2 =
n=2 n=3
+∞
= 2A2 + (m + 2) (m + 3) Am+3 xm+1
m=0
6
Per applicare con successo il metodo, non è necessario che i coefficienti siano
funzioni elementari: è in generale sufficiente che i coefficienti siano analitici, cioè
funzioni esprimibili localmente come somma di una serie di potenze della variabile
indipendente x.
14 1 Fenomeni ricorsivi ed equazioni alle differenze
A2 = 0 (m + 2) (m + 3) Am+3 = Am .
Uk+1 − Uk
= f (xk+1 , Uk+1 )
h
ossia
7
Cioè un problema che consiste nella determinazione di una soluzione di un’equa-
zione differenziale verificante condizioni iniziali assegnate in modo opportuno.
1.2 Esempi 15
che, per ogni k fissato, è effettivamente una equazione implicita in Uk+1 qua-
lora sia noto Uk : risolvendola iterativamente, a partire da U0 = u (x0 ) = u0 ,
si ottengono i valori Uk+1 .
Ci si attende che l’approssimazione Uk di u (xk ) migliori quando h si avvicina
a zero.
Alternativamente, il metodo di Eulero esplicito consiste nel calcolare l’ap-
prossimazione di f in xk e conduce alla formulazione
Uk+1 − Uk
= f (xk , Uk )
h
Fig. 1.2. Griglia di discretizzazione per l’equazione del calore in una sbarra
AVk+1 = Vk (1.15)
T
con la condizione iniziale V0 = f (s) f (2s) · · · f (N s) .
La discretizzazione di tipo Eulero esplicito conduce alla seguente equazione
alle differenze vettoriale
Wk+1 = BWk (1.16)
T
con la condizione iniziale W0 = f (s) f (2s) · · · f (N s) , dove Wj,k ap-
prossima il valore di v (js, hk) e B è la matrice N × N definita da
⎡ 2h ⎤
1− s2
h
s2 0 ··· 0
⎢ 2h ⎥
⎢ h
s2 1− s2
h
s2 ··· 0 ⎥
⎢ ⎥
⎢ .. ⎥
B=⎢
⎢ 0 h
s2 1− 2h
s2 ··· . ⎥
⎥
⎢ ⎥
⎢ .. .. .. .. ⎥
⎣ . . . . h
s2 ⎦
2h
0 ··· 0 h
s2 1− s2
Esempio 1.22 (Equazione dei tre momenti per una sbarra appog-
giata). Consideriamo una sbarra elastica pesante ed omogenea (vedi Fig. 1.3),
uniforme di lunghezza L, appoggiata ad N − 1 punti equidistanti ad una
distanza δ > 0: N δ = L.
Supponiamo che non vi siano forze agenti sulla sbarra ad eccezione del suo
peso e della reazione vincolare nei supporti d’appoggio. Vogliamo determinare
i momenti flettenti Mk , k = 1, , . . . , N − 1, nei punti di appoggio.
Sia Mk il momento flettente nel k-esimo supporto. Consideriamo tre supporti
consecutivi (di indici rispettivamente k − 1, k, k + 1) e collochiamo l’origine
nel supporto centrale. Sia poi x la distanza orientata da tale punto. Allora, il
momento flettente nel punto x è dato da:
⎧ x
⎪
⎨ Mk + (Mk − Mk−1 ) −δ ≤ x ≤ 0
δ
M (x) = (1.17)
⎪
⎩ Mk + (Mk+1 − Mk ) x 0≤x≤δ
δ
Dalla teoria delle sbarre elastiche sappiamo che lo spostamento verticale della
sbarra è descritto dal grafico di y = y (x) verificante
1 δ2
Mk δ 2 − (Mk − Mk−1 ) − cδ = 0
2 6
1 δ2
Mk δ 2 + (Mk+1 − Mk ) + cδ = 0
2 6
che sommate danno l’equazione dei tre momenti:
X1
a) b)
X0 X0
X1
c) d)
X0 X1 X0 X1
b)
a)
Il lettore è invitato ad affrontare gli esercizi prima della lettura dei capitoli
successivi, per poi confrontare le soluzioni trovate con le soluzioni svolte in
dettaglio che sono proposte nel Capitolo 8.
Esercizio 1.1. Una torta viene tagliata con tagli rettilinei in modo tale che due
tagli qualsiasi si intersecano in uno ed un solo punto ma tre tagli differenti non si
possono intersecare nello stesso punto. Si fornisca il modello alle differenze che de-
scrive ricorsivamente il numero Nk delle porzioni in cui viene suddivisa la torta con
1.4 Esercizi di riepilogo 21
R ≤ rS0
Cgg = (1 + s/100)gg/365 C0 .
Esercizio 1.8. Con riferimento al caso del decadimento radioattivo (Esempio 1.11),
assegnata una frazione r, 0 < r < 1 , di particelle che decadono nell’unità di tempo,
confrontare la vita media m (r) ed il tempo di dimezzamento d (r) al variare di r.
22 1 Fenomeni ricorsivi ed equazioni alle differenze
Esercizio 1.9. Un bambino dopo aver costruito una torre di k cubi li vuole riporre
nella cesta dei giochi. A questo scopo, li prende uno o due alla volta.
Descrivere con una equazione ricorsiva il numero dei modi differenti coi quali può
essere completata l’operazione.
Esercizio 1.10 (Problema della torre di Hanoi (Lucas8 , 1883)). Tre pioli so-
no allineati sul terreno. Sul piolo di sinistra sono impilati dischi di raggio differente
a partire da quello di raggio maggiore come illustrato dalla Fig. 1.6.
Si chiede di determinare la relazione che sussiste tra il numero minimo di mosse
Yk necessarie a spostare i dischi sul piolo di destra quando i dischi sono k ed Yk+1
numero minimo di mosse per effettuare la medesima operazione nel caso di k + 1
dischi. Una mossa equivale allo spostamento di un disco da un piolo all’altro e non
è possibile impilare alcun disco sopra uno di raggio inferiore.
Determinare
Esercizio 1.14. una formula ricorsiva per i coefficienti An dello svi-
luppo in serie +∞ n
n=0 An x di una soluzione y delle seguenti equazioni differenziali
del secondo ordine (x ∈ R):
equazione di Bessel x2 y + xy + x2 − k2 y = 0
equazione di Hermite y − 2xy + 2ky = 0
equazione di Laguerre xy + (1 − x) y + ky = 0
equazione di Legendre 1 − x2 y + k (k + 1) y = 0
8
François Edouard Anatole Lucas, 1842-1891.
1.4 Esercizi di riepilogo 23
Esercizio 1.16. Discretizzare con metodi alle differenze finite le seguenti equazioni
differenziali alle derivate parziali:
∂2 u ∂2 u
a) equazione di Laplace 2
+ =0
∂x ∂y2
∂2 v ∂2v
b) equazionedi D’Alembert 2
− =0
∂t ∂x2
Esercizio 1.17 (Equazione di Black & Scholes). L’equazione differenziale
1 2 2
vt + σ x vxx + rxvx − rv = 0
2
nell’incognita v = v (x, t), con σ (volatilità) ed r (tasso d’interesse bancario)
parametri noti, si dice equazione di Black & Scholes. Risolvere tale equazione dif-
ferenziale consente di determinare il prezzo v di particolari strumenti finanziari de-
rivati (ad esempio, opzioni, contratti forward, futures) al tempo t e per un certo
valore x del prodotto finanziario sottostante (obbligazioni, azioni, materie prime,
indici finanziari).
Ad esempio, è importante risolvere il seguente problema per una singola opzione
d’acquisto (call ):
⎧
⎪ 1
⎪
⎪ vt + σ2 x2 vxx + rxvx − rv = 0 x > 0, 0 < t < T
⎪
⎪ 2
⎨
v (0, t) = 0 0<t<T
⎪
⎪
⎪ v (x, t) ∼ x
⎪ se x → +∞
⎪
⎩
v (x, T ) = max (x − E, 0)
ove E indica il prezzo di esercizio (strike price) previsto dal contratto. Si noti che
tale problema è un problema all’indietro: assegnato v (x, T ), con T > 0, si cercano
v (x, 0) prezzo del contratto al tempo 0 e la quantità − ∂v∂x
(x, 0) (indicata con Δ)
di grande importanza per equilibrare rispetto al rischio il portafoglio dell’istituto
finanziario (writer ) che emette il contratto.
Provare che con le trasformazioni
In questo capitolo sono esposte alcune tecniche di soluzione per equazioni alle
differenze lineari ad uno o più passi che descrivono delle grandezze incognite
che sono scalari, cioè numeri. Il caso non lineare e il caso vettoriale saranno
affrontati rispettivamente nei Capitoli 3, 4 e 5, 6.
Nel caso scalare lineare, la particolare struttura dell’insieme delle soluzioni
consente di dare una completa caratterizzazione di tali soluzioni. Questo vale,
come vedremo nel Capitolo 5, anche nel caso vettoriale, mentre nel caso non
lineare questo non è possibile.
X1 = aX0
X2 = aX1 = a2 X0
··· = ...
Xk−1 = aXk−2 = ak−1 X0
Xk = aXk−1 = ak X0
che conducono all’enunciato successivo.
E. Salinelli, F. Tomarelli: Modelli Dinamici Discreti. 3a edizione
UNITEXT – La Matematica per il 3+2 71
DOI 10.1007/978-88-470-5504-9_2, © Springer-Verlag Italia 2014
26 2 Equazioni alle differenze lineari
Teorema 2.2. Per ogni condizione iniziale X0 la (2.1) ammette l’unica solu-
zione:
Xk = ak X0 k ∈ N. (2.2)
ipotesi di induzione
Xk+1 = aXk =
proprietà delle potenze
= a ak X0 =
= ak+1 X0
cioè la successione (2.2) soddisfa la relazione (2.1) anche per k + 1: dal principio di
induzione segue la tesi.
Esempio 2.3. Consideriamo una popolazione la cui evoluzione è descritta dal
modello di Malthus Xk+1 = τ Xk (si veda l’Esempio 1.12). Tale popolazione,
partendo da un valore iniziale X0 , al tempo k raggiunge il valore
Xk = τ k X0 .
Un “modello di crescita” più lenta (si vedano gli Esempi 1.4, 1.5) è quel-
lo ad incrementi additivi costanti, tipica dell’andamento di una progressione
aritmetica:
Xk+1 = Xk + b ∀k ∈ N, b ∈ R
la cui soluzione è data da Xk = X0 + kb, come si verifica facilmente.
I due tipi di evoluzione appena illustrati sono casi particolari di equazioni
lineari affini.
Definizione 2.4. Se a e b sono fissate costanti con a = 0, si dice equazio-
ne alle differenze lineare affine, del primo ordine, a coefficienti
costanti, l’insieme di relazioni nell’incognita X
1)
se a = 1 allora Xk = X0 + kb k∈N
e in tal caso
2)
X2k = X0 k∈N
X2k+1 = b − X0 k∈N .
se a = −1 allora:
X2k = X0
2k+1
2k+1 1 − (−1)
X2k+1 = (−1) X0 + b = 2α − X0 = b − X0
2
28 2 Equazioni alle differenze lineari
Prova. L’unico fatto non banale è la rappresentazione esplicita (2.4) relativa al caso
a = 1: può essere provato per induzione, mostrando che la successione (2.4) descrive
una soluzione di (2.3) per ogni dato iniziale X0 , e dall’unicità (a dato iniziale fissato)
segue il fatto che (2.4) descrive tutte le soluzioni al variare di X0 .
È tuttavia interessante ricavare direttamente la formula (2.4) anziché provarne la
validità “a posteriori”, perché la dimostrazione costruttiva consente di comprenderne
meglio il significato. Si tratta di provare che il caso 2) è qualitativamente simile al
caso omogeneo (b = 0, Teorema 2.1) salvo cambiamenti affini di coordinate (in R):
nell’ipotesi a = 1, studiamo le successioni (al variare di X0 )
Zk = Xk − α ∀k ∈ N (2.5)
Zk+1 + α = a (Zk + α) + b
b ab
Zk+1 + = aZk + +b
1−a 1−a
Zk+1 = aZk
la cui soluzione, dedotta dal Teorema 2.2, Zk = ak Z0 , sostituita nella (2.5) dà infine
b b
Xk = Zk + α = ak (X0 − α) + α = ak X0 − + .
1−a 1−a
Le Fig. 2.1 e 2.2 descrivono l’andamento qualitativo delle traiettorie nei casi
discussi nel Teorema 2.5
Dunque, se |a| < 1, si ottiene una stima della buona rapidità di convergen-
za all’equilibrio e del miglioramento della maggiorazione dell’errore a ciascun
passo:
|Xk+1 − α| = |Xk − α| |a| .
Xk+1 Xk
a=2
b = −1
Xk k
Xk+1 Xk
a=1
b=3
Xk k
Xk+1 Xk
a = 12
b=1
Xk k
Xk+1 Xk
a = − 12
b=5
Xk k
Xk+1 Xk
a = −1
b=5
Xk k
Xk+1 Xk
a = −2
b=6
Xk k
Si noti che la negatività del termine −d/b implica che il comportamento del
prezzo sarà sempre oscillante, e il fatto che ci sia convergenza o meno dipende
dal rapporto fra le pendenze delle curve di domanda e di offerta.
In particolare, se d < b allora i valori Pk dei prezzi convergeranno rapidamen-
te all’equilibrio α per k → +∞. Se d > b non si avrà una stabilizzazione del
prezzo.
Esercizio 2.2. Ricavare le tesi del Teorema 2.5 iterando la (2.3) a partire da un
dato iniziale X0 .
In questo paragrafo vediamo come sia possibile fornire una descrizione com-
pleta delle soluzioni per le equazioni lineari a coefficienti costanti anche nel
caso a più passi. A questo scopo è utile premettere alcune definizioni.
32 2 Equazioni alle differenze lineari
αn Fk = 0 , ∀k).
n
L’insieme delle successioni a valori complessi, dotato delle due operazioni sopra
introdotte, è uno spazio vettoriale di dimensione infinita. Questo significa
che la somma di (un numero finito) successioni o il prodotto di una succes-
sione per una costante sono ancora successioni, e che, comunque si scelga un
intero positivo n, è possibile trovare n successioni linearmente indipendenti.
(2.6)
Xk = cλk , c = 0, λ = 0.
2.2 Equazioni lineari ad n passi a coefficienti costanti 33
λn + an−1 λn−1 + · · · + a1 λ + a0 = 0.
L’equazione
Fk = λk
Nel caso in cui i coefficienti aj dell’equazione (2.6) sono tutti reali, i risultati
contenuti nel Teorema 2.15 possono essere ulteriormente precisati: in partico-
lare ha interesse scrivere le soluzioni di (2.6) in forma reale anche se alcune
radici del polinomio caratteristico sono complesse.
Più precisamente: se a0 , a1 , . . . , an−1 sono reali e λ = a + ib è soluzione della
(2.7), con a e b reali e b diverso da 0, allora anche λ = a−ib è soluzione e a tale
coppia di soluzioni sono associate le due soluzioni linearmente indipendenti in
forma reale
Fk = ρk cos (θk) Gk = ρk sin (θk)
Procedendo allo stesso modo su (a − ib)k , si può concludere che per ogni scelta
di c1 e c2 esistono due costanti
c1 e
c2 dipendenti da c1 , c2 e k, tali che
k k
c1 (a + ib) + c2 (a − ib) =
c1 ρk cos (θk) +
c2 ρk sin (θk) .
!
Si noti che, grazie
! alla formula di De Moivre, le due successioni ρk cos (θk)
e ρk sin (θk) generano, mediante combinazioni lineari a coefficienti in C, lo
stesso spazio bidimensionale di"successioni
# a valori complessi generato dalle
! k
combinazioni lineari di λk e λ .
Analogamente, se λ = a + ib è una soluzione complessa della (2.7) di molte-
plicità m ed a0 , a1 . . . , an−1 sono reali, allora ad essa e alla soluzione λ =
a − ib , pure di molteplicità m, sono associate le 2m soluzioni linearmente
indipendenti
Fk0 = ρk cos (θk) , Fk1 = kρk cos (θk) , . . . , Fkm−1 = k m−1 ρk cos (θk)
Prova del Teorema 2.15. Ad ogni n-upla di dati iniziali X0 , X1 , . . . , Xn−1 corri-
sponde una ed una sola soluzione ottenibile calcolando iterativamente i valori Xk .
Poiché ogni n-upla di dati iniziali si ottiene come combinazione lineare delle n scelte
di dati iniziali fra loro linearmente indipendenti
1, 0, 0, . . . 0, 0
0, 1, 0, . . . 0, 0
0, 0, 1, . . . 0, 0
...
0, 0, 0, . . . 0, 1
(k + n) λk+n +(k + n − 1) an−1 λk+n−1 +· · ·+a0 kλk = kλk P (λ)+λk+1 P (λ) (2.11)
dato che
P (λ) = nλn−1 + (n − 1) an−1 λn−2 + · · · + 2a2 λ + a1 .
Poiché, per la (2.10), P (λ) = P (λ) = 0, dalla (2.11) segue che kλk è soluzione di
(2.6).
Sia ora λ radice di molteplicità m ≥ 2 dell’equazione caratteristica. Fissato n, per
1 ≤ h ≤ m definiamo
h−1
Qh,k (μ) = cj,k (μ) P (j) (μ) con grado cj,k ≤ k, (2.12)
j=0
allora da (2.10) segue Qh,k (λ) = 0, dunque kh−1 λk è una soluzione di (2.6) per ogni
1 ≤ h ≤ m.
Proviamo la (2.12), ragionando per induzione sull’indice h.
Se h = 1, la tesi è vera dato che la (2.9) si scrive come
Supponiamo ora che esista un intero 1 ≤ h < m per cui (2.12) è vera. Allora, per
ogni k, otteniamo:
n
n
Qh+1,k (μ) = (k + s)h as μk+s = (k + s)h−1 as (k + s) μk+s =
s=0 s=0
d k+s d
n n
= (k + s)h−1 as μ μ =μ (k + s)h−1 as μk+s =
s=0
dμ dμ s=0
h
= cj,k P (j) (μ)
j=0
avendo posto cj,k = μ cj−1,k (μ) + cj,k (μ) . Quindi anche Qh+1,k (μ) si esprime co-
me combinazione lineare di P e delle sue derivate successive fino all’ordine h con
coefficienti che sono polinomi in μ di grado minore o uguale a k.
Rimane da provare l’indipendenza lineare delle soluzioni trovate.
Nel caso di n radici distinte λ1 , . . . , λn basterà provare l’indipendenza lineare dei
primi n valori delle successioni, cioè
⎡ ⎤
1 λ1 λ21 . . . λn−1
1
⎢ 1 λ2 λ22 . . . λn−1 ⎥
⎢ 2 ⎥
det ⎢ . . . . . ⎥ = 0
⎣ .. .. .. . . .. ⎦
1 λn λ2n . . . λn−1
n
c1 + c2 k + c3 k2 + · · · + cm km−1 = 0 k∈N
Xk = c1 2k + c2 + c3 k k∈N
da cui Xk = −2k+1 + 3k + 2.
$ √ %k $ √ %k
1 1+ 5 1 1− 5
Ck = √ − √ k∈N
5 2 5 2
Osserviamo che da
1 − √5
|λ1 | = <1
2
k
Xk = c1 ik + c2 (−i) k ∈ N.
2.2 Equazioni lineari ad n passi a coefficienti costanti 39
1
In conclusione, la soluzione generale di (2.13) è Xk = c1 + c2 k + k 2 .
2
Per l’analisi di casi più generali, si rimanda ai paragrafi 2.4 e 2.5.
Esercizio 2.3. Discutere, al variare di a e b in R, il comportamento asintotico della
soluzione dell’equazione lineare a due passi omogenea
Esercizio 2.4. Determinare la soluzione generale delle seguenti equazioni alle dif-
ferenze:
√
(1) Xk+2 − 2Xk+1 − 3Xk = 0 (2) Xk+2 − 3Xk+1 + Xk = 0
Un equilibrio per una equazione (alle differenze) a due passi lineare a coef-
ficienti costanti è un valore α ∈ R tale che la successione costante Xk = α,
∀k ∈ N, è soluzione di (2.14).
Un equilibrio α si dice attrattivo se, per ogni coppia di dati iniziali X0 e X1 ,
la soluzione corrispondente tende all’equilibrio, cioè
lim Xk = α.
k
tale che
x + a 1 x + a0 x = b
α = b/ (1 + an−1 + an−2 + · · · + a0 ) ;
n−1
|Xj − α| < δ ⇒ |Xk − α| < ε ∀k ∈ N
j=0
42 2 Equazioni alle differenze lineari
lim Xk = α.
k
m−1
Yk = cjl kl λkj
λj l=0
ricordando che:
|λ| < 1 ⇒ lim kl λk = 0
k
l ≥ 1 , |λ| = 1 ⇒ lim kl λk = +∞ .
k
6Xk+2 − 5Xk+1 + Xk = 2
Xk
Xk
1
k
−32
Per riassumere il senso generale degli ultimi due esempi, osserviamo che nei
casi in cui sono presenti soluzioni dell’equazione caratteristica di forma λ1,2 =
cos θ ± i sin θ, allora la soluzione generale contiene termini del tipo
Xk
1
2
√
2 3
Fig. 2.5. Grafico di Xk = (−1)k + 3
sin (kπ/3), successione di periodo 6
2.3 Stabilità di equilibri per equazioni ad n passi a coefficienti costanti 45
Xk
− 4 sin θk
Fig. 2.6. Grafico di Xk = 4 cos θk , successione non periodica
Im
Re
Fig. 2.7. Modi naturali delle soluzioni di un’equazione alle differenze lineare a coef-
ficienti costanti, omogenea, in funzione della posizione delle parti reale e immaginaria
dell’autovalore λ nel piano complesso
Poiché
( ) ( ) ( )
A1 B 1 3 A2 B 2 9 A3 B 3 243
det = > 0 ; det = − < 0 ; det = >0
BT1 AT1 4 B T
2 A T
2 4 B T
3 A T
3 64
Esercizio 2.7. Data l’equazione Xk+2 − 4Xk+1 + 5Xk = 6: (a) determinare la so-
luzione generale; (b) individuare eventuali equilibri, studiandone la natura.
equivalenti a
a0 < 1 |a1 | < 1 + a0 .
(2.17)
Il teorema appena enunciato ci indica la strada per risolvere la (2.17). Una vol-
ta individuata la soluzione generale dell’equazione omogenea corrispondente,
è sufficiente determinare una soluzione particolare dell’equazione completa:
la somma di queste due soluzioni fornisce la soluzione generale dell’equazione
completa.
Si noti che, se Fk è una costante ed 1 non è radice del polinomio caratteristico
ed esiste un equilibrio, allora come soluzione particolare si può scegliere la
soluzione di equilibrio (2.17).
e dividendo per 2k
4a − 8a + 3a = 1 ⇒ a = −1.
Xk = c1 + c2 3k − 2k k ∈ N.
2.4 Ricerca di soluzioni particolari con secondi membri di tipo particolare 49
e dividendo per bk = 0
βb2 − 4βb + 3β = 1 ⇒ β b2 − 4b + 3 = 1.
k (k + 1)
1 + 2 + 3 + · · · + (k − 1) + k = k ∈ N.
2
Fk soluzione particolare
βk cβ k
km cm km + cm−1 km−1 + · · · + c1 k + c0
km β k β k cm km + cm−1 km−1 + · · · + c1 k + c0
sin (θk) o cos (θk) c1 sin (θk) + c2 cos (θk)
k k k
β sin (θk) o β cos (θk) β (c1 sin (θk) + c2 cos (θk))
Esercizio 2.11. Provare la seguente formula che fornisce la somma dei quadrati dei
primi k numeri interi positivi
1
1 + 4 + 9 + · · · + k2 = k (2k + 1) (k + 1) .
6
Esercizio 2.12. Calcolare la somma dei cubi dei primi k numeri interi.
k
Pk = 1 + z + z 2 + · · · + z k = zn.
n=0
+∞
Esercizio 2.15. Stabilire per quali valori di z ∈ C la serie geometrica zk è
k=0
convergente e calcolarne la somma (si veda l’Appendice A, 18)-26)).
Esercizio 2.17. Esplicitare la soluzione del sistema ottenuto nella soluzione dell’E-
sercizio 1.3.
Esercizio 2.18. Determinare la soluzione generale delle seguenti equazioni alle dif-
ferenze:
k
1) Xk+2 − 2X √k+1 − 3Xk = (−3) √
2) Xk+2 − 2 3Xk+1 − 4Xk = 3 + 2 3 k
π
3) Xk+3 − Xk+2 + Xk+1 − Xk = sin k
2 k
4) Xk+3 + 5Xk+2 + 7Xk+1 + 3Xk = (−1) .
2.5 La Z-trasformata
La Z- trasformata è uno strumento matematico di grande importanza nella
elaborazione dei segnali. Qui ne viene data una breve presentazione, quale pos-
sibile metodo per la soluzione di equazioni alle differenze lineari con secondi
membri non costanti. Precisamente, tale tecnica consente di determinare so-
luzioni particolari con dati iniziali assegnati anche nel caso di secondi membri
che non sono funzioni elementari dell’indice k.
definita come somma di una serie di potenze i cui coefficienti sono i termini
della successione X:
+∞ Xk
Z {X} (z) = x (z) = k
k=0 z
k n (z) = z −n .
Infatti
+∞
+∞
k d 1
l (z) = k
−z
z dz z k
k=0 k=0
$+∞ %
d 1 d z z
= −z = −z = 2
dz zk dz z − 1 (z − 1)
k=0
Vediamo ora come agisce la Z-trasformata sullo “scorrimento” degli indici nel-
la successione da trasformare: l’estrema semplicità di tale azione è di grande
utilità nello studio delle equazioni alle differenze e nel trattamento di segnali
discreti con ritardo.
τn X = {0, 0, . . . , 0, X0 , X1 , X2 , . . . } .
n termini
Fig. 2.8. Nella presentazione dei segnali discreti è utile visualizzare graficamente i
termini delle successioni: (a) K 0, (b) K n , (c) U , (d) L
τ1 X z −1 x (z)
τn X z −n x (z)
Teorema 2.43. Sia X una successione. Allora, con riferimento alle Defini-
zioni 2.41 e 2.42
Z {τn X} = z −n x (z)
Z {τ−n X} = z n x (z) − z n X0 − z n−1 X1 − · · · − zXn−1 .
3z
z 2 x − z 2 X0 − zX1 − 2 (zx − zX0 ) + x = 2
(z − 1)
equivalente a
3z 2z
x (z) = 4 + 2 .
(z − 1) (z − 1)
A questo punto, sempre dalla tabella
$ *%
−1 3z 1
Z 4 = k (k − 1) (k − 2)
(z − 1) 2
$ *%k
2z
Z −1 = 2k
(z − 1)2 k
otteniamo la soluzione
1
Xk = 2k + k (k − 1) (k − 2) .
2
1
x (z) = g (z)
z 2 − 2z + 1
2.5 La Z-trasformata 55
k
(X ∗ Y )k = Xh Yk−h .
h=0
H ∗F .
Più in generale, per la stessa equazione, per ogni secondo membro F e per ogni
scelta dei dati iniziali X0 , X1 non necessariamente nulli, se H è la soluzione
3
Si noti che tale termine è la Z-trasformata della soluzione dell’equazione omo-
genea (Fk ≡ 0) con gli stessi dati iniziali. Si noti anche che tale soluzione può
essere calcolata direttamente (in modo più elementare) mediante le tecniche del
paragrafo 2.2).
4
Precisamente, funzione di trasferimento del filtro risolutore dell’equazione al-
le differenze, dove, fissata l’equazione omogenea e i dati iniziali, il filtro risolutore
corrisponde all’operazione lineare che ad ogni secondo membro associa la soluzione
dell’equazione non omogenea.
56 2 Equazioni alle differenze lineari
H ∗G
1 1 1 Esempio 2.35
Z −1 = Z −1 ∗ Z −1 =
z 2 − 2z + 1 z−1 z−1
1 1 Teorema 2.41
= Z −1 u (z) ∗ Z −1 u (z) =
z z
= Z −1 {Z {τ1 U }} ∗ Z −1 {Z {τ1 U }} =
= τ1 U ∗ τ1 U
k
(τ1 U )h (τ1 U )k−h = k − 1 se k ≥ 1.
h=0
−1
Fig. 2.9. Z −1 z 2 − 2z + 1
2.5 La Z-trasformata 57
Teorema 2.48. Sia F una successione Z-trasformabile (cioè esiste a > 0 tale
che |Fk | ≤ ak per ogni k ∈ N). Allora l’unica soluzione di
Xk+n + an−1 Xk+n−1 + · · · + a1 Xk+1 + a0 Xk = Fk
X0 = X1 = · · · = Xn−1 = 0
" −1 #
è data da X = T ∗ F ove T = Z −1 z n + an−1 z n−1 + · · · + a1 z + a0 .
1
Fig. 2.10. Segnale U − U(s−1)
s
58 2 Equazioni alle differenze lineari
160
140
120
100
80
(a)
60
40
20
160
140
120
100
80
(b)
60
40
20
160
140
120
100
80
(c)
60
40
20
Fig. 2.11. a) Grafico del prolungamento lineare a tratti; b) grafico della media
mobile a 10 giorni; c) grafico della media mobile a 20 giorni
2.5 La Z-trasformata 59
sul breve periodo. Vale la pena di osservare che tali previsioni vanno conside-
rate con grande cautela. Infatti, anche nel breve periodo, le stime dell’errore
di una estrapolazione richiedono una certa regolarità5 , mentre le serie storiche
disponibili sono estremamente irregolari: in questo senso l’esempio riportato
oltre ad essere un caso reale ha anche un comportamento tipico. È per questo
opportuno associare all’analisi tecnica l’analisi delle variabili economiche fon-
damentali che influenzano il titolo. I grafici dell’esempio visualizzano l’effetto
regolarizzante della convoluzione.
Come abbiamo illustrato negli esempi, l’uso delle tabelle è molto utile sia per
calcolare le Z-trasformate sia per calcolare l’antitrasformata.
Qualora non si abbiano a disposizione tabelle o queste non contengano le
funzioni che si devono antitrasformare, si può ricorrere ad una tecnica tipica
dell’analisi complessa che qui ricordiamo senza dimostrazione.
Teorema 2.51 (Formula di inversione della Z-trasformata). Sia f una
Z-trasformata di una successione F , ed f sia derivabile in senso complesso
in tutto C salvo un numero finito di punti z1 , z2 , . . . , zN tali che6
p
per j = 1, . . . , N ∃ intero positivo pj : ∃ finito lim (z − zj ) j f (z) .
z→zj
I1 R + (I1 − I2 ) R − V = 0
Ik+2 − 3Ik+1 + Ik = 0 1≤ k ≤N −2
Esempio 2.53. Consideriamo il circuito elettrico della Fig. 2.13 in cui sono
presenti 2N resistori di resistenza R ed N generatori di differenza di poten-
ziale Vk , 1 ≤ k ≤ N . Ci poniamo il problema di determinare l’intensità di
corrente Ik nel k-esimo resistore orizzontale. Procedendo come nell’esempio
precedente, otteniamo un’equazione lineare non omogenea, a due passi:
con “un dato iniziale” I1 e “un dato finale” (da determinare successivamente)
implicitamente forniti da
otteniamo
Ik = Jk + Tk .
k−1
Esercizio 2.22. Risolvere l’equazione 2Xk = 2 + 32 (k − s − 1) Xs , k ∈ N .
s=0
Xk+1 = Ak Xk ∀k ∈ N . (2.21)
Teorema 2.56. Per ogni dato iniziale X0 l’unica soluzione della (2.21) è:
$k−1 %
+
Xk = As X0 . (2.22)
s=0
,h
Qui e nel seguito il simbolo s=0 As denota il prodotto dei numeri A0 , A1 ,
. . . , Ah .
Omettiamo la prova del teorema poiché è del tutto analoga a quella del Teo-
rema 2.2.
2.6 Equazioni lineari a coefficienti variabili 63
Xk+1 = Ak Xk + Bk ∀k ∈ N (2.23)
Teorema 2.58. Per ogni dato iniziale X0 la (2.23) ha un’unica soluzione data
da:
,
k−1
k−2 ,
k−1
Xk = X0 As + Bk−1 + Br As k≥1 (2.24)
s=0 r=0 s=r+1
k−1
Prova. Poniamo G0 = 1 e Gk = As se k > 0, e dividiamo entrambi i membri
s=0
della (2.23) per Gk+1 :
Xk+1 Xk Bk
= + . (2.25)
Gk+1 Gk Gk+1
Se, inoltre, denotiamo
Xk Bk
Zk = βk =
Gk Gk+1
allora la (2.25) si riscrive come Zk+1 = Zk + βk la cui soluzione è data da
k−1
k−1
Br
Zk = Z0 + βr = X0 + .
r=0 r=0
Gr+1
dunque, per k > k, il sistema non ha memoria della storia precedente: i valori
Xk con k > k non dipendono dagli Xk con k ≤ k.
Osservazione 2.60. Nel caso di una equazione alle differenze del primo or-
dine a coefficienti non costanti, omogenea, è opportuno notare che il numero
di operazioni necessarie al calcolo del termine Xk sia con la (2.21) sia con la
(2.22) è pari a k. Invece, se si considera una equazione non omogenea, mentre
il calcolo di Xk con la (2.23) richiede 2k operazioni, l’impiego della (2.24) ne
richiede una quantità dell’ordine di k 2 : dunque, la formula esplicita per Xk
(in dipendenza da k e dalla condizione iniziale X0 ) dà informazioni sulla solu-
zione ma non garantisce alcun vantaggio computazionale rispetto all’impiego
della formula ricorsiva nel calcolo dei valori Xk .
k−1
Xk = X0 + Br .
r=0
k
Sk = Xn .
n=0
Sk+1 = Sk + Xk+1 .
Osserviamo che tale problema può essere risolto in molti casi con le tecniche
proposte nel paragrafo 2.4 e reltivi esercizi.
Esempio 2.62. Il numero dei triangoli equilateri di lato pari a 1/k che si
ricavano da un triangolo di lato unitario suddividendo ciascun lato in k parti
uguali e unendo tali punti mediante segmenti paralleli ai lati del triangolo
2.6 Equazioni lineari a coefficienti variabili 65
k−1
k (k − 1)
Xk = 1 + (2r + 1) = 1 + k − 1 + 2 = k2.
r=1
2
Xk+n + An−1
k Xk+n−1 + · · · + A1k Xk+1 + A0k Xk = 0. (2.26)
7
Il lettore ponga attenzione alla posizione degli indici: il numero X1 è parte del
dato iniziale, la successione X 1 è una soluzione, X11 è il termine con indice 1 di tale
successione.
66 2 Equazioni alle differenze lineari
Prova. Se vale la i) allora esiste un vettore c di costanti non tutte nulle tale che
Wk c = 0: abbiamo così un sistema lineare omogeneo di n equazioni algebriche in n
incognite che ammette una soluzione non banale e quindi, per il teorema di Cramer,
deve essere det Wk = 0.
Se k0 è tale che det Wk0 = 0, allora esiste un vettore c di costanti non tutte nulle
tale che Wk0 c = 0. Posto allora Xk = c1 Xk1 + c2 Xk2 + · · · + cn Xkn , ∀k, possiamo
affermare che Xk è soluzione dell’equazione omogenea (vedi il Teorema 2.64) con
condizione iniziale Xk0 = · · · = Xk0 +n−1 = 0. Dal teorema di esistenza ed unicità
(Teorema 1.3) segue allora che Xk = 0 per ogni k e quindi le successioni X 1 , . . . , X n
sono linearmente dipendenti.
Il caso non omogeneo della (2.26) si tratta nel solito modo: addizionando ad
una soluzione particolare le soluzioni dell’equazione omogenea.
determinare una relazione ricorsiva fra Ik e Ik−1 . Sfruttare il Teorema 2.58 per
ricavare un’espressione esplicita di Ik .
k 3k + 1
(1) Xk+1 = Xk (2) Xk+1 = Xk
k+1 3k + 7
Nel caso delle equazioni alle differenze non lineari non sono disponibili tec-
niche generali per esplicitare le soluzioni. Tuttavia in alcuni casi particolari
è possibile effettuare un cambio di variabile per trasformare le equazioni non
lineari in equazioni lineari, che sono risolubili mediante le tecniche viste nei pa-
ragrafi precedenti; quindi, effettuando il cambio di variabile inverso si ottiene
la soluzione in forma chiusa del problema di partenza.
In questo paragrafo vedremo che questo metodo si può sempre applicare al
caso delle equazioni alle differenze del primo ordine in forma normale quando
il secondo membro è una funzione lineare fratta dell’incognita.
Nel paragrafo 3.10, vedremo altre tecniche per risolvere equazioni non lineari.
Xk+2 = Xk ∀k ∈ N
Xk
Xk+1 = . (2.27)
1 + Xk
Anche in questo caso la soluzione può non esistere.
Supponendo di partire da un valore X0 per cui la soluzione esiste, procediamo
formalmente e poniamo Yk = 1/Xk per ogni k ottenendo, per sostituzione,
1 1/Yk
= cioè Yk+1 = Yk + 1 .
Yk+1 1 + 1/Yk
Tale problema è lineare affine e si risolve con la tecnica vista nel paragrafo
2.1: Yk = Y0 + k da cui
1 1 1 X0
Xk = = = −1 = . (2.28)
Yk Y0 + k X0 + k 1 + kX0
68 2 Equazioni alle differenze lineari
X0
Xk = ∀k ∈ N .
1 + kX0
Questa conclusione resta vera per tutti gli X0 < 0 che non conducono a −1
in un numero finito di passi.
Al fine di determinare i valori iniziali proibiti possiamo invertire l’iterazione
della funzione f (x) = x/ (1 + x), cioè iterare f −1 (z) = z/ (1 − z) e dunque
calcolare i valori Zk tali che
⎧
⎨ Zk
Zk+1 =
1 − Zk . (2.29)
⎩ Z = −1
0
Si noti che anche questa è un’equazione non lineare, ma, come vedremo tra po-
co, la sua soluzione si può esplicitare e si deduce che i valori vietati per il dato
X0 sono i valori −1/k con k = 1, 2, . . . come si può verificare per induzione.
Notiamo che sia (2.27) che (2.29) hanno secondi membri lineari fratti.
Definizione 2.70. Una funzione lineare fratta è una funzione così defi-
nita
ax + b
f : R \ {−d/c} → R f (x) = dove (c, d) = (0, 0) .
cx + d
Definizione 2.71. Una trasformazione di Möbius è una funzione così
definita:
az + b
f : C\ {−d/c} → C f (z) = dove ad − bc = 0.
cz + d
Osservazione 2.72. Tutte le trasformazioni di Möbius sono composizioni di
traslazioni, omotetie di centro l’origine ed inversioni z → 1/z. Inoltre, tali
trasformazioni mandano ciascuna circonferenza o retta del piano complesso
in una circonferenza o in una retta del piano complesso.
z −i
Esempio 2.73. La funzione f(z) = definita in C\{−i} trasforma l’asse
z +i !
reale {x + iy : y = 0} nella circonferenza unitaria x + iy : x2 + y2 = 1 .
2.7 Esempi di equazioni non lineari ad un passo riconducibili al caso lineare 69
aXk + b
Xk+1 = a, b, c, d ∈ R (2.30)
cXk + d
1
Yk = (2.32)
Xk − α
e corrispondentemente
1
Xk = α + (2.33)
Yk
70 2 Equazioni alle differenze lineari
cα + d c
Yk+1 = Yk + . (2.34)
a − αc a − αc
Riassumendo, se c = 0 e ad − bc = 0, allora:
cα + d a−d
(i) Se = 1, allora α1 = α2 = e, per il Teorema 2.5,
a − αc 2c
1 c
Yk = +k
X0 − α a − αc
−1
1 1 c
Xk = α + =α+ +k
Yk X0 − α a − αc
cα + d
(ii) Se = 1 (si ricordi che nelle nostre ipotesi è anche diverso da 0),
a − αc
allora α1 = α2 , l’equilibrio di (2.34) è, se α = α1 ,
c
γ = −1 = 0 (2.35)
2
(a − d) + 4bc
$ k %−1
1 cα + d
Xk = α + −γ +γ (2.37)
X0 − α a − αc
Osserviamo che
cα + d
se
a − αc > 1 allora esiste lim Xk = α1
k
cα + d 1
se a − αc < 1 allora esiste lim Xk = α1 +
k γ
= α2
cα + d
Se = 1 si possono avere comportamenti periodici o molto complicati
a − αc
a seconda che l’argomento sia o meno un sottomultiplo di 2π.
2
Si noti che se a, b, c, d ∈ R ma α ∈ / R (cioè Δ = (a − d) + 4bc < 0) allora
necessariamente
cα + d
a − αc = 1;
infatti √
cα + d a + d ± i −Δ
= √
a − αc a + d ∓ i −Δ = 1.
Zk tali che
Zk+1 = f −1 (Zk )
d
Z0 = −
c
dove f (x) = (ax + b) / (cx + d); se si pone z = (ax + b) / (cx + d), si ricava
Si noti che se a + d = 0 (e quindi cZ0 = a), allora l’unico valore vietato per
X0 è −d/c. Infatti, in tal caso, X0 = −d/c implica
aXk + b a d
Xk+1 = = = − ∀k.
cXk − a c c
Esercizio 2.27. Si definisce sezione aurea di un segmento, la più lunga delle due
parti ottenute dividendo in due il segmento dato in modo tale che il quadrato della
lunghezza di tale parte sia uguale al prodotto delle lunghezze di tutto il segmento
per quella della parte rimanente. Calcolare la lunghezza di tale segmento riferita al
segmento intero.
N−1
k N se w = 1
w =
1.
0 se w =
k=0
Supponiamo ora che N sia un numero pari (in realtà la maggior convenienza
dal punto di vista dei calcoli numerici si ha quando N è una potenza di 2: cioè
8
In realtà è sufficiente che f sia 2π periodica, continua e che sia possibile dividere
[0, 2π] in un numero finito di intervalli Ik = [ak , bk ] tali che f abbia derivata continua
in ciascun Ik ed esistano finite f+ (ak ) e f− (bk ) per ogni k.
74 2 Equazioni alle differenze lineari
1 2π
N−1
1
N−1 −kn
Cn = f (2kπ/N ) e−in2kπ/N = f (2kπ/N ) e2πi/N .
2π N N
k=0 k=0
(2.40)
Per rendere meno pesante la notazione poniamo
2π 2π
yk = f (2kπ/N ) ω = e2πi/N = cos + i sin .
N N
Poiché ω è una radice N -esima di 1 e le sue potenze ωk , k = 0, 1, . . . N −1, sono
tutte le radici N -esime complesse dell’unità (si veda Esempio 2.77), possiamo
scrivere
1
N−1
Cn = yk ω−kn . (2.41)
N
k=0
N/2−1
γh eih(2kπ/N) = yk k = 0, 1, . . . , N − 1
h=−N/2
N/2−1
γh ωhk = yk k = 0, 1, . . . , N − 1 . (2.43)
h=−N/2
9
L’errore effettuato calcolando l’integrale di una funzione f su un intervallo chiuso
e limitato col metodo delle tangenti è piccolo per N grande e si può stimare:
2π2
se f è continua, allora |cn − Cn | ≤ max |f |, inoltre
N
3
π
se f è continua, allora |cn − Cn | ≤ max |f |.
3N 2
2.8 La Trasformata Discreta di Fourier 75
N−1
Yh ωhk = yk k = 0, 1, . . . N − 1 (2.44)
h=0
N−1
N se k = 0 o k è multiplo intero di N
ωhk =
0 altrimenti
h=0
N−1
−hm
N−1
N se n = m
FF = ω nh
ω = ω h(n−m)
=
nm 0 altrimenti
h=0 h=0
1
cioè F F = N IN . Dunque F−1 = F e possiamo risolvere esplicitamente il
N
sistema (2.44):
1
N−1
Yn = yk ω−kn . (2.46)
N
k=0
1
y = FY Y = F−1 y = Fy .
N
Inoltre, il vettore Y è detto Trasformata Discreta di Fourier di y (spesso
abbreviata in DFT, dall’inglese Discrete Fourier Transform) e y è detta
trasformata discreta di Fourier inversa di Y:
Y = DFT y , y = (DFT)−1 Y .
1
Dunque, la trasformazione consiste nella moltiplicazione per la matrice Fe
N
l’antitrasformazione consiste nella moltiplicazione10 per la matrice F (dove F
è definita in (2.45)).
In analogia con quanto detto per Y, il vettore y definisce implicitamente una
successione y periodica di periodo N :
10
Nelle applicazioni si incontra spesso una variante della definizione, che è sostan-
1
zialmente equivalente: trasformazione DFT effettuata moltiplicando per √ F ed
N
1
antitrasformazione ottenuta moltiplicando per √ F.
N
2.8 La Trasformata Discreta di Fourier 77
π 2π
11
Numero di operazioni elementari da eseguire.
78 2 Equazioni alle differenze lineari
1 1
N
q (z) = yk z k = y0 + y1 z + y2 z 2 + · · · + yN−1 z N−1 z∈C.
N N
k=0
zn = e−2πin/N
2
zn = − zn+N/2 zn2 = zn+N/2 .
= y0 + y2 z 2 + y4 z 4 + y6 z 6 + z y1 + y3 z 2 + y5 z 4 + y7 z 6 .
N−1
yk = Yn ωkn k = 0, 1, . . . , N − 1
n=0
(2.47)
1 N−1
Yn = yk ω−kn n = 0, 1, . . . , N − 1 .
N k=0
e sostituendo in (2.47)
p2 −1 p1 −1
1
Yn = yk1 p1 +k0 ω−n(k1p1 +k0 ) =
N
k1 =0 k0 =0
p2 −1
$ p −1 %
1 −nk0 1
1
−n0 k1 p1
= ω yk1 p1 +k0 ω = (2.48)
p1 p2
k0 =0 k1 =0
p2 −1
1 −nk0
= ω yk0 ,n0
p1
k0 =1
1 p1 −1
dove yk0 ,n0 = yk p +k ω−n0 k1 p1 .
p2 k1 =0 1 1 0
Nella terminologia della computer science l’effettuazione di una moltiplica-
zione e una addizione corrisponde ad un flops12. Il calcolo diretto di Y a
partire da y utilizzando la seconda delle (2.47) richiederebbe N 2 flops per
ogni componente. Osserviamo che, nell’ipotesi N = p1 p2 , la (2.48) ha ridotto
il numero di flops: nel calcolo di y si compiono p2 operazioni, e nella sostitu-
12
Più precisamente, il flops (o AM) è il numero di operazioni corrispondenti all’istru-
zione FORTRAN A (I, J ) = A (I, J ) + T ∗ A (I, K) : comprende una moltiplicazione
ed un’addizione in aritmetica floating-point, alcuni calcoli di indici e alcuni riferi-
menti alla memoria. Si incontra anche la definizione più recente di flops come una
operazione floating-point; in tal modo un flops nella prima definizione corrisponde
a due flops nella seconda.
80 2 Equazioni alle differenze lineari
Esempio 2.81. Con riferimento alla terminologia della Teoria dei Segnali con-
sideriamo un segnale discreto cioè una successione di numeri ad indici interi
relativi13 X = {Xk }k∈Z .
Consideriamo un sistema o filtro causale, cioè una trasformazione che al
segnale discreto X in ingresso fa corrispondere un altro segnale Y = {Yk }k∈Z
in uscita, secondo la legge:
+∞
Yn = Kn−m Xm n∈Z (2.49)
m=−∞
X → filtro → Y
dove K = {Km }m∈Z è una successione assegnata verificante m |Km | < +∞
e Km = 0 se m è minore di zero14 . Osserviamo innanzitutto che, se l’ingresso
X è N periodico allora anche l’uscita Y è N periodica, infatti ∀n ∈ Z :
+∞
+∞
+∞
Yn+N = Kn+N−m Xm = Kn−m Xm−N = Kn−m Xm = Yn .
m=−∞ m=−∞ m=−∞
Allora
+∞
+∞ N−1
Yn = Kn−m Xm = Kn−(l−pN) Xl−pN =
m=−∞ p=−∞ l=0
+∞ N−1
N−1 +∞
N−1
= Kn+pN−l Xl = Xl Kn+pN−l = κn−l Xl .
p=−∞ l=0 l=0 p=−∞ l=0
Y = KX (2.50)
N−1
N−1
= κk−m ω(k−m)n Xm ωmn =
k=0 m=0
N−1
N−1
= Xm ωmn κk−m ω(k−m)n =
m=0 k=0
= xn kn n = 0, . . . , N − 1
T T T
dove x = x0 x1 · · · xN−1 , y = y0 y1 · · · yN−1 , k = k0 k1 · · · kN−1 .
Le N equazioni scalari yn = xn kn sono disaccoppiate, e se kn = 0, ∀n, si
15
Lavoriamo nell’ipotesi che +∞
m=−∞ |Km | < +∞, che è una condizione necessaria
e sufficiente affinché a segnali limitati in ingresso corrispondano segnali limitati in
uscita (proprietà denominata stabilità del filtro).
82 2 Equazioni alle differenze lineari
ricava
yn
xn =
kn
e applicando la DFT
1 yh −hn
N−1
Xn = ω .
N kh
h=0
N−1
Yj ωjh
1
N−1
j=0
Xn = ω−hn
N kh
h=0
ossia,
1
X = F diag k−1 −1 −1
0 , k1 , . . . , kN−1 FY =
N
−1 −1 −1
= DFT diag k0 , k1 , . . . , k−1N−1 (DFT) Y
ove ⎡ ⎤
k−1
0 0 ··· 0
⎢ ⎥
−1
⎢ 0 k1 · · · 0 ⎥
diag k−1
0 , k−1
1 , . . . , k−1
= ⎢ .. .. . . .. ⎥ .
N−1
⎣ . . . . ⎦
−1
0 0 · · · kN−1
Concludendo:
1
D= F diag k−1 −1 −1
0 , k1 , . . . , kN−1 F.
N
Osserviamo infine che se N è grande, anziché calcolare i prodotti fra matrici,
conviene calcolare trasformate ed antitrasformate mediante FFT.
N−1
(x ∗ y)k = xj yk−j k = 0, 1, . . ., N − 1
j=0
3
3
(I) x = N x
(II) x 3y
∗y = Nx 3
4y = x
(III) x 3 ∗y
3
Prova.
(I) x = (DFT)−1 x = Fx = Fx =Nx .
(II) Tutte le somme vanno intese al variare dell’indice da 0 a N − 1:
1
−kh
1
−k(h−l)
x
∗y k = ω xl yh−l = ω yh−l ω −kl xl =
N N
h l h,l
1
−kl
−k(h−l)
= ω xl ω yh−l =
N
l h
1
−kl 1
−k(h−l)
=N ω xl ω yh−l =
N N
l h
x)k (
= N ( y )k .
, y = v
(III) Scegliendo x = u nella (II), coniugando e tenendo conto della (I),
otteniamo:
= Nu
v
=
1
u ∗v uv .
N
Trasformando uv = N u , tenendo conto nuovamente di (I), otteniamo:
∗v
∗v
uv = u = u
∗v
.
1) Xk+3 + Xk = 0 ∀k ∈ N 2) Xk+4 − Xk = 0 ∀k ∈ N
Qok+1 = −c + dPk+1
e
e
ove Pk+1 è il prezzo atteso al tempo k + 1 sulla base di aspettative che si formano
alternativamente in uno dei due modi seguenti:
2. (aspettative adattive) le aspettattive sono adattate in ogni periodo sulla base della
discrepanza fra quanto atteso e quanto osservato:
e
Pk+1 − Pke = β (Pk − Pke ) β ∈ (0, 1) .
Esercizio 2.40. Viene erogato un mutuo di importo M che sarà estinto in k rate
costanti. Ipotizzando che il tasso annuo di interesse r sia composto e costante, ed i
pagamenti effettuati ai tempi 1, 2, . . . , k, calcolare l’importo Q di ciascuna rata.
16
Nel mercato secondario vengono scambiati titoli obbligazionari prima della loro
scadenza.
86 2 Equazioni alle differenze lineari
Esercizio 2.44. Nella prova del Teorema 2.15 si sfrutta la conoscenza del determi-
nante di Vandermonde. Verificare la correttezza dell’espressione utilizzata.
1
Esercizio 2.45. Calcolare la Z-trasformata della successione Xk = .
k!
Esercizio 2.46 (Sbarra elastica sostenuta da supporti). Consideriamo una
sbarra metallica di materiale omogeneo e sezione uniforme appoggiata a N − 1
supporti equidistanziati (Fig. 2.15) e soggetta a carichi W agli estremi.
M0 = MN = −W d .
Determinare i momenti flettenti in corrispondenza dei supporti (si noti che anziché
due condizioni iniziali, abbiamo una condizione iniziale ed una condizione finale,
dette anche condizioni al bordo).
# $T
Esercizio 2.47. Siano assegnati due vettori X = X0 X1 · · · XN −1 e Y =
# $T
Y0 Y1 · · · YN −1 e due successioni X e Y i cui primi N termini coincidono ri-
spettivamente con le componenti di X e Y e Xk = Yk = 0 se k ≥ N . Provare che
(X ∗ Y )k = 0 se k > 2N − 2 e
(X ∗ Y)k = (X ∗ Y )k + (X ∗ Y )k+N k = 0, 1, . . . , N − 1 .
3
Sistemi dinamici discreti: equazioni
scalari ad un passo
X1 = f (X0 )
X2 = f (X1 ) = f (f (X0 ))
X3 = f (X2 ) = f (f (f (X0 )))
... = ...
Xk = f (Xk−1 ) = f (f (. . . (f (X0 )))) = f ◦ f ◦ · · · ◦ f (X0 )
k volte
Esempio 3.3. Consideriamo alcuni esempi di s.d.d. {I, f} a fianco dei quali
abbiamo indicato la corrispondente legge ricorsiva:
1 1
f (x) = x I = [0, 1] Xk+1 = Xk
2 2
x Xk
f (x) = I = (0, +∞) Xk+1 =
1+x 1 + Xk
Per denotare la iterata k-esima di f adotteremo la seguente notazione
f 0 = identità
fk = f ◦ f ◦ · · · ◦ f
k volte
Esempio 3.6. Con riferimento all’Esempio 3.3, i primi due s.d.d. sono lineari,
il terzo è lineare affine, il quarto è non lineare.
È spesso utile una visualizzazione grafica del quadro delle fasi, in cui si evi-
denziano mediante frecce i successivi cambi di posizione dovuti alla iterazione
della funzione che governa il s.d.d.
!
Esempio 3.9. Consideriamo il s.d.d. R, x4 . Rappresentiamo R con una ret-
ta (orientata) verticale e disegnamo il quadro delle fasi. Si osservi che f (0) =
0, f (1) = 1 e f (x) > x se x > 1 , 0 < f (x) < x se 0 < x < 1 e f (x) > 0
se x < 0. Il disegno in Fig. 3.1 evidenzia che tutte le traiettorie diventano
non negative alla prima iterazione; inoltre, se 0 ≤ |x| < 1 la traiettoria f k (x)
tende a zero, mentre se |x| > 1 la traiettoria f k (x) tende a +∞ (i valori 0 ed
1 corrispondono a traiettorie costanti).
Esempio 3.10. In Fig. 3.2 è tracciato il diagramma delle fasi del sistema
dinamico discreto {[−π, π] , cos x}.
Esempio 3.11. Un sistema di infinite equazioni del tipo (equazione alle dif-
ferenze del primo ordine)
% &
Fig. 3.1. s.d.d. R, x4 Fig. 3.2. s.d.d. {[−π, π] , cos x}
α = f (α) α∈I
γ (I, f, α) = {α, α, α, . . . } .
1
Chiaramente equivale a Xk+1 − Xk = g (Xk ) dove g (x) = f (x) − x.
3.1 Definizioni preliminari 91
Xh = α0 , Xh+1 = α1 , . . . , Xh+s = α0 .
Esempio 3.19. Il s.d.d. non lineare {(0, +∞) , 1/x} presenta un! solo equili-
brio (α = 1) ed infinite orbite periodiche di periodo 2 : X0 , X0−1 (si veda la
Fig. 3.3).
92 3 Sistemi dinamici discreti: equazioni scalari ad un passo
!
Esempio 3.20. Il s.d.d. non lineare [0, 1] , a x − x2 con a ∈ R presenta
un’orbita definitivamente stazionaria per X0 = 1: {1, , 0, 0, . . . }.
2
!
Esempio 3.21. Il s.d.d. [0, 1] , 4 x − x presenta
! due equilibri, 0 e 3/4,
2
che sono le soluzioni di x ∈ [0, 1] : 4 x − x = x , ed una sola orbita 2 pe-
√ √ !
riodica 5 − 5 /8, 5 + 5 /8 ottenuta risolvendo
" 2 #
x ∈ [0, 1] : 4 4 x − x2 − 16 x − x2 =x . (3.2)
a b
Fig. 3.4. Grafico di una funzione verificante le ipotesi del Teorema 3.23
I=R f (x) = x + ex
I = (0, 1) f (x) = x2 .
perché f è continua
= lim f (Xk ) =
k
= f lim Xk =
k
= f (L) .
94 3 Sistemi dinamici discreti: equazioni scalari ad un passo
Esempio
√ 3.26. Consideriamo il s.d.d. {I, f} dove I = [−2, +∞) ed f (x) =
x + 2. Allora la funzione f è continua e ricordando che una radice aritmetica
è una quantità non negativa
√ L≥0
L+2= L ⇒ ⇒ L = 2.
L + 2 = L2
1
1) I = R, f (x) = arctan x 2) I = (0, +∞) , f (x) =.
x
2
Ricordiamo che una successione X si dice monotòna crescente (rispettivamente de-
crescente) se Xk+1 ≥ Xk (rispettivamente Xk+1 ≤ Xk ) per ogni k. La monotonia
si dice stretta quando tutte le disuguaglianze sono strette.
3.2 Ancora sull’analisi grafica 95
(1) k=0
(2) x = X0
(3) y = f (x)
(4) x=y
(5) k =k +1
(6) se k = 100 stop, se k < 100 torna a (3)
Se si è interessati ai valori Xk basta inserire una istruzione (3’) tra (3) e (4):
(3’) stampa k e x
valori successione X0 X1 X2 . . . Xk . . .
Per riportare più passi con maggior chiarezza nella rappresentazione grafica
conviene omettere i segmenti verticali di estremi (Xk , 0) e (Xk , Xk ) ed i seg-
menti orizzontali di estremi (0, Xk+1 ) e (Xk , Xk+1 ) ottenendo delle spezzate
che spesso sono chiamate ragnatele.
Xk+1 Xk
Xk k
Xk+1 Xk
k
Xk
% &
Fig. 3.7. Ragnatela di R, e−x , X0 = −1 Fig. 3.8. Traiettoria
3.3 Comportamento asintotico in ipotesi di monotonia 97
Esercizio 3.10. Si affronti lo studio del s.d.d. dell’Esempio 3.26 con il metodo gra-
fico: si noti come sia molto più facile congetturare e provare le corrette proprietà di
monotonia. Inoltre i grafici suggeriscono una strategia di prova molto semplice: se
−2 ≤ x ≤ 2, allora x < f (x) < 2 , dunque Xk è monotòna e limitata. . . .
Algoritmo I
⎧
⎪
⎪ se esistono punti fissi di f maggiori di X0 , allora
⎪
⎪
⎪
⎨ Xk → α, minimo punto fisso maggiore di X0
⎪
se X1 > X0
⎪
⎪
⎪
⎪ se non esistono punti fissi di f maggiori
⎪
⎪
⎩ di X0 , allora Xk +∞
⎧
⎪
⎪ se esistono punti fissi di f minori di X0 , allora
⎪
⎪
⎪
⎨ Xk → β, massimo punto fisso minore di X0
⎪
se X1 < X0
⎪
⎪
⎪
⎪ se non esistono punti fissi di f minori
⎪
⎪
⎩ di X0 , allora Xk −∞
98 3 Sistemi dinamici discreti: equazioni scalari ad un passo
Algoritmo II
⎧
⎪
⎪ se X2 = X0 , allora Xk è 2 periodica
⎪
⎪
⎪
⎪ X2k = X0 , X2k+1 = X1
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎪ ⎧
⎪
⎪
⎪
⎪ ⎪
⎪ 2
se esistono punti fissi di f maggiori
⎪
⎪ ⎪
⎪
⎪
⎪ ⎪
⎪ di X0 alloraX2k α, minimo
⎪
⎪ ⎪
⎪
⎪
⎪ ⎪
⎪ 2
punto fisso di f maggiore di X0
⎪
⎪ ⎪
⎪
⎪ ⎪
⎪
⎪
⎪ ⎨ e X2k+1 β = f (α)
⎪
⎪
⎪
⎪
⎪ se X2 > X0
⎪
⎪ ⎪
⎪
⎪
⎪ ⎪
⎪ se non esistono punti fissi di f
2
⎪
⎪ ⎪
⎪
⎪
⎨ ⎪
⎪ X
⎪
⎪
maggiori di 0 , allora
se X1 = X0 ⎪
⎪ X2k +∞, X2k+1 f (+∞)
⎪ ⎪
⎪
⎪
⎪ ⎩ ∗
( )
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎪ ⎧
⎪
⎪
⎪
⎪ ⎪
⎪ 2
se esistono punti fissi di f minori
⎪
⎪ ⎪
⎪
⎪
⎪ ⎪
⎪ di X0 , allora X2k β , massimo
⎪
⎪ ⎪
⎪
⎪
⎪ ⎪
⎪ punto fisso minore di X0 ,
⎪
⎪ ⎪
⎪
⎪
⎪ ⎨ X2k+1 α = f (β)
⎪
⎪
⎪
⎪ se X2 < X0
⎪
⎪ ⎪
⎪
⎪
⎪ ⎪
⎪
⎪
⎪ ⎪
⎪ 2
⎪
⎪ ⎪
⎪
se non esistono punti fissi di f
⎪
⎪ ⎪
⎪
⎪
⎪ ⎪
⎪
minori di X0 , allora
⎩ ⎩ X2k −∞, X2k+1 f (−∞)
!
Esempio 3.30. Consideriamo il s.d.d. R, −x3 . La funzione f è monotòna
decrescente in senso stretto: applichiamo l’Algoritmo II. A tal fine, se X0 ∈ R
si ha
X1 = f (X0 ) = −X03
e quindi
X1 = X0 ⇔ −X03 = X0 ⇔ X0 = 0.
Poiché
In questo paragrafo, che può essere saltato in una prima lettura, enunciamo
un risultato di grande importanza teorica e numerica: il Teorema delle Con-
trazioni. Nel caso particolare dei problemi studiati in questa trattazione, esso
consente di stabilire l’esistenza e l’unicità di punti fissi per s.d.d. {I, f} con
f non necessariamente derivabile e di effettuare una approssimazione nume-
rica di tali punti fissi. Tale approssimazione è assai utile quando l’equazione
{α ∈ I : α = f (α)} non è risolubile in forma chiusa.
lim Xk = α .
k
|f (X0 ) − X0 | k
|Xk − α| < τ .
1−τ
e quindi, iterando
|Xk+1 − Xk | ≤ τ k |X1 − X0 | .
Sfruttando la disuguaglianza triangolare e quanto appena mostrato sopra, per ogni
h ≥ 1, si ricava
h−1
h−1
|Xk+h − Xk | ≤ |Xk+n+1 − Xk+n | ≤ |X1 − X0 | τ k τn =
n=0 n=0
1 − τh |X1 − X0 | k
= |X1 − X0 | τ k ≤ τ .
1−τ 1−τ
102 3 Sistemi dinamici discreti: equazioni scalari ad un passo
Osservazione 3.34. Una contrazione può non essere derivabile (ad esempio,
f (x) = |x| /2), comunque, grazie al teorema di Lagrange, ogni funzione f in
C 1 (I) per cui esiste τ tale che
|f (x)| ≤ τ < 1 ∀x ∈ I
è una contrazione.
{x ∈ I : g (x) = 0}
f (x) = x ⇔ g (x) = 0.
e Xk = f k (X0 ), k ∈ N, implicano
|Xk − α| < ε ∀k ∈ N.
lim Xk = α.
k
Esercizio 3.17. Per acquisire familiarità con le varie definizioni, il lettore provi che
per il s.d.d. {R, f } con f (x) = x3 + x/2 , lo 0 è un equilibrio stabile e localmente
attrattivo, ma non globalmente attrattivo. Dunque 0 è localmente asintoticamente
stabile.
allora k−j
f (Xj ) − αk(mod s) < ε ∀k > j
dove k (mod s) denota l’unico intero in {0, 1, . . . , s − 1} congruo a k modulo s
(cioè l’unico intero che dà lo stesso resto di k quando è diviso per s).
1) R è chiuso;
2) R è invariante, cioè f (R) = R;
3) esiste un intorno aperto U di R (cioè R ⊂ U , R\U è chiuso) tale che, per
ogni intorno V di R esiste X0 ∈ V \R tale che f k (X0 ) ∈
/ U per infiniti
valori di k;
4) R è minimale, cioè non vi sono sottoinsiemi propri di R verificanti 1),
2), 3).
106 3 Sistemi dinamici discreti: equazioni scalari ad un passo
γ 21 β γ 21 β
31 31
Fig. 3.12. f (x) = 3, 1 x − x2 Fig. 3.13. f 2 con f (x) = 3, 1 x − x2
√
Fig. 3.14. I = [−1, 1] , f (x) = x3 Fig. 3.15. I = [−1, 1] , f (x) = 3
x sign(x)
Prova. Sia |f (α)| < 1. Per la continuità di f esistono d > 0 e r < 1 tali che |f (x)| ≤
r < 1 se x ∈ (α − d, α + d). Per il teorema di Lagrange, se x, t ∈ (α − d, α + d), allora
esiste x tale che
|f (x) − f (t)| = f (x) |x − t| ≤ r |x − t| .
con ψ ∈ C 1 che non si annulla in [a, b] e tale che risulti |ϕ (α)| < 1; in
tal caso le approssimanti sono generate in modo ricorsivo da Yk+1 = Yk +
ψ (Yk ) g (Yk ).
Definizione 3.59. Diciamo che un equilibrio di un s.d.d. {I, f}, con f in
C 1 (I), è iperbolico se |f (α) | = 1, superattrattivo se f (α) = 0 e neutro
se |f (α)| = 1.
Tornando allo studio della stabilità basato sulle proprietà delle derivate, os-
serviamo che il caso |f (α)| = 1 non viene chiarito dal Teorema 3.57 e, in
effetti, può corrispondere a situazioni molto diverse fra loro.
Quando l’esame della derivata prima di f nell’equilibrio non consente di con-
cludere, è necessario approfondire l’analisi: cosa che faremo nel seguito. Pre-
mettiamo allo scopo la definizione seguente.
Definizione 3.60. Un punto α di equilibrio per il s.d.d. {I, f} si dice
semistabile superiormente se per ogni ε > 0 esiste δ > 0 tale che α ≤
•
x < α + δ implica f k (x) − α < ε per ogni k ∈ N;
3.6 Condizioni di stabilità basate sulle derivate 109
Teorema 3.61. Sia α un equilibrio del s.d.d. {I, f}, con f ∈ C 1 , f (α) = 1.
Allora
x−δ ≤x ≤α ⇒ x ≤ f (x) ≤ α
inferiormente asintoticamente stabile
f (α) > 0 ⇒ α
superiormente repulsivo
superiormente asintoticamente stabile
f (α) < 0 ⇒ α
inferiormente repulsivo
2
2f (α) + 3 (f (α)) > 0 ⇒ α localmente asintoticamente stabile
2
2f (α) + 3 (f (α)) < 0 ⇒ α instabile
Prova. Posto g (x) = f 2 (x), x ∈ I, consideriamo i due s.d.d. {I, f } e {I, g}. Grazie
al Lemma 3.64 ed al Teorema 3.63, è sufficiente verificare che:
2
(i) g (α) = 1 (ii) g (α) = 0 (iii) g (α) = −2f (α) − 3 f (α) .
Le tre verifiche sono un delicato ed istruttivo esercizio sulla derivazione delle fun-
zioni composte che il lettore è invitato a svolgere da solo prima di confrontare il
risultato con i passaggi che seguono.
⎧
⎪
⎪ f (α) < 1 ⇒ α l.a.s.
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎪ ⎧ ⎧
⎪
⎪ ⎪ f (α) < 0 ⇒ s.l.a.s. & i.r.
⎪
⎪ ⎪
⎪ ⎪
⎪
⎪
⎪ ⎪
⎪ ⎪
⎪
⎪
⎪ ⎪
⎪ ⎪
⎪
⎪
⎪ ⎪
⎪ ⎪
⎪
⎪
⎪ ⎪
⎪ ⎪
⎪ f (α) > 0 ⇒ s.r. & i.l.a.s.
⎪
⎪ ⎪
⎪ ⎪
⎪
⎪
⎪ ⎪
⎪ ⎪
⎨
⎪
⎪ ⎪
⎪
⎪
⎪ ⎪
⎪ f (α) = 1
⎪
⎪ ⎪
⎪ ⎪
⎪
⎪ ⎪
⎪ ⎪
⎪
⎪
⎪ ⎪
⎪ ⎪
⎪ ⎧
⎪
⎪ ⎪
⎪ ⎪
⎪ ⎪ f (α) < 0 ⇒ α l.a.s.
⎨ ⎨ ⎪
⎪ ⎨
⎪
⎪
f (α) = α f (α) = 1 ⎪
⎪ f
(α) = 0
⎪
⎪ ⎪
⎪ ⎩ ⎪
⎩
⎪
⎪ ⎪
⎪ f (α) > 0 ⇒ α r.
⎪
⎪ ⎪
⎪
⎪
⎪ ⎪
⎪
⎪
⎪ ⎪
⎪
⎪
⎪ ⎪
⎪
⎪
⎪ ⎪
⎪
⎪
⎪ ⎪
⎪
⎪
⎪ ⎪
⎪ ⎧
⎪
⎪ ⎪
⎪ ⎪ 2f (α) + 3 f (α) 2 > 0 ⇒ α l.a.s.
⎪
⎪ ⎪
⎪ ⎨
⎪
⎪ ⎪
⎪
⎪
⎪ ⎪
⎪ f (α) = −1
⎪
⎪ ⎪
⎩ ⎪
⎩
⎪
⎪ 2f (α) + 3 f (α) 2 < 0 ⇒ α r.
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎩
f (α) > 1 ⇒ α r.
Se 0 < b < 1/8, allora si verifica facilmente (mediante il test della derivata
del Teorema 3.57) che vi sono due equilibri positivi, α1 ≥ α2 > 0 ,
1 1√
α1,2 = ± 1 − 8b
2 2
con α1 stabile e attrattivo, α2 repulsivo; per evitare l’estinzione, b va scelto
in modo tale che valga α2 = α2 (b) < X0 , cioè (poiché X0 è un dato mentre
b è la quantità che possiamo scegliere) b deve verificare:
⎧
⎪
⎨ 0<b< 1 1
se X0 ≥ ,
1
8 2 (3.5)
⎪ 2 1
⎩ b< X0 − (X0 ) se 0 < X0 < .
2 2
114 3 Sistemi dinamici discreti: equazioni scalari ad un passo
α1 = 1 − 2r α2 = 0.
I) II)
α2 α1 α1
III)
I) b = 0, 04 < 1/8; X0 = 1, 5
II) b = 1/8; X0 = 1, 5
periodo al valore
P (r) = r (1 − 2r) = r − 2r 2 .
La scelta di r che massimizza il pescato P nel lungo periodo è rmax = 1/4 con
Pmax = 1/8.
Dunque 1/8 è il massimo pescato sostenibile con la strategia a frazione fissa
ed è compatibile con la stabilità.
I) II)
α2 α1 α2 α1
III)
I) r = 1/8 < 1/2; X0 = 0, 2 < α1
III) r = 1/2; X0 = 1, 3 α1 = α2
Zk+1 = 1, 5 (1 − r) Zk − 0, 5 (1 − r) (Zk )2 .
Teorema 3.69. Sia f ∈ C 1 (I) e sia {α0 , α1 } un 2 ciclo per il s.d.d. {I, f}.
Allora
I suoi punti fissi, diversi da 0 e 9/13, sono le soluzioni di f 2 (x) = x, tali che
f (x) = x, cioè
√
2197 2 2873 221 17 ± 17
− x + x− = 0 ⇔ x1,2 = .
64 64 16 26
3.8 Studio qualitativo e stabilità delle orbite periodiche 119
√
Esempio 3.71. Dato il s.d.d. {[0, 1] , f}, con f (x) = (1 + 2 2) x − x2 , de-
terminiamo le orbite 2 periodiche e studiamone la stabilità.
Sulla base del Lemma 3.68, cerchiamo i punti fissi di
√ & √ '& √ '
f 2 (x) = f (f(x)) = (1 + 2 2) (1 + 2 2)x(1 − x) 1 − (1 + 2 2)x(1 − x) =
√ √ √
= (9 + 4 2)x(1 − x) 1 − (1 + 2 2)x + (1 + 2 2)x2
√
che non siano anche punti fissi di f: (1 + 2 2)x (1 − x) = x, cioè diversi dai
due valori √
8−2 2
0 .
7
Sotto tali condizioni, con qualche calcolo, si ricava
√ √
2 4− 2 2+3 2
f (x) = x ⇔ x1 = oppure x2 = .
7 7
13 √
f(x) = 4 (x − x2 ) f(x) = (1 + 2 2)(x − x2 )
Fig. 3.20. Grafici di f e della sua iterata f 2 sull’intervallo [0, 1] (due esempi)
120 3 Sistemi dinamici discreti: equazioni scalari ad un passo
√ √ !
Per studiare la stabilità dell’orbita periodica 4 − 2 /7, 2 + 3 2 /7 os-
√
serviamo che da f (x) = (1 + 2 2) (1 − 2x) segue
√
4− 2 2+3√2
f 7 f 7 = |−3| > 1
Osservazione 3.72. Se {α0 , α1, . . . , αs−1} è un s ciclo per il s.d.d. {I, f} con
f ∈ C 1 (I), allora, per j = 0, 1, . . . , s − 1, vale l’identità
(f s ) (αj ) = f f s−1 (αj ) f f s−2 (αj ) · · · f (αj ) =
= f (α0 ) f (α1 ) · · · f (αs−1 )
cioè il numero (f s ) (αj ) non dipende da αj ma (come è naturale) dipende
da tutto il ciclo e può essere valutato senza bisogno di composizioni ma solo
moltiplicando tra loro le derivate in tutti i punti dell’orbita s periodica.
Se ne deduce, con lo stesso ragionamento utilizzato per provare il Teorema
3.69, una caratterizzazione della stabilità per gli s cicli.
Come si è già detto, non sono noti metodi generali per esplicitare leggi ricor-
sive non lineari. Tuttavia nei casi in cui mediante opportune trasformazioni
(necessariamente non lineari) dell’incognita ci si riconduce ad un problema
lineare nell’incognita trasformata, è possibile esplicitare la soluzione utiliz-
zando i risultati relativi ai s.d.d. lineari (un caso particolare è stato discusso
nel paragrafo 2.7).
3.9 Soluzioni in forma chiusa per alcuni s.d.d. non lineari 121
Xk+1 = f (Xk )
Xk = ψ−1 bk ψ (X0 ) (3.9)
Osservazione 3.75. Si osservi che dal teorema fondamentale del calcolo in-
tegrale segue che ψ ∈ C 1 (I) e ψ (x) = 1/g (x) è sempre dello stesso segno in I
perché g è continua e diversa da zero nell’intervallo I. Dunque ψ è strettamente
monotòna e quindi invertibile.
Ne segue che l’identità (3.7) può essere soddisfatta solo in intervalli in cui f
è strettamente monotòna.
3
La tesi del Teorema 3.74 vale, più in generale, anche se g si annulla in un numero
finito di punti di I, purché g non cambi segno e la funzione 1/g risulti integrabile in
senso improprio su I.
122 3 Sistemi dinamici discreti: equazioni scalari ad un passo
Prova del Teorema 3.74. Poiché ψ, f ∈ C 1 (I) (cfr. Osservazione 3.75), applicando
la regola di derivazione delle funzioni composte, si ottiene
e con la sostituzione
Yk = ψ (Xk ) k∈N
giungiamo a
Yk+1 = bYk k∈N
Y0 = ψ (X0 )
la cui soluzione esplicita è
Yk = bk Y0 = bk ψ (X0 )
da cui
Xk = ψ−1 bk ψ (X0 ) .
Esempio 3.77. Studio della logistica di parametro a : ha (x) = a x − x2 . In
questo caso l’equazione (3.7) corrisponde alla ricerca di b e g tali che g (x) = 0,
b = 0, b = 1 e
b g ax − ax2 = g(x) a (1 − 2x) . (3.11)
Un tentativo di soluzione della (3.11) è la ricerca di g lineare affine, cioè
g (x) = γx + δ: sostituendo tale g nella (3.11) si ottiene
b=a=2 γ = −2δ.
1
x= 1 − e−ψ
2
1
cioè ψ−1 (s) = 2 (1 − e−s ). A questo punto la (3.9) fornisce
1 1 1 2k
Xk = − exp −2k (− ln (1 − 2X0 )) = 1 − (1 − 2X0 ) .
2 2 2
Concludendo,
1 2k
Xk = 1 − (1 − 2X0 ) k∈N
2
Il lettore verifichi che tale soluzione esplicita è valida anche nei casi X0 ≥ 1/2
e soddisfa le proprietà di monotonia e convergenza deducibili dallo studio
qualitativo con le tecniche dei paragrafi 3.1, 3.2 e 3.3 .
Yk+1 = b (Yk ) Yk .
k
Il modulo della soluzione si ottiene facilmente: |Yk | = |b| |Y0 |.
Se, inoltre, Φ risulta pari, allora
Xk = Φ (Yk ) = Φ (|Yk |) = Φ bk Ψ (X0 ) .
b
√ 1 − ax + ax2 = 1 − 2x
a
che è una identità in x solo per (si rilegga l’enunciato del Teorema 3.74):
a = 4 e b = 2, se x ∈ [0, 1/2);
a = 4 e b = −2, se x ∈ (1/2, 1];
∀a, b con a > 0 se x = 1/2, 0, 1 .
Poiché 0 ∈ I e f (0) = 0, si ha
2 x 2 x
dt dt √
ψ1 (x) = = √√ = 2 arcsin x x ∈ [0, 1/2] .
0 t (1 − t) 0 t 1−t
(3.12)
Verifichiamo√ la correttezza della formula trovata, ponendo per comodità
A = arcsin X0 :
2 2 2 2
f (Xk ) = 4 sin 2k A 1 − sin 2k A = 4 sin 2k A cos 2k A =
k+1
= sin 2 A = Xk+1 .
Esercizio 3.24. Al variare del parametro reale non negativo a, determinare il com-
portamento asintotico della successione
1 6
Yk+1 = Yk2 +
5 5
Y0 = a
126 3 Sistemi dinamici discreti: equazioni scalari ad un passo
⎨ 1
Yk+1 = 2Yk exp − Yk ∀k ∈ N
2
⎩
Y0 = a
√
Esercizio 3.26. Assegnati due numeri reali positivi a, b tali che a > b > 0, si
consideri la successione Y definita per ricorrenza:
⎧
⎨ 1 b
Yk+1 = Yk + ∀k ∈ N
2 Yk
⎩
Y1 = a
Mostrare che Yk è ben definita per ogni k, che è monotòna decrescente, che
√ esiste il
limite L di Yk per k → +∞ e calcolarlo. Cosa si può dire nel caso Y1 = b?
Posto k = |Yk − L|, mostrare che
2
k+1 = √k .
2 b
√
Calcolare 3 a meno di 10−7 .
( ) √
Esercizio 3.27. Provare che 6 + 6 + 6 + · · · = 3 .
Esercizio 3.28. Data g : R → R priva di punti fissi, posto f (x) = g (x) − x e
Yk+1 = Yk + f (Yk ), dimostrare che se il massimo assoluto di f è strettamente ne-
gativo, allora Yk → −∞, mentre se il minimo assoluto di f è strettamente positivo
allora Yk → +∞.
Esercizio 3.29. Un tipo di batterio si suddivide in due batteri con le sue stesse
caratteristiche oppure muore. Sia p la probabilità di suddivisione di ciascuno di tali
batteri (e di tutta l’eventuale discendenza). Qual è la probabilità s che la discendenza
di tale batterio non si estingua mai?
Esercizio 3.30. Studiare graficamente il s.d.d. {I, f } con I = [0, 1] ed
1
f (x) = sin (πx).
2π
Esercizio 3.31. Studiare graficamente il s.d.d. {I, f } con I = [0, 1] ed
f (x) = sin (πx).
Esercizio 3.32. Mostrare che esiste α ∈ (0, 1) tale che limk→+∞ cosk x = α per
ogni x ∈ R.
Ricavare numericamente il valore α = 0, 73909 . . . .
Suggerimento: mostrare che tutte le orbite del s.d.d. {I, cos x} sono attratte dall’u-
nico equilibrio α.
Stimare tale equilibrio e mostrare che è stabile.
Esercizio
% &3.33. Determinare eventuali equilibri, studiandone la stabilità, del s.d.d.
R, x + x3 .
Esercizio
% &3.34. Determinare eventuali equilibri, studiandone la stabilità, del s.d.d.
R+ , x−2 .
3.10 Esercizi di riepilogo 127
Esercizio 3.35. Si studi al variare del parametro reale β la successione definita per
ricorrenza
√
Xk+1 = fβ (Xk ) con fβ (x) = β + x.
mostrare che il dato iniziale X0 = 1/7 genera una traiettoria definitivamente 3 perio-
dica e che il s.d.d. presenta due orbite di periodo 3 entrambe instabili (Suggerimento:
si studi graficamente l’equazione T 3 (x) = x ).
Gran parte di questo capitolo è dedicato allo studio qualitativo del s.d.d.
associato alla crescita logistica discreta, sia per l’importanza di tale model-
lo matematico, sia perché, come vedremo in dettaglio, la dinamica ad esso
corrispondente è simile a quella di molti altri s.d.d. non lineari unimodali.
In tale studio incontreremo equilibri, orbite periodiche, biforcazioni e, in al-
cuni casi, anche comportamenti non banali che vengono definiti dinamiche
caotiche.
Alcune elementari nozioni di topologia, utili per la comprensione di questo
capitolo, sono richiamate in Appendice E.
logistica:
0 1
ta: diciamo che si tratta di modelli deterministici. Tuttavia, nel caso della
crescita logistica, non si ha più una descrizione qualitativa semplice dell’an-
damento di Xk , né tantomeno si può pensare a crescite indefinite, o estinzioni
per ogni dato iniziale e per ogni scelta del parametro positivo a; intervengono
invece oscillazioni ed altri fenomeni con una struttura molto complicata.
Anche senza un’analisi teorica, si può capire già da semplici esperimenti con
il metodo grafico, che si possono osservare molti tipi di comportamento qua-
litativo. Il lettore è invitato a fare degli esperimenti grafici sia a mano, sia al
computer, prima di proseguire (per generare le ragnatele si può utilizzare il
Notebook relativo proposto nell’Appendice H).
Cerchiamo di dare una idea di alcuni fenomeni che possono presentarsi, senza
alcuna pretesa di completezza; infatti, nonostante la formulazione del model-
lo sia elementare, la descrizione di tutte le sue soluzioni nasconde problemi
tutt’altro che elementari, e talora non risolti.
Consideriamo pertanto il s.d.d. {[0, 1] , ha } con a ∈ [0, 4].
Si può osservare graficamente (e si può dimostrare analiticamente) che, al cre-
scere del parametro a il comportamento qualitativo delle traiettorie cambia
radicalmente: il nostro scopo è quello di avere un’idea complessiva del quadro
delle traiettorie per tutti i valori di a. Per valori piccoli di a l’analisi è elemen-
tare, come vedremo nel seguito, ma al crescere di a la situazione è decisamente
più complessa e richiede l’introduzione di nuovi strumenti.
Il grafico di ha è una parabola di vertice (1/2, a/4), concava e simmetrica
rispetto alla retta verticale di equazione x = 1/2.
Risolvendo l’equazione ha (x) = x si deduce che il s.d.d. {[0, 1] , ha} ha sempre
l’equilibrio 0: tale equilibrio è unico se 0 ≤ a ≤ 1, invece, se 1 < a ≤ 4, ha
presenta anche il punto fisso αa = (a − 1) /a. Inoltre, ai valori iniziali 1 e (se
1 ≤ a ≤ 4) 1/a corrispondono traiettorie definitivamente costanti, giacché
ha (1) = 0 e ha (1/a) = αa.
h1/2 h1
0 1/2 1 0 1/2 1
Prova. La parte relativa agli equilibri è una banale conseguenza dell’ipotesi a > 1.
Se s è un intero ≥ 2, allora, poiché 0 è un punto fisso di ha per ogni a e ha (1) = 0,
la tesi relativa alle orbite periodiche è dimostrata se si prova che tutte le soluzioni
di {x ∈ R : hsa (x) = x} sono contenute in [0, 1]. Proviamo questo fatto.
Se x < 0, allora ha (x) < x < 0, ricalcolando ha si ottiene ha2 (x) < ha (x) < x < 0,
e, iterando
hsa (x) < hs−1
a (x) < · · · < x ∀s ≥ 1.
Se x > 1 allora ha (x) < 0, e, iterando
Il Teorema 4.2, già sorprendente in sé, è solo una piccola parte delle sorprese
relative alle orbite periodiche: si tratta di parte dell’informazione contenuta
nell’elegante risultato dimostrato nel 1964 da O.M. Sharkovsky1 , che enuncia-
mo nel seguito. Sottolineiamo che l’aspetto più interessante nella ricchezza di
struttura del quadro delle traiettorie di {I, f} è che la tesi segue dalla sola
ipotesi di continuità per f.
Xk+1 Xk
1/2
1/2 1 Xk
k
% &
Fig. 4.3. Orbita periodica {0, 1/2, 1} del s.d.d. R, −3x2 + 5x/2 + 1/2
1
Oleksandr Mikolaiovich Sharkovsky, 1936- .
134 4 Complessità dei sistemi dinamici non lineari: biforcazioni e caos
1 ≺ 2 ≺ 22 ≺ 23 ≺ 24 ≺ · · · ≺ 9 · 2n ≺ 7 · 2n ≺ 5 · 2n ≺ 3 · 2n ≺ · · ·
≺ 9 · 22 ≺ 7 · 22 ≺ 5 · 22 ≺ 3 · 22 ≺ · · ·
≺9·2 ≺7·2 ≺5·2 ≺ 3·2 ≺ ···
≺9 ≺7 ≺5 ≺3
Osservazione 4.5. Il Teorema 4.4 è molto fine nel senso che si possono forni-
re esempi con orbite di periodo 5 senza orbite di periodo 3 e, più in generale,
se n ≺ s, si possono avere orbite di periodo n senza alcuna orbita di periodo s.
Fig. 4.4. Alcune iterazioni della logistica h3,1 : h3,1 , (h3,1 )2 , (h3,1 )4
4.2 Il teorema di Sharkovsky 135
Diamo per completezza la dimostrazione del Teorema 4.2 che può essere omes-
sa in una prima lettura senza pregiudicare la comprensione del seguito.
136 4 Complessità dei sistemi dinamici non lineari: biforcazioni e caos
Prova del Teorema 4.2. Sia {a, b, c} l’orbita 3 periodica dove a < b < c. Supponiamo
f (a) = b, f (b) = c e f (c) = a (l’altro caso è analogo).
Siano I0 = [a, b] e I1 = [b, c]. Allora per il teorema dei valori intermedi
f k (p) ∈ I1 k = 0, 1, . . . , n − 2
Per provare la (4) siamo ancora liberi di scegliere Jn−1 . Osserviamo che
f n−1 (Jn−2 ) = f f n−2 (Jn−2 ) = f (I1 )
e, da f (I1 ) ⊃ I0 , segue f n−1 (Jn−2 ) ⊃ I0 ; allora per il Lemma 4.8 esiste Jn−1 ⊂ Jn−2
tale che f n−1 (Jn−1 ) = I0 . Infine
f n (Jn−1 ) = f f n−1 (Jn−1 ) = f (I0 )
Teorema 4.12 (D. Singer, 1978). Sia {I, f} un s.d.d. con f ∈ C 3 (I)
ed f si annulli al più in un numero finito di punti x1 , . . . , xm. Sia anche
138 4 Complessità dei sistemi dinamici non lineari: biforcazioni e caos
Per mostrare la tesi basta provare che f s ha solo un numero finito di punti fissi, cioè
f s (x) = x ha un numero finito di soluzioni; per il teorema di Rolle, è sufficiente
verificare che l’equazione (f s ) (x) = 1 ha un numero finito di soluzioni in I.
Se questo fosse falso, allora, sempre per il Teorema di Rolle, (f s ) dovrebbe avere
una infinità di punti con derivata nulla ed una infinità di punti di minimo locale, e
in tali punti x si avrebbe
(f s ) (x) = 0 (f s ) (x) ≥ 0;
allora D (f s ) (x) < 0 implica (f s ) (x) < 0 e (f s ) (x) > 0. Dunque (f s ) è negativa
in infiniti punti x intercalati ad infiniti punti x in cui vale 1.
Ne segue l’esistenza di infiniti punti di I in cui (f s ) si annulla, cioè infiniti punti in
cui si annulla f , in contraddizione con quanto supposto precedentemente.
Il lettore è invitato a riflettere sul fatto che la tesi del Teorema 4.12 è banal-
mente vera per ogni f polinomio di secondo grado.
Fig. 4.7. Ragnatele relative ai s.d.d. {R, gb }, gb (x) = ex+b , b = −1, 5; −1; 0
4.3 Biforcazioni di una famiglia ad un parametro di s.d.d. 141
x x
+1
+1
−1 O b
e−1
a
Fig. 4.8. Diagrammi di biforcazione: {R, fa } ,{R, gb }, fa (x) = aex , gb (x) = ex+b
O 1 2
h1/2 h1 h2
1 1 1
1_
2
1+a
ax2 − (1 + a) x + =0 x ∈ [0, 1] , 1<a<4.
a
L’equazione di secondo grado in x ammette due soluzioni βa e γa distinte e
diverse da 0 e da αa se e solo se a > 3 (vedi Esercizio 4.5):
a + 1 + (a + 1) (a − 3) a + 1 − (a + 1) (a − 3)
βa = γa = .
2a 2a
Dunque βa e γa appartengono all’orbita 2 periodica, infatti ha2 (x) = x è una
equazione di quarto grado, dunque non può avere altre soluzioni oltre 0, αa ,
βa e γa . In particolare {βa , γa } è l’unica orbita 2 periodica. Per studiare la
stabilità dell’orbita 2 periodica {βa , γa } osserviamo che da ha (x) = a (1 − 2x)
si deduce:
ha (βa ) = −1 − (a + 1) (a − 3) ha (γa ) = −1 + (a + 1) (a − 3)
0, 5 α a 0, 8
a=3 αa = 2/3
ha
0, 5 α a 0, 8
0, 5 α a 0, 8
2
Pierre Joseph Louis Fatou, 1878-1929.
146 4 Complessità dei sistemi dinamici non lineari: biforcazioni e caos
0.8
0.6
0.4
0.2
1
0.9
0.8 0.8
0.7
0.6
0.6
0.4
0.5
0.2
1 ηa 1
0 1 αa ηa 1 αa ηa 0 1
a
F = 4, 6692016091029 . . .
In tal modo è possibile stimare4 entro quale valore del parametro a la succes-
sione di raddoppi di periodo si sarà completata e, quindi, a partire da quale
valore di a vi saranno orbite 2n periodiche per ogni n.
Il fatto interessante è l’universalità della costante di Feigenbaum: infatti, la
presenza di una cascata di raddoppi di periodo con tale comportamento asin-
√
3
ηa = a + a2 − 4 /2a verifica l’equazione h2a (ηa ) = αa .
4
Posto pn = an − an−1 , l’informazione limn pn /pn+1 =F > 1 assicura (vedi (21)
nell’Appendice A) che la serie dei passi è convergente: +∞
n=1 pn < +∞ .
4.3 Biforcazioni di una famiglia ad un parametro di s.d.d. 149
totico è tipico di molti sistemi dinamici (ad esempio, fa (x) = a sin (πx) oppure
ga (x) = ax2 sin (πx) in [0, 1]).
Più precisamente, se f verifica:
• f : [0, 1] → R è dotata di tutte le derivate;
• f ha un unico punto di massimo x ∈ (0, 1) tale che f (
x) < 0;
• f è strettamente crescente in [0, x) e strettamente decrescente in (x, 1];
• f ha derivata schwarziana (Df) (x) < 0 per ogni x ∈ [0, 1] con x = x (vedi
Definizione 4.11);
allora al variare del parametro a in [0, 1/f (
x)] i valori ak di biforcazione corri-
spondenti a raddoppi di periodo della collezione di s.d.d. {I, af} sono tali che
le differenze ak − ak−1 formano una successione asintoticamente geometrica e:
ak − ak−1
lim = F.
k ak+1 − ak
a1 = 3
√ 2
a2 = 1 + 6 = 3, 449489 . . .
4
a3 = 3, 544090 . . .
8
a4 = 3, 564407...
16
a5 = 3, 568759...
32
a6 = 3, 569692...
64
a7 = 3, 569891 . . .
27
..
. ..
.
an
.. 2n
. ..
a∞ = 3, 5699456 . . . .
√
aω = 1 + 8 = 3, 828427 . . .
3
150 4 Complessità dei sistemi dinamici non lineari: biforcazioni e caos
implica che {β,√γ} è attrattiva e stabile. Quindi applicare tale proprietà ad f = ha2 ,
dove a2 = 1 + 6, e dedurne la stabilità del 2 ciclo).
Esercizio 4.8. Determinare mediante una simulazione numerica al computer (cioè
senza utilizzare le formule esplicite dell’Esercizio 4.2) i 2 cicli della parabola logistica
ha per a = 3, 1, a = 3, 2 e a = 3, 3. Provare che per ciascuno dei tre valori del para-
metro esiste un unico 2 ciclo. Provarne direttamente la stabilità usando il Teorema
3.69.
Disegnare alcune iterazioni con il metodo grafico per la ricerca di punti fissi di h2a
con i valori scelti.
Esercizio 4.9. Mediante simulazione numerica al computer determinare il 4 ciclo
per ha se a = 3, 5.
Provare poi che è stabile e attrattivo. Verificare graficamente (ragnatela) che è un
4 ciclo.
Plottare ha e le sue intersezioni con l’identità (è il modo più rapido per trovare il
ciclo). Si suggerisce di trovare le intersezioni con il metodo di Newton. Si ricorda
l’opportunità di inizializzare con il valore critico X0 = 1/2.
Esercizio 4.10. 1) Per il s.d.d. {[0, 1] , ha } il punto αa è un equilibrio stabile e at-
trattivo se e solo se 1 < a ≤ 3. Determinare l’unico valore b0 di a in (1, 3] per cui
αa risulta superattrattivo (cioè h (αa ) = 0).
2) Per il s.d.d. {[0, 1] , ha } l’orbita
√ 2 periodica {γa , βa } è stabile e attrattiva se e solo
se 3 = a1 < a ≤ a2 = 1 + 6. Determinare b1 di a ∈ (a1 , a2 ) per cui
l’unico valore
l’orbita {γa , βa } è superattrattiva (cioè h2a (γa ) = h2a (βa ) = 0 ).
Con riferimento ai valori ak di biforcazione corrispondenti alla cascata di raddoppi
di periodo per la logistica ha si può provare che, per ogni k ∈ N, esiste bk tale che
ak < bk < ak+1 , e per a = bk la logistica ha presenta un 2k ciclo superattrattivo ed
il valore 1/2 appartiene a tale ciclo.
√
Esercizio 4.11. Con a che varia in un intorno di aω = 1 + 8, plottare ha e (ha )3 ,
studiare graficamente e numericamente le soluzioni di (ha )3 (x) = x. Dedurne che per
a < aω non esistono orbite 3 periodiche e per a ≥ aω vi sono orbite 3 periodiche. Cal-
colare numericamente un 3 ciclo per ha corrispondente al valore a = 3, 84. Provare
poi che è stabile ed attrattivo.
4.4 Caos ed insiemi frattali 151
Esercizio 4.12. Verificare che la famiglia di s.d.d. {R, fa }, con fa (x) = ax(1 − x2 )
ed a ∈ R, presenta una biforcazione a forchetta.
2x x ∈ [0, 1/2]
T : [0, 1] → [0, 1] T (x) =
2 − 2x x ∈ [1/2, 1]
T T2
T3 T4
2π 2π
0 π 2π 0 π 2π
2π 2π
0 π 2π 0 π 2π
D:S→S
!
dove S = (x, y) ∈ R2 : x = cos θ, y = sin θ, θ ∈ [0, 2π) . È immediato verifi-
care che anche D ha almeno un’orbita 3 periodica (basta osservare che il grafico
di D3 ha intersezioni con quello dell’identità in punti che non appartengono
al grafico di D).
Inoltre la dinamica di D esibisce orbite di ogni periodo intero. Questa proprie-
tà va verificata direttamente poiché il Teorema 4.2 non si applica a funzioni
continue da S in S: si consideri ad esempio f(ϑ) = ϑ + 2π k che esibisce solo
punti k periodici.
5
Ci consentiamo un lieve abuso di notazione, denotando con la stessa lettera una
funzione diversa ma strettamente associata a D.
154 4 Complessità dei sistemi dinamici non lineari: biforcazioni e caos
Osservazione 4.31. Anche per il s.d.d. {[0, 2π), D} tutti gli equilibri e le
orbite periodiche sono repulsivi.
Fig. 4.18. Pasta sfoglia: prime operazioni del pasticcere interpretate mediante le
trasformazioni T e D iterate
6
Per una definizione formale di dimensione si veda l’Appendice E.
4.4 Caos ed insiemi frattali 157
E0 = [0, 1]
( ) ( )
1 2
E1 = 0, ∪ ,1
3 3
( ) ( ) ( ) ( )
1 2 1 2 7 8
E2 = 0, ∪ , ∪ , ∪ ,1
9 9 3 3 9 9
...
6
∞
C= Ek
k=0
Osserviamo che:
• C è autosimilare: la sua intersezione con uno qualsiasi degli intervalli al
passo n nella costruzione precedente corrisponde ad un suo riscalamento di
un fattore 3−n , a meno di una traslazione;
• C ha una struttura fine: non riusciamo a disegnarlo o ad immaginarlo con
precisione;
E0
E1
E2
E3
E4
1.5
Fig. 4.20. Grafico di g (x) = 3T (x)/2 ; due punti fissi repulsivi: 0 , 3/4
_3
2
Elenchiamo alcune proprietà del s.d.d. {R, ha }, con a > 4, senza riportarne la
dimostrazione. Fissato a:
• l’insieme !
R = x ∈ [0, 1] : hka (x) ∈ [0, 1] ∀k ∈ N
che è per definizione invariante rispetto ad ha , è un insieme di tipo Cantor;
• R è repulsivo: limk hka (x) = −∞ ∀x ∈ R\R;
• la dinamica di ha ristretta ad R è caotica.
Teorema 4.39 (T.Y. Li & J.A. Yorke, 1975). Se il s.d.d. {I, f}, dove
I è un intervallo ed f : I → I è una funzione continua, ha un’orbita periodica
di minimo periodo 3, allora esiste un sottoinsieme E ⊆ I non numerabile e
non contenente alcuna orbita periodica, tale che:
per ogni x, y ∈ E con x = y valgono
max lim f k (x) − f k (y) > 0 min lim f k (x) − f k (y) = 0 ;
k k
La tesi del Teorema 4.39 viene espressa in modo colloquiale nella forma se-
guente “il periodo 3 implica caos”. Tale affermazione è corretta solo in un
contesto in cui (nella definizione di caos) non si richiede la densità delle orbite
periodiche in tutto I, e limitatamente ai s.d.d. scalari.
Esercizio 4.13. Consideriamo una lancetta che si muove con velocità angolare uni-
forme ed unitaria nel quadrante di un cronometro, cioè compie un giro in 60 unità
di tempo (secondi).
Descrivere il s.d.d. che fa corrispondere alle varie posizioni iniziali le traiettorie della
lancetta ad intervalli di tempo di un secondo.
Dire se tale s.d.d. è topologicamente transitivo, se le orbite periodiche sono dense,
e se vi è dipendenza sensibile dai dati iniziali.
Esercizio 4.14. Consideriamo un orologio con due lancette, quella delle ore e quel-
la dei minuti, che si muovono a scatti, la prima ogni ora, la seconda ogni minuto.
Descrivere la dinamica Xk = ϕk − ψk dove ϕk è la posizione angolare delle lancette
delle ore e ψk di quella dei minuti (si considerino angoli in [0, 2π)).
Esercizio 4.16. Provare che esiste un insieme denso E ⊂ [0, 1] tale che per ogni
X0 ∈ E si ha limk T k (X0 ) = 0 (per la precisione, esiste k0 = k0 (X0 ) tale che
T k (X0 ) = 0 per ogni k > k0 ), dove T è la funzione tenda.
Esercizio 4.17. Provare che esiste un insieme denso E ⊂ [0, 1] tale che per ogni
X0 ∈ E si ha limk Dk (X0 ) = 0 (per la precisione, esiste k0 = k0 (X0 ) tale che
Dk (X0 ) = 0 per ogni k > k0 ), dove D è la mappa del raddoppio di fase.
g = ϕ ◦ f ◦ ϕ−1 . (4.2)
Relativamente alle (v), (vi) e (vii) osserviamo che la dipendenza sensibile dai
dati iniziali da sola non si conserva in generale per coniugazione topologica,
come mostra il controesempio seguente.
! !
Esempio 4.43. Siano (0, 1) , x2 e (1, +∞) , x2 . Allora ϕ (x) = 1/x è una
coniugazione topologica tra i due s.d.d.. Ma il primo non ha una dipenden-
za sensibile dai dati iniziali, dato che 0 ne attrae tutte le traiettorie, men-
tre 0 ∈ (1, +∞) e
il secondo
ha dipendenza sensibile dai dati iniziali: X0 , X
X0 − X0 = ε > 0 implicano
k = X 2k − X
2k =
Xk − X 0 0
0 X 2k−1 + X 2k−2 X 2k−1 ≥ 2kε.
0 + · · · + X
= X0 − X 0 0 0
Tuttavia vale il seguente teorema di cui non diamo la dimostrazione.
164 4 Complessità dei sistemi dinamici non lineari: biforcazioni e caos
Teorema 4.44. La dipendenza sensibile dai dati iniziali si preserva per co-
niugazione topologica se l’intervallo I (e di conseguenza anche J) è chiuso e
limitato.
Prova. La funzione ϕ (x) = (sin (πx/2))2 è una coniugazione topologica tra i due
s.d.d. {[0, 1] , h4 } e {[0, 1] , T }. Infatti ϕ ([0, 1]) = [0, 1], ϕ è continua in [0, 1], stret-
tamente monotòna e inoltre:
π 4
π 2 π 2
π 2
h4 (ϕ (x)) = 4 sin x − sin x = 4 sin x cos x =
2 2 2 2
(sin (πx))2 se 0 ≤ x ≤ 1/2
= (sin (πx))2 = =
(sin (πx − π))2 se 1/2 < x ≤ 1
= ϕ (T (x)) .
Il primo esempio del paragrafo 4.2 mostra che la dinamica! di un s.d.d. as-
sociato ad una funzione unimodale come R, ax2 + bx + c con a < 0 può
presentare orbite di periodo 3.
La coniugazione topologica ed i Teoremi 4.44 e 4.45 assicurano che la dina-
mica della logistica h4 in [0, 1] produce orbite di periodo
√ 3: questo in realtà
avviene a partire dal valore aω di a (con aω = 1 + 8 = 3, 828427...). Dun-
que, in accordo con il Teorema di Sharkovsky, se a > aω allora la logistica ha
traiettorie periodiche di ogni periodo intero.
(si veda l’analisi di h4 nell’Esempio 3.78). Nelle ipotesi del Teorema 3.74,
utilizzando le notazioni del paragrafo 3.9, osserviamo che J = ψ (I) è un
intervallo, i s.d.d. {I, f} e {J, bx} sono topologicamente coniugati, la coniuga-
zione topologica è data da ψ e risulta f = ψ−1 ◦ v ◦ ψ. Osserviamo infine che il
s.d.d. {J, bx} è ben definito (cioè per ogni y ∈ J risulta by ∈ J); anche questo
fatto è una conseguenza del Teorema 3.74, infatti se y ∈ J allora esiste x ∈ I
tale che y = ψ (x), dunque, posto x = f (x) si ottiene by = bψ (x) = ψ (
x) che
ovviamente appartiene a J.
Esercizio 4.22. Verificare che il cambio di variabili ϕ (x) = x − b/ (1 − a), utiliz-
zato nella dimostrazione del Teorema 2.5 per studiare il s.d.d. {R, ax + b} nel caso
a = 1, è effettivamente una coniugazione topologica tra la funzione lineare affine
f (x) = ax + b e la funzione lineare g (x) = ax.
Esercizio 4.23. Mostrare con un esempio che due s.d.d. lineari possono non essere
topologicamente coniugati.
Esercizio
% 4.26. Mostrare
& che i sistemi dinamici {[0, 1] , h4 } e {[0, 1] , g} dove g (x) =
min 4x2 , 4 (x − 1)2 non sono topologicamente coniugati, nonostante il fatto che sia
h4 sia g sono unimodali, continue, suriettive e strettamente monotòne crescenti in
(0, 1/2), decrescenti in (1/2, 1).
Si osservi che dagli esercizi precedenti segue una condizione necessaria per la
coniugazione topologica fra due funzioni f e g: vi deve essere una corrispon-
denza tra tutti gli eventuali punti e/o intervalli in cui f e g coincidono con
la funzione identità.
Esercizio 4.28. Dimostrare che il Teorema di Sharkovsky vale anche per i s.d.d.
del tipo {I, f } con I intervallo aperto.
g (x)
Ng (x) = x −
g (x)
il cui dominio coincide con quello di g, privato degli zeri di g , poi, a partire
da un valore X0 , si genera per ricorrenza la successione X = {Xk } iterando
la funzione Ng :
X0 X1 X2
g (Xk )
Xk+1 = Xk −
g (Xk )
max g 2
0 < Xk+1 − α < (Xk − α) .
2g (α)
168 4 Complessità dei sistemi dinamici non lineari: biforcazioni e caos
−x x
x
Fig. 4.25. Grafici di arctan x e 2x/ 1 + x2 ; 2 ciclo di {R, Narctan }
4.7 Sistemi dinamici discreti nel campo complesso 169
ne una descrizione completa del quadro delle fasi del s.d.d. {R, Nf } che qui
riassumiamo:
k
• se |X0 | = x
, allora Xk = (−1) x ;
k
• se |X0 | < x
, allora limk Xk = 0, sign(Xk ) = (−1) sign(X0 ), |Xk | 0;
k
• se |X0 | > x, allora limk |Xk | = +∞, sign(Xk ) = (−1) sign(X0 ), |Xk |
+∞.
Lo 0 è un equilibrio stabile e localmente attrattivo, mentre {
x, −
x} è un 2 ciclo
repulsivo.7
Per confronto con le definizioni dei paragrafi 3.1 e 3.5, si osservi che l’insieme
{z ∈ C : |z − α| < δ} è un disco, mentre l’insieme {x ∈ R : |x − α| < δ} è un
intervallo.
Definizione 4.54. Un equilibrio α di un s.d.d. {I, f} si dice equilibrio lo-
calmente attrattivo se esiste η > 0 tale che, per ogni valore iniziale X0 ∈
I ∩ {z ∈ C : |z − α| < η}, posto Xk = f k (X0 ), risulta
lim Xk = α.
k
α α+δ
Per i s.d.d. {I, f}, con f ∈ C 1 (I) ed I disco nel piano complesso, continua a
valere il criterio di stabilità del Teorema 3.57, pur di sostituire il modulo di
numero reale con quello di numero complesso.
e max |f | può essere stimato in un opportuno disco di centro α in modo tale che
risulti max |f | < 1.
Alla luce del Teorema 4.56 è naturale conservare anche nel caso complesso la
terminologia della Definizione 3.59 (equilibri superattrattivi, neutri). Riconsi-
deriamo dal punto di vista dei sistemi dinamici complessi il metodo di Newton
per la ricerca delle radici di un polinomio nel campo complesso.
Prova. Sia α una radice di p con molteplicità m. Allora p(z) = (z − α)m q(z) con
q (α) = 0 e
p (z) (z − α) q (z)
Np (z) = z − =z− .
p (z) (z − α) q (z) + mq (z)
Np (α) = α.
Viceversa, se Np (α) = α, allora α − p (α) /p (α) = α cioè8 p (α) = 0.
Infine
2
(p (z)) − p (z) p (z) p (z) p (z)
(Np ) (z) = 1 − 2 = .
(p (z)) (p (z))2
Dunque, se α è uno zero semplice di p, cioè p (α) = 0 e p (α) = 0, allora (Np ) (α) = 0
cioè α è stabile e superattrattivo.
Se α non è uno zero semplice, cioè p (α) = p (α) = 0, allora esiste m ≥ 2 tale che
p (z) = (z − α)m q (z) e q (α) = 0; ne segue
(Np ) (z) =
m
(z − α) q (z) m (m − 1) (z − α) q (z) + 2m (z − α)m−1q (z) + (z − α)m q (z)
m−2
2
m (z − α)m−1 q (z) + (z − α)m q (z)
q (z) m (m − 1) q (z) + 2m (z − α) q (z) + (z − α)2 q (z)
=
(mq (z) + (z − α) q (z))2
m (m − 1) q (α)2 m−1
(Np ) (α) = 2 = <1
2
m q (α) m
cioè α è attrattivo e stabile.
Grazie al fatto che le funzioni di variabile complessa derivabili con derivata
continua e non costanti hanno solo zeri isolati e di ordine finito ed intero, si
può provare nello stesso modo il seguente risultato di portata più generale con
una dimostrazione identica a quella del Teorema 4.57.
Teorema 4.58. Sia f ∈ C 1 (Ω), Ω ⊂ C aperto connesso, ed f non costante.
Definiamo
f (z)
Nf (z) = z −
f (z)
dove è sottointesa l’eventuale semplificazione di fattori comuni di f e f . Al-
lora:
1) Nf è definita e derivabile nell’insieme I = Ω\{z ∈ Ω : f (z) = 0 =
f(z)}.
2) Nf è definita e continua negli zeri di f.
3) L’insieme dei punti fissi di Nf in Ω coincide con l’insieme degli zeri di f.
4) Tutti i punti fissi di Nf sono localmente asintoticamente stabili per il
s.d.d. {I, Nf }.
5) Gli zeri semplici di f sono superattrattivi per il s.d.d. {I, Nf }.
8
Nell’espressione p (α) /p (α) deve essere sempre sottointesa l’eventuale
semplificazione.
4.7 Sistemi dinamici discreti nel campo complesso 173
p (z) = az 2 + bz + c a, b, c, ∈ C , a = 0. (4.3)
az 2 + bz + c az 2 − c
Np (z) = z − = . (4.4)
2az + b 2az + b
Lemma 4.60. Se p, Np sono definiti da (4.3) e (4.4), e a = 0 , allora Np è
topologicamente coniugato a
z2 + D
Nq (z) =
2z
dove
√
D
√
− D
√
X0 D
√
− D
Fig. 4.28. D > 0, dinamica di Nq (x) = x2 + D /2x , q (x) = x2 − D
Fig. 4.29. D < 0, dinamica di Nq (x) = x2 − 1 /2x, q (x) = x2 + 1
176 4 Complessità dei sistemi dinamici non lineari: biforcazioni e caos
z1 r
z2
az 2 − c
{ C\ {(z1 + z2 ) /2} , Np } con Np (z) =
2az + b
è caotico sulla retta r perpendicolare al segmento di estremi z1 , z2 e passante
per il punto medio (z1 + z2 ) /2. Inoltre tale retta r separa due semipiani aperti
che sono i bacini di attrazione di z1 e z2 (stabili e superattrattivi).
Se il polinomio p (z) = az 2 + bz + c ha una sola radice, allora tutti i pun-
ti di C sono nel bacino di attrazione di tale radice che risulta globalmente
asintoticamente stabile (in questo caso il s.d.d. è definito in tutto C).
Finora siamo stati intenzionalmente vaghi nella descrizione del s.d.d. associa-
to ad Np con p polinomio di secondo grado: anche se Np è definito in ogni
z ∈ C diverso da (z1 + z2 ) /2 = −b/2a tuttavia esiste una infinità di valori
9
Arthur Cayley, 1821-1895.
4.7 Sistemi dinamici discreti nel campo complesso 177
|X60 − 1| < 1/4 è ragionevole supporre che X0 sia nel bacino di attrazione
di 1 e decidiamo di colorarlo in grigio, se X60 − e2πi/3 < 1/4 è ragionevole
supporre che X0 sia4πi/3
nel bacino
di attrazione di e2πi/3 e decidiamo di colorarlo
in nero, se X60 − e < 1/4 è ragionevole supporre che X0 sia nel bacino
di attrazione di e4πi/3 e decidiamo di colorarlo in bianco.
Se le risorse di calcolo lo consentono, senza rendere eccessivamente lunghi i
tempi di attesa, si sostituisca 60 con 100.
Qualche commento su come sono stati ottenuti i diagrammi: la Fig. 4.31 rap-
presenta i bacini di attrazione delle tre radici complesse di 1 rispetto alla
dinamica di Nz3 −1 .
Nei punti di una griglia 200 × 200 collocata nel quadrato del piano complesso
{z ∈ C : |Re (z)| ≤ 2, |Im (z)| ≤ 2} si calcolano le iterate di Nz3 −1 fino a che
si ottiene un valore che differisce meno di 0, 5 da una delle tre radici com-
plesse dell’unità (1, exp 2πi/3, exp 4πi/3). Quando è soddisfatto tale test di
prossimità si arrestano i calcoli e si assegna un colore convenzionale: grigio in
prossimità ad 1, nero in prossimità ad exp (2πi/3), bianco in prossimità ad
exp (4πi/3).
Fig. 4.32. Bacini di attrazione in C delle radici n-esime complesse dell’unità per
la dinamica associata al metodo di Newton Nz n −1 con n = 1, . . . , 12
10
Ricordiamo che z appartiene al bordo dell’insieme E ⊂ C se per ogni r > 0
esistono w ∈ E e u ∈ C\E tali che |z − w| < r e |z − u| < r. Dunque z nel bordo di
tutti i bacini significa che per ogni r > 0 esistono w1 , . . . , wn tali che |z − wj | < r
ed ogni wj è nel bacino della j-esima radice complessa di 1.
180 4 Complessità dei sistemi dinamici non lineari: biforcazioni e caos
a = (8/7) (cos π/6 + i sin π/6) a = (7/8) (cos π/6 + i sin π/6)
Fig. 4.33. Traiettorie a spirale del s.d.d. {C, az} : convergenti se |a| < 1 ,
divergenti se |a| > 1
Dunque tutte le traiettorie di {C, az} sono del tipo Xk = ak X0 . Il disegno se-
guente evidenzia i primi passi di alcune traiettorie di {C, az} di punto iniziale
X0 = 1.
Dunque:
• se |a| < 1, allora 0 è l’unico equilibrio di {C, az} ed esso è anche global-
mente asintoticamente stabile;
• se |a| > 1, allora 0 è ancora l’unico equilibrio, ma in tal caso è repulsivo;
• se a = 1, allora tutti i punti di C sono equilibri e tutte le traiettorie sono
costanti;
• se |a| = 1 ma a = 1, allora 0 è nuovamente l’unico equilibrio, stabile ma
non attrattivo: le traiettorie ruotano attorno all’origine; sono tutte perio-
diche se l’argomento di a è un sottomultiplo di 2π, in caso contrario non
esistono orbite periodiche.
L’esercizio precedente
! potrebbe far pensare che la dinamica del sistema di-
namico C, z 2 + c sia relativamente semplice. In realtà, se c = 0, allora il
bordo che separa i due insiemi di dati iniziali in cui le traiettorie divergono o
rimangono limitate hanno una struttura molto complicata che prende il nome
di insieme di Julia, dal nome del matematico francese Gaston Julia (1893-
1978) che ne ha studiato le proprietà assai prima che l’avvento dei computers
ne consentisse un’efficace visualizzazione mediante simulazioni numeriche.
Si dice insieme pieno di Julia e!si denota con Kc l’insieme dei punti iniziali
di traiettorie del s.d.d. C, z 2 + c che rimangono limitate. Dunque l’insieme
di Julia è il bordo dell’insieme pieno di Julia.
Per effettuare simulazioni numeriche è utile sfruttare il seguente risultato ge-
nerale che contiene il Teorema 4.18.
F : I ×I ×···×I → I
n termini
Xk+2 = Xk+1 + Xk
182 4 Complessità dei sistemi dinamici non lineari: biforcazioni e caos
2 2
1 1
0 0
-1 -1
-2 -2
-2 -1 0 1 2 -2 -1 0 1 2
2 2
1 1
0 0
-1 -1
-2 -2
-2 -1 0 1 2 -2 -1 0 1 2
2 2
1 1
0 0
-1 -1
-2 -2
-2 -1 0 1 2 -2 -1 0 1 2
Xk+1 = M Xk
(5.1)
avendo posto ⎡ ⎤ ⎡ ⎤
Ak a b c
Xk = ⎣ Bk ⎦ M = ⎣1 − α 0 0⎦.
Ck 0 1−β 0
È immediato esprimere in forma chiusa (provarlo per induzione) il termine
generale di (5.1)
Xk = Mk X0 ∀k ∈ N
k volte
dove Mk = M · M· · · · · M ed M · M è l’usuale prodotto righe per colonne. Tut-
tavia, nonostante la conoscenza esplicita (non ricorsiva) della successione X,
rimane un problema di calcolo: infatti, la moltiplicazione fra matrici è una
operazione lunga anche se effettuata con procedure di calcolo automatico, e
deve essere effettuata anche per valori grandi di k. Ad esempio, sapere che al
tempo 50 risulta X50 = M50 X0 , non dà molta informazione sulla suddivisione
in classi di età della popolazione X50 , a meno di non calcolare effettivamen-
te M50 . Nella pratica anche la dimensione della matrice M è ben maggiore
di tre, il che aumenta in modo sostanziale la complessità computazionale del
problema.
Un poco di algebra lineare può però fornire molte informazioni qualitative su
Mk X0 , anche senza effettuare il calcolo esatto, o ridurre la complessità com-
putazionale se la matrice ha una particolare struttura (come in effetti avviene
nel caso del modello di Leslie).
Ricordiamo due importanti definizioni di algebra lineare (rinviamo all’Appen-
dice D per ulteriori dettagli).
MV = λV.
W = c 1 V 1 + c 2 V 2 + · · · + cn V n (5.2)
Mk W = Mk c1 V1 + c2 V2 + · · · + cn Vn = c1 λk1 V1 + · · · + cn λkn Vn
(5.3)
ove λj è l’autovalore associato a Vj , j = 1, 2, . . ., n.
Qualora non vi siano n autovettori linearmente indipendenti l’esplicitazione
di Mk W è più tecnica (si veda l’Osservazione 5.9).
Nel seguito, analogamente al caso scalare, chiameremo orbita o traiettoria
una qualsiasi successione di vettori {Xk } che risolve il sistema (5.1).
Esercizio 5.1. Determinare, nei vari casi, la soluzione esplicita del s.d.d. vettoriale
Xk+1 = M Xk con il dato iniziale X0 :
⎡ ⎤
0 1 1 0 0
13 # $T # $T
1) M = , X0 = 1 2 ; 2) M = ⎣ 2 −1 0 ⎦ , X0 = 4 −1 0 ;
02
3 −2 −3
⎡ ⎤
1 0 −1 #√ $T
3) M = ⎣ 0 −1 0 ⎦ , X0 = 2 − 1 3 −1 .
−1 0 −1
due sole forme dette alleli (allele G e allele g), ogni individuo ereditando un
allele da ciascun genitore, può avere nel suo patrimonio genetico quattro tipi
di coppie di alleli del gene G: (G, G), (g, g), (G, g), (g, G). I primi due tipi
sono detti omozigoti, gli altri eterozigoti.
Consideriamo, per semplicità, il caso in cui l’ordine degli alleli non ha influen-
za, cioè consideriamo indistinguibili (G, g) e (g, G). Dunque, abbiamo tre tipi
di individui relativamente alle caratteristiche determinate dal gene G: due
omozigoti (G, G), (g, g) e un eterozigote (G, g).
Legge di Hardy-Weinberg
Supponiamo che due geni allelomorfi G e g siano presenti nella popolazione
in proporzioni rispettivamente p e q con p, q ∈ [0, 1] e p + q = 1 e che
1) non vi siano mutazioni da G a g o viceversa;
2) nessuno degli individui (G, G), (g, g) o (G, g) sia avvantaggiato rispetto
agli altri e gli accoppiamenti avvengano in modo casuale;
3) il numero di individui della popolazione sia molto grande;
4) non vi siano immigrazioni di geni G o g per effetto di incroci con popo-
lazioni contigue.
Allora le proporzioni dei due alleli rimangono invariate nelle generazioni suc-
cessive.
Inoltre, le proporzioni di individui rispettivamente G omozigoti, g omozigoti
ed eterozigoti sono, a partire dalla prima generazione, p2 , q 2 e 2pq.
Ad esempio, se G determina la colorazione cutanea ed è recessivo3 , mentre g
impedisce la formazione del pigmento (gene dell’albinismo), supponendo alla
generazione 0 che le percentuali dei due alleli siano rispettivamente 99, 9% e
0, 1% (cioè p = 0, 999 e q = 0, 001), allora tali percentuali si conservano inal-
terate nelle generazioni successive. Inoltre, a partire dalla generazione 1 vi è
una frazione q 2 = 0, 000001 pari allo 0, 0001% (un individuo su un milione) di
individui albini omozigoti e vi è una frazione 2pq = 0, 001998 cioè lo 0, 1998%
di albini eterozigoti (complessivamente in tale situazione quasi due individui
su mille sono albini).
Un individuo (G, G) riceve due alleli G dai genitori della generazione k (uno da
ciascun genitore) e vi sono (Pk M ) (Pk F ) possibili modi di riceverli dalle diverse
possibili coppie di genitori M F . Dunque la frazione di omozigoti (G, G) è
(Pk M ) (Pk F )
A= = Pk2 .
MF
Principio di selezione
Se gli individui omozigoti (g, g) non si riproducono, mentre gli eterozigoti e
gli omozigoti (G, G) si riproducono normalmente, allora la frazione di g alleli
nella generazione k-esima è dato (in assenza di mutazioni) da
Q0
Qk =
1 + kQ0
dove Q0 è la frazione iniziale. Dunque l’allele letale g tende ad estinguersi
(sia pur lentamente).
Essi hanno 2Pk (1 + Qk ) N alleli in totale. Ma l’allele g è presente solo negli etero-
zigoti, cioè ve ne sono 2Pk Qk N , dunque la frazione di alleli g nella popolazione della
(k + 1)-esima generazione che giunge a riprodursi è:
2Pk Qk N Qk
Qk+1 = = .
2Pk (1 + Qk ) N 1 + Qk
Otteniamo così un s.d.d. non lineare del primo ordine Qk+1 = f (Qk ) con f fun-
zione di Moebius (si veda il paragrafo 2.7 ed in particolare l’Esempio 2.69). Con la
sostituzione Wk = Q−1k otteniamo la soluzione esplicita
Q0
Qk = .
1 + kQ0
Pk+1 = (1 − s) Pk ∀k
k
Pk = (1 − s) P0
Principio di mutazione
Se
1) la frazione di alleli G che mutano in g è s ∈ (0, 1) e non vi è mutazione
di g in G;
2) nessuno degli individui (G, G), (g, g) o (G, g) è avvantaggiato rispetto
agli altri e gli accoppiamenti avvengono in modo casuale;
3) il numero di individui della popolazione è molto grande;
4) non vi sono immigrazioni di geni G o g per effetto di incroci con popo-
lazioni contigue
allora la proporzione di G alleli nella k-esima generazione è
k
Pk = (1 − s) P0 .
Osservazione 5.5. Nei tre esempi precedenti si è dedotta l’evoluzione del vet-
T
tore Pk Qk dallo studio della quantità scalare Pk , sfruttando la semplice
ed esplicita relazione tra Pk e Qk : Pk + Qk = 1.
(2u + v) D = D (2Pk Pk + Pk Qk + Pk Qk ) =
da Pk +Qk =1=Pk +Qk
= D (Pk Pk + Pk Qk + Pk Pk + Pk Qk ) =
= D (Pk + Pk ) .
5.2 Applicazioni alla genetica 193
Pk+1 = Pk Qk+1 = Qk .
1 1 1
Pk+2 = (Pk+1 + Pk+1 ) = Pk+1 + Pk
2 2 2
ossia
2Pk+2 − Pk+1 − Pk = 0
Osserviamo che
P0 + 2P1
lim Pk = c1 = .
k 3
Poiché l’attuale popolazione è il risultato del succedersi di molte generazioni
precedenti, possiamo assumere k grande, e dunque Pk = c1 l’attuale frazio-
ne di alleli dominanti nell’attuale popolazione femminile (in questi discorsi il
“dato iniziale” è privo di significato).
k−1
Poiché anche Pk = Pk−1 = c1 + c2 (−1/2) è prossimo a c1 , possiamo rite-
nere Pk = c1 sia l’identico valore della frazione di alleli a nella popolazione
maschile.
Dunque, la frazione di allele dominante a (rispettivamente allele recessivo α)
si stabilizza su un valore c1 = r (rispettivamente 1 − r) sia per la popolazione
maschile sia per la popolazione femminile. Ne segue che in ciascuna gene-
razione le frazioni di omozigoti dominanti, eterozigoti ed omozigoti recessivi
nella popolazione femminile sono, rispettivamente,
2
u = r2 v = 2r (1 − r) w = (1 − r) .
Xk+1 = M Xk
la cui soluzione è
Xk = Mk X0
T
con X0 = P0 P0 . L’equazione caratteristica det (M − λI) = 0, cioè
2λ2 − λ − 1 = 0
ammette le soluzioni
λ1 = 1 λ2 = −1/2 .
(M − λ1 I) V1 = 0 ossia, in componenti
⎧
⎪ 1 1
⎨ − V11 + V12 = 0
2 2 ⇒ V11 = V12 .
⎪
⎩
V11 − V12 = 0
T
Scegliamo V1 = 1 1 .
Analogamente, un autovettore V2 relativo all’autovalore λ2 risolve il sistema
lineare omogeneo (M − λ2 I) V2 = 0 ossia, in componenti
⎧ 1
⎪
⎪
⎨ V11 + 2 V12 = 0 1
⇒ V11 = − V12 .
⎪
⎪ 2
⎩V + 1V = 0
11 12
2
T
Scegliamo V2 = −1 2 .
Per calcolare M X0 , scriviamo dapprima X0 come combinazione lineare di
k
V1 e V2 :
X0 = c1 V1 + c2 V2 c 1 , c2 ∈ R
(le costanti c1 e c2 esistono e sono uniche); ne segue (vedi la (5.3))
k
1
Xk = Mk X0 = c1 V1 + c2 − V2 .
2
k
Poiché lim (−1/2) = 0, si ricava
k
( )
1
lim Xk = c1 V1 = c1 .
k 1
T
Dato che Xk = Pk Pk , si riottiene la conclusione che
1
lim Pk = lim Pk = c1 = (P0 + 2P1 )
k k 3
cioè dopo molte generazioni, le due frazioni si stabilizzano e sono uguali fra lo-
ro. La selezione genetica non elimina completamente le malattie recessive che
non risultano letali prima del raggiungimento dell’età riproduttiva. Abbiamo
già osservato che la diversità biologica è un fatto positivo per il patrimo-
nio genetico di una specie in quanto a volte allo stesso genotipo recessivo si
accompagnano più caratteri del fenotipo, solo alcuni dei quali comportano
svantaggi biologici. Un esempio classico a tale rigurado è dato dalla resistenza
alla malaria associata alla talassemia o anemia mediterranea.
Osservazione 5.7. Il fatto di avere due metodi di analisi (scalare a più passi
o vettoriale ad un passo) è di natura generale.
196 5 Sistemi dinamici discreti: equazioni vettoriali
Vk+1 = FVk
T
con dato iniziale V0 = X0 X1 · · · Xn−1 , dove
⎡ ⎤
0 1 0 0 ··· 0
⎢ 0 0 1 0 ··· 0 ⎥
⎢ ⎥
⎢ 0 0 0 1 · · · 0 ⎥ T
⎢ ⎥
F=⎢ . Vk = Xk Xk+1 · · · Xk+n−1
.. ⎥
. . . . . .
⎢ .. .. .. .. .. ⎥
⎢ ⎥
⎣ 0 0 0 0 ··· 1 ⎦
−a0 −a1 −a2 −a3 · · · −an−1
Il polinomio ⎛ ⎞
n
P (λ) = (−1)n ⎝λn + bn−j λn−j ⎠
j=1
Si noti che (5.4) è una vera equazione ad n passi perché b0 = (−1)n det M = 0.
5.3 Stabilità di sistemi dinamici discreti vettoriali lineari 197
n
X0 = cj V j
j=1
k k
n
j
n
n
Xk = M X0 = M cj V = cj Mk Vj = cj λkj Vj . (5.6)
j=1 j=1 j=1
Così
2 2
2
n 2
2 k j2 disuguaglianza triangolare
lim Xk Rn = lim 2 cj λj V 2 ≤
k k 2 2
j=1
n 2
2
2 k j2 omogeneità della norma
≤ lim 2cj λj V 2 =
k
j=1
n
2 2
2 2
= lim |cj | 2Vj 2 λkj = teorema limite somma
k
j=1
n 2 2
2 2
= |cj | 2Vj 2 lim |λj |k = 0.
k
j=1
Se non esiste una base di autovettori, la prova è più tecnica ma il risultato continua
a valere. Si considera una base di Rn associata alla forma canonica di Jordan (Ap-
pendice D): tale base è costituita da autovettori generalizzati; esplicitamente, sono
soluzioni di (M − λj In )mj W = 0 dove mj è la molteplicità algebrica di λj .
M si decompone come M = S + T, dove S è diagonale (i termini sulla diagonale
sono gli autovalori) e T è nilpotente, perciò ST = TS, e si può facilmente esplicitare
l’espressione della potenza k-esima di M:
k (k − 1) k−2 2
Mk = Sk + kSk−1 T + S T + · · · + kSTk−1 + Tk . (5.7)
2
Si noti che nella (5.7), per ogni k, possono essere diversi da O al più i primi n
addendi4 .
Dunque, la soluzione Xk si esprime come combinazione lineare finita degli autovet-
tori generalizzati W j a coefficienti dipendenti dalla rappresentazione di X0 nella
base di Jordan, moltiplicati per kh λk−h
j con 0 ≤ h ≤ n. Dunque, anche in que-
sto caso, vale limk→+∞ Xk = 0 per ogni dato iniziale X0 , grazie all’implicazione
|λ| < 1 ⇒ lim kn λk = 0.
k
4
Infatti: Tm = O se m è la massima dimensione di un sottoblocco di Jordan, e vale
m ≤ n.
5.3 Stabilità di sistemi dinamici discreti vettoriali lineari 199
a b
0 1 0 1
0, 5 0 0 −0, 5
Fig. 5.1. Illustrazione del Teorema 5.8: a) , b)
0 0, 3 0, 5 0
allora da
J
Jj si
X0 = cj,i,r Wj,i,r
j=1 i=1 r=1
e
MWj,i,r = λj Wj,i,r + Wj,i,r+1 r < si
MWj,i,si = λj Wj,i,si
si esplicita il termine generale definito da Xk = Mk X0 :
Jj si min(si ,k)
J k
Xk = λk−h+1 cj,i,r−h+1 Wj,i,r .
r=1
h − 1 j
j=1 i=1 h=1
Tale espressione si riduce alla (5.6) nel caso (diagonalizzabile) in cui vale
mj = 1 per ogni j.
Senza sviluppare in dettaglio l’analisi qualitativa delle traiettorie corrispon-
denti alle soluzioni del s.d.d. lineare omogeneno Xk+1 = M Xk , possiamo
200 5 Sistemi dinamici discreti: equazioni vettoriali
dire che i modi naturali delle soluzioni (potenze intere dell’autovalore, dalle
cui combinazioni lineari vettoriali è costituita la soluzione generale) hanno
un andamento qualitativo che dipende solo dalla posizione del corrispondente
autovalore nel piano complesso. In particolare, si ha convergenza a zero se
|λ| < 1, divergenza all’infinito se |λ| > 1, mentre |λ| = 1 assicura la limitatez-
za. Alla luce dell’Osservazione 5.7, la Fig. 2.7 fornisce informazioni qualitative
anche sui modi naturali del caso vettoriale in esame.
Esempio 5.10. Se M è una matrice di ordine 2 con un solo autovalore λ di
molteplicità algebrica 2 e geometrica 1, allora M non è diagonalizzabile. Sia V
un autovettore di M di norma 1 e sia U tale che (M − λIn ) U = V ed U = 1.
Allora U è un autovettore generalizzato indipendente da V ed M è nella forma
di Jordan rispetto alla base {V, U}. Infine, se X0 = aV + bU, allora
Xk = aλk + bkλk−1 V + bλk U
Analizziamo ora i casi in cui gli autovalori λj non sono strettamente minori di
1 in modulo, ma verificano solo la disuguaglianza |λj | ≤ 1. Osserviamo che gli
equilibri sono caratterizzati dalla condizione X = M X e dunque sono tutti
gli autovettori dell’eventuale autovalore λ = 1. Limitiamoci, per semplicità,
al caso n = 2 ed M reale. Nel seguito è fissato
X0 = c1 V1 + c2 V2
dove V1 e V2 sono autovettori generalizzati (in particolare, almeno V2 è sem-
pre autovettore) di M corrispondenti alla base associata alla forma canonica
di Jordan.
dove c1 dipende solo dal valore iniziale. 0 è un equilibrio stabile ma non at-
trattivo poiché le soluzioni possono avere come limite qualunque multiplo di
V1 , e tali multipli sono tutti equilibri.
Questo è il caso dell’Esempio 5.6.
2) Se λ1 = −1, |λ2 | < 1, ragionando come sopra, da λk2 → 0 segue
Xk ∼ c1 (−1) V1 .
k
7) Se λ1 = λ2 = 1 e ( )
10
M= a = 0
a1
X1
X2 X0 = X6
X3 X5
X4
# $T
Fig. 5.2. Esempio di orbita (caso 4) : θ = π/3, X0 = cos (π/6) sin (π/6)
202 5 Sistemi dinamici discreti: equazioni vettoriali
allora ( ) ( ) ( )
1 0 1 0
V1 = V2 = Mk =
0 1 ka 1
e da X0 = c1 V1 + c2 V2 , si ottiene la soluzione seguente, che può essere
illimitata:
( )
0
Xk = Mk X0 = c1 V1 + c2 V2 + ka =
c1 V11 + c2 V12
= c1 V 1 + c 2 V 2 + c 1 a k V 2 .
8) Se λ1 = λ2 = −1 e
( ) ( )
−1 0 10
M= = (−1) a = 0
a −1 −a 1
tenendo conto che
( ) ( ) ( )
1 0 10
V1 = V2 =
k
Mk = (−1)
0 1 −ka 1
da X0 = c1 V1 +c2 V2 si ottiene la soluzione seguente, che può essere illimitata:
( )
0
Xk = Mk X0 = (−1)k c1 V1 + c2 V2 − ka =
c1 V11 + c2 V12
= (−1)k c1 V1 + c2 V2 − c1 a k V2 .
Le conclusioni relative agli ultimi due casi seguono dalla seguente decompo-
sizione M = S + T con S matrice diagonale e T matrice nilpotente; poiché
ST = TS e T2 = O, si dimostra agevolmente (si veda l’Esercizio 5.7) che
Mk = Sk + kTSk−1.
Invece, se esiste un λj tale che |λj | > 1, allora esistono soluzioni illimitate; ad
esempio, con X0 = Vj (autovettore relativo a λj ), si deduce
8 8
Mk X0 = Mk Vj = λk X0 ej lim 8Mk X0 8 = +∞ ,
k
Nodo degenere 0 < λ2 < λ1 = 1 (MI triangolare inf.) Nodo 0 < λ1 = λ2 < 1
Fig. 5.3a. Traiettorie di s.d.d. bidimensionali lineari nel piano delle fasi: λ1 , au-
tovalori della matrice reale M; assi orizzontale e verticale orientati rispettivamente
come i corrispondenti autovettori generalizzati V1 e V2 . Si noti che nell’ottavo e
nono diagramma la divergenza o convergenza delle traiettorie procede in senso ora-
rio; tuttavia poiché l’autovalore ha molteplicità geometrica 2, è lecito scambiare V1
con V2 nella rappresentazione grafica: in tal modo si l’andamento è antiorario
204 5 Sistemi dinamici discreti: equazioni vettoriali
(MI triangolare inf.) Nodo λ1 = λ2 = 1 (λ non reale) Fuoco stabile |λ| < 1
(λ non reale) Fuoco instabile |λ| > 1 (λ non reale) Centro |λ| = 1
t X2
X1
X1 X2
(a) (b)
Fig. 5.4. (a) Grafico di una traiettoria, (b) una traiettoria nel piano delle fasi
5.4 Matrici strettamente positive e Teorema di Perron-Frobenius 205
5
Oskar Perron (1880–1975), Ferdinand Georg Frobenius (1849–1917)
6
Il lettore è invitato a non confondere una matrice positiva con una matrice defi-
nita positiva: si confronti la Definizione 5.11 con quella di matrice definita positiva
riportata nell’Appendice
0 1D. 0 1
2 −1 12
Ad esempio, è definita positiva ma non è positiva. Viceversa, è
−1 2 21
strettamente positiva ma non è definita positiva.
206 5 Sistemi dinamici discreti: equazioni vettoriali
Xk = cM λM k VM + Wk
Infatti (5.12) implica che lo spazio generato da tutti gli autovettori generalizzati di
M diversi da VM interseca l’“ottante” {X ∈ Rn : X ≥ 0} solo in 0, dunque X0 > 0
implica (5.11). Infine (5.10) è una immediata conseguenza di (5.11) e del Teorema
5.18. Rimane dunque da provare la (5.12).
Se λj è un autovalore diverso da λM e Vj è il corrispondente autovettore, si ottiene:
T T T
λj Vj , VM = M Vj , VM = Vj , MT VM =
T T
= λM Vj , VM = λM Vj , VM ,
T
ne segue Vj , VM = 0 poiché λj = λM .
Se gli autovettori di M non formano una base, si consideri la base di Jordan costitui-
ta da autovettori generalizzati di M ; in tal caso, per ogni fissato blocco massimale di
208 5 Sistemi dinamici discreti: equazioni vettoriali
dunque
T
che implica Vj−s , VM = 0 poiché λj = λM .
Sia
λM = max {λ ∈ R : ∃X > 0 tale che MX ≥ λX} . (5.14)
Si noti che l’insieme di cui si calcola il massimo è non vuoto (contiene λ = 0), chiuso
(si possono scegliere sempre gli X in modo tale che X = 1) e limitato:
(MX)j = Mji Xi ≤ Mij max Xi ≤ Mij max Xi ⇒ λ≤ mij .
i i
i i i,j i,j
0 ≤ λM < +∞.
Fino a questo punto è stata usata solo l’ipotesi M ≥ O. Se, inoltre, M O allora
λM ≥ minj Mjj > 0. Dunque 0 < λM < +∞.
Sia VM > 0 tale che MV M ≥ λM VM .
(I) Proviamo che λM è un autovalore e VM è il corrispondente autovettore che
verifica VM 0.
Poiché M O segue MX 0 per ogni X > 0, dunque
M MVM −λM VM 0 oppure MVM = λM VM .
5.4 Matrici strettamente positive e Teorema di Perron-Frobenius 209
cioè
≥ (MY)
MY
MY = |λ| Y
≥ (λY)
e dalla definizione di λM segue |λ| ≤ λM . Per provare la disuguaglianza stretta, con-
sideriamo la matrice Mδ = M − δIn dove δ > 0 è scelto in modo tale che Mδ O
1
(ad esempio, ponendo δ = minij mij ).
2
Dall’identità (μ − δ) In − Mδ = μIn − M, per ogni μ ∈ C, segue che (λM − δ) e
(λ − δ) sono autovalori di Mδ . Inoltre, per la stretta positività di Mδ , vale
|λ − δ| ≤ λM − δ (5.15)
λ−δ λ
−δ 0 λMI − δ λMI
(M − λM In ) U = VM
(M − λM In ) VM = 0.
M
Infatti,
n posto M = [mij
], se V M≥ 0 è unMautovettore associato a λM tale che
M
V = 1, allora j mij Vj = λM Vi e sommando anche in i si ottiene
j=1 jM
j j Vj = λM da cui (5.16). Ragionando su M si ottiene la (5.17).
T
C
Fig. 5.7. Popolazione residente in Italia, per sesso e classi di età (fonte ISTAT)
Fig. 5.8. Due popolazioni (1998), ripartite per sesso e in classi di età di 10 anni
Sk+1 = ASk + Mk
con
⎡ ⎤
1 − p 1 − a1 0 0 0 0 0
⎢ p 1 − p − a 0 0 0 0⎥
⎢ 1 2 2 ⎥
⎢ ⎥
⎢ 0 p2 1 − p 3 − a3 0 0 0⎥
A=⎢
⎢
⎥
⎢ 0 0 p 3 1 − p 4 − a 4 0 0⎥⎥
⎢ ⎥
⎣ 0 0 0 p4 1 − p 5 − a5 0⎦
0 0 0 0 p5 0
Xk+1 = AXk + B
(5.18)
Xk = Ak (X0 − A) + A (5.19)
Si osservi la forte analogia di (5.19) con la formula (2.4) relativa al caso lineare
affine scalare.
A = AA + B
Yk+1 + A = A (Yk + A) + B
equivalente a
Yk+1 = AYk + AA − A + B
ossia
Yk+1 = AYk − (I − A) A + B.
Dalla definizione di A ricaviamo infine:
Nel caso generale (cioè se non si esclude la possibilità del valore 1 fra gli
autovalori di A) si decompone Rn come Rn = V0 ⊕ V1 ⊕ V2 dove
• Se |λ| < 1 per ogni autovalore, allora siamo nel caso I e l’equilibrio A è
stabile ed attrattivo.
• Se esiste un autovalore λ tale che |λ| > 1, allora l’eventuale equilibrio (casi
I o II) è instabile.
• Se λ = 1 è autovalore e vi è equilibrio, allora siamo nel caso II ed A è sta-
bile se le molteplicità algebriche e geometriche dell’autovalore 1 coincidono
(comunque A non è attrattivo).
Esempio 5.26. Sia M una matrice di ordine 9 data, nelle coordinate di Jor-
dan corrispondenti alla base e1 , e2 , . . . , e9 (le componenti non indicate sono
nulle) ⎡ ⎤
0 0
⎢ 1 0 ⎥
⎢ ⎥
⎢ 1 0 ⎥
⎢ ⎥
⎢ 1 1 ⎥
⎢ ⎥
M=⎢ ⎢ 1 0 ⎥
⎥
⎢ 1 1 ⎥
⎢ ⎥
⎢ λ1 0 0 ⎥
⎢ ⎥
⎣ 0 λ2 0 ⎦
0 0 λ3
con
V0 = e1 ⊕ e2 V1 = e3 ⊕ e4 ⊕ e5 ⊕ e6 V2 = e7 ⊕ e8 ⊕ e9 .
Prova. (i) ⇒ (ii): Se |λ| < 1 per ogni autovalore λ, allora la matrice I − A è inverti-
bile, e per il Teorema 5.24 vi è un unico equilibrio A stabile ed attrattivo. Inoltre,
se si inizializza il sistema dinamico con un dato X0 ≥ 0, allora risulta Xk 0 per
ogni k ≥ 1 e ne segue A ≥ 0 . Inoltre da AA ≥ 0, B O segue A = AA + B 0.
(ii) ⇒ (i): Se esiste A ≥ 0 tale che (I − A) A = B, allora A = AA + B 0.
Osservato che AT O e che A ed AT hanno gli stessi autovalori, denotiamo con
λA > 0 l’autovalore dominante di A (e dunque anche di AT ) e con U un autovettore
dominante strettamente positivo di AT (vedi Teorema 5.12):
Allora
3 4
(1 − λA ) A, U = A, I − AT U = (I − A) A, U = B, U > 0
Esercizio 5.4. Data la matrice quadrata A di ordine n i cui elementi sono tutti
uguali a 1/ (2n) e un vettore B ∈ Rn , B 0, studiare il s.d.d. Xk+1 = AXk + B.
Come nel caso scalare, non vi sono metodi generali per esplicitare le soluzioni
di sistemi non lineari. Ci limiteremo a discutere il comportamento asintotico
e la stabilità degli equilibri.
È utile introdurre la seguente definizione.
è detta norma di A.
T
Teorema 5.32. Siano n = 2, A = α1 α2 un equilibrio: F (A) = A, cioè
in componenti
α1 = f (α1 , α2 ) α2 = g (α1 , α2)
dove F : I 2 → I 2 è una funzione munita di derivate parziali continue e
⎡ ⎤
∂f ∂f
(α1 , α2) (α1 , α2 )
⎢ ∂x ∂y ⎥
⎢ ⎥
J (A) = ⎢ ⎥.
⎣ ∂g ∂g ⎦
(α1 , α2) (α1 , α2 )
∂x ∂y
Se tutti gli autovalori di J verificano |λ| < 1, allora α è un equilibrio stabile
T T
e localmente attrattivo (cioè se X0 Y0 è “vicino” ad α1 α2 , allora la
traiettoria associata a tale dato iniziale converge ad A).
Se esiste un autovalore λ tale che |λ| > 1, allora α è instabile.
Xk+1 = aXk .
allora
Xk+1 = 2Xk − Xk Yk
Yk+1 = 1, 5Yk − 2Yk2 + Xk Yk
cioè ⎡ ⎤
2x − xy
F (x, y) = ⎣ 3 ⎦.
y − 2y2 + xy
2
Le equazioni soddisfatte dagli equilibri sono
α1 = α1 α2
0, 5α2 + α1 α2 = 2α22
Gli equilibri sono 3: (0, 0) , (0, 1/4), e (3/2, 1) . La parte di piano significativa
è il quadrante x > 0, y > 0 cui appartiene un solo equilibrio: (3/2 , 1). Poiché
( ) √
3 1 −3/2 2
J ,1 = λ1,2 (J) = ± i
2 1 −1 2
1 1
y=2 y= x+
2 4
Yk
y = dc x + c−1
d
c−1
d
Xk
7
Si sostituiscano T, λk (T) e Uk (T) nella definizione di autovalore ed autovettore e
si utilizzino le identità:
2
sin α2 = 1−cos
2
α
; sin (α + β) = sin α cos β + sin β cos α .
5.8 Schemi numerici per la risoluzione di problemi lineari 223
1
TU = λU .
h2
può essere ottenuta mediante il metodo di Eulero esplicito, cioè dallo schema
numerico
Wj,k+1 = αWj−1,k + (1 − 2α) Wj,k + αWj+1,k α = h/s2
(5.23)
W0,k+1 = WN,k+1 = 0.
Fig. 5.10. Discretizzazione alle differenze finite con Eulero esplicito (5.23)
λk (B) ≤ 1 ⇔ 0 ≤ α ≤ 1/2 .
che tale errore risolve il s.d.d. Ek+1 = BEk con dato iniziale E0 . Concluden-
do, se vale la condizione di instabilità numerica gli inevitabili (per quanto
piccoli) errori verranno amplificati dalle iterazioni successive, mentre se vale
la condizione di stabilità numerica essi rimarranno “ben controllati”.
Ora ciascun passo risolutivo risulta numericamente non banale perché corri-
sponde ad invertire la matrice tridiagonale A.
Grazie all’analisi svolta nell’Esempio 5.34 osserviamo che A è diagonalizzabile
ed i suoi autovettori ed autovalori sono rispettivamente
8
Se il dato al bordo (condizioni sui valori di v (0, t) e v (a, t)) per l’equazione (5.22)
non è 0, allora, a causa delle equazioni estreme si deve modificare il secondo membro
come segue:
# $T
Vk = Vk + αV0,k+1 0 · · · 0 αVN,k+1 .
226 5 Sistemi dinamici discreti: equazioni vettoriali
Fig. 5.11. Discretizzazione alle differenze finite con Eulero implicito (5.24)
Il Teorema 5.8 assicura che per il s.d.d. Vk+1 = A−1 Vk l’equilibrio 0 risulta
stabile ed attrattivo per ogni α > 0.
In questo caso l’eventuale errore di arrotondamento Ek nella valutazione di
Vk è governato dal s.d.d. Ek+1 = A−1 Ek con dato iniziale E0 (errore di di-
scretizzazione del dato iniziale), pertanto lo schema di Eulero implicito risulta
numericamente stabile per ogni α > 0, cioè per ogni h > 0 e per ogni s > 0.
Riassumendo, abbiamo ricondotto la soluzione dell’equazione del calore ad
una cascata di problemi algebrici lineari.
Osserviamo che T, A, A−1 sono matrici definite positive per ogni α, mentre
B è definita positiva solo se 0 < α < 1/4 .
In pratica, per risolvere il sistema AVk+1 = Vk non si inverte la matrice A
(che ha dimensione N ) perché ciò richiederebbe troppe operazioni (dell’ordi-
ne di N 2 ). Inoltre A è tridiagonale, dunque occupa poco spazio in memoria
(3N − 2 dati), mentre A−1 non è una matrice sparsa e dunque occuperebbe
troppo spazio in memoria (N 2 dati).
Allora anziché invertire A si ricorre ad algoritmi numerici più efficienti. Ne
citiamo solo due: la decomposizione LU che è un metodo diretto, ed il
metodo SOR che è un metodo iterativo. Li illustriamo, per semplicità, con
riferimento alla matrice A = IN + αT che appare nello schema di Eulero
implicito per l’equazione del calore.
y1 = (1 + 2α) (5.25)
α2
yi = (1 + 2α) − i = 2, . . . , N
yi−1
zi = −α
α
li = − i = 1, . . . , N − 1.
yi
UVk+1 = Wk LWk = Vk
Wj,k + αVj+1,k+1
Vj,k+1 = j = 1, . . . , N − 1 .
yj
m+1 1 m m
Vj,k+1 = Vj,k + α Vj−1,k+1 + Vj+1,k+1 (5.27)
1 + 2α
e il processo viene iterato fino a quando l’errore
8 m+1 8 2
8V m 82
k+1 − Vk+1 = V m+1
j,k+1 − V m
j,k+1
j
m
a Vj,k+1 per renderlo più vicino al vero valore Vj,k+1 . Si può cercare di sovra-
m+1
correggere (over-correct): precisamente, il valore Vj,k+1 viene determinato in
due tempi a partire dalle relazioni
m+1 1
m+1 m
Yj,k+1 = Vj,k + α Vj−1,k+1 + Vj+1,k+1
1 + 2α
m+1 m
Vj,k+1 = Vj,k+1 m+1
+ ω Yj,k+1 − Vj,k+1
m
Poiché det E = 0 si sa che qualunque sia la scelta di B esiste una ed una sola
soluzione del sistema. Tuttavia il sistema è mal condizionato nel senso se-
guente: a piccole variazioni del dato B possono corrispondere grandi variazioni
della soluzione. T T T
Ad esempio, se B = 2 2, 01 allora X = 1 1 , se invece B = 2 1, 9
T
allora X = 12 −10 .
Ciò si verifica perché (benché E sia definita positiva e strettamente positiva)
il rapporto tra massimo e minimo autovalore di E è molto grande; infatti,
risolvendo l’equazione
caratteristica
√ λ2 − 2, 01λ + 0, 01 = 0 si ricavano gli
autovalori λ1,2 = 201 ± 40001 /200, cioè:
da cui si ottiene
λ2
∼ 400.
λ1
230 5 Sistemi dinamici discreti: equazioni vettoriali
δX δB
≤ X (M)
X B
8 −1 8
dove X (M) = M 8M 8 è detto numero di condizionamento della
matrice non singolare M ed M = max (MX / X) è la norma di M
X=0
come trasformazione lineare in Rn (si veda la Definizione 5.31).
Prova. Da (5.29) e (5.30) seguono
Osservazione 5.41. Nei casi in cui M è una matrice simmetrica reale e defi-
nita positiva, vale X (M) = λmax (M) /λmin (M).
1
0< < λmin A−1 < λmax A−1 < 1
5
dunque il problema algebrico che si deve risolvere nello schema di Eulero
implicito è ben condizionato.
A e B giocano a testa o croce con una moneta equa (la probabilità p di avere
testa è uguale alla probabilità q di avere croce: p = q = 1/2): chi vince un
turno prende un Euro all’avversario. Vince la partita chi rovina l’avversario,
ottenendo tutti gli a + b Euro. Poniamo a + b = s.
Per descrivere la situazione del gioco ad un dato turno, consideriamo il nu-
mero Xk di Euro posseduti dal giocatore A (B ne possiede s − Xk ) prima di
giocare il turno (k + 1)-esimo.
È comodo riportare in un diagramma le possibili storie della partita: si veda
la Fig. 6.1.
Per calcolare la probabilità che A dopo tre lanci della moneta possegga a + 1
Euro, dobbiamo valutare la probabilità di ciascuno dei possibili “percorsi” che
si concludono in tre tappe in a + 1 :
3
A perde A vince A vince 1
a −→ a − 1 −→ a −→ a + 1 : probabilità
2
3
A vince A perde A vince 1
a −→ a + 1 −→ a −→ a + 1 : probabilità
2
3
A vince A vince A perde 1
a −→ a + 1 −→ a + 2 −→ a + 1 : probabilità .
2
Poiché i tre percorsi rappresentano tre storie diverse (eventi disgiunti) la pro-
babilità richiesta è data dalla somma delle probabilità di ciascun pecorso, cioè
da 3/8.
Gli stati possibili sono i valori che può assumere Xk nel corso della partita,
cioè {0, 1, . . . , s}.
Può essere utile visualizzare graficamente le possibili transizioni tra i vari stati:
con riferimento alla Fig. 6.2, utilizziamo gli archi orientati per rappresentare
la probabilità di transizione da un valore ad un altro della somma posseduta
da A . Ad ogni arco corrisponde una probabilità di transizione2 . Ciascuna
a
a−1 a+1
a−2 a a+2
a−3 a−1 a+1 a+3
Fig. 6.1. Possibili andamenti del capitale di A corrispondenti a tre lanci conse-
cutivi della moneta
2
Il lettore familiare con il calcolo delle probabilità può osservare che la probabili-
tà di transizione da uno stato E ad un altro stato F è un esempio di probabilità
condizionale, cioè la probabilità che si cada in F essendo certi di partire dallo stato E.
6.1 Esempi, definizioni e notazioni 237
Ciascuno di questi eventi si realizza con un numero finito di percorsi nel grafo
(tale numero cresce rapidamente al crescere del numero d’ordine del turno
della vittoria) la cui probabilità è data dal prodotto delle probabilità del ve-
rificarsi di ciascuna transizione. La probabilità di vittoria è la somma delle
probabilità di tali eventi. Posto P (j), j = 0, 1, . . . , s, la probabilità di vincere
partendo con j Euro, si ottiene
1
P (j) = (P (j − 1) + P (j + 1)) j≥1 (6.1)
2
formula che ha una interpretazione geometrica: ogni terna di coordinate
(j − 1, P (j − 1)), (j, P (j)), (j + 1, P (j + 1)) corrisponde a tre punti allineati
nel piano. Inoltre, da P (0) = 0 e P (s) = 1 segue che ogni coppia (j, P (j))
appartiene ad una retta passante per l’origine:
j
P (j) = .
s
Dunque, la probabilità di vittoria per A (uguale alla probabilità di rovina per
B) sostituendo i nostri dati iniziali è
a
P (a) = .
a+b
238 6 Catene di Markov
Come si era già osservato, pur essendo equo il gioco, le probabilità sono a
favore di chi detiene un più cospicuo capitale iniziale (si rifletta sul fatto che
A in caso di vittoria conquista b Euro, B invece ne conquista a).
Una completa descrizione dell’evoluzione del gioco può essere ottenuta utiliz-
zando l’Algebra Lineare per esprimere in modo sintetico tutte le informazioni
contenute nella Fig. 6.2:
T
se Pk = Pk (0) Pk (1) . . . Pk (s) è il vettore delle probabilità Pk (t) di ave-
re t Euro dopo k turni, abbiamo un esempio di catena di Markov ad s + 1
stati descritta da
⎡ ⎤
1 1/2 0 0 · · · 0 0
⎢ 0 0 1/2 0 · · · 0 0 ⎥
⎢ ⎥
⎢ 0 1/2 0 1/2 · · · 0 0 ⎥
⎢ ⎥
⎢ .. .. .. .. ⎥
Pk+1 = MPk dove M=⎢ 0 0 1/2 . . . . ⎥.
⎢ ⎥
⎢. . . . ⎥
⎢ .. .. .. . . 0 1/2 0 ⎥
⎢ ⎥
⎣ 0 0 0 · · · 1/2 0 0 ⎦
0 0 0 . . . 0 1/2 1
Esempio 6.2. Due urne contengono delle biglie colorate. La prima ne contie-
ne 2 bianche e 3 nere, la seconda 4 bianche e 5 nere. Si estrae una biglia dalla
prima urna, se ne registra il colore e la si reintroduce nella sua urna. Se era
bianca si effettua la successiva estrazione dalla prima urna, se era nera, dalla
seconda. Quindi si itera il procedimento.
Ci si chiede qual è la probabilità che alla quinta estrazione la biglia sia bian-
ca.
Si tratta di un esempio di catena di Markov a due stati: uno stato è l’estra-
zione di una biglia bianca, l’altro è l’estrazione di una biglia nera. Se la k-esima
biglia estratta è bianca, allora alla (k + 1)-esima estrazione la probabilità di
estrarre bianca è 2/5, quella di estrarre nera è 3/5; se la k-esima biglia è ne-
ra, allora alla (k + 1)-esima estrazione la probabilità di estrarre bianca è 4/9,
nera 5/9.
Per risolvere il problema posto, consideriamo tutti i casi possibili e definia-
mo Pk la probabilità che la k-esima estrazione sia bianca e Qk = 1 − Pk la
probabilità che sia nera.
Sappiamo, estraendo dalla prima urna, che P1 = 2/5 e Q1 = 3/5. Se la
k-esima estrazione è bianca, allora la probabilità che la (k + 1)-esima sia an-
cora bianca è 2/5; se la k-esima estrazione è nera, allora la probabilità che la
(k + 1)-esima sia bianca è 4/9. Poiché si tratta di eventi disgiunti la cui unione
dà tutti i casi in cui si può ottenere bianca alla (k + 1)-esima estrazione, si
6.1 Esempi, definizioni e notazioni 239
ha:
2 4
Pk+1 = P k + Qk (6.2)
5 9
e ricordando che Pk + Qk = 1
4 2
Pk+1 = − Pk .
9 45
Si tratta di una equazione lineare a coefficienti costanti; mediante la (2.4)
e ponendo attenzione al fatto che si parte da k = 1 si ricava la soluzione
generale:
k−1
20 2
Pk = + − (P1 − 20/47) , k ∈ N\ {0} .
47 45
Se vi fossero state biglie con più di due colori, avremmo avuto una cate-
na di Markov con più di due stati ed avremmo utilizzato matrici di ordine
corrispondente al numero dei colori.
In generale, una catena di Markov è un modello per descrivere una suc-
cessione di esperimenti in ciascuno dei quali i risultati possibili (ad esempio,
estrazione di una biglia bianca o nera) sono gli stessi in ogni esperimento. Tut-
tavia la probabilità di uno stesso evento (ad esempio, biglia bianca) dipende
solo dal risultato dell’esperimento precedente. Nel caso in cui il parametro è
il tempo si usa anche dire che le catene di Markov descrivono fenomeni che
dipendono dal passato solo tramite il presente.
Diamo a questo punto una definizione formale. Qui e nel seguito il parametro
k che descrive il processo è sempre considerato come tempo.
Definizione 6.3. Una catena di Markov finita e omogenea è un pro-
cesso descritto da un insieme finito Ω = {s1 , s2 , . . . , sn } di stati (o eventi)
si distinti tali che, per ogni coppia ordinata di stati sj , si , è assegnata una
probabilità mij di transizione dallo stato sj allo stato si , indipendente da k.
240 6 Catene di Markov
n
0 ≤ mij ≤ 1 i, j = 1, . . . , n ; mij = 1 ∀j = 1, . . . , n . (6.3)
i=1
Come si è fatto per l’Esempio 6.1 nella Fig. 6.2, una catena di Markov può esse-
re descritta e visualizzata mediante un grafo orientato, cioè un insieme di verti-
ci (gli eventi) e di lati (frecce che collegano gli eventi). È sottinteso che ad ogni
vertice A collegato mediante una freccia ad un altro vertice (incluso il vertice
stesso A) e a ciascuna freccia è associata una probabilità di transizione positi-
va; non si tracciano i cammini che corrispondono a probabilità di transizione
nulla. Per una trattazione più approfondita dei grafi si veda il Capitolo 7.
Dal punto di vista algebrico, è comodo rappresentare una catena di Markov
mediante la matrice di transizione (o matrice stocastica) M = [mij ] i
cui elementi sono le probabilità di transizione mij dallo stato sj allo stato si .
Noi studieremo solo il caso, detto omogeneo, in cui M è costante; nei casi non
omogenei si ha M = M (k).
La (6.3) assicura che M è una matrice positiva e la somma degli elementi di
ciascuna sua colonna è pari a 1.
Lemma 6.4. Sia M = [mij ] una matrice positiva di dimensione n. Valgono
le seguenti conclusioni:
(1) M è stocastica se e solo se:
T
1 è autovalore di MT con autovettore associato 1 = 1 1 . . . 1 ;
(2) se M è stocastica, ogni suo autovalore λs soddisfa |λs | ≤ 1.
Prova. (1) È sufficiente osservare che la condizione di stocasticità per una matrice
positiva M equivale a MT ·1 = 1 e ricordare che M ed MT hanno gli stessi autovalori.
(2) Se Vs è un autovettore associato a λs allora:
n
n
n n
n
s
n
|λs | s
|Vi | = s
|λs Vi | = mij Vj ≤ mij Vjs =
i=1 i=1 i=1 j=1 i=1 j=1
n
n
s
n
= mij Vjs = Vj .
j=1 i=1 j=1
n
Poiché r=1 |Vrs | = 0 si ottiene la tesi.
6.1 Esempi, definizioni e notazioni 241
Si noti che una matrice stocastica può ammettere più autovalori di modulo
unitario. Inoltre, possono esservi anche autovalori doppi, nulli o negativi come
accade per le seguenti matrici stocastiche:
( ) ( ) ( )
1 0 0 1 1/2 1/2
0 1 1 0 1/2 1/2
n
0 ≤ Pkj ≤ 1 , j = 1, . . . , n ; Pkj = 1 ∀k ∈ N . (6.4)
j=1
Pk+1 = M Pk ∀k ∈ N
(6.5)
Prova. La (6.5) dice che Pk+1 è combinazione lineare delle colonne di M con coeffi-
cienti dati dalle componenti di Pk .
0 1
ab
3
Se n = 2 e M = , con a, b, c, d ≥ 0, il polinomio caratteristico P (λ) =
cd
λ − (a + d) λ + (ad − bc) ha discriminante uguale a (a − d)2 + 4bc ≥ 0, dunque
2
tutti gli autovalori sono reali; inoltre, per la regola dei segni di Cartesio, entrambi
sono positivi se ad > bc, uno positivo e uno nullo se ad = bc, uno positivo e uno
negativo se ad < bc.
4
Attenzione: in alcune trattazioni si assume che mij rappresenti la probabilità di
j n
transizione da i a j e quindi Pk+1 = mhj Pkh ossia Pk+1 = MT Pk ; in tali casi
h=1
è la somma degli elementi di ogni riga di M ad essere uguale ad 1.
242 6 Catene di Markov
Da mij ≥ 0 e Pkj ≥ 0 j
∀i, j segue Pk+1 ≥0 ∀j. Inoltre
n n
n
j
n
n
n
n
Pk+1 = mjh Pkh = mjh Pkh = mjh Pkh =
j=1 j=1 h=1 h=1 j=1 h=1 j=1
n
= Pkh = 1.
h=1
Ne segue anche
j
Pk+1 ≤1 ∀j.
Si è provata la validità di (6.4) per k =
k + 1. Il caso generale (k >
k) segue per
induzione.
n
0 ≤ P0j ≤ 1, j = 1, . . . , n; P0j = 1 . (6.6)
j=1
1
1
0 1 n=2
n=1
1
1
n=3
1
Sistemi dinamici vettoriali ad un passo del tipo (6.5) sono stati studiati nel
Capitolo V. La loro soluzione esplicita è:
Pk = Mk P0 ∀k ∈ N
Poiché {s1 , . . . , sn } descrive una collezione di tutti gli stati possibili (suppo-
(k)
sti distinti), si verifica che il generico elemento mij di Mk rappresenta la
probabilità di transizione dallo stato j allo stato i in k passi, cioè:
(k)
mij = P (Xn+k = si | Xn = sj ) . (6.7)
(k+h)
n
(k) (h)
(equazioni di Chapman-Kolmogorov) mij = mir mrj .
r=1
n
MP = P, Pj ≥ 0 e Pj = 1
j=1
M ammette
Osservazione 6.8. Se una matrice stocastica un autovettore
W > 0 relativo all’autovalore 1, allora W/ jW
j
è una distribuzione
di probabilità invariante per M.
244 6 Catene di Markov
Pk = V1 + Wk (6.11)
Prova. Fissato P0 , per opportuni (unici) cj vale P0 = n j=1 cj V . Tenendo conto
j
n
Poiché risulta h=1 Pkh = 1, ∀k, si ricava
n
n
1 = lim Pkh = c1 Vj1
k
h=1 j=1
n
cioè c1 = 0 , h=1 Vh1 = 0 e
1
c1 = . (6.14)
V11 + V21 + · · · + Vn1
6.1 Esempi, definizioni e notazioni 245
La matrice stocastica ( )
1 1/2
M=
0 1/2
246 6 Catene di Markov
Prova. Sappiamo (vedi Lemma 6.4) che 1 è un autovalore di M e che non vi sono
autovalori di modulo maggiore di 1. Per il Teorema di Perron-Frobenius (Teoremi
5.12 e 5.13) se la catena è regolare, allora M ha un autovalore dominante positivo e
semplice che necessariamente è l’autovalore 1. Il corrispondente autovettore è stret-
tamente positivo per lo stesso teorema, dunque se ne può determinare un multiplo
strettamente positivo la cui somma delle componenti sia esattamente 1 (cioè sia una
distribuzione di probabilità).
I Teoremi 6.9 e 6.13 mostrano che i s.d.d. associati a catene di Markov regola-
ri hanno notevoli proprietà qualitative e quantitative: il quadro generale sarà
sintetizzato nel Teorema 6.39.
il primo stato è assorbente, inoltre non vi sono transizioni dal secondo né dal
terzo al primo: il corrispondente Problema 6.24 è disaccoppiato. Dunque la
catena di Markov non è assorbente.
è assorbente.
248 6 Catene di Markov
Si noti che ci si può trovare fuori dagli stati 1 e 2 per tempi arbitrariamente
lunghi, ma in ogni evoluzione, ad ogni k, ad ogni stato vi è probabilità positiva
di cadere o nello stato 1 o nello stato 2.
Esempio 6.22. Consideriamo la catena di Markov a quattro stati, non assor-
bente, con uno stato assorbente (il primo) e con matrice di transizione:
⎡ ⎤
1 0, 2 0 0
⎢ 0 0, 2 0 0 ⎥
M=⎢ ⎥
⎣ 0 0, 3 0, 5 0, 5 ⎦ ;
0 0, 3 0, 5 0, 5
Problema 6.24. Assegnato uno stato iniziale5 si o, più in generale, una di-
stribuzione di probabilità iniziale P0 , calcolare o perlomeno stimare la pro-
babilità che l’evoluzione si concluda in un prefissato stato finale sj cioè lo si
raggiunga e vi si rimanga definitivamente (quale che sia la storia con cui si
perviene a tale stato).
Studiamo il Problema 6.24 solo nel caso di catene assorbenti: come sarà chia-
rito dal Teorema 6.26, se la catena è assorbente allora il problema 6.24 è
significativo solo se lo stato finale sj è assorbente, infatti, in tal caso la proba-
bilità di rimanere indefinitamente in uno stato non assorbente sj risulta nulla.
Denoteremo con P la successione di vettori di probabilità: Pk+1 = MPk con
P0 assegnato, dove M ha ordine n.
Per risolvere il problema si potrebbero determinare tutte le possibili evoluzioni
che, partendo da P0 conducono ad sj , calcolarne le corrispondenti probabilità
ed infine sommarle. Questa tecnica si rivela in pratica proibitiva.
Tuttavia, nei casi in cui assegnato P0 sia possibile mostrare che esiste
P∞ = lim Pk
k
Esempio 6.25. Se ( )
1/2 1/2
M=
1/2 1/2
allora non vi sono stati assorbenti. Vi è però una distribuzione di probabilità
invariante (vedi Definizione 6.6)) che è strettamente positiva:
T
P = 1/2 1/2 .
P∞ = lim Pk Q∞ = lim Qk = 0
k k
−1 T
Pk = P0 + B Ih − Ak (Ih − A) Q0 P k = P k Ak Q 0
−1 T
P∞ = P0 + B (Ih − A) Q0 P∞ = P ∞ 0
T
In particolare, a partire da P0 Q0 :
• la probabilità di rimanere definitivamente in uno stato non assorbente è
nulla;
• la probabilità di rimanere definitivamente in uno stato assorbente sj è pari
alla componente j-esima di P∞ ;
• se A = O, la dinamica è banale: Pk = P0 + BQ0 k ≥ 1, Qk = 0 k ≥ 1.
Prima di procedere con la dimostrazione del teorema è opportuno introdurre
una definizione ed un lemma.
Definizione 6.27. Una matrice quadrata A si dice substocastica se:
• A ≥ O;
• la somma degli elementi di ogni colonna di A è ≤ 1;
• almeno una delle precedenti somme è < 1.
6.2 Analisi asintotica di modelli descritti da catene di Markov assorbenti 251
Prova. Grazie alle stime (5.16) e (5.17) dell’autovalore dominante (la cui esistenza
è garantita Teorema di Perron-Frobenius, 3a formulazione) con il max delle som-
me sulle colonne, l’autovalore dominante λA verifica 0 ≤ λA ≤ 1. Se per assurdo
fosse λA = 1, a λA corrisponderebbe la distribuzione di probabilità invariante P
per A (autovettore normalizzato di A) e la distribuzione di probabilità invariante
= [ 0 P ]T per M:
P
# $T # $T
=
MP Im 0 AP = 0 AP
= P
=P
Mk P ∀k.
Qk = Ak Q0 ∀k ∈ N. (6.17)
Poiché i primi m sono tutti gli stati assorbenti della catena di Markov, le colonne di
B non possono essere tutte contemporaneamente nulle, dunque la matrice A è sub-
stocastica. Per il Lemma 6.28, tutti gli autovalori di A hanno modulo strettamente
252 6 Catene di Markov
lim Qk = 0.
k
Pk+1 = Pk + BAk Q0
Il fatto che Ih − A sia sempre invertibile segue dal fatto che tutti gli autovalori di A
hanno modulo strettamente minore di 1.
Passando al limite per k → +∞, si ottiene
P∞ = P0 + B (Ih − A)−1 Q0 .
Esempio 6.29. Consideriamo un ubriaco che esce da un bar: alla sua sinistra
si trova un lago, alla sua destra la propria casa; supponiamo che l’ubriaco
non stia mai fermo e che la probabilità che faccia un passo verso casa sia 0, 5
mentre la probabilità che faccia un passo nella direzione opposta, verso il lago,
sia 0, 5. Egli continua a camminare in modo casuale fino a quando o arriva a
casa o finisce nel lago!
Al solo scopo di ridurre la dimensione del problema, senza alterarne la sostan-
za, abbiamo ridotto le distanze in questione: la casa dista un passo dal bar, il
lago due.
Allora vi sono quattro stati, a, b, c, e d; il vettore che descrive le probabilità
T
di ciascuno stato al tempo k è Wk = ak bk ck dk , mentre la matrice di
6
Si noti che passare al limite nella prima equazione, tenendo conto di questo
risultato (limk Qk = 0), anche supponendo che ∃ limk Pk , conduce all’identità
lim Pk+1 = lim Pk che non dà alcuna informazione.
k k
6.3 Passeggiate casuali, duelli e partite di tennis 253
Si noti l’analogia con il gioco “testa o croce” con moneta equa qualora uno dei
giocatori inizi con una somma pari alla posta e l’altro con una somma dop-
pia. Utilizziamo un ragionamento (diverso da quello utilizzato per i lanci della
moneta) che si presta a generalizzazioni. È utile separare gli stati assorbenti
dagli altri anteponendo il quarto stato a secondo e terzo:
A1 = a , A2 = d , B1 = b , B2 = c.
e, al tempo k,
La seconda equazione
2
Pk+1 = Pk2 + 0, 5Pk4
dice che la probabilità di arrivare a casa dopo k + 1 passi è data dalla somma
della probabilità di essere a casa dopo k passi e di 0, 5 volte la probabilità di
essere in b = B1 dopo k passi. Posto
⎡ ⎤
1 0 0, 5 0
( )
I2 B ⎢0 1 0 0, 5 ⎥
M= = ⎢
⎣0 0 0
⎥ (6.19)
O A 0, 5 ⎦
0 0 0, 5 0
254 6 Catene di Markov
e
( ) ( )
P1 P3 T T
P= Q= P = P Q = P1 P2 P3 P4
P2 P4
0<c<b<a<1.
Ogni stato è un insieme di possibili superstiti dopo un turno del duello. Gli
stati assorbenti sono:
E1 nessuno sopravvive
E2 sopravvive solo A
E3 sopravvive solo B
E4 sopravvive solo C
Gli stati non assorbenti sono: s1 solo A e C sopravvivono, s2 solo B e C
sopravvivono, s3 tutti vivi. Non si può verificare il caso in cui solo A e B
sopravvivono (se non come stato iniziale), poiché se sono tutti vivi, nessuno
cerca di colpire C.
Siano Pk1 , Pk2 , Pk3 e Pk4 le probabilità di E1 , E2 , E3 e E4 dopo k turni, e Qk1 ,
Qk2 e Qk3 le probabilità di s1 , s2 e s3 .
1
Calcoliamo Pk+1 . Vi sono tre casi da considerare che corrispondono alla non
sopravvivenza di alcuno dopo il turno k + 1: nessun sopravvissuto dopo il
turno k, con probabilità Pk1 ; solo A e C dopo il turno k che si eliminano reci-
procamente al turno k + 1, con probabilità Qk1 · a · c; solo B e C dopo il turno
k che si eliminano reciprocamente al turno k + 1, con probabilità Qk2 · b · c.
Sommando le probabilità relative ai tre casi:
1
Pk+1 = Pk1 + Qk1 · a · c + Qk2 · b · c.
2
Per ottenere Pk+1 consideriamo due casi: solo A sopravvive dopo k turni; solo
A e C sopravvivono dopo k turni ed al (k + 1)-esimo turno A colpisce C e C
manca A:
2
Pk+1 = Pk2 + a (1 − c) Qk1 .
Analogamente si ottiene:
3
Pk+1 = Pk3 + b (1 − c) Qk2
4
Pk+1 = Pk4 + c (1 − a) Qk1 + c (1 − b) Qk2 + a (b + (1 − b) c) Qk3
1
Qk+1 = (1 − a) (1 − c) Qk1 + a (1 − b) (1 − c) Qk3
2
Qk+1 = (1 − b) (1 − c) Qk2 + (1 − a) (b + (1 − b) c) Qk3
3
Qk+1 = (1 − a) (1 − b) (1 − c) Qk3
(1−a)(1−b)(1−c)
ABC
a(1−b)(1−c)
(1− a)(b+ (1− b)c)
AC (1− a)(1− c) BC
(1− a)(1− c)
ac c(1− b)
bc
a(1− c) c(1− a) b(1− c)
1 A 1 C 1 B 1 O
Si noti che è molto utile (in questo esempio, ma soprattutto in situazioni più
complicate con molti stati) utilizzare un diagramma per stabilire quali sono
tutti i percorsi possibili che conducono ad un certo stato finale (vedi Fig. 6.5).
In pratica, prima si disegna il diagramma dei soli percorsi possibili, poi si
calcolano le probabilità di ciascuna transizione (matrice M di Fig. 6.6).
Dal Teorema 6.26 sappiamo che det (I3 − A) = 0. Peraltro la verifica diretta
di tale proprietà è immediata perché A è triangolare superiore e dunque sono
⎡ ⎤
ac bc 0
⎢ a (1 − c) 0 0 ⎥
⎢ ⎥
! ⎢ I
" 0 b (1 − c) 0 ⎥
I4 B ⎢ 4 ⎥
⎢ c (1 − a) c (1 − b) a (b + (1 − b) c) ⎥
M= =⎢ ⎥
O4,3 A ⎢ ⎥
⎢ (1 − a) (1 − c) a (1 − b) (1 − c) ⎥
⎢ 0 ⎥
⎣ 0 (1 − b) (1 − c) (1 − a) (b + (1 − b) c) ⎦
O4,3
0 0 (1 − a) (1 − b) (1 − c)
e ogni parentesi tonda contiene una quantità compresa fra 0 e 1 per l’ipotesi
a, b, c ∈ (0, 1); così i prodotti contenuti in ogni parentesi quadrata forniscono
ancora numeri compresi fra 0 e 1 e tale è la quantità in ciascuna parentesi
quadrata.
Se, ritornando all’esempio, consideriamo i dati
a = 0, 7 b = 0, 5 c = 0, 3
vince con probabilità 0, 620, B non vince perché non partecipa7 e C vince con
probabilità 0, 114. Chiaramente C si augura che B partecipi al duello.
Anche nelle competizioni elettorali con turni di ballottaggio successivi si pos-
sono creare paradossi in cui candidati deboli si avvantaggiano su candidati
più forti per la presenza di candidati di disturbo.8
0 − 15 0 − 30 0 − 40 15 − 0 15 − 15 15 − 30 15 − 40
30 − 0 30 − 15 30 − 30 30 − 40 40 − 0 40 − 15 40 − 30
7
E non perde...
8
Queste situazioni possono essere favorite o scoraggiate a seconda delle normative
e protocolli di voto.
6.4 Ancora sull’analisi asintotica 259
Fig. 6.7. Grafo dei possibili svolgimenti di un game con le probabilità di transizione
fra i vari stati. Parità indica sia la situazione “40 pari” sia situazioni di parità
successive
1
h
k−1
Vk = M V.
k
h=0
Vkl − MVkl = M V− M V =
kl
h=0 h=0
1 kl
= V−M V
kl
[ 1/2 1/2 0 ]T , P2h+1 = [ 1/2 0 1/2]T ; in tal caso non esiste il limite della
seconda e terza colonna delle potenze k-esime di (6.20) per k → +∞.
Invece le matrici regolari ammettono sempre un’unica distribuzione di proba-
bilità invariante, perché hanno un autovalore dominante semplice.
Concludiamo con alcuni risultati riepilogativi che legano il comportamento
asintotico e le distribuzioni di probabilità invarianti.
Teorema 6.36. Data una catena di Markov con n stati e matrice di tran-
sizione M = [mij ], se esiste il limite di una colonna di Mk per k → +∞,
cioè
(k)
∃j ∈ {1, 2, . . . , n} : ∀i ∈ {1, 2, . . . , n} ∃ lim mij = Pi (6.21)
k
T
allora il vettore P = P1 P2 · · · Pn è una distribuzione di probabilità
invariante.
n
n
(k)
n
(k)
Pi = lim mij = lim mij = 1 (6.22)
k k
i=1 i=1 i=1