Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
PROCESSI STOCASTICI
Franco Fagnola
31 gennaio 2009
1
(riassunto) I diritti d’autore sono riservati. Ogni sfruttamento commercia-
le sarà perseguito. Autore: Franco Fagnola, Dipartimento di Matematica ‘‘F.
Brioschi’’, Politecnico di Milano, piazza Leonardo da Vinci 32, 20133 Milano;
franco.fagnola@polimi.it
2
Indice
1 Richiami di probabilità 3
1.1 Variabili aleatorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Valore atteso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3 Indipendenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.4 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2 Il processo di Bernoulli 15
2.1 Costruzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2 Tempo di attesa del primo successo . . . . . . . . . . . . . . . . . . . . . . . . 16
2.3 Tempo di attesa dell’n-esimo successo . . . . . . . . . . . . . . . . . . . . . . 17
2.4 Indipendenza dei tempi tra due successi consecutivi . . . . . . . . . . . . . . . 19
2.5 Canali di comunicazione binari . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.6 Passeggiata casuale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.7 Il problema del ballottaggio . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.8 Tempo del primo ritorno in 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.9 Tempo trascorso dall’ultimo passaggio in 0 . . . . . . . . . . . . . . . . . . . . 26
2.10 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4 Processi puntuali 33
4.1 Processo di Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.2 Processi di rinnovi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.3 Lotto economico d’acquisto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.4 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
6 Moto browniano 57
6.1 Moto Browniano e invarianze per cambi di scala . . . . . . . . . . . . . . . . 57
6.2 Principio di riflessione, legge del massimo . . . . . . . . . . . . . . . . . . . . 59
6.3 Moto browniano d-dimensionale . . . . . . . . . . . . . . . . . . . . . . . . . . 61
6.4 Processo di Bessel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
6.5 Integrale di funzione rispetto al moto browniano . . . . . . . . . . . . . . . . 62
6.6 Processo di Ornstein-Uhlenbeck e ponte browniano . . . . . . . . . . . . . . . 63
6.7 Moto browniano geometrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
1
2 INDICE
6.8 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
7 Speranza condizionale 67
7.1 Speranza condizionale di variabili aleatorie integrabili . . . . . . . . . . . . . 68
7.2 Proprietà di monotonia e proiettività . . . . . . . . . . . . . . . . . . . . . . . 69
7.3 Diseguaglianza di Jensen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
7.4 Speranza condizionale e stima . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
7.5 Speranza condizionale rispetto a σ(V1 , . . . , Vn ) . . . . . . . . . . . . . . . . . . 71
7.6 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
8 Martingale 73
8.1 Prime proprietà, sottomaringale, supermartingale . . . . . . . . . . . . . . . . 75
8.2 Tempi d’arresto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
8.3 Teorema d’arresto discreto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
8.4 Applicazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
8.4.1 Passeggiata casuale unidimensionale . . . . . . . . . . . . . . . . . . . 81
8.4.2 Livello di un bacino . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
8.5 Diseguaglianza massimale discreta . . . . . . . . . . . . . . . . . . . . . . . . 84
8.6 Numero di attraversamenti di un intervallo . . . . . . . . . . . . . . . . . . . 84
8.7 Versioni con traiettorie regolari . . . . . . . . . . . . . . . . . . . . . . . . . . 85
8.8 Teorema d’arresto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
8.9 Diseguaglianza di Doob . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
8.10 Teorema di convergenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
8.11 Decomposizione di Doob-Meyer . . . . . . . . . . . . . . . . . . . . . . . . . . 89
8.12 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
11 Appendice 117
11.1 Somme di variabili aleatorie indipendenti . . . . . . . . . . . . . . . . . . . . 117
11.2 Speranza di una variabile aleatoria non negativa . . . . . . . . . . . . . . . . 118
11.3 Funzioni α-hölderiane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
11.4 Uniforme integrabilità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
1
Richiami di probabilità
Un esperimento casuale o fenomeno casuale è una situazione nella quale, per mancanza di
informazioni, non siamo in grado di predire con esattezza quello che accadrà.
Le nozioni intuitive ed empirica più comuni sui fenomeni o esperimenti casuali, secondo
l’interpretazione più corrente in campo scientifico e tecnologico, si traducono nel modello
matematico, detto spazio probabilizzato, costituito da una terna (Ω, F, P) nella quale
• Ω è un insieme rappresentante tutti i possibili risultati dell’esperimento aleatorio,
• F è una famiglia di sottoinsiemi di Ω, detti eventi, che rappresentano una proposizione
che sarà vera o falsa a seconda del risultato dell’esperimento aleatorio,
• P è una probabilità che assegna a ciascun elemento A della famiglia F una valutazione
numerica della possibilità di avverarsi della proposizione rappresentata da A.
Esempio 1.1 Lancio di un dado equilibrato. La scelta naturale di (Ω, F, P) per questo
esperimento aleatorio è: Ω := {1, 2, 3, 4, 5, 6}, F famiglia di tutti i sottoinsiemi di Ω, P(A) è
il numero di elementi di A diviso per 6 (numero dei casi favorevoli diviso per il numero di
casi possibili).
Esempio 1.2 Lancio di due monete uguali. Una scelta naturale dell’insieme Ω dei risultati
dell’esperimento aleatorio è l’insieme {CC, CT, T C, T T }. Come F si può prendere la famiglia
di tutti i sottoinsiemi di Ω e cioè la famiglia costituita da
∅, {CC}, {CT }, {T C}, {T T }, {CC, CT }, {CC, T C}, {CC, T T }, {CT, T C}, {CT, T T },
{T C, T T }, {CC, T C, CT }, {T C, CT, T T }, {CC, CT, T T }, {CC, CT, T C, T T }.
Infine, per ogni A ⊆ Ω, P(A) è il numero di elementi di A diviso per 4 (numero dei casi
favorevoli diviso per il numero di casi possibili).
Tuttavia un individuo interessato solamente al numero totale di teste o di croci potrebbe
accontentarsi di definire la probabilità di su una famiglia più “piccola” considerando il
modello (Ω0 , F 0 , P0 ) con: Ω0 = {0, 1, 2} (pensando che il risultato 0 corrisponde all’uscita
di 2 croci, 1 all’uscita di una testa e una croce,...), F la famiglia di tutti i sottoinsiemi di Ω0
e P0 la probabilità
P0 {0} = 1/4, P0 {1} = 1/2, P0 {2} = 1/4, ...
3
4 1. RICHIAMI DI PROBABILITÀ
Si suppone inoltre che la famiglia di queste proposizioni sulle quali si calcola P sia chiusa
per unione, intersezione e negazione logica (ovvero che, se è definita P di A e B, deve esserlo
anche P di A ∪ B, A ∩ B, Ω − A, Ω − B). Condizioni naturali, dette di coerenza, inducono
quindi a scegliere una P che soddisfi la proprietà, chiamata additività,
Proposizione 1.2 Data una famiglia (Ai )i∈I di σ-algebre di sottoinsiemi di un insieme Ω,
l’intersezione ∩i∈I Ai è una σ-algebra di sottoinsiemi di Ω.
Vale la pena di ricordare che, nella costruzione di uno spazio probabilizzato (Ω, F, P), è
abbastanza facile e naturale scegliere Ω e F ma poi, tanto più grande è F, tanto più difficile
sarà costruire la misura di probabilità P su F.
Definizione 1.3 Una variabile aleatoria reale (risp. reale estesa) X su uno spazio proba-
bilizzato (Ω, F, P) è un’applicazione X : Ω → R (risp. X : Ω → R) tale che, per ogni coppia
di numeri reali a, b l’insieme {a < X ≤ b} appartenga a F.
X −1 (A) = {ω ∈ Ω | X(ω) ∈ A} .
In modo equilvalente si potrebbe definire una variabile aleatoria, reale o reale estesa,
come un’applicazione X : Ω → R (risp. X : Ω → R) tale che, per ogni numero reale r
l’insieme { X ≤ r } appartenga a F. Infatti, per ogni a, b ∈ R, si ha
c
{ a < X ≤ b } = { X ≤ b } ∩ ({ X ≤ a }) . (1.1)
Una variabile aleatoria (reale o reale estesa) è quindi una funzione del risultato ω
dell’esperimento aleatorio della quale siamo in grado di dire qual è la probabilità di os-
servare valori in un certo intervallo ]a, b]. In realtà, grazie al fatto che F è una σ-algebra,
sarà definita la probabilità di insiemi del tipo {X ∈ A} con A sottoinsieme boreliano di R.
Definizione 1.4 Si chiama σ-algebra dei boreliani di R (risp. R) e si denota con B(R)
(risp. B(R)) σ-algebra generata dagli intervalli ]a, b] con a, b ∈ R.
Nel linguaggio dell’Analisi Matematica una variabile aleatoria reale (risp. reale estesa)
è dunque un’applicazione misurabile. Si può quindi dimostrare, come per le applicazioni
misurabili, che somme, combinazioni lineari, prodotti, ... di variabili aleatorie reali (e reali
estese evitando le forme indeterminate come +∞ − ∞) sono ancora variabili aleatorie reali.
Gli eventi determinati da X, dei quali cioè siamo in grado di dire se si sono verificati o
meno osservando il valore di X, formano una σ-algebra.
Definizione 1.5 Data una variabile aleatoria reale (risp. reale estesa) X si chiama σ-
algebra generata da una variabile aleatoria X e si denota σ(X) la sotto − σ-algebra di F
costituita dagli insiemi {X ∈ A} con A ∈ B(R) (risp. A ∈ B(R)).
6 1. RICHIAMI DI PROBABILITÀ
X : Ω → R, X(ω1 , ω2 ) = ω1 + ω2 .
Indica il numero totale di teste ottenute nel lancio. Si tratta evidentemente di una variabile
aleatoria perché, in questo modello, F è costituita da tutti i sottoinsiemi di Ω e quindi
{X ∈ A} è un elemento di F qualunque sia A. Si verifica facilmente che la σ-algebra
σ(X)-generata da X è costituita dagli insiemi
Si vede subito che σ(X) è costituita dagli eventi che siamo in grado di dire se si verificano
o meno conoscendo il solo valore di X.
Si può verificare abbastanza facilmente che, se X è una variabile aleatoria reale, allora
anche X 2 , X 3 , sin(X), arctan(X), . . . sono ancora variabili aleatorie reali. In generale si può
dimostrare la seguente
µ = (1 − p)δ0 + pδ1 .
λα xα−1 −λx
Z
µ(A) = e dx
]0,+∞[∩A Γ(α)
La legge χ2 (n) del chi-quadrato con n gradi di libertà è la legge Γ(n/2, 1/2).
Legge di Cauchy (mediana m)
Z
1 1
µ(A) = dx.
π A 1 + (x − m)2
B(a, b). Legge beta (a, b > 0)
Z
Γ(a + b)
µ(A) = xa−1 (1 − x)b−1 dx
Γ(a)Γ(b) ]0,1[∩A
Ricordiamo, per quanto ovvio, che due variabili aleatorie con la stessa legge possono
essere molto diverse. Per esempio le (Xn )n≥1 , variabili aleatorie di un processo di Bernoulli
di parametro p, hanno tutte la stessa legge B(1, p) ma sono molto diverse tra loro perché
Xn dà il risultato dell’n-esima prova del processo.
dove 1Ak denota la funzione indicatrice (o, nel linguaggio dell’Analisi, caratteristica) dell’evento
Ak (1Ak (ω) = 1 se ω ∈ Ak , 1Ak (ω) = 0 se ω ∈ / Ak ) e quindi la sua speranza è
n
X
E[X] = xk P(Ak ).
k=1
8 1. RICHIAMI DI PROBABILITÀ
Estendiamo poi la definizione alle variabili aleatorie non negative X : Ω → [0, +∞].
Per questo motivo cominciamo con l’osservare che ogni variabile aleatoria non-negativa è
estremo superiore di una successione non decrescente di variabili aleatorie con un numero
finito di valori. Si può considerare, per esempio, la successione
n
n2
X
Xn = k2−n 1{k2−n <X≤(k+1)2−n }
k=0
Xn (ω) ≤ Xn+1 (ω), e sup Xn (ω) = lim Xn (ω) = X(ω) per ogni ω ∈ Ω.
n n→∞
Si potrebbe dimostrare che E[X] è indipendente dalla particolare successione non decrescente
di variabili aleatorie con un numero finito di valori scelta. Abbiamo cosı̀ definito E[X] per
le variabili aleatorie non negative.
Infine, se X è una variabile aleatoria reale o reale estesa su uno spazio probabilizzato
(Ω, F, P), definiamo le variabili aleatorie X + , X − le variabili aleatorie
Teorema 1.11 Sia (Xn )n≥1 una successione non decrescente di variabili aleatorie reali
estese semi-integrabili inferiormente e sia X = supn≥1 Xn = limn→+∞ Xn . Si ha allora
Teorema 1.12 Sia (Xn )n≥1 una successione di variabili aleatorie reali estese integrabili.
Supponiamo che:
1. per quasi ogni ω ∈ Ω esista limn→∞ Xn (ω) = X(ω),
2. esista una variabile aleatoria Y integrabile tale che |Xn (ω)| ≤ Y (ω) per quasi ogni
ω ∈ Ω.
Si ha allora
E[X] = sup E[Xn ].
n≥1
si chiama varianza di X.
Densità Simbolo Speranza Varianza
Bernoulli B(1, p) p p(1 − p)
binomiale B(n, p) np np(1 − p)
Poisson P (λ) λ λ
geometrica G(p) 1/p q/p2
Pascal P(n, p) n/p nq/p2
uniforme U(a, b) (a + b)/2 (b − a)2 /12
esponenziale E(λ) 1/λ 1/λ2
normale N (µ, σ 2 ) µ σ2
gamma Γ(a, λ) a/λ a/λ2
chi quadrato χ2 (n) n 2n
beta B(a, b) a/(a + b) ab/(a + b)2 (a + b + 1)
esponenziale bilatera 0 2/λ2
Cauchy non definita non definita
g(E[X]) ≤ E[g(X)].
Lemma di Borel Cantelli. Un problema abbastanza frequente nello studio dei fenomeni
aleatori è quello di determinare la probabilità che si verifichino infiniti eventi tra quelli di
una data successione (An )n≥1 . L’evento in questione si rappresenta
∩n≥1 ∪k≥n Ak
e si indica con lim supn An . Si può inoltre rappresentare come l’insieme degli ω ∈ Ω dove la
serie delle funzioni indicatrici X
1An (ω)
n≥1
è divergente.
Il Lemma di Borel Cantelli dà una condizione abbastanza semplice per mostrare che
lim supn An ha probabilità 0.
1.3 Indipendenza
Definizione 1.15 Due variabili aleatorie reali (risp. reali estese) X, Y su uno spazio prob-
abilizzato (Ω, F, P), sono indipendenti se, per ogni coppia a, b e ogni coppia c, d di numeri
reali si ha
P { a < X ≤ b, c < Y ≤ d } = P { a < X ≤ b } P { c < Y ≤ d } .
Si verifica facilmente (grazie a (1.1)) che due variabili aleatorie X, Y sono indipendenti
se e solo se
P { X ≤ r, Y ≤ s } = P { X ≤ r } P { Y ≤ s }
per ogni coppia di numeri reali r, s.
La definizione precedente si generalizza nel modo naturale al caso di n variabili aleatorie.
Si dimostra il seguente
Teorema 1.16 Siano X1 , . . . , Xn variabili aleatorie reali (reali estese). Le condizioni seguenti
sono equivalenti:
1. X1 , . . . , Xn sono indipendenti,
1.3. INDIPENDENZA 11
P { X1 ∈ A1 , . . . , Xn ∈ An } = P { X1 ∈ A1 } · · · P { Xn ∈ An } ,
Corollario 1.17 Siano X, Y variabili aleatorie reali indipendenti con speranza finita. La
variabile aleatoria XY ha speranza finita e
E[XY ] = E[X]E[Y ].
1. X1 , . . . , Xn sono indipendenti,
Funzioni boreliane di variabili aleatorie indipendenti sono, a loro volta, variabili aleatorie
indipendenti. Più precisamente si dimostra il seguente
Allora le variabili aleatorie reali g1 ((Xi )i∈I1 ), . . . , gm ((Xi )i∈Im ) sono indipendenti.
Questo teorema si applica, per esempio, alle variabili aleatorie (Xn )n≥1 di un processo
di Bernoulli per dimostrare l’indipendenza delle variabili aleatorie
Y1 = X1 + X2 , Y2 = X3 (X4 + X5 ), Y3 = g3 (X6 , X7 ).
Infinite variabili aleatorie sono indipendenti, per definizione, se e solo se ogni loro sot-
tofamiglia finita è una famiglia di variabili aleatorie indipendenti nel senso delle definizioni
precedenti. I criteri precedenti permettono quindi di trattare in modo essenzialmente anal-
ogo anche il caso di infinite variabili aleatorie indipendenti.
12 1. RICHIAMI DI PROBABILITÀ
2. la σ-algebra B(Rn ), generata dagli insiemi della forma ]a1 , b1 ] × . . . ×]an , bn ] (detti
plurirettangoli),
(Si potrebbe dimostrare che esiste un’unica misura di probabilità P su B(Rn ) che verifica la
condizione 3.) Si definiscono quindi le X1 , . . . , Xn
P{ r < Xk ≤ s } = µ1 (R) · · · µk−1 (R)µk (]r, s])µk+1 (R) · · · µn (R) = µk (]r, s]).
1.4 Esercizi
Esercizio 1.1 Verificare le formule della media e della varianza della legge Γ(α, λ).
Esercizio 1.2 Verificare le formule della media e della varianza della legge B(a, b).
Esercizio 1.3 Siano X, N due variabili aleatorie indipendenti. Supponiamo che X abbia
legge B(1, p) e N abbia legge di Poisson con parametro λ > 0. Determinare la legge della
variabile aleatoria N X (definiamo, per convenzione, 00 = 1) e calcolare la speranza di N X .
Esercizio 1.4 Siano X1 , . . . , Xn variabili aleatorie reali indipendenti con legge normale
N (0, 1). Verificare che X12 + . . . + Xn2 ha legge Γ(n/2, 1/2).
1.4. ESERCIZI 13
Esercizio 1.5 Siano X, Y due variabili aleatorie reali indipendenti con legge esponenziale
di parametro λ > 0. Verificare che la variabile aleatoria X/(X + Y ) ha legge uniforme su
[0, 1].
Esercizio 1.6 Mostrare che B(R) (risp. B(R)) è la più piccola σ-algebra di sottoinsiemi di
R (risp. R) che contenga le seguenti famiglie di sottoinsiemi di R (risp. R)
H1 = { ]a, b[ | a, b ∈ R } ,
H2 = { [a, b[ | a, b ∈ R } ,
H3 = { [a, b] | a, b ∈ R } ,
H4 = { [a, +∞[ | a ∈ R } ,
H5 = { ]a, +∞[ | a ∈ R } ,
H6 = { ] − ∞, a] | a ∈ R } ,
H7 = { ] − ∞, a[ | a ∈ R } .
Esercizio 1.7 La σ-algebra B(Rd ) dei sottoinsiemi Boreliani di Rd è la più piccola σ-algebra
di sottoinsiemi di Rd che contiene i plurirettangoli
]a1 , b1 ] × . . . ×]ad , bd ].
Verificare che B(Rd ) coincide con la più piccola σ-algebra di sottoinsiemi di Rd che contiene
gli insiemi della forma
A1 × . . . × Ad
con A1 , . . . Ad ∈ B(R).
Esercizio 1.8 Sia (An )n≥1 una successione non decrescente (cioè tale che An ⊆ An+1 per
ogni n ≥ 1) di eventi in uno spazio probabilizzato (Ω, F, P). Mostrare che
Esercizio 1.9 Verificare che una variabile aleatoria reale X è indipendente da sé stessa se
e solo se è costante.
Esercizio 1.11 Siano X, Y due variabili aleatorie reali indipendenti. Supponiamo che Y ≤
X quasi certamente. Mostrare che esiste una costante c tale che P {Y ≤ c ≤ X} = 1.
Risposta. Osservare che, per ogni c ∈ R l’evento {X ≤ c} ∩ {Y > c} è vuoto e quindi
P{X ≤ c} · P{Y > c} = 0.
Esercizio 1.12 Siano X, Y due variabili aleatorie reali indipendenti. Supponiamo che X
abbia densità f e Y abbia legge ν. Mostrare che la variabile aleatoria X + Y ha per densità
la funzione g data da Z
g(s) = f (s − y)ν(dy)
R
Esercizio 1.13 Mostrare con un esempio che l’unione di due σ-algebre non è necessaria-
mente una σ-algebra.
14 1. RICHIAMI DI PROBABILITÀ
Il processo di Bernoulli
I più semplici esperimenti aleatori hanno due soli possibili risultati, di solito denotati con 0
(“insuccesso”) e 1 (“successo”) che hanno probabilità rispettivamente 1 − p e p (p ∈]0, 1[).
Un esperimento di questo tipo si chiama prova binaria.
Il processo di Bernoulli è costituito dalla ripetizione di un numero infinito di prove bi-
narie indipendenti. Questo esperimento aleatorio è piuttosto importante perché: a) sorge
naturalmente in numerose situazioni in campo scientifico e tecnologico, b) si possono calco-
lare in modo abbastanza semplice le probabilità di tutti gli eventi in gioco, c) i metodi che
si sviluppano nella loro trattazione si rivelano utili anche nella soluzione di altri problemi.
2.1 Costruzione
Richiamiamo brevemente la costruzione del processo di Bernoulli
L’insieme Ω dei risultati possibili dell’esperimento aleatorio in questione è costituito dalle
successioni di (ωk )k≥1 di 0 e di 1 cioè dal prodotto cartesiano
∗
Ω = { 0, 1 }N = { (ωk )k≥1 | ωk ∈ {0, 1} } .
Rk : Ω → { 0, 1 }, Rk (ω) = ωk .
Vogliamo trovare poi una σ-algebra F e una misura di probabilità P su F in modo tale che:
(B1) gli eventi { Rk = 1 } abbiano probabilità p fissata,
(B2) gli eventi { R1 = x1 }, { R2 = x2 }, . . . , { Rn = xn } siano indipendenti per ogni n ∈ N∗
e ogni x1 , . . . , xn ∈ { 0, 1 }.
La scelta naturale di F è quindi la più piccola σ-algebra di sottoinsiemi di Ω che contenga
questi eventi.
Per definire la probabilità su F in modo che gli eventi { Rt1 = xt1 }, . . . , { Rtn = xtn }
risultino indipendenti dobbiamo porre
IP (∩nk=1 { Rtk = xtk }) = IP { Rt1 = xt1 } · IP { Rt2 = xt2 } · · · IP { Rtn = xtn } = pk (1 − p)n−k
15
16 2. IL PROCESSO DI BERNOULLI
se Tn−1 (ω) < +∞ e l’insieme dei k > Tn−1 (ω) tali che ωk = 1 è non vuoto, Tn (ω) = +∞
altrimenti.
Per ottenere n successi occorre fare almeno n prove quindi
{ Tn = k } = ∅, e perciò IP { Tn = k } = 0.
per k = 0, 1, . . . , n − 1.
Inoltre, per ogni numero naturale k ≥ n, abbiamo poi
{ Tn = k } = { Sk−1 = n − 1, Rk = 1 } = { Sk−1 = n − 1 } ∩ { Rk = 1 }
perché, se k è l’istante dell’n-esimo successo, allora alla k-esima prova il risultato è stato
successo e, inoltre, nelle prime k − 1 prove si sono verificati esattamente n − 1 successi. In
particolare l’insieme { Tn = k } appartiene a F (è unione finita di eventi elementari).
La rappresentazione
[
{ Sk−1 = n − 1 } = (∩j∈F {Rj = 1}) ∩ ∩j ∈F
/ {Rj = 0}
F ⊆{0,1,...,k−1},card(F )=n−1
fa vedere inoltre che gli eventi { Sk−1 = n−1 } e { Rk = 1 } sono indipendenti (se A1 , . . . , Am
sono indipendenti allora A1 ∪ · · · ∪ Am−1 e Am sono indipendenti cosı̀ come A1 ∩ · · · ∩ Am−1
e Am ...) quindi
k−1
IP { Tn = k } = IP { Sk−1 = n − 1 } · IP { Rk = 1 } = pn (1 − p)k−n .
n−1
{ T n > ` } = { S` < n }
n−1
X
IP { Tn > ` } ≤ (p/(1 − p))j `j (1 − p)` .
j=0
IP { Tn = +∞ } = lim IP { Tn > ` } = 0.
`→∞
Definizione 2.4 Siano n ∈ N∗ e p ∈]0, 1[. La densità (pk )k≥0 su N∗ data da pk = 0 per
k = 1, 2, . . . , n − 1 e
k−1
pk = pn (1 − p)k−n
n−1
si chiama densità di Pascal di parametri n e p e si denota P (n, p).
con j ∈ N.
Questa densità si chiama binomiale negativa perché si esprime spesso utilizzando un’estensione
della definizione del coefficiente binomiale ai numeri negativi.
Infatti, osservando che, per ogni m, i ∈ N con i ≤ m si ha
m m(m − 1) . . . (m − i + 1)
= ,
i i!
0 1 2 3 4 5 6 7 8 9 10 12 0 2 4 6 8 10 12 14
n(1 − p) n(1 − p)
E[Tn − n] = , V [Tn − n] = V [Tn ] = .
p p2
per gli ω tali che Tn (ω) < +∞ per ogni n ≥ 1 e in modo arbitrario per gli ω nell’insieme di
probabilità nulla dove Tn (ω) = +∞ per qualche n.
Teorema 2.6 Le variabili aleatorie Un sono indipendenti e hanno tutte legge geometrica di
paramentro p.
20 2. IL PROCESSO DI BERNOULLI
IP { U1 = m1 , . . . , Un = mn } = pq m1 −1 · pq m2 −1 · · · pq mn −1 .
IP { Uk = mk } = pq mk −1 .
Ciò dimostra che Uk ha densità geometrica di parametro p e che vale la condizione del
Teorema 1.16.
Osservando che, per definizione, Tn = U1 + . . . + Un si può concludere che ogni variabile
aleatoria uguale alla somma di n variabili aleatorie indipendenti con legge geometrica di
parametro p ha legge di Pascal di parametri n e p.
IP { Sd > 0 } = 1 − IP { Sd = 0 } = 1 − (1 − p)d .
Una tecnica per diminuire la probabilità di errore chiamata “controllo di parità” consiste
nell’aggiunta alla sorgente di un (d + 1)-esimo carattere in modo tale che il numero di a o
di b contenuti nella stringa di lunghezza d + 1 inviata sia pari. Il ricevitore controllerà se
il numero di a o di b tra i d + 1 caratteri ricevuti è pari e, in tal caso, accetterà la stringa
inviata come corretta altrimenti ne chiederà la ritrasmissione.
In questo modo una stringa di d caratteri non verrà trasmessa correttamente solo con un
numero pari, non nullo, di errori sui singoli caratteri. Questo accade se si verifica l’evento
[(d+1)/2]
[
{ Sd+1 = 2k }
k=1
2.6. PASSEGGIATA CASUALE 21
([(d + 1)/2] denota la parte intera di (d + 1)/2 cioè il più grande intero minore o uguale a
(d + 1)/2 ovvero (d + 1)/2 se d è dispari e d/2 se d è pari) e quindi la probabilità che una
stringa di d caratteri non venga trasmessa correttamente con il controllo di partità è
[(d+1)/2] [(d+1)/2]
[ X
IP { Sd+1 = 2k } = IP { Sd+1 = 2k }
k=1 k=1
[(d+1)/2]
X d+1
= p2k (1 − p)d+1−2k
2k
k=1
1 + (1 − 2p)(d+1)
− (1 − p)(d+1) .
2
Si vede facilmente che, per p piccolo, si ha
1 − (1 − p)d ≈ dp + o(p),
(d+1)
1 + (1 − 2p)
− (1 − p)(d+1) ≈ d(d + 1)p2 + o(p2 ).
2
Lo spostamento del punto dal tempo n al tempo n + 1 è quindi ben modellizzato dalle
variabili aleatorie 2Rn+1 − 1.
Supponendo che, al tempo 0, il punto parta da 0, la posizione al tempo n è data da
n
X
Xn = X0 + (2Rk − 1) = 2Sn − n.
k=1
Definizione 2.8 La famiglia di variabili aleatorie (Xn )n≥0 si chiama passeggiata casuale
su Z con parametro p. Nel caso in cui p = 1/2 si chiama passeggiata casuale simmetrica.
Nelle varie interpretazioni delle passeggiate casuali si pone spesso il problema di deter-
minare la probabilità di ritornare al valore iniziale, di osservare un certo valore massimo o
minimo in un dato intervallo di tempo, il tempo medio impiegato per raggiungere un certo
valore e quantità simili.
Tratteremo molti di questi problemi utilizzando metodi di teoria delle martingale ma
risponderemo ad alcune delle domande precedenti con metodi elementari basati sul principio
di riflessione.
Il calcolo della probabilità di ritorno in 0 al tempo n della passeggiata casuale con X0 = 0
è il più semplice dei problemi precedenti. Infatti, sapendo che Sn ha legge binomiale B(n, p),
si trova subito che la probabilità di ritorno in 0 al tempo n è nulla se n è dispari mentre, se
n è pari
n
IP { Xn = 0 } = IP { Sn = n/2 } = (pq)n/2 . (2.6)
n/2
In particolare, grazie alla formula di Stirling, per n grande, si ha
(4p(1 − p))n
IP { X2n = 0 } ≈ √ .
πn
Teorema 2.9 (Principio di riflessione.) Il numero di cammini da (0, −a) a (n, b) (a, b ∈ Z)
che toccano l’asse delle ascisse è uguale al numero di cammini da (0, a) a (n, b) che toccano
l’asse delle ascisse.
Dimostrazione. Per ogni cammino da (0, −a) a (n, b) (a, b ∈ Z) che tocca sia m l’ultimo
istante in cui il valore raggiunto è 0. Per ottenere un cammino da (0, a) a (n, b) che tocca
l’asse delle ascisse basterà cambiare di segno i primi m incrementi del cammino da (0, −a)
a (n, b) (vedi Figura 2.1).
Teorema 2.10 Sia (Xn )n≥0 una passeggiata casuale simmetrica su Z con X0 = 0. Si ha
allora
IP max Xk ≥ x = 2IP { Xn > x } + IP { Xn = x }
0≤k≤n
zz
z
zz
(0, −a)
coincidono e quindi le loro probabilità sono uguali. Basterà quindi verificare che
IP max Xk ≥ x, Xn 6= x = 2IP { Xn > x } .
0≤k≤n
Questa identità segue dal principio di riflessione, infatti il numero di cammini che raggiun-
gono (ed eventualmente superano) il valore x e terminano con un valore diverso da x è
esattamente doppio del numero di cammini che terminano con un valore strettammente
maggiore di x.
e risulta evidentemente
n n
Nn,x = = .
s (n + x)/2
Iniziamo mostrando un lemma preliminare che si verifica essenzialmente come il principio
di riflessione.
Lemma 2.11 Il numero di cammini da (0, 0) a (n, x) (x ∈ N∗ ) che non toccano l’asse delle
ascisse a tempi strettamente positivi è uguale a
x
Nn−1,x−1 − Nn−1,x+1 = Nn,x
n
Dimostrazione. Il numero totale di cammini da (0, 0) a (n, x) che non passano mai da 0 ai
tempi 1, 2, . . . , n è evidentemente uguale al numero di cammini da (1, 1) a (n, x) che non
passano mai da 0. Questo, a sua volta, (per traslazione) è uguale al numero di cammini da
(0, 0) a (n − 1, x − 1) che non passano mai sotto lo 0 ai tempi 1, 2, . . . , n − 1.
Per mostrare la formula occorre quindi sottrarre a Nn−1,x−1 il numero di cammini che
passano sotto lo 0. Questo, per il principio di riflessione, è uguale al numero di cammini che
finiscono in (n − 1, x + 1). Infatti, detto m (m > 0) il primo istante dopo 0 in cui Xm < 0,
l’incremento risulta Xm − Xm−1 = 2Rm − 1 = −1. Cambiando questo incremento con un
+1, si ottiene un cammino che arriva in (n − 1, x + 1). Viceversa, dato un camino da (0, 0)
che arriva in (n − 1, x + 1), cambiando il primo incremento uguale a +1 in un incremento
−1 si ottiene un cammino da (0, 0) a (n − 1, x − 1) che passa sotto 0.
Il numero di cammini da (0, 0) a (n − 1, x − 1) che non passano per 0 è allora uguale a
n−1 n−1
Nn−1,x−1 − Nn−1,x+1 = −
(n + x)/2 − 1 (n + x)/2
x n x
= = Nn,x .
n (n + x)/2 n
Ciò dimostra il lemma.
Teorema 2.12 Se (Xn )n≥0 è una passeggiata casuale simmetrica con X0 = 0 per ogni
x ∈ { 1, 2, . . . , n } tale che n − x sia pari si ha
x n
IP { X1 > 0, X2 > 0, . . . , Xn−1 > 0, Xn = x } = 2−n ,
n (n + x)/2
in particolare
x
IP { X1 > 0, X2 > 0, . . . , Xn−1 > 0 | Xn = x } = .
n
Dimostrazione. La prima formula segue subito dal Lemma 2.11 e dal fatto che ogni cammino
fissato da (0, 0) a (n, x) ha probabilità 2−n . La seconda è un’immediata conseguenza della
definizione di probabilità condizionata.
Z = inf { n ≥ 1 | Xn = 0 }
con la convenzione abituale inf ∅ = +∞. Vogliamo calcolare la legge di Z. A questo scopo
iniziamo mostrando una formula notevole sull’uguaglianza tra: la probabilità di passaggio
in 0 al tempo 2n e la probabilità di non passare mai da 0 ai tempi 1, 2, . . . , 2n.
2.8. TEMPO DEL PRIMO RITORNO IN 0 25
Abbiamo inoltre (formula della probabilità totale), con le notazioni del paragrafo precedente
e grazie al Teorema 2.12,
n
X
IP { X1 > 0, X2 > 0, . . . , X2n > 0 } = IP { X1 > 0, X2 > 0, . . . , X2n = 2k }
k=1
n
−2n
X 2k
= 2 N2n,2k ,
2n
k=1
troviamo
1 2n 1
IP { X1 > 0, X2 > 0, . . . , X2n > 0 } = 2−2n = IP { X2n = 0 }
2 n 2
2−2n
1 2n
IP { Z = 2n } = IP { X2n = 0 } =
2n − 1 2n − 1 n
e IP { Z = +∞ } = 0.
IP { Z = 2n } = IP { X1 6= 0, X2 6= 0, . . . , X2n = 0 }
= IP { X1 6= 0, X2 6= 0, . . . , X2n−2 6= 0 } − IP { X1 6= 0, X2 6= 0, . . . , X2n 6= 0 }
−2n 2n − 2 2n
= 2 4 −
n−1 n
−2n 2n 2n
= 2 −1 .
n 2n − 1
26 2. IL PROCESSO DI BERNOULLI
abbiamo
IP { Z = +∞ } = lim IP { Z > 2n } .
n→∞
In particolare
∞
X
E[Z] = 2n · IP { Z = 2n } = +∞.
n=1
Questo mostra che il ritorno in 0 avverrà quasi certamente ma occorrerà attendere troppo
tempo.
Dimostrazione. Si ha infatti
e quindi, poiché X2k è indipendente dal vettore aleatorio (X2k+2 − X2k , . . . , X2n − X2k ),
grazie al Lemma 2.13 troviamo
0 2 4 6 8 10 12
Vedremo ora come la formula 2.7, per tempi grandi, dia origine alla cosiddetta legge
dell’arco seno. Più precisamente mostriamo che la successione di variabili aleatorie (V2n /2n)n≥1
converge in legge verso la legge dell’arco seno.
2.10 Esercizi
Esercizio 2.1 Calcolare la probabilità IP ({ R1 = 1 } | { Sn = k }) per k = 0, 1, . . . , n.
Esercizio 2.2 Verificare che una variabile aleatoria Y con densità binomiale negativa N B(n, p)
soddisfa
n(1 − p) n(1 − p)
E[Y ] = , V [Y ] =
p p2
Esercizio 2.3 Sia Tn il tempo d’attesa dell’n-esimo successo di un processo di Bernoulli e
sia k ≤ n. Calcolare
IP { Tk = j | Tn = m }
per ogni j ∈ { k, . . . , m − (n − k) }. Che cosa si può dire della legge di Tk rispetto alla
probabilità condizionata IP { · | Tn = m } ?
Esercizio 2.4 Un tale gioca n partite in ciascuna delle quali perde o vince 1 moneta con
uguale probabilità. Alla fine del gioco possiede x monete (x > 0). Qual è la probabilità che,
durante il gioco, non sia mai rimasto senza monete (tranne, ovviamente, al tempo 0)?
Esercizio 2.5 Siano (Rn )n≥1 e (Rn0 )n≥1 due processi di Bernoulli con parametri p e p0
indipendenti. Detti T e T 0 i rispettivi istanti dei primi successi, calcolare la probabilità
dell’evento { T ≤ T 0 }.
Esercizio 2.6 Il valore di portafoglio di azioni ogni giorno aumenta o diminuisce di 0.1 con
probabilità 1/2. Se il valore iniziale è 1 e, dopo 20 giorni è 1.2 qual è la probabilità che il
valore non sia mai sceso sotto 1?
3
29
30 3. ELEMENTI DI TEORIA GENERALE DEI PROCESSI
per ogni t ∈ I.
Fs ⊆ Ft
per ogni s ≤ t.
Esempio 3.2 Sia (Xn )n≥1 un processo di Bernoulli di parametro p. La σ-algebra degli
eventi osservabili fino al tempo n è la più piccola σ-algebra Fn di sottoinsiemi di F che
contenga gli eventi della forma
{ X1 = x1 , . . . , Xn = xn }
Definizione 3.4 Dato un processo stocastico X = (Xt )t∈I su uno spazio probabilizzato
(Ω, F, P) si chiama filtrazione naturale di X la filtrazione (Ft )t∈I in cui Ft è la più piccola
σ-algebra rispetto alla quale le variabili aleatorie Xs con s ≤ t siano misurabili.
Definizione 3.5 Un processo stocastico (Xt )t∈I su uno spazio probabilizzato (Ω, F, P) con
una filtrazione (Ft )t∈I di sotto-σ-algebre di F si dice adattato se la variabile aleatoria Xt è
Ft misurabile per ogni t ∈ I.
I 3 t → Xt (ω) ∈ R. (3.1)
per ogni s, t ∈ I è una proprietà molto più debole della continuità delle traiettorie.
Definizione 3.7 Si dice che X ammette una versione a traiettorie continue (risp. rego-
lari) se esiste un processo stocastico X 0 a traiettorie continue (risp. regolari) che sia una
modificazione di X.
P ( ∪t∈I {Xt 6= Yt } ) = 0.
Proposizione 3.9 Siano X e Y due processi con traiettorie regolari. Se X è una modifi-
cazione di Y allora è anche indistinguibile da Y .
Basterà infatti osservare che, data la regolarità delle traiettorie, preso un sottoinsieme
D di I numerabile e denso, si ha
[ [
{ Xt 6= Yt } = { Xt 6= Yt } .
t∈I t∈D
Esempio 3.3 Sia Ω = [0, 1], F = B([0, 1]) e P la misura di Lebesgue su F. Sia I = [0, +∞[
l’insieme dei tempi. Consideriamo il processo stocastico X cosı̀ definito
1 se ω = t,
Xt (ω) =
0 se ω 6= t.
e sia Y il processo nullo Yt (ω) = 0 per ogni t ∈ I e ogni ω ∈ Ω. È chiaro che X è una
modificazione di Y ma X non è indistinguibile da Y perché
P ( ∪t∈I {Xt 6= Yt } ) = 1.
Nello studio dei processi stocastici è molto utile sapere se un certo processo ha una mo-
dificazione con traiettorie continue. Questa proprietà si può verificare applicando il seguente
risultato che dà anzi una informazione più precisa. Ricordiamo che una funzione g : R → R
si chiama θ-holderiana (0 < θ < 1) se esiste una costante c tale che
Teorema 3.10 Sia X = (Xt )t≥0 un processo stocastico su uno spazio probabilizzato (Ω, F, P).
Se esistano due numeri reali α, β strettamente positivi e una costante C tali che
per ogni t, s ≥ 0, allora X ha una modificazione con traiettorie γ-hölderiane per ogni γ ∈
]0, β/α[.
Per la dimostrazione si veda “I. Karatzas, S.E. Shreve, Brownian Motion and Stocastic
Calculus (Second Edition) Th.2.8 p.53”.
3.3 Esercizi
Esercizio 3.1 Sia (Rn )n≥1 un processo di Bernoulli di parametro p su uno spazio probabi-
lizzato (Ω, F, P). Per ogni n ≥ 1 sia Sn = R1 + . . . + Rn e sia Gn la più piccola σ-algebra di
sottoinsiemi di F che contenga gli eventi della forma
{ S1 = k1 , . . . , Sn = kn }
Esercizio 3.3 Mostrare che un processo stocastico X = (Xt )t≥0 con la proprietà seguente
“per ogni t, s ≥ 0 la variabile aleatoria Xt −Xs ha legge normale N (0, t−s)” verifica l’ipotesi
del Teorema 3.10
Esercizio 3.4 Mostrare che un processo stocastico X = (Xt )t≥0 con la proprietà seguente
“per ogni t, s ≥ 0 la variabile aleatoria Xt − Xs ha legge di Poisson con parametro λ(t − s)”
non verifica l’ipotesi del Teorema 3.10
Esercizio 3.5 Mostrare che un processo stocastico X = (Xt )t∈[0,1] con la proprietà seguente:
per ogni t, s ≥ 0 le variabili aleatorie Xt , Xs hanno legge gaussiana bidimensionale con
media 0 e covarianza
Cov[Xt , Xs ] = min{s, t} − st
Processi puntuali
I processi puntuali sono speciali processi stocastici le cui traiettorie sono costanti a tratti e,
a tempi aleatori, hanno salti di una certa ampiezza che può essere costante oppure aleatoria.
In questo capitolo mostreremo alcuni esempi di processi puntuali con ampiezza dei salti
uguali a 1 e per questo detti anche processi di conteggio. Questi processi possono descrivere
vari fenomeni aleatori come il conteggio del numero di persone che arrivano in una coda
casuale, i guasti di un certo apparato, il decadimento radioattivo ...
Le Xn si potrebbero pensare come le durate di certi “pezzi” che vengono sostituiti non
appena si guastano. La variabile aleatoria Nt rappresenta quindi il numero di guasti
nell’intervallo temporale [0, t].
È abbastanza facile trovare la legge di Nt .
Proposizione 4.1 La variabile aleatoria Nt ha legge di Poisson di parametro λt per ogni
t > 0. In particolare P{ Nt = +∞ } = 0 per ogni t ≥ 0.
Dimostrazione. Calcoliamo dapprima la probabilità dell’evento { Nt = 0 }. Grazie all’identità
{ N t = 0 } = { T1 > t }
si ha subito
P{ Nt = 0 } = P{ T1 > t } = e−λt .
Calcoliamo poi la probabilità dell’evento { Nt = k } per ogni k > 0. Grazie all’identità
{ Nt = k } = { Tk ≤ t, Tk+1 > t } = { Tk ≤ t } − { Tk+1 ≤ t }
si ha quindi, tenendo conto che Tk e Tk+1 hanno leggi Γ(k, λ) e Γ(k + 1, λ) rispettivamente,
P{ Nt = k } = P{ Tk ≤ t } − P{ Tk+1 ≤ t }
Z t k k−1 Z t k+1 k
λ x λ x −λx
= e−λx dx − e dx.
0 (k − 1)! 0 k!
33
34 4. PROCESSI PUNTUALI
Integrando per parti il secondo integrale (si integra λe−λx e si deriva xk ) si trova infine
(λt)k
P{ Nt = k } = e−λt
k!
e quindi Nt ha legge di Poisson con parametro λt.
In particolare, dato che Nt ha speranza finita, la probabilità dell’ evento {Nt = +∞} è
nulla.
Si verifica inoltre che il processo (Nt )t≥0 ha incrementi indipendenti.
Teorema 4.2 Per ogni intero n ≥ 1 e ogni 0 < t1 < t2 < . . . < tn le variabili aleatorie
Nt1 , Nt2 − Nt1 , . . . , Ntn − Ntn−1 sono indipendenti e hanno legge di Poisson con parametri
rispettivamente λt1 , λ(t2 − t1 ), . . . , λ(tn − tn−1 ).
che hanno leggi rispettivamente Γ(h, λ), Γ(1, λ), Γ(k − 1, λ), Γ(1, λ) si vede subito che la
probabilità P{ Nt = h, Nt+s = k } è data da
t Z t+s−x Z t+s−(x+y) k−1 k−2 Z ∞
λh xh−1 −λx
Z
λ z
e dx λe−λy dy e−λz dz λe−λw dw
0 (h − 1)! t−x 0 (k − 2)! t+s−(x+y+z)
Z t Z t+s−x Z t+s−(x+y) k−2
xh−1 z
= λh+k e−λ(t+s) dx dy dz
0 (h − 1)! t−x 0 (k − 2)!
Z t Z t+s−x
xh−1 ((t + s) − (x + y))k−1
= λh+k e−λ(t+s) dx dy
0 (h − 1)! t−x (k − 1)!
k Z t
h+k −λ(t+s) s xh−1
=λ e dx
k! 0 (h − 1)!
(λt)h −λs (λs)k
= e−λt ·e .
h! k!
Si ha quindi
Definizione 4.3 Si chiama processo di Poisson di parametro λ > 0 una famiglia (Nt )t≥0
di variabili aleatorie su uno spazio probabilizzato (Ω, F, P) tali che
1. per ogni ω ∈ Ω la traiettoria t → Nt (ω) è regolare,
4.1. PROCESSO DI POISSON 35
2. per ogni intero n ≥ 1 e ogni 0 < t1 < t2 < . . . < tn le variabili aleatorie Nt1 , Nt2 −
Nt1 , . . . , Ntn − Ntn−1 sono indipendenti e hanno legge di Poisson con parametri rispet-
tivamente λt1 , λ(t2 − t1 ), . . . , λ(tn − tn−1 ).
Proposizione 4.5 Per ogni s < t ed ogni intero n ≥ 1 la legge di Ns per la probabilità
condizionata P { · | Nt = n } è la legge binomiale B(n, s/t).
P { Ns = k | Nt = n } = P { Ns = k, Nt − Ns = n − k } /P { Nt = n }
= P { Ns = k } P { Nt − Ns = n − k } /P { Nt = n }
e−λs (λs)k e−λ(t−s) (λ(t − s))n−k n!
= · · −λt
k! (n − k)! e (λt)n
n s k s n−k
= 1− .
k t t
La Proposizione è cosı̀ dimostrata.
Proposizione 4.6 Siano (Nti )t≥0 (i = 1, 2) due processi di Poisson indipendenti con para-
metri λi . Il processo (Yt )t≥0 definito da Yt = Nt1 +Nt2 è un processo di Poisson con parametro
λ1 + λ 2 .
(n)
È chiaro che la variabile aletoria St ha legge B([nt], pn ) e quindi, dalla nota proprietà
(n)
asintotica della legge binomiale, segue che St converge in legge verso una variabile aleatoria
Nt con legge di Poisson con parametro λt. Inoltre è chiaro che le variabili aleatorie
[ns] [nt]
(n) (n) (n)
X X
Ss(n) = Rk , St − Ss(n) = Rk
k=1 k=[ns]+1
sono indipendenti per ogni n e per ogni t > s. Da questo fatto si può dedurre l’indipendenza
di Ns e Nt − Ns . Si può dimostrare l’indipendenza degli incrementi del processo (Nt )t≥0 in
modo simile.
36 4. PROCESSI PUNTUALI
Le Xn si potrebbero pensare come le durate di certi “pezzi” che vengono sostituiti non
appena si guastano. La variabile aleatoria Nt rappresenta quindi il numero di guasti
nell’intervallo temporale [0, t].
Il processo (Nt )t≥0 cosı̀ ottenuto è un processo di conteggio e si chiama senza esplosione
se Nt è quasi certamente finita.
Nel caso in cui le variabili aleatorie Xn siano anche indipendenti ed equidistribuite si
chiama processo di rinnovi.
La speranza di Nt , cioè il numero medio di rinnovi nell’intervallo [0, t], si esprime sem-
plicemente in termini della funzione di ripartizione F delle variabili aleatorie Xk e delle
funzioni di ripartizione F ∗n (del prodotto di convoluzione di n leggi con funzione di ripar-
tizione F ). Quest’ultima si definisce, per induzione, con la formula
Z Z
∗(k+1) ∗k
F (s) = F (s − r)F (dr) = F (s − r)F ∗k (dr)
]0,s] ]0,s]
indicando con F (dr) l’integrazione rispetto alla misura di probabilità su ]0, +∞[ associata
alla funzione non decrescente F .
Proposizione 4.7 Sia N = (Nt )t≥0 un processo di rinnovi e F la funzione di ripartizione
delle Xk . Se P{ Xk > 0 } = 1 allora speranza di Nt è finita ed è data da
∞
X
E [Nt ] = F ∗n (t)
n=1
Dimostrazione. Si ha infatti
X X
E[Nt ] = P { Nt ≥ n } = P { Tn ≤ t } .
n≥1 n≥1
et E e−X1
X
t
−X1 n
E[Nt ] ≤ eE e ≤ .
1 − E [e−X1 ]
n≥1
Corollario 4.8 Sia N = (Nt )t≥0 un processo di rinnovi e F la funzione di ripartizione delle
Xk . Se P{ Xk > 0 } = 1 allora il momento di ordine 2 di Nt è finito.
Dimostrazione. Osserviamo che
2
X
Nt2 = 1{ Tn ≤t }
n≥1
X
= 1{ Tn ≤t } 1{ Tm ≤t }
n,m≥1
XX X X X
= 1{ Tn ≤t, Tm ≤t } + 1{ Tn ≤t, Tm ≤t } + 1{ Tn ≤t }
n≥1 m<n m≥1 n<m n≥1
XX X
= 2 1{ Tn ≤t } + 1{ Tn ≤t }
n≥1 m<n n≥1
X
= (2n − 1)1{ Tn ≤t }
n≥1
n≥2
Un punto x ∈ R si dice punto d’incremento per una funzione di ripartizione F se, per
ogni ε > 0, si ha F (x + ε) − F (x − ε) > 0. Una funzione di ripartizione F si dice aritmetica se
esiste un h > 0 tale che i punti d’incremento di F siano tutti nell’insieme { 0, ±h, ±2h, . . . }
per ogni x ∈ R.
p
Dimostrazione. Indicando con mt la parte intera di t/µ + xσ t/µ3 abbiamo
( )
Nt − t/µ
P p > x = P { Nt > mt } = P { Tmt < t } .
σ t/µ3
dove l’ultima uguaglianza segue dalla simmetria della densità normale N (0, 1) e, inoltre
( )
Nt − t/µ Tmt − mt µ
lim inf P p >x ≥ lim P √ < −x − ε
t→∞ σ t/µ3 t→∞ σ mt
Z −x−ε
1 2
= √ e−y /2 dy
2π −∞
Z +∞
1 2
= √ e−y /2 dy
2π x+ε
L’affermazione segue allora dall’arbitrarietà di ε.
Calcoliamo ora la probabilità di qualche evento notevole legato al processo di rinnovi.
Supporremo, per semplicità, che la legge delle variabili aleatorie Xk abbia una densità f
cioè Z s
F (s) = f (r)dr
0
per ogni s ≥ 0 e indicheremo analogamente con f ∗k la densità di Tk .
Probabilità di assenza di guasti nell’intervallo [s, t + s] sapendo che si sono verificati k
guasti nell’intervallo [0, s]
R s ∗k R∞
0
f (x)dx t+s−x f (y)dy
P { Nt+s = k | Ns = k } =
F ∗k (s) − F ∗(k+1) (s)
R s ∗k
0
f (x)(1 − F (t + s − x))dx
=
F ∗k (s) − F ∗(k+1) (s)
Rs
F ∗k (s) − 0 f ∗k (x)F (t + s − x)dx
=
F ∗k (s) − F ∗(k+1) (s)
Tasso istantaneo di guasto al tempo s sapendo che si sono verificati k guasti nell’intervallo
[0, s] (moltiplicare la formula precedente per t−1 e far tendere t a 0)
R s ∗k
0
f (x)f (s − x)dx f ∗(k+1) (s)
∗k ∗(k+1)
= ∗k
F (s) − F (s) F (s) − F ∗(k+1) (s)
Osserviamo che il processo di Poisson con parametro λ ha tassi istantanei di guasto
constanti uguali a λ infatti, ricordando che f ∗k è la densità Γ(k, λ) possiamo calcolare
f ∗(k+1) (s) f ∗(k+1) (s)
= Rs
F ∗k (s) − F ∗(k+1) (s) 0
(1 − F (s − r))f ∗k (r)dr
λk+1 sk e−λs /k!
= Rs
0
e−λ(s−r) λk rk−1 e−λr dr/(k − 1)!
k
λs
= Rs =λ
0
krk−1 dr
Questa proprietà caratterizza il processo di Poisson tra i processi di rinnovo infatti vale
la seguente
40 4. PROCESSI PUNTUALI
f (s)
=λ
1 − F (s)
ovvero Z ∞
f (s) = λ f (r)dr.
s
La funzione f è pertanto derivabile e soddisfa la relazione f 0 (s) = −λf (s). Ne segue che
f (s) = ce−λs con c costante che deve essere uguale a λ perché f è una densità. La legge
delle variabili aleatorie Xk è quindi la legge esponenziale di parametro λ e il processo di
rinnovi in questione è un processo di Poisson.
Il processo di Poisson si caratterizza tra i processi di rinnovo anche per l’indipendenza
degli incrementi.
Teorema 4.13 Se processo di rinnovi (Nt )t≥0 ha incrementi indipendenti e, inoltre, la legge
dell’incremento Nt+s − Ns dipende solo da t, allora (Nt )t≥0 è un processo di Poisson.
Dimostrazione. Basterà evidentemente dimostrare che il tempo del primo salto T1 ha legge
esponenziale ovvero, essendo
ϕ(t) = P {Nt = 0}
= P Nt − N(n−1)t/n = 0, . . . , Nt /n = 0
= P Nt − N(n−1)t/n = 0 · · · P Nt/n = 0 = ϕ(t/n)n .
Posto c = − log ϕ(1) > 0, abbiamo allora ϕ(t) = e−ct per tutti i t razionali e quindi per tutti
i t reali grazie alla continuità da destra di ϕ.
sono rispettivamente il tempo necessario per vendere n unità e il numero di pezzi venduti
fino al tempo t.
Il costo di stoccaggio di una quantità S è quindi
Z ∞
c (S − Nt )+ dt.
0
Osservando che { Nt < h } = { Th > t } troviamo la seguente formula per il costo medio di
stoccaggio
Z ∞ S Z
X ∞
+
cE (S − Nt ) dt = c P{ Th > t } dt
0 h=1 0
S
X
= c E[Th ]
h=1
S
X
= c mh
h=1
= cmS(S + 1)/2.
Il costo totale di un lotto, ovvero la somma del costo di ordinazione e di stoccaggio, è quindi
cmS(S + 1)
K+
2
e il costo totale medio per unità di merce è
K cm(S + 1)
+ .
S 2
42 4. PROCESSI PUNTUALI
4.4 Esercizi
Esercizio 4.1 Sia (Nt )t≥0 un processo di Poisson con parametro λ > 0. Verificare che il
processo (Xt )t≥0 definito da Xt = Nαt , con α costante strettamente positiva, è un processo
di Poisson con parametro αλ. Il processo (Yt )t≥0 definito da Yt = cNαt , dove c è un’altra
costante strettamente positiva, è un processo di Poisson? Eventualmente, qual è il suo
parametro?
Esercizio 4.2 Sia (Nt )t≥0 un processo di Poisson con parametro λ > 0 e sia
ph,k (t) = P { Nt+s = k | Ns = h }
(verificare che ph,k (t) non dipende da s). Mostrare che per ogni t ≥ 0 e ogni h ≤ k si ha
p0hk (t) = −λph,k (t) + λph+1,k (t).
Esercizio 4.3 Sia (Nt )t≥0 un processo di rinnovi. Supponiamo che le variabili aleatorie Xk
abbiano legge uniforme su [0, θ]. Calcolare la speranza di Nt per t ≤ θ.
R. E[Nt ] = et/θ − 1
Esercizio 4.4 Sia (Nt )t≥0 un processo di rinnovi. Verificare che il tasso istantaneo della
probabilità di due o più guasti nell’intervallo [s, s + t] è nullo ovvero
1
lim P { Nt+s > k + 1 | Ns = k } = 0
t→0 t
Esercizio 4.5 Siano X1 , . . . , Xn variabili aleatorie reali indipendenti ed equidistribuite. Si
chiamano statistiche ordinate le variabili aleatorie X(1) , . . . , X(n) le variabili aleatorie cosı̀
definite ricorsivamente da X(1) (ω) = min{ Xj (ω) | 1 ≤ j ≤ n } e
X(k+1) (ω) = min Xj (ω) | 1 ≤ k ≤ n, Xj (ω) > X(k) (ω) .
Detta F la funzione di ripartizione delle Xk ed Fk la funzione di ripartizione di X(k) verificare
che
n
X n n−j
Fk (t) = F (t)j (1 − F (t)) .
j
j=k
Trovare inoltre la densità congiunta del vettore aleatorio (X(1) , . . . , X(n) ) nel caso in cui le
X1 , . . . , Xn siano uniformemente distribuite su [0, 1].
Esercizio 4.6 Verificare che, dato un processo di Poisson (Nt )t≥0 con tempi di salto (Tn )n≥1
si ha
\
n! Z t1 Z tn−1 Z tn
P { Tj ≤ tj } {Nt = n} = n
dx1 . . . dxn−1 dxn
t 0 xn−2 xn−1
1≤j≤n
ovvero che la legge congiunta di (T1 , . . . , Tn ) per la probabilità condizionata P { · | {Nt = n}}
coincide con la legge congiunta delle statistiche ordinate (X(1) , . . . , X(n) ) di un n-campione
(X1 , . . . , Xn ) della legge uniforme su [0, t].
4.4. ESERCIZI 43
Esercizio 4.7 Sia (Nt )t≥0 un processo di Poisson con parametro λ > 0 e sia X = (Xt )t≥0
il processo definito da
Xt = (−1)Nt .
Verificare che X è un processo a valori +1, −1 e calcolare le probabilità di transizione
P { Xt+s = j | Xs = i }
per i, j ∈ {−1, 1}. Calcolare il tempo medio trascorso da X nel valore 1 ovvero
Z ∞
E 1{Xs =1} ds .
0
Verificare che, considerando la trasformata di Laplace, l’equazione dei rinnovi si esprime nel
modo seguente
M
c(λ) = Fb(λ) + M
c(λ)Fb(λ)
Sia (Ω, F, P) uno spazio probabilizzato ed S un insieme finito o numerabile che sarà consid-
erato come spazio misurabile munito della σ algebra P(S) di tutti i sottoinsiemi di S.
Definizione 5.1 Una famiglia (Xt )t≥0 di variabili aleatorie su (Ω, F, P) a valori in S si
chiama catena di Markov se
P Xtn+1 = j | Xtn = in , . . . , Xt1 = i1 = P Xtn+1 = j | Xtn = in (5.1)
La catena di Markov si chiama omogenea se pij (s, t+s) = pij (0, t) per ogni i, j ∈ S, t, s ≥ 0.
D’ora in avanti tratteremo catene di Markov omogenee e denoteremo con pij (t) le prob-
abilità di transizione pij (0, t). La famiglia (Pt )t≥0 delle matrici (eventualmente infinite)
si chiama semigruppo Markoviano. Denotiamo con 1l la matrice (δij )i,j∈S con δij = 1 se
i = j, δij = 0 se i 6= j.
Teorema 5.3 Il semigruppo Markoviano (Pt )t≥0 gode delle seguenti proprietà:
(a) P0 = 1l,
45
46 5. CATENE DI MARKOV A TEMPO CONTINUO
Infine, grazie alla formula della probabilità totale ed alla proprietà di Markov (5.1), per
ogni t, s ≥ 0, si ha
pij (t + s) = P { Xt+s = j | X0 = i }
X
= P { Xt+s = j, Xs = k | X0 = i }
k∈S
X P { Xt+s = j, Xs = k, X0 = i }
=
P { X0 = i }
k∈S
X P { Xt+s = j | Xs = k, X0 = i } P { Xs = k, X0 = i }
=
P { X0 = i }
k∈S
X P { Xs = k, X0 = i }
= P { Xt+s = j | Xs = k }
P { X0 = i }
k∈S
X
= P { Xt+s = j | Xs = k } P { Xs = k | X0 = i }
k∈S
X
= pik (s)pkj (t).
k∈S
Proposizione 5.4 Se la catena di Markov (Xt )t≥0 è continua in probabilità allora le fun-
zioni t → pij (t) sono continue.
Esempio 5.1 Catena di Markov a due stati. La matrice dei tassi di una catena a due stati
a tempo continuo ha la forma
−a a
Q=
b −b
con a, b > 0 (salvo casi banali). Le probabilità di transizione sono quindi date da
pi1 (t) tQ δi1
=e
pi2 (t) δi2
Teorema 5.6 Se −∞ < qii < 0 allora la variabile aleatoria Ti ha legge esponenziale con
parametro −qii .
La variabile aleatoria Ti ha dunque la proprietà detta assenza di memoria. Inoltre, per ogni
n ≥ 1, vale la relazione
{ Ti > t } ⊆ Xt/2n = i, . . . , X(2n −1)t/2n = i, Xt = i
e, più precisamente,
\
{ Ti > t } = Xt/2n = i, . . . , X(2n −1)t/2n = i, Xt = i
n≥1
Dimostrazione. Consideriamo la successione non crescente (Sn )n≥1 di tempi d’arresto dis-
creti
∞
X
Sn = (k + 1)2−n 1{k2−n <Ti ≤(k+1)2−n }
k=0
che converge quasi certamente verso Ti . Grazie alla continuità da destra delle traiettorie la
successione di variabili aleatorie (XSn )n≥1 converge quasi certamente verso XTi e quindi
Dato che i 6= j, risulta pij (2−n ) = qij 2−n + oij (2−n ) e quindi
∞
X
−n
P Ti > k2−n
P { X Sn = j } = (1 + oij (1))2 qij
k=0
X∞
= (1 + oij (1))2−n qij P { 2n T i > k }
k=0
−n qij
= (1 + oij (1))2 qij E[2n Tj ] = (1 + oij (1)) .
−qii
Dimostrazione. Consideriamo dapprima, per semplicità, il caso in cui l’insieme degli stati S
è finito (in questo caso l’ipotesi del teorema è banalmente verificata ...). Detta Q la matrice
dei tassi di transizione (qij )i,j∈S , per ogni t ≥ 0 indichiamo con etQ l’esponenziale della
matrice tQ. Con facili calcoli si vede subito che
d tQ
e = QetQ = etQ Q
dt
ovvero, gli elementi di matrice (etQ )ij soddisfano (5.4) e (5.3). La soluzione dei sistemi
lineari (5.4) e (5.3) è evidentemente unica.
Nel caso in cui l’insieme degli stati S è infinito numerabile basta definire l’operatore
lineare Q sullo spazio di Banach `∞ (S) delle funzioni limitate su S con la norma
|f |∞ = sup |f (j)|.
j∈S
Grazie all’ipotesi supi∈S (−qii ) < +∞, l’operatore Q è limitato e la sua norma è
= −2qjj |f |∞ .
poiché la serie converge nella norma uniforme degli operatori lineari su `∞ (S). La di-
mostrazione di completa quindi come nel caso in cui S è finito.
Osserviamo che, grazie alla differenziabilità delle probabilità di transizione pij (t), e
all’omogeneità della catena di Markov, la probabilità di passare da uno stato i a uno stato
j in un intervallo [t, t + h] “piccolo” è
pij (h) = qij h + o(h) se i 6= j,
P { Xt+h = j | Xt = i } =
pii (h) = 1 + qii h + o(h) se i = j,
(o(h) è un infinitesimo di ordine superiore ad h cioè una funzione tale che limh→0 o(h)/h = 0).
Spesso la catena di Markov è individuata a partire dai tassi qij .
Esempio 5.2 Processi di nascita. Si tratta delle catene di Markov con insieme degli stati
N che rappresenta il numero di individui in una popolazione. Questo numero può solo
aumentare a tempi aleatori per l’arrivo di nuovi individui. I tassi di transizione sono dati
da una successione (λn )n≥0 di numeri reali positivi; grazie al Teorema 5.6, λn è l’inverso del
tempo medio di attesa della transizione da n a n + 1. Il generatore del processo è la matrice
Q = (qij )i,j∈N con
Nel caso particolare in cui i tassi di nascita sono costanti λn = λ > 0 ritroviamo un processo
di Poisson.
51
Un altro caso notevole è quello in cui tutti gli individui si riproducono con la stessa
intesità e quindi λn = λn. La catena di Markov con cosı̀ ottenuta si chiama processo di
Yule. Se la popolazione al tempo 0 è costituita da i (i ≥ 1) individui, risolvendo per
induzione le equazioni di Kolmogorov all’avanti con la condizione iniziale pii (0) = 1
0
pii (t) = −λi pii (t),
p0ik (t) = −λk pik (t) + λ(k − 1)pi k−1 (t) se k > i
Il numero di individui al tempo t è quindi una variabile aleatoria con legge di Pascal con
parametri i ed e−λt .
Analogamente, con λn = λ(n + 1), si trova
k k−i
pik (t) = e−λ(i+1)t 1 − e−λt .
i
Esempio 5.3 Processi di morte. Come nell’Esempio (5.2) l’insieme degli stati N rappre-
senta il numero di individui di una popolazione che però, questa volta, può solo diminuire
di una unità di volta in volta finché arriva a 0. Il generatore infinitesimale del processo è
una matrice Q = (qij )i,j∈N con
Dato che il processo, una volta arrivato in 0, vi si ferma per sempre, si ha evidentemente
p00 (t) = 1 ovvero µ0 = 0. Inoltre è chiaro che, se j > i, allora pij (t) = 0 per ogni t ≥ 0. Le
equazioni di Kolmogorov all’indietro per le altre pij (t) con j ≤ i e t > 0 si scrivono
0
pii (t) = −µi pii (t),
p0ij (t) = −µi pij (t) + µi pi−1 j (t) se j < i
Risolvendo per induzione, a partire da pii (t) = e−µi t , si trova la probabilità pij (t) che la
popolazione al tempo t sia costituita da j individui (con j < i).
Nel caso particolare in cui µi = µi (tassi lineari) si trova
i i−j i i−j
pij (t) = e−µit eµt − 1 = e−µjt 1 − e−µt .
j j
Esempio 5.4 Processi di nascita e morte. L’insieme degli stati è sempre N ma il numero
di individui della popolazione può aumentare oppure diminuire di una unità. Dette (λn )n≥0
e (µn )n≥1 le successioni dei tassi di nascita e morte, il generatore del processo è la matrice
A = (qij )i,j∈N con
Lo stato di questo processo potrebbe anche indicare la lunghezza di una coda casuale in
cui i tempi di servizio dei clienti e i tempi di attesa tra gli arrivi di due clienti hanno legge
esponenziale (con opportuni parametri).
52 5. CATENE DI MARKOV A TEMPO CONTINUO
Definizione 5.10 Una catena di Markov (Xt )t≥0 con insieme degli stati S e probabilità di
transizione pij (·) si chiama irriducibile se, per ogni i, j ∈ S, esiste un tempo t > 0 tali che
pij (t) > 0.
Come nel caso in cui i tempi siano discreti, quindi, una catena di Markov è irriducibile
se, partendo da ogni stato i abbiamo probabilità positiva di arrivare in uno stato j in un
tempo t > 0.
Poiché spesso la catena di Markov a tempo continuo è definita per mezzo della matrice
Q dei tassi di transizione, vediamo ora come si esprime l’irriducibilità in termini dei qij .
Proposizione 5.11 Sia (Pt )t≥0 il semigruppo di transizione di una catena di Markov e sia
Q = (qij )i,j∈S il suo generatore. Supponiamo che, per ogni i, j ∈ S, esista un intero n ≥ 1
e stati k1 , . . . , kn tali che i 6= k1 , k1 6= k2 , . . . , kn 6= j e
Si ha quindi
pij (t) ≥ pik1 (t1 )pk1 k2 (t2 − t1 ) . . . pkn−1 kn (tn − tn−1 )pkn j (t − tn ) > 0
Definizione 5.12 Una legge di probabilità π = (πi )i∈S su S è detta invariante per una
catena di Markov (Xt )t≥0 con probabilità di transizione pij (·)) se
X
πi = πk pki (t) (5.7)
k∈S
per ogni i ∈ S e t ≥ 0.
Le leggi invarianti si determinano per mezzo del generatore A = (qij )i,j∈S del processo.
Proposizione 5.13 Supponiamo che qii > −∞ per ogni i ∈ S e che le (pij (t))i,j∈S siano
l’unica soluzione delle equazioni di Kolmogorov all’avanti e all’indietro. Una legge di prob-
abilità π = (πi )i∈S su S è invariante se e solo se
X
πk qkj = 0, per ogni j ∈ S.
k∈S
si trova subito
d X X X
0= πk pkj (t) = πk p0kj (0) = πk qkj .
dt
k∈S t=0 k∈S k∈S
53
Lo scambio di derivata e sommatoria, che è ovviamente lecito nel caso in cui S sia finito, si
giustifica con il teorema della convergenza dominata. Per ogni t > 0 si ha infatti
X pki (t) 1 − pii (t)
=
t t
k6=i
e quindi, dato che il membro destro converge a −qii per t tendente a 0, ne segue che esistono
t0 > 0 e M0 > 0 tali che
X pki (t)
< M0
t
k6=i
per ogni t ∈ [0, t0 ]. In particolare 0 ≤ t−1 pki (t) < M0 per ogni t ∈ [0, t0 ]. Poiché k6=i πk ≤ 1
P
lo scambio di derivata e sommatoria è cosı̀ giustificato.
Viceversa se vale la condizione (5.7) allora derivando (lo scambio di derivata e sommatoria
si gistifica come prima in un intervallo [0, t0 ])
d X X
πk pkj (t) = πk p0kj (t)
dt
k∈S k∈S
X
= πk qki p0ij (t)
k,i∈S
!
X X
= πk qki p0ij (t) = 0
i∈S k∈S
P
Ne segue che la funzione k∈S πk pkj (t) è costante e uguale al suo valore in 0, cioè πj e
quindi (πi )i∈S è una legge invariante.
Esempio 5.5 Processi di nascita e morte: legge invariante Un processo di nascita e morte
con tassi di transizione (λn )n≥0 e (µn )n≥1 ha legge invariante se e solo se si può trovare una
soluzione π = (πi )i∈S delle equazioni
π0 = −π0 λ0 + π1 µ1 ,
πn = πn−1 λn−1 − πn (λn + µn ) + πn+1 µn+1 , n ≥ 1,
Si verifica facilmente per induzione che, se le µn sono tutte strettamente positive, allora
λ0 λ1 · · · λn−1
z0 = 1, zn = n≥1
µ1 µ2 · · · µn
è l’unica soluzione del sistema precedente.
La successione (zn )n≥1 è evidentemente non negativa. Se risulta
X λ0 λ1 · · · λn−1
Z := 1 + <∞
µ1 µ2 · · · µn
n≥1
allora, posto πn = Z −1 zn , la successione (πn )n≥0 è l’unica legge invariante del processo di
nascita e morte.
Se la serie non converge allora il processo non ha legge invariante.
54 5. CATENE DI MARKOV A TEMPO CONTINUO
Teorema 5.14 Le probabilità di transizione pij (·) di una catena di Markov irriducibile sod-
disfano
1. limt→∞ pij (t) = πj se la catena di Markov ammette una legge invariante (πi )i∈S ,
2. limt→∞ pij (t) = 0 se la catena di Markov non ammette nessuna legge invariante.
In particolare, se la catena di Markov irriducibile ammette una legge invariante, allora questa
è unica.
Nel caso in cui l’insieme degli stati sia finito si può sempre trovare una legge invariante.
Teorema 5.15 Se l’insieme degli stati S è finito allora esiste almeno una legge di probabilità
su S invariante per la catena di Markov.
1 tn
Z
= lim νPs+t ds
n→∞ tn 0
1 tn +t
Z
= lim νPs ds.
n→∞ tn t
Scrivendo
Z tn +t Z tn Z tn +t Z t
1 1 1 1
νPs ds = νPs ds + νPs ds − νPs ds
tn t tn 0 tn tn tn 0
5.1. ESERCIZI 55
Troviamo quindi
Z tn +t Z tn
1 1
νPt = lim νPs ds = lim νPs ds = π
n→∞ tn t n→∞ tn 0
e quindi
Z t Z t
t−1 (νPs )i ds = Eν t−1 1{ Xs =i } ds .
0 0
5.1 Esercizi
Esercizio 5.1 Un materiale radioattivo è costituito da n atomi ciascuno dei quali decade
(cioè si trasforma in uno non radioattivo) in un tempo aleatorio con legge esponenziale
con parametro µ. Calcolare quanto tempo deve passare affinché il numero medio di atomi
radioattivi diventi minore di n/2 (tempo di dimezzamento).
Esercizio 5.2 Sia (Xt )t≥0 una catena di Markov con insieme dei tempi [0, +∞[, stati
{ 1, 2, 3 } e matrice dei tassi di transizione
−a a 0
0 −b b
0 0 0
Esercizio 5.3 Siano (Nt )t≥0 ed (Mt )t≥0 due processi di Poisson indipendenti con parametri
rispettivi λ e µ strettamente positivi. Verificare che il processo (Xt )t≥0 definito Xt =
+
(Nt − Mt ) è una catena di Markov con insieme dei tempi [0, +∞[, stati N = { 0, 1, 2, . . . }
e matrice dei tassi di transizione
−λ λ 0 ...
µ −(λ + µ) λ ... .
0 µ −(λ + µ) . . .
6
Moto browniano
Definizione 6.1 Un processo stocastico B = (Bt )t≥0 si chiama moto browniano, con pa-
rametro σ 2 > 0, se è adattato alla filtrazione data, B0 = 0 e, per ogni t > s, la variabile
aleatoria Bt − Bs è indipendente da Fs e ha leggi normale N (0, σ 2 (t − s)).
La filtrazione data (Ft )t≥0 è parte integrante della definizione di moto browniano. Tut-
tavia, nel caso in cui siano date le variabili aleatorie (Bt )t≥0 senza la filtrazione, diremo che
B è un moto browniano se lo è rispetto alla sua filtrazione naturale (FtB )t≥0 data da
FtB = σ { Bs | s ≤ t }
Proposizione 6.3 Sia (Bt )t≥0 un moto browniano con parametro σ 2 su uno spazio prob-
abilizzato (Ω, F, P) munito di una filtrazione (Ft )t≥0 . Il processo X = (Xt )t≥0 definito
da
1. Xt = cBt (c ∈ R) è un moto browniano con parametro c2 σ 2 ,
2. Xt = Bαt (α > 0) è un moto browniano con parametro ασ 2 rispetto alla filtrazione
(Ftα )t≥0 con Ftα = Fαt .
57
58 6. MOTO BROWNIANO
converge in legge verso una variabile aleatoria (Ws , Wt − Ws ) normale bidimensionale con
media 0 e matrice di covarianza diagonale diag(s, t − s) ovvero Ws e Wt − Ws sono indipen-
denti e hanno leggi normali N (0, s), N (0, t − s). L’analoga proprietà vale per una n-pla di
incrementi.
Un’approssimazione simile si può ottenere considerando un’arbitraria successione (Zn )n≥1
di variabili aleatorie indipendenti, equidistribuite con media 0 e varianza σ 2 (non nulla e
finita) definendo
P[nt]
(n) Zk
Wt = k=1 √ .
σ n
In particolare, quando le Zn prendono solo i valori +1 e −1 con probabilità 1/2, si può
approssimare il moto browniano (Wt )t≥0 con una successione di passeggiate casuali simme-
triche riscalate.
Applicando il Teorema 3.10 si dimostra subito la proposizione seguente
Teorema 6.4 Un moto browniano (Bt )t≥0 ha una modificazione con tutte le traiettorie
1/2 − ε hölderiane per ogni ε > 0.
(si potrebbe calcolare M2n = (2n)!/2n n! ma il valore esatto qui non serve). Ne segue che
Un’idea (grossolana) del comportamento del moto browniano per tempi grandi è data
dall’osservazione seguente. Per ogni c, t > 0 e ogni funzione ϕ :]0, +∞[→]0, +∞[ si ha
n √ o 2
Z +∞
2 2
P |Bt | > cϕ(t) t = √ e−x /2σ dx.
2πσ cϕ(t)
In particolare,
√ se ϕ diverge a +∞ (anche molto lentamente), la probabilità di osservare
valori di Bt / t fuori dall’intervallo [−cϕ(t), +cϕ(t)] tende a 0 per t tendente a +∞.
Il calcolo è abbastanza facile nel caso in cui A è un intervallo ] − a, b[ (a, b > 0). Si ha infatti
Z ∞ Z ∞ Z b
1 2
P{ Bt ∈] − a, b[ }dt = dt √ e−x /2t
dx
0 0 2πt −a
b ∞ 2
e−x /2t
Z Z
= dx dt √ = +∞.
−a 0 2πt
Il moto browniano trascorre quindi un tempo (medio) infinito in ogni intervallo ] − a, b[.
Il principio di riflessione afferma che, per ogni a > 0, ad ogni traiettoria s → Bs (ω) tale
che Mt (ω) ≥ a, ne è associata un’altra s → Bs (ω 0 ), il cui grafico è il simmetrico (o il riflesso
speculare) del primo rispetto alla funzione costante uguale ad a a partire dal primo istante
in cui la traiettoria ω raggiunge a. Per motivi di simmetria si avrà
{ T a < t } = { Mt > a }
si trova subito Z ∞
2 2
P { Ta < t } = √ e−x /2t
dx.
2πt a
Si verifica quindi la seguente
Dimostrazione. Per dimostrare che è quasi certamente finita basta osservare che
Definizione 6.8 Si chiama processo di Bessel con parametro d il processo (Xt )t≥0 definito
da 2 2 1/2
(1) (d)
Xt = kBt k = Bt + · · · + Bt .
2Γ((d + 1)/2)2
V [Xt ] = t d − .
Γ(d/2)2
√
Ricordando che Γ(1) = 1, Γ(1/2) = π e che Γ(α + 1) = αΓ(α) si trova subito
62 6. MOTO BROWNIANO
d Γ((d + 1)/2)/Γ(d/2) q t]
E[X V [Xt ]
√ 2t 2
1 1/ π π t 1− π
√ q
π πt π
2 2 2 t 2− 2
q
√2 2 2t 8
3 π t 3− π
√π √
3 π 3 9π
4 4 4 2πt t 4− 8
Si verifica facilmente che questa definizione non dipende dalla particolare successione scelta
per approssimare g (ogni altra successione con le proprietà (6.3) darebbe lo stesso limite).
Poniamo inoltre, per ogni intervallo ]s, t]
Z t Z t Z s
g(r)dBr = g(r)dBr − g(r)dBr .
s 0 0
Teorema 6.10 Sia (Bt )t≥0 un moto browniano. Per ogni g, h ∈ L2 [0, t] e ogni 0 ≤ a < b ≤
t, 0 ≤ c < d ≤ t si ha
"Z #
b
E g(s)dBs = 0,
a
"Z #
b Z d Z
2
E g(s)dBs h(s)dBs = σ g(s)h(s)ds.
a c [a,b]∩[c,d]
Se la variabile aleatoria X0 ha legge N (0, σ 2 /(2b)) allora le variabili Xt1 , Xt2 , . . . , Xtn (per
ogni 0 < t1 < t2 < . . . < tn ) hanno legge congiunta gaussiana.
Osserviamo che X0 = a e Xt = b.
s bs
E[Xs ]= a 1− +
t t
Z r∧s
du rs
Cov[Xr Xs ] = (t − r)(t − s) 2
= (r ∧ s) − .
0 (t − u) t
Nei due casi precedenti abbiamo affermato che i processi ottenuti per mezzo dell’integrale
stocastico rispetto al moto browniano sono processi gaussiani ovvero tutte le variabili Xt1 , Xt2 ,
. . . , Xtn (0 < t1 < t2 < . . . < tn ) hanno legge congiunta gaussiana. Questo fatto segue dalla
proposizione seguente
Proposizione 6.13 Per ogni g ∈ L2 [0, t] le variabili aleatorie Xt1 , Xt2 , . . . , Xtn ( n ∈ N,
0 < t1 < t2 < . . . < tn ) hanno legge congiunta gaussiana con medie nulle e matrice di
covarianza (C`m )1≤`,m≤n data da
Z t` ∧tm
C`m = |g(r)|2 dr.
0
Dimostrazione. Osserviamo innanzitutto che, nel caso in cui g sia una funzione costante a
tratti, la conclusione segue subito dalla definizione (6.1). Nel caso in cui g sia una funzione
qualunque in L2 [0, t], consideriamo una successione (gk )k≥1 di funzioni costanti a tratti
con le proprietà (6.3). Detta (X (k) )k≥1 la successione di processi corrispondenti e posto
u = (u1 , . . . , un ) si ha
h
(k) (k)
i 1
E exp i u1 Xt1 + . . . + un Xtn = exp − hu, C (k) ui
2
Definizione 6.14 Si chiama moto browniano geometrico il processo (Xt )t≥0 definito da
Osserviamo che si tratta di un processo a valori positivi le cui traiettorie hanno le stesse
proprietà di quelle del moto browniano. Abbiamo inoltre
E[Xt ] = et/2
V [Xt ] = et et − 1
6.8 Esercizi
Esercizio 6.1 Sia (Bt )t≥0 un moto browniano con parametro σ 2 . Verificare che
(2n)!
E |Bt − Bs |2n = n σ 2n |t − s|n .
2 n!
Esercizio 6.2 Sia (Bt )t≥0 un moto browniano standard. Mostrare che, per ogni t > s > 0,
le variabili aleatorie
1. Bt2 − Bs2 e Bs2 ,
2. exp(Bt ) − exp(Bs ) e exp(Bs )
non sono indipendenti.
Esercizio 6.3 Sia (Bt )t≥0 un moto browniano standard. Si consideri il processo X =
(Xt )t≥0 definito da Xt = tB1/t per t > 0 e X0 = 0. Mostrare che, per ogni t > s,
l’incremento Xt − Xs ha legge normale N (0, (t − s)). Verificare che il processo (Xt )t≥0 (con
X0 = 0) è un moto browniano.
R. Legge dell’incremento Xt − Xs
E exp iu(tB1/t − sB1/s ) = E exp iu(t − s)B1/t − ius(B1/s − B1/t )
= E exp iu(t − s)B1/t · E exp −ius(B1/s − B1/t )
2
u (t − s)2 1
2 2
u s 1 1
= exp − · exp − −
2 t 2 s t
2
u (t − s)
= exp − .
2
Esercizio 6.4 Verificare che le quasi tutte le traiettorie di un moto browniano standard
non sono funzioni derivabili e non hanno variazione limitata su ogni intervallo.
Esercizio 6.5 Sia (Bt )t≥0 un moto browniano standard. Verificare che le variabili aleatorie
Z π Z π
X= cos(t)dBt , Y = sin(t)dBt
0 0
sono indipendenti.
66 6. MOTO BROWNIANO
Esercizio 6.6 Sia (Bt )t≥0 un moto browniano standard e sia (Xt )t≥0 il processo definito
da
Xt = Bt + bt.
Determinare la legge del tempo Ta del primo attraversamento del livello a (a > 0).
Esercizio 6.7 Sia (Xt )t≥0 un processo con tutte le traiettorie continue. Verificare che, per
ogni t > 0, e ogni insieme D contenuto in [0, t] numerabile denso si ha
σ(Bs | 0 ≤ s ≤ t) = σ(Br | r ∈ D)
7
Speranza condizionale
Definizione 7.1 Sia X una variabile aleatoria reale integrabile. Si chiama versione della
speranza condizionale di X rispetto alla σ-algebra G ogni variabile aleatoria reale integrabile
V , misurabile rispetto alla σ-algebra G tale che
Z Z
XdP = V dP (7.1)
G G
E [1G V ] = E [1G V 0 ]
Esempio 7.1 Nel caso particolare in cui G = F si può prendere V = X mentre, nel caso
particolare in cui F = {∅, Ω}, poiché ogni variabile aleatoria G-misurabile è quasi certamente
costante, basterà prendere V = E[X].
Esempio 7.2 Siano X, Y due variabili aleatorie reali indipendenti con X integrabile e sia G
la σ-algebra σ(Y ) generata da Y . Si ha allora E[X|σ(Y )] = E[X]. In questo caso la speranza
condizionale di X rispetto a Y si denota anche con E[X|Y ].
Esempio 7.3 Siano X1 , . . . , Xn variabili aleatorie indipendenti con legge di Bernoulli B(1, p)
e sia Sn = X1 + . . . + Xn . Partendo dal calcolo della probabilità condizionata
k
P { X ` = 1 | Sn = k } =
n
per ogni ` ∈ {1, . . . , n} si trova
Sn
E[X` |Sn ] = .
n
67
68 7. SPERANZA CONDIZIONALE
Proposizione 7.4 Sia (Xn )n≥1 una catena di Markov con insieme degli stati E e matrice
di transizione T . Per ogni funzione f : E → R limitata si ha
E [ f (Xn+1 ) | σ{Xn , . . . , X0 } ] = (T f )(Xn ).
7.2. PROPRIETÀ DI MONOTONIA E PROIETTIVITÀ 69
= (aX + bY ) dP.
G
per ogni funzione f semplice. Con un tipico procedimento di teoria dell’integrazione la for-
mula precedente si estende alle funzioni f positive e poi a quelle tali che f (X) sia integrabile.
Se X è integrabile, basterà per trovare la (7.2).
70 7. SPERANZA CONDIZIONALE
Proposizione 7.8 Sia X una variabile aleatoria reale integrabile e ϕ : R → R una funzione
convessa. Supponiamo che anche la variabile aleatoria ϕ(X) sia integrabile. Si ha allora
ϕ(E[X|G]) ≤ E[ϕ(X)|G]
Proposizione 7.10 Sia X una variabile aleatoria e V una variabile aleatoria G-misurabile.
Supponiamo che E[|X|p ] < ∞ e che E[|V |q ] < ∞ con p, q numeri reali maggiori di 1 tali che
1/p + 1/q = 1. Si ha allora
E[ V X | G ] = V E[ X | G ]
E[ Vn X | G ] = Vn E[ X | G ]
In particolare
E |X − Z|2 = E |X − E[ X | G ]|2 .
min
2
Z∈L (Ω,G,P)
Dimostrazione. Scriviamo
h i
2
E |X − Z|2 = E ((X − E[ X | G ]) − (E[ X | G ] − Z))
+ 2E [ (X − E[ X | G ])(E[ X | G ] − Z)] .
Utilizzando le proprietà della speranza condizionale si verifica che l’ultimo termine della
somma precedente è nullo.
7.5. SPERANZA CONDIZIONALE RISPETTO A σ(V1 , . . . , VN ) 71
1{ V ∈B } = 1B (V )
quindi g = 1B . Dunque, per linearità, l’affermazione è vera per le combinazioni lineari finite
di funzioni indicatrici di insiemi di G, ovvero per le variabili aleatorie G-semplici.
Ricordiamo che ogni variabile aleatoria X, G-misurabile, non-negativa è limite puntuale
di una successione non decrescente (Xn )n≥1 di variabili aleatorie G-semplici. Per ogni n pos-
siamo trovare come sopra una funzione gn : Rn → R boreliana semplice tale che Xn = gn (V ).
In più la successione (gn )n≥1 è non decrescente e limitata superiormente da supω∈Ω |X(ω)|.
Quindi ponendo g = supn≥1 gn , troviamo X = g(V ).
Infine, decomponendo X nella sua parte positiva X + e negativa X − , abbiamo X + =
g + (V ) e X − = g − (V ), con g + , g − boreliane limitate, quindi, posto g = g + − g − abbiamo
X = g(V ).
Come conseguenta immediata abbiamo il
E[ X | σ(V1 , . . . , Vn ) ] = g(V1 , . . . , Vn ).
7.6 Esercizi
Esercizio 7.1 Sia X una variabile aleatoria integrabile e G la σ-algebra generata da una
variabile aleatoria della forma X
Z= an 1An
n≥1
dove (An )n≥1 è una partizione di Ω fatta con elementi di F e (an )n≥1 è una successione di
numeri reali distinti. Verificare che
R
X A XdP
E[ X | G ] = n
1An .
P(An )
n≥1
72 7. SPERANZA CONDIZIONALE
Esercizio 7.2 Siano X1 , X2 due variabili aleatorie reali con densità gaussiana bidimension-
ale N (m, Γ) dove m = (m1 , m2 ) è il vettore delle medie e Γ è la matrice di covarianza.
Mostrare che
Γ12
E [ X2 | σ(X1 ) ] = m2 + (X1 − m1 )
Γ11
Esercizio 7.3 Sia (Xn )n≥1 una successione di variabili aleatorie integrabili convergente in
L1 (Ω, F, P) verso una variabile aleatoria integrabile X cioè tale che
Martingale
Le martingale sono una classe di processi stocastici nella quale la dipendenza tra le variabili
aleatorie del processo si esprime in un modo speciale, la cosiddetta proprietà di martingala.
Questa proprietà costituisce una relazione di dipendenza che si può verificare in numerose
situazioni ed è diventata uno strumento fondamentale nella teoria e nelle applicazioni. In
questo capitolo studieremo le proprietà principali delle martingale e mostreremo qualche
applicazione.
Sia (Ω, F, P) uno spazio probabilizzato munito di una filtrazione (Ft )t∈I .
Definizione 8.1 Un processo (Mt )t∈I è una martingala se è adattato, la variabile aleatoria
Mt è integrabile per ogni t ∈ I e
E [ Mt | Fs ] = Ms , per ogni s ≤ t.
Esempio 8.1 Sia (Nt )t≥0 un processo di Poisson con parametro λ ed (Ft )t≥0 la sua fil-
trazione naturale. Il processo (Mt )t≥0 definito da
Mt = Nt − λt
è una martingala.
Esempio 8.2 Sia B = (Bt )t≥0 un moto browniano standard. È chiaro che B è una mar-
tingala come pure il processo (Xt )t≥0 definito da
Xt = Bt2 − t.
Esempio 8.3 Sia I = N e (Xn )n≥0 una catena di Markov con insieme degli stati uguale a
un insieme numerabile E e matrice di transizione T = (Tjk )jk∈E . Supponiamo che λ ∈]0, 1]
sia un autovalore della matrice T con autovettore una funzione f : E → R limitata ovvero
X
(T f )(j) = Tjk f (k), per ogni j ∈ E. (8.1)
k∈E
73
74 8. MARTINGALE
Grazie alla proprietà di Markov, per ogni n ≥ 0 e ogni funzione g : E n+1 → R (dove
E n+1 denota il prodotto di n + 1 copie dell’insieme E), si ha
E [Mn+1 g(Xn , . . . , X0 )]
X
= λ−(n+1) f (jn+1 )g(jn , jn−1 , . . . , j0 )P{Xn+1 = jn+1 , Xn = jn , . . . , X0 = j0 }
jn+1 ,jn ,...,j0
X
= λ−(n+1) f (jn+1 )g(jn , jn−1 , . . . , j0 )
jn+1 ,jn ,...,j0
Definizione 8.2 Sia (Ω, F, P) uno spazio probabilizzato munito di una filtrazione (Ft )t∈I e
Z una varibile aleatoria reale estesa integrabile. Si chiama martingala chiusa dalla varia-
bile aleatoria Z un processo stocastico (Mt )t∈I tale che Mt sia una versione della speranza
condizionale di Z rispetto alla σ-algebra Ft per ogni t ∈ I.
Esempio 8.5 (Rapporti di verosimiglianza) Sia (Yn )n≥0 una successione di variabili aleato-
rie reali indipendenti identicamente distribuite e siano f0 ed f1 due densità di probabilità.
Supponiamo, per semplicità, che la funzione f0 sia strettamente positiva. La successione dei
rapporti di verosimiglianza
costituisce un processo stocastico di grande importanza nei metodi sequenziali per i test di
ipotesi statistiche.
Si verifica facilmente che, se le variabile aleatorie f1 (Yn )/f0 (Yn ) sono integrabili, allora
f1 (Yn+1 )
E [ Xn+1 | σ{Y0 , . . . , Yn } ] = Xn E .
f0 (Yn+1 )
Osserviamo che (Xt )t∈I è una supermartingala se e solo se il processo (−Xt )t∈I è una
sottomartingala.
Esempio 8.6 Sia (Nt )t≥0 un processo di Poisson di parametro λ > 0. Si verifica facilmente
che il processo (Nt − ct)t≥0 (rispetto alla sua filtrazione naturale) è una sottomartingala se
c < λ e una supermartingala se c > λ.
Teorema 8.4 Siano X = (Xt )t∈I e Y = (Yt )t∈I due sottomartingale. Il processo Z =
(Zt )t∈I definito da
Zt (ω) = max{Xt (ω), Yt (ω)}
è una sottomartingala.
76 8. MARTINGALE
Ne segue che E[ Zt | Fs ] ≥ Zs .
Analogamante il minimo tra supermartingale è una supermartingala
Corollario 8.5 Se X = (Xt )t∈I è una martingala allora i processi
X + = (Xt+ )t≥0 , X − = (Xt− )t≥0 , |X| = (|Xt |)t≥0 ,
sono sottomartingale.
Dimostrazione. Basta osservare che: X + è il massimo tra X e la martingala nulla, X − è
l’opposto del minimo tra X e la martingala nulla, |X| è la somma di X + e X − .
Teorema 8.6 Sia X = (Xt )t∈I una martingala e ϕ : R → R una funzione convessa.
Supponiamo che, per ogni t ∈ I, la variabile aleatoria ϕ(Xt ) sia integrabile. Allora il processo
ϕ(X) = (ϕ(Xt ))t≥0 è una sottomartingala.
Dimostrazione. Basta ricordare la diseguaglianza di Jensen per la speranza condizionale.
Corollario 8.7 Sia X = (Xt )t∈I una martingala. Se le variabili aleatorie Xt hanno
quadrato integrabile allora il processo (Xt2 )t∈I è una sottomartingala.
Dimostrazione. Basta applicare il Teorema 8.6 con ϕ(x) = x2 .
Esempio 8.7 (Tempo d’attesa dell’n-mo successo) Sia (Xn )n≥1 un processo di Bernoulli
con paramento p ed (Fn )n≥1 la sua filtrazione naturale. Le variabili aleatorie Tn definite da
(con la convenzione min ∅ = +∞), ovvero i tempi d’attesa dell’n-esimo successo, sono tempi
d’arresto. Infatti
{ T1 = 1 } = { X1 = 1 } ∈ F1 ,
[
{ T1 ≤ k } = { X` = 1 } ∈ Fk (k > 1),
1≤`≤k
{ Tn+1 = k } = { Tn < k, Xk = 1 } ∈ Fk .
Esempio 8.9 (Tempo del primo attraversamento del moto browniano) Sia (Bt )t≥0 un moto
browniano standard e a > 0. Il tempo Ta del primo attraversamento del livello a definito da
è un tempo d’arresto rispetto alla filtrazione naturale del processo. Osserviamo infatti che
\
{ Ta > t } = { Bs < a } .
s∈[0,t]
{S ∧ T ≤ t} = {S ≤ t} ∪ {T ≤ t}, {S ∨ T ≤ t} = {S ≤ t} ∩ {T ≤ t}.
Gli insiemi { S > t } e { T > t } appartengono a Ft perché S e T sono tempi d’arresto. Inoltre
abbiamo
[
{ S ≤ t, T ≤ t } ∩ { S + T > t } = { S = x, T = y }
x,y∈[0,t], x+y>t
[ \ 1 1
= x − < S ≤ x, y − < T = y
n n
x,y∈[0,t], x+y>t n≥1
[ \ 1 1
= s − < S ≤ s, r − < T = r .
n n
s,r∈([0,t]∩(Q∪{t})), s+r>t n≥1
Proposizione 8.10 Sia (Tn )n≥1 una successione di tempi d’arresto. La variabile aleatoria
supn≥1 Tn è un tempo d’arresto.
per ogni t ≥ 0.
L’estremo inferiore di una successione (Tn )n≥1 di tempi d’arresto di una filtrazione
(Ft )t≥0 potrebbe non essere un tempo d’arresto della stessa filtrazione. Infatti, per ogni
k > 0, si ha
\ \ [
1 1
inf Tn ≤ t = inf Tn < t + = Tn < t +
n≥1 n≥1 j j
j≥k j≥k n≥1
e quindi l’insieme { inf n≥1 Tn ≤ t } appartiene alla σ-algebra Ft+1/k qualunque sia k. Ne
segue che appartiene alla σ-algebra
\
Ft+ = Ft+ k1 .
k≥1
È chiaro che la σ-algebra Ft+ è più grande della σ-algebra Ft perché tutte le Ft+1/k con-
tengono la Ft . In moltissime applicazioni però si può verificare che Ft = Ft+ per ogni
t ≥ 0. Questo succede, per esempio, nel caso della filltrazione naturale del moto browniano
o del processo di Poisson. Quando vale questa proprietà si dice che la filtrazione (Ft )t≥0 è
continua a destra.
Indipendentemente dal fatto che la filtrazione sia continua a destra possiamo comunque
mostrare la seguente
Proposizione 8.11 Ogni tempo d’arresto limitato è limite di una successione non-crescente
di tempi d’arresto discreti.
Dimostrazione. Basta considerare la successione
X
Tn = (k + 1)2−n 1{k2−n <T ≤(k+1)2−n } .
k≥0
I tempi d’arresto si utilizzano quando si voglia stabilire una regola che indichi, sulla
base delle osservazioni di passato e presente, l’instante in cui si voglia effettuare una certa
operazione.
8.3. TEOREMA D’ARRESTO DISCRETO 79
Esempio 8.10 Una partita a testa e croce in cui un giocatore vinca 1 quando esce testa e
perda 1 quando esce croce si modellizza naturalmente con un processo di Bernoulli (Rn )n≥1
con parametro 1/2 (supporremo che il gioco sia equo). Il capitale del giocatore al tempo n
sarà
Xn
Xn = 2 Rk − n.
k=1
Una “strategia” naturale è di interrompere il gioco non appena il capitale sia strettamente
positivo ovvero al tempo T
È chiaro che, ad ogni istante k si può osservare il valore di Sn e, sulla base dell’osservazione,
decidere se continuare o meno.
Definizione 8.12 Sia X = (Xt )t∈I un processo stocastico con insieme dei tempi I ⊆
[0, +∞[ e sia T un tempo d’arresto discreto a valori in I. Si chiama processo X arrestato
al tempo T e si denota con X |T il processo definito da
|T
Xt (ω) = XT (ω)∧t (ω).
Proposizione 8.13 Sia X = (Xt )t∈I un processo stocastico con insieme dei tempi I ⊆
[0, +∞[ tale che 0 ∈ I e sia T un tempo d’arresto discreto a valori in I. Se il processo X è
adattato, allora anche il processo arrestato X |T è adattato.
Teorema 8.14 Sia X = (Xt )t∈I una martingala (risp. supermartingala oppure sottomartin-
gala) e T un tempo d’arresto discreto a valori in I. Il processo arrestato X |T è una mar-
tingala (risp. supermartingala oppure sottomartingala). In particolare, per ogni t ∈ I, si
ha
E[Xt ] = E[XT ∧t ] = E[X0 ] (8.2)
poiché l’insieme A ∩ {T > s} appartiene a Fs . Dato che, per ogni r ∈ D che soddisfa la
diseguaglianza s < r ≤ t l’insieme A ∩ {T = r} appartiene a Fr , valgono le eguaglianze
Z Z X Z Z
XT ∧s dP = XT dP + Xt dP + Xt dP
A A∩{T ≤s} r∈D,s<r≤t A∩{T =r} A∩{T >t}
Z X Z Z
= XT dP + Xr dP + Xt dP
A∩{T ≤s} r∈D,s<r≤t A∩{T =r} A∩{T >t}
Z X Z Z
= XT ∧t dP + XT ∧t dP + XT ∧t dP
A∩{T ≤s} r∈D,s<r≤t A∩{T =r} A∩{T >t}
Z
= XT ∧t dP.
A
Teorema 8.16 Sia X = (Xt )t∈I una martingala e T un tempo d’arresto discreto a valori
in I. Supponiamo che T abbia valori in un insieme discreto D e
grazie al Teorema (8.14). Sotto le ipotesi del teorema si può far tendere t all’infinito e
concludere.
Osservazione. La condizione
8.4 Applicazioni
8.4.1 Passeggiata casuale unidimensionale
Calcoliamo le probabilità di uscita da un intervallo [−a, b] (a, b ∈ N∗ ) della passeggiata
casuale simmetrica su Z che parte da 0. Il processo stocastico (Xn )n≥1 in questione si può
rappresentare
Xn
Xn = Yk
k=1
Si verifica immediatamente che T è un tempo d’arresto per la filtrazione naturale (Fn )n≥1
del processo (Xn )n≥1 data da
Fn = σ{ Y1 , . . . , Yn }.
82 8. MARTINGALE
Inoltre il processo (Xn )n≥1 è una martingala rispetto a questa filtrazione. Per il teorema
d’arresto 8.14 si ha quindi
E[XT ∧n ] = E[X0 ] = 0.
Poiché P{ T < ∞ } = 1 (la passeggiata casuale simmetrica su Z è ricorrente ...) e inoltre
|XT ∧n | ≤ max{ a, b }, grazie al teorema della convergenza dominata, facendo tendere n
all’infinito si ha E[XT ] = 0 ovvero,
P{ XT = −a } + P{ XT = b } = 1. (8.4)
Zn = Xn2 − n.
ovvero E[XT2 ∧n ] = E[T ∧ n]. Facendo tendere n all’infinito (applicando il teorema della
convergenza dominata alla successione (XT2 ∧n )n≥1 che soddisfa |XT2 ∧n | ≤ (max{a, b})2 e il
teorema della convergenza monotona alla successione non decrescente (T ∧ n)n≥1 ) si ha
Supponiamo di voler mantenere il livello del bacino al di sopra di un certo valore minimo a.
Le variabili aleatorie Yn sono, a loro volta, differenza di due variabili aleatorie En e Un che
rappresentano rispettivamente il flusso in entrata e in uscita. La capacità b è un parametro
modificabile in fase di costruzione e il flusso in uscita Un è controllabile, in qualche misura,
nella gestione del bacino.
Sia T il tempo d’arresto (rispetto alla filtrazione naturale del processo (Ln )n≥0 )
Per determinare la capacità b di solito si cerca di fare in modo che il tempo medio E[T ]
della discesa del livello sotto a sia abbastanza grande. A questo scopo si cerca di trovare
qualche valutazione di E[T ] in termini di b, a e della legge delle variabili aleatorie En , Un .
Supponiamo, per esempio, che
− e−λ(y−a)
1 λ(b−a) 1
f (y) = e − (y − a) per a ≤ y ≤ b.
m λ
dunque T è un tempo d’arresto anche per la filtrazione (Fn )n≥0 data da Fn ⊆ σ{Y0 , . . . , Yn }.
Verifichiamo inoltre che il processo (Xn )n≥0 definito da
Xn = f (Ln ) + n
− e−λ(y−a)
1 λ(b−a) 1
g(y) = e − (y − a) per ogni y.
m λ
Poiché la funzione g è non decrescente per y < b e non crescente per y > b si ha f (y) ≥ g(y)
per ogni y e
E [ Xn+1 | Fn ] = E [ f (Xn+1 ) | Fn ] + (n + 1)
= E [ f (Ln + Yn+1 ) | Fn ] + (n + 1)
≥ E [ g(Ln + Yn+1 ) | Fn ] + (n + 1).
1 − E[ e−λ(y+Yn+1 −a) | Fn ]
1
E [ g(y + Yn+1 ) | Fn ] = eλ(b−a) − (y + E[Yn+1 | Fn ] − a)
m λ
λ(y−a)
E[ e−λYn+1 | Fn ]
1 λ(b−a) 1 − e E[Yn+1 | Fn ]
= e −(y−a) −
m λ m
≥ f (y) − 1, per ogni y ∈ [a, b].
Ne segue che
E [ Xn+1 | Fn ] ≥ f (Ln ) + n = Xn
ovvero il processo (Xn )n≥1 è una sottomartingala. Grazie al Teorema d’arresto discreto
8.14, per ogni n ≥ 1, si ha allora
E[ f (XT ∧n ) ] + E[ (T ∧ n) ] ≥ f (y).
Dato che la funzione f è limitata (come nell’applicazione precedente) si può far tendere n
all’infinito trovando cosı̀
E[ T ] = lim E[ (T ∧ n) ] ≥ f (y).
n→∞
Osserviamo che le ipotesi (8.5) e (8.6) sono abbastanza deboli perché non si suppone quasi
nulla sulla legge delle Yn e sulle loro correlazioni.
Un modello simile si potrebbe utilizzare per valutare il rischio di bancarotta di un’assicura-
zione. In questo caso le En potrebbero rappresentare i premi e le Un gli indennizzi versati.
84 8. MARTINGALE
Teorema 8.17 Sia (Xt )t∈I una sottomartingala. Per ogni x > 0 e ogni t ∈ I si ha allora
xP max Xs > x ≤ E[Xt+ ].
s∈I∩[0,t]
≤ E[XT+∧t ] ≤ E[Xt+ ].
T1 ≤ U1 ≤ T2 ≤ U2 ≤ . . . ≤ Tk ≤ Uk ≤ . . .
Teorema 8.18 Sia (Xt )t∈I una sottomartingala. Per ogni t ∈ I vale la diseguaglianza
E[(Xt − b)+ ]
E[J] ≤ (8.8)
b−a
8.7. VERSIONI CON TRAIETTORIE REGOLARI 85
Lemma 8.19 Sia (Xs )s∈I una sottomartingala, T , U due tempi d’arresto a valori in (I ∩
[0, t]) ∪ {+∞} tali che T ≤ U . Si ha allora
Z Z
(XT − XU ) dP ≤ (Xt − XT ) dP.
{ U <+∞ } { T <+∞, U =+∞ }
e quindi la conclusione.
Dimostrazione del Teorema 8.18. Grazie al Lemma 8.19, per ogni k ≥ 1, si ha
Z
(b − a)P{ Uk < ∞ } ≤ (XTk − XUk )dP
{ Uk <∞ }
Z
≤ (Xt − XTk )dP
{ Tk <∞,Uk =∞ }
Z
≤ (Xt − b)dP.
{ Tk <∞,Uk =∞ }
La Proposizione precedente afferma che per quasi tutti gli ω si ha sups∈D Xs (ω) < ∞ ed
esistono i limiti
La successione di variabili aleatorie reali (Un )n≥1 è non decrescente ed evidentemente con-
verge puntualmente verso la variabile aleatoria U definita da
e quindi
P{ U = +∞ } = lim P{ U > x } = 0,
x→∞
Ne segue che J(a, b)(ω) ≥ k e perciò, data l’arbitrarietà di k, si ha J(a, b)(ω) = ∞ come
prima.
8.7. VERSIONI CON TRAIETTORIE REGOLARI 87
Teorema 8.21 Data una variabile aleatoria Z integrabile esiste un processo X = (Xt )t≥0
con traiettorie regolari (e cioè continue a destra con limiti da sinistra) adattato alla fil-
trazione (Ft+ )t≥0 tale che
Xt = E[ Z | Ft+ ]
per ogni t ≥ 0. Il processo X una martingala con traiettorie regolari chiusa dalla variabile
aleatoria Z.
per tutti gli ω dell’evento quasi certo che la restrizione a D della traiettoria s → Xs (ω) sia
regolare e definire poi Xt (ω) = 0 per tutti gli altri ω.
Il processo cosı̀ottenuto è evidentemente adattato a (Ft+ )t≥0 poiché, per ogni numero
reale x e ogni t0 > t si ha
[ \
{ Xt > x } = { Xr > x } .
{ s∈D | t≤s<t0 } { r∈D | t≤r<s, }
L’insieme { Xt > x } appartiene dunque a tutte le σ-algebre Ft0 con t0 > t cioè a Ft+ .
La variabile aleatoria Xt è integrabile poiché è limite puntuale di una successione di
variabili aleatorie uniformemente integrabili (Lemma previsto in Appendice).
Verifichiamo infine la proprietà di martingala. Siano t, s due numeri reali con s < t e
A ∈ Fs+ e sia (sn )n≥1 una successione di elementi di D ∩ [s, t] convergente verso s. Si ha
allora, per ogni n ≥ 1, Z Z
Xsn dP = Xt dP.
A A
La conclusione segue subito facendo tendere n all’infinito grazie all’uniforme integrabilità
delle variabili aleatorie Xsn .
Si verifica, infine, che le traiettorie della martingala (Xt )t≥0 sono regolari.
Nelle applicazioni la filtrazione (Ft+ )t≥0 spesso coincide con la filtrazione (Ft )t≥0 . Si
potrebbe dimostrare, per esempio, che la filtrazione naturale di un moto browniano stan-
dard o del processo di Poisson che abbiamo costruito è continua a destra. Tuttavia questa
proprietà non vale in generale. Si introduce perciò la definizione seguente
Definizione 8.22 Sia (Ω, F, P) uno spazio probabilizzato. Una filtrazione (Ft+ )t≥0 soddisfa
le condizioni abituali se
1. per ogni t ≥ 0 si ha Ft = Ft+ ,
2. ogni evento A ∈ F con P(A) = 0 appartiene a F0 .
Nel seguito supporremo sempre che la filtrazione in questione soddisfi le condizioni abituali.
88 8. MARTINGALE
Teorema 8.23 Sia X = (Xt )t≥0 una martingala con traiettorie regolari e T un tempo
d’arresto. Il processo X |T arrestato al tempo T è una martingala. In particolare si ha
E[XT ∧t ] = E[X0 ] per ogni t ≥ 0.
Lemma 8.24 Sia X = (Xt )t≥0 una martingala, t > 0 e T la famiglia dei tempi d’arresto
discreti maggiorati da t. La famiglia di variabili aleatorie (XT )T ∈T è uniformemente inte-
grabile.
con 0 ≤ t1 < . . . < tn ≤ t. Il processo X è una martingala e quindi, per ogni c > 0
Z Xn Z
XT dP = Xtk dP
{ XT >c } k=1 { Xtk >c, T =tk }
Xn Z
= Xt dP
k=1 { Xtk >c, T =tk }
Xn Z
≤ |Xt | dP
k=1 { Xtk >c, T =tk }
Z
= |Xt | dP.
{ XT >c }
Analogamente abbiamo
Z Z
−XT dP ≤ |Xt |dP.
{ XT <−c } { XT <−c }
Le variabili aleatorie XTn ∧t sono Ft misurabili (Teorema 8.14) dunque anche la variabile
aleatoria XT ∧t è Ft misurabile. La successione (XTn ∧t )n≥1 è uniformemente integrabile per
il Lemma 8.24, dunque la variabile aleatoria XT ∧t è integrabile grazie al Teorema 11.7.
Verifichiamo infine la proprietà di martingala. Fissiamo s < t e un evento A ∈ Fs .
Poiché i processi X |Tn sono martingale, si ha
Z Z
XTn ∧s dP = XTn ∧t dP.
A A
Teorema 8.26 Sia Z una variabile aleatoria integrabile e X = (Xt )t≥0 una martingala con
traiettorie regolari chiusa dalla variabile aleatoria Z. Sia F∞ la σ-algebra generata dalle Fs
con s ≥ 0. Si ha allora
lim Xt = E[ Z | F∞ ]
t→∞
1
quasi certamente e in L (Ω, F, P).
La dimostrazione è analoga a quella del Teorema 8.21. Infatti si può verificare l’esistenza
dei limiti delle traiettorie all’infinito utilizzando la diseguaglianza sul numero di attraversa-
menti di un intervallo.
Proposizione 8.27 Ogni sottomartingala X = (Xn )n≥0 si decompone nella somma di una
martingala e di un processo A = (An )n≥0 tale che
90 8. MARTINGALE
da cui
An+1 = An + E[ Xn+1 | Fn ] − Xn .
Poniamo quindi A0 = 0 e, per ogni n ≥ 1,
n
X
An = (Ak−1 + E[ Xk | Fk−1 ] − Xk−1 ) .
k=1
Dato che X è una sottomartingala, si verifica subito che il processo A = (An )n≥0 ha trai-
ettorie non decrescenti. Infine il processo (Xn − An )n≥0 è una martingala per come è stato
definito il processo A (a partire dalla formula (8.9)).
La proprietà 2 del processo A = (An )n≥0 si esprime dicendo che il processo è prevedibile.
Infatti, se la variabile aleatoria An+1 è Fn misurabile, allora il suo valore è determinato
dalla conoscenza (del verificarsi o meno) degli eventi della σ-algebra Fn ovvero, al tempo n
si può “prevedere” il valore di A all’istante successivo. Un processo adattato è ovviamente
prevedibile.
Esempio 8.11 Consideriamo un gioco nel quale la successione dei capitali (Mn )n≥0 di un
giocatore che, ad ogni istante, scommette una somma fissa formi una martingala. Suppo-
niamo poi che il giocatore voglia provare a scommettere somme non fisse (con la speranza
di vincere di più) ma variabili (Hn )n≥0 , sulla base dei risultati delle scommesse precedenti.
Questa richiesta, insieme al fatto che dovrà dichiarare quanto scommette prima dell’n-esima
giocata, si esprime dicendo che Hn deve essere una variabile aleatoria Fn−1 -misurabile. La
domanda naturale è: potrà determinare una qualche stategia di puntate (Hn )n≥0 in modo
da rendere il gioco a lui favorevole?
Il capitale Xn+1 del giocatore al tempo n + 1 sarà dato da
Xn+1 = Xn + Hn (Mn+1 − Mn )
Supponendo che le variabili aleatorie Hn siano limitate (cosa molto ragionevole) si verifica
facilmente che il processo (Xn )n≥0 è una martingala. Ne segue che il valore medio del
capitale del giocatore al tempo n è uguale a quello al tempo 0 ovvero la scelta di qualunque
strategia prevedibile (Hn )n≥0 (e limitata) non produce vantaggi o svantaggi.
8.12 Esercizi
Esercizio 8.1 Sia (Bt )t≥0 un moto browniano standard. Mostrare che il processo (Xt )t≥0
definito da Xt = Bt3 − 3tBt è una martingala.
Esercizio 8.2 Sia (Nt )t≥0 un processo di Poisson con parametro λ e u ∈ R. Mostrare che
il processo (Xt )t≥0 definito da
è una martingala.
Esercizio 8.3 Sia T un tempo d’arresto e c una costante. Mostrare che cT è un tempo
d’arresto se e solo se c ≥ 1.
Esercizio 8.4 Sia T un tempo d’arresto tale che T ≥ 1. Mostrare che T 2 è un tempo
d’arresto.
Esercizio 8.5 Sia (Bt )t≥0 un moto browniano standard, ε > 0 e S il primo istante t tale
che, dopo un tempo ε il moto browniano supererà un livello a > 0 cioè
S = { t ≥ 0 | Bt+ε > a }
non è un tempo d’arresto rispetto alla filtrazione naturale del moto browniano.
Esercizio 8.7 Sia (Mt )t≥0 una martingala di quadrato integrabile. Verificare che se anche
il processo (Mt2 )t≥0 è una martingala allora Mt = M0 quasi certamente per ogni t ≥ 0.
In questo capitolo illustreremo alcune applicazioni della teoria delle martingale, in parti-
colare del teorema d’arresto allo studio delle proprietà del moto browniano. Mostreremo
inoltre come si possa utilizzare il moto browniano per scrivere le soluzioni di certe equazioni
differenziali a derivate parziali.
T = inf { s ≥ 0 | Bs ∈ { a, b }} .
Si verifica facilmente che i processi (Bt )t≥0 e (Bt2 − t)t≥0 sono martingale. Grazie al teorema
d’arresto si ha quindi
aP{ XT = a } + bP{ XT = b } = x.
93
94 9. APPLICAZIONI AL MOTO BROWNIANO E CATENE DI MARKOV
aP{ XT = a } + bP{ XT = b } = 1,
ci dà allora
La seconda relazione questa volta coinvolge un’altra quantità non nota E[(T ∧ t)2 ] e, man-
dando t all’infinito, E[T 2 ]. Non potendo procedere come nel caso in cui µ = 0 consideriamo
altre martingala ovvero la martingala esponenziale (Mt )t≥0 data da
β2
2
β
Mt = exp βBt − t = exp β(Xt − x) − − βµ t
2 2
troviamo l’identità
E[exp(2µXT ∧t )] = exp(2µx).
Passando al limite per t → ∞ come abbiamo già fatto nel caso in cui µ = 0 troviamo quindi
il sistema
P { XT = a } + P { XT = b } = 1
e2µa P { XT = a } + e2µb P { XT = b } = exp(2µx)
da cui, risolvendo,
Teorema 9.1 Sia f una funzione reale su Rd di classe C 2 limitata con tutte le derivate
parziali di ordine minore o uguale a 2 limitate. Allora il processo (Mt )t≥0 definito da
Z t
1
Mtf = f (Bt ) − (∆f )(Bs )ds
0 2
è una martingala.
Dimostrazione. Per s < t, grazie all’indipendenza degli incrementi del moto browniano,
abbiamo
h i h i
E eihu,Bt i | Fs = eihu,Bs i E eihu,(Bt −Bs )i | Fs
h i
= eihu,Bs i E eihu,(Bt −Bs )i
2
= eihu,Bs i e−|u| (t−s)/2
.
Analogamente
2Z t 2Z s
|u|2 t ihu,Br i
|u| |u|
Z
eihu,Br i dr Fs = E eihu,Br i dr + e dr Fs
E
2 0 2 0 2 s
2 Z s 2 Z t
|u| |u|
= eihu,Br i dr + E eihu,Bs i eihu,(Br −Bs )i dr Fs
2 0 2 s
|u|2 s ihu,Br i
Z t
|u|2 ihu,Bs i
Z
ihu,(Br −Bs )i
= e dr + e E e dr
2 0 2 s
|u|2 s ihu,Br i |u|2 ihu,Bs i t h ihu,(Br −Bs )i i
Z Z
= e dr + e E e dr
2 0 2 s
|u|2 s ihu,Br i |u|2 ihu,Bs i t −|u|2 (r−s)/2
Z Z
= e dr + e e dr
2 0 2 s
Il Teorema 9.1 è quindi verificato per le funzioni f (x) = eihu,xi che chiameremo, per
brevità, funzioni trigonometriche. Estenderemo ora la formula ad una classe più ampia
di funzioni utilizzando la densità delle funzioni trigonometriche nelle funzioni C 2 . È noto
infatti che, detto I(R) l’ipercubo I(R) = { x ∈ Rd | max1≤k≤d |xk | ≤ R }, per ogni funzione
f ∈ C 2 (Rd ), esiste una successione (fn )n≥1 di combinazioni lineari (a coefficienti complessi)
di funzioni trigonometriche che converge uniformemente verso f insieme con tutte le sue
derivate parziali di ordine minore o eguale a 2 sull’ipercubo I(R). Abbiamo cioè
lim sup |(f (x) − fn (x))| = 0, lim sup |(∆f )(x) − (∆fn )(x))| = 0.
n→∞ x∈I(R) n→∞ x∈I(R)
f |TR
Abbiamo quindi verificato che i processi arrestati (Mt )t≥0 sono martingale qualunque
sia R > 0. Possiamo ora dimostrare il Teorema 9.1.
Dimostrazione del Teorema 9.1. Cominciamo con l’osservare che i tempi d’arresto TR con-
vergono quasi certamente verso +∞ per R tendente all’infinito. Infatti il moto browniano d
dimensionale esce dall’ipercubo I(R) se e solo se una delle sue componenti esce dall’intervallo
[−R, R] cosa che accade quasi certamente per quanto visto nel paragrafo 9.1.
Poiché la funzione f e tutte le sue derivate parziali di ordine minore o uguale a 2 sono
limitate, le variabili aleatorie MTfR ∧s e MTfR ∧t sono uniformemente limitate in R. Facendo
tendere R all’infinito in (9.2) troviamo
Z Z
Msf dP = Mtf dP,
A A
dove f è una funzione continua su ∂D. La soluzione si può rappresentare per mezzo del
moto browniano d-dimensionale.
Sia (Xtx )t≥0 il moto browniano uscente da x cioè Xtx = x + Bt . Si ha allora
T = { t ≥ 0 | Xtx ∈
/ D}.
L’argomento precedente non è del tutto preciso perché abbiamo dimostrato il Teorema
9.1 supponendo che f sia una funzione di classe C 2 su tutto Rd . La soluzione u del problema
di Dirichlet è una funzione di classe C 2 su D e non abbiamo visto se si può estendere ad una
funzione di classe C 2 su Rd ...
Supponiamo che f sia di classe C 2 con tutte le derivate di ordine minore o uguale a 2 limitate
(per evitare questioni tecniche).
Sia (Xtx )t≥0 il moto browniano d-dimensionale con origine in x. La soluzione dell’equazione
del calore si può scrivere nella forma
u(t, x) = E [ f (Xtx ) ] .
da cui ponendo t = 0 si trova u(0, x) = f (x) e derivando rispetto a t si verifica che u soddisfa
l’equazione del calore.
Il moto browniano si utilizza per scrivere la soluzione di varie equazioni a derivate parziali.
Per esempio la soluzione dell’equazione
∂ 1
∂t u(t, x) = 2 ∆u(t, x) + V (x)u(t, x), (t, x) ∈ [0, +∞[×Rd
u(0, x) = f (x) x ∈ Rd
si scrive con la cosiddetta formula di Feynman-Kac
Rt
x V (Xrx )dr
u(t, x) = E f (Xt )e 0 .
Anche questa formula si verifica introducendo un’opportuna martingala del moto browniano.
In particolare
E [ f (Xt ) | Fs ] = E [ f (Xt ) | σ(Xs )]
9.6. MARTINGALE E CATENE DI MARKOV 99
Osserviamo che, grazie al Lemma 9.3 e alle equazioni di Kolmogorov all’avanti, il membro
destro si scrive
Z t Z tX
E [ (Qf )(Xr ) | Fs ] dr = pXs j (r − s)(Qf )(j)dr
s s j
Z tX
= pXs j (r − s)qjk f (k)dr
s j,k
Z tX
= p0Xs k (r − s)f (k)dr
s k
X
= (pXs k (t − s) − δXs k ) f (k)
k
= E [ f (Xt ) | Fs ] − f (Xs ).
Si verifica cosı̀ che (Mt )t≥0 è una martingala.
Il risultato precedente si generalizza facilmente alle funzioni f non limitate se valgono le
opportune condizioni d’integrabilità.
100 9. APPLICAZIONI AL MOTO BROWNIANO E CATENE DI MARKOV
9.7 Esercizi
Esercizio 9.1 Sia [a, b] un intervallo e x ∈]a, b[ un suo punto interno. Detto T il tempo di
uscita da [a, b] del moto browniano (Xtx )t≥0 con origine in x mostrare che
Esercizio 9.2 Sia Ta il tempo del primo attraversamento del livello a del moto browniano
standard con origine in 0. Mostrare che
√
E e−λTa = e−a 2λ
10
Processi di Markov
Sia (Ω, F, P) uno spazio probabilizzato, (Ft )t≥0 una filtrazione di sotto-σ-algebre di F ed
E un sottoinsieme boreliano di Rd munito della σ-algebra E indotta dalla σ-algebra B(Rd )
dei sottoinsiemi boreliani di Rd . Le variabili aleatorie (Xt )t≥0 di un processo di Markov o
markoviano, a valori in E sono dipendenti tra loro in un modo speciale per precisare il quale
introduciamo la seguente definizione.
p : (s, t) ∈ R2 | s ≤ t × E × E → [0, 1]
tale che
1. è adattato,
101
102 10. PROCESSI DI MARKOV
E [ E [ f (Xt ) | Fs ] | Fr ] = E [ f (Xt ) | Fr ]
E [ E [ 1A (Xt ) | Fs ] | Fr ] = E [ p(s, t, Xs , A) | Fr ]
Z
= p(s, t, y, A)p(r, s, Xr , dy).
E
Talvolta la filtrazione non è data esplicitamente. In questi casi, quando di dice che un
processo è markoviano, si sottointende rispetto alla sua filtrazione naturale.
La transizione markoviana p e la legge iniziale µ della variabile aleatoria X0 individuano
le leggi congiunte delle variabili aleatorie (Xt1 , . . . , Xtn ).
Teorema 10.3 Se (Xt )t≥0 è un processo di Markov con legge iniziale µ e nucleo di tran-
sizione p, per ogni n e ogni t1 < . . . tn si ha
Definizione 10.4 Un processo di Markov (Xt )t≥0 con nucleo di transizione p si chiama
omogeneo se p(s, t, x, A) = p(s + r, t + r, x, A) per ogni s < t, r ≥ 0, A ∈ E.
3. (positività) per ogni f ∈ L∞ (E, E) non negativa anche la funzione Tt f è non negativa,
e quindi Z
(Tt (Ts f ))(x) = f (z)p(t + s, x, dz) = (Tt+s f )(x).
E
Il teorema è cosı̀ dimostrato.
Definizione 10.6 Una famiglia (Tt )t≥0 di operatori lineari su L∞ (E, E) con le proprietà
1, 2, 3 e 4 del Teorema 10.5 si chiama semigruppo markoviano.
Grazie al Teorema 10.3, si può quindi affermare che un processo markoviano omogeneo è
determinato dalla legge iniziale e dal semigruppo markoviano associato.
Lo spazio vettoriale L∞ (E, E) tuttavia non è nemmeno uno spazio di Banach e quindi,
per utilizzare gli strumenti dell’Analisi Matematica è preferibile ridursi a semigruppi marko-
viani i cui operatori Tt agiscano almeno su spazi di Banach. Per questo motivo nel séguito
supporremo che:
tutte le misure p(t, x, ·) sono assolutamente continue rispetto a una misura σ-finita µ su E.
Il semigruppo (Tt )t≥0 induce allora un semigruppo, che denoteremo sempre nello stesso
modo, su L∞ (E, E, µ) e, denotando con p(t, x, ·) anche le densità di queste misure rispetto
a µ, abbiamo Z
(Tt f )(x) = f (y)p(t, x, y)µ(dy). (10.2)
E
Supporremo inoltre che: la funzione
Z
t→ g(x)(Tt )f (x)µ(dx)
E
su tutte le funzioni f ∈ L∞ (E, E, µ) per le quali il limite esiste per ogni g ∈ L1 (E, E, µ).
La teoria matematica che descrive la relazione è però di livello troppo elevato per gli
scopi di questo corso e quindi ci accontenteremo di qualche cenno. Osserviamo però che,
presa una f su cui è definito il generatore e posto u(t, x) = (Tt f )(x), si potrebbe verificare
che la funzione u soddisfa
∂u
= Au(t, x), u(0, x) = f (x).
∂t
(La verifica è immediata supponendo che il generatore sia definito anche sulle funzioni Tt f
per ogni t > 0). Vedremo tra poco (Teorema 10.8) che, nel caso in cui E sia lo spazio
euclideo, l’operatore A è un operatore differenziale. Pertanto, almeno in questo caso, si
vede bene che il generatore individua il semigruppo sempre che la soluzione dell’equazione
differenziale alle derivate parziali sia unica.
X λk (t − s)k
E [ f (Nt ) | Fs ] = e−λ(t−s) f (k + Ns ) = E [ f (Nt ) | σ(Ns ) ] .
k!
k≥0
X (λt)k−x
p : [0, +∞[ ×N × P(N) → [0, 1], p(t, x, B) = e−λt
(k − x)!
k∈B,k≥x
X (λt)(k−n)
(Tt f )(n) = e−λt f (k). (10.3)
(k − n)!
k≥n
X (λt)(k−n) X (λt)(k−n)
(Tt f )(n) − f (n) = e−λt f (k) − f (n) = e−λt (f (k) − f (n))
(k − n)! (k − n)!
k≥n k>n
e quindi
Osservando che
−λt X λk−n tk−n−1 X (λt)k−n−1
≤ 2λkf k∞ e−λt
e (f (k) − f (n))
(k − n)! (k − n)!
k≥n+2 k≥n+2
X (λt)h
≤ 2λkf k∞ e−λt
h!
h≥1
1 − e−λt
= 2λkf k∞
troviamo subito
(Tt f )(n) − f (n)
− λ (f (n + 1) − f (n)) ≤ 4λkf k∞ 1 − e−λt
t
Ne segue che ((Tt f ) − f )/t converge uniformemente verso la funzione n → λ(f (n + 1) − f (n))
e cui la conclusione è immediata.
Nel caso di un processo di nascita e morte con insieme degli stati N, utilizzando le
equazioni di Kolmogorov (all’avanti o all’indietro), si vede che il generatore è l’operatore
dove le λn (risp. ωn ) sono le intensità delle transizioni (o salti) dallo stato n allo stato n + 1
(risp. n − 1).
Più in generale, se il processo può saltare da un punto n ad un altro punto m con
intensità λnm allora (sotto opportune ipotesi non molto restrittive sulle intensità λnm dei
salti) si trova che il generatore infinitesimale è
X
(Af )(n) = λnm (f (m) − f (n)).
m≥0
|y − Bs |2
Z
1
E [ f (Bt ) | Fs ] = f (y) exp − dy.
(2π(t − s))d/2 Rd 2(t − s)
per ogni E ∈ B(Rd ). Il semigruppo relativo è definito di conseguenza. L’azione del generatore
infinitesimale A si calcola facilmente sulle funzioni di classe C 2 con tutte le derivate di ordine
106 10. PROCESSI DI MARKOV
1
lim p(t, x, BR (x)c ) = 0, (10.4)
t→0+ t
Z
1
lim (yi − xi )p(t, x, dy) = bi (x), (10.5)
t→0+ t BR (x)
Z
1
lim (yi − xi )(yj − xj )p(t, x, dy) = aij (x). (10.6)
t→0+ t BR (x)
Allora le matrici (aij (x))1≤i,j≤d sono semidefinite positive e il generatore di (Xt )t≥0 è
1 X ∂2f X ∂f
(Af )(x) = aij (x) (x) + bj (x) (x). (10.7)
2 ∂xi ∂xj ∂xj
1≤i,j≤d 1≤j≤d
Teorema 10.9 Sia f una funzione per la quale è definito Af . Il processo (Mtf )t≥0 definito
da Z t
Mtf = f (Xt ) − (Af )(Xs )ds
0
è una martingala.
e quindi
Z t Z s
E f (Xt ) − (Af )(Xr )dr | Fs = f (Xs ) − (Af )(Xr )dr
0 0
Z t
+ E f (Xt ) − f (Xs ) − (Af )(Xr )dr | Fs
s
Z s
= f (Xs ) − (Af )(Xr )dr.
0
Dimostrazione. Basta osservare che il processo (f (Xt ))t≥0 è adattato, le variabili aleatorie
f (Xt ) sono ovviamente integrabili perché limitate e
Nel caso in cui E sia uno degli insiemi numerabili elencati sopra, l’unica condizione che deve
soddisfare una f per essere nello spazio C`0 (E; R) è avere limite all’infinito.
Si vede subito che il semigruppo markoviano del processo di Poisson (Proposizione 10.7)
è felleriano e, con un pò più di lavoro che lo è anche il semigruppo del moto browniano.
Se un semigruppo è felleriano di solito si denota con lo stesso simbolo anche la sua
restrizione a C`0 (E; R). Anche il generatore infinitesimale, sempre denotato con lo stesso
simbolo, è una restrizione del generatore su L∞ (E, E, µ ed è definito da
Dom(A) = f ∈ C`0 (E; R) | ∃ lim (Tt f − f ) per k · k∞
t→0+
Tt f − f
(Af )(x) = lim .
t→0+ t
Vale la pena si sottolineare il fatto che f appartiene al dominio Dom(A) di A se il limite
precedente esiste per la norma uniforme k · k∞ ovvero
Proposizione 10.13 Sia (Tt )t≥0 un semigruppo markoviano felleriano. Il suo generatore
infinitesimale A ha le proprietà seguenti:
a) la funzione costante 1E appartiene a Dom(A) e A1E = 0,
10.6. IRRIDUCIBILITÀ E TEMPO DI SOGGIORNO IN UN INSIEME 109
Definizione 10.16 Si chiama tempo di soggiorno del processo (Xt )t≥0 nell’insieme A ∈ E
la variabile aleatoria τA a valori [0, +∞]
Z ∞
τA = 1A (Xs )ds.
0
Per verificare che τA è effettivamente una variabile aleatoria basta osservare che, grazie
alla regolarità delle traiettorie, l’applicazione definita su [0, +∞[×Ω a valori in E
(s, ω) → Xs (ω)
è misurabile rispetto alle σ-algebre B([0, +∞[) ⊗ F sul dominio e E sul codominio e quindi,
l’applicazione
(s, ω) → 1A (Xs (ω))
ottenuta per composizione con la funzione 1A definita su E, è pure misurabile. La funzione
τA risulta quindi misurabile per il teorema di Fubini.
Una semplice applicazione dello stesso teorema permette di verificare che
Dimostrazione. Si ha infatti
Z ∞
Ex [τA ] = Ex 1A (Xs )ds
Z ∞ 0
= Ex [1A (Xs )] ds
0
Z ∞
= (Ts 1A )(x)ds.
0
Indichiamo con M+ (E, E, µ) l’insieme delle funzioni E-misurabili su E a valori [0, +∞].
La definizione degli operatori (Tt )t≥0 si estende immediatamente a M+ E, E, µ) ponendo
Definizione 10.18 Si chiama potenziale associato al semigruppo markoviano (Tt )t≥0 l’applicazione
U : M+ (E, E, µ) → M+ (E, E, µ) definita da
Z ∞
(U f )(x) = (Ts f )(x)ds.
0
Proposizione 10.19 Sia f una funzione non negativa. Il potenziale U f è una funzione
superarmonica.
Esempio 10.1 (Potenziale del processo di Poisson) Sia (Tt )t≥0 il semigruppo del processo
di Poisson di parametro λ dato da (10.3). Con semplici calcoli si vede subito che, per ogni
f : N → [0, +∞[ si ha
X f (k) Z ∞
(U f )(n) = e−λt (λt)k dt
k! 0
k≥n
1 X f (k) ∞ −s k
Z
= e s ds
λ k! 0
k≥n
1X
= f (k)
λ
k≥n
È abbastanza facile verificare che, se f è una funzione a supporto compatto, allora U f è una
funzione limitata.
Nei casi in cui d = 1 e d = 2 l’integrale rispetto a t è divergente (a meno che f sia µ-quasi
ovunque nulla) e, dunque, il potenziale U f è infinito.
2. esiste una f ∈ L∞ (E, E, µ) non negativa con potenziale U f finito e strettamente posi-
tivo µ-quasi ovunque,
3. esiste una successione non decrescente (An )n≥1 di elementi di E la cui unione è
l’insieme E (a meno di insiemi µ-trascurabili) tali che U 1An sia limitato.
(U f )(x)
Tt g(x) ≤ = g(x)
1 + (U f )(x)
e Tt g < g per ogni t > 0 perché Tt U f < U f per ogni t > 0. Posto h = g − T1 g abbiamo una
funzione strattamente positiva con
Z ∞ Z 1
(U h)(x) = ((Tt g)(x) − (Tt+1 g)(x)) dt = (Tt g)(x)dt ≤ kgk∞ ≤ 1
0 0
Supponendo che il semigruppo markoviano sia di Feller ovvero che: E è uno spazio
metrico, E è la σ-algebra dei boreliani di E e la funzione x → (Tt f )(x) è continua per
ogni f continua. Allora si può prendere come successione (An )n≥1 una successione di sfere
(B(x, rn ))n≥1 con centro un qualunque punto di E e raggi rn divergenti a +∞.
In modo simile al Teorema 10.20 si dimostra il seguente
1. per ogni funzione f non negativa e quasi ogni x ∈ E risulta (U f )(x) = 0 oppure
(U f )(x) = +∞,
Dimostrazione. (idea) Se il processo è transiente allora esiste una f : E → [0, +∞[ tale che
0 < U f (x) < +∞ per µ-quasi ogni x. Posto g = U f si ha allora Tt g ≤ g. La funzione g non
e’ costante perche’, se lo fosse, si avrebbe Tt g = g per ogni t ≥ 0. Tuttavia
Z ∞
lim Tt g = lim Ts f ds = 0
t→∞ t→∞ t
Definizione 10.25 Una misura di probabilità ν su E si chiama invariante se, per ogni
f ∈ Mb (E) e ogni t ≥ 0, si ha
Z Z
f (x)ν(dx) = (Tt f )(x)ν(dx).
E E
In questo caso, indicheremo con gTt la densità di νTt rispetto a µ. Utilizzeremo inoltre la
notazione Z
hg, Tt f i := g(x)(Tt f (x))µ(dx)
E
∞ 1
per f ∈ L (E, E, µ) e g ∈ L (E, E, µ).
Teorema 10.26 Siano g0 , g∞ densità di probabilità su E e (tn )n≥1 una successione diver-
gente a +∞ tale che Z tn
1
lim (g0 Ts )ds, f = h g∞ , f i (10.8)
n→∞ tn 0
Osserviamo che la condizione (10.8) equivale alla convergenza debole in L1 (E, E, µ) della
successione di densità di probabilità su E
Z tn
1
(g0 Ts )ds.
tn 0
e 1/tn tende a 0.
10.8. MISURE INVARIANTI 115
Il Teorema precedente non fornisce un metodo pratico per il calcolo delle densità delle
misure invarianti. Per determinarle effettivamente si può partire dall’osservazione che una
densità invariante g soddifa la condizione
hg, Tt f i = hg, f i
hg, Af i = 0
per ogni f nel dominio del generatore A. Nel caso in cui A sia un operatore differenziale si
può calcolare g con un’integrazione per parti e risolvendo poi un’equazione differenziale
116 10. PROCESSI DI MARKOV
10.9 Esercizi
Esercizio 10.1 Sia (Nt )t≥0 un processo di Poisson con parametro λ > 0. Mostrare che il
processo (Xt )t≥0 definito da Xt = Nt − λt è un processo di Markov ricorrente.
Esercizio 10.2 Sia (Nt )t≥0 un processo di Poisson con parametro λ >. Mostrare che il
processo (Xt )t≥0 definito da
Xt = (−1)Nt
è un processo di Markov, determinare il semigruppo associato e il suo generatore. Mostrare
che il processo (Xt )t≥0 è ricorrente.
11
Appendice
Molte leggi notevoli sono prodotto di convoluzione di un certo numero n di altre leggi.
Certe leggi notevoli sono esprimibili come prodotto di convoluzione di k leggi di probabilità
qualunque sia k.
Le leggi di Poisson e normale, per esempio, godono di questa proprietà. Infatti, per ogni
k ≥ 1, la legge di Poisson di parametro λ è prodotto di convoluzione di k leggi di Poisson
di parametro λk. Analogamente la legge normale N (µ, σ 2 ) è prodotto di convoluzione di k
leggi normali N (µk, σ 2 k).
Le leggi che godono di questa proprietà si chiamano infinitamente divisibili e sono carat-
terizzate dal seguente
σ 2 t2
Z
itx itx
ϕ(t) = exp itm − + e −1− ν(dx)
2 R 1 + x2
x2
Z
ν(dx) < ∞.
R 1 + x2
117
118 11. APPENDICE
Questa formula si può anche dedurre immediatamente dalla (11.1) osservando che
Z ∞ ∞ Z
X n+1
dxP { V > x } dx = P { V > x } dx
0 n=0 n
X∞ Z n+1
= P { V > n } dx
n=0 n
X∞
= P{V > n}.
n=0
con α ∈]0, 1] e K costante per ogni t, s ∈]a, b[. La costante K potrebbe dipendere da f, a, b
ma, naturalmente, deve essere indipendente da t, s. Nel caso in cui α = 1 la f si dice
lipschitziana.
Una funzione α-hölderiana è anche β-hölderiana per ogni β ∈]0, α]. Infatti si ha
soddisfa
|f (t) − f (s)| ≤ |t − s|θ
dunque è θ-hölderiana con costante K = 1.
Condideriamo la funzione
1 − xθ
ϕ :]0, 1] → R, ϕ(x) = .
|1 − x|θ
per ogni x ∈]0, 1[. Ne segue che la funzione ϕ è non-crescente su [0, 1] e quindi ϕ(x) ≤
ϕ(0) = 1 per ogni x ∈ [0, 1].
Il caso in cui α > 1 non è interessante perché
Definizione 11.4 Una famiglia (fα )α∈A di funzioni reali estese su E, E-misurabili e µ-
integrabili, si chiama uniformemente integrabile se
Z
lim sup |fα (x)| µ(dx) = 0. (11.3)
c→+∞ α∈A { x∈E | |fα (x)|>c }
Osserviamo che, se la misura µ è finita cioè µ(E) < +∞, allora una famiglia (fα )α∈A uni-
formemente integrabile è uniformemente limitata in L1 (E, E, µ). Infatti, detto c un numero
reale strettamente positivo tale che
Z
|fα (x)| µ(dx) < 1
{ x∈E | |fα (x)|>c }
per ogni α ∈ A si ha
Z Z Z
|fα (x)| µ(dx) = |fα (x)| µ(dx) + |fα (x)| µ(dx)
E { x∈E | |fα (x)|≤c } { x∈E | |fα (x)|>c }
≤ cµ(E) + 1.
Come abbiamo detto l’uniforme integrabilità è una condizione più debole dell’uniforme
dominazione. Vale infatti la seguente
Proposizione 11.5 Una famiglia (fα )α∈A di funzioni reali estese su E, E-misurabili tali
che |fα | ≤ g per qualche funzione reale estesa g, E-misurabile e µ-integrabile è uniforme-
mente integrabile.
Dimostrazione. Si ha infatti, per ogni α ∈ A e c > 0,
Z Z
|fα (x)| µ(dx) ≤ g(x)µ(dx) = 0
{ x∈E | |fα (x)|>c } { x∈E | |fα (x)|>c }
e, inoltre,
Z Z
1 1
µ { x ∈ E | |fα (x)| > c } ≤ |fα (x)|µ(dx) ≤ g(x)µ(dx).
c E c E
Ne segue che µ { x ∈ E | |fα (x)| > c } converge verso 0 per c tendente all’infinito uniforme-
mente in α ovvero per ogni δ > 0 esiste un c(δ) > 0 tale che
sup µ { x ∈ E | |fα (x)| > c } < δ
α
per ogni c > c(δ). Dato che la funzione g è µ-integrabile, per ogni ε > 0 esiste un δ > 0 tale
che se µ(F ) < δ allora Z
g(x)µ(dx) < ε.
F
Si ha quindi, per ogni c > c(δ) e α ∈ A
Z Z
|fα (x)| µ(dx) ≤ g(x)µ(dx) < ε.
{ x∈E | |fα (x)|>c } { x∈E | |fα (x)|>c }
Proposizione 11.6 Supponiamo che µ(E) < +∞. Una famiglia (fα )α∈A limitata in Lp (E, E, µ)
con p > 1 è uniformemente integrabile.
Dimostrazione. Posto
Z 1/p
p
M := sup |fα (x)| µ(dx) ,
α∈A E
e q = p/(p − 1), indicando con { |fα | > c } l’insieme { x ∈ E | |fα (x)| > c }, grazie alla
diseguaglianza di Hölder abbiamo
Z Z p1
1 1
p
|fα (x)| µ(dx) ≤ (µ { |fα | > c }) q
|fα (x)| µ(dx) ≤ M (µ { |fα | > c }) q
{ |fα |>c } E
Teorema 11.7 Sia (E, E, µ) uno spazio di misura con µ(E) < ∞ ed (fn )n≥1 una suc-
cessione di funzioni reali estese E-misurabili, µ-integrabili, uniformemente integrabili, che
convergano µ-quasi ovunque verso una funzione f . Allora f è µ-integrabile e
Z Z
lim fn (x)µ(dx) = f (x)µ(dx).
n→∞ E E
poiché, come abbiamo osservato, se µ(E) < ∞, allora l’uniforme integrabilità garantisce che
la successione (fn )n≥1 è limitata in L1 (E, E, µ).
Verifichiamo che possono scambiare limite e integrale. Grazie all’uniforme integrabilità,
per ogni ε > 0, possiamo trovare un c(ε) > 0 tale che
Z
|fn (x)|µ(dx) < ε
{ x∈E | |fn (x)|>c }
122 11. APPENDICE
per ogni c > 0, prendendo eventualmente un c(ε) più grande del precedente abbiamo quindi
Z
f dµ < ε
{ |fn |>c }
fn (x) = 1[n,n+1]
è uniformemente integrabile perché l’insieme { x ∈ E | |fn (x)| > 1 } è vuoto per ogni n ≥ 1
e converge verso 0. Tuttavia si ha
Z
lim fn (x)µ(dx) = lim 1 = 1 6= 0.
n→∞ E n→∞
per ogni boreliano B contenuto in [0, +∞[. Per ogni n ≥ 1 sia fn la funzione
e quindi
nα
Z Z X
gdµ ≥ fn dµ = = +∞
[0,+∞[ [0,+∞[ n(n + 1)
n≥1