Sei sulla pagina 1di 4

LA PASSEGGIATA ALEATORIA DEL GIOCATORE

Assunzioni: il tempo è discreto, ovvero 0 = t0 < t1 < ..; non vi sono investimenti privi di rischio né possibilità
di accedere ad opzioni e/o titoli derivati; gli unici investimenti sono puramente aleatori. Si ha: Y1,..,Yn
n
Bernoulli (p). Tn = ∑ Yi valore del portafoglio al tempo t=n. Il processo continua finchè il
i=0
giocatore abbia raggiunto un livello a ≥ T 0 ≥ 0, oppure il valore del suo portafoglio sia stato azzerato. Tn = a
vittoria del giocatore PTo = prob. vittoria; Tn =0 rovina del giocatore qTo = prob. rovina. Teorema: se p ≠ q
q a q ¿
, allora qTo =
() ()
p

p ¿
; se p = q = 1/2 , allora qTo = 1- a .
a
q
() p
−1
Il processo aleatorio del giocatore può anche interpretarsi come gioco aleatorio tra due giocatori: Alice ha
capitale iniziale TO , Bobo ha capitale iniziale a- TO . Per ogni istante di tempo, Alice ottiene 1€ da Bobo con
prob. p, oppure Alice cede 1€ a Bobo con prob. q. Il gioco continua finchè uno dei due giocatori non riduce
1 T
il valore del suo portafoglio a 0. Se p = q = , allora qTo = prob. di rovina di Alice = 1- o ; pTo = prob.
2 a
q a q ¿
rovina di Bobo = 1 -
a−T o
. pTo + qTo = 1 -
To
+1-
a−T o
= 1. Se p ≠ q , allora qTo =
() ()
p

p
; pTo =
a
a a a q
()p
−1

p a p a−¿
() ()
q

q
.
a
p
() q
−1
1 1 1−x ¿

x a x a−¿ x a−x ¿ xa x a−x ¿ 1−x ¿ x a −x¿
Detto q/p = x, da cui p/q=1/x, si ha: pTo + qTo = + a = a + a = a
− = 1.
1
−1 x −1 1− x x −1 1−x 1−x a
xa xa
Quindi, in generale qTo + pTo = 1.
Nell’interpretazione del gioco Alice/Bobo, cosa succede se il capitale iniziale di Bobo è molto più grande
q a q ¿
del capitale iniziale di Alice? Consideriamo a →+∞. Sia p < q . Allora qTo =
() ()
p

p a →+∞
1;
a
q −−−−−−−→
() p
−1

q a q ¿
To a →+∞ p() ()

p q ¿
sia p = q. Allora, qTo = 1 -
a −−−−−−−→
1; sia p > q. Allora qTo =
q a ( ) =
p
. Pertanto, la prob.
()
p
−1
di rovina di Alice contro un avversario infinitamente ricco è pari a 1 se p ≤ q. Determiniamo ora il guadagno
atteso del giocatore: E(G) = (1- qTo ) a – To . Dimostrazione: E(G)= pTo (a- To ) + qTo (– To) = pTo a- pTo To - To
qTo = pTo a - To = (1- qTo ) a- To . Il processo del giocatore è un processo di Markov, infatti: P(Tt+1 =x+1| Tt
1
=x)=p; P(Tt+1 =x-1| Tt =x)=q; P(Tt+1 =y | Tt =x)=0 , per y ∉ { x +1 , x−1 } . Inoltre, E(Tn+1 | Tn = x) = ( x+1) ∙ +
2
1
(x-1) ∙ = x. Ossia il valore atteso di Tn+1 corrisponde al valore assunto da Tn . Pertanto, il processo del giocatore è
2
una martingala.

Abbiamo calcolato: la prob di vittoria del giocatore, ossia la prob. di raggiungere a ≥ To prima di raggiungere 0: la
prob. di rovina del giocatore, ossia la prob. di raggiungere 0 prima di raggiungere a. Tali probabilità sono indicate con:
pTo = P (TN = a | To); qTo = P (TN = 0 | To). Qui, N = min { n :T n ¿ 0 oppureT n=a } è una variabile aleatoria che indica il
tempo necessario per raggiungere 0 oppure a. Osserviamo che N<+∞ . Infatti, siano dati gli eventi, 0≤ k ≤ n. EK = ”il
giocatore vince in ogni istante di tempo tra Ka e (K+1) a – 1”. Ora E K sono indipendenti →EKC sono indipendenti. N >
na → tutti gli EK con 0 ≤ k ≤ n non si realizzano. Quindi, P(N>na | To ) ≤ P (¿ k =0 ¿ n−1 Eck ) = (1-~
p ) per ogni n (~
p=
P (EK ) = pa ). 0≤ P (N=∞∨T o ) ≤ P (N>na¿ T o). (quest’ultimo per n→ ∞ tende a 0). Quindi, P( N =∞∨T o) = 0. Ora
si calcoli |E(N) = DTo , durata media del gioco. Sia g (To) = | E (N | To). Vale: g (To) = p g (To+1) + q g (To-1)+1 con
g(0)=0=g(a). -1 = p g (To+1) - g (To) + q g (To-1) che è una equazione alle differenze del secondo ordine. Una soluzione
particolare è data da: g (To) = k + l To + m To2 . I valori k, l , m opportuni si ricavano sostituendo tale espressione in
To
quella precedente. Ne deriva g (To) = se p ≠ q . La soluzione dell’omogenea associata g h (To) = pgh (To+1)+qgh
q−p
To
q
q T o
To a p
1− ()
(To-1 ). g h (To) = A+B
p ()
. In generale, si ha: g (To) = −
q−p q− p q a con p≠ q. Se p=q, allora si prova
1−
p ()
che g (To) = To (a- To) con p=q=1/2.
Il modello stocastico per il cash management: riserva frazionaria (reserve ratio): percentuale di depositi bancari che
per legge la banca è tenuta a detenere sotto forma di contanti o di attività facilmente liquidabili. Modello stocastico:
dividere il periodo considerato in brevi ed equidistanti intervalli di tempo 0 = t 0 < t1 <..< tn <..; assumere che i depositi
bancari aumentino in ogni istante di tempo secondo la legge: Yn=1 con prob. 1/2, -1 con prob. 1/2; fissare un livello
n
iniziale di deposito To = s; considerare il processo dei depositi disponibili dato da: Tn = To + ∑ Y j liquidità totale al
j=1
tempo n. Un’azienda necessità di intervenire se Tn diventa troppo alto o basso. Se Tn ↓ 0, allora l’azienda interviene
per ripristinare un certo livello ottimale pari ad s; se Tn ↑ S, allora l’azienda interviene acquistando titoli finanziari per
ridurre le riserve ad s. Il processo di liquidità si configura pertanto come una sequenza di cicli. Ora sia k, 0<k< S, uno
dei possibili livelli di liquidità e sia WSK il numero medio di visite al livello k prima che termini con un ciclo iniziato
N−1
dal livello s. WSK = E ( ∑ 1{T =k } ¿¿ , con 1{T
j j =k } = 1 se Tj= =k, 0 altrimenti. Si può provare che WSK =
j=1

1 1
W S −1 ,K + W S +1 , K +δ S , K , con δ S , K = 1 se k=s, 0 se k≠s , con W0K = WSK = 0. Per risolvere tale equazione alle
2 2
differenze procediamo in due passi: determiniamo la soluzione dell’eq. omogenea associata: W h SK =
1 h 1
W S −1 ,K + W hS +1 , K che va ricercata tra le funzioni del tipo WS,K = A+Bs; determiniamo una soluzione particolare
2 2
p 1 p 1 p
dell’eq. non omogenea: W SK =δ SK + W S−1 , K + W S +1 , K che si può riscrivere come: -2 δ SK = W pS−1 , K - 2W pSK +
2 2
p
W S+1 , K . Una soluzione particolare si può ricercare tra le funzioni del tipo C+Ds+Es 2 , che hanno differenze del

secondo ordine costanti. In particolare, la soluzione è: W S , K =


p
{CE++ DsFs ,,sese ss>k≤ k . Una verifica diretta fornisce

0 , se s ≤ k k
W pS , K =
{2(k−s), se s> k
= - 2 max (s-k, 0) . Tenendo conto delle condizioni iniziali si ha: WSK = 2 (s (1-
S
) – max

(s-k,0)).
Consideriamo ora il primo istante di tempo N in cui il processo raggiunge 0 oppure S. N è una variabile aleatoria che
dipende dal processo considerato. Sappiamo che E(N) = s (S-s). Consideriamo ora il costo medio per possedere
liquidità durante il ciclo i-mo, partendo dal livello iniziale s. Si denoti tale costo con Ws. Sia r il costo per unità di
S −1 S −1 s−1
s
denaro e per unità di tempo per possedere liquidità. Si ha: Ws = ∑ r K W SK = 2 ( ∑ rk (S−k )−∑ r k (s−k ) ¿ ¿
k =1 S k=1 k=1

s rS (S−1)( S+1) rs( s−1)( s+1) s


=2( ( )− ¿ = r (S2 – s2 ) = Ws , costo medio per possedere liquidità durante il
S 6 6 3
ciclo i-mo.
Valutiamo ora il comportamento a lungo termine del processo. Osserviamo che i cicli sono indipendenti, il costo per
far ripartire ogni ciclo è pari a k; Ni indica la lunghezza del ciclo i; Ri indica il costo della liquidità durante il ciclo i. Il
s 2 2
costo totale negli n cicli è perciò nK+R1 + R2 +..+Rn . Costo atteso nel ciclo i-mo: k + E (Ri) = k + r (S – s ) .
3
N 1+ N 2+..+ N n k + E( R I )
Lunghezza attesa dell’i-mo ciclo = s (S-s). Quindi, costo medio per ciclo =
n E (NI )
k +( 1/3)r s (S 2−s2 ) k +( 1/3)r S 3 x (1−x 2 )
. Ponendo x=s/S, si ha: costo atteso (long run) = = f (x, S). Siamo
s (S−s) S2 x( 1−x)
1 /3
3k
interessati a min f (x, S) per 0<x<1 e S>0. Si calcola che il minimo è raggiunto per il punto x=1/3, S= 3 ( )
4r
.

Dimostrazione (teorema) (da ripetere sul foglio):


si noti che, per 1 ≤ ¿ ≤ a-1, si ha: TO=TO+1 con prob. p, TO-1 con prob.q.
Pertanto, qTo = p qTo+1 + q qTo-1 , per 1 ≤ ¿ ≤ a-1. (qTo prob. di rovina se il portafoglio vale TO ). Inoltre, si
assume qO=1 e qa =0. Riscriviamo nella forma p qTo + q qTo = p qTo+1 + q qTo-1 ; p (qTo+1- qTo ) = q(qTo - qTo-1);
q¿+1−q ¿ q
= , per 1 ≤ ¿ ≤ a-1. Distinguiamo ora due casi: sia p=q=1/2. Allora si può ricrivere nella forma
q¿ −q ¿−1 p
q¿+1−q ¿ q +q
= 1 per 1 ≤ ¿ ≤ a-1 . Da cui segue che qTo = ¿+1 ¿−1 . Pertanto, la funzione TO → qTo , 1 ≤ ¿ ≤ a-1, è
q¿ −q ¿−1 2
q 0=1= A+ B ∙ 0 A=1
lineare e può scriversi nella forma qTo = A+BTO. Ponendo { ,
qa =0=A +B ∙ a B=−1/ a { .

T
Si ricava qTo = 1- o . Ora, sia p≠q . Allora è equivalente a dire che (q ¿+1−q¿ ¿ = bTo rappresenta una progressione
a
q q ¿
geometrica di ragione ( )
p
. Ne segue che q ¿ = A + B
p ( )
per opportuni A, B ϵ R. Per determinare A e B si

qo =1= A+ B A=1−B
impongono le condizioni:
{
qa =0=A +B
q ;
()
p
a

{
1−B+B
q a
p ()
=0
;
a
q
()

{
p
A= q a q ¿
A=1−B
() ()
{ ()
a

( qp ) −1

B=
−1 p p
; . Quindi, qTo = che era quanto si voleva dimostrare.
q a q a

p
−1
B=
−1
q a
() p
−1

()
p
−1