Sei sulla pagina 1di 11

GIOCHI STATICI CON INFORMAZIONE COMPLETA

GIOCHI IN FORMA NORMALE

Un gioco in forma normale specifica:


1. i giocatori che partecipano al gioco i=1..n
2. le strategie a disposizione di ogni giocatore si Si (coincidono con le azioni nei giochi
simultanei con informazione completa)
3. i payoff relativi ad ogni giocatore in relazione a qualsiasi combinazione di strategie s,
ui=ui(s) [s S1 x S2 x x Sn]

La rappresentazione in forma normale di un gioco G = {S1,..,Sn; u1,..,un}

Simultaneit logica e cronologica

Concetto di equilibrio una funzione che associa ad un gioco una specifica combinazione di
strategie, caratterizzata dal fatto di essere composta da tutte strategie soddisfacenti per il
rispettivo giocatore

: G {s1,..,sn}
ELIMINAZIONE DI STRATEGIE DOMINATE

Il dilemma del prigioniero


P2 Tacere Parlare
P1
Tacere -1,-1 -9,0
Parlare 0,-9 -6,-6

Strategie dominate: si dominata se si | ui(si,s-i)>ui(si,s-i) s-i

Stretta e debole dominanza


P2 Tacere Parlare
P1
Tacere dominata da Parlare
Tacere R,R S,T
Parlare T,S P,P

In generale lequivalente del dilemma del prigioniero si ha quando


T(entazione)>R(icompensa)>P(unizione)>S(provvedutezza)

Il problema del free-riding pu essere interpretato come un dilemma del prigioniero


ELIMINAZIONE ITERATIVA DI STRATEGIE DOMINATE

In questo gioco non esiste ununica combinazione di strategie tutte non dominate

G2 Sx C Dx
G1
Su 1,0 1,2 0,1
Gi 0,3 0,1 2,0

{Su,C} tuttavia sopravvive a una iterativa eliminazione di strategie dominate

necessaria unassunzione sulla razionalit dellavversario (common knowledge)

E comunque ci sono giochi che ancora non riescono ad essere risolti

Risolvere significa fornire una previsione dellesito G2 Sx C Dx


G1
Su 0,4 9,0 5,3
C 4,0 0,4 5,3
Gi 3,5 3,5 6,6
EQUILIBRIO DI NASH

Una previsione strategicamente stabile (self-enforcing) prevede che la combinazione di strategie


sia composta da tutte strategie dalle quali nessun giocatore singolarmente desidera deviare

Nel gioco G, {sN1,..,sNn} detta combinazione di strategie di equilibrio di Nash se


ui(sNi,sN-i) ui(si,sN-i) si, i,
cio se sNi risolve il problema max si [ui(si,sN-i)]

Risposte ottime e funzione di reazione nello spazio delle strategie


(R*i = Ri(s-i) Ri(s-i) = argmax si [ui(si,s-i)])

G2 Sx C Dx
Proposizione A Nel gioco in forma normale G, se
leliminazione iterata di strategie strettamente domi- G1
nate rinuove tutte le strategie salvo una per ogni Su 0,4 9,0 5,3
giocatore, allora le strategie residue costituiscono una
combinazione di strategie di equilibrio di Nash C 4,0 0,4 5,3
Gi 3,5 3,5 6,6

Proposizione B Nel gioco in forma normale G, se


una combinazione di strategie di equilibrio di Nash,
allora esse sopravvivono alleliminazione iterata
di strategie strettamente dominate
ARBITRATO CON OFFERTA DEFINITIVA

In una tale situazione due giocatori fanno unofferta e un arbitro imparziale ( non giocatore ) ne
seleziona una in modo vincolante

In questo caso 1 e 2 offrono simultaneamente w1 e w2, in una situazione tale per cui u1(w) = -w
e u2(w) = w, e dove si sa che larbitro sceglie il valore pi prossimo a un valore target x, del
quale ai giocatori nota solo la densit di probabilit f(x). Naturalmente sar w1<w2

Poich Prob(w1 selezionato) = Prob(x<(w1+w2)/2) = F((w1+w2)/2) e


Prob(w2 selezionato) = 1 - F((w1+w2)/2),
il valore atteso selezionato dallarbitro sar:
E(w) = w1 F((w1+w2)/2) + w2 [1 - F((w1+w2)/2)]

La combinazione di strategie di equilibrio sar:


w1* = argminw1 E(w(w1,w2*))
w2* = argmaxw2 E(w(w1*,w2))

Le condizioni del primo ordine sono:


- (w1*-w2*) f((w1*+w2*)/2)/2 = F((w1*+w2*)/2)
- (w1*-w2*) f((w1*+w2*)/2)/2 = [1 - F((w1*+w2*)/2)]

Si ricava che la media delle offerte allequilibrio deve uguagliare la mediana della
decisione preferita dallarbitro. Quanto le offerte sono lontane dalla media dipende dalla
varianza di f: pi si aggressivi, pi elevato il payoff in caso di vittoria, ma pi bassa la
probabilit di vincere (problema simile a quello di asta in busta chiusa al primo prezzo)
LA TRAGEDIA DEI COMMONS [Hume, 1739]

Il problema delluso delle risorse comuni: n allevatori possiedono gi (i=1..n) capre che pascolano
su un prato della comunit. Il costo di acquistare e allevare una capra c, il payoff di ogni
allevatore v(gi) per ogni capra con v<0 e v<0

Il payoff individuale, dunque, se la variabile strategica g ed scelta simultaneamente da tutti


gli allevatori :
ui(gi,g-i) = gi v(gi+g-i) c gi

Lequilibrio di Nash quindi definito dal seguente problema:


g*i = argmaxgi [gi v(gi+g*-i) c gi] i

Le condizioni del primo ordine sono


v(gi+g*-i) + gi v(gi+g*-i) c = 0 o equivalentemente v(G*) + 1/n G* v(G*) c = 0

Lottimo sociale prevede:


G = argmaxG [G v(G) c G]

la cui condizione del primordine


v(G) + G v(G) c = 0

Da cui si ricava facilmente che G* > G per un problema di free riding


MOLTEPLICIT DELLEQUILIBRIO DI NASH E STRATEGIE MISTE

La battaglia dei sessi


Pat Opera Lotta
Chris
Opera 2,1 0,0
Lotta 0,0 1,2

Matching pennies
Ug Testa Croce
Diff
Testa -1,1 1,-1
Croce 1,-1 -1,1

Sono entrambi giochi i cui payoff dipendono dal fatto che i giocatori abbiano coordinato o meno
le proprie azioni e, nel caso, su quale azione. Tipicamente non sono caratterizzati da unicit
dellequilibrio, e quindi permane incertezza sulle azioni dellavversario

Strategia mista una distribuzione di probabilit {pi1,..,piK} con k=1..K pik=1, sulle strategie in Si
= {si1,..,siK}
La definizione che stata data di dominanza in un contesto di strategie pure prevede che
se si dominata, allora non esiste alcuna strategia pura s-i degli avversari tale per cui si ne sia
risposta ottima. Si pu dimostrare che se si dominata, allora non esiste neppure una strategia
mista degli avversari per la quale si possa essere risposta ottima

Il viceversa falso se ci limitiamo alle strategie pure, ma diventa vero ammettendo il ricorso a
strategie miste. In particolare si pu affermare che:

se non esiste alcuna s-i tale da rendere risposta ottima per i la strategia si, allora
significa che esiste una strategia si (eventualmente mista) che domina strettamente
si
2 L R
1
T 3,_ 0,_
Nel gioco qui a fianco, B non risposta ottima a nessuna M 0,_ 3,_
strategia di 2, ma n T n M dominano B. Una strategia
B 1,_ 1,_
che prevede di giocare pT = e pM = , domina tuttavia
strettamente B (neutralit al rischio)

Il concetto di equilibrio di Nash pu evidentemente essere esteso ad un contesto di strategie


miste, ricordando tra laltro che una strategia pura un caso particolare di strategia mista
Se in un gioco a due giocatori e due azioni {a,b} 1 si attende da 2 una strategia {q,1-q}, i
payoff per 1 diventano

E(u(a)) = q u(a,a)+(1-q) u(a,b) e E(u(b)) = q u(b,a)+(1-q) u(b,b)

In funzione della propria aspettativa circa q (giocare testa), 1 potr verificare se la propria
risposta ottima sia a oppure b. In particolare esister una soglia
q = [u(b,b)-u(a,b)]/[u(b,b)+u(a,a)-u(a,b)-u(b,a)]
al di sopra (o al di sotto) della quale a risposta ottima e viceversa.
Per q=q, 1 risulta indifferente alla strategia pura da adottare

Nel caso dei matching pennies, ad esempio, q=

Analogamente si pu ricavare mettendosi dal punto di osservazione di 2, ricavando r


r q r

r*=RDIFF(q)
q*=RUG(r)
r=

q r q

q= 1 r= 1 q= 1
Pi in generale, sempre per due giocatori:
J K
v1 (p1 , p2 ) = E(u1 (p1 , p2 )) = p1 jp2k u1 (s1 j , s 2k )
j =1k =1
J K
v 2 (p1 , p2 ) = E(u2 (p1 , p2 )) = p1 jp2k u2 (s1 j , s 2k )
j =1k =1

In altri termini, la condizione richiesta dal concetto di equilibrio di Nash prevede che:

v1 (p *1 , p *2 ) v1 (p1 , p *2 )
p1 , p2
v 2 (p *1 , p *2 ) v 2 (p *1 , p2 )

Le condizioni del primo ordine prevedono inoltre che pi sia risposta ottima per li-esimo
giocatore, cio che p1j > 0 sse anche la relativa strategia pura risposta ottima a p2, cio:

K K
p2k u1 (s1 j , s 2k ) p2k u1 (s1 j' , s 2k ) j'
k =1 k =1

e analogamente per 2

Interpretazione della strategia pura: casualit vs. incertezza del comportamento avversario
TEOREMA DI NASH (1950)
x >z y >w DOMINANZA
x G2 Sx Dx
<z y <w DOMINANZA
Quattro casi principali: G1
x >z y <w
x <z y >w Su x,_ y,_
Gi z,_ w,_

Se chiamiamo {r,1-r} e {q,1-q} le generiche strategie di 1 e di 2, nel primo e nel secondo caso,
r*=r(q) una costante (0 o 1); nei casi successivi esiste una soglia q=(w-y)/(x-z+w-y) che
segna il passaggio da r* = 0 a r* = 1. I casi x=z e/o y=w: per definizione una delle due
strategia domina (debolmente) laltra, e quindi la curva di reazione a L (q = 0 oppure q = 1)

Curve di reazione di questo genere hanno per forza almeno unintersezione nel piano r/q
allinterno del quadrato 0/1

Ne deriva che nei sedici casi possibili si pu ottenere: 1) un unico NE in strategie pure; 2) un
unico NE in strategie miste; 3) due NE in strategie pure e un NE in strategie miste

La generalizzazione a n giocatori e generico numero (finito) di strategie, il teorema di Nash,


che dice che:
G(S1,..,Sn;u1,..,un), se n e Si sono finiti i, ha almeno un NE eventualmente a strategie miste

La dimostrazione si fonda sul th. del punto fisso: se f(x) continua in [0,1] | x*f(x*)=x*

Potrebbero piacerti anche