Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
GIOCO DI STRATEGIA
PAYOFF
PREMIO
per ciascuno dei giocatori dipende non solo dalle sue scelte ma anche dalle scelte degli altri
partecipanti al gioco.
Pi precisamente il gioco di strategia
linsieme di regole che vincola le scelte dei giocatori e ne definisce i payoff.
Queste regole sono conosciute con certezza da tutti i giocatori. Un esempio, estraneo
alleconomia, ma appropriato, il gioco degli scacchi.
1
11 novembre 2014
IBM
Toshiba
Che devono scegliere il sistema operativo per i personal computer che producono e vendono.
11 novembre 2014
DOS
prodotto da IBM, e
-
UNIX
in versione Toshiba.
Se entrambe scelgono lo stesso sistema operativo, i computer prodotti dalle due societ sono
compatibili ed entrambe le societ ne traggono beneficio. In questo caso, la societ produttrice del
software guadagna
600 milioni di dollari e laltra societ 200 milioni di dollari. Se le scelte sono diverse, i computer
non sono compatibili ed entrambe guadagnano solo 100 milioni di dollari.
Le regole del gioco ed i relativi payoff possono essere rappresentati mediante un albero decisionale
(albero del gioco, forma estesa), costituito da un insieme di
NODI
o punti decisionali, collegati fra loro da segmenti, o
RAMI.
GRAFICO I
IBM
1
DOS
Toshiba
UNIX
2
Toshiba
DOS
UNIX DOS
UNIX
(600,200) (100,100) (100,100) (200,600)
Ogni nodo corrisponde ad una scelta da parte di un giocatore. Ogni ramo corrisponde alle
possibilit di scelta a disposizione del giocatore. Una data sequenza di nodi e rami detta
STRATEGIA
Ad ogni strategia associato uninsieme di payoff, uno per ciascun giocatore, corrispondente ai
numeri indicati entro parentesi al termine di ogni percorso (il primo riferito allIBM, il secondo
alla Toshiba.
Il gioco rappresentato nel grafico I detto:
ad informazione perfetta,
3
11 novembre 2014
perch si assume le sequenze delle scelte corrispondano alla struttura dellalbero e quindi che la
prima scelta spetti ad IBM e che, quando il suo turno di scegliere, Toshiba conosca la scelta
dellIBM.
Se la scelta contemporanea, o se nessuno dei due giocatori conosce la scelta dellaltro nel
momento in cui sceglie, il gioco detto
ad informazione imperfetta
e pu essere rappresentato nel modo seguente:
GRAFICO II
IBM
1
DOS
UNIX
Toshiba
Toshiba
2
3
DOS
UNIX DOS
UNIX
(600,200) (100,100) (100,100) (200,600)
Il segmento tratteggiato che unisce i nodi 2 e 3 significa che la scelta di Toshiba, che pu essere o
non essere contemporanea a quella di IBM, avviene senza conoscere la scelta di IBM, cio senza
sapere se si trova nel nodo 2 oppure nel nodo 3. Lo stesso vale naturalmente per IBM.
Per rappresentare un gioco ad informazione imperfetta in forma estesa si pu anche racchiudere i
nodi 2 e 3 in un ovale. Noi useremo tuttavia sempre la notazione illustrata nel grafico, perch pi
semplice.
Un gioco ad informazione imperfetta pu essere rappresentato anche in
forma normale
mediante una tavola a doppia entrata.
TAVOLA I
Societ
Toshiba
IBM
Sist. Operativo
DOS
UNIX
DOS
600,200
100.100
UNIX
100,100
200,600
11 novembre 2014
2. se IBM sceglie DOS e Toshiba sceglie UNIX, o viceversa, entrambe guadagnano solo 100
milioni di dollari,
3. se Toshiba sceglie UNIX e IBM sceglie DOS, Toshiba guadagna 600 milioni di dollari ed IBM
solo 200.
Si noti che:
qualunque sia la scelta dei due giocatori, entrambi hanno un guadagno netto.
Quindi, la somma dei payoff positiva.
Quando la somma dei guadagni netti compensa esattamente la somma delle perdite, il gioco detto:
a somma nulla.
ESEMPIO 2:
Un esempio di gioco a somma nulla il gioco dei matching pennies: due bambini scelgono
contemporaneamente un lato di una moneta. Se entrambi scelgono lo stesso lato il bambino 2
guadagna un penny, perso dallaltro. Se scelgono lati diversi, il bambino 1 guadagna un penny,
perso dallaltro. Anche questo gioco pu essere rappresentato in forma normale, come nella tavola
II:
TAVOLA II
Bambino
2
Esito del lancio
Testa
Croce
Testa
-1,+1
+1,-1
Croce
+1,-1
-1,+1
Croce
Bambino 2
3
Croce Testa
(+1,-1) (+1,-1)
Croce
(-1,+1)
Si noti che
n nellesempio 1 n nellesempio 2 le regole del gioco prevedono la possibilit di accordi
fra i giocatori.
5
11 novembre 2014
ognuna delle quali scelta da uno ed un solo giocatore, tale che, avendo definito
11 novembre 2014
ESEMPIO 3
Un esempio di equilibrio con strategia dominante il seguente:
TAVOLA III
Societ
Ford
Politica di prezzo
Prezzo alto
Prezzo basso
General Motors
Prezzo alto
Prezzo basso
500,500
100,700
700,100
300,300
Le due societ possono scegliere solo fra due politiche di prezzo (prezzo alto e prezzo basso).
Lesito della scelta di ciascuna dipende dalla scelta della concorrente. I payoff, in milioni di dollari,
sono indicati nella caselle centrali; come sempre il primo numero riferito alla Ford, il secondo alla
General Motors. Il gioco ad informazione imperfetta e non cooperativo.
facile verificare che la strategia prezzo basso la migliore per entrambe le societ,
indipendentemente dalla strategia scelta dal concorrente. Quindi prezzo basso la strategia scelta
da entrambe le societ, con un payoff di 300 milioni di dollari per ciascuna. Si noti che:
la strategia dominante non quella ottima nel senso di Pareto.
Infatti entrambe le societ potrebbero migliorare i loro risultati economici se stipulassero un
accordo e praticassero entrambe una strategia di prezzo alto. Questa tuttavia impossibile in un
gioco non cooperativo. Inoltre, anche nellipotesi che laccordo venisse stipulato, esiterebbe un
incentivo per entrambe le societ a violarlo (se una sola delle due viola laccordo il suo payoff
aumenta da 500 a 700 milioni di dollari).
Il gioco appena illustrato un esempio del gioco del dilemma del prigioniero.
Lascio a voi di rispondere al seguente problema:
esiste una strategia dominante nel gioco della scelta del sistema operativo di IBM e
Toshiba e nel gioco dei matching pennies?
La soluzione dei giochi mediante eliminazione delle strategie dominate, qualora sia possibile,
presuppone la razionalit dei giocatori. Lipotesi di razionalit non ha trovato conferma
nelleconomia sperimentale. In particolare, anche i giocatori razionali non scelgono la strategia
dominante se non sono certi della razionalit delle scelte dei loro avversari.
Il metodo inoltre inefficace quando una strategia dominante non esiste e quando esistono pi
equilibri di Nash. Gli equilibri multipli possono, a volte, essere ordinati, in modo da rendere
possibile una scelta per i giocatori. Anche in questo caso, tuttavia, non sempre i giocatori sono in
grado di riconoscere il pi vantaggioso in una molteplicit di equilibri possibili.
Il seguente:
ESEMPIO 4
illustra un caso in cui
7
11 novembre 2014
Generale 2
Generale 1
Strategie
Ritirarsi
Attaccare
Ritirarsi
5,8
8,0
Attaccare
6,6
2,3
Abbiamo definito equilibrio di Nash una coppia di strategie, una per ogni generale, tale che, se si
realizza, non esiste alcun incentivo per alcun giocatore a modificare la sua scelta. E facile verificare
che nellesempio 4 tutte le coppie di strategie implicano un incentivo a modificare la propria scelta
per almeno uno dei due generali. Consideriamo la coppia di strategie con payoff (6,6), in cui il
generale 1 si ritira ed il generale 2 attacca. Questa non pu essere un equilibrio perch, se il
generale 1 si ritira, anche al generale due conviene ritirarsi, ottenendo cos un payoff di 8. Daltra
parte anche la strategia (5,8), nella quale entrambi i generali si ritirano non pu essere un equilibrio
perch, se il generale 2 si ritira, al generale 1 conviene attaccare, dato che questo porterebbe il suo
payoff ad 8.
Unequilibrio di Nash che stabilisce una regola per lazione che ciascun giocatore deve compiere
detto
p i 0 , per i 1, , N
e
pi 1
i
11 novembre 2014
1)
5q 6(1 q ) 6 q
se si ritira,
2)
8q 2(1 q ) 2 6q
se attacca.
Quale delle due strategie sia pi conveniente per il generale 1 dipende chiaramente da valore di q.
Supponiamo che
il generale 2 scelga la strategia mista con q = 0,5.
I payoff per il generale 1 saranno:
5,5 se si ritira e 5 se attacca.
Quindi, se il generale 2 sceglie una strategia mista con q=0,5 il generale 1 sceglie la strategia pura
di ritirarsi, perch questa gli assicura:
un premio atteso pi elevato.
Si noti che le equazioni 1 e 2 che definiscono il guadagno (payoff) atteso associato ad ogni strategia
per il generale 1, sono
funzioni di utilit attesa, se il payoff una misura dellutilit di ogni strategia per il
giocatore.
Una funzione di utilit con queste caratteristiche detta
funzione di utilit di Von Neumann-Morgenstern.
Poich la strategia mista con q = 0,5 del generale 2 induce la scelta di una strategia pura per il
generale 1, questa strategia mista
non pu essere un equilibrio con strategie miste.
Continuando ad ipotizzare un gioco con due soli giocatori,
si ha un equilibrio con strategie miste quando ciascun giocatore adotta una strategia mista
in corrispondenza della quale il premio atteso che laltro giocatore riceve sempre lo
stesso, qualunque sia la strategia pura che questo giocatore adotta.
Supponiamo che, nellesempio 4, il generale 2 scelga la strategia mista con
q
4
7
, 1 q
3
7
--------------------------------------------------------------------------------------------------------9
11 novembre 2014
4
3 38
6
7
7
7
se si ritira
8
4
3 38
2
7
7
7
se attacca.
Poich il generale 1 indifferente sulla strategia da adottare, potrebbe affidarsi anche lui al caso ed
associare una probabilit p alla ritirata ed una probabilit 1-p allattacco.
Affinch la strategia mista del generale 1 ammetta un equilibrio con strategie miste, il valore di
p deve essere tale che il premio atteso del generale 2 per ogni strategia sia lo stesso. Ci avviene se
il generale 1 sceglie la strategia mista con
p
3
5
; 1 p
2
5
se si ritira
3
2 24
6 3
5
5
5
se attacca.
---------------------------------------------------------------------------------------------------------
4
7
, p
3
5
10
11 novembre 2014
ESEMPIO 5
Il giocatore 1 un bambino capriccioso, che il sabato pomeriggio vuole andare al cinema. Suo
padre, giocatore 2, vuole invece portare tutta la famiglia in visita da zia Sofia. Il bambino pu
accettare - payoff (1,1) - o rifiutare, ma, se rifiuta, il padre lo pu punire, tenendolo in casa, oppure
adeguarsi e portare la famiglia al cinema - payoff (2,0). Se la punizione viene attuata, tuttavia, il
bambino urla e strepita e tormenta tutta la famiglia - payoff (-1,-1)
La rappresentazione in forma estesa del gioco riportata nel grafico IV:
Giocatore 1
Sinistra
(zia Sofia)
Destra
(cinema)
Giocatore 2
(1,1) Sinistra
2
Destra
(punisce)
(non punisce)
(-1,-1)
(2,0)
GRAFICO IV
Se il bambino accetta di andare in visita da zia Sofia (strategia S) il gioco finisce. Quindi questa
strategia un equilibrio di Nash.
Se il bambino si rifiuta di andare in visita da zia Sofia, cio sceglie D, il gioco arriva al nodo 2 nel
quale spetta al padre scegliere fra arrabbiarsi e punire il bambino (strategia DS) oppure non
arrabbiarsi ed andare al cinema (strategia DD). Poich la strategia DS comporta per lui un payoff
negativo, il padre, con ogni probabilit, sceglie di non arrabbiarsi e di andare al cinema, cio DD, il
che comporta per lui un premio nullo ed un premio pari a 2 per il bambino. Anche in DD il gioco
finisce, quindi anche DD un equilibrio di Nash.
Se confrontiamo i due equilibri, notiamo che il primo
sorretto dalla minaccia paterna di chiudere il bambino in casa,
ma questa
minaccia non credibile,
perch il padre stesso non ha interesse ad attuarla. Solo la strategia DD corrisponde ad
un equilibrio di Nash sorretto da una minaccia credibile.
In pratica, solo la soluzione con payoff (2,0), andare al cinema, rilevante allinterno del sottogioco
costituito dalle strategie possibili a partire dal nodo 2.
11
11 novembre 2014
Giocatore 2
S
Giocatore 2
2
D
3
S
(4,4) (4,4)
Gio. 1 5 Gio. 1
S 4 D S
D
(5,0) (7,1) (2,1) (3,3)
Iniziando dai sottogiochi che partrono dai nodi 5 e 4 facile verificare che i payoff (5,0) e (2,1)
corrispondono a strategie sostenute da minacce non credibili.
Procedendo allindietro, facile verificare che, se 1 gioca per primo, sceglier S ed, essendo la
scelta di 2, nel nodo 2, irrilevante, il gioco finir.
12