Sei sulla pagina 1di 45

Roberto Lucchetti, Monica Salvioli

Introduzione alla Teoria dei Giochi

Prima versione
Prefazione
La teoria dei giochi è una disciplina matematica che si occupa di analiz-
zare e prevedere il comportamento di agenti razionali che interagiscono.
Ad esempio, se una persona deve andare da Milano a Torino in automo-
bile, sa che ci sono un certo numero di itinerari possibili. Quale scegliere?
È molto probabile che il tempo di viaggio sia per lui importante, e pos-
siamo supporre che voglia minimizzare il tempo passato in automobile.
Ma quanto sia questo tempo dipende, in generale, da quante persone tro-
va sulla strada che percorre. Ovviamente anche gli altri automobilisti
hanno di fronte un problema simile. Quindi, la decisione che un auto-
mobilista deve prendere sarà più o meno buona a seconda di quel che
faranno gli altri automobilisti. Facciamo un altro esempio. Supponiamo
di avere due venditori di gelati che debbano decidere dove piazzarsi su
una spiaggia lunga 1 km, supponiamo che i bagnanti siano uniformemente
distribuiti sulla spiaggia1 e che si rechino dal venditore più vicino. Do-
ve dovrebbero piazzarsi i due venditori, se si comportano razionalmente,
cioè in modo da ottenere il massimo possibile?
Probabilmente qualcuno potrebbe chiedersi perché chiamare teoria dei
giochi quella parte della matematica che si occupa di questi problemi. La
risposta è molto semplice. Il gioco è un magnifico modello di situazione
interattiva. Come possiamo definire un gioco, magari pensando a quelli
da tavolo più famosi, come gli scacchi e la dama? Potremmo dire cosı̀:
ci sono dei giocatori che, seguendo certe regole, cercano di arrivare alla
conclusione del gioco nella situazione a loro più favorevole; nei giochi più
semplici di solito il giocatore vuole vincere. È chiaro che una descrizione
simile si applica anche agli esempi precedenti, dove le regole rappresen-
tano le azioni che le persone possono compiere, ad esempio gli itinerari
possibili per chi va da Milano a Torino. Si adatta anche a tantissime
situazioni quotidiane, perché si può vedere come gioco la competizione
di due supermercati per accaparrarsi i clienti, il rapporto che si crea tra
medico e paziente, la contrattazione tra due persone, un’asta per aggiu-
dicarsi un bene.
Ai suoi albori la teoria è stata pensata avendo in mente agenti umani, per
applicarla soprattutto in Economia, ma successivamente si è espansa in
1
Vedremo poi in un esercizio come formalizzare matematicamente questi concetti.
3

molte direzioni, sia in altri ambiti delle attività umane, sia considerando
agenti, cioè giocatori, diversi dagli umani, come per esempio gli animali.
Il problema di capire l’equilibrio che si crea tra due specie che si conten-
dono uno stesso territorio viene studiato anche con metodi di teoria dei
giochi, e in letteratura si possono trovare lavori in cui i giocatori sono
geni e proteine.
Ci sono altri aspetti che rendono affascinante la teoria dei giochi. Come
abbiamo accennato all’inizio, si vuole cercare di definire il comportamento
razionale degli agenti. Che cosa significa essere razionali? E se cerchiamo
una definizione di razionalità, davvero questa si può applicare agli esseri
umani, cosı̀ come a falchi e colombe o a geni e proteine? È quindi scon-
tato che questa teoria abbia molti spunti di incontro e discussione con
discipline apparentemente lontane dalla matematica, come la filosofia e
la psicologia. Ma c’è anche un altro aspetto molto interessante legato alla
teoria dei giochi. Basterà farne un piccolo assaggio, come ad esempio in
queste note, per rendersi subito conto che, a parte in giochi talmente sem-
plici da essere un po’ stupidi, trovare una soluzione razionale (una volta
stabilito che cosa questo voglia dire) di un gioco propone un problema
di calcolo in genere terribilmente difficile. Ecco allora che l’informatica,
in particolare l’intelligenza artificiale, utilizza spesso giochi per testare
metodi che velocizzino il modo di calcolare soluzioni che richiedono conti
particolarmente complicati.
Concludiamo questa breve introduzione ritornando un attimo sull’idea di
razionalità. La teoria, almeno nelle sua fondamenta, postula che gli agen-
ti siano perfettamente razionali. Qualunque questo significhi, e qualcosa
ne diremo nel primo Capitolo, appare immediatamente chiaro che non
è vero che gli uomini in genere si comportino razionalmente. In realtà,
sono più razionali falchi, geni e proteine, anche se evidentemente la loro
razionalità è ben diversa da quella umana, meno consapevole e cerebrale,
ma in qualche modo forzata dalle leggi di sopravvivenza, dell’individuo e
della specie. Per questo occorre fare enorme attenzione ad applicare un
bel modellino di teoria dei giochi e dare per scontato che si ottengano
risultati straordinari: in realtà è più probabile fare errori clamorosi! Al-
lora che serve una teoria simile? Serve per molti motivi. Il primo, perché
definisce in maniera precisa che cosa significa comportamento razionale,
e quindi offre un riferimento al concetto di razionalità, secondo, perché
4

ci sono circostanze importanti in cui in effetti i giocatori si comportano


razionalmente2 e infine perché teorie come il machine learning, che par-
tono dal presupposto che non è vero che gli agenti siano razionali, e si
pongono quindi in condizioni più realistiche, hanno bisogno della teoria
di riferimento per svilupparsi; per fare un’analogia fisica, in genere i gas
in natura non si comportano come gas perfetti, ma in certe condizioni
particolari in modo molto simile, e comunque la teoria dei gas perfetti è
il punto di partenza per teorie più sofisticate e in genere più realistiche.

2
Un esempio pratico di questo tipo sono state le aste per l’assegnazione delle bande d’onda
per operatori telefonici, le cui regole sono state costruite da esperti di teoria dei giochi, e
in cui i giocatori hanno studiato il problema in modo scientifico.
1
La descrizione del gioco in forma estesa

In questo capitolo cominciamo con una breve introduzione delle basi del-
la teoria, poi passiamo a una vedere come descrivere matematicamente
alcuni dei giochi più popolari.

1.1 Le ipotesi della teoria


La prima ipotesi di base è:

Ogni agente è interessato esclusivamente ai propri obiettivi

Detto in maniera imprecisa, ogni giocatore cerca di ottenere il massimo


nel gioco, curandosi poco di quel che sarà la soddisfazione degli altri.
Un’ipotesi di comportamento che, in maniera sbagliata, potrebbe essere
definita di egoismo. Si tratta invece di un’ipotesi di tipo matematico, per
definire appunto in maniera precisa quale sia lo scopo del giocatore, ma
senza implicazioni etiche. In un gioco è assolutamente possibile assumere
che un giocatore abbia come scopo che un altro giocatore ottenga grandi
benefici. Detto in altre parole, comportamento razionale non è antitetico
a comportamento etico, sono due cose diverse, l’etica concorre a stabilire
gli obiettivi degli agenti. Una volta stabiliti questi, l’agente della teoria
fa di tutto per raggiungerli (seguendo le regole).
L’altra ipotesi, molto più articolata, è:

Il giocatore si comporta razionalmente


6 1 La descrizione del gioco in forma estesa

Questa ipotesi poi si articola in vari aspetti, vediamone i più impor-


tanti:
1. I giocatori sanno esprimere preferenze sugli esiti del gioco;
2. I giocatori sanno determinare una funzione di utilità che rappresenti
le loro preferenze, in caso sia necessario;
3. Se nel gioco sono presenti eventi probabilistici, i giocatori calcolano
le loro utilità attese seguendo le leggi del calcolo della probabilità;
4. I giocatori sanno analizzare le conseguenze delle loro azioni e di quelle
degli altri, e le conseguenze delle conseguenze . . . ;
5. I giocatori usano la teoria delle decisioni quando possibile.
Vediamo in breve che cosa significano i vari punti.
1. Saper esprimere preferenze coerenti significa saper fare una classifica
di tutti gli esiti del gioco (supponiamo per il momento che gli esiti sia-
no in numero finito). Di solito siamo capaci di fare paragoni binari. Se
chiediamo a qualcuno “preferisci una mela o una pera”, sa rispondere,
supponiamo dica una mela. Poi potete chiedere “preferisci una pera
o un arancio”? E magari vi risponde che vuole la pera. Naturalmente
potrebbe succedere che gli chiediate anche se preferisce una mela e un
arancio, e quale sarà la risposta? Se è coerente, vi deve dire una mela
. . . di solito, tra poche alternative, le persone sono in grado di espri-
mere preferenze coerenti, ma quando diventano molte comportamenti
incoerenti degli agenti sono ben conosciuti in Economia.
2. Determinare una funzione di utilità significa questo. A volte non ba-
sta che l’agente dica che la sua classifica tra i tre frutti di prima è
mela, pera, arancio. Occorre che ci dica quanta utilità associa alla
mela, alla pera, all’arancio. Potrebbe infatti essere necessario quan-
tificare quanto piaccia una mela più di un arancio. Anche di questo
vedremo esempi in seguito. Quindi una funzione di utilità associata a
preferenze coerenti significa una funzione che, se un’alternativa A per
l’agente è meglio dell’alternativa B, allora da A associa un numero
reale maggiore di quello che associa a B.
3. Saper usare le leggi della probabilità è importante non solo perché
ci possono essere delle situazioni in cui l’esito finale del gioco è de-
terminato da eventi casuali, come il lancio di una moneta o di un
dado, o il seme di una carta, ma anche perché in molti giochi non
1.1 Le ipotesi della teoria 7

è razionale giocare sempre allo stesso modo, quindi occorre alternare


le giocate; ma questo si deve fare, se siamo razionali, seguendo una
certa logica. Per esempio, se sto giocando a “carta, sasso, forbici” e
il mio avversario si accorge che io tiro una moneta per decidere se
giocare carta o sasso, e non gioco mai forbici, allora il mio avversario,
se è intelligente, può giocare in modo da riuscire a mettersi in tasca
un bel gruzzoletto se facciamo un sufficiente numero di partite: per
analizzare queste situazioni abbiamo bisogno di conoscere e utilizzare
le regole della probabilità (esperimenti interessanti mostrano che in
realtà spesso violiamo queste regole).
4. Sul saper ragionare sulle conseguenze delle azioni proprie e altrui,
e su quanto queste conseguenze abbiano a loro volta conseguenze,
qui faccio solo un esempio che mi piace molto, anche se non è un
gioco: nell’ambito dei giochi, ne vedremo in seguito. Supponiamo che
un padre metta un cappello in testa ai suoi figli e che loro possano
vedere quello degli altri ma non il proprio. Supponiamo che i cappelli
possano essere o rossi o blu, supponiamo infine che il padre metta
in testa ai figli tre cappelli rossi e dica: “almeno uno di voi ha un
cappello rosso”. Poi si rivolge al primo figlio chiedendogli il colore del
suo cappello. Risposta: non lo so. Stessa domanda al secondo, stessa
risposta. Stessa domanda al terzo, risposta: “certo che lo so, è rosso!”
Il terzo figlio ha sfruttato le risposte dei due fratelli per arrivare a una
conclusione corretta1 .
5. L’ultima richiesta di razionalità invece si può esprimere dicendo che
ogni qualvolta un giocatore può scegliere con certezza l’opzione più
favorevole per lui, allora lo sa fare. Ad esempio, se sono l’ultimo a
dover fare una mossa in un gioco, tra tutte quelle possibili farò quel-
la che mi dà la massima utilità. Questa ipotesi, molto ragionevole,
implica che la teoria dei giochi è un’estensione naturale della teoria
classica delle decisioni, dove l’agente razionale agisce da solo.
1
Che ragionamento ha fatto il terzo figlio per arrivare a dare la risposta giusta?
8 1 La descrizione del gioco in forma estesa

1.2 La forma estesa del gioco


Il primo modo di provare a modellizzare matematicamente un gioco è
quello di rappresentarlo nella cosiddetta forma estesa. Nel fare la descri-
zione di questo modello, avere in mente un esempio come la dama, gli
scacchi o il tris, può aiutare. Noi partiamo da esempi.
Esempio 1.2.1 Tre fratelli sono a casa dei nonni in vacanza, quando
ricevono un invito per andare fuori a cena con degli amici; ognuno di
loro vuole andare ma non vuole dirlo esplicitamente ai nonni per non
offenderli. La decisione se stare a casa o meno viene presa a maggioranza
e i tre fratelli votano pubblicamente uno dopo l’altro.
Per prima cosa, elenchiamo le preferenze sui possibili esiti, che in
questo caso sono identiche per i tre giocatori:
1 dire di No e andare: è la situazione ideale, assegniamo utilità massima,
per esempio 4, al giocatore che si trova in questo esito;
2 dire di Sı̀ e andare, utilità 3;
3 dire di No e non andare, utilità 2;
4 dire di Sı̀ e non andare, utilità 1.
Possiamo osservare che i valori 4. . . 1 sono arbitrari, quel che davvero
conta è come sono ordinati gli esiti, ad esempio potevamo scegliere ri-
spettivamente 40, 3 0, -7, che descrivono il gioco allo stesso modo; inol-
tre, per analizzare il gioco, non servono i numeri che associamo a ogni
situazione, quel che serve sono le classifiche sulle varie opzioni: i numeri
servono soltanto a visualizzare facilmente la classifica. Ora vediamo come
rappresentare matematicamente il gioco.
Non ci preoccupiamo per il momento di analizzarlo, piuttosto introdu-
ciamo un po’ di definizioni, che valgono per ogni gioco di questo tipo.
Quello di sotto è l’albero del gioco, che è un particolare grafo orientato,
con radice. Un grafo è un insieme di vertici o nodi e di archi o spigoli,
orientato significa che esiste un verso di percorrenza, in questo caso si
va dall’alto in basso, e non viceversa. La radice dell’albero, il vertice in
alto, rappresenta la situazione iniziale del gioco: nell’esempio di sopra
è il momento in cui il primo giocatore deve dichiarare il suo voto. Gli
altri vertici rappresentano le situazioni possibili del gioco, nell’esempio
1.2 La forma estesa del gioco 9

I
si no

II II
si no si no

III III III III


si no si no si no si no

(3,3,3) (3,3,4) (3,4,3) (1,2,2) (4,3,3) (2,1,2) (2,2,1) (2,2,2)

Figura 1.1. L’albero del gioco dei tre fratelli.

al secondo livello si trovano tutte le situazioni in cui il secondo giocatore


potrebbe trovarsi al momento di esprimere la sua azione scelta. Gli ar-
chi, che si dipartono da un vertice e arrivano a uno dei suoi cosiddetti
figli, rappresentano le azioni possibili per il giocatore che deve decidere
al vertice in questione. Cosı̀ se il primo giocatore ha detto sı̀, il secondo
si trova nel vertice di sinistra contrassegnato da II, e a sua volta ha due
azioni possibili, come ne ha nel nodo di destra. Dopo la scelta del terzo
il gioco finisce, e ad ogni situazione terminale associamo un vettore, che
rappresenta le utilità dei giocatori. È evidente l’efficacia di una rappre-
sentazione simile, in quanto una qualunque “partita” possibile di questo
“gioco” è rappresentata da un cammino che parte dalla radice in alto per
arrivare a uno dei nodi terminali in fondo: l’albero del gioco rappresenta
tutte le partite possibili.
Esercizio 1.2.1 Luca e Alice devono decidere come trascorrere la serata.
Per evitare litigi stabiliscono che Alice sceglierà se andare al cinema o
restare a casa, e successivamente Luca sceglierà che film guardare nel caso
del cinema (tra una commedia e un film di supereroi) oppure cosa fare a
casa (guardare la partita o fare un gioco da tavolo). Disegnare l’albero del
gioco e assegnare i payoff in modo che le preferenze dei giocatori siano:
• Alice: commedia (prima preferenza) - partita - gioco da tavolo - supe-
reroi (ultima preferenza);
10 1 La descrizione del gioco in forma estesa

• Luca: supereroi e partita (a pari merito) - gioco da tavolo - commedia


(ultima preferenza).

Consideriamo ora un altro gioco.


Esempio 1.2.2 Questo gioco si chiama il gioco della roulette russa.
1. Situazione iniziale: due giocatori con una pistola a sei colpi ciascuno.
In ogni pistola c’è un solo proiettile;
2. Regole:
• I giocatori mettono un euro sul piatto per aver il diritto di giocare;
• Il giocatore 1 decide di giocare o ritirarsi, se si ritira aggiunge 2
Euro al piatto;
• Nel caso il giocatore 1 sopravviva al primo stadio, il giocatore due
ha le stesse opzioni;
3. Esiti: Se entrambi sono vivi, si dividono il piatto, se uno è morto
l’altro si tiene tutto il piatto.
Ed ecco il suo albero:

s p

N II

5/6 1/6 s p

II N
-1 0
s p 5/6 1/6

N
3 -3 1
5/6 1/6

0 1

Figura 1.2. L’albero del gioco della roulette russa.


1.2 La forma estesa del gioco 11

Notiamo che in questo caso compare un protagonista, che nel gioco pre-
cedente non c’era. È indicato con N nell’albero, perché in quel nodo a
decidere è la Natura, che seleziona, per mezzo di un elemento casuale,
come prosegue il gioco. In questo caso per analizzarlo dobbiamo sempli-
cemente associare agli archi che escono dal vertice con etichetta N , le
probabilità con la quale la Natura sceglie quel ramo. La presenza della
Natura ha una conseguenza importante, per quanto riguarda la descri-
zione del gioco: diversamente dal primo esempio, non possiamo dare solo
preferenze sugli esiti, ma dobbiamo quantificare le utilità dei giocatori, al-
trimenti non sappiamo decidere che cosa scegliere. Nell’esempio, abbiamo
fatto l’ipotesi (poco credibile) che l’utilità del giocatore sia rappresentata
dai soldi che guadagna (o perde, in tal caso utilità negativa). Avere la
funzione utilità è necessario in quanto solo cosı̀ possiamo stabilire se un
esito è preferito rispetto a un altro. E, a proposito, qui ai nodi terminali
associamo un solo numero, non una coppia, perché in questo caso ba-
sta specificare quanto il secondo paga al primo2 . Cosı̀ possiamo dire, ad
esempio, che l’utilità del primo, nel caso entrambi decidano di giocare, è
1 5 5 1 1
× (−1) + ( × 0 + × 1) = − .
6 6 6 6 36
Quindi possiamo affermare che se entrambi sparano il primo giocatore
ha utilità negativa, il secondo positiva, perché il primo deve pagare al
secondo.
È comprensibile che la prima volta che si vede un esempio del gene-
re, ci si possa sentire confusi, per almeno due ragioni: la prima è che ci
sembra strano poter dire che l’esito delle scelte di sparare per entrambi è
1 1
che l’utilità è − 36 per il primo e 36 per il secondo: e se muoiono? Ma non
bisogna ragionare cosı̀: noi abbiamo calcolato le utilità attese, con le re-
gole della probabilità, perché sono queste che (abbiamo ipotizzato) usano
giocatori razionali. La seconda origine di confusione potrebbe dipendere
da come abbiamo scelto le funzioni di utilità: probabilmente morire do-
vrebbe essere valutato un po’ diversamente dal semplice fatto di perdere
un paio di Euro. Ma questo non attiene allo studio del gioco, bensı̀ alla
2
Assumiamo quindi che l’utilità del primo è quanto riceve dal secondo, quindi l’utilità del
secondo è esattamente l’utilità del primo, alla quale viene cambiato il segno: si parla in
questi casi di giochi a somma zero.
12 1 La descrizione del gioco in forma estesa

formalizzazione delle funzioni di utilità: questo non è il lavoro dei ma-


tematici, quanto piuttosto degli psicologi; noi prendiamo le funzioni di
utilità come date e su quello costruiamo la teoria.
Passiamo ora a vedere come analizzare questi giochi, supponendo gli
agenti razionali: lo facciamo partendo dal gioco dei tre fratelli, di cui
ricordiamo l’albero del gioco:

I
si no

II II
si no si no

III III III III


si no si no si no si no

(3,3,3) (3,3,4) (3,4,3) (1,2,2) (4,3,3) (2,1,2) (2,2,1) (2,2,2)

Figura 1.3. L’albero del gioco dell’Esempio 1.2.1.

Osserviamo in particolare ciò che è evidenziato in rosso: si tratta delle


scelte razionali del giocatore III. Perché è in grado di prendere decisioni
razionali? Perché in ogni situazione in cui potrebbe essere chiamato a
decidere, la sua azione è univocamente determinata dal fatto che può
scegliere la sua massima utilità: sono le scelte evidenziate in rosso. Ad
esempio, nel nodo più a sinistra, può scegliere se dire sı̀, ottenendo un
utilità pari a 3, o dire no, ottenendo 4. Ovvio che dice di no. E cosı̀ negli
altri nodi.
Ma dal momento che tutte le informazioni sono note a tutti i giocatori,
anche i giocatori I e II sanno che il terzo prenderà le decisioni che abbiamo
visto. Questo implica allora che il secondo giocatore, dopo questa analisi,
sa che cosa ottiene dalle varie scelte che compie in ogni nodo. In altre
parole, l’albero del gioco iniziale può essere sostituito da questo sotto,
equivalente3 .
3
Osserviamo esplicitamente che abbiamo usato due ipotesi di razionalità, la prima che
1.2 La forma estesa del gioco 13

I
si no

II II
si no si no

(3,3,4) (3,4,3) (4,3,3) (2,2,2)

Figura 1.4. L’albero ridotto del gioco dell’Esempio 1.2.1.

Ora è ovvio come procedere. Nel nuovo albero, ridotto, il giocatore I


sa che nel vertice di sinistra il giocatore II sceglie di dire no, e in quello di
destra di dire sı̀. Nel primo caso avrebbe utilità 3, nel secondo 4, quindi
dirà no.
Riassumiamo dunque quel che si è ottenuto:
1. l’esito del gioco è che i ragazzi andranno a cena con gli amici;
2. Il primo a votare vota per stare coi nonni, ottenendo cosı̀ utilità
massima;
3. Il secondo vota no se il primo vota sı̀, vota sı̀ se il primo vota no;
4. Il terzo vota no se sono stati votati prima due sı̀ o due no, vota sı̀
altrimenti.
Provando a generalizzare ad ogni altro gioco descritto tramite un al-
bero come quelli visti sopra, possiamo concludere che questo metodo
fornisce:

1. Il comportamento dei giocatori in ogni situazione in cui


potrebbero essere chiamati a prendere una decisione;
2. Il risultato finale, o esito del gioco.

i giocatori nelle situazioni in cui possono determinare l’esito del gioco massimizzano la
loro utilità, la seconda che i giocatori sanno utilizzare le conseguenze che le ipotesi di
razionalità hanno sull’analisi del gioco.
14 1 La descrizione del gioco in forma estesa

Su che cosa è basato il metodo precedente? Chiamiamo partita ogni


cammino che parte dalla radice del gioco e arriva a una situazione finale4 .
Chiamiamo anche lunghezza del gioco il numero di archi contenuti nella
partita più lunga possibile. Il metodo che abbiamo visto sopra, e che si
chiama induzione a ritroso, si basa sui due fatti seguenti:
• Si sa come risolvere i giochi di lunghezza 1, in quanto c’è un solo
giocatore che decide, che per ipotesi massimizza la sua utilità;
• Sapendo risolvere i giochi di lunghezza minore di un numero n,
sappiamo risolvere quelli di lunghezza n.
L’ultimo punto è un ulteriore esempio di uso delle ipotesi di razionalità: al
momento dell’inizio del gioco, il primo giocatore deve scegliere che mossa
fare, deve cioè decidere in che vertice andare. Ma scegliere un vertice
significa scegliere un sotto-gioco che ha lunghezza non maggiore di n, che
quindi si sa risolvere. Il primo giocatore sceglierà dunque il sotto-gioco
che gli porta la massima utilità.
Esercizio 1.2.2 Determinare la strategia ottimale per Luca e Alice e
l’esito del gioco nell’Esercizio 1.2.1.
Esercizio 1.2.3 Considerare il seguente gioco a due giocatori:

Determinare l’esito del gioco utilizzando l’induzione a ritroso.


Naturalmente ci sono giochi che non rientrano in questa categoria. Ad
esempio, giocare a carta sasso forbici in sequenza è davvero senza senso,
e se si gioca a mosse contemporanee l’induzione a ritroso non ha senso.
Osserviamo però che anche questi giochi si possono rappresentare con
alberi, con qualche accortezza. Ecco un paio di esempi.
Che situazione vogliamo rappresentare col gioco di Figura 1.6? Il gioco
comincia con la natura che seleziona una situazione iniziale, secondo certe
probabilità, note ai giocatori. Dopo la scelta della natura, che non viene
osservata dai giocatori, il pallino passa al giocatore I che può decidere di
terminarlo, oppure di passare la mano al giocatore II. Se la palla viene
passata a II; questi decide che fare, tra due azioni possibili.
4
Il nome è del tutto giustificato dal fatto che abbiamo in mente di descrivere un gioco, e
quindi un cammino simile rappresenta, come abbiamo già osservato, esattamente una tra
tutte le possibili evoluzioni del gioco.
1.2 La forma estesa del gioco 15

a c
b

II II
(3,3)
d e f g

I
(4,1) (5,0) (1,4)
h i

(2,2) (1,3)

Figura 1.5. Albero del gioco dell’Esercizio 1.2.3.

2/3 1/3
I I
r1 t1 r1 t1
II II
l2 r2 l2 r2

Figura 1.6. Un gioco a mosse contemporanee, con presenza della natura.

Un altro esempio è il gioco di Figura 1.7:


Qui il giocatore I prende una decisione, che non viene osservata dal
giocatore II5 . Il giocatore II può decidere di terminare il gioco, oppure
passare di nuovo la palla a I. In tal caso I ha due scelte possibili, (e
ricorda quale era stata la sua scelta al primo turno di gioco).
Fatto questo inciso, torniamo ai giochi precedenti, quelli a informa-
zione perfetta. Il metodo di induzione a ritroso serve bene a definire il
comportamento razionale di giocatori in questo contesto. La domanda
successiva da porsi è allora quanto questo metodo sia applicabile in pra-
tica. Se in teoria è applicabile a tutti i giochi a informazione perfetta, in
5
Per esempio, le due decisioni potrebbero essere prese contemporaneamente.
16 1 La descrizione del gioco in forma estesa

A B
II II
c d c d
I I
E F G H

Figura 1.7. Un gioco a mosse contemporanee.

pratica poi esistono vincoli precisi. Da che cosa dipendono questi vincoli?
Dal fatto che per applicarlo abbiamo effettivamente bisogno di disegnare
tutto l’albero del gioco. Per quali giochi è possibile fare questo? Solo per
giochi molto semplici, e la cui lunghezza è molto piccola. Siccome i giochi
invece possono essere anche semplici come regole ma poi complessi come
descrizione di tutte le partite possibili, sorge naturale distinguere tra tre
tipologie di giochi:
• quelli cui l’induzione si applica, ma non è possibile dire nulla di più;
• quelli in cui si può dire quel che succede, per esempio chi vince, basan-
dosi su un ragionamento logico, ma non si sa dire che osa devono fare i
giocatori per arrivare alla soluzione (per esempio come il tal giocatore
a vincere);
• quelli in cui è possibile dire quali sono le azioni determinate dall’in-
duzione a ritroso.
Facciamo un esempio per ogni tipo di situazione.
Il più famoso del primo tipo è il gioco degli scacchi: sappiamo dire
che ogni partita giocata dai giocatori razionali della teoria finisce sempre
con lo stesso esito, ma non sappiamo dire se questo esito è la vittoria del
bianco, la vittoria del nero, o il pareggio.
Un esempio del secondo tipo è il gioco seguente, molto bello:
Esempio 1.2.3 Il gioco del chomp. Due giocatori hanno una tavoletta di
cioccolato davanti. Giocano alternati, al proprio turno uno dei giocatori
sceglie un quadratino di cioccolato, e prende quello e tutti quelli che si
1.2 La forma estesa del gioco 17

trovano sopra e a destra. L’ultimo però è avvelenato, quindi chi è costretto


a prenderlo perde la partita. Vediamone un esempio:

1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 32 33 34 35

Supponiamo il primo giocatore scelga il quadratino contrassegnato dal


20. Allora si prende il 6, 13, 20, 7, 14, 21. Supponiamo che alla mossa
successiva il secondo decida di prendere il quadratino 23, allora lascia sul
tavolo 1,8,. . . , 29,. . . , 35.
Vediamo ora il ragionamento che porta a concludere che nel gioco del
chomp vince il primo giocatore, di qualunque dimensione sia il rettan-
golo. Intanto, la prima osservazione ci porta a dire che gli esiti possibili
dell’induzione a ritroso sono due, o vince il primo o vince il secondo. Poi
osserviamo la figura seguente, che dà l’idea della dimostrazione:

Figura 1.8. Gli archi hanno il colore del rettangolo scelto.

Supponiamo, per ipotesi6 , che vinca il secondo. Allora deve avere una
mossa che gli permette di vincere se il primo sceglie l’arco arancione,
corrispondente a togliere il quadratino più in alto a destra, e arriva al
vertice più a sinistra nel secondo livello. Ora consideriamo il sotto-gioco
6
Procediamo quindi per contraddizione.
18 1 La descrizione del gioco in forma estesa

che ha come radice questo vertice: che caratteristiche ha questo sotto-


gioco?
• il suo albero è identico a quello di partenza, deprivato dell’arco
arancione;
• i vertici hanno le etichette invertite; chi era il primo a giocare nel gioco
di partenza diventa il secondo nel sotto-gioco.
Dunque, se supponiamo, come stiamo facendo, che il secondo vinca, nel
sotto-gioco il primo a tirare ha la possibilità di vincere, scegliendo un
ramo opportuno. Allora questo significa che il primo a giocare nel gioco
iniziale ha la possibilità di vincere, scegliendo il ramo dello stesso colore
che sceglie il secondo per vincere nel sottogioco: ma questo contraddice
l’ipotesi che vinca il secondo7 .
Esercizio 1.2.4 Consideriamo il gioco con 8 quadratini.
5678
1234
Verificare che l’unica strategia vincente per il giocatore I è prendere il
quadratino numero 8.
Rimane da vedere un esempio del terzo tipo di giochi. Quanto facciamo
ora si applica a una varietà di giochi con determinate caratteristiche, ma
noi ci concentriamo su un gioco famoso, che si chama gioco del Nim, e che
è il seguente: ci sono n file, ciascuna con un certo numero di fiammiferi.
I giocatori a turno prendono quanti fiammiferi vogliono (almeno uno) da
una fila di loro scelta (che può cambiare da un turno all’altro). Chi toglie
l’ultimo fiammifero vince.
Un gioco Nim quindi può essere descritto da un vettore (n1 , n2 , . . . , nk )
con ni interi non negativi: ad esempio (3, 2, 2, 5) descrive la situazione in
cui abbiamo una fila di 3 fiammiferi, due di 2, e una di 5. Un modo efficace
di trovare l’esito di questi giochi consiste nel dividere tutti i vettori in
due categorie distinte:
• le posizioni P;
7
Questo ragionamento vale per qualunque tavoletta di cioccolato. Nel caso semplice della
figura, si verifica che tutte le scelte di un quadratino, escluso quello in alto a destra,
portano il primo a perdere. Il che significa proprio che prendendo quello, il secondo al suo
turno perderà, qualunque cosa faccia, vedi Esercizio 1.2.4.
1.2 La forma estesa del gioco 19

• le posizioni N.
Il criterio per stabilire in quale delle due categorie deve essere messa
una posizione è il seguente:
• Le posizioni terminali del gioco sono P posizioni: in questo caso si
tratta della sola posizione (0, 0, . . . , 0);
• vertici che hanno un arco che porta ad almeno una P-posizione sono
N-posizioni;
• vertici che portano esclusivamente a N-posizioni sono P-posizioni.
Cerchiamo di capire perché questa è un’idea brillante. Supponiamo
che il giocatore I parta da una posizione N: ha la possibilità di portare il
giocatore II a una posizione P. Ora II, qualunque cosa faccia, riporta I
a una posizione N. Dunque il giocatore I riesce a giocare una partita del
tipo N-P-N-. . . -P 8 , dove lui è sempre in posizione N, mentre l’altro in
P. Questo significa precisamente che chi parte dalla posizione N vince,
perché l’ultima P significa che non c’è più niente sul tavolo.
Il prossimo punto da esplorare è come si determinano le posizioni di un
gioco. L’idea è semplice, e ha evidenti analogie con l’induzione a ritroso.
Vediamolo su qualche esempio concreto, nel gioco dei Nim. Se il gioco è
fatto da una sola fila tutte le posizioni sono N, a parte la posizione 0.
Questo è ovvio, perché da dovunque si parta si può arrivare a 0, che è una
P posizione. Che succede se invece si parte da due file? Vediamo che le
posizioni N sono quelle della forma m, n con m 6= n, quindi le altre, quelle
con file uguali, sono P posizioni. Infatti, da una posizione (n, m) con per
esempio n > m possiamo togliere dalla fila con n elementi esattamente
n − m fiammiferi: siamo arrivati cosı̀ alla posizione (m, m) che appunto
è P-posizione. Ovviamente anche la posizione terminale (0, 0), risulta
P-posizione.
Con tre file di fiammiferi le cose diventano meno semplici, ma per
esempio possiamo dire subito qualcosa nella situazione (k, n, n). Perché è
una N-posizione? Perché si può andare in una P-posizione, precisamente
(0, n, n). Facciamo un ultimo esempio, poi andiamo al teorema. (1, 2, 3)
è una P-posizione, perché le mosse possibili sono:
8
Notare che il gioco deve finire, e che finisce per forza con una posizione P, visto che i nodi
terminali sono etichettati P.
20 1 La descrizione del gioco in forma estesa

1. lasciare una fila senza fiammiferi: {(0, 2, 3), (1, 0, 3), (1, 2, 0)}. Queste,
lo abbiamo già visto, sono N-posizioni;
2. due file con lo stesso numero di fiammiferi: {(1, 1, 3), (1, 2, 2), (1, 2, 1)},
che sono, come abbiamo già visto, N-posizioni.
Possiamo ora introdurre uno strumento che ci permette di riconoscere,
senza troppa fatica, che cosa sia una posizione in un qualunque gioco
Nim; si tratta di definire una nuova operazione strana sui numeri interi
non negativi. Definiamo l’operazione n ⊕ m come segue:
1. si scrivono n, m in base binaria: n = (nk . . . n0 )2 , m = (mk . . . m0 )2 ;
2. si forma il numero binario (nk + mk )2 . . . (n0 + m0 )2 ;
3. si definisce n ⊕ m = z, con (z)2 = (nk + mk )2 . . . (n0 + m0 )2 .

Esempio 1.2.4 Ecco qualche calcolo con ⊕


1. 2 ⊕ 4 = 6: (2)2 = 10, (4)2 = 100, 10 +2 100 = 110 and 6 = (110)2
2. 2 ⊕ 3 = 1. (2)2 = 10, (3)2 = 11, 10 ⊕ 11 = 01 = 1, (1)2 = 1
3. 3 ⊕ 3 = 0, in generale n ⊕ n = 0.
L’operazione ⊕ dota gli interi non negativi di una struttura importantis-
sima in matematica, quella di gruppo. Delle proprietà che valgono in un
gruppo quella che ci interessa è la legge di cancellazione:

n⊕m=n⊕k ⇒ m = k.
Ed ecco il teorema.
Teorema 1.2.1 (Bouton) Una posizione (n1 , n2 , . . . , nN ) è una P-posizione
se e solo se
n1 ⊕ n2 ⊕ . . . ⊕ nN = 0.
Dimostrazione. Vediamo la dimostrazione.
• L’unica posizione terminale è (0, . . . , 0) quindi banalmente P-posizione;
• Supponiamo ora n1 ⊕ n2 ⊕ . . . ⊕ nN = 0 (P-posizione) e prendiamo
qualche fiammifero da una fila, ad esempio la prima fila, con risultato
finale n01 ⊕ n2 ⊕ . . . ⊕ nN . Può essere n01 ⊕ n2 ⊕ . . . ⊕ nN = 0? No
perché allora sarebbe
1.2 La forma estesa del gioco 21

n01 ⊕ n2 ⊕ . . . ⊕ nN = n1 ⊕ n2 ⊕ . . . ⊕ nN
e per la legge di cancellazione questo significherebbe n1 = n01 , il che
è impossibile perché almeno un fiammifero va preso: quindi da una
P-posizione si finisce in una N-posizione;
• Mostriamo che se n1 ⊕ n2 ⊕ . . . ⊕ nN 6= 0 si può fare in modo da
arrivare in una P-posizione, che è come dire impariamo a vincere. Se
la posizione da cui partiamo ha somma Nim diversa da 0, cerchiamo
l’uno che appare più a sinistra nella somma. Negli addendi ci deve
essere almeno un 1. Cambiamolo in uno zero. Ora procediamo con gli
altri elementi dell’espansione binaria del numero prescelto e lasciamo
il bit che c’era se nella somma totale c’è zero, cambiamolo se c’è uno.
Il gioco è fatto, il teorema è dimostrato.
Vediamo un esempio per capire meglio:
Esempio 1.2.5 Consideriamo la posizione (1, 5, 7). 1 = 12 , 5 = 1012 ,
7 = 1112 quindi si ha 1 ⊕ 4 ⊕ 7 6= 0. Ora si ha:
1 = 001 ⊕
5 = 101 ⊕
7 = 111 =
3 = 011
Siccome nella somma binaria finale l’1 più a sinistra è in mezzo ed è
dovuto alla presenza del 7, si agisce sulla riga del 7, cambiando l’1 di
mezzo in 0. Poi, siccome nella somma finale c’è 1 anche nell’ultima casella
di destra, si cambia anche l’ultimo bit nella riga selezionata. Si passa
dunque a:
1 = 001 ⊕
5 = 101 ⊕
4 = 100 =
0 = 000
Esercizio 1.2.5 Consideriamo il gioco Nim con posizione iniziale (13, 12, 8).
È una P-posizione? Se non lo è, determinare una mossa vincente per il
primo giocatore.
22 1 La descrizione del gioco in forma estesa

Esercizio 1.2.6 Consideriamo il gioco Nim con posizione iniziale (5, 8, 7, 12).
Quale giocatore ha una strategia vincente?
Esercizio 1.2.7 Consideriamo il gioco Nim (12, 13, x, 9). Determinare x
in modo che il secondo giocatore abbia una strategia vincente.
Esercizio 1.2.8 Consideriamo la situazione:

(1, . . . , 1, m, m),
| {z }
k

k ∈ {2, 3, 4, 5, . . .}. Verificare che se k è pari questa posizione è una


P-posizione. Per k dispari, invece, determinare come passare a una P-
posizione.
Corollario 1.2.1 Da una posizione N ci sono sempre un numero dispari
di mosse che portano a una posizione P.

Per concludere, facciamo qualche ulteriore osservazione. Come già det-


to, per poter applicare il metodo di induzione a ritroso, è necessario spe-
cificare le scelte fatte dai giocatori in ogni nodo del gioco. Dal punto di
vista di ogni giocatore, questi deve decidere che cosa fare in ogni nodo
etichettato col suo nome. Questa osservazione ci permette di dare una
definizione molto importante.

Definizione 1.2.1 Si chiama strategia per il giocatore i la specifi-


cazione di un azione da prendere in ogni nodo etichettato col nome
di i, si chiama profilo di strategie in un gioco la specificazione di
una strategia per ogni giocatore.

È chiaro che la specificazione di un profilo qualsiasi di strategie ci


permette di dire sempre come termina il gioco. Anzi, spesso un profi-
lo di strategie ha informazioni apparentemente ridondanti. Osserviamo
l’albero di Figura 1.9:
Consideriamo il profilo di strategie (b, g, l), (c, q). L’esito che si ottiene
è (1, 3), e la parte rilevante a determinare questo esito sono l’azione b di I
e l’azione q del secondo. Tutto il resto non cambia il risultato: il primo può
1.2 La forma estesa del gioco 23

a b

II II

c d p q

I I
(4,2) (1,3)
g h i l

(3,1) (2,2)(1,2) (3,0)

Figura 1.9.

cambiare g con h e/o l con i, e il secondo c con d senza cambiare l’esito del
gioco. Quindi spesso si possono raggruppare strategie che a un giocatore
portano lo stesso risultato, ma è importante notare che la definizione,
fondamentale, di strategia, richiede di fornire tutte le informazioni in
tutti i nodi, l’unico modo di applicare l’induzione a ritroso.

Esercizio 1.2.9 Disegnare l’albero di un gioco a due giocatori in cui


il primo giocatore sceglie ALTO o BASSO e successivamente il secon-
do giocatore sceglie DESTRA o SINISTRA. Scrivere i payoff in modo
che il primo giocatore scelga ALTO e il secondo giocatore scelga sempre
DESTRA.
Esercizio 1.2.10 Consideriamo il seguente gioco e determinare un pos-
sibile valore per x in modo che l’esito finale del gioco sia (4, 4).
Nel prossimo Capitolo vedremo una nuova descrizione possibile di un
gioco, si chiama gioco in forma strategica.
24 1 La descrizione del gioco in forma estesa

a b

II II
c d e f

I I
(2,x) (3,2)
g h i l

(4,4) (2,4) (-1,3) (1,0)

Figura 1.10. L’albero del gioco dell’Esercizio 1.2.10.


2
Un’occhiata al modello non cooperativo di
Nash

Le ipotesi di base di tante teorie filosofiche, economiche, psicologiche, so-


ciali, immaginano l’essere vivente come un agente che cerca di ottenere il
benessere per sé: questo comportamento “egoista” non esclude collabora-
zioni, e non esclude nemmeno che le persone possano agire con generosità
verso gli altri: ma questo avviene, secondo la teoria, perché è cosı̀ che ci
sentiamo meglio; tutto dipende da quali sono i nostri scopi.
La teoria non cooperativa, in forma strategica, è stata fondata da
John. F. Nash, anche se alcuni risultati fondamentali sono stati ottenuti
prima da von Neumann; tuttavia questi ultimi riguardavano solo i giochi
a somma zero, cioè quelli in cui gli interessi di due giocatori sono esatta-
mente opposti; l’approccio di von Neumann a questo tipo di giochi non
poteva essere generalizzato facilmente alla totalità dei giochi, che è quel-
lo che ha fatto Nash. In questo capitolo vediamo applicata la sua teoria
a qualche situazione interessante, e vediamo soprattutto a quali conse-
guenze porta; in particolare, proprio perché un aspetto che ci interessa
è il confronto con la teoria cooperativa, ne metteremo in luce le carat-
teristiche che da quella la distinguono; ricordando comunque sempre che
il giocatore della teoria è sempre lo stesso agente egoista, che affronta
situazioni modellizzate in maniere differenti.
Cominciamo col vedere qualche esempio di situazioni tipiche della
teoria non cooperativa. Non svilupperemo i dettagli di questi esempi,
ma cercheremo di capire perché sono significativi, che cosa vogliono
rappresentare e che conclusioni ci permettono di trarre.
26 2 Un’occhiata al modello non cooperativo di Nash

Esempio 2.0.1 Una coppia deve decidere, come ogni anno, se trascorre-
re le vacanze al mare o in montagna. Vogliono passare le vacanze assieme,
ma lei ha molta voglia di andare al mare e mentre lui ama fare lunghe e
noiose passeggiate: che decisione prenderanno?
Questo gioco si trova facilmente in letteratura col nome di battaglia
dei sessi e è declinato in mille modi diversi, o il mare contro la montagna,
o Bach contro Mozart, o il cinema contro la partita. Non è il più citato
della teoria ma poco ci manca, vedremo il perché.
Esempio 2.0.2 In una località di campagna ci sono degli allevatori le cui
mucche pascolano su un terreno comune formato da un certo numero di
campi. Ogni mattina ciascun allevatore decide quante mucche far uscire
a pascolare. Ogni mucca occupa un campo brucando l’erba. Più mucche
ci sono, meno erba rimane per ciascuna di loro, e la loro produzione di
latte ne risente. Che devono fare i contadini?
L’esempio precedente è stato pubblicato nel 1833 dall’economista in-
glese William Forster Lloyd come prototipo della situazione di sfrutta-
mento eccessivo di risorse comuni. In 1968, l’ecologista Garrett Hardin ha
pubblicato su Science l’articolo “The Tragedy of the Commons”, e da al-
lora una situazione come quella di questo esempio è stata applicata nelle
situazioni più disparate, come l’aumento incontrollato della popolazione,
problemi ambientali, l’inquinamento di vari tipi, compreso quello lega-
to all’eccessiva illuminazione, lo sfruttamento degli Oceani per la pesca
intensiva, per arrivare all’uso eccessivo di antibiotici.
Esempio 2.0.3 In una spiaggia lunga 1 km affollata in modo uniforme
dai bagnanti, alcuni gelatai devono decidere in quale punto aprire i loro
chioschi. I gelatai vendono tutti lo stesso tipo di gelato e l’unico criterio
con cui le persone decideranno in quale chiosco recarsi è la loro distanza
dal chiosco, mentre ogni gelataio cerca di avere più clienti possibili.
Questo gioco è stato introdotto dallo statistico Harold Hotelling (1895-
1973) nell’articolo “Stability in Competition” in Economic Journal in
1929, con lo scopo di dimostrare che in molti mercati i produttori hanno
vantaggio a immettere prodotti il più simili possibili. Vedremo dopo come
la teoria dei giochi ci offre la sua interpretazione.
2 Un’occhiata al modello non cooperativo di Nash 27

Esempio 2.0.4 Ci sono due imprese sul mercato, che producono lo stes-
so bene. In questa situazione di duopolio, le imprese concorrono a formare
il prezzo del bene sul mercato, perché questo è una funzione decrescente
rispetto alla quantità totale di bene immesso sul mercato: più ce n’è,
meno costa. Quanto produrranno le due imprese?
Lo studio del duopolio è stato affrontato sistematicamente per la pri-
ma volta da Antoine Augustin Cournot (1801-1877) nel suo libro “Re-
cherches sur les Principes Mathematiques de la Théorie des Richesses”
per descrivere la competizione sul mercato di due aziende distributrici di
acqua minerale in posizione dominante sul mercato. La sua analisi e il
suo risultato nel suo modello più semplice portano all’unico equilibrio di
Nash del gioco associato, e furono di ispirazione per il giovane Nash, come
del resto esplicitamente sottolineato da lui nella sua tesi di dottorato.
Esempio 2.0.5 Immaginiamo che ci siano due città, come ad esempio
Milano e Torino, e che ogni mattina 4000 persone devono spostarsi da
Torino verso Milano per motivi di lavoro. A metà strada tra le due città
si trovano due paesi, A e B, e ci sono due percorsi alternativi, ognuno
dei quali attraversa uno dei due paesi. Tra Torino e A e tra B e Milano
ci sono due tratti di strada provinciale, i cui tempi di percorrenza risen-
tono fortemente del traffico: se ci sono N veicoli che stanno utilizzando
quel tratto di strada, il tempo di percorrenza (in minuti) è N/100. Al
contrario, tra A e Milano e tra Torino e B ci sono due tratti di una larga
autostrada, in cui i tempi di percorrenza sono dettati dal sistema Tutor
e quindi il tempo necessario per il viaggio è di 50 minuti, indipendente-
mente dal numero di auto che ci sono. Quale strada devono percorrere
gli automobilisti? Conviene costruire percorsi alternativi?
Questo esempio (e sue varianti) è noto col nome di paradosso di Braess,
dal nome del matematico tedesco Dietrich Braess, nato nel 1938, che pub-
blicò lo studio nel 1968. Perché sia un (apparente) paradosso, lo vedremo
in seguito.
Esempio 2.0.6 Un certo numero di persone, diciamo 100 per semplicità,
decidono, in maniera indipendente e simultanea, se andare in un bar che
oltre all’aperitivo propone musica dal vivo. Lo spazio nel bar è limitato,
e la serata è piacevole solo se meno del 60% della popolazione è presente.
28 2 Un’occhiata al modello non cooperativo di Nash

Non è possibile stabilire a priori quanti andranno al bar, per cui ognuno
decide a seconda se pensa che quella sera al bar ci vadano più o meno di
60 persone. Che fare?
Questo problema, noto come “El Farol bar” è stato introdotto nel 1994
dal famoso economista irlandese Brian W. Arthur e ispirato dal bar El
Farol, che si trova a Santa Fé, in New Mexico, e che i giovedı̀ sera offre
musica dal vivo e serve Irish coffee. Vedremo successivamente perché è
un esempio particolarmente significativo.
Esempio 2.0.7 Un padre (un po’ sciagurato), avendo comprato una tor-
ta per i suoi due figli, dice al primo: “offri una frazione qualunque della
torta a tuo fratello; se lui accetta la divido secondo il vostro accordo, se
invece rifiuta la torta me la mangio io”. Ora la domanda è, che faranno
i due fratelli?
Questo esempio, apparentemente banale, in realtà è molto famoso,
in quanto la sua analisi matematica è semplice, ma, nonostante questo,
ha ispirato numerosi esperimenti per lo studio di meccanismi cerebrali.
Uno degli articoli più famosi che ne parla è degli autori Sanfey, Rilling,
Aronson e Nystrom, si intitola “The Neural Basis of Economic Decision-
Making in the Ultimatum Game” ed è stato pubblicato su Science nel
2003. Studi simili sono stati fatti anche con gli scimpanzé!
Tutti gli esempi di sopra, a parte l’ultimo, sono situazioni descrivibili
come giochi non cooperativi, in forma strategica. In parole povere, forma
strategica significa che si dice direttamente quali sono le scelte possibili
dei giocatori, che si suppone agiscano in contemporanea. Diversa è la
situazioni di giochi in sequenza, che abbiamo viso nel primo Capitolo,
e di cui un altro esempio è quello dell’Esempio 2.0.7; tuttavia c’è un
modo standard di descrivere giochi che avvengono con mosse successive
come giochi in forma strategica, utilizzando il concetto di strategia come
definito nel Capitolo precedente.
2.1 Il dilemma del prigioniero 29

Un gioco (non cooperativo) in forma strategica è individuato da


un insieme N di n giocatori, da n insiemi, uno per giocatore, che
rappresentano le strategie che ogni giocatore può adottare, e da n
funzioni di utilità, che rappresentano le preferenze di ogni giocato-
re su tutti i possibili esiti del gioco; la funzione di utilità di ogni
giocatore dipende non solo dalla strategia che sceglie, ma anche da
quelle scelte dagli altri.

In concreto, nell’Esempio 2.0.2 per i pastori le strategie sono tante


quante le mucche che hanno (e la loro strategia diventa quante ne man-
dano al pascolo), nell’Esempio 2.0.4 del duopolio le strategie dei giocatori
sono infinite, e rappresentate da un numero q che denota la quantità di
prodotto che immettono nel mercato, e nell’Esempio 2.0.7 le strategie del
primo figlio sono rappresentate dall’intervallo [0, 1] (la scelta di x ∈ [0, 1]
rappresenta la percentuale di torta che il fratello propone di tenere per
sé, mentre una strategia del secondo è una cosa un po’ più elaborata, e
precisamente la scelta tra dire sı̀ o dire no per ogni possibile scelta x del
primo figlio)1 .
Una volta che abbiamo in mano un modello di gioco, dobbiamo anche
dire quali situazioni finali, in un gioco, sono definibili come risultati di
un processo razionale tra agenti. Per questo, abbiamo a disposizione il
concetto più famoso di tutta la teoria dei giochi, quello di equilibrio di
Nash. Ma prima di parlare di questo, dedichiamo un po’ di attenzione a
un gioco che in nessun discorso sulla teoria dei giochi può essere ignorato,
e che in più ci permette di introdurre un paradigma di razionalità che
precede l’idea di equilibrio di Nash.

2.1 Il dilemma del prigioniero


L’esempio più famoso di tutta la teoria dei giochi, e una delle più belle
sintesi che la matematica possa fare di concetti profondi e interessanti, è
chiamato Dilemma del prigioniero, e si basa sulla storia seguente.
1
Solo in questo modo ricadiamo nella definizione nel riquadro di sopra, sapere quel
che secondo dichiara in ogni circostanza, e sapere la scelta del primo, determina
automaticamente l’esito del gioco.
30 2 Un’occhiata al modello non cooperativo di Nash

Due malfattori vengono catturati dopo una rapina, e portati davanti


al giudice, che dice loro che la pena, se confesseranno, è di 5 anni; se
invece uno solo confessa la partecipazione di entrambi alla rapina, il
pentito sarà liberato mentre all’altro saranno date alcune aggravanti
che portano la pena a 7 anni. Infine, se nessuno confessa, verranno
condannati a 1 anno di galera per un reato minore, dal momento
che il giudice teme che in tribunale possano essere assolti, quindi
vuole evitare il processo.

Che cosa c’è di geniale nella scelta delle pene da parte del giudice?
Egli crea un’interazione tra i due prigionieri, perché il numero di anni
di condanna di ognuno dipende dal comportamento di entrambi (crea
cosı̀ una situazione di interazione tra i due). Se cosı̀ non fosse, chiaro
che i prigionieri terranno la bocca ben chiusa, visto che il giudice non
ha elementi di prova sufficienti per condannarli alla pena più alta, ma
adesso? Dal punto di vista della razionalità individuale questo dilemma è
una banalità. Consideriamo infatti il ragionamento di uno dei due (quello
dell’altro sarà identico, data la simmetria della situazione):
1. Che cosa mi conviene fare se il mio socio confessa? Se confesso, faccio
5 anni di galera, se non confesso ne faccio 7, mi conviene confessare;
2. Che cosa mi conviene fare se il mio socio non confessa? Se confes-
so sono libero, se non confesso faccio 1 anno di galera, mi conviene
confessare.
In conclusione, qualunque sia la scelta dell’altro, è conveniente confessare.
La razionalità quindi impone di confessare. Il dilemma consiste non tanto
in quel che fanno i prigionieri, che è chiaro, quanto il fatto che se facessero,
entrambi, la scelta opposta, starebbero molto meglio, perché farebbero
un anno di galera invece di 5! Ma la razionalità individuale impedisce
una scelta del genere.
Dovunque leggiate questa storia, la troverete abbellita di particolari
che non c’entrano nulla, il più importante dei quali è che i prigionieri sono
tenuti in celle separate, per evitare che comunichino tra loro. Oppure
che è importante che scelgano contemporaneamente, o all’insaputa l’uno
dell’altro. Ma tutto questo è folklore, il punto è che i prigionieri si possono
lasciar parlare tra loro, e che ognuno dei due sa benissimo quale sarà la
2.2 Strategie dominate 31

scelta dell’altro, perché ci sono due scelte possibili, e una è la migliore


a prescindere dal comportamento dell’altro! Non c’è modo di uscire da
questo impasse, se non assumere che il gioco sarà giocato ripetutamente
dai giocatori (e in certe condizioni in questo caso anche non confessare
potrebbe essere il risultato di un comportamento razionale) o ancora
meglio provare a far cambiare criterio di utilità ai due prigionieri2 .
Perché questa storiella è cosı̀ interessante? Perché, come dimostra una
vastissima letteratura, non solo matematica, la situazione in cui si trovano
i due prigionieri è comunissima nella vita di tutti i giorni. Praticamente
ogni giorno si presentano situazioni in cui certi agenti, cercando il meglio
per sé, che è un atteggiamento che obbedisce a una legge di natura, alla
fine ottengono un risultato negativo per tutti. Sarebbe sbagliato sostenere
che succede sempre cosı̀, si possono a volte osservare comportamenti più
socialmente utili, che in teoria dei giochi sono comunque spiegati con
modelli diversi, non negando l’ipotesi che ciascuno cerchi il meglio per
sé. Del resto, se ci sono esempi di comportamenti che sembrano violare
questa legge, ce ne sono anche moltissimi che la confermano. In fondo,
siamo tutti convinti che avere leggi di comportamento comuni a tutti è
indispensabile per avere una vita sociale decente, o addirittura una vita
sociale, ma poi molto spesso ognuno decide di obbedire a quel che più gli
aggrada, violando il patto sociale ma perseguendo l’interesse individuale.

2.2 Strategie dominate


Il dilemma del prigioniero ci ha permesso di individuare un primo criterio
di decisione:

Un giocatore non sceglie mai una strategia x, se ne esiste un’altra, y,


che gli permette di ottenere di più, qualunque sia il comportamento
di tutti gli altri giocatori

La strategia x si dice strettamente dominata dalla strategia y, e quin-


di il principio di sopra asserisce che nessun giocatore razionale gioca una
2
Se per esempio fossero legati da un rapporto di amicizia o affetto, si potrebbe far osservare
loro che l’utilità potrebbe essere misurata nella somma degli anni cui saranno condannati
32 2 Un’occhiata al modello non cooperativo di Nash

strategia strettamente dominata. Questo principio sembra essere invio-


labile, d’altra parte è necessario, dal momento che la teoria dei giochi
ambisce a essere una generalizzazione della teoria delle decisioni, in cui
l’individuo agisce da solo (sia pure in presenza i vincoli esterni). Se infatti
la funzione di utilità non dipende che dalle scelte del decisore, il criterio
di sopra implica che solo le azioni che la massimizzano possono essere
selezionate: esattamente la base della teoria del decisore razionale.
Questo principio di razionalità è apparentemente piuttosto debole,
perché l’esperienza ci induce a pensare che in genere una strategia è
buona o cattiva a seconda di quello che gli altri giocatori decidono di fare.
Nell’esempio che chiamiamo battaglia dei sessi, nel quali i due vogliono
stare assieme ma uno preferisce il mare l’altro la montagna, è evidente
che una buona strategia da parte di un giocatore non esiste in ogni caso,
ma dipende dalla scelta dell’altro.
Tuttavia, il principio di eliminazione delle strategie dominate, per
quanto sembri di limitata applicabilità, ha delle conseguenze sorpren-
denti. Ne illustriamo due tra le più contro-intuitive, attraverso semplici
esempi.
Esempio 2.2.1 Due catene di abbigliamento rivali vogliono aprire due
nuovi punti vendita specializzati in prodotti estivi o invernali. Le due ca-
tene vogliono aprire i loro negozi nella stessa città per dividersi il mercato
e farsi concorrenza diretta. Se aprissero il negozio a Genova dedicando-
si ai prodotti invernali avrebbero un fatturato di 1 milione all’anno, se
uno dei due offrisse vestiti estivi invece guadagnerebbe 2 milioni e se en-
trambi si occupassero di abbigliamento estivo potrebbero guadagnare 5
milioni di euro a testa. Se invece aprissero il negozio a Milano, dedicando-
si entrambi ai prodotti invernali guadagnerebbero 4 milioni, dedicandosi
entrambi ai prodotti estivi ne guadagnerebbero 6 e differenziandosi ne
guadagnerebbero 3 e 7.
Vediamo prima di tutto come riassumere in forma matematicamente effi-
cace il gioco precedente, un gioco finito tra due giocatori. In questo caso
è comodo rappresentarlo come una tabella, detta bi-matrice, di questo
tipo:
2.2 Strategie dominate 33

Estivo Invernale
Estivo (5,5) (2,1)
Invernale (1,2) (1,1)

Il gioco a Milano si rappresenta invece cosı̀

Estivo Invernale
Estivo (6,6) (3,7)
Invernale (7,3) (4,4)

Osserviamo che le tabelle vanno lette cosı̀: si chiama convenzional-


mente giocatore 1 quello che sceglie una riga, e 2 quello che sceglie una
colonna. Le loro scelte determinano una casella, che rappresenta un esito
del gioco, e dove è riportata una coppia di numeri, che rappresentano le
utilità dei giocatori, il primo ovviamente rappresenta l’utilità del primo.
Tornando all’esempio, possiamo notare una cosa: qualunque siano le
coppie di strategie scelte dai giocatori, i guadagni a Milano sono sempre
maggiori dei guadagni a Genova, per entrambi i giocatori. Diventa allo-
ra assolutamente naturale aspettarsi che i due decidano di aprire le loro
attività a Milano. Ma se facessero cosı̀ sbaglierebbero, come ci si accorge
applicando il principio di eliminazione delle strategie strettamente domi-
nate, che porta alla decisione di aprire l’attività in estate a Genova e in
inverno a Milano. Questo semplice esempio mostra che quando ci trovia-
mo a interagire con altri, la nostra situazione è completamente diversa
da quando prendiamo decisioni da soli. Quando siamo da soli sappiamo
che, qualunque decisione prenderemmo, a Milano guadagneremmo di più
che a Genova. Quindi banalmente e razionalmente apriremmo l’attività
a Milano, prima ancora di chiederci se d’inverno o d’estate3 .
Ed ecco il secondo esempio, anche questo molto sorprendente.
Esempio 2.2.2 Due proprietari di due bar che si trovano nello stesso
quartiere di una piccola città devono decidere se acquistare dei macchi-
nari per iniziare a produrre e vendere anche il gelato o no. Se comprano le
macchine per il gelato, la clientela di ciascuno aumenta facendo crescere
3
Matematicamente, sto dicendo la banalità che date due funzioni f e g, tali che f ≥ g su
un insieme di alternative I, allora max f ≥ max g, indipendentemente dai punti in cui il
massimo è raggiunto.
34 2 Un’occhiata al modello non cooperativo di Nash

i loro guadagni del 5%. Possiamo descrivere il gioco con questa tabella,
in cui utilizziamo la percentuale di aumento dei guadagni come utilità
dei giocatori:

Gelato Non Gelato


Gelato (5,5) (5,0)
Non Gelato (0,5) (0,0)

Immaginiamo adesso che i due giocatori abbiano anche una terza pos-
sibilità: acquistare un nuovo macchinario per preparare il frozen yogurt.
Se solo uno dei due vende il nuovo prodotto, ruba tutta la nuova cliente-
la aumentando il suo guadagno del 6%. Ecco come rappresentare questa
nuova situazione.

Gelato Non Gelato Frozen Yogurt


Gelato (5,5) (5,0) (0,6)
Non Gelato (0,5) (0,0) (0,6)
Frozen Yogurt (6,0) (6,0) (3,3)
Applicando il principio di eliminazione delle strategie strettamente do-
minate, nel primo caso l’utilità dei giocatori è 5, nel secondo 3!
Ancora una volta è violata una legge cardine della teoria delle decisio-
ni: quando si è da soli, per un giocatore razionale allargare l’insieme delle
scelte è sempre conveniente, in quanto se le nuove scelte non portano a un
miglioramento si possono ignorare 4 , ma questo purtroppo non avviene
in ambiente interattivo, la presenza di un altro ci può costringere a scelte
che messe insieme risultano negative per tutti.
Il risultato precedente si può leggere in maniera un po’ diversa, che
mette in luce il ruolo dell’informazione. Infatti, se i due gelatai non sa-
pessero dell’opzione frozen yogurt, ricadrebbero nel gioco precedente, con
guadagno di entrambi. È chiaro che questa osservazione ha implicazioni
sociali enormi. Il discorso va fatto con tutte le cautele del caso, ma è
4
Ancora una volta un concetto matematicamente banale, se ho due insiemi A e B tali che
A ⊂ B, allora ovviamente maxA f ≤ maxB f , qualunque sia la funzione f .
2.2 Strategie dominate 35

sicuramente vero che a volte certe informazioni è meglio che non siano
pubbliche5 .
Il principio di eliminazione delle strategie dominate, come già accenna-
to, a parte qualche esempio ben costruito, non fornisce indicazioni nella
maggior parte dei casi. C’è bisogno di un’idea nuova, che sia semplice
ma geniale. Questa idea è venuta a John Nash, che ha vuto il merito di
formalizzare il modello di gioco cooperativo, e di estendere un’idea che
Cournot aveva applicato nello studio del suo modello di duopolio. Questa
definizione, la più importante in ambito non cooperativo, merita una for-
malizzazione, che scrivo per due giocatori, il che evita notazioni pesanti,
ma che si estende facilmente al caso di un numero arbitrario (finito) di
giocatori.

Il profilo di strategie (x̄, ȳ) si dice di equilibrio (di Nash) per il gioco
(X, Y, f, g : X × Y → R) se valgono le due relazioni seguenti:
• f (x̄, ȳ) ≥ f (x, ȳ) per ogni x ∈ X;
• g(x̄, ȳ) ≥ g(x̄, y) per ogni y ∈ Y .

Che cosa rappresenta un equilibrio di Nash? Si tratta di una situazione


dalla quale nessun giocatore ha incentivo a deviare unilateralmente: se
il primo giocatore assume che il secondo giochi ȳ, per lui la scelta di
x̄ è ottimale. D’altra parte, siccome tutti i dati sono assunti noti dai
giocatori, per il primo giocatore non c’è alcun problema a credere che il
secondo possa giocare ȳ, assumendo che lui giochi x̄.
Questo apparente scioglilingua dovrebbe però trasmettere un messag-
gio chiaro: la scelta di un giocatore è ottimale in funzione della scelta
(fissata) dell’altro giocatore. Per ribadire la cosa con un esempio, non ha
senso dire, nella battaglia dei sessi, che la strategia del primo di andare
in montagna è ottimale; piuttosto, la scelta da parte di entrambi di an-
dare in montagna, rappresenta una situazione di equilibrio, dalla quale
nessuno dei due ha interesse a deviare da solo.
5
Il problema gigantesco rimane di chi dovrebbe avere il potere di conoscere e non diffondere
le cose, dovrebbero essere persone dotate di eccezionali senso etico e carisma, il problema
è che in giro non ce ne sono molte.
36 2 Un’occhiata al modello non cooperativo di Nash

Va osservata esplicitamente la differenza sostanziale tra l’equilibrio di


Nash e una strategia dominante per un giocatore: se x̄ è dominante, allora
rappresenta una scelta ottimale per il primo giocatore qualunque sia la
scelta del secondo giocatore; se (x̄, ȳ) è un equilibrio di Nash, allora x̄ è
ottimale per il primo giocatore, a condizione che il secondo giochi ȳ.
Come già detto, il concetto di equilibrio di Nash è davvero alla base di
tutta la teoria non cooperativa, e questo è un fatto assodato. Senza mai
dimenticare questo, ora rivediamo i vari esempi fatti, per mettere in luce
degli aspetti legati al concetto stesso, e anche a certi suoi aspetti poco
convincenti. Dicendo però a chiare lettere che è spesso la complessità
intrinseca allo studio delle situazioni interattive a far sı̀ che non esista
l’idea che va bene sempre e in ogni occasione. Resta il fatto che l’idea
di equilibrio di Nash è il primo paradigma di razionalità che ha portata
generale, ben più di quello di eliminazione delle strategie strettamente
dominate.
Possiamo ora rivisitare gli esempi precedenti, per vedere che cosa ci
dice il concetto di equilibrio di Nash, che informazioni ci dà, che problemi
ci pone. Nella battaglia dei sessi (Esempio 2.0.1) gli equilibri sono due,
e abbastanza ovvi. I due si recheranno insieme al mare, oppure insieme
in montagna. Non ci voleva Nash per capirlo, ma l’esempio ha il suo
interesse perché mostra uno dei problemi dell’equilibrio di Nash, almeno
nei giochi in cui non è unico. I due giocatori hanno preferenze diverse,
perché uno è più contento se viene selezionato un equilibrio, l’altro se
viene selezionato quello opposto:un buon motivo di conflitto. In realtà
c’è un altro problema, che mettiamo in luce in un esempio ancora più
evidente.
Esempio 2.2.3 Il gioco è descritto da questa bi-matrice:

(0,0) (1,1)
(1,1) (0,0)

Possiamo pensare che questo sia il gioco di una coppia che sta parlan-
do al cellulare, quando improvvisamente la comunicazione si interrom-
pe. Hanno entrambi due opzioni: richiamare o aspettare. Ed entrambi
vogliono continuare la conversazione: che fare?
2.2 Strategie dominate 37

Notiamo che questo è un gioco molto speciale, perché i due hanno


esattamente le stesse funzioni di utilità sugli esiti: sono ugualmente con-
tenti se si risentono, ugualmente scontenti altrimenti. Essi sono entrambi
indifferenti sui due equilibri di Nash, uno o l’altro è lo stesso, ma che cosa
capita spesso in pratica? Che i due richiamino immediatamente, trovan-
do il cellulare occupato, e dopo qualche tentativo a vuoto smettono, e
la conversazione langue. . . il che mostra che in presenza di più equili-
bri i giocatori hanno bisogno di coordinarsi, per raggiungere davvero un
equilibrio, perché senza coordinamento c’è il rischio concreto di finire in
una situazione chi di equilibrato non ha nulla. Due giocatori saggi, sa-
pendo che rischiano di dover giocare questo gioco, dovrebbero accordarsi
su come procedere (io dico sempre, se cade la linea richiama chi ha già
chiamato, cosa che per me a volte funziona a volte no, perché a volte mi
dimentico chi ha chiamato).
L’Esempio 2.0.2 dei contadini e delle mucche al pascolo è l’antesignano
di tutti quelli che modellizzano lo sfruttamento di beni comuni. Dal punto
di vista individuale, è conveniente richiedere sempre molte risorse, ma
queste sono finite e si impoveriscono, e alla fine tutti ne pagano le spese.
Concetti oggi chiari a tutti o quasi, ma la cui formalizzazione ai tempi è
servita ad aumentarne la consapevolezza.
Passiamo ora al gioco dell’Esempio 2.0.3, che parla dei due gelatai
che devono decidere dove mettere i loro baracchini per vendere lo stesso
tipo di gelato. È facile dimostrare che esiste un unico equilibrio di Nash,
che prevede che entrambi si mettano al centro della spiaggia. In questo
modo si dividono a metà i clienti che, essendo alla stessa distanza dai
due baracchini, andranno per metà da uno e per metà dall’altro. Se uno
si spostasse, per esempio verso destra, acquista clienti? No, ne perde!
Perché diventano automaticamente suoi tutti quelli alla sua destra, ma
divide a metà quelli che stanno in mezzo ai due. Quindi quello rimasto
al centro si prende tutti i clienti alla sua sinistra, più metà di quelli in
mezzo! Questo esempio, anche se molto semplificato, dà in parte un’in-
tuizione del fatto che spesso si osserva, nelle città, che ci sono vie o zone
dedicate in particolare a ospitare attività commerciali dello stesso tipo:
basta pensare ai negozi di moda in via della Spiga a Milano, o a viali chi-
lometrici pieni di concessionari di automobili, che si vedono spesso nelle
periferie di grandi città. Prima di passare al prossimo esempio, facciamo
38 2 Un’occhiata al modello non cooperativo di Nash

ancora un paio di osservazioni su questo gioco. La prima è che se ci sono


tre venditori di gelato, non esiste nessun equilibrio di Nash! Non è diffi-
cile dimostrarlo, basta avere pazienza e considerare un certo numero di
casi. Con quattro o cinque esiste sempre una situazione di equilibrio di
Nash, da 6 in su si può dimostrare che ci sono infinite configurazioni di
equilibrio! La seconda osservazione è che, al solito, l’equilibrio di Nash è
poco efficiente, se guardiamo per esempio il punto di vista dei bagnanti,
che avrebbero preferito di gran lungo un gelataio a 250 metri dall’inizio
della spiaggia, e uno a 250 metri dalla fine: in questo modo i più sfortu-
nati devono farsi solo 250 metri scottandosi i piedi sulla sabbia bollente,
mentre all’equilibrio se ne fanno 500.
Parliamo ora brevemente del modello di Cournot (Esempio 2.0.4).
Senza scrivere funzioni di utilità o fare calcoli, che si possono trovare
ovunque, il modello base considera due imprese che producono lo stesso
bene e hanno il potere di influenzarne il prezzo, attraverso la quantità di
prodotto immesso sul mercato. Nonostante sia, come detto, un modello
molto di base, esso mette bene in evidenza che la situazione, per i con-
sumatori, è meglio nel duopolio che in regime di monopolio: la quantità
complessiva di merce immessa nel mercato è superiore, quindi a prezzo
più basso. Inoltre i guadagni complessivi dei duopolisti sono più bassi di
quello del monopolista6 . Un’altra osservazione interessante (non dovuta
a Cournot) è che se si assume che un’azienda sia leader sul mercato, e
annunci per prima la sua politica produttiva, e che la seconda si adatti,
massimizzando il suo profitto in base alla politica annunciata dal leader,
si ha la situazione migliore per i consumatori: il leader produce come il
monopolista, l’altro produce una quantità positiva del bene, sul mercato
c’è una maggior quantità di bene che negli altri casi, con conseguente
diminuzione dei prezzi.
Possiamo ora passare all’esempio che abbiamo chiamato paradosso di
Braess, e che riguarda un semplice problema di traffico. La situazione è
visualizzata nella Figura 2.0.5 qui sotto:
6
Potrebbero accordarsi per fare finta di essere un produttore solo? Un accordo potrebbe
essere che uno produce zero, poi si dividono i guadagni dell’altro, ma è un accordo che non
sta in piedi, non è un equilibrio di Nash, quindi almeno un giocatore avrebbe incentivo a
romperlo.
2.2 Strategie dominate 39

Figura 2.1. Viaggiando da Milano a Torino

Ricordando che ci sono 4000 automobilisti che ogni mattina si recano


da Torino a Milano utilizzando due strade possibili, quella che passa dal
paese A e quella che passa dal paese B, non c’è bisogno di fare tanti
calcoli per capire che l’unica situazione di equilibrio si ha quando metà
automobilisti passa da una parte e metà dall’altra. Questo implica che la
durata del viaggio per ogni automobilista è di 70 minuti totali: 20 minuti
per percorrere il tratto di provinciale e 50 per percorrere il tratto di au-
tostrada. Fino a qui tutto ovvio e nessuna apparizione di paradossi. Ma
supponiamo che i sindaci di A e B decidano di agevolare gli automobilisti
e pensino di costruire una strada che colleghi i due paesi, aumentando
le possibilità di scelta degli automobilisti. Supponiamo anche che il tem-
po di percorrenza di questa nuova tratta sia di 5 minuti. Che succede?
Non è difficile rendersi conto che ora passare dall’autostrada diventa per
tutti una strategia strettamente dominata. Quindi tutti gli automobilisti
passeranno dalla nuova strada. Ma quanto dura il tragitto ora per tutti
i viaggiatori? Visto che passano tutti dal nuovo collegamento, tutti si
troveranno a percorrere le strade provinciali e il tempo di percorrenza
diventa 40+5+40=85 minuti. . . Un quarto d’ora in più rispetto a prima!
Ecco dove sta il paradosso, che a noi però a questo punto non sembra
un paradosso, perché abbiamo già visto all’inizio del capitolo che au-
mentare le possibilità di scelta dei giocatori può essere per loro molto
dannoso. Tuttavia rimane il fatto che questo esempio, pur se costruito a
tavolino e molto semplificato, mostra in maniera molto efficace qualcosa
che, per chi non è abituato a ragionare strategicamente, è davvero molto
sorprendente.
40 2 Un’occhiata al modello non cooperativo di Nash

Parliamo adesso del gioco di El Farol bar (Esempio 2.0.6), in cui la


contentezza dei presenti aumenta fino a quando si arriva alla soglia cri-
tica di 60 persone, dopo meglio stare a casa. Anche qui determinare gli
equilibri di Nash è molto facile. L’unica situazione di equilibrio è che 60
persone vadano al bar e 40 rimangano a casa. Il punto è che questa solu-
zione è freddamente razionale, ma poco credibile, in quanto discrimina i
giocatori, quelli del bar sono molto contenti quelli a casa molto meno, e
di difficile attuazione, se non si immagina un dittatore che stabilisce a suo
insindacabile giudizio chi va al bar e chi resta a casa. Che succede allora
in pratica? Naturalmente non si può dire che succederà dopodomani, ma
esperimenti hanno mostrato che le persone tendono a comportarsi evol-
vendo verso un altro equilibrio. . . Ma come, ci sono altri equilibri? Apro
una veloce parentesi, cercando di sintetizzare molto concetti importanti
ma meno intuitivi.
Consideriamo un gioco finito, con un unico equilibrio di Nash. La ra-
zionalità ci dice che quello è l’unico esito possibile del gioco, tra giocatori
razionali. Il che significa che se vediamo questo gioco giocato molte vol-
te, vedremo sempre lo stesso comportamento da parte dei giocatori. È
sensato pensare che tutti i giochi debbano avere sempre lo stesso esito? È
ragionevole pensare che a sasso carta forbici giocatori razionali ottenga-
no sempre lo stesso risultato? Ovviamente no, e il motivo è che il gioco
non ha un equilibrio di Nash. Tuttavia, l’intuizione ci dice che anche
un gioco come quello si può giocare con una certa accortezza. So che non
mi conviene affatto giocare sempre sasso, o forbici, o carta, perché i miei
avversari se ne accorgono e mi batteranno sempre, dopo qualche partita.
Mi conviene cambiare le mie strategie. Ma anche questo lo posso fare
con accortezza. Per esempio, potrei decidere di giocare sasso e forbici con
uguale probabilità, e ignorare carta? Si fa in fretta a capire che anche
questa è una cattiva idea, perché appena gli altri se ne accorgono con
me non perderanno mai (come?). L’idea geniale allora in questo contesto
è di allargare il concetto di strategia. Il giocatore non deve più scegliere
tra tre sole alternative, sasso carta o forbici, ma deve scegliere con che
probabilità giocare le tre opzioni. Il gioco si amplia, le utilità diventano
utilità attese, ma magicamente ora un equilibrio di Nash esiste sempre.
Certo, quello che i giocatori guadagneranno o perderanno diventa ora so-
lo in media, ma anche i casinò possono perdere un sacco di partire, però
2.2 Strategie dominate 41

poi in media guadagnano. L’idea si applica anche in questo contesto.


Tornando al nostro problema di El Farol bar, esperimenti sembrano
indicare che il comportamento degli abitanti di Santa Fé tende a evolve-
re verso un equilibrio in strategie miste, che ha l’indubbio vantaggio di
proporre una soluzione simmetrica che, per giocatori simmetrici, sembra
molto ragionevole.
Finiamo il capitolo parlando un po’ al gioco dell’ultimatum (Esempio
2.0.7), in cui il padre dice al primo figlio di proporre una frazione della
torta al fratello minore, se questi accetta la torta viene divisa dal padre,
altrimenti se la tiene.
Che equilibri di Nash ha questo gioco? Abbastanza sorprendentemen-
te, qualsiasi suddivisione della torta è razionale, perché risultato di un
equilibrio di Nash. Vediamo perché. Supponiamo che il fratello maggiore
proponga x per sé e 1 − x per il fratello minore, e che la strategia del fra-
tellino sia: accetto un’offerta di (almeno) 1 − x, rifiuto qualunque offerta
più bassa. Chiaramente, questa è una situazione di equilibrio. Questo per
esempio significa che il fratello maggiore potrebbe dire ti do 0.99 e mi
tengo 0.01 della torta, accetti? Certo che il fratello minore accetta, ma
chi glielo fa fare al primo di formulare una tale proposta? Davvero poco,
poco credibile. Esiste allora una soluzione più credibile? Certamente, se
si tiene conto della dinamica del gioco. Un gioco del genere avviene per
mosse successive, non contemporanee. In questo caso il ragionamento più
efficace è quello descritto nel Capitolo precedente parlando di induzione
a ritroso: che cosa fa il fratello piccolo se il maggiore vuol tenersi x e gli
offre 1 − x? Se risponde “accetto”, ottiene la percentuale pezzo (1 − x)
della torta, se rifiuta non ottiene nulla. Allora accettare è sempre una
scelta ottimale. Questo naturalmente è ben chiaro anche al fratello gran-
de, che quindi ha interesse a offrire il meno possibile. In questo modo la
proposta ottimale per il primo è di tenersi tutta la torta, e il secondo
accetta (perché per lui accettare o rifiutare è indifferente, quindi sono
entrambe scelte ottimali).
Succede cosı̀ in pratica? Certo che no! La cosa interessante è chie-
dersi perché, e le risposte spiegano tutti gli studi fatti utilizzando questo
esperimento. Ma possiamo spiegare, alla luce delle nostre ipotesi sul com-
portamento degli individui, perché proposte basse vengono rifiutate? O
42 2 Un’occhiata al modello non cooperativo di Nash

dobbiamo mettere in discussione il fatto che le persone agiscano massi-


mizzando la loro utilità? Ovviamente non esiste una risposta univoca,
ma la mia risposta è questa. I dati primitivi che definiscono un gioco non
cooperativo sono gli insiemi delle strategie dei giocatori, e le loro fun-
zioni di utilità. Ora, se non è irragionevole assumere che tutti conoscano
che azioni possano scegliere i giocatori, diventa invece enormemente più
difficile essere ragionevolmente certi sulle loro funzioni di utilità. Questo
gioco, come dicevo, è stato usato in un celebre esperimento in cui vo-
lontari venivano sottoposti a risonanza magnetica al cervello, simulando
che fossero il fratello minore, cui venivano fatte proposte di spartizione
di una certa somma di denaro (nell’esperimento non esisteva affatto un
primo giocatore, era chi faceva l’esperimento a scegliere la proposta da
fare) È stato osservato che il rifiuto comportava un’attività accentuata di
una parte del cervello, l’accettazione da una differente. Che cosa dimostra
questo? Che nel caso di cifre basse (o fette di torta molto mingherline)
il fratello minore è forse interessato ad altri aspetti della questione, per
esempio una cifra troppo bassa può essere presa come forma di ingiusti-
zia, o poca empatia. Il che, tradotto in termini matematici, significa che
la funzione di utilità non è in questo caso basata esclusivamente sul misu-
rare la quantità di torta che mangi o di denaro che prendi (piuttosto che
niente è meglio piuttosto, in questo caso), ma tiene conto di altri fattori.
Del resto, questo gioco è stato proposto, utilizzando un ingegnoso sistema
di distribuzione di noccioline, a due scimpanzé, e il risultato, non tanto
sorprendente, è che quello che doveva decidere se rifiutare o accettare,
non stava tanto a guardare quel che andava all’altro, ma si prendeva con
gusto le noccioline che arrivavano dalla sua parte, una volta che le avesse
accettate7 .
Concludiamo allora il capitolo tirando qualche conclusione: la cosa più
importante, di gran lunga, che la teoria non cooperativa mette in luce
è che l’interazione strategica tra individui cambia radicalmente la situa-
zione rispetto a quando si decide da soli; per questo, occorre sempre fare
attenzione a dare per scontato che cose che sono ovvie in teoria delle
7
Un altro aspetto inetressante dell’esperimento è che s eveniva detto a chi doveva accettare
o rifiutare l’offerta che la proposta era selezionata da un computer e non da un umano,
venivano in media accettare proposte molto più basse, forse perché le persone si illudono
poco sul fatto di poter “punire” il computer.
2.2 Strategie dominate 43

decisioni si trasportino pari pari alla teoria dei giochi: il secondo aspet-
to fondamentale invece è che il comportamento basato sulla razionalità
individuale genera spessissimo situazioni socialmente deprecabili, rispet-
to ad altre in cui tutti potrebbero stare meglio; tuttavia queste ultime
non sono stabili, perché qualche giocatore, qualora venissero proposte,
avrebbe interesse a non seguire la raccomandazione. Questa osservazione
è particolarmente interessante dal punto di vista del disegnare scenari e
promulgare leggi che, attraverso meccanismi immessi nel gioco, portino
la situazione di equilibrio verso situazioni più favorevoli dal punto di vi-
sta sociale. Pagare le tasse, semplicemente perché si sa che uno stato non
vive senza finanziamenti, è una strategia strettamente dominata, a meno
che non si introducano regole ausiliarie; Hobbes ha pensato al dittatore,
forse si può evitare utilizzando strumenti un po’ più sofisticati, basati sia
su punizioni sia su incentivi.
Esercizio 2.2.1 Una coppia di amici sta andando a caccia. Ognuno può
decidere se andare a cacciare un cervo o una lepre, ogni cacciatore può
catturare da solo la lepre, invece per catturare il cervo deve esserci anche
il suo compagno. Ovviamente è meglio catturare un cervo di una lepre.
 
(5, 5) (0, 1)
(1, 0) (1, 1)

Determinare gli equilibri di Nash.


Esercizio 2.2.2 Due studenti rispondono correttamente a una domanda
durante una lezione. L’insegnante decide allora di premiarli aggiungendo
punti al voto della prossima verifica. L’insegnante chiede agli studenti di
scrivere su un foglietto ”accetto un punto extra” o ”regalo tre punti extra
al mio compagno” e promette di seguire le decisioni prese dagli studenti.
Rappresentare il gioco in forma strategica e determinarne l’equilibrio.
Esercizio 2.2.3 Una guardia dà la caccia a un ladro all’interno di un
museo con 4 sale collegate come nella mappa: La guardia riesce a cattu-
rare il ladro se i due si trovano nella stessa stanza o in stanze adiacenti.
Se la guardia cattura il ladro avrà un payoff di 1, mentre il ladro di -1.
Se la guardia fallisce il suo payoff sarà -1 e quello del ladro 1. Dire quali
sono le strategie dominanti per la guardia e per il ladro.
44 2 Un’occhiata al modello non cooperativo di Nash

B D
A
C

Esercizio 2.2.4 Tre professori si ritrovano a un congresso in una piccola


cittadina, dove esistono solo i due ristoranti in cui recarsi per cena. Dal
momento che recentemente hanno avuto qualche dissenso su un progetto
scientifico, preferirebbero mangiare soli. Che faranno?
Esercizio 2.2.5 Rappresentare in forma strategica il gioco sasso carta
forbici, assegnando 1 al giocatore che vince, -1 a quello che perde e 0 in
caso di pareggio. Verificare che non ci sono equilibri di Nash.
Esercizio 2.2.6 Verificare che nel gioco di Hotelling (Esempio 2.0.3) se
i venditori sono tre non esiste un equilibrio di Nash.
Esercizio 2.2.7 Mettere in forma strategica i giochi degli Esercizi 1.2.9
e 1.2.10 e determinarne gli equilibri di Nash.
Esercizio 2.2.8 Discutere la seguente variante dell’ultimatum game, in
cui il padre offre due oggetti preziosi al primo figlio, che deve fare un’of-
ferta al fratello: il seguito come nell’ultimatum game (quindi ora le offerte
possibili sono 0,1,o 2 oggetti).
Indice

1 La descrizione del gioco in forma estesa . . . . . . . . . . . . . . . . 5


1.1 Le ipotesi della teoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 La forma estesa del gioco . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2 Un’occhiata al modello non cooperativo di Nash . . . . . . . 25


2.1 Il dilemma del prigioniero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.2 Strategie dominate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

Potrebbero piacerti anche