Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Definizione
La teoria dei giochi la scienza matematica che analizza alcune situazioni di conflitto e ne ricerca soluzioni (cooperative o non cooperative) attraverso modelli in cui le decisioni di un soggetto influiscono sui risultati conseguibili dai rivali.
N = Numero dei giocatori
MATEMATICAMENTE PARLANDO
G = {N, S, }
S = Numero di strategie
= Insieme delle vincite (payoff)
Evoluzione storica
La nascita della moderna teoria dei giochi viene comunemente fatta risalire al 1944 Anno di pubblicazione del libro Theory of Games and Economic Behavior da parte di John Von Neumann e Oskar Morgenstern
I primi studi pioneristici riguardavano principalmente i giochi non cooperativi, giocati da 2 individui, in cui la somma dei payoff conseguiti era pari a zero. A partire dagli anni 50 John Nash jr. studi il problema degli equilibri strategici nei giochi non cooperativi.
Nel periodo a cavallo tra la fine degli anni 50 e la met degli anni 70 la teoria dei giochi non conobbe una grande diffusione: fu applicata saltuariamente negli studi sulla stabilizzazione e sullo sviluppo. Ma dalla fine degli anni 70 gli studiosi cominciarono ad applicare la teoria dei giochi a un campo vastissimo di materie, non prettamente economiche.
Anche nel campo economico si moltiplicarono contributi teorici sempre pi formali grazie agli studi di Selten, Kreps, Harsanyi e altri
A riprova della definitiva consacrazione della Game Theory nel 1994 Nash, Selten e Harsanyi vincono il Premio Nobel per leconomia.
Studi militari
Economia Finanza
Matrice
GIOCATORE B
Forma estesa
t2
s1 Giocatore A s2
t1 s1
GIOCATORE A s2
2,4
0,4
2,2
6,0
t1 2,4 Giocatore B t2 2,2 t1 0,4 t2 6,0
GIOCHI SIMULTANEI
GIOCHI SEQUENZIALI
Giochi cooperativi e non cooperativi. Giochi simultanei e sequenziali. Giochi non ripetuti e ripetuti. Giochi con giocatori razionali o meno.
Noi oggi ci occuperemo solo di giochi non cooperativi e con individui razionali, principalmente di giochi simultanei (con forma a matrice).
Vedremo le possibili diverse soluzioni tra giochi giocati una sola volta e giochi ripetuti pi volte. Infine analizzeremo brevemente i giochi sequenziali in forma estesa, applicati al modello di Stackelberg e a un gioco di deterrenza allentrata del mercato.
Strategia: definizione
Scegliere una strategia significa individuare il risultato di una determinata scelta i da parte di un giocatore in base alle attese sulle possibilit di scelta dellavversario e al valore dei payoff
Si = (J = t1 tN) ( j x Pj )
t1 S1
t2
5,2 1,6
2,3 4,5
A
S2
Pt1 = 50 % ; Pt2 = 50 %
Il valore della probabilit attesa delle mosse dellavversario condiziona decisamente le scelte dellindividuo. Nellesempio precedente abbiamo visto che, sempre data
la formula Si = (J = t1 tN) ( j x Pj ) il giocatore A avrebbe scelto S1 come strategia ottimale. Riproponiamo lo stesso esempio, cambiando le probabilit attese che B giochi t1 oppure t2.
t1 S1
t2
5,2 1,6
2,3 4,5
A
S2
Pt1 = 20 % ; Pt2 = 80 %
Sulla scelta della strategia e sulla valutazione delle possibili scelte dellavversario influir notevolmente il numero delle volte in cui il gioco viene ripetuto. Se un gioco viene ripetuto una sola volta lindividuo tender a giocarsi il tutto per tutto nel suo unico tentativo, anche se ci sono serie possibilit di non riuscire a raggiungere il risultato sperato. Se invece un gioco viene ripetuto pi volte allora possibile fare degli aggiustamenti: si pu giocare sempre una sola strategia che riteniamo ottimale (strategia pura) o cercare di alternare stocasticamente varie strategie (strategia mista)
G = {N, S, }
N = Numero dei giocatori S = Numero di strategie = Payoff
DEFINIZIONE ALTERNATIVA
G = {N, S, , n}
Il risultato del gioco G determinato dal numero dei giocatori, dalle strategie, dal valore dei premi attesi ma anche dal numero di volte in cui esso viene giocato, purch i giocatori siano consapevoli che il gioco vada giocato n volte
Dormire
50 , 50
100 , 0
A
Dormire
Olio
-30 , 70
60 , 40
A
Olive
N = 2 giocatori (imprese A, B) Obiettivo: produrre olio o olive B produrr sicuramente olio A, essendo consapevole che B opter per la scelta olio, si regoler di conseguenza e sceglier di produrre olive
2,5
5,0
4,1
A
s2
6 , -10
A e B non posseggono strategie dominanti. A, analizzando le strategie per Pt = sceglierebbe S1 perch i valori attesi delle due strategie sono i seguenti: S1 = (2 x ) + (4 x ) + (6 x ) = 12/3 S2 = (5 x ) + (5 x ) + (0 x ) = 10/3
B ha una strategia dominata in senso stretto, che quindi gioca con P = 0. A, dopo aver escluso t3, ha una strategia dominante che S2. B, sapendo che A giocher S2, risponde con t2 e il gioco si conclude con il raggiungimento di (S2-t2)
t2
s1
10 , 4
5,3
A
s2
B non ha strategie dominanti e quindi neppure strategie dominate. A invece ha una strategia dominante in senso debole S1 (in cui s1 s2). A sceglie la strategia dominante S1 cui B risponde con t1.
L equilibrio S1-t1 la scelta ottimale per A e invece di second best per B. Ma seguendo una strategia debolmente dominante si raggiunge sempre un risultato efficiente?
t2
s1
10 , 1
5,3
A
s2
No perch la scelta (S1-t2), sia per A che per B, addirittura una scelta di third best. Preferenze di A: 101052. Preferenze di B: 7531.
Equilibri di Nash
Riprendiamo un attimo lesercizio precedente: lequilibrio raggiunto ha qualche particolare propriet?
10 , 1
5,3
Lequilibrio raggiunto ha una peculiarit: un punto in cui sia A che B, muovendosi da soli dallequilibrio, peggiorerebbero la loro situazione.
A infatti, spostandosi passerebbe da 5 a 2, B allo stesso modo da 3 a 1. Possiamo quindi dire che i giocatori raggiungono la loro scelta ottima data la scelta dellavversario: questo equilibrio chiamato Equilibrio di Nash (NE). Il problema che non sempre lequilibrio di Nash scelto coincide con una scelta ottimale, come nel caso (che vedremo dopo) del dilemma del prigioniero. Inoltre ci possono essere pi NE in un unico gioco. Anche in questo gioco, a ben guardare, c un secondo NE, che tra laltro composto dalla scelta ottima per entrambi i giocatori (10,7). Che fare in questi casi?
10 , 1
5,3
s1
s2
La risposta appare sin da subito chiara: la strategia S2 del giocatore A debolmente dominata dalla strategia S1, poich S1 S2 per ogni scelta di B. In un gioco simultaneo e con informazione perfetta, S1 domina sempre S2, e ci rende impossibile che si raggiunga (S2-t1) per ogni Pt2>0. Solo se ci fosse P=0 che B scelga t2 si potrebbe raggiungere lequilibrio (10,7) perch il valore atteso di S1 e S2 per Pt2=0 equivalente. Tuttavia questa certezza si presume irraggiungibile in un gioco simultaneo ripetuto una sola volta (mentre vedremo che non cos per i giochi ripetuti con negoziazioni preliminari). Diciamo che un primo criterio di raffinamento quello di escludere quegli equilibri di Nash ottenuti tramite strategie debolmente dominate.
Equilibrio perfetto nei sottogiochi: un gioco in forma estesa e in cui i giocatori muovono pi volte, da luogo a un insieme finito di sottogiochi. Se ci sono pi NE, bisogna individuare quel NE perfetto che tale sia per il gioco nel suo complesso sia in ciascun sottogioco proprio. Criterio della razionalit sequenziale: in ogni sottogioco si giunge a seguito di scelte iniziali: ammettendo che ci sia informazione perfetta sulle scelte iniziali che hanno portato al nodo, prevarr il NE tale per cui i giocatori continueranno a scegliere strategie che gli consentiranno di agire secondo lo stesso criterio di razionalit utilizzato fino a quel momento. Perfezione con mano tremante: una chiave di lettura proposta da Selten simile allequilibrio perfetto nei sottogiochi. Si basa su una serie di esempi che individuano nei giochi estesi, tra i vari NE, la possibilit attesa che un giocatore assegna al fatto che il suo competitor sbagli mossa.
Confessare
0,0
2 , -10
- 10 , 2
-3 , -3
A
Confessare
Due criminali vengono fermati e interrogati separatamente, ma la polizia non ha prove della loro colpevolezza: se nessuno confessa entrambi verranno rilasciati e avranno 0 anni di carcere, mentre se confessa solo uno, andr in prigione soltanto laltro.
Tuttavia, dati i benefici che i poliziotti hanno promesso nel caso di confessione, tutti e due hanno una strategia dominante che confessare.
Lequilibrio confessare-confessare lunico NE del gioco: tutti e 2 non hanno convenienza a ritrattare dato che laltro comunque confesserebbe.
In un gioco svolto una sola volta quello raggiunto lunico equilibrio possibile: vedremo come le cose si modificano in un gioco ripetuto.
Nato
Non istallare missili
-5 , -5 -10 , 10
10 , -10 0,0
I
I N NI
PV
NI
La soluzione del resto nella logica dei fatti: gli armamenti costano, lopinione pubblica contraria al riarmo, e cos i due contendenti, dovendo ripetere il gioco n volte, cercano di accordarsi per un nuovo equilibrio (non istallare-non istallare) Questo nuovo punto non un NE: entrambi i contendenti, infatti, cambiando strategia e istallando i missili otterrebbero nel breve periodo un vantaggio. Ma nel lungo periodo? Se i due blocchi possono controllare a vicenda le mosse dellavversario chiaro che, in presenza di una violazione degli accordi, nel turno successivo anche laltro contendente devierebbe e si ritornerebbe al NE (-5, -5). Questa cooperazione che porta a scegliere strategie dominate fortemente influenzata dal numero di volte in cui si ripete il gioco, vediamo perch:
I
I N NI
PV
NI
Confessare
0,0
2 , -10
- 10 , 2
-3 , -3
A
Confessare
La strategia colpo su colpo potrebbe essere efficace anche nel caso del dilemma del prigioniero, (che come abbiamo visto prima da come risultato un NE non soddisfacente) se i due criminali potessero rimanere in contatto tra loro.
In questo caso apparirebbe loro chiaro che, pur avendo due strategie dominanti (confessare-confessare), converrebbe a entrambi tenere una linea diversa e raggiungere un accordo in cui entrambi non confessano.
Verrebbero cos sottoposti a indefiniti interrogatori ma, continuando a non confessare, non verrebbero incriminati (a meno che uno dei due decidesse di confessare, facendo di fatto terminare il gioco.)
t2
s1
10 , 1
5,3
A
s2
Come abbiamo visto prima, in questo gioco A ha una strategia debolmente dominante S1, la gioca e costringe B a rispondere con t2, dando vita allequilibrio S1-t2, che un NE ma che risulta addirittura di third best per entrambi i contendenti. Possiamo per ipotizzare che, in un gioco ripetuto, i 2 contendenti possono fare ricorso a dei segnali per fare capire le proprie scelte strategiche e raggiungere un equilibrio diverso. Si parla in questo caso di negoziazioni preliminari. Vediamo come funzionano:
t1
s1 A s2
t2
Anche in questo caso possiamo fare ricorso a un confronto empirico con la realt.
10 , 1 10 , 7
5,3 2,5
Se A e B devono ripetere il gioco pi volte improbabile che continuino a accettare iteratamente un equilibrio di third best.
Per sbloccare la situazione uno dei due deve dare un segnale e negoziare: nel nostro caso lo deve fare B
t2
s1
0,0
99 , 100
A
s2
Questo un tipico caso in cui difficile che i due contendenti si mettano daccordo: seguendo il valore atteso delle strategie A sceglierebbe S2, B sceglierebbe t2 e tutti e 2 si ritroverebbero con =0. Anche con le negoziazioni preliminari c il serio rischio di non trovare un accordo, in quanto ci sono due NE: il primo (S2-t1) di first best per A e di second best per B, mentre il secondo NE (S1-t2) viceversa.
t1
s1 A s2
t2
0,0 100 , 99
99 , 100 0 ,0
In questo caso tuttavia assai probabile che, una volta cominciato il gioco, se i contendenti continuano sempre a ricevere =0, i nostri giocatori rinsaviscano e trovino un accordo. In fondo a A e B non importa molto ricevere 100 o 99. Per loro conta di pi non saltare alcun turno di gioco conseguendo 0.
Per fare ci bisogna dare vita a una convenzione per evitare di danneggiarsi a vicenda: trovare un accordo per uno dei due NE e poi continuare a giocarlo in modo continuativo, per non correre il rischio di subire un danno serio.
(Esempio di convenzione : il semaforo) Un possibile superamento delle convenzioni sono i comportamenti appresi. Se ad es. nel nostro gioco i payoff fossero (2,1) invece di (100,99) sarebbe molto pi difficile fare convergere A o B sul NE di second best, e sarebbe pi credibile la minaccia di infrangere laccordo anche a costo di ricevere 0. Con il tempo per A e B potrebbero sviluppare una strategia capace di giocare alternativamente i due NE per non scontentare nessuno.
Un buon esempio viene riferito da Kreps nel gioco sui criteri di scelta di 6 citt americane in un elenco di 12, a ognuna delle quali viene assegnato un diverso valore (incognito), mentre vengono svelate solo la citt con valore maggiore (New York) e quella con valore minore (Seattle). Le scelte seguono tutte un unico criterio che non razionale.
B
t2 t3
-90, -90
90 , 125
s2
s3
Un esempio di scelta secondo punti e principi focali rappresentata da questo gioco studiato da Sylos-Labini: analizzandolo razionalmente notiamo che le strategie S2 e t2 hanno un valore atteso decisamente minore e 2/3 di possibilit di ottenere un negativo. Razionalmente si possono escludere, limitando le scelte solo alle 4 combinazioni rimanenti. Eppure pi del 90% dei giocatori cui hanno chiesto di simulare questo gioco hanno scelto S2 e t2, ottenendo (S2-t2) che lunico NE del gioco.
Lautore sostiene che su questa scelta plebiscitaria hanno banalmente influito la posizione centrale della scelta (S2-t2) allinterno del gioco e i payoff a cifra tonda (100,100)
Nel modello di Stackleberg limpresa leader, di fronte alla minaccia di aumento di produzione da parte del follower, sceglie il punto in cui la propria curva di isoprofitto massima tangente in un unico punto alla curva di reazione dellimpresa follower. Il leader cerca quindi di massimizzare il proprio profitto date le possibili reazioni del concorrente, come vedremo prossimamente. Vediamo come ci pu essere espresso in forma di gioco a matrice
L
Reagire Aumentare Y Non reagire
Come vediamo nellesempio lazienda follower F non ha nessuna strategia dominante. L invece ha una strategia debolmente dominante che quella di reagire. Tuttavia nella realt il gioco non simultaneo ma sequenziale, e per capirlo dobbiamo fare riferimento a una struttura ad albero.
1,5 2,9
3,3 2,9
F
Mantenere Y
Analizziamo il gioco in forma estesa, tenendo presente che il primo payoff di F e il secondo di L
Follower
Non aumentare Y
F a questo punto sa che se non aumenta lattuale livello di output manterr il suo attuale payoff pari a 2.
Se invece aumenta la produzione incorrer nella reazione di L e otterr un payoff di 1. Per questo F decider di non aumentare Y e il gioco si concluder con F=2, L=9
Leader
Reagire Non reagire Reagire Non reagire
1,5
3,3
2,9
2,9
Follower
Aumentare Y
Non aumentare Y
Leader
Non reagire Reagire Non reagire
1,5 2
3,3
2,9
2,9
Ad esempio L pu scoraggiare F con una delibera del Cda che prevede di reagire comunque di fronte a qualsiasi aumento produttivo di F, oppure dando mandato ai propri avvocati di reagire comunque (visto che se F non aumenta gli output per L indifferente reagire o meno)
Barriere allentrata
I giochi sequenziali possono spiegare anche se ci sono barriere allentrata che possono impedire a una nuova azienda di insidiare la posizione di una azienda leader. Vediamo questi due giochi in forma di matrice tra A (azienda entrante) e B (azienda affermata).
Reagire Entrare
Non reagire
Reagire Entrare
Non reagire
0,2
2,1
0,0
2,1
A
Non entrare
1,9
1,9
Non entrare
1,9
1,9
A
Entrare Non Entrare
B
Reagire Non reagire Reagire Non reagire Reagire Non reagire
B
Reagire Non reagire
0,2
2,1
1,9
1,9
0,0
2,1
1,9
1,9
Se B un monopolista, in presenza di barriere allentrata pu continuare a disporre dei vantaggi tipici del monopolio.
Quindi a B conviene creare le condizioni di esistenza delle barriere allingresso del mercato. Se B disponesse di un surplus di capacit produttiva inutilizzata, potrebbe produrre una quantit di Y maggiore allo stesso costo marginale. Questa minaccia potrebbe far ritenere ad A impossibile il proprio ingresso sul mercato. E vero che, se B un monopolista, non ha uno stretto bisogno di questo surplus, tuttavia serve a rendere credibile la minaccia verso A, per cui per B meglio essere in questa situazione
B
Reagire Non reagire Reagire Non reagire
0,2
2,1
1,9
1,9
La possibilit di muovere per ultimo (data dal ruolo di leader o dalla struttura del mercato) e di influenzare cos le scelte dei propri competitors, rappresenta un vantaggio importante, che le aziende cercano di difendere e di utilizzare al meglio.