Sei sulla pagina 1di 9

Elementi fondamentali

La Teoria dei giochi dunque la scienza matematica che analizza alcune situazioni di conflitto e ne ricerca soluzioni (cooperative o non cooperative) attraverso modelli in cui le decisioni di un soggetto influiscono sui risultati conseguibili dal soggetto stesso e dagli altri soggetti. Chiariamo dunque alcuni concetti fondamentali: ASSUNZIONI FONDAMENTALI Si assume che tutti i giocatori interagenti siano intelligenti e razionali. Intelligenti significa che capiscono la situazione in cui si trovano e sono in grado di fare ragionamenti logici di complessit indefinitamente elevata. Razionali significa che hanno preferenze coerenti (transitive) sugli esiti finali del processo decisionale e che hanno lobiettivo di massimizzare queste preferenze (Postulato di razionalit). GIOCHI Per gioco si intende linsieme costituito da tutti i giocatori, dalle loro strategie e dai possibili payoff (cio guadagni nellapplicare una determinata strategia in relazione alle scelte degli altri) e il numero delle volte in cui si gioca; matematicamente:
G = {N, S, , n}

in cui N linsieme dei giocatori, S linsieme delle strategie, linsieme dei payoff, n il numero delle volte in cui il gioco viene ripetuto. Ci definisce in modo univoco un gioco, differenziandolo da ogni altro e creando una situazione ben precisa.. STRATEGIE Per ciascun giocatore definito un insieme di azioni che gli permesso compiere. Generalmente queste vengono dette le sue strategie ( linsieme indicato con ) Le strategie sono le possibili scelte che ogni giocatore pu compiere, individuando il risultato di quella determinata scelta in base alle attese sulle probabilit di scelta degli avversari e al valore dei payoff. Una strategia dunque un piano completo e contingente che specifica come il giocatore debba comportarsi in ogni possibile circostanza in cui potrebbe essere chiamato a decidere. PAYOFF e UTILITA Secondo leconomia politica classica (Smith, Ricardo, Marx), lutilit coincide con una propriet fisica dei beni. In una seconda fase (a partire da Bentham) lutilt intesa come una caratteristica intrinseca dei soggetti, ne misura in qualche modo il benessere o la soddisfazione in relazione a certi consumi: lutilit una funzione definita sullinsieme dei beni (o degli esiti del gioco). Si parla infatti di funzione di utilit" Ogni individuo ha una sua funzione di utilit sullinsieme dei beni. Per esempio se linsieme dei beni costituito da una fetta di torta, un panino con il salame e un trancio di pizza, ognuno degli agenti sar chiamato a quantificare numericamente le sua utilit per ciascuno dei tre beni in questione. Questo valore prende il nome di payoff. I payoff sono dunque gli utili ricavati da ciascun giocatore in relazione alle scelte della partita. Non `e richiesto che le utilit di due individui debbano essere le stesse: c chi preferisce il panino con il salame, chi la fetta di torta e chi la pizza.

Perch importante conoscere le funzioni di utilit quando si descrive un gioco? La motivazione `e semplice. Alla fine del gioco ci sono esiti possibili rappresentati da premi che possono essere la solita terna {fetta di torta, panino con il salame, pizza} oppure dei premi in denaro, o semplicemente la soddisfazione di aver battuto lavversario in un gioco di carte e il dispiacere dovuto alla sconfitta, o altro ancora. Per stabilire quali sono i nostri obiettivi nel giocare dobbiamo sapere quantificare in qualche modo gli esiti del gioco. Potremmo anche desiderare la sconfitta se il nostro obiettivo far felice il nostro avversario (il nonno che gioca a carte con il nipotino), o desiderare il pareggio se siamo dei perfetti egualitari. Se per qualcuno fare del bene soddisfacente, questo ci che guida le sue azioni e deve essere implicito nella sua funzione di utilit. Non importa quali sono i nostri obiettivi. Ci che importa soltanto che siano quantificabili. Il gioco ha una diversa conclusione per ogni possibile strategia: indicando linsieme di queste scelte con S, possiamo dire che ad ogni giocatore deve essere associata una funzione: ovvero una funzione di utilit che ritorni un numero reale per ogni esito. CLASSIFICAZIONE DEI GIOCHI I giochi possono dunque essere: Cooperativi o non cooperativi A somma zero o a somma variabile Simultanei o sequenziali A informazione completa o incompleta Non ripetuti o ripetuti Con giocatori razionali o meno Finito o infinito Un gioco cooperativo quando possibile una soluzione in cui i giocatori possano accordarsi per la scelta di determinate strategie in modo tale da ottenere ciascuno pi di quanto guadagnerebbe non accordandosi con lavversario. Tipici giochi cooperativi sono quelli legati alle interazioni umane (societ, economia, strategie militari,), mentre un esempio di gioco non cooperativo sono gli scacchi o la dama. Un gioco a somma zero quando ci che guadagnato da un giocatore automaticamente perso dallavversario e viceversa; cio quando la somma degli utili in campo costante per ogni combinazione di strategie. Una tipica situazione di questo tipo si ha nel momento in cui in palio un premio che si pu dividere o meno, ma di consistenza fissa. I giochi in cui tutti i giocatori muovono simultaneamente sono detti giochi simultanei, mentre i giochi in cui le mosse dei giocatori possono essere una prima dellaltra sono detti giochi sequenziali, o dinamici. I giochi in cui tutti i giocatori muovono sapendo le mosse precedenti o simultanee degli altri giocatori sono detti giochi a informazione perfetta, mentre quelli in cui alcuni giocatori devono muovere senza conoscere le mosse precedenti o simultanee degli altri giocatori sono detti giochi a informazione imperfetta.

I giochi simultanei sono generalmente giochi a informazione imperfetta, mentre i giochi sequenziali sono generalmente giochi a informazione perfetta. Un gioco ripetuto se giocato pi di una volta con le stesse regole, per quanto i payoff possano per variare a seconda delle condizioni che di volta in volta si vengono a creare. Riguardo ai giocatori razionali si rimanda al paragrafo 3.1 (Postulato di razionalit); meglio per specificare che in presenza di giocatori irrazionali non possibile giungere a soluzioni affidabili, dunque questi giochi non fanno parte della Teoria. Un gioco si pu ritenere finito quando giocato da un numero finito di giocatori per un tempo determinato. Giochi infiniti sono quelli che studiano levolversi della societ o delle scelte sul mercato di unazienda, senza dunque avere un limite temporale, e considerando talvolta levoluzione dellinsieme dei giocatori, cio labbandono o lingresso di qualche giocatore. RAPPRESENTAZIONE DEI GIOCHI: la forma estesa e la forma strategica Si dice che un gioco in forma estesa quando la descrizione `e fatta con un albero: si tratta di costruire un grafo che, partendo dalla radice, descriva il gioco mossa per mossa, fino ad arrivare a presentare tutte le situazioni finali, ciascuna esito univoco di una data serie di mosse. La forma normale (o strategica) invece precisa il numero dei giocatori, lo spazio delle loro strategie, e la funzione di utilit di ciascuno di loro. Si noti che le strategie in questa descrizione sono un dato del problema, mentre nella forma estesa abbiamo serie di mosse, ed un compito delicato di chi analizza il gioco `e proprio quello di dedurre da queste le strategie di ogni giocatore.1 TEOREMI Teorema del minimax Formulato da J. von Neumann nel 1928. Ipotesi: gioco a somma zero, strategie pure o miste Enunciato: Ogni gioco finito a somma costante possiede almeno un punto di equilibrio di minimax in strategie pure o miste. Un punto di equilibrio di minimax una combinazione di strategie tali che ciascun giocatore selezioni la strategia che fornisce il pi alto dei valori minimi, mentre lavversario portato a scegliere la minima perdita fra quelle massime per ogni strategia. Il limite di questo teorema consiste nel fatto di poter essere applicato esclusivamente a giochi a somma zero, ma per questo tipo di giochi fornisce equilibri certi e soluzioni razionalmente inappellabili. Ottimo Parietano Concetto introdotto da Vilfredo Pareto nel 1896. Una combinazione di strategie detta ottimo parietano se non esiste nessuna combinazione strategica diversa da quella considerata tale che in essa il payoff di ciascun giocatore risulti maggiore o uguale a quello della strategia iniziale. Nessun giocatore pu dunque aumentare il proprio payoff senza ridurre quello di un avversario. Una combinazione di strategie di questo tipo assicura che non vi siano sprechi di risorse. Lottimo parietano rappresenta la soluzione migliore dal punto di vista collettivo, ma non detto
1

Esempi di rappresentazioni in forma estesa e forma strategica a pag

che lo rappresenti sempre dal punto di vista individuale. Teorema di Nash Formulato da John Forbes Nash Jr. nel 1949. Ipotesi: gioco non cooperativo, strategie pure o miste. Enunciato: Ogni gioco finito che ammetta strategie miste ammette almeno un equilibrio di Nash. Un equilibrio di Nash una combinazione di strategie

tale che ciascun giocatore non abbia alcun interesse a modificare la propria strategia individuale mentre gli altri mantengono inalterate le proprie. Tale cio che:

Sostanzialmente una condizione in cui un giocatore che cambi la propria strategia pu solo rimetterci, senza possibilit di guadagno Se gli agenti sono razionali e la combinazione di strategie non corrisponde ad un equilibrio di Nash, almeno un giocatore avr interesse a modificare la propria strategia. Gli equilibri di Nash possono corrispondere o meno ad Ottimi di Pareto; questo secondo caso si presenta ogni volta che la razionalit individuale e quella collettiva non coincidono. Questo teorema assicura lesistenza di soluzioni possibili a ciascun gioco, ma non impone che tali soluzioni siano poi accettabili dal punto di vista razionale. E sempre presente lalternativa: meglio non giocare.

IL DILEMMA DEL PRIGIONIERO


Il dilemma del prigioniero sicuramente uno dei giochi strategici pi studiati, in quanto di semplice comprensione e rappresentativo dei caratteri fondamentali della teoria. Si tratta di un gioco a informazione completa2 proposto negli anni Cinquanta da Albert Tucker 3 come problema di teoria dei giochi. Oltre a essere stato approfonditamente studiato in questo contesto, il dilemma anche piuttosto noto al pubblico non tecnico come esempio di paradosso. Il dilemma pu essere descritto come segue. Due criminali vengono accusati di aver compiuto una rapina. Vengono dunque rinchiusi in due celle tra le quali non possibile alcuna comunicazione. A questo punto ognuno ha due possibilit: confessare o non confessare, secondo le seguenti condizioni:
2 3

Vedi nota 3. Albert Tucker (1905-1995): matematico statunitense, originario del Canada, di cui ricordiamo i contributi in topologia e programmazione non lineare, oltre che in teoria dei giochi.

- uno solo dei due confessa: chi ha confessato ha uno sconto di pena e viene condannato a un anno, l'altro viene condannato a 6 anni di carcere; - entrambi confessano: entrambi vengono condannati a 5 anni; - nessuno dei due confessa: entrambi vengono condannati a 2 anni. Definiamo dunque con [C; NC] linsieme delle possibili strategie per entrambi i giocatori (1 e 2), con C=confessa e NC= non confessa. Costruiamo dunque i Payoff, tali che: U(s1) > U(s2)4 se il dato giocatore preferisce il risultato della strategia s1 a quello della strategia s2 (in questo caso i nostri Payoffs saranno gli anni di carcere spettanti a ciascuno dei due giocatori cambiati di segno: chiaro che la preferenza ricade sul minor numero di anni possibile, che sar il maggiore se il valore viene cambiato di segno; supponiamo cio che lutilit di un anno di prigione sia -1) Rappresentazione in forma strategica: 5 Giocatore 2 C Giocatore 1 C NC -5;-5 -6;-1 NC -1;-6 -2;-2

Matrice 1: il dilemma del prigioniero

4 5

Vedi funzione di utilit a pagina Vedi nella sezione Elementi fondamentali al paragrafo Rappresentazione dei giochi

Rappresentazione in forma estesa :

Osserviamo che generalmente la forma estesa utilizzata per rappresentare dei giochi che si svolgono in successione, nei quali cio un giocatore effettua la sua mossa dopo la giocata dellaltro. Nel dilemma del prigioniero invece i due giocatori, non potendo comunicare, fanno la loro mossa simultaneamente. A questo proposito introduciamo quello che si usa chiamare insieme di informazione, rappresentato dalla linea tratteggiata che unisce i due vertici. Se prendiamo due vertici appartenenti allo stesso insieme di informazione, da tali vertici deve uscire lo stesso numero di rami, infatti il giocatore non sa in quale dei due vertici si trova. In questo caso ci significa che il giocatore 2 non sa se il giocatore 1 ha confessato o meno: attraverso questo strumento possibile rappresentare la contemporaneit del gioco anche in forma estesa. La miglior strategia di questo gioco non cooperativo (C; C), ovvero la confessione da parte di entrambi i giocatori. Per ognuno dei due lo scopo infatti di minimizzare la propria condanna; e ogni prigioniero confessando rischia 2 o 5 anni, non confessando ne rischia 1 o 6. In termini di Payoff il risultato di ciascun giocatore : se confessa: -1 o -5 se non confessa: -2 o -6 E evidente che la strategia C permette in ogni caso un maggior vantaggio rispetto alla strategia N.C. Diciamo dunque che la strategia NC strettamente dominata dalla strategia C (strategia strettamente dominante). Eliminando le strategie strettamente dominate si arriva all'equilibrio di Nash6, che in questo caso rappresentato dalla strategia (C;C), il cui risultato 5 anni di carcere ciascuno. Il risultato migliore per i due ("ottimo paretiano7") naturalmente di non confessare ( anno di carcere invece di 6), ma questo non un equilibrio.
6 7

Vedi nota 1. Vedi Ottimo Paretiano pag.

Supponiamo infatti che i due abbiano deciso di non confessare in caso di arresto in modo da ottenere il maggior vantaggio per entrambi. Sono ora rinchiusi in due celle diverse, e si domandano se la promessa sar mantenuta: in caso uno dei due non la rispettasse, il giocatore corretto verrebbe condannato al massimo della pena mentre quello egoista avrebbe il maggior vantaggio possibile. In quanto giocatori razionali entrambi possono prevedere questo ragionamento da parte dellaltro. C' dunque un dilemma: confessare o non confessare. La teoria dei giochi ci dice che c' un solo equilibrio (confessa, confessa).8

The Hobbesian Dilemma


As we have seen in the previous section, Hobbes argues that a person must always be suspicious that another will attack in order to maximize his/her own self-interest. Therefore, in order for a person to maximize his best interest, he must attack the other person before that other person can attack. Each such conflict between two people in a state of nature has been termed as the "Hobbesian Dilemma". However, in the field of Game Theory, the Hobbesian Dilemma has the same structure as a "Prisoner's Dilemma". Using the same example we used before, you will see that, after the injury (I promised to help you building your house and I didnt) the situation looks exactly like the Prisoners dilemma: each player can attack or not attack and this is the set of possible strategies. We can keep the same payoffs of the previous matrix and the only possible equilibrium results (attack; attack), that is exactly the conclusion reached by Hobbes.

WARGAMES: LO SBARCO IN NORMANDIA


Il problema principale dei Nazisti nel corso del 1944 (a parte la situazione sul fronte orientale) consisteva nel capire dove gli Alleati sarebbero sbarcati. Naturalmente, questo problema di scelta si poneva anche per gli Alleati: il processo di pianificazione dell'invasione dell'Europa continentale era cominciato gi a partire dal gennaio 1943. Il raggio di azione degli Spitfire (i caccia monoposto dellaviazione Inglese, divenuti aerei simbolo della seconda guerra mondiale) aveva limitato la scelta dei punti di sbarco. La geografia aveva ulteriormente ridotto le scelte a due: il Pas de Calais, e la costa della Normandia. Mentre il Pas de Calais offriva le spiagge migliori e un facile accesso alla Germania, era anche (per questi motivi) il punto pi probabile dove ci si sarebbe aspettata un'invasione e quindi il meglio difeso. Quindi, il gioco consisteva nella scelta del punto di sbarco per gli Alleati e nella scelta di dove concentrare le proprie forze per opporsi allo sbarco, per i Nazisti.

Definiamo quindi con {C, N} linsieme delle possibili strategie per entrambi i giocatori (Alleati e Nazisti), con C = Calais e N = Normandia. Le probabilit di successo per gli alleati, a priori, sono le seguenti: entrambi i giocatori scelgono N : 75%; entrambi i giocatori scelgono C : 20%; gli Alleati scelgono N, i Nazisti scelgono C : 100%; gli Alleati scelgono C, i Nazisti scelgono N : 100%;
8

Osserviamo che la mancanza di comunicazione tra i due criminale, evidenziata come condizione fondamentali allinizio del paragrafo, si rivela inessenziale: se pure si accordassero in precedenza, nessuno dei due potrebbe essere sicuro del rispetto dellaccordo da parte dellaltro.

Quindi: se le difese si concentrano sul luogo sbagliato, lo sbarco riesce con certezza, mentre la probabilit di riuscita inferiore sul Pas de Calais che in Normandia, se le difese azzeccano la collocazione giusta. Per costruire i payoffs, supponiamo che gli Alleati attribuiscano un valore pari a 100 ad uno sbarco riuscito al Pas de Calais, e pari a 80 ad uno sbarco riuscito in Normandia. Date le probabilit a priori che lo sbarco sia un successo, i payoff degli Alleati nei restanti casi (simmetrici) sono: 0.75 80 = 60 nel caso (N, N) e 0.2 100 = 20 nel caso (C, C) . Il rimanente rispetto a 100 o a 80 rappresenta il payoff dei Nazisti in ciascun caso. Quindi, il gioco si pu rappresentare in forma strategica come nella matrice 2: Asse C Alleati C N 20;80 80; 0 N 100;0 60;20

Matrice 2: lo sbarco in Normandia Si verifica rapidamente che questo gioco non possiede alcun equilibrio di Nash in strategie pure.9 Ammettiamo ora che gli Alleati attribuiscano la probabilit p alla strategia C (e quindi la probabilit 1 p alla strategia N), mentre i Nazisti attribuiscono la probabilit q alla strategia C (e quindi la probabilit 1 q alla strategia N). Per gli Alleati deve valere la seguente condizione: 20q + 100(1 q) = 80q + 60(1 q) mentre per i Nazisti deve valere: 80p = 20(1 p), le quali equivalgono a imporre che entrambi i giocatori siano indifferenti tra giocare C e giocare N, ovvero che entrambe le strategie procurino la stessa utilit. Risolvendo le due equazioni rispetto a q e p otteniamo: p=1/5; q=2/5
9

La strategia da seguire strettamente determinata se ne esiste una che soddisfacente per tutti i giocatori. Se ci non accade, necessario calcolare e rendere massima la speranza matematica del giocatore.

che sono le probabilit ottime che definiscono lequilibrio di Nash in strategie miste.10 In particolare, sono le probabilit con le quali, rispettivamente, gli Alleati e i Nazisti giocano C, cio decidono di sbarcare e schierare le proprie difese a Calais. Come si vede da questo risultato, i payoffs della matrice definiscono una situazione che genera maggior incertezza strategica per i Nazisti piuttosto che per gli Alleati, che quasi certamente scelgono N, cio lo sbarco in Normandia. Questo fu in effetti esattamente ci che avvenne: all'alba di marted 6 giugno 1944 (D-Day), con lo sbarco anfibio alleato sulle spiagge della Normandia, in Francia, ebbe inizio loperazione Overlord, che continu nelle settimane seguenti con una campagna terrestre che aveva lo scopo di stabilire, espandere ed eventualmente dilagare i nuclei di forze in Normandia. I difensori tedeschi posizionati sulle spiagge misero in piedi una resistenza relativamente leggera, essendo male addestrati e a corto di trasporti ed equipaggiamento, ed essendo stati soggetti ad una settimana di intensi bombardamenti. Uno dei motivi principali della sconfitta tedesca fu anche l'opera dello spionaggio britannico, che riusc a far passare il progetto in Normandia per una colossale operazione diversiva. Lo stesso Hitler, che pure aveva indovinato con largo anticipo il luogo effettivo dello sbarco, fu indotto a credere che il teatro delle operazioni principali sarebbe stato il Passo di Calais, avendo prestato credito al messaggio del 9 giugno inviato dalla celebre spia Arabel (Garbo per i britannici).
La storia delle guerre non conosce un'impresa simile per vastit di concezione, grandiosit di proporzioni e maestria di esecuzione. (Stalin, riferendosi allo sbarco Alleato, in una lettera indirizzata a Churchill, 11 giugno 1944)

10

Una strategia pura fornisce una definizione completa del modo in cui un giocatore gioca una partita. In particolare, essa determina quale scelta far il giocatore in qualsiasi situazione che potrebbe affrontare. Una strategia mista per un giocatore una distribuzione di probabilit sull'insieme delle strategie pure che costui ha a disposizione.