Sei sulla pagina 1di 32

JOGOS DINMICOS DE INFORMAO COMPLETA E PERFEITA

JOGOS DINMICOS DE INFORMAO COMPLETA E PERFEITA


At ento, concentramos a ateno em jogos simultneos, em que cada jogador ignora as decises dos demais no momento em que toma a sua prpria deciso, e os jogadores no se preocupam com as consequncias futuras de suas escolhas, uma vez que, tomadas as decises, o jogo se encerra. Jogos simultneos no nos fornecem informaes sobre eventuais desdobramentos futuros das escolhas dos jogadores, ou seja, so identificados como jogos estticos. Porm, comum encontrar situaes em que o processo de interao estratgica se desenvolve em etapas sucessivas. Assim, os jogadores fazem escolhas a partir do que os outros jogadores decidiram no passado e, portanto, nem sempre as decises so tomadas ignorando as decises dos demais jogadores. Tambm, nesse tipo de interao, as escolhas presentes exigem considerar as consequncias futuras, uma vez que os demais jogadores podero retaliar em etapas posteriores do jogo. Jogos que apresentam uma sequncia de interaes estratgicas so identificados como jogos dinmicos.

JOGOS DINMICOS DE INFORMAO COMPLETA E PERFEITA


Nos jogos simultneos (estticos), consideramos a hiptese de que existe informao completa, isto , os payoffs dos jogadores, para cada combinao de estratgias escolhidas, so de conhecimento comum (common knowledge) para todos os jogadores envolvidos no jogo. Para jogos dinmicos, alm da hiptese de informao completa, supomos a existncia de informao perfeita, isto , os jogadores, no momento da tomada de deciso, conhecem todo o desenvolvimento (histrico) do jogo at ento, ou seja, conhecem as estratgias adotadas pelos jogadores que o antecederam.

JOGOS SEQUENCIAIS: REPRESENTAO DE UM JOGO NA FORMA EXTENSIVA


sequencial.

Um jogo que permite dar conta, de modo mais adequado, dos desdobramentos sucessivos das interaes estratgicas chamado de jogo

Um jogo seqencial aquele em que os jogadores realizam seus movimentos em uma ordem predeterminada e, por isso, podem ser representados na forma extensiva.

JOGOS SEQUENCIAIS: REPRESENTAO DE UM JOGO NA FORMA EXTENSIVA


Um jogo de informao completa e perfeita na forma extensiva deve conter as seguintes infomaes: O conjunto de estratgias disponveis para cada jogador que participa do jogo, em cada ocasio que ele for convocado a tormar decises; A seqncia em que os jogadores tomam suas decises; O histrico completo do jogo desde o incio at o desfecho das interaes; Os payoffs dos jogadores para cada conjunto possvel de estratgias que tenham sido tomadas, at o final do jogo.

JOGOS SEQUENCIAIS: REPRESENTAO DE UM JOGO NA FORMA EXTENSIVA


Assim, as principais caractersticas de um jogo dinmico de informao completa e perfeita que: i) os movimentos ocorrem em seqncia; ii) todos os movimentos prvios so observados antes que o prximo movimento ocorra; iii) os payoffs de cada combinao de movimentos viveis so de conhecimento comum.

JOGOS SEQUENCIAIS: REPRESENTAO DE UM JOGO NA FORMA EXTENSIVA


Representao de um jogo entre uma empresa Inovadora e a empresa Lder de mercado, em que a Inovadore decide antes se vai ou no introduzir seu novo modelo de van, e a partir da a Lder toma sua deciso, j conhecendo a escolha da Inovadora.
Mantm Preo

LDER

(4, 1) (2, 2)
Reduz Preo

Lana a Van

INOVADORA

Mantm Preo No Lana a Van

(1, 4)

LDER
Reduz Preo

(1, 3)

JOGOS SEQUENCIAIS: REPRESENTAO DE UM JOGO NA FORMA EXTENSIVA


Para representar um jogo na forma extensiva utiliza-se uma rvore de jogos, composta por ramos e ns, as quais permitem demonstrar processos de interao estratgica que se desenrolam em etapas sucessivas; Cada n representa uma etapa do jogo em que um dos jogadores chamado para tomar uma deciso. Partindo de um n, cada ramo representa uma escolha possvel para o jogador, isto , um ramo representa uma estratgia do conjunto de estratgias disponveis para o jogador. Os ramos so representados por flechas para facilitar o entendimento de como o jogo se desdobra.

JOGOS SEQUENCIAIS: REPRESENTAO DE UM JOGO NA FORMA EXTENSIVA


Regras bsicas para a representao de um jogo na forma extensiva: a) Todo n deve ser precedido por, no mximo, um outro n apenas; b) Nenhuma trajetria pode ligar um n a ele mesmo; c) Todo n na rvolre de jogos deve ser sucessor de um nico e mesmo n inicial.

JOGOS SEQUENCIAIS: REPRESENTAO DE UM JOGO NA FORMA EXTENSIVA


VIOLAO DA REGRA a): Todo n deve ser precedido por, no mximo, um outro n apenas:

B1

A1

A2

No Lana a Van

B2

JOGOS SEQUENCIAIS: REPRESENTAO DE UM JOGO NA FORMA EXTENSIVA


VIOLAO DA REGRA b): Nenhuma trajetria pode ligar um n a ele mesmo;
B1

A1

C1

JOGOS SEQUENCIAIS: REPRESENTAO DE UM JOGO NA FORMA EXTENSIVA


VIOLAO DA REGRA c): Todo n na rvolre de jogos deve ser sucessor de um nico e mesmo n inicial.
B1

B2 A1

B3 A2

B4

JOGOS SEQUENCIAIS - ESTRATGIAS Definio: uma estratgia representa um plano de aes que especifica, para um determinjado jogador, que ao tomar em todos os momentos em que ele ter que decidir o que fazer. Supondo a racionalidade dos agentes envolvidos em um processo de interao estratgica, considera-se que os jogadores tomam suas decises levando em conta todo o desenvolvimento do processo de interao at o momento da tomada de deciso, bem como, suas possveis conseqencias futuras.

JOGOS SEQUENCIAIS - ESTRATGIAS


Chama-se de conjunto de estratgias, ou espao de estratgias, o conjunto de estratgias de que cada jogador dispe. De forma genrica, se chamarmos sij a j-sima estratgia do jogador i, o conjunto de estratgias ou espao de estratgias do jogador i dado por: Sij = {sij}

A forma de representar uma combinao de estratgias S qualquer por meio de um conjunto ordenado, no qual cada elemento uma estratgia para cada um dos n jogadores, na forma: S = (s1,......,sn)

Na frmula anterior, s1 uma dada estratgia do jogador nmero 1, s2 uma dada estratgia do jogador nmero 2, e assim por diante, at o n-simo jogador. Cada combinao de estratgias produz ganhos diferentes para os jogadores, cuja funo de recompensa pode ser representada por: Ui = (s1, ....,si,....,sn)

Denotando a funo de recompensa que o jogador i recebe quando o jagador 1 adota a estratgia s1, o jogador 2 adota a estratgia s2, etc...., at o nsimo jogador, incluindo o fato de que o prprio jogador i adota uma dada estratgia si.

JOGOS SEQUENCIAIS CONJUNTO DE INFORMAES


Definio: um conjunto de informao para um jogador representado por um conjunto de ns que o jogador acredita ter alcanado em uma dada etapa do jogo, quando alcana sua oportunidade de jogar. Quando um jogador tem certeza que, uma vez alcanada uma dada etapa do jogo, ele somente poder estar em um nico determinado n, diz-se que o seu conjunto de informao nessa etapa um conjunto unitrio, que tem como nico elemento aquele n que o jogador supe ter alcanado. Caso contrrio, isto , caso alcanada uma determinada etapa do jogo, o jogador que est na vez de jogar no pode estar certo quanto ao n que alcanou, ou seja, esse jogador no pode saber o que o jogador que decidiu antes escolheu, o conjunto de informao do jogador que joga nessa etapa conter todos os ns que ele considerar possvel de serem alcanados.

JOGOS SEQUENCIAIS CONJUNTO DE INFORMAES


Conjunto de Informao Unitrio em Jogo na Forma Sequencial:
B1

B2

JOGOS SEQUENCIAIS CONJUNTO DE INFORMAES Conjunto de Informao No Unitrio em jogo na Forma Sequencial:
B1

B2

JOGOS SEQUENCIAIS CONJUNTO DE INFORMAES OBS.: Um jogo dito de informao perfeita quando todos os jogadores conhecem toda a histria do jogo antes de fazerem suas escolhas. Se algum jogador, em algum momento do jogo, tem de fazer suas escolhas sem conhecer exatamete a histria do jogo at o momento, o jogo dito de informao imperfeita. Um modo mais formal de definir um jogo de informao perfeita dizer que todos os seus conjuntos de informao so unitrios, enquanto no jogo de informao imperfeita pelo menos um de seus conjuntos de informao no unitrio. Assim, para classificar um determinado modelo de interao estratgica, isto , um jogo, como de informao perfeita ou imperfeita, tudo que se tem de fazer investigar todos os seus conjuntos de informao, verificando se algum deles no unitrio.

O EQUILBRIO DE NASH EM JOGOS SEQNCIAIS


Ex.: o jogo da entrada


Luta

Dominante

(-1, 2) (3, 7)
Acomoda

Entrada

Desafiante

No Entra

(0, 10)

O EQUILBRIO DE NASH EM JOGOS SEQNCIAIS

Dominante Luta Acomoda

Entra Desafiante No Entra

-1, 2

3, 7

0, 10

0, 10

10

O EQUILBRIO DE NASH PERFEITO EM SUBJOGO


Um subjogo qualquer parte de um jogo na forma extensiva que obedece s seguintes condies: 1) Sempre se inicia em um nico n de deciso; 2) Sempre contm todos os ns que se seguem ao n no qual ele se iniciou; 3) Se contiver qualquer n de um conjunto de informao, ele conter todos os ns do conjunto de informao.

O EQUILBRIO DE NASH PERFEITO EM SUBJOGO

11

O EQUILBRIO DE NASH PERFEITO EM SUBJOGO

SJ3 B F

C SJ2 SJ4 D SJ1

O EQUILBRIO DE NASH PERFEITO EM SUBJOGO


Uma combinao de estratgias constitui um equilbrio de Nash perfeito em subjogos se ela preenche, simultaneamente, duas condies: 1) um equilbrio de Nash para o jogo na sua totalidade; 2) um equilbrio de Nash para cada subjogo.

OBS.: todo equilbrio de Nash perfeito em subjogos , ao mesmo tempo, um equilbrio de Nash, mas nem todo equilbrio de Nash em um jogo seqencial , necessariamente, um equilbrio perfeito em subjogos.

12

O EQUILBRIO DE NASH EM JOGOS SEQNCIAIS


Ex.: o jogo da entrada


Luta

Dominante SJ 2
Entrada Acomoda

(-1, 2) (3, 7)

Desafiante

No Entra

SJ 1

(0, 10)

METODO DA INDUO RETROATIVA


Ex.: o jogo da entrada


Luta

Dominante

(-1, 2) (3, 7)
Acomoda

Entrada

Desafiante

No Entra

(0, 10)

13

METODO DA INDUO RETROATIVA


Ex.: o jogo da entrada

(3, 7)
Entrada

Desafiante

No Entra

(0, 10)

METODO DA INDUO RETROATIVA


Ex.: o jogo da entrada

(3, 7)
Entrada

Desafiante

No Entra

(0, 10)

14

QUANDO ACREDITAR EM AMEAAS E PROMEAS

Ex.: Jogo da Regulao


Remunera

Regulador
Investimento Elevado No Remunera

(2, 1)

(-2, 2)

Empresa de InfraEstrutura

Remunera Investimento Baixo

(1, -2)

Regulador
No Remunera

(-1, -1)

O JOGO DA REGULAO EM FORMA ESTRATGICA

Remunera, Remunera

Remunera, No Remunera

No Remunera , Remunera

No Remunera, No Remunera

Investimento Elevado

2, 1

2, 1

-2, 2

-2, 2

Investimento Baixo

1, -2

-1, -1

1, -2

-1, -1

15

MODELO DE STACKELBERG

MODELO DE STACKELBERG

Caractersticas: Este modelo deriva seu nome do economista Herich Von Stackelberg (1905-1946). Considera-se um modelo simples de duoplio onde existem duas empresas concorrendo entre si (Empresa 1 e Empresa 2); As empresas fabricam produtos homogneos e conhecem a curva de demanda de mercado; Diferente do modelo de Cournot, agora uma das empresas (no caso a empresa 1) decide antes da outra quanto ir produzir; A empresa que decide primeiro, ou empresa lder, sabe que a outra empresa, a empresa seguidora, vai se ajustar sua escolha; A empresa lder escolhe uma quantidade tal que induza a empresa seguidora a produzir uma quantidade adequada maximizao dos lucros da lder.

16

MODELO DE STACKELBERG

Descrio do Modelo: Quantidades produzidas:


q1 = quantidade produzida pela Firma 1 q2 = quantidade produzida pela Firma 2;

Funo Demanda de Mercado: P(Q) = a bQ,


P(Q) representa o preo de mercado como funo da quantidade total produzida (Q); Q = q1 + q2; e, a, b > 0 so parmetros constantes.

MODELO DE STACKELBERG

Funo Receita Total:

RT1 = P(Q)q1 = (a bQ)q1 = [a b(q1 + q2 )]q1 = aq1 bq12 bq1q2


2 RT2 = P(Q)q2 = (a bQ)q2 = [a b(q1 + q2 )]q2 = aq2 bq1q2 bq2

Funo de Custo da Firma: C(Q) = cqi

CT 1 = cq 1
CT 2 = cq 2

17

MODELO DE STACKELBERG Funo Lucro Total:

i (qi ) = RTi CTi


1 ( q1 , q2 ) = aq1 bq12 bq1q2 cq1
2 2 ( q1 , q2 ) = aq2 bq2 bq1q2 cq2

MODELO DE STACKELBERG
Maximizao de Lucro para a empresa seguidora: como ela decide que quantidade produzir depois da empresa lder, ela se comporta exatamente como no modelo de Cournot, tomando a quantidade da empresa lder como dada. Assim, a funo de reao da empresa seguidora obtida de modo equivalente ao do modelo de Cournot.

Max i ( q i ) = RT i CT
0< pi <

2 2 = aq 2 bq 1 q 2 bq 2 cq 2

Toma-se

a primeira derivada da funo lucro da firma seguidora e iguala-se a zero, de acordo com a condio de primeira ordem para maximizao de lucro, obtemos:

Colocando
empresas 2:

2 = 0 a bq 1 2 bq 2 c = 0 q2
q2 em evidncia obtemos as funes de reaes das

q2 =

a bq1 c 2b

Funo de Reao da Firma 2 (Seguidora)

18

MODELO DE STACKELBERG
Considere a funo de lucro da empresa 1 (Lder):

1 ( q1 , q2 ) = aq1 bq12 bq1q2 cq1


A
empresa lder considera a funo de reao da empresa seguidora ao decidir quanto ir produzir. Assim, substituindo q2 pela funo de reao da empresa seguidora (Empresa 2), obtemos:

1 ( q1 , q2 ) = aq1 bq12 bq1

a bq1 c cq1 2b

MODELO DE STACKELBERG

Toma-se a primeira derivada da funo lucro da firma lder e iguala-

se a zero, de acordo com a condio de primeira ordem para maximizao de lucro, obtemos:

1 abq1 + b2q12 + cbq1 = 0 aq1 bq12 cq1 = 0 q1 2b

ab 2 b 2 q1 cb = 0

19

MODELO DE STACKELBERG

Quantidade de equilbrio da empresa lder:


q1* = ac 2b

Substituindo

a quantidade de equilbrio da empresa lder na funo de reao da empresa seguidora, tem-se que a quantidade de equilbrio da empresa seguidora dada por:

= q* 2

a c 4b

MODELO DE STACKELBERG

Constata-se que os lucros da empresa lder so maiores na soluo de Stackelberg do que na soluo de Cournot. A empresa seguidora, por sua vez, apresenta-se em situao pior do que qualquer uma das duas empresas do modelo de Cournot. No modelo de Stackelberg, ou de liderana de quantidade, nada mais fizemos do que aplicar o princpio da induo retroativa: a empresa lder antecipa a funo de reao da seguidora, que seria a etapa seguinte do jogo, ao tomar sua prpria deciso no incio do jogo. Aqui, analisamos as condies de equilbrio levando em conta uma empresa que seja lder na fixao de quantidades. Podemos aplicar o mesmo raciocnio para o caso de uma empresa que seja lder na fixao de preos.

20

JOGOS REPETIDOS

JOGOS REPETIDOS

Embora os jogadores participem de um processo de interao estratgica em que conheam o histrico das decises que foram tomadas em etapas anteriores, pode acontecer que a cada nova etapa em que so chamados a decidir, eles o faam sem saber o que os demais jogadores esto decidindo naquela etapa do jogo. Quando nos deparamos com esse tipo de situao, um tipo particular de modelagem em jogos, conhecido como modelos de jogos repetidos, pode ser til para analisar esse gnero de interao estratgica. Esse tipo de jogo possui grande interesse sempre que se discute como induzir cooperao, quando os jogadores possuem ganhos significativos ao agir de forma no cooperativa em cada etapa do processo de interao estratgica.

21

JOGOS REPETIDOS

Definio: um jogo repetido um jogo que se desenvolve ao longo do tempo por um nmero finito ou infinito de vezes. O jogo que se repete conhecido como jogobase. Uma particularidade atribuvel aos jogos repetidos que, a cada repetio, as estratgias dos jogadores devem permanecer constante. Assim, o que muda ao longo do processo de interao estratgica a histria do jogo, isto , o registro de como os jogadores se comportam at o presente.

APLICANDO JOGOS REPETIDOS CARTIS

O Modelo de Cournot: P = 100 Q, onde Q = q1 + q2 C1 = 4q1 C2 = 4q2

22

APLICANDO JOGOS REPETIDOS CARTIS

EMPRESA 2 COOPERA NO COOPERA 960, 1.280

COOPERA EMPRESA 1 NO COOPERA

1.152, 1.152

1.280, 960

1.024, 1.024

JOGOS REPETIDOS
Essa modelagem do processo de interao entre as empresas sofre de uma grave limitao: no razovel que a interao entre empresas que convivem em um mesmo setor ocorra apenas uma nica vez. O normal que as empresas definem que quantidade produzir repetidamente no tempo: toda semana, ou toda quinzena, ou todo ms etc... Nessas circunstncias um modelo de jogo simultneo onde os agentes so chamados apenas uma vez para jogar se mostra inadequado para tratar de situao de interao estratgica que se repetem no tempo. Assim conveniente utilizar modelos de jogos repetidos.

23

O EQUILBRIO DE NASH EM JOGOS SEQNCIAIS


Ex.: O paradoxo da cadeia de lojas


Luta

Dominante

(-1, 2) (3, 7)
Acomoda

Entrada

Desafiante

No Entra

(0, 10)

JOGOS REPETIDOS

Os jogos repetidos so divididos em dois grupos:


Jogos Repetidos Finitos: a caracterstica fundamental dos jogos repetidos finitos que todos os jogadores envolvidos sabem, antecipadamente, quantas vezes o jogo se repetir.

- Jogos Repetidos Infinitamente: assume-se que o processo de interao estratgica repetido infinito se os jogadores no sabem quando esse processo termina.

24

O PROBLEMA DA COOPERAO EM JOGOS REPETIDOS FINITOS


A idia por trs dos jogos repetidos finitos que, como ele ser jogado mais de uma vez, poderia se imaginar que seria possvel cooperar no incio para que o outro jogador tambm tenha um incentivo a cooperar com voc nos estgios subseqente. Todavia, percebe-se que, uma vez alcanado o ltimo estgio do jogo, ningum tem incentivos a cooperar, pois no haver mais rodadas no futuro que induza os jogadores a adotarem estratgias cooperativas. Sendo assim, por induo retroativa os jogadores so levados a adotarem estratgias no cooperativas desde a primeira jogada. A cooperao no pode ser atingida em nenhum estgio, ainda que houvesse a promessa de um deles de que iria cooperar na primeira vez. Ainda assim, o outro no cooperaria, porque ele saberia que, agindo assim, uma vez que o resultado do primeiro estgio emergisse, nos estgios subseqentes ningum iria cooperar. Essa concluso permanece inalterada independente do nmero de vezes que o jogo se repita, desde que seja finito.

JOGOS REPETIDOS FINITOS QUE APRESENTAM APENAS UM EQUILBRIO DE NASH

EMPRESA 2 COOPERA NO COOPERA 0, 3

COOPERA EMPRESA 1 NO COOPERA

2, 2

3, 0

1, 1

25

JOGOS REPETIDOS FINITOS QUE APRESENTAM APENAS UM EQUILBRIO DE NASH


As estratgias dos jogadores, em jogos repetidos (sejam finitos ou infinitos), especificam, dada a histria do jogo at ali, que ao tomar em cada etapa do jogo. Em um jogo repetido n vezes, um subjogo comeando em uma dada etapa do jogo t o jogo repetido, que jogado de t at a n-sima (e ltima) etapa. E os payoffs do jogo repetido dado pela soma dos payoffs obtidos em cada estgio. Qualquer jogo repetido um nmero finito de vezes (n vezes), seja esttico ou dinmico, em que o jogo-base apresente apenas um equilbrio de Nash, possui um nico equilbrio de Nash perfeito em subjogos, que consiste em jogar o equilbrio de Nash do jogo-base em todas as n etapas.

JOGOS REPETIDOS FINITOS QUE APRESENTAM MAIS DE UM EQUILBRIO DE NASH

Ex.: Jogo de Coordenao do Padro Tecnolgico Empresa Y (AntiVrus)


Atualizar No Atualizar -1, -2 1, 2

Empresa X (Programas)

Desenvolver No Desenvolver

2, 1 0, -1

OBS: Em um jogo repetido finito, em que o jogo-base apresenta mais de um equilbrio de Nash, qualquer seqncia de combinaes de estratgias que sejam equilbrios de Nash no jogo-base pode constituir um equilbrio de Nash perfeito em subjogos.

26

JOGOS REPETIDOS FINITOS QUE APRESENTAM MAIS DE UM EQUILBRIO DE NASH


FORNECEDOR Entrega Urgente EMPRESA AUTOMOBILSTICA Pea em Liga Especial Pea em Ao Comum Entrega Normal Entrega Rpida

4, 3

0, 0

2, 5

0, 1

2, 2

0, 1

Quando o fornecedor obedecer o contrato Quando o desobedecer o contrato

- 3 + 5 = 8 - 2 + 5 = 7

OBS: Em um jogo repetido finito, em que o jogo-base apresenta mais de um equilbrio de Nash, podem ter equilbrios de Nash perfeitos em subjogos que envolvam resultados, em alguma das n repeties do jogo-base, que no sejam equilbrios de Nash do jogo-base (quando envolve a possibilidade de retaliao).

JOGOS REPETIDOS INFINITOS

Uma vez constatado que a soluo por induo retroativa, em um jogo finito, exclui a possibilidade de que a cooperao possa emergir espontaneamente da interao entre os jogadores como uma possvel soluo do jogo, surge as seguintes questes: - possvel que os jogadores, espontaneamente, interajam entre de forma cooperativa? - Como conseguir que os jogadores decidam cooperar de forma espontnea em jogo que exige interao estratgica?

Resposta: possvel desde que o jogo possa se repetir infinitamente.

27

JOGOS REPETIDOS INFINITOS


Vamos iniciar nossa discusso do papel do fator de desconto em um jogo infinitamente repetido por um exemplo bem simples. Ex.: Imagine que um jogador receba amanh uma recompensa de 1 real. O jogador vai valorizar o recebimento de 1 real hoje mais do que o recebimento de 1 real amanh. Assim, 1 real amanh vale um pouco menos do que 1 real hoje. Representamos este fato considerando um fator de desconto representado por , tal que 0 < < 1, que deve ser aplicado s recompensas, ao longo do tempo. O fator de desconto est associado a uma taxa de desconto (em geral igual taxa de juros) r. Quando os jogadores aplicam uma taxa de desconto r sobre valores futuros, de tal forma que r > o, diz-se que os jogadores possuem preferncias intertemporais, no sentido de que preferem receber suas recompensas hoje a receb-las amanh. O fator de desconto tambm pode ter uma outra dimenso em jogos infinitamente repetidos, ou seja, ele pode incorporar a incerteza dos jogadores quanto ao trmino do processo de interao estratgica.

JOGOS REPETIDOS INFINITOS

Sendo a probabilidade de o jogo terminar a cada repetio dada por p e a taxa de desconto dada por r, o fator de desconto seria dado por:

1 p 1+ r

Onde (1-p) representa a probabilidade de o jogo continuar e (1-r) representa da taxa de desconto intertemporal.

28

JOGOS REPETIDOS INFINITOS


Suponha agora que um jogador qualquer obtm, de uma dada estratgia em um jogo infinitamente repetido, uma sucesso infinita de valores idnticos a 1 real. Assim, temos que aplicar o fator de desconto da seguinte forma:

1 + 1. + 1. 2 + 1. 3 + ....... + 1. n , sendo que n .


Sendo < 1, a expresso anterior um progresso geomtrica decrescente. Sendo assim, da frmula de soma dos termos de progresso geomtrica, temos que:

1 + 1 . + 1 .

+ 1 .

+ ....... + 1 .

1 1-

Essa expresso representa o valor presente (descontado) da srie infinita de recompensas do jogador, supondo que ele recebe o mesmo valor de 1 real em todas as etapas.

JOGOS REPETIDOS INFINITOS


Vamos considerar o dilema dos prisioneiros e examinar a possibilidade de cooperao, utilizando para isso a anlise de um tipo de estratgia conhecida como estratgia gatilho. Uma estratgia gatilho uma estratgia que determina, para o jogador que a adota, seguir um curso de ao enquanto uma determinada condio satisfeita e, caso essa condio em qualquer momento deixe de ser satisfeita, seguir um outro curso de ao pelo resto do jogo. Um exemplo de estratgia gatilho a estratgia severa (do ingls, grim). Na estratgia severa, o jogador adota a estratgia coopera desde que o outro jogador tambm coopere; se o outro jogador deixa de cooperar em algum momento, o jogador que adotou a estratgia severa no mais coopera pelo restante do jogo.

29

JOGOS REPETIDOS INFINITOS

A questo que surge se, ao adotar essa estratgia - na medida em que o jogador que a adota ameaa com uma retaliao interminvel caso o outro jogador se desvie do comportamento cooperativo -, poderia produzir a cooperao como um resultado sustentvel, em um jogo repetido em que o jogo-base do tipo dilema dos prisioneiros?

JOGOS REPETIDOS INFINITOS


Ex.: Dilema dos prisioneiros
EMPRESA 2 COOPERA NO COOPERA -1, 2

COOPERA EMPRESA 1 NO COOPERA

1, 1

2, -1

0, 0

30

JOGOS REPETIDOS INFINITOS


Dada a estratgia severa adotada pelo jogador 1, o jogador 2 tem duas possibilidades: A primeira no cooperar logo na primeira oportunidade, aproveitando-se da oportunidade de que o jogador 1 ir cooperar. Assim sua recompensa ser de:

2 + 0. + 0. 2 + 0. 3 + ....... + 0. n = 2

Adotar a mesma estratgia do jogador 1, ou seja, cooperar se o jogador 1 coopera, no coopera mais se, a qualquer momento, o jogador 1 iro cooperar, o que determinar para o jogador 2 o valor presente das suas recompensas como sendo:
1 + 1 . + 1 .
2

+ 1 .

+ ....... + 1 .

1 1-

JOGOS REPETIDOS INFINITOS


Assim sendo, qual a melhor opo para o jogador 2? Se o valor presente das recompensas resultantes da adoo da estratgia severa tambm pelo jogador 2 no coopera, o jogador 2 no possui vantagem em se desviar do comportamento cooperativo. Para que isso seja possvel, temos que:

1 > 2, ou > 1/2 1-


Assim, se o fator de desconto for superior a ou 0,5, dadas as recompensas do jogo, mais vantajoso para o jogador 2 tambm adotar a estratgia severa, e assim agir cooperativamente com o jogador 1, do que agir de forma oportunista, explorando a cooperao do jogador 1 na primeira etapa.

31

JOGOS REPETIDOS INFINITOS


Em dilema dos prisioneiros infinitamente repetidos, dadas as recompensas dos jogadores, se o fator de desconto for suficientemente elevado, isto , se os jogadores forem suficientemente pacientes, a cooperao pode ser sustentada por meio da adoo de uma estratgia-gatilho por parte dos jogadores. Diz-se que uma combinao de estratgias constitui um equilbrio perfeito em subjogos em jogos infinitamente repetidos quando, para qualquer que seja a histria do jogo at uma dada etapa, essas estratgias maximizam o valor presente das recompensas para os jogadores, daquela etapa em diante.

32

Potrebbero piacerti anche