Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
os Notas de Aula
1 Introduc
ao
1.1 Interdepend
encia Estrat
egica
A teoria dos jogos permite modelar comportamentos estrategicos de agentes economicos (jo-
gadores) que se envolvem em uma determinada situacao (jogo). E o instrumento adequado
quando existe interdependencia estrategica entre os agentes do modelo analisado.
No modelo de consumo usual, o consumidor decide entre possveis cestas de bens, dados os
precos e a sua renda. No modelo da firma competitiva, a firma maximiza o seu lucro, dada a
sua tecnologia de producao e dados os precos dos insumos e dos bens que vende. No modelo de
equilbrio geral competitivo, tanto os consumidores quanto as firmas sao tomadores de precos:
tomam os precos como dados e nao ha interdependencia estrategica entre suas decisoes.
Porem, existem situacoes onde o resultado das acoes de um agente dependem tambem das
acoes de outro ou outros agentes. Nesses casos, assumimos que o payoff (utilidade) do agente
depende nao so da sua acao, mas da acao de outros agentes. Modelos de oligopolio sao um
exemplo, em que o lucro de determinada firma depende do comportamento de suas rivais.
Em um jogo, cada jogador deve levar em conta a estrategia dos outros jogadores antes de
escolher o melhor para si. Isso gera uma circularidade, caracterstica fundamental da teoria
dos jogos.
O objetivo da teoria dos jogos e determinar o resultado de um jogo. Cada metodo de analise
da origem a um conceito de solucao particular, chamado equilbrio.
A maioria dos conceitos tem sua origem no conceito de equilbrio de Nash e sao, usualmente,
equilbrios de Nash que satisfazem certas propriedades. Por isso, sao chamados refinamen-
tos. Cada refinamento tenta solucionar alguma deficiencia do conceito de equilbrio de Nash
particular a alguma situacao ou modelo.
1.2 No
coes Preliminares
Definic
ao (informal): Jogo. Um jogo refere-se a qualquer situacao envolvendo dois ou mais
agentes, chamados jogadores, onde exista interdependencia estrategica.
Os jogadores,
A regra do jogo,
2. Os jogadores sao inteligentes. Os jogadores sabem tudo o que sabemos sobre o jogo e
conseguem fazer as mesmas inferencias que fazemos sobre a situacao em que se encontram.
A segunda hipotese nao e tao inocua quanto parece. Na teoria de equilbrio geral os in-
divduos sao racionais, mas nao e necessario que sejam inteligentes no sentido acima: os agentes
economicos nao precisam conhecer toda a estrutura de teoria de equilbrio geral ao tomarem
suas decisoes.
Existe uma correspondencia entre essas duas formas, que veremos mais a frente.
Vamos estudar jogos nao-cooperativos: analisamos cada agente separadamente e nao como um
grupo. Essa definicao nao implica que um jogador nao possa cooperar com o outro, ela e apenas
de cunho metodologico, onde cada agente e visto como uma entidade separada, autonoma, e
nao ha grupos de agentes se comportando como um u nico agente.
Essa hipotese e fundamental para a validade de certos procedimentos, tais como os procedi-
mentos de eliminacao de estrategias dominadas. Mais ainda, ela e fundamental para o conceito
de equilbrio de Nash (existem artigos que relaxam a hipotese de conhecimento comum, sob
certas condicoes).
Myerson (1997) argumenta que a hipotese de jogadores inteligentes implica supor que a estru-
tura do jogo e de conhecimento comum desses jogadores.
A formalizacao matematica dessa hipotese e bastante complicada. Aqui, vamos apenas assumir
a sua validade. As formalizacoes mais conhecidas sao feitas por Aumann (1976) e Aumann and
Brandenburger (1995).
A questao de que se a hipotese de conhecimento comum pode ser relaxada para a obtencao de
um equilbrio de Nash e de difcil trato. Aumann and Brandenburger (1995) mostraram que a
hipotese de conhecimento comum da racionalidade pode ser substituda por outras condicoes.
Polak (1999) aprofunda a analise de Aumann and Brandenburger (1995). Essa discussao e com-
plicada e foge do escopo do curso. Vamos apenas ver um exemplo para entender a importancia
dessa hipotese.
Myerson (1997) cita uma fabula que ilustra bem as implicacoes da hipotese. Em uma vila,
existem 100 casais. Toda noite, os homens se juntam e cada um elogia a sua mulher, caso ela
seja fiel, ou se lamenta caso ela tenha sido infiel. Se a mulher foi infiel, ela imediatamente conta
a todos os homens da vila, exceto ao seu marido. Essas tradicoes sao de conhecimento comum
de todos os habitantes da vila.
Suponha que todas as esposas foram infieis. Logo, cada homem sabia da infidelidade de todas
as esposas, exceto da sua, elogiada toda noite. Logo, todas as esposas eram elogiadas e nenhum
homem se lamentava. Numa certa noite, um visitante revelou a todos que uma esposa havia
sido infiel. Qual foi o resultado dessa revelacao?
O resultado foi que todos os homens continuaram a elogiar as esposas por 99 noites. Na noite de
numero 100, todos se lamentaram. Tente entender porque a hipotese de conhecimento comum
leva a esse resultado. Para isso, e necessario compreender o que a informacao do visitante
adicionou ao conhecimento dos homens da vila.
O raciocnio fica mais facil de compreender se considerarmos primeiro o caso em que apenas
uma esposa traiu o marido. A informacao nova que o visitante revelou foi informar a todos da
vila que havia uma esposa infiel. Pelos costumes da vila, 99 homens sabiam que havia uma
esposa infiel e apenas um homem, exatamente aquele cuja esposa havia sido infiel, nao tinha
conhecimento de nenhuma infidelidade na vila. Logo, ele imediatamente tomaria ciencia de
que a sua esposa e que fora infiel e se lamentaria na primeira noite depois da revelacao do
visitante.
Caso houvesse duas esposas infieis, entao 98 homens da vila saberiam que havia duas esposas
infieis e 2 homens teriam conhecimento de apenas um caso de infidelidade, ja que nao saberiam
que a sua respectiva esposa havia sido infiel. Nesse caso, na primeira noite ninguem se lamen-
taria. Porem, na segunda noite, apos observarem que nenhum homem havia se lamentado na
noite anterior, os 2 homens que tem conhecimento de apenas uma esposa infiel, saberiam que
eles sao os que foram trados e se lamentariam. O raciocnio estende-se de modo analogo para
o caso de 100 esposas infieis: no centesimo dia, todos os maridos se dariam conta de que foram
trados e se lamentariam.
Na forma normal nao nos preocupamos com cada acao do jogador, mas apenas com cada es-
trategia do jogador, o conjunto de todas as acoes que podem ser tomadas no decorrer de uma
partida do jogo, incluindo acoes para qualquer situacao de jogo. Para certos jogos, como vere-
mos a frente, a estrategia do jogador pode condensar uma quantidade enorme de informacao,
descrevendo um n umero muito grande de acoes a serem tomadas ao longo do jogo.
Observe que a interdependencia estrategica entre os agentes do modelo analisado aparece ex-
plicitamente na hipotese de que o payoff de cada jogador depende das estrategias de todos os
outros jogadores: ui : S1 Si SI R, ou seja, ui depende nao apenas da estrategia si
escolhida por i, mas tambem das estrategias de todos os outros jogadores, ui (s1 , . . . , si , . . . , sI ).
2.2 Exemplos
Exemplo 1: Matching Pennies ou Batedor vs Rebatedor. Neste jogo com duas
pessoas, cada jogador escolhe o lado de uma moeda, sem que o outro jogador tome conhecimento
de sua escolha. Os dois jogadores revelam simultaneamente o lado escolhido. Se os lados
escolhidos forem iguais, o jogador 1 paga R$ 1,00 ao jogador 2. Se forem distintos, o jogador
2 paga R$ 1,00 ao jogador 1. A matriz abaixo descreve este jogo.
1 / 2 Cara Coroa
Cara 1, 1 1, 1
Coroa 1, 1 1, 1
Notac ao: Vamos usar a seguinte convencao para todos os jogos representados na forma ma-
tricial: o primeiro elemento em cada celula da matriz e o payoff do jogador 1 (jogador-linha)
e o segundo elemento da celula e o payoff do jogador 2 (jogador-coluna).
No jogo Cara ou Coroa, fica claro que cada jogador deve agir de modo imprevisvel. Logo,
quando os jogadores decidem estrategicamente, pode ocorrer que a melhor forma de agir seja
escolher de modo aleatorio ou de modo que o seu rival nao saiba exatamente o que ele escolhera.
Observe que esse e um jogo de soma zero: o ganho de um jogador e igual a` perda do outro
jogador. Esse tipo de jogo foi extensivamente estudado por von Neumann and Morgenstern
(2007), no livro Theory of Games and Economic Behavior , publicado originalmente em 1947
e um dos marcos da teoria dos jogos.
Exemplo 2: Dilema dos Prisioneiros. Luiz Alberto e Laelio foram presos e estao sendo
interrogados separadamente, acusados de um crime. Se ambos confessarem o crime, eles rece-
berao uma pena de 3 anos na cadeia. Se ambos nao confessarem o crime, a pena sera de apenas
dois anos, por falta de evidencia. Porem, o promotor pode fazer uma acordo com um deles,
dando uma pena de apenas um ano na prisao para quem confessar e, para quem nao confessar,
de cinco anos na prisao, por nao ter colaborado com a justica. A matriz abaixo descreve este
jogo.
Exemplo 3: Problema de Coordenac ao. Suponha que duas pessoas estao viajando sepa-
radamente para o Rio de Janeiro e combinaram de se encontrar para almocar no dia seguinte.
Porem esqueceram de marcar o restaurante e nao estao conseguindo se comunicar. Eles costu-
mam almocar sempre em dois restaurantes, um no centro da cidade e outro na Barra da Tijuca.
O almoco no restaurante da barra e mais agradavel do que o almoco no restaurante do centro.
Porem, eles se desencontrarem e a pior situacao possvel. A matriz abaixo descreve este jogo.
1 / 2 Barra Centro
Barra 3, 3 0, 0
Centro 0, 0 1, 1
Exemplo 4: Batalha dos Sexos. Nelson e Renata querem fazer um programa domingo a`
tarde. Concordaram com duas opcoes: ir ao jogo do Corintians (F) ou fazer compras (C). Os
dois preferem estar juntos a fazerem os passeios separados, mas Nelson prefere ir ao jogo e
Renata prefere ir a`s compras. A matriz abaixo descreve este jogo.
Nelson / Renata F C
F 2, 1 0, 0
C 0, 0 1, 2
A batalha dos sexos modela tambem um problema de coordenacao, mas que envolve uma disputa
de poder. Veremos mais a frente que esse jogo tem dois equilbrios (em estrategias puras), em
que ambos os jogadores devem coordenar suas estrategias para alcancar um dos equilbrios.
Porem, o equilbrio que o jogador 1, Nelson, prefere, (F, F ), e diferente do equilbrio que o
jogador 2, Renata, prefere, (C, C), (e ambos preferem estar em uma situacao de equilbrio do
que estar em uma situacao de desequilbrio, (F, C) ou (C, F )). Neste caso, podemos ter uma
disputa de poder entre os jogadores, onde cada um tenta implementar o seu equilbrio preferido.
2.3 Domin
ancia Estrita
Considere um jogo com I jogadores. Vamos representar em negrito um conjunto de estrategias
de todos os jogadores: s = (s1 , . . . , sI ). Vamos usar a notacao si = (s1 , . . . , si1 , si+1 , . . . , sI )
para representar um conjunto de estrategias de todos os jogadores, exceto o jogador i.
ui (
si , si ) > ui (si , si ), para todo si Si ,
Para o jogo do dilema dos prisioneiros, Confessar e uma estrategia estritamente dominante
para os dois prisioneiros. Ela e a melhor estrategia para cada prisioneiro, independentemente
do que o outro prisioneiro escolha. Nesse caso, podemos dizer que (C, C) e um equilbrio em
estrategias estritamamente dominantes.
Observe que o equilbrio (C, C) e Pareto dominado pelo conjunto de estrategias (N C, N C).
Temos, entao, um caso onde o comportamento individual maximizador dos agentes envolvidos
resulta em um equilbrio Pareto ineficiente. Logo, na presenca de interdependencia estrategica,
a interacao de jogadores cujo objetivo e maximizar o seu proprio bem-estar pode levar a si-
tuacoes ineficientes.
Estrategias estritamente dominantes nao sao comuns. Existem varias situacoes, como o pro-
blema de coordenacao acima (Exemplo 3), onde e facil verificar que nao existem estrategias
dominantes para nenhum dos jogadores.
Apesar de estrategias estritamente dominantes serem raras, podemos usar um conceito simi-
lar, de estrategia estritamente dominada, para eliminarmos estrategias que nunca devem ser
escolhidas pelo jogador.
Definic
ao 7.3: Estrategia Estritamente Dominada. Dizemos que a estrategia si e estri-
tamente dominada no jogo G para o jogador i se existir uma outra estrategia si Si (Si 6= si )
desse jogador tal que:
ui (
si , si ) > ui (
si , si ), para todo si Si
Portanto, uma estrategia estritamente dominante e uma estrategia que domina estritamente
todas as outras estrategias do jogador. Podemos dizer tambem que todas as outras estrategias
sao estritamente dominadas pela estrategia estritamente dominante.
Exemplo 5: Estrat
egia Estritamente Dominada. Considere o seguinte jogo:
1 / 2 E D
C (7, 4) (5, 3)
M (8, 5) (2, 4)
B (5, 3) (3, 4)
1 / 2 E D
C (7, 4) (5, 3)
M (8, 5) (2, 4)
Para esse novo jogo reduzido, a estrategia E domina estritamente D, para o jogador 2.
Eliminando essa estrategia, obtemos um novo jogo, dado por:
1 / 2 E
C (7, 4)
M (8, 5)
Finalmente, para esse novo jogo reduzido, a estrategia M domina estritamente C, para o
jogador 1. Logo, ancontramos (M, E) (isto e, o jogador 1 escolhe M , o jogador 2 escolhe
E) como solucao do jogo usando esse procedimento de eliminacao de estrategias estritamente
dominadas.
O problema com o PEEED e que ele nem sempre leva a alguma solucao. Por exemplo, na
batalha dos sexos, nao existe nenhuma estrategia estritamente dominada, portanto nao conse-
guimos eliminar nenhuma estrategia do jogo e fazer qualquer predicao mais acurada sobre qual
deve ser o seu resultado (ou, pelo menos, o que nao pode ser resultado).
2.4 Domin
ancia Fraca
Podemos enfraquecer as definicoes de dominancia estrita, relaxando a exigencia de que o payoff
seja sempre estritamente maior nas definicoes acima.
Definic
ao: Estrategia Fracamente Dominante. Uma estrategia si Si e fracamente
dominante para o jogador i no jogo G se para toda estrategia si Si , si 6= si , vale:
si , si ) ui (si , si ),
ui ( para todo si Si ,
com desigualdade estrita para pelo menos um si .
O exemplo acima mostra que a ordem de eliminacao das estrategias fracamente dominadas
pode afetar a solucao obtida. Esta e uma caracterstica ruim deste procedimento, pois a
solucao obtida pode mudar conforme a ordem de eliminacao das estrategias. Este problema
nao ocorre quando eliminamos estrategias estritamente dominadas.
2.5 Estrat
egias Racionaliz
aveis
O PEEED e o PEEFD utilizam o conceito de conhecimento comum da racionalidade dos
jogadores e da estrutura do jogo. Porem, esses procedimentos nao esgotam toda a forca dessa
hipotese: ela permite obter o conceito de estrategia racionalizavel (Bernheim, 1984; Pearce,
1984), mais restritivo do que o conceito de estrategias que sobrevivem ao PEEED.
si , si ) ui (si , si ),
ui ( para todo si Si .
Podemos montar um procedimento de eliminacao de estrategias que nunca sao a melhor res-
posta, de modo similar ao PEEED. Mais uma vez, estamos supondo a validade da hipotese de
conhecimento comum da racionalidade dos jogadores e da estrutura do jogo.
Definic
ao: Estrat
egias Racionaliz aveis. As estrategias em Si do jogador i que sobrevivem
ao procedimento de eliminacao de estrategias que nunca sao a melhor resposta sao chamadas
racionalizaveis.
Uma estrategia racionalizavel pode sempre ser justificada, ou seja, o jogador pode justificar
a escolha dessa estrategia com uma conjectura razoavel sobre o comportamento dos outros
jogadores (nenhum rival escolhera uma estrategia nao racionalizavel).
Proposic
ao. As seguintes afirmacoes sao verdadeiras:
A ordem de remocao das estrategias que nunca sao a melhor resposta nao altera o resul-
tado obtido.
Cada jogador tem pelo menos uma estrategia racionalizavel, podendo ter mais de uma.
Para jogos com dois jogadores, o conjunto de estrategias racionalizaveis e igual ao con-
junto de estrategias que sobrevivem ao PEEED.
Porem, o conceito de estrategia racionalizavel tambem nem sempre fornece uma solucao. Por
exemplo, para a batalha dos sexos, todas as estrategias sao racionalizaveis, logo o conceito nao
diz nada sobre qual sera a solucao do jogo.
Queremos tornar as predicoes sobre o resultado de um jogo mais precisas do que o que pode
ser obtido usando os conceitos vistos acima. A seguir veremos o conceito de equilbrio de Nash
(EN), que, satisfeitas certas condicoes, sempre aponta pelo menos uma solucao para o jogo.
Esse e o mais importante conceito em teoria dos jogos.
3 Equilbrio de Nash
3.1 Equilbrio de Nash em Estrat
egias Puras
O maximo que podemos obter usando a hipotese de conhecimento comum e o conceito de es-
trategias racionalizaveis. Porem esse conceito nem sempre traz boas predicoes sobre o resultado
de um jogo. Por exemplo, para a Batalha dos Sexos, todas as estrategias sao racionalizaveis.
Logo, esse conceito nao traz nenhuma informacao a respeito da resolucao que devemos esperar
para esse jogo. Queremos tornar as predicoes sobre o resultado de um jogo mais precisas do
que o que pode ser obtido usando apenas estrategias racionalizaveis. Para obtermos qualquer
outro conceito mais forte, temos que adicionar alguma hipotese nova.
Definic
ao 7.7: Equilbrio de Nash em Estrat egias Puras (Nash, 1951). Um conjunto
de estrategias s = (s1 , s2 , . . . , sI ) e um equilbrio de Nash (EN) (em estrategias puras) para o
jogo G = (Si , ui )Ii=1 se, para todo jogador i = 1, 2, . . . , I,, vale:
si , si ) ui (si , si ) ,
ui ( si S i .
Proposic ao: Todas as estrategias que fazem parte de um equilbrio de Nash sao raciona-
lizaveis. Mais ainda, todo equilbrio formado por estrategias estritamente ou fracamente domi-
nantes, ou obtido pela eliminacao de estrategias estritamente ou fracamente dominadas, e um
equilbrio de Nash.
O conceito de EN traz uma predicao mais precisa a respeito do resultado de um jogo do que
o conceito de racionabilidade. No problema de coordenacao abaixo, todas as estrategias sao
racionalizaveis, mas apenas (s1 = L, s2 = U ) e (s1 = D, s2 = R) sao EN em estrategias puras.
1 / 2 L R
U 3, 3 0, 0
D 0, 0 1, 1
O jogo Cara ou Coroa, representado na matriz abaixo, nao possui EN em estrategias puras.
Logo, de modo geral, nao podemos garantir a existencia de EN em estrategias puras.
1 / 2 Cara Coroa
Cara 1, 1 1, 1
Coroa 1, 1 1, 1
Intuitivamente, qualquer solucao desse jogo envolve ambos os jogadores escolhendo suas es-
trategias de modo imprevisvel. Para formalizar essa ideia, vamos introduzir o conceito de
estrategias mistas.
P
O simplex de Si , representado por Mi = (Si ) = mi : Si [0, 1] | si Si mi (si ) = 1 , e o
conjunto das estrategias mistas do jogador i. Esse conjunto tambem inclui as estrategias puras
do jogador (chamadas estrategias mistas degeneradas).
Se os jogadores randomizam suas estrategias, entao o resultado do jogo deixara de ser de-
terminstico. Neste caso, calculamos o payoff dos jogadores usando utilidade esperada. Seja
m = (m1 , . . . , mI ) uma colecao de estrategias mistas para todos os jogadores. A utilidade
esperada do jogador i para a colecao de estrategias mistas m e:
X
Ui (m) = Em (ui ) = [m1 (s1 )m2 (s2 ) . . . mI (sI )] ui (s)
sSi
Observac ao: estamos assumindo que as randomizacoes de cada jogador sao independentes. A
nocao de equilbrio correlacionado (Aumann, 1974) trata do caso onde essas randomizacoes nao
sao independentes. Essa dependencia pode ser interpretada, por exemplo, como sinais p ublicos
que fazem com que as estrategias tenham um grau de correlacao.
A definicao acima permite que os jogadores randomizem entre as estrategias puras. Observe
que no equilbrio, cada jogador conhece o modo em que os outros jogadores estao randomizando
(as estrategias mistas escolhidas por seus rivais).
Observe que, para cada conjunto de estrategias dos jogadores candidato a equilbrio, devemos
verificar se para cada jogador, a sua estrategia e de fato a melhor resposta para as estrategias
dos outros jogadores que fazem parte do conjunto de estrategias candidato a equilbrio. Con-
siderando estrategias mistas, existem um n umero infinito de estrategias, o que torna este pro-
cedimento inviavel. Como fazemos entao para encontrar os equilbrios de Nash em estrategias
mistas de um jogo? O teorema abaixo fornece um algoritmo para isso. Antes vamos definir o
conceito de suporte de uma estrategia mista.
= (m
1. m I ) M e um equilbrio de Nash;
1, . . . , m
ui (si , m
3. Para todo jogador i, ui (m) i ), para todo si Si .
O Teorema 7.1 diz que em um EN em estrategias mistas, duas estrategias puras de um jogador
que podem ser escolhidas (que possuem probabilidade positiva) devem necessariamente gerar
o mesmo payoff para esse jogador, que sera igual ao payoff obtido no equilbrio. Esse resultado
e consequencia de utilizarmos a utilidade esperada, que e linear nas probabilidades, para calcu-
larmos o payoff de um conjunto de estrategias mistas. Caso existissem duas estrategias puras
que o jogador escolhesse com probabilidade positiva e em que uma delas gerasse um payoff
maior do que o da outra, dadas as estrategias de equilbrio dos outros jogadores, o jogador nao
deveria atribuir probabilidade positiva `a estrategia que lhe da o payoff mais baixo, pois isso
reduziria o seu payoff de equilbrio.
Ou seja, dadas as estrategias escolhidas em equilbrio pelos outros jogadores, esse jogador
e indiferente entre qualquer estrategia pura que ele de fato possa vir a escolher (que tem
probabilidade positiva), e estas estrategias puras lhe dao um payoff igual ou maior do que
qualquer outra estrategia que ele nao escolhe. Lembre-se que o que de fato determina as
probabilidades de cada jogador e fazer (m 1, . . . , m
I ) um equilbrio.
Existe uma outra forma de interpretar a randomizacao de estrategias, para o caso de dois
jogadores, que pode ser mais adequada para certas situacoes. Nessa interpretacao, a estrategia
mista de um determinado jogador e a distribuicao de probabilidade que o outro jogador atribui
para as suas escolhas. Por exemplo, no jogo Cara ou Coroa, a estrategia mista do jogador
1 pode ser interpretada tanto como o modo que o jogador 1 randomiza entre cara e coroa ou
como o modo que o jogador 2 imagina que o jogador 1 estara randomizando entre as suas
escolhas.
Vamos agora usar o teorema para calcular o EN para o jogo Cara ou Coroa. Suponha que
o jogador 1 decida proceder do seguinte modo: com probabilidade ele escolhe Ca e com
probabilidade 1 ele escolhe Co. Similarmente, o jogador 2 decide proceder do seguinte
modo: com probabilidade ele escolhe Ca e com probabilidade 1 ele escolhe Co. Vamos
representar na matriz abaixo essa situacao.
1 / 2 Cara () Coroa (1 )
Cara () 1, 1 1, 1
Coroa (1 ) 1, 1 1, 1
u1 (Ca, m2 ) = u1 (Co, m2 ) 1 + 1 (1 ) = 1 + 1 (1 ) = 0, 5
u2 (m1 , Ca) = u2 (m1 , Co) 1 1 (1 ) = 1 + 1 (1 ) = 0, 5
Para jogos maiores, com mais jogadores e/ou mais estrategias, o seguinte algoritmo descreve
como devemos proceder para determinar todos os EN de um jogo na forma normal.
si ) 0, para todo si Si , / Si .
P
(iii) mi ( si ) = 1, e mi (si ) = 0, para todo si
mi (
si Si
Repita o procedimento para todas as combinacoes possveis S.
A ideia do algoritmo e fixar um conjunto de estrategias puras dos jogadores para o qual se
verifica a existencia de algum equilbrio em estrategias mistas. Usando o teorema anterior de
equivalecia de definicoes, sabemos que:
(i) Garante que a utilidade de um jogador i qualquer, ao jogar uma estrategia pura que
faz parte da randomizacao (jogada com probabilidade positiva) deve ser sempre igual,
quando os seus rivais estao jogando as estrategias de equilbrio;
(ii) Assegura que nenhuma estrategia (para qualquer jogador) que nao e usada na rando-
mizacao da uma utilidade maior do que a de equilbrio;
Vamos encontrar todos os equilbrios do jogo abaixo para aplicarmos o algoritmo acima.
Exemplo 8. Considere o seguinte jogo com dois jogadores. O jogador 1 possui duas estrategias
puras, U e D. O jogador 2 possui tres estrategias puras, L, M e R:
1 / 2 L M R
U 1, 1 0, 0 5, 5
D 0, 0 2, 2 0, 0
Esse jogo possui dois EN em estrategias puras, (U, R) e (D, M ). Vamos procurar todos os EN
possveis em estrategias mistas. Temos que considerar quatro casos:
1. O jogador 2 randomiza entre L, M e R com probabilidades , e 1 , o jogador 1
randomiza entre U e D com probabilidades e 1 . Nesse caso, devemos ter que:
(i) u1 (U, m2 ) = u1 (D, m2 ) e (ii) u2 (m1 , L) = u2 (m1 , M ) = u2 (m1 , R).
Ou seja,
(i) 1 + 5 (1 ) = 2
(ii) 1 = 2 (1 ) = 5
No item (ii), nao existe solucao para que satisfaca as igualdades desse item. Portanto,
nao existe EN com a randomizacao sugerida acima.
2. O jogador 2 randomiza entre L e M com probabilidades e 1 , o jogador 1 randomiza
entre U e D com probabilidades e 1 . Nesse caso, devemos ter que:
(i) u1 (U, m2 ) = u1 (D, m2 ) e (ii) u2 (m1 , L) = u2 (m1 , M ).
Ou seja,
(i) 1 = 2 (1 ) = 2/3
(ii) 1 = 2 (1 ) = 2/3
Entao (m1 ; m2 ) = (2/3U, 1/3D; 2/3L, 1/3M ) e um candidato a EN. Porem, s2 = R e tal que
u2 (m1 , R) = 10/3 > u2 (m1 , m2 ) = 2/3, portanto a randomizacao acima nao e um EN.
3. O jogador 2 randomiza entre L e R com probabilidades e 1 , o jogador 1 randomiza
entre U e D com probabilidades e 1 . Nesse caso, devemos ter que:
(i) u1 (U, m2 ) = u1 (D, m2 ) e (ii) u2 (m1 , L) = u2 (m1 , R).
Ou seja,
(i) 1 + 5 (1 ) = 0 = 1, 25
(ii) 1 = 5 =0
O item (iii) do algoritmo nao e satisfeito (o valor de encontrado nao caracteriza uma
probabilidade). Portanto, nao existe EN com a randomizacao sugerida nesse caso.
4. O jogador 2 randomiza entre M e R com probabilidades e 1 , o jogador 1 randomiza
entre U e D com probabilidades e 1 . Nesse caso, devemos ter que:
(i) u1 (U, m2 ) = u1 (D, m2 ) e (ii) u2 (m1 , M ) = u2 (m1 , R).
Ou seja,
(i) 5 (1 ) = 2 = 5/7
(ii) 2 (1 ) = 5 = 5/7
Entao (m1 ; m2 ) = (5/7U, 2/7D; 5/7M, 2/7R) e um candidato a EN. Como s2 = L e tal que
u2 (m1 , L) = 5/7 < u2 (m1 , m2 ) = 10/7, a randomizacao acima e de fato um EN.
O jogo acima possui ao todo tres EN, dois em estrategias puras e um em estrategias mistas
nao-degeneradas. Claramente, esse algoritmo e impraticavel de ser calculado no braco para
jogos com muitas estrategias. Porem, ele pode ser implementado computacionalmente nesses
casos.
2. ui : M R e contnua em M e quase-concava em Mi .
Entao sempre existe (pelo menos) um equilbrio de Nash para esse jogo.
Corol ario. Todo jogo finito na forma estrategica possui pelo menos um equilbrio de Nash em
estrategias mistas.
Para confirmar a validade do corolario, basta notar que o simplex de um conjunto finito nao-
vazio e compacto e convexo. Logo, o Teorema 7.2 pode ser visto como um corolario de Teorema
acima.
bi (mi ) = {m
i Mi | ui (m
i , mi ) ui (mi , mi ), mi Mi }.
A definicao acima diz que bi (mi ) seleciona, dada a escolha mi de todos os outros jogadores
que nao i, a melhor resposta do jogador i a` escolha mi . Observe primeiro que bi e de fato uma
correspondencia e nao uma funcao, pois para uma determinada escolha mi dos seus rivais, o
jogador i pode ter mais de uma estrategia que e a melhor resposta a mi .
Observe que se existe um ponto fixo para b, isto e, um conjunto de estrategias m = (m1 , . . . , mI )
tal que (m1 , . . . , mI ) (b1 (m1 ), . . . , bI (mI )), entao vale que mi bi (mi ) para todo jogador
i, o que significa que mi e a melhor resposta do jogador i a` escolha mi de seus rivais, ou seja,
m = (m1 , . . . , mI ) e um equilbrio de Nash.
4 Alguns Resultados
Vimos acima exemplos de equilbrios com estrategias puramente mistas. O exemplo abaixo
mostra que pode existir um EN onde apenas um dos jogadores de fato randomize. Para que
isso ocorra, e necessario que os payoffs obtidos com as estrategias puras que fazem parte da
randomizacao desse jogador sejam todos iguais, ja que o outro jogador nao randomiza e escolhe
uma estrategia pura. Alem disso, cada estrategia pura do jogador que de fato e randomizada
forma um EN em estrategias puras junto com a estrategia pura escolhida pelo outro jogador.
O exemplo a seguir ilustra esse ponto.
1 / 2 L R
U 1, 1 0, 0
D 1, 0 0, 0
Esse jogo possui tres EN em estrategias puras, (U, L), (D, L) e (D, R). Nao existe equilbrio em
estrategias estritamente mistas para os dois jogadores. Porem, (U, (1 )D; L) e um EN para
todo [0, 1], em que o jogador 1 randomiza entre as estrategias U e D, escolhendo qualquer
probabilidade. Isso ocorre porque como U e D proveem o mesmo payoff para o jogador 1
quando 2 escolhe L, entao qualquer randomizacao entre essas duas estrategias sera parte de
um EN junto com a estrategia L de 2.
Um caso mais extremo e sem interesse seria o de um jogo em que os payoffs de cada jogador sao
todos iguais. Nessa situacao, tudo sera EN, ja que qualquer escolha de cada jogador gerara
sempre o mesmo payoff. Evidentemente, isso nao configuraria um jogo no sentido informal do
termo. A matriz abaixo ilustra esse caso.
1 / 2 L R
U 1, 2 1, 2
D 1, 2 1, 2
Proposic
ao. Os seguintes resultados sao validos:
2. Se existir equilbrio em estrategias fracamente dominantes, entao ele sera um EN. Neste
caso, pode ocorrer que exista outro EN, formado por estrategias fracamente dominadas.
O exemplo abaixo mostra esse caso.
3. Vimos em um exemplo acima que o PEEFD pode levar a diferentes resultados, depen-
dendo da ordem de eliminacao das estrategias. Mesmo assim, qualquer equilbrio obtido
com o PEEFD sera um EN.
1 / 2 L R
U 1, 1 0, 0
D 0, 0 0, 0
Esse jogo possui dois EN, dados por (U, L) e (D, R). Nao existe equilbrio em estrategias
estritamente mistas. O EN (U, L) e tambem equilbrio em estrategias fracamente dominantes
(e pode ser obtido usando o PEEFD). O EN (L, D) e um equilbrio formado por estrategias
fracamente dominadas e portanto nao pode ser encontrado usando o PEEFD.
O Exemplo 10 mostra que pode existir um equilbrio formado por estrategias fracamente do-
minadas. Um equilbrio desse tipo e algo estranho, pois envolve cada jogador escolher uma
estrategia para a qual existe outra opcao que dara sempre um payoff maior ou igual, inde-
pendentemente do que os outros jogadores facam. Entao e difcil justificar que um equilbrio
em estrategias fracamente dominadas seja o resultado da interacao estrategica dos jogadores.
Existe um conceito de refinamento do EN para jogos na forma normal, chamado refinamento da
mao-tremula (Selten, 1975; Myerson, 1978), que exclui a possibilidade desse tipo de equilbrio
ocorrer, no sentido de que o EN formado por estrategias fracamente dominadas nao satisfaz
o refinamento da mao-tremula (pode se dizer tambem que esse EN nao e perfeito da m ao-
tremula).
Refinamentos do conceito de EN sao direcionados para eliminar EN que por algum motivo
nao sao considerados razoaveis. Nesse caso, existira algum ou alguns EN que satisfazem o
refinamento e algum ou alguns que nao o satisfazem.
Refer
encias
Aumann, R. J. (1974). Subjectivity and correlation in randomized strategies. Journal of
Mathematical Economics, 1 , 67-96.
Aumann, R. J. (1976). Agreeing to disagree. The Annals of Statistics, 4:6 , 1236-1239.
Aumann, R. J., & Brandenburger, A. (1995). Epistemic conditions for nash equilibrium.
Econometrica, 63:5 , 1161-1180.
Bernheim, B. D. (1984). Rationalizable strategic behavior. Econometrica, 52 , 1007-1028.
Myerson, R. B. (1997). Game theory: Analysis of conflict. Harvard University Press.
Nash, J. F. (1950). Equilibrium in points in n-person games. Proceedings of the National
Academia of Sciences, 36 , 48-49.
Nash, J. F. (1951). Non-cooperative games. Annals of Mathematics, 54:2 , 289-295.
Pearce, D. G. (1984). Rationalizable strategic behavior and the problem of perfection. Econo-
metrica, 52 , 1029-1050.
Polak, B. (1999). Epistemic conditions for nash equilibrium, and common knowledge of
rationality. Econometrica, 67:3 , 673-676.
von Neumann, J., & Morgenstern, O. (2007). Theory of games and economic behavior. Prin-
ceton University Press.
Jogos Bayesianos
1 Informac
ao Incompleta
Em um jogo de informacao incompleta os jogadores possuem informacao privada relevante para
o jogo, antes do seu incio, informacao nao compartilhada por todos os jogadores.
Porem isso pode nao ser natural em muitos casos, como em leiloes, onde cada participante tem
a sua valoracao do bem a ser leiloado, informacao essa relevante para o leilao, e mais nenhum
outro participante conhece essa valoracao. A natureza da informacao incompleta pode ser de
varios tipos, como o payoff dos jogadores, as preferencias, etc (Myerson, 1997).
Logo, esses jogos sao modelados supondo que os jogadores escolhem suas estrategias ja pos-
suindo informacao privada. Como isso e feito?
Ideia Central Harsanyi (1967): Toda incerteza a respeito da informacao privada que um
jogador possui e descrita pelo seu tipo. Cada jogador sabe o seu tipo, mas desconhece o tipo
dos outros jogadores. A natureza escolhe o tipo de cada jogador antes do incio do jogo.
O tipo do jogador contem toda informacao privada relevante que ele possui sobre o jogo e que
nao e de conhecimento comum entre os outros jogadores. Como um jogador desconhece os
tipos dos outros jogadores, ele formara uma crenca (belief ) a respeito desses tipos. Esta
nota de aula baseia-se em Jehle and Reny (2011), paginas 319-325, Myerson (1997), paginas
67-83.
2 Jogo Bayesiano
Seja ti Ti uma variavel aleatoria escolhida pela natureza e observada apenas pelo jogador i.
Dizemos que ti e o tipo do jogador i. O conjunto T = T1 T2 TI e o domnio de toda
incerteza do jogo e incorpora toda informacao privada relevante que existe no jogo. Vamos
assumir que Ti e finito para todo jogador i.
A funcao utilidade do jogador i depende do seu tipo e dos tipos de todos os outros jogadores,
alem das estrategias de todos os jogadores, como de praxe. Entao temos que:
ui : S T R , ui = ui (s, t) ,
Vamos supor que cada jogador i conhece Ti , ou seja, sabe quais podem ser os possveis tipos
que os outros jogadores podem vir a ser. Logo, cada jogador pode ser um e apenas um dos tipos
elencados no seu conjunto de tipos (ou seja, nao ha surpresas no sentido de que um jogador
revela ser um tipo fora de seu conjunto de tipos).
Precisamos agora apenas caracterizar a probabilidade de ocorrencia dos tipos. Vamos supor
que para cada jogador i, existe uma funcao de probabilidade subjetiva pi : Ti (Ti ). Logo,
para cada tipo ti do jogador i, pi especifica uma distribuicao de probabilidades pi ( | ti ) sobre o
conjunto Ti , que representa o sistema de crencas do jogador i sobre o tipo dos outros jogadores,
caso o tipo de i seja ti . Portanto, pi (ti | ti ) e a probabilidade que o jogador i, quando do tipo
ti , atribui a que os outros jogadores sejam do tipo ti . Temos entao que:
X
0 pi (ti | ti ) 1, ti Ti e pi (ti | ti ) = 1 ,
ti Ti
Definic
ao 7.10: Jogo de Informac ao Incompleta. Um jogo de informacao incompleta (ou
jogo Bayesiano) e descrito pela colecao:
G = (pi , Ti , Si , ui )Ii=1 ,
Assumimos que cada jogador i conhece toda a estrutura do jogo Bayesiano G = (pi , Ti , Si , ui )Ii=1 ,
do modo definido acima, e o seu proprio tipo ti . Esse fato e de conhecimento comum dos
jogadores. Alem disso, cada jogador sabe que todos os outros jogadores conhecem o seu proprio
tipo (e isso tambem e de conhecimento comum do jogo).
Vamos chamar o objeto de escolha em um jogo Bayesiano de acao. Isso e consistente com a
definicao de acao para jogos na forma extensiva, que veremos a seguir. A ideia e que uma
acao define um plano contingente completo de jogadas que o indivduo considera factvel, ap
os
conhecer o seu tipo. Ja uma estrategia abarca um plano contingente completo, para todas as
situacoes possveis, antes de o jogador saber o seu tipo.
3 Consist
encia
Definic
ao: Consist encia do Sistema de Crencas (Myerson, 1997). Dizemos que o
sistema de crencas (pi )iI e consistente se existir umaPdistribuicao comum a priori p sobre o
conjunto de tipos T (0 p (t) 1, para todo t T , e tT p (t) = 1) tal que a crenca de cada
jogador e igual `a distribuicao condicional de p, calculada usando a regra de Bayes:
p (ti , ti )
pi (ti | ti ) = P ,
ti Ti p (ti , ti )
Observe que no exemplo acima, p(t) = 1/10000, para todo t {1, 2, . . . , 100} {1, 2, . . . , 100}
mostra que as crencas acima sao consistentes, pois:
p (ti , ti ) 1/10000 1
pi (ti | ti ) = P = = ,
ti Ti p (t i ,
ti ) 100/10000 100
A hipotese de consistencia simplifica bastante o modelo. Neste caso, o jogo pode ser caracte-
rizado por G = (p, Ti , Si , ui )Ii=1 . Mais ainda, em um modelo consistente, diferencas em crencas
individuais sao justificadas apenas por diferencas na informacao que cada agente possui. Se as
crencas forem inconsistentes, essas diferencas podem ser geradas por diferencas de opiniao.
Mais especificamente, Aumann (1976) argumenta que toda diferenca nas crencas dos jogadores
e resultado de uma diferenca de informacao. Logo, segundo Aumann, seria natural supor que
todos os sistemas de crencas sejam derivados de umaP distribuicao conjunta p sobre o conjunto
de todos os tipos T (p(t) > 0, para todo t T , e tT p(t) = 1). Apesar de os jogadores
desconhecerem os tipos de seus rivais, a distribuicao p e de conhecimento comum entre os
jogadores. Essa hipotese e chamada common prior assumption (CPA).
Definic
ao: Jogos Bayesianos Equivalentes. Considere os dois jogos Bayesianos abaixo:
G1 = (pi , Ti , Si , ui )Ii=1
pi , Ti , Si , ui )Ii=1
G2 = (
Dizemos que G1 e G2 sao totalmente equivalentes se para todo jogador i existem funcoes
ai : Ti R e bi : T R tais que, para todo ti Ti , ai (ti ) > 0 e:
pi (ti | ti )
ui (s, t) = ai (ti )pi (ti | ti )ui (s, t) + bi (t) ,
para todo s S, ti Ti .
Logo, dois jogos sao totalmente equivalentes se as utilidade esperadas de cada jogador nos dois
jogos representarem a mesma preferencia. Neste caso, estamos representando o mesmo jogo,
apenas supondo utilidades esperadas diferentes mas equivalentes para cada jogador (observe que
as probabilidades acima sao subjetivas por isso podemos considerar funcoes de probabilidades
diferentes).
pi , Ti , Si , ui )Ii=1
ou seja, bi (t) = 0, para todo t T e ai (ti ) = 1 para todo ti Ti . Entao Ge = (
e totalmente equivalente ao jogo original G e as crencas pi sao consistentes com a distribuicao
comum a priori p : T R dada por:
1
p (t) = ,
|T1 | |T2 | |TI |
Portanto, para jogos de informacao incompleta G = (pi , Ti , Si , ui )Ii=1 , conforme definido acima,
a hipotese de consistencia nao e limitadora. Porem isso nao e verdade em geral. Por exemplo,
para modelos que assumem a hipotese de valores privados (private values assumption), ou
seja, em que a utilidade de cada jogador depende apenas das acoes escolhidas e do seu tipo,
ui : S Ti R, o resultado acima pode nao ser valido.
4 Equilbrio Bayesiano
Queremos definir uma solucao ou nocao de equilbrio para jogos de informacao incompleta.
O atalho desenvolvido por Harsanyi (1967) consiste em associar ao jogo Bayesiano um jogo
na forma estrategica G , de modo que essa associacao nao seja ambgua. Isso permite usar
conceitos definidos para jogos na forma estrategica para os jogos Bayesianos.
Vamos fazer isso tornando cada tipo ti Ti um jogador distinto. Como o conjunto dos tipos
Ti e finito para todo jogador i, podemos supor, sem perda de generalidade, que TiS Tj = ,
para todo i 6= j. Criamos um jogo artificial, onde o conjunto dos jogadores e T = iI Ti , ou
seja, cada tipo de cada jogador e um jogador nesse novo jogo.
Uma vez definidos os jogadores, precisamos caracterizar as estrategias que cada jogador pode
escolher. Obviamente, se o jogador e de um tipo referente ao jogador i no jogo Bayesiano
original, fazemos Sti = Si , para todo ti Ti , para todo i. Logo, o conjunto de todas estrategias
do jogo na forma estrategica pode ser denotado por:
|T | |T | |T |
S = S1 1 S2 2 SI I
onde Si = SiTi = {si : Ti Si } e o conjunto de todas as funcoes que associam a cada tipo uma
estrategia. Logo, podemos lidar ou com S ou com S , dependendo do que for mais conveniente.
Definic
ao 7.11: Representac ao na Forma Normal. Seja G = (pi , Ti , Si , ui )Ii=1 um jogo
de informacao incompleta. O jogo na forma estrategica G = (Sti , uti )ti T definido acima e
chamado representacao agente/tipo associado ao jogo G.
Desse modo, obtemos o jogo na forma normal G que corresponde ao jogo de informacao incom-
pleta original, G = (p, Ti , Si , ui )Ii=1 . Portanto, transformamos o estudo de jogos de informacao
Teorema 7.3: Exist encia de ENB. Todo jogo finito de informacao incompleta possui pelo
menos um equilbrio de Nash Bayesiano.
O Teorema 7.3 e consequencia direta do Teorema de Nash (Theorem 7.2), que garante a
existencia de equilbrios de Nash para todo jogo finito na forma estrategica, quando consi-
deramos estrategias mistas.
O Teorema 7.3 trata cada jogador tipo ti do jogador i como um jogador separado que maximiza
a sua utilidade, dada a sua crenca a respeito dos outros jogadores. Para termos uma descricao
completa do equilbrio, precisamos ter uma lista de estrategias para todos os tipos de jogadores.
Ou seja, mesmo que o jogador i saiba o seu tipo, a sua estrategia de equilbrio e escolher uma
acao para cada tipo que ele poderia vir a ser. Isso e necessario por que mesmo que i conheca
o seu tipo, os outros jogadores nao sabem qual e o tipo de i (podemos dizer que nao sabem o
tipo de i que foi realizado). Entao, ex-ante cada jogador i tem utilidade dada por:
X
Ep [ui (si (ti ), si (ti ), ti , ti )] = si (ti ), si (ti ), ti , ti ) .
p(t) ui (
tT
Ex-post, a utilidade realizada e a que ocorre com os jogadores de fato escolhendo a acao asso-
ciada ao seu tipo ti realizado, que faz parte do equilbrio de Nash:
X
uti (s ) = Epi [ui (si (ti ), si (ti ), ti , ti ) | ti ] = pi (ti | ti ) ui (
si (ti ), si (ti ), ti , ti ) .
ti Ti
Portanto, um conjunto de regras de decisao (s1 (), . . . , sI ()) e um equilbrio de Nash Bayesiano
para o jogo G = (p, Ti , Si , ui )Ii=1 se, e somente se, para todo jogador ti temos que:
Epi ui (si (ti ), si (ti ), ti , ti ) | ti Epi ui (s0i , si (ti ), ti , ti ) | ti ,
Exemplos 7.2 e 7.3. Duas firmas competem no preco, do modo de Bertrand. A firma 1 nao
conhece o custo marginal de producao da firma 2, que pode ser baixo ou alto, com a mesma
probabilidade. Nesse caso, T1 = {c1 } e T2 = {c2h , c2h }, com c1 = 0, c2l = 1 e c2h = 4. O conjunto
de estrategia de cada firma e o preco cobrado pelo bem produzido. O payoff da firma 2 depende
de seu custo marginal ser baixo ou alto. A demanda de mercado e 8 p, onde p e o menor
preco cobrado. Vamos supor que cada firma possa escolher apenas entre tres precos, p = 1,
p = 4 e p = 6.
Suponha a seguinte regra: se os precos anunciados forem diferentes, a firma que anunciou o
menor deles define o preco de equilbrio e fica com toda a demanda. Se as firmas anunciam
dois precos iguais, as duas firmas dividem o mercado caso o preco anunciado seja maior do
que o maior custo marginal. Caso o preco anunciado seja igual ao maior custo marginal, entao
a firma 1 fica com toda a demanda. O payoff de cada firma e dado pelo seu lucro, que e igual
a zero caso nao haja producao. Logo, os payoffs do jogo sao descritas pelas matrizes abaixo,
para cada tipo que a firma 2 venha a ser.
1 / 2l p2l = 6 p2l = 4 p2l = 1
p1 = 6 6, 5 0, 12 0, 0
1
p = 4 16, 0 8, 6 0, 0
1
p =1 7, 0 7, 0 7, 0
1 / 2h p2h = 6 p2h = 4 p2h = 1
p1 = 6 6, 2 0, 0 0, 21
p1 = 4 16, 0 16, 0 0, 21
p1 = 1 7, 0 7, 0 7, 0
Vamos encontrar as matrizes associadas `a representacao agente/tipo do jogo Bayesiano acima.
Nesse caso, temos tres jogadores, 1, 2l e 2h, onde 2l e o jogador 2, tipo l e 2h e o jogador 2,
tipo h. A representacao na forma normal gera as matrizes abaixo.
Firma 1 escolhe p1 = 6
2l / 2h p2h = 6 p2h = 4 p2h = 1
p2l = 6 6, 5, 2 3, 5, 0 3, 5, 21
p2l = 4 3, 12, 2 0, 12, 0 0, 12, 21
p2l = 1 3, 0, 2 0, 0, 0 0, 0, 21
Firma 1 escolhe p1 = 4
2l / 2h p2h = 6 p2h = 4 p2h = 1
p2l = 6 16, 0, 0 16, 0, 0 8, 0, 21
p2l = 4 12, 6, 0 12, 6, 0 4, 6, 21
p2l = 1 8, 0, 0 8, 0, 0 0, 0, 21
Firma 1 escolhe p1 = 1
2l / 2h p2h = 6 p2h = 4 p2h = 1
p2l = 6 7, 0, 0 7, 0, 0 7, 0, 0
p2l = 4 7, 0, 0 7, 0, 0 7, 0, 0
p2l = 1 7, 0, 0 7, 0, 0 7, 0, 0
Observe que para o jogador 2l, p = 4 e estrategia fracamente dominante. Ja para o jogador 2h,
p = 6 e estrategia fracamente dominante. Eliminando as estrategias dominadas, encontramos
o seguinte equilbrio Bayesiano: 1 escolhe p = 4, 2l escolhe p = 4 e 2h escolhe p = 6. Neste
equilbrio, o jogador 1 obtem payoff 12, o jogador 2l obtem payoff 6, e o jogador 2h obtem
payoff 0. Portanto, exceto para a firma 2, caso ela seja de alto custo, as firmas obtem lucro
positivo, na presenca da informacao incompleta descrita neste exerccio. Ou seja, a competic
ao
de Bertrand nao necessariamente levara o lucro a zero quando houver informacao incompleta.
Finalmente, e possvel mostrar que existem outros EN para este jogo.
5 Leil
ao de Primeiro Pre
co
Suponha um leilao de envelope fechado, onde cada comprador faz uma oferta (fechada) inde-
pendentemente dos outros jogadores. Vamos assumir apenas dois jogadores. Apos as ofertas
serem feitas, os envelopes sao abertos e vence o leilao quem fez a maior oferta, que paga o valor
da oferta feita (o outro jogador nao paga nada).
Vamos denotar por vi o valor do objeto leiloado para o jogador i, i = 1, 2. Cada jogador sabe o
valor de seu vi , porem desconhece a valoracao do seu oponente. Nesse caso, o jogador i assume
que vi U [0, 1], ou seja, que a valoracao do oponente e descrita por uma variavel aleatoria
com distribuicao uniforme entre [0, 1]. Essa informacao e de conhecimento comum entre os
jogadores.
Entao o tipo do jogador i e dado por v. Um equilbrio de Nash Bayesiano nesse jogo e caracte-
rizado por um par de funcoes de oferta (s1 (), s2 ()), onde si : [0, 1] [0, 1] e a funcao oferta do
jogador i, i = 1, 2. Como o jogo e simetrico, vamos procurar um equilbrio onde os jogadores
seguem estrategias identicas.
Vamos supor que a solucao e uma funcao crescente: s(v) e tal que quanto maior a valoracao
do indivduo, maior o lance dado. Logo podemos inverter a funcao s(v) e obter a funcao V (s),
que diz a valoracao do indivduo que da um lance igual a s.
V (s) (v s) + (1 V (s)) 0 ,
V 0 (s)(v s) V (s) = 0
Essa expressao diz que para cada valor v (o tipo do jogador), podemos encontrar a sua estrategia
otima. Em equilbrio devemos ter entao que:
Portanto, o equilbrio de Nash Bayesiano e caracterizado por s(v) = v/2, para os dois jogadores,
o que significa que cada jogador deve dar um lance igual `a metade da sua valoracao do objeto.
Observacoes:
O modo que procedemos para encontrar o equilbrio e padrao: chutamos que a es-
trategia (a funcao lance otimo) era crescente (invertvel) e da derivamos uma EDO que
essa funcao deve satisfazer.
6 Discuss
ao
Alguns pontos:
2. Qual sistema de crencas p considerar? Diferentes p (crencas a respeito dos outros joga-
dores) podem levar a diferentes solucoes.
possvel mostrar, sob condicoes razoavelmente gerais, que qualquer conjunto de regras
3. E
de decisao e um ENB para um determinado sistema de crencas. Ou seja, para qualquer
comportamento existe um sistema de crencas que o suporta como ENB (ver Ledyard
(1986))
Refer
encias
Aumann, R. J. (1976). Agreeing to disagree. The Annals of Statistics, 4:6 , 1236-1239.
Harsanyi, J. (1967). Games with incomplete information played by bayesian players. Manage-
ment Science, 14 .
Jehle, G., & Reny, P. (2011). Advanced microeconomic theory (3rd ed.). Pearson Education.
Ledyard, J. O. (1986). The scope of the hypothesis of bayesian equilibrium. Journal of
Economic Theory, 39:1 , 59-82.
Myerson, R. B. (1997). Game theory: Analysis of conflict. Harvard University Press.
1 Definico
es Iniciais
Sabemos que para descrevermos um jogo sao necessarios tres objetos:
A regra do jogo,
Um jogo na forma extensiva, definido a seguir, e a representacao mais adequada para situacoes
dinamicas. A definicao abaixo mostra que para se caracterizar um jogo na forma extensiva
de maneira formal, e necessario definir uma serie de objetos, o que leva a uma caracterizacao
longa
Definic
ao 7.13: Jogo na Forma Extensiva. Representamos um jogo finito na forma
extensiva pelo conjunto:
= {I, A, X, E, , , I, (ui )iI }
onde:
1. I e o n
umero (finito) de jogadores (denotamos por 1 o jogador natureza, caso exista);
2. A e o conjunto de acoes, que inclui todas as acoes que podem ser tomadas em qualquer
ponto do jogo (A nao necessariamente e finito);
3. X e um conjunto de nos (ou historias cada no e uma descricao completa das acoes que
foram escolhidas ate o momento presente do jogo), tal que:
A(x) = {a A | (x, a) X}
de todas as acoes disponveis para o jogador que deve se mover apos a historia x X\{x0 }.
Definic ao: Jogo Finito. Se os conjuntos de acoes A e o conjunto de nos X sao finitos, entao
dizemos que o jogo na forma extensiva = {I, A, X, E, i , , I, (ui )iI } (com finitos jogadores)
e finito.
Logo, em um jogo de informacao perfeita, cada jogador observa todas as jogadas dos outros
jogadores escolhidas anteriormente.
Exemplo: Representac
ao em Arvore. Nos dois exemplos abaixo (e nos proximos), o payoff
na primeira linha e do jogador 1 e na segunda linha, do jogador 2.
Terminologia:
Dizemos que o no y sucede estritamente o no x se y = (x, a1 , . . . , ak ), para algum conjunto
{a1 , . . . , ak } A.
k = 1, dizemos que y sucede imeditamente x.
Dizemos que y sucede fracamente x se y = x ou se y sucede estritamente x.
Dizemos que um jogo e de memoria perfeita quando nenhum jogador se esquece do que ele ja
sabia (inclusive de acoes que ja foram tomadas durante o desenrolar do jogo).
Definicao 7.18: Jogo de Mem oria Perfeita. Um jogo na forma extensiva e de mem oria
perfeita se para dois nos quaisquer x e y = (x, a, a1 , . . . , ak ) que pertencem ao mesmo jogador,
entao todo no no mesmo conjunto de informacao de y tem a forma w = (z, a, a01 , . . . , a0l ), para
algum no z no mesmo conjunto de informacao de x.
A definicao acima de memoria perfeita assume que se um jogador i qualquer nao consegue
distinguir entre dois nos de decisao seus (ou seja, que pertencem ao mesmo conjunto de in-
formacao na definicao, y e w), entao essas historias y e w podem ser diferentes apenas com
relacao a acoes tomadas por outros jogadores, diferentes de i. Isto implica que nenhum jogador
se esquece das acoes que escolheu no passado. Portanto, se dois nos pertencem ao mesmo
conjunto de informacao do jogador i, entao a mesma sequencia de acoes de i levou a esses n
os.
O jogo ilustrado na figura abaixo nao apresenta memoria perfeita. Nesse jogo, o jogador 1, na
terceira rodada do jogo, apos a sua escolha na primeira rodada e apos a escolha do jogador 2
na segunda rodada, nao se lembra de sua escolha feita na primeira rodada do jogo.
1
t x1
HH
HH
E H D
HH
H
HH
t
x2 jt
x3 H
@ 2 @
@ @
a @b a @b
@ @
t x4 @Rt
x5 @ t x6 @Rt
x7 @
A A 1 A A
A A A A
l A r l A r l A r l A r
A A A A
AA
U
AAU AAU AAU
2 Relac
ao Entre Forma Normal e Forma Extensiva
2.1 Forma Estrat
egica Associada
Definicao 7.14: Estrat egias em Jogos na Forma Extensiva. Seja um jogo na forma
extensiva qualquer. Uma estrategia pura do jogador i para o jogo e uma funcao si : Ii A,
tal que si (I(x)) A(x), para todo x com (x) = i. Vamos denotar por Si o conjunto de
estrategias puras do jogador i no jogo .
A estrategia de um jogador em um jogo na forma extensiva e uma regra que determina a sua
escolha de acao em todos os conjuntos de informacao do jogo. Uma estrategia para o jogador
i e entao um plano contingente completo (uma regra de decisao completa) que especifica como
o jogador i jogara em toda e qualquer circunstancia do jogo. Se o jogo e finito, entao o
conjunto de estrategias de cada jogador e finito.
Dizer que uma estrategia e um plano contingente completo para o jogo significa dizer que
uma estrategia define acoes para todos os conjuntos de informacao do jogo, mesmo que esses
conjuntos de informacao nao sejam alcancados durante o jogo. Isso inclui definir acoes para
conjunto de informacoes onde a propria estrategia do jogador em questao torna essas acoes
irrelevantes.
Vamos denotar por s um conjunto de estrategias para o jogo em forma extensiva finito. Dado
s = s1 s2 sI e , podemos calcular o payoff esperado de cada jogador, representado
por E ui (s) ou apenas ui (s), para i = 1, 2, . . . , I.
Se cada jogador escolhe uma estrategia si Si , entao temos que foi jogada uma partida do
jogo e o resultado esta descrito em um dos nos finais do jogo . Desse modo, (Si , ui )iI define
um jogo na forma estrategica, chamado forma estrategica associada a .
Um jogo representado na forma normal pode ser representado na forma extensiva sem ambi-
guidades? O contrario tambem e valido? A forma normal e uma estrutura mais simples de se
definir do que a forma extensiva, pois envolve uma quantidade menor de objetos matematicos.
A razao para isso e que uma estrategia condensa uma quantidade enorme de informacao sobre
as acoes escolhidas que compoem essa estrategia. Respondendo entao as duas perguntas, da
forma extensiva para a forma normal sim, mas o contrario nao e valido: a mesma forma normal
pode representar mais de um jogo na forma extensiva. A figura abaixo mostra dois jogos dife-
rentes que possuem a mesma representacao na forma normal, que se resume na representacao
de um jogo do tipo Cara ou Coroa discutido acima.
@ @
t 2 @t t 1 @t
A A A A
Ca AA Co Ca AA Co Ca AA Co Ca AA Co
A A A A
t At t At t At t At
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
Como todo jogo na forma extensiva possui uma u nica representacao na forma estrategica,
podemos adaptar os conceitos definidos anteriormente para jogos na forma estrategica (do-
minancia, equilbrio de Nash, etc) para jogos na forma extensiva, aplicando esses conceitos
para a representacao na forma normal do jogo na forma extensiva.
von Neumann and Morgenstern (2007) (publicado originalmente em 1944) argumentam que de
um modo geral, so e necessario conhecermos a forma normal para analisarmos um jogo. Se os
jogadores sao inteligentes, cada jogador pode planejar toda a sua regra de decisoes para o jogo
antes de o jogo comecar. Assim, ele monta a sua estrategia para o jogo.
Essa suficiencia da forma normal de um jogo e uma das ideias mais importantes da teoria de
jogos. Para jogos simultaneos, isso e claro. Porem, para jogos dinamicos, existe uma perda de
informacao quando representamos o jogo na forma estrategica. No exemplo acima, vemos que a
forma normal equivalente dos dois jogos sequenciais e a mesma logo a informacao perdida na
representacao do jogo na forma normal e apenas quem escolhe primeiro o lado da moeda. Essa
perda de informacao e irrelevante para a analise dos dois jogos e nao influencia os resultados
obtidos. Porem, essa perda de informacao sera sempre irrelevante ou existem casos em que ela
e relevante? Essa e uma questao em aberto na teoria.
2.2 Randomiza
c
ao
Existem dois modos de se definir randomizacao por parte dos jogadores em um jogo na forma
extensiva:
Teorema de Kuhn (Kuhn, 1953). Para jogos na forma extensiva de memoria perfeita,
estrategia mista e estrategia comportamental sao modos de randomizacao equivalentes.
Logo, para toda estrategia comportamental bi de i, podemos encontrar uma estrategia mista
mi de i que resulta na mesma distribuicao sobre payoffs, quaisquer que sejam as estrategias,
mistas ou comportamentais, usadas pelos outros jogadores, e vice-versa. Isso implica que o
tipo de estrategia considerada, mista ou comportamental, e irrelevante para analise de jogos
finitos na forma extensiva de memoria perfeita.
2.3 Amea
cas N
ao-Crveis
Varios tipos de jogos possuem uma dinamica de acoes escolhidas em tempos diferentes. Em
alguns desses jogos, representa-los na forma normal e da encontrarmos os EN pode nao ser
adequado. Quando transformamos um jogo na forma extensiva para a forma normal e en-
contramos os EN do jogo nessa forma, alguns equilbrios podem nao ser crveis, baseados em
ameacas de um dos jogadores que nao sera cumprida nunca. Portanto, o principal problema
na resolucao de jogos dinamicos por meio de encontrar os EN da sua representacao na forma
normal diz respeito `a credibilidade de uma estrategia que faz parte de um EN do jogo na forma
normal.
Entrante
t
@
N
ao Entra @ Entra
@
@
@Rt Monopolista
@
0 @
@
2 Briga @ Acomoda
@
@R
@
1 1
1 1
O segundo EN e baseado em uma ameaca vazia, nao-crvel : M faz uma ameaca, que se for
levada a serio, nao precisa ser cumprida, pois nesse caso E escolhe nao entrar. Porem, uma vez
que E entra, o melhor para M e se acomodar. O refinamento de perfeicao em subjogos, que ve-
remos a seguir, tem como principal objetivo eliminar equilbrios de Nash baseados em ameacas
nao crveis. Vamos dividir a analise: primeiro estudaremos jogos de informacao perfeita, depois
jogos de informacao imperfeita.
3 Jogos de Informac
ao Perfeita
Vamos primeiro analisar jogos de informacao perfeita, onde os jogadores estao perfeitamente
informados de todas as acoes previamente escolhidas quando for o seu momento de jogar
(I(x) = {x}, para todo no de decisao x). Jogos como damas, xadrez, etc sao jogos de in-
formacao perfeita.
2. Determine a escolha otima dos jogadores que jogam nesses nos (problema de maximizacao
individual, sem interacao estrategica). Logo, para cada no pen
ultimo x, encontre s(x) (x)
a acao que leva ao no final que maximiza o payoff do jogador (x) (no caso de mais
de uma acao levando ao payoff maximo, faca esse procedimento para cada uma dessas
acoes). Denote por ux o vetor de payoffs resultante.
4. Repita passos 1., 2. e 3. para o jogo reduzido, ate que uma acao tenha sido associada a
cada no de decisao (ou seja, ate chegar ao no inicial do jogo).
A solucao de inducao reversa para jogos com informacao perfeita se resume a que todos os
jogadores facam escolhas que maximizem o seu payoff sempre que for a sua vez de jogar. Na
pratica, o jogo e resolvido do fim para o comeco. No exemplo anterior, o u
nico EN que satisfaz
o princpio da racionalidade sequencial, implementado por este algoritmo de inducao reversa,
e (entrar,acomodar se E entrou).
Teorema 7.4 (Kuhn). Se s e uma estrategia de inducao reversa do jogo finito na forma
extensiva de informacao perfeita, entao s e um equilbrio de Nash de .
Prova: Primeiro note que o algoritmo de inducao reversa e bem definido e leva a um conjunto
de estrategias sir = (sir ir ir
a que o jogo e finito. Temos que mostrar que sir e um
1 , s2 , . . . , sI ), j
EN. Suponha que nao. Entao existe (pelo menos) um jogador i para o qual existe s0i 6= sir i tal
que:
ui (s0i , sir ir ir
i ) > ui (si , si )
Corol ario 7.1. Todo jogo na forma extensiva finito de informacao perfeita tem um EN em
estrategias puras.
Corolario: Unicidade de Equilbrio. Se os payoffs de cada jogador sao diferentes nos nos
terminais do jogo finito na forma extensiva, para todos jogadores, entao existe um u
nico EN
que pode ser encontrado usando o algoritmo de inducao reversa.
No jogo Monopolista/Entrante acima, vimos que existem dois EN em estrategias puras, mas
apenas um EN pode ser obtido usando o algoritmo de inducao reversa. O algoritmo elimina
exatamente o EN baseado em uma ameaca nao-crvel, o monopolista abrir uma guerra de precos
caso o entrante de fato entre. Essa ameaca nao e crvel pois, uma vez que o entrante entrou
no mercado, se o monopolista fizer uma guerra de precos, ele proprio se prejudicara sem obter
qualquer ganho.
4 Jogos de Informac
ao Imperfeita
O algoritmo de inducao reversa acima so se aplica para jogos de informacao perfeita. Porem a
ideia de racionalidade sequencial pode ser usada tambem para jogos de informacao imperfeita
por meio de um algoritmo similar de inducao reversa. A ideia central e definir subjogos do
jogo principal (Selten, 1965, 1975).
Definic
ao 7.16: Subjogo. Um subjogo de um jogo na forma extensiva e um subconjunto
do jogo tal que:
(i) Se inicia em um conjunto de informacao que contem apenas um u
nico no de decisao;
Podemos condensar a definicao acima na Def. 7.16 usada no livro-texto, que afirma que um no
de decisao x define um subjogo se I(x) = {x} e sempre que y for um no de decisao que sucede
x, e z um no que esta contido no conjunto de informacao de y, entao z tambem sucede x.
Entao se o no x define um subjogo, todos os jogadores sabem que estao em x quando x for
alcancado. Cada subjogo pode ser visto como um jogo por si so.
Exemplo (Fig. 7.17). O jogo na forma de arvore abaixo possui dois subjogos.
1 Out
t 2
2
In
t1
@
@
L @R
@
t 2 @t
@
A A
A A
l A r l A r
A A
t
At
A t
At
A
1 0 0 3
3 0 0 1
Observe que um ENPS e um refinamento de EN: todo ENPS e um EN, ja que o proprio jogo
e um subjogo seu. O contrario nao e valido: existem EN que nao sao perfeitos em subjogos.
Teorema 7.5. Para todo jogo finito na forma extensiva de informacao perfeita, o conjunto de
estrategias de inducao reversa e igual ao conjunto de ENPS em estrategias puras.
Definic
ao 7.19: ENPS. O conjunto de estrategias comportamentais b = (b1 , b2 , . . . , bI ) e um
ENPS do jogo na forma extensiva finito se b induz um equilbrio de Nash em cada subjogo
de .
Teorema 7.6: Exist encia de ENPS (Selten, 1965, 1975). Todo jogo finito na forma
extensiva com memoria perfeita possui um ENPS.
A hipotese de memoria perfeita e necessaria. Existem exemplos de jogos que nao sao de
memoria perfeita, que nao possuem ENPS.
A prova do Teorema 7.6 utiliza o seguinte algoritmo geral de inducao reversa para jogos na
forma extensiva (sejam de informacao completa ou nao):
1. Comece pelo termino da arvore, ache os EN para todos os subjogos finais (subjogos que
nao possuem nenhum subjogo estrito), encontre a estrategia comportamental equivalente;
2. Substitua cada subjogo pelo payoff de um de seus EN;
3. Repita os passos 1. e 2. para o jogo reduzido, continue ate nao restar nenhum subjogo;
4. Repita 1., 2. e 3. para todos os EN encontrados (no caso de algum subjogo ter mais de
um EN).
Para jogos de informacao perfeita, esse algoritmo e igual ao algoritmo anterior (Def. 7.15). Para
jogos de informacao imperfeita, ele resulta em (pelo menos) um profile b de estrategias com-
portamentais. Para completarmos a prova do Teorema 7.6, precisamos mostrar que qualquer
profile b de estrategias comportamentais obtido usando o algoritmo de inducao reversa acima
e um ENPS, e que todo ENPS pode ser encontrado utilizando esse algoritmo (demonstracao
similar a do Teorema 7.5).
5 Jogos Repetidos
Em um jogo do tipo dilema dos prisioneiros, seria possvel obter cooperacao se repetssemos
o jogo diversas vezes? Com a repeticao, o n umero de estrategias de cada jogador aumenta.
Nesse caso, e possvel criar estrategias onde o jogador pune o outro, caso ele nao coopere.
Exemplo: Dilema dos Prisioneiros.
1 / 2 Confessar Nao Confessar
Confessar 3, 3 1, 5
Nao Confessar 5, 1 2, 2
Suponha que o jogador 1 adota a seguinte estrategia: na primeira interacao ele joga N C
(cooperar). Nos perodos seguintes, se o outro jogador escolheu N C (cooperar) no perodo
anterior, ele coopera hoje. Caso contrario, o jogador 1 escolhe C (nao cooperar). Essa estrategia
pode levar a algum tipo de cooperacao? Mais especificamente, existe algum equilbrio tal que
os jogadores venham a adotar estrategias cooperativas? Para jogos repetidos finitas vezes,
considerando ENPS, a resposta e negativa. Para jogos repetidos indefinidamente ou sem data
certa para terminarem, a resposta e positiva.
5.1 Repeti
cao Finita
O teorema abaixo mostra que se o dilema dos prisioneiros e repetido um n umero fixo (finito)
de vezes, o u nico equilbrio de Nash perfeito em subjogos sera formado pelo EN do jogo em
cada perodo que esta sendo jogado. Logo, nao e possvel obter o resultado eficiente com a
repeticao finita do jogo.
Teorema (Mas-Colell, Whinston, & Green, 1996). Seja dado por sucessivos Gt =
(Mit , uti ())Ii=1 (ou seja, um jogo onde em cada perodo t se joga um jogo simultaneo), t =
1, 2, . . . , T < +. Suponha que os jogadores observam as estrategias puras jogadas em cada
jogo, imediatamente apos a conclusao do jogo, e que o payoff de cada jogador e dado pela
soma dos payoffs obtidos em todos os Gt . Se existe um u nico EN st para cada Gt , entao
existe um u nico ENPS para , que consiste em cada jogador escolhendo sti em cada jogo Gt ,
independentemente do que foi feito antes.
O Teorema acima tem uma consequencia implcita importante, a de eliminar qualquer de-
pendencia historica nas estrategias. Ou seja, tudo o que ocorreu antes e irrelevante para
decidir o que fazer hoje. Para jogos que satisfacam as condicoes da proposicao, um ENPS n
ao
depende da historia ocorrida no jogo em nenhum momento.
Por exemplo, o teorema acima tem como consequencia o fato que afirmamos acima, que o dilema
dos prisioneiros jogado repetidamente, por um perodo determinado, continua sempre tendo a
mesma solucao nao cooperativa entre os jogadores em cada rodada do jogo. Esse resultado e
consequencia da hipotese de racionalidade sequencial. Por inducao reversa, na u
ltima rodada,
e melhor nao cooperar. Resolvendo de tras para diante, obtemos nao-cooperacao para todas
as rodadas do jogo.
Intuitivamente, esse resultado ocorre pelo fato de o jogo ter uma data de termino conhecida
pelos jogadores. Resolvendo o jogo por inducao reversa, cada jogador percebe que o seu rival
ira descumprir o acordo de cooperacao na u
ltima vez que interagirem. Eles se adiantam a isso
e nao cooperam na u ltima rodada. Sabendo disso, os jogadores tambem nao irao cooperar na
pen ultima rodada do jogo. Usando esse argumento, obtemos que os jogadores nao cooperam
em nenhuma rodada do jogo. O teorema, consequencia da definicao de ENPS, leva a resultados
considerados pouco razoaveis, como mostra o exemplo abaixo.
Is C II
s C
Is C II II
s C . . . . . . . . . . . . .s C
I
s C II
s C (100 100)
P P P P P P P
1 0 2 1 97 99 98
1 3 2 4 100 99 101
Para este jogo, o unico ENPS e cada jogador escolher P em todo momento do jogo. Isso leva
ao payoff de equilbrio (1, 1), o que mostra que a nocao de ENPS pode levar a comportamen-
tos extremos, em que os jogadores obtem payoffs muito menores do que poderiam obter se
cooperassem. Existem varios estudos experimentais sobre o jogo da centopeia, que procuram
exatamente analisar se esse u nico ENPS e de fato o resultado do jogo. Um estudo classico e o
de McKelvey and Palfrey (1992).
Is IIs Is IIs Is
C C C C Divide 5.000
5.000
P P P P P
1 0 100 0 10.000
0 10 0 1000 0
5.2 Repeti
cao Infinita
Se o jogo for repetido infinitamente (ou se ele nao tiver uma data certa para terminar), pode-se
mostrar que o resultado eficiente em cada rodada do jogo pode ser obtido como equilbrio,
dependendo do quanto os jogadores descontem o futuro (ou da probabilidade de o jogo terminar
na rodada seguinte).
As estrategias que levam a esse tipo de equilbrio sao chamadas estrategias gatilho (trigger
ou Nash-reversion strategies). Um exemplo e a estrategia olho-por-olho (tit-for-tat), onde a
estrategia de hoje do jogador e igual `a estrategia usada pelo seu adversario ontem.
Logo, se
1
,
2
entao o resultado cooperativo ((N C, N C) todo perodo) e obtido como equilbrio (e um equilbrio
de Nash perfeito em subjogos).
6 Equilbrio Sequencial
Para certos jogos, ENPS nao e um conceito de solucao adequado. O exemplo abaixo e um caso
em que isso ocorre.
Entrante n
E
t 0
@ 2
@
E1 @ E2
@
t Monopolio @t
@
A A
A A
Br A Ac Br A Ac
A A
AA
A
A
1 3 1 2
1 0 1 1
E / M Br Ac
nE (0, 2) (0, 2)
E1 (1, 1) (3, 0)
E2 (1, 1) (2, 1)
O jogo acima possui dois EN em estrategias puras: (nE, Br se Entrante entra) e (E1 , Ac se
Entrante entra). Esses EN sao tambem ENPS, pois o unico subjogo desse jogo e o proprio jogo.
Nesse caso, o refinamento de perfeicao em subjogos nao elimina o equilbrio ruim (N E, Br
se Entrante entra), baseado em uma ameaca nao-crvel.
0 L 1t
5 @
@
M @R
@
p(x) tx 2 y@t p(y)
@
A A
A A
l m A r
l m A r
A A
AA AA
4 1 0 0 1 4
0 1 4 4 1 0
Vamos analisar se essa ameaca de jogar m por parte do jogador 2 e crvel, assumindo que o
jogador 2 tem um sistema de crencas a respeito da jogada escolhida por 1. Se 2 pode jogar (ou
seja, que este conjunto de decisao nao-trivial e alcancado), ele sabe que deve estar ou no no x
ou no no y.
p(x) = probabilidade que 2 acha que o no x foi alcancado (ie, que 1 jogou M );
p(y) = probabilidade que 2 acha que o no y foi alcancado (ie, que 1 jogou D).
Nesse caso, os payoffs esperados de 2 para cada uma de suas estrategias disponveis sao:
Apesar de nao sabermos nada sobre o sistema de crencas de 2 (os valores exatos de p(x) e
p(y)), podemos afirmar que uma vez que 2 pode jogar, ele nunca escolhera a estrategia m, ja
que a estrategia mista s = (1/2 l; 0 m; 1/2 r) domina m estritamente:
Definic
ao: Sistema de Crencas. Um sistema de crencas para o jogo na forma extensiva
e uma especificacao de probabilidades p(x) [0, 1] para cada no de decisao x do jogo tal que
X
p(x) = 1 ,
xI
Um sistema de crencas diz qual e a crenca de cada jogador de estar em algum no do conjunto
de informacao I, condicional a estar nesse conjunto de informacao I. Entao um sistema de
crencas define probabilidades em cada conjunto de informacao, em todo o jogo, para todos
os jogadores. Observe que podemos nos restringir a definir o sistema de crencas apenas para
conjuntos de informacao nao-triviais (com mais de um no de decisao). Iremos proceder desse
modo, para simplificar a notacao. Note entao que nao faz sentido usar o conceito de crencas
para jogos na forma extensiva de informacao perfeita.
Definic ao 7.21: Racionalidade Sequencial. O par (p, b) do jogo finito na forma extensiva
e sequencialmente racional se para todo conjunto de informacao I do jogador i, para todo
i = 1, . . . , I, temos que:
vi (p , b | I) vi (p , (b0i , bi ) | I) ,
para toda estrategia comportamental b0i de i.
Exemplo 3 (Fig. 7.34). Considere o jogo de Cara e Coroa representado na forma extensiva
abaixo.
1t
@
@
Ca @ Co
@
p(x) t x y@t p(y)
@
2
A A
A A
Ca A Co Ca A Co
A A
AA
A
A
1 1 1 1
1 1 1 1
Suponha que os jogadores 1 e 2 jogam Cara com probabilidade 1 e o jogador 2 acha que 1
jogou Coroa com probabilidade 1 (p(x) = 0, p(y) = 1). Sabemos que as estrategias (Ca, Ca)
nao constituem um equilbrio de Nash, mas o par estrategias/crencas ((Ca, Ca), p(x) = 0) e
sequencialmente racional, pois o jogador 1 obtem o payoff mais alto possvel e o jogador 2,
segundo suas crencas, obtem o payoff esperado mais alto:
O Exemplo 3 acima deixa claro que racionalidade sequencial e insuficiente para definirmos uma
nocao de equilbrio satisfatoria. Neste caso, encontramos estrategias e crencas sequencialmente
racionais, mas que nao chegam nem a constituir um equilbrio de Nash. Precisamos entao
impor outras condicoes para obter um conceito de equilbrio satisfatorio. No exemplo, fica
claro que o problema e causado por uma inconsistencia entre a estrategia do jogador 1, que
escolhe Cara, e a crenca do jogador 2, que acredita que 1 escolheu Coroa com certeza. Vamos
eliminar esse tipo de inconsistencia usando a propriedade 1 a seguir.
Propriedade 1 (P1): Regra de Bayes. Um sistema de crencas deve ser derivado das
estrategias usando a regra de Bayes, sempre que possvel.
Logo, para todo conjunto de informacao que possui probabilidade positiva de ser alcancado
no jogo, o sistema de crencas nesse conjunto de informacao deve ser derivado usando a regra
de Bayes. No Exemplo 3 acima, a u nica crenca que satisfaz a regra de Bayes para o par de
estrategias (Ca, Ca) e p(x) = 1, p(y) = 0. Portanto, a crenca considerada para o jogador 2
nesse exemplo, p(x) = 0, quando o jogador 1 escolhe Cara, nao satisfaz a regra de Bayes. O
exemplo a seguir mostra mais claramente como utilizamos a regra de Bayes para calcular o
sistema de crencas.
A regra de Bayes impoe um certo grau de consistencia no par (p, b) de estrategias e crencas.
Em equilbrio, os jogadores devem ter crencas corretas a respeito das estrategias usadas no
jogo, no sentido de que as crencas satisfazem a regra de Bayes, sempre que possvel, dado o
par de estrategias e crencas analisado.
1
v
@ HH
H
@ HH
4
@ H
2 3 1 HH 5
15 15 15 15 @ H 15
@ HH
rv @r w zHr
@ H
2
B B B
B B B
B B B
B B B
B B B
B B B
No exemplo acima, o sistema de crencas pode ser derivado usando a regra de Bayes, onde para
cada conjunto de informacao I, temos que:
P (x | b)
p(x) = P ,
yI P (y | b)
Dado o par (p, b), se algum conjunto de informacao (nao-trivial) nao for alcancavel pela es-
trategia b, entao nao podemos usar a regra de Bayes para encontrar o sistema de crencas
associado a` estrategia comportamental b considerada (denominador igual a zero na formula
acima da regra de Bayes). Nesses casos, pode ser razoavel ainda assim impor alguma estrutura
sobre o sistema de crencas, como o exemplo a seguir ilustra.
Exemplo 5 (Fig. 7.31). Considere o jogo representado (de modo incompleto) na arvore
abaixo, com tres jogadores, em que as estrategias comportamentais dos jogadores 1 e 2 consis-
tem em jogar F ora com probabilidade 1.
F ora 1
v
(1) @
@
@
L @R
@
F ora @
F ora
v p(x) 1 p(x) @v
@
2
(1) A A (1)
A A
A A
A A B A A B
A A
A A
p(y) v 3 A
A v1 p(y) p(z) v
3 AAv1 p(z)
A A A A
A A A A
A A A A
A A A A
Exemplo 6 (Mas-Colell et al., 1996). Considere o jogo representado na arvore abaixo, com
tres jogadores, onde um deles e a Natureza, que se move primeiro, usando as probabilidades
descritas na arvore. Considere que o jogador 1 escolhe A com probabilidade 1. Entao a regra
de Bayes nos diz que p(x) = 1/2, mas nao pode ser usada para inferir o sistema de crencas
do jogador 2. Vamos verificar se existe algum sistema de crencas que faz com que o profile de
estrategias (A, L) seja racionalmente sequencial. Note que:
Logo, se 10 8p(y) < 5, ou seja, se p(y) > 5/8 = 0, 625, entao a racionalidade sequencial do
jogador 2 e satisfeita. Observe que para o par de estrategias (A, L) e as crencas p(x) = 1/2,
p(y) > 0, 625, a escolha da estrategia A do jogador 1 e otima. Conforme veremos adiante, o
par de estrategias e crencas ((A, L), (p(x) = 1/2, p(y) > 5/8)) e um equilbrio sequencial fraco.
Natureza
v
@
@
1/2 @ 1/2
@
@
@
v p(x) Jog. 1 1 p(x) @v
@
A A
A A
A A
A A B B A A
A A
A A
AAv v
p(y) Jog. 2
1 p(y) A
A
2 A A 2
A A
10 L A R L A R 10
AA A
A
0 5 0 5
5 2 5 10
O jogo acima, para as estrategias de 1 e 2 representadas em parenteses, nunca chega a ser jogado
e a regra de Bayes nao fornece nenhuma restricao sobre o sistema de crencas dos jogadores 2 e 3.
Mas e razoavel assumir que, se as crencas desses jogadores sao formadas de modo independente
(ou seja, a crenca do jogador 2 nao afeta a crenca do jogador 3, e vice-versa), entao p(y) = 0, 5.
Isso motiva a propriedade 2 abaixo.
Propriedade 2 (P2): Independ encia: Um sistema de crencas deve refletir o fato que os
jogadores escolhem suas estrategias independentemente.
Vamos analisar mais uma propriedade que iremos impor sobre o sistema de crencas. O Exemplo
7 a seguir motiva esta terceira propriedade.
Exemplo 7 (Fig 7.30). Considere o jogo representado (de modo incompleto) na arvore
abaixo, com tres jogadores, em que a estrategia comportamental do jogador 1 consiste em
jogar F ora com probabilidade 1 e do jogador 2 jogar B com probabilidade 1.
F ora 1
v
(1) @
@
L @R
@
@
@
p(x) v @v 1 p(x)
@
A 2 A
A A
(1)A B (1)A B
A AA A AA
v v
p(y) 3 1 p(y)
A A
A A
A A
E AD E AD
A A
A A
Para as estrategias consideradas, a regra de Bayes nao impoe nenhuma restricao sobre as
crencas dos jogadores 2 e 3. A hipotese de independencia do sistema de crencas diz que saber
a estrategia de 2 nao prove nenhuma informacao a 3 sobre o sistema de crencas de 2. Mas se
3 jogar, ele sabera que 2 escolheu a acao A. Mais ainda, ele sabe que estara no no y apenas
se 2 estiver no no x (ou seja, se 1 tivesse escolhido a acao L). Nesse caso, e razoavel assumir
que o sistema de crencas de 2 e 3 e tal que p(x) = p(y). Esse raciocnio motiva a propriedade
3 abaixo.
Propriedade 3 (P3): Crencas Comuns. Jogadores com a mesma informacao devem ter
crencas identicas.
Essas tres propriedades, (P1), (P2) e (P3), constituem hipoteses que iremos impor sobre o
sistema de crencas dos jogadores. As propriedades 2 e 3 se aplicam para crencas que pertencem
a conjuntos de informacao que nao sao alcancados, dada a estrategia considerada (fora do
caminho de equilbrio). Isso e a definicao um tanto informal dessas duas propriedades tornam
difcil verificar se um sistema de crencas satisfaz essas duas regras. A definicao de consistencia a
seguir fornece um algoritmo que, segundo o resultado que discutimos abaixo, permite verificar se
as tres propriedades acima (e algo alem dessas propriedades...) sao satisfeitas simultaneamente.
Definic
ao 7.20: Consist encia. Seja um jogo na forma extensiva. Dizemos que o par (p, b)
e consistente se existir uma sequencia {bn } de estrategias comportamentais completamente
mistas (atribui probabilidade positiva a todas acoes em todos os conjuntos de informacao) que
converge a b, tal que a sequencia de sistema de crencas {pn } associada a {bn } pela regra de
Bayes, converge a p.
possvel mostrar que a propriedade de consistencia implica a regra de Bayes e e mais forte do
E
que apenas impor a regra de Bayes. Ela e mais forte tambem do que impor a regra de Bayes
em cada subjogo do jogo. A propriedade de consistencia implica nao so as propriedades 1, 2 e
3 acima, mas tambem outras propriedades, conforme Kohlberg and Reny (1997) estabelecem
(ver os itens (i)-(iv) na pagina 354 do livro-texto).
Definic
ao 7.22: Equilbrio Sequencial. Um par (p, b) e um equilbrio sequencial se satisfaz
racionalidade sequencial e consistencia.
Teorema 7.7: Exist encia de Equilbrio Sequencial (Kreps & Wilson, 1982). Todo
jogo finito na forma extensiva de memoria perfeita possui pelo menos um equilbrio sequencial.
Se o par (p, b) e um equilbrio sequencial, entao o conjunto de estrategias comportamentais b e
um ENPS.
Observe que no Exemplo 6, vimos que se exigirmos apenas que o sistema de crencas satisfaca
a regra de Bayes, ((A, L), (p(x) = 1/2, p(y) > 5/8)) e um par de estrategias e crencas racional-
mente sequenciais e que satisfaz a regra de Bayes. Entao esse exemplo deixa claro que a regra
de consistencia realmente impoe uma restricao maior sobre o sistema de crencas do que a regra
de Bayes apenas.
Exemplo 10 (Fig. 7.29). Considere o jogo abaixo, onde em parenteses estao representadas
as estrategias comportamentais dos jogadores.
1s
@
(1) @ (0)
@
@s 2
@
@
( 31 ) @ (2)
@3
p(x) s @s 1 p(x)
@
3
A A
A A
A A
AA AA
Observe que podemos interpretar esse resultado do seguinte modo: 3 saber se 1 joga Esquerda
ou Direita nao afeta a sua crenca sobre a probabilidade que 2 escolha Esquerda ou Direita
(pois, no limite, 1 nao joga Direita e esse caminho de jogo em que o conjunto de informacao
de 3 e alcancado nao ocorre). Como 2 escolhe Esquerda com probabilidade 1/3 e Direita
com probabilidade 2/3, entao a crenca de 3 reflete apenas essa escolha de 2: p(x) = 1/3,
1 p(x) = 2/3.
Logo, diferentes requerimentos sobre o sistema de crencas geram diferentes conceitos de equilbrio.
Proposic
ao. Todo Equilbrio sequencial-fraco e um equilbrio de Nash.
Exemplo 12. Considere novamente o jogo representado no Exemplo 1. Vimos que os dois
u
nicos EN (em estrategias puras) desse jogo sao (nE, Br se Entrante entra) e (E1 , Ac se
Entrante entra). Para o segundo EN, a regra de Bayes diz que o sistema de crencas do jogador
M tem que ser p(E1 ) = 1, p(E2 ) = 1 p(E1 ) = 0. Precisamos verificar se para ((E1 , Ac se
Entrante entra),p(E1 ) = 1), racionalidade sequencial e satisfeita.
Ja para o EN dado por (nE, Br se Entrante entra), a regra de Bayes nao impoe nenhuma
restricao sobre o sistema de crencas. Logo, precisamos verificar apenas para quais valores de
p(E1 ) o par (b , p ) = ((nE, Br se Entrante entra),p(E1 )) satisfaz racionalidade sequencial.
Note que:
vM (b , p | I) = (1) p(E1 ) + (1) (1 p(E1 ) = 1
Note que se M mudar sua estrategia para Ac, seu payoff sera:
que e sempre maior do que ou igual a 2. Logo, nao ha sistema de crencas que suporte as
estrategias (nE, Br se Entrante entra) como um equilbrio sequencial-fraco (note que como a
racionalidade sequencial e a propriedade que nao e satisfeita, entao tambem nao existe crencas
que suportem essas estrategias como um equilbrio sequencial).
Refer
encias
Friedman, J. (1971). A non-cooperative equilibrium for supergames. Review of Economic
Studies, 38,1 , 1-12.
Kohlberg, E., & Reny, P. (1997). Independence on relative probability spaces and consistent
assessments in game trees. Journal of Economic Theory, 75 , 280-313.
Kreps, M., D, & Wilson, R. (1982). Sequential equilibrium. Econometrica, 50:4 , 863-894.
Kuhn, H. (1953). Extensive games and the problem of information, in contributions to the
theory of games. In H. Kuhn & A. Tucker (Eds.), (Vol. II, p. 193-216). Princeton
University Press.
Mas-Colell, A., Whinston, M., & Green, J. (1996). Microeconomic theory. Oxford University
Press.
McKelvey, R., & Palfrey, T. R. (1992). An experimental study of the centipede game. Econo-
metrica, 60:4 , 803-836.
Rubinstein, A. (1979). Equilibrium in supergames with the overtaking criterion. Journal of
Economic Theory, 21:1 , 1-9.
Selten, R. (1965). Spieltheoretische behandlung eines oligopolmodells mit nachfragetragheit.
Zeitschrift f
ur die Gesamte Staatswissenschaft, 121 , 301-324.
Selten, R. (1975). Reexamination of the perfectness concept for equilibrium points in extensive
games. International Journal of Game Theory, 4 , 25-55.
von Neumann, J., & Morgenstern, O. (2007). Theory of games and economic behavior (1944:
1st ed.). Princeton University Press.
1 Escolha Social
1.1 Introdu
c
ao
1.1.1 Teoria da Escolha Social
Escolha Social: problema de agregar preferencias individuais em uma preferencia social. Como
um grupo ou uma sociedade decide coletivamente?
Queremos que essa regra de agregacao satisfaca certos criterios de carater normativo.
Exemplo: Se todos em uma sociedade preferem a alternativa A a` alternativa B, entao a regra
social prefere A a` B (unanimidade de Pareto).
Resultado principal: Teorema da Impossibilidade de Arrow.
1.1.2 Definico
es
Alternativa: descricao completa de um estado social;
1.1.3 Relac
ao de Prefer
encia Social
Definic ao: Prefer encia Social (Def. 6.1). Uma relacao de preferencia social R e uma
relacao binaria completa e transitiva sobre X. Representamos por P e I as relacoes de pre-
ferencia estrita e indiferenca derivadas de R, respectivamente.
Notacao:
Quest ao: Como agregar preferencias individuais em uma preferencia social? Que propriedades
uma regra que faz isso, que chamaremos funcao de bem-estar social (FBES social welfare
function) deve satisfazer?
Di = 1 se xPi y
Di = 0 se y Ii x
Di = 1 se y Pi x
1.2.2 Condico
es
Definic ao: Crit erio Paretiano (Unanimidade). f () satisfaz o criterio Paretiano se
f (1, . . . , 1) = 1 e f (1, . . . , 1) = 1.
Observe que o Teorema de May nao so garante que a regra de votacao majoritaria e decisiva,
igualitaria, neutra e positiva (parte mais facil de verificar), mas tambem que se uma regra
de decisao e decisiva, igualitaria, neutra e positiva, entao ela necessariamente e a regra de
votacao majoritaria (parte mais difcil de verificar). Logo, o Teorema de May constitui uma
caracterizacao completa da regra de votacao majoritaria.
O lema abaixo e fundamental para a prova do Teorema de May. Essencialmente, o lema diz que
podemos descrever a regra de votacao majoritaria por meio do total de pessoas que preferem
a alternativa x vis-`a-vis ao total de pessoas que preferem a alternativa y.
Passo 1) Usar o Lema e a propriedade de neutralidade a fim de mostrar que para um grupo
qualquer de preferencias (D1 , . . . , DI ) tal que X(D1 , . . . , DI ) = Y (D1 , . . . , DI ), entao
f (D1 , . . . , DI ) = 0.
Passo 2) Usar parte 1), simetria e resposta positiva a fim de mostrar que para um grupo
qualquer de preferencias (D1 , . . . , DI ) tal que X(D1 , . . . , DI ) > Y (D1 , . . . , DI ), entao
f (D1 , . . . , DI ) = 1.
Passo 3) Usar parte 2) e neutralidade entre as alternativas a fim de mostrar que para um
grupo qualquer de preferencias (D1 , . . . , DI ) tal que X(D1 , . . . , DI ) < Y (D1 , . . . , DI ),
entao f (D1 , . . . , DI ) = 1.
Definic
ao: Vencedor de Condorcet. Dizemos que uma alternativa e um vencedor de
Condorcet se ela ganha de todas as outras alternativas na votacao majoritaria aos pares.
Ou seja, mesmo que as preferencias individuais sejam transitivas, pode ocorrer que a preferencia
social nao o seja. Para o grupo de preferencias acima, nao existe um vencedor de Condorcet.
Logo, em um caso simples, com apenas tres alternativas e tres indivduos, as preferencias
exibidas na tabela acima mostram uma situacao em que a regra de votacao majoritaria aos
pares associa a um determinado conjunto de preferencias individuais uma preferencia social
que nao e transitiva.
Nesse caso, podemos ter problemas de manipulacao da regra social, onde um agente pode ter
condicoes de implementar o seu resultado preferido. O exemplo abaixo ilustra essa possibili-
dade.
1.3.2 Manipulac
ao de Agenda
Regras de escolha social nao transitivas podem trazer problemas de manipulacao de agenda.
Suponha que a regra de escolha e tal que, no caso de tres alternativas x, y e z, se a agenda e
(x, y, z), entao primeiro vota-se x vs y, e depois o vencedor dessa votacao contra z.
Logo, para esse grupo de preferencias em particular, quem define a agenda de votacoes define
a alternativa vencedora.
Observe que o exemplo acima exige que as preferencias dos indivduos sejam do conhecimento
de todos. Alem disso, abre-se a possibilidade de votacao estrategica: pode nao ser mais do
interesse dos eleitores revelarem corretamente as suas verdadeiras preferencias, no caso em que
esse comportamento modifique a escolha social a seu favor.
Por exemplo, suponha que a agenda de votacao e definida pelo indivduo 1. Ele entao imple-
mentara a agenda (y, z, x), que leva a escolha de x, sua alternativa preferida. Essa e a pior
alternativa para o indivduo 3. Se este decidir na primeira rodada de votacao, entre y e z, votar
em z, z passa a ser escolhido em vez de y. Na segunda rodada de votacao, a alternativa x e
preterida e z e escolhido. Logo, o indivduo 3, ao revelar incorretamente as suas preferencias,
consegue afetar o resultado e fazer com que a sua segunda melhor alternativa, z, seja escolhida
no lugar da sua terceira melhor alternativa, x.
Logicamente, a analise se complica: os outros eleitores podem tambem decidir votar estrategica-
mente, nao revelando corretamente suas preferencias. Nesse caso, devemos analisar o problema
de votacao como um jogo e procurar por equilbrios de Nash. Observe que a discussao acima
mostra que a situacao em que o indivduo 1 define a agenda (y, z, x) e todos votam de acordo
com suas preferencias verdadeiras nao e um equilbrio de Nash (mais especificamente, vimos
que o indivduo 3 revelar corretamente sua preferencia nao e a melhor resposta a`s estrategias
dos eleitores 1 e 2 de revelarem suas preferencias verdadeiras).
Nao vamos nos aprofundar mais na questao de comportamento estrategico agora. O ponto
principal que desejamos enfatizar e o de que, em situacoes onde existam tres ou mais alternati-
vas, a regra de votacao majoritaria aos pares pode associar preferencias sociais nao transitivas
a determinados conjuntos de preferencias individuais. Essas situacoes podem gerar problemas
como manipulacao de agenda e votacao estrategica. Queremos investigar se existe alguma regra
de escolha social que nao incorra nesses problemas.
1.4 Problema
De modo geral, uma sociedade define uma funcao de bem-estar social (ou uma regra de es-
colha social ) f que para cada conjunto de preferencias individuais (R1 , . . . , RI ) associa uma
preferencia social:
(R1 , . . . , RI ) 7 R
f
Por exemplo, uma regra muito utilizada e votacao majoritaria, em que a alternativa mais
votada (ou selecionada) pelos agentes e escolhida.
Queremos que a funcao de bem-estar social satisfaca algumas condicoes normativas basicas.
Por exemplo, queremos que ela satisfaca o criterio fraco de Pareto: se todos preferem x a y,
entao a preferencia social prefere x a y.
Na proxima secao veremos algumas propriedades e o principal resultado desta teoria, o Teorema
de Arrow.
2 Teorema de Arrow
2.1 Condi
coes
Arrow (1951): encontrar uma regra de decisao social que agregue preferencias individuais de
modo satisfatorio. As condicoes do teorema de Arrow sao exigencias normativas sobre a
funcao de bem-estar social f que gera a decisao social, R = f (R1 , . . . , RN ).
Essa condicao impoe a` regra social f a capacidade de associar qualquer grupo de preferencias
individuais a uma preferencia social. Portanto, o mecanismo de escolha social e valido qualquer
que seja o grupo de preferencias individuais.
Essa condicao elimina a possibilidade de um ditador na sociedade. Isso nao exclui o fato de
que a escolha social coincida, para um certo grupo de preferencias, com a escolha de algum ou
de alguns indivduos (isso e normal ocorrer).
Essa e a condicao mais sutil de todas. Impoe sobre a funcao de bem-estar social a propriedade de
que o ordenamento social entre duas alternativas dependa apenas dos ordenamentos individuais
entre essas duas alternativas e, portanto, nao seja afetado por nenhuma outra alternativa
diferente de x e y.
Nao e ditadorial.
Porem, ele nao satisfaz o criterio de independencia das alternativas irrelevantes, pois o orde-
namento de duas alternativas pode depender do posicionamento das outras alternativas.
Nos dois grupos, os ordenamentos individuais entre x e y sao os mesmos. Porem, o mecanismo
de Borda resulta em escolhas diferentes. Temos entao uma violacao da hipotese de IIA.
Corol ario. Se existem pelo menos tres alternativas em X, entao a u nica funcao de bem-estar
social f que resulta em R completa e transitiva e que satisfaz as condicoes de domnio universal,
princpio Pareto fraco e independencia das alternativas irrelevantes e a regra ditadorial.
A Demonstracao do Teorema de Arrow pode ser feita de diversos modos. Geanakoplos (2005)
apresenta tres provas simples para o Teorema. Vamos primeiro mostrar a prova classica feita
por Arrow (1951). Para isso, precisamos definir o seguinte conceito:
2.2.1 Demonstrac
ao
Definic
ao: Conjunto Decisivo. Dada a funcao de escolha social f , dizemos que o conjunto
de agentes S I e:
2.2.2 Prova Gr
afica
Vamos agora discutir a prova grafica do Teorema de Arrow feita no livro-texto e baseada em
Blackorby, Donaldson, and Weymark (1984). Suponha que X RK , K 1, e um conjunto
convexo nao-vazio e nao-unitario e que para cada preferencia individual Ri exista uma utilidade
ui : X R contnua que a representa.
onde as condicoes do teorema de Arrow sao satisfeitas. Observe que a utilidade social em x,
[f (u1 (), . . . , uI ())](x) pode depender de toda utilidade ui () de cada indivduo i, e nao apenas
da utilidade ui (x) que i atribui a` alternativa x. Ou seja, f (u1 (), . . . , uI ()) e uma utilidade
social e [f (u1 (), . . . , uI ())](x) e a utilidade social atribuda `a alternativa x. Para simplificar
a notacao, denote por fu a utilidade social f (u1 (), . . . , uI ()) e por fu (x) a utilidade social
[f (u1 (), . . . , uI ())](x) atribuda a` alternativa x X.
Como uma utilidade e u nica a menos de transformacoes crescentes, vamos impor que f satisfaca
a seguinte propriedade de invariancia: sejam i : R R, i = 1, . . . , I funcoes estritamente
crescentes e contnuas. Entao:
Princpio Fraco de Pareto: se ui (x) > ui (y) para todo i, entao fu (x) > fu (y);
fu (x) fu (y) se, e somente se, W (u1 (x), . . . , uI (x)) W (u1 (y), . . . , uI (y)) (2)
entao:
W (( 1 u1 )(x), . . . , ( I uI )(x)) W (( 1 u1 )(y), . . . , ( I uI )(y)),
para qualquer conjunto de funcoes i : R R contnuas e estritamente crescentes i.
Vamos discutir a prova grafica do Teorema de Arrow, supondo apenas dois indivduos. Vamos
caracterizar as curvas de indiferenca da funcao de utilidade social W , que satisfaz as hipoteses
do teorema de Arrow. Considere um ponto u u1 , u2 ) qualquer em R2++ . Esse ponto divide
= (
o quadrante positivo em quatro sub-quadrantes (que nao incluem as fronteiras, denotadas em
linhas tracejadas na figura), como ilustra a figura abaixo.
u2
6
Princpio fraco de Pareto:
P u, u em III; e
u
II I
, u em I
uP u
u
s
III IV
-
u1
O princpio fraco de Pareto implica que a utilidade social atribuda `as utilidades no sub-
quadrante I sao maiores do que W (
u) e que a utilidade social atribuda `as utilidades no sub-
quadrante III sao menores do que W ( u). Portanto, a curva de indiferenca que passa pelo
deve estar contida nos sub-quadrantes II e IV ou nas fronteiras dos sub-quadrantes.
ponto u
Considere agora um ponto arbitrario u
no sub-quadrante II.
u2
6
Tres casos possveis:
W (
u) > W (
u),
II I
su
W (
u) = W (
u), e
su
W (
u) < W (
u).
u
s
III IV
-
u1
v1 = 1 (
u1 ) < 1 (
u1 ) = u1
v2 = 2 (
u2 ) > 2 (
u2 ) = u2
ou seja, v
necessariamente esta no segundo quadrante tambem. Como temos flexibilidade total
na escolha das funcoes i , isto implica que qualquer ponto u no segundo quadrante deve ser
ordenado da mesma forma com relacao a u . Note que isso vale para os outros dois casos
tambem, em que W ( u) > W ( u) e em que W ( u) = W (u). Finalmente, observe que o u
ltimo
caso, W (u) = W ( u), nao pode ocorrer, pois se W ( u) = W (u), entao todos os pontos no
segundo sub-quadrante seriam socialmente indiferentes entre si, mas se considerarmos u no
sub-quadrante II, com u u , entao o princpio fraco de Pareto implica que W (
u) > W (u)
(ver figura acima).
1. Se W (
u) < W (II), entao necessariamente W (
u) > W (IV).
2. Se W (
u) > W (II), entao necessariamente W (
u) < W (IV).
Suponha que W ( u) < W (II) (o segundo caso e analogo). Considere as seguintes funcoes
= ( 1 , 2 ) contnuas e estritamente crescente:
1 (u1 ) = u1 + 1 e 2 (u2 ) = u2 1
u1 , u2 ):
aplicadas `as utilidades (
1 (
u1 ) = u1 + 1 e 2 (
u2 ) = u2 1
u1 1, u2 + 1):
e `as utilidades (
1 (
u1 1) = u1 e 2 (
u2 + 1) = u2
Logo,
ou 1) W (IV) < W (
u) < W (II) ou 2) W (II) < W (
u) < W (IV) .
No primeiro caso, temos que as curvas de indiferenca social sao retas horizontais passando por
. Isso significa que o indivduo 2 e o ditador: W (u1 , u2 ) = u2 . No segundo caso, temos que as
u
curvas de indiferenca social sao retas verticais passando por u . Isso significa que o indivduo 1
1 2 1
e o ditador: W (u , u ) = u .
Diversos autores da area de ciencia poltica incorporaram o resultado de Arrow em suas analises
(por exemplo, ver Shepsle and Boncheck (1995); Austen-Smith and Banks (1996)). Alem disso,
esses autores passaram a utilizar ferramentas como teoria dos jogos para auxiliar essas analises.
Vamos agora discutir relaxamentos nas condicoes do Teorema de Arrow que levam a algum
resultado menos negativo.
possvel mostrar que uma preferencia quase-transitiva e acclica, mas que o inverso nao vale
E
em geral. Sen (1970) desenvolve modelos em que a preferencia social satisfaz um desses dois
requerimentos no lugar de transitividade.
Quao provavel e ocorrer o paradoxo de Condorcet em uma sociedade com tres indivduos e tres
alternativas? Supondo apenas preferencias estritas, temos 216 (6 6 6) sociedades possveis.
Dessas, 12 apresentam o paradoxo de Condorcet. Se as preferencias sao de pico u nico, o
Teorema de Black (ou Teorema do Eleitor Mediano) (Black, 1948) garante que a alternativa
preferida do eleitor mediano e um vencedor de Condorcet (nao e derrotada por nenhuma outra
alternativa numa votacao majoritaria aos pares).
Suponha que exista uma ordem linear (ou ordem parcial completa) em X, ou seja, uma
relacao binaria que satisfaz as propriedades de reflexividade, completeza, transitividade e
antissimetria (se xRi y e yRi x entao x = y).
Definicao: Prefer
encias de Pico Unico. A preferencia Ri e de pico u
nico com relacao a`
ordem linear em X se existe alguma alternativa xi com a propriedade de que Ri e crescente
com respeito a em {y X | xi y} e decrescente com respeito a em {y X | y xi },
ou seja:
Se xi z > y entao zP i y , e
Se y > z xi entao zP i y .
Definic
ao: Eleitor Mediano. O agente h e o eleitor mediano para o conjunto de preferencias
individuais (R1 , R2 , . . . , RI ) se:
I I
#{i I | xi xh } e #{i I | xh xi } .
2 2
Proposic ao. Suponha que e uma ordem linear em X e considere o conjunto de preferencias
individuais (R1 , R2 , . . . , RI ) de pico u
nico com respeito a e seja h o eleitor mediano desse
conjunto. Entao a alternativa preferida do eleitor mediano e um vencedor de Condorcet em X
(nao e derrotada por nenhuma outra alternativa numa votacao majoritaria aos pares): xh Rx,
para todo x X.
Teorema do Eleitor Mediano (ou Teorema de Black (1948)). Suponha que o n umero de
agentes e mpar e que e uma ordem linear em X. Entao votacao majoritaria aos pares define
uma FBES que leva sempre a preferencias sociais completas e transitivas quando consideramos
apenas preferencias individuais de pico u
nico.
Alem disso, nesse caso, nao ha incentivos para representacao incorreta das preferencias, com o
sentido de manipular o resultado.
3 Mensurabilidade e Compara
c
ao
3.1 Hip
oteses sobre a Racionalidade Individual
O teorema de Arrow supoe que as utilidades individuais sao apenas medidas ordinais de bem-
estar e que utilidades de indivduos diferentes nao sao comparaveis. Podemos relaxar esta
u
ltima hipotese, supondo que utilidades de indivduos diferentes sao comparaveis. Alem disso,
podemos relaxar as duas hipoteses conjuntamente, supondo que utilidades possuam sentido
cardinal e que incrementos nas utilidades possam ser comparados entre indivduos Outras
hipoteses e combinacoes de hipoteses podem ser feitas. Hammond (1976); DAspremont and
Gevers (1977); Roberts (1980); Sen (1984) constituem referencias basicas dessa linha de pes-
quisa. Observe que abandonamos entao a ideia de que utilidades individuais fornecem apenas
informacao sobre a ordenacao das alternativas.
Definic
ao: Mensurabilidade, Comparac
ao e Invari
ancia (Def 6.2). Dizemos que:
A hipotese 1 permite comparacoes entre utilidades, pois assumimos igual para todos os
indivduos. A hipotese 2 permite a valoracao de incrementos em cada utilidade individual e a
comparacao desses incrementos entre utilidades diferentes.
fu (x) fu (y) se, e somente se, W (u1 (x), . . . , uI (x)) W (u1 (y), . . . , uI (y)) (3)
Vamos assumir que vale strict welfarism e que podemos entao analisar a funcao W diretamente.
Definicao: Hip
oteses Eticas (Def. 6.3). Considere as seguintes propriedades sobre a
funcao W :
Anonimato (A): Seja u = (u1 , . . . , uI ) um grupo de utilidades qualquer. A funcao de bem-
estar social W satisfaz a propriedade de anonimato se W (u1 , . . . , uI ) = W (u(1) , . . . , u(I) ),
onde : {1, . . . , I} {1, . . . , I} e uma permutacao ( e uma bijecao).
Crit
erio de Igualdade de Hammond (HE): Sejam u = (u1 , . . . , uI ) e u u1 , . . . , uI )
= (
dois grupos de utilidades quaisquer onde uk = uk para todo k 6= i, j. Se ui < ui < uj < uj ,
u1 , . . . , uI ) W (
entao W ( u1 , . . . , uI ).
A propriedade de anonimato impoe que a identidade do indivduo nao tenha influencia sobre
W , ou seja, que todas as pessoas sejam tratadas do mesmo modo. O criterio de igualdade de
Hammond diz que dispersao nas utilidades (ou seja, desigualdade com relacao ao bem-estar
dos indivduos) diminui o bem-estar social.
3.2 Fun
cao de Bem-estar de Rawls
Teorema: FBES Rawlsiana (Th. 6.2). Uma funcao de bem-estar social W contnua e
estritamente crescente satisfaz o criterio de igualdade de Hammond se, e somente se, W (u) =
min{u1 , . . . , uI }. Mais ainda, W satisfaz a propriedade de anonimato e e invariante no nvel
de utilidade.
3.3 Fun
cao de Bem-estar Utilitarista
Teorema: FBES Utilitarista (Th. 6.3). Uma funcao de bem-estar social W contnua e
estritamente crescente satisfaz a propriedade de anonimato e e invariante para diferencas de
utilidade se, e somente se, pode tomar a forma utilitarista, em que W (u) = u1 + + uI .
Por exemplo, se assumirmos que a FBES f e invariante apenas por transformacoes afins crescen-
tes iguais, do tipo i = bui , b > 0, para todo i, entao dizemos que f e invariante a mudancas
percentuais (UPI ) nas utilidades individuais. As FBES Rawlsiana e Utilitarista satisfazem
esse criterio. Mais ainda, as curvas de indiferenca social neste caso devem ser negativamente
inclinadas e radialmente paralelas. Isso significa que a FBES f e homotetica.
Se adicionarmos convexidade e separabilidade forte (as TMS entre duas utilidades quaisquer
independem das utilidades de outros indivduos) a`s hipoteses WP e A, entao a funcao de
bem-estar social deve ser do tipo CES:
1/
W (u1 , . . . , uI ) = (u1 ) + + (uI ) , 0 6= < 1 ,
onde = 1/1, a elasticidade de substituicao entre utilidades, mede a preferencia social por
igualdade ( 0 gera a forma Rawlsiana, gera a forma linear).
4 Justica
4.1 Harsanyi e Rawls
O que e um criterio de decisao social justo? Duas posicoes, formalizadas a partir de uma
discussao filosofica antiga, tomando como base uma posicao original:
Arrow (1973) argumenta que a funcao de utilidade Rawlsiano e um caso particular do caso
mais geral em que os indivduos, em sua posicao original, sao infinitamente avessos ao risco.
Para notar isto, basta lembrar que a FBES Rawlsiana e um caso particular da FBES do tipo
CES, em que o grau de aversao `a incerteza dos agentes e infinito.
5 O Teorema de Gibbard-Satterthwaite
Assumimos que as preferencias sao observaveis ou que cada indivduo revela a sua preferencia
verdadeira. Porem, devemos considerar que as pessoas podem agir estrategicamente, de modo
a nao revelarem corretamente as suas preferencias, caso isso seja do seu interesse.
Vamos assumir que o conjunto de alternativas X e finito e que vale a hipotese de domnio
irrestrito das preferencias individuais.
Definicao: Func ao de Escolha Social (FES). Para cada conjunto de preferencias individu-
ais R = (R1 , R2 , . . . , RI ), c(R) X denota a escolha da sociedade. Vamos supor que a imagem
de c e X (ou seja, para todo x X, existe um conjunto de preferencias R = (R1 , R2 , . . . , RI )
tal que c(R) = x).
Definic ao: Funcao de Escolha Social Ditadorial (Def. 6.4). A funcao de escolha social
c() e ditadorial se existe um indivduo i tal que sempre que c(R1 , . . . , RI ) = x, entao xRi y
para todo y X.
Vamos denotar por Ri as preferencias de todos os indivduos da sociedade, menos o indivduo i.
Fixe Ri e observe que se existirem x, y X distintos tais que c(Ri , Ri ) = x e c(R i , Ri ) = y,
i pode afetar a escolha social: se reportar Ri , a escolha social e x; se reportar R i , e y. Queremos
evitar que a funcao de escolha social seja a prova de revelacoes incorretas de preferencias. Vamos
denotar por (R1 , R2 , . . . , RI ) as preferencias verdadeiras do grupo.
Definicao: Func ao de Escolha Social imune a Comportamento Estrat egico (Def.
6.5). A funcao de escolha social c() e imune a comportamento estrategico se para todo
indivduo i e para todo par Ri e R i de preferencias, e para todo conjunto de preferencias Ri
dos outros jogadores, se c(Ri , Ri ) = x e c(R i , Ri ) = y, entao xRi y.
A definicao acima garante que se a FES e imune a comportamento estrategico, entao todos os
indivduos irao sempre declarar suas preferencias verdadeiras, ja que nunca havera qualquer
ganho em reporta-las de modo incorreto.
Queremos saber que FES sao imunes a comportamento estrategico. O Teorema de Gibbard-
Satterthwaite (Gibbard (1973); Satterthwaite (1975)) responde essa questao e mostra que so-
mente a FES ditadorial satisfaz esse criterio.
Teorema de Gibbard-Satterthwaite (Th. 6.4). Se existem pelos menos tres alternativas,
entao toda funcao de escolha social imune a comportamento estrategico e ditadorial.
Para demonstrarmos o Teorema de Gibbard-Satterthwaite, usaremos as duas definicoes abaixo
(vamos seguir a prova feita por Reny (2001)).
Definicao: Func ao de Escolha Social Pareto Eficiente (Def. 6.6). A funcao de escolha
social c() e Pareto Eficiente se c(R1 , . . . , RI ) = x sempre que xP i y para todo indivduo i e
todo y X distinto de x.
Definic
ao: Func ao de Escolha Social Pareto Monot onica (Def. 6.7). A funcao de
1 I 1, . . . , R
escolha social c() e monotonica se c(R , . . . , R ) = x implica c(R I ) = x sempre que
para cada indivduo i e todo y X distinto de x, temos que xRi y implica xP i y.
A demonstracao do Teorema pode ser dividida em duas partes:
Parte 1: A propriedade de imunidade a comportamento estrategico implica monotonicidade
e eficiencia de Pareto.
Parte 2: #X 3, monotonicidade e eficiencia de Pareto implicam c ditadorial.
Refer
encias
Arrow, K. (1951). Social choice and individual values. New York: John Wiley.
Arrow, K. (1973). Some ordinalist utilitarian notes on rawls theory of justice. Journal of
Philosophy, 70 , 245-263.
Austen-Smith, D., & Banks, J. (1996). Positive political theory. Ann Arbor: University of
Michigan Press.
Black, D. (1948). On the rationale of group decision-making. Journal of Political Economy,
56 , 23-34.
Blackorby, C., Donaldson, D., & Weymark, J. (1984). Social choice with interpersonal utility
comparisons: A diagrammatic introduction. International Economic Review , 25 , 327-
356.
DAspremont, C., & Gevers, L. (1977). Equity and the informational basis of collective choice.
Review of Economic Studies, 44 , 199-209.
Geanakoplos, J. (2005). Three brief proofs of arrows impossibilty theorem. Economic Theory,
26:21 , 211-215.
Gibbard, A. (1973). Manipulation of voting schemes: A general result. Econometrica, 41 ,
587-601.
Hammond, P. J. (1976). Equity, arrows conditions and rawls difference principle. Econome-
trica, 44 , 793-804.
Harsanyi, J. (1953). Cardinal utility in welfare economics and in the theory of risk-taking.
Journal of Political Economy, 61 , 434-435.
Harsanyi, J. (1955). Cardinal welfare, individualistic ethics, and interpersonal comparisons of
utility. Journal of Political Economy, 63 , 309-321.
Harsanyi, J. (1975). Can the maxmin principle serve as basis of morality? a critique of john
rawls theory. American Political Science Review , 69 , 594-606.
May, K. O. (1952). A set of independent necessary and sufficient conditions for simple majority
decision. Econometrica, 20:4 , 680-684.
Rawls, J. (1971). A theory of justice. Cambridge, MA: Harvard University Press.
Reny, P. J. (2001). Arrows theorem and the gibbard-satterthwaite theorem: A unified appro-
ach. Economic Letters, 70 , 99-105.
Roberts, K. W. (1980). Possibility theorems with interpersonally comparable welfare levels.
Review of Economic Studies, 47 , 409-420.
Satterthwaite, M. (1975). Strategy-proofness and arrows conditions: Existence and correspon-
dence theorems for voting procedures and social welfare functions. Journal of Economic
Theory, 10 , 187-217.
Sen, A. (1970). Collective choice and social welfare. Amsterdam: North Holland.
Sen, A. (1984). Social choice theory. In K. Arrow & M. Intrilligator (Eds.), (Vol. 3, p. 1073-
1181). North Holland.
Shepsle, K., & Boncheck, M. (1995). Analysing politics. New York: W. W. Norton.
1 Economia da Informa
c
ao
1.1 Introdu
c
ao
Modelos tradicionais assumem informacao perfeita. Por exemplo, os consumidores conhecem a
qualidade dos produtos adquiridos e as firmas conhecem a produtividade de novos empregados.
A hipotese de informacao perfeita permite tratar esses dois problemas, consumidor e firma,
separadamente e depois unificar a analise via precos que equilibram mercados.
Em modelos de equilbrio geral as interacoes entre os agentes sao bastante limitadas apenas
pelo sistema de precos. Existem varios problemas, como, por exemplo, justificar a existencia
de firmas. Acrescentar incerteza nos modelos de equilbrio geral nao resolve, pois a incerteza e
exogena e simetrica. Problemas aparecem quando existe uma assimetria de informacao entre
os agentes economicos.
Exemplos:
Existem certas caractersticas que sao comuns aos modelos de informacao assimetrica:
2. Interacao de um n
umero pequeno de agentes (dois, usualmente);
3. As restricoes geradas pelo modelo sao descritas por um contrato, garantido por uma
terceira parte;
Vamos assumir um modelo de barganha simples, sem iteracao no processo de barganha (con-
trato do tipo take-it-or-leave-it). O cumprimento do contrato e assegurado por uma terceira
parte (justica, por exemplo). Alguma caracterstica de uma das partes da transacao (agente)
nao e observada pela outra parte (principal ). Portanto, os seguintes termos sao tradicional-
mente usados no sentido abaixo:
Um resultado pouco intuitivo que pode ocorrer em certas situacoes de perigo moral e o bem-
estar total associado `a solucao de Second-Best ser menor do que o bem-estar total associado
a` solucao de Third-Best (obviamente, considerando apenas o principal, o seu bem-estar no
Second-Best sera maior ou igual ao seu bem-estar no Third-Best).
2 Selec
ao Adversa
2.1 Modelo B
asico
Mercado de seguros para carros, com varias firmas e varios consumidores. Este modelo mais
simples serve para outros problemas (como, por exemplo, para o modelo de sinalizacao no
mercado de trabalho de Spence (1973)).
Vamos supor que existem m consumidores, i = 1, . . . , m, todos iguais com respeito `a utilidade
e riqueza inicial, mas com diferentes probabilidades de sofrerem um acidente de carro:
wi = w: riqueza inicial;
Todas as companhias de seguro sao identicas. Apenas seguro total e oferecido, que paga L se o
acidente ocorre, 0 caso contrario (ou seja, nao existe a possibilidade de seguro parcial seguro
e um lumpy good ). O preco do seguro e denotado por pi e a firma nao incorre em custos
administrativos.
Observe que o preco depende do estado da natureza (tratamos um bem em diferentes esta-
dos como diferentes bens). Logo, o preco depende do consumidor i (seguros que beneficiam
diferentes consumidores sao produtos diferentes, logo possuem precos diferentes).
EPij = pi i L
Vamos analisar primeiro o caso com informacao simetrica e depois o caso com informacao
assimetrica, em um ambiente de competicao perfeita.
Informa
cao Sim
etrica
Esse resultado e eficiente no sentido de Pareto: nao e possvel aumentar o payoff de nenhum
agente sem que se diminua o payoff de algum outro agente. Podemos mostrar isso usando
o Primeiro Teorema do Bem-Estar (ver Exerccio 8.1). Porem, iremos mostrar isso de modo
direto.
Sabemos que:
Uma alocacao determina rendas para todos os agentes (consumidores e firmas) em cada
estado da natureza;
Afirmac
ao: Nenhuma alocacao factvel Pareto-domina a alocacao competitiva.
Ideia da Demonstrac ao: Prova por absurdo. O Exerccio 8.6 assegura que podemos supor,
sem perda de generalidade, que a alocacao competitiva e dominada por uma alocacao factvel
onde a riqueza wi de cada consumidor e constante em cada estado da natureza (ou seja, se ele
tem ou nao um acidente). Entao:
onde wi e uma alocacao factvel, constante em todo estado da natureza, que Pareto-domina
a alocacao competitiva e a equivalencia segue de u crescente. Como a riqueza de cada con-
sumidor e constante nos diferentes estados, podemos assumir sem perda de generalidade que
ocorre transferencia de riqueza apenas entre consumidores e firmas (e nao entre consumidores
diferentes ver o Exerccio 8.6). Nesse caso, o lucro esperado da firma que prove o consumidor
i com seguro, considerando a alocacao que Pareto-domina a alocacao de equilbrio, e:
(1 i )(w wi ) + i (w L wi ) = w i L wi
Mas cada companhia de seguro deve ter lucro esperado EP j nao-negativo na alocacao Pareto-
dominante, pois cada firma tem lucro esperado zero na alocacao competitiva. Logo:
X
EPij 0 , j .
i
A riqueza (constante) de cada consumidor e o lucro esperado de cada firma na alocacao Pareto-
dominante e identica a` sua contraparte na alocacao competitiva. Desse modo, obtivemos uma
contradicao com a hipotese de que a alocacao constante e Pareto-dominante. Podemos concluir
entao que a alocacao competitiva e eficiente.
Informa
cao Assim
etrica
Denotamos por F (), [, ] a fracao dos consumidores com probabilidade menor ou igual a
de sofrer um acidente (outra interpretacao: F () diz a probabilidade de que um consumidor
em particular tenha probabilidade ou menor do que de sofrer um acidente).
Razao: Suponha, por absurdo, dois precos distintos, p > p . Nesse caso, todos os consumi-
dores iriam comprar seguro apenas das firmas cujo preco cobrado e p . Pelo lado da oferta,
se consumidores estivessem comprando o seguro aos dois precos, nenhuma firma iria ofertar
seguro ao preco p , pois o seu lucro esperado seria menor. Logo p = p .
Queremos determinar o preco de equilbrio p . Observe que se o lucro esperado for positivo, a
oferta sera infinita; se o lucro esperado for negativo, a oferta e zero.
p = E()L ,
onde Z
E() = dF ()
O problema desse chute e que usamos nele a probabilidade incondicional de sofrer um aci-
dente. Porem, a probabilidade deve ser condicional a quem de fato compra o seguro. As
companhias de seguro ao fixarem p = E()L, podem estar subestimando a probabilidade es-
perada de acidente que de fato importa para elas (condicional a quem de fato compra o seguro).
Vamos levar isso em conta agora.
Seja qualquer. Um consumidor compra um seguro pelo preco p se a utilidade esperada obtida
sem comprar o seguro e menor ou igual a` utilidade esperada de comprar o seguro:
u(w) u(w p)
u(w L) + (1 )u(w) u(w p) h(p) , (1)
u(w) u(w L)
onde a implicacao segue do fato de u ser crescente (u(w) u(w L) e positivo). Como u e
crescente e u(w) u(w L) e positivo, h e crescente em p. Note que obtivemos uma condicao
em p para que o seguro seja comprado.
onde: R
h(p )
dF ()
E( | h(p )) =
1 F (h(p ))
e a probabilidade esperada de ocorrer um acidente, condicional em h(p ).
para todo p [0, L], onde h(p) segue portanto da equacao (1) acima.
2. g pode ser definida como como g : [0, L] [0, L], pois E( | h(p)) [0, ], ja que
[, ].
Propriedades do Equilbrio:
Exemplo: Considere [, ] = [0, 1] e F dada pela distribuicao uniforme em [0, 1]. Neste caso,
temos que:
R1 R1
h(p)
dF () h(p)
f ()d 1 h(p)2 1 + h(p)
E( | h(p)) = = = =
1 F (h(p)) 1 h(p) 2(1 h(p)) 2
1 + h(p )
p = L,
2
onde h(p) = (u(w) u(w p))/(u(w) u(w L)) e p [0, L]. Portanto, como h(L) = 1, temos
que p = L e preco de equilbrio. Nesse caso, E( | h(p )) = E( | 1) = 1.
Comparando com o resultado competitivo com informacao simetrica: cada consumidor possui
utilidade estritamente maior (exceto os que possuem probabilidade 1 de sofrer um acidente)
e firmas obtem lucro esperado zero. Nesse exemplo com informacao assimetrica, o mercado
fecha: nenhuma troca e realizada e oportunidades de melhoras de Pareto nao ocorrem.
Esse e um problema de selecao adversa: efeito negativo no lucro esperado das firmas. Se o preco
e tal que EP < 0, entao aumentar o preco deve aumentar o lucro esperado. Porem, aumentar
o preco altera a utilidade dos consumidores de comprar o seguro, enquanto a utilidade de nao
comprar o seguro continua a mesma. Assim, consumidores no limite deixam de comprar o
seguro. Logo, apenas os consumidores com maior risco de acidentes continuam comprando o
seguro.
Caso extremo (Akerlof, 1970): mercado fecha. Porem mercados de seguro existem. Como os
mercados lidam com esses problemas?
3 Sinalizac
ao
3.1 Jogo de Sinaliza
c
ao
Acima vimos que o problema de selecao adversa gerado pela assimetria de informacao pode
ser tao severo que destroi o mercado de seguros. Porem existem formas que o proprio mercado
encontra para mitigar o problema gerado pela assimetria de informacao. Uma dessas formas
e por meio de sinalizacao, em que o tipo informado tenta, de uma forma crvel, sinalizar
corretamente o seu tipo `a parte desinformada.
Logo, nos modelos de sinalizacao, o agente (consumidor, no nosso exemplo), de alguma maneira
crvel, comunica o seu tipo para o principal (a companhia de seguros, no nosso exemplo). Vamos
modelar essa relacao como um jogo, onde consumidores se movem primeiro.
Suponha, a partir de agora, que existam apenas dois tipos, 0 < < < 1, onde uma proporcao
, 0 < < 1, da populacao e do tipo (chamaremos o consumidor do tipo de baixo risco e
o consumidor do tipo de alto risco).
Note que a firma nao observa o tipo do consumidor, apenas a proposta feita por ele. A
figura abaixo ilustra o jogo para o caso em que os jogadores podem escolher apenas entre dois
contratos, (B, p) e (B 0 , p0 ).
Natureza
x
baixo HH alto
() risco H risco (1 )
H
HH
HH
Consumidor x
H x Consumidor
risco baixo risco alto
A A
0 0
(B, p) A (B , p ) (B, p) A (B 0 , p0 )
A A
Ax Ax
A A
A Seguradora
A
A A
Ac A Rej
Ac A Rej
A A
A A
x x
A Seguradora A
A A
Ac A Rej Ac A Rej
A A
A A
l = (Bl , pl ), Bl 0 e 0 pl w .
h = (Bh , ph ), Bh 0 e 0 ph w .
Logo, uma estrategia para a firma consiste em uma funcao resposta (B, p) {Aceitar, Rejeitar},
para toda proposta (B, p). A funcao depende apenas da proposta feita, e nao do tipo do
consumidor, evidenciando o problema de assimetria de informcao.
No jogo de sinalizacao, primeiro o consumidor propoe = (B, p). A firma entao forma uma
crenca () = (B, p), onde (B, p) e a crenca da firma de que o consumidor que fez a proposta
(B, p) seja de baixo risco.
Vamos assumir que os agentes tomam decisoes que sao otimas em cada ponto do jogo, e que o
sistema de crencas seja consistente. Portanto, vamos estender a nocao de equilbrio sequencial
para este jogo de sinalizacao (a definicao vista usual para jogos finitos nao se aplica, pois o
conjunto de estrategias do consumidor e infinito). O Exerccio 8.8 garante que a definicao
abaixo e equivalente a` definicao de equilbrio sequencial. Note que vamos procurar apenas
equilbrios em estrategias puras.
Definic
ao 8.1: Equilbrio Sequencial. O par ((l , h , ()); ()) e um equilbrio sequencial
em estrategias puras do jogo de sinalizacao se:
3. Para toda proposta = (B, p), a funcao de reacao () da companhia de seguros maxi-
miza o seu lucro esperado, dado o sistema de crencas ().
A questao crucial em que estamos interessados e saber se existe um equilbrio em que o consu-
midor de baixo risco consegue se diferenciar do de alto risco, de modo que o equilbrio obtido
seja menos ineficiente. A forma de um consumidor se diferenciar e pela proposta feita, que
pode funcionar como um sinal do seu tipo para a firma. Como (B, p) nao afeta a probabilidade
da perda, dizemos que (B, p) e um sinal puro. Nesse caso, dizemos que o sinal nao e produtivo.
Veremos que sera possvel obter um equilbrio menos ineficiente, onde o tipo de baixo risco
consegue se diferenciar do tipo de alto risco no caso em que os consumidores de tipos distintos
possuem taxas marginais de substituicao entre B e p diferentes. Essa condicao e chamada
single-crossing property (ou condicao de Spence-Mirrless ou condicao de separacao sorting
condition).
A utilidade esperada de cada tipo, caso a companhia de seguros aceite a proposta (B, p), e:
ul (B, p) = u(w L + B p) + (1 ) u(w p)
uh (B, p) = u(w L + B p) + (1 ) u(w p)
Proposic
ao (Facts).
(a) ul (B, p) e uh (B, p) sao contnuas, diferenciaveis, estritamente crescentes em B, estrita-
mente concavas em (B, p) e estritamente decrescentes em p.
(b) A taxa marginal de substituicao satisfaz:
T M Si (B, p) > i , se B < L;
T M Si (B, p) = i , se B = L;
T M Si (B, p) < i , se B > L;
onde l = e h = .
(c) T M Sl (B, p) < T M Sh (B, p), para todo (B, p).
A condicao single-crossing property (item (c) da proposicao acima) significa que, dada uma
diminuicao em B, o consumidor de baixo risco aceita essa diminuicao por uma reducao em p
menor do que a reducao em p que o consumidor de alto risco aceitaria (custos diferentes em
relacao a (B, p)). A diferenca de taxas marginais de substituicao entre os dois tipos, dada pelo
fato de as probabilidades de acidente serem diferentes, faz com que as curvas de indiferenca de
tipos distintos se cruzem em apenas um ponto. No caso, como T M Sl (B, p) < T M Sh (B, p), a
curva de indiferenca do tipo de baixo risco e menos inclinada do que a curva do tipo de alto
risco. Dado o ponto (B 0 , p0 ) na Figura 8.2 abaixo, reduzir o benefcio para o consumidor de
baixo risco e menos custoso do que reduzir o benefcio para o consumidor de alto risco.
p
6
Figura 8.2
uh constante
ul constante
p0 s @
@
p00l s R
@
-
B 00 B 0 B
p
6
Figura 8.3
45 graus
p = B
(reta de isolucro zero se alto risco)
s 1
p = B
s 2
(reta de isolucro zero se baixo risco)
s 3
-
B
Na Figura 8.4 abaixo representamos o equilbrio no caso em que a seguradora consegue iden-
tificar o tipo do consumidor (ou seja, na ausencia do problema de informacao) e o mercado de
seguros e competitivo. A solucao de first-best e eficiente e caracterizada por ambos os tipos
adquirindo seguro total (B = L) ao preco justo relativo ao seu tipo (p = L, se alto risco;
p = L, se baixo risco).
p
6
Figura 8.4
45 graus
p = B
c
uh
s c
h = (L, L)
p = B
c
s ul
c
= (L, L)
l
-
L B
Observe que as estrategias lc = (L, L) e hc = (L, L) nao farao parte de nenhum equilbrio
sequencial, pois uh (lc ) > uh (hc ), ja que B = L nesses dois contratos e L < L (pois < ).
Logo, essas estrategias violam a condicao 1. da definicao de equilbrio sequencial acima.
Lema 8.1. Seja ((l , h , ()); ()) um equilbrio sequencial qualquer. Denote por ul e uh as
utilidades de equilbrio dos consumidores de baixo risco e alto risco, respectivamente. Entao:
1. ul ul , e
2. uh uch ,
O lema acima e valido para qualquer equilbrio sequencial. Ele mostra que a utilidade dos
dois tipos de indivduo nao sera menor do que a utilidade que eles obteriam no caso em que a
seguradora acreditasse que eles sao do tipo alto. Em particular, em um equilbrio sequencial,
o tipo de risco alto nunca tera uma utilidade menor do que a que ele obteria no equilbrio
de informacao perfeita (nao podemos garantir o mesmo para o consumidor de baixo risco,
pois ul < ul (L, L), ja que < (localize na figura acima essas duas utilidades e faca a
comparacao).
Corol
ario. No equilbrio, consumidores do tipo de alto risco compram o seguro.
O corolario segue do item 2. do lema acima e do fato de que aversao ao risco implica uch >
uh (0, 0). Nao podemos garantir que o consumidor de baixo risco compra o seguro no equilbrio.
1. Mostrar que, no equilbrio, a firma aceita qualquer proposta (B, p) tal que p > B.
2. No equilbrio, vale:
A Figura 8.5 abaixo ilustra graficamente o resultado do Lema 8.1. O corolario segue de ime-
diato, ja que uch > uh (0, 0). Para o caso do consumidor de baixo risco, temos que a utilidade
de equilbro, ul sera maior ou igual do que a utilidade ul , cuja curva de indiferenca associada
esta no grafico. Na Figura 8.5, como ela foi desenhada para o caso em que T M Sl (0, 0) > ,
entao ul > ul (0, 0). Logo, podemos garantir que o indivduo de baixo risco comprara o seguro
tambem. Porem, se T M Sl (0, 0) < , entao ul ul (0, 0). Neste caso, pode ocorrer que o
indivduo decida nao adquirir seguro (nao viola o Lema 8.1, ja que ul ul (0, 0)).
p
6
Figura 8.5
45 graus
p = B
uch uh
s c
h
ul ul
p = B
s
l
-
L B
Equilbrio Separador
No equilbrio separador, cada tipo escolhe uma proposta diferente. A firma separa os tipos
observando a proposta feita. Em equilbrio, nao existe tentacao de desviar, ou seja, de enviar
o sinal do outro tipo. Entao, o tipo de alto risco nao tem incentivo para se fazer passar pelo
tipo de baixo risco (e vice-versa). O Teorema 8.1 a seguir formaliza esse ponto.
1. l 6= h = (L, L);
2. pl Bl ;
4. uch = uh (h ) uh (l ).
Esquema de Demonstrac ao: () Suponha que ((l , h , ()); ()) seja um equilbrio se-
parador. Mostrar que satisfaz os itens (1) -(4) do teorema.
() Suponha que l e h sao tais que satisfazem os itens (1) -(4) do teorema. Mostrar que exis-
tem () e () tais que ((l , h , ()); ()) seja um equilbrio sequencial. Para isso, considere
() e () tais que:
1 se (B, p) = l
(B, p) =
0 se (B, p) 6= l
Aceita, se (B, p) = l ou p B
(B, p) =
Rejeita, caso contrario
Mostrar que ((l , h , ()); ()) satisfaz as condicoes listadas na definicao de equilbrio sequen-
cial.
A Figura 8.6 abaixo ilustra as consequencias do Teorema 8.1. Nela estao marcadas possveis
estrategias de propostas (l , h ) dos consumidores que formam equilbrios separadores. Observe
que a proposta de equilbrio do tipo de alto risco e sempre igual a hc . Porem, qualquer proposta
l na area hachurada da figura constitui, com hc (e com () e () definidos na demonstracao
do Teorema 8.1), um equilbrio separador.
O Teorema 8.1 restringe a atencao a equilbrios em que as propostas dos dois tipos sao aceitas
e que consideram apenas estrategias puras (nao estamos levando em conta a possibilidade de os
consumidores randomizarem entre propostas diferentes). Se T M Sl (0, 0) , entao e possvel
mostrar que existem equilbrios em que a proposta do consumidor de baixo risco e rejeitada
em equilbrio. Porem, como argumentamos na demonstracao do Teorema 8.1, esse equilbrio
e equivalente em termos de payoffs a outro equilbrio em que todas as propostas sao aceitas.
Alem disso, e possvel mostrar que a area hachurada da figura abaixo sera sempre nao-vazia,
mesmo no caso em que T M Sl (0, 0) (para mostrar isso, usamos que T M Sl (0, 0) > ).
Por outro lado, podem existir equilbrios em que o tipo de baixo risco recebe algum seguro,
quando e possvel utilizar sinais. As propostas (hc , l ), ilustradas na figura abaixo, sao Pareto
eficientes, considerando todas as propostas que formam um equilbrio separador e geram lucro
zero para a seguradora.
Portanto, mesmo no caso em que o u nico equilbrio competitivo sob informacao assimetrica
nao prove seguro total para o tipo de baixo risco, sinalizacao pode melhorar a eficiencia, com
o tipo de baixo risco adquirindo seguro parcial.
p
6
Figura 8.6
45 graus
p = B
uc
h uh
s c
h
ul ul
p = B
s
l
-
L B
Equilbrio Agregador
O Teorema 8.2 abaixo caracteriza as propriedades que um equilbrio agregador deve satisfazer.
Neste tipo de equilbrio, o tipo de alto risco se faz passar pelo tipo de baixo risco, em certo
sentido.
Esquema de Demonstrac ao: () Suponha que (( 0 , 0 , ()); ()) seja um equilbrio agre-
gador. Entao (1) garante que a proposta sera aceita pela seguradora e (2) e consequencia do
Lema 8.1.
() Suponha que 0 = (B 0 , p0 ) satisfaz as condicoes (1) e (2) do teorema. Mostrar que existem
() e () tais que (( 0 , 0 , ()); ()) seja um equilbrio sequencial. Para isso, considere ()
e () tais que:
se (B, p) = 0
(B, p) =
0 se (B, p) 6= 0
Aceita, se (B, p) = 0 ou p B
(B, p) =
Rejeita, caso contrario
Mostrar que (( 0 , 0 , ()); ()) satisfaz as condicoes na definicao de equilbrio sequencial.
A area hachurada da Figura 8.9 abaixo ilustra o conjunto de propostas que podem fazer parte
de um equilbrio agregador, segundo o Teorema 8.2.
p
6
Figura 8.9
45 graus
p = B
uc
h uh
p=
B
!
!!
! !! ul ul
!!
!
!
p = B
!
!!
!
!
!!!
!
!
!
!
-
B
Em geral, podemos apenas afirmar que o consumidor de alto risco prefere o equilbrio agregador
ao equilbrio separador. Intuitivamente, seria de se esperar que o consumidor de baixo risco
preferisse o equilbrio separador. Porem, nem sempre isso sera verdade. Mais ainda, quanto
maior a proporcao de consumidores de baixo risco, mais provavel que um consumidor de baixo
risco prefira o equilbrio agregador ao equilbrio separador.
Nesse caso, e razoavel supor que apenas o consumidor de baixo risco faria essa proposta.
Porem, a nocao de equilbrio sequencial nao impoe nenhuma disciplina sobre crencas referentes
a propostas tais como 00 (nas demonstracoes dos Teoremas 8.1 e 8.2 usamos crencas pouco
razoaveis nesse sentido, pois se um indivduo fizesse uma proposta diferente das de equilbrio,
a crenca da firma seria de que esse indivduo e de alto risco com certeza).
p
6
Figura 8.11
45 graus
p = B
uh
0 ul
s
p=
B
s 00 p = B
-
B
Definic ao 8.3: Equilbrio Intuitivo (Cho & Kreps, 1987). O equilbrio sequencial
((l , h , ()); ()) satisfaz o criterio intuitivo se a seguinte condicao e satisfeita para toda
proposta 6= l , h :
onde ul e uh sao as utilidades de equilbrio dos consumidores de baixo e de alto risco, respec-
tivamente.
Teorema 8.3: Exist encia Equilbrio Intuitivo (Cho & Kreps, 1987). Existe um u nico
par de propostas (l , h ) que faz parte de um equilbrio sequencial que satisfaz o criterio intui-
tivo. Alem disso, o equilbrio sequencial que satisfaz o criterio intuitivo e o melhor equilbrio
separador para o consumidor de risco baixo (ou seja, l = l e h = hc , ver Figura 8.6).
A razoabilidade do criterio intuitivo indica que o equilbrio intuitivo e o resultado mais provavel
de um jogo de sinalizacao. Esse resultado pode ser melhor (no sentido de Pareto) do que o
resultado de equilbrio competitivo com informacao assimetrica. Nesse caso, sinalizacao atenua
a ineficiencia causada pela assimetria de informacao.
4 Screening
4.1 Jogo de Screening
Agora vamos supor que a companhia de seguros se move primeiro, escolhendo um menu de
contratos (uma lista de possveis contratos de seguros). A firma desenha um contrato para cada
tipo de consumidor, com o intuito de separar os tipos e diminuir a perda causada pela assimetria
de informacao. Em certos mercados screening pode ser mais comum do que sinalizacao
Vamos supor dois tipos de consumidores e duas companhias de seguro. Usando duas firmas
podemos modelar a possibilidade de que uma das firmas, dado o menu de contratos oferecido
pela outra firma, ofereca um contrato com o objetivo de roubar todos os consumidores de baixo
risco da outra firma (estrategia de cream-skimming).
Os dois tipos de consumidores sao alto e baixo risco, onde e a proporcao de consumidores de
baixo risco. Neste caso, podemos supor que cada firma oferece apenas dois tipos de contratos,
sem perda de generalidade.
A firma desenha o contrato de modo que cada tipo adquira o contrato desenhado para ele.
Mas essa decisao e do consumidor ele escolhe o contrato que deseja. As firmas se movem
simultaneamente. Logo, as duas companhias de seguro oferecem contratos ao mesmo tempo
no mercado.
Para o jogo de screening modelado acima, o u nico conjunto de informacao nao trivial e
alcancado sempre, quaisquer que sejam as estrategias dos jogadores. Nesse caso, podemos
usar o conceito de equilbrio de Nash perfeito em subjogos (ENPS). Assim como no modelo de
sinalizacao, existem dois tipos de equilbrio: agregador e separador. Observe que, segundo a
definicao a seguir, em um equilbrio agregador os dois tipos de consumidores adquirem o mesmo
contrato. Porem, eles podem adquirir esse contrato de companhias de seguro diferentes.
Lema 8.2. Ambas as companhias de seguro recebem lucro esperado zero em todo equilbrio
perfeito em subjogos em estrategias puras.
Ideia da prova: Basta mostrar que nenhuma das firmas tem lucro esperado positivo. Provar
por contradicao, analisando os dois casos de equilbrio possveis, agregador e separador.
Equilbrio Agregador
O resultado abaixo e tpico em modelos de competicao com screening, onde as firmas competem
por consumidores oferecendo simultaneamente um menu de contratos. O efeito de cream-
skimming elimina a existencia de equilbrios agregadores.
Teorema 8.4. Nao existe nenhum equilbrio agregador em estrategias puras para o jogo de
screening.
Ideia da Prova: Por contradicao, usar o Lema 8.2. Observe que a competicao entre as firmas
e fundamental para obtermos esse resultado.
Equilbrio Separador
O resultado abaixo mostra que a natureza competitiva do modelo afeta tambem o conjunto de
equilbrios separadores. A competicao entre as duas firmas nesse caso elimina todos contratos
que fazem parte de equilbrios sequenciais no modelo de sinalizacao. O u nico equilbrio sepa-
rador do modelo de screening coincide com o equilbrio intuitivo do modelo de sinalizacao (o
equilbrio sequencial separador que prove o maximo de utilidade para o consumidor de baixo
risco).
O Teorema 8.5 apenas caracteriza qual sera o equilbrio separador no jogo de screening, caso ele
exista. Usando o Teorema 8.4, podemos garantir que se um ENPS em estrategias puras existir,
entao ele e separador e os contratos sao u
nicos para cada tipo de jogador (sempre existira
ENPS em estrategias comportamentais).
Porem, pode ocorrer que nao exista nenhum equilbrio em estrategias puras. Isso pode acontecer
se for suficientemente proximo de 1 (proporcao de consumidores de alto risco e baixa).
5 Perigo Moral
5.1 Introdu
c
ao
Perigo moral esta presente em transacoes onde uma da partes (principal) nao consegue moni-
torar as acoes da outra parte, e essas acoes sao relevantes para a transacao negociada.
Exemplo: Seguro de automoveis: motorista pode deixar de tomar cuidado com o carro apos
adquirir o seguro. Esse comportamento afeta o resultado do contrato (a probabilidade de o
carro ser roubado pode aumentar, por exemplo) e nao e possvel (ou e muito custoso) a` firma
observar esse comportamento.
O agente toma uma acao que afeta a sua utilidade e a utilidade do principal. O principal nao
observa a acao tomada, apenas o resultado da acao. Quando a acao que o agente escolhe espon-
taneamente nao e Pareto-otima (o que o principal gostaria), dizemos que existe um problema
de perigo moral.
Exemplos:
Firma e Empregado esforco vs producao;
Acionistas e Gerentes;
Servicos Medico e Paciente, Advogado e Cliente;
Fazendeiros e Arrendatarios (sharecropping decision);
Seguros seguro contra roubo, seguro contra incendio, seguros em geral de proprieda-
des/bens.
First-Best: caso em que o principal observa a acao do agente, de modo que e possvel
implementar a acao otima diretamente.
Divisao otima de risco (optimal risk sharing): principal fornece um seguro total para o agente
(por exemplo, salario fixo para o agente) e com isso assume todo o risco da atividade produtiva.
A divisao otima de risco nem sempre e possvel quando existe problema de perigo moral, pois
o agente pode nao escolher a acao desejada pelo principal.
5.2 Modelo
Suponha um consumidor e uma companhia de seguros. Consumidor deseja comprar um seguro
contra acidentes. A probabilidade de sofrer um acidente depende do cuidado (esforco) que o
consumidor tem ao dirigir.
Vamos supor apenas dois nveis de esforco para o consumidor, e = 0 (pouco esforco) ou e = 1
(muito esforco). A companhia de seguros deve desenhar um esquema de incentivos de modo
que o consumidor escolha por si mesmo o nvel de esforco desejado pela firma.
Vamos supor tambem que o consumidor possui uma utilidade u estritamente crescente e estri-
tamente concava sobre riqueza w e que a riqueza inicial e maior do que L. Alem disso, d(e)
denota a desutilidade do nvel de esforco e. Logo, a utilidade e separavel: u() d(e), onde
d(1) > d(0).
A companhia de seguro observa a perda l ocorrida, mas nao o nvel de esforco do consumidor.
Logo, o benefcio pago pode depender apenas da perda ocorrida. Um contrato e represen-
tado entao por (p, B0 , B1 , . . . , BL ), onde p e o preco do contrato de seguro que paga Bl se o
consumidor sofre um acidente com perda l.
Hip
otese 8.1: Monotone Likelihood Ratio Condition (MLRC). A razao
l (0)
l (1)
e estritamente crescente em l, l = 0, 1, 2, . . . , L.
Quais sao os contratos oferecidos pela seguradora? Quais sao as propriedades de eficiencia
desses contratos?
5.3 Informa
cao Sim
etrica
Vamos supor que o principal observa o nvel de esforco do agente. Logo, o principal pode
implementar diretamente a acao que deseja. Ou seja, o contrato e diretamente condicionado
ao nvel de esforco desejado pela firma. Nesse caso, nao existe problema de informacao as
acoes do consumidor sao observadas sem custo pela companhia de seguros.
O problema da firma e:
L
X L
X
max p l (e)Bl s.a. l (e)u(w p l + Bl ) d(e) u ,
e,p,B0 ,...,BL
l=0 l=0
Vamos encontrar a solucao resolvendo as CPOs. As CSOs sao validas, pois este e um problema
de maximizacao onde a funcao objetivo e linear e as restricoes sao concavas.
A primeira CPO e redundante, pois e consequencia das L + 1 CPOs em (3). Temos entao
um sistema de no maximo L + 2 equacoes independentes, onde precisamos encontrar L + 3
variaveis.
u(w p l Bl ) = d(e) + u , l 0.
u(w p) = d(e) + u ,
Portanto, no caso de informacao perfeita, o contrato otimo prove seguro total para o agente,
qualquer que seja a acao que o principal deseje implementar (a utilidade do indivduo nao varia
permanece constante em todos os estados da natureza).
O preco cobrado pela firma de seguros iguala a utilidade obtida com o contrato com a utilidade
reserva do consumidor, calculada no nvel de esforco relevante. Esse resultado e esperado: a
firma e neutra ao risco e o consumidor e avesso ao risco, logo obtemos uma divisao otima de
risco, em que a firma arca com todo o risco.
Para a firma, ao decidir o nvel otimo de esforco que deseja implementar, temos que, dado
e = 0, 1, o preco otimo em funcao de e e encontrado resolvendo a equacao:
Como d(0) < d(1), exigir e = 0 permite `a firma cobrar um preco mais alto, o que aumenta o
lucro esperado (restricao de participacao). Por outro lado, exigir e = 1 reduz a probabilidade
esperada de perda (MLRC) e, portanto, tambem aumenta os lucros.
A acao otima para o principal depende do caso em questao. Se for a acao menos custosa para
o agente, e estivermos em uma situacao de perigo moral, nao ha conflito de interesses entre o
principal e o agente e, portanto, nao ocorre perda de eficiencia.
5.4 Informa
cao Assim
etrica
Agora vamos supor que a escolha do nvel de esforco do consumidor nao e observada pela
companhia de seguro, que deve entao desenhar um contrato que implicitamente induza o con-
sumidor a escolher o nvel de esforco que a firma deseja implementar.
Para isso, uma nova restricao deve ser adicionada ao problema da firma. Essa restricao, cha-
mada restricao de incentivos (ou restricao de compatibilidade de incentivos), assegura que o
consumidor escolhera de fato a acao desejada pela firma.
A restricao de incentivos garante que o nvel de esforco desejado pela firma seja de fato o nvel
de esforco escolhido pelo consumidor no contrato otimo.
Novamente, vamos resolver o problema da firma para cada nvel de esforco e depois encontrar
o nvel de esforco otimo.
Poltica Otima para e = 0
Suponha que a seguradora queira induzir o agente a escolher o nvel baixo de esforco (e = 0).
Entre todas as polticas possveis que implementam e = 0, qual a melhor para a firma? Nesse
caso, a firma deve apenas pagar um salario que garanta a participacao do agente. Nao e
necessario se preocupar com a restricao de incentivos.
Vimos que a solucao otima p, B0 , . . . , BL para o problema com informacao perfeita (i.e., sem
considerar a restricao de incentivos) quando e = 0 e Bl = l e o preco otimo e encontrado
resolvendo a equacao u(w p) = d(0) u.
Substituindo a solucao acima na restricao de incentivos, com e = 0, ela se reduz a d(0) d(1),
que e valido por hipotese. Logo, para induzir o consumidor a escolher o nvel de esforco mnimo,
a firma nao precisa adotar nenhum esquema de incentivos especial, basta selecionar o mesmo
contrato otimo usado no caso onde nao existe problema de informacao.
Poltica Otima para e = 1
Suponha agora que a seguradora queira induzir o agente a escolher o nvel alto de esforco
(e = 1). Entre todas as polticas possveis que implementam e = 1, qual a melhor para a
firma?
Observe que a poltica otima de first-best, que prove seguro total para o agente, nao satisfaz
a restricao de incentivos nesse caso. Intuitivamente, se seguro total e oferecido, o agente ira
escolher o menor nvel de esforco. Portanto, para que o principal consiga implementar e = 1,
o contrato nao pode fornecer seguro total para todos os nVeis de perda.
Logo w p l + Bl e constante para todo l. Nesse caso, a CPO para (restricao de incentivos)
se reduz a d(0) d(1), que e negativo, um absurdo. Logo 6= 0.
Observe agora que a MLRC implica que existe l tal que l (0)/l (1) e diferente de 1. Mais
ainda, vamos mostrar que existem l e l tais que:
l (0) (0)
<1< l
l (1) l (1)
Suponha que nao. Ou seja, suponha que para todo l, l (0)/l (1) 1, com algum l em que a
desigualdade e estrita (o outro caso e similar). Mas entao temos que:
l (0)
1 l l (0) l (1) l ,
l (1)
com pelo menos um l em que a desigualdade e estrita. Somando a u
ltima desigualdade para
todo l, temos que: X X
l (0) > l (1) = 1 ,
l l
P
um absurdo, pois l l (0) = 1.
Como e sao positivos, o lado direito da equacao (6) e estritamente decrescente em l, pela
MLRC. Mas isso significa que u0 (w p + Bl l) e estritamente crescente em Bl l. Como u0 e
decrescente (o agente e avesso ao risco, u00 () < 0), entao Bl l e estritamente decrescente em
l. Portanto, o contrato otimo e tal que:
l Bl e estritamente crescente em l.
Como normalizamos Bl = 0, temos que o contrato otimo para e = 1 nao prove seguro total
para o consumidor. Pelo contrario, ele especifica que o consumidor assuma parte da perda, e
que o valor dessa parte da perda assumida pelo consumidor aumente com o tamanho da perda
(pode ser que em termos percentuais seja igual: o consumidor arca sempre com 10% do valor
da perda. Claramente, quanto maior a perda, maior sera o valor assumido pelo consumidor
neste caso).
O consumidor deve entao arcar com parte do risco, para que ele de fato se esforce. Se l Bl e
crescente, temos que a MLRC implica que:
L
X
(l (1) l (0))u(w p l + Bl ) > 0
l=0
Evidentemente, no contrato otimo, esse ganho e igual ao custo em se esforcar muito, dado por:
de tal modo que a restricao de incentivos seja satisfeita. No contrato otimo, o benefcio lquido
de se esforcar muito se iguala ao custo lquido desse esforco.
Para determinarmos a solucao que o principal implementa, verificamos qual o nvel de esforco
que maximiza o seu lucro esperado.
Se no caso de informacao perfeita o nvel de esforco otimo e baixo, entao o contrato otimo nesse
caso sera tambem o contrato otimo para o caso de informacao assimetrica.
Porem, se no caso de informacao perfeita o nvel de esforco otimo e alto, entao pode ocorrer
que para o caso de informacao assimetrica a firma decida implementar o nvel baixo de esforco.
Isso ocorrera se for muito dispendioso para a firma induzir o consumidor, por meio do contrato,
a se esforcar muito.
Nesse caso, temos uma situacao claramente ineficiente a utilidade do consumidor continua
igual a sua utilidade reserva, porem a firma obtem lucro menor do que obteria na situacao de
informacao simetrica, pois implementa o nVel de esforco sub-otimo e = 0.
Finalmente, se no caso de informacao perfeita o nvel de esforco otimo e alto, e tambem para
o caso de informacao assimetrica a firma decida implementar o nvel alto de esforco, temos
mais uma vez uma situacao claramente ineficiente a utilidade do consumidor continua igual
a sua utilidade reserva, porem ele nao obtem seguro total (ou seja, nao ocorre divisao otima de
riscos) e a firma obtem lucro menor do que obteria na situacao de informacao simetrica, pois
precisa induzir o agente a se esforcar (implementar e = 1 via a restricao de incentivos).
Refer
encias
Akerlof, G. A. (1970). The market for lemons: Quality uncertainty and the market mecha-
nism. The Quarterly Journal of Economics, 84:3 , 488-500.
Cho, I., & Kreps, D. (1987). Signaling games and stable equilibria. Quaterly Journal of
Economics, 102:2 , 179-221.
Salanie, B. (2005). The economics of contracts: a primer (2nd edition). Cambridge, MA: The
MIT Press.
Spence, M. (1973). Job market signaling. The Quarterly Journal of Economics, 87:3 , 355-374.
Desenho de Mecanismos
1 Introduc
ao
Desenho de mecanismo e o estudo de regras institucionais de um jogo com o objetivo de alcancar
certo resultado, levando-se em conta que os agentes participantes do jogo estao interessados
apenas em maximizar a sua utilidade, no caso em que essa utilidade nao seja de conhecimento
comum.
Por exemplo, em um leilao, o leiloeiro tem uma ideia do valor do objeto e do valor que os
participantes dao ao objeto sendo leiloado, mas nao conhece esses valores com certeza. O
objetivo e desenhar uma estrutura de incentivos que leve os agentes a se comportarem de uma
maneira desejavel. No caso de leiloes, o objetivo e desenhar um tipo de leilao que maximize o
lucro (ou a receita) do leiloeiro.
Mecanismos de revelacao direta (ou compatveis de incentivo) sao mecanismos em que os agen-
tes revelam corretamente a informacao privada que possuem (no exemplo de leiloes, que o lance
dado revele verdadeiramente o valor que o indivduo da ao objeto; no exemplo de votacao, que
o sistema de votacao adotado leve os participantes a votarem de acordo com a sua preferencia
verdadeira entre as alternativas sob escolha). O princpio da revelacao garante que para qual-
quer mecanismo geral de informacao existe um mecanismo direto onde os agentes revelam
corretamente a informacao que possuem.
2 Teoria de Leil
oes
Um indivduo, chamado leiloeiro, quer vender um u nico bem indivisvel para N possveis com-
pradores, pelo maior preco possvel. A demanda pelo bem nao e conhecida, o leiloeiro conhece
apenas certas caractersticas dos possveis compradores do bem.
Leil ao: forma de venda onde todos os interessados podem participar na compra do bem. Um
leilao e uma forma de transacionar bens por meio de lances. Lances sao feitos pelo objeto que
esta sendo leiloado. Ganha o leilao quem der o lance vencedor.
Existem diversos tipos de leilao. Analisaremos quatro desses possveis tipos. Queremos saber
qual desses tipos e o melhor para o leiloeiro no sentido de gerar a maior receita esperada (receita
ex-ante).
Leilao Holandes (ou de preco descendente): Vendedor anuncia um preco alto que vai
sendo reduzido ate que alguem se ofereca para comprar o objeto, pagando o u
ltimo preco
anunciado.
Leilao Ingles (ou de preco ascendente): Vendedor anuncia um preco baixo (pode ser zero)
e vai aumentando. Os participantes sinalizam quando desejam abandonar o leilao. Uma
vez fora do leilao, nao e mais possvel voltar. Quando restar apenas um participante, ele
e o vencedor e paga o preco corrente.
Sera que e possvel determinarmos qual destes leiloes e melhor para o vendedor do objeto, no
sentido de gerar a maior receita esperada? Mais ainda, sera possvel classificar esses leiloes em
termos de receita esperada gerada?
Observe que estamos preocupados em maximizar a receita esperada, ou seja, a receita ex-ante,
antes de o leilao ocorrer. Uma vez que o leilao ocorra, o vendedor obtera uma receita ex-post,
que quase sempre sera diferente da receita esperada, ja que o leiloeiro nao conhece a valoracao
dada ao objeto por cada participante, mas apenas assume uma certa distribuicao de valores
possveis, como veremos. Como a receita ex-post e obtida pela realizacao de uma variavel
incerta pelo leiloeiro, nao faz sentido falar em maximizacao da receita ex-post: cada um desses
leiloes pode ter uma receita ex-post diferente, mas isso evidentemente nao deve ser usado para
dizer que um tipo de leilao gera mais receita do que outro.
Assuma que existam N participantes do leilao, onde vi indica o valor do objeto a ser leiloado
para o indivduo i. Esse valor e conhecido apenas pelo indivduo i. Outros participantes
sabem apenas que vi possui uma distribuicao em [0, 1], descrita por uma funcao de distribuicao
acumulada Fi (vi ) com funcao de densidade fi (vi ).
Todos os participantes do leilao sao neutros ao risco. Se i ganha o leilao, seu payoff e vi p,
onde vi e o valor que i atribui ao objeto e p e o preco pago. Se i nao ganha o leilao, vamos
supor que o seu payoff e zero, para todos os tipos de leilao descritos acima (perder o leilao nao
gera desutilidade). Se ocorrer um empate, o objeto e sorteado entre os vencedores (onde cada
vencedor tem a mesma probabilidade de levar o objeto).
Vamos supor que os valores vi sao mutualmente independentes, ou seja, a informacao privada
de i e independente da informacao privada dos outros participantes. Logo, o indivduo i nao
obtem nenhuma informacao relevante a respeito do seu valor vi observando a valoracao dos
outros indivduos (a informacao privada do indivduo i e suficiente para ele determinar o valor
que atribui ao objeto).
Observe que as hipoteses assumidas no modelo de leilao com valores independentes e privados
sao fortes e podem nao ser validas em uma serie de situacoes. Por exemplo, se a Petrobras
leiloar um campo para exploracao de petroleo, conhecer a valoracao dos outros participantes
pode dar uma ideia melhor do valor do campo e, portanto, afetar a valoracao individual de um
participante. Neste caso, a hipotese de valores privados nao e adequada.
2.2 Lance
otimo
Vamos analisar qual deve ser o lance otimo de um participante tpico do leilao, para cada um
dos quatro leiloes descritos acima.
2.2.1 FPSB
Vamos supor que fi (v) = f (v), para todo v [0, 1], para todo i = 1, . . . , N . Logo, estamos
adicionando `a hipotese de independencia a hipotese de distribuicoes identicas.
A estrategia de i e dar um lance (bid ) em funcao do valor que atribui ao objeto. Vamos de-
notar por bi : [0, 1] R+ essa funcao-lance. Logicamente, i conhece a sua valoracao do objeto,
mas para encontrarmos o equilbrio, precisamos levar em conta que os outros particpantes nao
conhecem a valoracao de i. Podemos imaginar a funcao bi como informando o lance que deve
ser dado pelo jogador i antes de ele conhecer a sua valoracao.
Vamos restringir a nossa procura por equilbrios com funcoes-lance estritamente crescentes:
uma valoracao maior leva a um lance maior, o que intuitivamente faz sentido, mas nao neces-
sariamente precisa valer em geral (podem existir equilbrios em que para uma regiao de valores
v a funcao lance de equilbrio seja constante, por exemplo).
Como estamos supondo que fi (v) = f (v), vamos procurar um equilbrio simetrico, descrito por
b : [0, 1] R+ estritamente crescente e igual para todo indivduo i. A funcao b diz o lance
otimo para um indivduo, dado que todos os outros participantes do leilao estao dando lances
segundo b.
Teorema 9.1. Se N participantes possuem valores privados independentes gerados por uma
distribuicao F em um leilao de primeiro preco, entao o lance:
Z v
b(v) = 1
x dF N 1 (x) ,
F N 1 (v) 0
quando o participante valora o objeto em v e um equilbrio de Nash simetrico do leilao de
FPSB. Mais ainda, este e o u
nico equilbrio de Nash simetrico.
Demonstrac ao. Vamos denotar por b() a funcao lance otima e u(r, v) a utilidade de o
indivduo i do tipo v dar o lance otimo caso a sua valoracao fosse r. Suponha que se i nao
ganhar o leilao, sua utilidade sera zero. Logo,
u(r, v) = prob(b(r) > b(vj ) , j 6= i) v b(r) + prob(b(r) < b(vj ) , para algum j 6= i) 0
= prob(r > vj , j 6= i) v b(r)
= F N 1 (r) (v b(r)) ,
onde a segunda igualdade segue de b() ser estritamente crescente e a terceira igualdade segue
de: Y Y
prob(r > vj , j 6= i) = prob(r > vj ) = F (r) = (F (r))N 1 ,
j6=i j6=i
du(r, v)
= (N 1)F N 2 (r)f (r)(v b(r)) F N 1 (r)b0 (r)
dr
A CPO sera valida em r = v (ver Exerccio 9.3), o que resulta na seguinte CPO:
Essa CPO define uma equacao diferencial. Essa equacao pode ser reescrita como:
Observe que o lado esquerdo da igualdade acima e igual a` derivada de F N 1 (v)b(v) com relacao
a v. Logo:
dF N 1 (v)b(v)
= (N 1)F N 2 (v)f (v)v
dv
Como essa igualdade deve ser valida para todo v, integrando com relacao a v, obtemos:
Z v
F N 1
(v)b(v) = (N 1) xf (x)F N 2 (x)dx + C ,
0
onde C e a constante de integracao. Assumindo que b(0) = 0 (ou seja, se o valor for zero, o
indivduo da lance igual a zero), obtemos que C = 0. Entao:
Z v Z v
b(v) = (N 1) xf (x)F N 2 1
(x)dx = N 1 x dF N 1 (x) .
F N 1 (v) 0 F (v) 0
possvel mostrar que a solucao acima para b() e estritamente crescente em v (Exerccio 9.1).
E
Alem disso, temos que ela e u nica, considerando apenas solucoes estritamente crescentes para
equilbrios simetricos (e possvel mostrar que nao existem equilbrios assimetricos, dadas as
hipoteses feitas). Note que para concluirmos que a estrategia b(v) encontrada acima define de
fato um equilbrio de Nash, precisamos mostrar que u(r, v) calculada levando em conta b(v) e
maximizada quando r = v (ver Exerccio 9.3).
Exemplo 9.1. Suponha que vi = v e distribudo uniformemente em [0, 1]. Nesse caso, F (v) = v
e f (v) = 1. Se existem N participantes, a funcao-lance de equilbrio e:
Z v Z v
b(v) = 1 xdx N 1 1
= N 1 x(N 1)xN 2 dx
v N 1 0 v 0
N 1 v N 1
N 1 1 n
Z
1 v
= N 1 x dx = N 1 v = 1 v=v .
v 0 v N N N
Portanto, o lance de equilbrio e menor que o valor do objeto para o indivduo. Quanto mais
participantes no leilao, maior e mais proximo o lance de equilbrio do valor do objeto. Se
houverem apenas dois participantes, entao cada um deles ira dar um lance igual `a metade do
valor que atribui ao objeto leiloado (b(v) = v/2).
2.2.2 Leil
ao Holand
es
Em um leilao holandes, cada participante deve decidir em que momento levantar a mao para
sinalizar que comprara o objeto ao preco anunciado, lembrando que ate alguem levantar a mao,
o leiloeiro vai diminuindo o valor que devera ser pago pelo objeto.
Temos entao que o participante que levanta a mao primeiro, ou seja, que escolhe o preco mais
alto, ganha o leilao e paga este u
ltimo preco anunciado. Portanto, se tomarmos levantar a
mao por lance, vemos que o leilao holandes e equivalente ao leilao de primeiro preco.
Isso justifica o resultado abaixo, similar ao resultado para leilao de primeiro preco, ser valido
para o leilao holandes. Os dois tipos de leilao geram a mesma receita ex-ante e ex-post para o
leiloeiro.
Teorema 9.2. Se N participantes possuem valores privados e independentes gerados por uma
distribuicao F , entao o participante que valora o objeto em v levantar a mao quando o preco
do objeto leiloado alcancar: Z v
1
N 1
x dF N 1 (x)
F (v) 0
constitui um equilbrio de Nash simetrico do leilao holandes. Mais ainda, este e o u
nico
equilbrio de Nash simetrico.
2.2.3 Leil
ao de Vickrey (Leil
ao de SPSB)
O leilao de segundo preco induz os participantes a darem lances mais altos, ja que o valor pago
caso venca o leilao e o segundo maior lance e nao o primeiro maior lance, como no leilao de
FPSB. Logo, e razoavel imaginar que os participantes desse tipo de leilao se comportem de
modo diferente do que se comportariam em um leilao FPSB. A priori, nao podemos afirmar
qual tipo de leilao gera uma receita esperada maior (ex post, as receitas quase sempre serao
diferentes, ver Exemplo A1 abaixo). O Teorema 9.3 abaixo descreve o comportamento otimo
dos participantes de um leilao de segundo preco.
Demonstrac ao: A ideia consiste em mostrar que se um participante qualquer der um lance
de valor diferente da sua valoracao sera sempre fracamente dominado por dar um lance igual
a sua valoracao. Fixe o indivduo i e denote por B = max{bj | j 6= i}. Mostre que bi (vi ) = vi
e a (
unica) estrategia fracamente dominante do jogo para qualquer jogador i. Logo, cada
participante dar lance igual a` sua valoracao constitui um equilbrio de Nash em estrategias
fracamente dominantes.
2.2.4 Leil
ao Ingl
es
Para determinarmos o comportamento otimo de um participante em um leilao ingles, basta
notar que, para um participante qualquer, sair do leilao quando o preco alcanca a sua valoracao
e uma estrategia fracamente dominante.
Mais ainda, como o vencedor do leilao ingles e o participante com maior valor associado ao
objeto leiloado, e o preco que sera pago e o que faz o participante com a segunda maior valoracao
abandonar o leilao, entao o leilao ingles gera a mesma receita ex-post que o leilao de segundo
preco (e, logicamente, a mesma receita esperada).
2.3 Compara
c
ao de Receita
Os leiloes de primeiro-preco e holandes geram a mesma receita ex-post. E os leiloes de Vickrey
e ingles tambem geram a mesma receita ex-post. Portanto, temos que comparar apenas as
receitas geradas pelos leiloes de primeiro e de segundo preco. Eles irao, quase sempre, gerar
receitas ex-post diferentes.
Exemplo A1: Considere o set-up do Exemplo 9.1, com dois jogadores. Suponha as seguintes
duas realizacoes de valores para os jogadores:
1. v1 = 0, 9 e v2 = 0, 1. Neste caso, a receita ex-post do leilao de primeiro preco, assumindo
que os jogadores escolhem as estrategias de equilbrio, e 0, 45, e a receita ex-post do leilao
de segundo preco e 0, 1.
2. v1 = 0, 9 e v2 = 0, 7. Neste caso, a receita ex-post do leilao de primeiro preco, assumindo
que os jogadores escolhem as estrategias de equilbrio, e 0, 45, e a receita ex-post do leilao
de segundo preco e 0, 7.
Logo, o exemplo mostra que as receitas ex-post destes dois tipos de leilao nao podem ser
ordenadas: em 1., o leilao de primeiro preco realiza uma receita maior; em 2., o leilao de
segundo preco realiza uma receita maior.
Vamos entao comparar as receitas ex-ante geradas pelos leilao de primeiro e de segundo preco.
Queremos analisar qual desses dois leiloes gera a maior receita esperada. Intuitivamente, como
no leilao de primeiro preco, o maior lance vence, e o vencedor paga o maior lance, enquanto no
leilao de segundo preco o maior lance vence, mas o vencedor paga apenas o valor do segundo
maior lance, poderamos pensar que o leilao de primeiro preco gera uma receita esperada maior.
Isso nao necessariamente ocorre, pois no leilao de segundo preco e razoavel assumir que os
participantes se comportarao de modo diferente de como se comportariam em um leilao de
primeiro preco (vimos que o lance de equilbrio no leilao de segundo preco e maior do que no de
primeiro preco, no contexto do Exemplo 9.1). O desenho do leilao de segundo preco induz os
participantes a darem lances maiores, ja que eles irao pagar apenas o valor do segundo maior
lance.
Portanto, nao e claro qual dos dois tipos de leilao ira gerar a maior receita esperada para o
leiloeiro. Usando as funcoes lance otimas encontradas acima para esses dois tipos de leilao,
iremos mostrar que, sob a hipotese de participantes neutros ao risco e com valores privados e
independentes, a receita esperada dos dois leiloes sera igual. Esse resultado sera generalizado
no Teorema de Equivalencia de Receita (Teorema 9.6).
Vamos supor que fi (v) = f (v), para todo v [0, 1], para todo i = 1, . . . , N , ou seja, todas as
distribuicoes sao identicas.
O lance e definido pela funcao b. Como a distribuicao dos valores e independente e dada por
F , a probabilidade do maior lance ser menor que v e:
P (max(V1 , . . . , VN ) v) = P (max(V, . . . , V ) v) = P (V v, . . . , V v) = [P (V v)]N = F N (v)
Portanto, a variavel aleatoria (v.a.) definida por M = max(V1 , . . . , VN ), onde cada v.a. Vi tem
distribuicao acumulada F e densidade f , possui distribuicao acumulada dada por FM (v) =
F N (v) e densidade dada por fM (v) = N F N 1 (v)f (v). Vamos denotar por RF P A a receita
esperada do leilao de primeiro preco. Temos entao que:
Z 1 Z 1
RF P A =
b(v)fM (v) dv = b(v)N F N 1 (v)f (v) dv
0 0
Vamos agora calcular a receita esperada para o leilao de segundo preco. Denote por X a
v.a. definida pelo segundo maior lance. Vamos identificar a funcao de densidade dessa v.a.
Para isso, e mais facil tratar a funcao de densidade como uma probabilidade. Suponha que o
indivduo i deu o segundo maior lance, com valor v. Entao um dos N 1 participantes restantes
deu um lance maior do que i e todos os outros N 2 participantes deram lance menor do que
i. A probabilidade entao de que i de um lance igual a v e de que esse lance seja o segundo
maior lance e:
f (v)(N 1)F N 2 (v)(1 F (v))
Como existem N indivduos que podem estar nessa situacao, a funcao de densidade fX associ-
ada a v.a. X e:
fX (v) = N (N 1)F N 2 (v)(1 F (v))f (v)
Vamos denotar por RSP A a receita esperada do leilao de segundo preco. Temos entao que:
Z 1 Z 1
RSP A = b(v)fX (v) dv = N (N 1) vF N 2 (v)f (v)(1 F (v)) dv .
0 0
Substituindo na receita esperada do leilao de primeiro preco o lance otimo descrito no Teorema
9.1 que foi encontrado para este tipo de leilao, obtemos:
Z 1 Z v
1 N 1
RF P A = N N 1 (v)
x dF (x) f (v)F N 1 (v) dv
0 F 0
Z 1 Z v
N 2
= N (N 1) xF (x)f (x) dx f (v) dv
0 0
Z 1 Z v
N 2
= N (N 1) xF (x)f (x)f (v) dx dv
0 0
Vamos usar os colchetes de Iverson para invertermos a ordem de integracao da u ltima integral
N 2
dupla na expressao acima, onde g(x, v) = xF (x)f (x)f (v):
Z 1 Z v Z 1 Z v Z Z v
g(x, v) dx dv = dv dx g(x, v) = dv dx [0 v 1] g(x, v)
0 0 0 0 0
ZZ Z Z 1
= dx dv [0 x v 1] g(x, v) = dx dv [0 x 1] g(x, v)
x
Z 1 Z 1 Z 1 Z 1
= dx dv g(x, v) = g(x, v) dv dx
0 x 0 x
Portanto:
Z 1 Z v
N 2
RF P A = N (N 1) xF
(x)f (x)f (v) dx dv
0 0
Z 1 Z 1
N 2
= N (N 1) xF (x)f (x)f (v) dv dx
0 x
Z 1 Z 1
N 2
= N (N 1) xF (x)f (x) f (v) dv dx
0 x
Z 1
= N (N 1) xF N 2 (x)f (x)(1 F (x)) dx = RSP A
0
Isso mostra que as receitas esperadas dos dois tipos de leiloes, leilao de primeiro preco e leilao
de segundo preco, sao iguais. Logo, para o leiloeiro, ex-ante, tanto faz se o leilao for do tipo
de primeiro ou de segundo preco, em termos de receita esperada.
Exemplo 9.2. Suponha que vi = v e distribudo uniformemente em [0, 1]. Nesse caso, F (v) = v
e f (v) = 1. A receita esperada gerada em um leilao de primeiro preco e:
Z 1 Z 1h Z 1
b(v)N F N 1 v i
N 1 1 N 1
RF P A = (v)f (v) dv = N v v dv = N 1 v N dv =
0 0 N N 0 N +1
3 Teorema de Equival
encia de Receita
3.1 Mecanismo de Venda Direta
Vamos usar um modelo de Myerson (1981) que permite analisar todos os leiloes vistos acima
(e outros) sob uma mesma estrutura. O conceito abaixo e fundamental para isso.
p1 (v1 , . . . , vN ), . . . , pN (v1 , . . . , vN ) ,
e de N funcoes de custo:
c1 (v1 , . . . , vN ), . . . , cN (v1 , . . . , vN ).
Para cada i e cada vetor de valoracoes (v1 , . . . , vN ) reportados simultaneamente pelos partici-
pantes do leilao, pi (v1 , . . . , vN ) [0, 1] e a probabilidade de i de receber o objeto e ci (v1 , . . . , vN )
R e o pagamento que i deve fazer ao leiloeiro. Vamos supor que, para todo (v1 , . . . , vn ),
N
X
pi (v1 , . . . , vN ) 1 .
i=1
Se a soma das probabilidades for menor do que um, entao existe uma probabilidade de que o
objeto nao seja vendido, isto e, permaneca em poder do vendedor.
Note que nada impede que as funcoes custo assumam valores negativos (neste caso, o ven-
dedor do bem estaria pagando um valor ao participante do leilao), ou que as funcoes custo
tenham valor positivo mesmo quando o comprador nao tenha chance de ganhar o objeto (se a
probabilidade do participante de ganhar o objeto for zero).
Vamos agora analisar um tipo especial de mecanismo de venda direta, que induz os partici-
pantes a revelarem a sua valoracao verdadeira do objeto leiloado. O princpio da revelac
ao,
um resultado fundamental em desenho de mecanismos, mostra que, qualquer que seja o meca-
nismo desenhado pelo vendedor, e possvel encontrar um mecanismo de revelacao verdadeira
(tambem chamado mecanismo compatvel de incentivo). Ou seja, podemos restringir a analise
a mecanismos compatveis de incentivo.
onde fi (vi ) = f (v1 ) . . . f (vi1 )f (vi+1 ) . . . f (vN ) e dvi = dv1 . . . dvi1 dvi+1 . . . dvN .
onde:
Z 1 Z 1
pi (ri ) = ... pi (ri , vi )fi (vi )dvi , e
0 0
Z 1 Z 1
ci (ri ) = ... ci (ri , vi )fi (vi )dvi ,
0 0
A definicao acima deixa claro que um mecanismo de venda direta e compatvel de incentivo se
quando todos os outros participantes revelarem a sua valoracao do objeto corretamente, entao
o payoff esperado de cada jogador i e maximizado quando ele reportar o seu valor verdadeiro.
para todo i = 1, . . . , N .
O mecanismo acima gera a mesma receita ex-post que o leilao de primeiro preco, se os parti-
cipantes revelarem corretamente o valor que atribuem ao objeto. Dada a forma do mecanismo,
podemos mostrar que a estrategia de equilbrio de cada participante e revelar corretamente
o valor que atribui ao objeto leiloado (dado que os outros participantes estao revelando cor-
retamente os seus valores). Logo, construmos um mecanismo de venda direta compatvel de
incentivo equivalente ao leilao de primeiro preco.
Podemos fazer o mesmo para os outros tipos de leilao: para cada um deles, podemos encontrar
um mecanismo de venda direta compatvel de incentivo equivalente (isto e, que leve ao mesmo
vencedor e a` mesma receita ex-post). Portanto, podemos estudar os quatro tipos de leilao
analisando os mecanismos de venda direta equivalentes a eles. Faremos isso agora.
3.3 Caracteriza
c
ao dos Mecanismos Compatveis de Incentivo
Seja um mecanismo de venda direta compatvel de incentivo dado por pi () e ci (), para todo i.
Como o mecanismo e compatvel de incentivo, a estrategia otima de i e revelar corretamente a
sua valoracao do objeto, dado que todos os outros interessados estao revelando corretamente
as suas valoracoes.
Logo, um mecanismo e compatvel de incentivo se, e somente se, para todo vi , ui (vi , vi )
ui (ri , vi ), para todo i. O teorema abaixo caracteriza completamente um mecanismo de venda
direta compatvel de incentivo.
O Teorema 9.5 mostra que todo mecanismo compatvel de incentivos deve ser tal que a pro-
babilidade de ganhar o objeto nao diminui quanto maior o valor v declarado. Alem disso, o
item (ii) do teorema mostra que todo mecanismo compatvel de incentivos deve ser tal que uma
vez definidas as funcoes de probabilidade pi () e os custos esperados quando a valoracao e nula
(
ci (0)), para todo i, estao definidos tambem os custos esperados para todas as outras valoracoes
possveis, para todos os participantes. Esse resultado e crucial para entender o Teorema de
Equivalencia de Receita.
3.4 Equival
encia de Receita
Teorema 9.6: Teorema de Equival encia de Receita. Se dois mecanismos de venda direta
compatveis de incentivo possuem as mesmas funcoes de probabilidade e todo participante cuja
valoracao e zero e indiferente entre os dois mecanismos, entao os dois mecanismos geram a
mesma receita esperada para o leiloeiro.
Demonstrac
ao: Note que a receita esperada (ER) do vendedor e:
Z 1 Z N
1X
ER = ... ci (v1 , . . . , vN )f1 (v1 ) . . . fN (vN ) dv1 . . . dvN
0 0 i=1
N Z
X 1 Z 1 Z 1
= ... ci (v1 , . . . , vN )fi (vi ) dvi fi (vi ) dvi
i=1 0 0 0
| {z }
=
ci (vi )
N Z 1
X Z vi
= ci (0) + pi (vi )vi pi (x) dx fi (vi ) dvi
i=1 0 0
XN Z 1 Z vi N
X
= pi (vi )vi pi (x) dx fi (vi ) dvi + ci (0) .
i=1 0 0 i=1
Logo, a receita gerada pelo leiloeiro depende apenas das funcoes de probabilidade pi de alocacao
do objeto e do valor que os participantes esperam pagar quando possuem valoracao nula. Como
o payoff esperado de cada participante e completamente determinado pelo seu pagamento
esperado quando o seu valor e zero, conclumos a demonstracao do teorema.
Podemos usar o teorema acima diretamente para concluirmos que as receitas esperadas dos
quatro leiloes analisados anteriormente sao iguais. Basta notar que as funcoes de probabilidade
sao iguais para os quatro leiloes: ganha o leilao quem der o maior lance (equivalentemente,
tiver a maior valoracao). Alem disso, em cada um dos quatro leiloes, se o participante tem
valoracao nula, o seu custo esperado em participar do leilao e zero.
Nos quatro tipos de leilao, o objeto e adquirido pelo participante que da maior valor ao objeto.
Logo, cada um desses leiloes e eficiente. Observe que pelo teorema de equivalencia de receita,
esses leiloes tambem possuem a mesma distribuicao de riqueza ex-ante. Ja a distribuicao de
riqueza ex-post dos leiloes de primeiro e de segundo preco sera quase sempre diferente (ver
Exemplo A1 acima).
Logo, para todo mecanismo de venda direta existe um mecanismo de venda direta compatvel
de incentivo que gera a mesma receita esperada, a mesma alocacao (probabilstica) do objeto e
os mesmos custos esperados para cada participante. O problema do vendedor resume-se entao
a encontrar o mecanismo de venda direta compatvel de incentivo que maximize a sua receita
esperada. Isso evidentemente simplifica bastante o problema, ja que podemos concentrar a
analise restrita a apenas mecanismos compatveis de incentivo.
Proposic
ao: Racionalidade Individual e Revelac ao Verdadeira. Um mecanismo de
venda direta compatvel de incentivo e individualmente racional se, e somente se, o custo
ci (0) 0, para todo i).
esperado em zero de cada participante e nao positivo (
4.4
Mecanismo de Venda Otimo
O problema do vendedor e encontrar o mecanismo de venda direta que maximiza a sua receita
esperada, sujeito aos mecanismos serem de revelacao verdadeira e a respeitarem a racionalidade
individual dos participantes. Usando os Teoremas 9.5 e 9.6, esse problema pode ser escrito
como:
N Z 1
X Z vi N
X
max pi (vi )vi pi (x) dx fi (vi ) dvi + ci (0)
(pi (),ci ())N
i=1 0 0
i=1 i=1
Proposic
ao. A receita esperada otima do do vendedor pode ser reescrita como:
Z 1 Z 1 (X N ) N
1 Fi (vi ) X
ER = ... pi (v) vi f1 (v1 ) . . . fN (vN ) dv1 . . . dvN + ci (0) ,
0 0 i=1
fi (vi ) i=1
onde v = (v1 , . . . , vN ).
XN Z 1 Z 1 Z 1
= pi (vi )vi fi (vi ) dvi pi (x)fi (vi ) dvi dx
i=1 0 0 x
XN Z 1 Z 1
= pi (vi )vi fi (vi ) dvi pi (x)(1 Fi (x)) dx
i=1 0 0
XN Z 1 Z 1
= pi (vi )vi fi (vi ) dvi pi (vi )(1 Fi (vi )) dvi
i=1 0 0
N Z 1
X 1 Fi (vi )
= pi (vi ) vi fi (vi ) dvi
i=1 0
fi (vi )
N Z 1 Z 1
X 1 Fi (vi )
= ... pi (v) vi f1 (v1 ) . . . fN (vN ) dv1 . . . dvN
i=1 0 0 fi (vi )
Z 1 Z 1 (X N )
1 Fi (vi )
= ... pi (v) vi f1 (v1 ) . . . fN (vN ) dv1 . . . dvN .
0 0 i=1
f i (v i )
Considere o termo:
Z 1 Z ( N )
1
X 1 Fi (vi )
... pi (v) vi f1 (v1 ) . . . fN (vN ) dv1 . . . dvN (1)
0 0 i=1
fi (vi )
A expressao em (1) seria maximizada se cada termo entre os parenteses fosse maximizado.
Como pi (v1 , . . . , vn ) e nao-negativo e soma 1 ou menos, os N + 1 termos:
N
X
p1 (v1 , . . . , vn ), . . . , pN (v1 , . . . , vn ), 1 pi (v1 , . . . , vn )
i=1
sao nao-negativos e somam 1. A soma entre os parenteses na expressao acima (1), que pode
ser reescrita como:
N N
!
X 1 Fi (vi ) X
pi (v) vi + 1 pi (v) 0 ,
i=1
f i (vi ) i=1
Mas entao a soma entre os parenteses na expressao acima (1) nao pode ser maior do que o
maior dos termos em colchetes acima, se algum deles for positivo, ou maior do que zero, se
todos eles foram negativos. Suponha que todos os termos em colchetes sao diferentes entre si.
Defina: (
1Fi (vi ) 1Fj (vj )
1, se vi > max 0, vj ,
pi (v) = fi (vi ) j6=i fj (vj )
(2)
0, caso contrario.
Entao temos que:
N N
X 1 Fi (vi ) X 1 Fi (vi )
pi (v) vi pi (v) vi
i=1
fi (vi ) i=1
fi (vi )
Logo, se os termos em colchetes forem todos diferentes com probabilidade 1, obtemos uma cota
superior para a receita esperada do leiloeiro:
Z 1 Z 1 (X N ) N
1 Fi (vi ) X
ER = ... pi (v) vi f1 (v1 ) . . . fN (vN ) dv1 . . . dvN + ci (0)
0 0 i=1
fi (vi ) i=1
Z 1 Z 1 (X N ) N
1 F i (vi ) X
... pi (v) vi f1 (v1 ) . . . fN (vN ) dv1 . . . dvN + ci (0) ,
0 0 i=1
fi (vi ) i=1
para qualquer mecanismo de venda direta compatvel de incentivo (pi (), ci ())N i=1 que consi-
derarmos. Vamos continuar assumindo que os termos em colchetes sao distintos com proba-
bilidade 1. Como a restricao (iii) do problema do leiloeiro exige que ci (0) 0, para todo i,
obtemos que a receita esperada ER do leiloeiro tera o seguinte limite superior:
Z 1 Z 1 (X N )
1 F (v
i i )
ER ... pi (v) vi f1 (v1 ) . . . fN (vN ) dv1 . . . dvN (3)
0 0 i=1
f i (v i )
Vamos construir um mecanismo de venda direta compatvel de incentivo que alcanca o limite
superior acima. Logo, esse mecanismo maximiza a receita esperada do leiloeiro. Vamos definir
as probabilidades do mecanismo por (2). Dada essas probabilidade, precisamos definir as
funcoes custo. Mas o Teorema 9.5 (a restricao (ii) do problema do leiloeiro) requer que a
funcao custo do mecanismo dependa das funcoes de probabilidade definidas. Considere entao
o seguinte mecanismo (pi (), ci ())N
i=1 :
(
1Fi (vi ) 1Fj (vj )
1, se v i > max 0, vj ,
pi (v) = fi (vi ) j6=i fj (vj )
0, caso contrario.
Z vi
ci (v) = ci (0, vi ) + pi (v)vi pi (x, vi )dx,
0
1 Fi (vi )
vi e estritamente crescente em vi , (5)
fi (vi )
entao o mecanismo de venda direta definido em (4) gera a maior receita esperada possvel para
o leiloeiro.
Prova (ideia): Observe que, por construcao, o mecanismo acima satisfaz as restricoes (ii)
e (iii) e alcanca o limite superior para a receita esperada descrito em (3) (lembre-se que, por
construcao, ci (0) = 0, para todo i). Precisamos entao apenas mostrar que o mecanismo descrito
satisfaz a restricao (i) do problema do leiloeiro. Isso nao sera verdade em geral. Mas assumindo
(5), podemos mostrar que (i) e valido, o que conclui a demonstracao do teorema.
Note que (5) garante tambem que os n umeros vi (1 Fi (vi ))/fi (vi ) sao distintos com proba-
bilidade 1. A distribuicao uniforme satisfaz esse requerimento.
4.5
Analisando o Mecanismo de Venda Otimo
O mecanismo (pi (), ci ())N
i=1
e composto de duas partes:
Vamos analisar cada uma dessas partes do mecanismo de venda direta otimo (pi (), ci ())N
i=1
separadamente.
Primeiro vamos discutir a parte de alocacao do objeto que o mecanismo assume. Para v1 , . . . , vN
anunciados, o objeto e vendido para o consumidor cujo i cujo vi (1 Fi (vi ))/fi (vi ) e o maior
e positivo, caso exista. Caso nao exista i com vi (1 Fi (vi ))/fi (vi ) positivo, entao o objeto
nao e vendido.
O valor vi (1 Fi (vi ))/fi (vi ) pode ser interpretado como a receita marginal, denotado por
RM gi (vi ), que o vendedor obtem ao aumentar a probabilidade de que o objeto seja alocado
para o vendedor i quando a sua valoracao e vi .
Portanto, o vendedor maximiza sua receita vendendo o objeto para i com a maior receita
marginal RM gi (vi ) (ou seja, fazendo a probabilidade desse indivduo receber o objeto igual a
1), desde que ela seja positiva (caso contrario, o objeto nao e vendido).
Agora vamos discutir a parte de pagamento que o mecanismo assume. Note que os participantes
que nao recebem o objeto pagam, de acordo com o mecanismo descrito em (4), o valor:
Z vi Z vi
ci (vi , vi ) = pi (vi , vi )vi pi (x, vi ) dx = 0 vi 0 dx = 0 ,
0 0
ou seja, eles nao pagam nada (note que como pi (vi , vi ) = 0 e pi e nao-decrescente em vi , entao
pi (x, vi ) = 0, para todo x vi ).
Logo, o pagamento feito pelo vencedor do leilao, igual a ri (vi ), independe do seu valor re-
portado para o objeto. Mais ainda, o preco pago e igual ao valor maximo que ele poderia ter
anunciado, dado os valores anunciados pelos outros participantes, para o qual ele nao receberia
o objeto. Obtemos entao o teorema a seguir.
4.6 Efici
encia e Simetria
Ineficiencia pode ocorrer quando:
2. A venda ocorre para um indivduo cujo valor atribudo ao objeto nao e o maior.
O primeiro caso ocorre se vi (1 Fi (vi ))/fi (vi ) for menor que zero para todo i. O segundo
caso pode ocorrer se os indivduos nao forem simetricos.
A presenca de ineficiencia nao e inesperada: essa e uma situacao onde um vendedor monopolista
deseja obter o maximo de lucro possvel. Neste caso, ao inves de restringir producao, o vendedor
pode optar por nao vender o objeto, mesmo que existam compradores que atribuam um valor
positivo ao objeto.
Alem disso, como o vendedor sabe quem e cada comprador e conhece as distribuicoes Fi , para
todo i, ele pode discriminar entre os compradores de modo a obter lucro maior. Porem, no
caso simetrico, onde Fi = F para todo i, esse segundo tipo de ineficiencia desaparece. Alem
disso, supondo simetria, obtemos o teorema abaixo.
1 F (v)
v e estritamente crescente em v ,
f (v)
1 F ( )
= 0,
f ( )
Prova: Considere o mecanismo otimo (pi (), ci ())N i=1 e suponha que os participantes anunciam
v1 , . . . , vN . Como v (1 F (v))/f (v) e estritamente crescente em v e o objeto e alocado para
quem tem o maior vi (1 F (vi ))/f (vi ), entao o objeto e alocado para quem anuncia o maior
vi , desde que vi (1 F (vi ))/f (vi ) seja positivo.
nico < vi , [0, 1], tal que (1
Se vi (1 F (vi ))/f (vi ) e positivo, entao existe um u
F ( )/f ( ) = 0 (Exerccio 9.20). Entao, i ganha o objeto se vi e vi > vj , j 6= i. Nesse
caso, ele paga ou ou o maior valor vj , j 6= i.
Os outros tres tipos de leiloes tambem geram a receita maxima para o vendedor, se definirmos
um preco reserva adequado. Desse modo, todos os quatros tipos de leilao, com preco reserva
adequado, maximizam a receita do vendedor, entre todas as formas possveis de venda do
objeto. Entao por que alguns tipos de leiloes sao mais usados do que outros?
Refer
encias
Myerson, R. B. (1981). Optimal auction design. Mathematics of Operations Research, 6 ,
58-73.