Apostila Micro 2

Microeconomia 2 P
os Notas de Aula
Microeconomia 2 Pos-Graduacao 2/2015

Notas de Aula 1 Teoria dos Jogos (Parte l)
Prof. Jose Guilherme de Lara Resende
Departamento de Economia, Universidade de Braslia
1 Introduc
ao
1.1 Interdepend
encia Estrat
egica
A teoria dos jogos permite modelar comportamentos estrategicos de agentes economicos (jo-
gadores) que se envolvem em uma determinada situacao (jogo). E o instrumento adequado
quando existe interdependencia estrategica entre os agentes do modelo analisado.
No modelo de consumo usual, o consumidor decide entre possveis cestas de bens, dados os
precos e a sua renda. No modelo da firma competitiva, a firma maximiza o seu lucro, dada a
sua tecnologia de producao e dados os precos dos insumos e dos bens que vende. No modelo de
equilbrio geral competitivo, tanto os consumidores quanto as firmas sao tomadores de precos:
tomam os precos como dados e nao ha interdependencia estrategica entre suas decisoes.
Porem, existem situacoes onde o resultado das acoes de um agente dependem tambem das
acoes de outro ou outros agentes. Nesses casos, assumimos que o payoff (utilidade) do agente
depende nao so da sua acao, mas da acao de outros agentes. Modelos de oligopolio sao um
exemplo, em que o lucro de determinada firma depende do comportamento de suas rivais.
Em um jogo, cada jogador deve levar em conta a estrategia dos outros jogadores antes de
escolher o melhor para si. Isso gera uma circularidade, caracterstica fundamental da teoria
dos jogos.
O objetivo da teoria dos jogos e determinar o resultado de um jogo. Cada metodo de analise
da origem a um conceito de solucao particular, chamado equilbrio.
A maioria dos conceitos tem sua origem no conceito de equilbrio de Nash e sao, usualmente,
equilbrios de Nash que satisfazem certas propriedades. Por isso, sao chamados refinamen-
tos. Cada refinamento tenta solucionar alguma deficiencia do conceito de equilbrio de Nash
particular a alguma situacao ou modelo.
1.2 No
coes Preliminares
Definic
ao (informal): Jogo. Um jogo refere-se a qualquer situacao envolvendo dois ou mais
agentes, chamados jogadores, onde exista interdependencia estrategica.
Para descrevermos um jogo e necessario conhecermos tres objetos:
Os jogadores,
A regra do jogo,
O resultado (payoff) do jogo.
Jose Guilherme de Lara Resende 1 NA 1 Teoria dos Jogos (parte 1)

Microeconomia 2 P
os Notas de Aula
Sao feitas duas hipoteses basicas sobre os jogadores (Myerson, 1997):
1. Os jogadores sao racionais. As acoes de um jogador sao consistentes com o objetivo

desejado: maximizar o seu payoff ou a sua a utilidade.
2. Os jogadores sao inteligentes. Os jogadores sabem tudo o que sabemos sobre o jogo e
conseguem fazer as mesmas inferencias que fazemos sobre a situacao em que se encontram.
A segunda hipotese nao e tao inocua quanto parece. Na teoria de equilbrio geral os in-
divduos sao racionais, mas nao e necessario que sejam inteligentes no sentido acima: os agentes
economicos nao precisam conhecer toda a estrutura de teoria de equilbrio geral ao tomarem
suas decisoes.
Existem duas formas de representarmos um jogo:
FORMA NORMAL: Representacao em forma matricial, tambem conhecida como forma

estrategica. Adequada para situacoes onde os jogadores se movem (decidem suas acoes)
simultaneamente. Mais usada em modelos estaticos.
FORMA EXTENSIVA: Representacao em forma de arvore. Adequada para situacoes onde

exista uma ordem cronologica dos eventos do jogo. Mais usada em modelos dinamicos.
Existe uma correspondencia entre essas duas formas, que veremos mais a frente.
Vamos estudar jogos nao-cooperativos: analisamos cada agente separadamente e nao como um
grupo. Essa definicao nao implica que um jogador nao possa cooperar com o outro, ela e apenas
de cunho metodologico, onde cada agente e visto como uma entidade separada, autonoma, e
nao ha grupos de agentes se comportando como um u nico agente.
1.3 Conhecimento Comum

Uma hipotese crucial em teoria dos jogos e a de conhecimento comum (common knowledge).
Essa hipotese diz que a racionalidade dos jogadores e a estrutura do jogo e de conhecimento
comum para todo jogador.
Se considerarmos dois jogadores, um determinado fato e de conhecimento comum dos jogadores

se o jogador 1 conhece o fato, se o jogador 1 sabe que o jogador 2 conhece o fato, se o jogador
1 sabe que o jogador 2 sabe que o jogador 1 conhece o fato, se o jogador 1 sabe que o jogador
2 sabe que o jogador 1 sabe que o jogador 2 conhece o fato, e assim vai ad infinitum, o mesmo
raciocnio valendo para o jogador 2.
Essa hipotese e fundamental para a validade de certos procedimentos, tais como os procedi-
mentos de eliminacao de estrategias dominadas. Mais ainda, ela e fundamental para o conceito
de equilbrio de Nash (existem artigos que relaxam a hipotese de conhecimento comum, sob
certas condicoes).
Myerson (1997) argumenta que a hipotese de jogadores inteligentes implica supor que a estru-
tura do jogo e de conhecimento comum desses jogadores.
A formalizacao matematica dessa hipotese e bastante complicada. Aqui, vamos apenas assumir
a sua validade. As formalizacoes mais conhecidas sao feitas por Aumann (1976) e Aumann and
Brandenburger (1995).

Microeconomia 2 P
os Notas de Aula
A questao de que se a hipotese de conhecimento comum pode ser relaxada para a obtencao de
um equilbrio de Nash e de difcil trato. Aumann and Brandenburger (1995) mostraram que a
hipotese de conhecimento comum da racionalidade pode ser substituda por outras condicoes.
Polak (1999) aprofunda a analise de Aumann and Brandenburger (1995). Essa discussao e com-
plicada e foge do escopo do curso. Vamos apenas ver um exemplo para entender a importancia
dessa hipotese.
Myerson (1997) cita uma fabula que ilustra bem as implicacoes da hipotese. Em uma vila,
existem 100 casais. Toda noite, os homens se juntam e cada um elogia a sua mulher, caso ela
seja fiel, ou se lamenta caso ela tenha sido infiel. Se a mulher foi infiel, ela imediatamente conta
a todos os homens da vila, exceto ao seu marido. Essas tradicoes sao de conhecimento comum
de todos os habitantes da vila.
Suponha que todas as esposas foram infieis. Logo, cada homem sabia da infidelidade de todas
as esposas, exceto da sua, elogiada toda noite. Logo, todas as esposas eram elogiadas e nenhum
homem se lamentava. Numa certa noite, um visitante revelou a todos que uma esposa havia
sido infiel. Qual foi o resultado dessa revelacao?
O resultado foi que todos os homens continuaram a elogiar as esposas por 99 noites. Na noite de
numero 100, todos se lamentaram. Tente entender porque a hipotese de conhecimento comum
leva a esse resultado. Para isso, e necessario compreender o que a informacao do visitante
adicionou ao conhecimento dos homens da vila.
O raciocnio fica mais facil de compreender se considerarmos primeiro o caso em que apenas
uma esposa traiu o marido. A informacao nova que o visitante revelou foi informar a todos da
vila que havia uma esposa infiel. Pelos costumes da vila, 99 homens sabiam que havia uma
esposa infiel e apenas um homem, exatamente aquele cuja esposa havia sido infiel, nao tinha
conhecimento de nenhuma infidelidade na vila. Logo, ele imediatamente tomaria ciencia de
que a sua esposa e que fora infiel e se lamentaria na primeira noite depois da revelacao do
visitante.
Caso houvesse duas esposas infieis, entao 98 homens da vila saberiam que havia duas esposas
infieis e 2 homens teriam conhecimento de apenas um caso de infidelidade, ja que nao saberiam
que a sua respectiva esposa havia sido infiel. Nesse caso, na primeira noite ninguem se lamen-
taria. Porem, na segunda noite, apos observarem que nenhum homem havia se lamentado na
noite anterior, os 2 homens que tem conhecimento de apenas uma esposa infiel, saberiam que
eles sao os que foram trados e se lamentariam. O raciocnio estende-se de modo analogo para
o caso de 100 esposas infieis: no centesimo dia, todos os maridos se dariam conta de que foram
trados e se lamentariam.

Microeconomia 2 P
os Notas de Aula
2 Jogos na Forma Estrat

egica
2.1 Defini
coes e Exemplos de Jogos
Definic ao 7.1: Jogo na Forma Estrat egica (ou Forma Normal). Um jogo na forma
I
estrategica e uma colecao G = (Si , ui )i=1 , onde I e o n
umero de jogadores, Si e o conjunto de
estrategias disponveis ao jogador i, para todo i I, e ui : Ij=1 Sj R e a funcao de payoff
Q
(a utilidade) do jogador i, que depende das estrategias de todos os jogadores. Dizemos que um
jogo na forma normal e finito se o n umero I de jogadores e finito e se o conjunto das estrategias
Si e finito para todo jogador i, i = 1, . . . , I.
Na forma normal nao nos preocupamos com cada acao do jogador, mas apenas com cada es-
trategia do jogador, o conjunto de todas as acoes que podem ser tomadas no decorrer de uma
partida do jogo, incluindo acoes para qualquer situacao de jogo. Para certos jogos, como vere-
mos a frente, a estrategia do jogador pode condensar uma quantidade enorme de informacao,
descrevendo um n umero muito grande de acoes a serem tomadas ao longo do jogo.
Observe que a interdependencia estrategica entre os agentes do modelo analisado aparece ex-
plicitamente na hipotese de que o payoff de cada jogador depende das estrategias de todos os
outros jogadores: ui : S1 Si SI R, ou seja, ui depende nao apenas da estrategia si
escolhida por i, mas tambem das estrategias de todos os outros jogadores, ui (s1 , . . . , si , . . . , sI ).
2.2 Exemplos
Exemplo 1: Matching Pennies ou Batedor vs Rebatedor. Neste jogo com duas
pessoas, cada jogador escolhe o lado de uma moeda, sem que o outro jogador tome conhecimento
de sua escolha. Os dois jogadores revelam simultaneamente o lado escolhido. Se os lados
escolhidos forem iguais, o jogador 1 paga R$ 1,00 ao jogador 2. Se forem distintos, o jogador
2 paga R$ 1,00 ao jogador 1. A matriz abaixo descreve este jogo.
1 / 2 Cara Coroa
Cara 1, 1 1, 1
Coroa 1, 1 1, 1
Notac ao: Vamos usar a seguinte convencao para todos os jogos representados na forma ma-
tricial: o primeiro elemento em cada celula da matriz e o payoff do jogador 1 (jogador-linha)
e o segundo elemento da celula e o payoff do jogador 2 (jogador-coluna).
No jogo Cara ou Coroa, fica claro que cada jogador deve agir de modo imprevisvel. Logo,
quando os jogadores decidem estrategicamente, pode ocorrer que a melhor forma de agir seja
escolher de modo aleatorio ou de modo que o seu rival nao saiba exatamente o que ele escolhera.
Para esse jogo, temos que:
Jogadores: I = {1, 2};

Estrategias: S1 = S2 = {Cara, Coroa};
Payoffs: u1 (Cara,Coroa) = u1 (Coroa,Cara) = 1;
u1 (Cara,Cara) = u1 (Coroa,Coroa) = 1;
u2 (s1 , s2 ) = u1 (s1 , s2 ), (s1 , s2 ) S1 S2 .

Microeconomia 2 P
os Notas de Aula
Observe que esse e um jogo de soma zero: o ganho de um jogador e igual a` perda do outro
jogador. Esse tipo de jogo foi extensivamente estudado por von Neumann and Morgenstern
(2007), no livro Theory of Games and Economic Behavior , publicado originalmente em 1947
e um dos marcos da teoria dos jogos.
Exemplo 2: Dilema dos Prisioneiros. Luiz Alberto e Laelio foram presos e estao sendo
interrogados separadamente, acusados de um crime. Se ambos confessarem o crime, eles rece-
berao uma pena de 3 anos na cadeia. Se ambos nao confessarem o crime, a pena sera de apenas
dois anos, por falta de evidencia. Porem, o promotor pode fazer uma acordo com um deles,
dando uma pena de apenas um ano na prisao para quem confessar e, para quem nao confessar,
de cinco anos na prisao, por nao ter colaborado com a justica. A matriz abaixo descreve este
jogo.
L.A. / Laelio Confessar Nao Confessar

Confessar 3, 3 1, 5
Nao Confessar 5, 1 2, 2
Exemplo 3: Problema de Coordenac ao. Suponha que duas pessoas estao viajando sepa-
radamente para o Rio de Janeiro e combinaram de se encontrar para almocar no dia seguinte.
Porem esqueceram de marcar o restaurante e nao estao conseguindo se comunicar. Eles costu-
mam almocar sempre em dois restaurantes, um no centro da cidade e outro na Barra da Tijuca.
O almoco no restaurante da barra e mais agradavel do que o almoco no restaurante do centro.
Porem, eles se desencontrarem e a pior situacao possvel. A matriz abaixo descreve este jogo.
1 / 2 Barra Centro
Barra 3, 3 0, 0
Centro 0, 0 1, 1
Exemplo 4: Batalha dos Sexos. Nelson e Renata querem fazer um programa domingo a`
tarde. Concordaram com duas opcoes: ir ao jogo do Corintians (F) ou fazer compras (C). Os
dois preferem estar juntos a fazerem os passeios separados, mas Nelson prefere ir ao jogo e
Renata prefere ir a`s compras. A matriz abaixo descreve este jogo.
Nelson / Renata F C
F 2, 1 0, 0
C 0, 0 1, 2
A batalha dos sexos modela tambem um problema de coordenacao, mas que envolve uma disputa
de poder. Veremos mais a frente que esse jogo tem dois equilbrios (em estrategias puras), em
que ambos os jogadores devem coordenar suas estrategias para alcancar um dos equilbrios.
Porem, o equilbrio que o jogador 1, Nelson, prefere, (F, F ), e diferente do equilbrio que o
jogador 2, Renata, prefere, (C, C), (e ambos preferem estar em uma situacao de equilbrio do
que estar em uma situacao de desequilbrio, (F, C) ou (C, F )). Neste caso, podemos ter uma
disputa de poder entre os jogadores, onde cada um tenta implementar o seu equilbrio preferido.

Microeconomia 2 P
os Notas de Aula
2.3 Domin
ancia Estrita
Considere um jogo com I jogadores. Vamos representar em negrito um conjunto de estrategias
de todos os jogadores: s = (s1 , . . . , sI ). Vamos usar a notacao si = (s1 , . . . , si1 , si+1 , . . . , sI )
para representar um conjunto de estrategias de todos os jogadores, exceto o jogador i.
Definic egia Estritamente Dominante. Uma estrategia si Si e estrita-

ao 7.2: Estrat
mente dominante para o jogador i no jogo G se para toda estrategia si Si , si 6= si , vale:
ui (
si , si ) > ui (si , si ), para todo si Si ,
onde Si = S1 Si1 Si+1 SI .
Logo, uma estrategia si e estritamente dominante para o jogador i se ela for a u

nica estrategia
que maximiza o payoff desse jogador, quaisquer que sejam as estrategias escolhidas pelos outros
jogadores.
Para o jogo do dilema dos prisioneiros, Confessar e uma estrategia estritamente dominante
para os dois prisioneiros. Ela e a melhor estrategia para cada prisioneiro, independentemente
do que o outro prisioneiro escolha. Nesse caso, podemos dizer que (C, C) e um equilbrio em
estrategias estritamamente dominantes.
Observe que o equilbrio (C, C) e Pareto dominado pelo conjunto de estrategias (N C, N C).
Temos, entao, um caso onde o comportamento individual maximizador dos agentes envolvidos
resulta em um equilbrio Pareto ineficiente. Logo, na presenca de interdependencia estrategica,
a interacao de jogadores cujo objetivo e maximizar o seu proprio bem-estar pode levar a si-
tuacoes ineficientes.
Estrategias estritamente dominantes nao sao comuns. Existem varias situacoes, como o pro-
blema de coordenacao acima (Exemplo 3), onde e facil verificar que nao existem estrategias
dominantes para nenhum dos jogadores.
Apesar de estrategias estritamente dominantes serem raras, podemos usar um conceito simi-
lar, de estrategia estritamente dominada, para eliminarmos estrategias que nunca devem ser
escolhidas pelo jogador.
Definic
ao 7.3: Estrategia Estritamente Dominada. Dizemos que a estrategia si e estri-
tamente dominada no jogo G para o jogador i se existir uma outra estrategia si Si (Si 6= si )
desse jogador tal que:
ui (
si , si ) > ui (
si , si ), para todo si Si
Neste caso, dizemos que a estrategia si domina estritamente a estrategia si .
Portanto, uma estrategia estritamente dominante e uma estrategia que domina estritamente
todas as outras estrategias do jogador. Podemos dizer tambem que todas as outras estrategias
sao estritamente dominadas pela estrategia estritamente dominante.
Exemplo 5: Estrat
egia Estritamente Dominada. Considere o seguinte jogo:
1 / 2 E D
C (7, 4) (5, 3)
M (8, 5) (2, 4)
B (5, 3) (3, 4)

Microeconomia 2 P
os Notas de Aula
Para o jogador 1, a estrategia B e estritamente dominada pela estrategia C. Essa e a u nica

estrategia estritamente dominada no jogo acima. Se eliminarmos essa estrategia do jogo, usando
o argumento de que o jogador 1 nunca a escolhera, ja que C traz um payoff sempre maior,
qualquer que seja a jogada de 2, obtemos um novo jogo, dado por:
1 / 2 E D
C (7, 4) (5, 3)
M (8, 5) (2, 4)
Para esse novo jogo reduzido, a estrategia E domina estritamente D, para o jogador 2.
Eliminando essa estrategia, obtemos um novo jogo, dado por:
1 / 2 E
C (7, 4)
M (8, 5)
Finalmente, para esse novo jogo reduzido, a estrategia M domina estritamente C, para o
jogador 1. Logo, ancontramos (M, E) (isto e, o jogador 1 escolhe M , o jogador 2 escolhe
E) como solucao do jogo usando esse procedimento de eliminacao de estrategias estritamente
dominadas.
A ideia do procedimento e, portanto, simples. Ele usa implicitamente a hipotese de conhe-

cimento comum da racionalidade e da estrutura do jogo para todos os jogadores. A sua
formalizacao pode ser feita do seguinte modo:
Procedimento de Eliminac ao de Estrat egias Estritamente Dominadas (PEEED):

Considere o jogo G = (Si , ui )Ii=1 . Seja Si0 = Si , para cada jogador i. Para n 1, seja Sin o
conjunto das estrategias do jogador i resultante da n-esima etapa de eliminacao, ou seja, si Sin
se si Sin1 nao e estritamente dominada em Sin1 (no jogo dado por Gn1 = (Sin1 , ui )Ii=1 ).
Definicao 7.4: Estrat egia Iterativamente Estritamente N ao-Dominada. A estrategia

si do jogador i e iterativamente estritamente nao dominada em S (ou sobrevive ao PEEED)
se si Sin , para todo n 1.
O problema com o PEEED e que ele nem sempre leva a alguma solucao. Por exemplo, na
batalha dos sexos, nao existe nenhuma estrategia estritamente dominada, portanto nao conse-
guimos eliminar nenhuma estrategia do jogo e fazer qualquer predicao mais acurada sobre qual
deve ser o seu resultado (ou, pelo menos, o que nao pode ser resultado).
2.4 Domin
ancia Fraca
Podemos enfraquecer as definicoes de dominancia estrita, relaxando a exigencia de que o payoff
seja sempre estritamente maior nas definicoes acima.
Definic
ao: Estrategia Fracamente Dominante. Uma estrategia si Si e fracamente
dominante para o jogador i no jogo G se para toda estrategia si Si , si 6= si , vale:
si , si ) ui (si , si ),
ui ( para todo si Si ,
com desigualdade estrita para pelo menos um si .
Evidentemente, toda estrategia fortemente dominante e fracamente dominante, mas a volta

nao vale (ver Exemplo 6 abaixo).

Microeconomia 2 P
os Notas de Aula
Exemplo 6. Considere o seguinte jogo:

1 / 2 E D
C (1, 1) (0, 0)
B (0, 0) (0, 0)
A estrategia C e fracamente dominante para o jogador 1 e a estrategia E e fracamente do-

minante para o jogador 2. Desse modo, (C, E) e um equilbrio em estrategias fracamente
dominantes. Observe que nenhuma estrategia e estritamente dominante.
Definic
ao 7.5: Estrat
egia Fracamente Dominada. Uma estrategia si e fracamente domi-
nada no jogo G para o jogador i quando existe uma outra estrategia si Si do jogador i tal
que:
si, si ) ui (
ui ( si , si ), para todo si Si ,
com desigualdade estrita para pelo menos um si . Dizemos que si domina fracamente si .
Exemplo 7. Considere o seguinte jogo:
1 / 2 E D
C (9, 6) (7, 6)
M (9, 1) (3, 2)
B (5, 4) (7, 3)
O jogador 1 possui duas estrategias fracamente dominadas: M e fracamente dominada por
C e B e fracamente dominada por C (ou seja, C e fracamente dominante para o jogador 1).
O jogador 2 nao possui nenhuma estrategia dominada, seja no sentido estrito seja no sentido
fraco. Vamos primeiro definir formalmente o processo de eliminacao de estrategias fracamente
dominadas (PEEFD):
Procedimento de Eliminac ao de Estrategias Fracamente Dominadas (PEEFD): Con-
sidere o jogo G = (Si , ui )i=1 . Seja Wi = Si , para cada jogador i. Para n 1, seja Win o
I 0
conjunto das estrategias do jogador i resultante da n-esima etapa de eliminacao de estrategias

fracamente dominadas, ou seja, si Win se si Win1 nao e fracamente dominada em Win1
(no jogo dado por Gn1 = (Win1 , ui )Ii=1 ).
Definic
ao 7.6: Estrat egia Iterativamente Fracamente N ao-Dominada. A estrategia
si do jogador i e iterativamente fracamente nao-dominada em S (ou sobrevive ao PEEFD) se
si Win , para todo n 1.
Vamos aplicar o PEEFD ao jogo acima, procedendo de tres modos distintos:
1. Se eliminarmos primeiro M para o jogador 1, a estrategia D do jogador 2 se torna
fracamente dominada para o jogo resultante. Eliminando D, podemos eliminar B no
jogo resultante, obtendo (C, E) (payoff (9,6)) como solucao.
2. Se eliminarmos primeiro B para o jogador 1, a estrategia E do jogador 2 se torna fra-
camente dominada para o jogo resultante. Eliminando E, podemos eliminar M no jogo
resultante, obtendo (C, D) (payoff (7,6)) como solucao.
3. Se eliminarmos simultaneamente M e B, entao obtemos o subjogo com 1 escolhendo C e
2 sendo indiferente entre E e D, e nenhuma dessas duas estrategias podem ser eliminadas
para o jogador 2, usando o PEEFD.
O exemplo acima mostra que a ordem de eliminacao das estrategias fracamente dominadas
pode afetar a solucao obtida. Esta e uma caracterstica ruim deste procedimento, pois a
solucao obtida pode mudar conforme a ordem de eliminacao das estrategias. Este problema
nao ocorre quando eliminamos estrategias estritamente dominadas.

Microeconomia 2 P
os Notas de Aula
2.5 Estrat
egias Racionaliz
aveis
O PEEED e o PEEFD utilizam o conceito de conhecimento comum da racionalidade dos
jogadores e da estrutura do jogo. Porem, esses procedimentos nao esgotam toda a forca dessa
hipotese: ela permite obter o conceito de estrategia racionalizavel (Bernheim, 1984; Pearce,
1984), mais restritivo do que o conceito de estrategias que sobrevivem ao PEEED.
ao: Melhor Resposta. Considere o jogo G = (Si , ui )Ii=1 . A estrategia si e a melhor

Definic
resposta do jogador i à estrategia si dos seus rivais se:
si , si ) ui (si , si ),
ui ( para todo si Si .
Portanto, a estrategia si e a melhor resposta do jogador i para a estrategia si se ela for a

escolha otima de i quando ele acredita que seus rivais escolherao as estrategias descritas no
vetor si . Um jogador nao deve escolher uma estrategia que nunca e uma melhor resposta,
pois neste caso nao existe forma de o jogador i justificar a escolha dessa estrategia. Observe
que estrategias estritamente dominadas nunca sao a melhor resposta.
Podemos montar um procedimento de eliminacao de estrategias que nunca sao a melhor res-
posta, de modo similar ao PEEED. Mais uma vez, estamos supondo a validade da hipotese de
conhecimento comum da racionalidade dos jogadores e da estrutura do jogo.
Definic
ao: Estrat
egias Racionaliz aveis. As estrategias em Si do jogador i que sobrevivem
ao procedimento de eliminacao de estrategias que nunca sao a melhor resposta sao chamadas
racionalizaveis.
Uma estrategia racionalizavel pode sempre ser justificada, ou seja, o jogador pode justificar
a escolha dessa estrategia com uma conjectura razoavel sobre o comportamento dos outros
jogadores (nenhum rival escolhera uma estrategia nao racionalizavel).
Proposic
ao. As seguintes afirmacoes sao verdadeiras:
A ordem de remocao das estrategias que nunca sao a melhor resposta nao altera o resul-
tado obtido.
Cada jogador tem pelo menos uma estrategia racionalizavel, podendo ter mais de uma.
O conjunto de estrategias racionalizaveis esta contido no conjunto de estrategias que

sobrevivem ao PEEED.
Para jogos com dois jogadores, o conjunto de estrategias racionalizaveis e igual ao con-
junto de estrategias que sobrevivem ao PEEED.
Porem, o conceito de estrategia racionalizavel tambem nem sempre fornece uma solucao. Por
exemplo, para a batalha dos sexos, todas as estrategias sao racionalizaveis, logo o conceito nao
diz nada sobre qual sera a solucao do jogo.
Queremos tornar as predicoes sobre o resultado de um jogo mais precisas do que o que pode
ser obtido usando os conceitos vistos acima. A seguir veremos o conceito de equilbrio de Nash
(EN), que, satisfeitas certas condicoes, sempre aponta pelo menos uma solucao para o jogo.
Esse e o mais importante conceito em teoria dos jogos.

Microeconomia 2 P
os Notas de Aula
3 Equilbrio de Nash
3.1 Equilbrio de Nash em Estrat
egias Puras
O maximo que podemos obter usando a hipotese de conhecimento comum e o conceito de es-
trategias racionalizaveis. Porem esse conceito nem sempre traz boas predicoes sobre o resultado
de um jogo. Por exemplo, para a Batalha dos Sexos, todas as estrategias sao racionalizaveis.
Logo, esse conceito nao traz nenhuma informacao a respeito da resolucao que devemos esperar
para esse jogo. Queremos tornar as predicoes sobre o resultado de um jogo mais precisas do
que o que pode ser obtido usando apenas estrategias racionalizaveis. Para obtermos qualquer
outro conceito mais forte, temos que adicionar alguma hipotese nova.
Definic
ao 7.7: Equilbrio de Nash em Estrat egias Puras (Nash, 1951). Um conjunto
de estrategias s = (s1 , s2 , . . . , sI ) e um equilbrio de Nash (EN) (em estrategias puras) para o
jogo G = (Si , ui )Ii=1 se, para todo jogador i = 1, 2, . . . , I,, vale:
si , si ) ui (si , si ) ,
ui ( si S i .
Em um equilbrio de Nash (EN), a estrategia de cada jogador e a melhor resposta para as

estrategias que sao de fato escolhidas pelos outros jogadores. Portanto, um EN requer que os
jogadores estejam certos sobre suas conjecturas a respeito das estrategias escolhidas pelos seus
rivais. Dizemos que os jogadores possuem expectativas mutualmente corretas.
Proposic ao: Todas as estrategias que fazem parte de um equilbrio de Nash sao raciona-
lizaveis. Mais ainda, todo equilbrio formado por estrategias estritamente ou fracamente domi-
nantes, ou obtido pela eliminacao de estrategias estritamente ou fracamente dominadas, e um
equilbrio de Nash.
O conceito de EN traz uma predicao mais precisa a respeito do resultado de um jogo do que
o conceito de racionabilidade. No problema de coordenacao abaixo, todas as estrategias sao
racionalizaveis, mas apenas (s1 = L, s2 = U ) e (s1 = D, s2 = R) sao EN em estrategias puras.
1 / 2 L R
U 3, 3 0, 0
D 0, 0 1, 1
O jogo Cara ou Coroa, representado na matriz abaixo, nao possui EN em estrategias puras.
Logo, de modo geral, nao podemos garantir a existencia de EN em estrategias puras.
1 / 2 Cara Coroa
Cara 1, 1 1, 1
Coroa 1, 1 1, 1
Intuitivamente, qualquer solucao desse jogo envolve ambos os jogadores escolhendo suas es-
trategias de modo imprevisvel. Para formalizar essa ideia, vamos introduzir o conceito de
estrategias mistas.

Microeconomia 2 P
os Notas de Aula
3.2 Equilbrio de Nash em Estrat

egias Mistas
Definicao 7.8: Estrat egias Mistas. Seja Si o conjunto de estrategias puras do jogador i.
Uma estrategia mista do jogador i e uma distribuicao de probabilidade sobre Si , ou seja, uma
funcao mi : Si [0, 1], que associa uma probabilidade a cada estrategia pura do jogador i.
Logo, para um jogo finito, temos que:
X
mi (si ) 0 , si e mi (si ) = 1 .
si Si
P
O simplex de Si , representado por Mi = (Si ) = mi : Si [0, 1] | si Si mi (si ) = 1 , e o
conjunto das estrategias mistas do jogador i. Esse conjunto tambem inclui as estrategias puras
do jogador (chamadas estrategias mistas degeneradas).
Se os jogadores randomizam suas estrategias, entao o resultado do jogo deixara de ser de-
terminstico. Neste caso, calculamos o payoff dos jogadores usando utilidade esperada. Seja
m = (m1 , . . . , mI ) uma colecao de estrategias mistas para todos os jogadores. A utilidade
esperada do jogador i para a colecao de estrategias mistas m e:
X
Ui (m) = Em (ui ) = [m1 (s1 )m2 (s2 ) . . . mI (sI )] ui (s)
sSi
Observac ao: estamos assumindo que as randomizacoes de cada jogador sao independentes. A
nocao de equilbrio correlacionado (Aumann, 1974) trata do caso onde essas randomizacoes nao
sao independentes. Essa dependencia pode ser interpretada, por exemplo, como sinais p ublicos
que fazem com que as estrategias tenham um grau de correlacao.
Podemos estender imediatamente os conceitos de: estrategias dominantes, estrategias domi-

nadas, procedimentos de eliminacao e estrategias racionalizaveis, ao permitir que os jogadores
possam escolher estrategias mistas, alem de estrategias puras.
Definic ao 7.9: Equilbrio de Nash em Estrat egias Mistas. O conjunto de estrategias

m = (m 1, . . . , m I ) e um equilbrio de Nash para o jogo G = (Si , ui )Ii=1 se, para cada jogador
i = 1, 2, . . . , I, vale:
ui (m i ) ui (mi , m
i, m i ) , mi Mi .
A definicao acima permite que os jogadores randomizem entre as estrategias puras. Observe
que no equilbrio, cada jogador conhece o modo em que os outros jogadores estao randomizando
(as estrategias mistas escolhidas por seus rivais).
Observe que, para cada conjunto de estrategias dos jogadores candidato a equilbrio, devemos
verificar se para cada jogador, a sua estrategia e de fato a melhor resposta para as estrategias
dos outros jogadores que fazem parte do conjunto de estrategias candidato a equilbrio. Con-
siderando estrategias mistas, existem um n umero infinito de estrategias, o que torna este pro-
cedimento inviavel. Como fazemos entao para encontrar os equilbrios de Nash em estrategias
mistas de um jogo? O teorema abaixo fornece um algoritmo para isso. Antes vamos definir o
conceito de suporte de uma estrategia mista.

Microeconomia 2 P
os Notas de Aula
ao (Suporte). O suporte da estrategia mista mi Mi , denotado por supp(mi ), e o

Definic
conjunto de estrategias puras de i que sao jogadas com probabilidade positiva por mi . Isto e,
supp(mi ) = {si Si | mi (si ) > 0}
Podemos definir o suporte do conjunto de estrategias mistas m = (m1 , m2 , . . . , mI ) como:

I
Y I
Y
supp(m) = supp(mi ) = {si Si | mi (si ) > 0}
i=1 i=1
Teorema 7.1: Equival

encia de Definic
oes. As seguintes afirmativas sao equivalentes:
= (m
1. m I ) M e um equilbrio de Nash;
1, . . . , m
2. Para todo jogador i, ui (m) i ), para todo si supp(m

= ui (si , m ui (si , m
i ); e ui (m) i ),
para todo si
/ supp(m i );
ui (si , m
3. Para todo jogador i, ui (m) i ), para todo si Si .
O Teorema 7.1 diz que em um EN em estrategias mistas, duas estrategias puras de um jogador
que podem ser escolhidas (que possuem probabilidade positiva) devem necessariamente gerar
o mesmo payoff para esse jogador, que sera igual ao payoff obtido no equilbrio. Esse resultado
e consequencia de utilizarmos a utilidade esperada, que e linear nas probabilidades, para calcu-
larmos o payoff de um conjunto de estrategias mistas. Caso existissem duas estrategias puras
que o jogador escolhesse com probabilidade positiva e em que uma delas gerasse um payoff
maior do que o da outra, dadas as estrategias de equilbrio dos outros jogadores, o jogador nao
deveria atribuir probabilidade positiva à estrategia que lhe da o payoff mais baixo, pois isso
reduziria o seu payoff de equilbrio.
Ou seja, dadas as estrategias escolhidas em equilbrio pelos outros jogadores, esse jogador
e indiferente entre qualquer estrategia pura que ele de fato possa vir a escolher (que tem
probabilidade positiva), e estas estrategias puras lhe dao um payoff igual ou maior do que
qualquer outra estrategia que ele nao escolhe. Lembre-se que o que de fato determina as
probabilidades de cada jogador e fazer (m 1, . . . , m
I ) um equilbrio.
Existe uma outra forma de interpretar a randomizacao de estrategias, para o caso de dois
jogadores, que pode ser mais adequada para certas situacoes. Nessa interpretacao, a estrategia
mista de um determinado jogador e a distribuicao de probabilidade que o outro jogador atribui
para as suas escolhas. Por exemplo, no jogo Cara ou Coroa, a estrategia mista do jogador
1 pode ser interpretada tanto como o modo que o jogador 1 randomiza entre cara e coroa ou
como o modo que o jogador 2 imagina que o jogador 1 estara randomizando entre as suas
escolhas.
Vamos agora usar o teorema para calcular o EN para o jogo Cara ou Coroa. Suponha que
o jogador 1 decida proceder do seguinte modo: com probabilidade ele escolhe Ca e com
probabilidade 1 ele escolhe Co. Similarmente, o jogador 2 decide proceder do seguinte
modo: com probabilidade ele escolhe Ca e com probabilidade 1 ele escolhe Co. Vamos
representar na matriz abaixo essa situacao.
1 / 2 Cara () Coroa (1 )
Cara () 1, 1 1, 1
Coroa (1 ) 1, 1 1, 1

Microeconomia 2 P
os Notas de Aula
Pelo Teorema 7.1, essas randomizacoes constituem um EN se:
u1 (Ca, m2 ) = u1 (Co, m2 ) e u2 (m1 , Ca) = u2 (m1 , Co) ,
onde m1 e m2 representam as estrategias mistas dos jogadores 1 e 2, respectivamente. Portanto:
u1 (Ca, m2 ) = u1 (Co, m2 ) 1 + 1 (1 ) = 1 + 1 (1 ) = 0, 5
u2 (m1 , Ca) = u2 (m1 , Co) 1 1 (1 ) = 1 + 1 (1 ) = 0, 5
Logo, m1 = (1/2Ca; 1/2Co) e m2 = (1/2Ca; 1/2Co) constituem um EN em estrategias mistas

(mais ainda, este e o u
nico EN deste jogo). Observe que:
u1 (Ca, m2 ) = u1 (Co, m2 ) = u1 (m1 , m2 ) = 0

u2 (m1 , Ca) = u2 (m1 , Co) = u2 (m1 , m2 ) = 0,
como esperado pelo Teorema 7.1.
Para jogos maiores, com mais jogadores e/ou mais estrategias, o seguinte algoritmo descreve
como devemos proceder para determinar todos os EN de um jogo na forma normal.
Algoritmo para Encontrar EN em Estrat egias Mistas. Fixe S = S1 SI S =

S1 SI , com Si 6= para todo i. Se existe algum equilbrio de Nash m com suporte em
entao existem n
S, umeros Ui , para todo jogador i, tais que:
!
si , si ) = Ui , para todo jogador i, para todo si Si ;
P Q
(i) mj (sj ) ui (
si Si j6=i
(ii) ui (si , mi ) Ui , para todo jogador i, para todo si / Si ;
si ) 0, para todo si Si , / Si .
P
(iii) mi ( si ) = 1, e mi (si ) = 0, para todo si
mi (
si Si

Repita o procedimento para todas as combinacoes possveis S.
A ideia do algoritmo e fixar um conjunto de estrategias puras dos jogadores para o qual se
verifica a existencia de algum equilbrio em estrategias mistas. Usando o teorema anterior de
equivalecia de definicoes, sabemos que:
(i) Garante que a utilidade de um jogador i qualquer, ao jogar uma estrategia pura que
faz parte da randomizacao (jogada com probabilidade positiva) deve ser sempre igual,
quando os seus rivais estao jogando as estrategias de equilbrio;
(ii) Assegura que nenhuma estrategia (para qualquer jogador) que nao e usada na rando-
mizacao da uma utilidade maior do que a de equilbrio;
(iii) Garante que as probabilidades de randomizacao sejam de fato probabilidades.
Vamos encontrar todos os equilbrios do jogo abaixo para aplicarmos o algoritmo acima.
Exemplo 8. Considere o seguinte jogo com dois jogadores. O jogador 1 possui duas estrategias
puras, U e D. O jogador 2 possui tres estrategias puras, L, M e R:
1 / 2 L M R
U 1, 1 0, 0 5, 5
D 0, 0 2, 2 0, 0

Microeconomia 2 P
os Notas de Aula
Esse jogo possui dois EN em estrategias puras, (U, R) e (D, M ). Vamos procurar todos os EN
possveis em estrategias mistas. Temos que considerar quatro casos:
1. O jogador 2 randomiza entre L, M e R com probabilidades , e 1 , o jogador 1
randomiza entre U e D com probabilidades e 1 . Nesse caso, devemos ter que:
(i) u1 (U, m2 ) = u1 (D, m2 ) e (ii) u2 (m1 , L) = u2 (m1 , M ) = u2 (m1 , R).
Ou seja,
(i) 1 + 5 (1 ) = 2
(ii) 1 = 2 (1 ) = 5
No item (ii), nao existe solucao para que satisfaca as igualdades desse item. Portanto,
nao existe EN com a randomizacao sugerida acima.
2. O jogador 2 randomiza entre L e M com probabilidades e 1 , o jogador 1 randomiza
entre U e D com probabilidades e 1 . Nesse caso, devemos ter que:
(i) u1 (U, m2 ) = u1 (D, m2 ) e (ii) u2 (m1 , L) = u2 (m1 , M ).
Ou seja,
(i) 1 = 2 (1 ) = 2/3
(ii) 1 = 2 (1 ) = 2/3
Entao (m1 ; m2 ) = (2/3U, 1/3D; 2/3L, 1/3M ) e um candidato a EN. Porem, s2 = R e tal que
u2 (m1 , R) = 10/3 > u2 (m1 , m2 ) = 2/3, portanto a randomizacao acima nao e um EN.
3. O jogador 2 randomiza entre L e R com probabilidades e 1 , o jogador 1 randomiza
(i) u1 (U, m2 ) = u1 (D, m2 ) e (ii) u2 (m1 , L) = u2 (m1 , R).
Ou seja,
(i) 1 + 5 (1 ) = 0 = 1, 25
(ii) 1 = 5 =0
O item (iii) do algoritmo nao e satisfeito (o valor de encontrado nao caracteriza uma
probabilidade). Portanto, nao existe EN com a randomizacao sugerida nesse caso.
4. O jogador 2 randomiza entre M e R com probabilidades e 1 , o jogador 1 randomiza
(i) u1 (U, m2 ) = u1 (D, m2 ) e (ii) u2 (m1 , M ) = u2 (m1 , R).
Ou seja,
(i) 5 (1 ) = 2 = 5/7
(ii) 2 (1 ) = 5 = 5/7
Entao (m1 ; m2 ) = (5/7U, 2/7D; 5/7M, 2/7R) e um candidato a EN. Como s2 = L e tal que
u2 (m1 , L) = 5/7 < u2 (m1 , m2 ) = 10/7, a randomizacao acima e de fato um EN.
O jogo acima possui ao todo tres EN, dois em estrategias puras e um em estrategias mistas
nao-degeneradas. Claramente, esse algoritmo e impraticavel de ser calculado no braco para
jogos com muitas estrategias. Porem, ele pode ser implementado computacionalmente nesses
casos.

Microeconomia 2 P
os Notas de Aula
3.3 Teorema de Nash

Teorema 7.2: Exist encia de Equilbrio de Nash (Nash, 1950). Todo jogo na forma
estrategica finito possui (pelo menos) um equilbrio de Nash para esse jogo.
O seguinte resultado mais geral e valido:
encia de Equilbrio de Nash. Considere o jogo G = (Mi , ui )Ii=1 , onde:

Teorema de Exist
1. Mi Rn e nao-vazio, compacto e convexo para todo i; e
2. ui : M R e contnua em M e quase-concava em Mi .
Entao sempre existe (pelo menos) um equilbrio de Nash para esse jogo.
Corol ario. Todo jogo finito na forma estrategica possui pelo menos um equilbrio de Nash em
estrategias mistas.
Para confirmar a validade do corolario, basta notar que o simplex de um conjunto finito nao-
vazio e compacto e convexo. Logo, o Teorema 7.2 pode ser visto como um corolario de Teorema
acima.
Para se provar o Teorema acima, vamos definir a correspondencia bi : Mi Mi de melhor

resposta para o jogador i:
bi (mi ) = {m
i Mi | ui (m
i , mi ) ui (mi , mi ), mi Mi }.
A definicao acima diz que bi (mi ) seleciona, dada a escolha mi de todos os outros jogadores
que nao i, a melhor resposta do jogador i a` escolha mi . Observe primeiro que bi e de fato uma
correspondencia e nao uma funcao, pois para uma determinada escolha mi dos seus rivais, o
jogador i pode ter mais de uma estrategia que e a melhor resposta a mi .
Podemos provar que a correspondencia de melhor resposta de cada jogador satisfaz:
(i) bi (mi ) e nao vazia para todo mi Mi ;
(ii) bi (mi ) e de valores convexos e de valores compactos para todo mi Mi ;
(iii) bi : Mi Mi e hemi-contnua superior.
A propriedade de hemi-continuidade superior garante, junto com a propriedade de hemi-

continuidade inferior, uma regularidade para correspondencias analoga a` propriedade de conti-
nuidade para funcoes. Se bi satisfaz as propriedades acima, podemos definir a correspondencia
b = (b1 , . . . , bI ) como a correspondencia de melhor resposta de todos os jogadores e entao
aplicar o Teorema do Ponto Fixo de Kakutani, enunciado abaixo.
Teorema do Ponto Fixo de Kakutani. Suponha que M Rn e um conjunto nao-vazio,

compacto e convexo. Seja b : M M uma correspondencia hemi-contnua superior com
valores convexos. Entao b tem ponto fixo (isto e, existe mP F M tal que mP F b(mP F )).
Observe que se existe um ponto fixo para b, isto e, um conjunto de estrategias m = (m1 , . . . , mI )
tal que (m1 , . . . , mI ) (b1 (m1 ), . . . , bI (mI )), entao vale que mi bi (mi ) para todo jogador
i, o que significa que mi e a melhor resposta do jogador i a` escolha mi de seus rivais, ou seja,
m = (m1 , . . . , mI ) e um equilbrio de Nash.

Microeconomia 2 P
os Notas de Aula
4 Alguns Resultados
Vimos acima exemplos de equilbrios com estrategias puramente mistas. O exemplo abaixo
mostra que pode existir um EN onde apenas um dos jogadores de fato randomize. Para que
isso ocorra, e necessario que os payoffs obtidos com as estrategias puras que fazem parte da
randomizacao desse jogador sejam todos iguais, ja que o outro jogador nao randomiza e escolhe
uma estrategia pura. Alem disso, cada estrategia pura do jogador que de fato e randomizada
forma um EN em estrategias puras junto com a estrategia pura escolhida pelo outro jogador.
O exemplo a seguir ilustra esse ponto.
Exemplo 9: Considere o seguinte jogo com dois jogadores:
1 / 2 L R
U 1, 1 0, 0
D 1, 0 0, 0
Esse jogo possui tres EN em estrategias puras, (U, L), (D, L) e (D, R). Nao existe equilbrio em
estrategias estritamente mistas para os dois jogadores. Porem, (U, (1 )D; L) e um EN para
todo [0, 1], em que o jogador 1 randomiza entre as estrategias U e D, escolhendo qualquer
probabilidade. Isso ocorre porque como U e D proveem o mesmo payoff para o jogador 1
quando 2 escolhe L, entao qualquer randomizacao entre essas duas estrategias sera parte de
um EN junto com a estrategia L de 2.
Um caso mais extremo e sem interesse seria o de um jogo em que os payoffs de cada jogador sao
todos iguais. Nessa situacao, tudo sera EN, ja que qualquer escolha de cada jogador gerara
sempre o mesmo payoff. Evidentemente, isso nao configuraria um jogo no sentido informal do
termo. A matriz abaixo ilustra esse caso.
1 / 2 L R
U 1, 2 1, 2
D 1, 2 1, 2
Proposic
ao. Os seguintes resultados sao validos:
1. Se existir equilbrio em estrategias estritamente dominantes, ele sera u

nico e sera o u
nico
EN do jogo. O mesmo vale para equilbrios obtidos com o PEEED: se existir, sera u nico
eou nico EN do jogo.
2. Se existir equilbrio em estrategias fracamente dominantes, entao ele sera um EN. Neste
caso, pode ocorrer que exista outro EN, formado por estrategias fracamente dominadas.
O exemplo abaixo mostra esse caso.
3. Vimos em um exemplo acima que o PEEFD pode levar a diferentes resultados, depen-
dendo da ordem de eliminacao das estrategias. Mesmo assim, qualquer equilbrio obtido
com o PEEFD sera um EN.
Exemplo 10: Considere o seguinte jogo com dois jogadores:
1 / 2 L R
U 1, 1 0, 0
D 0, 0 0, 0

Microeconomia 2 P
os Notas de Aula
Esse jogo possui dois EN, dados por (U, L) e (D, R). Nao existe equilbrio em estrategias
estritamente mistas. O EN (U, L) e tambem equilbrio em estrategias fracamente dominantes
(e pode ser obtido usando o PEEFD). O EN (L, D) e um equilbrio formado por estrategias
fracamente dominadas e portanto nao pode ser encontrado usando o PEEFD.
O Exemplo 10 mostra que pode existir um equilbrio formado por estrategias fracamente do-
minadas. Um equilbrio desse tipo e algo estranho, pois envolve cada jogador escolher uma
estrategia para a qual existe outra opcao que dara sempre um payoff maior ou igual, inde-
pendentemente do que os outros jogadores facam. Entao e difcil justificar que um equilbrio
em estrategias fracamente dominadas seja o resultado da interacao estrategica dos jogadores.
Existe um conceito de refinamento do EN para jogos na forma normal, chamado refinamento da
mao-tremula (Selten, 1975; Myerson, 1978), que exclui a possibilidade desse tipo de equilbrio
ocorrer, no sentido de que o EN formado por estrategias fracamente dominadas nao satisfaz
o refinamento da mao-tremula (pode se dizer tambem que esse EN nao e perfeito da m ao-
tremula).
Refinamentos do conceito de EN sao direcionados para eliminar EN que por algum motivo
nao sao considerados razoaveis. Nesse caso, existira algum ou alguns EN que satisfazem o
refinamento e algum ou alguns que nao o satisfazem.
O refinamento da mao-tremula considera a possibilidade de que os jogadores possam cometer

erros no momento da escolha da sua estrategia a ser jogada. O EN entao sera chamado perfeito
da mao-tremula caso satisfaca a condicao imposta pelo refinamento. No exemplo acima, apenas
o EN (U, L) e perfeito da mao-tremula. O EN (D, R) nao e perfeito da mao-tremula. Mas-
Colell et al. apresentam a formalizacao desse conceito, elaborado por Selten (1975) e Myerson
(1978).
Refer
encias
Aumann, R. J. (1974). Subjectivity and correlation in randomized strategies. Journal of
Mathematical Economics, 1 , 67-96.
Aumann, R. J. (1976). Agreeing to disagree. The Annals of Statistics, 4:6 , 1236-1239.
Aumann, R. J., & Brandenburger, A. (1995). Epistemic conditions for nash equilibrium.
Econometrica, 63:5 , 1161-1180.
Bernheim, B. D. (1984). Rationalizable strategic behavior. Econometrica, 52 , 1007-1028.
Myerson, R. B. (1997). Game theory: Analysis of conflict. Harvard University Press.
Nash, J. F. (1950). Equilibrium in points in n-person games. Proceedings of the National
Academia of Sciences, 36 , 48-49.
Nash, J. F. (1951). Non-cooperative games. Annals of Mathematics, 54:2 , 289-295.
Pearce, D. G. (1984). Rationalizable strategic behavior and the problem of perfection. Econo-
metrica, 52 , 1029-1050.
Polak, B. (1999). Epistemic conditions for nash equilibrium, and common knowledge of
rationality. Econometrica, 67:3 , 673-676.
von Neumann, J., & Morgenstern, O. (2007). Theory of games and economic behavior. Prin-
ceton University Press.

Microeconomia 2 P
os Notas de Aula

Notas de Aula 1 Teoria dos Jogos (Parte 2)
Jogos Bayesianos
1 Informac
ao Incompleta
Em um jogo de informacao incompleta os jogadores possuem informacao privada relevante para
o jogo, antes do seu incio, informacao nao compartilhada por todos os jogadores.
Portanto, informacao incompleta e diferente de informacao imperfeita, onde algum jogador

desconhece alguma escolha feita por outro jogador apos o incio do jogo.
Poderamos transformar um problema de informacao incompleta em um problema de in-

formacao imperfeita, modelando o jogo de modo que se inicie antes de qualquer diferenca
de informacao entre os jogadores.
Porem isso pode nao ser natural em muitos casos, como em leiloes, onde cada participante tem
a sua valoracao do bem a ser leiloado, informacao essa relevante para o leilao, e mais nenhum
outro participante conhece essa valoracao. A natureza da informacao incompleta pode ser de
varios tipos, como o payoff dos jogadores, as preferencias, etc (Myerson, 1997).
Logo, esses jogos sao modelados supondo que os jogadores escolhem suas estrategias ja pos-
suindo informacao privada. Como isso e feito?
Ideia Central Harsanyi (1967): Toda incerteza a respeito da informacao privada que um
jogador possui e descrita pelo seu tipo. Cada jogador sabe o seu tipo, mas desconhece o tipo
dos outros jogadores. A natureza escolhe o tipo de cada jogador antes do incio do jogo.
O tipo do jogador contem toda informacao privada relevante que ele possui sobre o jogo e que
nao e de conhecimento comum entre os outros jogadores. Como um jogador desconhece os
tipos dos outros jogadores, ele formara uma crenca (belief ) a respeito desses tipos. Esta
nota de aula baseia-se em Jehle and Reny (2011), paginas 319-325, Myerson (1997), paginas
67-83.
2 Jogo Bayesiano
Seja ti Ti uma variavel aleatoria escolhida pela natureza e observada apenas pelo jogador i.
Dizemos que ti e o tipo do jogador i. O conjunto T = T1 T2 TI e o domnio de toda
incerteza do jogo e incorpora toda informacao privada relevante que existe no jogo. Vamos
assumir que Ti e finito para todo jogador i.
A funcao utilidade do jogador i depende do seu tipo e dos tipos de todos os outros jogadores,
alem das estrategias de todos os jogadores, como de praxe. Entao temos que:
ui : S T R , ui = ui (s, t) ,
onde s = (s1 , . . . , sI ) S = S1 SI e t = (t1 , . . . , tI ) T = T1 TI . Logo, podemos

modelar casos em que a informacao de um jogador pode afetar o payoff de outro jogador.

Microeconomia 2 P
os Notas de Aula
Vamos supor que cada jogador i conhece Ti , ou seja, sabe quais podem ser os possveis tipos
que os outros jogadores podem vir a ser. Logo, cada jogador pode ser um e apenas um dos tipos
elencados no seu conjunto de tipos (ou seja, nao ha surpresas no sentido de que um jogador
revela ser um tipo fora de seu conjunto de tipos).
Precisamos agora apenas caracterizar a probabilidade de ocorrencia dos tipos. Vamos supor
que para cada jogador i, existe uma funcao de probabilidade subjetiva pi : Ti (Ti ). Logo,
para cada tipo ti do jogador i, pi especifica uma distribuicao de probabilidades pi ( | ti ) sobre o
conjunto Ti , que representa o sistema de crencas do jogador i sobre o tipo dos outros jogadores,
caso o tipo de i seja ti . Portanto, pi (ti | ti ) e a probabilidade que o jogador i, quando do tipo
ti , atribui a que os outros jogadores sejam do tipo ti . Temos entao que:
X
0 pi (ti | ti ) 1, ti Ti e pi (ti | ti ) = 1 ,
ti Ti
para todo tipo ti , todo jogador i.
Definic
ao 7.10: Jogo de Informac ao Incompleta. Um jogo de informacao incompleta (ou
jogo Bayesiano) e descrito pela colecao:
G = (pi , Ti , Si , ui )Ii=1 ,
onde para cada ti Ti , pi ( | ti ) e uma distribuicao de probabilidade sobre Ti , e ui : ST R.

Se I e finito, e Si e Ti sao finitos para todo i, dizemos que G e um jogo finito de informacao
incompleta.
Assumimos que cada jogador i conhece toda a estrutura do jogo Bayesiano G = (pi , Ti , Si , ui )Ii=1 ,
do modo definido acima, e o seu proprio tipo ti . Esse fato e de conhecimento comum dos
jogadores. Alem disso, cada jogador sabe que todos os outros jogadores conhecem o seu proprio
tipo (e isso tambem e de conhecimento comum do jogo).
Vamos chamar o objeto de escolha em um jogo Bayesiano de acao. Isso e consistente com a
definicao de acao para jogos na forma extensiva, que veremos a seguir. A ideia e que uma
acao define um plano contingente completo de jogadas que o indivduo considera factvel, ap
os
conhecer o seu tipo. Ja uma estrategia abarca um plano contingente completo, para todas as
situacoes possveis, antes de o jogador saber o seu tipo.
Exemplo: Vendedor vs Comprador. Suponha um objeto qualquer posto a venda, em que

cada parte da transacao saiba apenas a sua valoracao. Suponha que esse valor esta entre R$
1 e R$ 100, com probabilidade igual para cada valor. Ou seja, Ti = {1, 2, 3, . . . , 100}, para
i = v, c, onde v denota o vendedor do objeto e c um potencial comprador, e pi (ti | ti ) = 1/100,
para todo ti Ti , ti Ti , i = v, c. Cada jogador anuncia um valor si , i = v, c, onde
si {0, 1, 2, 3, . . . , 100}. Suponha que se sc sv , entao a venda do objeto ocorre, com preco
igual a (sv + sc )/2. Assumindo que os jogadores sao neutros ao risco, temos que:
sv + sc
Utilidade do vendedor: uv (s, t) = tv ,
2
sv + sc
Utilidade do comprador: uc (s, t) = tc .
2
Se sc < sv , entao a venda do objeto nao ocorre e uv (s, t) = uc (s, t) = 0. Com isso, completamos
a caracterizacao do jogo.

Microeconomia 2 P
os Notas de Aula
3 Consist
encia
Definic
ao: Consist encia do Sistema de Crencas (Myerson, 1997). Dizemos que o
sistema de crencas (pi )iI e consistente se existir umaPdistribuicao comum a priori p sobre o
conjunto de tipos T (0 p (t) 1, para todo t T , e tT p (t) = 1) tal que a crenca de cada
jogador e igual à distribuicao condicional de p, calculada usando a regra de Bayes:
p (ti , ti )
pi (ti | ti ) = P ,

ti Ti p (ti , ti )
para todo t T , para todo jogador i I.
Observe que no exemplo acima, p(t) = 1/10000, para todo t {1, 2, . . . , 100} {1, 2, . . . , 100}
mostra que as crencas acima sao consistentes, pois:
p (ti , ti ) 1/10000 1
pi (ti | ti ) = P = = ,

ti Ti p (t i ,
ti ) 100/10000 100
para todo ti Ti , para todo ti Ti , para todo jogador i.
A hipotese de consistencia simplifica bastante o modelo. Neste caso, o jogo pode ser caracte-
rizado por G = (p, Ti , Si , ui )Ii=1 . Mais ainda, em um modelo consistente, diferencas em crencas
individuais sao justificadas apenas por diferencas na informacao que cada agente possui. Se as
crencas forem inconsistentes, essas diferencas podem ser geradas por diferencas de opiniao.
Mais especificamente, Aumann (1976) argumenta que toda diferenca nas crencas dos jogadores
e resultado de uma diferenca de informacao. Logo, segundo Aumann, seria natural supor que
todos os sistemas de crencas sejam derivados de umaP distribuicao conjunta p sobre o conjunto
de todos os tipos T (p(t) > 0, para todo t T , e tT p(t) = 1). Apesar de os jogadores
desconhecerem os tipos de seus rivais, a distribuicao p e de conhecimento comum entre os
jogadores. Essa hipotese e chamada common prior assumption (CPA).
Definic
ao: Jogos Bayesianos Equivalentes. Considere os dois jogos Bayesianos abaixo:
G1 = (pi , Ti , Si , ui )Ii=1
pi , Ti , Si , ui )Ii=1
G2 = (
Dizemos que G1 e G2 sao totalmente equivalentes se para todo jogador i existem funcoes
ai : Ti R e bi : T R tais que, para todo ti Ti , ai (ti ) > 0 e:
pi (ti | ti )
ui (s, t) = ai (ti )pi (ti | ti )ui (s, t) + bi (t) ,
para todo s S, ti Ti .
Logo, dois jogos sao totalmente equivalentes se as utilidade esperadas de cada jogador nos dois
jogos representarem a mesma preferencia. Neste caso, estamos representando o mesmo jogo,
apenas supondo utilidades esperadas diferentes mas equivalentes para cada jogador (observe que
as probabilidades acima sao subjetivas por isso podemos considerar funcoes de probabilidades
diferentes).
ao. Todo jogo Bayesiano G = (pi , Ti , Si , ui )Ii=1 finito e totalmente equivalente a um

Proposic
jogo Bayesiano com crencas consistentes.
Prova: Considere G = (pi , Ti , Si , ui )Ii=1 arbitrario e faca para todo jogador i:

1
pi (ti | ti ) = ti , e ui (s, t) = |Ti | pi (ti | ti ) ui (s, t) ,
|Ti |

Microeconomia 2 P
os Notas de Aula
pi , Ti , Si , ui )Ii=1
ou seja, bi (t) = 0, para todo t T e ai (ti ) = 1 para todo ti Ti . Entao Ge = (
e totalmente equivalente ao jogo original G e as crencas pi sao consistentes com a distribuicao
comum a priori p : T R dada por:
1
p (t) = ,
|T1 | |T2 | |TI |
o que conclui a demonstracao.
Portanto, para jogos de informacao incompleta G = (pi , Ti , Si , ui )Ii=1 , conforme definido acima,
a hipotese de consistencia nao e limitadora. Porem isso nao e verdade em geral. Por exemplo,
para modelos que assumem a hipotese de valores privados (private values assumption), ou
seja, em que a utilidade de cada jogador depende apenas das acoes escolhidas e do seu tipo,
ui : S Ti R, o resultado acima pode nao ser valido.
4 Equilbrio Bayesiano
Queremos definir uma solucao ou nocao de equilbrio para jogos de informacao incompleta.
O atalho desenvolvido por Harsanyi (1967) consiste em associar ao jogo Bayesiano um jogo
na forma estrategica G , de modo que essa associacao nao seja ambgua. Isso permite usar
conceitos definidos para jogos na forma estrategica para os jogos Bayesianos.
Vamos fazer isso tornando cada tipo ti Ti um jogador distinto. Como o conjunto dos tipos
Ti e finito para todo jogador i, podemos supor, sem perda de generalidade, que TiS Tj = ,
para todo i 6= j. Criamos um jogo artificial, onde o conjunto dos jogadores e T = iI Ti , ou
seja, cada tipo de cada jogador e um jogador nesse novo jogo.
Uma vez definidos os jogadores, precisamos caracterizar as estrategias que cada jogador pode
escolher. Obviamente, se o jogador e de um tipo referente ao jogador i no jogo Bayesiano
original, fazemos Sti = Si , para todo ti Ti , para todo i. Logo, o conjunto de todas estrategias
do jogo na forma estrategica pode ser denotado por:
|T | |T | |T |
S = S1 1 S2 2 SI I
Observe que S e igual (isomorfo) ao conjunto:
S = S1T1 S2T2 SITI ,
onde Si = SiTi = {si : Ti Si } e o conjunto de todas as funcoes que associam a cada tipo uma
estrategia. Logo, podemos lidar ou com S ou com S , dependendo do que for mais conveniente.
Finalmente, falta apenas definirmos as funcoes de payoff uti : S R associadas ao jogo na

forma normal. Para isso, fazemos:
X
uti (s ) = pi (ti | ti ) ui si (ti ), si (ti ), ti , ti

ti Ti
Definic
ao 7.11: Representac ao na Forma Normal. Seja G = (pi , Ti , Si , ui )Ii=1 um jogo
de informacao incompleta. O jogo na forma estrategica G = (Sti , uti )ti T definido acima e
chamado representacao agente/tipo associado ao jogo G.
Desse modo, obtemos o jogo na forma normal G que corresponde ao jogo de informacao incom-
pleta original, G = (p, Ti , Si , ui )Ii=1 . Portanto, transformamos o estudo de jogos de informacao

Microeconomia 2 P
os Notas de Aula
incompleta em um estudo de jogos na forma estrategica. Vamos definir o conceito de equilbrio

usando esse atalho.
Definic ao 7.12: Equilbrio Bayesiano. Um equilbrio de Nash Bayesiano (ENB, ou apenas

equilbrio Bayesiano) s = (s1 (), . . . , sI ()) do jogo de informacao incompleta G = (p, Ti , Si , ui )Ii=1
e um equilbrio de Nash para a representacao agente/tipo de G na forma estrategica G descrita
acima.
Teorema 7.3: Exist encia de ENB. Todo jogo finito de informacao incompleta possui pelo
menos um equilbrio de Nash Bayesiano.
O Teorema 7.3 e consequencia direta do Teorema de Nash (Theorem 7.2), que garante a
existencia de equilbrios de Nash para todo jogo finito na forma estrategica, quando consi-
deramos estrategias mistas.
O Teorema 7.3 trata cada jogador tipo ti do jogador i como um jogador separado que maximiza
a sua utilidade, dada a sua crenca a respeito dos outros jogadores. Para termos uma descricao
completa do equilbrio, precisamos ter uma lista de estrategias para todos os tipos de jogadores.
Ou seja, mesmo que o jogador i saiba o seu tipo, a sua estrategia de equilbrio e escolher uma
acao para cada tipo que ele poderia vir a ser. Isso e necessario por que mesmo que i conheca
o seu tipo, os outros jogadores nao sabem qual e o tipo de i (podemos dizer que nao sabem o
tipo de i que foi realizado). Entao, ex-ante cada jogador i tem utilidade dada por:
X
Ep [ui (si (ti ), si (ti ), ti , ti )] = si (ti ), si (ti ), ti , ti ) .
p(t) ui (
tT
Ex-post, a utilidade realizada e a que ocorre com os jogadores de fato escolhendo a acao asso-
ciada ao seu tipo ti realizado, que faz parte do equilbrio de Nash:
X
uti (s ) = Epi [ui (si (ti ), si (ti ), ti , ti ) | ti ] = pi (ti | ti ) ui (
si (ti ), si (ti ), ti , ti ) .
ti Ti
Portanto, um conjunto de regras de decisao (s1 (), . . . , sI ()) e um equilbrio de Nash Bayesiano
para o jogo G = (p, Ti , Si , ui )Ii=1 se, e somente se, para todo jogador ti temos que:
Epi ui (si (ti ), si (ti ), ti , ti ) | ti Epi ui (s0i , si (ti ), ti , ti ) | ti ,

para todo s0i Si , para todo ti Ti com probabilidade positiva de ocorrer.

Finalmente, observe que o Teorema de Existencia de Equilbrio acima nao exclui a possibilidade
de que o equilbrio Bayesiano envolva jogadores randomizando. Neste caso, denote por:
m = (mi ( | ti ))ti Ti , iI
um conjunto de estrategias mistas definidas para todos os jogadores. Entao, temos que para
todo si Si , ti Ti , e todo jogador i, mi (si | ti ) 0; e:
X
mi (si | ti ) = 1 ,
si Si
para todo ti Ti , para todo jogador i.

Entao o conjunto de estrategias m = (mi (si | ti ))ti Ti , iI e um equilbrio Bayesiano se para
todo i I, e para todo ti Ti , temos que:

X X Y
mi ( | ti ) argmax mj (sj | tj ) mi (si ) uti (s )
mi Si
ti Ti sS jIi

Microeconomia 2 P
os Notas de Aula
Exemplos 7.2 e 7.3. Duas firmas competem no preco, do modo de Bertrand. A firma 1 nao
conhece o custo marginal de producao da firma 2, que pode ser baixo ou alto, com a mesma
probabilidade. Nesse caso, T1 = {c1 } e T2 = {c2h , c2h }, com c1 = 0, c2l = 1 e c2h = 4. O conjunto
de estrategia de cada firma e o preco cobrado pelo bem produzido. O payoff da firma 2 depende
de seu custo marginal ser baixo ou alto. A demanda de mercado e 8 p, onde p e o menor
preco cobrado. Vamos supor que cada firma possa escolher apenas entre tres precos, p = 1,
p = 4 e p = 6.
Suponha a seguinte regra: se os precos anunciados forem diferentes, a firma que anunciou o
menor deles define o preco de equilbrio e fica com toda a demanda. Se as firmas anunciam
dois precos iguais, as duas firmas dividem o mercado caso o preco anunciado seja maior do
que o maior custo marginal. Caso o preco anunciado seja igual ao maior custo marginal, entao
a firma 1 fica com toda a demanda. O payoff de cada firma e dado pelo seu lucro, que e igual
a zero caso nao haja producao. Logo, os payoffs do jogo sao descritas pelas matrizes abaixo,
para cada tipo que a firma 2 venha a ser.
1 / 2l p2l = 6 p2l = 4 p2l = 1
p1 = 6 6, 5 0, 12 0, 0
1
p = 4 16, 0 8, 6 0, 0
1
p =1 7, 0 7, 0 7, 0
1 / 2h p2h = 6 p2h = 4 p2h = 1
p1 = 6 6, 2 0, 0 0, 21
p1 = 4 16, 0 16, 0 0, 21
p1 = 1 7, 0 7, 0 7, 0
Vamos encontrar as matrizes associadas à representacao agente/tipo do jogo Bayesiano acima.
Nesse caso, temos tres jogadores, 1, 2l e 2h, onde 2l e o jogador 2, tipo l e 2h e o jogador 2,
tipo h. A representacao na forma normal gera as matrizes abaixo.
Firma 1 escolhe p1 = 6
2l / 2h p2h = 6 p2h = 4 p2h = 1
p2l = 6 6, 5, 2 3, 5, 0 3, 5, 21
p2l = 4 3, 12, 2 0, 12, 0 0, 12, 21
p2l = 1 3, 0, 2 0, 0, 0 0, 0, 21
2l / 2h p2h = 6 p2h = 4 p2h = 1
p2l = 6 16, 0, 0 16, 0, 0 8, 0, 21
p2l = 4 12, 6, 0 12, 6, 0 4, 6, 21
p2l = 1 8, 0, 0 8, 0, 0 0, 0, 21
2l / 2h p2h = 6 p2h = 4 p2h = 1
p2l = 6 7, 0, 0 7, 0, 0 7, 0, 0
p2l = 4 7, 0, 0 7, 0, 0 7, 0, 0
p2l = 1 7, 0, 0 7, 0, 0 7, 0, 0
Observe que para o jogador 2l, p = 4 e estrategia fracamente dominante. Ja para o jogador 2h,
p = 6 e estrategia fracamente dominante. Eliminando as estrategias dominadas, encontramos
o seguinte equilbrio Bayesiano: 1 escolhe p = 4, 2l escolhe p = 4 e 2h escolhe p = 6. Neste
equilbrio, o jogador 1 obtem payoff 12, o jogador 2l obtem payoff 6, e o jogador 2h obtem
payoff 0. Portanto, exceto para a firma 2, caso ela seja de alto custo, as firmas obtem lucro
positivo, na presenca da informacao incompleta descrita neste exerccio. Ou seja, a competic
ao
de Bertrand nao necessariamente levara o lucro a zero quando houver informacao incompleta.
Finalmente, e possvel mostrar que existem outros EN para este jogo.

Microeconomia 2 P
os Notas de Aula
5 Leil
ao de Primeiro Pre
co
Suponha um leilao de envelope fechado, onde cada comprador faz uma oferta (fechada) inde-
pendentemente dos outros jogadores. Vamos assumir apenas dois jogadores. Apos as ofertas
serem feitas, os envelopes sao abertos e vence o leilao quem fez a maior oferta, que paga o valor
da oferta feita (o outro jogador nao paga nada).
Vamos denotar por vi o valor do objeto leiloado para o jogador i, i = 1, 2. Cada jogador sabe o
valor de seu vi , porem desconhece a valoracao do seu oponente. Nesse caso, o jogador i assume
que vi U [0, 1], ou seja, que a valoracao do oponente e descrita por uma variavel aleatoria
com distribuicao uniforme entre [0, 1]. Essa informacao e de conhecimento comum entre os
jogadores.
Entao o tipo do jogador i e dado por v. Um equilbrio de Nash Bayesiano nesse jogo e caracte-
rizado por um par de funcoes de oferta (s1 (), s2 ()), onde si : [0, 1] [0, 1] e a funcao oferta do
jogador i, i = 1, 2. Como o jogo e simetrico, vamos procurar um equilbrio onde os jogadores
seguem estrategias identicas.
Vamos supor que a solucao e uma funcao crescente: s(v) e tal que quanto maior a valoracao
do indivduo, maior o lance dado. Logo podemos inverter a funcao s(v) e obter a funcao V (s),
que diz a valoracao do indivduo que da um lance igual a s.
Quando um comprador da um lance igual a s, a probabilidade de ganhar o leilao e igual à

probabilidade de que o outro jogador de um lance menor do que s:
p(v V (s)) = V (s) ,
ja que v U [0, 1].
Portanto, o payoff esperado do comprador com valoracao v e que da lance s e:
V (s) (v s) + (1 V (s)) 0 ,
onde assumimos que o payoff obtido em nao ganhar o leilao e 0.
A funcao lance otimo deve maximizar a expressao acima, cuja CPO e:
V 0 (s)(v s) V (s) = 0
Essa expressao diz que para cada valor v (o tipo do jogador), podemos encontrar a sua estrategia
otima. Em equilbrio devemos ter entao que:
(V (s) s)V 0 (s) = V (s) , s [0, 1] .
A solucao dessa EDO e:

V (s) = s + s2 + 2c ,
onde c e a constante de integracao. Vamos assumir que se v = 0, entao o lance e zero: s = 0.
Logo:
0 = 0 + 2c c = 0
Entao V (s) = 2s ou s = v/2.
Portanto, o equilbrio de Nash Bayesiano e caracterizado por s(v) = v/2, para os dois jogadores,
o que significa que cada jogador deve dar um lance igual à metade da sua valoracao do objeto.

Microeconomia 2 P
os Notas de Aula
Observacoes:
Nesse exemplo, o equilbrio e u

nico, mas isto nao e valido em geral. Em alguns jogos
pode ser conveniente mentir sobre o seu tipo.
O modo que procedemos para encontrar o equilbrio e padrao: chutamos que a es-
trategia (a funcao lance otimo) era crescente (invertvel) e da derivamos uma EDO que
essa funcao deve satisfazer.
6 Discuss
ao
Alguns pontos:
1. Dificuldade em definir o jogo: o que sao os tipos? Quais tipos considerar?
2. Qual sistema de crencas p considerar? Diferentes p (crencas a respeito dos outros joga-
dores) podem levar a diferentes solucoes.
possvel mostrar, sob condicoes razoavelmente gerais, que qualquer conjunto de regras
3. E
de decisao e um ENB para um determinado sistema de crencas. Ou seja, para qualquer
comportamento existe um sistema de crencas que o suporta como ENB (ver Ledyard
(1986))
Refer
encias
Aumann, R. J. (1976). Agreeing to disagree. The Annals of Statistics, 4:6 , 1236-1239.
Harsanyi, J. (1967). Games with incomplete information played by bayesian players. Manage-
ment Science, 14 .
Jehle, G., & Reny, P. (2011). Advanced microeconomic theory (3rd ed.). Pearson Education.
Ledyard, J. O. (1986). The scope of the hypothesis of bayesian equilibrium. Journal of
Economic Theory, 39:1 , 59-82.
Myerson, R. B. (1997). Game theory: Analysis of conflict. Harvard University Press.

Microeconomia 2 P
os Notas de Aula

Notas de Aula 1 Teoria dos Jogos (Parte 3)
Jogos na Forma Extensiva
1 Definico
es Iniciais
Sabemos que para descrevermos um jogo sao necessarios tres objetos:
Os jogadores (inclusive natureza),
A regra do jogo,
O resultado (payoff) do jogo.
Um jogo na forma extensiva, definido a seguir, e a representacao mais adequada para situacoes
dinamicas. A definicao abaixo mostra que para se caracterizar um jogo na forma extensiva
de maneira formal, e necessario definir uma serie de objetos, o que leva a uma caracterizacao
longa
Definic
ao 7.13: Jogo na Forma Extensiva. Representamos um jogo finito na forma
extensiva pelo conjunto:
= {I, A, X, E, , , I, (ui )iI }
onde:
1. I e o n
umero (finito) de jogadores (denotamos por 1 o jogador natureza, caso exista);
2. A e o conjunto de acoes, que inclui todas as acoes que podem ser tomadas em qualquer
ponto do jogo (A nao necessariamente e finito);
3. X e um conjunto de nos (ou historias cada no e uma descricao completa das acoes que
foram escolhidas ate o momento presente do jogo), tal que:
(a) X contem um elemento denotado x0 , chamado no inicial (ou historia vazia);

(b) Cada x X \{x0 } toma a forma x = (a1 , a2 , . . . , ak ) para algum n
umero finito de
acoes ai A, e
(c) Se (a1 , a2 , . . . , ak ) X \{x0 } para algum k > 1, entao (a1 , a2 , . . . , ak1 ) X \{x0 }.
Vamos denotar por A(x) o conjunto:
A(x) = {a A | (x, a) X}
de todas as acoes disponveis para o jogador que deve se mover apos a historia x X\{x0 }.
4. A(x0 ) A e um conjunto de acoes e e uma distribuicao de probabilidade sobre A(x0 )

que descreve o movimento da natureza no jogo. A natureza sempre se move primeiro e
uma unica vez, selecionando aleatoriamente uma acao em A(x0 ) usando a probabilidade
(logo, (a1 , a2 , . . . , ak ) X \{x0 } implica ai A(x0 ) para i = 1 apenas).

Microeconomia 2 P
os Notas de Aula
5. E e um conjunto de nos finais, definido por:

E = {x X | (x, a) 6 X para todo a A}
(cada no final descreve uma partida inteira em particular do jogo).
6. : X \ (E {x0 }) I e uma funcao que indica o jogador que joga no no de decis
ao
x X \(E {x0 }). Denotamos por:
Xi = {x X \(E {x0 }) | (x) = i }
o conjunto dos nos de decisao em que i joga.
7. I e uma particao do conjunto de nos de decisao X\(E {x0 }) em conjuntos de informacao,
de modo que se x e x0 pertencem ao mesmo elemento da particao I, entao:
(a) (x) = (x0 ) (mesmo jogador que escolhe), e
(b) A(x) = A(x0 ) (mesmas acoes disponveis).
O conjunto de informacao que contem o no de decisao x e denotado por I(x). Denotamos

por:
Ii = {I(x) | (x) = i, para algum x X \(E {x0 })}
o conjunto dos conjuntos de informacao em que i joga.
8. ui : E R, i = 1, 2, . . . , I e uma funcao de payoff esperado com domnio no conjunto
dos nos finais, descrevendo o payoff de cada jogador para todo partida completa possvel
do jogo.
Definic ao: Jogo Finito. Se os conjuntos de acoes A e o conjunto de nos X sao finitos, entao
dizemos que o jogo na forma extensiva = {I, A, X, E, i , , I, (ui )iI } (com finitos jogadores)
e finito.
Definicao: Jogo de Informac ao Perfeita. Um jogo na forma extensiva e de informac ao

perfeita se cada conjunto de informacao do jogo contem apenas um no de decisao (I(x) = {x}
ou #I(x) = 1, x X \(E {x0 })).
Logo, em um jogo de informacao perfeita, cada jogador observa todas as jogadas dos outros
jogadores escolhidas anteriormente.
Exemplo: Representac
ao em Arvore. Nos dois exemplos abaixo (e nos proximos), o payoff
na primeira linha e do jogador 1 e na segunda linha, do jogador 2.
Jogo de Informacao Perfeita Jogo de Informacao Imperfeita

1t 1t
@ @
E @
@D E @
@D
@ @
2 t @t 2 t 2 @t
A A A A
l A
A r l A
A r l A
A r l A
A r
A A A A
t At t At t At t At
1 0 0 3 1 0 0 3
3 0 0 1 3 0 0 1
Ler os Exemplos 7.4 (take-away game) e 7.5 (buyer-seller game).

Microeconomia 2 P
os Notas de Aula
Terminologia:
Dizemos que o no y sucede estritamente o no x se y = (x, a1 , . . . , ak ), para algum conjunto
{a1 , . . . , ak } A.
k = 1, dizemos que y sucede imeditamente x.
Dizemos que y sucede fracamente x se y = x ou se y sucede estritamente x.
Dizemos que um jogo e de memoria perfeita quando nenhum jogador se esquece do que ele ja
sabia (inclusive de acoes que ja foram tomadas durante o desenrolar do jogo).
Definicao 7.18: Jogo de Mem oria Perfeita. Um jogo na forma extensiva e de mem oria
perfeita se para dois nos quaisquer x e y = (x, a, a1 , . . . , ak ) que pertencem ao mesmo jogador,
entao todo no no mesmo conjunto de informacao de y tem a forma w = (z, a, a01 , . . . , a0l ), para
algum no z no mesmo conjunto de informacao de x.
A definicao acima de memoria perfeita assume que se um jogador i qualquer nao consegue
distinguir entre dois nos de decisao seus (ou seja, que pertencem ao mesmo conjunto de in-
formacao na definicao, y e w), entao essas historias y e w podem ser diferentes apenas com
relacao a acoes tomadas por outros jogadores, diferentes de i. Isto implica que nenhum jogador
se esquece das acoes que escolheu no passado. Portanto, se dois nos pertencem ao mesmo
conjunto de informacao do jogador i, entao a mesma sequencia de acoes de i levou a esses n
os.
O jogo ilustrado na figura abaixo nao apresenta memoria perfeita. Nesse jogo, o jogador 1, na
terceira rodada do jogo, apos a sua escolha na primeira rodada e apos a escolha do jogador 2
na segunda rodada, nao se lembra de sua escolha feita na primeira rodada do jogo.
1
t x1
HH
HH
E H D
HH
H
HH
t
x2 jt
x3 H
@ 2 @
@ @
a @b a @b
@ @
t x4 @Rt
x5 @ t x6 @Rt
x7 @
A A 1 A A
A A A A
l A r l A r l A r l A r
A A A A

AA
U
AAU AAU AAU
No exemplo acima, representamos os nos de decisao dos jogadores por xi , i = 1, 2, . . . , 7.

Intuitivamente, vimos que e facil observar que o jogo nao e de memoria perfeita. Vamos checar
entao se ele de fato nao satisfaz a definicao acima. Para isso, basta observar que x4 e x6 , por
exemplo, sao nos de decisao que pertencem ao mesmo conjunto de decisao do jogador 1, e que
x4 = (x1 , E, a) e x6 = (x1 , D, a), onde x1 e um no de decisao do jogador 1. Logo, a acao
tomada por 1 em x1 e que leva a x4 e diferente da acao tomada por 1 em x1 que leva a x6 .
Como x4 e x6 estao no mesmo conjunto de informacao do jogador 1, isso significa que esse jogo
representa uma situacao em que 1 se esquece da acao tomada no no de decisao x1 , E ou D,
quando o jogo alcanca o conjunto de informacao I(x4 ) = {x4 , x5 , x6 , x7 }, um ponto do jogo em
que 1 novamente escolhe.

Microeconomia 2 P
os Notas de Aula
2 Relac
ao Entre Forma Normal e Forma Extensiva
2.1 Forma Estrat
egica Associada
Definicao 7.14: Estrat egias em Jogos na Forma Extensiva. Seja um jogo na forma
extensiva qualquer. Uma estrategia pura do jogador i para o jogo e uma funcao si : Ii A,
tal que si (I(x)) A(x), para todo x com (x) = i. Vamos denotar por Si o conjunto de
estrategias puras do jogador i no jogo .
A estrategia de um jogador em um jogo na forma extensiva e uma regra que determina a sua
escolha de acao em todos os conjuntos de informacao do jogo. Uma estrategia para o jogador
i e entao um plano contingente completo (uma regra de decisao completa) que especifica como
o jogador i jogara em toda e qualquer circunstancia do jogo. Se o jogo e finito, entao o
conjunto de estrategias de cada jogador e finito.
Dizer que uma estrategia e um plano contingente completo para o jogo significa dizer que
uma estrategia define acoes para todos os conjuntos de informacao do jogo, mesmo que esses
conjuntos de informacao nao sejam alcancados durante o jogo. Isso inclui definir acoes para
conjunto de informacoes onde a propria estrategia do jogador em questao torna essas acoes
irrelevantes.
Vamos denotar por s um conjunto de estrategias para o jogo em forma extensiva finito. Dado
s = s1 s2 sI e , podemos calcular o payoff esperado de cada jogador, representado
por E ui (s) ou apenas ui (s), para i = 1, 2, . . . , I.
Se cada jogador escolhe uma estrategia si Si , entao temos que foi jogada uma partida do
jogo e o resultado esta descrito em um dos nos finais do jogo . Desse modo, (Si , ui )iI define
um jogo na forma estrategica, chamado forma estrategica associada a .
Portanto, podemos estender todos os conceitos definidos anteriormente (dominancia, equilbrio

de Nash, etc) de jogos na forma estrategica para jogos na forma extensiva.
Um jogo representado na forma normal pode ser representado na forma extensiva sem ambi-
guidades? O contrario tambem e valido? A forma normal e uma estrutura mais simples de se
definir do que a forma extensiva, pois envolve uma quantidade menor de objetos matematicos.
A razao para isso e que uma estrategia condensa uma quantidade enorme de informacao sobre
as acoes escolhidas que compoem essa estrategia. Respondendo entao as duas perguntas, da
forma extensiva para a forma normal sim, mas o contrario nao e valido: a mesma forma normal
pode representar mais de um jogo na forma extensiva. A figura abaixo mostra dois jogos dife-
rentes que possuem a mesma representacao na forma normal, que se resume na representacao
de um jogo do tipo Cara ou Coroa discutido acima.
Jogador 1 escolhe primeiro Jogador 2 escolhe primeiro

1t 2t
@ @
Ca @ Co
@
Ca @ Co
@
@ @
t 2 @t t 1 @t
A A A A
Ca AA Co Ca AA Co Ca AA Co Ca AA Co
A A A A
t At t At t At t At
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1

Microeconomia 2 P
os Notas de Aula
Como todo jogo na forma extensiva possui uma u nica representacao na forma estrategica,
podemos adaptar os conceitos definidos anteriormente para jogos na forma estrategica (do-
minancia, equilbrio de Nash, etc) para jogos na forma extensiva, aplicando esses conceitos
para a representacao na forma normal do jogo na forma extensiva.
von Neumann and Morgenstern (2007) (publicado originalmente em 1944) argumentam que de
um modo geral, so e necessario conhecermos a forma normal para analisarmos um jogo. Se os
jogadores sao inteligentes, cada jogador pode planejar toda a sua regra de decisoes para o jogo
antes de o jogo comecar. Assim, ele monta a sua estrategia para o jogo.
Essa suficiencia da forma normal de um jogo e uma das ideias mais importantes da teoria de
jogos. Para jogos simultaneos, isso e claro. Porem, para jogos dinamicos, existe uma perda de
informacao quando representamos o jogo na forma estrategica. No exemplo acima, vemos que a
forma normal equivalente dos dois jogos sequenciais e a mesma logo a informacao perdida na
representacao do jogo na forma normal e apenas quem escolhe primeiro o lado da moeda. Essa
perda de informacao e irrelevante para a analise dos dois jogos e nao influencia os resultados
obtidos. Porem, essa perda de informacao sera sempre irrelevante ou existem casos em que ela
e relevante? Essa e uma questao em aberto na teoria.
2.2 Randomiza
c
ao
Existem dois modos de se definir randomizacao por parte dos jogadores em um jogo na forma
extensiva:
1. Randomizar a estrategia usada. Esse modo de randomizacao e o mesmo usado em jogos

estrategicos.
2. Randomizar em cada momento de jogar.
No primeiro modo, obtemos o conceito de estrategia mista visto anteriormente. No segundo

modo, obtemos o conceito de estrategia comportamental.
Definic ao: Estrategias Comportamentais. Seja um jogo na forma extensiva. Uma

estrategia comportamental bi para o jogador i especifica, para cada conjunto de informacao
I Ii e para cada acao a A(I), uma probabilidade bi (a, I) 0, onde:
X
bi (a, I) = 1 , I Ii ,
aA(I)
onde A(I) e o conjunto de acoes possveis no conjunto de informacao I.
Teorema de Kuhn (Kuhn, 1953). Para jogos na forma extensiva de memoria perfeita,
estrategia mista e estrategia comportamental sao modos de randomizacao equivalentes.
Logo, para toda estrategia comportamental bi de i, podemos encontrar uma estrategia mista
mi de i que resulta na mesma distribuicao sobre payoffs, quaisquer que sejam as estrategias,
mistas ou comportamentais, usadas pelos outros jogadores, e vice-versa. Isso implica que o
tipo de estrategia considerada, mista ou comportamental, e irrelevante para analise de jogos
finitos na forma extensiva de memoria perfeita.

Microeconomia 2 P
os Notas de Aula
2.3 Amea
cas N
ao-Crveis
Varios tipos de jogos possuem uma dinamica de acoes escolhidas em tempos diferentes. Em
alguns desses jogos, representa-los na forma normal e da encontrarmos os EN pode nao ser
adequado. Quando transformamos um jogo na forma extensiva para a forma normal e en-
contramos os EN do jogo nessa forma, alguns equilbrios podem nao ser crveis, baseados em
ameacas de um dos jogadores que nao sera cumprida nunca. Portanto, o principal problema
na resolucao de jogos dinamicos por meio de encontrar os EN da sua representacao na forma
normal diz respeito à credibilidade de uma estrategia que faz parte de um EN do jogo na forma
normal.
Exemplo: Monopolista e Firma Entrante (Fig. 7.12). Considere um mercado monopo-

lista. O monopolista (M ) mantem o mercado ameacando firmas entrantes (E) com uma guerra
de precos. Desse modo, o monopolio mantem seu lucro. Porem, se alguma firma de fato entrar,
a melhor estrategia para o monopolista e formar um cartel e dividir o lucro de monopolio, ja
que a guerra de precos traria prejuzos nao somente para a firma entrante, mas tambem para o
incumbente. Essa situacao estrategica e representada pelo seguinte jogo na forma extensiva.
Entrante
t
@
N
ao Entra @ Entra
@
@
@Rt Monopolista
@

0 @
@
2 Briga @ Acomoda
@
@R
@

1 1
1 1
A representacao na forma normal do jogo acima e:
Entrante/Monopolista Briga, se E entrou Acomoda, se E entrou

Nao entra 0,2 0,2
Entra -1,-1 1,1
Existem dois EN em estrategias puras para o jogo:
1. firma entrante (E) entrar, monopolista (M ) acomoda, se E entrou; e
2. firma entrante nao entra, monopolista briga se E entrar.
O segundo EN e baseado em uma ameaca vazia, nao-crvel : M faz uma ameaca, que se for
levada a serio, nao precisa ser cumprida, pois nesse caso E escolhe nao entrar. Porem, uma vez
que E entra, o melhor para M e se acomodar. O refinamento de perfeicao em subjogos, que ve-
remos a seguir, tem como principal objetivo eliminar equilbrios de Nash baseados em ameacas
nao crveis. Vamos dividir a analise: primeiro estudaremos jogos de informacao perfeita, depois
jogos de informacao imperfeita.

Microeconomia 2 P
os Notas de Aula
3 Jogos de Informac
ao Perfeita
Vamos primeiro analisar jogos de informacao perfeita, onde os jogadores estao perfeitamente
informados de todas as acoes previamente escolhidas quando for o seu momento de jogar
(I(x) = {x}, para todo no de decisao x). Jogos como damas, xadrez, etc sao jogos de in-
formacao perfeita.
O objetivo e desenvolver um refinamento que elimine equilbrios baseados em estrategias nao-

crveis, como no exemplo acima, onde o ideal seria encontrarmos (1, 1) como u nico payoff de
solucao da interacao estrategica entre o monopolista e a firma entrante descrita no exemplo
anterior. Portanto, queremos que as solucoes do jogo ainda sejam EN, mas queremos eliminar
os EN baseados em ameacas nao-crveis. O seguinte conceito e fundamental para obtermos
esse refinamento.
Princpio da Racionalidade Sequencial: A estrategia de um jogador qualquer deve espe-

cificar acoes otimas em cada conjunto de informacao do jogo desse jogador.
Esse princpio e implementado em um jogo finito na forma extensiva de informacao perfeita

pelo seguinte Algoritmo de Induc ao Reversa (backward induction algorithm, Def. 7.15):
1. Comece pelos nos de decisao finais da arvore (nos pen

ultimos: nos cujos sucessores sao
todos nos terminais);
2. Determine a escolha otima dos jogadores que jogam nesses nos (problema de maximizacao
individual, sem interacao estrategica). Logo, para cada no pen
ultimo x, encontre s(x) (x)
a acao que leva ao no final que maximiza o payoff do jogador (x) (no caso de mais
de uma acao levando ao payoff maximo, faca esse procedimento para cada uma dessas
acoes). Denote por ux o vetor de payoffs resultante.
3. Redesenhe a arvore, substituindo os nos penultimos por um no terminal, com payoff

definido pela escolha otima encontrada no passo 2, ux ;
4. Repita passos 1., 2. e 3. para o jogo reduzido, ate que uma acao tenha sido associada a
cada no de decisao (ou seja, ate chegar ao no inicial do jogo).
A solucao de inducao reversa para jogos com informacao perfeita se resume a que todos os
jogadores facam escolhas que maximizem o seu payoff sempre que for a sua vez de jogar. Na
pratica, o jogo e resolvido do fim para o comeco. No exemplo anterior, o u
nico EN que satisfaz
o princpio da racionalidade sequencial, implementado por este algoritmo de inducao reversa,
e (entrar,acomodar se E entrou).
Definic ao 7.15: Estrat egias de Induc ao Reversa. O conjunto de estrategias puras s =

s1 sI e uma estrategia de inducao reversa para o jogo na forma extensiva se e obtido
de acordo com o algoritmo de inducao reversa.
Teorema 7.4 (Kuhn). Se s e uma estrategia de inducao reversa do jogo finito na forma
extensiva de informacao perfeita, entao s e um equilbrio de Nash de .
Prova: Primeiro note que o algoritmo de inducao reversa e bem definido e leva a um conjunto
de estrategias sir = (sir ir ir
a que o jogo e finito. Temos que mostrar que sir e um
1 , s2 , . . . , sI ), j
EN. Suponha que nao. Entao existe (pelo menos) um jogador i para o qual existe s0i 6= sir i tal
que:
ui (s0i , sir ir ir
i ) > ui (si , si )
Devemos entao mostrar que isso leva a uma contradicao.

Microeconomia 2 P
os Notas de Aula
Corol ario 7.1. Todo jogo na forma extensiva finito de informacao perfeita tem um EN em
estrategias puras.
Corolario: Unicidade de Equilbrio. Se os payoffs de cada jogador sao diferentes nos nos
terminais do jogo finito na forma extensiva, para todos jogadores, entao existe um u
nico EN
que pode ser encontrado usando o algoritmo de inducao reversa.
No jogo Monopolista/Entrante acima, vimos que existem dois EN em estrategias puras, mas
apenas um EN pode ser obtido usando o algoritmo de inducao reversa. O algoritmo elimina
exatamente o EN baseado em uma ameaca nao-crvel, o monopolista abrir uma guerra de precos
caso o entrante de fato entre. Essa ameaca nao e crvel pois, uma vez que o entrante entrou
no mercado, se o monopolista fizer uma guerra de precos, ele proprio se prejudicara sem obter
qualquer ganho.
4 Jogos de Informac
ao Imperfeita
O algoritmo de inducao reversa acima so se aplica para jogos de informacao perfeita. Porem a
ideia de racionalidade sequencial pode ser usada tambem para jogos de informacao imperfeita
por meio de um algoritmo similar de inducao reversa. A ideia central e definir subjogos do
jogo principal (Selten, 1965, 1975).
Definic
ao 7.16: Subjogo. Um subjogo de um jogo na forma extensiva e um subconjunto
do jogo tal que:
(i) Se inicia em um conjunto de informacao que contem apenas um u
nico no de decisao;
(ii) Contem todos os nos que sao sucessores desse no inicial; e
(iii) Se o no de decisao y pertence ao subjogo, entao todo z I(y) tambem e no sucessor do

no inicial x.
Podemos condensar a definicao acima na Def. 7.16 usada no livro-texto, que afirma que um no
de decisao x define um subjogo se I(x) = {x} e sempre que y for um no de decisao que sucede
x, e z um no que esta contido no conjunto de informacao de y, entao z tambem sucede x.
Entao se o no x define um subjogo, todos os jogadores sabem que estao em x quando x for
alcancado. Cada subjogo pode ser visto como um jogo por si so.
Exemplo (Fig. 7.17). O jogo na forma de arvore abaixo possui dois subjogos.
1 Out
t 2
2
In
t1
@
@
L @R
@
t 2 @t
@
A A
A A
l A r l A r
A A
t

At
A t

At
A
1 0 0 3
3 0 0 1

Microeconomia 2 P
os Notas de Aula
Definic ao 7.17: ENPS em Estrat egias Puras. O conjunto de estrategias puras s =

(s1 , s2 , . . . , sI ) do jogo na forma extensiva e um equilbrio de Nash Perfeito em Subjogos
(ENPS) se s induz um equilbrio de Nash em todo subjogo de .
Logo, o princpio de racionalidade sequencial e implementado em jogos de informacao imperfeita

exigindo que a solucao do jogo seja tal que as acoes que compoem essa solucao definam um EN
para cada subjogo do jogo.
Observe que um ENPS e um refinamento de EN: todo ENPS e um EN, ja que o proprio jogo
e um subjogo seu. O contrario nao e valido: existem EN que nao sao perfeitos em subjogos.
Teorema 7.5. Para todo jogo finito na forma extensiva de informacao perfeita, o conjunto de
estrategias de inducao reversa e igual ao conjunto de ENPS em estrategias puras.
Logo, em jogos de informacao perfeita, o conjunto de ENPS coincide com o conjunto de EN

obtido usando o algoritmo de inducao reversa visto acima. Porem nem todo jogo de informacao
imperfeita possui um ENPS em estrategias puras. Precisamos entao considerar a possibilidade
de os jogadores randomizarem. O Teorema de Kuhn discutido acima mostra que, para jogos
de memoria perfeita, tanto faz considerarmos estrategias mistas ou estrategias comportamen-
tais. Vamos seguir o livro-texto, que utiliza estrategias comportamentais.
Definic
ao 7.19: ENPS. O conjunto de estrategias comportamentais b = (b1 , b2 , . . . , bI ) e um
ENPS do jogo na forma extensiva finito se b induz um equilbrio de Nash em cada subjogo
de .
Dada a equivalencia entre estrategias mistas e estrategias comportamentais, o Teorema 7.1

garante que o conjunto de estrategias comportamentais b e um EN de um jogo se, e somente
se, nenhum jogador possui uma estrategia pura que gere maior payoff, dadas as estrategias
comportamentais dos outros jogadores. Essa equivalencia tambem garante que todo ENPS e
um EN para jogos de memoria perfeita.
Teorema 7.6: Exist encia de ENPS (Selten, 1965, 1975). Todo jogo finito na forma
extensiva com memoria perfeita possui um ENPS.
A hipotese de memoria perfeita e necessaria. Existem exemplos de jogos que nao sao de
memoria perfeita, que nao possuem ENPS.
A prova do Teorema 7.6 utiliza o seguinte algoritmo geral de inducao reversa para jogos na
forma extensiva (sejam de informacao completa ou nao):
1. Comece pelo termino da arvore, ache os EN para todos os subjogos finais (subjogos que
nao possuem nenhum subjogo estrito), encontre a estrategia comportamental equivalente;
2. Substitua cada subjogo pelo payoff de um de seus EN;
3. Repita os passos 1. e 2. para o jogo reduzido, continue ate nao restar nenhum subjogo;
4. Repita 1., 2. e 3. para todos os EN encontrados (no caso de algum subjogo ter mais de
um EN).
Para jogos de informacao perfeita, esse algoritmo e igual ao algoritmo anterior (Def. 7.15). Para
jogos de informacao imperfeita, ele resulta em (pelo menos) um profile b de estrategias com-
portamentais. Para completarmos a prova do Teorema 7.6, precisamos mostrar que qualquer
profile b de estrategias comportamentais obtido usando o algoritmo de inducao reversa acima
e um ENPS, e que todo ENPS pode ser encontrado utilizando esse algoritmo (demonstracao
similar a do Teorema 7.5).

Microeconomia 2 P
os Notas de Aula
5 Jogos Repetidos
Em um jogo do tipo dilema dos prisioneiros, seria possvel obter cooperacao se repetssemos
o jogo diversas vezes? Com a repeticao, o n umero de estrategias de cada jogador aumenta.
Nesse caso, e possvel criar estrategias onde o jogador pune o outro, caso ele nao coopere.
Exemplo: Dilema dos Prisioneiros.
1 / 2 Confessar Nao Confessar
Confessar 3, 3 1, 5
Nao Confessar 5, 1 2, 2
Suponha que o jogador 1 adota a seguinte estrategia: na primeira interacao ele joga N C
(cooperar). Nos perodos seguintes, se o outro jogador escolheu N C (cooperar) no perodo
anterior, ele coopera hoje. Caso contrario, o jogador 1 escolhe C (nao cooperar). Essa estrategia
pode levar a algum tipo de cooperacao? Mais especificamente, existe algum equilbrio tal que
os jogadores venham a adotar estrategias cooperativas? Para jogos repetidos finitas vezes,
considerando ENPS, a resposta e negativa. Para jogos repetidos indefinidamente ou sem data
certa para terminarem, a resposta e positiva.
5.1 Repeti
cao Finita
O teorema abaixo mostra que se o dilema dos prisioneiros e repetido um n umero fixo (finito)
de vezes, o u nico equilbrio de Nash perfeito em subjogos sera formado pelo EN do jogo em
cada perodo que esta sendo jogado. Logo, nao e possvel obter o resultado eficiente com a
repeticao finita do jogo.
Teorema (Mas-Colell, Whinston, & Green, 1996). Seja dado por sucessivos Gt =
(Mit , uti ())Ii=1 (ou seja, um jogo onde em cada perodo t se joga um jogo simultaneo), t =
1, 2, . . . , T < +. Suponha que os jogadores observam as estrategias puras jogadas em cada
jogo, imediatamente apos a conclusao do jogo, e que o payoff de cada jogador e dado pela
soma dos payoffs obtidos em todos os Gt . Se existe um u nico EN st para cada Gt , entao
existe um u nico ENPS para , que consiste em cada jogador escolhendo sti em cada jogo Gt ,
independentemente do que foi feito antes.
O Teorema acima tem uma consequencia implcita importante, a de eliminar qualquer de-
pendencia historica nas estrategias. Ou seja, tudo o que ocorreu antes e irrelevante para
decidir o que fazer hoje. Para jogos que satisfacam as condicoes da proposicao, um ENPS n
ao
depende da historia ocorrida no jogo em nenhum momento.
Por exemplo, o teorema acima tem como consequencia o fato que afirmamos acima, que o dilema
dos prisioneiros jogado repetidamente, por um perodo determinado, continua sempre tendo a
mesma solucao nao cooperativa entre os jogadores em cada rodada do jogo. Esse resultado e
consequencia da hipotese de racionalidade sequencial. Por inducao reversa, na u
ltima rodada,
e melhor nao cooperar. Resolvendo de tras para diante, obtemos nao-cooperacao para todas
as rodadas do jogo.
Intuitivamente, esse resultado ocorre pelo fato de o jogo ter uma data de termino conhecida
pelos jogadores. Resolvendo o jogo por inducao reversa, cada jogador percebe que o seu rival
ira descumprir o acordo de cooperacao na u
ltima vez que interagirem. Eles se adiantam a isso
e nao cooperam na u ltima rodada. Sabendo disso, os jogadores tambem nao irao cooperar na
pen ultima rodada do jogo. Usando esse argumento, obtemos que os jogadores nao cooperam
em nenhuma rodada do jogo. O teorema, consequencia da definicao de ENPS, leva a resultados
considerados pouco razoaveis, como mostra o exemplo abaixo.

Microeconomia 2 P
os Notas de Aula
Exemplo: Jogo da Centopeia 1. Considere o seguinte jogo.
Is C II
s C
Is C II II
s C . . . . . . . . . . . . .s C
I
s C II
s C (100 100)
P P P P P P P

1 0 2 1 97 99 98
1 3 2 4 100 99 101
Para este jogo, o unico ENPS e cada jogador escolher P em todo momento do jogo. Isso leva
ao payoff de equilbrio (1, 1), o que mostra que a nocao de ENPS pode levar a comportamen-
tos extremos, em que os jogadores obtem payoffs muito menores do que poderiam obter se
cooperassem. Existem varios estudos experimentais sobre o jogo da centopeia, que procuram
exatamente analisar se esse u nico ENPS e de fato o resultado do jogo. Um estudo classico e o
de McKelvey and Palfrey (1992).
Exemplo: Jogo da Centopeia 2. Considere a seguinte versao do jogo da centopeia. Neste

jogo, os dois participantes podem continuar o jogo ou parar. A cada vez que eles decidem
continuar, o valor do montante que o jogo oferece e multiplicado por 10, iniciando com o valor
de R$ 1. Eles podem, alternadamente, decidir continuar a aumentar o montante quatro vezes,
ou seja, o montante pode ir ate R$ 10.000. Porem, nesta u ltima etapa, o jogador que decide
(jogador 1), pode escolher ou dividir o valor e, portanto, cada um dos jogadores recebe R$ 5.000
(uma solucao cooperativa), ou pode decidir ficar com os R$ 10.000 inteiros. Isso vale nas etapas
anteriores, onde neste caso o jogador que decide pode ou continuar o jogo, multiplicando por 10
o valor acumulado ate entao, ou decidir terminar o jogo e ficar com o total do valor acumulado.
Assim como a versao anterior do jogo da centopeia, nesta versao, o u nico ENPS consiste em
jogar P em todo no de decisao, ou seja, o jogador recebe R$ 1 e o jogador 2, 0. Portanto, temos
uma solucao em que os jogadores nao cooperam nunca e, desse modo, dividem o menor valor
possvel do jogo.
Is IIs Is IIs Is

C C C C Divide 5.000
5.000
P P P P P

1 0 100 0 10.000
0 10 0 1000 0

Microeconomia 2 P
os Notas de Aula
5.2 Repeti
cao Infinita
Se o jogo for repetido infinitamente (ou se ele nao tiver uma data certa para terminar), pode-se
mostrar que o resultado eficiente em cada rodada do jogo pode ser obtido como equilbrio,
dependendo do quanto os jogadores descontem o futuro (ou da probabilidade de o jogo terminar
na rodada seguinte).
As estrategias que levam a esse tipo de equilbrio sao chamadas estrategias gatilho (trigger
ou Nash-reversion strategies). Um exemplo e a estrategia olho-por-olho (tit-for-tat), onde a
estrategia de hoje do jogador e igual à estrategia usada pelo seu adversario ontem.
Considere novamente a seguinte estrategia para o i, i = 1, 2: na primeira interacao ele joga

N C (cooperar). Nos perodos seguintes, se o outro jogador escolheu N C (cooperar) no perodo
anterior, ele coopera hoje. Caso contrario, o jogador i escolhe C (nao cooperar). Suponha que
a taxa de desconto intertemporal e 0 < < 1. Temos que o jogador 2 cooperara se:

X X 2 3
2 t 1 + 3 t 1 +
t=0 t=1
1 1
Logo, se
1
,
2
entao o resultado cooperativo ((N C, N C) todo perodo) e obtido como equilbrio (e um equilbrio
de Nash perfeito em subjogos).
Portanto, dependendo da taxa de desconto intertemporal e dos payoffs obtidos desviando do

equilbrio cooperativo e seguindo o equilbrio cooperativo, podem existir equilbrios em que os
jogadores adotem estrategias que envolvem cooperacao. Esse resultado e conhecido como Folk
Theorem (Friedman, 1971; Rubinstein, 1979).

Microeconomia 2 P
os Notas de Aula
6 Equilbrio Sequencial
Para certos jogos, ENPS nao e um conceito de solucao adequado. O exemplo abaixo e um caso
em que isso ocorre.
Exemplo 1. Considere o seguinte jogo na forma extensiva.
Entrante n
E
t 0
@ 2
@
E1 @ E2
@
t Monopolio @t
@
A A
A A
Br A Ac Br A Ac
A A

AA
A
A
1 3 1 2
1 0 1 1
A representacao desse jogo na forma estrategica e:
E / M Br Ac
nE (0, 2) (0, 2)
E1 (1, 1) (3, 0)
E2 (1, 1) (2, 1)
O jogo acima possui dois EN em estrategias puras: (nE, Br se Entrante entra) e (E1 , Ac se
Entrante entra). Esses EN sao tambem ENPS, pois o unico subjogo desse jogo e o proprio jogo.
Nesse caso, o refinamento de perfeicao em subjogos nao elimina o equilbrio ruim (N E, Br
se Entrante entra), baseado em uma ameaca nao-crvel.
Queremos eliminar o equilbrio ruim, ainda usando o princpio da racionalidade sequencial.

Para isso temos que introduzir um novo conceito, crencas, de modo que, no exemplo acima,
o jogador Monopolista possua uma crenca sobre a estrategia que a Firma Entrante escolheu,
uma vez que esta u
ltima decidiu entrar.
Exemplo 2 (Fig. 7.27). Considere o seguinte jogo.

0 L 1t
5 @
@
M @R
@
p(x) tx 2 y@t p(y)
@
A A
A A
l m A r
l m A r
A A
AA AA

4 1 0 0 1 4
0 1 4 4 1 0

Microeconomia 2 P
os Notas de Aula
O profile de estrategias (L, m se 1 jogou M ou R) e o u nico ENPS (e tambem o u nico EN)

em estrategias puras desse jogo. Logo, perfeicao em subjogos nao impoe nenhuma disciplina
(ou consistencia) na parte do jogo nao alcancada, quando 1 escolhe L.
Vamos analisar se essa ameaca de jogar m por parte do jogador 2 e crvel, assumindo que o
jogador 2 tem um sistema de crencas a respeito da jogada escolhida por 1. Se 2 pode jogar (ou
seja, que este conjunto de decisao nao-trivial e alcancado), ele sabe que deve estar ou no no x
ou no no y.
Suponha portanto que 2 tem o seguinte sistema de crencas p descrito por:
p(x) = probabilidade que 2 acha que o no x foi alcancado (ie, que 1 jogou M );
p(y) = probabilidade que 2 acha que o no y foi alcancado (ie, que 1 jogou D).
Nesse caso, os payoffs esperados de 2 para cada uma de suas estrategias disponveis sao:
Eu2 (l) = 4p(y) , Eu2 (m) = 1 e Eu2 (r) = 4p(x) .
Apesar de nao sabermos nada sobre o sistema de crencas de 2 (os valores exatos de p(x) e
p(y)), podemos afirmar que uma vez que 2 pode jogar, ele nunca escolhera a estrategia m, ja
que a estrategia mista s = (1/2 l; 0 m; 1/2 r) domina m estritamente:
Eu2 (s) = 2 > 1 = Eu2 (m) ,
qualquer que seja o sistema de crencas p de 2. Ou seja, o equilbrio (L, m se 1 jogou M ou R)

e formado por uma ameaca nao-crvel, e satisfaz o criterio de perfeicao de subjogos. Queremos
entao refinar o conceito de ENPS para eliminar equilbrios pouco razoaveis como o encontrado
para o jogo desse exemplo.
Definic
ao: Sistema de Crencas. Um sistema de crencas para o jogo na forma extensiva
e uma especificacao de probabilidades p(x) [0, 1] para cada no de decisao x do jogo tal que
X
p(x) = 1 ,
xI
para todo conjunto de informacao I de .
Um sistema de crencas diz qual e a crenca de cada jogador de estar em algum no do conjunto
de informacao I, condicional a estar nesse conjunto de informacao I. Entao um sistema de
crencas define probabilidades em cada conjunto de informacao, em todo o jogo, para todos
os jogadores. Observe que podemos nos restringir a definir o sistema de crencas apenas para
conjuntos de informacao nao-triviais (com mais de um no de decisao). Iremos proceder desse
modo, para simplificar a notacao. Note entao que nao faz sentido usar o conceito de crencas
para jogos na forma extensiva de informacao perfeita.
Considere o par (p, b) de sistema de crencas e estrategias. Interpretamos p como o sistema de

crencas dado que os jogadores escolhem as estrategias definidas em b. A questao fundamental
e decidir que tipo de estrutura/hipoteses exigiremos que o par sistema de crencas/estrategias
satisfaca. Diferentes hipoteses levam a diferentes nocoes de equilbrio. A primeira hipotese que
exigiremos que seja satisfeita e a de racionalidade sequencial, definida abaixo para esse novo
contexto em que introduzimos a nocao de sistemas de crencas.
Considere o par (p, b) de sistema de crencas e estrategias e um conjunto de informacao I Ii .

Vamos denotar por ui (b|x) o payoff do jogador i se o no x I e alcancado, dado o conjunto

Microeconomia 2 P
os Notas de Aula
de estrategias comportamentais b. O jogador nao sabe exatamente qual no foi alcancado, se

estivermos em um conjunto de informacao nao-trivial. O sistema de crencas p permite calcular
o payoff esperado desse jogador, dado que ele esta no conjunto de informacao I. Vamos entao
denotar por: X
vi (p, b | I) = p(x) ui (b | x)
xI
o payoff esperado do jogador i quando o conjunto de informacao I e alcancado, dado o sistema

de crencas p e as estrategias b.
Definic ao 7.21: Racionalidade Sequencial. O par (p, b) do jogo finito na forma extensiva
e sequencialmente racional se para todo conjunto de informacao I do jogador i, para todo
i = 1, . . . , I, temos que:
vi (p , b | I) vi (p , (b0i , bi ) | I) ,
para toda estrategia comportamental b0i de i.
Observe que o sistema de crencas permite implementar a nocao de racionalidade sequencial em

todo conjunto de informacao do jogo, mesmo para conjuntos de informacao que nao tenham
sido alcancados pela estrategia analisada.
Dizemos que o conjunto de estrategias comportamentais b do jogo na forma extensiva e

sequencialmente racional se existir algum sistema de crencas p tal que o par (p, b) seja sequen-
cialmente racional. Observe que a definicao acima de racionalidade sequencial exige que cada
jogador faca escolhas otimas em cada um dos seus conjuntos de informacao, dado o sistema de
crencas que possui, dadas as estrategias dos outros jogadores.
Exemplo 3 (Fig. 7.34). Considere o jogo de Cara e Coroa representado na forma extensiva
abaixo.
1t
@
@
Ca @ Co
@
p(x) t x y@t p(y)
@
2
A A
A A
Ca A Co Ca A Co
A A

AA
A
A
1 1 1 1
1 1 1 1
Suponha que os jogadores 1 e 2 jogam Cara com probabilidade 1 e o jogador 2 acha que 1
jogou Coroa com probabilidade 1 (p(x) = 0, p(y) = 1). Sabemos que as estrategias (Ca, Ca)
nao constituem um equilbrio de Nash, mas o par estrategias/crencas ((Ca, Ca), p(x) = 0) e
sequencialmente racional, pois o jogador 1 obtem o payoff mais alto possvel e o jogador 2,
segundo suas crencas, obtem o payoff esperado mais alto:
v2 (p, b | I) = p(x)u2 (Ca, Ca | x) + p(y)u2 (Co, Ca | y) = 1 .
O Exemplo 3 acima deixa claro que racionalidade sequencial e insuficiente para definirmos uma
nocao de equilbrio satisfatoria. Neste caso, encontramos estrategias e crencas sequencialmente
racionais, mas que nao chegam nem a constituir um equilbrio de Nash. Precisamos entao
impor outras condicoes para obter um conceito de equilbrio satisfatorio. No exemplo, fica

Microeconomia 2 P
os Notas de Aula
claro que o problema e causado por uma inconsistencia entre a estrategia do jogador 1, que
escolhe Cara, e a crenca do jogador 2, que acredita que 1 escolheu Coroa com certeza. Vamos
eliminar esse tipo de inconsistencia usando a propriedade 1 a seguir.
Propriedade 1 (P1): Regra de Bayes. Um sistema de crencas deve ser derivado das
estrategias usando a regra de Bayes, sempre que possvel.
Logo, para todo conjunto de informacao que possui probabilidade positiva de ser alcancado
no jogo, o sistema de crencas nesse conjunto de informacao deve ser derivado usando a regra
de Bayes. No Exemplo 3 acima, a u nica crenca que satisfaz a regra de Bayes para o par de
estrategias (Ca, Ca) e p(x) = 1, p(y) = 0. Portanto, a crenca considerada para o jogador 2
nesse exemplo, p(x) = 0, quando o jogador 1 escolhe Cara, nao satisfaz a regra de Bayes. O
exemplo a seguir mostra mais claramente como utilizamos a regra de Bayes para calcular o
sistema de crencas.
A regra de Bayes impoe um certo grau de consistencia no par (p, b) de estrategias e crencas.
Em equilbrio, os jogadores devem ter crencas corretas a respeito das estrategias usadas no
jogo, no sentido de que as crencas satisfazem a regra de Bayes, sempre que possvel, dado o
par de estrategias e crencas analisado.
Exemplo 4 (Fig. 7.28). Considere o pedaco de jogo abaixo, em que a randomizacao do

jogador 1 no seu no de decisao esta explicitada ao lado de cada acao.
1
v
@ HH
H
@ HH
4
@ H
2 3 1 HH 5
15 15 15 15 @ H 15
@ HH
rv @r w zHr
@ H
2
B B B
B B B
B B B
B B B
B B B
B B B
No exemplo acima, o sistema de crencas pode ser derivado usando a regra de Bayes, onde para
cada conjunto de informacao I, temos que:
P (x | b)
p(x) = P ,
yI P (y | b)
onde P (x | b) e a probabilidade do no x ser alcancado, dada a estrategia comportamental b.

Logo, temos que:
3/15 3 1/15 1 5/15 5

p(v) = = , p(w) = = , p(z) = = .
9/15 9 9/15 9 9/15 9
Dado o par (p, b), se algum conjunto de informacao (nao-trivial) nao for alcancavel pela es-
trategia b, entao nao podemos usar a regra de Bayes para encontrar o sistema de crencas
associado a` estrategia comportamental b considerada (denominador igual a zero na formula
acima da regra de Bayes). Nesses casos, pode ser razoavel ainda assim impor alguma estrutura
sobre o sistema de crencas, como o exemplo a seguir ilustra.

Microeconomia 2 P
os Notas de Aula
Exemplo 5 (Fig. 7.31). Considere o jogo representado (de modo incompleto) na arvore
abaixo, com tres jogadores, em que as estrategias comportamentais dos jogadores 1 e 2 consis-
tem em jogar F ora com probabilidade 1.
F ora 1
v
(1) @
@
@
L @R
@
F ora @
F ora
v p(x) 1 p(x) @v
@
2
(1) A A (1)
A A
A A
A A B A A B
A A
A A
p(y) v 3 A
A v1 p(y) p(z) v

3 AAv1 p(z)
A A A A
A A A A
A A A A
A A A A
Exemplo 6 (Mas-Colell et al., 1996). Considere o jogo representado na arvore abaixo, com
tres jogadores, onde um deles e a Natureza, que se move primeiro, usando as probabilidades
descritas na arvore. Considere que o jogador 1 escolhe A com probabilidade 1. Entao a regra
de Bayes nos diz que p(x) = 1/2, mas nao pode ser usada para inferir o sistema de crencas
do jogador 2. Vamos verificar se existe algum sistema de crencas que faz com que o profile de
estrategias (A, L) seja racionalmente sequencial. Note que:
v2 (A, L | p(y)) = p(y) 5 + (1 p(y)) 5 = 5

v2 (A, R | p(y)) = p(y) 2 + (1 p(y)) 10 = 10 8py
Logo, se 10 8p(y) < 5, ou seja, se p(y) > 5/8 = 0, 625, entao a racionalidade sequencial do
jogador 2 e satisfeita. Observe que para o par de estrategias (A, L) e as crencas p(x) = 1/2,
p(y) > 0, 625, a escolha da estrategia A do jogador 1 e otima. Conforme veremos adiante, o
par de estrategias e crencas ((A, L), (p(x) = 1/2, p(y) > 5/8)) e um equilbrio sequencial fraco.
Natureza
v
@
@
1/2 @ 1/2
@
@
@
v p(x) Jog. 1 1 p(x) @v
@
A A
A A
A A
A A B B A A
A A
A A
AAv v

p(y) Jog. 2
1 p(y) A
A
2 A A 2
A A
10 L A R L A R 10
AA A
A

0 5 0 5
5 2 5 10

Microeconomia 2 P
os Notas de Aula
O jogo acima, para as estrategias de 1 e 2 representadas em parenteses, nunca chega a ser jogado
e a regra de Bayes nao fornece nenhuma restricao sobre o sistema de crencas dos jogadores 2 e 3.
Mas e razoavel assumir que, se as crencas desses jogadores sao formadas de modo independente
(ou seja, a crenca do jogador 2 nao afeta a crenca do jogador 3, e vice-versa), entao p(y) = 0, 5.
Isso motiva a propriedade 2 abaixo.
Propriedade 2 (P2): Independ encia: Um sistema de crencas deve refletir o fato que os
jogadores escolhem suas estrategias independentemente.
Vamos analisar mais uma propriedade que iremos impor sobre o sistema de crencas. O Exemplo
7 a seguir motiva esta terceira propriedade.
Exemplo 7 (Fig 7.30). Considere o jogo representado (de modo incompleto) na arvore
abaixo, com tres jogadores, em que a estrategia comportamental do jogador 1 consiste em
jogar F ora com probabilidade 1 e do jogador 2 jogar B com probabilidade 1.
F ora 1
v
(1) @
@
L @R
@
@
@
p(x) v @v 1 p(x)
@
A 2 A
A A
(1)A B (1)A B
A AA A AA

v v

p(y) 3 1 p(y)
A A
A A
A A
E AD E AD
A A
A A
Para as estrategias consideradas, a regra de Bayes nao impoe nenhuma restricao sobre as
crencas dos jogadores 2 e 3. A hipotese de independencia do sistema de crencas diz que saber
a estrategia de 2 nao prove nenhuma informacao a 3 sobre o sistema de crencas de 2. Mas se
3 jogar, ele sabera que 2 escolheu a acao A. Mais ainda, ele sabe que estara no no y apenas
se 2 estiver no no x (ou seja, se 1 tivesse escolhido a acao L). Nesse caso, e razoavel assumir
que o sistema de crencas de 2 e 3 e tal que p(x) = p(y). Esse raciocnio motiva a propriedade
3 abaixo.
Propriedade 3 (P3): Crencas Comuns. Jogadores com a mesma informacao devem ter
crencas identicas.
Essas tres propriedades, (P1), (P2) e (P3), constituem hipoteses que iremos impor sobre o
sistema de crencas dos jogadores. As propriedades 2 e 3 se aplicam para crencas que pertencem
a conjuntos de informacao que nao sao alcancados, dada a estrategia considerada (fora do
caminho de equilbrio). Isso e a definicao um tanto informal dessas duas propriedades tornam
difcil verificar se um sistema de crencas satisfaz essas duas regras. A definicao de consistencia a
seguir fornece um algoritmo que, segundo o resultado que discutimos abaixo, permite verificar se
as tres propriedades acima (e algo alem dessas propriedades...) sao satisfeitas simultaneamente.

Microeconomia 2 P
os Notas de Aula
Definic
ao 7.20: Consist encia. Seja um jogo na forma extensiva. Dizemos que o par (p, b)
e consistente se existir uma sequencia {bn } de estrategias comportamentais completamente
mistas (atribui probabilidade positiva a todas acoes em todos os conjuntos de informacao) que
converge a b, tal que a sequencia de sistema de crencas {pn } associada a {bn } pela regra de
Bayes, converge a p.
possvel mostrar que a propriedade de consistencia implica a regra de Bayes e e mais forte do
E
que apenas impor a regra de Bayes. Ela e mais forte tambem do que impor a regra de Bayes
em cada subjogo do jogo. A propriedade de consistencia implica nao so as propriedades 1, 2 e
3 acima, mas tambem outras propriedades, conforme Kohlberg and Reny (1997) estabelecem
(ver os itens (i)-(iv) na pagina 354 do livro-texto).
Definic
ao 7.22: Equilbrio Sequencial. Um par (p, b) e um equilbrio sequencial se satisfaz
racionalidade sequencial e consistencia.
Equilbrio sequencial e um tipo de equilbrio com crencas. Para definirmos um determinado

equilbrio sequencial corretamente, temos que nao somente definir as estrategias dos jogadores
de equilbrio, mas tambem o sistema de crencas que suporta essas estrategias como um equilbrio
sequencial. Portanto, um equilbrio sequencial e composto pelas estrategias comportamentais
dos jogadores e pelo sistema de crencas que os jogadores possuem, onde esses dois objetos sao
relacionados pela regra de consistencia e pela racionalidade sequencial.
Teorema 7.7: Exist encia de Equilbrio Sequencial (Kreps & Wilson, 1982). Todo
jogo finito na forma extensiva de memoria perfeita possui pelo menos um equilbrio sequencial.
Se o par (p, b) e um equilbrio sequencial, entao o conjunto de estrategias comportamentais b e
um ENPS.
O Teorema de Kreps e Wilson mostra que equilbrio sequencial e um refinamento de ENPS,

que, por sua vez, e um refinamento de EN. Logo, equilbrio sequencial e um refinamento de
EN. A fim de verificarmos se um par (p, b) e um equilbrio sequencial, devemos checar dois
pontos: (i) (p, b) satisfaz racionalidade sequencial; e (ii) p e consistente.
Exemplo 8. Se usarmos o conceito de consistencia no Exemplo 5, para verificar se ele impoe

alguma restricao no sistema de crencas, veremos que qualquer sistema de crencas consistente
com as estrategias descritas no exemplo, em que o jogador 3 nao chega a participar do jogo,
deve satisfazer p(y) = p(z).
Exemplo 9. Vamos analisar novamente o Exemplo 6 acima, considerando que o jogador 1

escolhe a estrategia A. Sabemos que a regra de Bayes nao impoes qualquer restricao sobre o
sistema de crencas do jogador 2. Vamos verificar se a regra de consistencia acima impoe alguma
restricao sobre p(y). Observe que qualquer que seja a sequencia {bn } de sistema de estrategias
comportamentais completamente mistas que considerarmos, como o conjunto de informacao de
2 e alcancado pela escolha da estrategia B do jogador 1, todo sistema de crencas associado a
essa sequencia pela regra de Bayes tera pn (y) = 1/2, para todo n N. Logo, o u nico sistema
de crencas consistente para o jogador 2 e p(y) = 1/2. Entao racionalidade sequencial para o
jogador 2 implica que ele deve escolher R:
v2 (, L | p(y) = 1/2) = 5 < 6 = 0, 5 2 + 0, 5 10 = v2 (, R | p(y) = 1/2)
Nao e difcil portanto perceber que ((B, R), (p(x) = 1/2, p(y) = 1/2)) e o u
nico equilbrio
sequencial desse jogo.
Observe que no Exemplo 6, vimos que se exigirmos apenas que o sistema de crencas satisfaca
a regra de Bayes, ((A, L), (p(x) = 1/2, p(y) > 5/8)) e um par de estrategias e crencas racional-
mente sequenciais e que satisfaz a regra de Bayes. Entao esse exemplo deixa claro que a regra

Microeconomia 2 P
os Notas de Aula
de consistencia realmente impoe uma restricao maior sobre o sistema de crencas do que a regra
de Bayes apenas.
Exemplo 10 (Fig. 7.29). Considere o jogo abaixo, onde em parenteses estao representadas
as estrategias comportamentais dos jogadores.
1s
@
(1) @ (0)
@
@s 2
@
@
( 31 ) @ (2)
@3
p(x) s @s 1 p(x)
@
3
A A
A A
A A
AA AA
Dada a estrategia do jogador 1 considerada, os jogadores 2 e 3 nao jogam e, portanto, nao

podemos usar a regra de Bayes para derivar o sistema de crencas do jogador 3. Vamos verificar
se a propriedade de consistencia impoe restricao sobre p(x). Considere a sequencia (bn ) de
estrategias comportamentais completamente mistas, em que para o jogador 1 temos que bn1 1
e 1 bn1 0 e para o jogador 2, bn2 1/3 e 1 bn2 2/3, com 0 < bn1 < 1 e 0 < bn2 < 1, para
todo n N. Usando a regra de Bayes para derivar a sequencia de sistemas de crencas (pn )
associada a essa sequencia de estrategias completamente mistas (bn ), obtemos:
(1 bn1 ) bn2 1
pn (x) = n n n
= bn2
(1 b1 ) [b2 + (1 b2 )] 3
Logo, qualquer sistema de crencas consistentes leva a p(x) = 1/3, ou seja, restringe para esse
jogo um sistema de crencas que esta fora do caminho de equilbrio.
Observe que podemos interpretar esse resultado do seguinte modo: 3 saber se 1 joga Esquerda
ou Direita nao afeta a sua crenca sobre a probabilidade que 2 escolha Esquerda ou Direita
(pois, no limite, 1 nao joga Direita e esse caminho de jogo em que o conjunto de informacao
de 3 e alcancado nao ocorre). Como 2 escolhe Esquerda com probabilidade 1/3 e Direita
com probabilidade 2/3, entao a crenca de 3 reflete apenas essa escolha de 2: p(x) = 1/3,
1 p(x) = 2/3.
Exemplo 11: Considere o jogo e a estrategia comportamental descritos no Exemplo 7. Vamos

verificar que a regra de consistencia implica p(x) = p(y). Considere a sequencia de estrategias
completamente mistas (bn ) que converge para a estrategia considerada no Exemplo 6. Entao
bn1 (F ) 1, bn1 (L) 0, bn1 (R) 0, bn2 (A) 0 e bn2 (B) 1 (e todas essas randomizacoes sao
maiores do que 0 e menores do que 1). Entao:
bn1 (L)
pn (x) = , n N
bn1 (L) + bn1 (R)
Ja para o sistema de crencas do jogador 3 temos que:
bn1 (L) bn2 (A) bn1 (L)
pn (y) = = = pn (x) , n N
bn1 (L) bn2 (A) + bn1 (R) bn2 (A) bn1 (L) + bn1 (R)
Logo, qualquer sistema de crencas consistente com a estrategia considerada impoe a restricao
p(x) = p(y).
Exemplo 7.7 (Cara e Coroa Sofisticado). Analisar esse jogo.

Microeconomia 2 P
os Notas de Aula
7 Outros Conceitos de Equilbrios com Cren

cas
Existem outros conceitos de equilbrio com crencas, como, por exemplo:
Equilbrio Bayesiano Perfeito-Fraco (EBPf, tambem chamado Equilbrio Sequencial Fraco):

(p, b) e um EBPf se satisfaz racionalidade sequencial e regra de Bayes, sempre que possvel.
Equilbrio Bayesiano Perfeito (EBP): (p, b) e um EBP se satisfaz racionalidade sequencial

e regra de Bayes, sempre que possvel, em todo subjogo do jogo principal.
Logo, diferentes requerimentos sobre o sistema de crencas geram diferentes conceitos de equilbrio.
Proposic
ao. Todo Equilbrio sequencial-fraco e um equilbrio de Nash.
Portanto, para encontramos os equilbrios sequenciais-fraco (ESf) de um jogo, determinamos

os equilbrios de Nash desse jogo. Da verificamos se existe, para cada um dos EN encontrados,
um sistema de crencas que o suporte como ESf (ou seja, que satisfaca a regra de Bayes, sempre
que possvel, e tal que satisfaca racionalidade sequencial).
Exemplo 12. Considere novamente o jogo representado no Exemplo 1. Vimos que os dois
u
nicos EN (em estrategias puras) desse jogo sao (nE, Br se Entrante entra) e (E1 , Ac se
Entrante entra). Para o segundo EN, a regra de Bayes diz que o sistema de crencas do jogador
M tem que ser p(E1 ) = 1, p(E2 ) = 1 p(E1 ) = 0. Precisamos verificar se para ((E1 , Ac se
Entrante entra),p(E1 ) = 1), racionalidade sequencial e satisfeita.
Ja para o EN dado por (nE, Br se Entrante entra), a regra de Bayes nao impoe nenhuma
restricao sobre o sistema de crencas. Logo, precisamos verificar apenas para quais valores de
p(E1 ) o par (b , p ) = ((nE, Br se Entrante entra),p(E1 )) satisfaz racionalidade sequencial.
Note que:
vM (b , p | I) = (1) p(E1 ) + (1) (1 p(E1 ) = 1
Note que se M mudar sua estrategia para Ac, seu payoff sera:
vM (Ac, Br, p | I) = 3 p(E1 ) + 2 (1 p(E1 ) ,
que e sempre maior do que ou igual a 2. Logo, nao ha sistema de crencas que suporte as
estrategias (nE, Br se Entrante entra) como um equilbrio sequencial-fraco (note que como a
racionalidade sequencial e a propriedade que nao e satisfeita, entao tambem nao existe crencas
que suportem essas estrategias como um equilbrio sequencial).
Um problema do conceito de equilbrio sequencial fraco e que ele nao e um refinamento de

ENPS. Logo, podem existir equilbrios sequenciais fracos que nao sao ENPS.

Microeconomia 2 P
os Notas de Aula
Refer
encias
Friedman, J. (1971). A non-cooperative equilibrium for supergames. Review of Economic
Studies, 38,1 , 1-12.
Kohlberg, E., & Reny, P. (1997). Independence on relative probability spaces and consistent
assessments in game trees. Journal of Economic Theory, 75 , 280-313.
Kreps, M., D, & Wilson, R. (1982). Sequential equilibrium. Econometrica, 50:4 , 863-894.
Kuhn, H. (1953). Extensive games and the problem of information, in contributions to the
theory of games. In H. Kuhn & A. Tucker (Eds.), (Vol. II, p. 193-216). Princeton
University Press.
Mas-Colell, A., Whinston, M., & Green, J. (1996). Microeconomic theory. Oxford University
Press.
McKelvey, R., & Palfrey, T. R. (1992). An experimental study of the centipede game. Econo-
metrica, 60:4 , 803-836.
Rubinstein, A. (1979). Equilibrium in supergames with the overtaking criterion. Journal of
Economic Theory, 21:1 , 1-9.
Selten, R. (1965). Spieltheoretische behandlung eines oligopolmodells mit nachfragetragheit.
Zeitschrift f
ur die Gesamte Staatswissenschaft, 121 , 301-324.
Selten, R. (1975). Reexamination of the perfectness concept for equilibrium points in extensive
games. International Journal of Game Theory, 4 , 25-55.
von Neumann, J., & Morgenstern, O. (2007). Theory of games and economic behavior (1944:
1st ed.). Princeton University Press.

Microeconomia 2 P
os Notas de Aula

Notas de Aula 2 Escolha Social
1 Escolha Social
1.1 Introdu
c
ao
1.1.1 Teoria da Escolha Social
Escolha Social: problema de agregar preferencias individuais em uma preferencia social. Como
um grupo ou uma sociedade decide coletivamente?
Queremos que essa regra de agregacao satisfaca certos criterios de carater normativo.
Exemplo: Se todos em uma sociedade preferem a alternativa A a` alternativa B, entao a regra
social prefere A a` B (unanimidade de Pareto).
Resultado principal: Teorema da Impossibilidade de Arrow.
1.1.2 Definico
es
Alternativa: descricao completa de um estado social;
X: conjunto nao-vazio de alternativas, todas excludentes;
I 2: tamanho do grupo ou sociedade (n

umero de indivduos);
Ri : relacao de preferencia do indivduo i sobre as alternativas em X. Vamos supor que

Ri e completa e transitiva para todo indivduo i. Temos que:
P i : preferencia estrita de i (i );

I i : indiferenca de i (i ).
Grupo de preferencias: lista das preferencias de todos os indivduos do grupo.
1.1.3 Relac
ao de Prefer
encia Social
Definic ao: Prefer encia Social (Def. 6.1). Uma relacao de preferencia social R e uma
relacao binaria completa e transitiva sobre X. Representamos por P e I as relacoes de pre-
ferencia estrita e indiferenca derivadas de R, respectivamente.
Notacao:
xRy: (a alternativa) x e socialmente tao boa quanto y,
xP y: (a alternativa) x e socialmente melhor que y,
xIy: (a alternativa) x e socialmente indiferente a y
Quest ao: Como agregar preferencias individuais em uma preferencia social? Que propriedades
uma regra que faz isso, que chamaremos funcao de bem-estar social (FBES social welfare
function) deve satisfazer?
Jose Guilherme de Lara Resende 1 NA 2 Escolha Social

Microeconomia 2 P
os Notas de Aula
1.2 Caso de Duas Alternativas: Teorema de May

1.2.1 Notac
ao
Vamos seguir May (1952). Suponha apenas duas alternativas: x e y. Para cada indivduo i
podemos ter tres casos apenas, x P i y, x I i y e y P i x. Entao, cada indivduo pode ser descrito
pela regra Di , onde:
Di = 1 se xPi y
Di = 0 se y Ii x
Di = 1 se y Pi x
Definic ao de Bem-Estar Social (FBES). A funcao f : U I U , U = {1, 0, 1},

ao: Func
associa cada grupo de preferencias a uma preferencia social.
Exemplo: Votac aria. Seja (1 , . . . , I ) 0 um sistema de pesos. Definimos f

ao Majorit
como: !
X I
f (D1 , . . . , DI ) = sign i D i ,
i=1
onde sign : R R e a funcao definida por sign(a) = 1 se a > 0, sign(a) = 0 se a = 0 e

sign(a) = 1 se a < 0.
Se i = 1 para todo i, f representa a regra de votacao majoritaria:
f (D1 , . . . , DI ) = 1 #(i : xP i y) > #(i : yP i x)

f (D1 , . . . , DI ) = 0 #(i : xP i y) = #(i : yP i x)
f (D1 , . . . , DI ) = 1 #(i : xP i y) < #(i : yP i x)
1.2.2 Condico
es
Definic ao: Crit erio Paretiano (Unanimidade). f () satisfaz o criterio Paretiano se
f (1, . . . , 1) = 1 e f (1, . . . , 1) = 1.
Exemplo: Defina f por f (D1 , . . . , DI ) = Dh . O indivduo h e chamado ditador, pois a sua

preferencia determina a escolha social (i = 0, i 6= h, h = 1, no exemplo anterior). Observe
que a regra ditadorial satisfaz o criterio Paretiano.
Condicao 1: Decisiva. A funcao de decisao em grupo e bem definida e assume um u

nico
valor para todo elemento de U I .
Condic ao 2: Simetria ou Anonimato. f (D1 , . . . , DI ) = f (D(1) , . . . , D(I) ), onde :

{1, . . . , I} {1, . . . , I} e uma permutacao ( e uma bijecao).
ao 3: Neutralidade entre as alternativas. f (D1 , . . . , DI ) = f (D1 , . . . , DI ).

Condic
i = Di para todo i 6= i0 , e
ao 4: Resposta Positiva. Se D = f (D1 , . . . , DI ) 0 e D
Condic
0 > D 0 , entao f (D
D i i ,...,D
1 ) = 1.
I

Microeconomia 2 P
os Notas de Aula
1.2.3 Teorema de May

Teorema de May (May, 1952). A funcao de decisao em grupo f e de votacao majoritaria
se, e somente se, for decisiva, simetrica, neutra entre as alternativas e de resposta positiva.
Observe que o Teorema de May nao so garante que a regra de votacao majoritaria e decisiva,
igualitaria, neutra e positiva (parte mais facil de verificar), mas tambem que se uma regra
de decisao e decisiva, igualitaria, neutra e positiva, entao ela necessariamente e a regra de
votacao majoritaria (parte mais difcil de verificar). Logo, o Teorema de May constitui uma
caracterizacao completa da regra de votacao majoritaria.
O lema abaixo e fundamental para a prova do Teorema de May. Essencialmente, o lema diz que
podemos descrever a regra de votacao majoritaria por meio do total de pessoas que preferem
a alternativa x vis-à-vis ao total de pessoas que preferem a alternativa y.
Lema. Sejam X(D1 , . . . , DI ) = #{i | Di = 1} e Y (D1 , . . . , DI ) = #{i | Di = 1}. A

propriedade de simetria implica a existencia de uma funcao G(X, Y ) tal que f pode ser escrita
como f (D1 , . . . , DI ) = G(X(D1 , . . . , DI ), Y (D1 , . . . , DI ))
Ideia da Prova do Teorema de May:
Passo 1) Usar o Lema e a propriedade de neutralidade a fim de mostrar que para um grupo
qualquer de preferencias (D1 , . . . , DI ) tal que X(D1 , . . . , DI ) = Y (D1 , . . . , DI ), entao
f (D1 , . . . , DI ) = 0.
Passo 2) Usar parte 1), simetria e resposta positiva a fim de mostrar que para um grupo
qualquer de preferencias (D1 , . . . , DI ) tal que X(D1 , . . . , DI ) > Y (D1 , . . . , DI ), entao
f (D1 , . . . , DI ) = 1.
Passo 3) Usar parte 2) e neutralidade entre as alternativas a fim de mostrar que para um
grupo qualquer de preferencias (D1 , . . . , DI ) tal que X(D1 , . . . , DI ) < Y (D1 , . . . , DI ),
entao f (D1 , . . . , DI ) = 1.
1.3 Paradoxo de Condorcet

1.3.1 Mais de Duas Alternativas
No caso de apenas duas alternativas, a exigencia da regra social ser transitiva nao faz sentido.
Se tivermos tres ou mais alternativas, transitividade passa a ser relevante. Vamos supor entao
que existam pelo menos tres alternativas.
Suponha que a regra de escolha social e dada por votacao majoritaria aos pares: todas as
alternativas sao postas em votacao aos pares, quem tiver mais votos ganha. Logo, para cada
par sob votacao, o vencedor (isto e, a alternativa socialmente preferida) e a alternativa que tiver
mais votos (no caso de empate, obtemos que as duas alternativas sao socialmente indiferentes).
Definic
ao: Vencedor de Condorcet. Dizemos que uma alternativa e um vencedor de
Condorcet se ela ganha de todas as outras alternativas na votacao majoritaria aos pares.
Se existir algum vencedor de Condorcet, e facil mostrar que ele sera u

nico. Portanto, pode
existir no maximo um vencedor de Condorcet. O exemplo abaixo mostra uma situacao em que
nao existe vencedor de Condorcet.

Microeconomia 2 P
os Notas de Aula
Suponha o seguinte conjunto de preferencias estritas:

Posicao Indivduo 1 Indivduo 2 Indivduo 3
Primeira x y z
Segunda y z x
Terceira z x y
Votacao majoritaria entre:

x vs y xP y
y vs z yP z xP y, yP z, zP x
x vs z zP x
| {z }
R n
ao
e transitiva!
Ou seja, mesmo que as preferencias individuais sejam transitivas, pode ocorrer que a preferencia
social nao o seja. Para o grupo de preferencias acima, nao existe um vencedor de Condorcet.
Logo, em um caso simples, com apenas tres alternativas e tres indivduos, as preferencias
exibidas na tabela acima mostram uma situacao em que a regra de votacao majoritaria aos
pares associa a um determinado conjunto de preferencias individuais uma preferencia social
que nao e transitiva.
Nesse caso, podemos ter problemas de manipulacao da regra social, onde um agente pode ter
condicoes de implementar o seu resultado preferido. O exemplo abaixo ilustra essa possibili-
dade.
1.3.2 Manipulac
ao de Agenda
Regras de escolha social nao transitivas podem trazer problemas de manipulacao de agenda.
Suponha que a regra de escolha e tal que, no caso de tres alternativas x, y e z, se a agenda e
(x, y, z), entao primeiro vota-se x vs y, e depois o vencedor dessa votacao contra z.
(x, y, z) : x vs y x ganha, x vs z z ganha

(y, z, x) : y vs z y ganha, y vs x x ganha
(z, x, y) : z vs x z ganha, z vs y y ganha
Logo, para esse grupo de preferencias em particular, quem define a agenda de votacoes define
a alternativa vencedora.
Observe que o exemplo acima exige que as preferencias dos indivduos sejam do conhecimento
de todos. Alem disso, abre-se a possibilidade de votacao estrategica: pode nao ser mais do
interesse dos eleitores revelarem corretamente as suas verdadeiras preferencias, no caso em que
esse comportamento modifique a escolha social a seu favor.
Por exemplo, suponha que a agenda de votacao e definida pelo indivduo 1. Ele entao imple-
mentara a agenda (y, z, x), que leva a escolha de x, sua alternativa preferida. Essa e a pior
alternativa para o indivduo 3. Se este decidir na primeira rodada de votacao, entre y e z, votar
em z, z passa a ser escolhido em vez de y. Na segunda rodada de votacao, a alternativa x e
preterida e z e escolhido. Logo, o indivduo 3, ao revelar incorretamente as suas preferencias,
consegue afetar o resultado e fazer com que a sua segunda melhor alternativa, z, seja escolhida
no lugar da sua terceira melhor alternativa, x.
Logicamente, a analise se complica: os outros eleitores podem tambem decidir votar estrategica-
mente, nao revelando corretamente suas preferencias. Nesse caso, devemos analisar o problema
de votacao como um jogo e procurar por equilbrios de Nash. Observe que a discussao acima
mostra que a situacao em que o indivduo 1 define a agenda (y, z, x) e todos votam de acordo
com suas preferencias verdadeiras nao e um equilbrio de Nash (mais especificamente, vimos

Microeconomia 2 P
os Notas de Aula
que o indivduo 3 revelar corretamente sua preferencia nao e a melhor resposta a`s estrategias
dos eleitores 1 e 2 de revelarem suas preferencias verdadeiras).
Nao vamos nos aprofundar mais na questao de comportamento estrategico agora. O ponto
principal que desejamos enfatizar e o de que, em situacoes onde existam tres ou mais alternati-
vas, a regra de votacao majoritaria aos pares pode associar preferencias sociais nao transitivas
a determinados conjuntos de preferencias individuais. Essas situacoes podem gerar problemas
como manipulacao de agenda e votacao estrategica. Queremos investigar se existe alguma regra
de escolha social que nao incorra nesses problemas.
1.4 Problema
De modo geral, uma sociedade define uma funcao de bem-estar social (ou uma regra de es-
colha social ) f que para cada conjunto de preferencias individuais (R1 , . . . , RI ) associa uma
preferencia social:
(R1 , . . . , RI ) 7 R
f
Por exemplo, uma regra muito utilizada e votacao majoritaria, em que a alternativa mais
votada (ou selecionada) pelos agentes e escolhida.
Queremos que a funcao de bem-estar social satisfaca algumas condicoes normativas basicas.
Por exemplo, queremos que ela satisfaca o criterio fraco de Pareto: se todos preferem x a y,
entao a preferencia social prefere x a y.
Na proxima secao veremos algumas propriedades e o principal resultado desta teoria, o Teorema
de Arrow.

Microeconomia 2 P
os Notas de Aula
2 Teorema de Arrow
2.1 Condi
coes
Arrow (1951): encontrar uma regra de decisao social que agregue preferencias individuais de
modo satisfatorio. As condicoes do teorema de Arrow sao exigencias normativas sobre a
funcao de bem-estar social f que gera a decisao social, R = f (R1 , . . . , RN ).
Condicao 1: Domnio Irrestrito (U). O domnio de f inclui todas as combinacoes possveis

de preferencias sobre o espaco de alternativas X.
Essa condicao impoe a` regra social f a capacidade de associar qualquer grupo de preferencias
individuais a uma preferencia social. Portanto, o mecanismo de escolha social e valido qualquer
que seja o grupo de preferencias individuais.
Condicao 2: Princpio Fraco de Pareto (WP). Para qualquer par de alternativas x e y

tal que x P i y para todo i, entao x P y.
Essa condicao impoe um criterio de unanimidade no mecanismo de escolha social. Podemos

definir outros criterios de unanimidade (por exemplo, com preferencias fracas).
Condicao 3: N ao-Ditadorial (D). Nao existe indivduo h tal que se x P h y, entao x P y,

quaisquer que sejam as preferencias dos outros indivduos i 6= h.
Essa condicao elimina a possibilidade de um ditador na sociedade. Isso nao exclui o fato de
que a escolha social coincida, para um certo grupo de preferencias, com a escolha de algum ou
de alguns indivduos (isso e normal ocorrer).
Condicao 4: Independ encia das Alternativas Irrelevantes (IIA). Sejam R = f (R1 , . . . , RI ),

= f (R
R ,...,R
1 ) e x e y duas alternativas quaisquer em X. Se cada indivduo i ordena x
I
i
versus y em R do mesmo modo que ordena x versus y em R i , entao o ordenamento social de
x versus y e o mesmo em R e em R.
Essa e a condicao mais sutil de todas. Impoe sobre a funcao de bem-estar social a propriedade de
que o ordenamento social entre duas alternativas dependa apenas dos ordenamentos individuais
entre essas duas alternativas e, portanto, nao seja afetado por nenhuma outra alternativa
diferente de x e y.
Exemplo: Contagem de Borda. O mecanismo de escolha social de contagem de Borda

requer que cada indivduo ordene as alternativas em uma lista, de acordo com a sua preferencia.
Cada alternativa recebe um valor numerico, determinado pela sua posicao relativa na lista. Por
exemplo, um possvel mecanismo de contagem de Borda seria, para cada indivduo i, associamos
o n
umero ci (x) = n para cada alternativa x, onde n e a posicao de preferencia de x para i.
Logo, se c1 (x) = 2, entao x e a segunda alternativa preferida do indivduo 1. Definimos a regra
da contagem de Borda para esse caso por:
I
X I
X
xRy ci (x) ci (y)
i=1 i=1
O mecanismo de contagem de Borda:

completo e transitivo (e de domnio irrestrito);
E
Satisfaz o princpio fraco de Pareto,
Nao e ditadorial.

Microeconomia 2 P
os Notas de Aula
Porem, ele nao satisfaz o criterio de independencia das alternativas irrelevantes, pois o orde-
namento de duas alternativas pode depender do posicionamento das outras alternativas.
Exemplo: Suponha dois indivduos e tres alternativas, x, y, z.

x P 1 z P 1 y c1 (x) = 1, c1 (y) = 3
Grupo A: xP y
y P 2 x P 2 z c2 (x) = 2, c2 (y) = 1

x P 1 y P 1 z c1 (x) = 1, c1 (y) = 2
Grupo B: yP x
y P 2 z P 2 x c2 (x) = 3, c2 (y) = 1
Nos dois grupos, os ordenamentos individuais entre x e y sao os mesmos. Porem, o mecanismo
de Borda resulta em escolhas diferentes. Temos entao uma violacao da hipotese de IIA.
2.2 Teorema de Arrow

Teorema da Impossibilidade de Arrow (Th. 6.1). Se existem pelo menos tres alternativas
em X, entao nao existe funcao de bem-estar social f que resulte em R completa e transitiva e
tal que satisfaca as condicoes domnio irrestrito, princpio fraco de Pareto e independencia das
alternativas irrelevantes e que seja nao-ditadorial.
Corol ario. Se existem pelo menos tres alternativas em X, entao a u nica funcao de bem-estar
social f que resulta em R completa e transitiva e que satisfaz as condicoes de domnio universal,
princpio Pareto fraco e independencia das alternativas irrelevantes e a regra ditadorial.
A Demonstracao do Teorema de Arrow pode ser feita de diversos modos. Geanakoplos (2005)
apresenta tres provas simples para o Teorema. Vamos primeiro mostrar a prova classica feita
por Arrow (1951). Para isso, precisamos definir o seguinte conceito:
2.2.1 Demonstrac
ao
Definic
ao: Conjunto Decisivo. Dada a funcao de escolha social f , dizemos que o conjunto
de agentes S I e:
1. Decisivo em x sobre y se para todo i S, xP i y e para todo j 6 S, yP j x, entao xP y.
2. Decisivo se para todo x, y em X, S e decisivo em x sobre y.
3. Completamente Decisivo em x sobre y se para todo i S, xP i y entao xP y.
A ideia da demonstracao classica de Arrow consiste em mostrar o contagio da propriedade

de decisao, para entao mostrar que o menor grupo completamente decisivo e de tamanho um
(ditador). Essa demonstracao pode ser dividida nos seguintes passos:
Passo 1: Se para algum par x, y X, S I e decisivo em x sobre y, entao, para qualquer

alternativa z 6= x, S e decisivo em x sobre z. Similarmente, para toda alternativa z 6= y,
S e decisivo em z sobre y.
Passo 2: Se para algum par x, y X, S e decisivo em x sobre y e z e uma terceira alternativa

qualquer, entao S e decisivo em z sobre w e em w sobre z, onde w X e tal que w 6= z.
Passo 3: Se para algum par x, y X, S I e decisivo em x sobre y, entao S e decisivo.
Passo 4: Se S I e T I sao decisivos, entao S T e decisivo.
Passo 5: Para qualquer S I, ou S e decisivo ou I S e decisivo.

Microeconomia 2 P
os Notas de Aula
Passo 6: Se S I e decisivo e S T , entao T tambem e decisivo.
Passo 7: Se S I e decisivo e #S > 1, entao existe S S, S =

6 S, tal que S e decisivo.
Passo 8: Existe um h I tal que S = {h} e decisivo.
Passo 9: Se S I e decisivo, entao para todo par x, y X, S e completamente decisivo em

x sobre y.
Passo 10: Se para algum h I, S = {h} e decisivo, entao h e um ditador.
2.2.2 Prova Gr
afica
Vamos agora discutir a prova grafica do Teorema de Arrow feita no livro-texto e baseada em
Blackorby, Donaldson, and Weymark (1984). Suponha que X RK , K 1, e um conjunto
convexo nao-vazio e nao-unitario e que para cada preferencia individual Ri exista uma utilidade
ui : X R contnua que a representa.
Observe que abandonamos a hipotese de domnio irrestrito (por exemplo, se K 2, preferencias

lexicograficas sobre X foram descartadas). Queremos agregar essas utilidades individuais em
uma funcao de bem-estar social f , que mapeia um conjunto de utilidades individuais u() =
(u1 (), . . . , uI ()) em uma utilidade social contnua (note que isto tambem consiste em uma
exigencia mais forte do que uma preferencia social completa e transitiva). Denotamos por U o
conjunto das funcoes de utilidade contnuas definidas em X:
U = {u | u : X R e funcao de utilidade contnua} .

Q
Portanto, queremos encontrar f : iI U U tal que para cada vetor de funcoes de utilidades
individuais (u1 (), . . . , uI ()), obtemos uma funcao de utilidade social:
fu () = [f (u1 (), . . . , uI ())]() ,
onde as condicoes do teorema de Arrow sao satisfeitas. Observe que a utilidade social em x,
[f (u1 (), . . . , uI ())](x) pode depender de toda utilidade ui () de cada indivduo i, e nao apenas
da utilidade ui (x) que i atribui a` alternativa x. Ou seja, f (u1 (), . . . , uI ()) e uma utilidade
social e [f (u1 (), . . . , uI ())](x) e a utilidade social atribuda à alternativa x. Para simplificar
a notacao, denote por fu a utilidade social f (u1 (), . . . , uI ()) e por fu (x) a utilidade social
[f (u1 (), . . . , uI ())](x) atribuda a` alternativa x X.
Como uma utilidade e u nica a menos de transformacoes crescentes, vamos impor que f satisfaca
a seguinte propriedade de invariancia: sejam i : R R, i = 1, . . . , I funcoes estritamente
crescentes e contnuas. Entao:
fu (x) fu (y) se, e somente se, fu (x) fu (y) , (1)
onde u = ( 1 u1 , . . . , I uI ) (consideramos i contnua para que a utilidade i ui seja

contnua para todo indivduo i).
As condicoes do Teorema de Arrow sao facilmente adaptadas para esta situacao:

Domnio irrestrito: o domnio de f e qualquer conjunto de funcoes de utilidade contnuas;
Princpio Fraco de Pareto: se ui (x) > ui (y) para todo i, entao fu (x) > fu (y);
Nao ditadorial: nao existe indivduo h tal que fu = uh
Independencia das Alternativas Irrelevantes: a comparacao entre fu (x) e fu (y) depende

somente dos vetores u(x) = (u1 (x), . . . , uI (x)) e u(y) = (u1 (y), . . . , uI (y)).

Microeconomia 2 P
os Notas de Aula
Considere a seguinte restricao adicional sobre f :
Princpio de Indiferenca de Pareto (PI). Se ui (x) = ui (y) para todo i = 1, . . . , I, entao

fu (x) = fu (y).
Teorema (Sen, 1970). Se a funcao de utilidade social fu , induzida por f como:
fu (x) = [f (u1 (), . . . , uI ())](x) ,
e contnua e satisfaz as condicoes de domnio irrestrito, princpio fraco de Pareto, inde-

pendencia das alternativas irrelevantes e o princpio de indiferenca de Pareto, entao existe uma
funcao W : RI R contnua e estritamente crescente tal que para todo x, y X, e todo
conjunto de utilidades contnuas u() = (u1 (), . . . , uI ()), temos que:
fu (x) fu (y) se, e somente se, W (u1 (x), . . . , uI (x)) W (u1 (y), . . . , uI (y)) (2)
A propriedade de invariancia (equacao 1) de f implica que W tambem satisfaz uma propriedade

similar de invariancia:
Se W (u1 (x), . . . , uI (x)) W (u1 (y), . . . , uI (y)) ,
entao:
W (( 1 u1 )(x), . . . , ( I uI )(x)) W (( 1 u1 )(y), . . . , ( I uI )(y)),
para qualquer conjunto de funcoes i : R R contnuas e estritamente crescentes i.
Vamos discutir a prova grafica do Teorema de Arrow, supondo apenas dois indivduos. Vamos
caracterizar as curvas de indiferenca da funcao de utilidade social W , que satisfaz as hipoteses
do teorema de Arrow. Considere um ponto u u1 , u2 ) qualquer em R2++ . Esse ponto divide
= (
o quadrante positivo em quatro sub-quadrantes (que nao incluem as fronteiras, denotadas em
linhas tracejadas na figura), como ilustra a figura abaixo.
u2
6
Princpio fraco de Pareto:
P u, u em III; e
u
II I
, u em I
uP u
u

s
III IV
-
u1

Microeconomia 2 P
os Notas de Aula
O princpio fraco de Pareto implica que a utilidade social atribuda às utilidades no sub-
quadrante I sao maiores do que W (
u) e que a utilidade social atribuda às utilidades no sub-
quadrante III sao menores do que W ( u). Portanto, a curva de indiferenca que passa pelo
deve estar contida nos sub-quadrantes II e IV ou nas fronteiras dos sub-quadrantes.
ponto u
Considere agora um ponto arbitrario u
no sub-quadrante II.
u2
6
Tres casos possveis:
W (
u) > W (
u),
II I
su
W (
u) = W (
u), e
su
W (
u) < W (
u).
u

s
III IV
-
u1
Suponha que W ( u) < W (u). Como W e invariante a qualquer transformacao estritamente

crescente e contnua das utilidades. Considere ( 1 , 2 ) contnuas e estritamente crescente tais
que:
1 (
u1 ) = u1 e 2 (
u2 ) = u2
Como u esta no sub-quadrante II, u1 < u1 e u2 > u2 . Como i e estritamente crescente, para
i = 1, 2, entao:
v1 = 1 (
u1 ) < 1 (
u1 ) = u1
v2 = 2 (
u2 ) > 2 (
u2 ) = u2
ou seja, v
necessariamente esta no segundo quadrante tambem. Como temos flexibilidade total
na escolha das funcoes i , isto implica que qualquer ponto u no segundo quadrante deve ser
ordenado da mesma forma com relacao a u . Note que isso vale para os outros dois casos
tambem, em que W ( u) > W ( u) e em que W ( u) = W (u). Finalmente, observe que o u
ltimo
caso, W (u) = W ( u), nao pode ocorrer, pois se W ( u) = W (u), entao todos os pontos no
segundo sub-quadrante seriam socialmente indiferentes entre si, mas se considerarmos u no
sub-quadrante II, com u u , entao o princpio fraco de Pareto implica que W (
u) > W (u)
(ver figura acima).
Portanto, temos que ou W ( u) > W (

u) ou W ( u) < W (
u), para todo u
na regiao II. Vamos
denotar o primeiro caso por W (
u) > W (II) e o segundo, por W (
u) < W (II).
Argumentando de modo similar, temos que ou W ( u) > W (u) ou W (

u) < W (
u), para todo
u
na regiao IV. Vamos denotar o primeiro caso por W (
u) > W (IV) e o segundo caso por
W (
u) < W (IV).

Microeconomia 2 P
os Notas de Aula
Finalmente, vamos mostrar que:
1. Se W (
u) < W (II), entao necessariamente W (
u) > W (IV).
2. Se W (
u) > W (II), entao necessariamente W (
u) < W (IV).
Suponha que W ( u) < W (II) (o segundo caso e analogo). Considere as seguintes funcoes
= ( 1 , 2 ) contnuas e estritamente crescente:
1 (u1 ) = u1 + 1 e 2 (u2 ) = u2 1
u1 , u2 ):
aplicadas às utilidades (
1 (
u1 ) = u1 + 1 e 2 (
u2 ) = u2 1
u1 1, u2 + 1):
e às utilidades (
1 (
u1 1) = u1 e 2 (
u2 + 1) = u2
Como ( u1 1, u2 + 1) esta no sub-quadrante II, W (u1 , u2 ) < W (u1 1, u2 + 1). A propriedade

1 1 2 2 1 1 2 2
de invariancia implica que W ( ( u ), (
u )) < W ( ( u 1), ( u +1)), ou seja, que W ( u1 +
1, u2 1) < W ( u1 , u2 ). Observe que o par de utilidades ( u1 + 1, u2 1) esta contido no sub-
quadrante IV. Por um argumento similar ao feito acima, podemos concluir que a propriedade
de invariancia implica que W ( u) > W (IV).
Logo,
ou 1) W (IV) < W (
u) < W (II) ou 2) W (II) < W (
u) < W (IV) .
No primeiro caso, temos que as curvas de indiferenca social sao retas horizontais passando por
. Isso significa que o indivduo 2 e o ditador: W (u1 , u2 ) = u2 . No segundo caso, temos que as
u
curvas de indiferenca social sao retas verticais passando por u . Isso significa que o indivduo 1
1 2 1
e o ditador: W (u , u ) = u .

Microeconomia 2 P
os Notas de Aula
2.3 Teorema do Eleitor Mediano

O teorema de Arrow possui uma conclusao negativa: e impossvel esperar que uma sociedade
se comporte com a mesma coerencia que podemos esperar de um indivduo racional (no sentido
de preferencias completas e transitivas). Esse problema de coerencia mostra que detalhes ins-
titucionais e procedimentos do processo poltico sao importantes. Ou seja, tomadas de decisoes
em grupo podem gerar resultados arbitrarios e manipulacao. O processo instituticional pode
ser uma restricao a esses problemas.
Diversos autores da area de ciencia poltica incorporaram o resultado de Arrow em suas analises
(por exemplo, ver Shepsle and Boncheck (1995); Austen-Smith and Banks (1996)). Alem disso,
esses autores passaram a utilizar ferramentas como teoria dos jogos para auxiliar essas analises.
Vamos agora discutir relaxamentos nas condicoes do Teorema de Arrow que levam a algum
resultado menos negativo.
Exemplo 1: Relaxar hip otese de Transitividade. Podemos relaxar a hipose de transiti-

vidade e exigir apenas que a preferencia seja apenas quase-transitiva ou apenas acclica:
(i) R e quase-transitiva se a preferencia social estrita P induzida por R e transitiva.
(ii) R e acclica se possui um elemento maximal em todo subconjunto nao-vazio X 0 X (ie,

se {x X 0 | xRy y X 0 } =6 , para todo X 0 X nao-vazio).
possvel mostrar que uma preferencia quase-transitiva e acclica, mas que o inverso nao vale
E
em geral. Sen (1970) desenvolve modelos em que a preferencia social satisfaz um desses dois
requerimentos no lugar de transitividade.
Exemplo 2: Relaxar hip otese de Domnio Irrestrito. preferencias de pico u

nico: existe
algum modo de ordenar as alternativas em um espaco unidimensional tal que todas as pre-
ferencias tem pico u
nico nessa dimensao.
Quao provavel e ocorrer o paradoxo de Condorcet em uma sociedade com tres indivduos e tres
alternativas? Supondo apenas preferencias estritas, temos 216 (6 6 6) sociedades possveis.
Dessas, 12 apresentam o paradoxo de Condorcet. Se as preferencias sao de pico u nico, o
Teorema de Black (ou Teorema do Eleitor Mediano) (Black, 1948) garante que a alternativa
preferida do eleitor mediano e um vencedor de Condorcet (nao e derrotada por nenhuma outra
alternativa numa votacao majoritaria aos pares).
Suponha que exista uma ordem linear (ou ordem parcial completa) em X, ou seja, uma
relacao binaria que satisfaz as propriedades de reflexividade, completeza, transitividade e
antissimetria (se xRi y e yRi x entao x = y).
Definicao: Prefer
encias de Pico Unico. A preferencia Ri e de pico u
nico com relacao a`
ordem linear em X se existe alguma alternativa xi com a propriedade de que Ri e crescente
com respeito a em {y X | xi y} e decrescente com respeito a em {y X | y xi },
ou seja:
Se xi z > y entao zP i y , e
Se y > z xi entao zP i y .

Microeconomia 2 P
os Notas de Aula
Vamos entao restringir o domnio das preferencias consideradas e admitir preferencias de p

ico u
nico apenas (e sem relacoes de indiferenca). Observe que as preferencias dispostas no
paradoxo de Condorcet nao sao de pico u
nico.
Definic
ao: Eleitor Mediano. O agente h e o eleitor mediano para o conjunto de preferencias
individuais (R1 , R2 , . . . , RI ) se:
I I
#{i I | xi xh } e #{i I | xh xi } .
2 2
Proposic ao. Suponha que e uma ordem linear em X e considere o conjunto de preferencias
individuais (R1 , R2 , . . . , RI ) de pico u
nico com respeito a e seja h o eleitor mediano desse
conjunto. Entao a alternativa preferida do eleitor mediano e um vencedor de Condorcet em X
(nao e derrotada por nenhuma outra alternativa numa votacao majoritaria aos pares): xh Rx,
para todo x X.
Teorema do Eleitor Mediano (ou Teorema de Black (1948)). Suponha que o n umero de
agentes e mpar e que e uma ordem linear em X. Entao votacao majoritaria aos pares define
uma FBES que leva sempre a preferencias sociais completas e transitivas quando consideramos
apenas preferencias individuais de pico u
nico.
Alem disso, nesse caso, nao ha incentivos para representacao incorreta das preferencias, com o
sentido de manipular o resultado.

Microeconomia 2 P
os Notas de Aula
3 Mensurabilidade e Compara
c
ao
3.1 Hip
oteses sobre a Racionalidade Individual
O teorema de Arrow supoe que as utilidades individuais sao apenas medidas ordinais de bem-
estar e que utilidades de indivduos diferentes nao sao comparaveis. Podemos relaxar esta
u
ltima hipotese, supondo que utilidades de indivduos diferentes sao comparaveis. Alem disso,
podemos relaxar as duas hipoteses conjuntamente, supondo que utilidades possuam sentido
cardinal e que incrementos nas utilidades possam ser comparados entre indivduos Outras
hipoteses e combinacoes de hipoteses podem ser feitas. Hammond (1976); DAspremont and
Gevers (1977); Roberts (1980); Sen (1984) constituem referencias basicas dessa linha de pes-
quisa. Observe que abandonamos entao a ideia de que utilidades individuais fornecem apenas
informacao sobre a ordenacao das alternativas.
Definic
ao: Mensurabilidade, Comparac
ao e Invari
ancia (Def 6.2). Dizemos que:
1. A funcao de bem-estar social f e invariante no nvel de utilidade (ULI) se:
fu (x) fu (y) fu (x) fu (y),
para qualquer = (, , . . . , ), onde e crescente.
2. A funcao de bem-estar social f e invariante para diferencas de utilidade (UDI) se:
fu (x) fu (y) fu (x) fu (y),
para qualquer = ( 1 , 2 , . . . , I ), onde i = ai + bui , b > 0, ai R, i.
A hipotese 1 permite comparacoes entre utilidades, pois assumimos igual para todos os
indivduos. A hipotese 2 permite a valoracao de incrementos em cada utilidade individual e a
comparacao desses incrementos entre utilidades diferentes.
Vamos supor que X Rk e um conjunto convexo nao-vazio e nao-unitario. Vamos considerar

apenas FBES que satisfazem U, WP, IIA (welfarism) e PI (strict welfarism, se adicionarmos
PI a` welfarism). Vimos entao que vale o Teorema de Sen visto acima:
Teorema (Sen, 1970). Se a funcao de utilidade social fu , induzida por f como:
fu (x) = [f (u1 (), . . . , uI ())](x) ,
e contnua e f satisfaz as condicoes de domnio universal, princpio fraco de Pareto, inde-

pendencia das alternativas irrelevantes e o princpio de indiferenca de Pareto, entao existe uma
funcao W : RI R contnua e estritamente crescente tal que para todo x, y X, e todo
conjunto de utilidades contnuas u = (u1 , . . . , uI ), temos que:
fu (x) fu (y) se, e somente se, W (u1 (x), . . . , uI (x)) W (u1 (y), . . . , uI (y)) (3)
Vamos assumir que vale strict welfarism e que podemos entao analisar a funcao W diretamente.

Microeconomia 2 P
os Notas de Aula
Definicao: Hip
oteses Eticas (Def. 6.3). Considere as seguintes propriedades sobre a
funcao W :
Anonimato (A): Seja u = (u1 , . . . , uI ) um grupo de utilidades qualquer. A funcao de bem-
estar social W satisfaz a propriedade de anonimato se W (u1 , . . . , uI ) = W (u(1) , . . . , u(I) ),
onde : {1, . . . , I} {1, . . . , I} e uma permutacao ( e uma bijecao).
Crit
erio de Igualdade de Hammond (HE): Sejam u = (u1 , . . . , uI ) e u u1 , . . . , uI )
= (
dois grupos de utilidades quaisquer onde uk = uk para todo k 6= i, j. Se ui < ui < uj < uj ,
u1 , . . . , uI ) W (
entao W ( u1 , . . . , uI ).
A propriedade de anonimato impoe que a identidade do indivduo nao tenha influencia sobre
W , ou seja, que todas as pessoas sejam tratadas do mesmo modo. O criterio de igualdade de
Hammond diz que dispersao nas utilidades (ou seja, desigualdade com relacao ao bem-estar
dos indivduos) diminui o bem-estar social.
3.2 Fun
cao de Bem-estar de Rawls
Teorema: FBES Rawlsiana (Th. 6.2). Uma funcao de bem-estar social W contnua e
estritamente crescente satisfaz o criterio de igualdade de Hammond se, e somente se, W (u) =
min{u1 , . . . , uI }. Mais ainda, W satisfaz a propriedade de anonimato e e invariante no nvel
de utilidade.
O teorema caracteriza totalmente a funcao de bem-estar Rawlsiana (formalizado por Hammond

(1976), elaborado por Rawls (1971)). Mostrar que essa funcao de bem-estar satisfaz as hipoteses
do teorema e facil.
3.3 Fun
cao de Bem-estar Utilitarista
Teorema: FBES Utilitarista (Th. 6.3). Uma funcao de bem-estar social W contnua e
estritamente crescente satisfaz a propriedade de anonimato e e invariante para diferencas de
utilidade se, e somente se, pode tomar a forma utilitarista, em que W (u) = u1 + + uI .
umeros ai 0, i = 1, . . . , I, com algum aj > 0,

Se anonimato nao e requerido, entao existem n
1 I
tais que W (u) = a1 u + + aI u .
3.4 Outras Varia

coes
Quanto maior a possibilidade de mensuracao das utilidades individuais e de comparacao de
utilidades de indivduos diferentes, maior a flexibilidade de funcoes de bem-estar social.
Por exemplo, se assumirmos que a FBES f e invariante apenas por transformacoes afins crescen-
tes iguais, do tipo i = bui , b > 0, para todo i, entao dizemos que f e invariante a mudancas
percentuais (UPI ) nas utilidades individuais. As FBES Rawlsiana e Utilitarista satisfazem
esse criterio. Mais ainda, as curvas de indiferenca social neste caso devem ser negativamente
inclinadas e radialmente paralelas. Isso significa que a FBES f e homotetica.
Se adicionarmos convexidade e separabilidade forte (as TMS entre duas utilidades quaisquer
independem das utilidades de outros indivduos) a`s hipoteses WP e A, entao a funcao de
bem-estar social deve ser do tipo CES:
1/
W (u1 , . . . , uI ) = (u1 ) + + (uI ) , 0 6= < 1 ,
onde = 1/1, a elasticidade de substituicao entre utilidades, mede a preferencia social por
igualdade ( 0 gera a forma Rawlsiana, gera a forma linear).

Microeconomia 2 P
os Notas de Aula
4 Justica
4.1 Harsanyi e Rawls
O que e um criterio de decisao social justo? Duas posicoes, formalizadas a partir de uma
discussao filosofica antiga, tomando como base uma posicao original:
1. Harsanyi (1953, 1955, 1975) (principle of insufficient reason): probabilidade igual de

vir a ser qualquer pessoa da sociedade. Gera uma funcao de bem-estar social do tipo
Utilitarista.
2. Rawls (1971) (veu de ignorancia): gera a funcao de bem-estar Rawlsiana.
Arrow (1973) argumenta que a funcao de utilidade Rawlsiano e um caso particular do caso
mais geral em que os indivduos, em sua posicao original, sao infinitamente avessos ao risco.
Para notar isto, basta lembrar que a FBES Rawlsiana e um caso particular da FBES do tipo
CES, em que o grau de aversao à incerteza dos agentes e infinito.

Microeconomia 2 P
os Notas de Aula
5 O Teorema de Gibbard-Satterthwaite
Assumimos que as preferencias sao observaveis ou que cada indivduo revela a sua preferencia
verdadeira. Porem, devemos considerar que as pessoas podem agir estrategicamente, de modo
a nao revelarem corretamente as suas preferencias, caso isso seja do seu interesse.
Vamos assumir que o conjunto de alternativas X e finito e que vale a hipotese de domnio
irrestrito das preferencias individuais.
Definicao: Func ao de Escolha Social (FES). Para cada conjunto de preferencias individu-
ais R = (R1 , R2 , . . . , RI ), c(R) X denota a escolha da sociedade. Vamos supor que a imagem
de c e X (ou seja, para todo x X, existe um conjunto de preferencias R = (R1 , R2 , . . . , RI )
tal que c(R) = x).
Definic ao: Funcao de Escolha Social Ditadorial (Def. 6.4). A funcao de escolha social
c() e ditadorial se existe um indivduo i tal que sempre que c(R1 , . . . , RI ) = x, entao xRi y
para todo y X.
Vamos denotar por Ri as preferencias de todos os indivduos da sociedade, menos o indivduo i.
Fixe Ri e observe que se existirem x, y X distintos tais que c(Ri , Ri ) = x e c(R i , Ri ) = y,
i pode afetar a escolha social: se reportar Ri , a escolha social e x; se reportar R i , e y. Queremos
evitar que a funcao de escolha social seja a prova de revelacoes incorretas de preferencias. Vamos
denotar por (R1 , R2 , . . . , RI ) as preferencias verdadeiras do grupo.
Definicao: Func ao de Escolha Social imune a Comportamento Estrat egico (Def.
6.5). A funcao de escolha social c() e imune a comportamento estrategico se para todo
indivduo i e para todo par Ri e R i de preferencias, e para todo conjunto de preferencias Ri
dos outros jogadores, se c(Ri , Ri ) = x e c(R i , Ri ) = y, entao xRi y.
A definicao acima garante que se a FES e imune a comportamento estrategico, entao todos os
indivduos irao sempre declarar suas preferencias verdadeiras, ja que nunca havera qualquer
ganho em reporta-las de modo incorreto.
Queremos saber que FES sao imunes a comportamento estrategico. O Teorema de Gibbard-
Satterthwaite (Gibbard (1973); Satterthwaite (1975)) responde essa questao e mostra que so-
mente a FES ditadorial satisfaz esse criterio.
Teorema de Gibbard-Satterthwaite (Th. 6.4). Se existem pelos menos tres alternativas,
entao toda funcao de escolha social imune a comportamento estrategico e ditadorial.
Para demonstrarmos o Teorema de Gibbard-Satterthwaite, usaremos as duas definicoes abaixo
(vamos seguir a prova feita por Reny (2001)).
Definicao: Func ao de Escolha Social Pareto Eficiente (Def. 6.6). A funcao de escolha
social c() e Pareto Eficiente se c(R1 , . . . , RI ) = x sempre que xP i y para todo indivduo i e
todo y X distinto de x.
Definic
ao: Func ao de Escolha Social Pareto Monot onica (Def. 6.7). A funcao de
1 I 1, . . . , R
escolha social c() e monotonica se c(R , . . . , R ) = x implica c(R I ) = x sempre que
para cada indivduo i e todo y X distinto de x, temos que xRi y implica xP i y.
A demonstracao do Teorema pode ser dividida em duas partes:
Parte 1: A propriedade de imunidade a comportamento estrategico implica monotonicidade
e eficiencia de Pareto.
Parte 2: #X 3, monotonicidade e eficiencia de Pareto implicam c ditadorial.

Microeconomia 2 P
os Notas de Aula
Refer
encias
Arrow, K. (1951). Social choice and individual values. New York: John Wiley.
Arrow, K. (1973). Some ordinalist utilitarian notes on rawls theory of justice. Journal of
Philosophy, 70 , 245-263.
Austen-Smith, D., & Banks, J. (1996). Positive political theory. Ann Arbor: University of
Michigan Press.
Black, D. (1948). On the rationale of group decision-making. Journal of Political Economy,
56 , 23-34.
Blackorby, C., Donaldson, D., & Weymark, J. (1984). Social choice with interpersonal utility
comparisons: A diagrammatic introduction. International Economic Review , 25 , 327-
356.
DAspremont, C., & Gevers, L. (1977). Equity and the informational basis of collective choice.
Review of Economic Studies, 44 , 199-209.
Geanakoplos, J. (2005). Three brief proofs of arrows impossibilty theorem. Economic Theory,
26:21 , 211-215.
Gibbard, A. (1973). Manipulation of voting schemes: A general result. Econometrica, 41 ,
587-601.
Hammond, P. J. (1976). Equity, arrows conditions and rawls difference principle. Econome-
trica, 44 , 793-804.
Harsanyi, J. (1953). Cardinal utility in welfare economics and in the theory of risk-taking.
Journal of Political Economy, 61 , 434-435.
Harsanyi, J. (1955). Cardinal welfare, individualistic ethics, and interpersonal comparisons of
utility. Journal of Political Economy, 63 , 309-321.
Harsanyi, J. (1975). Can the maxmin principle serve as basis of morality? a critique of john
rawls theory. American Political Science Review , 69 , 594-606.
May, K. O. (1952). A set of independent necessary and sufficient conditions for simple majority
decision. Econometrica, 20:4 , 680-684.
Rawls, J. (1971). A theory of justice. Cambridge, MA: Harvard University Press.
Reny, P. J. (2001). Arrows theorem and the gibbard-satterthwaite theorem: A unified appro-
ach. Economic Letters, 70 , 99-105.
Roberts, K. W. (1980). Possibility theorems with interpersonally comparable welfare levels.
Review of Economic Studies, 47 , 409-420.
Satterthwaite, M. (1975). Strategy-proofness and arrows conditions: Existence and correspon-
dence theorems for voting procedures and social welfare functions. Journal of Economic
Theory, 10 , 187-217.
Sen, A. (1970). Collective choice and social welfare. Amsterdam: North Holland.
Sen, A. (1984). Social choice theory. In K. Arrow & M. Intrilligator (Eds.), (Vol. 3, p. 1073-
1181). North Holland.
Shepsle, K., & Boncheck, M. (1995). Analysing politics. New York: W. W. Norton.

Microeconomia 2 P
os Notas de Aula

Notas de Aula 3 Teoria da Informacao
1 Economia da Informa
c
ao
1.1 Introdu
c
ao
Modelos tradicionais assumem informacao perfeita. Por exemplo, os consumidores conhecem a
qualidade dos produtos adquiridos e as firmas conhecem a produtividade de novos empregados.
A hipotese de informacao perfeita permite tratar esses dois problemas, consumidor e firma,
separadamente e depois unificar a analise via precos que equilibram mercados.
Em modelos de equilbrio geral as interacoes entre os agentes sao bastante limitadas apenas
pelo sistema de precos. Existem varios problemas, como, por exemplo, justificar a existencia
de firmas. Acrescentar incerteza nos modelos de equilbrio geral nao resolve, pois a incerteza e
exogena e simetrica. Problemas aparecem quando existe uma assimetria de informacao entre
os agentes economicos.
Exemplos:
1. Relacao empregado/patrao nvel de esforco do empregado nao e observado pelo patrao.
2. Compra de produtos qualidade do produto nao e observada pelo consumidor (Akerlof,

1970).
3. Venda de produtos disponibilidade a pagar do consumidor nao e observada pelo mono-

polista.
4. Mercado de Trabalho firma nao observa a produtividade do trabalhador (Spence, 1973).
Informacao imperfeita quebra essa metodologia descentralizada da analise de equilbrio geral:

assimetrias de informacao podem gerar comportamentos estrategicos, onde o objetivo e tirar
proveito da informacao privada. Alem disso, na maioria dos casos, a assimetria de informacao
gera uma ineficiencia (uma falha de mercado). Logo, o Primeiro Teorema do Bem-Estar deixa
de ser valido.
Vamos estudar os efeitos da assimetria de informacao nas propriedades de eficiencia de mercado.

Todo o captulo 8 do livro-texto e construdo usando exemplos do mercado de seguros.
Existem certas caractersticas que sao comuns aos modelos de informacao assimetrica:
1. Na maior parte, equilbrio parcial (um bem);
2. Interacao de um n
umero pequeno de agentes (dois, usualmente);
3. As restricoes geradas pelo modelo sao descritas por um contrato, garantido por uma
terceira parte;
4. Modelos de teoria dos jogos.
Jose Guilherme de Lara Resende 1 NA 3 Informacao

Microeconomia 2 P
os Notas de Aula
Salanie (2005) classifica os modelos de informacao assimetrica do seguinte modo:
I) Tipo da informacao assimetrica:
(a) O que o agente e/suas caractersticas: informacao oculta

(b) O que o agente faz/decisao que toma: acao oculta
II) Quanto a` forma do jogo:
(a) Screening: uma parte e imperfeitamente informada sobre as caractersticas da

outra parte. Parte desinformada move-se primeiro.
(b) Sinalizacao: uma parte e imperfeitamente informada sobre as caractersticas da
outra parte. Parte informada move-se primeiro.
(c) Perigo Moral : uma parte e imperfeitamente informada sobre as acoes da outra parte.
Parte desinformada move-se primeiro.
Vamos assumir um modelo de barganha simples, sem iteracao no processo de barganha (con-
trato do tipo take-it-or-leave-it). O cumprimento do contrato e assegurado por uma terceira
parte (justica, por exemplo). Alguma caracterstica de uma das partes da transacao (agente)
nao e observada pela outra parte (principal ). Portanto, os seguintes termos sao tradicional-
mente usados no sentido abaixo:
Principal : Parte desinformada.
Agente: Parte informada.
A terminologia mais usada para classificar a otimalidade das solucoes e:
First-Best: a solucao do problema para o caso em que a informacao e perfeita. Esse

caso serve de comparacao para avaliar a perda de bem-estar incorrida pela assimetria de
informacao.
Second-Best: a solucao do problema para o caso em que e considerada a assimetria infor-

macional. Usualmente, essa solucao apresentara uma perda de bem-estar, com relacao a`
solucao de First-Best.
Third-Best: a solucao do problema para o caso em que e considerada a assimetria infor-

macional, restringindo os tipos de contratos que podem ser feitos. Esse tipo de solucao
e mais comum para casos de perigo moral (por exemplo, relacao patrao-empregado, em
que contrato de salario pode ser apenas do tipo pagamento fixo mais comissao).
Um resultado pouco intuitivo que pode ocorrer em certas situacoes de perigo moral e o bem-
estar total associado à solucao de Second-Best ser menor do que o bem-estar total associado
a` solucao de Third-Best (obviamente, considerando apenas o principal, o seu bem-estar no
Second-Best sera maior ou igual ao seu bem-estar no Third-Best).

Microeconomia 2 P
os Notas de Aula
2 Selec
ao Adversa
2.1 Modelo B
asico
Mercado de seguros para carros, com varias firmas e varios consumidores. Este modelo mais
simples serve para outros problemas (como, por exemplo, para o modelo de sinalizacao no
mercado de trabalho de Spence (1973)).
Vamos supor que existem m consumidores, i = 1, . . . , m, todos iguais com respeito à utilidade
e riqueza inicial, mas com diferentes probabilidades de sofrerem um acidente de carro:
ui = u, para todo i = 1, . . . , m, u e contnua, crescente, estritamente concava, definida

sobre a riqueza;
wi = w: riqueza inicial;
i : probabilidade de o indivduo i sofrer um acidente de carro (essas probabilidades sao,

por hipotese, independentes (acidentes sao do tipo bater em uma arvore).
L: prejuzo com um acidente, igual para todo indivduo.
Todas as companhias de seguro sao identicas. Apenas seguro total e oferecido, que paga L se o
acidente ocorre, 0 caso contrario (ou seja, nao existe a possibilidade de seguro parcial seguro
e um lumpy good ). O preco do seguro e denotado por pi e a firma nao incorre em custos
administrativos.
Observe que o preco depende do estado da natureza (tratamos um bem em diferentes esta-
dos como diferentes bens). Logo, o preco depende do consumidor i (seguros que beneficiam
diferentes consumidores sao produtos diferentes, logo possuem precos diferentes).
O lucro esperado de uma firma j obtido ao vender seguro para o indivduo i e:
EPij = pi i L
Vamos analisar primeiro o caso com informacao simetrica e depois o caso com informacao
assimetrica, em um ambiente de competicao perfeita.
Informa
cao Sim
etrica
Suponha que as companhias de seguro observem a probabilidade i de cada indivduo. E facil

verificar que neste caso o equilbrio e u
nico e dado por pi = i L, para todo i = 1, 2, . . . , m.
Neste equilbrio todas as seguradoras obtem lucro esperado zero e todos os indivduos adquirem
seguro total.
Esse resultado e eficiente no sentido de Pareto: nao e possvel aumentar o payoff de nenhum
agente sem que se diminua o payoff de algum outro agente. Podemos mostrar isso usando
o Primeiro Teorema do Bem-Estar (ver Exerccio 8.1). Porem, iremos mostrar isso de modo
direto.
Sabemos que:
Uma alocacao determina rendas para todos os agentes (consumidores e firmas) em cada
estado da natureza;
Uma alocacao e factvel se em cada estado da natureza, o total de riqueza distribudo e

igual ao total de riqueza existente.

Microeconomia 2 P
os Notas de Aula
Afirmac
ao: Nenhuma alocacao factvel Pareto-domina a alocacao competitiva.
Ideia da Demonstrac ao: Prova por absurdo. O Exerccio 8.6 assegura que podemos supor,
sem perda de generalidade, que a alocacao competitiva e dominada por uma alocacao factvel
onde a riqueza wi de cada consumidor e constante em cada estado da natureza (ou seja, se ele
tem ou nao um acidente). Entao:
u(wi ) u(w pi ) = u(w i L) wi w i L , i ,
onde wi e uma alocacao factvel, constante em todo estado da natureza, que Pareto-domina
a alocacao competitiva e a equivalencia segue de u crescente. Como a riqueza de cada con-
sumidor e constante nos diferentes estados, podemos assumir sem perda de generalidade que
ocorre transferencia de riqueza apenas entre consumidores e firmas (e nao entre consumidores
diferentes ver o Exerccio 8.6). Nesse caso, o lucro esperado da firma que prove o consumidor
i com seguro, considerando a alocacao que Pareto-domina a alocacao de equilbrio, e:
(1 i )(w wi ) + i (w L wi ) = w i L wi
Usando a desigualdade wi w i L, temos que:

X
EPij = w i L wi 0 , i .
j
Mas cada companhia de seguro deve ter lucro esperado EP j nao-negativo na alocacao Pareto-
dominante, pois cada firma tem lucro esperado zero na alocacao competitiva. Logo:
X
EPij 0 , j .
i
Juntando os dois resultados:

X X
EPij 0 , j e EPij 0, i .
i j
Essas duas desigualdades acima implicam:

X X
EPij = 0 , j e EPij = 0, i .
i j
A riqueza (constante) de cada consumidor e o lucro esperado de cada firma na alocacao Pareto-
dominante e identica a` sua contraparte na alocacao competitiva. Desse modo, obtivemos uma
contradicao com a hipotese de que a alocacao constante e Pareto-dominante. Podemos concluir
entao que a alocacao competitiva e eficiente.
Informa
cao Assim
etrica
Suponha que as companhias de seguro nao observem perfeitamente a probabilidade i de cada

indivduo. Vamos supor tambem que cada firma conheca apenas a distribuicao de probabili-
dades F sobre [, ], com ambos e , < , no suporte de F .
Denotamos por F (), [, ] a fracao dos consumidores com probabilidade menor ou igual a
de sofrer um acidente (outra interpretacao: F () diz a probabilidade de que um consumidor
em particular tenha probabilidade ou menor do que de sofrer um acidente).
Consequ encia da informac ao assim nico preco de equilbrio p do contrato de

etrica: um u
seguro para todos os consumidores.

Microeconomia 2 P
os Notas de Aula
Razao: Suponha, por absurdo, dois precos distintos, p > p . Nesse caso, todos os consumi-
dores iriam comprar seguro apenas das firmas cujo preco cobrado e p . Pelo lado da oferta,
se consumidores estivessem comprando o seguro aos dois precos, nenhuma firma iria ofertar
seguro ao preco p , pois o seu lucro esperado seria menor. Logo p = p .
Queremos determinar o preco de equilbrio p . Observe que se o lucro esperado for positivo, a
oferta sera infinita; se o lucro esperado for negativo, a oferta e zero.
Um chute natural para o preco de equilbro e:
p = E()L ,
onde Z
E() = dF ()

e a probabilidade esperada de ocorrer um acidente.
O problema desse chute e que usamos nele a probabilidade incondicional de sofrer um aci-
dente. Porem, a probabilidade deve ser condicional a quem de fato compra o seguro. As
companhias de seguro ao fixarem p = E()L, podem estar subestimando a probabilidade es-
perada de acidente que de fato importa para elas (condicional a quem de fato compra o seguro).
Vamos levar isso em conta agora.
Seja qualquer. Um consumidor compra um seguro pelo preco p se a utilidade esperada obtida
sem comprar o seguro e menor ou igual a` utilidade esperada de comprar o seguro:
u(w) u(w p)
u(w L) + (1 )u(w) u(w p) h(p) , (1)
u(w) u(w L)
onde a implicacao segue do fato de u ser crescente (u(w) u(w L) e positivo). Como u e
crescente e u(w) u(w L) e positivo, h e crescente em p. Note que obtivemos uma condicao
em p para que o seguro seja comprado.
ao: Preco de Equilbrio. O preco p e um preco de equilbrio competitivo sob

Definic
informacao assimetrica se satisfaz:
p = E( | h(p ))L , (2)
onde: R
h(p )
dF ()
E( | h(p )) =
1 F (h(p ))
e a probabilidade esperada de ocorrer um acidente, condicional em h(p ).
Observe que a definicao acima de fato descreve um equilbrio como:
Consumidor com probabilidade compra seguro ao preco p se h(p );
A equacao (2) assegura lucro esperado zero para as firmas.
Vamos agora mostrar que existe um p de equilbrio.
Seja g(p) = E( | h(p))L, definida para p [0, L]. Observe que:

Microeconomia 2 P
os Notas de Aula
1. g e bem-definida, pois a esperanca condicional E( | h(p)) e bem-definida para todo

p [0, L]: h(p) , para todo p [0, L], pois:
(1 )u(w) + u(w L) u((1 )w + (w L))

= u(w L) u(w p),
para todo p [0, L], onde h(p) segue portanto da equacao (1) acima.
2. g pode ser definida como como g : [0, L] [0, L], pois E( | h(p)) [0, ], ja que
[, ].
3. g e nao-decrescente em p, pois h e crescente em p (e entao E( | h(p)) e nao-

decrescente em p).
Portanto, g : [0, L] [0, L] nao-decrescente tem um ponto fixo (consequencia do Teorema

do Ponto Fixo de Tarsky aplicado a` reta real). Esse ponto fixo e o preco de equilbrio:
p = g(p ) = E( | h(p ))L .
Propriedades do Equilbrio:
Unicidade: Equilbrio nao e necessariamente u

nico.
Eficiencia: Equilbrio nao e eficiente, em geral.
Exemplo: Considere [, ] = [0, 1] e F dada pela distribuicao uniforme em [0, 1]. Neste caso,
temos que:
R1 R1
h(p)
dF () h(p)
f ()d 1 h(p)2 1 + h(p)
E( | h(p)) = = = =
1 F (h(p)) 1 h(p) 2(1 h(p)) 2
Logo, a funcao g, dada por:

1 + h(p)
g(p) = E( | h(p ))L = L
2
e estritamente crescente e estritamente concava (pois h(p) e estritamente crescente e estrita-

mente concava). Nesse caso, o preco de equilbrio p satisfaz:
1 + h(p )

p = L,
2
onde h(p) = (u(w) u(w p))/(u(w) u(w L)) e p [0, L]. Portanto, como h(L) = 1, temos
que p = L e preco de equilbrio. Nesse caso, E( | h(p )) = E( | 1) = 1.
nicos consumidores que compram seguros sao os que satisfazem E( |

Neste equilbrio, os u

h(p )) = 1, ou seja, os que tem probabilidade 1 de sofrer um acidente. Mas, para esse tipo de
consumidor e esse preco de equilbrio, e irrelevante comprar ou nao o seguro. O resultado e
ineficiente ao extremo.
Comparando com o resultado competitivo com informacao simetrica: cada consumidor possui
utilidade estritamente maior (exceto os que possuem probabilidade 1 de sofrer um acidente)
e firmas obtem lucro esperado zero. Nesse exemplo com informacao assimetrica, o mercado
fecha: nenhuma troca e realizada e oportunidades de melhoras de Pareto nao ocorrem.

Microeconomia 2 P
os Notas de Aula
Esse e um problema de selecao adversa: efeito negativo no lucro esperado das firmas. Se o preco
e tal que EP < 0, entao aumentar o preco deve aumentar o lucro esperado. Porem, aumentar
o preco altera a utilidade dos consumidores de comprar o seguro, enquanto a utilidade de nao
comprar o seguro continua a mesma. Assim, consumidores no limite deixam de comprar o
seguro. Logo, apenas os consumidores com maior risco de acidentes continuam comprando o
seguro.
Caso extremo (Akerlof, 1970): mercado fecha. Porem mercados de seguro existem. Como os
mercados lidam com esses problemas?

Microeconomia 2 P
os Notas de Aula
3 Sinalizac
ao
3.1 Jogo de Sinaliza
c
ao
Acima vimos que o problema de selecao adversa gerado pela assimetria de informacao pode
ser tao severo que destroi o mercado de seguros. Porem existem formas que o proprio mercado
encontra para mitigar o problema gerado pela assimetria de informacao. Uma dessas formas
e por meio de sinalizacao, em que o tipo informado tenta, de uma forma crvel, sinalizar
corretamente o seu tipo à parte desinformada.
Logo, nos modelos de sinalizacao, o agente (consumidor, no nosso exemplo), de alguma maneira
crvel, comunica o seu tipo para o principal (a companhia de seguros, no nosso exemplo). Vamos
modelar essa relacao como um jogo, onde consumidores se movem primeiro.
Suponha, a partir de agora, que existam apenas dois tipos, 0 < < < 1, onde uma proporcao
, 0 < < 1, da populacao e do tipo (chamaremos o consumidor do tipo de baixo risco e
o consumidor do tipo de alto risco).
O jogo de sinalizacao de seguros que vamos analisar e estruturado do seguinte modo:
Natureza se move primeiro, determinando o tipo do consumidor, segundo a proporcao ;
Consumidor se move, escolhendo a estrategia (B, p), onde B e o benefcio pago e p e o

preco do seguro, pago se a perda ocorrer ou nao ((B, p) e uma proposta de contrato feito
pelo consumidor para a companhia de seguros);
Companhia de seguros se move, aceitando ou rejeitando a proposta do consumidor, sem

observar qual o tipo do consumidor.
Note que a firma nao observa o tipo do consumidor, apenas a proposta feita por ele. A
figura abaixo ilustra o jogo para o caso em que os jogadores podem escolher apenas entre dois
contratos, (B, p) e (B 0 , p0 ).
Natureza
x
baixo HH alto
() risco H risco (1 )
H
HH
HH
Consumidor x
H x Consumidor
risco baixo risco alto
A A
0 0
(B, p) A (B , p ) (B, p) A (B 0 , p0 )
A A
Ax Ax
A A

A Seguradora
A

A A
Ac A Rej
Ac A Rej

A A
A A

x x

A Seguradora A
A A
Ac A Rej Ac A Rej
A A
A A
Figura 8.1: Jogo de Sinalizac

ao

Microeconomia 2 P
os Notas de Aula
3.2 Equilbrio Sequencial

3.2.1 Estrat
egias
Estrategia pura para o tipo de baixo risco:
l = (Bl , pl ), Bl 0 e 0 pl w .
Estrategia pura para o tipo de alto risco:
h = (Bh , ph ), Bh 0 e 0 ph w .
Acoes disponveis para a companhia de seguros:
Aceitar ou Rejeitar, para cada proposta feita.
Logo, uma estrategia para a firma consiste em uma funcao resposta (B, p) {Aceitar, Rejeitar},
para toda proposta (B, p). A funcao depende apenas da proposta feita, e nao do tipo do
consumidor, evidenciando o problema de assimetria de informcao.
No jogo de sinalizacao, primeiro o consumidor propoe = (B, p). A firma entao forma uma
crenca () = (B, p), onde (B, p) e a crenca da firma de que o consumidor que fez a proposta
(B, p) seja de baixo risco.
Vamos assumir que os agentes tomam decisoes que sao otimas em cada ponto do jogo, e que o
sistema de crencas seja consistente. Portanto, vamos estender a nocao de equilbrio sequencial
para este jogo de sinalizacao (a definicao vista usual para jogos finitos nao se aplica, pois o
conjunto de estrategias do consumidor e infinito). O Exerccio 8.8 garante que a definicao
abaixo e equivalente a` definicao de equilbrio sequencial. Note que vamos procurar apenas
equilbrios em estrategias puras.
Definic
ao 8.1: Equilbrio Sequencial. O par ((l , h , ()); ()) e um equilbrio sequencial
em estrategias puras do jogo de sinalizacao se:
1. Dada a estrategia () da seguradora, o contrato l maximiza a utilidade do consumidor

de baixo risco e o contrato h maximiza a utilidade do consumidor de alto risco;
2. O sistema de crencas () da firma satisfaz a regra de Bayes:
(a) () [0, 1], para todo contrato = (B, p);

(b) Se l 6= h , entao (l ) = 1 e (h ) = 0;
(c) Se l = h , entao (l ) = (h ) = .
3. Para toda proposta = (B, p), a funcao de reacao () da companhia de seguros maxi-
miza o seu lucro esperado, dado o sistema de crencas ().
A questao crucial em que estamos interessados e saber se existe um equilbrio em que o consu-
midor de baixo risco consegue se diferenciar do de alto risco, de modo que o equilbrio obtido
seja menos ineficiente. A forma de um consumidor se diferenciar e pela proposta feita, que
pode funcionar como um sinal do seu tipo para a firma. Como (B, p) nao afeta a probabilidade
da perda, dizemos que (B, p) e um sinal puro. Nesse caso, dizemos que o sinal nao e produtivo.

Microeconomia 2 P
os Notas de Aula
Veremos que sera possvel obter um equilbrio menos ineficiente, onde o tipo de baixo risco
consegue se diferenciar do tipo de alto risco no caso em que os consumidores de tipos distintos
possuem taxas marginais de substituicao entre B e p diferentes. Essa condicao e chamada
single-crossing property (ou condicao de Spence-Mirrless ou condicao de separacao sorting
condition).
A utilidade esperada de cada tipo, caso a companhia de seguros aceite a proposta (B, p), e:
ul (B, p) = u(w L + B p) + (1 ) u(w p)
uh (B, p) = u(w L + B p) + (1 ) u(w p)
Proposic
ao (Facts).
(a) ul (B, p) e uh (B, p) sao contnuas, diferenciaveis, estritamente crescentes em B, estrita-
mente concavas em (B, p) e estritamente decrescentes em p.
(b) A taxa marginal de substituicao satisfaz:
T M Si (B, p) > i , se B < L;
T M Si (B, p) = i , se B = L;
T M Si (B, p) < i , se B > L;
onde l = e h = .
(c) T M Sl (B, p) < T M Sh (B, p), para todo (B, p).
A demonstracao da proposicao consiste em:

(a) Consequencia das propriedades de u.
(b) A TMS do tipo de baixo risco e (similar para o caso de alto risco):
ul (B,p)
B u0 (w L + B p)
T M Sl (B, p) = =
ul (B,p) u0 (w L + B p) + (1 )u0 (w p)
p
Como u0 e decrescente, u0 (w p) u0 (w L + B p), se L + B 0 (i.e., B L).

Entao:
u0 (w L + B p) + (1 )u0 (w p) u0 (w L + B p) + (1 )u0 (w L + B p)
= u0 (w L + B p)
Logo, temos que para B L vale que:
u0 (w L + B p)
1
u0 (w L + B p) + (1 )u0 (w p)
Se B L, multiplicando essa u
ltima desigualdade por resulta em:
u0 (w L + B p)
= T M Sl (B, p) .
u0 (w L + B p) + (1 )u0 (wL + B p)
(c) Fixe (B, p) qualquer. Defina a funcao f : (0, 1) R como:

X
f () = ,
X + (1 )Y
onde X = u0 (w L+B p) e Y = u0 (w p) sao positivos, pois u e estritamente crescente.
facil mostrar que f 0 () e maior do que zero. Logo f e crescente e como < , entao
E
f () = T M Sl (B, p) < T M Sh (B, p) = f (), para todo (B, p).

Microeconomia 2 P
os Notas de Aula
A condicao single-crossing property (item (c) da proposicao acima) significa que, dada uma
diminuicao em B, o consumidor de baixo risco aceita essa diminuicao por uma reducao em p
menor do que a reducao em p que o consumidor de alto risco aceitaria (custos diferentes em
relacao a (B, p)). A diferenca de taxas marginais de substituicao entre os dois tipos, dada pelo
fato de as probabilidades de acidente serem diferentes, faz com que as curvas de indiferenca de
tipos distintos se cruzem em apenas um ponto. No caso, como T M Sl (B, p) < T M Sh (B, p), a
curva de indiferenca do tipo de baixo risco e menos inclinada do que a curva do tipo de alto
risco. Dado o ponto (B 0 , p0 ) na Figura 8.2 abaixo, reduzir o benefcio para o consumidor de
baixo risco e menos custoso do que reduzir o benefcio para o consumidor de alto risco.
p
6
Figura 8.2
uh constante
ul constante
p0 s @
@
p00l s R
@
p00h s Direcao na qual

a utilidade aumenta
-
B 00 B 0 B
A seguradora deseja maximizar lucro. Assumindo a inexistencia de custos de transacao e

que a firma e neutra ao risco, as duas retas de isolucro zero para a firma, caso conseguisse
distinguir os tipos dos consumidores sao dadas por p = B, para o tipo de alto risco, e p = B,
para o tipo de baixo risco. Como 0 < < < 1, obtemos a Figura 8.3 abaixo. Observe
que a proposta 1 , acima da reta p = B, gera lucro positivo qualquer que seja o tipo do
consumidor. Ja a proposta 3 , abaixo da reta p = B, gera lucro negativo qualquer que seja
o tipo do consumidor. Finalmente, a proposta 2 , entre as retas p = B e p = B, gera lucro
positivo se o consumidor e de baixo risco e lucro negativo se o consumidor e de alto risco.
p
6
Figura 8.3
45 graus
p = B

(reta de isolucro zero se alto risco)

s 1

p = B
s 2

(reta de isolucro zero se baixo risco)

s 3

-
B

Microeconomia 2 P
os Notas de Aula
Na Figura 8.4 abaixo representamos o equilbrio no caso em que a seguradora consegue iden-
tificar o tipo do consumidor (ou seja, na ausencia do problema de informacao) e o mercado de
seguros e competitivo. A solucao de first-best e eficiente e caracterizada por ambos os tipos
adquirindo seguro total (B = L) ao preco justo relativo ao seu tipo (p = L, se alto risco;
p = L, se baixo risco).
p
6
Figura 8.4
45 graus
p = B

c

uh

s c

h = (L, L)

p = B

c

s ul
c

= (L, L)
l

-
L B
Observe que as estrategias lc = (L, L) e hc = (L, L) nao farao parte de nenhum equilbrio
sequencial, pois uh (lc ) > uh (hc ), ja que B = L nesses dois contratos e L < L (pois < ).
Logo, essas estrategias violam a condicao 1. da definicao de equilbrio sequencial acima.
Lema 8.1. Seja ((l , h , ()); ()) um equilbrio sequencial qualquer. Denote por ul e uh as
utilidades de equilbrio dos consumidores de baixo risco e alto risco, respectivamente. Entao:
1. ul ul , e
2. uh uch ,
onde ul = max(B,p) ul (B, p) sujeito a p = B w e uch = uh (L, L) (utilidade do consumidor

de alto risco no equilbrio competitivo com informacao completa).
O lema acima e valido para qualquer equilbrio sequencial. Ele mostra que a utilidade dos
dois tipos de indivduo nao sera menor do que a utilidade que eles obteriam no caso em que a
seguradora acreditasse que eles sao do tipo alto. Em particular, em um equilbrio sequencial,
o tipo de risco alto nunca tera uma utilidade menor do que a que ele obteria no equilbrio
de informacao perfeita (nao podemos garantir o mesmo para o consumidor de baixo risco,
pois ul < ul (L, L), ja que < (localize na figura acima essas duas utilidades e faca a
comparacao).
Corol
ario. No equilbrio, consumidores do tipo de alto risco compram o seguro.
O corolario segue do item 2. do lema acima e do fato de que aversao ao risco implica uch >
uh (0, 0). Nao podemos garantir que o consumidor de baixo risco compra o seguro no equilbrio.

Microeconomia 2 P
os Notas de Aula
A prova do Lema 8.1 consiste em:
1. Mostrar que, no equilbrio, a firma aceita qualquer proposta (B, p) tal que p > B.
2. No equilbrio, vale:
ul ul (B, p) , (B, p) tal que B p w

uh uh (B, p) , (B, p) tal que B p w
3. Concluir demonstracao do lema usando a continuidade de u.
A Figura 8.5 abaixo ilustra graficamente o resultado do Lema 8.1. O corolario segue de ime-
diato, ja que uch > uh (0, 0). Para o caso do consumidor de baixo risco, temos que a utilidade
de equilbro, ul sera maior ou igual do que a utilidade ul , cuja curva de indiferenca associada
esta no grafico. Na Figura 8.5, como ela foi desenhada para o caso em que T M Sl (0, 0) > ,
entao ul > ul (0, 0). Logo, podemos garantir que o indivduo de baixo risco comprara o seguro
tambem. Porem, se T M Sl (0, 0) < , entao ul ul (0, 0). Neste caso, pode ocorrer que o
indivduo decida nao adquirir seguro (nao viola o Lema 8.1, ja que ul ul (0, 0)).
p
6
Figura 8.5
45 graus
p = B

uch uh

s c

h
ul ul

p = B

s

l

-
L B
3.3 Equilbrio Separador e Equilbrio Agregador

Um equilbrio e chamado separador se diferentes tipos de consumidores escolhem propostas
(B, p) diferentes. Neste caso, a companhia de seguros identifica o tipo do consumidor pela
proposta feita. Um equilbrio e chamado agregador se os diferentes tipos de consumidores
escolhem propostas (B, p) iguais. Nesse caso, a companhia de seguros nao consegue identificar
o tipo do consumidor, observando a proposta feita.
Definic ao 8.2: Equilbrio Separador e Equilibrio Agregador. Um equilbrio sequencial

em estrategias puras ((l , h , ()); ()) e separador se l 6= h . Caso contrario, ele e um
equilbrio agregador.
Vamos analisar cada tipo de equilbrio, comecando pelo equilbrio separador.

Microeconomia 2 P
os Notas de Aula
Equilbrio Separador
No equilbrio separador, cada tipo escolhe uma proposta diferente. A firma separa os tipos
observando a proposta feita. Em equilbrio, nao existe tentacao de desviar, ou seja, de enviar
o sinal do outro tipo. Entao, o tipo de alto risco nao tem incentivo para se fazer passar pelo
tipo de baixo risco (e vice-versa). O Teorema 8.1 a seguir formaliza esse ponto.
Teorema 8.1: Caracterizac ao do Equilbrio Separador. As propostas l = (Bl , pl )

e h = (Bh , ph ) sao escolhidas pelos consumidores de baixo e alto risco, respectivamente, e
aceitas pela companhia de seguros em um equilbrio separador se, e somente se,
1. l 6= h = (L, L);
2. pl Bl ;
3. ul (l ) ul = max(B,p) ul (B, p) sujeito a` p = B w;
4. uch = uh (h ) uh (l ).
Esquema de Demonstrac ao: () Suponha que ((l , h , ()); ()) seja um equilbrio se-
parador. Mostrar que satisfaz os itens (1) -(4) do teorema.
() Suponha que l e h sao tais que satisfazem os itens (1) -(4) do teorema. Mostrar que exis-
tem () e () tais que ((l , h , ()); ()) seja um equilbrio sequencial. Para isso, considere
() e () tais que:

1 se (B, p) = l
(B, p) =
0 se (B, p) 6= l

Aceita, se (B, p) = l ou p B
(B, p) =
Rejeita, caso contrario
Mostrar que ((l , h , ()); ()) satisfaz as condicoes listadas na definicao de equilbrio sequen-
cial.
A Figura 8.6 abaixo ilustra as consequencias do Teorema 8.1. Nela estao marcadas possveis
estrategias de propostas (l , h ) dos consumidores que formam equilbrios separadores. Observe
que a proposta de equilbrio do tipo de alto risco e sempre igual a hc . Porem, qualquer proposta
l na area hachurada da figura constitui, com hc (e com () e () definidos na demonstracao
do Teorema 8.1), um equilbrio separador.
O Teorema 8.1 restringe a atencao a equilbrios em que as propostas dos dois tipos sao aceitas
e que consideram apenas estrategias puras (nao estamos levando em conta a possibilidade de os
consumidores randomizarem entre propostas diferentes). Se T M Sl (0, 0) , entao e possvel
mostrar que existem equilbrios em que a proposta do consumidor de baixo risco e rejeitada
em equilbrio. Porem, como argumentamos na demonstracao do Teorema 8.1, esse equilbrio
e equivalente em termos de payoffs a outro equilbrio em que todas as propostas sao aceitas.
Alem disso, e possvel mostrar que a area hachurada da figura abaixo sera sempre nao-vazia,
mesmo no caso em que T M Sl (0, 0) (para mostrar isso, usamos que T M Sl (0, 0) > ).
Em termos de eficiencia, se T M Sl (0, 0) , existe um equilbrio em que o tipo de baixo

risco nao e segurado (proposta = (0, 0)) e o tipo de alto risco recebe seguro total (proposta
= (L, L)). Esta situacao pode ser um equilbrio independentemente da probabilidade 1
de o indivduo ser de alto risco. Portanto, mesmo na presenca de poucos indivduos de alto
risco, o mercado de seguros para indivduos de baixo risco pode inexistir, sob certas condicoes.

Microeconomia 2 P
os Notas de Aula
Por outro lado, podem existir equilbrios em que o tipo de baixo risco recebe algum seguro,
quando e possvel utilizar sinais. As propostas (hc , l ), ilustradas na figura abaixo, sao Pareto
eficientes, considerando todas as propostas que formam um equilbrio separador e geram lucro
zero para a seguradora.
Portanto, mesmo no caso em que o u nico equilbrio competitivo sob informacao assimetrica
nao prove seguro total para o tipo de baixo risco, sinalizacao pode melhorar a eficiencia, com
o tipo de baixo risco adquirindo seguro parcial.
p
6
Figura 8.6

45 graus
p = B

uc
h uh

s c

h
ul ul

p = B

s
l

-
L B
Equilbrio Agregador
O Teorema 8.2 abaixo caracteriza as propriedades que um equilbrio agregador deve satisfazer.
Neste tipo de equilbrio, o tipo de alto risco se faz passar pelo tipo de baixo risco, em certo
sentido.
Teorema 8.2: Caracterizac ao do Equilbrio Agregador. A proposta 0 = (B 0 , p0 ) e o

resultado de algum equilbrio agregador se, e somente se, satisfaz as seguintes desigualdades:
(1) p0 B0; e
(2) ul (B 0 , p0 ) ul e uh (B 0 , p0 ) uch ,
= + (1 ).
onde
Esquema de Demonstrac ao: () Suponha que (( 0 , 0 , ()); ()) seja um equilbrio agre-
gador. Entao (1) garante que a proposta sera aceita pela seguradora e (2) e consequencia do
Lema 8.1.
() Suponha que 0 = (B 0 , p0 ) satisfaz as condicoes (1) e (2) do teorema. Mostrar que existem
() e () tais que (( 0 , 0 , ()); ()) seja um equilbrio sequencial. Para isso, considere ()
e () tais que:
se (B, p) = 0

(B, p) =
0 se (B, p) 6= 0
Aceita, se (B, p) = 0 ou p B

(B, p) =
Rejeita, caso contrario
Mostrar que (( 0 , 0 , ()); ()) satisfaz as condicoes na definicao de equilbrio sequencial.

Microeconomia 2 P
os Notas de Aula
A area hachurada da Figura 8.9 abaixo ilustra o conjunto de propostas que podem fazer parte
de um equilbrio agregador, segundo o Teorema 8.2.
p
6
Figura 8.9
45 graus
p = B

uc
h uh

p=
B
!
!!

! !! ul ul
!!
!
!
p = B
!
!!
!
!
!!!
!
!
!
!
-
B
A proporcao mede a proporcao de consumidores de baixo risco (mudar altera a inclinacao

da reta de isolucro agregado zero). Logo, se e suficientemente proximo de zero, a maioria
dos consumidores e de alto risco e pode nao existir equilbrio agregador (reta de isolucro definida
por se aproxima da reta de isolucro definida por p = B). Porem, se e suficientemente
proximo de um, a maioria dos consumidores e de baixo risco e pode ocorrer uma situacao onde
os dois tipos de consumidores preferem o equilbrio agregador ao equilbrio separador.
Em geral, podemos apenas afirmar que o consumidor de alto risco prefere o equilbrio agregador
ao equilbrio separador. Intuitivamente, seria de se esperar que o consumidor de baixo risco
preferisse o equilbrio separador. Porem, nem sempre isso sera verdade. Mais ainda, quanto
maior a proporcao de consumidores de baixo risco, mais provavel que um consumidor de baixo
risco prefira o equilbrio agregador ao equilbrio separador.
3.4 Equilbrio Intuitivo

A nocao de equilbrio sequencial apresenta certos problemas para a analise de um modelo
de sinalizacao. Esses problemas sao causados pelo fato de que a restricao que a definicao de
equilbrio sequencial impoe sobre o sistema de crencas permite que a firma tenha crencas pouco
razoaveis.
Por exemplo, suponha a situacao ilustrada na Figura 8.11 abaixo, em que l = h = 0 e a

proposta de equilbrio. Observe que existem propostas 00 tais que apenas o consumidor de
baixo risco estaria melhor escolhendo essa proposta no lugar de sua proposta de equilbrio (o
consumidor de alto risco estaria pior escolhendo a proposta 00 no lugar de sua proposta de
equilbrio).
Nesse caso, e razoavel supor que apenas o consumidor de baixo risco faria essa proposta.
Porem, a nocao de equilbrio sequencial nao impoe nenhuma disciplina sobre crencas referentes
a propostas tais como 00 (nas demonstracoes dos Teoremas 8.1 e 8.2 usamos crencas pouco
razoaveis nesse sentido, pois se um indivduo fizesse uma proposta diferente das de equilbrio,
a crenca da firma seria de que esse indivduo e de alto risco com certeza).

Microeconomia 2 P
os Notas de Aula
p
6
Figura 8.11

45 graus
p = B

uh

0 ul

s
p=
B

s 00 p = B

-
B
Definic ao 8.3: Equilbrio Intuitivo (Cho & Kreps, 1987). O equilbrio sequencial
((l , h , ()); ()) satisfaz o criterio intuitivo se a seguinte condicao e satisfeita para toda
proposta 6= l , h :
Se ul () > ul e uh () < uh entao () = 1 ;
Se ul () < ul e uh () > uh entao () = 0 ;
onde ul e uh sao as utilidades de equilbrio dos consumidores de baixo e de alto risco, respec-
tivamente.
Teorema 8.3: Exist encia Equilbrio Intuitivo (Cho & Kreps, 1987). Existe um u nico
par de propostas (l , h ) que faz parte de um equilbrio sequencial que satisfaz o criterio intui-
tivo. Alem disso, o equilbrio sequencial que satisfaz o criterio intuitivo e o melhor equilbrio
separador para o consumidor de risco baixo (ou seja, l = l e h = hc , ver Figura 8.6).
Os passos da demonstracao do Teorema 8.3 consistem em:
1. Mostrar que nenhum equilbrio agregador satisfaz o criterio intuitivo.
2. Mostrar que a utilidade de equilbrio (que satisfaz o criterio intuitivo) do consumidor de

baixo risco e ul (l ).
3. Mostrar que o equilbrio intuitivo existe.
Um equilbrio sequencial que satisfaz o criterio intuitivo e chamado equilbrio intuitivo. A

nocao de equilbrio intuitivo elimina todos os equilbrios sequenciais do jogo de sinalizacao,
com excecao de um u nico equilbrio separador.
A razoabilidade do criterio intuitivo indica que o equilbrio intuitivo e o resultado mais provavel
de um jogo de sinalizacao. Esse resultado pode ser melhor (no sentido de Pareto) do que o
resultado de equilbrio competitivo com informacao assimetrica. Nesse caso, sinalizacao atenua
a ineficiencia causada pela assimetria de informacao.

Microeconomia 2 P
os Notas de Aula
4 Screening
4.1 Jogo de Screening
Agora vamos supor que a companhia de seguros se move primeiro, escolhendo um menu de
contratos (uma lista de possveis contratos de seguros). A firma desenha um contrato para cada
tipo de consumidor, com o intuito de separar os tipos e diminuir a perda causada pela assimetria
de informacao. Em certos mercados screening pode ser mais comum do que sinalizacao
Vamos supor dois tipos de consumidores e duas companhias de seguro. Usando duas firmas
podemos modelar a possibilidade de que uma das firmas, dado o menu de contratos oferecido
pela outra firma, ofereca um contrato com o objetivo de roubar todos os consumidores de baixo
risco da outra firma (estrategia de cream-skimming).
Os dois tipos de consumidores sao alto e baixo risco, onde e a proporcao de consumidores de
baixo risco. Neste caso, podemos supor que cada firma oferece apenas dois tipos de contratos,
sem perda de generalidade.
A firma desenha o contrato de modo que cada tipo adquira o contrato desenhado para ele.
Mas essa decisao e do consumidor ele escolhe o contrato que deseja. As firmas se movem
simultaneamente. Logo, as duas companhias de seguro oferecem contratos ao mesmo tempo
no mercado.
Portanto, a dinamica do jogo de screening e:

As duas companhias de seguro se movem primeiro, escolhendo simultaneamente um menu
de contratos de seguro;
A natureza se move em seguida, determinando qual o tipo de consumidor que as compa-
nhias de seguro encontram: com probabilidade o consumidor de baixo risco e escolhido,
com probabilidade 1 o consumidor de alto risco e escolhido;
O consumidor selecionado pela natureza escolhe um dos contratos de seguro de uma das
firmas, selecionado de um dos menus de uma das firmas.
As estrategias dos jogadores sao:

Firmas (indexadas por A e B): Uma estrategia pura e descrita por um par de contratos:
j = (lj , hj ), j = A, B.
Consumidores: Uma estrategia pura e descrita por uma funcao escolha:

ci (A , B ) = (j, ),
onde j = A ou B e = lj , hj , ou (0, 0).
Para o jogo de screening modelado acima, o u nico conjunto de informacao nao trivial e
alcancado sempre, quaisquer que sejam as estrategias dos jogadores. Nesse caso, podemos
usar o conceito de equilbrio de Nash perfeito em subjogos (ENPS). Assim como no modelo de
sinalizacao, existem dois tipos de equilbrio: agregador e separador. Observe que, segundo a
definicao a seguir, em um equilbrio agregador os dois tipos de consumidores adquirem o mesmo
contrato. Porem, eles podem adquirir esse contrato de companhias de seguro diferentes.
Definic ao 8.4: Equilbrio. O equilbrio perfeito em subjogos em estrategias puras, denotado

por ( , B , cl (), ch ()), e um equilbrio separador se l 6= h , onde (jl , l ) = cl (A , B ), e
A
(jh , h ) = ch (A , B ). Caso contrario, o equilbrio e agregador.

Microeconomia 2 P
os Notas de Aula
4.2 Analisando o Jogo

Queremos caracterizar os equilbrios do jogo de screening. Um fenomeno importante neste
tipo de jogo e chamado cream-skimming (separando o joio do trigo): ocorre quando uma
das firmas obtem vantagem estrategica do menu de contratos da outra firma, oferecendo uma
poltica que atraia apenas os consumidores de baixo risco da outra firma. Nesse caso, a firma
competidora fica apenas com consumidores de alto risco. No equilbrio, ambas as firmas devem
agir de modo que a concorrente nao tenha espaco para usar uma estrategia cream-skimming.
Para que o problema de cream-skimming possa ser analisado, e necessario supor pelo menos
duas firmas.
Lema 8.2. Ambas as companhias de seguro recebem lucro esperado zero em todo equilbrio
perfeito em subjogos em estrategias puras.
Ideia da prova: Basta mostrar que nenhuma das firmas tem lucro esperado positivo. Provar
por contradicao, analisando os dois casos de equilbrio possveis, agregador e separador.
Equilbrio Agregador
O resultado abaixo e tpico em modelos de competicao com screening, onde as firmas competem
por consumidores oferecendo simultaneamente um menu de contratos. O efeito de cream-
skimming elimina a existencia de equilbrios agregadores.
Teorema 8.4. Nao existe nenhum equilbrio agregador em estrategias puras para o jogo de
screening.
Ideia da Prova: Por contradicao, usar o Lema 8.2. Observe que a competicao entre as firmas
e fundamental para obtermos esse resultado.
Equilbrio Separador
O resultado abaixo mostra que a natureza competitiva do modelo afeta tambem o conjunto de
equilbrios separadores. A competicao entre as duas firmas nesse caso elimina todos contratos
que fazem parte de equilbrios sequenciais no modelo de sinalizacao. O u nico equilbrio sepa-
rador do modelo de screening coincide com o equilbrio intuitivo do modelo de sinalizacao (o
equilbrio sequencial separador que prove o maximo de utilidade para o consumidor de baixo
risco).
Teorema 8.5. Denote por l e h as polticas escolhidas pelos consumidores de baixo e de

alto risco, respectivamente, em um equilbrio separador. Entao l = l e h = hc .
Ideia da prova: consiste em mostrar uma serie de afirmacoes: 1) uh uch , 2) l satisfaz

pl = Bl , 3) h = hc , e 4) l = l .
O Teorema 8.5 apenas caracteriza qual sera o equilbrio separador no jogo de screening, caso ele
exista. Usando o Teorema 8.4, podemos garantir que se um ENPS em estrategias puras existir,
entao ele e separador e os contratos sao u
nicos para cada tipo de jogador (sempre existira
ENPS em estrategias comportamentais).
Porem, pode ocorrer que nao exista nenhum equilbrio em estrategias puras. Isso pode acontecer
se for suficientemente proximo de 1 (proporcao de consumidores de alto risco e baixa).

Microeconomia 2 P
os Notas de Aula
5 Perigo Moral
5.1 Introdu
c
ao
Perigo moral esta presente em transacoes onde uma da partes (principal) nao consegue moni-
torar as acoes da outra parte, e essas acoes sao relevantes para a transacao negociada.
Exemplo: Seguro de automoveis: motorista pode deixar de tomar cuidado com o carro apos
adquirir o seguro. Esse comportamento afeta o resultado do contrato (a probabilidade de o
carro ser roubado pode aumentar, por exemplo) e nao e possvel (ou e muito custoso) a` firma
observar esse comportamento.
Principal: Parte desinformada companhia de seguro.

Agente: Parte informada consumidor.
O agente toma uma acao que afeta a sua utilidade e a utilidade do principal. O principal nao
observa a acao tomada, apenas o resultado da acao. Quando a acao que o agente escolhe espon-
taneamente nao e Pareto-otima (o que o principal gostaria), dizemos que existe um problema
de perigo moral.
O problema do principal-agente refere-se ao problema de como o principal pode desenhar um

esquema de incentivos que induza o agente a tomar a acao desejada pelo principal.
Exemplos:
Firma e Empregado esforco vs producao;
Acionistas e Gerentes;
Servicos Medico e Paciente, Advogado e Cliente;
Fazendeiros e Arrendatarios (sharecropping decision);
Seguros seguro contra roubo, seguro contra incendio, seguros em geral de proprieda-
des/bens.
First-Best: caso em que o principal observa a acao do agente, de modo que e possvel
implementar a acao otima diretamente.
Em geral, supoe-se que:

Principal: neutro ao risco (principal consegue diversificar o risco associado com a sua
relacao com o agente);
Agente: avesso ao risco (pequeno, nao consegue diversificar o risco).
Divisao otima de risco (optimal risk sharing): principal fornece um seguro total para o agente
(por exemplo, salario fixo para o agente) e com isso assume todo o risco da atividade produtiva.
A divisao otima de risco nem sempre e possvel quando existe problema de perigo moral, pois
o agente pode nao escolher a acao desejada pelo principal.
Solucao: principal oferece um contrato ao agente. Trade-off entre:

Divisao de riscos (salario do agente nao deve depender do produto);
Incentivos (principal deve condicionar o salario do agente ao produto).

Microeconomia 2 P
os Notas de Aula
5.2 Modelo
Suponha um consumidor e uma companhia de seguros. Consumidor deseja comprar um seguro
contra acidentes. A probabilidade de sofrer um acidente depende do cuidado (esforco) que o
consumidor tem ao dirigir.
Existem L + 1 possibilidades de perda, l {0, 1, 2, . . . , L}, onde l e o valor da perda. A

probabilidade de ocorrer a perda l e l (e) > 0, para
P todo l e e, onde e e o nvel de esforco do
consumidor. Dado e qualquer, temos entao que l l (e) = 1.
Vamos supor apenas dois nveis de esforco para o consumidor, e = 0 (pouco esforco) ou e = 1
(muito esforco). A companhia de seguros deve desenhar um esquema de incentivos de modo
que o consumidor escolha por si mesmo o nvel de esforco desejado pela firma.
Vamos supor tambem que o consumidor possui uma utilidade u estritamente crescente e estri-
tamente concava sobre riqueza w e que a riqueza inicial e maior do que L. Alem disso, d(e)
denota a desutilidade do nvel de esforco e. Logo, a utilidade e separavel: u() d(e), onde
d(1) > d(0).
A companhia de seguro observa a perda l ocorrida, mas nao o nvel de esforco do consumidor.
Logo, o benefcio pago pode depender apenas da perda ocorrida. Um contrato e represen-
tado entao por (p, B0 , B1 , . . . , BL ), onde p e o preco do contrato de seguro que paga Bl se o
consumidor sofre um acidente com perda l.
Hip
otese 8.1: Monotone Likelihood Ratio Condition (MLRC). A razao
l (0)
l (1)
e estritamente crescente em l, l = 0, 1, 2, . . . , L.
A MLRC garante que a razao da probabilidade de ter se esforcado sobre a probabilidade de

ter se esforcado muito e crescente no valor da perda. Intuitivamente, quanto maior a perda
observada, mais provavel que o consumidor se esforcou pouco e nao muito.
Quais sao os contratos oferecidos pela seguradora? Quais sao as propriedades de eficiencia
desses contratos?
5.3 Informa
cao Sim
etrica
Vamos supor que o principal observa o nvel de esforco do agente. Logo, o principal pode
implementar diretamente a acao que deseja. Ou seja, o contrato e diretamente condicionado
ao nvel de esforco desejado pela firma. Nesse caso, nao existe problema de informacao as
acoes do consumidor sao observadas sem custo pela companhia de seguros.
O problema da firma e:
L
X L
X
max p l (e)Bl s.a. l (e)u(w p l + Bl ) d(e) u ,
e,p,B0 ,...,BL
l=0 l=0
onde u e a utilidade reserva (ou custo de oportunidade em assinar o contrato de seguro) do

consumidor. Essa restricao do problema e chamada restricao de participacao.
Vamos separar o problema em dois, um onde e = 0 e o outro onde e = 1. Determinamos o

contrato otimo em cada caso, e depois encontramos o nvel de esforco otimo para o principal.

Microeconomia 2 P
os Notas de Aula
O Lagrangeano do problema da firma e:

L
" L #
X X
L=p l (e)Bl + l (e)u(w p l + Bl ) d(e) u
l=0 l=0
Vamos encontrar a solucao resolvendo as CPOs. As CSOs sao validas, pois este e um problema
de maximizacao onde a funcao objetivo e linear e as restricoes sao concavas.
As condicoes de primeira ordem (CPOs) sao:

" L #
L X
=1 l (e)u0 (w p l + Bl ) = 0 (3)
p l=0
L
= l (e) + l (e)u0 (w p l + Bl ) = 0 , Bl (4)
Bl
L
L X
= l (e)u(w p l + Bl ) d(e) u = 0 (se 6= 0) (5)
l=0
A primeira CPO e redundante, pois e consequencia das L + 1 CPOs em (3). Temos entao
um sistema de no maximo L + 2 equacoes independentes, onde precisamos encontrar L + 3
variaveis.
As CPOs em (3) implicam que > 0 e que:

1
u0 (w p l + Bl ) = , l 0,

o que pro sua vez implica que Bl l deve ser constante para todo l (u0 e injetiva).
Como > 0, a CPO (4) e valida com igualdade, logo:
u(w p l Bl ) = d(e) + u , l 0.
Vamos normalizar B0 = 0. A equacao acima para l = 0 se torna:
u(w p) = d(e) + u ,
ou seja, encontramos p resolvendo u(w p) = d(e) + u.
Como Bl l e constante para todo l e B0 0 = 0, temos que Bl = l para todo l.
Portanto, no caso de informacao perfeita, o contrato otimo prove seguro total para o agente,
qualquer que seja a acao que o principal deseje implementar (a utilidade do indivduo nao varia
permanece constante em todos os estados da natureza).
O preco cobrado pela firma de seguros iguala a utilidade obtida com o contrato com a utilidade
reserva do consumidor, calculada no nvel de esforco relevante. Esse resultado e esperado: a
firma e neutra ao risco e o consumidor e avesso ao risco, logo obtemos uma divisao otima de
risco, em que a firma arca com todo o risco.
Para a firma, ao decidir o nvel otimo de esforco que deseja implementar, temos que, dado
e = 0, 1, o preco otimo em funcao de e e encontrado resolvendo a equacao:
u(w p(e)) = d(e) u

Microeconomia 2 P
os Notas de Aula
Logo, a companhia de seguro escolhe e {0, 1} que maximiza:

L
X
p(e) l (e) l
l=0
Como d(0) < d(1), exigir e = 0 permite à firma cobrar um preco mais alto, o que aumenta o
lucro esperado (restricao de participacao). Por outro lado, exigir e = 1 reduz a probabilidade
esperada de perda (MLRC) e, portanto, tambem aumenta os lucros.
A acao otima para o principal depende do caso em questao. Se for a acao menos custosa para
o agente, e estivermos em uma situacao de perigo moral, nao ha conflito de interesses entre o
principal e o agente e, portanto, nao ocorre perda de eficiencia.
De qualquer modo, em ambos os casos, e = 0 ou e = 1, no caso de informacao perfeita, o

agente obtem seguro total contra acidentes e o resultado e eficiente.
5.4 Informa
cao Assim
etrica
Agora vamos supor que a escolha do nvel de esforco do consumidor nao e observada pela
companhia de seguro, que deve entao desenhar um contrato que implicitamente induza o con-
sumidor a escolher o nvel de esforco que a firma deseja implementar.
Para isso, uma nova restricao deve ser adicionada ao problema da firma. Essa restricao, cha-
mada restricao de incentivos (ou restricao de compatibilidade de incentivos), assegura que o
consumidor escolhera de fato a acao desejada pela firma.
O problema da firma de seguros e caracterizado como:

L
X
max p l (e)Bl
e,p,B0 ,...,BL
l=0
L
X
s.a. l (e)u(w p l + Bl ) d(e) u ,
l=0
XL L
X
l (e)u(w p l + Bl ) d(e) l (e0 )u(w p l + Bl ) d(e0 ) ,
l=0 l=0
onde e, e0 {0, 1}, e 6= e0 .
A restricao de incentivos garante que o nvel de esforco desejado pela firma seja de fato o nvel
de esforco escolhido pelo consumidor no contrato otimo.
Novamente, vamos resolver o problema da firma para cada nvel de esforco e depois encontrar
o nvel de esforco otimo.

Poltica Otima para e = 0
Suponha que a seguradora queira induzir o agente a escolher o nvel baixo de esforco (e = 0).
Entre todas as polticas possveis que implementam e = 0, qual a melhor para a firma? Nesse
caso, a firma deve apenas pagar um salario que garanta a participacao do agente. Nao e
necessario se preocupar com a restricao de incentivos.
Vimos que a solucao otima p, B0 , . . . , BL para o problema com informacao perfeita (i.e., sem
considerar a restricao de incentivos) quando e = 0 e Bl = l e o preco otimo e encontrado
resolvendo a equacao u(w p) = d(0) u.

Microeconomia 2 P
os Notas de Aula
Se adicionarmos a restricao de incentivos ao problema, o lucro esperado da firma nao aumen-

tara. Se a solucao acima satisfaz a restricao de incentivos, entao ela e tambem a solucao para
o problema com a restricao de incentivos, que nao estara ativa no otimo.
Substituindo a solucao acima na restricao de incentivos, com e = 0, ela se reduz a d(0) d(1),
que e valido por hipotese. Logo, para induzir o consumidor a escolher o nvel de esforco mnimo,
a firma nao precisa adotar nenhum esquema de incentivos especial, basta selecionar o mesmo
contrato otimo usado no caso onde nao existe problema de informacao.

Poltica Otima para e = 1
Suponha agora que a seguradora queira induzir o agente a escolher o nvel alto de esforco
(e = 1). Entre todas as polticas possveis que implementam e = 1, qual a melhor para a
firma?
Observe que a poltica otima de first-best, que prove seguro total para o agente, nao satisfaz
a restricao de incentivos nesse caso. Intuitivamente, se seguro total e oferecido, o agente ira
escolher o menor nvel de esforco. Portanto, para que o principal consiga implementar e = 1,
o contrato nao pode fornecer seguro total para todos os nVeis de perda.
Vamos resolver o problema de maximizacao do principal com e = 1 fixo. O Lagrangeano do

problema e:
L
" L #
X X
L=p l (1)Bl + l (1)u(w p l + Bl ) d(1) u
l=0 l=0
" L L
!#
X X
+ l (1)u(w p l + Bl ) d(1) l (0)u(w p l + Bl ) d(0)
l=0 l=0
As condicoes de primeira ordem do problema sao:

L
L X
=1 [l (1) + (l (1) l (0))] u0 (w p l + Bl ) = 0
p l=0
L
= l (1) + [l (1) + (l (1) l (0))] u0 (w p l + Bl ) = 0 , Bl
Bl
L
L X
= l (1)u(w p l + Bl ) d(1) u 0
l=0
L
L X
= (l (1) l (0))u(w p l + Bl ) + d(0) d(1) 0
l=0
A primeira CPO e redundante, pois e consequencia das L + 1 CPOs em Bl . Logo podemos

normalizar B0 = 0. As CPOs em Bl sao equivalentes às seguintes equacoes:

1 l (0)
=+ 1 , l.
u0 (w p l + Bl ) l (1)
Vamos provar que as duas restricoes estao ativas no otimo. Para isso, basta provar que 6= 0 e
6= 0. Logo, no otimo, o consumidor compra um contrato de seguros que gera utilidade igual
a sua utilidade reserva e ele e indiferente entre se esforcar muito ou se esforcar pouco.
Suponha que = 0. Entao

1
= , l.
u0 (w p l + Bl )

Microeconomia 2 P
os Notas de Aula
Logo w p l + Bl e constante para todo l. Nesse caso, a CPO para (restricao de incentivos)
se reduz a d(0) d(1), que e negativo, um absurdo. Logo 6= 0.
Observe agora que a MLRC implica que existe l tal que l (0)/l (1) e diferente de 1. Mais
ainda, vamos mostrar que existem l e l tais que:
l (0) (0)
<1< l
l (1) l (1)
Suponha que nao. Ou seja, suponha que para todo l, l (0)/l (1) 1, com algum l em que a
desigualdade e estrita (o outro caso e similar). Mas entao temos que:
l (0)
1 l l (0) l (1) l ,
l (1)
com pelo menos um l em que a desigualdade e estrita. Somando a u
ltima desigualdade para
todo l, temos que: X X
l (0) > l (1) = 1 ,
l l
P
um absurdo, pois l l (0) = 1.
Logo, como 6= 0, existem valores de l em que o termo:

l (0)
1
l (1)
assume valores positivos e assume valores negativos. Como 1/u0 (w p l + Bl ) e sempre
positivo, para que a igualdade:

1 l (0)
=+ 1 (6)
u0 (w p l + Bl ) l (1)
seja valida para todo l, devemos ter > 0.
Podemos mostrar tambem que > 0. A condicao de taxas de probabilidade monotonas

(MLRC) assegura que > 0 (exerccio).
Como e sao positivos, o lado direito da equacao (6) e estritamente decrescente em l, pela
MLRC. Mas isso significa que u0 (w p + Bl l) e estritamente crescente em Bl l. Como u0 e
decrescente (o agente e avesso ao risco, u00 () < 0), entao Bl l e estritamente decrescente em
l. Portanto, o contrato otimo e tal que:
l Bl e estritamente crescente em l.
Como normalizamos Bl = 0, temos que o contrato otimo para e = 1 nao prove seguro total
para o consumidor. Pelo contrario, ele especifica que o consumidor assuma parte da perda, e
que o valor dessa parte da perda assumida pelo consumidor aumente com o tamanho da perda
(pode ser que em termos percentuais seja igual: o consumidor arca sempre com 10% do valor
da perda. Claramente, quanto maior a perda, maior sera o valor assumido pelo consumidor
neste caso).
O consumidor deve entao arcar com parte do risco, para que ele de fato se esforce. Se l Bl e
crescente, temos que a MLRC implica que:
L
X
(l (1) l (0))u(w p l + Bl ) > 0
l=0

Microeconomia 2 P
os Notas de Aula
Evidentemente, no contrato otimo, esse ganho e igual ao custo em se esforcar muito, dado por:
d(1) d(0) > 0 ,
de tal modo que a restricao de incentivos seja satisfeita. No contrato otimo, o benefcio lquido
de se esforcar muito se iguala ao custo lquido desse esforco.
Para determinarmos a solucao que o principal implementa, verificamos qual o nvel de esforco
que maximiza o seu lucro esperado.
Se no caso de informacao perfeita o nvel de esforco otimo e baixo, entao o contrato otimo nesse
caso sera tambem o contrato otimo para o caso de informacao assimetrica.
Porem, se no caso de informacao perfeita o nvel de esforco otimo e alto, entao pode ocorrer
que para o caso de informacao assimetrica a firma decida implementar o nvel baixo de esforco.
Isso ocorrera se for muito dispendioso para a firma induzir o consumidor, por meio do contrato,
a se esforcar muito.
Nesse caso, temos uma situacao claramente ineficiente a utilidade do consumidor continua
igual a sua utilidade reserva, porem a firma obtem lucro menor do que obteria na situacao de
informacao simetrica, pois implementa o nVel de esforco sub-otimo e = 0.
Finalmente, se no caso de informacao perfeita o nvel de esforco otimo e alto, e tambem para
o caso de informacao assimetrica a firma decida implementar o nvel alto de esforco, temos
mais uma vez uma situacao claramente ineficiente a utilidade do consumidor continua igual
a sua utilidade reserva, porem ele nao obtem seguro total (ou seja, nao ocorre divisao otima de
riscos) e a firma obtem lucro menor do que obteria na situacao de informacao simetrica, pois
precisa induzir o agente a se esforcar (implementar e = 1 via a restricao de incentivos).
Refer
encias
Akerlof, G. A. (1970). The market for lemons: Quality uncertainty and the market mecha-
nism. The Quarterly Journal of Economics, 84:3 , 488-500.
Cho, I., & Kreps, D. (1987). Signaling games and stable equilibria. Quaterly Journal of
Economics, 102:2 , 179-221.
Salanie, B. (2005). The economics of contracts: a primer (2nd edition). Cambridge, MA: The
MIT Press.
Spence, M. (1973). Job market signaling. The Quarterly Journal of Economics, 87:3 , 355-374.

Microeconomia 2 P
os Notas de Aula

Desenho de Mecanismos
1 Introduc
ao
Desenho de mecanismo e o estudo de regras institucionais de um jogo com o objetivo de alcancar
certo resultado, levando-se em conta que os agentes participantes do jogo estao interessados
apenas em maximizar a sua utilidade, no caso em que essa utilidade nao seja de conhecimento
comum.
Por exemplo, em um leilao, o leiloeiro tem uma ideia do valor do objeto e do valor que os
participantes dao ao objeto sendo leiloado, mas nao conhece esses valores com certeza. O
objetivo e desenhar uma estrutura de incentivos que leve os agentes a se comportarem de uma
maneira desejavel. No caso de leiloes, o objetivo e desenhar um tipo de leilao que maximize o
lucro (ou a receita) do leiloeiro.
Exemplo: o Teorema de Gibbard-Satterthwaite mostra que qualquer sistema de votacao que

nao admite manipulacao (ou seja, que leve os votantes a revelar corretamente as suas pre-
ferencias e seja imune a comportamento estrategico ou seja, nao revelar corretamente a sua
preferencia pode levar a um resultado melhor para o indivduo) e ditadorial. Esse resultado e
visto como uma releitura do Teorema de Impossibilidade de Arrow.
Mecanismos de revelacao direta (ou compatveis de incentivo) sao mecanismos em que os agen-
tes revelam corretamente a informacao privada que possuem (no exemplo de leiloes, que o lance
dado revele verdadeiramente o valor que o indivduo da ao objeto; no exemplo de votacao, que
o sistema de votacao adotado leve os participantes a votarem de acordo com a sua preferencia
verdadeira entre as alternativas sob escolha). O princpio da revelacao garante que para qual-
quer mecanismo geral de informacao existe um mecanismo direto onde os agentes revelam
corretamente a informacao que possuem.
2 Teoria de Leil
oes
Um indivduo, chamado leiloeiro, quer vender um u nico bem indivisvel para N possveis com-
pradores, pelo maior preco possvel. A demanda pelo bem nao e conhecida, o leiloeiro conhece
apenas certas caractersticas dos possveis compradores do bem.
Leil ao: forma de venda onde todos os interessados podem participar na compra do bem. Um
leilao e uma forma de transacionar bens por meio de lances. Lances sao feitos pelo objeto que
esta sendo leiloado. Ganha o leilao quem der o lance vencedor.
Existem diversos tipos de leilao. Analisaremos quatro desses possveis tipos. Queremos saber
qual desses tipos e o melhor para o leiloeiro no sentido de gerar a maior receita esperada (receita
ex-ante).
Jose Guilherme de Lara Resende 1 Desenho de Mecanismos

Microeconomia 2 P
os Notas de Aula
Quatro tipos de leilao:

Primeiro-Preco, Envelope Fechado (FPSB): cada participante submete um lance fechado.
O maior lance vence e o vencedor paga o valor de seu lance pelo objeto.
Segundo-Preco, Envelope Fechado (SPSB ou Leilao de Vickrey): cada participante sub-

mete um lance fechado. O maior lance vence e o vencedor paga o valor do segundo maior
lance pelo objeto.
Leilao Holandes (ou de preco descendente): Vendedor anuncia um preco alto que vai
sendo reduzido ate que alguem se ofereca para comprar o objeto, pagando o u
ltimo preco
anunciado.
Leilao Ingles (ou de preco ascendente): Vendedor anuncia um preco baixo (pode ser zero)
e vai aumentando. Os participantes sinalizam quando desejam abandonar o leilao. Uma
vez fora do leilao, nao e mais possvel voltar. Quando restar apenas um participante, ele
e o vencedor e paga o preco corrente.
Sera que e possvel determinarmos qual destes leiloes e melhor para o vendedor do objeto, no
sentido de gerar a maior receita esperada? Mais ainda, sera possvel classificar esses leiloes em
termos de receita esperada gerada?
Observe que estamos preocupados em maximizar a receita esperada, ou seja, a receita ex-ante,
antes de o leilao ocorrer. Uma vez que o leilao ocorra, o vendedor obtera uma receita ex-post,
que quase sempre sera diferente da receita esperada, ja que o leiloeiro nao conhece a valoracao
dada ao objeto por cada participante, mas apenas assume uma certa distribuicao de valores
possveis, como veremos. Como a receita ex-post e obtida pela realizacao de uma variavel
incerta pelo leiloeiro, nao faz sentido falar em maximizacao da receita ex-post: cada um desses
leiloes pode ter uma receita ex-post diferente, mas isso evidentemente nao deve ser usado para
dizer que um tipo de leilao gera mais receita do que outro.
2.1 Modelo de Valora

c
ao Privada Independente
Suponha que o vendedor e neutro ao risco e que objeto nao tem valor para ele (permite
simplificar o problema maximizacao de lucro e equivalente à maximizacao de receita).
Assuma que existam N participantes do leilao, onde vi indica o valor do objeto a ser leiloado
para o indivduo i. Esse valor e conhecido apenas pelo indivduo i. Outros participantes
sabem apenas que vi possui uma distribuicao em [0, 1], descrita por uma funcao de distribuicao
acumulada Fi (vi ) com funcao de densidade fi (vi ).
As funcoes F1 , . . . , FN (e, portanto, f1 , . . . , fN ) sao de conhecimento comum de todos os par-

ticipantes e do leiloeiro.
Todos os participantes do leilao sao neutros ao risco. Se i ganha o leilao, seu payoff e vi p,
onde vi e o valor que i atribui ao objeto e p e o preco pago. Se i nao ganha o leilao, vamos
supor que o seu payoff e zero, para todos os tipos de leilao descritos acima (perder o leilao nao
gera desutilidade). Se ocorrer um empate, o objeto e sorteado entre os vencedores (onde cada
vencedor tem a mesma probabilidade de levar o objeto).
Vamos supor que os valores vi sao mutualmente independentes, ou seja, a informacao privada
de i e independente da informacao privada dos outros participantes. Logo, o indivduo i nao
obtem nenhuma informacao relevante a respeito do seu valor vi observando a valoracao dos

Microeconomia 2 P
os Notas de Aula
outros indivduos (a informacao privada do indivduo i e suficiente para ele determinar o valor
que atribui ao objeto).
Um leilao com essas caractersticas e chamado modelo de valores independentes e privados.

O termo independente refere-se ao fato de que a valoracao do objeto a ser leiloado de cada
participante (uma informacao privada) e independente das valoracoes dos outros participantes.
O termo valores privados refere-se ao fato de que apenas a informacao privada do participante e
suficiente para ele calcular o seu lance (ou seja, saber do valor privado dos outros participantes
nao ira alterar a sua valoracao do objeto).
Observe que as hipoteses assumidas no modelo de leilao com valores independentes e privados
sao fortes e podem nao ser validas em uma serie de situacoes. Por exemplo, se a Petrobras
leiloar um campo para exploracao de petroleo, conhecer a valoracao dos outros participantes
pode dar uma ideia melhor do valor do campo e, portanto, afetar a valoracao individual de um
participante. Neste caso, a hipotese de valores privados nao e adequada.
2.2 Lance
otimo
Vamos analisar qual deve ser o lance otimo de um participante tpico do leilao, para cada um
dos quatro leiloes descritos acima.
2.2.1 FPSB
Vamos supor que fi (v) = f (v), para todo v [0, 1], para todo i = 1, . . . , N . Logo, estamos
adicionando à hipotese de independencia a hipotese de distribuicoes identicas.
A estrategia de i e dar um lance (bid ) em funcao do valor que atribui ao objeto. Vamos de-
notar por bi : [0, 1] R+ essa funcao-lance. Logicamente, i conhece a sua valoracao do objeto,
mas para encontrarmos o equilbrio, precisamos levar em conta que os outros particpantes nao
conhecem a valoracao de i. Podemos imaginar a funcao bi como informando o lance que deve
ser dado pelo jogador i antes de ele conhecer a sua valoracao.
Vamos restringir a nossa procura por equilbrios com funcoes-lance estritamente crescentes:
uma valoracao maior leva a um lance maior, o que intuitivamente faz sentido, mas nao neces-
sariamente precisa valer em geral (podem existir equilbrios em que para uma regiao de valores
v a funcao lance de equilbrio seja constante, por exemplo).
Como estamos supondo que fi (v) = f (v), vamos procurar um equilbrio simetrico, descrito por
b : [0, 1] R+ estritamente crescente e igual para todo indivduo i. A funcao b diz o lance
otimo para um indivduo, dado que todos os outros participantes do leilao estao dando lances
segundo b.
Portanto, vamos encontrar um equilbrio de Nash simetrico com funcoes-lance estritamente

crescentes. Nesse caso, obtemos o resultado abaixo.
Teorema 9.1. Se N participantes possuem valores privados independentes gerados por uma
distribuicao F em um leilao de primeiro preco, entao o lance:
Z v
b(v) = 1
x dF N 1 (x) ,
F N 1 (v) 0
quando o participante valora o objeto em v e um equilbrio de Nash simetrico do leilao de
FPSB. Mais ainda, este e o u
nico equilbrio de Nash simetrico.

Microeconomia 2 P
os Notas de Aula
Demonstrac ao. Vamos denotar por b() a funcao lance otima e u(r, v) a utilidade de o
indivduo i do tipo v dar o lance otimo caso a sua valoracao fosse r. Suponha que se i nao
ganhar o leilao, sua utilidade sera zero. Logo,

u(r, v) = prob(b(r) > b(vj ) , j 6= i) v b(r) + prob(b(r) < b(vj ) , para algum j 6= i) 0

= prob(r > vj , j 6= i) v b(r)
= F N 1 (r) (v b(r)) ,
onde a segunda igualdade segue de b() ser estritamente crescente e a terceira igualdade segue
de: Y Y
prob(r > vj , j 6= i) = prob(r > vj ) = F (r) = (F (r))N 1 ,
j6=i j6=i
onde a primeira igualdade e consequencia da hipotese de independencia e a segunda, da de-

finicao de funcao de distribuicao acumulada e do fato de que as distribuicoes sao todas identicas.
O indivduo maximiza a sua utilidade se revelar r = v (Exerccio 9.3). Logo, a CPO do pro-
blema de maximizar em r a utilidade u(r, v) = F N 1 (r) (v b(r)) e satisfeita com r = v. A
derivada de u(r, v) com respeito a r e:
du(r, v)
= (N 1)F N 2 (r)f (r)(v b(r)) F N 1 (r)b0 (r)
dr
A CPO sera valida em r = v (ver Exerccio 9.3), o que resulta na seguinte CPO:
(N 1)F N 2 (v)f (v)(v b(v)) F N 1 (v)b0 (v) = 0
Essa CPO define uma equacao diferencial. Essa equacao pode ser reescrita como:
(N 1)F N 2 (v)f (v)b(v) + F N 1 (v)b0 (v) = (N 1)F N 2 (v)f (v)v
Observe que o lado esquerdo da igualdade acima e igual a` derivada de F N 1 (v)b(v) com relacao
a v. Logo:
dF N 1 (v)b(v)
= (N 1)F N 2 (v)f (v)v
dv
Como essa igualdade deve ser valida para todo v, integrando com relacao a v, obtemos:
Z v
F N 1
(v)b(v) = (N 1) xf (x)F N 2 (x)dx + C ,
0
onde C e a constante de integracao. Assumindo que b(0) = 0 (ou seja, se o valor for zero, o
indivduo da lance igual a zero), obtemos que C = 0. Entao:
Z v Z v
b(v) = (N 1) xf (x)F N 2 1
(x)dx = N 1 x dF N 1 (x) .
F N 1 (v) 0 F (v) 0
possvel mostrar que a solucao acima para b() e estritamente crescente em v (Exerccio 9.1).
E
Alem disso, temos que ela e u nica, considerando apenas solucoes estritamente crescentes para
equilbrios simetricos (e possvel mostrar que nao existem equilbrios assimetricos, dadas as
hipoteses feitas). Note que para concluirmos que a estrategia b(v) encontrada acima define de
fato um equilbrio de Nash, precisamos mostrar que u(r, v) calculada levando em conta b(v) e
maximizada quando r = v (ver Exerccio 9.3).

Microeconomia 2 P
os Notas de Aula
Exemplo 9.1. Suponha que vi = v e distribudo uniformemente em [0, 1]. Nesse caso, F (v) = v
e f (v) = 1. Se existem N participantes, a funcao-lance de equilbrio e:
Z v Z v
b(v) = 1 xdx N 1 1
= N 1 x(N 1)xN 2 dx
v N 1 0 v 0
N 1 v N 1

N 1 1 n
Z
1 v
= N 1 x dx = N 1 v = 1 v=v .
v 0 v N N N
Portanto, o lance de equilbrio e menor que o valor do objeto para o indivduo. Quanto mais
participantes no leilao, maior e mais proximo o lance de equilbrio do valor do objeto. Se
houverem apenas dois participantes, entao cada um deles ira dar um lance igual à metade do
valor que atribui ao objeto leiloado (b(v) = v/2).
No equilbrio de um leilao de primeiro preco, cada participante da um lance igual à esperanca

do segundo maior valor, condicional no seu valor ser o maior, ou seja, condicional em vencer
o leilao.
O lance de equilbrio em um leilao de primeiro preco e condicional em vencer o leilao, pois o

lance so tem consequencias praticas quando o leilao e ganho. Esse resultado se estende para
outros leiloes em que nao ganhar o leilao nao gera custos para o participante (um leilao all-pay
nao satisfaz essa condicao).
2.2.2 Leil
ao Holand
es
Em um leilao holandes, cada participante deve decidir em que momento levantar a mao para
sinalizar que comprara o objeto ao preco anunciado, lembrando que ate alguem levantar a mao,
o leiloeiro vai diminuindo o valor que devera ser pago pelo objeto.
Temos entao que o participante que levanta a mao primeiro, ou seja, que escolhe o preco mais
alto, ganha o leilao e paga este u
ltimo preco anunciado. Portanto, se tomarmos levantar a
mao por lance, vemos que o leilao holandes e equivalente ao leilao de primeiro preco.
Isso justifica o resultado abaixo, similar ao resultado para leilao de primeiro preco, ser valido
para o leilao holandes. Os dois tipos de leilao geram a mesma receita ex-ante e ex-post para o
leiloeiro.
Teorema 9.2. Se N participantes possuem valores privados e independentes gerados por uma
distribuicao F , entao o participante que valora o objeto em v levantar a mao quando o preco
do objeto leiloado alcancar: Z v
1
N 1
x dF N 1 (x)
F (v) 0
constitui um equilbrio de Nash simetrico do leilao holandes. Mais ainda, este e o u
nico
equilbrio de Nash simetrico.

Microeconomia 2 P
os Notas de Aula
2.2.3 Leil
ao de Vickrey (Leil
ao de SPSB)
O leilao de segundo preco induz os participantes a darem lances mais altos, ja que o valor pago
caso venca o leilao e o segundo maior lance e nao o primeiro maior lance, como no leilao de
FPSB. Logo, e razoavel imaginar que os participantes desse tipo de leilao se comportem de
modo diferente do que se comportariam em um leilao FPSB. A priori, nao podemos afirmar
qual tipo de leilao gera uma receita esperada maior (ex post, as receitas quase sempre serao
diferentes, ver Exemplo A1 abaixo). O Teorema 9.3 abaixo descreve o comportamento otimo
dos participantes de um leilao de segundo preco.
Teorema 9.3. Se N participantes possuem valores privados independentes em um leilao de

segundo preco, entao dar um lance igual a` valoracao do objeto e a u
nica estrategia fracamente
dominante, para cada participante do jogo.
Demonstrac ao: A ideia consiste em mostrar que se um participante qualquer der um lance
de valor diferente da sua valoracao sera sempre fracamente dominado por dar um lance igual
a sua valoracao. Fixe o indivduo i e denote por B = max{bj | j 6= i}. Mostre que bi (vi ) = vi
e a (
unica) estrategia fracamente dominante do jogo para qualquer jogador i. Logo, cada
participante dar lance igual a` sua valoracao constitui um equilbrio de Nash em estrategias
fracamente dominantes.
2.2.4 Leil
ao Ingl
es
Para determinarmos o comportamento otimo de um participante em um leilao ingles, basta
notar que, para um participante qualquer, sair do leilao quando o preco alcanca a sua valoracao
e uma estrategia fracamente dominante.
Teorema 9.4. Se N participantes possuem valores privados independentes em um leilao

ingles, entao abandonar o leilao quando o preco se iguala a sua valoracao e a u
nica estrategia
fracamente dominante, para cada participante do jogo.
Mais ainda, como o vencedor do leilao ingles e o participante com maior valor associado ao
objeto leiloado, e o preco que sera pago e o que faz o participante com a segunda maior valoracao
abandonar o leilao, entao o leilao ingles gera a mesma receita ex-post que o leilao de segundo
preco (e, logicamente, a mesma receita esperada).

Microeconomia 2 P
os Notas de Aula
2.3 Compara
c
ao de Receita
Os leiloes de primeiro-preco e holandes geram a mesma receita ex-post. E os leiloes de Vickrey
e ingles tambem geram a mesma receita ex-post. Portanto, temos que comparar apenas as
receitas geradas pelos leiloes de primeiro e de segundo preco. Eles irao, quase sempre, gerar
receitas ex-post diferentes.
Exemplo A1: Considere o set-up do Exemplo 9.1, com dois jogadores. Suponha as seguintes
duas realizacoes de valores para os jogadores:
1. v1 = 0, 9 e v2 = 0, 1. Neste caso, a receita ex-post do leilao de primeiro preco, assumindo
que os jogadores escolhem as estrategias de equilbrio, e 0, 45, e a receita ex-post do leilao
de segundo preco e 0, 1.
2. v1 = 0, 9 e v2 = 0, 7. Neste caso, a receita ex-post do leilao de primeiro preco, assumindo
que os jogadores escolhem as estrategias de equilbrio, e 0, 45, e a receita ex-post do leilao
de segundo preco e 0, 7.
Logo, o exemplo mostra que as receitas ex-post destes dois tipos de leilao nao podem ser
ordenadas: em 1., o leilao de primeiro preco realiza uma receita maior; em 2., o leilao de
segundo preco realiza uma receita maior.
Vamos entao comparar as receitas ex-ante geradas pelos leilao de primeiro e de segundo preco.
Queremos analisar qual desses dois leiloes gera a maior receita esperada. Intuitivamente, como
no leilao de primeiro preco, o maior lance vence, e o vencedor paga o maior lance, enquanto no
leilao de segundo preco o maior lance vence, mas o vencedor paga apenas o valor do segundo
maior lance, poderamos pensar que o leilao de primeiro preco gera uma receita esperada maior.
Isso nao necessariamente ocorre, pois no leilao de segundo preco e razoavel assumir que os
participantes se comportarao de modo diferente de como se comportariam em um leilao de
primeiro preco (vimos que o lance de equilbrio no leilao de segundo preco e maior do que no de
primeiro preco, no contexto do Exemplo 9.1). O desenho do leilao de segundo preco induz os
participantes a darem lances maiores, ja que eles irao pagar apenas o valor do segundo maior
lance.
Portanto, nao e claro qual dos dois tipos de leilao ira gerar a maior receita esperada para o
leiloeiro. Usando as funcoes lance otimas encontradas acima para esses dois tipos de leilao,
iremos mostrar que, sob a hipotese de participantes neutros ao risco e com valores privados e
independentes, a receita esperada dos dois leiloes sera igual. Esse resultado sera generalizado
no Teorema de Equivalencia de Receita (Teorema 9.6).
Vamos supor que fi (v) = f (v), para todo v [0, 1], para todo i = 1, . . . , N , ou seja, todas as
distribuicoes sao identicas.
O lance e definido pela funcao b. Como a distribuicao dos valores e independente e dada por
F , a probabilidade do maior lance ser menor que v e:
P (max(V1 , . . . , VN ) v) = P (max(V, . . . , V ) v) = P (V v, . . . , V v) = [P (V v)]N = F N (v)
Portanto, a variavel aleatoria (v.a.) definida por M = max(V1 , . . . , VN ), onde cada v.a. Vi tem
distribuicao acumulada F e densidade f , possui distribuicao acumulada dada por FM (v) =
F N (v) e densidade dada por fM (v) = N F N 1 (v)f (v). Vamos denotar por RF P A a receita
esperada do leilao de primeiro preco. Temos entao que:
Z 1 Z 1
RF P A =
b(v)fM (v) dv = b(v)N F N 1 (v)f (v) dv
0 0

Microeconomia 2 P
os Notas de Aula
Vamos agora calcular a receita esperada para o leilao de segundo preco. Denote por X a
v.a. definida pelo segundo maior lance. Vamos identificar a funcao de densidade dessa v.a.
Para isso, e mais facil tratar a funcao de densidade como uma probabilidade. Suponha que o
indivduo i deu o segundo maior lance, com valor v. Entao um dos N 1 participantes restantes
deu um lance maior do que i e todos os outros N 2 participantes deram lance menor do que
i. A probabilidade entao de que i de um lance igual a v e de que esse lance seja o segundo
maior lance e:
f (v)(N 1)F N 2 (v)(1 F (v))
Como existem N indivduos que podem estar nessa situacao, a funcao de densidade fX associ-
ada a v.a. X e:
fX (v) = N (N 1)F N 2 (v)(1 F (v))f (v)
Vamos denotar por RSP A a receita esperada do leilao de segundo preco. Temos entao que:
Z 1 Z 1
RSP A = b(v)fX (v) dv = N (N 1) vF N 2 (v)f (v)(1 F (v)) dv .
0 0
Substituindo na receita esperada do leilao de primeiro preco o lance otimo descrito no Teorema
9.1 que foi encontrado para este tipo de leilao, obtemos:
Z 1 Z v
1 N 1
RF P A = N N 1 (v)
x dF (x) f (v)F N 1 (v) dv
0 F 0
Z 1 Z v
N 2
= N (N 1) xF (x)f (x) dx f (v) dv
0 0
Z 1 Z v
N 2
= N (N 1) xF (x)f (x)f (v) dx dv
0 0
Vamos usar os colchetes de Iverson para invertermos a ordem de integracao da u ltima integral
N 2
dupla na expressao acima, onde g(x, v) = xF (x)f (x)f (v):
Z 1 Z v Z 1 Z v Z Z v
g(x, v) dx dv = dv dx g(x, v) = dv dx [0 v 1] g(x, v)
0 0 0 0 0
ZZ Z Z 1
= dx dv [0 x v 1] g(x, v) = dx dv [0 x 1] g(x, v)
x
Z 1 Z 1 Z 1 Z 1
= dx dv g(x, v) = g(x, v) dv dx
0 x 0 x
Portanto:
Z 1 Z v
N 2
RF P A = N (N 1) xF
(x)f (x)f (v) dx dv
0 0
Z 1 Z 1
N 2
= N (N 1) xF (x)f (x)f (v) dv dx
0 x
Z 1 Z 1
N 2
= N (N 1) xF (x)f (x) f (v) dv dx
0 x
Z 1
= N (N 1) xF N 2 (x)f (x)(1 F (x)) dx = RSP A
0

Microeconomia 2 P
os Notas de Aula
Isso mostra que as receitas esperadas dos dois tipos de leiloes, leilao de primeiro preco e leilao
de segundo preco, sao iguais. Logo, para o leiloeiro, ex-ante, tanto faz se o leilao for do tipo
de primeiro ou de segundo preco, em termos de receita esperada.
Exemplo 9.2. Suponha que vi = v e distribudo uniformemente em [0, 1]. Nesse caso, F (v) = v
e f (v) = 1. A receita esperada gerada em um leilao de primeiro preco e:
Z 1 Z 1h Z 1
b(v)N F N 1 v i
N 1 1 N 1
RF P A = (v)f (v) dv = N v v dv = N 1 v N dv =
0 0 N N 0 N +1
A receita esperada gerada em um leilao de segundo preco e:

Z 1
RSP A = N (N 1) vF N 2 (v)f (v)(1 F (v)) dv
Z0 1
N 1
= N (N 1) v N 1 (1 v) dv =
0 N +1
Logo, a receita esperada de ambos os leiloes e igual.
Obtivemos entao o seguinte resultado:
Se N participantes possuem valores privados independentes gerados por uma dis-

tribuicao F , entao a receita esperada gerada pelos quatro tipos de leiloes analisados
e igual.
Vamos generalizar esse resultado, por meio do Teorema de Equival

encia de Receita.

Microeconomia 2 P
os Notas de Aula
3 Teorema de Equival
encia de Receita
3.1 Mecanismo de Venda Direta
Vamos usar um modelo de Myerson (1981) que permite analisar todos os leiloes vistos acima
(e outros) sob uma mesma estrutura. O conceito abaixo e fundamental para isso.
Definic ao 9.1: Mecanismo de Venda Direta. Um mecanismo de venda direta e uma

colecao de N funcoes de probabilidade:
p1 (v1 , . . . , vN ), . . . , pN (v1 , . . . , vN ) ,
e de N funcoes de custo:
c1 (v1 , . . . , vN ), . . . , cN (v1 , . . . , vN ).
Para cada i e cada vetor de valoracoes (v1 , . . . , vN ) reportados simultaneamente pelos partici-
pantes do leilao, pi (v1 , . . . , vN ) [0, 1] e a probabilidade de i de receber o objeto e ci (v1 , . . . , vN )
R e o pagamento que i deve fazer ao leiloeiro. Vamos supor que, para todo (v1 , . . . , vn ),
N
X
pi (v1 , . . . , vN ) 1 .
i=1
Se a soma das probabilidades for menor do que um, entao existe uma probabilidade de que o
objeto nao seja vendido, isto e, permaneca em poder do vendedor.
O mecanismo de venda direta (pi (), ci ())N

i=1
e de conhecimento comum para todos, e uma vez
anunciado, o vendedor obrigatoriamente usa o mecanismo para realizar a venda do objeto. A
ideia e que cada interessado reporte um valor para o objeto (que pode ser o seu valor verdadeiro
ou nao). O vendedor entao faz uso do mecanismo para determinar o comprador do objeto, por
meio das probabilidades pi , e quanto cada um ira pagar, por meio das funcoes custo ci .
Note que nada impede que as funcoes custo assumam valores negativos (neste caso, o ven-
dedor do bem estaria pagando um valor ao participante do leilao), ou que as funcoes custo
tenham valor positivo mesmo quando o comprador nao tenha chance de ganhar o objeto (se a
probabilidade do participante de ganhar o objeto for zero).
A receita do vendedor dependera do mecanismo utilizado. O problema do vendedor e escolher

o mecanismo que gera a maior receita esperada. Cada leilao visto anteriormente e equivalente
a um mecanismo de venda direta. Portanto, podemos estudar os leiloes acima sob uma mesma
estrutura.
Vamos agora analisar um tipo especial de mecanismo de venda direta, que induz os partici-
pantes a revelarem a sua valoracao verdadeira do objeto leiloado. O princpio da revelac
ao,
um resultado fundamental em desenho de mecanismos, mostra que, qualquer que seja o meca-
nismo desenhado pelo vendedor, e possvel encontrar um mecanismo de revelacao verdadeira
(tambem chamado mecanismo compatvel de incentivo). Ou seja, podemos restringir a analise
a mecanismos compatveis de incentivo.

Microeconomia 2 P
os Notas de Aula
3.2 Mecanismos Compatveis de Incentivo

Considere o mecanismo (pi (), ci ())N i=1 . Suponha que a valora cao de i e vi e que ele anuncia ri .
Se todos os outros participantes anunciam seus valores corretos, o payoff esperado de i e:
Z 1 Z 1
ui (ri , vi ) = ... [pi (ri , vi )vi ci (ri , vi )] fi (vi ) dvi ,
0 0
onde fi (vi ) = f (v1 ) . . . f (vi1 )f (vi+1 ) . . . f (vN ) e dvi = dv1 . . . dvi1 dvi+1 . . . dvN .
Logo, o payoff esperado de i quando sua valoracao e vi e reporta ri e:
ui (ri , vi ) = pi (ri )vi ci (ri ) ,
onde:
Z 1 Z 1
pi (ri ) = ... pi (ri , vi )fi (vi )dvi , e
0 0
Z 1 Z 1
ci (ri ) = ... ci (ri , vi )fi (vi )dvi ,
0 0
em que pi (ri ) e a probabilidade de i receber o objeto quando anuncia ri e ci (ri ) e o paga-

mento esperado quando anuncia ri , pi (ri ) e ci (ri ) condicionados a todos os outros participantes
revelarem corretamente seus valores.
Definicao 9.2: Mecanismo de Venda Direta Compatvel de Incentivo. Um meca-

nismo de venda direta e dito compatvel de incentivo (ou de revelacao verdadeira) se para cada
indivduo i e para cada um dos seus valores vi [0, 1], a utilidade esperada:
ui (ri , vi ) = pi (ri )vi ci (ri )
e maximizada em ri [0, 1] quando ri = vi . Neste caso, dizemos que cada participante i

reportar o seu valor verdadeiro atribudo ao objeto constitui um equilbrio de Nash Bayesiano.
A definicao acima deixa claro que um mecanismo de venda direta e compatvel de incentivo se
quando todos os outros participantes revelarem a sua valoracao do objeto corretamente, entao
o payoff esperado de cada jogador i e maximizado quando ele reportar o seu valor verdadeiro.
Observe que em um mecanismo compatvel de incentivo, reportar corretamente o seu valor

constitui um EN Bayesiano, mas nao constitui uma estrategia dominante para cada jogador.
Logo, revelar corretamente o seu valor nao e, em geral, uma estrategia otima independente do
que os outros jogadores facam.
Exemplo: Leil ao Simetrico de FPSB. Suponha que existam N interessados no objeto a

ser vendido, com valores privados independentes gerados por uma distribuicao F . Seja b a
funcao-lance otima encontrada no leilao de FPSB acima. Considere o mecanismo definido por:

1, se vi > vj , j 6= i
pi (v1 , . . . , vN ) =
0, caso contrario
b(vi ), se vi > vj , j 6= i

ci (v1 , . . . , vN ) =
0, caso contrario
para todo i = 1, . . . , N .

Microeconomia 2 P
os Notas de Aula
O mecanismo acima gera a mesma receita ex-post que o leilao de primeiro preco, se os parti-
cipantes revelarem corretamente o valor que atribuem ao objeto. Dada a forma do mecanismo,
podemos mostrar que a estrategia de equilbrio de cada participante e revelar corretamente
o valor que atribui ao objeto leiloado (dado que os outros participantes estao revelando cor-
retamente os seus valores). Logo, construmos um mecanismo de venda direta compatvel de
incentivo equivalente ao leilao de primeiro preco.
Podemos fazer o mesmo para os outros tipos de leilao: para cada um deles, podemos encontrar
um mecanismo de venda direta compatvel de incentivo equivalente (isto e, que leve ao mesmo
vencedor e a` mesma receita ex-post). Portanto, podemos estudar os quatro tipos de leilao
analisando os mecanismos de venda direta equivalentes a eles. Faremos isso agora.
3.3 Caracteriza
c
ao dos Mecanismos Compatveis de Incentivo
Seja um mecanismo de venda direta compatvel de incentivo dado por pi () e ci (), para todo i.
Como o mecanismo e compatvel de incentivo, a estrategia otima de i e revelar corretamente a
sua valoracao do objeto, dado que todos os outros interessados estao revelando corretamente
as suas valoracoes.
Logo, um mecanismo e compatvel de incentivo se, e somente se, para todo vi , ui (vi , vi )
ui (ri , vi ), para todo i. O teorema abaixo caracteriza completamente um mecanismo de venda
direta compatvel de incentivo.
Teorema 9.5: Caracterizac ao de Mecanismos Compatveis de Incentivo. Um meca-

nismo de venda direta (pi (), ci ())N
i=1
e compatvel de incentivos se, e somente se, para todo
participante i,
(i) pi (vi ) e nao-decrescente em vi , e

Rv
(ii) ci (vi ) = ci (0) + pi (vi )vi 0 i pi (x)dx, para todo vi [0, 1].
Ideia da demonstrac ao: () Suponha que (pi (), ci ())N i=1

e compatvel de incentivos, ou
seja, que ui (vi , vi ) ui (ri , vi ), para i qualquer. Temos que mostrar que valem (1) e (2) do
teorema.
() Suponha que o mecanismo (pi (), ci ())N i=1 satisfa
ca (1) e (2) do teorema. Temos que
mostrar que esse mecanismo satisfaz ui (vi , vi ) ui (ri , vi ), para vi e ri quaisquer, para todo i.
O Teorema 9.5 mostra que todo mecanismo compatvel de incentivos deve ser tal que a pro-
babilidade de ganhar o objeto nao diminui quanto maior o valor v declarado. Alem disso, o
item (ii) do teorema mostra que todo mecanismo compatvel de incentivos deve ser tal que uma
vez definidas as funcoes de probabilidade pi () e os custos esperados quando a valoracao e nula
(
ci (0)), para todo i, estao definidos tambem os custos esperados para todas as outras valoracoes
possveis, para todos os participantes. Esse resultado e crucial para entender o Teorema de
Equivalencia de Receita.

Microeconomia 2 P
os Notas de Aula
3.4 Equival
encia de Receita
Teorema 9.6: Teorema de Equival encia de Receita. Se dois mecanismos de venda direta
compatveis de incentivo possuem as mesmas funcoes de probabilidade e todo participante cuja
valoracao e zero e indiferente entre os dois mecanismos, entao os dois mecanismos geram a
mesma receita esperada para o leiloeiro.
Demonstrac
ao: Note que a receita esperada (ER) do vendedor e:
Z 1 Z N
1X
ER = ... ci (v1 , . . . , vN )f1 (v1 ) . . . fN (vN ) dv1 . . . dvN
0 0 i=1
N Z
X 1 Z 1 Z 1
= ... ci (v1 , . . . , vN )fi (vi ) dvi fi (vi ) dvi
i=1 0 0 0
| {z }
=
ci (vi )
N Z 1
X Z vi
= ci (0) + pi (vi )vi pi (x) dx fi (vi ) dvi
i=1 0 0
XN Z 1 Z vi N
X
= pi (vi )vi pi (x) dx fi (vi ) dvi + ci (0) .
i=1 0 0 i=1
Logo, a receita gerada pelo leiloeiro depende apenas das funcoes de probabilidade pi de alocacao
do objeto e do valor que os participantes esperam pagar quando possuem valoracao nula. Como
o payoff esperado de cada participante e completamente determinado pelo seu pagamento
esperado quando o seu valor e zero, conclumos a demonstracao do teorema.
Podemos usar o teorema acima diretamente para concluirmos que as receitas esperadas dos
quatro leiloes analisados anteriormente sao iguais. Basta notar que as funcoes de probabilidade
sao iguais para os quatro leiloes: ganha o leilao quem der o maior lance (equivalentemente,
tiver a maior valoracao). Alem disso, em cada um dos quatro leiloes, se o participante tem
valoracao nula, o seu custo esperado em participar do leilao e zero.
Nos quatro tipos de leilao, o objeto e adquirido pelo participante que da maior valor ao objeto.
Logo, cada um desses leiloes e eficiente. Observe que pelo teorema de equivalencia de receita,
esses leiloes tambem possuem a mesma distribuicao de riqueza ex-ante. Ja a distribuicao de
riqueza ex-post dos leiloes de primeiro e de segundo preco sera quase sempre diferente (ver
Exemplo A1 acima).
Para os leiloes de primeiro preco e holandes, se abandonarmos a hipotese de participantes

simetricos, pode ocorrer que esses leiloes nao sejam eficientes (ou seja, pode ocorrer que o
participante que valora mais o objeto nao ganhe o leilao).

Microeconomia 2 P
os Notas de Aula
4 Desenhando um Mecanismo que Maximiza Receita

4.1 Introdu
c
ao
Vimos que os quatro tipos de leiloes acima geram a mesma receita, quando os participantes
sao simetricos. Mas existe um melhor mecanismo em termos de maximizacao de receita? Se
sim, como e esse mecanismo?
4.2 Princpio da Revela

cao
Mesmo permitindo qualquer mecanismo de venda, o princpio da revelacao continua valido.
Ou seja, para qualquer mecanismo de venda e um equilbrio de Nash onde cada participante
usa uma estrategia que mapeia a sua valoracao em um comportamento maximizador, podemos
construir um mecanismo de venda direta compatvel de incentivo equivalente à forma de venda
original.
Logo, para todo mecanismo de venda direta existe um mecanismo de venda direta compatvel
de incentivo que gera a mesma receita esperada, a mesma alocacao (probabilstica) do objeto e
os mesmos custos esperados para cada participante. O problema do vendedor resume-se entao
a encontrar o mecanismo de venda direta compatvel de incentivo que maximize a sua receita
esperada. Isso evidentemente simplifica bastante o problema, ja que podemos concentrar a
analise restrita a apenas mecanismos compatveis de incentivo.
4.3 Racionalidade Individual

Dada a sua valoracao do objeto, nenhum participante obtem payoff esperado negativo, pois a
participacao no leilao e voluntaria. Vamos entao analisar apenas mecanismos compatveis de
incentivo individualmente racionais, onde cada participante, independente da sua valoracao,
recebe um payoff nao-negativo no equilbrio de revelacao correta:
ui (vi , vi ) = pi (vi )vi ci (vi ) 0, vi [0, 1].
Proposic
ao: Racionalidade Individual e Revelac ao Verdadeira. Um mecanismo de
venda direta compatvel de incentivo e individualmente racional se, e somente se, o custo
ci (0) 0, para todo i).
esperado em zero de cada participante e nao positivo (
Prova: Usando a parte (ii) do Teorema 9.5, temos que:

Z vi
ui (vi , vi ) =
ci (0) + pi (x) dx 0 , vi [0, 1].
0
A desigualdade acima e valida se, e somente se, ci (0) 0.

Microeconomia 2 P
os Notas de Aula
4.4
Mecanismo de Venda Otimo
O problema do vendedor e encontrar o mecanismo de venda direta que maximiza a sua receita
esperada, sujeito aos mecanismos serem de revelacao verdadeira e a respeitarem a racionalidade
individual dos participantes. Usando os Teoremas 9.5 e 9.6, esse problema pode ser escrito
como:
N Z 1
X Z vi N
X
max pi (vi )vi pi (x) dx fi (vi ) dvi + ci (0)
(pi (),ci ())N
i=1 0 0
i=1 i=1
s.a.: (i) pi (vi ) nao-decrescente em vi ,

Z vi
(ii) ci (vi ) = ci (0) + pi (vi )vi pi (x) dx, vi [0, 1],
0
(iii) ci (0) 0
Proposic
ao. A receita esperada otima do do vendedor pode ser reescrita como:
Z 1 Z 1 (X N ) N
1 Fi (vi ) X
ER = ... pi (v) vi f1 (v1 ) . . . fN (vN ) dv1 . . . dvN + ci (0) ,
0 0 i=1
fi (vi ) i=1
onde v = (v1 , . . . , vN ).
Prova: Basta notar que:

N Z
X 1 Z vi
I= pi (vi )vi pi (x) dx fi (vi ) dvi
i=1 0 0
N Z
X 1 Z 1 Z vi
= pi (vi )vi fi (vi ) dvi pi (x)fi (vi ) dx dvi
i=1 0 0 0
XN Z 1 Z 1 Z 1
= pi (vi )vi fi (vi ) dvi pi (x)fi (vi ) dvi dx
i=1 0 0 x
XN Z 1 Z 1
= pi (vi )vi fi (vi ) dvi pi (x)(1 Fi (x)) dx
i=1 0 0
XN Z 1 Z 1
= pi (vi )vi fi (vi ) dvi pi (vi )(1 Fi (vi )) dvi
i=1 0 0
N Z 1
X 1 Fi (vi )
= pi (vi ) vi fi (vi ) dvi
i=1 0
fi (vi )
N Z 1 Z 1
X 1 Fi (vi )
= ... pi (v) vi f1 (v1 ) . . . fN (vN ) dv1 . . . dvN
i=1 0 0 fi (vi )
Z 1 Z 1 (X N )
1 Fi (vi )
= ... pi (v) vi f1 (v1 ) . . . fN (vN ) dv1 . . . dvN .
0 0 i=1
f i (v i )

Microeconomia 2 P
os Notas de Aula
Considere o termo:
Z 1 Z ( N )
1
X 1 Fi (vi )
... pi (v) vi f1 (v1 ) . . . fN (vN ) dv1 . . . dvN (1)
0 0 i=1
fi (vi )
A expressao em (1) seria maximizada se cada termo entre os parenteses fosse maximizado.
Como pi (v1 , . . . , vn ) e nao-negativo e soma 1 ou menos, os N + 1 termos:
N
X
p1 (v1 , . . . , vn ), . . . , pN (v1 , . . . , vn ), 1 pi (v1 , . . . , vn )
i=1
sao nao-negativos e somam 1. A soma entre os parenteses na expressao acima (1), que pode
ser reescrita como:
N N
!
X 1 Fi (vi ) X
pi (v) vi + 1 pi (v) 0 ,
i=1
f i (vi ) i=1
e apenas a soma ponderada dos N + 1 n umeros:

1 F1 (v1 ) 1 FN (vN )
v1 , . . . , vN ,0.
f1 (v1 ) fN (vN )
Mas entao a soma entre os parenteses na expressao acima (1) nao pode ser maior do que o
maior dos termos em colchetes acima, se algum deles for positivo, ou maior do que zero, se
todos eles foram negativos. Suponha que todos os termos em colchetes sao diferentes entre si.
Defina: (
1Fi (vi ) 1Fj (vj )
1, se vi > max 0, vj ,
pi (v) = fi (vi ) j6=i fj (vj )
(2)
0, caso contrario.
Entao temos que:
N N
X 1 Fi (vi ) X 1 Fi (vi )
pi (v) vi pi (v) vi
i=1
fi (vi ) i=1
fi (vi )
Logo, se os termos em colchetes forem todos diferentes com probabilidade 1, obtemos uma cota
superior para a receita esperada do leiloeiro:
Z 1 Z 1 (X N ) N
1 Fi (vi ) X
ER = ... pi (v) vi f1 (v1 ) . . . fN (vN ) dv1 . . . dvN + ci (0)
0 0 i=1
fi (vi ) i=1
Z 1 Z 1 (X N ) N
1 F i (vi ) X
... pi (v) vi f1 (v1 ) . . . fN (vN ) dv1 . . . dvN + ci (0) ,
0 0 i=1
fi (vi ) i=1
para qualquer mecanismo de venda direta compatvel de incentivo (pi (), ci ())N i=1 que consi-
derarmos. Vamos continuar assumindo que os termos em colchetes sao distintos com proba-
bilidade 1. Como a restricao (iii) do problema do leiloeiro exige que ci (0) 0, para todo i,
obtemos que a receita esperada ER do leiloeiro tera o seguinte limite superior:
Z 1 Z 1 (X N )
1 F (v
i i )
ER ... pi (v) vi f1 (v1 ) . . . fN (vN ) dv1 . . . dvN (3)
0 0 i=1
f i (v i )

Microeconomia 2 P
os Notas de Aula
Vamos construir um mecanismo de venda direta compatvel de incentivo que alcanca o limite
superior acima. Logo, esse mecanismo maximiza a receita esperada do leiloeiro. Vamos definir
as probabilidades do mecanismo por (2). Dada essas probabilidade, precisamos definir as
funcoes custo. Mas o Teorema 9.5 (a restricao (ii) do problema do leiloeiro) requer que a
funcao custo do mecanismo dependa das funcoes de probabilidade definidas. Considere entao
o seguinte mecanismo (pi (), ci ())N
i=1 :
(
1Fi (vi ) 1Fj (vj )
1, se v i > max 0, vj ,
0, caso contrario.
Z vi

ci (v) = ci (0, vi ) + pi (v)vi pi (x, vi )dx,
0
para todo i = 1, . . . , N , onde v = (v1 , . . . , vN ).
Queremos que o mecanismo acima satisfaca tambem a restricao de racionalidade individual

(restricao (iii) do problema do leiloeiro). Se fizermos ci (0, vi ) = 0, para todo vi , para
todo indivduo i, entao a restricao de racionalidade individual e satisfeita. Logo o mecanismo
simplifica para:
(
1Fi (vi ) 1Fj (vj )
1, se vi > max 0, vj ,
(4)
0, caso contrario.
Z vi

ci (v) = pi (v)vi pi (x, vi )dx,
0
para todo i = 1, . . . , N , onde v = (v1 , . . . , vN ).
Podemos mostrar entao o seguinte resultado.
Teorema 9.7. Se N participantes possuem valores privados independentes, e a valoracao do

participante i e obtida de uma funcao de densidade positiva e contnua fi que satisfaz:
1 Fi (vi )
vi e estritamente crescente em vi , (5)
fi (vi )
entao o mecanismo de venda direta definido em (4) gera a maior receita esperada possvel para
o leiloeiro.
Prova (ideia): Observe que, por construcao, o mecanismo acima satisfaz as restricoes (ii)
e (iii) e alcanca o limite superior para a receita esperada descrito em (3) (lembre-se que, por
construcao, ci (0) = 0, para todo i). Precisamos entao apenas mostrar que o mecanismo descrito
satisfaz a restricao (i) do problema do leiloeiro. Isso nao sera verdade em geral. Mas assumindo
(5), podemos mostrar que (i) e valido, o que conclui a demonstracao do teorema.
Note que (5) garante tambem que os n umeros vi (1 Fi (vi ))/fi (vi ) sao distintos com proba-
bilidade 1. A distribuicao uniforme satisfaz esse requerimento.

Microeconomia 2 P
os Notas de Aula
4.5
Analisando o Mecanismo de Venda Otimo
O mecanismo (pi (), ci ())N
i=1
e composto de duas partes:
1. pi (), como o objeto e alocado entre os varios participantes, e
2. ci (), como os pagamentos sao determinados.
Vamos analisar cada uma dessas partes do mecanismo de venda direta otimo (pi (), ci ())N
i=1
separadamente.
Primeiro vamos discutir a parte de alocacao do objeto que o mecanismo assume. Para v1 , . . . , vN
anunciados, o objeto e vendido para o consumidor cujo i cujo vi (1 Fi (vi ))/fi (vi ) e o maior
e positivo, caso exista. Caso nao exista i com vi (1 Fi (vi ))/fi (vi ) positivo, entao o objeto
nao e vendido.
O valor vi (1 Fi (vi ))/fi (vi ) pode ser interpretado como a receita marginal, denotado por
RM gi (vi ), que o vendedor obtem ao aumentar a probabilidade de que o objeto seja alocado
para o vendedor i quando a sua valoracao e vi .
Portanto, o vendedor maximiza sua receita vendendo o objeto para i com a maior receita
marginal RM gi (vi ) (ou seja, fazendo a probabilidade desse indivduo receber o objeto igual a
1), desde que ela seja positiva (caso contrario, o objeto nao e vendido).
Agora vamos discutir a parte de pagamento que o mecanismo assume. Note que os participantes
que nao recebem o objeto pagam, de acordo com o mecanismo descrito em (4), o valor:
Z vi Z vi

ci (vi , vi ) = pi (vi , vi )vi pi (x, vi ) dx = 0 vi 0 dx = 0 ,
0 0
ou seja, eles nao pagam nada (note que como pi (vi , vi ) = 0 e pi e nao-decrescente em vi , entao
pi (x, vi ) = 0, para todo x vi ).
Ja o indivduo i que recebe o objeto paga o preco:

Z vi Z vi

ci (vi , vi ) = pi (vi , vi )vi pi (x, vi ) dx = vi pi (x, vi ) dx
0 0
Como pi toma apenas os valores 0 ou 1, e nao-decrescente e contnua a` esquerda, e pi (vi , vi ) =

1, existe um valor maximo ri < vi , que depende de vi , tal que pi (ri , vi ) = 0. Como ri
depende de vi , vamos denota-lo como ri (vi ). Pela definicao de ri (vi ), temos que pi (x, vi )
e igual a 1 para todo x > ri (vi ) e e igual a zero para todo x ri (vi ). Portanto:
Z vi Z vi

ci (vi , vi ) = vi pi (x, vi ) dx = vi 1 dx = vi (vi ri (vi )) = ri (vi )
0 ri (vi )
Logo, o pagamento feito pelo vencedor do leilao, igual a ri (vi ), independe do seu valor re-
portado para o objeto. Mais ainda, o preco pago e igual ao valor maximo que ele poderia ter
anunciado, dado os valores anunciados pelos outros participantes, para o qual ele nao receberia
o objeto. Obtemos entao o teorema a seguir.

Microeconomia 2 P
os Notas de Aula
Teorema 9.8. Se N participantes possuem valores privados independentes, e a valoracao de

todo participante i e obtida de uma funcao de densidade positiva e contnua fi que satisfaz
vi (1 Fi (vi ))/fi (vi ) crescente em vi , entao o seguinte mecanismo de venda gera a maior
receita esperada possvel:
Para cada vetor de valores anunciados v1 , . . . , vN , o vendedor entrega o objeto para

o indivduo i cujo vi (1 Fi (vi ))/fi (vi ) e o maior e positivo, caso exista (caso
nao exista i com vi (1 Fi (vi ))/fi (vi ) positivo, entao o objeto nao e vendido).
Se a venda e realizada, i paga ri , onde ri (1 Fi (ri )/fi (ri ) = 0 ou maxj6=i vj
(1 Fj (vj )/fj (vj ), o que for maior. O pagamento feito pelo participante i, ri , e,
portanto, o maior valor que ele poderia ter reportado, dado os valores reportados
pelos outros participantes, tal que ele nao receberia o objeto.
Como o mecanismo (pi (), ci ())N

i=1
e compatvel de incentivo, revelar a valoracao verdadeira do
objeto constitui um equilbrio de Nash. Mas, considerando este mecanismo, e possvel mostrar
que anunciar a valoracao verdadeira e uma estrategia fracamente dominante (Exerccio 9.19).
Logo, mesmo que os outros participantes nao anunciem a sua valoracao verdadeira, para i e
sempre melhor resposta anunciar sua valoracao verdadeira.
Um problema e que a implementacao de (pi (), ci ())N

i=1 exige que o vendedor conhe
ca a distri-
buicao Fi de cada indivduo. Se as distribuicoes Fi nao forem conhecidas, o mecanismo nao e
implementavel.

Microeconomia 2 P
os Notas de Aula
4.6 Efici
encia e Simetria
Ineficiencia pode ocorrer quando:
1. Nao ha venda e existem pessoas que atribuem valor positivo ao bem;
2. A venda ocorre para um indivduo cujo valor atribudo ao objeto nao e o maior.
O primeiro caso ocorre se vi (1 Fi (vi ))/fi (vi ) for menor que zero para todo i. O segundo
caso pode ocorrer se os indivduos nao forem simetricos.
A presenca de ineficiencia nao e inesperada: essa e uma situacao onde um vendedor monopolista
deseja obter o maximo de lucro possvel. Neste caso, ao inves de restringir producao, o vendedor
pode optar por nao vender o objeto, mesmo que existam compradores que atribuam um valor
positivo ao objeto.
Alem disso, como o vendedor sabe quem e cada comprador e conhece as distribuicoes Fi , para
todo i, ele pode discriminar entre os compradores de modo a obter lucro maior. Porem, no
caso simetrico, onde Fi = F para todo i, esse segundo tipo de ineficiencia desaparece. Alem
disso, supondo simetria, obtemos o teorema abaixo.
Teorema 9.9. Se N participantes de um leilao possuem valores privados independentes, cada

valor obtido da mesma funcao de densidade contnua f , onde:
1 F (v)
v e estritamente crescente em v ,
f (v)
entao o leilao de segundo-preco com preco reserva que satisfaz:
1 F ( )
= 0,
f ( )
maximiza a receita esperada do leiloeiro.
Prova: Considere o mecanismo otimo (pi (), ci ())N i=1 e suponha que os participantes anunciam
v1 , . . . , vN . Como v (1 F (v))/f (v) e estritamente crescente em v e o objeto e alocado para
quem tem o maior vi (1 F (vi ))/f (vi ), entao o objeto e alocado para quem anuncia o maior
vi , desde que vi (1 F (vi ))/f (vi ) seja positivo.
nico < vi , [0, 1], tal que (1
Se vi (1 F (vi ))/f (vi ) e positivo, entao existe um u
F ( )/f ( ) = 0 (Exerccio 9.20). Entao, i ganha o objeto se vi e vi > vj , j 6= i. Nesse
caso, ele paga ou ou o maior valor vj , j 6= i.
Os outros tres tipos de leiloes tambem geram a receita maxima para o vendedor, se definirmos
um preco reserva adequado. Desse modo, todos os quatros tipos de leilao, com preco reserva
adequado, maximizam a receita do vendedor, entre todas as formas possveis de venda do
objeto. Entao por que alguns tipos de leiloes sao mais usados do que outros?
Refer
encias
Myerson, R. B. (1981). Optimal auction design. Mathematics of Operations Research, 6 ,
58-73.

Apostila Micro 2

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Apostila Micro 2

Caricato da

Copyright:

Formati disponibili

Microeconomia 2 P

Microeconomia 2 Pos-Graduacao 2/2015

Para descrevermos um jogo e necessario conhecermos tres objetos:

O resultado (payoff) do jogo.

Jose Guilherme de Lara Resende 1 NA 1 Teoria dos Jogos (parte 1)

Sao feitas duas hipoteses basicas sobre os jogadores (Myerson, 1997):

1. Os jogadores sao racionais. As acoes de um jogador sao consistentes com o objetivo

Existem duas formas de representarmos um jogo:

FORMA NORMAL: Representacao em forma matricial, tambem conhecida como forma

FORMA EXTENSIVA: Representacao em forma de arvore. Adequada para situacoes onde

1.3 Conhecimento Comum

Se considerarmos dois jogadores, um determinado fato e de conhecimento comum dos jogadores

Jose Guilherme de Lara Resende 2 NA 1 Teoria dos Jogos (parte 1)

Jose Guilherme de Lara Resende 3 NA 1 Teoria dos Jogos (parte 1)

2 Jogos na Forma Estrat

Para esse jogo, temos que:

Jogadores: I = {1, 2};

Jose Guilherme de Lara Resende 4 NA 1 Teoria dos Jogos (parte 1)

L.A. / Laelio Confessar Nao Confessar

Jose Guilherme de Lara Resende 5 NA 1 Teoria dos Jogos (parte 1)

Definic egia Estritamente Dominante. Uma estrategia si Si e estrita-

onde Si = S1 Si1 Si+1 SI .

Logo, uma estrategia si e estritamente dominante para o jogador i se ela for a u

Neste caso, dizemos que a estrategia si domina estritamente a estrategia si .

Jose Guilherme de Lara Resende 6 NA 1 Teoria dos Jogos (parte 1)

Para o jogador 1, a estrategia B e estritamente dominada pela estrategia C. Essa e a u nica

A ideia do procedimento e, portanto, simples. Ele usa implicitamente a hipotese de conhe-

Procedimento de Eliminac ao de Estrat egias Estritamente Dominadas (PEEED):

Definicao 7.4: Estrat egia Iterativamente Estritamente N ao-Dominada. A estrategia

Evidentemente, toda estrategia fortemente dominante e fracamente dominante, mas a volta

Jose Guilherme de Lara Resende 7 NA 1 Teoria dos Jogos (parte 1)

Exemplo 6. Considere o seguinte jogo:

A estrategia C e fracamente dominante para o jogador 1 e a estrategia E e fracamente do-

conjunto das estrategias do jogador i resultante da n-esima etapa de eliminacao de estrategias

Jose Guilherme de Lara Resende 8 NA 1 Teoria dos Jogos (parte 1)

ao: Melhor Resposta. Considere o jogo G = (Si , ui )Ii=1 . A estrategia si e a melhor

Portanto, a estrategia si e a melhor resposta do jogador i para a estrategia si se ela for a

O conjunto de estrategias racionalizaveis esta contido no conjunto de estrategias que

Jose Guilherme de Lara Resende 9 NA 1 Teoria dos Jogos (parte 1)

Em um equilbrio de Nash (EN), a estrategia de cada jogador e a melhor resposta para as

Jose Guilherme de Lara Resende 10 NA 1 Teoria dos Jogos (parte 1)

3.2 Equilbrio de Nash em Estrat

Podemos estender imediatamente os conceitos de: estrategias dominantes, estrategias domi-

Definic ao 7.9: Equilbrio de Nash em Estrat egias Mistas. O conjunto de estrategias

Jose Guilherme de Lara Resende 11 NA 1 Teoria dos Jogos (parte 1)

ao (Suporte). O suporte da estrategia mista mi Mi , denotado por supp(mi ), e o

supp(mi ) = {si Si | mi (si ) > 0}

Podemos definir o suporte do conjunto de estrategias mistas m = (m1 , m2 , . . . , mI ) como:

Teorema 7.1: Equival

2. Para todo jogador i, ui (m) i ), para todo si supp(m

Jose Guilherme de Lara Resende 12 NA 1 Teoria dos Jogos (parte 1)

Pelo Teorema 7.1, essas randomizacoes constituem um EN se:

u1 (Ca, m2 ) = u1 (Co, m2 ) e u2 (m1 , Ca) = u2 (m1 , Co) ,

onde m1 e m2 representam as estrategias mistas dos jogadores 1 e 2, respectivamente. Portanto:

Logo, m1 = (1/2Ca; 1/2Co) e m2 = (1/2Ca; 1/2Co) constituem um EN em estrategias mistas

u1 (Ca, m2 ) = u1 (Co, m2 ) = u1 (m1 , m2 ) = 0

como esperado pelo Teorema 7.1.

Algoritmo para Encontrar EN em Estrat egias Mistas. Fixe S = S1 SI S =

(ii) ui (si , mi ) Ui , para todo jogador i, para todo si / Si ;

(iii) Garante que as probabilidades de randomizacao sejam de fato probabilidades.

Jose Guilherme de Lara Resende 13 NA 1 Teoria dos Jogos (parte 1)

Jose Guilherme de Lara Resende 14 NA 1 Teoria dos Jogos (parte 1)

3.3 Teorema de Nash

O seguinte resultado mais geral e valido: