Sei sulla pagina 1di 188

tdj

i i
2017/2/2
page 1
i i

UMA INTRODUC A
AO ` TEORIA

ECONOMICA DOS JOGOS

Humberto Jose Bortolossi


Universidade Federal Fluminense

Gilmar Garbugio
Universidade Federal Fluminense

Brgida Sartini
Universidade Federal Rural do Rio de Janeiro

1.1.2
VERSAO
2 de fevereiro de 2017

Por favor, envie suas sugestoes, correcoes e crticas para


hjbortol@vm.u.br, gilmarg@id.u.br e brigida.sartini@gmail.com.

i i

i i
tdj
i i
2017/2/2
page 2
i i

` minha esposa Josel e `a minha lha Hillary Winry.


A
H. J. B.

` minha mae Rita e aos meus irmaos Humberto e Reginaldo.


A
B. A. S.

Aos meus pais Orlando e Iraci e aos meus irmaos Roseli, Rosinei,
Rosana, Carla, Andreia e Reginaldo.
G. G.

i i

i i
tdj
i i
2017/2/2
page 3
i i

i i

i i
tdj
i i
2017/2/2
page 1
i i

Sum
ario

Pref
acio 3

1 Alguns marcos hist


oricos 5

2 Jogos na forma estrat egica 10


2.1 O que e um jogo? . . . . . . . . . . . . . . . . . . . . . 10
2.2 Solucoes de um jogo em estrategias puras . . . . . . . 13
2.2.1 Dominancia em estrategias puras . . . . . . . . 14
2.2.2 Equilbrio de Nash em estrategias puras . . . . 20
2.2.3 Relacoes entre domin ancia e equilbrio de Nash 24
2.3 Estrategias mistas . . . . . . . . . . . . . . . . . . . . 27
2.4 Solucoes de um jogo em estrategias mistas . . . . . . . 31
2.4.1 Dominancia em estrategias mistas . . . . . . . 32
2.4.2 Equilbrio de Nash em estrategias mistas . . . . 35
2.4.3 Relacoes entre domin ancia e equilbrio de Nash 45
2.4.4 Como interpretar estrategias mistas? . . . . . . 45
2.5 Jogos innitos . . . . . . . . . . . . . . . . . . . . . . . 48
2.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . 50

3 O teorema de equilbrio de Nash 60


3.1 Usando o teorema de Brouwer . . . . . . . . . . . . . . 60
3.2 Usando o teorema de Kakutani . . . . . . . . . . . . . 65
3.3 Algumas propriedades dos equilbrios de Nash . . . . . 69
3.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . 70

i i

i i
tdj
i i
2017/2/2
page 2
i i

2 Sum
ario

4 Calculando equilbrios de Nash 71


4.1 Equilbrio de Nash via um problema de otimizacao . . 71
4.2 Equilbrio de Nash via equacoes polinomiais . . . . . . 74
4.3 Jogos de soma zero . . . . . . . . . . . . . . . . . . . . 82
4.3.1 Jogos de soma constante com dois jogadores . . 82
4.3.2 Equilbrio de Nash em estrategias puras . . . . 86
4.3.3 Equilbrio de Nash em estrategias mistas . . . . 91
4.3.4 O teorema minimax de von Neumann . . . . . 93
4.4 Equilbrio de Nash via um problema de complementa-
ridade . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
4.4.1 Jogos bimatriciais . . . . . . . . . . . . . . . . 101
4.4.2 O algoritmo de Lemke-Howson . . . . . . . . . 104
4.5 Gambit . . . . . . . . . . . . . . . . . . . . . . . . . . 104
4.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . 106

5 Jogos na forma extensa 108


5.1 Denicao . . . . . . . . . . . . . . . . . . . . . . . . . 108
5.2 Equilbrio de Nash . . . . . . . . . . . . . . . . . . . . 110
5.3 Induc
ao retroativa e equilbrio perfeito em subjogos . . 114
5.4 O teorema de Kuhn-Zermelo . . . . . . . . . . . . . . 118
5.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . 119

6 Exemplos 120
6.1 O jogo Le Her simplicado . . . . . . . . . . . . . . . . 120
6.2 O modelo de duopolio de Cournot . . . . . . . . . . . 126
6.3 O modelo de duopolio de Bertrand . . . . . . . . . . . 129
6.4 O modelo de duopolio de Stackelberg . . . . . . . . . . 131
6.5 A tragedia dos comuns . . . . . . . . . . . . . . . . . . 133

A Convexidade 137

B Programa
c
ao Linear 145

C Respostas dos exerccios 155

Bibliografia 173

Indice 183

i i

i i
tdj
i i
2017/2/2
page 3
i i

Pref
acio
A teoria dos jogos e uma teoria matematica criada para se modelar
fen omenos que podem ser observados quando dois ou mais agentes de
decisao interagem entre si. Ela fornece a linguagem para a descricao
de processos de decisao conscientes e objetivos envolvendo mais de
um indivduo.
Suas aplicac
oes incluem eleicoes, leil
oes, balanco de poder, evolu-
c
ao genetica, etc. Ela tambem e uma teoria matematica pura, que
pode e tem sido estudada como tal, sem a necessidade de relaciona-la
com problemas comportamentais ou jogos per se.
Algumas pessoas acreditam que a teoria dos jogos formar a, algum
dia, o alicerce de um conhecimento tecnico estrito de como decisoes
s
ao feitas e de como a economia funciona. A teoria ainda n ao atingiu
este patamar e, hoje, e mais estudada em seus aspectos matematicos
puros e, em aplicacoes, ela e usada como uma ferramenta ou alegoria
que auxiliam no entendimento de sistemas mais complicados.
Neste texto trataremos da teoria matematica dos jogos nao-coope-
rativos estaticos de informacao completa e dos jogos din amicos de
informacao perfeita.
A Teoria Econ omica dos Jogos nao deve ser confundida com a
Teoria Combinat oria dos Jogos, iniciada por Sprague e Grundy na
decada de 30. Enquanto que a primeira tem motivacoes predomi-
nante economicas e procura estabelecer metodos para se maximizar
o ganho (payo ), a segunda se concentra nos aspectos combinat orios
de jogos de mesa (por exemplo, a estrategia do jogo de nim) e nao
permite elementos imprevisveis como o lancamento de um dado
ou o embaralhamento de cartas.
Acreditamos que o assunto seja estimulante para o estudante de
matematica: ele tera a oportunidade de ver como conceitos de analise,

i i

i i
tdj
i i
2017/2/2
page 4
i i

4 Pref
acio

topologia, otimizacao e probabilidade se integram em uma teoria apli-


cada.

Agradecimentos 1
Gostaramos de agradecer a Hilmar Ilton Santana Ferreira, Polya-
ne Alves Santos e Larissa Santana Barreto, que participaram ativa-
mente dos seminarios sobre teoria dos jogos realizados no perodo
2003-2004, momento no qual uma vers ao preliminar deste texto foi
escrita. Tambem gostaramos de agradecer a Rita de Cassia Silva
Costa, Bernardo K. Pagnoncelli e, em especial, a Carlos Tomei, que
leram o texto e zeram v arias sugestoes. Finalmente, gostaramos de
agradecer a Sec
ao de Referencia (SRE) da Divis ao de Bibliotecas e
Documentac ao da PUC-Rio pela agilidade e eciencia na aquisicao
de alguns artigos difceis de se encontrar.

Agradecimentos 2
Gostaramos de agradecer `as v
arias pessoas que, apos a divulgacao
da vers
ao Creative Commons deste livro, colaboraram com sugest oes:
Doherty Andrade, Carlos Frederico Palmeira.

Humberto Jose Bortolossi


Brgida Alexandre Sartini
Gilmar Garbugio

1 de fevereiro de 2017

i i

i i
tdj
i i
2017/2/2
page 5
i i

Captulo 1

Alguns marcos
hist
oricos

Neste captulo apresentaremos alguns marcos historicos da teoria


dos jogos relacionados principalmente com os topicos que iremos ex-
plorar no texto. Para uma cronologia mais completa, recomendamos
as referencias [46, 50, 65, 86, 95, 96].
O conceito de solucao de um jogo por estrategia mista1 surgiu pela
primeira vez no estudo do jogo Le Her, realizado por James Walde-
grave e descrito por ele em uma carta a Pierre Remond de Montmort,
em 13 de novembro de 1713. Em seu estudo, ele procurou encontrar
uma estrategia que maximizasse a probabilidade de vit oria do joga-
dor, independentemente da escolha de estrategia de seu oponente.
Este jogo foi discutido por Montmort e por Nicholas Bernoulli em
1713 e os resultados foram publicados nesse ano por Montmort, que
incluiu a solucao de Waldegrave em um apendice.
Em 1838, Augustin Cournot publicou sua obra Recherches sur
les Principes Mathematiques de la Theorie des Richesses, na qual
analisou um caso especial de duopolio. As empresas decidiam as
quantidades a produzir e Cournot deniu o conceito de equilbrio de
1 Uma estrategia pura e uma das escolhas que o jogador pode fazer. Uma
estrat
egia mista e uma distribuic
ao de probabilidades sobre o conjunto de es-
trat
egias puras. Definic
oes formais ser
ao apresentadas no pr
oximo captulo.

i i

i i
tdj
i i
2017/2/2
page 6
i i

6
[CAP. 1: ALGUNS MARCOS HISTORICOS

Figura 1.1: Antoine Augustin Cournot (18011877).

mercado como sendo a situacao em que ambas as empresas reagem


de forma otima `a decis ao da empresa concorrente. Este conceito
de solucao e uma vers ao do equilbrio de Nash aplicado ao caso do
duop olio.
No incio do seculo XX, apareceram varios artigos sobre teoria dos
jogos. Ernst Zermelo, em 1913, publicou um teorema sobre o jogo
de xadrez no artigo Uber eine Anwendung der Mengenlehre auf die
Theorie des Schachspiels, armando que, em cada etapa do jogo, pelo
menos um dos jogadores possui uma estrategia que o levara a vitoria
ou ao empate. Contudo, Zermelo n ao demonstrou o teorema em seu
artigo. A primeira demonstracao foi dada por Laszlo Kalmar. Apa-
rentemente, foi Zermelo quem primeiro destacou o uso da sem antica
de otimalidade em teoria dos jogos: Whether one could calculate
with mathematical objectivity, or even give a participant some idea
of, the value of a possible position in the game, as well as of the best
move in this position: information without which the player would
have to eliminate both subjective and psychological guesses and the
opinions of the perfect player, etc.? ([95]).

No perodo de 1921 a 1927, Emile Borel publicou uma serie de
notas sobre jogos simetricos de soma zero com dois jogadores com
um n umero nito n de estrategias puras para cada jogador. Borel
foi o primeiro a tentar formular matematicamente este jogo. Ele in-
troduziu o conceito de metodo de jogada (o que hoje corresponde
a estrategia pura) e procurou por uma solucao em estrategias mis-
`
tas (o que hoje e conhecido como solucao minimax). Em 1921, ele
provou a existencia de tal solucao para n = 3 ([07]) e, em 1924,

i i

i i
tdj
i i
2017/2/2
page 7
i i

Figura 1.2: Ernst Friedrich Ferdinand Zermelo (18711953).

para n = 5 ([08]). Borel acreditava que o resultado de existencia


n
ao seria v
alido para um n qualquer, mas como nao encontrou um
contra-exemplo, deixou o problema em aberto.


Figura 1.3: Felix Edouard Justin Emile Borel (1871-1956).

No artigo Zur Theorie der Gesellschaftsspiele de 1928, usando


topologia e calculo funcional ([50]), John von Neumann demonstrou
a existencia de solucao em estrategias mistas de um jogo nito de
soma zero com dois jogadores e um n umero arbitrario de estrategias
puras. Este artigo tambem introduziu a forma extensa de um jogo.
Ate a decada de 40, os artigos publicados sobre teoria dos jogos
nao tinham despertado muito o interesse dos cientistas sociais e de
outras areas que pesquisavam sobre conitos de interesses. Talvez
isto se deva ao fato de que os artigos eram escritos por matem aticos
e publicados em revistas matem aticas. Este panorama foi alterado
com a publicacao em 1944 do livro Theory of Games and Economic

i i

i i
tdj
i i
2017/2/2
page 8
i i

8
[CAP. 1: ALGUNS MARCOS HISTORICOS

Behavior, escrito por John von Neumann e pelo economista Oskar


Morgenstern, um marco na teoria dos jogos.

Oskar Morgenstern John von Neumann


(1902-1977) (1903-1957)

Figura 1.4: Oskar Morgenstern e John von Neumann.

Eles detalharam a formulacao de problemas economicos e mostraram


v
arias possibilidades de aplicacao da teoria dos jogos em economia,
procurando apresentar as motivacoes, os raciocnios e as conclus
oes
da teoria de forma acessvel, atraindo assim a atencao de pesquisa-

i i

i i
tdj
i i
2017/2/2
page 9
i i

dores de diversas areas. Na reedicao de 1947, tomada como padr ao,


os autores estabeleceram os axiomas da teoria da utilidade. O livro
foi republicado em 1953 e sua mais recente edicao e de 1980.
Na Universidade de Princeton, John Forbes Nash Jr. escreveu sua
tese de doutorado em 1949, sob o ttulo Non-Cooperative Games. Ele
deniu o conceito de ponto de equilbrio, atualmente conhecido como
equilbrio de Nash de um jogo e provou sua existencia para jogos nao-
cooperativos. Os resultados mais importantes de sua tese estao no
artigo Equilibrium Points in N-Person Games de 1950 ([66]) e, mais
detalhadamente, no artigo Non-Cooperative Games de 1951 ([69]).
Ainda em 1950, Nash escreveu sobre o problema da barganha em
The Bargaining Problem ([68]) e, no ano de 1953, sobre jogos coo-
perativos em Two Person Cooperative Games ([70]). Nestes, Nash
deniu o conceito de solucao da barganha de Nash em um jogo coo-
perativo com dois jogadores, estabeleceu um sistema de axiomas que
esta solucao deveria satisfazer e provou a existencia e unicidade desta
solucao.
Em 1994, John Harsanyi, John Nash e Reinhard Selten receberam
o Premio Nobel de Economia em reconhecimento ao trabalho pioneiro
sobre an alise de equilbrio na teoria de jogos n
ao-cooperativos.

(a) (b) (c)

Figura 1.5: Ganhadores do premio Nobel de Economia em 1994:


(a) John Harsanyi (1920-2000), (b) John Forbes Nash Jr.
(1928-2015) e (c) Reinhard Selten (1930-2016).

i i

i i
tdj
i i
2017/2/2
page 10
i i

Captulo 2

Jogos na forma
estrat
egica

2.1 O que
e um jogo?
A teoria dos jogos pode ser denida como a teoria dos modelos
matematicos que estuda a escolha de decisoes otimas sob condicoes
de conito. O elemento basico em um jogo e o conjunto de jogadores
que dele participam. Cada jogador tem um conjunto de estrategias.
Quando cada jogador escolhe sua estrategia, temos entao uma si-
tuac
ao ou perl no espaco de todas as situacoes (pers) possveis.
Cada jogador tem interesse ou preferencias para cada situacao no
jogo. Em termos matem aticos, cada jogador tem uma func ao uti-
lidade que atribui um n umero real (o ganho ou payo do jogador)
a cada situac
ao do jogo. Mais especicamente, um jogo tem os se-
guintes elementos basicos: existe um conjunto nito de jogadores,
representado por
G = {g1 , g2 , . . . , gn },

e cada jogador gi G possui um conjunto nito

Si = {si1 , si2 , . . . , simi }

10

i i

i i
tdj
i i
2017/2/2
page 11
i i

UM JOGO?
[SEC. 2.1: O QUE E 11

de opcoes, denominadas estrategias puras do jogador gi (mi 2).


Um vetor
s = (s1j1 , s2j2 , . . . , snjn ),
onde siji e uma estrategia pura para o jogador gi G, e denomi-
nado um perl de estrategias puras. O conjunto de todos os pers de
estrategias puras formam, portanto, o produto cartesiano
n

S= Si = S1 S2 Sn ,
i=1

denominado espaco de estrategias puras do jogo. Para cada joga-


dor gi G, existe uma func
ao utilidade
ui : S R
s  ui (s)
que associa o ganho (payo) ui (s) do jogador gi a cada perl de
estrategias puras s S. Esta funcao utilidade e uma forma de re-
presentar a preferencia do jogador gi com relacao aos varios pers de
estrategias do jogo ([13]).
Jogos descritos nesta forma s ao denominados jogos estrategicos ou
jogos na forma normal . Neles, cada jogador deve fazer a sua escolha
de estrategia sem o conhecimento das escolhas dos demais jogadores.
Admite-se, contudo, que cada jogador conhece toda a estrutura do
jogo. Por este motivo, jogos deste tipo tambem s ao denominados
jogos nao-cooperativos de informac ao completa.
Assume-se tambem que os jogadores sejam racionais, isto e, eles
sempre escolher ao acoes que maximizem a sua funcao utilidade. Alem
de ser racional, cada jogador (1) sabe que seus advers arios tambem
s
ao racionais, (2) sabe que eles sabem que o jogador sabe que eles sao
racionais, ad innitum.

Exemplo 2.1 (O dilema do prisioneiro) Possivelmente o exem-


plo mais conhecido na teoria dos jogos e o dilema do prisioneiro. Ele
foi formulado por Albert W. Tucker em 1950, em um seminario para
psicologos na Universidade de Stanford, para ilustrar a diculdade de
se analisar certos tipos de jogos.
A situacao e a seguinte: dois ladr
oes, Al e Bob, s
ao capturados
e acusados de um mesmo crime. Presos em selas separadas e sem

i i

i i
tdj
i i
2017/2/2
page 12
i i

12
[CAP. 2: JOGOS NA FORMA ESTRATEGICA

poderem se comunicar entre si, o delegado de plant ao faz a seguinte


proposta: cada um pode escolher entre confessar ou negar o crime.
Se nenhum deles confessar, ambos ser ao submetidos a uma pena de
1 ano. Se os dois confessarem, ent
ao ambos terao pena de 5 anos. Mas
se um confessar e o outro negar, entao o que confessou sera libertado
e o outro ser
a condenado a 10 anos de pris ao. Neste contexto, temos
G = {Al, Bob},
SAl = {confessar, negar}, SBob = {confessar, negar},
S = SAl SBob =
{(confessar, confessar), (confessar, negar),
(negar, confessar), (negar, negar)}.
As duas funcoes utilidade
uAl : S R e uBob : S R
s
ao dadas por
uAl (confessar, confessar) = 5, uAl (confessar, negar) = 0,
uAl (negar, confessar) = 10, uAl (negar, negar) = 1,
(que representam os ganhos de Al) e
uBob (confessar, confessar) = 5, uBob (confessar, negar) = 10,
uBob (negar, confessar) = 0, uBob (negar, negar) = 1

(que representam os ganhos de Bob). E uma pratica representar os


payos dos jogadores atraves de uma matriz, denominada matriz de
payos.
Bob
confessar negar
confessar (5, 5) (0, 10)
Al

negar (10, 0) (1, 1)

Nesta matriz, os n umeros de cada celula representam, respectiva-


mente, os payos de Al e Bob para as escolhas de Al e Bob corres-
pondentes a celula.

i i

i i
tdj
i i
2017/2/2
page 13
i i

[SEC. 2.2: SOLUC


OES
DE UM JOGO EM ESTRATEGIAS PURAS 13

Exemplo 2.2 (A batalha dos sexos) Um homem e a sua mulher


desejam sair para passear. O homem prefere assistir a um jogo de
futebol enquanto que sua mulher prefere ir ao cinema. Se eles forem
juntos para o futebol, ent ao o homem tem satisfacao maior do que a
mulher. Por outro lado, se eles forem juntos ao cinema, entao a mu-
lher tem satisfacao maior do que o homem. Finalmente, se eles sarem
sozinhos, entao ambos cam igualmente insatisfeitos. Esta situacao
tambem pode ser modelada como um jogo estrategico. Temos:

G = {homem, mulher},
Shomem = {futebol, cinema}, Smulher = {futebol, cinema},
S = Shomem Smulher =
{(futebol, futebol), (futebol, cinema),
(cinema, futebol), (cinema, cinema)}.

As duas funcoes utilidade uhomem : S R e umulher : S R sao


descritas pela seguinte matriz de payos:
Mulher
futebol cinema
futebol (10, 5) (0, 0) .
Homem

cinema (0, 0) (5, 10)

2.2 Solu
c
oes de um jogo em estrat
egias
puras
Uma soluc ao de um jogo e uma prescricao ou previs
ao sobre o re-
sultado do jogo. Existem varios conceitos diferentes de solucao. Nesta
sec
ao, investigaremos os dois conceitos mais comuns: domin ancia e
equilbrio de Nash.
Considere o dilema do prisioneiro. Como encontrar uma solucao
para o dilema de Al e Bob, isto e, que estrategias s ao plausveis

i i

i i
tdj
i i
2017/2/2
page 14
i i

14
[CAP. 2: JOGOS NA FORMA ESTRATEGICA

se os dois prisioneiros querem minimizar1 o tempo de cadeia? Se


analisarmos o jogo do ponto de vista de Al, ele pode raciocinar da
seguinte maneira:

Duas coisas podem acontecer: Bob pode confessar ou


Bob pode negar. Se Bob confessar, entao e melhor para
mim confessar tambem. Se Bob n ao confessar, entao eu
co livre se eu confessar. Em qualquer um dos casos, e
melhor para mim confessar. Entao, eu confessarei.

Se analisarmos agora o jogo do ponto de vista de Bob, podemos


aplicar a mesma linha de raciocnio e concluir que Bob tambem ir
a
confessar. Assim, ambos confessarao e car
ao presos por 5 anos.
Em termos da teoria dos jogos, dizemos que (1) os dois joga-
dores possuem uma estrategia dominante, isto e, todas menos uma
estrategia e estritamente dominada, (2) que o jogo e resol
uvel por do-
minancia estrita iterada e (3) que o jogo termina em uma solucao que
e um equilbrio de estrategia dominante, conceitos que deniremos a
seguir.

2.2.1 Domin
ancia em estrat
egias puras
Freq
uentemente, iremos discutir pers de estrategia na qual ape-
nas a estrategia de um unico jogador gi G ir
a variar, enquanto que
as estrategias de seus oponentes permanecerao xas. Denote por

si = (s1j1 , . . . , s(i1)ji1 , s(i+1)ji+1 , . . . , snjn )


Si = S1 Si1 Si+1 Sn

uma escolha de estrategia para todos os jogadores, menos o jogador gi .


Desta maneira, um perl de estrategias pode ser convenientemente
denotado por

s = (siji , si ) = (s1j1 , . . . , s(i1)ji1 , siji , s(i+1)ji+1 , . . . , snjn ).

1 No Exemplo 2.1, os payos foram definidos como n umeros 0. Desta ma-


neira, minimizar o tempo de cadeia e equivalente a maximizar o payo.

i i

i i
tdj
i i
2017/2/2
page 15
i i

[SEC. 2.2: SOLUC


OES
DE UM JOGO EM ESTRATEGIAS PURAS 15

Definic
ao 2.1 (Estrate gia Pura Estritamente Domi-
nada) Dizemos que uma estrategia pura sik Si do joga-
dor gi G e estritamente dominada pela estrategia sik Si se,
independentemente das escolhas dos demais jogadores, o joga-
dor gi ganhar mais escolhendo sik do que sik , isto e, se

ui (sik , si ) > ui (sik , si ),

para todo si Si .

Defini
c
ao 2.2 (em estrat
egias puras)
(a) (Domina ncia Estrita Iterada) Domin ancia estrita ite-
rada e o processo no qual, sequencialmente, se eliminam as
estrategias que sao estritamente dominadas.
(b) (Equilbrio de Estrat egia Estritamente Dominan-
te) Quando o processo de dominancia estrita iterada reduz
o jogo para um u nico perl de estrategias puras s , dizemos
que s e um equilbrio de estrategia estritamente dominante.

Exemplo 2.3 Considere o jogo determinado pela matriz de payos


abaixo.
g2
s21 s22 s23 s24
s11 (5, 2) (2, 6) (1, 4) (0, 4)

s12 (0, 0) (3, 2) (2, 1) (1, 1)


g1
s13 (7, 0) (2, 2) (1, 1) (5, 1)

s14 (9, 5) (1, 3) (0, 2) (4, 8)

i i

i i
tdj
i i
2017/2/2
page 16
i i

16
[CAP. 2: JOGOS NA FORMA ESTRATEGICA

Neste jogo, para o jogador g2 , a estrategia s21 e estritamente domi-


nada pela estrategia s24 e, assim, a primeira coluna da matriz pode
ser eliminada.
g2
s22 s23 s24
s11 (2, 6) (1, 4) (0, 4)

s12 (3, 2) (2, 1) (1, 1)


g1
s13 (2, 2) (1, 1) (5, 1)

s14 (1, 3) (0, 2) (4, 8)

Agora, nesta matriz reduzida, para o jogador g1 , as estrategias s11


e s14 sao estritamente dominadas pelas estrategias s12 e s13 , respec-
tivamente. Portanto, as linhas 1 e 4 podem ser eliminadas. Alem
disso, a estrategia s23 do jogador g2 e estritamente dominada pela es-
trategia s22 . Assim, a coluna 2 tambem pode ser eliminada. Obtemos
entao uma matriz reduzida 2 2.
g2
s22 s24
s12 (3, 2) (1, 1)
g1
s13 (2, 2) (5, 1)

Finalmente, a estrategia s24 do jogador g2 e estritamente dominada


pela estrategia s22 e, na matriz 2 1 resultante, a estrategia s13 do
jogador g1 e estritamente dominada pela estrategia s12 . Vemos ent ao
que (s12 , s22 ) e o equilbrio de estrategias estritamente dominantes do
jogo: o jogador g1 escolhe a estrategia s12 (ganhando 3) e o jogador g2
escolhe a estrategia s22 (ganhando 2).

Note que, em cada passo do processo de eliminacao das estrategias


estritamente dominadas, o jogo e substitudo por um outro jogo

i i

i i
tdj
i i
2017/2/2
page 17
i i

[SEC. 2.2: SOLUC


OES
DE UM JOGO EM ESTRATEGIAS PURAS 17

mais simples, no sentido de que o conjunto de estrategias puras


de um jogador (aquele que tem uma estrategia estritamente domi-
nada) e substitudo por um subconjunto com menos elementos (ob-
tido removendo-se justamente as estrategias que sao estritamente do-
minadas). No exemplo acima, os conjuntos de estrategias puras ini-
ciais dos dois jogadores sao dados, respectivamente, por

S1 = {s11 , s12 , s13 , s14 } e S2 = {s21 , s22 , s23 , s24 }.

Como a estrategia pura s21 e estritamente dominada por s24 , o con-


junto S2 e substitudo por {s22 , s23 , s24 } = S2 {s21 }. O conjunto S1
permanece o mesmo. Sendo assim, podemos substituir o jogo original
por um mais simples, onde os conjuntos de estrategias puras dos dois
jogadores sao dados por
(1) (1)
S1 = {s11 , s12 , s13 , s14 } e S2 = {s22 , s23 , s24 }.

As funcoes utilidade do novo jogo s


ao as restricoes das funcoes utili-
dade do jogo original aos novos conjuntos de estrategias puras:

u1 |S (1) e u2 |S (1) .
1 2

Para o novo jogo, vemos que as estrategias s11 e s14 sao estritamente
dominadas pelas estrategias s12 e s13 , respectivamente. Logo, pode-
mos simplicar o jogo mais uma vez, considerando os conjuntos de
estrategias puras
(2) (2)
S1 = {s12 , s13 } e S2 = {s22 , s23 , s24 }.

Seguindo com as outras eliminacoes, terminamos com um jogo muito


simples, onde cada conjunto de estrategias puras e unitario:
(5) (5)
S1 = {s12 } e S2 = {s22 }.

Este processo de eliminacao gerou, portanto, uma cadeia de espacos


de estrategias puras:

(1) (1) (2) (2)


S = S1 S2  S (1) = S1 S2  S (2) = S1 S2 
(5) (5)
 S (5) = S1 S2 = {(s12 , s22 )}.

i i

i i
tdj
i i
2017/2/2
page 18
i i

18
[CAP. 2: JOGOS NA FORMA ESTRATEGICA

Neste exemplo, a tecnica de domin ancia estrita iterada forneceu um


u
nico perl de estrategias como solucao do jogo, no caso, o perl
(5) (5)
(s12 , s22 ) S1 S2 .
Contudo, pode acontecer da tecnica fornecer v arios pers ou, ate
mesmo, fornecer todo o espaco de estrategias, como e o caso da bata-
lha dos sexos, onde n
ao existem estrategias estritamente dominadas.

Um outro conceito importante e o de estrategia pura fracamente


dominada.

Definic
ao 2.3 (Estrate gia Pura Fracamente Domi-
nada) Dizemos que uma estrategia pura sik Si do joga-
dor gi G e fracamente dominada pela estrategia sik Si
se
ui (sik , si ) ui (sik , si ),
para todo si Si e, pelo menos para algum si Si ,

ui (sik , si ) > ui (sik , si ).

Em outras palavras, sik Si e fracamente dominada por


sik Si se, independentemente das escolhas dos demais joga-
dores, o jogador gi nada perde se trocar a estrategia sik Si
pela estrategia sik Si e, pelo menos para uma escolha dos
demais jogadores, esta troca da ao jogador gi um ganho maior.

Defini
c
ao 2.4
(a) (Domina ncia Fraca Iterada) Domin ancia fraca iterada
e o processo no qual, seq uencialmente, se eliminam as es-
trategias que sao fracamente dominadas.
(b) (Equilbrio de Estrat egia Fracamente Dominante)
Quando o processo de dominancia fraca iterada reduz o jogo
para um unico perl de estrategias puras s , dizemos que

s e um equilbrio de estrategia fracamente dominante.

i i

i i
tdj
i i
2017/2/2
page 19
i i

[SEC. 2.2: SOLUC


OES
DE UM JOGO EM ESTRATEGIAS PURAS 19

Exemplo 2.4 Considere o jogo cuja matriz de payos e dada por:

g2
s21 s22
s11 (1, 1) (1, 0) .
g1
s12 (1, 0) (0, 1)

A estrategia s12 do jogador g1 e fracamente dominada pela estra-


tegia s11 . Eliminando-a, obtemos a matriz reduzida:

g2
s21 s22
.
g1 s11 (1, 1) (1, 0)

Vemos agora que a estrategia s22 do jogador 2 e estritamente do-


minada pela estrategia s21 . Sendo assim, (s11 , s21 ) e o equilbrio de
estrategias fracamente dominadas do jogo.

Uma pergunta natural e se o processo de eliminacao das estrategias


dominadas depende ou n ao da ordem em que s ao realizadas. Para
o caso de estrategias estritamente dominadas, pode-se mostrar que
esta ordem e irrelevante, isto e, independentemente da ordem em
que as estrategias (estritamente dominadas) s ao eliminadas, obtem-se
sempre a mesma matriz reduzida no nal do processo. Por outro lado,
o processo de eliminac ao das estrategias fracamente dominadas pode
conduzir a resultados diferentes, dependendo da ordem de eliminacao.
Considere, por exemplo, o jogo (conforme [32]):

g2
s21 s22 s23
s11 (0, 2) (0, 0) (1, 0) .
g1
s12 (0, 3) (1, 0) (0, 0)

i i

i i
tdj
i i
2017/2/2
page 20
i i

20
[CAP. 2: JOGOS NA FORMA ESTRATEGICA

Eliminando-se, em sequencia, as estrategias s23 (que e estritamente


dominada por s21 ), s11 (que e fracamente dominada por s12 ) e s22
(que e estritamente dominada por s21 ), obtemos (s12 , s21 ) como res-
posta. Agora, eliminando-se, em sequencia, as estrategias s22 (que
e estritamente dominada por s21 ), s12 (que e fracamente dominada
por s11 ) e s23 (que e estritamente dominada por s21 ), obtemos outra
resposta: (s11 , s21 ). Para detalhes sobre este assunto, recomendamos
as referencias [01, 15, 26, 32, 47, 55].
Com relacao `a complexidade computacional, os resultados mos-
tram que os problemas relacionados com estrategias estritamente do-
minadas tendem a ser mais faceis (no sentido que eles podem ser
resolvidos em tempo polinomial), enquanto que questoes envolvendo
estrategias fracamente dominadas s ao mais difceis (no sentido que
eles s
ao NP-completos). Por exemplo, saber se uma dada submatriz
de uma matriz de payos pode ser obtida atraves do processo de
eliminacao de estrategias dominadas e um problema polinomial para
o caso de estrategias estritamente dominadas e e um problema NP-
Completo para o caso de estrategias fracamente dominadas. Detalhes
sobre o assunto podem ser encontrados nas referencias [18, 33].

2.2.2 Equilbrio de Nash em estrat


egias puras
Uma soluc ao estrategica ou equilbrio de Nash de um jogo e um
perl de estrategias onde cada jogador n ao tem incentivo de mudar
sua estrategia se os demais jogadores nao o zerem.

Definic
ao 2.5 (Equilbrio de Nash) Dizemos que um perl
de estrategias

s = (s1 , . . . , s(i1) , si , s(i+1) , . . . , sn ) S

e um equilbrio de Nash se

ui (si , si ) ui (siji , si )

para todo i = 1, . . . , n e para todo ji = 1, . . . , mi , com mi 2.

i i

i i
tdj
i i
2017/2/2
page 21
i i

[SEC. 2.2: SOLUC


OES
DE UM JOGO EM ESTRATEGIAS PURAS 21

Exemplo 2.5
(a) No dilema do prisioneiro (Exemplo 2.1), o perl de estrategias
(confessar, confessar) e um equilbrio de Nash. De fato:

uAl (confessar, confessar) = 5 > 10 = uAl (negar, confessar)

uBob (confessar, confessar) = 5 > 10 = uBob (confessar, negar).

Estas desigualdades mostram que, para o perl de estrategias


(confessar, confessar), um prisioneiro n
ao se sente motivado a
mudar a sua estrategia se o outro nao o zer (ele n
ao vai car
menos tempo na cadeia fazendo isto).
J
a o perl (negar, confessar) n
ao e um equilbrio de Nash do
jogo pois, neste caso, dado que Bob decide confessar, Al ca
menos tempo na cadeia se mudar a sua estrategia de negar para
confessar. Em outras palavras, para o perl (negar, confessar),
Al se sente motivado a mudar a sua estrategia se Bob n
ao o zer.
Os pers (confessar, negar) e (negar, negar) tambem n ao s
ao
equilbrios de Nash. Em (confessar, negar), Bob se sente moti-
vado a mudar a sua estrategia se Al nao o zer e, em (negar,
negar), cada um dos prisioneiros se sente motivado a mudar a
sua estrategia se o outro nao o zer. Desta maneira, vemos que
ou nico equilbrio de Nash do jogo e (confessar, confessar).

(b) Na batalha dos sexos (Exemplo 2.2), os pers de estrategia (fu-


tebol, futebol) e (cinema, cinema) s
ao os u
nicos equilbrios de
Nash do jogo.

(c) No Exemplo 2.3, o u nico equilbrio de Nash do jogo e o perl de


estrategias (s12 , s22 ).

Existem, contudo, jogos que nao possuem equilbrios de Nash em


estrategias puras. Este e o caso, por exemplo, do jogo de comparar
moedas (matching pennies).

i i

i i
tdj
i i
2017/2/2
page 22
i i

22
[CAP. 2: JOGOS NA FORMA ESTRATEGICA

Exemplo 2.6 (Comparar moedas) Nesse jogo, dois jogadores exi-


bem, ao mesmo tempo, a moeda que cada um esconde em sua mao.
Se ambas as moedas apresentam cara ou coroa, o segundo jogador
d
a sua moeda para o primeiro. Se uma das moedas apresenta cara,
enquanto a outra apresenta coroa, e a vez do primeiro jogador dar
sua moeda para o segundo. Esse jogo se encontra representado por
sua matriz de payos dada abaixo.
g2
s21 s22
s11 (+1, 1) (1, +1)
g1
s12 (1, +1) (+1, 1)

Observe que o perl de estrategias (s11 , s21 ) nao e um equilbrio de


Nash em estrategias puras, pois se o jogador g1 mantiver a sua es-
trategia s11 , o jogador g2 tera um ganho maior se mudar sua es-
trategia de s21 para s22 , isto e, ele se sente motivado a mudar a sua
estrategia se o jogador g1 nao mudar a sua escolha. O mesmo com-
portamento ocorre para o perl de estrategias (s12 , s22 ). Ja, para os
pers (s11 , s22 ) e (s12 , s21 ), e o jogador g1 que se sente motivado a
mudar de estrategia para ganhar mais, se o jogador g2 mantiver a sua
estrategia. Isto mostra que o jogo de comparar moedas nao possui
equilbrios de Nash em estrategias puras.

Existe uma maneira conveniente de se caracterizar equilbrios de


Nash atraves das func
oes de melhor resposta. De maneira informal,
a melhor resposta de um jogador para uma determinada escolha de
estrategias dos demais jogadores e o conjunto de estrategias do jo-
gador que maximizam o seu ganho quando os demais jogadores nao
mudam as suas escolhas. Mais precisamente, temos a seguinte

Defini
c
ao 2.6 (Func es de melhor resposta) A funcao de
o
melhor resposta do jogador gi e a aplicacao

MRi : Si 2Si

i i

i i
tdj
i i
2017/2/2
page 23
i i

[SEC. 2.2: SOLUC


OES
DE UM JOGO EM ESTRATEGIAS PURAS 23

denida por

MRi (si ) = argmaxsi Si ui (si , si )


= {si Si | si Si , ui (si , si ) ui (si , si )},

com si Si (aqui 2Si representa o conjunto das partes de Si ).


A funcao de melhor resposta do jogo e a aplicacao

MR : S 2S

denida por

MR(s) = (MR1 (s1 ), MR2 (s2 ), . . . , MRn (sn )),

com s S. Observacao: alguns autores usam as notacoes


MRi : Si Si e MRi : Si Si para representar a funcao
de melhor resposta MRi : Si 2Si .

Exemplo 2.7
(a) No dilema do prisioneiro (Exemplo 2.1), temos
MRAl : SBob SAl
confessar  {confessar}
negar  {confessar}

MRBob : SAl SBob


confessar  {confessar}
negar  {confessar}.

(b) Na batalha dos sexos (Exemplo 2.2), temos


MRHomem : SMulher SHomem
futebol  {futebol}
cinema  {cinema}

MRMulher : SHomem SMulher


futebol  {futebol}
cinema  {cinema}.

i i

i i
tdj
i i
2017/2/2
page 24
i i

24
[CAP. 2: JOGOS NA FORMA ESTRATEGICA

(c) No Exemplo 2.3, temos

MR1 (s21 ) = {s14 }, MR1 (s22 ) = {s12 },


MR1 (s23 ) = {s12 }, MR1 (s24 ) = {s13 },
MR2 (s11 ) = {s22 }, MR2 (s12 ) = {s22 },
MR2 (s13 ) = {s22 }, MR2 (s14 ) = {s24 }.

(d) No jogo de comparar moedas (Exemplo 2.6), temos

MR1 (s21 ) = {s11 }, MR1 (s22 ) = {s12 },


MR2 (s11 ) = {s22 }, MR2 (s12 ) = {s21 }.

A proxima proposicao e uma consequencia direta das denicoes


de equilbrio de Nash e funcoes de melhor resposta.

Proposi ao 2.1 s = (s1 , . . . , si , . . . , sn ) S e um equilbrio


c
de Nash em estrategias puras se, e somente se, si MRi (si )
para todo i = 1, . . . , n.

Observac o. Como vimos, nem sempre um jogo possui um equi-


a
lbrio de Nash em estrategias puras. Contudo, e possvel garantir
esta existencia para certos tipos de jogos com estruturas especiais.
O leitor interessado pode consultar os jogos descritos nos artigos [28,
61, 80, 94]. Para resultados quantitativos, veja [60].

2.2.3 Relac
oes entre domin
ancia e equilbrio de
Nash

Proposi c
ao 2.2 O processo de dominancia estrita iterada nao
pode eliminar um equilbrio de Nash ao simplicar um jogo.

Demonstrac ao: Lembramos que, em cada etapa do processo de eli-


minacao de estrategias estritamente dominadas, o conjunto de es-
trategias puras de algum jogador e substitudo por um subconjunto

i i

i i
tdj
i i
2017/2/2
page 25
i i

[SEC. 2.2: SOLUC


OES
DE UM JOGO EM ESTRATEGIAS PURAS 25

com menos elementos, obtido removendo-se as estrategias do jogador


que s
ao estritamente dominadas. Cada eliminacao gera um espaco de
estrategias puras com menos elementos o que, sucessivamente, sim-
plica o jogo original:

(1)
S = S1 Sn  S (1) = S1 Sn(1) 
(k)
 S (k) = S1 Sn(k) .

Com esta notacao, o enunciado da proposicao pode ser colocado as-


sim: se s S e um equilbrio de Nash, entao s S (k) .
A demonstracao ser a feita por contradicao: suponha, por absurdo,
que exista s = (s1 , . . . , sn ) S tal que s e um equilbrio de Nash,
mas s  S (k) . Isto signica que existe i tal que si Si mas
(l)

si  Si
(l+1) (0)
para algum l = 0, . . . , k 1 (se l = 0, dena Si = Si ).
Sem perda de generalidade, vamos supor que esta propriedade ocorre
pela primeira vez para o ndice i, isto e, si e a primeira estrategia do
perl de estrategias

s = (s1 , . . . , s(i1) , si , s(i+1) , . . . , sn )

que e eliminada por uma estrategia estritamente dominante. Sendo


assim, existe si Si tal que
(l)

ui (si , si ) < ui (si , si )

para todo si Si . Como si e a primeira estrategia a ser eliminada,


(l)

isto signica que si Si e, portanto,


(l)

ui (si , si ) < ui (si , si ).

Mas isto e um absurdo pois, por hipotese, s = (si , si ) e um


equilbrio de Nash.

Proposi c
ao 2.3 Se o processo de dominancia estrita iterada
deixa apenas um u nico perl de estrategias puras s , entao s
e o u
nico equilbrio de Nash do jogo.

i i

i i
tdj
i i
2017/2/2
page 26
i i

26
[CAP. 2: JOGOS NA FORMA ESTRATEGICA

Demonstrac
ao: Suponha que o processo de dominancia estrita iterada
gere uma cadeia de espacos de estrategias puras
(1)
S = S1 Sn  S (1) = S1 Sn(1) 
(k)
 S (k) = S1 Sn(k) ,

onde o u
ltimo conjunto da cadeia e unitario:

S (k) = S1 Sn(k) = {s } = {(s1 , . . . , si , . . . , sn )}.


(k)

Note que, em particular, s1 S1 , s2 S2 , . . . , sn Sn , para


(l) (l) (l)

todo l = 0, . . . , k. Vamos mostrar que, nesta situacao, s e o u


nico
equilbrio de Nash do jogo. De fato, basta mostrar que s e um
equilbrio de Nash, pois a unicidade e uma consequencia direta da
Proposicao 2.2. Suponha entao, por absurdo, que s nao seja um
equilbrio de Nash. Neste caso, devem existir ndice i e estrategia

i Si , com si = si , tais que
pura s[1] [1]

ui (si , si ) < ui (s[1]


i , si ).


e dado que s S para todo = 1, . . . n
(l)
i , si )  S
Dado que (s[1] (k)

e para todo l = 0, . . . , k, segue-se que a estrategia s[1] i e estritamente


dominada por alguma outra estrategia s[2] i S i . Segue-se entao que,

em particular, ui (s[1]
i , si ) < u (s
i i
[2]
, s i ) e, portanto,

ui (si , si ) < ui (s[1]


i , si ) < ui (si , si ).
[2]

Note que, por causa destas desigualdades, segue-se que s[2] i = si e


[1]

si = si . Como (si , si ) tambem nao pertence a S (k) , segue-se que a


[2] [2]

estrategia s[2]
i e estritamente dominada por uma outra estrategia s[3] i

Si . Sendo assim, ui (s[2]i , si ) < ui (si , si ) e, portanto,
[3]

ui (si , si ) < ui (s[1] [2] [3]


i , si ) < ui (si , si ) < ui (si , si ).

Como antes, destas desigualdades, segue-se que s[3] i = si , si = si e


[2] [3] [1]


si = si . Prosseguindo desta maneira, construiramos uma sequencia
[3]

innita (s[1] [2] [3] [r]


i , si , si , . . . , si , . . .) de estrat
egias puras distintas do jo-
gador gi satisfazendo as desigualdades

ui (si , si ) < ui (s[1]


i , si ) < < ui (si , si ) < .
[r]

i i

i i
tdj
i i
2017/2/2
page 27
i i


[SEC. 2.3: ESTRATEGIAS MISTAS 27

Mas isto e um absurdo, pois Si e um conjunto nito.

A recproca da Proposicao 2.3 e falsa, isto e, mesmo que o jogo


tenha um u nico equilbrio de Nash, ele n
ao e necessariamente obtido a
partir do processo de dominancia estrita iterada. O jogo cuja matriz
de payos e

g2
s21 s22 s23
s11 (1, +1) (+1, 1) (1, +1)

g1 s12 (+1, 1) (1, +1) (+1, 1)

s13 (1, +1) (+1, 1) (+5, +5)

fornece um contra-exemplo: s = (s13 , s23 ) e o u nico equilbrio de


Nash do jogo, mas nao existem estrategias estritamente dominadas.
A Proposicao 2.2 e falsa se trocarmos domin ancia estrita por do-
minancia fraca, isto e, o processo de dominancia fraca iterada pode
eliminar um equilbrio de Nash (veja o exerccio [10] na pagina 58
para um contra-exemplo). Se o processo de dominancia fraca iterada
reduz o jogo para apenas um u nico perl de estrategias (como na
Proposic
ao 2.3), entao este perl e obrigatoriamente um equilbrio de
Nash, contudo, ele nao e necessariamente o u nico equilbrio de Nash
do jogo.

2.3 Estrat
egias mistas
Como vimos no jogo de comparar moedas do Exemplo 2.6, existem
jogos que nao possuem equilbrios de Nash em estrategias puras. Uma
alternativa para estes casos e a de considerar o jogo do ponto de vista
probabilstico, isto e, ao inves de escolher um perl de estrategias
puras, o jogador deve escolher uma distribuic ao de probabilidade sobre
suas estrategias puras.
Uma estrategia mista pi para o jogador gi G e uma distribuicao
de probabilidades sobre o conjunto Si de estrategias puras do jogador,

i i

i i
tdj
i i
2017/2/2
page 28
i i

28
[CAP. 2: JOGOS NA FORMA ESTRATEGICA

isto e, pi e um elemento do conjunto


 mi


mi = (x1 , . . . , xmi ) Rmi | x1 0, . . . , xmi 0 e xk = 1 .
k=1

Assim, se pi = (pi1 , pi2 , . . . , pimi ), entao


mi

pi1 0, pi2 0, ..., pimi 0 e pik = 1.
k=1

Note que cada mi e um conjunto compacto e convexo. Nas


Figuras 2.1 e 2.2 temos os desenhos de 2 e 3 , respectivamente. Os
pontos extremos (vertices) de mi , isto e, os pontos da forma

e1 = (1, 0, . . . , 0, 0), e2 = (0, 1, . . . , 0, 0), . . . , emi = (0, 0, . . . , 0, 1)

dao, respectivamente, probabilidade 1 a`s estrategias puras si1 , si2 ,


. . . , simi . Desta maneira, podemos considerar a distribuicao de pro-
babilidade ek como a estrategia mista que representa a estrategia
pura sik do jogador gi .

x2
1

0 1 x1

 
Figura 2.1: 2 = (x1 , x2 ) R2 | x1 0, x2 0 e x1 + x2 = 1 .

i i

i i
tdj
i i
2017/2/2
page 29
i i


[SEC. 2.3: ESTRATEGIAS MISTAS 29

x3

0 1 x2

1
x1


Figura 2.2: 3 = (x1 , x2 , x3 ) R3 | x1 0, x2 0, x3 0 e x1 +
x2 + x3 = 1}.

O espaco de todos os pers de estrategia mista e o produto car-


tesiano
= m1 m2 mn ,
denominado espaco de estrategias mistas. Como o produto cartesiano
de conjuntos compactos e convexos e compacto e convexo, vemos que
e compacto e convexo.
Um vetor p e denominado um perl de estrategias mistas.
Como no caso de estrategias puras, usaremos a notacao pi para
representar as estrategias mistas de todos os jogadores, excluindo-se
a do jogador gi . Desta maneira, escreveremos

(pi , pi )

para representar p = (p1 , . . . , pi , . . . , pn ). Como a estrategia pura sik


pode ser identicada com a distribuicao de probabilidades que da
peso 1 a sik e peso 0 a`s demais estrategias do jogador gi , usaremos

(sik , pi )

i i

i i
tdj
i i
2017/2/2
page 30
i i

30
[CAP. 2: JOGOS NA FORMA ESTRATEGICA

como uma notacao alternativa para o perl de estrategias mistas


(ek , pi ). Do mesmo modo, usaremos
(pi , si )
para indicar o perl de estrategias mistas onde o jogador gi escolhe
a distribuicao de probabilidades pi e os demais jogadores escolhem
ao peso 1 `as estrategias puras em si .
distribuicoes que d
Cada perl de estrategias mistas p = (p1 , . . . , pn ) determina
um payo esperado (utilidade esperada), uma media dos payos pon-
derada pelas distribuicoes de probabilidades p1 , . . . , pn . Mais preci-
samente, se
p = (p1 , p2 , . . . , pn )
= (p11 , p12 , . . . , p1m1 ; p21 , p22 , . . . , p2m2 ; . . . ; pn1 , pn2 , . . . , pnmn ),




p1 p2 pn

entao
m1 
 m2 mn

ui (p) = p1j1 p2j2 pnjn ui (s1j1 , s2j2 , . . . , snjn ).
j1 =1 j2 =1 jn =1
(2.1)
Cuidado com o abuso de notacao: estamos usando ui para representar
a funcao utilidade tanto em estrategias puras quanto em estrategias
mistas.
Como exemplo, considere o jogo de comparar moedas na pagi-
na 22. Se g1 escolhe a distribuicao de probabilidade p1 = (1/4, 3/4)
e g2 escolhe a distribuicao de probabilidade p2 = (1/3, 2/3), entao
os payos esperados associados ao perl de estrategias mistas p =
(p1 , p2 ) = (1/4, 3/4; 1/3, 2/3) sao dados por

2 
2
u1 (p) = p1j1 p2j2 u1 (s1j1 , s2j2 )
j1 =1 j2 =1
= p11 p21 u1 (s11 , s21 ) + p11 p22 u1 (s11 , s22 ) +
p12 p21 u1 (s12 , s21 ) + p12 p22 u1 (s12 , s22 )
1 1 1 2 3 1 3 2
= (+1) + (1) + (1) + (+1)
4 3 4 3 4 3 4 3
1
= +
6

i i

i i
tdj
i i
2017/2/2
page 31
i i

[SEC. 2.4: SOLUC


OES
DE UM JOGO EM ESTRATEGIAS MISTAS 31

e, analogamente,


2 
2
u2 (p) = p1j1 p2j2 u2 (s1j1 , s2j2 )
j1 =1 j2 =1
= p11 p21 u2 (s11 , s21 ) + p11 p22 u2 (s11 , s22 ) +
p12 p21 u2 (s12 , s21 ) + p12 p22 u2 (s12 , s22 )
1 1 1 2 3 1 3 2
= (1) + (+1) + (+1) + (1)
4 3 4 3 4 3 4 3
1
= .
6

Observac a o. Se p = (pi , pi ) , entao a funcao x  ui (x, pi )


preserva combinaco es convexas. Mais precisamente, se x1 , . . . , xr
mi e 1 , . . . , r s
ao escalares n ao-negativos com rk=1 k = 1, entao
r  r
 

ui k xk , pi = k ui (xk , pi ). (2.2)
k=1 k=1

Em particular, se
mi

pi = (pi1 , . . . , pimi ) = pik ek , (2.3)
k=1

com ek o k-esimo vetor da base can onica de Rmi , entao


m  mi
 i 

ui (p ) = ui (pi , pi ) = ui pik ek , pi = pik ui (ek , pi ).
k=1 k=1
(2.4)

2.4 Solu
c
oes de um jogo em estrat
egias
mistas
Todos os criterios b
asicos para solucoes de jogos em estrategias
puras podem ser estendidos para estrategias mistas.

i i

i i
tdj
i i
2017/2/2
page 32
i i

32
[CAP. 2: JOGOS NA FORMA ESTRATEGICA

2.4.1 Domin
ancia em estrat
egias mistas

Definic
ao 2.7 (Estrate gia Mista Estritamente Domi-
nada) Dizemos que uma estrategia mista pi mi do joga-
dor gi G e estritamente dominada pela estrategia pi mi
se, independentemente das escolhas de distribuicoes de proba-
bilidade dos demais jogadores, o jogador gi ganha mais esco-
lhendo pi do que pi , isto e, se

ui (pi , pi ) > ui (pi , pi ),

para todo pi i = m1 mi1 mi+1 mn .

Como os payos ui (pi , pi ) e ui (pi , pi ) sao, respectivamente,


oes convexas dos payos ui (pi , si ) e ui (pi , si ),
combinac
segue-se que a condicao acima e equivalente a

ui (pi , si ) > ui (pi , si ),

para todos pers de estrategias puras si Si .

Exemplo 2.8 ([30], p


agina 21) Considere o jogo com a seguinte
matriz de payos:

g2
s21 s22
s11 (5, 3) (0, 0)
.
g1 s12 (0, 0) (5, 3)

s13 (2, 1) (2, 1)

A estrategia mista p1 = (0, 0, 1) 3 do jogador g1 e estritamente

i i

i i
tdj
i i
2017/2/2
page 33
i i

[SEC. 2.4: SOLUC


OES
DE UM JOGO EM ESTRATEGIAS MISTAS 33

dominada pela estrategia mista p1 = (1/2, 1/2, 0) 3 , pois


 
1 1 5 5 5
u1 (p1 , p2 ) = u1 , , 0; p21 , p22 = p21 + p22 =
2 2 2 2 2

 

>
u1 (p1 , p2 ) = u1 0 , 0 , 1; p21 , p22 = 2 p21 + 2 p22 = 2

para todo p2 = (p21 , p22 ) 2 . Como p1 = (0, 0, 1) representa


a estrategia pura s13 do jogador g1 , este exemplo tambem mostra
que uma estrategia pura pode nao ser dominada por nenhuma outra
estrategia puras mas, ainda sim, ser dominada por uma estrategia
mista.

Exemplo 2.9 ([31], p agina 7) Uma estrategia mista que atribui


probabilidade positiva para uma estrategia pura estritamente domi-
nada tambem e estritamente dominada (Exerccio [13]). Contudo,
uma estrategia mista pode ser estritamente dominada mesmo que ela
atribua probabilidades positivas apenas para as estrategias puras que
n
ao sao nem mesmo fracamente dominadas. Considere, por exemplo,
o jogo com a seguinte matriz de payos:

g2
s21 s22
s11 (5, 3) (2, 0)
.
g1 s12 (2, 0) (5, 3)

s13 (4, 1) (4, 1)

As estrategias puras s11 e s12 n ao s


ao fracamente dominadas, mas
a estrategia mista p1 = (1/2, 1/2, 0) e estritamente dominada pela
estrategia mista p1 = (0, 0, 1) (que corresponde a` estrategia pura s13 ),

i i

i i
tdj
i i
2017/2/2
page 34
i i

34
[CAP. 2: JOGOS NA FORMA ESTRATEGICA

pois
 
u1 (p1 , p2 ) = u1 0 , 0 , 1; p21 , p22 = 4 p21 + 4 p22 = 4

>
 
1 1 7 7 7
u1 (p1 , p2 ) = u1 , , 0; p21 , p22 = p21 + p22 =
2 2 2 2 2

para todo p2 = (p21 , p22 ) 2 .

A denicao de domin
ancia estrita iterada para estrategias mistas que
daremos aqui segue a linha proposta pelas referencias [26, 31, 74].
Abordagens alternativas podem ser encontradas em [01, 15].

Definic
ao 2.8 (Dominancia Estrita Iterada em Estra-
tegias Mistas) Sejam Si(0) = Si e (0)
mi = mi . Dena, recur-
sivamente,

(n) (n1)
Si = {s Si | pi (n1)
mi tal que
(n1)
si Si , ui (pi , si ) > ui (s, si )}

mi = {pi = (pi1 , . . . , pimi ) mi |


(n)
(n)
k = 1, . . . , mi , pik > 0 somente se sik Si }.

A intersecao


Si =
(n)
Si
n=0

e o conjunto de estrategias puras que sobrevivem a remocao


iterada de estrategias estritamente dominadas e

i i

i i
tdj
i i
2017/2/2
page 35
i i

[SEC. 2.4: SOLUC


OES
DE UM JOGO EM ESTRATEGIAS MISTAS 35


mi = {pi mi | pi mi

tal que si Si , ui (pi , si ) > ui (pi , si )}


()

e o conjunto de todas as estrategias mistas do jogador gi que


sobreviveram a tecnica de dominancia estrita iterada.

Note que Si(n) e o conjunto de estrategias puras em Si(n1) que n


ao sao
estritamente dominadas pelas estrategias mistas em (n1)mi e que (n)
mi
e o conjunto de estrategias mistas que da probabilidades positivas
apenas para as estrategias puras em Si(n) .

Defini
c
ao 2.9 (Equilbrio de Estrat egia Estritamente
Dominante) Se, no processo de dominancia estrita iterada, o
conjunto S = S1 Sn e unitario, isto e, se

S = {s },

entao dizemos que s e um equilbrio de estrategia estritamente


dominante.

Como no caso de estrategias puras, e possvel mostrar que os con-


juntos S = S1 Sn e =
m1 mn n
ao depen-
dem da ordem em que as estrategias estritamente dominadas s ao
removidas. Nao apresentaremos a demonstracao deste fato aqui.
O leitor interessado poder a encontr
a-la (bem como as denicoes e
resultados sobre estrategias mistas fracamente dominadas) nas re-
ferencias [01, 15, 26, 55].

2.4.2 Equilbrio de Nash em estrat


egias mistas

Definic
ao 2.10 (Equilbrio de Nash) Dizemos que um per-
l de estrategias mistas

i i

i i
tdj
i i
2017/2/2
page 36
i i

36
[CAP. 2: JOGOS NA FORMA ESTRATEGICA

p = (p1 , p2 , . . . , pn ) = m1 m2 mn
e um equilbrio de Nash se

ui (pi , pi ) ui (p, pi )

para todo p mi , isto e, nenhum jogador sente motivacao


de trocar a sua estrategia mista se os demais jogadores nao o
zerem.

Exemplo 2.10
(a) No dilema do prisioneiro (Exemplo 2.1), o perl de estrategias
mistas
p = (p1 , p2 ) = (1, 0; 1, 0)
e um equilbrio de Nash, pois

u1 (p1 , p2 ) = u1 (p11 , p12 ; 1, 0) = 5 p11 10


5 = u1 (1, 0; 1, 0) = u1 (p1 , p2 )

para todo p1 = (p11 , p12 ) 2 e

u2 (p1 , p2 ) = u2 (1, 0; p21 , p22 ) = 5 p21 10


5 = u2 (1, 0; 1, 0) = u2 (p1 , p2 )

para todo p2 = (p21 , p22 ) 2 . Observe que este equilbrio


corresponde ao equilbrio em estrategias puras

s = (confessar, confessar).

Mostraremos mais adiante que este e o u


nico equilbrio de Nash
em estrategias mistas do jogo.
(b) Na batalha dos sexos (Exemplo 2.2), os equilbrios de Nash em
estrategias mistas sao

(1, 0; 1, 0), (0, 1; 0, 1) e (2/3, 1/3; 1/3, 2/3).

i i

i i
tdj
i i
2017/2/2
page 37
i i

[SEC. 2.4: SOLUC


OES
DE UM JOGO EM ESTRATEGIAS MISTAS 37

Os dois primeiros pers de estrategias mistas correspondem a`s


estrategias puras (futebol, futebol) e (cinema, cinema), respec-
tivamente. Mostraremos mais adiante que estes s ao os u
nicos
equilbrios de Nash em estrategias mistas do jogo.
(c) No Exemplo 2.3, o u
nico equilbrio de Nash em estrategia mista
e o ponto
(0, 1, 0, 0; 0, 1, 0, 0)
que corresponde ao equilbrio de Nash (s12 , s22 ) em estrategias
puras.
(d) No jogo de comparar moedas do Exemplo 2.6, o u
nico equilbrio
de Nash em estrategias mistas e o ponto
(1/2, 1/2; 1/2, 1/2).

Como no caso de estrategias puras, podemos caracterizar equil-


brios de Nash em estrategias mistas atraves das funcoes de melhor
resposta. Considere um jogo com espaco de estrategias mistas =
m1 mi mn . No que se segue, usaremos as seguintes
notac
oes:
(Si ) = mi e (Si ) = m1 mi1 mi+1 mn .

Defini cao 2.11 (Func


o es de melhor resposta em estra-
egias mistas) A funcao de melhor resposta do jogador gi e a
t
aplicacao
MRi : (Si ) 2(Si )
denida por MRi (pi ) = argmaxpi (Si ) ui (pi , pi ), isto e,

MRi (pi )
=

{pi (Si ) | pi (Si ), ui (pi , pi ) ui (pi , pi )},

com pi (Si ). A funcao de melhor resposta do jogo e a


aplicacao
MR : 2

i i

i i
tdj
i i
2017/2/2
page 38
i i

38
[CAP. 2: JOGOS NA FORMA ESTRATEGICA

denida por

MR(p) = (MR1 (p1 ), MR2 (p2 ), . . . , MRn (pn )),

com p .

Note que, como (Si ) e um conjunto compacto n ao-vazio e a


ao pi  ui (pi , pi ) e contnua, podemos usar o teorema de Wei-
func
erstrass para garantir que MRi (pi ) = argmaxpi (Si ) ui (pi , pi ) e
um conjunto n ao-vazio para todo pi (Si ).
A proxima proposicao e uma consequencia direta das denicoes
de equilbrio de Nash e funcoes de melhor resposta em estrategias
mistas.

Proposi ao 2.4 p = (p1 , . . . , pi , . . . , pn ) e um equilbrio


c
de Nash em estrategias mistas se, e somente se, pi MRi (pi )
para todo i = 1, . . . , n, isto e, p MR(p ).

Exemplo 2.11 Suponha que, na batalha dos sexos (Exemplo 2.2),


a mulher escolha a estrategia mista p2 = (1/2, 1/2). Qual e a melhor
resposta do homem a esta estrategia da mulher? Para responder a
esta pergunta, observe inicialmente que

uHomem(p1 , p2 ) = uHomem (p11 , p12 ; p21 , p22 )


= p11 p21 uHomem (futebol, futebol) +
p11 p22 uHomem (futebol, cinema) +
p12 p21 uHomem (cinema, futebol) +
p12 p22 uHomem (cinema, cinema)
= 10 p11 p21 + 5 p12 p22

e, portanto, uHomem (p11 , p12 ; 1/2, 1/2) = 5 p11 + (5/2) p12 . Desta
maneira,

MRHomem (1/2, 1/2) = argmax(p11 ,p12 )2 (5 p11 + (5/2) p12 ).

i i

i i
tdj
i i
2017/2/2
page 39
i i

[SEC. 2.4: SOLUC


OES
DE UM JOGO EM ESTRATEGIAS MISTAS 39

Segue-se que a melhor resposta do homem a` estrategia mista p2 =


(1/2, 1/2) da mulher e obtida resolvendo-se o seguinte problema de
otimizacao:

maximizar 5 p11 + (5/2) p12


sujeito a p11 + p12 = 1,
p11 0,
p12 0,

ao e (p11 , p12 ) = (1, 0). Sendo assim, MRHomem (1/2, 1/2) =


cuja soluc
{(1, 0)}.

No caso de jogos com apenas dois jogadores, cada um com apenas


duas estrategias puras, e possvel escrever as estrategias mistas de
uma maneira mais simplicada:

2 = {(p, 1 p) R2 | 0 p 1},

isto e, cada elemento de 2 pode ser identicado com um numero real


no intervalo [0, 1]. Com isto, as funcoes de melhor resposta podem
ser reescritas de forma a depender de apenas de um n umero real. Por
exemplo, se o homem escolhe uma estrategia mista (p, 1 p) 2 ,
qual e a melhor resposta da mulher a esta estrategia do homem?
Escrevendo as estrategias mistas da mulher na forma (q, 1 q) 2 ,
vemos que

uMulher(p, 1 p; q, 1 q) = 15 pq + 10 10 q 10 p
= 5 (3 p 2) q + 10 (1 p).

Sendo assim,

MRMulher(p) = argmax(q,1q)2 (5 (3 p 2) q + 10 (1 p))


= argmaxq[0,1] (5 (3 p 2) q + 10 (1 p)),

onde, por simplicidade, estamos escrevendo MRMulher(p) no lugar


de MRMulher (p, 1 p). Assim, dada a escolha de p [0, 1] do homem,
a mulher quer encontrar os valores de q [0, 1] que maximizam o valor
de sua utilidade uMulher = 5 (3 p 2) q + 10 (1 p). Se p [0, 2/3),
entao 3 p 2 < 0 e, para maximizar a sua utilidade, a mulher devera

i i

i i
tdj
i i
2017/2/2
page 40
i i

40
[CAP. 2: JOGOS NA FORMA ESTRATEGICA

escolher q = 0. Se p = 2/3, entao 3 p 2 = 0 e, portanto, a utilidade


uMulher = 10 (1 p) da mulher n ao dependera de q. Neste caso, a
mulher poder a escolher qualquer valor de q em [0, 1]. Se p (2/3, 1],
entao 3 p 2 > 0 e, para maximizar a sua utilidade, a mulher dever a
escolher q = 1. Mostramos ent ao que

{0}, se p [0, 2/3),
MRMulher (p) = [0, 1], se p = 2/3,

{1}, se p (2/3, 1].

Esta func
ao de melhor resposta pode ser representada gracamente,
como mostra a Figura 2.3.

(Mulher) q

(Futebol) 1

(Cinema)
0 2/3 1 p (Homem)

(Cinema) (Futebol)

Figura 2.3: Representacao gr


aca da funcao de melhor resposta da
mulher no jogo da batalha dos sexos.

Do mesmo modo, se a mulher escolhe uma estrategia mista (q, 1q)


2 , ent
ao

uHomem (p, 1 p; q, 1 q) = 15 pq + 5 5 q 5 p
= 5 (3 q 1) p + 5 (1 q),

de modo que

MRHomem (q) = argmax(p,1p)2 (5 (3 q 1) p + 5 (1 q))


= argmaxp[0,1] (5 (3 q 1) p + 5 (1 q)).

i i

i i
tdj
i i
2017/2/2
page 41
i i

[SEC. 2.4: SOLUC


OES
DE UM JOGO EM ESTRATEGIAS MISTAS 41

Assim, dada a escolha de q [0, 1] da mulher, o homem quer en-


contrar os valores de p [0, 1] que maximizam o valor de sua utili-
dade uHomem = 5 (3 q 1) p + 5 (1 q). Se q [0, 1/3), entao 3 q
1 < 0 e, para maximizar a sua utilidade, o homem dever a esco-
lher p = 0. Se q = 1/3, ent ao 3 q 1 = 0 e, portanto, a utilidade
uHomem = 5 (1 q) do homem n ao dependera de p. Neste caso, o
homem poder a escolher qualquer valor de p em [0, 1]. Se q (1/3, 1],
entao 3 q 1 > 0 e, para maximizar a sua utilidade, o homem dever a
escolher p = 1. Mostramos ent ao que

{0}, se q [0, 1/3),
MRHomem (q) = [0, 1], se q = 1/3,

{1}, se q (1/3, 1].

Esta funcao de melhor resposta pode ser representada gracamente,


como mostra a Figura 2.4.

(Homem) p

(Futebol) 1

(Cinema)
0 1/3 1 q (Mulher)

(Cinema) (Futebol)

Figura 2.4: Representacao gr


aca da funcao de melhor resposta do
homem no jogo da batalha dos sexos.

Agora, pela Proposicao 2.4, segue-se que um perl de estrategias


mistas (p , 1 p ; q , 1 q ) e um equilbrio de Nash se, e somente se,
q MRMulher (p ) e p MRHomem (q ). Desta maneira, os valores
de p e q que geram equilbrios de Nash correspondem aos pontos
de intersecao entre as representacoes gr acas das funcoes de melhor

i i

i i
tdj
i i
2017/2/2
page 42
i i

42
[CAP. 2: JOGOS NA FORMA ESTRATEGICA

resposta da mulher e do homem, quando representadas em um mesmo


sistema de eixos, como ilustra a Figura 2.5.

(Mulher) q

(Futebol) 1

1/3

(Cinema)
0 2/3 1 p (Homem)

(Cinema) (Futebol)

Figura 2.5: Calculando os equilbrios de Nash usando as representa-


coes gr
acas das duas funcoes de melhor resposta.

Vemos, portanto, que a batalha dos sexos possui apenas 3 equilbrios


de Nash em estrategias mistas:

(0, 1; 0, 1), (2/3, 1/3; 1/3, 2/3) e (1, 0; 1, 0),

que correspondem, respectivamente, aos tres u nicos pontos de inter-


secao (p , q ) = (0, 0), (p , q ) = (2/3, 1/3) e (p , q ) = (1, 1) das
duas representacoes gr acas.

Exemplo 2.12 ([31], p agina 17) (O jogo da inspec o) O che-


a
fe de uma empresa de computacao descona que seu operador de
computadores esta usando o tempo de servico para bater papo
na internet. Se o operador trabalha corretamente, ele gasta g em
esforco e produz um lucro bruto de v unidades para a empresa. O
chefe, por sua vez, pode scalizar ou n ao o trabalho do operador.
Fiscalizar custa h unidades para a empresa. Se o operador for pego
batendo papo na internet, ele perde o seu salario de w unidades
(o chefe nao pode condicionar o valor do sal
ario w ao valor do lucro
bruto v). Para limitar o n
umero de casos a considerar, vamos assumir

i i

i i
tdj
i i
2017/2/2
page 43
i i

[SEC. 2.4: SOLUC


OES
DE UM JOGO EM ESTRATEGIAS MISTAS 43

que g > h > 0 e que w > g. Os dois jogadores escolhem suas


estrategias simultaneamente (em particular, ao decidir se vai scalizar
ou nao, o chefe nao sabe se o empregado decidiu trabalhar ou decidiu
bater papo na internet). Neste contexto, o jogo da inspecao tem a
matriz de payos indicada abaixo.
empregado
nao trabalhar trabalhar
scalizar (h, 0) (v w h, w g)
chefe

n
ao scalizar (w, w) (v w, w g)

Observe que este jogo n ao possui equilbrio de Nash em estrategias


puras e, como ele deve se repetir em cada dia u til de trabalho, nao e
sensato escolher sempre a mesma estrategia pura para todos os dias.
A solucao, neste caso, e escolher entre as estrategias puras a cada dia
seguindo uma distribuicao de probabilidades, isto e, atraves de es-
trategias mistas. Como as funcoes de melhor resposta do empregado
e do chefe s ao dadas, respectivamente, por

MREmpregado (p) = argmaxq[0,1] ((wp + g) q + w g)



{1}, se p [0, g/w),
= [0, 1], se p = g/w,

{0}, se p (g/w, 1],
MRChefe (q) = argmaxp[0,1] ((+wq h) p + v (1 q) w)

{0}, se q [0, h/w),
= [0, 1], se q = h/w,

{1}, se q (h/w, 1],

segue-se que o (
unico) equilbrio de Nash em estrategias mistas e
obtido tomando-se p = g/w e q = h/w. Se, por exemplo, v = 5,
w = 4, g = 3 e h = 2, ent
ao

(p , 1 p ; q , 1 q ) = (3/4, 1/4; 1/2, 1/2).

Isto signica que o chefe deve escolher sua estrategia de acordo com
um gerador de n umeros aleatorios com distribuicao de probabili-
dade (3/4, 1/4) e o operador deve escolher sua estrategia de acordo

i i

i i
tdj
i i
2017/2/2
page 44
i i

44
[CAP. 2: JOGOS NA FORMA ESTRATEGICA

com um gerador de n umeros aleatorios com distribuicao de probabili-


dade (1/2, 1/2). Isto pode ser feito, por exemplo, com as duas rodas
da fortuna da Figura 2.6.

Fiscalizar Trabalhar

No fiscalizar No trabalhar

chefe empregado

Figura 2.6: Distribuicoes de probabilidade que constituem um equil-


brio de Nash para o jogo do Exemplo 2.12.

A partir deste resultado, podemos calcular o valor otimo de contrato


do empregado, isto e, o valor de w que maximiza o payo esperado
do chefe:
 
h
uChefe (w) = (+wq h) p + v (1 q ) w) = v 1 w.
w

por exemplo, vh > g, entao este valor otimo e dado por w =
Se,
vh (note que uChefe (w ) = 0 e uChefe (w) 0 para w > 0).

Jogos deste tipo tem sido usados para se estudar temas como controle
de armas ([03, 10, 83]), prevencao de crimes ([04]) e incentivos no
trabalho ([53]).

Como vimos no jogo de comparar moedas no Exemplo 2.6, existem


jogos que nao possuem equilbrios de Nash em estrategias puras e, ate
agora, todos os jogos apresentados em nossos exemplos possuem pelo
menos um equilbrio de Nash em estrategias mistas. Uma pergunta
natural e se a existencia de equilbrios de Nash em estrategias mistas
e um resultado geral ou nao. A resposta e sim! No proximo captulo
apresentaremos e demonstraremos o teorema de equilbrio de Nash,

i i

i i
tdj
i i
2017/2/2
page 45
i i

[SEC. 2.4: SOLUC


OES
DE UM JOGO EM ESTRATEGIAS MISTAS 45

que garante a existencia de equilbrios em estrategias mistas para


jogos nitos.

2.4.3 Relac
oes entre domin
ancia e equilbrio de
Nash
As Proposicoes 2.2 e 2.3 para estrategias puras continuam v alidas
para estrategias mistas: (1) o processo de dominancia estrita ite-
rada em estrategias mistas nao pode eliminar um equilbrio de Nash
e (2) se o processo de dominancia estrita iterada em estrategias mistas
deixa apenas um u nico perl de estrategias, entao este perl e um
equilbrio de Nash do jogo. N ao apresentaremos as demonstracoes
destes resultados aqui. O leitor interessado poder a encontra-las nas
referencias [15, 26].

2.4.4 Como interpretar estrat


egias mistas?
Existe muita controversia sobre as interpretacoes e usos de es-
trategias mistas ([02, 12, 17, 57, 74, 77, 81, 73, 92, 93]). Aumann,
por exemplo, em [02], arma que
Mixed strategy equilibria have always been intuitively
problematic because they are not strict: a player will not
lose if he abandons the randomization and uses instead
any arbitrary one of the pure strategy components of the
randomization.
(veja as Equacoes 4.1 na pagina 81) e, segundo Rardner e Roshen-
tal ([76]),
One of the reasons why game-theoretic ideas have not
found more widespread application is that randomization,
which plays a major role in game theory, seems to have
limited appeal in many practical situations.
Ainda, segundo Rubinstein ([81]),
The reason for the criticism is that the naive interpreta-
tion of a mixed strategy as an action which is conditional
on the outcome of a lottery executed by the player before

i i

i i
tdj
i i
2017/2/2
page 46
i i

46
[CAP. 2: JOGOS NA FORMA ESTRATEGICA

the game, goes against our intuition. We are reluctant to


believe that our decisions are made at random. We prefer
to be able to point to a reason for each action we take.
Outside of Las Vegas we do not spin roulettes.
De fato, testes experimentais recentes mostraram que jogadores nao
seguem a estrategia mista prevista pela teoria, mesmo quando o jogo
possui um u nico equilbrio de Nash em estrategias mistas ([57]).
Existem tambem certas analises feitas com estrategias mistas que
produzem resultados n ao-intuitivos. Considere, por exemplo, a se-
guinte situac
ao. Um contribuinte C deve decidir se vai ou nao sonegar
imposto, sabendo que existe um scal F que pode ou n ao scaliza-lo.
Na matriz de payos abaixo, vamos assumir que valem as seguintes
desigualdades
(1) c21 > c11 : o contribuinte C prefere nao sonegar se souber que
o scal F ira scalizar,
(2) c12 > c22 : o contribuinte C prefere sonegar se souber que o s-
cal F n
ao ira scalizar,
(3) f11 > f12 : o scal F prefere scalizar se souber que o contribuin-
te C ir
a sonegar e
(4) f22 > f21 : o scal F prefere nao scalizar se souber que o contri-
buinte C n ao ir
a sonegar.
Voce pode pensar que os cij sao n
umeros negativos que representam
o quanto ser
a debitado de C pelo pagamento de imposto e que os fij
s
ao numeros positivos que representam bonus salariais de F .
F
scalizar nao scalizar
sonegar (c11 , f11 ) (c12 , f12 ) .
C
n
ao sonegar (c21 , f21 ) (c22 , f22 )

Usando a tecnica descrita no Exemplo 2.11, vemos que o u nico equi-


lbrio de Nash do jogo e dado por (pC , 1 pC ; pF , 1 pF ), onde
 
f22 f21 c22 c12
(pC , pF ) = , .
f22 f21 f12 + f11 c22 c12 c21 + c11

i i

i i
tdj
i i
2017/2/2
page 47
i i

[SEC. 2.4: SOLUC


OES
DE UM JOGO EM ESTRATEGIAS MISTAS 47

Aqui, pC representa a probabilidade com que C decide sonegar e pF


representa a probabilidade com que F decide scalizar. Dois resulta-
dos n oes para pC e pF :
ao-intuitivos advem destas express
(a) Se a receita federal decide aumentar a multa de sonegacao, isto
uencia pC de
e, se ela resolve diminuir o valor de c11 , entao a freq
sonegacoes n
ao muda e a freq uencia de scalizacoes pF diminui.
(b) Se a receita federal decide aumentar o bonus salarial para os s-
cais que identicam contribuintes sonegadores, isto e, se ela resol-
uencia de scalizacoes pF
ver aumentar o valor de f11 , entao a freq
n
ao muda e a freq uencia de sonegacoes pC diminui.
Isto acontece porque alteracoes introduzidas nos payos de um jo-
gador afeta apenas a express ao para o perl de estrategias mistas
do equilbrio de Nash do outro jogador (Proposicao da Irrelevancia
do Payo [43]).
Existem, contudo, interpretacoes que sao mais robustas. Uma de-
las e imaginar o jogo como uma interacao entre n populacoes nume-
rosas: cada partida ocorre depois que n jogadores sao selecionados
de maneira aleatoria nestas populacoes. As probabilidades piji no
perl de estrategias mistas pi do jogador gi sao interpretadas como
as frequencias dos jogadores que escolheram a estrategia pura siji na
i-esima populacao. Outra interpretacao e devida a Harsanyi. Apre-
sentamos aqui o abstract de seu artigo [39]:
Equilibrium points in mixed strategies seem to be unsta-
ble, because any player can deviate without penalty from
his equilibrium strategy even if he expects all other players
to stick to theirs. This paper proposes a model under
which most mixed-strategy equilibrium points have full
stability. It is argued that for any game the players
uncertainty about the other players exact payos can be
modeled as a disturbed game , i.e., as a game with small
random uctuations in the payos. Any equilibrium point
in , whether it is in pure or in mixed strategies, can al-
most always be obtained as a limit of a pure-strategy
equilibrium point in the corresponding disturbed game
when all disturbances go to zero. Accordingly, mixed-
strategy equilibrium points are stable even though the

i i

i i
tdj
i i
2017/2/2
page 48
i i

48
[CAP. 2: JOGOS NA FORMA ESTRATEGICA

players may make no deliberate eort to use their pure


strategies with the probability weights prescribed by their
mixed equilibrium strategies because the random uc-
tuations in their payos will make them use their pure
strategies approximately with the prescribed probabili-
ties.

Nao nos aprofundaremos neste tema polemico. O leitor interessado


pode consultar as referencias citadas no incio desta subsecao e, em
especial, [81] e a Sec
ao 3.2 de [74].

2.5 Jogos infinitos


Os jogos que estudamos ate agora s ao nitos, isto e, eles possuem
um n umero nito de jogadores, cada um com um n umero nito de es-
trategias puras. Contudo, existem situacoes que, para serem modela-
das, necessitam de um n umero innito de jogadores ou de um n umero
innito de estrategias ([06, 44, 62]). Jogos em estrategias mistas, por
exemplo, podem ser pensados como jogos com um n umero nito de
jogadores e com um n umero innito de estrategias (as innitas dis-
tribuic
oes de probabilidade que cada jogador pode escolher). Vamos
nos concentrar no caso de jogos com um n umero nito de jogadores e
um n umero innito de estrategias puras (o caso de estrategias mistas
requer como pre-requisito teoria da medida e nao ser a tratado aqui).
As denicoes de estrategias estritamente dominadas, estrategias fra-
camente dominadas e equilbrios de Nash s ao analogas ao caso nito,
com a diferenca de que, agora, os conjuntos Si podem ser innitos.

Defini c
ao 2.12 (Estrategia Pura Estritamente Domi-
nada) Dizemos que uma estrategia pura si Si do jogador gi
G e estritamente dominada pela estrategia si Si se

ui (si , si ) > ui (si , si ),

para todo si Si .

i i

i i
tdj
i i
2017/2/2
page 49
i i

[SEC. 2.5: JOGOS INFINITOS 49

Definic
ao 2.13 (Estrat egia Pura Fracamente Domi-
nada) Dizemos que uma estrategia pura si Si do joga-
dor gi G e fracamente dominada pela estrategia si Si se

ui (si , si ) ui (si , si ),

para todo si Si e, pelo menos para algum si Si ,

ui (si , si ) > ui (si , si ).

Definic
ao 2.14 (Equilbrio de Nash)Dizemos que um perl
de estrategias

s = (s1 , . . . , s(i1) , si , s(i+1) , . . . , sn ) S

e um equilbrio de Nash se

ui (si , si ) ui (si , si )

para todo i = 1, . . . , n e para todo si Si .

Exemplo 2.13 ([26], p agina 2009) Considere o seguinte jogo in-


nito: G = {g1 , g2 }, S1 = S2 = [0, 1] e u1 , u2 : S = S1 S2 R
denidas por

x, se x < 1,
u1 (x, y) = 0, se x = 1 e y < 1,

1, se x = 1 e y = 1,
e
y, se y < 1,
u2 (x, y) = 0, se y = 1 e x < 1,

1, se y = 1 e x = 1,
Observe que toda estrategia pura x [0, 1) do jogador g1 e estrita-
mente dominada. De fato, (1 + x)/2 (x, 1) e

u1 (x, y) = x < (1 + x)/2 = u1 ((1 + x)/2, y), y [0, 1].

i i

i i
tdj
i i
2017/2/2
page 50
i i

50
[CAP. 2: JOGOS NA FORMA ESTRATEGICA

Do mesmo modo, toda estrategia pura y [0, 1) do jogador g2 e


estritamente dominada por (1 + y)/2 (y, 1). Como

u1 (1, 1) = 1 u1 (x, 1) e u2 (1, 1) = 1 u2 (1, y), x, y, [0, 1],

segue-se que (x , y ) = (1, 1) e o u


nico equilbrio de Nash em es-
trategias puras do jogo. Eliminando-se todas as estrategias em S1
{1, t} e S2 {1, t}, para algum t < 1, obtemos um jogo 2 2, que
n
ao pode ser mais reduzido:
g2
1 t
1 (1, 1) (0, t)
g1
t (t, 0) (t, t)

Como t e arbitrario, este exemplo mostra que, em jogos innitos,


o processo de eliminacao de estrategias puras estritamente domina-
das pode produzir reducoes que dependem da ordem em que as eli-
minac
oes s
ao realizadas. O exemplo tambem mostra que, em jogos
innitos, a melhor resposta de um jogador pode n ao existir. Por
exemplo, nao existe uma melhor resposta (em estrategias puras) do
a uma escolha y (0, 1) do jogador g2 .
jogador g1 `

Como no caso de jogos nitos, um jogo innito nem sempre pos-


sui equilbrios de Nash em estrategias puras. Contudo, e possvel
mostrar que se os espacos de estrategias Si sao subconjuntos com-
pactos, convexos e nao-vazios de um espaco euclidiano e as funcoes
utilidade s = (si , si )  ui (s) sao contnuas em s e quase-c
oncavas
em si , entao o jogo possui pelo menos um equilbrio de Nash em es-
trategias puras ([23, 31, 34]). Note que este resultado inclui, como
caso particular, os jogos nitos em estrategias mistas.

2.6 Exerccios
[01] Use o processo de dominancia estrita iterada para reduzir o jogo
cuja matriz de payos e dada abaixo.

i i

i i
tdj
i i
2017/2/2
page 51
i i

[SEC. 2.6: EXERCICIOS 51

g2
s21 s22 s23 s24
s11 (3, 0) (1, 1) (5, 4) (0, 2)

g1 s12 (1, 1) (3, 2) (6, 0) (2, 1)

s13 (0, 2) (4, 4) (7, 2) (3, 0)

[02] Considere a matriz de payos para os jogadores L (linhas) e C


(colunas), a seguir:

C
c1 c2
l1 (3, 3) (0, 1)
L
l2 (1, 1) (2, 3)

Pede-se:
(a) Determinar se existe alguma estrategia estritamente domi-
nante para algum jogador.
(b) Determinar se existe algum equilbrio de Nash (em estrate-
gias puras). Caso exista mais do que um equilbrio, quantos
e quais sao.
[03] A partir da matriz de payos a seguir para os jogadores L (li-
nhas) e C colunas,

C
c1 c2
l1 (3, 2) (4, 4)
L
l2 (1, 1) (9, 2)

determine:

i i

i i
tdj
i i
2017/2/2
page 52
i i

52
[CAP. 2: JOGOS NA FORMA ESTRATEGICA

(a) Se algum jogador possui alguma estrategia dominante.


(b) Quantos equilbrios de Nash em estrategias puras existem.
[04] (Jogo do covarde) Neste jogo, dois adolescentes pilotam
carros roubados em direcao a um abismo em um teste de co-
ragem: aquele que desviar o carro primeiro ser
a chamado de
covarde (chicken).

Este tipo de jogo cou popular depois do lme Juventude Trans-


viada (Rebel Without a Cause) de 1955, estrelado por James
Dean, que morreu em decorrencia de um acidente de automovel.
Bertrand Russell, em [82], compara uma variacao deste jogo
com a tatica de brinkmanship 2 na corrida nuclear:
Since the nuclear stalemate became apparent, the
Governments of East and West have adopted the
policy which Mr. Dulles calls brinkmanship. This
is a policy adapted from a sport which, I am told, is
practised by some youthful degenerates. This sport
is called Chicken!. It is played by choosing a long
straight road with a white line down the middle and
starting two very fast cars towards each other from
opposite ends. Each car is expected to keep the wheels
of one side on the white line. As they approach each
other, mutual destruction becomes more and more
imminent. If one of them swerves from the white
2 Arte ou pr
atica de se levar uma situac
ao perigosa ou confrontac
ao al
em do
limite do que pode ser considerado seguro, para conseguir determinado desfecho.

i i

i i
tdj
i i
2017/2/2
page 53
i i

[SEC. 2.6: EXERCICIOS 53

line before the other, the other, as he passes, shouts


Chicken!, and the one who has swerved becomes
an object of contempt. As played by irresponsible
boys, this game is considered decadent and immoral,
though only the lives of the players are risked. But
when the game is played by eminent statesmen, who
risk not only their own lives but those of many hun-
dreds of millions of human beings, it is thought on
both sides that the statesmen on one side are dis-
playing a high degree of wisdom and courage, and
only the statesmen on the other side are reprehensi-
ble. This, of course, is absurd. Both are to blame
for playing such an incredibly dangerous game. The
game may be played without misfortune a few times,
but sooner or later it will come to be felt that loss
of face is more dreadful than nuclear annihilation.
The moment will come when neither side can face
the derisive cry of Chicken! from the other side.
When that moment is come, the statesmen of both
sides will plunge the world into destruction.
O jogo do covarde pode ser modelado com a seguinte matriz
de payos:

g2
desviar nao desviar
desviar (2, 2) (1, 3) .
g1
n
ao desviar (3, 1) (0, 0)

Pede-se:
(a) Determinar se existe alguma estrategia estritamente domi-
nante para algum jogador.
(b) Determinar se existe algum equilbrio de Nash (em estrate-
gias puras). Caso exista mais do que um equilbrio, quantos
e quais s
ao.

i i

i i
tdj
i i
2017/2/2
page 54
i i

54
[CAP. 2: JOGOS NA FORMA ESTRATEGICA

[05] (Jogo Hawk-Dove) Dois animais disputam um recurso (uma


presa, por exemplo). Cada animal tem duas opcoes: (1) brigar
pelo recurso (estrategia hawk ) ou (2) ameacar o seu oponente
(estrategia dove). Se os dois animais resolverem brigar pelo
recurso, o conito continuara ate que um deles que ferido e
o vencedor ser a o outro. Se somente um animal decide ata-
car, entao ele vencer
a o animal que decidiu apenas ameacar.
Se os dois escolherem fazer ameacas, entao existe um empate
e cada animal recebe um ganho menor do que ganharia na si-
tuac
ao onde um escolhe brigar e o outro ameacar. Este jogo
foi apresentado pela primeira vez por John Maynard Smith e
George Price no artigo The Logic of Animal Conict na re-
vista Nature [56]. A forma tradicional da matriz de payos e a
seguinte:

g2
brigar ameacar
 
V C V C
brigar , (V, 0) .
g1 2 2
 
V V
ameacar (0, V ) ,
2 2

Aqui, V e o valor do recurso sendo disputado e C e o custo da


briga. Em geral, assume-se que o valor do recurso e menor do
que o custo da briga, isto e, C > V > 0. Pede-se:

(a) Determinar se existe alguma estrategia estritamente domi-


nante para algum jogador.
(b) Determinar se existe algum equilbrio de Nash (em estrate-
gias puras). Caso exista mais do que um equilbrio, quantos
e quais s
ao.

[06] No artigo Nornmandy: Game and Reality, de W. Draker na


revista Moves, no. 6 (1972), e feita uma analise da invas ao da
Europa na Normandia na Segunda Guerra Mundial. Seis con-
gurac
oes possveis de ataque (1 a 6) pelos Aliados e seis possveis

i i

i i
tdj
i i
2017/2/2
page 55
i i

[SEC. 2.6: EXERCICIOS 55

estrategias defensivas (A a F ) pelo Eixo foram simuladas e cal-


culadas, num total de 36 simulacoes. A matriz da Tabela 2.1
foi estimada pelos Aliados para cada batalha hipotetica. Use o
processo de dominancia fraca iterada para reduzir ao maximo
possvel o tamanho da matriz.
[07] Considere um jogo com tres jogadores: A, B e C. As estrategias
do jogador A s ao {x1 , x2 , x3 }, as estrategias do jogador B sao
{y1 , y2 } e as estrategias do jogador C sao {z1 , z2 , z3 , z4 }. Se
o jogador B escolhe a estrategia y1 , os payos sao dados pela
matriz

C
z1 z2 z3 z4
x1 (5, 0, 2) (1, 0, 1) (3, 0, 6) (1, 2, 1)

A x2 (3, 2, 2) (9, 1, 8) (2, 0, 5) (2, 0, 2)

x3 (1, 0, 0) (1, 0, 9) (4, 0, 8) (3, 0, 3)

Por outro lado, se o jogador B escolhe a estrategia y2 , entao os


payos s
ao dados por

C
z1 z2 z3 z4
x1 (0, 1, 1) (0, 1, 2) (2, 1, 3) (0, 3, 9)

A x2 (0, 3, 2) (1, 2, 3) (2, 1, 8) (2, 1, 0)

x3 (1, 1, 0) (2, 1, 1) (3, 2, 2) (3, 1, 3)

Use a tecnica de domin


ancia estrita iterada para reduzir a ma-
triz deste jogo.

i i

i i
2017/2/2
page 56
i

i
tdj
i

i
[CAP. 2: JOGOS NA FORMA ESTRATEGICA

Eixo
A B C D E F
1 (+13, 13) (+29, 29) (+ 8, 8) (+12, 12) (+16, 16) (+23, 23)
2 (+18, 18) (+22, 22) (+21, 21) (+22, 22) (+29, 29) (+31, 31)
3 (+18, 18) (+22, 22) (+31, 31) (+31, 31) (+27, 27) (+37, 37)
Aliados

4 (+11, 11) (+22, 22) (+12, 12) (+21, 21) (+21, 21) (+26, 26)
5 (+18, 18) (+16, 16) (+19, 19) (+14, 14) (+19, 19) (+28, 28)
6 (+23, 23) (+22, 22) (+19, 19) (+23, 23) (+30, 30) (+34, 34)
Tabela 2.1: An
alise da invasao da Europa na Normandia na Segunda Guerra Mundial.
56
i

i
i

i
tdj
i i
2017/2/2
page 57
i i

[SEC. 2.6: EXERCICIOS 57

[08] Repita o exerccio anterior com a matriz de payos

C
z1 z2 z3 z4
x1 (1, 2, 9) (2, 9, 9) (3, 7, 9) (2, 8, 9)

A x2 (3, 8, 3) (4, 5, 4) (4, 1, 3) (3, 9, 3)

x3 (2, 9, 9) (3, 9, 9) (3, 9, 9) (2, 9, 9)

caso o jogador B escolha a estrategia y1 e a matriz de payos

C
z1 z2 z3 z4
x1 (2, 1, 9) (3, 9, 9) (2, 9, 9) (1, 9, 9)

A x2 (4, 9, 1) (4, 2, 2) (3, 2, 1) (2, 2, 1)

x3 (1, 9, 9) (2, 9, 9) (2, 9, 9) (1, 9, 9)

caso ele escolha a estrategia y2 .


[09] Considere um jogo com tres jogadores: A, B e C. As estrategias
do jogador A s ao {x1 , x2 , x3 }, as estrategias do jogador B sao
{y1 , y2 } e as estrategias do jogador C sao {z1 , z2 , z3 , z4 }. Se
o jogador B escolhe a estrategia y1 , os payos sao dados pela
matriz
C
z1 z2 z3 z4
x1 (1, 2, 1) (2, 3, 1) (1, 0, 2) (1, 4, 1)

A x2 (2, 0, 1) (1, 2, 1) (3, 1, 3) (3, 2, 1)

x3 (1, 0, 1) (1, 1, 1) (2, 5, 1) (1, 3, 1)

i i

i i
tdj
i i
2017/2/2
page 58
i i

58
[CAP. 2: JOGOS NA FORMA ESTRATEGICA

Por outro lado, se o jogador B escolhe a estrategia y2 , entao os


payos s
ao dados por

C
z1 z2 z3 z4
x1 (0, 0, 0) (1, 2, 3) (1, 3, 0) (1, 1, 1)

A x2 (2, 1, 0) (1, 5, 1) (2, 2, 3) (1, 5, 2)

x3 (2, 1, 1) (1, 0, 1) (1, 0, 4) (1, 5, 3)

Calcule os equilbrios de Nash em estrategias puras deste jogo.


[10] Considere o jogo cuja matriz de payos e dada por:

Jogador 2
L C R
T (1, 0) (3, 1) (1, 1)
Jogador 1

.
M (1, 1) (3, 0) (0, 1)

B (2, 2) (3, 3) (0, 2)

(a) Identique, para cada jogador, todos os pares de estrategias


onde uma estrategia e fracamente dominada pela outra.
(b) Usando o processo de eliminacao das estrategias fracamente
dominadas, encontre todas as possveis de maneiras de re-
duzir o jogo para uma matriz 1 1.
(c) Quais s
ao os equilbrios de Nash em estrategias puras do
jogo?
[11] Suponha que o processo de dominancia fraca iterada em es-
trategias puras reduza um jogo nito para apenas um u nico
perl de estrategias s . Mostre que s e um equilbrio de Nash
em estrategias puras do jogo.

i i

i i
tdj
i i
2017/2/2
page 59
i i

[SEC. 2.6: EXERCICIOS 59

[12] Demonstre a propriedade 2.2 da pagina 31 da funcao utilidade


esperada denida em 2.1.
[13] Mostre que uma estrategia mista que atribui probabilidade po-
sitiva para uma estrategia pura estritamente dominada tambem
e estritamente dominada.
[14] Use a tecnica descrita no Exemplo 2.11 para calcular as funcoes
de melhor resposta dos jogadores dos Exemplos 2.1 (o dilema
dos prisioneiros) e 2.6 (comparar moedas). Em seguida, use as
representacoes gr
acas destas funcoes para calcular os equil-
brios de Nash em estrategias mistas de cada jogo.
[15] Um equilbrio de Nash em estrategias mista pode dar probabi-
lidade positiva a uma estrategia pura que e estritamente domi-
nada? E em uma estrategia pura que e fracamente dominada?
[16] (Eficiencia de Pareto) Um perl de estrategias puras e Pa-
reto eciente (tambem denominado ponto otimo de Pareto) se
nenhum outro perl de estrategias puras oferece a todos os joga-
dores um ganho maior, isto e, nenhum jogador pode aumentar o
seu ganho sem que algum outro jogador tenha uma perda. Mais
precisamente, s S e Pareto eciente se, n ao existe s S
tal que

ui (s ) > ui (s ), para todo i = 1, . . . , n.

O equilbrio de Nash s = (confessar, confessar) do jogo do


dilema dos prisioneiros e Pareto eciente?

i i

i i
tdj
i i
2017/2/2
page 60
i i

Captulo 3

O teorema de equilbrio
de Nash

O teorema de equilbrio de Nash estabelece que todo jogo nito


possui pelo menos um equilbrio de Nash em estrategias mistas. Este
resultado foi provado por John Forbes Nash Jr. em sua tese de dou-
torado em 1949 na Universidade de Princeton. Neste captulo apre-
sentaremos duas demonstracoes do teorema, obtidas atraves de dois
teoremas de ponto xo: o de Brouwer e o de Kakutani.

3.1 Usando o teorema de Brouwer

Teorema 3.1 (do ponto fixo de Brouwer) Se e um


subconjunto compacto, convexo e n ao-vazio de um espaco eucli-
diano de dimensao nita e se F : e uma funcao contnua,
entao F possui um ponto xo em , isto e, existe p tal
que
F(p ) = p .

A demonstrac
ao deste teorema pode ser encontrada, por exemplo,
em [63, 79]. A dissertacao de mestrado [89] oferece um excelente

60

i i

i i
tdj
i i
2017/2/2
page 61
i i

[SEC. 3.1: USANDO O TEOREMA DE BROUWER 61

survey sobre o assunto: ela inclui dados historicos, generalizacoes e


aplicacoes do teorema do ponto xo de Brouwer.
Com as notacoes dadas na Secao 2.3, estabeleceremos uma se-
q
uencia de teoremas que fornecem caracterizacoes alternativas para
um equilbrio de Nash.

Teorema 3.2 Para cada i = 1, . . . , n e j = 1, . . . , mi , dena as


funcoes

zij : R
p  zij (p) = ui (sij , pi ) ui (pi , pi )

(isto e, zij mede o ganho ou perda do jogador gi quando ele troca


a distribuicao de probabilidade pi pela estrategia pura sij ). Te-
mos que p e um equilbrio de Nash se, e somente se,

zij (p ) 0

para cada i = 1, . . . , n e j = 1, . . . , mi .

Demonstrac ao:
() Se p = (pi , pi ) e um equilbrio de Nash, entao ui (pi , pi )
ui (sij , pi ) para cada i = 1, . . . , n e j = 1, . . . , mi . Conseq
uente-
mente,
zij (p ) = ui (sij , pi ) ui (pi , pi ) 0
para cada i = 1, . . . , n e j = 1, . . . , mi .
() Se

zij (p ) = ui (sij , pi ) ui (pi , pi ) 0

para cada i = 1, . . . , n e j = 1, . . . , mi , entao

ui (sij , pi ) = ui (ej , pi ) ui (pi , pi )

para cada i = 1, . . . , n e j = 1, . . . , mi , onde ej e o vetor em Rmi que


tem 1 na j-esima coordenada e zero nas demais. Devemos mostrar
que para todo pi = (pi1 , . . . , pimi ) mi

ui (pi , pi ) ui (pi , pi ).

i i

i i
tdj
i i
2017/2/2
page 62
i i

62 [CAP. 3: O TEOREMA DE EQUILIBRIO DE NASH

Mas, como x  ui (x, pi ) preserva combinacoes convexas, temos que


m  mi
 i   

ui (pi , pi ) = ui pik ek , pi = pik ui ek , pi
k=1 k=1

mi
 mi
      
pik ui pi , pi = ui pi , pi pik = ui pi , pi ,
k=1 k=1
mi
onde, na u
ltima igualdade, usamos o fato de que k=1 pik = 1, dado
que pi mi .

Teorema 3.3 Para cada i = 1, . . . , n e j = 1, . . . , mi , dena as


funcoes

gij : R
.
p  gij (p) = max{0, zij (p)}

Temos que p e um equilbrio de Nash se, e somente se,

gij (p) = 0

para cada i = 1, . . . , n e j = 1, . . . , mi .

Demonstrac
ao: A prova segue imediatamente do teorema anterior.

Teorema 3.4 Dena a aplicacao

F : = m1 mn = m1 mn
,
p = (p1 , . . . , pn )  F(p) = (y1 (p), . . . , yn (p))

onde

yi (p) = (yi1 (p), . . . , yimi (p)), pi = (pi1 , . . . , pimi )

i i

i i
tdj
i i
2017/2/2
page 63
i i

[SEC. 3.1: USANDO O TEOREMA DE BROUWER 63

pij + gij (p)


yij (p) = mi .

1+ gik (p)
k=1

Temos que p e um equilbrio de Nash se, e somente se,

F(p ) = p ,

isto e, se, e somente se, p e um ponto xo da aplicacao F.

o: Observe que, de fato, F() , pois claramente


Demonstraca
yij 0 e
mi mi
 
mi
mi
pik + gik (p)
  pik + gik (p)
yik (p) = = k=1 k=1
mi mi

k=1 k=1
1+ gik (p) 1+ gik (p)
k=1 k=1
mi

1+ gik (p)
k=1
= mi = 1,

1+ gik (p)
k=1

isto e, cada yi (p) mi .


() Se p e um equilbrio de Nash, entao gij (p ) = 0 para cada
i = 1, . . . , n e j = 1, . . . , mi . Desta maneira, yij (p ) = pij para cada
i = 1, . . . , n e j = 1, . . . , mi , isto e, yi (p ) = pi para cada i = 1, . . . , n
ou, ainda, F(p ) = p .
() Suponha que p = (p1 , p2 , . . . , pn ) = m1 mn
seja um ponto xo da aplicacao F : , isto e, suponha que

pij + gij (p )
pij = mi

1+ gik (p )
k=1

i i

i i
tdj
i i
2017/2/2
page 64
i i

64 [CAP. 3: O TEOREMA DE EQUILIBRIO DE NASH

para todo j = 1, . . . , mi e i = 1, . . . , n. Segue-se ent


ao que
mi

pij gik (p ) = gij (p ),
k=1

para todo j = 1, . . . , mi e i = 1, . . . , n. Armamos agora que =


mi
k=1 gik (p ) = 0, de modo que gik (p ) = 0 para todo k = 1, . . . , mi
e i = 1, . . . , n. De fato: se, por absurdo, > 0, vemos a partir da
relacao acima que
gij (p ) > 0 se, e somente se, pij > 0.
Sem perda de generalidade, suponha que pi1 > 0, pi2 > 0, . . . , pil > 0
e pi(l+1) = pi(l+2) = = pimi = 0. Observe que
mi

pi = pik ek ,
k=1

onde ei e o i-esimo vetor da base can onica de Rmi . Dado que



gik (p ) > 0 para todo k = 1, . . . , l, temos que
ui (ek , pi ) > ui (pi , pi ),
para todo k = 1, . . . , l. Desta maneira,
m  mi
 i   

ui (pi , pi ) = ui pik ek , pi = pik ui ek , pi
k=1 k=1
=

l
  
pik ui ek , pi
k=1

>
l
 l
      
pik ui pi , pi = ui pi , pi pik = ui pi , pi ,
k=1 k=1

um absurdo. Isto demonstra que gij (p ) = 0 para todo j = 1, . . . , mi
e j = 1, . . . , m e, assim, p e um equilbrio de Nash em estrategias
mistas.

i i

i i
tdj
i i
2017/2/2
page 65
i i

[SEC. 3.2: USANDO O TEOREMA DE KAKUTANI 65

Teorema 3.5 (do equilbrio de Nash) Todo jogo denido


por matrizes de payos possui um equilbrio de Nash.

Demonstracao: A aplicacao F : denida no teorema anterior


e contnua e e um conjunto compacto e convexo. Pelo teorema
do ponto xo de Brouwer, F possui um ponto xo p . Pelo teorema
anterior, p e um equilbrio de Nash.

3.2 Usando o teorema de Kakutani


Seja X um subconjunto de Rn . Dizemos que p X e um ponto
ao : X 2X se p (p ). O teorema do ponto
xo de uma func
xo de Kakutani estabelece condicoes sucientes para que possua
pelo menos um ponto xo.

Teorema 3.6 (do ponto fixo de Kakutani) Seja X um


ao-vazio de Rn . Se
subconjunto compacto, convexo e n

: X 2X

e semicontnua superiormente e (x) e n


ao-vazio e convexo para
todo x X, ent ao possui pelo menos um ponto xo, isto e,
existe p X tal que

p (p ).

Suponha que exista um subconjunto compacto K de Rn tal que


(x) K para todo x X e suponha que (x) e um subconjunto
fechado de Rn para todo x X. Dizemos que : X 2X e contnua
superiormente se, e somente se, y0 (x0 ) sempre que (a) x0 X,
(b) xk X para k = 1, 2, . . ., (c) limk+ xk = x0 , (d) yk (xk )
e (e) limk+ yk = y0 . Neste contexto, e contnua superiormente
aco de ,
se, e somente se, o gr

Gr() = {(x, y) X X | y (x)},

i i

i i
tdj
i i
2017/2/2
page 66
i i

66 [CAP. 3: O TEOREMA DE EQUILIBRIO DE NASH

e um subconjunto fechado de X X. Por exemplo, se X = [0, 1],


entao 
{1/2}, se 0 x < 1/2,
(x) =
[1/4, 3/4], se 1/2 x 1,

e semicontnua superiormente (Figura 3.1), enquanto que



{1/2}, se 0 x 1/2,
(x) =
[1/4, 3/4], se 1/2 < x 1,

n
ao o e (Figura 3.2).

3/4

1/2

1/4

0 1/2 1 x

Figura 3.1: Gr
aco de uma funcao que e semicontnua superiormente.

Usaremos o teorema do ponto xo de Kakutani para mostrar que


ao de melhor resposta MR : 2 denida por
a func

MR(p) = (MR1 (p1 ), MR2 (p2 ), . . . , MRn (pn )),

com p e MRi (pi ) = argmaxpi (Si ) ui (pi , pi ), possui um


ponto xo p que, em virtude da Proposicao 2.4, ser
a um equilbrio
de Nash.

i i

i i
tdj
i i
2017/2/2
page 67
i i

[SEC. 3.2: USANDO O TEOREMA DE KAKUTANI 67

3/4

1/2

1/4

0 1/2 1 x

Figura 3.2: Gr
aco de uma funcao que n
ao e semicontnua superior-
mente.

Teorema 3.7 (do equilbrio de Nash) Todo jogo denido


por matrizes de payos possui um equilbrio de Nash.

Demonstrac ao: Basta vericarmos que a funcao de melhor resposta


satisfaz as hip
oteses do teorema do ponto xo de Kakutani.
(1) O conjunto X = = (S1 ) (Sn ) e nao-vazio, com-
pacto (como produto cartesiano de conjuntos compactos) e con-
vexo (como produto cartesiano de conjuntos convexos).
(2) Para todo p , o conjunto MR(p) esta contido no compacto
K = .
(3) Para todo p , o conjunto MR(p) e convexo. De fato: supo-
nha, por absurdo, MR(p) nao seja um conjunto convexo. Entao
existem q() , q() MR(p) e (0, 1) tais que

(1 ) q() + q()  MR(p).

i i

i i
tdj
i i
2017/2/2
page 68
i i

68 [CAP. 3: O TEOREMA DE EQUILIBRIO DE NASH

Mas, para todo ndice i, vale que

ui ((1 ) q()
i + qi , pi ) =
()

(1 ) ui (q()
i , pi ) + ui (qi , pi ).
()

Agora,

ui (q() ()
i , pi ) = ui (qi , pi ) = constante = max ui (pi , pi ).
pi (Si )

Conseq uentemente, ui ((1 ) q()


i + qi , pi ) = constante,
()

isto e, (1 ) qi + qi MRi (pi ), para todo i = 1, . . . , n,


() ()

o que e uma contradicao.


(4) Para todo p , o conjunto MR(p) e fechado. Para ver isto,
basta mostrar que MRi (pi ) = argmaxpi (Si ) ui (pi , pi ) e fe-
chado. Seja ent ao p(k)
i uma sequencia de pontos em MRi (pi ) que
converge para p(0) i . Desta maneira, ui (p(k)
i , pi ) = constante =
maxpi (Si ) ui (pi , pi ) e, como x  ui (x, pi ) e uma funcao
contnua, conclumos que

ui (p(0)
i , pi ) = constante = max ui (pi , pi ).
pi (Si )

Sendo assim, p(0)


i MRi (pi ).

(5) MR : 2 e semicontnua superiormente. Com efeito, mos-


traremos que se (a) p(0) , (b) p(k) e uma sequencia de pontos
em , (c) limk+ p(k) = p(0) , (d) q(k) MR(p(k) ) e (e) q(k)
converge para q(0) , entao q(0) MR(p(0) ). Se, por absurdo,
q(0)  MR(p(0) ), entao existe ndice i tal que q(0)
i  MR(p(0)
i ).
Portanto, existem  > 0 e qi (Si ) tais que
()

i , pi ) > ui (qi , pi ) + 3 .
ui (q() (0) (0) (0)

Mas, desde que ui e uma funcao contnua e (q(k) (k)


i , pi ) converge
(0) (0)
para (qi , pi ), entao para todo k sucientemente grande,

i , pi ) > ui (qi , pi )  >


ui (q() (k) () (0)

i , pi ) + 2  > ui (qi , pi ) + .
ui (q(0) (0) (k) (k)

i i

i i
tdj
i i
2017/2/2
page 69
i i

[SEC. 3.3: ALGUMAS PROPRIEDADES DOS EQUILIBRIOS DE NASH 69

i  MRi (pi ), pois ui (qi , pi ) > ui (qi , pi ),


Sendo assim, q(k) (k) () (k) (k) (k)

o que contradiz (d).

Shizuo Kakutani demonstrou o seu teorema no artigo [45]. Debreu


lista mais de 300 aplicacoes do teorema do ponto xo de Kakutani
ao provar a existencia de um equilbrio economico em [24].

3.3 Algumas propriedades dos equilbrios


de Nash
Wilson ([97]) mostrou que, a menos de um conjunto fechado e
de medida zero, todo jogo nito possui um n umero nito e mpar
de equilbrios de Nash em estrategias mistas. Pelo menos para jogos
com dois jogadores, cada um com duas estrategias, este resultado
pode ser antecipado atraves da analise das funcoes de melhor resposta
que zemos na Subsecao 2.4.2 (veja, por exemplo, a Figura 2.5 na
pagina 42). Harsanyi, em [40], apresentou uma prova alternativa para
este resultado. Tambem tratam do assunto as referencias [35, 36, 59].
Por outro lado, os casos degenerados podem ter topologias diver-
sicadas. De fato, Datta provou que toda variedade algebrica real
(soluc
oes reais de um sistema de equacoes polinomiais) e isomorfa
ao conjunto de equilbrios de Nash em estrategias totalmente mistas
de algum jogo com 3 jogadores e, tambem, de algum jogo com n
jogadores, cada um com apenas 2 estrategias puras ([20]). Um per-
l de estrategias totalmente mistas e um perl que d a probabilidade
positiva a cada estrategia pura.
Existem jogos cujos payos sao todos n umeros racionais, mas to-
dos os equilbrios de Nash em estrategias mistas possuem coordenadas
irracionais ([69]). Contudo, Markakis mostrou que, neste contexto,
existe sempre pelo menos um equilbrio de Nash em estrategias mistas
com coordenadas algebricas ([51, 54]).
Torres-Martnez ([91]) e Zhao ([99]) demonstram que e possvel
deduzir os teoremas de ponto xo de Brouwer e Kakutani a partir de
um teorema de existencia de equilbrios de Nash.

i i

i i
tdj
i i
2017/2/2
page 70
i i

70 [CAP. 3: O TEOREMA DE EQUILIBRIO DE NASH

3.4 Exerccios
[01] O objetivo deste exerccio e mostrar que as hipoteses do teorema
do ponto xo de Brouwer n ao podem ser removidas.
(a) Exiba uma funcao F : descontnua, denida em um
subconjunto compacto, convexo e n ao-vazio de Rn , que
n
ao possui ponto xo.
(b) Exiba uma funcao F : contnua, denida em um
subconjunto n ao-vazio de Rn ,
ao-compacto, convexo e n
que n
ao possui ponto xo.
(c) Exiba uma funcao F : contnua, denida em um
subconjunto compacto, n ao-vazio de Rn ,
ao-convexo e n
que n
ao possui ponto xo.
[02] Exiba um exemplo de funcao : X 2X denida em um
subconjunto X compacto, convexo e n ao-vazio de Rn , que e
semicontnua superiormente, mas nao possui ponto xo. Isto
mostra que a hipotese de (x) ser um conjunto convexo para
todo x X n ao pode ser removida do enunciado do teorema
do ponto xo de Kakutani.
[03] De um exemplo de jogo com um n
umero par de equilbrios de
Nash em estrategias mistas.

i i

i i
tdj
i i
2017/2/2
page 71
i i

Captulo 4

Calculando equilbrios
de Nash

4.1 Equilbrio de Nash via um problema


de otimiza c
ao
O Teorema 3.3 sugere uma maneira de se calcular os equilbrios
de Nash de um jogo. Eles sao solucoes do seguinte problema de
otimizac
ao n
ao-linear:
mi
n 
 2
minimizar (gij (p))
i=1 j=1
sujeito a p .

Com efeito: a soma de quadrados e zero se, e somente se, cada parcela
e igual a zero. McKelvey demonstrou em [58] que a funcao objetivo
mi
n 
 2
p  (gij (p))
i=1 j=1

e uma func ao de classe C 1 . Assim, algoritmos numericos de oti-


mizacao que usam derivadas (Newton, Davidon-Fletcher-Powell) po-
dem ser usados.

71

i i

i i
tdj
i i
2017/2/2
page 72
i i

72 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

Exemplo 4.1 Para o dilema do prisioneiro (Exemplo 2.1, pagina 11),


(p, q) = (p, 1 p; q, 1 q) 2 2
e um equilbrio de Nash se, e somente se, (p, q) e solucao do seguinte
problema de otimizacao

minimizar G(p, q) = (max {0, (1 + p) (4 q + 1)})2 +


(max {0, p (4 q + 1)})2 +
2
(max {0, (4 p + 1) (1 + q)}) +
2
(max {0, q (4 p + 1)})
sujeito a 0 p 1,
0 q 1.
Como vemos pela Figura 4.1, que mostra o graco e o mapa de con-
torno de G, o ponto
(p , q ) = (1, 0; 1, 0)
e o u
nico equilbrio de Nash do jogo.

Exemplo 4.2 Para a batalha dos sexos (Exemplo 2.2, p


agina 13),
(p, q) = (p, 1 p; q, 1 q) 2 2
e um equilbrio de Nash se, e somente se, (p, q) e solucao do seguinte
problema de otimizacao

minimizar G(p, q) = (max {0, 5 (1 + p) (3 q 1)})2 +


2
(max {0, 5 p (3 q 1)}) +
2
(max {0, 5 (3 p 2) (1 + q))) +
2
(max {0, 5 q (3 p 2)})
sujeito a 0 p 1,
0 q 1.

Como vemos pela Figura 4.2, que mostra o graco e o mapa de con-
torno de G, os pontos
(p , q ) = (1, 0; 1, 0), (p , q ) = (0, 1; 0, 1) e

(p , q ) = (2/3, 1/3; 1/3, 2/3)

i i

i i
tdj
i i
2017/2/2
page 73
i i

[SEC. 4.1: EQUILIBRIO DE NASH VIA UM PROBLEMA DE OTIMIZAC


AO 73

sao os u
nicos equilbrios de Nash do jogo.

Exemplo 4.3 Para o jogo do Exemplo 2.6 da pagina 22,

(p, q) = (p, 1 p; q, 1 q) 2 2

e um equilbrio de Nash se, e somente se, (p, q) e solucao do seguinte


problema de otimizacao

2
minimizar G(p, q) = (max {0, 2 (1 + p) (2 q 1)}) +
2
(max {0, 2 p (2 q 1)}) +
2
(max {0, 2 (2 p 1) (1 + q)}) +
2
(max {0, 2 (2 p 1) q})
sujeito a 0 p 1,
0 q 1.

Como vemos pela Figura 4.3, que mostra o graco e o mapa de con-
torno de G, o ponto

(p , q ) = (1/2, 1/2; 1/2, 1/2)

e o u
nico equilbrio de Nash do jogo.

Exemplo 4.4 Para o jogo do exemplo 2.12 da p


agina 42,

(p, q) = (p, 1 p; q, 1 q) 2 2

e um equilbrio de Nash se, e somente se, (p, q) e solucao do seguinte


problema de otimizacao

minimizar G(p, q) = (max {0, 2 (1 + p) (2 q 1)})2 +


2
(max {0, 2 p (2 q 1)}) +
2
(max {0, (3 + 4 p) (1 + q)}) +
2
(max {0, q (3 + 4 p)})
sujeito a 0 p 1,
0 q 1.

i i

i i
tdj
i i
2017/2/2
page 74
i i

74 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

Como vemos pela Figura 4.4, que mostra o graco e o mapa de con-
torno de G, o ponto

(p , q ) = (3/4, 1/4; 1/2, 1/2)

e o u
nico equilbrio de Nash do jogo.

4.2 Equilbrio de Nash via equac


oes poli-
nomiais
A proxima proposicao estabelece que a maior utilidade esperada
que o jogador gi pode obter contra qualquer escolha de estrategias
mistas dos demais jogadores n ao depende se o jogador gi esta usando
estrategias mistas ou somente estrategias puras. Mais ainda, as es-
trategias mistas otimas para o jogador gi sao justamente aquelas que
atribuem probabilidade positiva somente para as estrategias puras
otimas.

Proposi c
ao 4.1 Para todo i = 1, . . . , n e para todo p =
(p1 , . . . , pi , . . . , pn ) = (S1 ) (Si ) (Sn ),

max ui (siji , pi ) = pi , pi ).
max ui (
siji Si 
pi (Si )

Mais ainda,

pi = (pi1 , . . . , pik , . . . , pimi ) argmaxpi (Si ) ui (


pi , pi )

pik = 0 para todo k tal que sik  argmaxsiji Si ui (siji , pi ).

Demonstrac
ao: Pela Propriedade 2.4, sabemos que
mi

pi , pi ) =
ui ( piji ui (siji , pi ).
ji =1

i i

i i
tdj
i i
2017/2/2
page 75
i i

[SEC. 4.2: EQUILIBRIO DE NASH VIA EQUAC


OES POLINOMIAIS 75

25

20

15

10

5 1

0.5 q
0
0 0.2 0.4 0.6 0
0.8 1
p

p
0 0.2 0.4 0.6 0.8 1
1

0.8

0.6

0.4

0.2

Figura 4.1: Encontrando os equilbrios de Nash para o dilema do pri-


sioneiro via um problema de otimizacao.

i i

i i
tdj
i i
2017/2/2
page 76
i i

76 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

2.5

1.5

1
0.5 0.8
0.6
0.4 q
0 0.2
0 0.2 0.4 0.6 0
0.8 1
p

p
0 0.2 0.4 0.6 0.8 1
1

0.8

0.6

0.4

0.2

Figura 4.2: Encontrando os equilbrios de Nash para a batalha dos


sexos via um problema de otimizacao.

i i

i i
tdj
i i
2017/2/2
page 77
i i

[SEC. 4.2: EQUILIBRIO DE NASH VIA EQUAC


OES POLINOMIAIS 77

0.8

0.6
q
0.4

0.2
0.8 1
0 0.4 0.6
0 0.2 p

p
0 0.2 0.4 0.6 0.8 1
1

0.8

0.6

0.4

0.2

Figura 4.3: Encontrando os equilbrios de Nash do jogo de comparar


moedas via um problema de otimizacao.

i i

i i
tdj
i i
2017/2/2
page 78
i i

78 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

0.8

0.6
q
0.4

0.2
0.8 1
0 0.4 0.6
0 0.2 p

p
0 0.2 0.4 0.6 0.8 1
1

0.8

0.6

0.4

0.2

Figura 4.4: Encontrando os equilbrios de Nash do jogo do Exem-


plo 2.12 via um problema de otimizacao.

i i

i i
tdj
i i
2017/2/2
page 79
i i

[SEC. 4.2: EQUILIBRIO DE NASH VIA EQUAC


OES POLINOMIAIS 79

pi , pi ) e a media ponderada dos valores ui (siji , pi ), onde


Assim, ui (
os pesos piji sao n ao-negativos e somam 1. Esta media ponderada
n
ao pode ser maior do que o maior dos valores que participam no
c
alculo da media. Assim,
pi , pi ) max ui (siji , pi )
ui (
siji Si

i (Si ) e, portanto,
para todo p
pi , pi ) max ui (siji , pi ).
max ui (

pi (Si ) siji Si

Por outro lado, ui (siji , pi ) = ui (eji , pi ), onde eji e a distribuicao


de probabilidades em (Si ) que da peso 1 a` estrategia pura siji .
Assim,
ui (siji , pi ) = ui (eji , pi ) pi , pi )
max ui (

pi (Si )

para todo siji Si e, portanto,


max ui (siji , pi ) pi , pi ).
max ui (
siji Si 
pi (Si )

Para a segunda parte da proposicao, suponha por absurdo que exista


pi = (pi1 , . . . , pik , . . . , pimi ) argmaxpi (Si ) ui (
pi , pi )
onde, para algum ndice k, ocorre que
pik > 0 e sik  argmaxsiji Si ui (siji , pi ).

Isto implica que ui (sik , pi ) < maxsiji Si ui (siji , pi ). Uma vez que
ui (siji , pi ) maxsiji Si ui (siji , pi ) para todo ji = k, segue-se que
mi

ui (pi , pi ) = piji ui (siji , pi )
ji =1
mi
< piji max ui (siji , pi ) = max ui (siji , pi )
siji Si siji Si
ji =1

= pi , pi ).
max ui (

pi (Si )

i i

i i
tdj
i i
2017/2/2
page 80
i i

80 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

Masisto contradiz o fato de pi pertencer a argmaxpi (Si ) ui (


pi , pi ).
Reciprocamente, se pi satisfaz a condicao pik = 0 para todo k tal que
sik  argmaxsij Si ui (siji , pi ), entao
i

ui (sik , pi ) = max ui (siji , pi )


siji Si

sempre que pik > 0. Assim


mi
 
ui (pi , pi ) = pik ui (sik , pi ) = pik ui (sik , pi )
k=1 p
ik >0

= pik max ui (siji , pi ) = max ui (siji , pi )
siji Si siji Si
p
ik >0

= pi , pi ).
max ui (

pi (Si )

Isto mostra que pi pertence a a argmaxpi (Si ) ui (


pi , pi ).

Corol ario 4.1 p = (p1 , . . . , pi , . . . , pn ) e um equilbrio


de Nash em estrategias mistas se, e somente se, para todo i =
1, . . . , n,

pik > 0 sik argmaxsiji Si ui (siji , pi ),

onde pi = (pi1 , . . . , pik , . . . , pimi ).

O suporte de um perl pi = (pi1 , . . . , pik , . . . , pimi ) de estrategias


mistas e o conjunto de estrategias puras do jogador gi que recebe
probabilidade positiva por pi . Mais precisamente,

supp(pi ) = {sik Si | pik > 0}.

Assim, o Corolario 4.1 diz que p = (p1 , . . . , pi , . . . , pn ) e um equil-


brio de Nash se, e somente se, para todo i = 1, . . . , n,

supp(pi ) argmaxsiji Si ui (siji , pi ).

i i

i i
tdj
i i
2017/2/2
page 81
i i

[SEC. 4.2: EQUILIBRIO DE NASH VIA EQUAC


OES POLINOMIAIS 81

A Proposicao 4.1 pode ser usada para calcular equilbrios de Nash


em estrategias mistas. O ponto chave e observar que, pela Pro-
posicao 4.1, se p e um equilbrio de Nash em estrategias mistas,
entao, para todo i = 1, . . . , n,

ui (sik , pi ) = constante = max ui (siji , pi ) (4.1)


siji Si

sempre que pik > 0, isto e, em um equilbrio de Nash, o jogador gi


tem o mesmo ganho se trocar sua estrategia pi por qualquer outra
estrategia pura que recebeu probabilidade positiva de pi .

Exemplo 4.5 No Exemplo 2.11, vimos que as funcoes utilidade dois


jogadores da batalha dos sexos s
ao dadas por

uHomem (p11 , p12 ; p21 , p22 ) = 10 p11 p21 + 5 p12 p22 ,


uMulher(p11 , p12 ; p21 , p22 ) = 5 p11 p21 + 10 p12 p22 .

Vamos usar as relacoes 4.1 para calcular o equilbrio de Nash em


estrategias mistas que nao e um equilbrio em estrategias puras,
isto e, o equilbrio de Nash cujas estrategias mistas tem suporte
nas duas estrategias puras de cada jogador. Para isto, considere
p = (p11 , p12 ; p21 , p22 ) 2 2 , com 0 < p11 , p12 , p21 , p22 < 1.
Pelas relacoes 4.1, se p e um equilbrio de Nash, entao

uHomem ( 1 , 0 ; p21 , p22 ) = uHomem( 0 , 1 ; p21 , p22 ),


uMulher(p11 , p12 ; 1 , 0 ) = uMulher(p11 , p12 ; 0 , 1 ),

isto e,
10 p21 = 5 p22 e 5p11 = 10 p12 .
Como p21 + p22 = 1 e p11 + p12 = 1, obtemos ent ao um sistema linear
com 4 equac
oes e 4 incognitas. A solucao deste sistema da o equilbrio
de Nash
(p11 , p12 ; p21 , p22 ) = (2/3, 1/3; 1/3, 2/3).

A tecnica descrita no exemplo acima pode ser usada para o calculo


dos equilbrios de Nash que nao sao estrategias puras para jogos com

i i

i i
tdj
i i
2017/2/2
page 82
i i

82 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

mais do que dois jogadores e com mais do que duas estrategias puras
por jogador. Neste caso, e preciso (1) considerar os v arios casos que
resultam das diferentes escolhas das estrategias puras que farao parte
do suporte de cada perl em estrategias mistas e (2) resolver o sistema
nao-linear resultante. Mais precisamente, para cada jogador gi e para
cada subconjunto nao-vazio Ti = {sik1 , . . . , sikti } de Si (que especica
quais estrategias puras far ao parte do suporte), devemos resolver o
sistema descrito na Figura 4.5 (neste sistema, wi representa o ganho
constante que o jogador gi obtem escolhendo qualquer uma de suas
estrategias puras que recebeu probabilidade positiva de pi ).
Para jogos com muitos jogadores e muitas estrategias, o sistema
da Figura 4.5 nao e pr atico para o calculo a mao dos equilbrios de
Nash. Contudo, metodos numericos para a solucao de um sistema
de equacoes polinomiais podem ser aplicados: o metodo de Newton
com uma estrategia de subdivisao espacial, bases de Gr obner e conti-
nuacao homot opica poliedral. O leitor interessado pode consultar as
referencias [21, 22, 51]

4.3 Jogos de soma zero


Nesta sec
ao estudaremos os jogos de soma zero com dois jogado-
res, uma classe especial de jogos onde a soma dos payos dos dois
jogadores e sempre zero: o que um jogador ganha, o outro perde1 .
Veremos que, para este tipo de jogo, os equilbrios de Nash em es-
trategias mistas podem ser facilmente calculados resolvendo-se um
problema de otimizacao linear.

4.3.1 Jogos de soma constante com dois jogadores

Definic
ao 4.1 (Jogos de soma constante com dois jo-
gadores) Um jogo de soma constante com dois jogadores e um
jogo com dois jogadores, comumente denominados jogador linha
e jogador coluna, com estrategias

1 Por este motivo, jogos de soma zero tamb ao denominados jogos estrita-
em s
mente competitivos.

i i

i i
i
i

i
i

m1 mi1 mi+1 mn
   
p1j1 p(i1)ji1 p(i+1)ji+1 pnjn ui (s1j1 , . . . , siji , sik , siji+1 , snjn ) = wi ,
j1 =1 ji1 =1 ji+1 =1 jn =1
[SEC. 4.3: JOGOS DE SOMA ZERO

i = 1, . . . , n, sik Ti ,

pik = 0, i = 1, . . . , n, = 1, . . . , ti ,
ti

pik = 1, i = 1, . . . , n.
=1

Figura 4.5: Calculando equilbrios de Nash atraves de um sistema nao-linear.


83

i
i
tdj

i
i
page 83
2017/2/2
tdj
i i
2017/2/2
page 84
i i

84 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

Sjogador linha = {1, 2, . . . , m}


e
Sjogador coluna = {1, 2, . . . , n}
e matriz de payos

jogador coluna
1 2 n
1 (a11 , b11 ) (a12 , b12 ) (a1n , b1n )
jogador linha

2 (a21 , b21 ) (a22 , b22 ) (a2n , b2n )


.. .. .. .. ..
. . . . .

m (am1 , bm1 ) (am2 , bm2 ) (amn , bmn )

satisfazendo aij + bij = c = constante, para todo i = 1, . . . , m


e j = 1, . . . , n. No caso particular em que a constante c e zero,
dizemos que o jogo tem soma zero.

Em termos de estrategias mistas, se p = (p1 , . . . , pm ) m e uma


distribuicao de probabilidades para as estrategias puras do jogador
linha e q = (q1 , . . . , qn ) n e uma distribuicao de probabilidades
para as estrategias puras do jogador coluna, ent ao o payo esperado
para o jogador linha e

m 
 n
ul (p, q) = pi qj aij
i=1 j=1
a11 a12 a1n q1
 a21 a22 a2n q2

= p1 p2 pm .. .. .. .. .. ,
. . . . .
am1 am2 amn qn

i i

i i
tdj
i i
2017/2/2
page 85
i i

[SEC. 4.3: JOGOS DE SOMA ZERO 85

isto e,

a11 a12 a1n
a21 a22 a2n

ul (p, q) = pT Aq, com A = .. .. .. .. .
. . . .
am1 am2 amn

Analogamente, o payo esperado para o jogador coluna e dado por



b11 b12 b1n
b21 b22 b2n

uc (p, q) = pT Bq, com B = . .. .. .. .
.. . . .
bm1 bm2 bmn

Uma vez que o jogo tem soma constante, vemos que



a11 a12 a1n b11 b12 b1n
a21 a22 a2n b21 b22 b2n

A+B = . .. .. .. + .. .. .. ..
.. . . . . . . .
am1 am2 amn bm1 bm2 bmn

c c c
c c c

= . . .
. . ...
,
.. ..
c c c

isto e,

c c c 1 1 1
c c c 1 1 1

A+B = C = .. .. .. .. = c .. .. .. .. = c 1 ,
. . . . . . . .
c c c 1 1 1

onde 1 denota a matriz m n formada com 1 em todas as suas


entradas. Sendo assim, e facil de ver que

uc (p, q) = pT Bq = pT (c 1 A)q = cpT 1 q pT Aq = c ul (p, q)

i i

i i
tdj
i i
2017/2/2
page 86
i i

86 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

onde, na u ltima igualdade, usamos que pT 1 q = 1, pois p e q sao


distribuicoes de probabilidades e, por isto,
m
 n

pi = 1 e qj = 1.
i=1 j=1

Em particular, vale a seguinte propriedade importante:


ul (p , q ) ul (p, q ) uc (p , q ) uc (p, q ). (4.2)

4.3.2 Equilbrio de Nash em estrat


egias puras

Definic
ao 4.2 (Ponto de sela) Dizemos que um elemento
aij de uma matriz A e um ponto de sela da matriz A se ele for
simultaneamente um mnimo em sua linha e um maximo em sua
coluna, isto e, se

aij ail para todo l = 1, . . . , n e


aij akj para todo k = 1, . . . , m.

O termo ponto de sela vem do fato que se desenharmos o graco


dos payos do jogador linha, a vizinhanca do ponto de sela lembra o
formato de uma sela de cavalo (Figura 4.6).

Teorema 4.1 O elemento aij e um ponto de sela da matriz A


se, e somente se, o par (i, j) e um equilbrio de Nash em es-
trategias puras para o jogo.

Demonstrac
ao:
() Seja aij um ponto de sela da matriz A. Como aij e maximo
em sua coluna, vale que
ul (i, j) = aij akj = ul (k, j)

i i

i i
tdj
i i
2017/2/2
page 87
i i

[SEC. 4.3: JOGOS DE SOMA ZERO 87

payoff

has
Colunas Lin

Figura 4.6: Ponto de sela.

para todo k = 1, . . . , m, isto e, o jogador linha nao pode aumentar o


seu payo se o jogador coluna mantiver a escolha da coluna j. Por
outro lado, como aij e mnimo em sua linha, vale que

uc (i, j) = bij = c aij c ail = bil = uc (i, l)

para todo l = 1, . . . , n, isto e, o jogador coluna nao pode aumentar


o seu payo se o jogador linha mantiver a escolha da linha i. Isto
mostra que o perl de estrategias puras (i, j) e um equilbrio de Nash
do jogo.
() Seja (i, j) e um equilbrio de Nash do jogo. A partir das
consideracoes acima, e facil de ver que aij e maximo em sua coluna
e mnimo em sua linha e que, portanto, aij e um ponto de sela da
matriz A.

i i

i i
tdj
i i
2017/2/2
page 88
i i

88 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

Teorema 4.2 Se aij e ars sao dois pontos de sela da matriz A,


entao ais e arj tambem sao pontos de sela da matriz A e

aij = ars = ais = arj .

Demonstrac
ao: Considere a matriz

.. ..
. .
aij ais

.. .. ..
A= . . . .

arj ars

.. ..
. .

Como aij e ars sao pontos de sela, sabemos que eles s ao mnimos
em suas respectivas linhas e m
aximos em suas respectivas colunas.
Assim,
aij ais ars e aij arj ars ,
e, portanto,
aij = ais = arj = ars .
Observe que ais e mnimo em sua linha, pois aij = ais e mnimo
da mesma linha e que ais e maximo em sua coluna, pois ars = ais
e maximo da mesma coluna. Analogamente, arj e mnimo em sua
linha, pois ars = arj e mnimo da mesma linha e arj e maximo em
sua coluna, pois arj = aij e maximo da mesma coluna. Conclumos
entao que ais e arj tambem sao pontos de sela da matriz A.

O payo mnimo do jogador linha, se ele escolher a linha k, e dado


por
ak = min akl .
1ln

Analogamente, o payo mnimo do jogador coluna, se ele escolher a


coluna l, e dado por c al , onde

al = max akl .
1km

i i

i i
tdj
i i
2017/2/2
page 89
i i

[SEC. 4.3: JOGOS DE SOMA ZERO 89

Dena
vl (A) = max ak = max min akl
1km 1km 1ln
e
vc (A) = min al = min max akl .
1ln 1ln 1km

Teorema 4.3 Para toda matriz A, tem-se vc (A) vl (A).

Demonstraca
o: Temos que para todo k = 1, . . . , m e j = 1, . . . , n,
akj min akl .
1ln
Assim,
max akj max min akl = vl (A),
1km 1km 1ln

para todo j = 1, . . . , n. Conseq


uentemente,

vc (A) = min max akj max min akl = vl (A).


1jn 1km 1km 1ln

O proximo teorema caracteriza a existencia de pontos de sela e,


portanto, a existencia de equilbrios de Nash em estrategias puras,
em termos das funcoes vl e vc .

Teorema 4.4 Uma matriz A tem um ponto de sela se, e so-


mente se, vl (A) = vc (A).

Demonstrac ao:
() Se aij e um ponto de sela da matriz A, entao vale que
aij = min1ln ail = ai . Como vl (A) = max1km ak , e claro que
vl (A) ai = aij . Por outro lado, aij = max1km akj = aj . Como
vc (A) = min1ln al , segue-se que vc (A) aj = aij . Combinando
estas duas desigualdades, conclumos que vc (A) aij vl (A). Mas,
pelo teorema anterior, vc (A) vl (A) e, sendo assim, vc (A) = vl (A).
() Como vl (A) = max1rm ar , existe uma linha i tal que
vl (A) = ai . Como, por sua vez, ai = min1sn ais , existe uma co-
luna l tal que ai = ail . Assim, vl (A) = ai = ail . Analogamente, como

i i

i i
tdj
i i
2017/2/2
page 90
i i

90 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

vc (A) = min1sn as , existe uma coluna j tal que vc (A) = aj . Como,


por sua vez, aj = max1rm arj , existe uma linha k tal que aj = akj .
Assim, vc (A) = aj = akj . Uma vez que, por hipotese, vl (A) = vc (A),
temos que
ail = ai = vl (A) = vc (A) = aj = akj .
Armamos que aij e um ponto de sela da matriz A. Com efeito, aij
aj = ai ais , para todo s = 1, . . . , n, isto e, aij e o mnimo de sua
linha. Por outro lado, aij ai = aj arj , para todo r = 1, . . . , m,
isto e, aij e o maximo de sua coluna. Portanto, aij e um ponto de
sela da matriz A.

Corol ario 4.2 Um jogo de dois jogadores com soma constante


denido pela matriz de payos A do jogador linha tem um
equilbrio de Nash em estrategias puras se, e somente se,

vl (A) = vc (A).

Exemplo 4.6 Considere o jogo de soma zero cujos payos do jogador


linha s
ao dados pela matriz A abaixo.

mnimo das linhas



3 1 1 0 0
0 0
1 2 0
A =
1 0 2 1 0
3 1 2 2 1
m
aximo das colunas 3 1 2 2

Como vl (A) = m
aximo dos mnimos das linhas = 1 = vc (A) = mnimo
dos maximos das colunas, segue-se que o jogo possui um equilbrio
de Nash em estrategias puras. De fato, a42 e um ponto de sela da
matriz A.

i i

i i
tdj
i i
2017/2/2
page 91
i i

[SEC. 4.3: JOGOS DE SOMA ZERO 91

Exemplo 4.7 Considere o jogo de soma zero cujos payos do jogador


linha s
ao dados pela matriz A abaixo.

mnimo das linhas



3 2 1 0 0
0 0
1 2 0
A =
1 0 2 1 0
3 1 2 2 1
m
aximo das colunas 3 2 2 2

Como vl (A) = m aximo dos mnimos das linhas = 1 < 2 = vc (A) =


mnimo dos maximos das colunas, segue-se que o jogo n
ao possui um
equilbrio de Nash em estrategias puras.

4.3.3 Equilbrio de Nash em estrat


egias mistas
Dena
vl (A) = max min pT Aq e vc (A) = min max pT Aq.
pm qn qn pm

Teorema 4.5 Para toda matriz A, tem-se vc (A) vl (A).

o: Temos que para todo p m ,


Demonstraca
pT Aq min pT Ay.
yn

Assim,
max pT Aq max min pT Ay = vl (A).
pm pm yn

Conseq
uentemente,
vc (A) = min max pT Aq max min pT Ay = vl (A).
qn pm pm yn

O pr
oximo teorema caracteriza a existencia de equilbrios de Nash
em estrategias mistas em termos das funcoes vl e vc .

i i

i i
tdj
i i
2017/2/2
page 92
i i

92 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

Teorema 4.6 Um perl de estrategias mistas (p , q ) e um


equilbrio de Nash de um jogo de dois jogadores com soma cons-
tante denido pela matriz de payos A do jogador linha se, e
somente se,
vl (A) = vc (A) = pT Aq .

Demonstrac
ao:
() Se (p , q ) e um equilbrio de Nash, entao

pT Aq = ul (p , q ) ul (p, q ) = pT Aq ,

para todo p m . Em particular,

pT Aq = max pT Aq min max pT Ay = vc (A).


pm yn pm

Vale tambem que

pT Aq = c uc (p , q ) c uc (p , q) = pT Aq,

para todo q n . Em particular,

pT Aq = min pT Aq max min xT Aq = vl (A).


qn xm qn

Desta maneira, vl (A) vc (A). Como, pelo teorema anterior, vl (A)


vc (A), conclumos que vl (A) = vc (A).
() Como vl (A) = maxpm minqn pT Aq, existe p m tal
que
vl (A) = min pT Aq.
qn

Analogamente, como vc (A) = minqn maxpm pT Aq, existe q


m tal
vc (A) = max pT Aq .
pm

Uma vez que, por hip


otese, vl (A) = vc (A), temos que

min pT Aq = vl (A) = vc (A) = max pT Aq .


qn pm

i i

i i
tdj
i i
2017/2/2
page 93
i i

[SEC. 4.3: JOGOS DE SOMA ZERO 93

Armamos que (p , q ) e um equilbrio de Nash do jogo. Com efeito,

ul (p , q ) = pT Aq min pT Aq =
qn

max pT Aq xT Aq = ul (x, q ),
pm

para todo x m . Por outro lado,

uc (p , q ) = c pT Aq c max pT Aq =
pm

c min pT Aq c pT Ay = uc (p , y),
qn

para todo y n . Desta maneira, (p , q ) e um equilbrio de Nash


do jogo.

4.3.4 O teorema minimax de von Neumann


O proximo teorema estabelece que, para jogos de dois jogadores
com soma zero, vl (A) = vc (A) sempre. Sendo assim, pelo teorema 4.6,
segue-se que, para esta classe de jogos, sempre existe pelo menos um
equilbrio de Nash em estrategias mistas.

Teorema 4.7 (minimax de von Neumann) Para todo jogo


de soma zero com dois jogadores, representado pela matriz
de payos A do jogador linha, sempre existe um perl de es-
trategias mistas (p , q ) m n satisfazendo

vl (A) = max min pT Aq


pm qn
=

pT Aq
=

min max pT Aq = vc (A).


qn pm

Em particular, (p , q ) e um equilbrio de Nash do jogo.

i i

i i
tdj
i i
2017/2/2
page 94
i i

94 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

Daremos uma demonstracao deste teorema minimax de von Neu-


mann usando o teorema de dualidade da teoria de programacao linear.
Lembramos que um problema de programacao linear e um problema
de otimizac
ao com funcao objetivo e restricoes lineares:

(problema primal)
maximizar bT y
sujeito a Ay c,
y 0,

onde as desigualdades devem ser interpretadas componente a com-


ponente. A cada problema de programacao linear (problema primal)
podemos associar um outro problema de otimizacao (problema dual):

(problema dual)
minimizar cT x
sujeito a x A bT ,
T

x 0.

Teorema 4.8 (da dualidade em programac


ao linear)

(a) O problema primal possui uma solucao se, e somente se, o


problema dual possui uma solucao.
(b) Se y e solucao do problema primal e x e solucao do pro-
blema dual, ent ao cT x = bT y .

Uma demonstrac ao do teorema de dualidade pode ser encontrada


em [14, 52].
Demonstrac ao do teorema minimax: sem perda de generalidade,
podemos assumir que todas as entradas da matriz de payos A do jo-
gador linha sao positivas. Caso contr
ario, basta substituir A por A =
A + D e B = A por B  = D + B, onde D = d 1 , com d >
max1im,1jn |aij |. Observe que A +B  = 0 (isto e, o jogo denido
 
pelas matrizes A e B tem soma zero) e que (p , q ) e um equilbrio

i i

i i
tdj
i i
2017/2/2
page 95
i i

[SEC. 4.3: JOGOS DE SOMA ZERO 95

de Nash para o jogo denido pela matriz A se, e somente se, (p , q )


e um equilbrio de Nash para o jogo denido pela matriz A. 
Sejam c = (1, 1, . . . , 1)T e b = (1, 1, . . . , 1)T . Considere os proble-
mas de programacao linear:
(problema primal)
maximizar bT y
sujeito a Ay c,
y 0,

(problema dual)
minimizar cT x
sujeito a x A bT ,
T

x 0.

Passo 1: o problema dual possui uma solucao.


Como A > 0, o conjunto admissvel

X = {x Rm | xT A bT e x 0}

e nao vazio. Por outro lado, como c = (1, 1, . . . , 1)T , a funcao ob-
jetivo do problema e escrita como x = (x1 , x2 , . . . , xm )  cT x =
x1 + x2 + + xm . Assim, o problema dual consiste em encontrar o
ponto do conjunto X mais pr oximo da origem segundo a norma da
soma || ||1 , um problema que certamente possui uma solucao pois,
se p X, entao podemos compacticar o conjunto admissvel in-
cluindo a restricao ||x||1 ||p||1 e, com isso, podemos usar o teorema
de Weierstrass para garantir a existencia de um mnimo.
Passo 2: construc ao do equilbrio de Nash.
Dado que o problema dual possui uma solucao, pelo teorema de
dualidade, o problema primal tambem possui. Mais ainda: se x e
solucao do problema dual e y e solucao do problema primal, entao

cT x = (x )T Ay = bT y .

Seja = cT x = bT y (que e > 0 pois (0, 0, . . . , 0) nao e admissvel)


e dena
x y
p = e q = .

i i

i i
tdj
i i
2017/2/2
page 96
i i

96 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

Armamos que (p , q ) e um equilbrio de Nash do jogo. Com efeito:


claramente p m e q n , pois p 0 (ja que x 0 e > 0),
q 0 (ja que y 0 e > 0),
m
 m
 x i cT x
pi = = = =1
i=1 i=1

e
m
 n
 yj bT y
qj = = = = 1.
j=1 j=1

Agora, como xT A bT , temos que para todo q n , xT Aq


T n
b q = j=1 qj = 1. Mas p = x /. Desta maneira, pT Aq =
pT Aq , para todo q n . Conseq
uentemente,

uc (p , q ) = pT Aq pT Aq = uc (p , q)

para todo q n . Mostramos entao que o jogador coluna nao pode


aumentar o seu payo esperado trocando q por q, se o jogador linha
mantiver a escolha p . Analogamente, como
m Ay c, temos que
para todo p m , pT Ay pT c = i=1 pi = 1. Mas y =
q /. Desta maneira, p Aq = pT Aq , para todo p m .
Consequentemente,

ul (p , q ) = pT Aq pT Aq = ul (p, q ),

para todo p m . Mostramos ent ao que o jogador linha nao pode


aumentar o seu payo esperado trocando p por p, se o jogador co-
luna mantiver a escolha q . Conclumos, portanto, que (p , q ) e um
equilbrio de Nash do jogo.

Alem de estabelecer a existencia de equilbrios de Nash, a demons-


tracao que demos sugere uma maneira de calcul a-los: resolvendo-se
dois problemas de programacao linear.

Exemplo 4.8 O governo deseja vacinar seus cidadaos contra um


certo vrus da gripe. Este vrus possui dois sorotipos, sendo que e
desconhecida a proporcao na qual os dois sorotipos ocorrem na po-
pulac
ao do vrus. Foram desenvolvidas duas vacinas onde a ecacia

i i

i i
tdj
i i
2017/2/2
page 97
i i

[SEC. 4.3: JOGOS DE SOMA ZERO 97

da vacina 1 e de 85% contra o sorotipo 1 e de 70% contra o soro-


tipo 2. A ecacia da vacina 2 e de 60% contra o sorotipo 1 e de 90%
contra o sorotipo 2. Qual poltica de vacinacao deveria ser tomada
pelo governo?
Esta situacao pode ser modelada como um jogo de soma zero
com dois jogadores, onde o jogador linha L (o governo) deseja obter
a maior compensacao (a fracao dos cidadaos resistentes ao vrus) o
maior possvel e o jogador coluna C (o vrus) deseja obter a maior
compensacao a menor possvel. A matriz de payos e a seguinte:

vrus
sorotipo 1 sorotipo 2
(85/100, 85/100) (70/100, 70/100)
governo

vacina 1

vacina 2 (60/100, 60/100) (90/100, 90/100)

Para encontrar um equilbrio de Nash, devemos resolver os seguintes


problemas de programacao linear

(problema primal)
maximizar ' y1 +(y'2 ( ' (
85/100 70/100 y1 1
sujeito a ,
60/100 90/100 ' y2 ( ' 1 (
y1 0
,
y2 0

(problema dual)
minimizar ' x1 + x2 (
 85/100 70/100 
sujeito a x1 x2 1 1 ,
60/100 90/100
' ( ' (
x1 0
,
x2 0

isto e,

i i

i i
tdj
i i
2017/2/2
page 98
i i

98 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

(problema primal)
maximizar y1 + y2
sujeito a 17y1 + 14y2 20,
6y1 + 9y2 10,
y1 0,
y2 0,

(problema dual)
minimizar x1 + x2
sujeito a 7x1 + 12x2 20,
7x1 + 9x2 10,
x1 0,
x2 0.

ao do problema dual e x = (20/23, 10/23) (Figura 4.7) e a


A soluc
ao do problema primal e y = (40/69, 50/69), com
soluc
30
= x1 + x2 = y1 + y2 = .
23
Desta maneira, o u nico equilbrio de Nash para o problema e dado
pelo ponto (p , q ), onde
   
x 2 1 y 4 5
p = = , e q = = , .
3 3 9 9

O teorema minimax de von Neumann garante que, para jogos de


soma zero, existem estrategias mistas p e q tais que:
(a) Se o jogador linha jogar com p , entao o seu ganho esperado
nunca e menor do que v = pT Aq , independentemente da es-
colha do jogador coluna.
(b) Se o jogador coluna jogar com q , entao a sua perda esperada
nunca e maior do que v = pT Aq , independentemente da esco-
lha do jogador linha.
Como efeito: como (p , q ) e um equilbrio de Nash em estrategias
mistas, segue-se que v = uc (p , q ) uc (p , q), q n , e v =

i i

i i
tdj
i i
2017/2/2
page 99
i i

[SEC. 4.3: JOGOS DE SOMA ZERO 99

x2

30/23

10/23

0 20/23 30/23 x1

Figura 4.7: Solucao do problema dual.

y1

30/23

50/69

0 40/69 30/23 y1

Figura 4.8: Solucao do problema primal.

i i

i i
tdj
i i
2017/2/2
page 100
i i

100 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

ul (p , q ) uc (p, q), p m . Mas uc (p, q) = pT Aq e ul (p, q) =


+pT Aq. Assim,

q n , v = uc (p , q ) uc (p , q)

T
q n , pAq pT Aq = v (4.3)

O ganho esperado do jogador linha nunca e menor
do que v se ele jogar com p , independentemente
da escolha q do jogador coluna.
e, analogamente,

p m , v = ul (p , q ) ul (p, q )

p m , pAq pT Aq = v
(4.4)

A perda esperada do jogador coluna nunca e maior
do que v se ele jogar com q , independentemente
da escolha p do jogador linha.
Mais ainda: se (p , q ) e um equilbrio de Nash do jogo, entao
n

aij qj = v , para todo i tal que pi > 0 e (4.5)
j=1
m
pi aij = v , para todo j tal que qj > 0. (4.6)
i=1

De fato: suponha,
n por absurdo, que exista algum ndice k tal que
pk > 0 e a
j=1 kj qj = v . Usando as desigualdades 4.4 com
n
p = ei , sabemos que j=1 aij qj v para todo i = 1, . . . , m. Logo,
n
se j=1 akj qj = v , entao nj=1 akj qj < v . Mas, ent
ao,

m
 n
 m


v = pi aij qj < pi v = v ,
i=1 j=1 i=1

i i

i i
tdj
i i
2017/2/2
page 101
i i

[SEC. 4.4: EQUILIBRIO DE NASH VIA UM PROBLEMA DE COMPLEMENTARIDADE 101

o que e uma contradicao. Um argumento analogo pode ser usado


para provar 4.6. Note que 4.5 e 4.6 nada mais sao do que as condicoes
estabelecidas no Corolario 4.1 na p
agina 80 para o caso particular de
jogos de soma zero.

4.4 Equilbrio de Nash via um problema


de complementaridade
4.4.1 Jogos bimatriciais
Sejam u1 (p, q) = pT Aq e u2 (p, q) = pT Bq sao, respectivamente,
as func
oes utilidade dos jogadores 1 e 2. Sem perda de generalidade,
podemos assumir que A > 0 e B > 0 pois, caso contr ario, basta
substituir A por A + c 1 e B por B + c 1 para alguma constante
c > 0 sucientemente grande. Observe agora que (p , q ) =
m n e um equilbrio de Nash em estrategias mistas do jogo se,
e somente se, p e q satisfazem os seguintes programas lineares, um
dependendo do outro:

maximizar (Aq )T p maximizar (B T p )T q


sujeito a Tm p = 1, sujeito a Tn q = 1,
p 0, q 0,

onde m e n sao, respectivamente, matrizes de tamanho m1 e n1


com todas as entradas iguais a 1. Os problemas duais destes dois PLs
s
ao dados por:

minimizar minimizar
sujeito a m Aq , sujeito a n B T p .

Se e a solucao
otima do primeiro problema dual, ent
ao pelo teo-
rema forte da dualidade, vale que (Aq )T p = . Mas (Aq )T p =
q T AT p = pT Aq e = (p m ) . Assim, pT Aq = (p m )
ou, equivalentemente,

pT (m Aq ) = 0. (4.7)

i i

i i
tdj
i i
2017/2/2
page 102
i i

102 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

Esta condicao diz que p e m Aq sao ortogonais. Dado que estes


vetores sao nao-negativos, eles tem que ser complementares, no sen-
tido que eles nao podem ter componentes positivas na mesma posicao.
Esta caracterizacao de um par primal-dual otimo e conhecida como
folgas complementares em programacao linear. Dado que p e uma
distribuicao de probabilidades, pelo menos uma de suas componen-
tes e positiva, de modo que a respectiva componente de m Aq
e zero e e a maior das entradas de Aq . Qualquer estrategia
pura i do jogador 1 e uma melhor resposta a q se, e somente se,
a i-esima componente de m Aq e igual a zero. Desta forma,
a Equac ao 4.7 obtem o Corolario 4.1 na pagina 80: uma estrategia
mista p e uma melhor resposta para q se, e somente se, ela da pro-
babilidade positiva apenas para as estrategias puras que sao melhores
respostas para q . Analogamente, se e a solucao otima do segundo
problema dual, entao
qT (n B T p ) = 0. (4.8)

Teorema 4.9 O perl de estrategias mistas (p , q ) e um


umeros reais
equilbrio de Nash se, e somente se, existem n

e tais que

Tm p = 1,
Tn q = 1,
m Aq 0, (4.9)
n B T p 0,
p, q 0,

e as Equac
oes 4.7 e 4.7 sejam satisfeitas.

Dado um vetor t Rn e uma matriz M de tamanho n n, o


problema de complementaridade linear (PCL) associado ao par (t, M )
consiste em encontrar z, w Rn tais que
w + M z = t, w 0, z0 e zT w = 0.
Veremos agora como caracterizar os equilbrios de Nash em estra-
tegias mistas de jogos bimatriciais (jogos nitos com apenas dois

i i

i i
tdj
i i
2017/2/2
page 103
i i

[SEC. 4.4: EQUILIBRIO DE NASH VIA UM PROBLEMA DE COMPLEMENTARIDADE 103

jogadores) atraves de um problema de complementaridade linear.


Se (p , q ) e um equilbrio de Nash do jogo, entao

u1 (p , q ) = pT Aq pT Aq = u1 (p, q ), p m .

Mas, por linearidade, pT Aq pT Aq para todo p m se, e


somente se, pT Aq eTi Aq , i = 1, . . . , m, onde ei representa
o i-esimo vetor da base can
onica. Mas, ent
ao,

(pT Aq )m (eTi Aq )m = m (eTi Aq ) = (m eTi )(Aq ) = Aq .

Analogamente, como

u2 (p , q ) = pT Bq pT Bq = u2 (p , q), q n ,

segue-se que pT Bq pT Bej = eTj B T p , j = 1, . . . , n e, por-


tanto,

(pT Bq )n (eTj B T p )m =
m (eTj B T p ) = (m eTj )(B T p ) = B T p .
Desta maneira, (p , q ) e um equilbrio de Nash se, e somente se,

(pT Aq )m Aq e (pT Bq )n B T p . (4.10)

Como A e B possuem todas as entradas positivas, segue-se que os


umeros pT Aq e pT Bq sao positivos. Sejam ent
n ao
p q
x = e y = .
pT Bq pT Aq

Introduzindoas variaveis de folga w = (u , v ), vemos que se (p , q )


e um equilbrio de Nash, entao z = (x , y ) e w constituem uma
solucao do problema de complementaridade linear

w + M z = t, w 0, z0 e zT w = 0,

onde ' ( ' (


t=
m 0 A
e M= .
n BT 0

i i

i i
tdj
i i
2017/2/2
page 104
i i

104 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

Reciprocamente, se z = (x , y ) e w = (u , v ) constituem uma


solucao do problema de complementaridade linear acima, entao

x y
p = e q =
Tm x Tn y
constituem um equilbrio de Nash do jogo bimatricial.
Alem de programacao linear, programacao quadratica e teoria dos
jogos, aplicacoes do problema de complementaridade linear incluem
o estudo de modelos nanceiros, a analise n ao-linear de certas estru-
turas elasto-pl asticas e muitas outras areas ([64]).

4.4.2 O algoritmo de Lemke-Howson


Um dos metodos mais importantes para se encontrar uma solucao
de um PCL e o algoritmo de Lemke-Howson. Ele foi apresentado no
artigo [49] em 1964. Muito mais do que um metodo de calculo de
equilbrios de jogos bimatriciais, o algoritmo de Lemke-Howson d a
uma prova algebrica construtiva para a existencia de equilbrios, alem
de estabelecer que, genericamente, o n umero de equilbrios de Nash e
nito e mpar. Sendo similar ao algoritmo Simplex para programacao
linear, sua complexidade e exponencial ([84]). Alem do artigo origi-
nal, o leitor interessado em mais detalhes do algoritmo pode consultar
a referencia [87].

4.5 Gambit
Desenvolvido por Richard D. McKelvey (California Institute of
Technology), Andrew M. McLennan (University of Minnesota) e The-
odore L. Turocy (Texas A&M University), Gambit e um programa de
computador, gratuito e multiplataforma, orientado para a construcao
e an
alise de jogos nitos. Ele oferece uma interface graca intuitiva
para o calculo de equilbrios de Nash e a analise das estruturas de
dominancia das estrategias do jogo. Para baix
a-lo, acesse o endereco:

http://econweb.tamu.edu/gambit.

i i

i i
tdj
i i
2017/2/2
page 105
i i

[SEC. 4.5: GAMBIT 105

Figura 4.9: Gambit eliminando as estrategias fracamente domina-


das do Jogo da Segunda Gerra Mundial descrito no
Exerccio 6 na pagina 54.

i i

i i
tdj
i i
2017/2/2
page 106
i i

106 [CAP. 4: CALCULANDO EQUILIBRIOS DE NASH

Observa c
ao. A equipe do Gambit recentemente desenvolveu uma
vers
ao on-line do software que est
a disponvel no endereco: http:
//gte.csc.liv.ac.uk/gte/builder/ (e preciso habilitar o uso de
janelas pop-up).

4.6 Exerccios
[01] Calcule os pontos de sela da matriz

24 23 22 25
10 22 20 19
A= 27
.
25 22 23
20 28 16 15

[02] Como no Exemplo 4.8, escreva os problemas primal e dual do


jogo de comparar moedas (Exemplo 2.6, p agina 22). Resolva
estes problemas de otimizacao para encontrar o equilbrio de
Nash em estrategias mistas do jogo.

[03] Mostre como encontrar pelo menos um equilbrio de Nash de


um jogo de soma zero 2 2 geral.

[04] Encontre pelo menos um equilbrio de Nash em estrategias mis-


tas do jogo de soma zero denido pela matriz
' (
1 +5 +1 2
A= .
+1 3 2 +5

[05] Sejam p m e q n duas estrategias mistas de um jogo


de soma zero com dois jogadores. Mostre que se o mnimo dos
ganhos medios do jogador linha usando p e igual ao maximo
das perdas medias do jogador coluna usando q , isto e, se

min ul (p , el ) = max (uc (ek , q )),


1ln 1km

entao (p , q ) e um equilbrio de Nash do jogo. Aqui ek re-


presenta o k-esimo vetor da base can onica de Rm e el o l-
n
esimo vetor da base can onica de R . Use este resultado para

i i

i i
tdj
i i
2017/2/2
page 107
i i

[SEC. 4.6: EXERCICIOS 107

mostrar que as estrategias mistas p = (6/37, 20/37, 0, 11/37)


e q = (14/37, 4/37, 0, 19/37, 0) constituem um equilbrio de
Nash do jogo de soma zero denido pela matriz

5 8 3 1 6
4 2 6 3 5
A= 2 4 6 4 1 .

1 3 2 5 3

[06] (Jogos de quadrados ma gicos) Um quadrado m agico e uma


matriz quadrada n n cujas entradas sao constitudas pelos
umeros 1, 2, . . . , n2 , arranjados de tal forma que a soma das
n
n entradas em qualquer linha, coluna ou diagonal principal e
sempre o mesmo n umero. Mostre como encontrar pelo menos
um equilbrio de Nash em estrategias mistas de um jogo de soma
zero cuja matriz e um quadrado m agico. Aplique a tecnica para
a matriz
16 3 2 13
5 10 11 8
A= 9 6 7 12 .

4 15 14 1
Este quadrado magico aparece na gravura Melencolia I de Al-
brecht D
urer:

http://en.wikipedia.org/wiki/Melancholia_I.

[07] Considere um jogo de soma zero denido por uma matriz A


inversvel que possui um equilbrio de Nash (p , q ) totalmente
misto (isto e, 0 < pi , qj < 1 para todo i, j {1, . . . , n}). Mostre
que
T A1 A1
p = T 1 e q = T 1 ,
A A
 T
onde = 1 1 .

i i

i i
tdj
i i
2017/2/2
page 108
i i

Captulo 5

Jogos na forma extensa

A forma normal de um jogo e usada em situacoes onde os jogado-


res escolhem sua estrategia simultaneamente ou o fazem sem conhecer
a estrategia dos outros jogadores. Contudo, existem situacoes em que
os jogadores tomam suas decisoes de forma seq uencial, depois de ob-
servar a acao que um outro jogador realizou. A forma extensa tem
uma estrutura mais adequada para analisar jogos desta natureza, es-
pecicando assim quem se move, quando, com qual informacao e o
ganho de cada jogador. Ela contem toda informacao sobre um jogo.
Existem v arias formas de se representar um jogo da forma extensa, to-
das elas tentando formalizar a ideia de arvore. Entre elas: (1) relacoes
de ordem, (2) teoria de grafos ([41]) e (3) alfabetos ([27]). Nossa abor-
dagem aqui sera mais informal. Trataremos dos jogos seq uencias de
informacao perfeita: os ganhos sao de conhecimento comum de todos
os jogadores, um u nico jogador faz um movimento por vez e cada
jogador conhece as escolhas dos jogadores que o antecederam toda
vez que for jogar.

5.1 Definic
ao
Um jogo na forma extensa (tambem denominado jogo sequencial)
e aquele em que os jogadores realizam seus movimentos em uma or-
dem predeterminada. Por este motivo, uma maneira muito adequada

108

i i

i i
tdj
i i
2017/2/2
page 109
i i

[SEC. 5.1: DEFINIC


AO 109

de se representar um jogo na forma extensa e atraves de uma arvore.


Por exemplo, na Figura 5.1, o jogador 1 joga primeiro: ele pode es-
colher entre as acoes a e b. Depois, e a vez do jogador 2 jogar. Se 1
jogou a, ent
ao 2 pode escolher entre c ou d e, se 1 jogou b, entao 2 pode
escolher entre e e f . Depois que todos jogadores realizaram (seq uen-
cialmente) suas acoes, cada jogador recebe o seu ganho. A convencao
e que a primeira coordenada do vetor de payos represente o ganho
de quem jogou em primeiro lugar, a segunda coordenada represente
o ganho de quem jogou em segundo lugar, e assim por diante.

c (2, 4)
2
d
a
(1, 0)
1
b
e (6, 12)
2
f
(9, {1)

Figura 5.1: Um jogo na forma extensa.

Uma arvore e composta por n os e ramos. Os ramos representam


as ac
oes dos jogadores. No jogo da Figura 5.1 existem 6 ramos: a, b,
c, d, e e f . Alguns sao do jogador 1 (a e b), enquanto que outros sao
do jogador 2 (c, d, e e f ). Os nos s
ao de dois tipos: existem aqueles
que emanam ramos e existem aqueles que nao. Estes u ltimos sao as
folhas da arvore e neles estao os valores dos payos dos jogadores.
Um no que n ao e uma folha identica o jogador que deve escolher
uma das acoes representadas pelos ramos que saem do n o. Nos que
n
ao sao folhas s ao denominados n os de decisao. Por exemplo, no
primeiro no (tambem denominado raiz da arvore) o jogador 1 que
deve fazer a sua escolha entre os ramos (acoes) a e b.
Uma estrategia de um jogador e um plano de acao completo que
especica uma acao factvel deste jogador em cada no de decis ao
em que o jogador pode atuar. No jogo da Figura 5.1, o jogador 1
tem apenas um n o de decis ao. Por este motivo, suas estrategias se

i i

i i
tdj
i i
2017/2/2
page 110
i i

110 [CAP. 5: JOGOS NA FORMA EXTENSA

confundem com suas acoes:

S1 = {a, b}.

Por outro lado, o jogador 2 tem dois nos de decis ao: um que se segue
depois que o jogador 1 jogou a e o outro depois que o jogador 1 jogou b.
Por este motivo, cada estrategia do jogador 2 deve conter duas acoes:
uma para o primeiro no e a outra para o outro n o. Assim, uma
estrategia possvel para o jogador 2 e jogar c se o jogador 1 jogar a
e jogar f se o jogador 1 jogar b. Outra e jogar c se o jogador 1
jogar a e jogar e se o jogador 1 jogar b. Escrevendo apenas as acoes
que o jogador 2 pode tomar em cada n o de decisao, o conjunto de
suas estrategias pode ser entao representado da seguinte maneira:

S2 = {(c, e), (c, f ), (d, e), (d, f )}.


muito importante notar a diferenca entre acoes e estrategias. Neste
E
contexto, (c, e) e uma estrategia do jogador 2, enquanto que c e e sao
acoes (uma para cada n o de decisao do jogador). Uma acao e um
conceito local: ela representa o comportamento do jogador em um
momento particular do jogo, isto e, em um n o de decisao. Uma
estrategia e um conceito global: ela especica o comportamento do
jogador no jogo inteiro, isto e, em todos os nos de decis
ao do jogador.
Mais exemplos: no jogo da Figura 5.2,

S1 = {a, b}, S2 = {(c, e), (c, f ), (c, g), (d, e), (d, f ), (d, g)}

e, no jogo da Figura 5.3,

S1 = {(a, l, p), (a, l, q), (a, m, p), (a, m, q),


(b, l, p), (b, l, q), (b, m, p), (b, m, q)}

e
S2 = {(c, e), (c, f ), (d, e), (d, f )}.

5.2 Equilbrio de Nash


A denic
ao de equilbrio de Nash para jogos seq
uenciais e a mesma
dada para jogos na forma normal: se Si e o conjunto de estrategias

i i

i i
tdj
i i
2017/2/2
page 111
i i

[SEC. 5.2: EQUILIBRIO DE NASH 111

c (2, 4)
2
d
a (1, 0)
1

b (6, 12)
e
2 f
(9, {1)
g

(8, 9)

Figura 5.2: Um jogo na forma extensa.

c (2, 4)
2
d

a (1, 10)
1
l (2, 3)
1
m
e
b (1, 4)
2
f
p (5, 0)
1
q

(5, 4)

Figura 5.3: Um jogo na forma extensa.

i i

i i
tdj
i i
2017/2/2
page 112
i i

112 [CAP. 5: JOGOS NA FORMA EXTENSA

do jogador i, 1 i n, entao um perl de estrategias

s = (s1 , . . . , si , . . . , sn ) S1 Si Sn

e um equilbrio de Nash (em estrategias puras) se

ui (si , si ) ui (siji , si )

para todo i = 1, . . . , n e para todo ji = 1, . . . , mi , com mi o n umero


de estrategias do jogador i. A caracterizacao via funcoes de melhor
resposta tambem pode ser usada: s = (s1 , . . . , si , . . . , sn ) S e um
equilbrio de Nash em estrategias se, e somente se, si MRi (si )
para todo i = 1, . . . , n, onde MRi (si ) = argmaxsi Si ui (si , si ).
No jogo da Figura 5.4, temos que

S1 = {a, b}, S2 = {(c, e), (c, f ), (d, e), (d, f )}

Assim, existem 8 pers de estrategias:

S = S1 S2 = {(a, (c, e)), (a, (c, f )), (a, (d, e)), (a, (d, f )),
(b, (c, e)), (b, (c, f )), (b, (d, e)), (b, (d, f ))}.

c (2, 4)
2
d
a
(1, 9)
1
b
e (5, 0)
2
f
(5, 4)

Figura 5.4: Calculando equilbrios de Nash em um jogo seq


uencial.

Vamos mostrar que o perl (a, (c, f )) n


ao e um equilbrio de Nash
do jogo. Inicialmente, observe que, para calcular o ganho dos joga-
dores associado a um determinado perl de estrategias, basta seguir

i i

i i
tdj
i i
2017/2/2
page 113
i i

[SEC. 5.2: EQUILIBRIO DE NASH 113

o caminho de execuc ao do jogo. Por exemplo, para o perl de es-


trategia (a, (c, f )), a execucao do jogo se da da seguinte maneira:
o jogador 1 escolhe a acao a e, em seguida, o jogador 2 escolhe a
acao c, o que resulta no ganho 2 para o jogador 1 (Figura 5.5). J a,
para o perl de estrategia (b, (c, f )), o jogador 1 escolhe a acao a
e o jogador 2 escolhe a acao f , dando o ganho 5 para o jogador 1
(Figura 5.6).

c (2, 4)
2
d
a
(1, 9)
1
b
e (5, 0)
2
f
(5, 4)

Figura 5.5: Caminho de execucao associado ao perl de estrate-


gias (a, (c, f )).

c (2, 4)
2
d
a
(1, 9)
1
b
e (5, 0)
2
f
(5, 4)

Figura 5.6: Caminho de execucao associado ao perl de estrate-


gias (b, (c, f )).

Desta maneira, se o jogador 2 mantiver a sua estrategia (c, f ), o


jogador 1 ganhar
a mais trocando sua estrategia a pela estrategia b:

u1 (a, (c, f )) = 2 < 5 = u1 (b, (c, f )).

i i

i i
tdj
i i
2017/2/2
page 114
i i

114 [CAP. 5: JOGOS NA FORMA EXTENSA

Isto mostra que (a, (c, f )) n ao e um equilbrio de Nash. O per-


l (b, (c, f )), por sua vez, e um equilbrio de Nash, pois

u1 (b, (c, f )) = 5 > 2 = u1 (a, (c, f ))

e
u2 (b, (c, f )) = 4 > 0 = u2 (b, (c, e)),
u2 (b, (c, f )) = 4 > 0 = u2 (b, (d, e)),
u2 (b, (c, f )) = 4 4 = u2 (b, (d, f )).
O jogo possui mais um equilbrio de Nash: o perl (b, (c, f )).

5.3 Inducao retroativa e equilbrio per-


feito em subjogos
A induc ao retroativa e um processo que produz um perl de es-
trategias com a propriedade de que se cada jogador seguir as reco-
mendac oes de ac
oes estabelecidas pelo perl, ent ao suas estrategias
ser
ao otimas em cada n o de decis ao onde o jogador pode atuar.
O algoritmo e simples. Comecando pelos n os de decis ao nais,
determinamos as melhores acoes disponveis para os jogadores que
vao atuar nestes n os. Isto e facil de se fazer, ja que n ao existem
outros n os de decisao que sucedem os n os em questao: basta, em
cada n o de decisao nal, escolher a acao que de ao jogador do no
o maior payo possvel. Se existe um empate entre duas acoes que
levam ao maior payo, escolhemos uma delas arbitrariamente. Feito
isto, as acoes escolhidas sao marcadas e, as demais, ignoradas. Este
processo agora e repetido para os pen ultimos nos de decis ao, para os
antepen ultimos, etc., ate que a raiz da arvore seja alcancada.
Por exemplo, no jogo seq uencial da Figura 5.3, os u ltimos nos de
decisao sao , e . Assim, no passo 1 da inducao retroativa, o joga-
dor 2 marca a ac ao d no no e o jogador 1 marca as acoes l e p nos
nos e , respectivamente (Figura 5.7). No passo 2, o jogador 2 marca
a ac
ao e no n o (Figura 5.8). Finalmente, no passo 3, o jogador 1
marca a acao b (Figura 5.9). O perl de estrategias obtido e

((b, l, p), (d, e)).

i i

i i
tdj
i i
2017/2/2
page 115
i i

[SEC. 5.3: INDUC RETROATIVA E EQUILIBRIO PERFEITO EM SUBJOGOS


AO 115

c (2, 4)
2
d

a (1, 10)
1
l (2, 3)
1
m
e
b (1, 4)
2
f
p (5, 0)
1
q

(5, 4)

Figura 5.7: Inducao retroativa: passo 1.

c (2, 4)
2
d

a (1, 10)
1
l (2, 3)
1
m
e
b (1, 4)
2
f
p (5, 0)
1
q

(5, 4)

Figura 5.8: Inducao retroativa: passo 2.

i i

i i
tdj
i i
2017/2/2
page 116
i i

116 [CAP. 5: JOGOS NA FORMA EXTENSA

c (2, 4)
2
d

a (1, 10)
1
l (2, 3)
1
m
e
b (1, 4)
2
f
p (5, 0)
1
q

(5, 4)

Figura 5.9: Inducao retroativa: passo 3.

O processo de inducao retroativa d a, portanto, um algoritmo para


encontrar um equilbrio de Nash em estrategias puras de um jogo
seq
uencial com informacao perfeita. Note, contudo, que nem todo
equilbrio de Nash pode ser obtido por inducao retroativa. O perl
de estrategias (b, d) do jogo da Figura 5.10 e um equilbrio de Nash
que n ao e obtido por inducao retroativa.

c (2, 1)
2
d
a
(0, 0)
1
b

(1, 2)

Figura 5.10: (b, d) e um equilbrio de Nash que nao e obtido por


induc
ao retroativa.

Seja um dos n os de decis


ao de um jogo G. O subjogo que
comeca em e o jogo obtido copiando-se todos os n os de decisao,
ramos e payos do jogo original que sucedem . Por exemplo, no
jogo da Figura 5.3, o subjogo que comeca no de decis
ao , e o jogo

i i

i i
tdj
i i
2017/2/2
page 117
i i

[SEC. 5.3: INDUC RETROATIVA E EQUILIBRIO PERFEITO EM SUBJOGOS


AO 117

da Figura 5.11.

l (2, 3)
1
m
e
2 (1, 4)

f
p (5, 0)
1
q

(5, 4)

Figura 5.11: Subjogo que comeca no n


o do jogo da Figura 5.3.

Dizemos que um perl de estrategias (puras) s e um equilbrio


perfeito em subjogos de um jogo seq uencial G se os respectivos sub-
pers de s sao equilbrios de Nash de cada subjogo de G. Como
veremos, este equilbrio idealizado por Reinhard Selten, tem forte co-
nexao com o processo de inducao retroativa. De fato: considere, por
exemplo, o jogo da Figura 5.3. Se
s = ((a , a , a ), (a , a ))
e um equilbrio perfeito em subjogos deste jogo, entao (a ) e (a )
devem ser equilbrios de Nash dos subjogos que comecam nos nos
e , respectivamente. Mas, neste caso, a e a devem ser acoes que
maximizem o ganho do jogador 1 nestes nos. Sendo assim, conclumos
que a = l e a = p ou a = q. Tomemos a = p. Do mesmo modo,
como (a ) deve ser um equilbrio de Nash do subjogo que comeca no
no , vemos que o jogador 2 escolhera a = d. Entao, nesta primeira
iterac
ao, j
a podemos armar que
s = ((a , l, p), (d, a )).
Agora, se a = e, o jogador 2 ganhar a 3 (ja que o jogador 1 escolhe l
neste caso) e, se a = f , o jogador 2 ganhar a 0 (ja que o jogador 1
escolhe p neste caso). Como (a , (l, p)) deve ser um equilbrio de
Nash do subjogo que comeca no n o , segue-se que, obrigatoriamente,
a = e. Assim, ap os a segunda iteracao, vale que
s = ((a , l, p), (d, e)).

i i

i i
tdj
i i
2017/2/2
page 118
i i

118 [CAP. 5: JOGOS NA FORMA EXTENSA

Como as acoes nos n os , , e  ja estao agora todas determinadas,


acil de ver que se s = ((a , l, p), (d, e)) e um equilbrio de Nash do
e f
jogo original, entao a = b. Assim, o equilbrio perfeito em subjogos e

s = ((b, l, p), (d, e)).

Note que a imposic ao de que os respectivos subpers de s sejam


equilbrios de Nash de cada subjogo de G induz a mesma selecao de
por este
acoes que seria feita no processo de inducao retroativa. E
motivo que os equilbrios perfeitos em subjogos coincidem com os
equilbrios obtidos por inducao retroativa.

5.4 O teorema de Kuhn-Zermelo

Teorema 5.1 (Kuhn-Zermelo) Todo jogo seq uencial de in-


formacao perfeita possui pelo menos um equilbrio de Nash em
estrategias puras.

Ideia da prova. A demonstracao e feita por inducao. Se o jogo possui


apenas um u nico no de decis
ao, entao o teorema e verdadeiro: o jo-
gador que age neste no escolhe uma acao que maximiza o seu payo.
Os outros jogadores, se existirem, tem espacos de estrategias vazios.
Suponha ent ao que todo jogo com menos do que m > 1 nos de de-
cisao possua pelo menos um equilbrio de Nash. Escolhendo um no de
decisao que sucede imediatamente a raiz da arvore do jogo, cria-
remos dois jogos. O primeiro e o subjogo G que comeca em . Pela
hipotese de inducao, G possui pelo menos um equilbrio de Nash s .
O segundo jogo, G , e construdo da seguinte maneira: removemos
de G o subjogo G e no , que antes era de decis ao, criamos uma
folha cujos payos s ao dados pelos payos associados ao equilbrio s
de G . Novamente, pela hip otese de inducao, G possui pelo me-
nos um equilbrio de Nash s . Se a acao em s nao usa o ramo a
que liga a em G , entao s e um equilbrio de Nash do jogo
original G. Por outro lado, se s usa o ramo a, entao (a, s ) e um
equilbrio de Nash do jogo original G.

i i

i i
tdj
i i
2017/2/2
page 119
i i

[SEC. 5.5: EXERCICIOS 119

5.5 Exerccios
[01] (Jogo da centop eia) Use inducao retroativa para obter um
equilbrio de Nash do jogo seq uencial da gura abaixo. O
equilbrio e Pareto eciente?
1 Continuar 2 Continuar 1 Continuar 2 Continuar
(64, 16)
Parar

Parar

Parar

Parar
(4, 1) (2, 8) (16, 4) (8, 32) .

Este jogo foi desenvolvido pelo economista Robert W. Rosenthal,


mas o seu nome e devido a Kenneth Binmore.
[02] (Jogo da confianc a) Use inducao retroativa para obter um
equilbrio de Nash do jogo seq uencial da gura abaixo. O equi-
lbrio e Pareto eciente?

trair ({1, 2)
2
fiar
con honrar ( 1, 1)
1

no
con
fiar
(0, 0) .

i i

i i
tdj
i i
2017/2/2
page 120
i i

Captulo 6

Exemplos

6.1 O jogo Le Her simplificado


Nesta secao estudaremos a vers ao simplicada do jogo Le Her,
como apresentada por Benjamim e Goldman em [05]. Dois jogadores
empregam um pacote de 13 cartas do mesmo naipe (A, 2, . . . , 10,
Q, J e K). Ap os um sistema de distribuicao e troca de cartas que
descreveremos a seguir, o vencedor e aquele com a maior carta (A <
2 < < 10 < Q < J < K).
Inicialmente, o jogador 1 embaralha as 13 cartas e distribui uma
carta X para si, uma carta Y para o jogador 2 e deixa o restante
das cartas em um monte Z, sem que nenhum dos dois jogadores
veja as cartas. Feito isto, cada jogador ve sua carta, mas nao as
outras. O jogador 1 deve entao decidir se mantem a sua carta ou
a troca com o jogador 2 (que nao pode se negar a fazer a troca).
No primeiro caso, e a vez do jogador 2 decidir se ele mantem a sua
carta (a u nica que ele conhece ate o momento) ou se ele faz a troca
com a primeira carta do monte Z. Depois que o jogador 2 faz a sua
escolha, os jogadores mostram as suas cartas e vence aquele com a
maior carta. No segundo caso, os dois jogadores conhecem os valores
das duas cartas X e Y e o jogador 2 nao tem escolha alguma: se,
depois da troca, a sua carta for menor do que a carta do jogador 1,
entao ele deve obrigatoriamente troca-la com a carta do monte Z
na esperanca de obter uma carta maior para vencer o jogo, caso

120

i i

i i
tdj
i i
2017/2/2
page 121
i i

[SEC. 6.1: O JOGO LE HER SIMPLIFICADO 121

contr
ario, ele mantem a sua carta e vence o jogo. O leitor interessado
pode se familiarizar com as regras do jogo atuando como o jogador 2
no applet Java disponvel no endereco:

http://www.professores.uff.br/hjbortol/arquivo/2007.1/
applets/leher1_br.html.

Quais sao as estrategias puras do jogador 1? Cada estrategia pura


corresponde a uma escolha de um subconjunto formado pelas cartas
que ele ira manter na primeira etapa do jogo. Por exemplo, a escolha
do subconjunto {5, 7, 9} corresponde `a estrategia pura do jogador 1
em manter a sua carta se, e somente se, ela for igual a 5, 7 ou 9. Desta
maneira, existem tantas estrategias puras quantos subconjuntos do
conjunto
D = {A, 2, 3, 4, 5, 6, 7, 8, 9, 10, Q, J, K},
isto e, existem um total de 213 = 8192 estrategias puras para o joga-
dor 1. O mesmo vale para o jogador 2: ele tem 213 estrategias puras
que est ao em correspondencia biunvoca com os 213 subconjuntos

i i

i i
tdj
i i
2017/2/2
page 122
i i

122 [CAP. 6: EXEMPLOS

distintos de D, cada um especicando quais cartas o jogador 2 ira


manter. E importante observar mais uma vez que o jogador 2 s o faz
uma escolha (a de manter a sua carta Y ou troca-la com uma carta
do monte Z) quando o jogador 1 decide por manter a sua carta X.
Se o jogador 1 resolve trocar de cartas, a acao do jogador 2 esta com-
pletamente determinada pelos valores das cartas X e Y (supondo,
naturalmente, que o jogador 2 seja racional).
A matriz de payos do jogo tem, portanto, dimensao 213 213 .
Este tamanho pode ser reduzido consideravelmente observando que
estrategias puras com saltos s
ao dominadas por aquelas sem sal-
tos. Por exemplo, a estrategia pura

{5, 7, 9}

(manter apenas as cartas 5, 7 e 9) e dominada pela estrategia pura

{5, 6, 7, 8, 9, 10, Q, J, K}

(manter apenas as cartas maiores do que ou iguais a 5). Assim, ao


inves de considerar todos os 213 subconjuntos de D, podemos nos
restringir aos 13 subconjuntos da forma {C D | C C},  onde
C D. No que se segue, usaremos o seguinte abuso de notacao

A = {A, 2, 3, 4, 5, 6, 7, 9, 9, 10, Q, J, K},


2 = {2, 3, 4, 5, 6, 7, 9, 9, 10, Q, J, K},
3 = {3, 4, 5, 6, 7, 9, 9, 10, Q, J, K}, . . .

para representar estas estrategias puras dominantes de cada jogador.


O ganho do jogador 1 e sua probabilidade de vitoria que, eviden-
temente, depende das estrategias puras (dominantes) escolhidas pelos
dois jogadores. Atraves de calculos com probabilidades condicionais
(como em [05]) ou atraves de uma enumeracao direta (veja o ap-
plet Java disponvel no endereco http://www.professores.uff.br/
hjbortol/arquivo/2007.1/applets/leher2_br.html), obtemos a
matriz de payos apresentada na tabela 6.1, onde as probabilidades
foram calculadas com 3 casas decimais corretas. Como o jogo e de
soma zero (isto e, um jogador vence se, e somente se, o outro perde),
a matriz de payos do jogador 2 e a matriz de payofs do jogador 1
multiplicada por 1.

i i

i i
i
i

i
i

jogador 2
A 2 3 4 5 6 7 8 9 10 Q J K
A 0.500 0.462 0.429 0.404 0.385 0.372 0.365 0.365 0.372 0.385 0.404 0.429 0.462
2 0.538 0.500 0.468 0.442 0.423 0.410 0.404 0.404 0.410 0.423 0.442 0.468 0.500
3 0.571 0.538 0.506 0.480 0.460 0.447 0.440 0.439 0.445 0.457 0.476 0.501 0.533
4 0.596 0.569 0.543 0.517 0.496 0.481 0.473 0.471 0.476 0.487 0.505 0.529 0.559
5 0.613 0.592 0.571 0.550 0.529 0.513 0.503 0.499 0.502 0.512 0.527 0.550 0.578
6 0.622 0.606 0.590 0.573 0.557 0.541 0.529 0.523 0.523 0.530 0.544 0.564 0.590
[SEC. 6.1: O JOGO LE HER SIMPLIFICADO

7 0.623 0.611 0.598 0.586 0.574 0.562 0.550 0.541 0.538 0.543 0.553 0.570 0.593

jogador 1
8 0.614 0.605 0.597 0.588 0.579 0.571 0.562 0.553 0.547 0.548 0.555 0.568 0.588
9 0.596 0.590 0.584 0.578 0.572 0.566 0.561 0.555 0.549 0.545 0.548 0.558 0.573
10 0.566 0.563 0.559 0.556 0.552 0.549 0.545 0.542 0.538 0.535 0.533 0.538 0.549
Q 0.526 0.524 0.523 0.521 0.519 0.517 0.516 0.514 0.512 0.510 0.509 0.508 0.514
J 0.474 0.474 0.473 0.473 0.472 0.471 0.471 0.470 0.470 0.469 0.469 0.468 0.468
K 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410 0.410

Tabela 6.1: Matriz de payos do jogador 1 para o jogo Le Her.


123

i
i
tdj

i
i
page 123
2017/2/2
2017/2/2
page 124
i

i
tdj
i

i
[CAP. 6: EXEMPLOS

jogador 2
A 2 3 4 5 6 7 8 9 10 Q J K
jogador 1

7 0.623 0.611 0.598 0.586 0.574 0.562 0.550 0.541 0.538 0.543 0.553 0.570 0.593
8 0.614 0.605 0.597 0.588 0.579 0.571 0.562 0.553 0.547 0.548 0.555 0.568 0.588
9 0.596 0.590 0.584 0.578 0.572 0.566 0.561 0.555 0.549 0.545 0.548 0.558 0.573
Tabela 6.2: Matriz de payos do jogador 1 para o jogo Le Her apos mais uma eliminac
ao de estrategias
estritamente dominadas.
124
i

i
i

i
tdj
i i
2017/2/2
page 125
i i

[SEC. 6.1: O JOGO LE HER SIMPLIFICADO 125

Vamos usar domin ancia para simplicar ainda mais a matriz do


jogo. Observe que as estrategias 7 e 9 do jogador 1 dominam, respec-
tivamente, as estrategias de A a 6 e de 10 a K (isto e, o jogador 1
deve sempre trocar cartas 6 e deve sempre manter cartas 10).
Eliminando-se entao as linhas estritamente dominadas, obtemos a
matriz da tabela 6.2. Para esta matriz reduzida, as estrategias 9
e 10 do jogador 2 dominam, respectivamente, as estrategias de A a 8
e de Q a K (isto e, o jogador 2 deve sempre trocar cartas 8 e deve
sempre manter as cartas Q, J e K. Eliminando-se ent ao as colunas
estritamente dominadas, obtemos a matriz da tabela 6.3.

jogador 2
9 10
jogador 1

7 0.538 0.543
8 0.547 0.548
9 0.549 0.545

Tabela 6.3: Matriz de payos do jogador 1 para o jogo Le Her apos


mais uma eliminacao de estrategias estritamente domi-
nadas.

Finalmente, vemos que para esta matriz reduzida, a estrategia 8 do


jogador 1 domina estritamente a estrategia 7. Eliminando-a, obtemos
a matriz 2 2 da tabela 6.4.

jogador 2
9 10
jogador 1

8 0.547 0.548
9 0.549 0.545

Tabela 6.4: Matriz de payos do jogador 1 para o jogo Le Her apos


mais uma eliminacao de estrategias estritamente domi-
nadas.

Usando-se programacao linear ou funcoes de melhor resposta, po-


demos calcular facilmente o equilbrio de Nash em estrategias mistas

i i

i i
tdj
i i
2017/2/2
page 126
i i

126 [CAP. 6: EXEMPLOS

deste jogo 2 2:

(p1 , p2 ) = (4/5, 1/5) para o jogador 1

e
(q1 , q2 ) = (3/5, 2/5) para o jogador 2.
Os payos medios sao, respectivamente, 0.5474 e 0.4526. Vemos,
portanto, que o jogador 1 leva vantagem nesta versao simplicada
do Le Her supondo, e claro, que ele aja racionalmente seguindo o
equilbrio de Nash.
Observac
o es.

1. No jogo original com 52 cartas, o jogador 2 pode se negar a trocar


de cartas com o jogador 1 se sua carta for K (a de maior valor). No
caso de cartas de mesmo valor (mas naipes diferentes), o jogador 2
vence. Mesmo na vers ao original, a probabilidade media de ganho
do jogador 1 e maior do que a do jogador 2 no equilbrio de Nash.
Os detalhes podem ser encontrados nas referencias [25] e [37].
2. O jogo Le Her foi investigado por Pierre Remond de Montmort
(16781719) e Nicholas Bernoulli (16871759), mas foi James Wal-
degrave (16841741) que forneceu uma solucao para o jogo usando
o conceito de equilbrio em estrategias mistas. As referencias [90]
e [37] apresentam em detalhes a hist oria deste jogo, incluindo a
troca de correspondencia entre Montmort, Bernoulli e Waldegrave
e os erros cometidos na solucao apresentada por Bernoulli.
3. Benjamim e Goldman mostram em [05] que, para a vers ao sim-
plicada do Le Her, a reducao da matriz de payos para uma
matriz 2 2 ocorre para qualquer baralho com um n
umero N 3
de cartas de um mesmo naipe.

6.2 O modelo de duop


olio de Cournot
Sejam q1 e q2 as quantidades de um produto homogeneo fabricado
por duas empresas 1 e 2, respectivamente. Diz-se que dois produtos
fabricados por empresas diferentes s
ao homogeneos quando os con-
sumidores nao percebem diferencas na qualidade dos dois produtos

i i

i i
tdj
i i
2017/2/2
page 127
i i


[SEC. 6.2: O MODELO DE DUOPOLIO DE COURNOT 127

e, assim, eles tomam suas decisoes sobre qual produto comprar con-
siderando apenas o preco, independentemente do fabricante. Vamos
assumir a situacao de market-clearing, isto e, nao existe excesso de
demanda ou excesso de oferta no mercado. Assim, a quantidade de-
mandada do produto e igual `a quantidade ofertada do mesmo. Para
simplicar, vamos supor que o preco de mercado e uma funcao linear
da quantidade agregada Q = q1 + q2 do produto no mercado. Mais
precisamente,
 
A Q, se Q < A, A (q1 + q2 ), se q1 + q2 < A,
P (Q) = =
0, se Q A, 0, se q1 + q2 A.
Aqui, A e o preco maximo aceitavel pelo mercado. Os custos to-
tais de producao das empresas 1 e 2 s ao dados, respectivamente,
por C1 (q1 ) = c q1 e C2 (q2 ) = c q2 , com c > 0. Vamos supor que
c < A. As duas empresas devem escolher simultaneamente as quan-
tidades que ir ao produzir. O ganho de cada empresa e o lucro que
ela obtem.
Temos entao um jogo innito com dois jogadores, g1 = Empresa 1,
g2 = Empresa 2, S1 = [0, +), S2 = [0, +) e S = S1 S2 . As fun-
oes de utilidade u1 , u2 : S R sao dadas por
c
u1 (q1 , q2 ) = q1 P (q1 + q2 ) c q1

q1 [A (q1 + q2 ) c], se q1 + q2 A,
=
q1 [c], se q1 + q2 > A,

q1 (q1 + (A q2 c)), se q1 + q2 A,
=
q1 [c], se q1 + q2 > A,

u2 (q1 , q2 ) = q2 P (q1 + q2 ) c q2

q2 [A (q1 + q2 ) c], se q1 + q2 A,
=
q2 [c], se q1 + q2 > A,

q2 (q2 + (A q1 c)), se q1 + q2 A,
=
q2 [c], se q1 + q2 > A.
Desta maneira, as funcoes de melhor resposta das duas empresas s
ao
dadas por

{(A c q2 )/2}, se q2 A c,
MR1 (q2 ) =
{0}, se q2 > A c,

i i

i i
tdj
i i
2017/2/2
page 128
i i

128 [CAP. 6: EXEMPLOS


{(A c q1 )/2}, se q1 A c,
MR2 (q1 ) =
{0}, se q1 > A c.

Lembrando que (q1 , q2 ) e um equilbrio de Nash em estrategias puras


se, e somente se, q2 MR2 (q1 ) e q1 MR1 (q2 ), vemos que (q1 , q2 )
deve ser solucao do sistema

q2 = (A c q1 )/2 e q1 = (A c q2 )/2.

Sendo assim, vemos que o u nico equilbrio de Nash em estrategias


puras do jogo e
 
Ac Ac
(q1 , q2 ) = , . (6.1)
3 3

Estes valores tambem podem ser encontrados geometricamente, a-


traves dos pontos de intersecao das representacoes gr
acas das duas
funcoes de melhor resposta (Figura 6.1).

q2

A{c

(A { c)/2
(q 1*, q2* )

0 (A { c)/2 A{c q1

Figura 6.1: Calculando o equilbrio de Nash do modelo de duopolio


de Cournot.

i i

i i
tdj
i i
2017/2/2
page 129
i i


[SEC. 6.3: O MODELO DE DUOPOLIO DE BERTRAND 129

6.3 O modelo de duop


olio de Bertrand
Neste modelo, ao inves de decidir o quanto produzir, as empresas
devem escolher o quanto cobrar pelo produto, isto e, elas entram em
uma competic ao de precos. Como no modelo de Cournot, estamos
assumindo que tudo o que e produzido e consumido. Lembrando
que A e o preco maximo aceitavel pelo mercado, vemos que S1 =
S2 = [0, A] e S = S1 S2 = [0, A] [0, A]. As funcoes utilidade s
ao
dadas por

ui (p1 , p2 ) = pi Qi (p1 , p2 ) c Qi (p1 , p2 ) = (pi c) Qi (p1 , p2 ),

onde Qi (p1 , p2 ) representa a producao vendida da empresa i com o


perl de precos (p1 , p2 ). Como o produto e homogeneo, podemos
assumir que os consumidores comprar ao o produto mais barato. Se
as duas empresas cobrarem o mesmo preco, vamos assumir que elas
dividem igualmente o mercado. Desta maneira,

A pi , se pi < pj ,
Qi (p1 , p2 ) = (A pi )/2, se pi = pj ,

0, se pi > pj ,
e, portanto,

(pi c) (A pi ), se pi < pj ,
ui (p1 , p2 ) = (pi c) (A pi )/2, se pi = pj ,

0, se pi > pj ,

onde j = i = 1, 2.
Quais sao os equilbrios de Nash em estrategias puras deste mo-
delo? Certamente (p1 , p2 ) = (c, c) e um equilbrio de Nash pois, neste
caso,

u1 (p1 , p2 ) = 0 u1 (p1 , p2 ) e u2 (p1 , p2 ) = 0 u2 (p1 , p2 ),

para todo p1 S1 e para todo p2 S2 . Existem outros equilbrios de


Nash? A resposta e nao, como podemos concluir a partir dos casos
descritos a seguir.

(a) Se p2 < c e p1 p2 , entao u2 (p1 , p2 ) < 0 = u2 (p1 , c). Logo, neste


caso, (p1 , p2 ) n
ao e um equilbrio de Nash do jogo.

i i

i i
tdj
i i
2017/2/2
page 130
i i

130 [CAP. 6: EXEMPLOS

p2

A
Caso (e)

Caso (d)
Caso (c)

(f)
so
Caso (g)

Ca
c Caso (h)
)
(b

Caso (a)
so
Ca

0 c A p1

Figura 6.2: Calculando o equilbrio de Nash do modelo de duopolio


de Bertrand analisando os varios casos.

(b) Se p1 = p2 < c, entao u1 (p1 , p2 ) < 0 = u1 (c, p2 ). Logo, neste


caso, (p1 , p2 ) n
ao e um equilbrio de Nash do jogo.

(c) Se p1 < c e p2 p1 , entao u1 (p1 , p2 ) < 0 = u1 (c, p2 ). Logo, neste


caso, (p1 , p2 ) n
ao e um equilbrio de Nash do jogo.

(d) Suponha que p1 = c e p2 > c. Se p2 < A, ent


ao u1 (p1 , p2 ) = 0 <

u1 (p2 , p2 ). Se p2 = A, ent
ao

u2 (p1 , p2 ) = 0 < u2 (p1 , (A + c)/2).

Note que (A + c)/2 e ponto de maximo da funcao quadratica


pi  (pi c) (A pi ) no intervalo [c, A]. Vemos entao que, neste
caso, (p1 , p2 ) tambem nao e um equilbrio de Nash do jogo.

(e) Suponha que p2 > p1 > c. Como u2 (p1 , p2 ) = 0 < u2 (p1 , p1 ).


segue-se que (p1 , p2 ) tambem n
ao e um equilbrio de Nash do
jogo.

i i

i i
tdj
i i
2017/2/2
page 131
i i


[SEC. 6.4: O MODELO DE DUOPOLIO DE STACKELBERG 131

( f ) Suponha que p2 = p1 > c. Se p1 = p2 ((A + c)/2, A], ent ao


u1 (p1 , p2 ) < u1 ((A + c)/2, p2 ). Se p1 = p2 (c, (A + c)/2], seja
p1 a solucao da equacao (c x) (A x) = u no intervalo (c, p1 ),
onde u = (c p1 ) (A p1 )/2, isto e, seja
)
A+c c2 + A2 2 p1 A + 2 p1 2 2 c p1

p1 = .
2 2
ao u1 (p1 , p2 ) < u1 ((p1 + p1 )/2, p2 ). Vemos entao que, neste
Ent
caso, (p1 , p2 ) tambem nao e um equilbrio de Nash do jogo.
(g) Suponha que p1 > p2 > c. Como u1 (p1 , p2 ) = 0 < u1 (p2 , p2 ).
segue-se que (p1 , p2 ) tambem n
ao e um equilbrio de Nash do
jogo.
(h) Suponha que p2 = c e p1 > c. Se p1 < A, ent
ao u2 (p1 , p2 ) = 0 <
u2 (p1 , p1 ). Se p1 = A, ent
ao

u1 (p1 , p2 ) = 0 < u1 ((A + c)/2, p2 ).

Vemos entao que, neste caso, (p1 , p2 ) tambem nao e um equilbrio


de Nash do jogo.

Ao contrario do modelo de duopolio de Cournot, as funcoes de


melhor resposta n ao denidas. Por exemplo, se p1 = (A + c)/2,
ao est
ao existe um ponto de maximo da funcao p2  u2 (p1 , p2 ),
entao n
como mostra a Figura 6.3. Isto acontece por que esta funcao e des-
contnua.

6.4 O modelo de duop


olio de Stackelberg
O modelo de duopolio de Cournot e um jogo simultaneo, no sen-
tido que cada empresa, ao escolher o seu nvel de producao, nao sabe
o nvel de produc
ao da empresa concorrente. Heinrich von Stackel-
berg, em [88], propos um modelo de duopolio onde uma das empresas
(a empresa lder) escolhe sua producao primeiro e a outra empresa
(a empresa seguidora) faz a sua escolha de producao depois.
A ordem do jogo e a seguinte: (1) a empresa 1 escolhe uma quan-
tidade de produc ao q1 0 e (2) a empresa 2 observa o valor de q1

i i

i i
tdj
i i
2017/2/2
page 132
i i

132 [CAP. 6: EXEMPLOS

u2

0 c (A + c)/2 A p2

aco da funcao p2  u2 ((A + c)/2, p2 ).


Figura 6.3: Gr

ao, escolhe a sua quantidade de producao q2 0. O ganho de


e, ent
cada empresa e o lucro que ela obtem:

u1 (q1 , q2 ) = q1 P (q1 + q2 ) c q1 ,
u2 (q1 , q2 ) = q2 P (q1 + q2 ) c q2 ,

onde P (Q) = A Q e o preco de mercado em funcao da quantidade


agregada Q = q1 + q2 e c > 0 e o custo unitario de producao.
Vamos usar inducao retroativa para encontrar um equilbrio de
Nash deste jogo seq uencial. Primeiro, vamos calcular a acao otima
A2 (q1 ) da empresa 2 em funcao da quantidade de producao q1 :

A2 (q1 ) = argmaxq2 0 u2 (q1 , q2 ) = argmaxq2 0 q2 [A q1 q2 c] .

Pela regra de Fermat, obtemos que

A q1 c
q2 = A2 (q1 ) = ,
2

i i

i i
tdj
i i
2017/2/2
page 133
i i


[SEC. 6.5: A TRAGEDIA DOS COMUNS 133

desde que q1 < A c. Prosseguindo retroativamente, vemos que a


ac
ao
otima A1 da Empresa 1 e dada por
A1 = argmaxq1 0 u1 (q1 , A2 (q1 ))
= argmaxq1 0 q1 [A q1 A2 (q1 ) c]
= argmaxq1 0 q1 [A q1 c]/2
e, desta maneira,
Ac Ac
q1 = A1 = e q2 = A2 (q1 ) = .
2 4
Se a empresa 1 tivesse escolhido a acao sugerida pelo equilbrio de
Cournot, q1(C) = (A c)/3, entao a acao otima da empresa 2 tambem
seria aquela sugerida pelo equilbrio de Cournot, q2(C) = (A c)/3.
Portanto, usando-se as acoes sugeridas pelo equilbrio de Cournot no
modelo Stackelberg, temos que Q(C) = q1(C) + q2(C) = 2 (A c)/3,
P (Q(C) ) = (A + 2 c)/3 e
(A c)2
u1 (q1(C) , q2(C) ) = u2 (q1(C) , q2(C) ) = .
9
Por outro lado, usando-se as acoes obtidas por inducao retroativa,
vemos que Q = q1 + q2 = 3 (A c)/4, P (Q ) = (A + 3 c)/4 e
(A c)2 (A c)2
u1 (q1 , q2 ) = , u2 (q1 , q2 ) = .
8 16
Estas expressoes mostram que a producao agregada (a soma das
producoes) e maior no modelo de Stackelberg do que no modelo de
Cournot. Elas tambem explicam porque, no modelo de Stackelberg,
a empresa 1 n ao escolhe a acao sugerida pelo modelo de Cournot: se
ela o zer, vai ganhar menos. Vemos tambem que o preco de mercado
no modelo de Cournot e maior do que no modelo de Cournot. Assim,
no modelo de Stackelberg, a empresa 1 est a ganhando mais porque a
empresa 2 esta ganhando bem menos.

6.5 A trag
edia dos comuns
O termo A Tragedia dos Comuns vem de uma par abola pu-
blicada pelo economista poltico William Forster Lloyd em seu livro

i i

i i
tdj
i i
2017/2/2
page 134
i i

134 [CAP. 6: EXEMPLOS

Two Lectures on the Checks to Population de 1833, que depois foi po-
pularizada e estendida por Garret Hardin no seu artigo The Tragedy
of the Commons publicado na revista Science em 1968 ([38]).
A palavra tragedia tem o signicado dado por Alfred North
Whitehead em seu livro Science and The Modern World : The es-
sence of dramatic tragedy is not unhappiness. It resides in the solem-
nity of the remorseless working of things.. J a a palavra comuns
designa uma area de pastagem coletiva, sem dono e sem qualquer
regulamentac ao, usada por pastores na Idade Media, que cuidavam
do rebanho de ovelhas para obter a l a que vendiam para a confeccao
de roupas.
Com o crescimento do n umero de famlias de camponeses ao longo
do tempo, ocorreu um aumento do n umero de ovelhas necess arias
para o sustento de cada famlia. Como a area de pastagem era de uso
comum, nenhuma famlia tinha incentivo para controlar o n umero de
ovelhas de seu rebanho pois, se o zesse, outras famlias usariam as
pastagens de qualquer forma. Com uma superpopulacao de ovelhas, a
terra que antes era fertil, comecou a se exaurir. A reducao da area de
pastagem afetou tanto o rebanho quanto a ind ustria local de roupas.
A par abola mostra, entao, que a imprudencia em administrar um
recurso nito do qual todos se beneciam pode levar `a runa.
Vamos usar teoria dos jogos para modelar uma vers ao ingenua da
tragedia dos comuns. Considere uma aldeia com n pastores e seja oi
o numero de ovelhas do i-esimo pastor, de modo que o n umero total
de ovelhas da aldeia e o = o1 + + on . O custo de compra de uma
ovelha e c, independentemente do n umero de ovelhas que o pastor
ja possui. O benefcio de um pastor em deixar uma ovelha pastando
e v(o) por ovelha. Como o campo de pastagem e um recurso nito,
existe um n umero maximo o de ovelhas que ele pode suportar. As-
sim, v(o) > 0 se o < o e v(o) = 0 se o o. Naturalmente, v e uma
funcao decrescente, pois quanto mais ovelhas no pasto, menor ser aa
area u
til de pastagem para a proxima ovelha. Mais ainda: se existem
poucas ovelhas pastando, colocar uma a mais para pastar nao vai
afetar muito as ovelhas que ja estao pastando mas, por outro lado, se
existem muitas ovelhas no pasto, digamos, quase que completando a
cota maxima o, o acrescimo de uma ovelha prejudica mais acentua-
damente a pastagem das demais ovelhas. Admitindo que as ovelhas
sejam innitamente divisveis, estas condicoes podem ser modeladas

i i

i i
tdj
i i
2017/2/2
page 135
i i


[SEC. 6.5: A TRAGEDIA DOS COMUNS 135

exigindo-se que v  0 e v  < 0. Desta maneira, v tem um graco tal


como o apresentado na Figura 6.4.

0 o o

Figura 6.4: Gr
aco da funcao v.

Neste jogo, a estrategia do pastor i e a escolha da quantidade de


ovelhas que ele deixara no pasto. Podemos entao considerar que o
conjunto de estrategias puras do pastor i e Si = [0, o). Sua funcao
utilidade e dada por

ui (o1 , . . . , oi , . . . , on ) = oi v(o1 + + oi + + on ) c oi .

Suponha que c < v = v(0). Vamos n caracterizar os equilbrios de


Nash o = (o1 , . . . , on ) tais que j=1 oj < o. Para isto, usaremos
n
as seguintes notac oes: = j=1 oj e i
= oi . Note que a
funcao  
i
oi  ui (oi , oi ) = oi v oi i

c oi
tem as seguintes propriedades:

(1) i e contnua,

(2) i tem a mesma classe de diferenciabilidade de v em [0, o i ),

(3) i (0) = 0, i (o i ) < 0, i (oi ) 0 para oi o i ,

(4) i (0) = v(0) c > 0, logo i e crescente e, portanto, positiva, em


um intervalo (0, ) para algum  > 0 e

i i

i i
tdj
i i
2017/2/2
page 136
i i

136 [CAP. 6: EXEMPLOS


(5) i e concava em 0, o i .
Logo, a func
ao de melhor resposta do pastor i esta bem denida:
   
MRi (o ) = argmaxoi (0,oi
) oi v oi i c oi .

Se oi MRi (o ), entao, pela regra de Fermat, i (oi ) = 0, isto e,


v(oi + i

) + oi v  (oi + i

) c = 0.
Somando-se estas equacoes para i = 1, . . . , n e, ent
ao, dividindo-se
por n, obtemos que deve satisfazer a seguinte equacao:
1 
v( ) + v ( ) = 0. (6.2)
n
Por outro lado, se o objetivo e maximizar a utilidade coletiva, isto
e, a soma das funcoes utilidades individuais, ent
ao devemos resolver
o seguinte problema de otimizacao:
max (o v(o) c o) .
o(0,o)

Usando novamente a regra de Fermat, conclumos que uma solucao


deste problema de otimizacao deve resolver a seguinte equacao:
v( ) + v  ( ) = 0. (6.3)
Observe que > . Com efeito: se, por absurdo, , entao
v( ) v( ), ja que v e decrescente. Mas v  tambem e decrescente,
ja que v  < 0. Desta maneira, 0 > v  ( ) v  ( ). Como 0 <
/n < , segue-se que
 
v ( ) v ( ) > v  ( )
n n
e, portanto,

0 = v( ) + v ( ) > v( ) + v  ( ) = 0,
n
uma contradicao. Vemos entao que o equilbrio de Nash o coloca
mais ovelhas no pasto do que o n umero de ovelhas sugerido pelo
equilbrio coletivo o . Isto acontece porque cada pastor considera
apenas o seu pr oprio benefcio e nao o efeito de suas acoes sobre os
outros pastores.

i i

i i
tdj
i i
2017/2/2
page 137
i i

Ap
endice A

Convexidade

Neste apendice apresentaremos as denicoes e propriedades b


a-
sicas de funcoes convexas necess
arias no texto. As demonstracoes
omitidas podem ser encontradas em [42].

Defini ao A.1 (Conjuntos convexos) Dizemos que U


c
Rn e um conjunto convexo se, e somente se, para todo p, q U
tem-se
(1 t) p + t q U,
para todo t [0, 1], isto e, se o segmento de reta que une dois
pontos quaisquer de U esta sempre contido em U .

Teorema A.1 Seja {U } uma famlia de conjuntos conve-


xos em Rn Ent
ao 
U

tambem e um conjunto convexo em Rn .

137

i i

i i
tdj
i i
2017/2/2
page 138
i i

138 [CAP. A: CONVEXIDADE

(a) (b)

Figura A.1: O conjunto da esquerda e convexo enquanto que o da


direita nao o e.

Definic
ao A.2 (Semiplanos e Semiespa cos) Seja a um ve-
ao-nulo em Rn e seja c um n
tor n umero real. Os conjuntos

H+ = {x Rn | ax c} e H = {x Rn | ax c}

s
ao denominados, respectivamente, semiespacos fechados cor-
respondentes ao semiplano H = {x Rn | ax = c}.

Por linearidade, segue-se que semiplanos e semiespacos s


ao con-
juntos convexos.

Definic
ao A.3 (Politopos e Poliedros) Um politopo e um
conjunto que pode ser expresso como a intersecao de um n
umero
nito de semiespacos fechados. Um poliedro e um politopo limi-
tado.

Note que politopos e poliedros sao conjuntos convexos, como in-


tersecao de conjuntos convexos.

Defini c
ao A.4 (Combinac o convexa) Sejam x1 , . . . , xk
a
umeros reais 0 tais que ni=1 i = 1. A com-
Rn e 1 , . . . , k n
binaca
o convexa de x1 , . . . , xk com pesos 1 , . . . , k e o ponto

1 x1 + + i xk .

i i

i i
tdj
i i
2017/2/2
page 139
i i

139

(a) (b)

Figura A.2: O conjunto de todas as combinacoes convexas de (a) dois


pontos distintos e um segmento de reta que liga os dois
pontos e de (b) tres pontos nao-colineares e um tri
angulo
(lados e interior) com vertices nos tres pontos.

Teorema A.2 Um subconjunto U de Rn e convexo se, e so-


mente se, toda combinacao convexa de pontos de U pertence
a U.

Defini
c
ao A.5 (Func
o es convexas e co
ncavas)

(a) Dizemos que uma funcao f : U Rn R denida em um


subconjunto convexo U de Rn e convexa se, e somente se,

f ((1 t) p + t q) (1 t) f (p) + t f (q), (A.1)

para todo p, q U e todo t [0, 1].


(b) Dizemos que uma funcao f : U Rn R denida em um
subconjunto convexo U de Rn e c
oncava se, e somente se,

f ((1 t) p + t q) (1 t) f (p) + t f (q), (A.2)

para todo p, q U e todo t [0, 1].

A interpretacao geometrica e a seguinte: para uma funcao convexa, o


segmento de reta secante que passa pelos pontos (p, f (p)) e (q, f (q))
sempre esta acima ou coincide com o gr aco de f para qualquer

i i

i i
tdj
i i
2017/2/2
page 140
i i

140 [CAP. A: CONVEXIDADE

f(p)

seg
me
nto
(1{ t) . f(p)+t . f(q) de r
eta
sec
ant
e grfico de f

f(q)
f ((1{ t) . p +t . q)

0 p (1{ t) . p+t . q q x

Figura A.3: Para uma funcao convexa, o segmento de reta secante


ca sempre acima ou coincide com o graco da funcao,
para quaisquer escolhas de p e q.

escolha de pontos p e q em U (veja a Figura A.3). Ja para uma


func
ao concava, o segmento de reta secante que passa pelos pontos
(p, f (p)) e (q, f (q)) sempre est
a abaixo ou coincide com o gr
aco
de f para qualquer escolha de pontos p e q em U . Note que f e
oncava se, e somente se, f e convexa.
c
O pr oximo teorema estabelece o motivo de convexidade ser uma pro-
priedade tao desejavel em otimizacao.

Teorema A.3

(a) Se f : U Rn R e convexa, ent


ao todo ponto de mnimo
local de f em U tambem e ponto de mnimo global de f
em U .
(b) Se f : U Rn R e c
oncava, ent
ao todo ponto de maximo
local de f em U tambem e ponto de m aximo global de f
em U .

i i

i i
tdj
i i
2017/2/2
page 141
i i

141

Teorema A.4 Seja f : U Rn R uma funcao de classe C 1


denida em um subconjunto convexo U de Rn .
(a) f e uma funcao convexa em U se, e somente se,

f (q) f (p) + f (p) (q p), (A.3)

para todo p, q U , isto e, se, e somente se, cada hiperplano


tangente ao graco de f esta sempre abaixo ou coincide com
o gr
aco de f .
(b) f e uma func
ao concava em U se, e somente se,

f (q) f (p) + f (p) (q p), (A.4)

para todo p, q U , isto e, se, e somente se, cada hiperplano


tangente ao graco de f esta sempre acima ou coincide com
o graco de f .
Aqui f (p) denota o vetor gradiente de f em p.

grfico de f

0 x

Figura A.4: Para uma funcao convexa, cada hiperplano tangente ao


gr
aco de f esta sempre abaixo do graco de f .

i i

i i
tdj
i i
2017/2/2
page 142
i i

142 [CAP. A: CONVEXIDADE

Defini
c
ao A.6 (Func
o es quase-convexas e quase-co
n-
cavas)
(a) Dizemos que uma funcao f : U Rn R denida em um
subconjunto convexo U de Rn e quase-convexa se, e somente
se,
{x U | f (x) c}
e um conjunto convexo para todo c R.
(b) Dizemos que uma funcao f : U Rn R denida em um
subconjunto convexo U de Rn e quase-c
oncavo se, e somente
se,
{x U | f (x) c}
e um conjunto convexo para todo c R.

Note que f e quase-c oncava se, e somente se, f e quase-convexa.


Toda func
ao convexa e quase-convexa e toda funcao c
oncava e quase-
c
oncava. Existem funcoes quase-convexas que nao sao convexas.
Por
3
exemplo, a funcao f : R R denida por y = f (x) = x2 e quase-
convexa, mas nao e convexa.

0 x


3
Figura A.5: y = f (x) = x2 e quase-convexa, mas n
ao e convexa
em R.

i i

i i
tdj
i i
2017/2/2
page 143
i i

143

Toda funcao f : R R monotona e quase-convexa e quase-concava.


A funcao y = f (x) = x que leva x R no maior inteiro menor do
que ou igual a x e funcao quase-convexa que nao e contnua. A funcao
da Figura A.6 e um exemplo de funcao que n ao e quase-convexa.

Teorema A.5 Seja f : U Rn R uma funcao denida em


um subconjunto convexo U de Rn .
(a) As seguintes condicoes s
ao equivalentes:

(1) f e uma funcao quase-convexa em U .


(2) x1 , x2 U, t [0, 1], se f (x1 ) f (x2 ), entao

f (t x1 + (1 t) x2 ) f (x2 ).

(3) x1 , x2 U, t [0, 1],

f (t x1 + (1 t) x2 ) max{f (x1 ), f (x2 )}.

(b) As seguintes condicoes sao equivalentes:


(1) f e uma funcao quase-concava em U .
(2) x1 , x2 U, t [0, 1], se f (x1 ) f (x2 ), entao

f (t x1 + (1 t) x2 ) f (x2 ).

(3) x1 , x2 U, t [0, 1],

f (t x1 + (1 t) x2 ) min{f (x1 ), f (x2 )}.

Teorema A.6 Seja f : U Rn R uma funcao de classe C 1


denida em um subconjunto convexo U de Rn .

(a) f e quase-convexa em U se, e somente se,

x1 , x2 U, f (x2 ) f (x1 ) f (x1 ) (x2 x1 ) 0.

i i

i i
tdj
i i
2017/2/2
page 144
i i

144 [CAP. A: CONVEXIDADE

0 x

Figura A.6: Um exemplo de funcao que n


ao e quase-convexa.

(b) f e quase-c
oncava em U se, e somente se,

x1 , x2 U, f (x2 ) f (x1 ) f (x1 ) (x2 x1 ) 0.

i i

i i
tdj
i i
2017/2/2
page 145
i i

Ap
endice B

Programa
c
ao Linear

Neste apendice apresentaremos as denicoes e propriedades b a-


sicas da teoria de programacao linear necess arias no texto. Para
detalhes, demonstracoes e extensoes, recomendamos os excelentes li-
vros [14, 52].
Um programa linear e um problema de otimizacao onde a funcao
que queremos otimizar e as restricoes s
ao todas lineares. Por exemplo,

minimizar x1 + x2
x1 ,x2 R
sujeito a 3 x1 + 2 x2 8,
x1 + 5 x2 7, (B.1)
x1 0,
x2 0,

e um programa linear. Para resolve-lo, precisamos encontrar um


ponto (x1 , x2 ) do conjunto admissvel

K = {(x1 , x2 ) R2 | 3 x1 + 2 x2 8, x1 + 5 x2 7, x1 0, x2 0}

que torna o valor da func ao objetivo o(x1 , x2 ) = x1 + x2 o menor


possvel. O conjunto K esta desenhado na Figura B.1. Por inspecao,
vemos que a solucao otima e dada por (x1 , x2 ) = (2, 1). Este ponto e
a intersecao da curva de nvel f (x1 , x2 ) = x1 + x2 = c mais baixa
que intercepta o conjunto admissvel.

145

i i

i i
tdj
i i
2017/2/2
page 146
i i

146 [CAP. B: PROGRAMAC LINEAR


AO

x2

0 2 3 7 x1

Figura B.1: O conjunto admissvel do programa linear B.1.

Dizemos que um programa linear esta na forma padr ao se todas


as vari
aveis de decis
ao sao nao-negativas e se todas as restricoes s
ao
em igualdade:

minimizar R c1 x1 + + cn xn
x1 ,...,xn
sujeito a a11 x1 + + a1n xn = b1 ,
.. .. .. .. ..
. . . . .
am1 x1 + + amn xn = bm ,
e x1 0, . . . , xn 0.

Todo programa linear pode ser reescrito na forma padr ao com o uso
de vari
aveis de folga. Por exemplo, uma restricao da forma
ai1 x1 + + ain xn bi
pode ser substituda, de maneira equivalente, pelas restricoes
ai1 x1 + + ain xn yi = bi e yi 0.
Se uma vari
avel de decis ao xi pode assumir qualquer valor real, isto e,
se n
ao existe restricao de nao-negatividade em xi , entao podemos

i i

i i
tdj
i i
2017/2/2
page 147
i i

147

substituir xi por ui vi , a diferenca de dois n


umeros positivos. Se
colocarmos o programa linear B.1 na forma padr ao, obtemos o se-
guinte PL:
minimizar x1 + x2
x1 ,x2 ,y1 ,y2 R
sujeito a 3 x1 + 2 x2 y1 = 8,
x1 + 5 x2 y2 = 7,
x1 0, (B.2)
x2 0,
y1 0,
y2 0.

Um programa linear pode ser escrito de forma mais compacta


usando-se matrizes e vetores:

minimizar
n
cT x
xR (B.3)
sujeito a Ax = b e x 0,

onde x Rn , c Rn , b Rm e A e uma matriz m n. Note


que o conjunto admissvel K = {x Rn | Ax = b e x 0} de um
programa linear, quando nao-vazio, e um politopo convexo, e que as
hipersuperfcies de nvel da funcao objetivo sao hiperplanos.
Problemas de maximizacao podem ser transformados em proble-
mas de minimizacao substituindo-se a funcao objetivo o por o. Mais
precisamente, x e uma solucao otima de

maximizar
n
cT x
xR
sujeito a Ax = b e x 0,

se, e somente se, x tambem e solucao de

minimizar
n
cT x
xR
sujeito a Ax = b e x 0.

Na teoria de programacao linear, assume-se que m < n (existem


mais inc
ognitas do que restricoes em igualdade) e que o posto da
matriz A e m, isto e, as m linhas de A sao linearmente independentes.

i i

i i
tdj
i i
2017/2/2
page 148
i i

148 [CAP. B: PROGRAMAC LINEAR


AO


Da teoria de Algebra Linear sabemos, entao, que existem m colunas
de A que s ao linearmente independentes. Renomeando-se ndices se
necessario, podemos assumir que estas colunas sejam as m primeiras.
Isto induz uma decomposicao de A e de x:
' (
 xB
A= B C , x= ,
xC
onde B e uma matriz mm inversvel. Como o sistema linear Ax = b
e equivalente a BxB + CxC = b, segue-se ent ao que existe uma
soluc
ao x de Ax = b na forma
' (
xB
.
0
Esta solucao e denominada soluc
ao b
asica do sistema linear Ax =
b associada a` base B. As componentes de xB sao denominadas
vari
aveis basicas.

Teorema B.1 (Teorema Fundamental da Programa c


ao
Linear) Considere um programa linear na forma padr
ao B.3,
com A matriz m n de posto m.
(a) Se o programa linear possui um ponto admissvel, entao ele
possui um ponto admissvel que e uma solucao basica do
sistema linear Ax = b.
(b) Se o programa linear possui um ponto otimo, entao ele pos-
sui um ponto otimo que e uma solucao basica do sistema
linear Ax = b.

O proximo teorema da uma interpretacao geometrica para pontos


admissveis que s
ao solucoes basicas: eles correspondem aos pontos
extremos (vertices) do politopo K = {x Rn | Ax = b e x 0}.

Definic
ao B.1 (Ponto Extremo) Dizemos que um ponto x
em um conjunto convexo U e ponto extremo de U se nao existem
dois outros pontos distintos x1 e x2 em U tais que x = x1 +
(1 ) x2 para algum no intervalo (0, 1).

i i

i i
tdj
i i
2017/2/2
page 149
i i

149

Na Figura B.2, x1 , x2 e x3 sao os u nicos pontos extremos do


conjunto admissvel K do PL B.1. O ponto x4 nao e um ponto
extremo de K, pois ele pode ser escrito como uma combinacao con-
vexa de x2 K e x3 K. Como x6 = x5 + (1 ) x7 para
algum (0, 1), vemos que o ponto x6 (no interior do conjunto
admissvel) tambem n
ao e um ponto extremo de K.

x2

4 x1 x6 x7

x5
3

x2
1 x4
x3
0
2 3 7 x1

Figura B.2: x1 , x2 e x3 sao os u


nicos pontos extremos do conjunto
admissvel do PL B.1.

Teorema B.2 (Equival encia entre Pontos Extremos e


Solu co
es Basicas) Seja A uma matriz m n de posto m,
b um vetor em Rm e K = {x Rn | Ax = b e x 0} o con-
junto admissvel de B.3. Entao x e um ponto extremo de K
se, e somente se, x e um ponto admissvel que e solucao b
asica
de Ax = b.

Os teoremas B.1 e B.2 dizem que, para se resolver o problema B.3, nao
e preciso considerar todos os pontos do conjunto admissvel K: basta
procurar pelo ponto otimo entre os pontos extremos (vertices) de K!
O metodo simplex explora esta estrutura para construir um algoritmo
muito popular para se resolver B.3. Outra categoria de metodos que

i i

i i
tdj
i i
2017/2/2
page 150
i i

150 [CAP. B: PROGRAMAC LINEAR


AO

recentemente ganhou bastante popularidade e a classe dos metodos


de ponto interior. N ao e nosso proposito estudar estes algoritmos
aqui. O leitor interessado poder a consultar os livros [14, 52]. O que e
preciso se ter em mente e que programas lineares podem ser resolvidos
numericamente de maneira muito eciente nos dias de hoje. A seguir
estabeleceremos resultados sobre dualidade, um conceito fundamental
e muito u til em programacao linear.

Defini
c
ao B.2 (O problema dual) O problema dual de

minimizar
n
cT x
xR (B.4)
sujeito a Ax b e x 0,

e o programa linear

maximizar
m
T b
R (B.5)
sujeito a AT c e 0,
m
onde T b = i=1 i bi . B.5
e denominado o problema dual
de B.4. Neste contexto, B.4 e denominado problema primal.

Por exemplo, o problema dual do programa linear B.1 e

minimizar 8 1 + 7 2
1 ,2 R
sujeito a 3 1 + 2 1,
2 1 + 5 2 1, (B.6)
1 0,
2 0.

O problema dual de qualquer programa linear pode ser encontrado


convertendo-o para o formato B.4. Por exemplo, como Ax = b se,
e somente se, Ax b e Ax b, o programa linear na forma
padr
ao B.3 pode ser escrito na forma do problema primal B.4 da

i i

i i
tdj
i i
2017/2/2
page 151
i i

151

seguinte maneira equivalente

minimizar
n
cT x
xR
' ( ' (
A b
sujeito a x e x 0.
A b

Particionando-se agora as vari


aveis duais na forma (u, v), o problema
dual deste u
ltimo PL e

minimizar
n
uT b vT b
xR
sujeito a AT u AT v c, u 0 e v 0.

Fazendo-se = u v, o problema acima pode ser simplicado, o que


nos leva ao seguinte par de problemas duais:

Par Dual B.1


(problema primal) (problema dual)
minimizar
n
T
c x maximizar
m
T b
xR R
sujeito a Ax = b, sujeito a AT c.
x 0,

Outros pares de problemas duais de interesse s


ao dados a seguir.

Par Dual B.2


(problema primal) (problema dual)
maximizar
n
T
c x minimizar
m
T b
xR R
sujeito a Ax = b, sujeito a AT c.
x 0,

i i

i i
tdj
i i
2017/2/2
page 152
i i

152 [CAP. B: PROGRAMAC LINEAR


AO

Par Dual B.3 (O da Denicao B.2)


(problema primal) (problema dual)
minimizar
n
T
c x maximizar
m
T b
xR R
sujeito a Ax b, sujeito a AT c,
x 0, 0.

Par Dual B.4


(problema primal) (problema dual)
T
maximizar
m
b y minimizar cT x
yR n
xR
sujeito a Ay c, sujeito a xT A bT,
y 0, x 0.

Teorema B.3 (Teorema fraco de dualidade) Se x e sao


admissveis para os problemas B.3 e B.5, respectivamente, ent
ao
cT x T b.

Este teorema mostra que um ponto admissvel para um dos pro-


blemas fornece uma cota para o valor da funcao objetivo do outro
problema. Os valores associados com o problema primal s ao sempre
maiores ou iguais aos valores associados com o problema dual. Como
corolario, vemos que se um par de pontos admissveis pode ser encon-
trado para os problemas primal e dual com valores iguais da funcao
objetivo, entao estes pontos s
ao otimos.

Teorema B.4 (Teorema forte de dualidade) Se um dos


problemas B.3 ou B.5 tem uma solucao otima nita, entao o
outro tambem tera uma solucao otima nita e, neste caso, os
valores das respectivas funcoes objetivo s
ao iguais. Se a funcao

i i

i i
tdj
i i
2017/2/2
page 153
i i

153

objetivo do problema primal nao e limitada inferiormente, ent


ao
o conjunto admissvel do problema dual e vazio e, se a funcao
objetivo do problema dual nao e limitada superiormente, ent ao
o conjunto admissvel do problema primal e vazio.

O conjunto admissvel do problema dual B.6 do programa linear B.1


esta desenhado na Figura B.3. Por inspecao, vemos que a solucao
otima e dada por (1 , 2 ) = (4/13, 1/13). Este ponto e a intersecao da

curva de nvel g(1 , 2 ) = 8 1 + 7 2 = c mais alta que intercepta
o conjunto admissvel. Lembrando que (x1 , x2 ) = (2, 1) e a solucao
do problema primal B.1, vemos que
f (x1 , x2 ) = x1 + x2 = 3 = 8 1 + 7 2 = g(1 , 2 ),
como arma o teorema forte da dualidade.
2

3/7

1/5

(4/13, 1/13)

3/8
0 1/3 1

Figura B.3: O conjunto admissvel do problema dual B.6 do pro-


grama linear B.1.

Por m, gostaramos de observar que se a funcao objetivo do pro-


grama linear B.3 n
ao e limitada inferiormente no conjunto admissvel

i i

i i
tdj
i i
2017/2/2
page 154
i i

154 [CAP. B: PROGRAMAC LINEAR


AO

K = {x Rn | Ax = b e x 0} ,
entao existem ponto extremo x  e raio extremo r de K tal que o valor
da funcao objetivo de B.3 em x = x +tr tende a quando t tende
a +. Em particular,
cT 
r < 0.
Dizemos que  r e um raio de K se, e somente se, r = 0 e o conjunto
{p Rn | p = x + t  r e t 0} esta contido em K para todo x K.
Um raio  r de K e extremo, se nao existem outros dois raios r1 e r2
de K (com r1 = t r2 para todo t > 0) e um escalar s no intervalo (0, 1)
tal que 
r = s r1 + (1 s) r2 .

x2

r1
r2

r3
K

0 x1

Figura B.4: Os vetores r1 e r2 nao sao raios extremos de K. O ve-


tor r3 e um raio extremo de K.

i i

i i
tdj
i i
2017/2/2
page 155
i i

Ap
endice C

Respostas dos exerccios

Captulo 2
[01] O processo de dominancia estrita iterada reduz o jogo para uma
matriz 11 com um u nico perl de estrategias puras: (s13 , s22 ).
[02] (a) Nao existem estrategias dominantes neste jogo.
(b) (l1 , c1 ) e (l2 , c2 ) sao os u
nicos equilbrios de Nash em es-
trategias puras do jogo.
[03] (a) c2 domina estritamente c1 .
(b) (l2 , c2 ) e o u
nico equilbrio de Nash em estrategias puras do
jogo.
[04] (a) Nao existem estrategias dominantes neste jogo.
(b) (desviar, nao desviar) e (nao desviar, desviar) s
ao os u
nicos
equilbrios de Nash em estrategias puras do jogo.
[05] (a) Nao existem estrategias dominantes neste jogo.
(b) (brigar, ameacar) e (ameacar, brigar) sao os u
nicos equilbrios
de Nash em estrategias puras do jogo.
[06] Usando o processo de domin
ancia fraca iterada, o jogo se reduz
para uma matriz 3 3:

155

i i

i i
tdj
i i
2017/2/2
page 156
i i

156 [CAP. C: RESPOSTAS DOS EXERCICIOS

Eixo
A B C
1 (+13, 13) (+29, 29) (+ 8, 8)
Aliados .
3 (+18, 18) (+22, 22) (+31, 31)

6 (+23, 23) (+22, 22) (+19, 19)

[07] O processo de dominancia estrita iterada reduz o jogo para


uma matriz 1 1 1 com um u
nico perl de estrategias puras:
(x3 , y2 , z4 ).

[08] O processo de dominancia estrita iterada reduz o jogo para


uma matriz 1 1 1 com um u
nico perl de estrategias puras:
(x2 , y1 , z2 ).

[09] O perl de estrategias (x2 , y2 , z3 ) e o u


nico equilbrio de Nash
em estrategias puras do jogo.

[10] (a) Para o jogador 1, a estrategia M e fracamente dominada


pela estrategia T e tambem fracamente dominada pela es-
trategia B. Para o jogador 2, a estrategia L e fracamente
dominada pela estrategia R.
(b) O processo de eliminacao das estrategias fracamente domi-
nadas conduz a duas reducoes 1 1: {(B, C)} e {(T, R)}.
(c) Os equilbrios de Nash em estrategias puras s ao (T, C),
(T, R) e (B, C). Note que (T, C) nao est a entre os per-
s de estrategias encontrados no item anterior.

[11] Suponha, por absurdo, que s = (s1 , . . . , sn ) nao seja um e-


quilbrio de Nash. Entao devem existir ndice i e estrategia

i Si , com si = si , tais que ui (si , si ) < ui (si , si ).
pura s[1] [1] [1]

Como, por hipotese, o processo de eliminacao reduz o jogo ape-


nas para o perl s , segue-se que o perl (s[1]
i , si ) foi eliminado
em alguma etapa do processo. Dados que as estrategias puras
em si nao foram eliminadas (se o fossem, o perl (si , si )
tambem seria eliminado), segue-se que a eliminacao ocorreu

i i

i i
tdj
i i
2017/2/2
page 157
i i

157

porque a estrategia s[1]


i foi fracamente dominada por outra es-
trategia s[2] i (si , si ) ui (si , si ) para todo si
[1] [2]
i . Logo, u
que pode ser construdo com as estrategias que restaram nos
espacos de estrategias puras dos outros jogadores neste estagio
do processo (que inclui si ) e, mais ainda, pelo menos para
i , vale a desigualdade estrita: ui (si , si ) < ui (si , si ).
um s[2] [1] [2] [2] [2]

Das desigualdades

ui (si , si ) < ui (s[1]


i , si ) ui (si , si )
[2]

e
i , si ) < ui (si , si )
ui (s[1] [2] [2] [2]


i = si e si = si .
segue-se que s[2] [2] [1]

Agora, por sua vez, o perl (s[2]i , si ) tamb


[2]
em foi eliminado du-
rante o processo. Dados que as estrategias puras em s[2] i n ao
foram eliminadas nesta etapa (se o fossem, o perl (s[1] i , s[2]
i )
tambem seria eliminado e, portanto, ele n ao existiria nas eta-
pas seguintes), segue-se que a eliminacao correu porque a es-
trategia s[2]
i foi fracamente dominada por outra estrat egia s[3]i .
Logo, ui (si , si ) ui (si , si ) para todo si que pode ser
[2] [3]

construdo com as estrategias que restaram nos espacos de es-


trategias puras dos outros jogadores neste estagio do processo
(que inclui si e s[2]
i ) e, mais ainda, pelo menos para um si ,
[3]

vale a desigualdade estrita: ui (si , si ) < ui (si , si ). Das


[2] [3] [3] [3]

desigualdades

ui (si , si ) < ui (s[1] [2] [3]


i , si ) ui (si , si ) ui (si , si ),

i , si ) < ui (si , si ) ui (si , si )


ui (s[1] [2] [2] [2] [3] [2]

e
i , si ) < ui (si , si )
ui (s[2] [3] [3] [3]


i = si , si = si e si = si .
segue-se que s[3] [3] [1] [3] [2]

Prosseguindo desta maneira, construiramos uma sequencia in-


nita (s[1] [2] [3] [r]
i , si , si , . . . , si , . . .) de estrat
egias puras distintas do
jogador gi , o que e impossvel, dado que Si e, por hip otese,
nito.

i i

i i
tdj
i i
2017/2/2
page 158
i i

158 [CAP. C: RESPOSTAS DOS EXERCICIOS

[12] Note que

ui (p ) = ui (pi , pi )
m1 mn

= p1j1 pnjn ui (s1j1 , . . . , snjn ).
j1 =1 jn =1

Reordenando os somatorios, obtemos que


mi

ui (pi , pi ) = piji vji = pi , v
ji =1

onde
m1 mi1 mi+1 mn
   
vji = cj1 ,...,jn ui (s1j1 , . . . , snjn ),
j1 =1 ji1 =1 ji+1 =1 jn =1

com cj1 ,...,jn = p1j1 p(i1)ji1 p(i+1)ji+1 pnjn . Desta ma-


neira, se x1 , . . . , xr i e 1 , . . . , r sao escalares n ao-negativos
r
com k=1 k = 1, ent ao
r  * r +
 

ui k xk , pi = k xk , v
k=1 k=1
r

= k xk , v
k=1
r
= k ui (xk , pi ).
k=1

Nas igualdades acima rnao usamos que 1 , . . . , r sao escalares


n
ao-negativos com k=1 k = 1. De fato, esta exig encia e
necess
r a ria apenas para garantir que se x1 , . . . , xr i , ent
ao

k=1 k x k i .

[13] Suponha que a estrategia pura sik do jogador gi seja estrita-


mente dominada por uma estrategia mista

pi = (pi1 , . . . , pik , . . . , pimi ) mi .

i i

i i
tdj
i i
2017/2/2
page 159
i i

159

Vamos mostrar que se pi = (pi1 , . . . , pik , . . . , pimi ) e uma outra


estrategia mista do jogador gi com pik > 0, ent ao pi tambem
e estritamente dominada. Como sik e estritamente dominada
por pi , segue-se que
ui (pi , si ) > ui (sik , si ), si Si .
Assim,
mi

()
ui (pi , si ) = pir ui (sir , si )
r=1
mi
= pir ui (sir , si ) + pik ui (sik , si )
r=1
r =k

mi

< pir ui (sir , si ) + pik ui (pi , si ),
r=1
r =k

onde, em (), usamos a propriedade 2.4 da pagina 31. Mas, por


esta mesma propriedade,
mi

ui (pi , si ) = pir ui (sir , si ).
r  =1

Conseq
uentemente,
ui (pi , si )
<
mi
 mi

pir ui (sir , si ) + pik pir ui (sir , si )
r =1 r  =1
r =k

=
mi

(pir + pik pir ) ui (sir , si ) + pik pik ui (sik , si )
r=1
r =k

=
mi

pir ui (sir , si ),
r=1

i i

i i
tdj
i i
2017/2/2
page 160
i i

160 [CAP. C: RESPOSTAS DOS EXERCICIOS

onde os coecientes pir sao denidos por



pir + pik pir , se r = k,
pir =
pik pik , se r = k.
i 
Como pir 0 para todo r = 1, . . . , mi e m r=1 pir = 1, segue-se
que pi = (pi1 , . . . , pir , . . . , pimi ) e uma distribuicao de proba-
bilidades e, sendo assim,
mi

ui (pi , si ) < pir ui (sir , si ) = ui (pi , si ), si Si .
r=1

Isto mostra que a estrategia mista pi e estritamente dominada


pela estrategia mista pi .
[14] Para o dilema dos prisioneiros, as funcoes de melhor resposta
sao dadas por:

MRBob (p) = argmaxq[0,1] ((4 p + 1) q (9 p + 1)) = {1},


MRAl (q) = argmaxp[0,1] ((4 q + 1) p (9 q + 1)) = {1}.
A partir das representacoes gr acas destas funcoes (Figura C.1),
vemos que o u nico equilbrio de Nash em estrategias mistas do
jogo e o perl (1, 0; 1, 0), que corresponde ao u nico ponto de
intersecao (p , q ) = (1, 1) das duas representacoes gracas.
Para o jogo de comparar moedas, as funcoes de melhor resposta
s
ao dadas por:

MR2 (p) = argmaxq[0,1] (2 (+1 2 p) q 1 + 2 p)



{1}, se p [0, 1/2),
= [0, 1], se p = 1/2,

{0}, se p (1/2, 1],
MR1 (q) = argmaxp[0,1] (2 (1 + 2 q) p + 1 2 q)

{0}, se q [0, 1/2),
= [0, 1], se q = 1/2,

{1}, se q (1/2, 1].

A partir das representacoes gracas destas funcoes (Figura C.2),


vemos que o u nico equilbrio de Nash em estrategias mistas do

i i

i i
tdj
i i
2017/2/2
page 161
i i

161

(Bob) q

(Confessar) 1

(Negar)
0 1 p (Al)

(Negar) (Confessar)

Figura C.1: Calculando os equilbrios de Nash usando as representa-


coes gr
acas das duas funcoes de melhor resposta.

jogo e o perl (1/2, 1/2; 1/2, 1/2), que corresponde ao u nico


ponto de intersecao (p , q ) = (1/2, 1/2) das duas representa-
c
oes gracas.

[15] Um equilbrio de Nash n ao pode por probabilidade positiva em


uma estrategia pura que e estritamente dominada. De fato:
suponha, por absurdo, que p = (pi , pi ) seja um equilbrio
de Nash com pi = (pi1 , . . . , pik1 , . . . , pik2 , . . . , pimi ) e pik1 > 0,
onde sik1 e uma estrategia pura estritamente dominada por sik2 .
Dena agora pi = (pi1 , . . . , 0, . . . , pik1 + pik2 , . . . , pimi ). Note
que pi (Si ) e ui (pi , pi ) > ui (pi , pi ), contradizendo o fato
de p = (pi , pi ) ser um equilbrio de Nash. Um equilbrio de
Nash pode por probabilidade positiva em uma estrategia pura
fracamente dominada. No jogo abaixo,

g2
s21 s22
s11 (12, 10) (28, 26) ,
g1
s12 (20, 46) (20, 46)

i i

i i
tdj
i i
2017/2/2
page 162
i i

162 [CAP. C: RESPOSTAS DOS EXERCICIOS

(g2) q

(s21 ) 1

1/2

(s22 )
0 1/2 1 p (g1)

(s12 ) (s11 )

Figura C.2: Calculando os equilbrios de Nash usando as representa-


coes gr
acas das duas funcoes de melhor resposta.

o perl de estrategias mistas (0, 1; 1/2, 1/2) e um equilbrio de


Nash que p oe probabilidade p21 = 1/2 > 0 na estrategia s21
e s21 e fracamente dominada pela estrategia s22 .

[16] O perl de estrategias puras s = (confessar, confessar) n ao e


Pareto eciente pois, se s = (negar, negar) e tal que uAl (s ) =
1 > 5 = uAl (s ) e uBob (s ) = 1 > 5 = uBob (s ).

Captulo 3
[01] (a) Considere = [0, 1] e F : cujo gr
aco e dado na
Figura C.3.
(b) Considere = (0, 1) e F : cujo graco e dado na
Figura C.4.
(c) Considere = [0, 1/3] [2/3, 1] e F : cujo gr
aco e
dado na Figura C.5.

i i

i i
tdj
i i
2017/2/2
page 163
i i

163

1/2

0 1/2 1 x

Figura C.3: Graco do item (a).

2/3

0 1/3 1 x

Figura C.4: Graco do item (b).

i i

i i
tdj
i i
2017/2/2
page 164
i i

164 [CAP. C: RESPOSTAS DOS EXERCICIOS

2/3

1/3

0 1/3 2/3 1 x

Figura C.5: Graco do item (c).

3/4

1/4

0 1/2 1 x

Figura C.6: nao possui ponto xo.

i i

i i
tdj
i i
2017/2/2
page 165
i i

165

[02] Conforme a Figura C.6 na pagina 164, um exemplo e obtido


tomando-se X = [0, 1] e

[3/4, 1], se 0 x < 1/2,
(x) = [0, 1/4] [3/4, 1], se x = 1/2,

[0, 1/4], se 1/2 < x 1.

[03] O jogo abaixo possui apenas dois equilbrios de Nash em es-


trategias mistas.

g2
s21 s22
s11 (1, 1) (0, 0) ,
g1
s12 (0, 0) (0, 0)

Captulo 4
[01] A matriz A tem dois pontos de sela: a13 e a33 .
[02] No jogo de comparar moedas,
' (
+1 1
A=
1 +1

Como A tem entradas negativas, vamos substitu-la por


' ( ' (
A = +1 1 + 2 1 = +3 +1 .
1 +1 +1 +3

Assim:

(problema primal)

maximizar y1 + y2
sujeito a 3 y1 + y2 1,
y1 + 3 y2 1,
y1 0,
y2 0,

i i

i i
tdj
i i
2017/2/2
page 166
i i

166 [CAP. C: RESPOSTAS DOS EXERCICIOS

(problema dual)

minimizar x1 + x2
sujeito a 3 x1 + x2 1,
x1 + 3 x2 1,
x1 0,
x2 0.

A solucao do problema dual e (x1 , x2 ) = (1/4, 1/4) e a solucao


do problema primal e (y1 , y2 ) = (1/4, 1/4). Se

1
= x1 + x2 = y1 + y2 = ,
2
segue-se que o u nico equilbrio de Nash do jogo de comparar
moedas e dado por (p , q ), onde
   
(x , x ) 1 1 (y , y ) 1 1
p = 1 2 = , e q = 1 2 = , .
2 2 2 2

[03] Considere o seguinte jogo matricial geral de ordem 2 2:


' (
a b
A= .
d c

Se existe um ponto de sela, basta usarmos os resultados da Sub-


secao 4.3.2 para encontrar um equilbrio de Nash do jogo. Su-
ponha ent ao que a matriz A nao possua pontos de sela. Desta
maneira, o jogo possui apenas equilbrios de Nash

(p , 1 p ; q , 1 q )

totalmente mistos, isto e, com 0 < p , q < 1. Se a b, entao


b < c, caso contr
ario b seria um ponto de sela. Desde que b < c,
devemos ter c > d pois, caso contr ario, c seria um ponto de
sela. Prosseguindo desta maneira, vemos que d < a e a > b.
Em outras palavras, se a b, entao a > b, b < c, c > d e d < a.
Por simetria, se a b, entao a < b, b > c, c < d e d > a.
Com isto mostramos que se nao existem pontos de sela, ent ao

i i

i i
tdj
i i
2017/2/2
page 167
i i

167

ou a > b, b < c, c > d e d < a, ou a < b, b < c, c < d e d > a.


Usando as Equacoes 4.6, obtemos que

a p + d (1 p ) = b p + c (1 p )

Resolvendo para p , encontraremos que

cd
p =
(a b) + (c d)

Como nao existem pontos de sela, (a b) e (c d) sao ambos


uentemente, 0 < p < 1.
positivos ou ambos negativos, e conseq
O ganho medio do jogador linha usando esta estrategia e

ac bd
v = a p + d (1 p ) = .
(a b) + (c d)

Analogamente, usando as Equacoes 4.5, obtemos a seguinte ex-


press
ao:
cb
q =
(a b) + (c d)
com 0 < q < 1. A perda media do jogador coluna usando esta
estrategia e

ac bd
v = a q + d(1 q ) = .
(a b) + (c d)

[04] Como A n
ao possui pontos de sela, o jogo possui apenas equilbrios
de Nash
(p , 1 p ; q , 1 q )
totalmente mistos, isto e, com 0 < p , q < 1. Se v e o valor
do jogo, entao usando as desigualdades 4.3 com q = ek R4
para k = 1, 2, 3, 4, vemos que

' ( v
 1 +5 +1 2 v
p 1 p
v ,
+1 3 2 +5
v

i i

i i
tdj
i i
2017/2/2
page 168
i i

168 [CAP. C: RESPOSTAS DOS EXERCICIOS

v*

5 Coluna 2

3
v*

*{
=

8p
{7

=
p*

v*
+
v* = 5
2 Coluna 3
1 {2p p*
{
*+ =3
1 v*

0 1 p*
{1 Coluna 1

{2 Coluna 4

{3

Figura C.7: Envelope inferior.

isto e,

v 2 p + 1,

v 8 p 3,
(C.1)
v
3 p 2,

v 7 p + 5.
oes ans v = 2 p + 1, v = 8 p 3, v = 3 p 2
As func
e v = 3 p 2 representam os ganhos medios do jogador linha

quando ele escolhe a distribuicao de probabilidades (p , 1p) e


o jogador coluna escolhe as colunas 1, 2, 3 e 4, respectivamente.
Os gracos destas funcoes para 0 p 1 estao desenhados na
Figura C.7.
Para um valor xo de p , o jogador linha est
a seguro de que seu
ganho medio e pelo menos o mnimo destas quatro funcoes cal-
culadas em p , o envelope inferior destas quatro funcoes. Como
o jogador linha pretende maximizar os seus ganhos medios,

i i

i i
tdj
i i
2017/2/2
page 169
i i

169

entao ele precisa encontrar p que atinge o maximo deste en-


velope inferior. De acordo com a Figura C.7, o m aximo ocorre
justamente na intersecao das retas v = 2 p +1 e v = 3 p 2,
as quais representam, respectivamente, as colunas 1 e 3 do jo-
gador coluna. Deste modo, uma solucao do jogo 2 4 original
pode ser obtida estudando-se o jogo 2 2 denido pela matriz
' (
1 +1
R= .
+1 2

O valor deste jogo e v = 1/5 para p = 3/5 e q = 3/5.


Assim, um equilbrio de Nash do jogo original e dado por
 
3 2 3 2
(p , 1 p ; q , 0, 1 q , 0) = , ; , 0, , 0 .
5 5 5 5

Naturalmente, a tecnica aqui descrita pode ser aplicada para


qualquer jogo de soma zero com matriz A de tamanho 2 n.

[05] Lembre-se que ul (p, q) = pT Aq e ul (p, q) = pT Aq. Sejam


ek e el tais que

min ul (p , el ) = ul (p , el )
1ln

e
max (uc (ek , q )) = uc (ek , q ),
1km

isto e, pT Ael pT Ael para todo l e eTk Aq eTk Aq para


todo k. Desta maneira,

eTk Aq eTk Aq = (pT Ael ) = pT Ael pT Ael ,

para todo k = 1, . . . , m e l = 1, . . . , n. Por linearidade, segue-se


que
pT Aq pT Aq,
para todo p m e q n . Em particular, pT Aq pT Aq
e pT Aq pT Aq, isto e, ul (p, q ) ul (p , q ) e uc (p , q)
uc (p , q ) para todo p m e q n . Isto mostra que (p , q )
e um equilbrio de Nash do jogo.

i i

i i
tdj
i i
2017/2/2
page 170
i i

170 [CAP. C: RESPOSTAS DOS EXERCICIOS

Para a matriz A de tamanho 4 5 do enunciado, temos que


121 121 160
ul (p , e1 ) = , ul (p , e2 ) = , ul (p , e3 ) = ,
37 37 37
121 169
ul (p , e4 ) = e ul (p , e5 ) = ,
37 37
e
121 121 120
uc (e1 , q ) = , uc (e2 , q ) = , uc (e3 , q ) = e
37 37 37
121
uc (e4 , q ) = ,
37
de modo que

min ul (p , el ) = 121/37 = max (uc (ek , q )) = 121/37.


1ln 1km

Pelo resultado acima, isto mostra que (p , q ) e um equilbrio


de Nash do jogo.
n n
[06] Seja M = l=1 ail = k=1 akj a constante obtida pela soma
de qualquer linha ou coluna. Dena
 
1 1
p =q = ,..., n .
n n

Observe que, para todo k, l {1, . . . , n}, ul (p , el ) = p Ael =


n n
i=1 pi ail = pi
n
anil = M/n e uc (ek , q ) = ek Aq =
i=1

j=1 akj qj = qj j=1 akj = M/n. Portanto,

M
min ul (p , el ) = = max (uc (ek , q )).
1ln n 1km

Pelo resultado do exerccio anterior, conclumos que (p , q ) e


um equilbrio de Nash do jogo. Para o caso do quadrado m agico
da gravura Melancolia I de Albrecht D urer,
 
1 1 1 1
p =q = , , ,
4 4 4 4

e o valor do jogo e v = 34/4 = 17/2.

i i

i i
tdj
i i
2017/2/2
page 171
i i

171

[07] Se (p , q ) e um equilbrio de Nash totalmente misto, ent


ao,
pelas relacoes 4.5,
n

aij qj = v , i {1, . . . , n}.
j=1

Estas equac
oes podem ser escritas usando-se matrizes da se-
guinte maneira: Aq = v . Como, por hipotese, A e uma
matriz inversvel, segue-se que q = v A1 . Agora,
n
 1
qj = 1 1 = T q = v T A v = .
j=1
T A1
Sendo assim,
A1
q = .
T A1
Do mesmo modo, pelas relacoes 4.6,
n

pi aij = v , j {1, . . . , n}.
i=1

Estas equacoes podem ser escritas usando-se matrizes da se-


guinte maneira: pT Aq = v . Como, por hipotese, A e uma
matriz inversvel, segue-se que p = v A1 e, assim,
A1
p = .
T A1
Captulo 5
[01] O equilbrio de Nash em estrategias puras obtido por inducao
retroativa e
((Parar, Parar), (Parar, Parar)).
Este equilbrio nao e Pareto eciente pois, em comparacao com
o perl acima,
((Continuar, Continuar), (Continuar, Continuar))
d
a um ganho maior para os dois jogadores.

i i

i i
tdj
i i
2017/2/2
page 172
i i

172 [CAP. C: RESPOSTAS DOS EXERCICIOS

[02] O equilbrio de Nash em estrategias puras obtido por inducao


retroativa e
(Nao conar, Trair).
Este equilbrio nao e Pareto eciente pois, em comparacao com
o perl acima,
(Conar, Honrar)
d
a um ganho maior para os dois jogadores.

i i

i i
tdj
i i
2017/2/2
page 173
i i

Referencias
Bibliogr
aficas

[01] K. R. Apt, Uniform Proofs of Order Independence for Various


Strategy Elimination Procedures. Contributions to Theoretical
Economics, vol. 4, no. 1, article 5, 48 p
aginas, 2004.

[02] R. Aumann, What Is Game Theory Trying to Accomplish?.


Em Frontiers of Economics, K. Arrow, S. Honkapohja e
B. Blackwell (editores), pp. 28-76, 1985.

[03] R. Avenhaus, M. Canty, D. M. Kilgour, B. von Stengel, S. Za-


mir, Inspection Games in Arms Control. European Journal of
Operational Research, vol. 90, no. 3, pp. 383-394, 1996.

[04] G. S. Becker, Crime and Punishment: An Economic Approach.


Journal of Politial Economy, vol 79, pp. 169-217, 1968.

[05] A. T. Benjamin e A. J. Goldman, Analysis of the N-Card


Game Le Her. Journal of Optimization Theory and Applica-
tions, vol. 114, no. 3, pp. 695704, 2002.

[06] J. Bertrand. Theorie Mathematique de la Richesse Sociale.


Journal des Savants, pp. 499-508, 1883.

[07] E. Borel, The Theory of Play and Integral Equations with Skew
Symmetric Kernels. Econometrica, vol. 21, no. 1, pp. 97-100,
1953. Originalmente publicado em: Comptes Rendus Hebdo-
madaires des Seances de lAcademie des Sciences, 1921.

173

i i

i i
tdj
i i
2017/2/2
page 174
i i

174
REFERENCIAS
BIBLIOGRAFICAS

[08] E. Borel, On Games that Involve Chance and the Skill of the
Players. Econometrica, vol. 21, no. 1, pp. 101-115, 1953. Origi-
nalmente publicado em: Elements de la Theorie des Probabi-
lites, 1924.

[09] T. Borgers, Pure Strategy Dominance. Econometrica, vol. 61,


no. 1, pp. 423-430, 1993.

[10] S. J. Brams e D. M. Kilgour, Game Theory and National Se-


curity. Basil Blackwell, 1988.

[11] F. Brandt, F. Fischer e Y. Shoham, On Strictly Competitive


Multi-Player Games. Proceedings of the 21st National Confe-
rence on Articial Intelligence (AAAI), AAAI Press, pp. 605-
612, 2006.

[12] J. N. Brown e R. W. Rosenthal, Testing The Minimax Hy-


pothesis: A Re-Examination of ONeills Game Experiment.
Econometrica, vol 58, no. 5, pp. 1065-1081, 1990.

[13] L. I. de Castro e J. H. Faro, Introduc


ao `
a Teoria da Escolha.
25o Coloquio Brasileiro de Matematica, IMPA, 2005.

[14] V. Chvatal, Linear Programming. W. H. Freeman and Com-


pany, 1983.

[15] Y. C. Chen, N. Y. Long e X. Luo, Iterated Strict Dominance


in General Games. CIRANO Working Papers, 2007s-03, 2007.

[16] S.-F. Cheng e M. P. Wellman, Iterated Weaker-Than-Weak


Dominance Twentieth International Joint Conference on Ar-
ticial Intelligence, Hyderabad, India, pp. 1233-1238, 2007.

[17] P. A. Chiappori, S. Levitt e T. Groseclose, Testing Mixed-


Strategy Equilibria When Players Are Heterogeneous: The Case
of Penalty Kicks in Soccer. The American Economic Review,
vol. 92, no. 4, pp. 1138-1151, 2002.

[18] V. Conitzer e T. Sandholm, Complexity of (Iterated) Domi-


nance. Proceedings of the 6th ACM Conference on Electronic
Commerce, pp. 8897, 2005.

i i

i i
tdj
i i
2017/2/2
page 175
i i


REFERENCIAS
BIBLIOGRAFICAS 175

[19] A. A. Cournot, Recherches sur les Principes Mathematiques de


la Theorie des Richesses, 1838. Traduzido por N. T. Bacon em
Researches into the Mathematical Principles of the Theory of
Wealth, McMillan, New York, 1927.

[20] R. S. Datta, Algebraic Methods in Game Theory. Tese de dou-


torado, Departamento de Matematica, University of California
at Berkeley, 2003.

[21] R. S. Datta, Using Computer Algebra To Find Nash Equilibria.


International Conference on Symbolic and Algebraic Compu-
tation, Proceedings of the 2003 International Symposium on
Symbolic and Algebraic Computation, pp. 74-79, 2003.

[22] R. S. Datta, Finding All Nash Equilibria of a Finite Game


Using Polynomial Algebra. Artigo aceito para publicacao, The
Journal of Economic Theory, 2007. Disponvel eletronicamente
em: http://arxiv.org/abs/math.AC/0612462.

[23] G. Debreu, A Social Equilibrum Existence Theorem. Proceed-


ings of the National Academy of Sciences of the United States
of America (PNAS), vol. 38, no. 10, pp. 886-893, 1952.

[24] G. Debreu, Existence of Competitive Equilibrium. Em Hand-


book of Mathematical Economics, vol. II, K. J. Arrow e M. D.
Intriligator (editores), North-Holland, pp. 697-743, 1982.

[25] M. Dresher, Games of Strategy: Theory and Applications.


Prentice-Hall, Englewood Clis, 1961.

[26] M. Dufwenberg e M. Stegeman, Existence and Uniqueness of


Maximal Reductions Under Iterated Strict Dominance. Econo-
metrica, vol. 70, n. 5, pp. 20072023, 2002.

[27] K. Etessami, Algorithmic Game Theory and Aplications. Lec-


ture Notes, School of Informatics, The University of Edinburgh,
Scotland, UK, 2004.

[28] A. Fabrikant, A. Luthra, E. Maneva, C. H. Papadimitriou e


S. Shenker, On a Network Creation Game. Annual ACM Sym-
posium on Principles of Distributed Computing, Proceedings

i i

i i
tdj
i i
2017/2/2
page 176
i i

176
REFERENCIAS
BIBLIOGRAFICAS

of the Twenty-Second Annual Symposium on Principles of Dis-


tributed Computing, pp. 347351, 2003.

[29] J. W. Friedman, Game Theory with Aplications to Economics,


Second Edition. Oxford University Press, 1990.

[30] D. Fudenberg e D. K. Levine, The Theory of Learning in


Games. The MIT Press, 1996.

[31] D. Fudenberg e J. Tirole, Game Theory. The MIT Press, 1995.

[32] I. Gilboa, E. Kalai e E. Zemel, On the Order of Elimina-


ting Dominated Strategies. Operations Research Letters, vol. 9,
pp. 8589, 1990.

[33] I. Gilboa, E. Kalai e E. Zemel, The Complexity of Eliminating


Dominated Strategies, Mathematics of Operations Research,
vol. 18, no. 3, pp. 553565, 1993.

[34] I. L. Glicksberg, A Further Generalization of the Kakutani


Fixed Point Theorem, with Application to Nash Equilibrium
Points, Proceedings of the American Mathematical Society,
vol. 3, no. 1, pp. 170-174, 1952.

[35] S. Govindan e R. Wilson, Direct Proofs of Generic Finiteness


of Nash Equilibrium Outcomes. Econometrica, vol. 69, no. 3,
pp. 765-769, 2001.

[36] F. G
ul, D. Pearce, E. Stacchetti, A Bound on The Proportion
of Pure Strategy Equilibria in Generic Games. Mathematics of
Operations Research, vol. 18, no. 3, pp. 548-552, 1993.

[37] A. Hald, A History of Probability and Statistics and Their Ap-


plications before 1750. John Willey & Sons, New York, 1990.

[38] G. Hardin, The Tragedy of the Commons. Science, vol 162,


pp. 1243-1248, 1968.

[39] J. C. Harsanyi, Games with Randomly Disturbed Payos: A


New Rationale for Mixed Strategy. International Journal of
Game Theory, vol. 2, no. 1, pp. 1-23, 1973.

i i

i i
tdj
i i
2017/2/2
page 177
i i


REFERENCIAS
BIBLIOGRAFICAS 177

[40] J. C. Harsanyi, Oddness of The Number of Equilibrium Points:


A New Proof. International Journal of Game Theory, vol. 2,
no. 1, pp. 235-250, 1973.

[41] S. Hart, Games in Extensive and Strategic Forms. Captulo 2


em Handbook of Game Theory, vol. 1, R. J. Aumann e S. Hart
(editores), Elsevier Science Publishers, 1992.

[42] J. B. Hiriart-Urruty e C. Lemarechal, Convex Analysis and Mi-


nimization Algorithms I: Fundamentals. Springer-Verlag, 1993.

[43] J. Hirshleifer e E. Rasmusen, Are Equilibrium Strategies Unaf-


fected by Incentives?. Journal of Theoretical Politics, vol. 4,
no. 3, pp. 353-367, 1992.

[44] H. Hotelling, The Stability of Competition. The Economic Jour-


nal, vol 39, no. 153, pp. 41-57, 1929.

[45] S. Kakutani, A Generalization of Brouwers Fixed Point The-


orem. Duke Mathematical Journal, vol 8, pp. 457-459, 1941.

[46] T. H. Kjeldsen, John von Neumanns Conception of the Mini-


max Theorem: A Journey Through Dierent Mathematical
Contexts. Archive for History of Exact Sciences, vol. 56, no. 1,
pp. 39-68, 2001.

[47] D. Knuth, C. Papadimitriou e J. Tsitsiklis, A Note on Strategy


Elimination in Bimatrix Games. Operations Research Letters,
vol. 7, pp. 103107, 1988.

[48] D. M. Kreps, Game Theory and Economic Modelling. Claren-


don Lectures in Economics, Oxford University Press, 1990.

[49] C. E. Lemke e J. T. Howson Jr., Equilibrium Points of Bima-


trix Games. Journal of the Society for Industrial and Applied
Mathematics, vol. 12, no. 2, pp. 413-423, 1964.

[50] R. J. Leonard, From Parlor Games to Social Science: Von Neu-


mann, Morgenstern, and the Creation of Game Theory 1928-
1944. Journal of Economic Literature, vol. 33, no. 2, pp. 730-
761, 1995.

i i

i i
tdj
i i
2017/2/2
page 178
i i

178
REFERENCIAS
BIBLIOGRAFICAS

[51] R. J. Lipton e E. Markakis, Nash Equilibria via Polynomial


Equations. Em LATIN 2004: Theoretical Informatics, Lectures
Notes in Computer Science, Springer-Verlag, pp. 413-422, 2004.

[52] D. G. Luenberger, Linear and Nonlinear Programming, Second


Edition. Addision-Wesley Publishing Company, 1989.

[53] W. B. MacLeod, Incentives in Organizations: An Overview of


Some of the Evidence and Theory. Em Trends in Business Or-
ganization, Horst Siebert (editor), The Kiel Institute of World
Economics, 1995.

[54] E. Markakis, Computational Aspects of Game Theory and Mi-


croeconomics. Tese de doutorado, Faculdade de Computacao,
Georgia Institute of Technology, 2005.

[55] L. M. Marx e J. M. Swinkels, Order Independence for Iterat-


ed Weak Dominance. Games and Economic Behavior, vol 18,
pp. 219245, 1997.

[56] J. Maynard Smith e G. R. Price, The Logic of Animal Conict.


Nature, vol. 246, no. 5427, pp. 15-18, 1973.

[57] K. A. McCabe, A. Mukherji e D. E. Runkle, An Experimental


Study of Information and Mixed-Strategy Play in Three-Person
Matching-Pennies Game. Economic Theory, vol. 15, pp. 421-
462, 2000.

[58] R. D. McKelvey, A Liapunov Function for Nash Equilibria. So-


cial Science Working Paper 953, California Institute of Tech-
nology, 1998.

[59] R. D. McKelvey e A. McLennan, The Maximal Number of Regu-


lar Totally Mixed Nash Equilibria. Journal of Economic Theory,
vol. 72, pp. 411-425, 1997.

[60] A. McLennan, The Maximal Generic Number of Pure Nash


Equilibria. Journal of Economic Theory, vol. 72, no. 2, pp. 408-
410, 1997.

i i

i i
tdj
i i
2017/2/2
page 179
i i


REFERENCIAS
BIBLIOGRAFICAS 179

[61] I. Milchtaich, Congestion Games with Player-Specic Payo


Functions. Games and Economic Behavior, vol 13, n. 1,
pp. 111124, 1996.

[62] P. R. Milgrom e R. J. Weber, A Theory of Auctions and Com-


petitive Bidding. Econometrica, vol. 50, no. 5, pp. 1089-1122,
1982.

[63] J. Milnor, Analytic Proofs of the Hairy Ball Theorem and the
Brouwer Fixed Point Theorem. The American Mathematical
Monthly, vol. 85, no. 7, pp. 521-524, 1978.

[64] K. G. Murty, Linear Complementarity, Linear and Nonlinear


Programming. Heldermann-Verlag, 1988.

[65] R. G. Myerson, Nash Equilibrium and the History of Econo-


mic Theory. Journal of Economic Literature, vol. 37, no. 3,
pp. 1067-1082, 1999.

[66] J. F. Nash Jr., Equilibrium Points in n-person Games. Procee-


dings of the National Academy of Sciences of the United States
of America, pp. 4849, 1950.

[67] J. F. Nash Jr., Non-Cooperative Games. PhD. Thesis. Prince-


ton University Press, 1950.

[68] J. F. Nash Jr., The Bargaining Problem. Econometrica, vol. 18,


no. 2, pp. 155162, 1950.

[69] J. F. Nash Jr., Non-Cooperative Games. Annals of Mathemat-


ics, vol. 54, pp. 286295, 1951.

[70] J. F. Nash Jr., Two-person Cooperative Games. Econometrica,


pp. 128140, 1953.

[71] J. von Neumann. Zur Theorie der Gesellschaftsspiele. Mathe-


matische Annalen, vol. 100, pp. 295-320. Traduzido por S.
Bargmann: On the Theory of Games of Stategy em Contribu-
tions to the Theory of Games, vol. 4, pp. 13-42, A. W. Tucker
e R. D. Luce (editores), Princeton University Press, 1959.

i i

i i
tdj
i i
2017/2/2
page 180
i i

180
REFERENCIAS
BIBLIOGRAFICAS

[72] J. von Neumann e O. Morgenstern, Theory of Games and Eco-


nomic Behavior. Princeton University Press, 1944.

[73] B. ONeill, Nonmetric Test of the Minimax Theory of Two-


person Zerosum Games. Proceedings of the National Academy
of Sciences of the United States of America (PNAS), vol. 84,
pp. 2106-2109, 1987.

[74] M. J. Osborne e A. Rubinstein, A Course in Game Theory.


The MIT Press, 1994.

[75] R. Otter e J. Dunne, Games with Equilibrium Points. Proceed-


ings of the National Academy of Sciences of the United States
of America (PNAS), vol. 39, pp. 310-314, 1953.

[76] R. Radner e R. Roshental, Private Information and Pure Strat-


egy Equilibrium. Mathematics of Operations Research, vol. 7,
pp. 401-409, 1982.

[77] A. Rapoport e R. B. Boebel, Mixed Strategies in Strictly Com-


petitive Games: A Further Test of The Minimax Hypothesis.
Games and Economic Behaviour, vol. 4, no. 2, pp. 261-283,
1992.

[78] P. J. Reny, On The Existence of Pure and Mixed Strategy Nash


Equilibria in Discontinuous Games. Econometrica, vol. 67,
no. 5, pp. 1029-1056, 1999.

[79] C. A. Rogers, A Less Strange Version of Milnors Proof of


Brouwers Fixed-Point Theorem. The American Mathematical
Monthly, vol. 87, no. 7, pp. 525-527, 1980.

[80] R. W. Rosenthal, A Class of Games Possessing Pure-Strategy


Nash Equilibria. International Journal of Game Theory, vol. 2,
n. 1, pp. 6567, 1973.

[81] A. Rubinstein, Comments On The Interpretation of Game The-


ory. Econometrica, vol. 59, no. 4, pp. 909-924, 1991.

[82] B. W. Russell, Common Sense and Nuclear Warfare. George


Allen & Unwin, 1959.

i i

i i
tdj
i i
2017/2/2
page 181
i i


REFERENCIAS
BIBLIOGRAFICAS 181

[83] T. L. Saaty, Mathematical Models of Arms Control and Disar-


mament: Application of Mathematical Structures in Politics.
John Wiley & Sons, 1968.

[84] R. Savani e B. von Stengel, Exponentially Many Steps for Find-


ing a Nash Equilibrium in a Bimatrix Game. CDAM Research
Report LSE-CDAM-2004-03, 2004.

[85] T. C. Schelling, The Strategy of Conict. Oxford University


Press, 1968.

[86] U. Schwalbe e P. Walker, Zermelo and the Early History of


Game Theory. Games and Economic Behavior, vol. 34, no. 1,
pp. 123-137, 2001.

[87] L. S. Shapley, A Note on the Lemke-Howson Algorithm.


Mathematical Programming Study I: Pivoting and Extensions,
pp. 175-189, 1974.

[88] H. von Stackelberg, Marktform und Gleichgewicht. Julius


Springer, 1934.

[89] T. Stuckless, Brouwers Fixed Point Theorem: Methods of


Proof and Generalizations. Dissertacao de mestrado, Departa-
mento de Matematica, Simon Fraser University, 2003.

[90] I. Todhunter, A History of the Mathematical Theory of Proba-


bility. Chelsea, New York, 1949.

[91] J. P. Torres-Martnez, Fixed Points as Nash equilibria. Fixed


Point Theory and Applications, vol. 2006, 4 p
aginas, 2006.

[92] G. Tsebelis, The Abuse of Probability In Political Analysis: The


Robison Crusoe Fallacy. The American Political Science Re-
view, vol. 83, no. 1, pp. 77-91, 1989.

[93] G. Tsebelis, Are Sanctions Eective? A Game-Theoretic


Analysis. The Journal of Conict Resolution, vol. 34, no. 1,
pp. 3-28, 1990.

i i

i i
tdj
i i
2017/2/2
page 182
i i

182
REFERENCIAS
BIBLIOGRAFICAS

[94] A. Vetta, Nash Equilibria in Competitive Societies, with Ap-


plications to Facility Location, Trac Routing and Auctions.
Proceedings of the 43rd Annual IEEE Symposium on Founda-
tions of Computer Science (FOCS02), IEEE Computer Society,
pp. 416425, 2002.
[95] N. N. Vorobev, Foundations of Game Theory: Noncooperative
Games. Birkhauser Verlag, 1994.
[96] P. Walker, A Chronology of Game Theory. http://www.econ.
canterbury.ac.nz/personal pages/paul walker/gt/hist
.htm, 2005.
[97] R. Wilson, Computing Equilibria of N-Person Games. SIAM
Journal on Applied Mathematics, vol. 21, no 1, 1971.
[98]
E. Zermelo, Uber eine Anwendung der Mengdenlehre auf die
theories des Schachspiels. Atas do Decimo Quinto Congresso
Internacional de Matem aticos, vol. 2, pp. 501504, 1913.
[99] J. Zhao, The Equivalente Between Four Economic Theorems
and Brouwers Fixed Point Theorem. Working paper, Depart-
ment of Economics, Iowa State University, 2002.

i i

i i
tdj
i i
2017/2/2
page 183
i i

Indice


Arvore, 109 de estrategia estritamente
dominante, 15, 35
Bernoulli, Nicholas, 5, 126 de estrategia fracamente do-
Bertrand minante, 18
Modelo de duopolio, 129 de Nash, 20, 110
Binmore, Kenneth, 119 em estrategias mistas, 35

Borel, Emile, 6 perfeito em subjogos, 117
Espaco de estrategias
Combinacao convexa, 31, 138 mistas, 29
Complementaridade Linear, 102 puras, 11
Conjunto Estrategia
admissvel de um PL, 145 de um jogo sequencial, 109
convexo, 137 mista, 27
Cournot suporte, 80
Augustin, 5 pura, 11
Modelo de duopolio, 126 totalmente mista, 69
Folgas complementares, 102
de Montmort, Pierre Remond, Folha de uma arvore, 109
126 Forma
Dominancia normal, 11
em estrategias mistas, 32 padrao de um PL, 146
em estrategias puras, 14 Funcao
estrita iterada, 15, 34 concava, 139
fraca iterada, 18 convexa, 139
D
urer, Albrecht, 107 de melhor reposta, 22
objetivo de um PL, 145
Eciencia de Pareto, 59 quase-concava, 142
Equilbrio quase-convexa, 142

183

i i

i i
tdj
i i
2017/2/2
page 184
i i

184 INDICE

utilidade, 11 Kalmar, Laszlo, 6


esperada, 30
Le Her, 120
Gambit, 104 Lloyd, William Forster, 133
Ganho, 10
Market-clearing, 127
Hardin, Garret, 134 Matriz de payos, 12
Harsanyi, John, 9 Melhor resposta, 22
Metodo simplex, 149
Induc
ao retroativa, 114 Modelo de Duop olio
Informac
ao perfeita, 108 de Bertrand, 129
de Cournot, 126
Jogo de Stackelberg, 131
a batalha dos sexos, 13 Montmort, Pierre Remond, 5
bimatricial, 101 Morgenstern, Oskar, 8
Chicken, 52
Nash
comparar moedas, 21
Equilbrio de
da centopeia, 119
em estrategias mistas, 35
da conanca, 119
em estrategias puras, 20
da inspecao, 42
Nash Jr., John Forbes, 9, 60
de informacao perfeita, 108
No de uma arvore, 109
de soma zero, 82
2 2, 106
Otimo de Pareto, 59
2 n, 169
matriz inversvel, 107 Pareto, eciencia de, 59
quadrado magico, 107 Payo , 10
do covarde, 52 Perl de estrategias
estrategico, 11 mistas, 29
estritamente competitivo, puras, 11
82 Politopo, 138
hawk-dove, 54 Ponto
Le Her, 120 extremo, 148
na forma extensa, 108 xo, 60, 65
na forma normal, 11 Problema
n
ao-cooperativo, 11 de complementaridade li-
o dilema do prisioneiro, 11 near, 102
quadrado magico, 107 dual, 150
sequencial, 108 dual de um LP, 150

i i

i i
tdj
i i
2017/2/2
page 185
i i

INDICE 185

primal de um LP, 150 basica de um PL, 148


Produto homogeneo, 126 de folga de um PL, 146
Proposicao da Irrelevancia do Payo, von Neumann, John, 7
47 von Stackelberg, Heinrich, 131

Quadrado magico, 107 Waldegrave, James, 5, 126


Whitehead, Alfred North, 134
Raiz de uma arvore, 109
Ramo de uma arvore, 109 Zermelo, Ernst, 6
Rosenthal, Robert W., 119
Russell, Bertrand, 52

Selten, Reinhard, 9, 117


Semiespaco, 138
Semiplano, 138
Simplex, 149
Solucao
basica de um PL, 148
Solucao estrategica, 20
Stackelberg
Modelo de duopolio, 131
Subjogo, 116
Suporte, 80

Teorema
do ponto xo de Brouwer,
60
do ponto xo de Kakutani,
65
forte de dualidade, 152
fraco de dualidade, 152
fundamental da programacao
linear, 148
Tucker, Albert W., 11

Utilidade, 11
esperada, 30

Vari
avel

i i

i i

Potrebbero piacerti anche