Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
e 11:1. O:J1J
GO./lhJ.o
ROBERf GIBBONS
Universidad
de Cornell
UN PRIMER CURSO
DE TEORA DE JUEGOS
I
&
,~-
TraducCin de
Paloma Calvo.
y Xavier ViJa
.i
Universidad de Northwestern
Antoni
Bosch
O editor
.J
:',
'lb
'1'(
I,
~/""
l.i5
CONTENIDO
"':'
,','
":.
Prefacio
Liberdplex
i/1
Sl'aill
IX
1
2V
2
(.
v""
15
15
21
23
27
29/
29
33/
47
48
51
"
~:.
r;~
53
55';/ /
55./
59
62
66
69
a.J
t
VI I
2.3
2.4
2.5
2.6
2.7
~
..
.....
3.3
3.4
3.5
3.6
.."
t
i
CONTENIDO
69 '
71
73
77
80
80
87
101
106
112
11.5
115
122
129:/
130
139
143
144
144
146
150
152
152
155
159
164
169
169
172
175
177
185
185
CONTENIDU
4.2.B
4.2.C
4.2.D
4.3 Otras
4.3.A
4.3.B
4.3.C
4.4
4.5
4.6
4.7
ndice analtico
/ Vll
192
207
2JO
213
213
221
227
236
248
249
257
261
PREFACIO
j,
La teora de juegos es el estudio de problemas de decisin multipersonales. Tales problemas se plantean frecuentemente en economa. Como,es
bien sabido, por ejemplo, en situaciones de oligopolio se dan tpicamente
problemas de este tipo (cada empresa debe tener en cuenta lo que harn
las dems). Pero muchas otras aplicaciones de teora de juegos surgen
en campos ajenos a la organizacin industrial. A nivel micro econmico,
. muchos modelos de intercambio (como los de negociacin y de subasta)
utilizan teora de juegos. A un nivel de agregacin intermedio, y en el
campo de la economa laboral o de la economa financiera se utiliza ll
teora de juegos en mode!os cJ.ecomportamiento de las empresas en los
mercados de factores, o pai~' dilucidar problemas de decisin multiperso~
nales dentro de ellas: varios trabajadores compitiendo por un ascenso,v~~
rios departamentos compitiendo por unos mismos recursos. Finalmente,
al nivel ms alto de agregacin, en el campo de la economa internacional,
se utiliza en modelos en los que los pases compiten (o coluden) en sus
decisiones arancelarias y, en general, en una poltica econmica exterior;
o en macroeconoma, para analizar los resultados de la poltica monetari!l
cuando el gobierno y los agentes que determinan los salaribs o los precios
se comportan estr,atgicamente.
Este libro est conc~bido para presentar la teora de juegos a quienes
mstarde construirn (o, al menos, consumirn) los modelos de la teora
de juegos en los mbitos aplicados de la economa. Se han procurado
resaltar en l las aplicaciones de la teora, tanto al menos .como la propia
teora, por tres razones. En primer lugar, porque las aplicaciones ayudan
a ensear la teora. En segundo lugar, porque las aplicaciones ilustran el
proceso de construccin de modelos; es decir, el proceso de traduccin
de la descripcin informal de una determinada situacin a un problema
formal de teora de juegos para ser analizado. En tercer lugar, porque
las diversas aplicaciones permiten comprobar que problemas similares
surgen en reas diferentes del anlisis econmico, y que los mismos ins~
trumentos de teora de juegos pueden apliCarse en cada sihacin."Para :..
,'.,
x/
PREFACIO
Prefacio
-~':. :
..~.>-.-'~;.~,-.~~."..:\~.~-
/ XI
Aprend teora de juegos con David Kreps, John Roberts y Bob Wilson
durante mis estudios de doctorado, y con Adam Brandemburger, Drew
Fudenberg y Jean Tirole ms adelante. A ellos debo la parte. terica el: e:te
libro. El nfasis en las aplicaciones y otros aspectos del estIlo pedagoglco
del libro, en cambio, se los debo en gran parte a los estudiantes del departamento de economa del M.l.I. quienes, de 19~5 a 1990, inspiraron y
moldearon los cursos que han culminado en este lIbro. Estoy muy agradecido a todos estos amigos por las ideas que han compartido conmigo
y el estmulo que siempre me han otorgado, as com? ~or los numerosos
comentarios tiles al borrador del libro que he reCIbIdo de Joe Farrell ,
Milt Harris, George Mailath, Matthew Rabin, Andy Weiss y varios rticos
annimos. Finalmente, me complace reconocer los consejos y apoyo que
he recibido de Jack Repcheck de Princeton University Press y la ayuda financiera de una beca Olin en economa del National Bureau of EconOlnic
Research.
\'
1. JUEGOS ESTTICOS
CON INFORMACIN COMPLETA
\
:";
"
I JUEGOS
.~
,-.:.,'
COMPLETA (e. 1)
<
y.
y equilibrio de Nas/ I 3
Preso 1
-J,Q
-1,-1
Confesar (,'--c 9
"..
.',
-~'-
(6'-6
"\
En este juego, cada jugador cuenta con dos estrategias posibles: confe~
sar y no confesar. Las ganancias de los dos jugadores cuando eligen un par
concreto de estrategias aparecen en la casilla correspondiente-de la ma~
triz binaria. Por convencin, la ganancia del llamado jugador-fila (aqu el.
preso,l) es la primera, ganancia, seguida, po~:la.gananciadeL jugador:,:
columna (aqu el preso 2). Por eso, si por.ejemp~o;el pre~oJ elige caUar.y.
el preso 2 elige confesar, el preso 1 recibe una ganancia de-9(que repre,
senta nueve, meses en prisin) y el preso 2 recibe una gananCia de O (que
representa la inmediata puesta en libertad),
Ahora abordamos el caso generaL .La representacin en forma normal
de un juego especifica: (1) los jugadores en el juego, (2) las estrategias
de que dispone cada jugador y (3) la ganancia de cada jugador en cada
combinacin posible de estrategias. A menudo discutiremos juegos con
un nmero n de jugadores, enlos cuales los jugadores estn numerados de
1 a n y ~ jugadL~bitrari~~s denominad.o_p;.g;do:r-i:)SeGei~onjunto
de estrategias con que cuenta el jugador i (llamado espacio de estrategia1
de i), y sea Si un elemento arbitrario de este conjunto. (Ocasionahnet'ie
escribiremos si E Si rara indicar que la estrategia Si es uh elemento
del conjunto Si.)Sea (sI,'" ,sn) una combin'acin de estrategias, una para;
<l/JUEGOS
COMPLETA (c. 1)
es
,sn)'
Definicin. La representacin
en forma nonnal de un juego con n jugadores
especifica los espacios de estrategias de los jugadores SI,' .. ,Sn y sus funciones
de ganancias '!tI, ... Un. Denotamos este juego con G = {SI, ... ,SIl;Ul, ... Un}.
Aunque hemos indicado que en un juego en forma norm~llos jugadores eligen sus estrategias de forma simultnea, esto no significa que las
partes acten necesariamente de fonna simultnea. Es suficiente que cada
parte elija la accin a seguir sin conocer las decisiones de los dems, como
sera aqu el caso si los presos tomasen una decisin en momentos arbitraTosen sus celdas separadas. Adems, aunque en este captulo utilizamos
juegos en forma normal para representar solamente juegos estticos en
los cuales los jugadores actan todos sin conocer las decisiones de los
dems jugadores, veremos en el captulo 2 que las representaciones en
forma normal pueden darse en juegos con tomas de decisin sucesivas,
pero tambin que una alternativa, la representacin en fonna extensiva del
juego, es a menudo un marco de trabajo ms conveniente para analizar
los aspectos din,IIri,cosde los juegos.
1.1.B Eliminacin iterativa de estrategias estrictamente dominadas
t l '::
~
siempre que T > R > P > I, para plasmar las ideas de ganancias de
tentacin, recompensa, penalizacin e ingenuidad. De forma ms general:
Definicin. En el juego en forma normal G = {SI, ... ,Sn;Ul, ... ,lln}, sean s;
y s;' posibles estrategias del jugador i (por ejemplo, s; y s;' son elementos de Si).
La estrategia s; est estrictamente
dominada por la estrategia s;' si para cada
combinacin posible de las estrategias de los restantes jugadores la ganancia de i
por utilizar si es estrictamente menor que la ganancia de i por utilizar s;':
..
"::':.'
para cada (sIr' .. ,Si-l,Si+l,' .. ,sn) que puede ser construida a partir de los espacios de estrategias de los otros jugadores SI,'" ,Si~l,Si+l, ... ,Sn'
Los jugadores racionales no utilizan estrategias estrictamente dominadas, puesto que bajo ninguna conjetura que un jugador pudiera formarse
sobre las estrategias que elegirn los dems jugadores sera ptimo utilizar tales estrategias. 1. As, en el dilema de los presos, un jugador racional
elegir confesar, por lo que (confesar, confesar) ser el resultado alque lle-:
gan dos jugadores racionales, incluso cuando (confesar, confesar) supone
unas ganancias peores para ambos jugadores que (callar, callar). Como
el dilema de los presos tiene mltiples aplicaciones (que incluyen la carrera de armamentos y el problema del polizn en la provisin de bienes
pblicos) trataremos variantes del juego en los captulos 2 y 4. Por ahora
nos centraremos ms bien en si la idea de que jugadores racionales no utilizan estrategias estrictamente dominadas puede conducir a la solucin
de otros juegos.
Consideremos el juego abstracto de la figura 1.1.1.2 El jugador 1 tiene
dos estrategias y el jugador 2 tiene 3: Sr = {alta, baja} y S2 = {izquierda,
centro, derecha}. Para el jugador 1, ni alta ni baja estn estrictamente
1 Una cuestin complementaria tambin tiene inters: si no existe una conjetura que'el
jugador i pueda formarse sobre las estrategias de los dems jugadores, que haga ptimo elegir
la estrategia Si, podemos concluir que debe existir otra estrategia que domine estrictamente a
s.;? L;'respusta es afirmativa, siempre que adoptemos definidones adecuadas de "conj~tura';
y de "otra estrategia", trminos que incluyen la idea de estrategias mixtas que introduciremos
en la secdn 1.3.A.
1:::.-
:::--
1:
Jugador 2
Izquierda Centro
Jugador 1
Jugador 2
Izquierda' Centro Derecha
:Alta
"
1,0
12 ,
0,1
0,3
0,1
20
Figura .1.1
",
'
\~,'
..1l
']iigadr2
Izquierda Centro
Aita
"'1,0
'1,2'
0,3
0,1
!~gador 1
,"
Baja'
Figura 1.1.2
';":'~'.
'
,~,"'.
'
,."~';~;"~~V
.. J~~r~~#ft."'
:,f.~,..
. -'~;. x"
,l'"
1_,0
1_,2_
Figura 1.1.3
Jugador1
Baja
Alta 1__
Este proceso se denomina eliminacin iterativa de las estrategias estrictamente dominadas. Aunque est basado en la atractiva idea de que los
jugadores racionales no, utilizan estrategias estrictamente dominadas, el
proceso presenta dos inconvenientes. En primer lugar, cada paso requiere
un supuesto adicional sobre lo que los jugadores saben acerca de la racionalidad del otro. Si queremos ser capaces de aplicar el proceso pata
un ntmero arbitrario de pasos, neceSitamos suponer que es informaci11
del dominio pblico que los jugadores son racionales. Esto es, necesitamos
suponer no slo que todos los jugadores son racionales, sino tambin que
todos lbs jugadores saben que todos los jugadores son racionales, y que
todos los jugadores saben que todos los jugadores saben que todos I~s
jugadores son racionales, y as ad infil1itUt1l (vase la defihicin fomiaI de
informacin del dominio pblico en Aumaim [1976]).
;
La segunda desventaja de la eliminacin iterativa de estrategias estrictamente dominadas es que el proceso conduce a menudo a una prediCd'ri
imprecisa sobre el desarrollo del juego. Por ejemplo~ consideremos el
juego de la figura 1.1.4. En-estejuego no hay estrategias estrictamente dominadas para ser eliminadas. (Puesto que no hemos fun'darnltado est
juego en absoluto, al lector puede parecerle' arbitrario 'oinclusopafokgico.
Para una aplicacin econmica en el mismo sentido, vase el caso de tres
o ms empresas en el modelo de Cournot incluido en la seccin 1.2.A)
Puesto que todas las estrategias en el juego sobreviven a la eliminacin
iterativa de las estrategias estrictamente dominadas, el proceso no permite
ninguna prediccin sobre el desarrollo del juego.
,I
'A
,':.~'
(j D
0.4. ,0 .~\3
M .1!i) 0,.4',5,3
B. 3,5 3,5
6.6
, 1-
Figura 1.1.4
8/
A continuacin abordamos el equilibrio de Nash, un concepto de solucin que da lugar a predicciones mucho ms precisas en una clase de
juegos muy amplia. Demostramos que el equilibrio de Nash es un cOncepto ~iesoluc(nms poderoso que la_e.liminaciniterativa de las.estra~
tegias estrictamente.dominadas, en el sentido 'de que las estrategias de los
jugadores en un equilibrio de Nash siempre sobreviven a la eliminacin
iterativa de las estrategias estrictamente domin<).das,~osa que no ocurre
a la inversa. En los captulos siguientes argmnentareinos que, en juegos
ms dcos, incluso el equilibrio de N ash da lugar p. predicciones demasiado
impn;cjsas sobre el desarrollo. del juego, por lo que definiIemos nociones
de equilibdo an ms poderosas, ms adecuadas para estos casos. ,,"
..
",
(EN)
Si
si
es l/na solucin de
Para relacionar esta definicin con su fundamerltacin anterior, supongamos que la teora de juegos ofrece las estrategias (s~,
,s~) como
la solucin al juego en forma normal G =: {SI, ... ,Sn; 'Ul,
, un}' Decir
que (s~, ... ,s~) no constituyen un equilibrio de Nash de G es equivalente
a decir que existe algn jugador 'i tal que si no es la mejor respuesta a
(sl,/ ... ,si_l,si+I,
/
/
/') Esto es," eXIstea 1guna S'i en S,italque,.,
,.
... ,sn'
11
,\'
"',
As, si la teora ofrece las estrategias (s~, ... ,s~) como la solttdn pero estas
estrategias no constituyen un equilibrio de Nash, al menos un jugador
tendr un incentivo para desviarse de la prediccin de la teora, con lo
que la teora quedar desin~~tida por el desarrollo conCreto del juego.
Otra fundamentacin muy parecida del equilibrio de Nash incorpora la
idea de convenio: si surge un acuerdo sobre cmo comportarse en un
determinado juego, las estrategias fijadas por el convenio deben formar
un equil~bri~ de Nash;si no,-habr al menos un jugador que no se regir
por ~l,i:onv~nio.
'.
'
.
Para concretar, vamos a resolver unos cuantos ejemplos. COrisider~
moslos tr~-~eg~s en forma normal ya descritos: el dileIT;,adelos
y los de ia~j{iuras
1.1.1.
y 1.1.4. Una forma torpe de hallar los quili~
f ...
,
.
,
""
brios de Nash en un juego consiste simplemente en comprobar si cada
combinacin p~sible.de estTat~gias satisface la condicin'(EN) en la defi~
niciI1} En un juego de dos jugadores, esta forma dehlllarlos eqtrilibrios
co~~~del
modo siguiente: para cada jugador pa"rac~da estratep
posible ~onla que cuenta cada j"ugador se determina la mejo~ resp~sta
del 'otro 'juga.dor a-sa estrategia. En la figura 1.1.5 se representa esto en
el caso del juego definido en 1.1.4, subrayando la ganancia de la mejor
respuesta del jugador j a cada una de las posibles estrategias del jugador
i: Sj el jugador columna fuera a jugar 1, por ejemplo, la mejor respuesta
del jugador fila sera M, puesto que 4 es mayor que 3 y que O; por eo,
la gananCia q~e 4) proporciona al jugador fila en la casilla (M,I) de l
matriz binaria est subrayada.
p~es~~
3 En la seccin 1.3.A vamos a distinguir entre estrategias puras, y mixtas. Despus vamos
a ver que la definicin dada aqu describe equilibrios de Nash en estrategias puras, pero
que tambin puede haber equilibrios de Nash en estrategias mixtas. A menos que se.seale'
explcitamente de otro modo. todas las referencias'a los equilibrios de Nash en esta secci~.,~~C
refieren a equilibrios de Nash en estrategias puras.
la/JUEGOS
equilibrio de Nash. Para ver esto ltimo recordemos que en la figura 1.1.4,
el equilibri.? de Nash ofrece una nica prediccin C8,D), mientrlS que la
eliminacin iterativa de las estrategias estrictamente dominadas ofrece
una prediccin con el mayor grado de imprecisin posible: no se elimina
ninguna.estrategia; puede ocurrir cUllquiercosa.
Tras demostrar que el equilibrio de Nash es un concepto de solucin
ms poderoso que la eliminacin iterativa de las estrategias estrictamente
dominadas tenemos que preguntarnos si el equilibrio de Nash no es un
concepto de solucin demasiado poderoso. Esto es podemos estar seguros de que el equilibrio de Nash existe? Nash (1950) dem\Jsti que en
cualquier juego finito (por ejemplo, un juego en el cual el nun1ero n de
jugadores y los conjuntos de estrategias SI,' .. ,Sn son todos finitos) existe
al menos un equilibrio de Nash. (Este equilibrio puede~!1Cluirestrltegias
mixtas, que discutiremos en la seccin 1.3.A. Paraun J~unciado preciso
del teorema de Nash vase la seccin 1.3.B.) COUlnot (1838) propuso la
misma nocin de equilibrio en el contexto delJ1 modelo particular de
duo polio y demostr (por construccin) que existe un equilibrio en este
modelo; vase la seccin 1.2.A. En cada aplicacin anazada en este libro,
seguiremos el ejemplo de Cqumot: demostraremo~ q~e existe un equiJibrio de Nash (o ms poderoso) mediante la construcin de uno. En
.algunas secciones tericas, no obstante, utilizaremo~ el teorema de Nash
(o su anlogo para conceptos de equilibrio ms poderosos) y simplemente
diremos que existe un equilibrio.
.,
Conclullnos esta seccin con otro ejemplo clsico, la bat~lla de los sexos.
Este ejemplo muestra que un juego puede tener mltipl~~equl1i'Griosae
Nsh, y tambin ser til en las discusiones sob~~~stTategias mixtas de las
secciones 1.3.B y 3.2.A. En la exposicin tradicionldel juego (que, quede
claro, data de los aos cincuenta), un hombre y una mujer estn tratando
de decidir qu harn esta noche; nosotros analizarnos uha versin del
juego que no tiene en cuenta el sexo de los participantes} En lugares
de trabajo sep:rados, Paty Chris deben elegir entre ir a.'la pera' o lun
combate de boxeo.. Arn,bos(as) jugldores(as) preferiran pasar la noche
juntos(as), pero Pat preferira estar juntos(as) en el boxeo, mientras que
Chris preferira estar juntos(as) en la pera, tal como representamos en la
matriz binaria que sigue:
:,
.,,>'
B 3,5 3,5
'~
Figura 1.1.5
no
. ,~'
'..:::;:;
"t;Ut~{'~,\~J~~~t.:h~~\1i'\~~;;-\:c:
..', -,
:'
".
'.'
y equilibrio de Nas" / ]]
.
s En ingls, los diminutivos Pat y Chris pueden referirse tanto a nombres masculinos
(Patrick y Christopher) como femeninos (Patricia y Christinal. (N. de los T.)
12/
JUEGOS ESr,\rICOS
pera Boxeo
?,l
Boxeo
0,01,~
y equilibrio de Nash / 13
Apndice
Pat
pera
0,0
Chris
6 E
l
..
n a secaon 1.3.B describimos un tercer equilibrio de Nash (que incluye estrategias
nuxtas) en la batalla de los sexos. Al contrario que (pera,pera) y (boxeo,boxeo), este tercer.
eqUlhbno ofrece ganandas simtricas, como se podria esperar de la solucin nica a un juego
sunetnco. Por otro lado, el tercer equilibrio es tambin ineficiente, lo cual puede influir en
contra de que se llegue a un acuerdo para alcanzarlo. Cualquiera que sea nuestro juicio sobre
los eqUllibnos de Nash en la batalla de los sexos, la cuestin sigue en pie: pueden existir
Juegos para l~s cuales la teora de juegos no ofrezca una solucin nica y para los que no se
llegue a rungun acuerdo ..
;'~-~~::~'li;r"
"es
(Li.l)
para cada (sI;' .. ,si-l,Si+l,' .. ,Sn) que puede ser construida a partir de las
estrategias que no han sido an eliminadas de los espacios de estrategias
de losatros jugadores. Puesto que si es la primera delas estrategias de
,',
'~:'~
.
I
14/
COMPLETA (e. 1)
AplicaciO/leE'
(1.1.2)
Pero (1.1.2) es contradicha por (EN): si debe ser una mejor respuesta a
(si, ... ,s:~1,s:+l"" ,s~), por lo que no puede existir una estrategia
que
domine estrictamente a si. Esta contradiccin completa la demostracin.
Despus de haber demostrado la proposicin Bhemos ya demostrado
parte de la proposicin A; lo nico que nos queda demostrar es que si
la eliminacin iterativa de estrategias estrictamente dominadas elimina
todas las estrategias excepto (si, ... ,s~), estas estrategias forman un equilibrio de Nash. Por la proposicin B cualesquiera otros equilibrios de
Nash habran sobrevivido tambin, por lo que este equilibrio debe ser
nico. Suponemos aqu que G es finito.
El argumento es nuevamente por contradiccin. Supongamos que
la eliminacin iterativa de estrategias estrictamente dominadas elimina
todas las estrategias excepto (si, ... ,si'), pero estas estrategias no forman
un equilibrio de Nash. Entonces debe existir un jugador i y alguna estrategia factible Si en Si tal que (EN) no se cumpla, pero S debe haber sido
estrictamente dominada por alguna otra estrategia s; en algn punto de]
proceso. Los enunciados formales de estas dos observaciones son: existe
S en Si tal que
<'
(1.1.3)
y existe s; en el conjunto de estrategias del jugador i que queda en algn
punto del proceso tal que
.
(1.1.4)
para cada (S1,", ,S-1,Si+1," . ,sn) que puede ser construida a partir de las
estrategias que quedan en los espacios de estrategias de los otros jugadores
en ese punto del proceso. Puesto que las estrategias de los otros jugadores
(si, ... ,si_1,s:+1'" . ,s~) nunca son eliminadas, una de las implicaciones de
(1.1.4) es
(1.1.5)
/ 15
s;,
.<
1.2 Aplicaciones
1.2.A Modelo de duopolio de Cournot
Como hemos indicado en la seccin previa, Cournot (1838) se anticip
a la definicin de equilibrio de Nash en ms de un siglo (pero slo en
el contexto de un modelo concreto de duopolio). Por ello, no es sorprendente que el trabajo de Cournot constituya uno de los clsicos dea
teora de juegos y una de las piedras angulares en organizacin industriaL
Consideramos aqu una versin muy simple del modelo de Cournot y
presentaremos variaciones del modelo en los captulos siguientes. En esta
seccin utilizamos el modelo para ilustrar: (a) la traduccin del enunciado
informal de un problema a.la forma normal de un juego; (b) los clculos
necesarios para hallar el equilibrio de Nash del juego y (c) la eliminacin
iterativa de las estrategias estrictamente dominadas.
Sean q1 y q2 las cantidades (de un producto homogneo) producid~~
por las empresas 1 y 2 respectivamente. Sea P(Q) = a - Q el precio
de equilibrio de mercado cuando la cantidad agregada en el mercado es
Q = q1 + q2. (Ms precisamente, P(Q) = a - Q para Q < a. y P(Q) = Opara
Q 2: a.) Supongamos que el coste total de produccin de la cantidad qi
por la empresa i es C(q) = eq. Es decir, no existen costes fijos y el coste
marginal es constante e igual a e, donde suponemos que e < D.. Siguiendo
a Cournot, suponemos que las empresas eligen sus cantidades de forma
simultnea?
. 7 En la seccin 1.2.B discutimos el modelo de Bertrand (1883), en el cual las empres"s
ehgen preaos en vez de cantidades, y en la seccin 2.1.B el modelo de Stackelberg (J 934), en
el cual las empresas eJ:gen cantidades, pero una empresa eHge antes que (y es observada por)
la otra. Finalmente, discutimos en la seccin 2.3.C el modelo de Friedman (1971). en el cual la
interaccin descrita en el modelo de Coumot ocurre repetidamente en el tiempo .
Aplicaciones / 17
"
qi = 2(a - qj - e).
ql*
= 21(a -
q2 - e)
21( a -
ql - e .
y
q2 =
lri(qi,qj)
= q[P(q
'lLi(8i,8j)'
',ES,
8 Obsrvese que hemos cambiado ligeramente la notacin al escribir Ui(Si,Sj)
en vez
de 'l/.(SI,s2)'
Ambas expresiones representan las ganancias del'jugador i en funcin de las
estrategias elegidas por todos los jugadores, Vamos a utilizar estas expresiones (y sus anlogas
con 11 jugadores) indistintamente.
i~~.,
"
,..
,',
.,'
i.:,.
18
I JUEGOS
Aplicaciones
COMPLETA (c. 1)
I 19
y
del mismo modo, si q2 es menor que a. - c, la mejor respuesta de la empresa
les
-
"',
",!
'
q,
..::;
'Ir- (~
(O, a - e)
,q]
_) _ a - e
4
[3(0_ -
c) _
una
que
(a -
para
para
_]
q]
y
(O, (a - e)/2)
7fi
...
',-
x,qj
[a-c
-4- - x ] [3(a-C)
---4-- + x
a. - e
='lri ( qm,qj ) - X [ -2-
.)~
.-
. a - c)/2, O)
.,):
o.-c
( -4- -
-; Figura 1.2.1
(a
c, O)'
q,
+x
- qj
- qj
Tras estos dos pasos, las cantidades que quedan en el espacio de estrategias
de cada empresa sonlas contenidas en el intervalo entre (0.-c)/4 y (a-c) /2 .
La repeticin de estos argumentos conduce a intervalos cada vez menores
20/
JUECOS ESrrlCOS
CON INfORMACIN
Aplicaciones / 21
COMPLETA (e. 1)
R,(q)
(O, (a - e)/4)
".
,
.....
\ ..
,o,.
(a - e, O)
Figura 1.2.2
9 Estos dos argumentos son ligeramente incompletos, puesto que no hemos analizado
la mejor respuesta de la empresa i cuando no tiene la certeza de cul sea la cantidad qj'
Supongamos que la empresai no est segura de qj pero cree que el valoresper<ldo,de qj
es E(q.i)' Puesto que 1ri(Qi,Qj) es lineal en qj,!a mejor respuesta de la empresa -tdentrode
su incertidumbre es igual a su mejor respesta cuando tiene la certeza d que la "empresa j
elegir E(qj), caso' que hemos desarrollado en el texto.
."..
c....':~c.'""':'"
',"
,..:
22/
Aplicaciones!
empresai,
max
'
..
pI~ .,.,'~:'~!;"~',"rr;:.',,';'
:.::,
(pi ,pi)
=[a ~
~i./b;j][;~~'fr'
constituye un equilibriddeN~~~sr'para
-
cada
max [u,
O::;Pi
-]Ji
+ upj](Pi
eJ,
<00
+ bp*. + e).
.
Por 10 tanto, si el par de precios (pi ,pi) ha de ser un equilibrio de Nash,
las decisiones de precios de las empresas deben cumplir
pi =
pi
"i(pi'));)
pi es una solucin de
O::;Pi <00
qi(PPj) = a - Pi + bpj,
Pi ~ O.
23
~(iJ,
= ~(a +
0/2 + c)
y
pi = ~(a+opi
+c)
2
Resolviendo este par de ecuaciones obtenemos
*
p}
= P2 =
a+c
2 - b'
,, .
\",
'.'
24/
Aplicaciones / 25
IV,
es elegida
W,
Prob { weelegido}
1/Je +'W.}
Prob { x < --2-
(We
s)
+W
= F --2-
:.',
';-
y
Prob {. weelegldo}
e+ws)
1- F (1/J--2-
:':.'
We
'We . F CUe;'Ws)
+ w .
[1 _ F (We; Ws)] .
w:
. F(we+w;)
~:nwe'
--2-'-" +ws',[
es elegida
1-
F(we+w;)]
-'-2--
(W,+W,)
/2
As, el par de ofertas salariales (w:,w;) debe ser una solucin de las condici~nes de primer orden de estos problemas de optimizacin:
Figura 1.2.3
(!:,
(
y
El valor de x es conocido por el rbitro, pero no por las partes. Las parles creen que x se distribuye aleatoriamente segn una distribw,:in de probabilidad F(x), con la correspondiente funcin de densidad !(x).l1Dada
nuestra especificacin acerca del comportamiento del rbitro, si las ofertas
son UJe y w., las partes creen que las probabilidades Prob{we sea elegida}
y Prob{'Wssea elegida} pueden ser expresadas de la siguiente forma:'
Esto es, la probabilidad de que x sea menor que un valor arbitrario x' es F(x'),
Puesto q\le F(x') es una
probabilidad, tenemos que O ~ F(x') ~ 1 para cualquier x'. Adems, si. "," >. x',
H
F(x ) 2: F(x'); entonces Cc') 2: Opara cada x'.
(w; -
(....
11
Aplicaco/les
F(W;+W;)
2
=~.
2'
(1.2.2)
esto es, la oferta media debe ser igual a la mediana del acuerdo preferido
por el rbitro. Sustituyendo (1.2.2) en cualquiera de las condiciones de
primer orden obtenemos
W
-1))
* =
C,,;;w;
(1.2.3)
esto es, la distancia entre las ofertas debe serigual a la inversa del valor
de la funcin de densidad evaluada en la mediana del acuerdo preferido
por el rbitro ..
Consideremos el siguiente ejemplo, que ofrece un resultado de estatica
comparativa que resulta intuitivamente atractivo. Supongamos que el
acuerdo preferido por el rbitro se distribuye normalmente con media m
y varianza a2, en cuyo caso la funcin de densidad es
f(x) = _1_
exp { __ l_(x _
V2rra2
2a2
m)2}.
(En este ejemplo, se puede demostrar que las condiciones de primer orden
anteriormente dadas son suficientes.) Puesto que una distribucin normal
es simtrica con respecto a su media, la mediana de la distrjbuCn es igual
a su media, m. Por lo tanto, (1.2.2) se convierte en
W: 'w;
+
--2--=m
Y0.2.3) se convierte en
* __ 1__
~
we - f(m) - v2rra
*_
Ws
+~,
'ff
w*=m
e
'-
ff'
2
rra .'
2 ,-
/ Z7
28/
yul/(G)
1j
existencia de equilibrio / 29
1.2.4.,
',.:,.
Figura 1.2.4
Durante la primavera, los aldeanos eligen simultneamente cuntas
cabras van a tener. Supongamos que las cabras son continuamente divisibles. Una estrategia del aldeano i es la decisin sobre el nmero de cabras
que llevar a pastar en el ejido, 9.. Suponer que el espacio de estrategias
es [0,00) cubre todas las opciones' del aldeano; [O,Gmax) tambin bastara.
Las ganancias del aldeano opor criar 9i cabras cuando el nmero de cabras
criadas por otros aldeanos es 91,' .. ,9';-1,9i+l .. o,9", es
- e=
(1.2.7)
<: "',
( ;.
en (1.2.7).
1.3 Teora avanzada: Estrategias mixtas y existencia de equilibrio
,':
'.
~'.'
(1.2.4)
En la seccin 1.1.C hemos dinido Si como el conjunto de estrategias conque cuenta el jugador i, y la combiriacion de estrategias (si, ... ,s~) cono
un equilibrio deNash si, para cada jugador i,'.s7es la mejor respuesta' dt
jugador i a las estrategias de los otros n - 1jugadores:
(.
v(9' +
(1.2.5)
- e = 0,
(1.2.6)
donde C* denota 91'+ o.. + 9~. Por el contrario, el ptimo social, denotado
con G**, es una solucin de
(EN)
:::
'~~.
".'
Teora avanzada:
Jugador 2
Cara Cruz
Cara
"',
-1,1
1,~1
Cruz 1, -1
-1,1
Jugador 1
'.
<~.'
es
. 7.~';'\f,-:1~~>7
..
:ei:e'
~~~:;t~f~;
,
Estrategias
mixtas y existencia
de equililnio
/ 31
un elemento de incertidumbre sobre lo que harn los jugadores. A continuacin, introducimos la nocin de estrategia mix/:a, que interpretamos en
trminos de la incertidumbre de un jugador respecto a lo que otro jugador
har. (Esta interpretacin fue avanzada por Harsanyi [1973];la discutiremos con ms detalle en la seccin 3.2.A,) En la prxima seccin vamos a
ampliar la definicin de equilibrio de Nash para que incluya estrategias
mixtas, incorporando con ello el elemento de incertidumbre inherente a la
solucin de juegos como el juego de las monedas, del pquer, del bisbol
y de las batallas.
Formalmente, para el jugador i una estrategia mixta es una distribucin de probabilidad sobre (algunas o todas) las estrategias en Si' De
aqu en adelante nos referiremos a las estrategias en Si como estrategias
puras del jugador i. En los juegos con decisin simultnea e informacin
completa analizados en este captulo, las estrategias puras de un jugador
son las diferentes decisiones que el jugador puede tomar. En el juego de
las monedas, por ejemplo, Si consiste en las dos estrategias puras cara y
cruz, as que una estrategia mixta para el jugador i es la distribucin de
probabilidad (q,1 - q), donde q es la probabilidad de elegir cara, 1 - q es
la probabilidad de elegir cruz, y S q S 1. La estrategia mixta (0,1) es
simplemente la estrategia pUra cruz; del mismo modo, la estrategia mixta
(1,0) es la estrategia pura cara.
Como un segundo ejemplo de estrategia mixta, recordemos la figura
1.1.1, en la que el jugador 2 cuenta con las estrategias puras izquierda,
centro y derecha. En este caso, para el jugador 2 una estrategia mixta es la
distribucin de probabilidad (q,r,l - q - r), en la que q es la probabilidad
de elegir izquierda, r es la probabilidad de elegir centro y 1 - q - 7" es la
probabilidad de elegir derecha. Como antes, S q S 1, Y ahora tambin
S r S 1 Y O S q + r S 1. En este juego la ~strategia mixta 0/3,1/3,1/3)
asigna la misma probabilidad a izquierda, centro y derecha, mientras que
(1/2,1/2,0) asigna la misma 'probabilidad a izquierda y centro, pero no
asigna ninguna probabilidad a derecha. Como siempre, las estrategias
puras de un jugador son simplemente los casos lmite de sus estrategias
mixtas (por ejemplo, aqu la estrategia pura izquierda del jugador 2 es la
estrategia mixta (1, 0, O,
,,'
De forma .ms general, supongamosq~e el jugador i cuenta con [(
estrategias puras: Si = {Sil,:" ,.me}. En este caso, para el jugadori
una estrategia mixta es una distribucin de probabilidad (Pi]" .. ,]J;f(), en
la que Pik es la probabilidad,A~: <J~el jugador i elija la estrategia 8;b
para k = 1, ... ,J(. Puesto que Pik'es una probabilidad, es necesi1rio que
Ji
Definicin. En el juego en forma normal G '= {S], ... ,Sn; U], . , , /un} supongamos que Si = {Si], ... ,SiK }. En este caso para el jugador . una estrategia
mixta es lIna distribucin de probabilidad Vi = (P'i1" .. ,PiK), dnde
Pi, ::; 1
para k = 1, . , . ,K Y Pi] + . , , + Vil, = 1.
::;
Concluimos esta seccin volviendo brevemente a la nocin de estrategias estrictamente dominadas que introdujimos en la seccin 1.1.B,
con objeto de ilustrar el papel potencial de las estrategias mixtas en los
argumentos all utilizados. Recordemosque si una estrategia Si es estrictamente dominada, no existe ninguna conjetura que el jugador ' pueda
formarse (sobre las estrategias que elegirn los dems jugadores) tal que
hiciera ptimo elegir S". El argumento inverso tambin se cumple, siempre que permitamos estrategias mixtas: si no existe ninguna conjetura que
el jugador i pueda formarse (sobre las estrategias que elegirn los dems
jugadores) tal que hiciera ,ptimo elegir Si, existe otra estrategia que domina estrictamente a S.]4 Los juegos de las figuras 1.3.1 y 1.3.2 muestran
que este argumento inverso sera falso si limitramos nuestra atencin a
estrategias puras.
Jugador 2
1
. A 3,- 0,-
Jugador 1
Figura 1.3.1
I~ Pearce (l984) demuestra este resultado en el caso de dos jugadores, e indica que se
cumple para el caso de n jugadores siempre que las estrategias mixtas de los jugadores puedan
estar correlacionadas. Es decir, siempre que lo que suponga el jugador . sobre lo que har
el jugador j pueda estar correlacionado con lo que suponga el jugador i sobre lo que har el
jugador k. Aurnann (1987)sugiere que tal correlacin en los supuestos de i es completamente
natural, incluso si j, i Y k toman sus decisiones de fomla totalmente independiente: por
ejemplo, i puede saber que tanto j como k fueron a una escuela de direccin de empresas, o
incluso a la misma escuela, pero puede no saber lo que se ensea en ella.
La figura 1.3.1 muestra que una estrategia pura dada puede estar es'trictamente dominada por una estrategia mixta, incluso si la estrategia
pura no est estrictamente dominada por ninguna otra estrategia pura.
En este juego, para cualquier conjetura (q,l- q) que el jugador 1 pudiera
formarse sobre el juego del jugador 2, la mejor respuesta de 1 es o A
(si q ::::1/2) o !vI (si q ::; 1/2), pero nunca B. Sin embargo, B no est
estrictamente dOIInada ni por A ni por 1'1'1. La clave es que B est estrictamente dominada por una estrategia mixta: si el jugador 1 elige A
con probabilidad 1/2 y !vI con probabilidad 1/2, la ganancia esperada de
1 es 3/2, independientemente de qu estrategia (pura o mixta) utilice 2,y
3/2 es mayor que el pago a 1 que produce con certeza la eleccin de!?;
Este ejemplo ilustra el papel de las estrategias mixtas para encontrar "otra
estrategia que domine estrictamente a s/'.
Jugador 2
A 3,- 0,-
Jugador 1
Figura 1.3.2
La figura 1.3.2 muestra que una estrategia pura dada puede ser una
mejor respuesta a una estrategia IIxta,incluso si la estrategia pura no 'es
una mejor respuesta a ninguna otra estrategia pura. En este juego,'Bno
es una mejor respuesta para el jugador 1 a IoD deljugador 2, pero B E!s l
mejor respuesta del jugador 1 a la estrategia mixta (q,1 - q) del jugador 2,
siempre que 1/3 < q < 2/3. Este ejemplo ilustra el papel de las estrategias
mixtas en la "conjetura que se puede formar el jugador '".
i~
e~
A_
\,
Teora avanzada:
cada jugador cuenta con dos estrategias puras tiene un equilibrio de Nash
(que posiblemente incluya estrategias mixtas). Finalmente; enunciamos y
discutimos el teorema de Nash (1950), que garantiza que cualquier juego
finito (es decir, cualquier juego con un nmero finito de jugadores, cada
uno de los cuales cuenta con unnmero nito de estrategias puras) tiene
un equilibrio de Nash (que posiblemente iricluya estrategias mixtas),
Recordemos que la definicin de equilibrio de Nash dada en la seccin
1.1.C garantiza que la estrategia pura de cada jugadoI: consti,tuye una
mejor respuesta a las estrategias puras d los restantes jugaddres. Para
ampliar la definicin de modo que incluya estrategias mixtas, necesitamos simplemente que la e"strateiPaI"nixtade cada jugador sea.una mejor
respuesta a las estrategias mixtas de los otros jugadores. Puesto que cUale
quier estrategia pura puede ser representada <:'0#10 la estiit~gia que asigna
~a probabilidad cero a todas sus otras estrategias puras, esta definicin
ampliada incluye a la ari'terior.
. La forma de hallar la mejor respuesta del jugador i a una estrategia
mIXtadel jugador j se basa en la interpretacin de la estrategia mixta del
jugador j como representacin de la incertidumbre d~l Jugador i sobre lo
que har el jugador j. Continuamos con el juego de las monedas como
ejemplo. Supongamos que el jugador 1 cree que el jugador 2 elegir cara
con probabilidad '1 y cruz con probabilidad 1 - '1; esto es, 1 supone que
2 elegir la estrategia mixta ('1,1 - '1). Bajo,este supuesto, las ganancias
esperadas del jugador 1 son '1. (-1) + O - '1) . 1 = 1 - 2'1 eligiendo cara y
'1' 1 + 0- '1) . (-1) = 2'1 - 1 eligiendo cruz. Puesto que 1 - 2'1 > 2'1 -1 si
Yslo si '1 < 1/2, la mejor respuesta en estrategias puras del jugador.1 es
cara si '1 < 1/2 Ycruz si '1 > 1/2, Yel jugador 1 ser indiferente en.tre cara
y cruz si.'1 = 1/2. Nos quedan por considerar las estrategias mixtas del
jugador 1.
.
Sea (,,1 - ,) la estrategia mixta en la cual el j~gador 1 elige ~ara con
probabilidad ,. Para cada valor de '1 entre cero y uno, cakulamos.el(los)
valor(es) de" denotado(s) por ('1) tal que (,,1-,) sea una mejor respuesta
del jugador 1 a ('1,1 - '1) del jugador 2. Los resultados se r~cogen"~n la
figura 1.3.3. La ganancia esperada del jugador 1 al elegir (,,1-' ,) cuand~
2 elige ('1,1 - '1) es
,*
''1.(-1)+,0-
'1).1+(1-')'1,1
0.3.1) .
~_ .~,~ 'c~~'
f(1 -'1}
la probbil~daad
Estmtegil1S
mixtas y existencia
de c'1,llibrio / 3.5
,
,*('1)
(Cara)
(Cruz)
1/2
.1
'1
(Cara)
(Cruz)
Figura 1.3.3
La naturaleza de la mejor respuesta del jugador 1 a ('1,1 - '1) cambia
cuando '1 = 1/2. Como indicamos anteriormente, cuando r == 1/2 el
jugador 1 es indiferente entre las estrategias puras cara y cruz. Adems,
puesto que la ganancia esperada del jugador 1 en (1.3.1)es independiente
;';"",1;',"1",:
1, ,.1
36/
COMPLETA (e. 1)
LP2k'Ul(Slj,S2k)
~ LP2kUl(Sj~S2k)
k;l
k;1
para cada Slj' en SI' Esto es, para que una estrategia mixta sea una mejor
respuesta a P2 debe asignar una probabilidad positiva a una estrategia
pura concreta slo si sta es una mejor respuesta a P2. De forma inversa,
si el jugador 1tiene varias estrategias puras que son mejores respuestas a
P21 cualquier estrategia mixta que asigna toda su probabilidad a algunas
o ~ todas estas mejores respuestas en estrategias puras (y probabilidad
cero al resto de las estrategias puras) es tambin una mejor respuesta del
jugador 1 a P2.
Para dar un enunciado fonnal de la definicin ampliada del equilibrio
de Nash necesitamos calcular'la ganancia esperada del jugador 2 cuando
los jugadores 1 y 21;1tilizanlas estrategias mixtas PI y P2. Si el jugador 2 cree
que el jugad m 1 utilizar las estrategias (Sl1,' .. ,S1]) con probabilidades
(p11,' .. ,PIJ), la ganancia esperada del jugador 2 por utilizar las estrategias
(S21,' .. ,S2K) con probabilidades (p21," . ,P2K) es
V2(Pl,P:=
[ J
f;P2k
~PljU2(S1j,S2k)
:=
VI (Pl,P2)
:=
:=
L
j;l
Plj
L
j;l
0,3.2)
P2kUI (Slj,S2k),
k;1
[ K
c
L P2kU (Slj,S2k)
k;l
K
L
j;1 k;l
:=
(1.3.3)
(1.3.4)
PI
sobre
SI,
0.3.5)
~ v2(pi,P2)
c'
y pi debe cumplir
";:,-
P2 sobre
52.
Teora avanzada:
de cada jugador es una mejor respuesta a la estrategia mixta del otro jugador:
(1.3.4) y (1.3.5) deben cumplirse.
q
q*(r)
(Cara) 1
:'~:,
1/2
mixtas y existencia
de eqllilil".jrJ / 39
-------- ..-...'
(Cruz)
Estrategias
. (Cara)
(Cruz)
(Cara) 1
Figura 1.3.4
q*(r)
r
1/2
(Cara) 1
q*(r)
(Cruz)
1/2
1/2
(Cara)
(Cruz)
Figura 1.3.6
(Cruz)
q
(Cara)
(Cruz)
Figura 1.3.5
40
COMPLETA (c. 1)
r*(q)
(pera) 1
q*(r)
2/3
(Boxeo)
1/3
l:, .
(Boxeo)'
Figura 1.3.7
_.:,'
En cualquier juego, un equilibrio de Nash (que incluya estrategias puras o mixtas) aparece como una interseccin:,dJUas:.c.QITespon.dencias,de
mejor respuesta de los jugadores, induso cuando:hyms de dosjugdores y tambin cuando algunos o todos lsjugadores tienen ms de dos
estrategias puras. Por desgracia, los nicos juegos en los que las co~espondencias de mejor respuesta de los jugadores tienen representaciones'
grficas sencillas son los juegos de dos jugadores en:lasque cada jugador
slo tiene dos estrategias. Discutimos ahora con un argumento grfico que
cualquier juego de ese tipo tiene un equilibrio de Nash (que posiblemente
incluya estrategias mixtas).
o =w, '
,~.
'i~i..
,----,
42/
COMPLETA (e. 1)
Jugador 2
Izquierda Derecha
Alta
x,--..:.
Baja
Z,-
y,-
.-
Jugador 1
10,-
(Alta)
.,',
.. ,'
(Alta)
r*( q)
r*( q)
Figura 13.8
En el caso (i) para el jugador 1 alta,domi~a estrictamente a baja, y en
el caso (ii) baja domina estrictamente a alta ...Recordemos de la seccin
previa que una estrategia es estrictamente dornin~da si y slo si no existe
una conjetura que el jugador i pudiera ~onrtaise(sobre las estrategias que
elegirn los dems jugadores) tal quehicier ptimo elegir Si. AS, si
(g,l - g) es una estrategia mixta del jugador 2, donde g es la probabilidad
de que 2 elija izquierda, en el caso (i) no existe un valor de g tal que baja
sea ptima para el jugador 1, y en el caso (ii)no existe un valor de g tal
que alta sea ptima. Si (r,l- r) denota una estrategia mixta del jugador 1
en la que r es la probabilidad de que 1 elija alta, podemos representar las
correspondencias de mejor respuesta para los casos (i) y (ii) como en la
figura 1.3.9.(En estos dos casos las correspon<:ienciasde mejor respuesta
son de hecho funciones: de mejorrespuesta, puesto que no existe un valor
de g tal que el jugador 1 tenga mltiples mejores respuestas.)
-r
(Alta) 1
(Alta) 1 f-c_=._=
... 7::"".__=.__=.__=._~_._-_ -~.
f------~
r*(q)
<Baja)
(Izquierda)
r*(q)
(Baja)
1 q
(Derecha)
Caso (i)
(Izquierda)
Caso (ii)
Figura 1.3.9
(Derecha)
._. __
(Baja)
(Baja)
q'
(Izquierda)
q'l
(Derecha)
(Izquierda)
(Derecha)
Caso (iv)
Caso (iii)
Figura 1.3.10
Puesto que ql = 1 si x = Z y ql = Osi y = w, las correspondencias de
mejor respuesta en los casos en que ocurra x = Z o y = w tienen forma de
L (es decir, dos caras adyacentes del cuadrado unitario), como ocurrira
en la figura 1.3.10 si ql = Oo 1 en los casos (iij) y (iv).
Aadiendo ganancias arbitrarias del jugador 2 a la figura 1.3.8 y realizando clculos anlogos obtenemos la mismas cuatro correspondencias
de mejor respuesta, con la salvedad de que en el eje horizontal se mide
r y en el vertical se mide q, como en la figura 1.3.4. Girando 90 grados
y dando la vuelta a esas cuatro figuras, como hicimos para obtener 1.3.5,
obtenemos 1.3.11 y 1.3.12. (En estas figuras r' se define de forma anloga
a q' en la figura 1.3.10.)
La cuestin crucial es que, dada cualquiera de estas cuatro correspondencias de mejor respuesta del jugador 1, r'(q) de las figuras 1.3.9 o
1.3.10, y cualquiera de las cuatro del jugador 2, q'(r) de las figuras 1.3.11
o 1.3.12, el par de correspondencias de mejor respuesta tiene al menos
una interseccin, por lo qtieel juego tiene al menos un equilibrio de Nash.
Comprobarlo para los di~cisis pares posibles de correspondencias de mejor respuesta se deja como ejercicio. En lugar de ello, nosotros vamos a
.H
I JUEGOS
COMPLETA (e 1)
1-------"
(Alta)
1 f-.--"--_-----~
q*(I)
q*(r)
(Baja)
(Baja)
(Izquierda)
1 q
(Derecha)
Caso
(Izquierda).
(i)
(Derecha)
Caso (ii)
Figura 1.3.11
r
(Alta)
(Alta)
r'
en
se
q*(r)
q*(r)
(Baja)
(Baja)
1
(Izquierda)
(Derecha)
Caso (iii~
1
(Izquierda)
(x)
(Derecha)
Caso (iv)
x*
Figura 1.3.12
16 Los casos que incluyen x ~ z o y ~ w no contradicen la afirmacin de que el par de
correspondencias de mejor respuesta tiene al menos una interseccin. _Al contrario, adems
de las caractersticas cualitativas descritas en el texto, pueden ahora darse dos equilibrios de
Nash en estrategias puras sin un equilibrio de Nash en estrategias mixtas, y un continuo de
equilibrios de Nash en estrategias mixtas.
x*
Figura 1.3.13
1"
',',.
Lecturas
(x)
x'
adicol1alfs
I 47
de la figura 1.3.10: para q == q', r*(q') incluye cero, uno y todo el interv1lo
entre ellos. (De modo un poco ms formal, r*(q') incluye el lmite ele I"(q)
cuando q tiende a q' por la izquierda, el lmite de r*(q) cuando q liende a
q' por la derecha, y todos los valores de r entre ambos lnites:) Si (:;I)
en la figura 1.3.14 se comportara de forma anloga a la correspondencia
de mejor respuesta del jugador 1, (x') incluira no slo el crculo negro
(como en la figura), sino tambin el crculo blanco y todo el intervillo entre
ellos, en cuyo caso (x) tendra un punto fijo en x'.
La correspondencia de mejor respuesta de cada jugador se com.portil
siempre como r*(q') en la figura 1.3.14: siempre incluye (las generalizilciones adecuadas de) el lmite por la izquierda, el lmite por la derecha
y los valores intermedios. El motivo de esto es que, como demostramos
anteriormente en el caso de dos jugadores, si el jugador i tiene varias estrategias puras que son mejores respuestas a las estrategias mixtas de los
dems jugadores, cualquier estrategia mixta Pi que asigna toda su probabilidad a algunas o a todas las mejores respuestas en estrategias puras
deljugador i (y probabilidad cero al resto de las estrategias puras de i.) es
tambin una mejor respuesta del jugador i. Puesto que la correspondencil.de mejor respuesta de cada jugador se comporta siempre delmisll10
modo, io mismo ocurre con la correspondencia de mejor respuesta de
los TI, jugadores. Estas propiedades cumplen las hiptesis del teoremil de
Kakutani, por lo que esta ltima correspondencia tiene un pu.nto fijo.
El teorema de Nash garantiza que existe un equilibrio en una ampliil
clase de juegos, pero ninguna de las ilplicaciones analizadas en la seccin
1.2 pertenece a esta clase (porque cada aplicacin tiene espacios de estrategias infinitos). Esto demuestra que lils hiptesis del teorema de NilSh son
condiciones suficientes pero no necesarias para que exista un equilibrio;
existen muchos juegos que no cumplen las hiptesis del teorema pero, no
obstante, tienen uno o ms equilibrios de Nash.
Figura 1.3.14
Para ilustrar las diferencias entre (x) en la figura 1.3.14y la correspondencia de mejor respuesta de un jugador, consideremos el caso (iii)
17 El valor de (x') se indica conel crculo 'negro. El circulo blanco indica qu (X') no
incluye este valor. La lnea discontinua se incluye nicamente para indicar que ambos crculos
se dan cuando x = x'; no indica valores adicionales de (x').
Ejercicios / 49
consJtese Kreps y Scheinkman (1983), quienes demuestran que en algunas circunstancias el resultado de Cournot se da en un modelo de tipo
Bertrand en el cual las empresas se enfrentan a restricciones de capacidad (que escogen a un cierto coste antes de elegir los precios). Sobre
el arbitraje, consltese Gibbons (1988), quien demuestra que el acuerdo
preferido por el rbitro puede depender del contenido informativo de las
ofertas de las partes, tanto en el arbitraje convencional como en el de oferta
final. Finalmente, consltese Dasgupta y Maskin (1986) sobre la existencia del equilibrio de Nash en juegos con espacios de estrategias continuos,
incluyendo equilibrios en estrategias puras.
1.5 Ejercicios
1.1 Qu es un juego en fonna normal? Qu es una estrategia estrictamen te dominada en un juego en forma normal? Qu es un equilibrio de
Nash con estrategias puras en un juego en forma normal?
1.2 En el siguiente juego en fonna normal, qu estrategias sobreviven
a una elirnin'.lcin iterativa de las estrategias estrictamente dominadas?
Cules son los equilibrios de Nash con estrategias puras?'
[ C D
A
e..
1.5 Consideremos las dos versiones finitas siguientes del modelo de duopolio de Coumot. En primer lugar, supongamos que cada empresa debe
elegir o la mitad de la cantidad de monopolio, qm/2= (a -c)j4,o la-can~
tidad de equilibrio de Coumot, !Je = (a -c)/3. No pueden darse otras
cantidades, Demustrese que este juego con dos alternativas es, equivalente. al dilellla de los preso;>: cada eIIlpresa tiene una estrategia estrictamente dominada, y ambas estn peor en equilibrio que si cooperasen.
En segundo lugar, supongamos que cada empresa puede elegir o qm/2 o
qe, () una tercera cantid\idq' .. Hllese un valor de q' tal que el juego sea
equivl.1ehteal modelo de Coumot de la seccin 1.2.A, en el sentidq'de
que (qe,qe) sea un equilibrio de Nash nico y ambas empresas estn .pem;
en equilibrio de lo que estaran si cooperasen, pero ninguna de ellas tiene
una estrategia estrictamente dominada.
1.6 Considrese el modelo de duopolio de Coumot en el que la demanda
inversa es P(Q) = a - Q pero las empresas tienen costes marginales
asimtricos, Cl para la empresa 1 y C2para la empresa 2. Cul es el
equiJibrio de Nash si O < e.; < a/2 para cada empresa? Qu ocurre si
el < C2< a pero 2C2 > a + Cl?
(.
..,;.
SO/JUEGOS
.'/}
Referellcins / 51
COMPLETA (c. 1)
J':
solicitar trabajo en una de las empresas. Los trabajadores deciden simultneamente si solicitar el trabajo de la empresa 1 o de la empresa 2.
Si slo un trabajador solicita trabajo en una de las empresas, dicho trabajador obtiene el trabajo. Si ambos trabajadores solicitan trabajo en la
misma empresa, la empresa contrata a uno de ellos aleatorialnente, y el
otro queda desempleado (lo que significa una ganancia cero). Hllense
los equilibrios de Nash del juego en forma normal. (Para ms informacin
sobre los salarios que fijarn las empresas, consltese Montgomery [1991J.)
Trabajador 2
Solicitar a Solicitar a
empresa 1 empresa 2
Solicitar a
empresa 1
2:7/11'2:W]
Solicitar a
empresa 2
W2,1.v]
'UJl,W2
Trabajador 1
2: 'UJ2, 2: 'UJ2
Fecha 2
1.10 Demustrese que no existen equilibrios de Nash con estrategias mixtas en los tres juegos en forma normal analizados en la seccin 1.1: El
dilema de los presos, el de la figura 1.1.1 y,el de la figura 1.1.4.
1:11 ~llese el equilibrio de Nash con estrategias mixta~ del juego del
eJerCICIO
1.2.
1.6 Referencias
AUMANN,R. 1974, "Subjectivity and Correlation in Randomized Strategies" Journal of Mathematical Ecol1omcs 1:67-96.
-. 1976. "Agreeing to Disagree." Al1l1als of Statstics 4:1236-39.
A 2,1 0.2
B 1,~ 10
"
'
52/
,',
COMPLETA (e. 1)
'.'.'
2. JUEGOS DINMICOS
CON INFORMACIN COMPLETA
DASGUPTA,
P, y E. MASKIN,1986. "The Existence of Equilibrium in Discontinuous Economic Games, 1:Theory." ReviC'U!of Economic Studies 53:1-26.
FARBER,H., 1980, "An Analysis of Final-Offer Arbitration."Journal
flict Resolution 35:683-705.
FRIEDMAN,J. 1971. "A Noncooperative
Review of Economic Studies 28:1-12.
Equilibrium
for Supergames."
Reedicin.
Londres:
J. M.
KREPS,D., y J. SCHElNKMAN.1983. "Quantity Precommitrnent and Bertrand Competition Yield Cournot OutcolIles." Bell JOL/rnal of Economics
4:326-37.
MONTGOMERY,
J. 1991. "Equilibrium Wage Dispersion and Interindustry
Wage Differentials." Qllarterly JOl/mal of Economics 106:163-79.
NASH,J. 1950. "Equilibrium Points in n-Person Games." Proceedings of the
National Aeademy of Sciences 36:48-49.
PEARCE,O, 1984. "Rationalizable Strategic Behavior and the Problem of
Perfection." Econometrica 52:1029-50.
STACKELBERG,
H. VON, 1934, Marktfonn
Springer.
c\
'.','.
of Con-
L/nd Cleichgewicht.
Viena: Julius
Ijnestecaptulo
presentamos los juegos dinmicos. De nuevo, limi~amas nue~tra atencin a los juegos con informacin completa. (es ddr;
juegos en los que las fundones de ganancias de los jugadores so~ Wormacinqel dorinio pblico); vase una introduccin a 10s'jugOs con
informacin incompleta en el captulo 3. En la seccin 2.1 analiZarnos
los juegos dinmicos no slo con informacin completa, sino tambii:co~
informacin perfecta, lo que significa que en cada momentodeI'j1ego;~1
jugador a quien le corresponde decidir conoce la historia cmple'f:de
todas las decisiones tornadas hasta ese momento. En las secciries'i;2';
2.4, considercunos los juegos con informacin completa pero imperfet~:
en algn momento ~~l juego el jugador a quien le corresponde decidirno
conoce toda lahistoria del juego.
.
El tema central en todo juego dinmico es el de la credibilidad. Como
ejemplo de una amenaza que no resulta creble, consideremos el siguiente
juego de dos tiradas. Primero, el jugador 1 escoge entre dar 1.000 pesets
al jugador 2 () no darle nada, n segundo lugar, el jugado.r2 observa la
decisiridel jugador 1 y de~ide si hacer estallar o no una granada que
los matara a los dos. Supongamos que el jugador 2 amenaza' c;on hacer
estallar la granada a no ser que el jugador 11e page las 1.000 pesetas. Si
el jugador. 1 cree que puede cumplirse la amenaza, su mejor respuesta es
la de pagar las 1.000 pesetas. Pero el jugador 1 no debera creerse una
amenaza semejante: si al jugador :2 s~ le diera la oportunidad de ejecutar
dicha amenaza, escogera no hacerlo., Por tanto, el jugador 1 no debera'
pagar nada al jugador 2.1
En la seccin 2.1 analizamos los siguientes casos de juegos dinmicos
con informacin completa y perfecta: el jugador 1 decide primero, acto
seguido el jugador 2 observa la decisin dl jugador 1 y finalmente el juga1. El jugador 1 podra preguntarse si un o?>n~nie que amenaza con hacer explotar una'
granada est loco. Este tipo de dudas se modelali como informacin incompleta, porque el
jugador 1 no est seguro de la funcin d ganancias del jugador 2 (vase captulo 3).
(,
1",'
:',
'..
-,
1
Juegos dillmicos
COMPLETA (e. 2)
COI 'formacin
completa
y perfecta
/ 5.5
1J,1
(a1,o.z) y'Uz(al,o,z).
z
Muchos problemas econmicos se ajustan a esta descripcin. Dos ejemplos (que ms adelante discutiremos con mayor detalle) so~ el mo~elo d,e
duopolio de Stackelberg y el modelo de Leontief, de sal~~lO~y mv~l de
empleo en una empresa con fuerte implantacin ~~ un smdIcato .. ?lros
problemas econmicos pueden modelarse si permItimOS una suce:J7n de
movimientos ms amplia, ya sea aadiendo ms jugadores o penmllendo
q~e los jugadores tiren ms de una vez. (El modelo de negoci~ci.nde Rubinstein discutido en la seccin 2.1.0 es un ejemplo de este ultImo caso.)
Las caractersti~as clave de un juego dinmico con informacin completa
y perfecta son que (1) las decisones se toman de manera sucesiv~, .~2)
todas las decisiones anteriores son conocidas antes de tomar la deOSlon
2 Se podra permitir que el conjunto fa~tH:'I~'del jugador 2, Az, dep:n~iera de la accin
del jugador 1, al' Tal dependencia podra d~notarse con AZ(aI) O podna Incorporarse en la
funcin de ganancias del jugador 2 estableoendo que 11:z(a1'0,z) =
para valores de a2
do a Algunos movimientos del Jugador 1 podnan mcluso poner
que no son fac ti'bles d al'.'
. An
al juego sin dar la oportunidad de move~ a~jugador 2; para tales valores de al, el conJ'.~nto
de acciones factibles Az(o,J) contiene un umco elemento. de forma que el Jugador 2 no tiene
-ex:
eleccin posible.
",.'.
siguiente y (3) las ganancias de los jugadores para cada combinacin posible de jugadas son informacin del dominio pblico.
Resolvemos un juego por induccin hacia atrs de la siguiente forma:
cuando al jugador 2 le corresponda decidir en la segunda etapa del juego,
se enfrentar al siguiente problema, dada la accin al previamente adoptada por el jugador 1:
max
'u2(.l,az).
azEAz
'Ul (al,Rz(al).
alEA]
c.
(,
...
Juegos
COMPLETA (e. 2)
::~::
dil1tmicos
COI1 il1formacill
completa
y perfecta
/ 59
.
dor 2 lo sea: si 1piensa que 2 podra no ser racionill,
ro no que el Juga
1"
O'
pe
.
ger D en la primera etapa confiando en que 2 e 19wril, en
1 podna esCO
'.
'
I"
1 tercera
se nda, dando con ello la oportunida~.a 1 de Jug~r.
~n.8
la ; Otra osibilidad es quesea informaClon del dommlO ~ubhco q.ue el
~taPd' 2 Pracional pero no que el jugador 1 sea racional: sIl es raClonal
Juga or. es.que 2 cree que 1 podra no ser racional, 1 podna. escoger /) en
pero pIensa
.
l
.
' tapa confiando en que 2 pensara que 1 no es raClona, y, por
la pnmera e
"1
t
El
.
DI con la esperanza de que 1jugara D en a tercera e ilpa._"
tanto, Jugara
1 '. d D
r 'parte
USO de la induccin.hacia
atrs presupone que la e eCClOn e po.
eda
explicarse siguiendo este razonamiento. Para algunos Juegos,
,d e l pu
.
l'
. D arque 1
sin embargo, podra ser ms razonable suponer que J~go
~.'
.
.
.'
1
En
tales
J'uegosel
uso
de
la
mducClon
hacla
es, efectivamente, lrraClOna .
, . .
..
atrs pierd~ mucho de su atractivo como predlCclOn del J~ego,. tal como
le a'sa al equilibrio de Nash en juegos en los que la teona de Juegos no
p
.'
una solucin nica y no cabe esperar acuerdo alguno enbe
proporclOna
los jugadores.
2.1.B El mod~lo de duopolio de Stackelberg
,.'0
,
temporal del juego es el sig'uiente: (1) La empresa 1
escoge una can t'd
1 a d ql >
_ O., (2) la empresa 2 observa ,11 .y escoge entonces
.
una cantidad q2 ? O; (3) las ganancias de la empresa ~Vlenen dadas pOI la
funcin de beneficio
'7ri(q;,qj)
donde P(Q)
= qi[P(Q)
el,
a - Q es el precio de equilibrio
de mercado cuando la
ql -
q2 -
qz 2:0
el,
lo que resulta en
R2(ql) =="
a-ql-e
'
,.'
,.'
==maxqIfa - ql - R2(qi)
Ql2:0 .
. '.
-:- el
.
.. a- ql.""'"C
==maxql
'2
. ,.
Q2:0
lo que resulta' en
a-c
qi == -. -2-
a-c
R2(qi) ==-4-
que es el resultado por induccin hacia atrs del juego del duopolio de
Stackelberg.4
'..
'.
4 De la misma forma que el "equilibrio de Cournot" y el "equilibrio de Bertrand" se
refieren tpicamente al equilibrio de Nash de los juegos de Cournot y Bertrand, la mencin
del "equilibrio de Stackelberg" significa a menudo que el juego es de decisiones sucesivas en
vez de ~u:nultneas. Sin embargo, como se ha constatado en la secci'nanterior, los juegos
con deaslones sucesivas poseen a menudo mltiples equilibrios de Nash, de los cuales slo
uno est asociado can el resultado obtenido por induccin hacia atrs del juego, Por tanto, el
"equi1ib~o de Stackelherg" puede referirse tanto a la naturaleza secuencial del juego como al
uso de unrnterio de solucin ms poderoso que el mero equilibrio de Nash.
..
'
".
,"
1\3
= O.
=maxR(L)
L2:0
- wL,
max7r(w,L)
L2:0
Pendiente =
R(L)
L * (w)
Figura 2.1.1
Para garantizar que la condicin de primer orden R'(L) -w =. O ~enga
solucin, suponemos que R'(O) = 00 y que R'(oo) = O,tal como tndlCa la
figura 2.1.1.
La figura 2.1.2 representa L * (w) en funcin de tu (pero ~tiliza l~s e!es
de forma que faciliten la comparacin con grficos postenores) e lnchca
que L*(w) corta cada una de las curvas de isobeneficio de la e~1presa
en su punto mximo.6 Manteniendo L constante, ~a empr~s~ ~sta t.anto
mejor cuanto menor sea w, de forma que las curvas :sobenefIClo Dfenores
representan niveles de beneficio ms altos. La fi.gura 2.1.3 representa
las curvas de indiferencia del sindicato. Mantemendo L constante, el
sindicato est tanto mejor cuanto ms alto sea w, de forma que las curvas
de indiferencia ms altas corresponden a niveles de utilidad mayores del
sindicato.
6 Esta
dado 'UJ.
concreta
beneficio
ltima propiedad es simplemente otra manera~e decir que L *('UJ) maximiza 7f( ["w)
Si el sindicato pide 'UJ', por ejemplo, la elecoon de L por larte d~ l~ empresa se
en la eleccin de un punto en la recta hOrizontal w = 'UJ. El maxnno nivel de
posible se alcanza escogiendo L de forma que la curva de isobeneficio que posa por
'UJ
1J)'.
L *(w)
'
...'
Curva de indiferencia
del sindicato
w*
L*(w)
L
Curvas de isobeneficio de la empresa
L*
(w*)
Figura 2.1.2
'Figura
2.1.4.
,
w
L
Curvas de indiferencia del sindicato
Figura 2.1.3
(w,L*(w).
'.
',.,.,'
"~o
'.:
.'
66
1 JUEGOS
OlNMIC05
CON INFORMACIN
COMPLETA (e. 2)
completa y I",rleeta
67
w
Curva de beneficio
w*
de la empresa
L * (w*)
Figura 2.1.5
2.1.D Negociacin secuencial
Empezamos con un modelo de negociacin de tres periodos perteneciente
a la clase de juegos estudiada en la seccin 2.1.A. Pasamos luego a discutir el modelo de Rubinstein (1982), en el que. l nmero de periodos
. es (potencialmente) infinito. En ambos modelos se llega a un acuerdo
inmediatamente, no hay negociaciones prolongadas (como huelgas). En
el modelo de Sobel y Takahashi (1983) de negociacin secuencial con
informacin asimtrica, en cambio, pueden ocurrir huelgas en el nico
equilibrio (bayesiano perfecto) con probabilidad positiva (vase la seccin
4.3.B).
se
'"
1',
\.'
,
'"
,~
"
Analizaremos el siguiente juego sencillo, al cual (sin mucha inspiracin) llamaremos juego en dos etapas con informacin perfecta pero
incompleta:
1. Los jugadores 1 y 2 escogen simultneamente las acciones al y az de
los conjuntos factibles Aly Az respectivamente.
2. Losjugadores 3 y 4 observan el resultado de la primera etapa, (al,az), y
escogen entonces simultneamente las acciones 0.3 y 0.4 de los conjuntos
factibles A3 y A4 respectivamente.
.
~
3. Las ganancias sonui(al,az,a3,a4)
para i = 1,2,3,4.
Muchos problemas econmicos se ajustan a esta descripcin.8 Tres ejemplos (que discutiremos ms adelante con mayor detalle) son los pnicos
bancarios, los aranceles y la competencia internacional imperfecta y los
torneos (por ejemplo, la lucha entre varios vicepresidentes de una empresa
por ser el prxno presidente). Otros problemas e~xJl1micospueden modelarse si permitimos una mayor complejidad, ya sea aadiendo ms
jugadores o permitiendo que los jugadores jueguen en ms de una etapa.
Podra incluso hab~r~enos jugadores: en algunas aplicaciones.los jugadores 3 y 4 son los jugadores 1 y 2; en otras, bien el jugador 2 o el 4 no
aparece.
Resolvemos un juego de esta clase utiizando un enfoque parecido
~!_qe la induccin haci~ atrs, pero est~ vez, el primer paso quedamos
cuando nos movemos hacia atrs desde el final del juego exige la resolucin de un juego real(el juego siinultneoentre los jugadores 3 y 4 en
la segUnda etapa, dado el resultado de la primera etapa) en vez de resolver un problema de optnizacin para un nico individuo como en la
seccin anterior. P.arano complicar las cosas; supondremos en esta seccin
que para cada resultado factible de la primera etapa, (0.1,0.2), el juego que
queda pendiente enla segunda etapa entrylos jugadores 3 y 4 tiene un
nico equilibrio de Nash que denominam()s (a;(al,az),a(al,az.
~ la
seccin 2.3.A (sobre juegos repetidos) consideramos las consecuencias de
prescindir de este supuesto.
Si los jugadores 1 y 2 prevn que el comportamiento en la, segunda
etapa de los jugadores 3 y 4 vendr dado por (a;(al,a2~,-a(al,az,
la interaccin entre los jugadores 1 y 2 en la primera etapa se concreta en el
siguiente juego de decisiones simultneas:
8 Como en la seccin anterior, los conjuntos de ~ccioIies factibles de los jugadores 3 y 4 en
la segunda etap~, A:>! A4, podran depender del resultado de la primera etapa (al,a2)' En
particular, podnan eX1stirvalores (al,a2) que finalizaran el juego.
.. ,:'
1/,1
TI
"-z de
Sacar
Sacar
No sacar
r,r
D,2r - D
No Sacar 2r - D,D
R,R
Figura 2.2.1
Sacar
No sacar
Sacar
T,T
D,2r-'--D
No Sacar
2r - D,D
siguiente etapa
Fecha 1
Sacar
Sacar
R,R
NoSacar
D,2R - D,
No sacar
2R-
D,D
R,R
Fecha 2
Para analizar este juego procedemos hacia atrs. Considrese el juego
en forma normal correspondiente a la fecha 2. Como R > D (y por
tanto 2R - D > R), "sacar" domina estrictamente a "no sacar", de forma
que existe un nico equilibrio de Nash de este juego: ambos inversores
sacan el dinero, lo que conduce a unas ganancias de (R,R). Como no hay
descuento, podemos simplemeI1te sustituir estas ganancias en el juego en
forma normal correspondiente a la fecha 1, tal como indica la figura 2.2.1.
Dado que r < D (y por tanto 2r - D < 1'), esta versin de un periodo del
juego de dos periodos tiene dos equilibrios de Nash en estrategias puras:
(l) ambos inversores sacan el dinero, lo que conduce a unas ganancias
de (,.,.,.);(2) ninguno de los dos inversores saca el dinero, lo que lleva a
unas ganancias de (R,R). Por tanto, el juego original del pnico bancario
de dos periodos tiene dos resltados perfectos en subjuegos (y, por tanto,
no se ajusta totalmente a la clase de juegos definida en la seccin2.2.A):
(1) ambos inversores sacan el dinero en la fecha 1, lo que conduce a unas
-,
.,
fllegos
.....
...,.'
1r'i(ttj,hi,ehj,ej)
",
Wi(ttj,h"e"hJ,ej)
+ e;) -
tje
='2Qf
+ 1r'i(titjhi,ei,hj,ej)
+ tiej,
'!'~
Como 1r'i(t"tj,h"e"h;,e;)
puede escribi~e como la sum~ de los benefi~io,sde la empresa i en ~l.mercado i (los cuales son funcin de hi y e;
Ullicamente) y lm~beneficIOSde la empresa i en el mercado j (los cuales son funcin, de ei, h;.y tj. nicamente), el problema de optimizacin
en los dos mercados para la empresa i se simplifica al separarse en dos
problemas, uno para cada mercado: hi debe solucionar
, max
h,::::O
.-~
+ eJ~)-
hi[a - (hi
'
cL
y ei debe solucionar
maxei[a
<,::::0
- (ei
+ 11,*) - el J
te'.
J
'
9 S'
.
1 un consUffildor compra un bien a un, precio,p cua~dohab'r
estado dispuesto a
pagar un valor v, se beneficiade un excedente de v '-' p. Dada la i:ufV~de deinilcla inversa
Pi(Qi) ~ a - Q" si la cantidad vendida en ei mercado i es Qi, puede demostrarSe que el
excedente agregado del consumidor es (l/2)Qr
Suponiendo que
e; :::;a -
eH
dos etapas de
ill{omlOc/I
I 75
c, tenemos que
1(
,,)
11,; =
a - ej - e ,
'2
(22,1)
e - tj ) .
(2.22)
(Los resultados que derivamos son coherentes con ambos supuestos,) Las
dos funciones de mejor respuesta (2.2.1) y (2.2.2) deben cumplirse para
cada i = 1,2. Por tanto, tenemos cuatro ecuaciones con cuatro incgnitas
(hi,ei,hi,ei).
Afortunadamente, este sistema de ecuaciones puede simplificarse dividindose en dos grupos de dos ecuaciones con dos incgnitas,
Las soluciones son
h~ =
,
0.-
'3
+ ti
ei
0.-
C -
2tj
(2,23)
/,-.
76/
Ce.
2)
(2.2.3). Si (ti Ji) es un equilibrio de Nash de este juego entre los gobiernos,
entonces, para cada i, ti debe solucionar
max
W;*(ti,t*).
ti~O
Pero
W;*(t,tiJ
es igual a
(2(a - e) - ti?
(a - e + ti)2 + (a - e - 2t~?
1
18
+ t(a
t
- e - 2t)1
3'
por tanto
2.2.0 Torneos
a-e
t~ =--
e~ = a - e
como las cantidades escogidas por las empresas en la segunda etapa. Por
tanto, el resultado perfecto en subjuegos de este juego -de aranceles es
(ti
(a - e)j3,hj=hi=
4(u-:- e)j9,ej = ei = (a --' e)j9)~
'
En el resultado perfecto en subjuegos, la cantidad agregada en cada
mercado es S(a - e)j9. Sin embargo, si los gobiernos hubieran escogido
unas tasas, ar~ncelarias iguales a cero, la cantidad agregada en cada mercado habna SIdo 2(a - e)/3, exactamente igual que en el modelo de Cournot. Por tanto, el excedente de los consumidores en el mercado i (el cual,
como hemos visto anteriormente, es simplemente la mitad del cuadrado
de la cantidad agregada en el mercado i) es menor, cuando los gobiernos
esc?ge.n l~s tasas arancelarias que son estrategias dominantes, de lo que
~ena SIelIgieran unos aranceles iguales a cero. De hecho, unos aranceles
Iguales a cero son socialmente ptimos en el sentido de
=5 =
max
W(t],t2)
Consideremos a dos trabajadores y su capataz. El producto del trabajador i (i = 1 o 2) es Yi = ei + E donde ei es esfuerzo y Ei es ruido. El
proceso de produccin es el siguiente: Primero, los trabajadores escogen
simultneamente sus niveles no negativos de esfuerzo: ei ?: O. En se--'
gundo lugar, los valores de ruido E] y 1'2 se obtienen independientemente,
de acuerdo con una funcin dedensidad f(E) con media cero. Entercer
lugar, el producto de los trabajadores es obsen:ado pe~ono su
Los salarios de los trabajadores,' por tanto, pueden depender de lo que
han producido, pero no (directamente) de su esfuerzo.
Supongamos que el capataz decide inducir a los trabajadores a esforzarse ms y para ello les hace competir en un torneo;.tal y como originalmente analizaron Lazear y Rosen (1981).10 El salario recibido 'por el
vencedor del torneo (es decir, el trabajador quems:produica)eswA;"el
salario recibido por el perdedor es WB. La ganancia:deun trabajador que
reciba un salario W y realice un esfuerzO e es u(w,e) = w - g(e), donde la
desutilidad del esfuerzo, g(e), es creciente y convexa (es decir; g'(e) > O Y
g"(e) > O). La ganancia del capataz es Yl + YF-WA - WB.
Transcribimos ahora esta aplicacin'a lostrininos de la clase de juegos
discutida en la seccin 2.2.A. El capat~~'~"eIRg~dor 1~cuya accin al es
escoger lbs salarios W A y W B que se pagarn en el torneo. No hay jugador
2. Los trabajadores son los jugadores 3 y4;quienes observan los salarios .
escogidos en la primera etapa y deci~e,!-1~n.t,?~cessnultneamente sus
acciones a3 Y a4, es decir los esfur~o~'~l'y'~:(Consideraremos ms de-
e~fu~i~o~
+ Wi(t2,tl),
tl,t2~O
... ".
78 / ]VEGaS
COMPLETA (e. 2)
lante la posibilidad de que, dados los salarios elegidos por el capataz, los
trabajadores prefieran no participar en el torneo y acepten en cambio una
oferta de empleo alternativo.) Finalmente, las ganancias de los jugadores
son las establecidas anteriormente. Dado que lo que se produce (y por
tanto tambin los salarios) es funcin no slo de las decisiones de los jugadores sino tambin de los trminos de ruido El y (.2,operaremos con las
ganancias esperadas de los jugadores.
Supongamos que el capataz ha elegido los salarios WA y WB. Si el
par de esfuerzos (ei,ei) es un equilibrio de Nash del juego festante entre
los trabajadores, para cada i, ei ha de maximizar el salario esperado del
trabajador i menos la desutilidad del esfuerzo: ei debe ser una solucin
dell
,','
-_:;,'
Prob{Yi(e;) >
Yj(ej)}
=Prob{Ei >
' =1
ej +
e;}
Prob{Ei>e;+Ej-e,IEj}f(Ej)dEj
. j
/[1 -
F(ej
- ei
+ Ej)JJ(Ej)dEj,
WB)
J(e;
- ei + Ej)f(Ej)dEj
= g'(ei)'
e,,,=O
, = (WA
::.
donde
"',1::'"
Yi(ei)
- WB)
Yj(e;)}
Prob{Yi(ei) >
,,',
Yj(e;)}
+ WB
-' g(ei)
(WA - WB)
(2.2.4)
~ g(ei),
Como
-,,) :
(WA _
,-,~~tl
~~~,
.,::- ..'
~:',
.",.!:.'
--");
"
__
,~i
:;
~~','
"o,}'
,)~
.~}
,",.l~
'. '-,'
'
..../
~_l.>t'
)8Prob{Yi(ei) >
WB
8
ei
Yj(e;)}
- 9
'(
,)
e,.
(2.2.5)
.'
Es decir, el trabajador i escoge ei de forma que la desutilidad marginal de
un esfuerzo extra, g'(e;), sea igual al beneficio marginal de ese esfuerzo
adicional, que es el producto de lo que se gana en salario por venCer en el
torneo, WA '-w B, y el aumento marginal de la probabilidad de ganar.
Por la regla de Bayes,12
11 Al escribir (2.2.4),supusimos
que la funcin de densidad del ruido (e) es tal que el
suceso en el qU lostrabaj~dores producen exactamente lo mismo OCurrcon probabilidad
cero y, por tanto;no es necesario considerarlo en la funcin de utilidad esperada del trabajador
i. (Ms formalmente, suponemos que la funcin de densidad (E) es no atmica) En una
descripcin completa del torneo, sera natural (pero innecesario) especificar que el ganador se
determina a cara o cruz, o (lo que en este modeio resulta eqttivalente) que ambos trabajadores
reciben(wA
+wB)/2
(2.26)
:1
"
;:\
. j
l2La regla de Bayes proporciona una frmula para P(AIB), la probabilidad (condicional)
de que un suceso A ocurra dado que el suceso B ha ocurrido. Sean P(A), P(B) Y P(A,B)
las probabilidades (a priori) (es decir, las probabilidades antes de que tanto A como B hayan
tenido la oportunidad de ocurrir) de que A ocurra, B ocurra y de que ambos A y B ocurran
respectivamente.
La regla de Bayes establece que P(AIB) = P(A,B)/ P(B). Esto es, la
probabilidad condicional de A dado B es igual a la probabilidad de que ambos 'A y B ocurran
dividida por la probabilidad a priori de que B ocurra.
?:
:1
que satisfagan
-w,
2 ,~ + 2-wB
- g(e*)
>- Ua.
Juegos repetidos / 81
(2.2.7)
Jugador 2
(
Iz
D2
1,1 5,0
Jugador 1
WB
= 2Ua
+ 2g(e*) -
WA.
WB)
f(j)2dj
1,
Y (2.2.8)determina entonces
0,5 4,4
(2.2.8)
WA Y"illB.
2.3Juegos repetidos
En esta seccin analizarnos si las amenazas y promesas sobre el comportamiento futuro pueden influir en el comportamiento presente en situaciones que se repiten en el tiempo. Buena parte de lo que hay que entender
en estas situaciones se ha visto ya en el caso de dos periodos; pocas ideas
nuevas se requieren para entender los juegos con un horizonte infinito.
Hemos definido tambin el equilibrio de Nash perfecto en subjuegos. Esta
defircin tiene una expresin ms sencilla para el caso especial de los juegos repetidos que en el general de los juegos dinmicos con informcin
completa que considerarnos en la seccin 2.4.B. La introducirnos aqu para
tacilitar la exposicin posterior.
. '.
2.3.A Teora: Juegos repetidos en dos etapas
Consideremos el dilema de los presos dado en forma normal de la figura
2.3.1. Supongamos que hay dos participantes en este juego que deciden
simultneamente en dos ocasiones, habiendo observado el resultad"ode li,'l
primera decisin antes de decidir por segunda vez, y supongamos que las
('.
Figura 2.3.1
Jugador 2
Iz
D2
2,2 6,1
Jugador 1
1,6 5,5
Figura 2.3.2
Llamaremos a este juego repetido el dilema de los presos en:dos etapas.
Este juego pertenece a la clase de los juegos analizada en la seccin 2.2.A.
Aqu los jugadores 3 y 4 son idnticos a los jugadores 1 y 2, los espaCios
de acciones A3 y A4 son idnticos a Al y AZ Y las ganancias ui(al,a2,a3,a1l
son simplemente la suma de las ganancias en la'pnmera etapa (i.;a2)
y en la segunda etapa (a3,a4)' Adems, el dilema de los presos en d.s
etapas satisface el supuesto que hicimos en la seccin 2.2.A: para cada
resultado factible de la primera etapa del juego, (al,a21, el juego restant.e
en la segunda etapa entre los jugadores 3 y 4 tiene un nico equilibrio
de Nash, que denotamos por (a3(al,a21,a,i(al,a2'
De hecho, el dilema
de los presos en dos etapas satisface este supuesto de forma clara, como
seguidamente indicamos. En la seccin 2.2.A peTInitini.osla posibilidad de
que el equilibrio de Nash del juego restante en la segunda etapa dependa
del resultado de la primera etapa -de aqu la notacin (a; (al ,a2) ,a (al ,a2
en vez de simplemente (aj,a). (En el juego de los aranceles, por ejemplo;
las cantidades de equilibrio escogidas por las empresas en la segunda
etapa dependan de los aranceles escogidos por los gobiernos en la primera
etapa.) Sin embargo, en el dilema de los presos en dos tapas, el nico
~'.
[IleSOS
82 / JuEGOS DINMICOS CON INFORMACIN COMPLETA (c. 2)
...
}:
Definicin. Dado un juego de etapa G, G(T) denota el juego r.epetido finitamente en el que G se juega T veces, habiendo los jugadores observado los
resultados de todas las jugadas anteriores antes de que empiece la siguiente. Las
ganancias de G(T) son simplemente la suma de las ganancias de los T juegos de .
etapa.
Proposicin. Si el juego de etapa G .tiene un nicQequilibrio de Nash, entonces,
para cualquier T finito, el juego repetido G(T) tiene un ~ico resultado perfecto
en subjuegos: en cada etapa se juega el equilibrio de Nash de G.i3
13 Se ~btienen resUltados anlogos si el juego de etapa G es un jego dinmic con informadn completa. Supongamos que G es un juego dinmico con inJonndn completa y
perfecta de la clase definida en la secdn 21.A. Si G tiene un rjco resultado por inducdn
hada atrs, G(T) tiene un nico resultado perfecto en subjuegos: en cada etapa se juega el
resultado por inducdn hacia atrs de G. Sinillarmente, supongamos que G es un juego en
repef idos / 83
lora al caso de dos periodos, pero consideramos la posi.. vodlvdemqo:::1 J'uego de etapa G tenga mltiples equilibrios :le ..NilSh,
blhda
e
. d
. d
[y C ll1utan 1
3 3 1~as estrateglils enOillma as ./. d /
en l a fi gura 2 ..,
. 1
como
enOJ1Unal
.
de los presos d e l a fi gura 23.. I , pero las estrategias
. 'b .ilS
dIlem; sido aadidas al juego de forma que ahora existen dos eqUlh nos
Di ha
'.
(1 J) como en el dilema de los presos, y
,2
.
"1'
I
N h en estrategIas puras.
de as d
1
' (D D) Natura men te, es artl' f)' cial aadir un eqUllt mo a
a~ora a de~as pr~~os2de esta manera, pero nuestro inters en este juego
dIlema, e os 't'vo que sustan h' va. En la prxima seccin veremos que
es mas exposll
, 'h d
uilibrios
.
tidos infinitamente comparten este espm I e eq ..
los Juegos ~epe
'1'
d etapa que se repiten infinitamente tienen
. "
u'Iti les mc1uso SI os Juegos e
m . ~ 'uilibrio de Nash, como en el dilema de los presos. Por tal~to, en
un UNCOeq.
.
de etapa artificial en el contexto Sl1nple
. , n analIZamos un Juego
est~::cC1:riodos, y nos preparamos con ello para el anlisis poster~or de
de
p
..'
'co en un contexto con honzonte
un juego de etapa con mteres economl ,
infinito.
1-:'"
--
1,6
]1 1,1
1,1 1,1
~''!.
Figura 2.3.4
Existen tres equilibrios de Nash con estrategias puras en el juego
de la figura 2.3.4: (1],1z), (Cl,CZ) y (D],Dz). Como i'l1 la figura 2.3.2,
los equilibrios de Nash de este juego de una etapa corresponden a los
resultados perfectos en subjuegos del juego repetido original. Denotemos
con w,x),(y,z)
un resultado del juego repetido: (w,x) en la primera etapa
y (!J,z) en la segunda. El equilibrio de Nash (1],1z) de la figura 2.3.4
corresponde al resultado perfecto en subjuegos (1],[Z),(1],[2 del juego
repetlLio,puesto que el resultado previsto en la segunda etapa es (11,!z)
como consecuencia de cualquier resultado en la primera etapa excepto de
(C'],C'2). De la misma forma, el equilibrio de Nash (D],Dz) de la figura
~.3.4 corresponde al resultado perfecto en subjuegos Dl,Dz),(11'!Z
del
Juego repetido. Estos dos resultados perfectos en subjuegos del juego
repehdo simplemente enlazan los resultados de los equilibrios de Nash
de los juegos de etapa, pero el tercer equilibrio de Nash de la figura
2.3.4 genera un resultado cualitativamente diferente: (Cl,Cz) de la figura
todo.juego en dos etapas repetido, en primer lugar porque el cambio el) las definidones es
nunuscnlo y, en segundo lugar, porque en las secciones Z.3.B y 2.4.B aparecen definidones
mduso mas generales.
Juegos rq;elidos / 85
2.3.4 corresponde al resultado perfecto en subjuegos Cl,Cz),(D],D2)
del
juego repetido, puesto que el resultado previsto en la segunda etapa es
(Dl,Dz) como consecuencia de (Cl,C2). Por lo tanto, como hemos afirmado'
anteriormente, se puede alcanzar la cooperacin en la primera etapa de
un resultado perfecto en subjuegos del juego repetido. Esto es un ejemplo
de un resultado ms general: si G = {Al,'"
,An; uI- ... ,un} es un juego
esttico con informacin completa que tiene mltiples equilibrios, pueden
existir resultados perfectos en subjuegos del juego repetido G(T) en los
que, para cualquier t < T, el resultado de la etapa t no es un equilibrio
de Nash de G. Volveremos sobre esta idea en el anlisis de un juego con
horizonte infinito en la prxima seccin.
Juegos repetidos / 87
que
el
repetidos
infinitamente
(
''-.(,
~
..
1'.
~,
COMPLETA (c. 2)
Jugador 2
D2
1,1 5,0
0,5 4,4
Figura 2.3.6
16 El teorema de tradicin oral original se referia a las ganancias en todos los equilibrios
de Nash de un,juego repetido infinitamente. A este resultado se le llam teorema de tradicin
oral por ser ampliamente conocido entre los tericos de juegos de os "aos cincuenia, aun
sin que nadie lo hubiera publicado. El teorema de Friedman (1971) se refiere a lasgnancias
en ciertos equilibrios de Nash perfectos en subjuegos de un juego repebdo infinitamente y,
por tanto, refuerza el teorema de tradicin oral original al utilizar un criterio de solucin ms
fuerte, el equilibrio de Nash perfecto en subjuegos en vez del equilibrio de Nash. Sin embargo,
el antiguo nombre ha prevalecido: al teore;na de Friedman (y a otros resultados posteriores)
se les llama a veces teoremas ele tradicin oral, aun cuando' no hayan sido ampliamente
conocidos entre los tericos de juegos antes de ser publicados.
de la sucesin
00
Jugador 1
.'
L 5 l7f
t
t.
t=I
c..
';-',
"'~'-
,,",
'.'
Juegos repetidos ! 91
Estaes~~~t~i?aesun, ei,:fi,lplod:l~/~t.rategiadel
disparador(trigger strategy);.
'llamadaas p'orque el jugad~i coopera hastaquealguieridefa de Cooperar,
lo qu~Aesencadena' la;dcisln'de. rtovivi '~'.'cooperair.Utlcaffis: Si
ambos jugadores adoptnla, estrat~gia derdlsparador, el resUltado d~l"
juegorepeti~o inffuitamertte ser (Dl,D~)enCdaetapa.' Yerembs pnmeio
que si o est' lo suficientemente Cerca de uno, el hecho de que los dos
jugadores adopten esta estr~tegia cortstituyeun equilibrio de Nash del
juegorepetid infinitamente. Veremos a contiriu~cin que este equilibrio
de Nash es'perfecto en subjuegos, en un sentido que se precisar ms
adelante.
Para demostrar que la adopcin de la estrategia del disparador por
parte de los dos jUi?adores es un equilibrio de Nash del juego repetido
infinitamente, supondremos que el jugador i ha adoptado la estrategia
del disparador ydemostraremos a'continuacin, siempre que o est lo
suficientemente cerca de uno, que adoptar esta estrategia es tambin la
mejor respuesta del jugador j. Dado que el jugador i jugar I para
siempreeuand el resultado de alguna ronda difiera de (Dl~D2), lafuejor
respuesta del jugador j es efectivamente jugar Ij para siempre ruando el
resultado de alguna etapa difiera de (Dl,D2)' Queda: por determinar la
mejor respuesta del jugador ien la primera etapa yen cualquier etapa tal
que los resultados anteriores hayan sido (Dl,D2). Jugar Ij proporcionara
una ganancia de 5 en esta etapa, pero desencadenara la riocooperacin
del jugador"i (y, por tanto, tambin del jugador j) enio sucesivo, de forma
que la ganancia en cada etapa futUra sera 1: Comd'1++2+:. /=1/(1-0),
el valor presente de esta:sucesin de ganancias es
5 + 0.1 +
.::
..,'
_.
o'
5 + 1 _ '
(2.3.1)
.0
.1 + ... = 5 + -"-.
1-0
17 Naturalmente se puede definir tambin un juego repetido basado en un juego de etapa
dihInico, En esta seccin limitamos nuestra atencin a juegos de etapa estticos para poder
presentar las ideas principales de. forma sencilla. Las aplicaciones en las secciones 2.3.0 y
2.3.E son juegos repetidos basados en juegos de etapa dinmicos.
V =5+ 1_
. _
'.
"'.~
~,.~-
;.0
<
,"
Juegos repetidos I 93
clor de desCllento 6. Para cada t, los resultados de las t - 1 jugadas anteriores del
jllego de etapa son conocidos antes de que empiece la t-sima etapa. La ganancia
de cada jugador en G(co,o) es el valor presente de las ganancias que el jugador
outiene en la sucesin infinita de juegos de etapa.
En cualquier juego (repetido o no), la estrategia de un jugador es un
plan completo de accin, es decir, especifica una accin factible del jugador
en cada contingencia en la que le pudiera corresponder actuar. Dicho de
forma algo ms frvola, si un j~ga_dordejara una estrateg!a a su abogado
anles de que el juego empezase, el abogado podra sustituir al jugador
en el juego, sin necesitar en ningn caso de instrucciones adicionales
sobre cmo jugar. En un juego esttico con informacin completa, por
ejemplo, una estrategia es simplemente una accin. (Por esto describimos
lal juego como G = {S,,,,,Sn;'U,
... ,un} en el capitulo t pero aqu
pu:de describirse tambin como G = {A], ... ,An; U, '" ,un}: en un juego
estallco con informacin 120mpletael ~spacio de estrategias del jugador i,
Si, es simplemente el espacio de acciones Ai.) Sin embargo, en un juego
dinmico, una estrategia es ms complicada.
Consideremos el dilema de los presos en dos etapas analizado en la
seccin anterior. Cada jugador acruados veces, de forma que podra
pensarse que una estrategia es simplemente un par d irIstrucciones (b,c),
donde b es la decisin en la primera etapa y e es la decisin en la segunda
elapa. Pero existen cuatro resultados posibles de la pr11leraetapa, (1,1z),
U,Dz),(D1,1 y (D,D, que representan cuatro contingencias diferentes
en las que al jugador l~ podra corresponder actuar. Por tanto, la estrategia
de cada jugador consta de cinco instrucciones, que indicamos mediante
(VW,x,y,z), donde v es la decisin en la primera etapa y w,x,y y zson''!as
decisiones en la segunda etapa correspondientes a (11,h), (11,Dz), (DJz) y
(D,Dz) respectivamente. Usando esta notacin, las instrucciones "jugar b
en la primera etapa y jugar e en la segunda pase lo que pase enla primera"
se describen como (b,c,c,c,c), pero esta notacin tambin puede expresar
estrategias en las que la decisin de la segunda etapa es contingente del
resultado de la primera etapa, tal como (b,c,c,c,b), que significa "jugar b en
la pnmera etapa y jugar e en la segunda ronda a menos que el resultado
de la primera sea (D1,D:J, en cuyo caso jugar b". Del mismo modo, en
el juego. repetido en dos etapas basado en la figura 2.3.3, la estrategia
de cada Jugador consta de diez instrucciones, una decisin en la primera
etapa y nueve decisiones contingentes en la segunda etapa, una para cada
resultado posible de la primera etapa. Recordemos que al analizar el
liegos "e'e/idos
al juego original G(oo,o). Como en el caso con horizonte finito, existen tantos
subjuegos que empiezan en la etapa t + 1 de G(oo,o) como posibles historias del
juego hasta la etapa t.
Obsrvese que la t-sima etapa de un juego repetido no es por s misma
un subjuego del juego repetido (suponiendo que t < T en el caso finito).
Un subjuego es una parte del juego original que no slo empieza en un
momento en que la historia del juego hasta entonces es informacin del
domino pblico entre todos los jugadores, sino que tambin incluye todas
las decisiones posteriores a ese rnome~toen el juego original. Analizar la
t-sima etapa aisladamente sera equivaierit~a considerar la t-sima etapa
corno la etapa final del juego repetido .. Tal anlisis podra llevarse a cabo
pero no sera relevante para el juego repetido original.
Estamos ahora preparados para la definicin de equilibrio de Nash
perfecto en subjuegos, la cual depende a su vez de la definicin de equilibrio de Nash. Esta ltima no 11acambiado desde el captulo 1, pero ahora
apreciamos la complejidad potencial de la estrategia de un jugador en
un juego dinmico: en cualquier juego, un equilibrio de Nash es una coleccin de estrategias, una para cada jugador, tal que la estrategia de cada
jugador es la mejor respuesta a las estrategias de los dems jugadores.
Definicin. ,(Selten 1965): Un equilibrio de Nash es perfecto en subjuegos
si las estrategias de los jugadores constituyen un equilibrio de Nash en cada
subjuego.
'
,
,
qs
(Dl,Dz).
(0,5)
(5,0)
Ganancia al
jugador 1
Figura 2.3.7
'
Aplicamos seguidamente argumentos anlogos al juego repet.do infi'nitamente G(oo,o). Estos argumentos conducen al teorema. de Fnedman
(1971) para juegos repetidos infinitamente. Para enunciar' el teorema, necesitarnos dos ltimas definiciones. Primero, llamamos factIbles a las ga. (Xl,"" x n ) en ell'uego de etapa G si son una combinacin
convexa
nanCIas
.
(es decir, una media ponderada donde las ponderaciones son no-negativas
y suman uno) de las ganancias a las estrategias puras de. G. El conju.llto
de ganancias factibles en el dilema de los pres~s de la figura 2..3.6 es la
regin sombreada de la figura 2.3.7. Las gananCIas alas .estra~eglas puras
(1, 1), (0,5), (4, 4) Y (5, O) son factibles. Otros pagos factIbles mcluyen los
, ) para 1 < .,x < 4 que resultan de las medias ponderadas de (1,
pares (X,X
1) Y (4, 4), Y los pares (y,z) para y + z = 5 Y O < Y < 5, que resl1.ltan.de
las medias ponderadas de (O, 5) Y (5, O). Los otro~ pares en (el mtenor
de) la regin sombreada de la figura 2.3.7 son medIas ponderadas de las
Juegos repetidos / 97
media de la sucesin
00
O -
8)
8t-]7ft._
t=1
cada jugador ' y si (j est lo suficientemente cerca de uno, existe UI1 equilibrio de
Nash perfecto en subjuegos del juego repetido infinitamente G(oo,ti) que alcanza
(X], ... ,xn) como ganancia media.
'
Pago al jugador 2
(0,5)
(.
(5,0)
Ganancia-al
jugador 1
Figura 2.3.8
La demostracin de este teorema repite los argumentos ya dados para
el dilema de los presos repetido infinitamente, de forma que la relegamos
al apndice, Es conceptualmente inmediato pero algo complicado de notacin extender el teorema a los juegos de etapa de buen comportamiento
que'~~ ~~~ni,finitosni ~iticos (veremos algunos ejemplos ~n las apli7
caciones d las tres prximas secciones). En el contexto del dilema de
lo~p~sos de la fisuril 2.3.6.- el teorema de Friedman garantiza que puede
alcanzarse cualquier punto en la regin ms oscura de la figura 2.3.8como
ganancia media en Un equilibrio de Nash perfecto en subjuegos del juego
rep~tido, siempre y cuando el factor de descuento est lo suficientemente
cerca de uno.
, Concluimos esta seccin esbozando dos derivaciones adicionales de la
teora de juegos repetidos infinitamente, que se complican al aadrseles
la siguiente caracterstica especial del dilema de los presos. En el dilema
de los presos (de una etapa) de la figura 2.3.6, el jugador i puede estar
seguro de recibir,como mnimo la ganancia de 1 del equilibrio de Nash,
jugando 1;. En un juego de duopolio de Cournot de una etapa (como
el descrito en la seccin 1.2.A), por el contrario, una empresa no puede
estar segura de obtener los beneficios del equilibrio de Nash produciendo
,, .:.
<,'
, .~t~;
'b:
~t::
98 I
JUEGOS DlNMIICOS
CON INFORMACIN
,',
... ,-,'
. "
'
Juegos
COMPLETA (e. 2)
I'qJef
idos I 99
Esto es,
adi
es una solucin de
max lLi(o.xl, - -'
,o,x,i_l,ai,o..T:i+l,'"
,o.xn).
a,EA,
Sea
di
di = v,;(axl,'
, . ,o,,,,,i-l ,0.di,0'x,;+1
100/
COMPLETA (e. 2)
a XlI. a X'l+
. 1I
...
a)xn
>
e,
Ui
((le]"
...
,aen).
(dado que los dems jugadores han adoptado la estrategia del disparador)
es axi si y slo si { ?: (di - xi)/(di - ei).
Combinando esta observacin con el hecho de que la mejor respuesta
de 'i es jugar aei para siempre si el resultado de alguna etapa difiere de
(axIJ' .. ,axn), conc'uimos que jugar la estrategia del disparador por parte
de todos los jugadores es un equilibrio de Nash si y slo si
,
u
?: max
1
'
= d., + 1 _o oei.
'"
,~I:/~
o V,-,- x
,/0
,) S"1Jugar
u.
adi
Vi = Xi + oVi,
es. ptimo, entonces
Vi
= di
+ --e.
1-0'"
Xi
-->d+-1 - { - " 1 _
o e,,,.
o>
d; -
Xi
di -
ei'
d,; - Xi
-d--'
i - ei
Como di ?: Xi > ei, debe ocurrir que (di - xi)/(di - ei) < lpara cada i,
de foim que eI~valormximo de esta fraccin para cualquier jugador sea
tambin estrictamente menor que 1.
Queda por demostrar que este equilibrio de Nash es perfecto en subjuegos. Es deCir,'que las estrategias del disparador deben constituir un
equilibrio de Nash en cada subjuego de G(oo,o). Recordemos -que cada
subjuegode 0(00,0) idntico al propio G(oo,o). En el equilibrio de Nash
con estrategias del disparador estos subjuegos pueden agruparse en dos
clases: (i) subjuegos en los que los resultados de las etapas anteriores han
sido (axl, .. -: ;a~n), y (ji) subjuegos'en los
el resultado de al menoS.ri{
etapa difiere de (axl,' .. ,axn)' Si los jugadores adoptan la estrategia 'del
disparador en el juego completo, (i) las estrategias'd los jugadores riun'
subjuego de la primera etapa son de nuevo las estrategias del disparador
que, tal como acabamos de demostrar, constituyen un equilibrio de Nash
del juego completo, y (ii) las estrategias de los jugadores emin subjuegdcle .
la segunda das e consisten simplemente en repetir el eqcilibno~a~IJiieg
de etapa (ael,' .. ,aen), lo que tambin es un equilibrio de Nash d~l jrieg;;~"
completo. Por tanto, el equilibrio de Nash conestrategiasciel cfu;Parador
del juego repetido infinitamente es perfecto en subjuegOs.
es
qu
':,.,
....... '
':.."
--------
COMPLETA (c. 2)
"
",',
max
qj
(a -
q'
',':.'
:::
7rd
+ 1 _ 6 . 11"c,
Producir q*
producir q*
uno de los
producir la
_.
max (a, -
qj - q* - c)qj.
qj
_l,q
~ c)q,
2'
m
'(2.3.2)
1
1-8
--
'11"*
>
-
7rd
8
1-6
+ --'
7rc,
J !legos repetidos /
COMPLETA (c. 2)
105
= 7f(x) + --
. -7f
2
m.
siguiente:
--
1-5
V(x)
Sustituyendo
V(x)
(2.3.3)
. -7r
m_
(2.3.4)
?: 7r dp(X) + 5V(x).
en (2.3.3) obtenemos
5 G7rm
-7r(X)
?: 7rd -
~7fm.
Es decir, lo que se gana en este periodo por desviarse no debe ser mayor
que el valor descontado de la prdida en el periodo siguiente debida a
la penalizacin. (Siempre y cuando ninguna de las empresas .se desvi
de la fase de penalizacin, no hay ninguna prdida a parlii dl si~ente
periodo, ya que la fase de penalizacin termina y las empresas velven
al resultado de monopolio, como si no hubiera habido desviacin.) Dl
mismo modo, (2.3.4) puede reescribirse como
.
1-
-":
(a - qj - x - e)qj.
qj
5 G7fm
7r(x)
?: 7rdP
~ 7f(x?::
..
',
COMPLETA (c. 2)
Jllegos
mente.
Shapiro y Stiglitz (1984) desarrollan un mo.delo ~inmico en el q.ue
l empresas inducen a los trabajadores a trabajar mas pagando salanos
:r:os y amenazando con despedir a los que sean descubiertos trabajando
poco. Como consecuencia de estos salarios altos, las empresas reducen su
demanda de trabajo, de forma que a1g1.mostrabajadores tendrn empleo
n salarios altos mientras que otros estarn (involuntariamente) parados.
ca
d
,.
1
Cuanto mayor sea el nmero de trabajadores para os, mas tIempo e
llevar a un trabajador que haya sido despedido encontrar un nuevo
empleo, de forma que la amenaza de despido resulta ms. efectiva. En
el equilibrio competitivo, el salario 'w y la tasa de paro 1J, mduc.en a los
trabajadores a esforzarse, de tal forma que la demanda de trabajO de las
empresas al salario lJ) hace que la tasa de desempleo ~ea exactamente 'U,.
Vamos a estudiar los aspectos de este modelo que tienen que ver co~
los juegos repetidos (pero ignoraremos los relacionados co~ el equilibriq'
competitivo) analizando el caso de una empresa y un trabajador.
, Consideremos el siguiente juego de etapa. En primer lugar, la empresa
ofrece al trabajador unsalario,vJ. En segundo lugar, el trabajador a.ceptao
rechaza la oferta de la empresa. Si el trabajador rechaza w, se conVIerte en
un trabajador independiente con un salario Wo. Si el trabajador acepta UI,
escoge entre realizar un esfuerzo (lo que le produce una desutilidad e~o no
(lo que no le produce desutilidad). La decisin tornada por el traba~ador
sobre su esfuerzo no es observada por la empresa, pero lo que el traba)'Jdor
produce es observado tanto por la empresa como por el.!!abajador. La
produccin puede ser alta o baja; para simplificar, suponemos que el
nivel bajo de produccin es cero y escribimos, eLnivel~1to como y > O.
Supongamos que si el trabajador realiza un esfuerzo, la produccin es ~J,ta
con probabilidad 1, pero que si el trabajador no se esfuerza, la producClon
es alta con probabilidad p y baja con probabilidad 1 - p. Por tanto, en
este modelo, un nivel bajo de produccin es signo inequvoco de falta de
esfuerzo.
.tI
Si la empresa emplea al trabajador con un salario w, las gananciils a
lbs jugado~es si el trabajador realiza un esfuerzo ~ la pro~uccin e: alta
son y - w para la empresa y w -'- e para el trabajador. SI el trabaJildor
no se esfuerza, e es cero; si la produccin es baja, y es cero. Suponemos
que y - e > lIJO> py, de forma que al trabajador le resulta eficiente estilr
e)
+ 8y':,
{jp)O
O
-p\. wa_ }
{j'
'\."
w
.
',1'
1-
2: Wo + '(1
(j
p{j
)e
p .
Juegos repelidos /
COMPLETA (c. 2)
(1 -
+ 1 + ---
== Wo
(j
[jO - p)
(2.3.5)
(2.3.6)
>
_wo+
'(1 1- 6)
.+-/5-. e,
w::
y - w*
2: O.
(2.3.7)
Recordemos que supusimos que y - e > Wo (es decir, que para el trabajador
es eficiente estar empleado por la empresa y esforzarse). Necesitamos una
condicin ms fuerte si estas estrategias han de formar un equilibrio de
Nash perfecto en subjuegos: (2.3.5) y (2.3.7) implican
Y-e>
- 'tilo +
1-/5
---e
60 - p)
111
,'.
'112
COMPLETA (c. 2)
::-C'Tr2
_ (y _y*)2,
y =by*
+d(-r - 7[e)]2.
d~~~tp.J~
'
1l'*(-re)
= --:J?[(l c+ u-
b)y*
+ d-re].
(2.3.8)
.'
~:;,,
~
,
;:~;~~\:i!~W;.;,~,\
~r,.lol~J~:~:.i~;~\"1'~'.\I'.I';,;,,:,;1;'r,,,,l..l.'~I'
..,,.:.,,;"" .:.:"'J.._~'
~-...:..!...~...:..-'~~L~,I
.........
_ .~I;.l...;.'--:'<'~.
---.---------
Juegos dil1micos
COll
/ 115
<...
".-,:
. ,~.;.
'.":.'
="..
_l_W(O
1-b
O)
'-
>
(".+(0),0)
+ _rS_vV("',""'s),
1-15
(2,39)
con infoIDlacin
completa
pero imperfecta
19
116/
COMPLETA (c. 2)
nos juegos una de las dos formas es ms apropiada que la otra. Vamos a
ver cmo los juegos estticos pueden representarse utilizando la forma extensiva y cmo los juegos dinmicos pueden ser representados utilizando
la forma normal.
Recordemos de la seccin l.1.A que la representacin en forma normal
de un juego requiere precisar: (1) los jugadores, (2) las estrategias posibles
de cada jugador y (3) las ganancias recibidas por cada jugador para cada
combinacin de estrategias posibles.
Definicin. La representacin en fanna extensiva de un juego exige preci~ar:
(1) los jugadores, (2a) cundo tiene que jugar cada jtigador,(2b) lo qt{e cada
jugador puede hacer cada vez que tiene la oportunidad de jugar, (2c) lo que cada
jugador sabe cada vez que tiene la oportunidad de jugar y (3) la ganancia recibida
por cada jugador para cada combinacin posible de jugadas.
ALmqueno lo dijimos en su momento, eillas secciones 2.1 a 2.3 hemos
analizado varios j~egos representados en forma extensiva. La contribucin de esta seccin consi~te elldescribir estos juegos en forma derbol
en vez de utiliZr' palabr~s, porqtie el uso derbo~es,.~ menudo'facilita
tanto la explicaci6n co~o el anlisis.
' .. , .> .,.
' ..
Como ejemplo de un juego en formaextensiva, consideremseI siglliente representante d la clase de juegos en dos etapas 'con informacin
completa y perfecta presentada en la seccin 2.1.A:
1. El jugador 1 escoge una accin al del conjunto factible Al = {J,D}.
2. El jugador 2 observa al y escoge entonces una accin a2 del conjunto
,42 = {J',D'}.
3. Las ganancias son Ul (al,az) y -uz(al,a2), como se indica en el rbol de
la figura 2.4.1.
<..
2,')
Ganancia al jugador 1:
Ganancia al jugador 2:
2
1
Figura 2.4.1
o
O
. Puede parecer innecesario exigir que la estrategia de un jugador es-p~tmque una accin factible, para cada contingencia en la que al jugadb~'I)l~diera<;orrespQnderle decidir~;Resulta claro, sin embargo, que no
. ,poarqlOs aplicar lanociri de equilibrio de Nash a los juegos dinmicos
118/
COMPLETA (c. 2)
Juegos dinmicos
con informacin completa si permitiramos que las estrategias de un jugador ~epran sin especificar sus acciones en algunas contingencias. Para
que el Jugador j calcule una mejor respuesta a la estrategia del jugador i,
puede que j necesite considerar cmo,actuara i en todas y cada una de las, '
contingencias, no slo en las contingencias que i o j creen que es posible'
~~~.
..
, o.'.
COI!
, .,
forma extensiva. Denominemos las filas de la forma normal
entaClonen
.
I
d
sd aCuerd oc on las estrategias factibles del Jugador 1 y las ca umnas e
e d o con las estrategias factibles del jugador.. 2, y calculemos las gana 11euer
a.
en cada combinacin posIble de estrategIas,
~aoo 1 J'ugadores
'
" como se
. dica en la figura 2.4.2.
111 Una vez mostrado que un juego dinmico puede rep~esentars: .en
seguidamente a demostrar cmo un Juego
formano,rmal pasemos
,
, estatIco
'
.
de
decisiones
simultneas)
puede
representarse
en
forma
(es d eClr, ,
'
.,
'.
, extensiva. Para ello, nos basamos len la observaoon hecha en la sec~IOn ] .l.A
(en conex'o'ncon el dilema de los presos) de que
, no es necesano que los
.
, 'dores acten simultneamente: es suficiente con que cada uno escoJa
ugaestrateoia sin conocer la decisin del otro, como sera el caso en el
una
o~
d ..
Id
dilema de los presos silos presos tomaran sus eCSlO~eSen cea: :eparadas. Por tanto, podemos representar un juego de (dgamos) deosJOnes
simultneas entre los jugadores 1 y 2 como sigue:
3,1
Jugador 1
3,1
(DI,DI)
1,2
"
1,2
',---.../
2,1
0,0
2,1
')
0,0
"",.;
Figura 2.4.2
",.,'
de
Defulicin Un conju~to
itlfonnacin
nodos de decisi~ que satisface:
11/1
a2
del
Preso 1
-1
.
La representacin en forma extensiva de este juego (ignoramos las ganancias para simplificar) aparece en la figura 2:4.4. En esta forma extensiva;
el jugador 3 tiene dos conjuntos de informacin: uno con un nico elemento que sigue a D por parte del jugador 1 y DI por parte del jugador
2 y otro con ms de un elemento que incluye los dems nodos en los que
le corresponde decidir al jugador 3.. Por tanto/todo lo que el jugador 3
observa es si (al,a2) = {D,D'} o no ..
1
4
4
5
O
':."'
Figura 2.4.3
En un juego el! forma extensiva, indicaremos que una coleccin de
nodos de decisineonstituye un-conjunto de informacin con una lnea
discontinua, como en la representacin en forma extensiva del dilema de
los presos de la figura 2.4.3. Indicaremos a veces a qu jugador- le corresponde mover en los nodos del conjunto de informacin por medio de una
leyenda, como en la figura 2.4.3; alternativamente, podemos simplemente
dar nombre a la lnea discontinua que une esos'nodos, como en la figura
2.4.4. La interpretacin del conjunto de informacin del preso 2 en la figura 2.4.3 es que cuando al preso 21e corresponde decidir, todo lo que sabe
es que se ha llegado al conjunto de informacin (es decir, que el preso 1
ha decidido), pero no a qu nodo se ha llegado (es decir, lo que ha hecho).
Veremos en el captulo 4 que el preso 2 puede tener una opinin de lo que
el preso 1 ha hecho, incluso sin haberlo observado, pero ignoraremos esta
cuestin hasta entonces.
Figura 2.4.4
Ahora que hemos definido la nocin de conjunto de informacin, podemos ofrecer una definicin alternativa de la distincin entre informacin
perfecta e imperfecta. Definimos previamente la informacin perfecta diciendo que en cada jugada, el jugador al que le corresponde jugar conoce
toda la historia del juego hasta ese momento. Una definicin equivalente
es que cada conjunto de informacin contiene un nico elemento: Por
el contrario, la informacin imperfecta significa que existe al menos un'
--~
122 / JUEGOS DINMICOS CON INFORMAcrN
Juegos dinlmicos
COMPLETA (c. 2)
cO~j~ntode informaci~n con m~ de un elemento,19Por tanto, la represent~ClQnen forma extensiva de un Juego de decisiones simultneas (como el
~lle~a de l~s presos) es un juego con informacin imperfecta. De forma
~lml1ar, l~: J~egos en dos etapas estudiados en la seccin 2.2.A poseen.
l~orm~clOn Imperfecta porque las decisiones. de los jugadores Iy 2 son
slmultaneas~ como tambin lo son las decisiones de los jug~dofes 3 y 4..
?e forma mas general, un juego dinmico con informacin co'mpleta pero
lm~erfecta~~ede repr,esentarse en forma extensiva utilizandbconjuntos
de mformaclOn con mas de un elemento para indicar lo que cada jugador
sabe (y no sabe) cuando le corresponde jugar, tal como hemos hecho en la
figura 2.4.4.
."
....
,_.
..",
.... ", "
"
.: '.
--
". -
~
.
'-..:.
19
.
'. ":.~:;C
,
Est~ ~aracterizacin de la informaan perfecta e imperfecta en trminos de 20njuntos de
informaaon con ~o o ms elementos est restringida a los juegos cn info~aci" complet;
>0
COI1infonl1nn
completa
pero imperfecto
/ 123
(a) empieza en un nodo de decisin n que sea un conjunto de informacin con 1111
nico elemento (pero que no sea el primer nodo de decisin del juego),
(b) incluye todos los nodos de decisin y terminales que siguen a n en el rbol
(pero no los nodos que no siguen a n) y
(e) no intersecta a ningn conjunto de informacin (es decir, si 1m nodo de
decisin n' sigue a n en el rbol, todos los otros nodos en el conjunto de
informacin que contiene a n' deben tambin seguir a -n y, por tanto, deben
incluirse en el subjuego).
Debido al comentario entre parntesis de la parte (a), no contamos el
juego completo como un subjuego, pero esto es slo una cuestin de
estil: eliirtinar ese comentario entre parntesis de la definicin no tendra
ningri efecto.
Podemos utilizar el juego de la figura 2.4.1 y el dilema de los presos
de la figura 2.4.3 para ilustrar las partes (a) y (b) de esta definicin. En la
figura 2:4.1 hay dos subjuegos, que empiezan en cada uno de los nodos de
decisin del jugador 2. En el dilema de los presos (o cualquier otro juego
de decisin simultnea) no hay subjuegos. Para ilustrar la parte (c) de la
definicin', consideremos el juego de la figura 2.4.4. Slo hay un subjuego,
el que empieza en el nodo de decisin del jugador 3 que sigue a D por
parte del jugador 1 y D' por parte del jugador 2. Debido a la parte (c), en
este juego ningn subjuego empieza en ninguno de los nodos de decisin
del jugador 2, aun cuando estos dos nodos son conjuntos de informacin
de un nico elemento..
.
"Vn trtanera de motivar la parte (c) consiste en fumar que queremos
poder ari~liiar ili1subju~gcipor s mismo y que qti~rem6s que el a'niisi's
searei~vait~pai~el juego completo. En la figura 2.4.4, si intentramos
definir un:'subjuego que empezara en el nodo de decisin del jugador 2
qu sigue a la decisin I del jugador 1, estaramos creando un subjuego en
el que el jugador 3 ignora la decisin del jugador 2 pero conoce la deeisln
del jugador.1. Tal subjuego no sera relevante para el juego completo
porque en ~ste lltim el jugador 3 no conoce la jugadade 1, sino que tan
slo observa si (0.1,0.2) = {D,D/} o no. Recordemos el argumento parecido
porelqlleE-fsimojuego de etapa de 1.111 juego repetido no es en s mismo
un stihjUegodeljuego repetido, suponiendo en el caso finito que t < T.
Otra m'anerade motivar la parte (c) es dndonos cuenta de que la
parte (a) slo garantiza que el jugador al que le corresponde jugar en el
nodo n conoce la historia completa del juego hasta ese momento, no que
los dems jugadores tambin conozcan la historia. La parte (c) garantiza
COMPLETA (c. 2)
que la historia completa del juego hasta ese momento sea informacin del
dominio pblico en el siguiente sentido: en cualquier nodo que sigue a
/1, digamos ni, el jugador al que le corresponde decidir,en ni sabe que el
juego lleg al nadan. Por tanto, incluso si ni pertenece a un conjunto de
informacin con ms de un elemento, todos los nodos en ese conjunto de
informacin siguen a n, de forma que el jugador al que le corresponde
decidir en ese conjunto de informacin sabe que el juego ha llegado a un
nodo que sigue a n. (Si las dos ltimas afirmaciones parecen difciles es en
parte porque la representacin en forma extensiva de un juego especifica
lo que el jugadori sabe en cada uno de sus nodos de, decisin, pero no
hace explcito lo que el jugador i sabe en los nodosfe decisin de j,)
Como se ha descrito anteriormente, la figura 2.4.4 ofrece un ejemplo de
cmo podra no cumplirse la parte (c). Podemos ahora reinterpretar este
ejemplo: si caracterizsemos (informalmente)1o que el jugador 3 sabe
en el nodo de decisin del jugador 2 que sigue a la decisin 1 por parte
del jugador 1, diramos que 3 no conoce la: historia del juego .hast~ ese
momento, ya que 3 tiene otros nodos de decisin en lasque 3no sabe sil
jug 1 o D.
~;.
Dada la definicin general de subjuego, podemos;ahora aplicar la
definicin de equilibrio de Nash perfecto en subjuegosde la seccin 2,3.B.
Definicin. (Selten 1965):Un equilibrio de Nash es perfecto en subjuegos si las
estrategias de los jugadores constituyen un equilibrio de Nash en cada subjuego.
Es inmediato demostrar que cualquier juego dinrrlic:finito con.informacin completa (es decir, cualquier juego dinmico en l q~~ iffi ~&nero
finito de jugadores tiene un conjunto de estrategias fac~:I:>.!eSftriit~ri:jn
un equilibrio de Nash perfecto en subjuegos"posiblemenh~ co~ e'stnltegias
mixtas. El argumento procede por: construccin, utilizando un procedimiento parecido a la induccin hacia atrs, y est basad~. en dos o~stTrvaciones. Primero, aunque presentamos el teorema de Nash en el contexto
de juegos estticos con informacin completa, ste se extiend~ a'todo
juego finito en forma normal con informacin complef~, y hemos visto
que estos juegos pueden ser estticos o dinmicos. En segundo lugar, un
juego dinmico finito con informacin completa tiene lll nnerq)lnito
de subjuegos, cada uno de los cuales cumple las hiptesisdelte~r~ria d
Nash.20
. -.
- '.
20 Para construir un equilibrio de Nash perfecto en ~ubjuego's,identifiquemos
primero
t"dos los subjuegos menores que contienen nodos terminales en el rbol del. juego original
"
.....
.C;.,
"
1',.,
i"
.'
~.'.
'
:~
'<.;'
pero imf,,:rfeela
/127
,/,'
'a4:(aT~0.2)).
"'-:,'
una
3
1
1
2
o
O
Figura 2.4.5
COMPLETA (e. 2)
::.:',,,
en
','.'
(: '
.;:'
,....
,,'"
-,
captulo 4).
Seccin 2.1: Sobre los salarios y el empleo en empresas con fuerte ~pl~~:
tacin sindical, vase ~ m~d~k, de negociacin repetida en.Espinosa y
Rhee (1989; ejercicio 2,lO}y un'modelo de tina nica negociacin en el que
las empresas pueden escoger negociar sobre salarios y empleo o slo sobre
salarios, en Staiger (199), Sobre la negociacin sucesiva, vase un modelo
al estilo de Rubinstein de negciacin entre una empresa y un sindicato en
Ejercicios
130 / JUEGOS DINMICOS CON INFORMACIN
",
.',.-.
/ 131
COMPLETA (c. 2)
2.2 Supongamos ahora que padre e hijo juegan un juego diferente, analizado originalmente por Buchanan (1975). Los ingresos IH e Ip estn
fijados exgenamente. Primero, el hijo decide qu parte del ingreso If{
ahorrar (S) para el futuro, consumiendo el resto UR - S) hoy. En segundo lugar, el padre observa la eleccin de S por parte del hijo y escoge una herencia, B. La ganancia del hijo es la suma de las utilidades
presente y futura: Ul UR - S) + U2(S + B). La ganancia del padre es
V(Ip - B) + k[U1 (IR - S) + U2(S + B)]. Supongamos que las funciones de
utilidad Ul, U2, y V son crecientes yestrictamente cncavas. Demustrese
que hay un "dilema del samaritano": en el resultado por induccin hacia
atrs, el hijo ahorra demasiado poco, para inducir al padre a dejarle una
herencia mayor (es decir, tanto las ganancias del padre corno las del hijo
podran aumentar si S fuera convenientemente ms alto y B convenientemente ms bajo).
2.3 Supongamos que los jugadores en el juego de la negociacin con horizonte infinito de Rubinsteintienen factores de descuento diferentes: 81
corresponde al jugador 1 y {j2 al jugador 2. Adptese el argumento dado
en el texto para demostrar que en el resultado por induccin hacia atrs,
el jugador 1 ofrece el acuerdo
2.6 Ejercicios
2.1 S.upongamos que un padre y un hijo participan en el siguiente juego,
anahzado originalmente por Becker (1974). Primero el hijo toma una
accin, A, que.resulta en un ingreso para l, IR (A), yen un ingreso para
el padre;Jp(A).
(Pensemos en I H(A) corno el ingreso dl hijo, neto de
cualquier coste de, la accin A.) En segundo lugar, el padre bserv los
132/
Ejercicios I 133
otro difcil (D), y que la preparacin es til en los dos empleos, pero ms
. en el difcil: YDO < YEO < YES < YDS, donde Yij es lo que el trabajador
produce en el trabajo 'i (= E o D) cuando el trabajador tiene un nivel de
preparacin de j (~ O o S). Supongamos que la empresa puede comprometerse a pagar salarios diferentes en los dos empleos, 'WE y 'WD; pero
ningl,J.n9de estos dos salarios puede ser menor que el salario alternativo
del trabajador, que normalizamos a cero.
El desarrollo temporal del juego es el siguiente: En el momento O la
empresa escoge 'WE y 'WD Yel trabajador observa estos salarios. En el ~~mento 1 el trabajador entra a formar parte de la empresa y puede adqumr
el nivel de preparacin S a un coste C. (Ignoramos laproduccin'y los
salarios en el primer periodo. Puesto que el trabajador no ha adqUirido
an la preparacin, lo eficiente es que se le asigne el trabajo E.) Supongamos que YDS - YEO > e, de forma que al trabajador leconyiene adquirir
la preparacin. En el momento 2 la empresa observa si el trabajador ha
adquirido o no la preparacin y decide entonces si concederle el ascenso
al trabajo D o no durante el segundo (y ltimo) periodo de empleo qel
trabajador..
"".':Los beneficios de la eID:presa en el segundo periodo son Yij- 'W;,
donde el trabajador realiza el trabajo 'i y tiene un nivel de preparacin j.
La ganancia del trabajador por realizar eltrabajo i en el segundo periodo
es 'Wi o 'Wi - e, dep.endiendo de si el trabajador se ha preparado o no en el
primer periodo. Hllese el resultado por induccin hacia atrs, Vase un
modelo ms complejo en Prendergast (1992).
!.:::' .
0'-
.~.
ti:! I
Eje,.cici()~ / 135
COMPLETA (e. 2)
.".,;.,'
2,2
x,O
-1,0
0,0
O,x
4,4
-1,0
0,0
0,0
0,0
0,2
0,0
0, -1
0, -1
-1, -1
2,0
Ejercicios I 137
produccin de monopolio, cul es el equilibrio de Nash perfecto en subjuegos simtrico ms rentable al que puede llegarse utilizando estrategias
del disparador?
j'.'
(;::-:-'
:~
"'",'
Refrrencias
COMPLETA (c. 2)
/\39
2.7 Referencias
ABREU,
JOlll'1wl
140/
-.
COMPLETA (e. 2)
Repeated
Referencias / 141
Ecollometrica 56:383-96.
ABJ~EU,D., D. PEARCE, y E. STACCHETTI. 1986. "Optimal
with Imperfect
o/ Economic
Cartel Equilipria
Monitoring."
Review
"JointProjects
without
Commitment."
5tudies 58:259-76.
in In#3529
o/ Economic
"A Non-cooperative
Equilibrium
for Supergames."
Studies 38:1-12.
AKE1~LOF,C., Y J. YELLEN, eds. 1986. Efficiency Wage Models 'o/ the Labor
Market. Cambridge, Inglaterra: Cambridge University Press.
BECKER, G. 1974.
FRIEDMAN, J. 1971.
Review
and Incomplete
in Repeated
Carnes
Econometrica 54:533c54.
Inforrnation."
Collusion
Wage Bargaining
Under Irnperfect
and Industry
Structure."
and In':
oumal of .
in a
KREPS, D. 1990. A Course in Microeconomie Theory. Princeton,
University Press.
NJ: Princeton
oumal of Political
of Social Interactions."
Economy 82:1063-93.
1982.
"Sequential
Equilibrium:."
Eeonometne~
. .' ~;
1985. "Finitely
-. 1989. "Renegotiation
in Finitely
School Working Paper #89-004.
Repeated
Econometrica
Carnes."
50:863-94..
LAZEAR,
Repeated
Carnes."
Harvard
.
Business
Debt:
Is to Forgive
to Forget?"
Deposit
Insurance,
and
as a Repeated
Carnes."
Carnes
as Optimum:
Annual
Wage
in Repeated
and Industrial
:L'.iC,;
.:/
man Capital
e 1992.
Acquisition."
in Inducing
aparicin
Specific Hu-
en Quarterly oumal o/
Eeonomies.
Two
ROSEN, 5.1986.
in Elimination
Tournaments.'~
Ame-
1;;
. ~,.
ROTEMBERG,
J., y G. SALONER.1986. "A Supergame-Theoretic Model of
Busmess Cycles and Price Wars during Booms." American Economic Review
76:390-407.
3. JUEGOS ESTTICOS
CON INFORMACIN INCOMPLETA
RUB~STEJ.'\I,
A. 1982. "Perfect Equilibrium in a Bargaining Model." Econometrzca 50:97-109.
..
, ,'
.~
,~:;
of Bargainin ."
g
STA~:I<ELBERG,
H. VON. 1934.. Marktform und Gle:hgewicht.
Spnnger.
Viena: Julius
STAIGER~
D. 1991. "Why Do Union Contracts Exclude Employment?" Stanford Uruversity, Mimeo.
TIROLE,J. 1988. The Theory o/ Industrial Organization.
Press.
.{,;',
ambridge: MIT
Con este captulo comienza nuestro estudio de los juegos con ill!0r1110Il
incompleta, tambin llamados juegos bayesianos .. Recordemos que en un
juego con infoIDlacin completa las funciones de ganancias de. los juga~
dores son informacin del dominio pblico. Por el contrario, en un juego
con informacin incompleta, al menos un jugador no est'seguro de la
funcin de ganancias de otro jugador. Un ejemplo comn de un juego
esttico con informacin incompleta es una subasta de sobre cerrado:
cada participante conoce su propia valoracin del bien subastado, pero no
conoce las valoraciones de los otros participantes, y las pujas se entregm
en sobres cerrados, por lo que las decisiones de los jugadores pueden considerarse simultneas. Sin embargo, la mayora de los juegos bayesianos
con inters econmico son dinmicos. Como veremos en el captuJo,4,
la existencia de informacin privada conduce de forma natural a que las
partes informadas intenten comunicar (o a confundirlos), y que las partes no informadas intenten conseguir informacin. Estas cuestiones son
intrnsecamente
dinmicas.
.
'
En la seccin 3.1, definimos la representacin en forma normal de
un juego bayesiano esttico y el equ.i1ib'nbayesiano de Nash en dicil~
juego. Puesto que estas definiciones son abstractas y algo complejas,
introduciremos las ideas principales con un ejemplo sencillo, el de l~
competencia a la Cournot bajo informacin asimtrica.
En la seccin 3.2 consideramos tres aplicaciones. En priiller lugar,
ofrecemos una discusin formal de la interpretacin de las estrategias
mixtas dada en el captulo 1: la estrategia mixta del jugador .i representa
la incertidumbre del jugador i con respecto a la estrategia pura que eligir
j, y la eleccin de j depende de una cierta informacin privada. En
segundo lugar, analizamos una suba sta "de sobre cerrado en la que las
valoraciones de los participantes son informacin privada, mientras que
la valoracin del vendedor es conocida. Finalmente, consideramos el
caso en el que un comprador y un vendedor tienen, cada UIlO de ellos,
informacin privada sobre sus valoraciones (como cuando una empresa
14.1/
INCOMPLETA (e. 3)
qi -
q2) - cBlq2'
q2
maxB
q
[(a -, ql - qi(cA)
'cJ ql
+ (l -
B) [(a -ql
q2
qi -
c] ql
q2(CA) -
a -
qi -
CA
a-
qi -
CB
-2
qi(c~)
.,"
L...
B [a - qi(cA)
ql =
c]
+ (l 2
'
Supongamos que estas condiciones de primeror.den caracteriz~i~isoluciones de los problemas de 'optimizacin anterires, '\Recotdem:~s.~el
ejercicio 1.6 que, en un duopolio de Coumot .C?-!1 ~oI1llacin.co.~gl~ta,
si los costes de las empressson lo'suficientemente diferentes entre s, la
empresa con el coste alto no produce nada en-equilibio. Corno ejeicoo,
hllese una condicin suficiente para excluir aqu problemas anlogos.)
Las soluciones a las tres condiciones de primer orden son
y
max[(a
- qi(CB) -
q2) - cAlq2-
qi =-
a -
2c +BCA + (l 3
B)cB
"
1 .:.::-
(
"-'.-
146/
(..,
.
s estlticos y eqllilib,'io bayesiallo de Nosl, ! 147
Teoria: Juegos bayesw,lO
INCOMPLETA (c. 3)
de
a;
""-
Ahora queremos representar en forma normal un juego d decisin simultnea con informacin incompleta, tambin llamado juego bayesiano
esttico, El primer paso consiste en representar la Idea de que cadajugadar conoce su funcin de ganancias, pero puede no conocer las de otros
y
1rZ(ql,qZ;
= [(a - ql - '1z) -
e)
ql
. que e 1 espaCIO
'de tipos
de" la empresa 2 es Tz = {CB,CA} y
Podemos deCIr
.
qu el espacio de tipos de la empresa 1 es 7] = {c}',
l'
d
'"
del.' tipo de un jugador, decrr
Da d a esta d e fimCIOn
'1 que e ' Juga~' or
,.
.-'
.-';, d"e gananCIas
'es
equivalente " a deCIr que e Jugalor /.
1 conoce su fuhcIOn
" '.
,
d ..decir que el Jugador '1, puede no estar
conoce su tIpo, Del rmsmo mo o,
, I t .
de otros J'ugadores es
seguro d e las fuh'CIonesed ganancI'as
.
. equwa ene
d
'
a decir que puede no estar
seguro. de los tipos de otros Jugadores,
, r, e-I
t ). Utilizamos T-i para mucar e
notados por t- = (t],., . ,/i_l,t,+l".
.. , 'n
148/
INCOMPLETA (c. 3)
... ,an;tl,
,tn).
La segunda cuestin tcnica se refiere a las conjeturas Pi(Ltlti). SupOl\emos que es del dominio pblico que en el paso (1) del desarrollo
temporal del juego esttico bayesiano, el azar escoge un vector de, ,tipos
t = (tI, ... ,tn) de acuerdo con la distribucin a priori de probabilidad p(t\
Cuando el azar revela ti al jugador i, ste puede calcular laconjel:tiiPi(Lilti) utilizando la regla de Bayes:2'
a, "
Pi(Li Iti) =
p(L;,ti)
P(ti)
p(L;,ti)
p(L;,ti) .
t_iET_i
Adems, los otros jugadores pueden calcular las distintas conjeturas que
podra, formarse el jugador -i, dependiendo del tipo de i, concretame,nte
2 La regla de Bayes es una frmula para calcular P(AiB), la probablIidad (condidomida)
de ql.\e un suceso A ocurra dado que un suceso B ha ocurrido ya. Sean peA), P(B) y P(A,El
las prob,abilidaqes (a priori, es decir, las probabilidades antes de que A o B hayan podido
ocurri~) de qu~ A ocurTa, de que B ocurra y de'que ambos A y B ocurran respectivamente. La
regla de Bay",s establece que'P(AIB) ; P(A,B)/ P(B). Es decir, la probabilidad condicional
d", que se d /1es igual a la probabilidad de que se den tanto A como B, dividida por. la
pr~babilida'd
pri9ri de que ocurra B.
150/
INCOMPLETA (c. 3)
.,
"
-.-"{'
..~:
Definidri:Enet'uegobayeslm.iJestticoG=={AI,:.A'TI
.".,'
nI
' .. "' T 'PI
P":; Ul~' .. ,U,;}, una'estrategia
del jugador i es una funcin Si(t;) donde, para
cada tipo ti en Ti, Si(ti)'determiha la accin del conjunto factible Ai que el tipo ti
elegira si el azar determinara que el jugador es de este tipo.
_
nI
1."/
'
152/
Aplicaciones / 153
INCOMPLETA (e 3)
Definicin. En el juego bayesiano esttico G = {Al,' .. ,:1n; TI, ... ,T,,; PI, .
estrategias
= (.~1',... ,"~) forman un equilibrio bayesiano
de Nash (con estrategias puras) si para cada jugador i y para cada uno" de sus
tipos ti en Ti, si (ti) es una solucin de
,,*
Pat
pera Boxeo
pera
2,1
0,0
Boxeo
0,0
1,2
Chris
Es decir, ningn jugador quiere cambiar su estrategia, incluso si el cambio supone
cambiar slo una accin para un tipo.
Es inmediato dem'ostrar que en un juego bayesiano esttico finito (es
decir, un juego en el cual TI es finito y (Al, ... ,A,,) Y (Tl, ... ,T,.) son todos
conjuntos finitos) existe un equilibrio bayesiano de Nash, tal vez con
estrategias mixtas. La demostracin es muy similar a la de la existencia
de un equilibrio de Nash con estrategias mixtas en juegos finitos con
informacin completa, por lo que la omitimos.
3.2 Aplicaciones
3.2.A Revisin de las estrategias mixtas
Como mencionamos en la seccin 1.3.A, Harsanyi (1973) interpret la
estrategia mixta del jugador j como la incertidumbre deTjugador i sobre
la estrategia pura elegida 'por el jugador j y que, a su vez; la eleccin de j
depende de cierta informacin privada. Ahora damos"i.m\~rlI1cido'ms
preciso de esta idea: un equilibrio de Nash con~str~tegi~~ 'mixtas en u~
juego con informacin completa puede (casi siempre) interpretarse como
un equilibrio bayesiano de Nash con estrategias puras en un juego muy
similar con algo de informacin incompleta. (No tendrem9sen cuenta los
casos raros en los cuales tal interpretacin no es posible.) De un modo ms
evocador, la caracterstica crucial de un equilibrio de Nashcori estrategias
mixtas no es que el jugador j elija una estrategia al azar, sirio'que el jugadr
i no sabe con certeza la eleccin del jugador j. Esta falta de certeza puede
provenir de algn suceso aleatorio o (ms probablemente) de tin poco de
informacin incompleta, como en el siguiente ejemplo.
-Recordemos que en la batalla de los sexos existen dos equilibrios de
Nash con estrategias puras, (pera, pera) y (boxeo, boxeo), y uno con
estrategias mixtas, en el que Chris elige la pera con probabilidad 2/3 y
Pat elige el boxeo con probabilidad 2/3.
Boxeo
pera
2 + te,l
0,0
Boxeo
0,0
1,2 + tp
Chris
""';
.','.
","
154/
,'.
\.~}
]VEGaS
Aplicaciones
INCOMPLETA (c. 3)
-.
E.(2+tc)+
j;
"
.,
[ 1--
C].
x
. O+ -(2 +
tp)
e.,
= -(2
de
.'
+ tp)
C]
ee
1-- .1+-.0=1--,
x
x
x
tp .;::: ..-
:-
3 = p.
2:1;
+4:;
"
que tiende a 2/3 cuando :; tiende a cero. Por lo tanto, cuando la informacin incompleta desaparece, el comportamiento de los jugadores en
este equilibrio bayesiano de Nash con eslrategias puras del juego con
informacin incompleta tiende a su comportamiento en el equilibrio de
Nash con estrategias mixtas en el juego original con informacin completa,
3.2.B Una subasta
v; ~.
x'
-3 +)9
1------
/ 155
si bi > bj,
si bi = bj,
(3.2,2)
Resolviendo (3.2.1) y (3.2.2) simultneamente obtenemos p = e y p2 + 3px= O.'Reiolvlendo la ecuaCin de segundo gradase demuestra que la
probabilidad:deque Chris elija la pera; concretamente (x ::..c)/x, y la de
que Patel1ja ei boxeo, concretamente (x- p)/x, son'ambas iguales a.
si bi
<
bj.
Para obtener un equilib~io bayesiano de Nash de este juego comenzarnos construyendo los espacios de estrategias de los jugadores. Recordemos que en un juego bayesiano esttico, una estrategia es una funcin
que va de tipos a acciones. Por lo tanto, para el jugador i una estrategia
156/
JUEGOS ESTTlCOSCON
INFORMACIN
INCOMPLETA Ce. 3)
Aplicaciones / 157
es una hmcin bJv) que determina la puja que elegira cada uno de los
tipos (es decir, valoraciones) de i . En un equilibrio bayesiano de Nash, la
estrategia bl (VI) del jugador 1 es una mejor respuesta a la estrategia b2(V2)
del jugador 2 y viceversa. Formalmente, el par de estrategias (b1 (VI ),b2 (V2
constituye un equilibrio bayesiano de Nash si, para cada V en [0,1], b;(vi)
es una solucin de
max(v.-
b)
Prob{b >
bj(vj)}
-(v. - bi)
Prob{bi
= bj(uj)}.
n,ax(Vi - b) Prob{bi
>
aj
+ CjVj},
P. ro b{b
.i
>
aj +Cjv]
} --
p.10 b { Vj
bi < ---
aj } = ---o
bi - aj
Cj
5(0 < aj < 1, existen varios valores de Vi tales que Vi < aj, en cuyo caso
bi (V) no es lineal, sino plana al principio y con pendiente positiva despus.
Como estamos buscando un equilibrio lineal, excluimos O < aj < 1,
centrndonos en aj 2: 1 Y aj ::; O. Pero el primero no puede darse en
equilibrio: puesto que es ptimo para un tipo ms alto pujar tanto al
menos corno la puja ptima del tipo ms bajo, tenemos que Cj 2: O, pero
entonces aj 2: 1 implicara que bj(Vj) 2: Vj, lo que no puede ser ptimo.
Por lo tanto, si b;(vi) tiene que ser lineal, debemos tener aj ::; O, en cuyo'
caso b;(v.) = (Vi + aj)/2, por lo que ai = aj/2 y Ci= 1/2.
R9\:h~f\19s.
reRe!ir el D.1Smo
anlisis para el jugador j suponiendo que el
jugac!9i'iadOpta Iastrate&'ab;(vi) ~Q-i +civi,'con lo qu~ obtenernos ai::; O,
aj = a;/2 y Cj = 1/2:' Combinando estos dos conjuntos de resultados
tenemos que ai = aj = O Y c.-= Cj = 1/2, es decir, bi(Vi) = v;/2, como.
dijimos antes.
Podramos preguntarnos si hay otros equilibrios bayesianos de Nash
en este juego, y tambin cmo las pujas en equilibrio cambian cuando
la distribucin de las valoraciones de los jugadores cambia. Ningunacie
estas cuestiones puede reslverse utilG:ando la tcnica que acabaiTIosdi
aplicar (proponer estrategias .lineales y despus derivar los coeficientes
que l~s cOnvierten enequllibrio).
No conduce a niI:guna part~ inte~~..
taradivinar todas las formas funcionales que podran tener otros egi1ilibrios de este j~ego, y no existe equilibrio lineal para ninguna otra distribucin de valoraciones. En el apndice, derivamos un equilibrio bayesiano simtrico}. nuevamente para el caso de valoraciones uniformemente
distribuida;, Suponiendo _qu~.lasestrategias de los jugadores son estric~
tamentecrecientes y diferenciables, demostrarnos que el nic,?equilibi;i,~
bay~sianode NashsjII1~tIjcQ.e_s el equilibrio lineal que ya1erros' deri~
vadO. La tcnica que utilizarnos puede extenderse fcilmente a una clase
ms amplia.de distribuciones de las valoraciones, y tambin al caso de n
participil;ntes.4
Cj
AplicacirJlles
/ 159
Apndice
Supongam.os queel jugador j adopta la estrategia bO y supongamos que
N.) es estnctamente creciente y diferenciable. Entonces', para un valor
dado de Vi la puja ptima del jugador ies una solucin de
>
b(vj)}.
bi
Sea b-1 (bj) la valoracin-que el participante j debe tener para pujar bj; esto
es, b-1(bj) = Vj sibj = b(vjtP.4esto que.vj est uniformemente clistribuida
en [O,ll,Prob{bi > b(1jt= Prob{b:2-I(b> v= b-1(bi). La condicin de
primer orden.para la opti~zacin del probletriadl jugador ies
.
-b-1(bi)
d'
+ (Vi ~ bi) db. b-(bi)
'1
= O.
.;
-b-l(b(~i
.'.
'.'
O.
t'i
) = O,
la cual~e expresa de un modo ms conveniente como b' (Vi)Vi +b( Vi) = Vi. La
parte izquierda de esta ecuacin diferencial es precisamente d{ b(Vi )Vi} /dVi.
Integrando ambas partes de la ecuacin obtenemos
1
b(v)v'
7.
t = -'Il
2 1_ + k ,
max Pb [v b -
Pb+E[P,(v,)IPb>,,(U,)J]
2
Prob{p
.
>p
1) -
(7) )}
S
(3.2.3)
Aplicaciones!
donde E[psCuJlpb
2':f'JuJJ es el precio esperado que pedir el vendedor,
condicionado a que lo que pida sea menor que el precio ]lb ofrecido por el
cumprador. Para cada Vs en [0,1], J!s(Vs)es una solucin de
(3.2.4)
donde E[Pb(Vb)lpb(Vb)
2':PsJ es el precio esperado que ofrecer el comprador condicionado a que lo que ofrezca sea mayor que el precio Ps que pide
el vendedor.
Vb
Intercamqio
x
161
del vendedor es una mejor respuesta a la del comprador, ya que para los
tipos del vendedor que hacen que el intercambio se prefiera a la ausencia
de intercambio ste ocurre, y viceversa. El argumento anlogo demuestra
que la estrategia del comprador es una mejor respuesta a la del vendedor,
por lo que estas estrategias forman un equilibrio bayesiano de Nash. En
este equilibrio el intercambio se da para los pares (VsUb) indicados en la
figura 3.2.1; el intercambio sera eficiente para todos los pares (V"Vb) tales
que Vb ~. Vs, pero no se da en las dos regiones sombreadas de la figura.
Ahora derivamos un equilibrio bayesiano de Nash lineal de la subasta
doble. Como en la seccin anterior, no restringimos los espacios de estrategiasdelos jugadores de nianera que se incluyan solamenre las estrategias
lin~ales, sino que pennitimos que los jugadores elijan estrategias arbitrarias pero nos preguntamos si existe un equilibrio que sea lineal. Existen
muchos otros equilibrios adems de los equilibrios de precio nico y el
equilibrio lineal, pero el equilibrio lineal tiene propiedades de eficiencia
interesantes que describiremos ms adelante.
Supongamos que la estrategia del vendedor es Ps(vs) = as + CsVs'
Entonces Ps est uniformemente distribuido en [as,as + cs], por lo que
(3.2.3) se convierte en
as + Pb}]
max [Vb - -1 {Pb + .--Pb
2
2
(3.2.5)
"-; .:r.,:,,,: .,;_._~_
V.
Figura 3.2.1
max [ -2 Ps +
. p,
Ps + ab + Cb }
....
Cs
Pb = 3"Vb + 3"as.
;';:
Pb - as
---,
,','
<:.
(3.2:6)"
Apl icnCollcs
162/
163
INCOMPLETA (c. 3)
(ab
Ch)
(3.2.7)
v,
v, = v, + 0/4)
V,=
v,
Intercambio
p,,(v.) =
3v., + "4
v,
3/4
Figura 3.2.3
3/4
1/4
".'
;..J'
V"
Vb
"
,
Figura
3.2.2
l~ figura 3.2.3. (De acuerdo con esto, la figura 3.2.2 revela que, para los
tIpos del vendedor por encima de 3/4, se realizan demandas por encima
de la oferta ms alta del comprador Pb(l) = 3/4, Yque para los tipos del
vendedor por debajo de 1/4 se realizan ofertas por debajo de la oferta ms
baja del vendedor, P. (O) = 1/4.)
lb4 / JUEGOS
ESTTICOS
CON
INFOI<iVIACIN
INCOMPLETA
(e. 3)
si /lb 2:
ti..).
forma continua en [:l:s,ys], donde Ys > Xb e Yb > x" no existe ningn juego
de negociacin al que quisieran jugar el comprador y el vendedor que
tenga un equilibrio bayesiano de Nash en el que el intercambio ocurra si
y slo si es eficiente. En la prxima seccin vamos a indicar cmo puede
utilizarse el principio de revelacin para demostrar este resultado general.
Concluimos esta seccin aplicando este resultado al modelo de empleo de
Hall y Lazear: si la empresa tiene informacin privada sobre el producto
marginal m del trabajador y el trabajador tiene informacin privada sobre
una oportunidad alternativa ti, no existe ningn je'gode negociacin que
la empresa y el trabajador quisieran jugar que 'produZca empleo si y slo
si es eficiente (es decir, si y slo si m2: v).
3.3 El principio
de revelacin
Los juegos de esta clase (es decir, los juegos estticos bayesianos en los
cuales la nica accin del jugador es hacer una declaracin sobre su tipo)
se llaman mecanismos directos.
La segunda manera en la que el vendedor puede utilizar el principio de revelacin es limitando su atencin a los mecanismos directos, en
los cuales decir la verdad constituye un equilibrio bayesiano de Nash
para cada participante, es decir, a ls funciones de oferta y de probabilidad {Xl (TI", . ,Tn),. ,. ,Xn(Tl,' .. , Tn); ql (TI,' .. ,Tn), ... ,qn(Tl,'",
taun)}
tales que la estrategia de equilibrio de cada jugador i sea declarar Ti (t;) =ti
para cada ti en n. Un mecanismo directo en el cual decir la verdad constituye un equilibrio bayesiano de Nash se llama de incentivos compatibles.
Fuera del contexto del diseo de una subasta, el principio de revelacin puede seguir siendo utilizado de estas dos maneras. Cu~lquier
equilibrio bayesiano de Nash de un juego bayesiano puede representarse
<;:onun nuevo equilibrio bayesiano de Nash en un nuevo juego bayesiano
adecuadamente escogido, en el cual por "representado" queremos decir
que para cada posible combinacin de tipos de los jugadores (tit ... ,tn),
las acciones y las ganancias de los jugadores en el nuevo equilibrio son
idnticos a los del equilibrio original. Itdependientemente de cul sea el
juego original, el nuevo juego bayesiano es siempre un mecanismo directo;
independientemente del equilibrio original, el nuevo equilibrio siempre
consiste en decir la verdad. De manera ms formal:
r,:
".'.
166/
INCOMPLETA (c. 3)
',':
,".
..
.. :
INCOMPLETA (e. 3)
Ejercicios I 169
donde t = (t, ... ,tn). Se podra pensar que estas ganancias se dan porque
un observador imparcial se acerca a los jugadores y pronuncia el siguiente
discurso:
".,/
\ ..
35 Ejercicios
3.1 Qu es un juego bayesiano esttico? Qu es una estrategia (pura)
en tal juego? Qu es un equilibrio bayesiano de Nash (con estrategias
puras) en dicho juego?
\
',.o',
Ejercicios
ID'-
j)
,o
A 1,1 0,0
A 0,0
B 0,0 0,0
B 0,0 2,2
Juega
Juega2
....
3.5 Recordemos de la Seccin 1.3 que el juegode las monedas (un jueg'.
esttico con informacin completa) no tiene equilibrios de Nash cori's~..
trategias puras; pero' tiene un 'equilibrIo de Nash con estrategias' 'Ilixhis;':';
cada jugador elige cara con probabilidad 1/2 ..
Jugador 2
cara cruz
cara 1,-1
-1,1
Jugador 1
cruz -1,1 1,-1
','
/171
.~;
..tl~'f;'.~"
;10;
..
. en
172/
INCOMPLETA (c. 3)
Referencias
3.6 Referencias
/ 173
of Operations Research
-. 1985. "Bayesian Equilibrium and Incentive Compatibility: An I.ntroduction." In Social Goals and Social Organization. L. Hurwicz, D. Schmeldler,
y H. Sonnenschein, eds. Cambridge: Cambridge University Press.
MYE~N, R., Y M. SATTERHWAlTE.
1983. "Efficient Mechanisms for Bilateral Trading." oumal of Economic Theory 28:265-81.
SAPPINGTON,D. 1983. "Limited Liability Contracts between Principal and
Agent." oumal o/ Economic Theory 21:1-21.
BA1<ON,
D., Y R. MYERSON.1982. "Regulating a Monopolist with Unknown
Costs." Econometrica 50:911-30.
BULOW,J., y P. KLEMPERER.1991. "Rational Frenzies and Crashes." Stanford University Craduate School of Business Research Paper #1150.
CHATTERjEE,K., Y W. SAMUELSON.1983. "Bargaining under Incomplete
Informabon." Operations Research 31:835-51.
DEmE, D. 1988. "Bilateral Trading as an Efficient Auction over Times."
[ol/rIlal of Political Economy 96:100-15.
.
HALL,R., Y E. LAZEAR.1984. "The Excess Sensitivity of Layoffs and Quits
lu Demand." [ournal of Labor Econ01nics 2:233-57.
HARSANYI,J. 1967. "Cames with Incomplete Information Played by Bayesian Players Parts 1 II and I1I." Management Science 14:159-82, 320-34~
486-502.
~3
4. JUEGOS DINMICOS
CON INFORMACIN INCOMPLETA
176
I J;ECOS
L\iCOMPLETA (e. 4)
__
eM@_!.O!' ~!i!!!E'!!!!!'!'!!'!'
:t,"""'~ ..""__..
._.
."_
Introduccin
I 177
En la seccin 4.3 describiremos otras aplicaciones del equilibrio bayesiano perfecto. Comenzaremos c0r:. el. an~~isis de juegos con parloteo
(cheap-talk games) (es decir, juegos de sena1JZacJOnen los cuales los mensajes no cuestan nada), entre cuyas aplicac.ion~sse incluyen 1.asamenazas d~
to
ve Presidencial a las decisiones del legIslativo norteamencano, los
. anun
.
cios de poltica por parte de la autoridad monetaria y las comurucaclOnes
(o "voz") en las organizaciones. En los juegos con parloteo, el ~cance de
la comunicacin se determina por los intereses comu~es de los Ju~adores
ms que por los costes de las seales de los diferentes tipos. EstudIaremo~
a continuacin el modelo de negociacin sucesiva de Sobel y Takahashi
(1983), en el cual una empresa debe tolerar una huelga para den:ostrar
que no puede permitirse pagar salarios ms .altos.(cfr. el.mo~elo ge negociacin con informacin completa de Rubmstem que mclwmos en la
secclOn
. en equilibrio). Finalmente,
..
.
" 2.1.D , en el cual las huelgas no se dan
exploraremos la explicacin clsica de Kreps, Milgrom, ~~bert~ y WIlson
(1982)del papel de la reputacin en el logro de la coopera~~~ raCJOnale~,el
dilema de los presos repetido finitamente (cfr. la proposlclon en ~asecCloIl
2.3.A concerniente al nico equilibrio de Nash perfecto en subJueg~s .de
un juego repetido finitamente basado en un juego de etapa con un m:1CO
equilibrio de Nash).
.:,
En la seccin 4.4 volveremos a la teora. Aunque es la seccin final
del libro, sirve para indicar lo que podra venir a continuaciIl.~~ql.!~
como culminacin de los temas analizados. All describireII10seustraremos dos refinamientos (sucesivos) del equilibrio bayesiano perfecto, el
segundo de los cuales es el criterio intuitivo de Cho y Kreps (1987).
. Introduccin
o'
O
2
O
1
Utiiza~d la rep!esent~ci6n'enfonnan9pnal
de este juego4ad~~
la figura 4.1.2, observ~mq~ que existen~().seqi1ibrios deNash con estra:;:
tegias puras, (1,1') y (D,D'),
(ieterminat SI estos equiiibri~;'d ],{f;h
son perfectos en subjuegos utiHz!Ull0slarepresentacin en {antia e~t~ri~
'.
'
"",'
,'"
,
, ", 'jl'!'
siva para definir los subjuegos del juego. Puesto que un' juego ,esdefr{j~9.,
de modo que comienza en, un nodo de decisin, que no es ~s que~~:
conjunto deinformacin cbn un nico elemento (aunque no es eipri~EJ-,
n~do de decisin del jueg()), el juego'delafigura .l no tiene subjug~~~"
SI un juego no tiene subjuegos, el r~q,uisitode perfeccin en subjuegos
(~o~cretamenteque las estrategias d' los jugadores c~mstituyan un equi~
hbno de Nash en cada subjuego) se cumple de forma trivia( Por tano:
encualquierjuego que no tenga subjuegos la definicin de equilibrio de.
Nash perfec~ en subjuegosles equivalent a la definicin de equilibriocl~
Nash, por lo que en la figura 4.1.1 tanto (1,!') como (D,D') son equilibrios
'de Nash perfectos en subjuegos. No obstante, (D,D') depende claramente
d,euna amen,aza que n resultacreble: si llega el tumo del jugador 2,jugar
1 domma a Jugar D', por 10 que el jugador 1 no debera verse inducido a
jugar D por la amenaza d;l jugador 2 de jugar Di si llega a mover.
r~r
Jug~dor 2
D'
.,:'1:';'
2,1
0,0
0,2
0,1
1,3
.:.:J:"
Jugadorl'
,;~~
Ii"
1,3
I liCJ
"t
1 En cada conj'unto de inFormacin el j'ugador que decide debe
RequISl o .
' J'
'
.
formarse una conjetura sobre el nodo del conjunta ~te injorm,acln al que se 1m
llegado en el juego. Para un conjunto de 111f~,:maclOncon mas de un ele1l1:/lfO,
una conjetura es una distribucin de probabl11dad sobre los nodos del conju/lto
de infonnacin; para un conjunto de informacin con un nico. el:mento, la
conjetura del jugador asigna probabilidad uno al nico nodo de declslO11.
"Figura 4.1.1
l'
perj)"
Una manera de reforzar el concepto de equilibrio para excluir el equi. d Nash perfecto en subJ'uegos (D D') de la figura 4.1.1 es imponer
libno e
' ,
los dos requisitos siguientes:
'o
2
1
..".
Requisito 2. Dadas sus conjeturas, las estrategias de los jugado~~s deben ~~,.
sucesivamente
racionales.
Es decir, en cada conjunto de mformaclOn, la aCClO1l
tomada por el jugador al que le toca tirar y su estrategia subsiguie~te debense.r
ptimas, dada la c01fjetura del jugador en ese conjunto d~ informaclOn y las :llbSl,~
guientes estrategias de los dems jugadores (donde una estra.tegla subslg,Ulente
es un plan de accin completo que cubre cada contmgencla que podna darse
despus de haberse alcanzado el conjunto de informacin).
180
! JUECOS
INCOMPLETA (c. 4)
Introduccin
o
1
o
2
o
1
Figura 4.1.3
"
equl~Ito 3.
al equilibrio
bayesiano
perfecto / 181
sino que ahora tambin incluye una conjetura para cada jugador en cada
conjunto de informacin en el que el jugador tenga que jugar.1 La ventaja
de hacer explcitas las conjeturas de los jugadores de esta manera es que,
igual que en captulos anteriores insistimos en que los jugadores eligen
estrategias crebles, ahora podemos insistir en que se forman conjeturas
razonables, tanto dentro de la trayectoria de equilibrio (en el requisito 3)
como fuera de sta (en el requisito 4 que sigue y en otros de la seccin 4.4).
En aplicaciones econmicas simples, que incluyen el juego de sealizacin de la seccin 4.2.A y el juego con parloteo de la seccin 4.3.A,
los tres requisitos no slo capturan el espritu del equilibrio bayesiano
perfecto, sino que tambin constituyen su definicin. Sin embargo, en
aplicaciones econmicas ms complejas, se necesita imponer msrequisitos con objeto de eliminar equilibrios inverosmiles. Distintos autores han
utilizado. diferentes definiciones del equilibrio bayesiano perfecto. Todas
las definiciones incluyen los tres requisitos; algunas tambin incluyen el
requisito 4 y algunas imponen requisitos adicionales.2 En este captulo
tomamos los requisitos 1 a 4 como definicin del equilibrio bayesiano
perfecto.3
jugador 1?
3 Fudenberg y TIrole (1991) dan una definicin formal del equilibrio bayesiano perfecto
para una amplia clase de juegos dinmicos con informacin incompleta. Su definicin trata
cuestiones como las que hemos planteado en la nota 2. Sin embargo, en los juegos simples
analizados en este captulo. estas cuestiones no se plantean, por lo que su definicin es equivalente a los requisitos 1 a 4; Fudenberg y TIrole ofrecen condiciones bajo las cuales su equilibrio
bayesiano perfecto es equivalente al equilibrio sucesivo de Kreps y Wilson.
,,
''-.'
'.'
'.
\~ ..'
CON INFOR,\IAClN
INCO~II'LET,\
Introduccin
re .)
Definicin U q ''b . b
duras que s'at n, e ul1 no .ayesiano perfecto
lS aeen os requIsItos 1 a 4.
ni equilibrio
bnycsinno
perfccto
/ 183
A
2
L'
O
O
A
Figura 4.1.5
-,,} .. _---
O
1
1
Figura 4.1.4
Este juego ti ne
b'
,
con un n'
un su Ju~go: comIenza en el conjunto de informacin
este sub' ICOe emento ~el Jugador 2. El nico equilibrio de Nash en
Juego entre los Jugadores 2 3
(1 D'
equilibrio de Nash e
. y es , ), por lo que el nico
Estas estrate 'as 1p rfe:to en subJuegos del juego completo es (A,!,D').
g Y a conJetura p = 1 del jugador 3 satisfacen los requisitos
184/
INCOMPLETA (e. 4)
que el equilibrio bayesiano perfecto hace que las conjeturas de los jugadores sean explcitas, este equilibrio no puede reconstruirse procediendo
hacia atrs en el rbol del juego, como hicimos para construir el equilibrio
de Nash perfecto en subjuegos. El requisito 2 determina la accin de un
jugador en un conjunto de informacin.dado basado en parte en la conjetura del jugador sobre dicho conjunto de informacin. Si el requisito 3
o el requisito 4 se aplican a este conjunto de informacin, determinan la
conjetura del jugador a partir de las acciones de los jugadores situados
ms arriba en el rbol. Pero el requisito 2 determina las acciones situadas
ms arriba en el rbol, basndose en parte en las estrategias subsiguientes
de los jugadores, incluyendo la decisin en el conjunto de informacin
original. Esta circularidad implica que una sola pasada ha~a atrs a lo
largo del rbol (normalmente) no es suficiente para calcular un equilibrio
bayesiano perfecto.
, '!li
.r'
mj
UE(ti,mj,ak)
UR(ti,mj,ak).
, 'Jt
_rJ
\
(
(
J'
;',
:- - .:.'
En el modelo deinversirtempresarial
y estruc~rade
capital de Myers y Majluf (1984),el emisor es una empresa
que necesita capital para financiar WI nuevo proyecto, el
receptor es un inversor potencial; el tipo es la rentabilidad
de los activos existentes de la empresa, el mensaje es la
oferta de una participacin en l beneficio de la empresa
a cambio de financiacin y llaccin es la decisin de si
invertir ano por parte del inversor.
expectativa de inflacin por parte de los empresarios precede al juego de seii.alizacin, y la eleccin de la autoridad
monetaria de inflacin en el segundo periodo la sigue,
En el resto de esta seccin analizarnos el juego de seii.alizacin abstracto dado en 1 a 4, ms que estas aplicaciones. La figura 4.2.1 ofrece
una representacin en forma extensiva (sin ganancias) de un caso simple:
T == {tlh}, NI == {ml,m2}, A. == {o.l,o.2}YProb{t] } == p. Ntese que el juego
no se desarrolla desde el nodo inicial en la parte superior del rbol hasta
los nodos terminales en la parte inferior, sino desde una jugada inicial
iterminada por el azar en mitad del rbol hasta los nodos terminales en
los extremos izquierdo y derecho.
Emisor
a,
a,
m,
:
a,
'
,
,
Receptor
Azar
,
,
,
1 - J
a,
m,
t,
ai
a,
Receptor
m,
t,
a,
m,
a,
Emisor
Figura 4.2.1
Recordemos que (en cualquier juego) la estrategia de un jugador es un
plan de accin completo; una estrategia detalla una accin factible para
cada contingencia en la cual el jugador pudiera tener que actuar. Por lo
tanto, en un juego de seii.alizacin, una estrategia pura del emisor es una
funcin m(ti) que especifica qu mensaje elegir para cada tipo que el
azar pueda detemIinar, y una estrategia pura del receptor es una funcin
o.(mj) que especifica qu accin elegir ante cada mensaje que .el emisor
pueda enviar. En el juego simple de la figura 4.2.1, tanto el emIsor como
el receptor cuentan con cuatro estrategias puras.
188/
INCOMPLETA (e. 4)
mI
m2
si el
m2
m2
si el
ai si el
a2
L .(tjmj)
1.
tiET
,'.
'.','
Juegos de se1alzalf
190 / JUEGOS DINMICOS CON INFORMACIN
:," >
/.'
'
P(ti)
E.p(ti) .
".
;':
'\.
"
/ IlJ 1
INCOMPLETA (c. 4)
t,ET,
Definicin, Un equilibrio
bayesiano
erfi t
.'.
.
juego de sealizacin consiste en ," dP ec o ,CO~l estrategIas puras en un
' t
unpar eestrategzasm*(t')ya*(m)
je ura At 1m )
. fi
'j
,yen una
con
(3).
' 'J que satls acen los requisitos de sealizacin (1), (2R), (2E) Y
'.\
(e. 4)
':.
,',,'-,
i
','
4 La presencia de dos empresas en el papel del receptor deja este juego ligeramente fuera
de la clase de juegos analizada en la seccin previa; pero vase la discusin que precede a la
ecuacin (4.2.1).
5 Formalmente, suponemos que trabajadores con alta capacidad sbn ms productivos (es
decir, y(A,e) > 'y(I3,e) para toda e), y que la educacin no reduce la productividad (es decir,
Ye(TI,e) ~ Opara cada 'TI y cada e, donde ye('r,e) es la productividad
marginal de la educacin
",
____________________
(:;:"
..J.
fuegos de sClia/izacin
194
:""r
/195
INCOMPLETA (c. 4)
co~ IAenlafigura).
.
IR
lA
::.
v
w,
~.
Figura 4.2.3
196/
INCOMPLETA (e. 4)
w(e)
= .L(Ale)
. y(A,e)
+ [1 -
.L(Ale)] . y(E,e),
Curvas de
indiferencia
para capacidad
(4.2.1)
y(n,e)
e*(iz)
(';,
;
Figura 4.2.4
Ahora volvemos (deforma permanente) al supuesto de que la capacidad del trabajador es informacin privada. Esto abre la posibilidad d~ que.
un trabajador con capacidad baja pueda tratar de pasar por un trabaJa~or
de capacidad alta. Pueden plantearse dos casos. La ~gura 4.2.5 des~nbe
el caso en el que le resulta demasiado caro a un trabajador con capacIdad
baja adquirir una educacin e*(A), incluso si esto permitier~ engaa~ a las
empresas y hacer que le pagaran el salario w*(A). Es deCIr,en la figura
4.2.5, w*(B)
- c[B,e*(B)]
>
w*(A)
- c[E,e*(A)].
'-:
lA
y(A,e)
w
w*(A)
,',
y(B,e)
w*(B)
e
w*(-,) = Y[',e*Cr)].
e*),
e*(B)
e'(A)
Figura 4.2.5
"
'".'
e')
},
':,:,
,,
Juegos de se>lalizacll
w*(B}
Para completar la descripcin de equilibrio bayesiano perfecto ele agrupacin nos falta (i) determinar la conjetura ele la~ empresas p,(A le) para
las elecciones de educacin e =1 ep fuera del eqUlltbno, que entonces determina el resto de la estrategia de las empresas ll)(e) por medio de (4.2.1),
y (ii) demostrar que la mejor respuesta d: ambos tipos de trabajador a
la estrategia w(e) de las empresas es elegIr e = ep' Est~s dos pasos 1 epresentan los requisitos 1 y 2E de sealizacin respechvame~te: CO~l~O
apuntamos anteriormente (4.2.1) sustituye al reqUlsJto2R de senaltzaclon
en este modelo con dos receptores.
Una posibilidad es que las empresas crean que cualquier niv.elde ed~lcacin distinto de ep indica que el trabajador tiene Wla capaCIdad baja:
p,(A!e) = O para todo e =1 ep' Aunque esta conjetura ,podra parecer extraa, nada en la definicin de equilibrio bayesiano perfecto la e~c1L1ye,
porque los requisitos del 1 al 3 no imponen restricci~~es a las conjeturas
situadas fuera de la trayectoria de equilibrio y el reqwsJto 4 es vacuo en un
juego de sealizacin. El refinamiento que aplicamos en la seccin 4.4 restringe la conjetura del receptor fuera de la trayecto~ia de equilibri~ en un
juego de sealizacin; en particular excluye la conJ::ura que anahzamos
aqu. En este anlisis de los equilibrios de agrupaclOn ~~s cent:3mos en
esta conjetura para simplificar la exposicin, pero tamblen conSIderamos
brevemente conjeturas distintas.
Si la conjetura de la empresa es
__
,_,__
.
e*(B}
/ '199
~L(Ale)
e*(A)
apara
e =1 ep
{ q para e = ep
(4.2.3)
-.':: .
Como describimos en la seccin anterior, en este modelo pueden existir tres casos de equilibrios bayesianos petf~i:tos: de' ~i;rupacin, de separacin e hbrido. Normalmente existen numerososdsos de cada clase de
equilibrio; aqu l~mitamos nuestra atertci6riiirios cant~s ejemplos. En
un equilibrio de agrupacin, los dos tipos del trabajador eligen un nivel de
educacin nico, digamos ep' Elrequisit03'de seilicin impli<;aque
la conjetura de las empresas despus de observar ep debe ser lac'onjetura
a priori p,(Alep) = q, que, a su vez, exige que el salario ofrecido despus de
observarep
sea
(4.2)
_ {Y(E ,e)
wp
7]
para e =1 ep
para e,. -- e-p'
(4.2.4)
max'w(e)
- c(7/,e).
(4.2.5)
INCOMPLETA (c. 4)
de indiferencia del trabajador con capacidad alta que pasa por el punto
(ep'll)p)
est por encima de la funcin de salario tu = y(B,e).
y (A,e)
O
q y(A,e)
+ ( 1 - q)
L(Ale) =
y(R,e)
e'
el'
"
1.:.;.
(R,e)
.
e*(B)
q
{ q
w(e)
{Y(B,e)
wq
Wq
el'
Figura 4.2.7
En resumen, dadas las curvas de indiferencia, las funciones de produccin y el valor de el' en la figura 4.2.7,la estrategia [efE) = ep,e(A) = el']
del trabajador, y la conjetura L(Ale) en (4.2.3)y la estrategia w(e) en (4.2.4)
de las empresas constituyen un equilibrio bayesiano perfecto de agrupacin.
Existen muchos otros equilibrios bayesianos perfectos de agrupacin
en el ejemplo definido por las curvas de indiferencia y las funciones de
produccin de la figura 4.2.7. Algunos de estos equilibrios incluyen una
eleccin de un nivel de educacin diferente por parte del trabajador (es
decir, un valor de el' distinto del de la figura); otros incluyen la misma
eleccin de un nivel de educacin pero difieren fuera de la trayectoria de
equilibrio. Como ejemplo de lo primero, sea e un nivel de educacin entre
ep y el, donde el en la figura 4.2.7 es el nivel de educacin en el eualla curva
de indiferencia del trabajador de baja capacidad que pasa por el punto
(e'(B)w'(B)
corta la funcin de salario w = q . y(A,e) + (l - q) . y(B,e).
C"
'.
01 sustItUImos el' en (4.2.3) y (4.2.4) por e, la conjetura y la estrategia
resultantes de las empresas, junto con la estrategia [e(B) = e,e(A) = e] del
(,',
"
0'
",<
,'.
'.',',','
1'.>.,
________
.:..--
1::'
Juegos de selaliznci"
INCOMPLETA (e. 4)
2m
y(A,e)
O
p,(Afe) = { 1
10
(4.2.6)
( _ { y(E,e)
we ) y(A,e)
Puesto que e'(A) es la mejor respuesta del trabajador con capacidad alta.
a la funcin de salariosw = y(A,e), tambin es la mejor respuesta aqu.
Con respecto al trabajador de baja capacidad, e7(B) es la mejor respuesta
de dicho trabajador cuando la funcin de salarios eSw == y(E,e), de manera que w'(E) -e[B,e'(E)]
es la mayor ganancia.que el trabajador puede
lograr de entre todas las elecciones de e < e'(A), Puesto que las cur~.
vas de indiferencia del trabajador de baja capacidad tienen mayor pen.:
diente que las del trabajador de alta capacidad; w~(A) - e[E,e'(A)] es
la mayor ganancia que puede conseguir; aqu un trabajador de baja capacidad de entre todas las elecciones de e 2: e'(A).
Por tanto, e'(E)
es la mejor respuesta de un trabajador de baja capacidad, puest? qu~
w'(E) - dE,e'(E)]
> w'(A) - dE,e'(A)] en el caso en que no hay envidia_
A partir de aqu ignoramos el caso en el que no hay envidia. Como
sugerimos anteriormente, la figura 4.2.6 (el caso con envidia) es ms inte"'
resante. Ahora el trabajador con capacidad alta no puede ganar el salario
alto roCe) = y(A,e) simplemente eligiendo la educacin e'(A) queelegia
bajo informacin completa. En su lugar, para sealizar su capacidad, el
trabajador con capacidad alta debe elegir e., > e'(A), .como muestra la
figura 4.2.8, puesto que el trabajador con capacidad baja imitar cualquier
valor de e entre e'(A) y es si hacerlo lleva a las empresas a creer que tiene
capacidad alta. Formalmente, el equilibrio natural bayesiano perfecto de'
separacin incluye ahora la estrategia [e(E) = e'(E),e(A) = es] del trabajador y las conjeturas de equilibrio p[Ale'(E)] = O Y{t[Ales] = 1 Ylos salarios
de equilibrio w[e'(E)] = w'(E) y w(es) = y(A,es) de las empresas. ste es
el nico comportamiento en equilibrio que sobrevive al refinamiento que
aplicaremos en la seccin 4.4.
y(A,e,J
w'(A)
y(B,e)
w'
(L)
e*(B)
e'(A)
es
Figura 4.2.8
.,
de e uilibrio, de las conjeturas de las emjJr~sas
Una expreslOn, fuera
.q
., .
Itrabajador tIene
que sustenta este comportamiento de e~Ulhbno es que ~o'
capacidad alta si e 2: e., y capacidad baja en caso contra .
O
para e
p,(Aje) = { 1 para e
< es
2: e.,.
para e < es
para e 2: es.
.
cidad baja tiene dos
Dada esta funcin de salarios, el trabaJado.r con capa.
ar' (A,e,).
". .. .
l . '(E)
ganar 1}! (B) y elegIr es y gan.l/
.
mejores respuestas: e eglr e
y
.
f
d p'(JJ)' al.
ue esta indiferencia se resuelve en avor e ~
,
Vamos a suponer q
.'
f dad arbitrariamente
. '"
d 'amos aumentar es en una can 1
.
temativamente po n
..
'd d b J'aprefiriera estnc- d
ue el trabajador con capaCl a a
pequena e manera q
,...
'd d alta las elecciones
tamente e'(E), En cuanto al trabajador con capan a
,
.'
d
.
.
> e'(A). :Puesto que
las LUlvas e
. de e > e son lnfenores a e" ya que e.,.
,
'j'
s
.
'dad baJ'a llenen mas pem lente que
indiferencia del trabaJador con capacI
.
1 '1 .
.d d lta la curva de indiferenCla de u t11110
las del trabajador con capacl a a ,
.,
1 .'
que pasa por el punto ( e"y. (A ,es est por encima de la funclOn de s.a allos
b"
.
1 que las. elecciones de e < es son tam len
w = y(B,e) para e < e" por o
- c[B,e*(E)]
= 'Wh - c(E,eh).
\:.'
"
;;'
'.'
,"
"
(4.2.9)
(4.2.8)
Recordemos de la nota 2 ele! captulo 3 que la regla de Rayes establece que P(AIB) =
p(A.m/
P(8). Para derivar (4.2.8), reformulemos la regla de Bayes como P(A,E) = P(BIA).
1-'(04), por lo que P(AIE) = P(BIA).
1-'(04)/ P(B).
6
q
Wh = ---~.
q + (l - q)7f
.
y(A,e.)
(1 - q)7f
q
(1
).
7f
y(E,eh).
(4.2.10}
....
INCOMPLETA (c. 4)
Para un valor determinado de eh, si (4.2.9) da que '/1)h < y(A,eh), entonces
(4.2.10) determina el valor nico de que constituye un equilibrio hbrido
en el cual el trabajador con capacidad baja escoge aleatoriamente entre
e*(E) y eh, mientras que si '/1)h > y(A,eh),
no existe ningn equilibrio
hbrido que incluya eh.
7["
O
/.L(A\e) = { r
y(A,e)
para e < eh
para e 2': e".
r y(A,e)
+ O - r)
y(E,e)
w(e) = { r . y(A,e)
.
y(B,e)
+ (l - r) . y(B,e)
para e <
para e 2':
eh
eh.
Slo queda por comprobar que la estrategia del trabajador (e(B) = e" con
probabilidad 7[",e(B)
e*(E) con probabilidad 1 - 7[";e(A) = eh) es una
mejor respuesta a la estrategia de las empresas. Para'el trabajador con
capacidad baja,la e < eh ptima es e*(B) y la e 2': eh ptima es el~' Para el
trabajador con capacidad alta, eh es superior a todas las alternatlvas.
w~
q y(A,e)
+,0-
q) y(B,)
,
,,
,
y(B,e)
'~
. 1:,
w*(B)
' ..
'
'.'
e*(B)
Figura 4.2.9
.....
7["
o.'
)' n
Juegos de sel1aliZJlcin
INCOMPLETA (c. 4)
y las
ganancias:
pB
(l - q)A + R]
2:
1(1 + r).
(4.2.11)
s<--1f+R
(4.2.12)
1(1 +1')
R
.
< --o
+ (1 - p)A + R - A + R
!209
(4.2.13)
1(1 + r)A
R
- B.
(4.2.14)
Jegos de sializnci')/1
JO + r), que el inversor; acepta. Sin embargo, si B fuera lo suficientemente negativo como para queR +B < JO + 7"), el tipo de beneficio
bajo no podra devolver su deuda, por lo que el inversor no aceptara el
contrato. Aplicaramos un argumehto'similar siH y A fueran benefiCiti;:'
esperados (y no beneficios seguros). Supongamos que el tipo 7f Sil;nifit~ .
que los beneficios actuales de !l empresa sern 1r+ J{ con probabilidad
1/2 y 1r- J{ con probabilidad 1/2. Ahora, si B - J{ + R < JO + r), hay
una probabilidad de 1/2 de qu el tipo de beneficio bajo no sea capaz
de devolver la deuda D = J(1 + r), por 10 que el inverSOftlo aceptar el
contrato.
.
D =
I 211
'"t
1r*(1re) = ~2[(l
c+d
- b)y* + d1re].
c+d
b)y' + d1r21
=. 1r:i.(1r2'c).
~ 12
! JUEGOS
INCOMPLETA (e. 4)
En un equilibrio de agrupacin, ambos tipos escogen la misma inflacin para el primer periodo, digamos 7r*,por lo que la expectativa de ,
los empresarios en el primer periodo es 7rj = 7r*. En la trayectoria de
equilibrio, los empresarios empiezan el segundo periodo creyendo que la
probabilidad de que e = D es Ji, por lo que se forman la expectativa 7r2(p).
La autoridad monetaria de tipo c escoge entonces su inflacin ptima para'
el segundo periodo dada esta expectativa, concretamente 7ri[7r2(P),c],finalizando con ello el juego. Para completar la descripcin de este equilibrio,
queda (como siempre) definir las conjeturas del receptor fu~~a del equi-.
Iibrio para calcular las correspondientes decisiones fuera del equilibrio
utilizando (4.2.15), y comprobar que estas decisiones no crean ningn
incentivo a desviarse del equilibrio para ningn tipo del emisor.
En un equilibrio de separacin, los dos tipos escogen niveles de inflacin diferentes en el primer periodo, digamos 7[D y 7rF, por lo que la
expectativa de los empresarios en el primer periodo es 7r = P7[D+(1-phF.
Despus de observar 7[D, los empresarios empiezan el segundo periodq'
creyendo que e = Dy se forman por ello la expectativa 7[2(1);delmi~IJ;l9
modo, observar 7[F cOJ;lducea7[2(0).En equilibrio, el tipo dbil e~coge ei1~
tonces 7[i[7[2(1),D] y el tipo fuerte 7[i[7r2(O),F], finalizandoel juego. Par~
completar la descripcin de este equilibrio,. no.'slo queda, corno antes~
detallar las conjeturas y acciones fuera del equilibrio del receptoricorii~
probar que ningn tipo del emisor tiene incentivos para desviarse, sino
tambin comprobar que ningn tipo tiene incentivos pala imitar el cmn-,
pOltamiento en equilibrio del otro. Aqu, por ejemplo, el tipo dbil podra
pensar en escoger 7[F en el primer periodo, induciend() co!,ell.o a qtle !
expectativa de los empresarios en el segurido periodo fuera 7[2(0),pero
escoger 7[i[7[2(0),D], finalizando el juego. EscL~jr, incluso si 7[F fuera
demasiado baja para el tipo dbil, la expectativa consiguiente 7[2(0)podra
ser tan baja que el tipo dbil recibiera una ganancia enorme debido a la
inflacin inesperada 7[i[7[2(O),D] - 7r2(O) en el segundo periodo. En un
equilibrio de separacin, la inflacin escogida en el primer periodo por el
tipo fuerte debe ser lo suficientemente baja corno para que el tipo d~bil
no sienta la tentacin de imitarle, a pesar del ben~ficio que obtendra por
la inflacin inesperada en el segundo periodo. Para muchos valores de
los parmetros, esta restriccin hace que 7[F sea menor que ei nivel d~
inflacin que el tipo fuerte elegira bajo informacin completa, delrrJsmo
modo que el trabajador con capacidad alta invierte ms de la cuenta en
educacin en un equilibrio de separacin del modelo de Spence.
del equilibrio
bayesiano
perfecto
del libro, la frase que originalmente aparece es "Hey, look out for that
como "Cuidado con ese autobs!" o como "Espera ese autobs!",
La fraseqe nosotros incluimos aqu es una de las muchas frases en
signifiadosc?mpl"tamente
diferentes dependiendo del contexto. '
quiere eXpresar. (N. de los T.).
(i.
,
~.'.
"
':
,r.
Otras aplicaciones
214 / JUEGOS DINMICOS CON INFORMACIN
emisor, TI, enva un mensaje mI, mientras que otro subconjunto de tipos;
T2, enva o.tro mensaje, m2. (Cada Ti podra contener slo un tipo, como
en un equilibrio de separacin, o muchos tipos, como en un equilibrio de
separacin parcial.) En equilibrio, el receptor interpretar que mi viene de
Ti y tomar por tanto la decisin ptima, a dada su conjetura. Come:,to"
dos los tipos del emisor tienen las mismas preferencias sobre las acciones
a tomar, si un tipo prefiere (digamos) al a 0.2, todos los tipos tienen esta
preferencia y enviarn el mensaje mI en lugar de m2, destruyendo con ello
el equilibrio putativo. Por ejemplo, en el m~dei~' deSpence; 'si elpaii~teo
resultara. en un mensaje indicativo <leun saJaria,alto, mientras que otro
tipo de parloteo indicaraunsalario b~jo,lo~ trai:>aJ?dores'de'"~~lqier nivel d~ capacidad enviaran.el primer ni.ensaje~porlo que npuede' existir
,un equilibrio en el que. el parloteo afecte los salari()s.
,
',.'
,,/
del equilibrio
bayesinno
prr!,'cfo
/ 215
INCOMPLETA (c. 4)
Por 10 tanto, para que el parloteo sea informativo, una condicin necesaria es que diferentes tipos del emisor tengan preferencias diferentes en
relacin con:las acciOliesdeLreceptor, Una segunda condicin necesaria,
por supuesto, es que el.receptor prefiera acciones,giferentesdependiendo
del ti'p:del emisor .. (Tanto la selizacincomQ;ja.comurucacinp~yia
son intiles si las preferencias del receptor sobre sus acciones' son inde~
pendientes del tipo del emisor.). Una terceracondiciitnecesaria para que
el parloteo sea 'informativo es que las preferencias del receptr sobre sus
acciones nlJ sean completamente opuests alasd~emisor. Para adelantar
un ltimo. ejemplo,supongamos que elr~~epto{prefiere.acciones bajas
cuando el tipo deLemisor es bajo y acciones altastuando es.alto; Siemisores de tipos bajos prefieren acciones baja~ y los de tipos altos acciones
altas, puede haber comunicacin, pero si efemisor tiene ias preferencias
opuestas no puede existir comunicacin, ya que al emisorle gustara cone
fundir al receptor. Crawford y Sobel (1982) lIlalizanunmodelc5 abstracto
que satisface estas tres condiciones necesarias y establecen d()s resultados
intuitivos: en trminos informales, puede existir ms comunicacin por
medio del parloteo cuando las preferencias. de las jugadores estn ms
ntimamente relacionadas, pero no puede existir comunicacin perfecta a
no ser que las preferencias de los jugadores estn perfectamente alineadas ..
Cada una de .las aplicaciones econmicas que acabamos de. describir
(parloteo por parte de la autoridad monetaria, amenazas de veto, debates
parlamentarios y presencia sindical) incluyen no slo un juego sencillo
con parloteo sino tambin una modelizacion ms completade un entorno
econmico. Analizar una de estas apii<:acionesexigira describir no s<$loel
juego sino tambin el modelo completo, lo que desviara nestr<i atencin
de las fuerzas bsicas que operan en los juegos con parloteo. En esta
seccin, por lo tanto, nos apartamos de nuestro estilo anterior y.analizamos
slo juegos abstractos con parloteo, dejando las aplicaciones como lectura
adicional.
El desarrollo temporal del juego con parloteo ms sencillo es idntico
al del juego de sealizacin ms sencillo; slo cambian las ganancias.
(J.k
de
La caracterstica clave de este juego es que el mensaje no tiene efecto directo rusobre la ganancia del emisor ni sobre la del receptor. La nica
manera en la que el mensaje puede importar es a travs de su contenido
informativo: cambiando la conjetura del receptor sobre el tipo del emisor,
un mensaje puede cambiar la decisin del receptor y, por tanto, afectar
indirectamente a las ganancias de los dos jugadores. Como la misma informacin puede ser comurucada en diferentes lenguajes, diferentes espacios
de mensajes pueden alcanzar los mismos resultados. El espritu del parloteo es que puede decirse cualquier cosa; en consecuencia, formalizar este
concepto exigira que M fuera un conjunto muy grande. Por el contrario,
suponemos que M es lo suficientemente rico para decir lo que haga falta
decir; es decir, M = T. Para los propsitos de esta seccin, este supuesto
es equivalente a permitir que se diga cualquier cosa; sin embargo, para
los propsitos de la seccin 4.4 (refinamientos del equilibrio bayesiano
perfecto), este supuesto debe ser reconsiderado.
Puesto que los juegos con parloteo y de sealizacin ms sencillos
tienen el mismo desarrollo temporal, las definiciones de equilibrio bayesiano perfecto en los dos juegos son tambin idnticas: un equilibrio
bayesian perfecto con estrategias puras en un juego con parlol<;:oes un
par de estrategias m'(ti) y a'(mj), y una conjetura .t(tdm) que satisfacen
los requisitos (1), (2R), (2E) Y (3) de sealizacin, aunque las funciones
de ganancias U R(tmj,o,k) Y U ECt111.j,G.k) en los requisitos (2F,)y (2E) de
216/
INCOMPLETA (e. 4)
sealizac.in son ahora equivalentes a URUi,aJ y Udt."rtk) respectivamente. Sm embargo, una diferencia entre los juegos de sealizacin y los
Juegos con parloteo es que en estos ltimos siempre existe un equilibrio
de agrupacin. Puesto que los mensajes no tienen un efecto directo sobre
las'
. dI'
.
> gana~l.C1ase emI~or, SIel receptor va a ignorar todos los mensajes, la
atrupaclOn es una. mejor respuesta del emisor. Puesto que los mensajes no
tIenen un efecto dIrecto sobre las ganancias del receptor, si el emisor est
jugando agrupacin, ignorar todos los mensajes es una mejor respuesta
del receptor. Formalmente, sea a* la accin ptima del.receptor en un
equIlIbno de agrupacin; es decir, a* es una solucin de
tB
tA
aB
1:,1
y,O
(LA
Z,O "W,1
Figura 4.3.1
',
.... '
a.
\',"
..
218
!JUEGOS
(c. 4)
los jugadores, cuando b est cerca de tero los intereses de los jugadores
estn ms alineados),
.t
:'
".;.'
,"
,,'
",:,"
Xl
+b =
1]
X] +
2:1 [X]2 + -2-
Otras aplicaciolles
o Xl = 0/2)
positivo, por
para &:?: 1/4
para permitir
del equilibrio
bayesiallo
pa/cfo
! 219
Punto medio
a=l
t+b
U,(t,a)
Figura 4.3.2
Para completar la discusin de este equilibrio de dos escalones, tratamos el tema de los mensajes que estn fuera de la trayectoria de equilibrio.
Crawford y Sobel establecen la estrategia (mixta) del emisor de (orn:a ~l~e
estos mensajes no existan: todos los tipos t < X] escogen un mensaje
aleatoriamente de acuerdo con una dish'ibucin uniforme en [O,X]); todos
los tipos t :?: X] escogen un mensaje ale'atoriamente de acuerdo con una
distribucin uniforme en [xI,l]. Como hemos supuesto que M = '1', no
hay ningn mensaje del que podamos estar seguros que no se enviar en
equilibrio, por lo que el requisito 3 de sealizacin detemna la conjetura
del receptor despus de cualquier mensaje posible: la conjetu.ra del receptor despus de observar cualquier mensaje de [O,X]) es que t se distribuye
uniformemente en [O,XI),y la conjetura del receptor despus de observar
cualquier mensaje de [xI,l] es que t se distribuye wUformemente en [:1;1,11.
(El uso de distribuciones uniformes en la estrategia mixta del emisor no
tiene nada que ver con el supuesto de una distribucin uniforme del tipo
del emisor; la estrategia mixta del emisor podra utilizar tambin cualquier
otra densidad de probabilidad estrictamente positiva sobre los intervalos
220/
INCOMPLETA (e. 4)
Xk+l
+ :1;k
2
-
(
Xk
b)
= 2: +
\~.
En un equilibrio de n escalones, si el primer escaln tiene una longitud ti,el segundo debe tener una longitud d + 4b, el tercero d + 8b Y as
sucesivamente. El n-simo escaln debe acabar exactamente en 1, por lo
que de~emosterer
~. d + (d + 4b) + ... + [d + (n - 1)4b] = 1.
+ n(n
- 1) = n(n - 1)/2,
- 1) . 2.b
= 1.
tenemos que
(4.3.1)
Dado c~aiquiern tal que n(n -1). 2b < 1,existe' un vaJor de d cue~luci0I1a
(4.3.1). Es decir, para cualquier n talque n(n-l).2b
<1, existeunequilibri
de agrupaci~parcial de n escalones, y la longitud del primer escaln es
el valor de d que soluciona (4.3.1). Corno la longitud del primer escaln
debe ser positiva, el nmero mximo de escalones en este equilibri?, n *(b);
es el valor msaIto den tal que n(n - 1) .2b < 1. Utilizando la frmula
de la ecu"acin "de segundo grado, se obtiene que n*(b) es el mayor enter?
por debajo de
~.[1 + JI
+ (2/b)}.
(,
};~
'11)1
(2 - 8)2
=
2(4 -38)
'Ir
A.
1rl
INCOMPLETA (c. 4)
2w
2- 8
= 2-8 = 4-"381rA
UJ2
1rj
2=
Si el beneficio de la empresa,
en
Caso
2 -
-2-(4---3--)
1r,
/'
KA
,ltJ],
es mayor que
1))2'
contrario, la rechaza.
224/
INCOMPLETA (c. 4)
Azar
lO,
,WE}
lC,1 -
wa
7tH
'- wB
ei,
O.
O
lO"
IT, - lO,
O
O
e~p're~~:
O
O
lO,
1t.~- IVg
,.
,,-
O
O
Figura 4.3.3
dos com.o en la figura 4.3.3). En cada conjunto de informacin, la conjetura
del sIndIcato es una distribucin de probabilidad sobre estos nodos. En el
O
O
'_.
-,>.
_.
o'"
-'
..
'
maxUJ'
w
lO}
.'
lO},
;.
donde Prob{la empresa acepta w} = (TI-'w) /Tl para los valores relevantes
.....
...
....
,','
,~,',
....}
;-
7fl= max{7f"(w,7f,j2),Wl}'
Para resolver esta ecuacin implcita, supongamos que Wl ~ 7f"('U],irtl2).
7f*(Wl,7fl/2). Por lo tanto,
7fl -- Wl, lo que contradice Wl >
Enances
t
Wl
Wl
W2(w1)=2_'
Hemos reducido el juego a un problema de optimizacin en un periodo para el sindicato: dada la oferta salarial del sindicato en el prime.r
periodo, 1JJl,hemos hallado la respuesta p~m~ ~e la empresa en e~pnmer periodo, la conjetura del sindicato al pnnc~plO del segundo p:n~do,
la oferta ptima del sindicato en el segundo penado y la respuesta 0.pt1ll1a
de la empresa en el segundo periodo. Por lo tanto,.l,a oferta salanal del
sindicato en el primer periodo debera ser una soluclOn de
+ W2(Wl)
Wl
W2}'
=7fA
(.
228/
INCOlvlPLETA (e. 4)
en que la ganancia en una etapa dependa slo de las jugadas de esa etapa,
y que la ganancia total del juego repetido sea la suma de las ganancias en
cada una de las etapas del juego. En particular, se podra suponer que
con probabilidadp la mejor respuesta del jugador fila a la cooperacin
es la cooperacin. Kreps, Milgrom, Roberts y Wilson (KMRW en lo sucesivo) demuestran que la existencia de informacin asimtrica unilateral
de este tipo no es suficiente para producir la cooperacin en el equilibrio;
al contrario, no cooperar (confesar) es lo que ocurre en cada etapa, al igual
que bajo informacin completa. Sin embargo, tambin demuestran que si
la asimetra informativa es bilateral (es decir, existe tambin una probabilidad q de qli.e'la mejor respu~sta del jugador columna a la cooperacin
sea la cooperacin) puede existir entonces un equilibrio en el que los dos
jugadores cooperen hasta que;uede muy poco para que el juego se acabe.
Para repetirlo otra vez, supondremos que con probabilidad p el jugador fila slo puede jugar la estrategia del Talin. El espritu del anlisis
de KMRW' es que' incluso si p es muy pequea (es decir, incluso si el
jugador' colrnna tiene slo una ligera sospecha de que el jugador fila
podra no ser racional) ,sta incertidumbre puede tener un gran 'efecto"e:n
el siguiente sentido. KMRW demuestran que existe una cofa superior,.al
nmero de etapas en las que algn jugador no coopera en equilibrio. Esta
coti;lsuperior depende de p y de las ganancias en el juego de etapa, pero
no del nmero de etapas en el juego repetido. Por lo tanto, en cualquier
equilibrio de un juego repetido lo suficientemente largo, la fraccin deetapas en las que ambos jugadores cooperan es grande. (KMRWestablecen
su resultado para el equilibrio sucesivo, pero sus argumentos tamb~~~~e
pueden aplicar al eq\lilibrio bayesiano perfecto.) Dos pasos claveel1 ~l
argumento de KMRW son: (Osi el jugador fila se desva de la estrategia
del Talin,.pasa a ser informacin del dominio pblico que el jugador es
racional, por lo que ningn jugador' cooperar en lo sucesivo, de manera
que el jugador fila racional tiene un incentivo para imitar la estrategia del
Talin, y (ii) dado un supuesto que i.I;npondreJI,t,os
ms, adelante sobre las
ganancias del juego de etapa, la mejor respuest del jugador columna a la
~stategia del Talin sera coope~ar hasta. la ltima etapa del juego.
.
Para entende:ulsson los elementos bsicos del modelo de KMWR,
con~iderarem~s eicompieII1ertt?riricie su ~liSis:.en lugar de suponer q~e
p es baja y analizar los juegos rep,etldc,>sdelarga duracin, supondremos
qlle p es lo suficientemente alta ~oIl1oyara que exista un equilibrio de
.un juego repetido corto en el qud9!i dos jugadores cooperen en todas las
etapas menos
en las dos
l9~Ill.~,Empezamos con el caso de dos periodos.
.
.
.
,(
Olras aplicaciones
riel equilibrio
bayesillllO perfecto
/ 231
"o
";
1=2
1=1
NC
NC
Jugador columna
NC
Figura 4.3.5
Para hacer de este juego de etapa un dilema de los presos, suponemos que
a > 1 yb < O.KMRWtambin suponen que a + b < 2,de forma que (como
indicamos anteriormente en (ii la mejor respuesta del jugador columna
a la estrategia del Talin es cooperar hasta la ltini'etpa del juego; en
lugar de ir alternando entre cooperar y no cooperar.
1=1
1=2
1=3
NC
NC
Jugador columna
NC
Columna
Figura 4.3.6
Cooperar,No coop~rar
-,
.,:
Cooperar
1,1
b,a
No cooperar
a,b
0,0
Fila
Figura 4.3.4
Al igual que en el ltimo periodo de un dilema de los presos rejJetido
finitamente coninformacin completa, no cooperar (NO) driliaestric
tamente a cooperar (O) en l~ltima etapa de este juegod~ dos'peii6dos
con informacin incompleta; tanto para el jugador fila r.;tcional
para
el jugador column. Dado que el jugador columna no coopetaren"la
ltima etapa, no existe ninguna razn para que el jug~dorfila r~ional10
hagaen larrimera etapa. Ahora bien, la estrategia delTalin empieza
el juego con cooperacin. Por lo tanto, la nica decisi6n que hace falta
determinar es la del jugador columna en el primer periodo, (X), 'que ser
c?mo
"
p .
que
p + (1 - p)b
O.
(4.32)
232/
INCOMPLETA (c. 4)
(4.3.3)
,'o,,'
',,-;.",
1 + p + (1 - p)b + pa ~, a + b + pa.
1= 1
1= 2
1= 3
NC
NC
NC
Jugador columna'
NC
NC
-.
1= 1
1= 2
NC
NC
1=3
NC
"---'
Jugador columna
NC
NC
NC
Figura 4.3.8
Figura 4.3.7
a+b:::;1.
'(4.3.4)
(,
INCOMPLETA (c. 4)
a=l
a=l/(l-p)
= -p/(l-p)
Figura 4.3.9
Apndice
"'c
",
un
+ b + [T
- (t
+ 2) - 1] + 11 + (1 -
p)b
+ pa,
(t
+ 2) - 11 + p + (1 -
p)b
+ pu.
(43.5)
Refinamientos
Hasta ahora hemos demostrado que el jugador columna no tiene incentivos para desviarse cooperando hasta el periodo t - 1 Y dejando de
cooperar en el periodo t, dado que se jugar el equilibrio cooperativo en
el juego de continuacin que empieza en el periodo t + 2. Ms en general,
el jugador columna podra cooperar hasta el periodo t - 1, no cooperar
en los periodos t a t + s y volver a cooperar en el periodo t + s + 1. Hay
tres casos que son triviales: (1) si t + s = T (es decir, si el jugador columna
nunca coopera despus de no haberlo hecho en el periodo t), la ganancia
es a en el periodo t y cero en lo sucesivo, que es menor que (4.3.5); (2) si
t + s -1- 1 = T, la ganancia del jugador colunma de t a T es a + b, peor que
en (l), y (3) si t + s + 1 = T - 1, la ganancia del jugador colunma de t a l'
es a + b + pa, que es menor que (4.3.5). Quedan por considerar los valores
de ~ para los que t + s + 1 < l' - 1. Al igual que en elcaso anterior con
s = O, existe un equilibrio cooperativo. en el juego de. continuacin que
empieza en el periodo t + s + 2; supongamos que se juega este equilibrio.
Entonces, la ganancia del jugador columna en los periodos ta T por jugar
esta desviacin es
a + b + [1' - (t + s + 2) - 1] + p + (1 -p)b+
---------------2
pg,
3
1
------7
Figura 4.4.1
Otras dos caractersticas de este ejemplo merecen una breve mencin.
En primer lugar, aunque C est estrictamente dominada, 1 no. Si Eestu~
viera estrictamente dominada (corno ocurrira si la ganancia de 3 por parte
del jugador 1 fuera, por ejemplo, 3/2) el mismo argumento implicara que
no es razonable que p sea positiva, lo que implica que p debe ser cero, pero
esto contradira el resultado anterior de que p debe ser uno.,.En tal caso,
este requisito no restringir! lqs conj~turas fuera del equilibrio d~i jugador
2. (Vase la definicin formal'que damos ms adelante)
,
.
1
.,_,'
En segundo lugar, el ejemplo no ilustra el requisito .~escrito inicialmente, porque C no slo est estrictamente dC;IDinadaa partir de algn
conjunto de info~acin, sino estrjctarr;f~t~~ominada en el sentido ms
,.
. ..
."
o.
~
.
s;.
",
[pI
b
2,0
Receptor
1,0
[}- pI
1,
1,1
Figura 4.4.2
Definicin. Consideremos un conjunto de informacin en el cual le toca decidir al jugador i:" La estrategia s; est estrictamente
dominada a partir de
este conjunto de. informacin
s(existe otra estrategia Si tal que, para cada
conjetura que pudiera fonnarse i 'e-n el conjunto de informacin' dado, y para
cada posible combinacin' de las esttaiegiils subsiguientes de .los otros jugadores
(donde una "estrategia subsiguiente" es un plan completo de accin que cubre
cada contingencia que pudiera presentarse una vez se ha alcanzado el conjunto
de inforrr;zaciridado) la ganancia esperada de i al tomar la accin indicada por Si
en el conjunto de informacin dado 'y al jugar la estrategia subsiguiente indicada
por Si s :estr,ictamente ;nayor que la ganancia esperada al tomar la accin y jugar
la estrategia subsiguiente especificadas por s;.
2-10/
akEA
j'
,CLk) >
max U E(tmj,ak)'
ukEA
Duelo
[pI
,
,
Quiche
t,
[ql
Cerveza
..
No
0,5
:
.,,
3,0
Receptor
0,1
Cobardica
Duelo
en T.)
....
0,-1
2,0
,,
,,
,
,,
,,
,,
"
"::'"
1,-1
0,5
Duelo: ,
,
,
[l No
2,0
Reeptor
Azar
pI
Quiche
1,
Duelo
Cerveza
Malas pulgas
[1 -
~:
...
qI
No
3,0
Figura 4.4.3
En el juego de sealizacin "cerveza y quiche", elemisor es uno de los
dos tipos: t ="cobardica" (con probabilidad 0,1) Y t2 = "malas pulgas"
(con probabilidad 0,9). El mensaje del emisor es su eleccin de cerveza
c.
..
'"
',
..:.;
Refinamientos
INCOMPLETA Ce. 4)
del equilibrio
bayesimlO perjec/o
/ 24:1
Si este discurso fuera credo, establecera que q = 0, lo que es incompatible con este equilibrio bayesiano perfecto de agrupacin.
Podemos ahora generalizar este argumento a la clase de juegos de
sealizacin definida en la seccin 4.2.A; con ello obtenemos el requisito
6 de sealizacin.
Definicin. Dado un equilibrio bayesiano perfecto en un juego de serlalizacil1,
el mensaje mj est dominado en equilibrio para el tipo ti de T si la gl7J1I1ncia
en equilibrio de t que denotamos mediante U'(t;), es ms alta que la mayor
ganancia posible para ti por utilizar 7)Ij:
.~,
/
,
~-'
(,,1
Refinamientos
INCOMPLETA (c. 4)
1,
(A,e)
y(A, e,)----.-.-----
~Y(Bre)
w*(B)
e*(B)
e.
Figura 4.4.4
+ [1 -
J.l(Ale)] . y(B,e).
Por lo tanto, la utilidad para el trabajador con capacidad baja al escoger e'(B) es corno mnimo yfB,e*(B)]
- c[B,e*(B),
que es mayor que su
utilidad al escoger cualquier e > e., independientemente de lo que la
empresa crea despus de observar e. Es decir, en trminos del requisito 5
de sealizacin, cualquier nivel de educacin e > es estdom:inado para
el tipo de capacidad baja_ Utilizando lID lenguaje informal, el requisito 5
de sealizacin implica que la conjehlra de la empresa debe ser .t(Ale) = 1
para e > e., lo que a su vez implica que un equilibrio de separacin en el
,','
1,'.
;;',
Re!ill11111ielllos
INCOMPLETA (e. 4)
qy
(A,e,)
parcelo / 247
bayesiallo
(A,e)
del equilibrio
(A,e)
(B,e)
y
w*(B)
(A,e)
e,
e*(B)
e '
qy
y (A ,e, )
(A,e)
Figura 4.4.5
y U3,e)
w*(B)
e,
e*(B)
Figura 4.4.6
24j /
J llEGOS
Ejercicios / 249
INCOMPLETA (c. 4)
(A,e)
qy
(A,e)
(B,e)
4.6 Ejercicios
4.1 En los siguientes juegos en forma extensiva, dervese el juego en forma
normal y hllense todos los equilibrios de Nash con estrategias puras, los
perfectos en subjuegos y los bayesianos perfectos.
e* (L)
ep
e'
e"
e,
e
,-.. .-;:"
a.
D
Figura 4.4.7
2
2
4.5 Lecturas
adicionales
4
1
O
1
3
O
b.
D
2
4
1
3
1
2
4
O
4
O
3
3
.-;,":
",:.,
Ejercicios / 251
".,'
1")
(1/3)
1,0
: b
Receptor
1,1
2,1
, a
a
1
1,
(1/3)
, "
,."','.
'~4':.'
0,0
,
,
Receptor
2
2
<0'
b
1,0
0,0
O
1
3
O
\$.
k'
;t
Receptor
Receptor
Azar
1,
(1/3)
a
1
0,5
1,
3,0
2,0
a.
2,2
1,1
a
1
Receptor
Azar
Receptor
1,
0,5
O,n
2,0
Receptor
Azar
Receptor
t,
1,0
0,5
1
3,1
2,1
0,0
0,1
1,2
0,0
0,0
2,2
0,0
1
0,1
0,5
t,
.1,0
1,1
252 /
b,
J UECOS I)IN,vllCOS
30)
0,0
a
O
IJ
0,5
1,1
4,1
3,3.
0,5
Receptor
Azar
Receptor
0,1
Ejercicios / 253
1,
1,2
\:,.'
\.
'.
'.
b
2,0
',',
El socio 1 posee una participacin s en la sociedad, el socio 2 posee 1 - s.' Los socios estn de
acuerdo en jugar el siguiente juego: el socio 1 anuncia un precio para la
sociedad, p, y el soci02 escoge entonces si comprar la participacin de 1
por ps o vender la suya por pO - s). Supongamos que es informacin del
dominio pblico que las valoraciones de los socios de ser propietarios d
toda la sociedad son independientes y se distribuyen uniformemente en.
[0,1], pero que la valoracin deeada socio es informacin privada. Cul
es el equilibrio bayesiano perfecto?
.'
I\'.~J
Ejercicius / 255
254/
INCOMPLETA (e. 4)
4.11 Un comprador y un vendedor tienen valoraciones 'Ve y Vv respectivamente, Es informa,cin del dominio pblico que el intercambio es
rentable (es decir, que Ve > vv), pero la magnitud de esta rentabilidad es
informacin privada de la siguiente manera: la valoracin del vendedor se
distribuye uniformemente en [0,1];la valoracin del comprador Ve = k '1)",
donde k > 1 es informacin del dominio pblico; el vendedor conoce Vv
(y por tanto ve) pero el comprador no conoce Ve (o vv)' Supongamos que
el comprador realiza una nica oferta p que el vendedor acepta o rechaza.
Cul es el equilibrio bayesiano perfecto cuando k < 2? Ycuando k> 2?
(Vase Samuelson 1984.)
..
,,)
4.12 Este problema considera la versin con horizonte infinito del juego
de la negociacin con dos periodos analizado en la seccin 4.3.B. Como
antes, la empresa tieneinformacin privada sobre sus beneficios' (1r),que
estn uniformemente distribuidos en [O,1ro],
y elsindicafo realiza todas las
ofertas salariales y tiene un s~Jariode. rese~.va JJr ":::O. ,l
En el juego candas periodos, la ~npre~Kacepta la, primera oferta del
sindicato (Wl) si 1r'> 71'1,donde el tipo con:beneficlos,.1rl es indiferente
entre (i) aceptar Wl y (ii) rechazar Wl pero aceptar la oferta del sindicato en
el segundo. periodo (W2), y W2 es la oferta ptima del sindicato dado que
los bem~ficiosde la empresa estn uniformemente distribuidos en [O,1rl]
y que slo queda un periodo de negociacin. En cambio, en el juego
con horizonte infinito, W2 ser la oferta ptima del sindicato 4ado que el
beneficio deja emprsaest uniformemente distribuido en [O,1rl]y que
queda un n~er6infi.nito,de periodos de negociacin (potencial). Aunque
el tipo con beneficlos 1rlserotra vezndiferente entre las opciones (i) y
(ii), el cambio en W2 harq~e cambie el vlor de 1rl.
El juego de continuacin que empieza en el segundo periodo del
juego de horizonte infinito es una versin a escala del juego completo:
existe un nmero infinito de periodos de negociacin (potencial), y los
beneficios de la empresa estn otra vez uniformemente distribuidos entre
Oy una cota superior; la nica diferencia es que la cota superior es ahora
1rl en lugar de1ro. Sobel y Takahashi (1983)demuestran que el juego
con horizonte infinito tiene un equilibrio bayesiano perfecto estacionario.
En este equilibrio, si los beneficios de la empresa estn uniformemente
distribuidos entre Oy 1r*,elsindicato realiza una oferta salarial w(7r*) = b1r*,
por lo que la:primera oferta es b1ro, la segunda b1rl' etc. Si el sindicato utiliza
esta estrategia estacionaria, la mejor respuesta de la empresa proporciona
1rl = C7ro,7r2= C7rl,etc., y el valor presente esperado de las ganancias
a la empresa, Wl'
2. La empresa o acepta o rechaza 1JJI' Si acepta, hay produccin en
los dos periodos, por lo que las ganancias son 2WIpara el sindicalo
y 2(1r- Wl) para la empresa. (No hay descuento.) Si la empresa no
acepta 1))1,no hay produccin en el primer periodo, y las ganancias del
primer periodo son cero tanto para la empresa como para el sindicato,
3. Al comienzo del segundo periodo (suponiendo que la empresa rechaz Wl) la empresa realiza una oferta salarial al sindicato, W2. (Al
contrario que en el modelo de Sobel y Takahashi, el sindica to no realiza
la oferta.)
4. El sindicato o acepta o rechaza W2. Si lo acepta hay produccin en
el segundo periodo, con lo que las ganancias del segun<:ioperiodo (y
totales) son W2 para el sindicato y 7r- W2 para la empresa. (Recordemos
que las ganancias del primer periodo fueron cero.) Si el sindicato
rechaza W2 no hay produccin, por lo que el sindicato gana un salario
alternativo Wr en el segundo periodo y la empresa cierra y gana cero.
4.14 Nalebuff (1987) analiza el siguiente modelo de la negociacin previo
a un posible pleito entre un demandante y un demandado. Si el caso
va a juicio, el demandado se ver obligado a pagar al demandante una
cantidad d por daos. Es informacin del dominio pblico que d est
uniformemente distribuida en [0,1] y que slo el demandado conoce el
verdadero valor de d. Ir a juicio le cuesta al demandante C < 1';2, pero
(por simplicidad) no le cuesta nada al demandado.
El desarrollo temporal es el siguiente: (1) El demandante propone
un acuerdo, s. (2) El demandado o acepta el acuerdo (en cuyo caso la
ganancia del demandante es s y la del demandado es -s) o lo rechaza. (3)
INCOMPLETA (e. 4)
Referencias
/ 257
l
"'
..
4.7 Referencias
AUSTEN-SMITH,
D. 1990. "Information Transrnission in Debate." American
oumal
o/ Political
Science 34:124-52.
AxELROO,R. 1981. "The Emergence of Cooperation Among Egoists." American Political Science Review 75:306-18.
BALL!L. 1990. "Tune~Consistent Poliey and Persistent" Changes in lllfl~tion." National Bureau of13conornic Researeh Working Paper #3529
(December).
.
BARRO,R. 1986. "Reputation in a Model ofM~metary Policy with Incomplete Information." oumal o/ Monetary Economics 17:3-20.
BHAITACHARYA;
S. 1979. "Imperfect Information, Dividend Plicy: anc
the 'Bird in the Hand' Fallacy'" Bell oumal of Economics 10:259-70:
.. ,.. ~
CHO, J.-K., y D. KREPS.1987. "Signaling Carnes and Stable Equilibria."
-.'
'.'
'-:.
~
.
CHO, l.-K., y J. SoBEL.1990. "Strategie Stabilit}r and Uniqueness in Signaling Carnes." oumal o/ Economic Theory 50:381-413.
CRAMTON,
E, y J. TRAcy. 1992. "Strikes and Holdouts in Wage Bargainirg:
Theory and Data." American Economic Review 82:100-21.
.':
:-',.
'"
'i,;.
CRAWFORO,
v., y J. SOBEL. 1982. "Strategie Infornation Transrnission."
Econometrica 50:1431-51.
DYBVIG,
E, Y J. ZENOER.1991. "Capital Structure and Dividend Irrelevance
with Asymmetric Information." Review o/ Financial Stlldies 4:201-19.
FARRELL,
L y R. CIBBONS.1991. "Union Voice."Mimeo, Comell University.
FuDENBERG,D., Y J. TIROLE. 1991. "Perfeet Bayesian Equilibrium and
Sequential Equilibrium." oumal o/ Economic Theory 53:236-60.
HARSANYI,
J. 1967. "Carnes with Incornplete Information Played by Bayesian Players, Parts 1, n, and III." Management Science 14:159-82,320-34,
486-502.
RefercI1cil15
I 259
INCOMPLETA (e. 4)
Model of Bargaining,"
87:355-74.
Econometrica
50:863-94.
8:296-332.
1<REPS,
D., P. MILGROM,J. ROBERTS,y R. WILSON. 1982. "Rational Cooperation in the Finitely Repeated Prisioners' Dilernma." Joumal of Economic
Theory 27:245-52.
.
..,
STEIN,J. 1989. "Cheap Talk and the Fed: A Theory of 1mprecise Policy
Announcements." American Ecol1omic Review 79:32-42.
VICKERS,J. 1986. "Signalling in a Model of Monetary Policy with Incol1lplete Information." Oxford Economic Papers 38:443-55.
'
.,
INDICE ANALTICO
.,'
'".'
"\
":'.
NDICE
262 /
NDICE
AN,\J.TICO
/263
ANALT1CO
colusin
en el duopolio de Coumot
dinmico, 101-106
en modelos dinmicos de duopolio,
105-10.
vase tambin repetido, juego
compatibilidad de incentivos, 164-65
competencia internacional, 70
conjeturas.
en conjuntos de informacin con uno
y ms de un elemento, 179
en equilibrio bayesiano
perfecto,181,185
en juegos bayesianos estticos, 148
en refinamientos del equilibrio
bayesiano perfecto, 236-47
vase tambin informacin imperfecta;
informacin incompleta
conjunto deinformacin
con ms de un elemento,l22, 129,
176,178,189
definido, con ejemplos, 222-23
en la definicin deinformacin
imperfectar.121
en la definicin de informacin
perfecta, 121
vase tambin conjeturas; nodo de
decisin; trayectoria de equilibrio;
informacin imperfecta; informacin
incompleta
continuacin, juego de, 176, 235
ejercicios 4.12, 4.14, 254, 256
cooperacin
en el dilema de los presos repetido
infinitainnte con informacin
asimtrica, 227-36
en el modelo de salarios de
eficiencia,l07-108
en juegos repetidos infinitamente,
89-90,101-102,228n6
en juegos repetidos finilamente con
informacin completa, 82-86
vase tambin repetido, juego
correlacionado, equilibrio, 35n 15
correspondencia de mejor respuest~
como funcin de mejor respuesl~,
42-43
definida, 36
de n jug~dores, 47
intersecciones de, 39, 41
representaciones grfic~s de, 35, 38,
42-44
Cournot, A., 2, 11
Coumot, juego de duopoli%ligopolio
de
con informacin asimtrica, 143,
144-146,147,151
con informacin complet~, 15-21,
59-62,75-76,145-146
ejercicio 3.2, 169
ejercicios 1.4-1.6, 48-49
ejercicio 2.15, 176
en juegos repetidos, 101-106
vase tambin juego de duopolio
Cournot, equilibrio de, 60n4
Cr~mton, P., 248
Crawford, V., 177, 214,253
credibilidad en los juegos dinmicos, 53
vase tambin amenazas y promesas
Criterio intuitivo, vase requisito 6 de
sealizacin
lJ~sgupta, P. 48
decisin, teora de In, uni- frenle ~
multi-personal, 61
Deere, D., 169
Diamond, D., 54, 73
dilema de los presos, el
cooperacin en, 89-91, 227-236
equilibrio de Nash en, 10
;,.
26-1 / NDICE
en forma extensiva
NDICE
ANALTICO
iterativa de estrategias
definicin de, 5
vase tambin eliminacin iterativa de
estrategias estrictamente dominadas
etapa, juego de
con mltiples equilibrios de Nash,
82-87
de decisiones sucesivas, 109, 111
en el teorema de Friedman, 92
en juegos repetidos infinitamente,
91-92
en juegos repetidos infinitamente
informacin completa, 82
86,
con
ANALTICO
265 .
ejercicio 4.1,249
relacin con juegos en forma
extensiva, 118-19
transcripcin del enunciado informal
de un problema a un, 15-16,21-22,
153, 155
vase tambin forma extensiva, juego
en
Friedrnan, L 15n1, 54, 96,101
Friedman, teorema de, 88
demostracin del, 97, 99-101
enunciado del, 96
frontera, de Pareto, 87 .
Fudenberg, D., 98, 181n3
funcin de mejor respuesta, 35-37,
como correspondencia de mejor
respuesta, 42-43
como estrategia, 125
en el juego de duopolio de Coumot,
17-21,39
en el juego delos aranceles,. 75
funciones de ganancias, en jue~s"
bayesianos estticos"146,1.49
en juegos estticos con informacin
completa, 4
93,
97
Farber, H., 2, 23
farol, en pquer, 30
Farrell, J., 86,120,213,248
Fenlndez,Fl,129
finito,juego: 34,45, 181n1. Vas~ tambin
repetido finita mente, juego
forma extensiva, juego en, 4, 115-117
ejercicios 2.21, 2.22, 138-39
relacin con la forma normal,119
vase tambin nodo de decisin;
conjunto de info,rmacin; forma
nomlal, juego en
forma normal, juego en:
definicin de, par,! ti!' juego con
informacin completa, 3, 4
definicin de, para un juego
esttico con informacin incompleta,
146-150
ejercicios 2.21,2.22, 138-39
ganancia factible, 95
ganancia medio, 96
ganancia de reserva,
97, 98,.
.
ganancias, informacin del dominio~"
pblico sob;e as, 117,143
".
."
,(;"
-266
NDICE ANALTICO
NDICE ANALTICO
en el madela de duapalia de
Caumat, 144-146
en el madela de negaciacin
sucesiva, :221-27
vase tambin infarmacin incampleta;
infarmacin privada
infarmacin campleta, 1, 143, vase
tambin informacin incampleta
informacin campleta y perfecta, juega
can, 55, vase tambin induccin hacia
atrs; repetida, juega; perfecta en ~
subjuegas, equilibrio. d Nash
infarmacin campleta.pero irriperfda,
juega can, 70, 120-121 .
en das etapas, 92, 117 .
vase tainbin infarmaan
impeTf~da; bayesiand prfeCta,
.equillbda; repetida, juega; perfecta
en subjuegas, eijilibria de Nash
infarmacin del daminio pblica, 7
en el juega de dopalia de Caumat
con informacin asimtrica, 144
en juegas can infrmati6n corhpleta
y perfcta; 11i, 143
sabre la racianalidad
de las
jugadares, 7, 56-59
sabre,las fvncianes de ganancias de
las juga49'res, 1
infarmacin il'iperfecta .
definida, 53
en el juega de las aranceles, 73-77
en el juego de las pnicas bancarias,
71-73
en el juega de tameo, 77-80
en juegas repetidas finitamente, 80'87
en juegas repetidas infinitamente,
87-105
juegas dinmicas con; 10
vase tambin infamacin completa
152-55
en las juegas de sealizacin,
185-213,236-47
en un juega esttica, 146-150
vase tambin infarmacin asimtrica;
;.
Jacklin, C. 130
jugadares racianales, 4-7
53nl
en juegas can parla tea, 213-21
en la reinterpretacin del equilibrio.
de Nash can estrategias mixtas, 40,
cama,
I 267
Kakutani, S., 45
228,241,243
KrisllOa, V., 130
2b:i
1 NDICE
NDICE
ANALTICO
en el, 35
equilibrio de Nash con estrategias
mixtas en el, 37-39
eSlra legias mixtas en el, 39
ganan.:ias esperadas en el, 33
siendo ms listo en el, 30
Mont;omery, J., 51
Myers, S., 177, 186,208
l'vIyerson, R., 163, 164, 166, 169
ANALTICO
1269
probabilidad
de que se acabe un juego repetido, 90
distribucin, 24nll
en estrategias mixtas, 31
funcin de densidad, 23n10
vase tambin regla de Bayes conjetura
problema de teora de juegos, 4
punto fijo, teorema del, 45-47
pura, estrategia:
definicin de, 93, 117
ejercicio 2.18, 138
ejercicios 3.1, 3.3,169-70
en juegos bayesianos estticos, 151-52
en juegos de sealzacin, 188
en juegos dinmicos con informacin
completa, 93
en juegos repetidos con informacin
completa, 93
vase tambin estrategia; mixta,
"\
estrategia
Pyle, D., 248
racionaldad.sucesiva,
179.
refinamiento
del equilibrio bayesianoperfecto,
177,194,199,202,236,248
del equilibrio de Nash, 84
ejercicio 4.16, 256
regla de Bayes, 149112,180,204n6
renegociacin, 86-86, 11 ...
repetido finitamente, juego:
con informacin completa, 80-87
definicin, 82
dilema de los presos con iriformacin
incompleta, 227-36
renegociacin en un, 86-87
repetido infinitamente, juego: 87-101
definido, 92
estrategia del disparador en, 90
estrategia en, 93
ganancias en 95
subjuego en, 94
vase tambin ganancia media
cooperacin; colusin; factor de
descuento; ganancia factible;
.....
't.a
te::.
NDICE
270 /
';,
.L/
NDICE
~.)
ANM.II(,()
/2'71
ANALTICO
infinitamente, 93
en el dilema de los presos rel,elicio
infinitamente, 94
en el duopolio de Cournot repetid"
infinitamente, 105
en el juego de poltica mone!"ria, n5
en el modelo de salarios de eficiencia,
111
J., 68
'-"#;"
;-~;:C"l
valor prente,
89
Zender,
Facultad
r., 208
U 1'1~,il S IVI
de Cielic;;s EClr1micils
DCANi\TO
I ,fBRO
l.
CO;\lPR,\DO
SE"'JESTRE
2006 1
(;~