Sei sulla pagina 1di 5

EL MODELO HALCN-PALOMA

En el lenguaje ordinario entendemos por "halcn" a los polticos partidarios de


estrategias ms agresivas mientras que identificamos como "paloma" a los ms
pacifistas. El modelo Halcn-Paloma sirve para analizar situaciones de conflicto entre
estrategias agresivas y conciliadoras.

HALCN-PALOMA:
MATRIZ DE PAGOS

Jugador Y

Paloma

Halcn

Paloma

2,2

3,1*

Halcn

1,3*

4,4

Jugador X

Obsrvense las sutiles pero importantes diferencias de este modelo con el Dilema del
Prisionero. En principio la matriz es muy parecida, simplemente se han trocado las
posiciones de los pagos 3 y 4, pero la solucin y el anlisis son ahora muy diferentes.
Hay aqu dos resultados que son equilibrios de Nash: cuando las estrategias elegidas
por cada jugador son diferentes; en la matriz aqu representada esas soluciones estn
marcadas con un asterisco. Comprubese, por el contrario, que en el Dilema del
Prisionero el equilibrio de Nash est en el punto en que ambos jugadores traicionan.
Otra notable diferencia de este juego con otros es la importancia que aqu adquiere el
orden en que los jugadores eligen sus estrategias. Como tantas veces en la vida real, el
primero que juega, gana. El primero elegir y manifestar la estrategia Halcn con lo
que el segundo en elegir se ver obligado a elegir la estrategia Paloma, la menos mala.
El DILEMA DEL PRISIONERO
El Dilema del Prisionero es un modelo de conflictos muy frecuentes en la sociedad que ha
sido
profundamente
estudiado
por
la
Teora
de
Juegos.
Dos delincuentes son detenidos y encerrados en celdas de aislamiento de forma que no
pueden comunicarse entre ellos. El alguacil sospecha que han participado en el robo del
banco, delito cuya pena es diez aos de crcel, pero no tiene pruebas. Slo tiene
pruebas y puede culparles de un delito menor, tenencia ilcita de armas, cuyo castigo es
de dos aos de crcel. Promete a cada uno de ellos que reducir su condena a la mitad
si proporciona las pruebas para culpar al otro del robo del banco .Las alternativas para
cada prisionero pueden representarse en forma de matriz de pagos. La estrategia
"lealtad" consiste en permanecer en silencio y no proporcionar pruebas para acusar al
compaero. Llamaremos "traicin" a la estrategia alternativa.
Dilema del prisionero -Matriz de Pagos(aos
de crcel)

Preso X

lealtad
traicin

Preso Y
lealtad
traicin
2\2
10 \ 1
1 \ 10
5\5

Los pagos a la izquierda o a la derecha de la barra indican los aos de crcel a


los que es condenado el preso X o Y respectivamente segn las estrategias
que hayan elegido cada uno de ellos.En vez de expresar los pagos en aos de

crcel, podramos indicar simplemente el orden de preferencia de cada preso


de los correspondientes resultados, con lo que el modelo pasa a tener
aplicacin ms general.
Dilema del prisionero Matriz de Pagos (orden de preferencias)

Preso Y
lealtad
traicin

Preso X

lealtad
2\2
1\4

traicin
4\1
3 \ 3*

La aplicacin de la estrategia maximn conduce en este juego a un resultado


subptimo. Al no conocer la decisin del otro preso, la estrategia ms segura es
traicionar. Si ambos traicionan, el resultado para ambos es peor que si ambos
hubieran elegido la lealtad. Este resultado es un punto de equilibrio de Nash y
est sealado en la matriz mediante un asterisco.
El dilema del prisionero, tal como lo hemos descrito, es un juego de suma no
nula, bipersonal, biestratgico y simtrico.
LA GUERRA DE LOS SEXOS
El juego de "La guerra de los sexos" es un ejemplo muy sencillo de utilizacin
de modelos de la teora de juegos para analizar un problema frecuente en la
vida cotidiana.
Hay dos jugadores: "L" y "ELLA". Cada uno de ellos puede elegir entre dos
posibles estrategias a las que llamaremos "Ftbol" y "Discoteca".
1
2
3
4

- Supongamos que el orden de preferencias de L es el siguiente:


(lo ms preferido) L y ELLA eligen Ftbol.
L y ELLA eligen Discoteca.
L elige Ftbol y ELLA elige Discoteca.
(lo menos preferido) l elige Discoteca y ELLA elige Ftbol.

Supongamos que el orden de preferencias de ELLA es el


siguiente:
1 (lo ms preferido) L y ELLA eligen Discoteca.
2 L y ELLA eligen Ftbol.
3 L elige Ftbol y ELLA elige Discoteca.
4 (lo menos preferido) l elige Discoteca y ELLA elige Ftbol.
La matriz de pagos es como sigue:

Ftbol
Discoteca

ELLA
Ftbol
Discoteca
1\2
3 \ 3*
4\4
2\1

Los pagos representan el orden de preferencias.


En verde y a la izquierda de la barra, los pagos a L.
En violeta y a la derecha de la barra los pagos a ELLA.

Este juego, tal como lo hemos descrito, es un juego sin repeticin y sin
transferencia de utilidad. Sin repeticin significa que slo se juega una vez por
lo que no es posible tomar decisiones en funcin de la eleccin que haya
hecho el otro jugador en juegos anteriores. Sin transferencia de utilidad
significa que no hay comunicacin previa por lo que no es posible ponerse de
acuerdo, negociar ni acordar pagos secundarios ("Si vienes al ftbol te pago la
entrada").

El problema que se plantea es simplemente un problema de coordinacin. Se


trata de coincidir en la eleccin. Al no haber comunicacin previa, es posible
que el resultado no sea ptimo. Si cada uno de los jugadores elige
su estrategia maximn el pago que recibirn (3\3) es subptimo. Esa solucin,
marcada en la matriz con un asterisco, no es un punto de equilibrio de
Nash ya que los jugadores estn tentados de cambiar su eleccin: cuando
ELLA llegue a la discoteca y observe que L se ha ido al ftbol, sentir el deseo
de cambiar de estrategia para obtener un pago mayor.El modelo que hemos
visto es un juego simtrico ya que jugadores o estrategias son intercambiables
sin que los resultados varen. Podemos introducir una interesante modificacin
en el juego convirtindolo en asimtrico a la vez que nos aproximamos ms al
mundo real. Supongamos que las posiciones 2 y 3 en el orden de
preferencias de L se invierten. L prefiere ir solo al Ftbol ms que ir con
ELLA a la Discoteca. La matriz de pagos queda como sigue:

ELLA
Ftbol Discoteca
Ftbol
2\3
1 \ 2*
Discoteca 4 \ 4
3\1

Si ELLA conoce la matriz de pagos, es decir, las preferencias de L, el


problema de coordinacin desaparece. Est muy claro que L elegir siembre
la estrategia Ftbol, sea cual sea la eleccin de ELLA. Sabiendo esto ELLA
elegir siempre la estrategia Ftbol tambin, ya que prefiere estar con L
aunque sea en el Ftbol que estar sola aunque sea en la Discoteca. La
estrategia maximn de ambos jugadores coincide. El resultado, marcado con
un asterisco, es un ptimo, un punto de silla, una solucin estable, un punto de
equilibrio de Nash. Obsrvese que esta solucin conduce a una situacin
estable de dominacin social del jugador que podramos calificar como el ms
egosta.
LA CAZA DEL CIERVO
Es un juego que describe un conflicto entre seguridad y cooperacin social.
Jean-Jacques Rousseau describi una situacin en la que dos individuos van a
cazar. Cada uno elige cazar un ciervo o una liebre. Cada jugador debe elegir
una accin sin conocer la del otro. Si un individuo caza un ciervo, debe
cooperar con su compaero para tener xito. Un jugador individual puede
cazar una liebre por s mismo, pero una liebre vale menos que un ciervo. Esta
situacin se considera una analoga importante con la cooperacin social.
Nos servir para afianzar los conceptos de equilibrio de Nash y estrategia
dominante, y adems para introducir un concepto nuevo: la suma cero.
El juego dice algo as: tenemos dos lobos, Rmulo y Remo, que pueden decidir
ir a cazar un Conejo o cooperar para cazar un Ciervo. Si uno de ellos decide
cazar un Conejo, come. No es que se pegue un festn, pero vaya, come.
Si ambos deciden ir juntos a cazar un Ciervo, ambos se pegan un festn de la
leche. No solo comen, sino que adems se ponen las botas, y pueden dedicar
las energas sobrantes a, por ejemplo, la reproduccin.
Pero si uno de ellos decide ir a por el Ciervo, y el otro va a por el Conejo, el que
decidi ir a por el Ciervo se queda sin nada, porque l solo no es capaz de

cazarlo (no obstante, su amigo, que se fue a por el Conejo, s come).


Podemos representar esto segn la siguiente matriz de pagos (primero
ponemos la recompensa de Rmulo y luego la de Remo):
Remo

Rmulo

Ciervo

Conejo

Ciervo

4,4

0,3

Conejo

3,0

3,3

Representamos con un 3 el hecho de que comen, con 4 el hecho de que no


solamente comen, sino que se pegan un festn, y con 0 el hecho de que se
quedan con el estmago vaco.
Existe una estrategia dominante para alguno de los jugadores? Recordemos
cmo se buscaba: para cada una de las posibles decisiones del otro jugador,
elegamos nuestra mejor opcin. Si en todos los casos es la misma eleccin,
eso es una estrategia dominante.
Pues no, en este caso no existe estrategia dominante.

Si Remo elige Ciervo, la mejor eleccin de Rmulo es Ciervo. Pero si Remo


elige Conejo, la mejor eleccin de Rmulo es Conejo. Es decir, Rmulo no tiene
una estrategia dominante (ni tampoco Remo, pues su situacin es la misma).
Existe algn equilibrio de Nash? S, existen dos equilibrios de Nash: CiervoCiervo y Conejo-Conejo.

Si ambos eligieron Conejo, el que cambie su eleccin a Ciervo se queda


sin nada, as que no est tentado de cambiar. Luego Conejo-Conejo es
un equilibrio de Nash.

Si ambos eligieron Ciervo, el que cambie su eleccin a Conejo pasa de


cobrar 4 a cobrar 3, as que no le interesa hacerlo. Luego Ciervo-Ciervo
es un equilibrio de Nash.

Si uno elige Conejo y otro Ciervo, cualquiera de los dos cambios


beneficia a alguien. Si el que eligi Conejo cambia a Ciervo, pasa de
ganar 3 a ganar 4. As que est tentado de cambiar. Y el que eligi
Ciervo, que actualmente gana 0, tambin sale beneficiado (pasando a
ganar 3) si cambia a Conejo. Luego Conejo-Ciervo y Ciervo-Conejo no
son equilibrios de Nash.

Aunque a algunos les parecer obvio, debemos darnos cuenta de que las
situaciones no son las mismas que en el dilema del prisionero, porque la
matriz no es exactamente igual, aunque sea parecida. Tomando una matriz de
pagos genrica como la siguiente:
Jugador 2

Jugador 1

Alfa

Beta

Alfa

a,a

c,b

Beta

b,c

d,d

Generalmente se supone que estamos en un juego como la caza del ciervo si


se cumple la relacin a>b>=d>c (en nuestro juego, 4>3>=3>0), pero
estamos en uno como eldilema del prisionero si se cumple la relacin
c>d>a>b (en nuestro ejemplo, 0>-1>-6>-10).[1] Como estamos considerando
solo estrategias puras, los valores exactos de los nmeros no afectan, pero si
estudiramos estrategias mixtas, que veremos ms adelante, entonces no solo
la relacin es importante, sino tambin su valor exacto. Y tambin son
importantes para saber si el juego es de suma cero o no.

Potrebbero piacerti anche