Sei sulla pagina 1di 21

Toma de decisiones bajo

incertidumbre
CINTHIA C. PÉREZ, PH.D.
NOVIEMBRE 2017
Criterios de Decisión
 Lotería
 Casino
 Inversiones
Toma de decisiones bajo incertidumbre
 Se decide por una acción
 Existen diferentes estados de la naturaleza, con probabilidad de
ser observados
 Dada la acción y los estados, se recibe un “premio”

State-of-the-world decisión-
making-model
Toma de decisiones bajo incertidumbre
El tomador de decisiones selecciona una acción 𝑎𝑖 , de un set de
acciones posibles 𝐴 = {𝑎1 , 𝑎2 , … , 𝑎𝑘 }
Los posibles estados son observados. Con probabilidad 𝑝𝑗 , el
estado observado es 𝑠𝑗 ∈ 𝑆 = {𝑠1 , 𝑠2 , … , 𝑠𝑛 }
Si la acción 𝑎𝑖 es seleccionada y el estado es 𝑠𝑗 , el tomador de
decisiones recibe la recompense 𝑟𝑖𝑗
El vendedor de periódicos
¿Cuántos periódicos debe comprar el “canillita”
cada día?
Precio de compra 0,20 $/u
Precio de venta 0,25 $/u
Valor al final del día 0

Cada día, existe la misma probabilidad que venda


entre 6 y 10 periódicos

www.guayaquilesmidestino.com
El vendedor de periódicos
Posibles valores de la demanda diaria
◦ 𝑆 = {6,7,8,9,10}

Probabilidades
1
◦ 𝑝6 = 𝑝7 = 𝑝8 = 𝑝9 = 𝑝10 = 5

Acciones que debe tomar el canillita?


◦ 𝐴 = {6,7,8,9,10}
◦ ¿Por qué no menos que 6 o más que 10?

Si se compran 𝑖 periódicos, y se demandan 𝑗. Cómo se define el ¨reward¨?


𝑟𝑖𝑗 = 25𝑖 − 20i = 5i cuando (𝑖 ≤ 𝑗)
𝑟𝑖𝑗 = 25𝑗 − 20i cuando (𝑖 ≥ 𝑗)
Crear tabla de recompensa
Acciones dominantes
Una acción X domina a otra Y si su recompensa es mayor o igual para todo
estado, y existe por lo menos un estado en el que la recompensa de X es
estrictamente mayor que la de Y

Cuáles son las acciones dominadas?


Debemos incluir acciones dominadas en nuestro estudio?
El vendedor de periódicos
Tabla de recompensa. Los valores están en centavos de dólar

Periódicos demandados
Periódicos 6 7 8 9 10
comprados
6 30 30 30 30 30
7 10 35 35 35 35
8 -10 15 40 40 40
9 -30 -5 20 45 45
10 -50 -25 0 25 50
Criterio del pago máximo (Maximin)
Encuentre la mínima recompensa para cada acción. Luego, entre esos,
seleccione la acción con la máxima recompensa.
Este criterio, trata de reducir el impacto negativo del peor resultado posible
¿Cuál es el resultado para el caso del canillita?
Criterio del pago máximo (Maximin)
Continuando con el problema del vendedor de periódicos

Periódicos demandados
Periódicos 6 7 8 9 10
comprados
6 30 30 30 30 30
7 10 35 35 35 35
8 -10 15 40 40 40
9 -30 -5 20 45 45
10 -50 -25 0 25 50

¿Qué ventaja y desventaja observa?


Criterio Maximax
Para cada acción, determine el estado con la mayor recompensa. Seleccione la acción que el
valor más grande.
Continuando con el problema del vendedor de periódicos
Periódicos demandados
Periódicos 6 7 8 9 10
comprados
6 30 30 30 30 30
7 10 35 35 35 35
8 -10 15 40 40 40
9 -30 -5 20 45 45
10 -50 -25 0 25 50
Criterio del mínimo arrepentimiento
 En inglés se conoce como: Minimax regret. Fue desarrollado por
L.J. Savage.
 Utiliza el concepto de costo de oportunidad
 Como lo calcula:
1. Para cada estado de la naturaleza 𝑠𝑗 encuentra la acción 𝑖 ∗𝑗 que maximice 𝑟𝑖𝑗
2. Calcule el valor de la oportunidad perdida o “regret” 𝑟𝑖 ∗𝑗 ,𝑗 − 𝑟𝑖𝑗
3. Aplique el criterio minimax para la tabla del costo de oportunidad
Criterio del mínimo arrepentimiento
Continuando con el problema del vendedor de periódicos

Periódicos demandados
Periódicos 6 7 8 9 10
comprados
6 30-30=0 35-30=5 40-30=10 45-30=15 50-30=20
7 30-10=20 0 5 10 15
8 30+10=40 20 0 5 10
9 30+30=60 40 20 0 5
10 30+50=80 60 40 20 0
Intenta disminuir el nivel de decepción
Regla de decisión de Bayes
Usando las mejores estimaciones disponibles de las probabilidades
de cada estado de la naturaleza, se calcula el valor esperado de la
recompensa de cada acción posible

En resumen, se selecciona la acción con el valor más grande de recompensa


esperada
Regla de decisión de Bayes
Continuando con el problema del vendedor de periódicos
Periódicos Recompensa esperada
comprados
6 (1/5)*(30+30+30+30+30)=30
7 (1/5)*(15+35+35+35+35)=30
8 (1/5)*(-10+15+40+40+40)=25
9 (1/5)*(-30-5+20+45+45)=15
10 (1/5)*(-50-25+0+25+50)= 0

Observaciones:
 Incluye toda la información disponible
 Validez de las probabilidades
Criterio de la máxima posibilidad
Identifique el estado con la mayor probabilidad de ocurrencia. Para ese estado, seleccione la acción con el
máximo pago.
Periódicos demandados
Ejemplo canillita: Periódicos 6 7 8 9 10
comprados
6 30 30 30 30 30
7 10 35 35 35 35
8 -10 15 40 40 40
9 -30 -5 20 45 45
10 -50 -25 0 25 50

Desventajas:
-No es muy útil cuando las diferencias entre las probabilidades de los estados son pequeñas
-Solo se enfoca en estados de alta probabilidad, sin importar el pago de los otros estados
Explotación de petróleo
Una compañía petrolera nacional posee un terreno, en donde según un consultor, existe la
posibilidad de 1 entre 4 de obtener petróleo.
Otra compañía extranjera está interesada en el terreno y le ha ofrecido $90,000. Sin embargo, la
compañía nacional ha pensado en perforar, a un costo de $100,000. Si encuentra petróleo, el
ingreso será de $800,000.
Utilizando diferentes criterios, ¿Qué decisión debería utilizar la compañía?
Análisis de sensibilidad
 La suma de las dos probabilidades debe ser 1
 Asuma que la empresa ha detectado que la probabilidad de encontrar petróleo está entre 15%
y 35%.
 Por lo tanto, la probabilidad de no encontrar petróleo está entre 0.85 y 0.65
 ¿Qué sucede en el límite inferior? Encontrar valor esperado de la recompensa
 ¿Qué sucede en el límite superior? Encontrar valor esperado de la recompensa
Selección de campaña publicitaria
Sweet and Coffee y Juan Valdez son dos cafeterías que compiten por el mismo mercado. Las dos
deben decidir si lanzar un campaña de publicidad pequeña, media o grande. S&C estima que JV
tiene la misma probabilidad de lanzar una campaña de cualquiera de los tres tamaños. La
siguiente tabla muestra la utilidad de S&C para cada posible acción de las dos cafeterías. Utilice
los cinco criterios de decisión aprendidos para determinar la estrategia de campaña de S&C.
ESTADOS
ONES
Campaña de Juan Valdez
Campaña de S&C Pequeña Mediana Grande
Pequeña $6,000 $5,000 $2,000
Mediana $5,000 $6,000 $1,000
Grande $9,000 $6,000 $0
Definición de precios
Una vez terminada la campaña, S&C y JV deben determinar los
precios de sus productos. Particularmente, S&C desea
determinar el precio de su sánduche de jamón premium. S&C
estima que el precio del mismo producto en JV es una variable
aleatoria D, que tiene la siguiente función de probabilidad:
P(D=$6)=0.25, P(D=$8)=0.50, P(D=$10)=0.25.
Si S&C cobra un precio de 𝑝1 y JV cobra 𝑝2 , S&C venderá 100 +
25(𝑝2 − 𝑝1 ) sánduches. El costo del sánduche para S&C es de
$4.
S&C está considerando cobrar $5, $6, $7, $8 o $9 por sánduche.
Utilice todos los criterios de decision aprendidos para
determiner cuánto debería cobrar S&C.
Referencias
Winston, Wayne. ¨Operations Research: Applications and Algorithms¨. 4th edition. 2003
Hillier, F., and G. Lieberman. "Investigación de Operaciones. 7 Edición. Ed." (2002)

Potrebbero piacerti anche