Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
1. Cadenas de Markov
1.1. Población, adaptado de Winston 2005, basado en Babich (1992)
La probabilidad de que un colombiano muera en función de su edad está dada en la tabla 1. Por ejemplo un
individuo de un año tiene una probabilidad de 0.000383 de morir antes de alcanzar su segundo año. Suponga que
cada año nacen 662883 niños y nadie sobrevive por encima de los 110 años de edad.
1
2. Procesos Markovianos de decisión (MDP)
2.1. Financiamiento (Winston, 2005)
Priceler Auto Corporación debe determinar si debe o no dar a los consumidores 8 % o 11 % de financiamiento en
los coches nuevos. Si Priceler da financiación de 8 % durante el mes en curso, la distribución de probabilidad de las
ventas durante el mes en curso será como se muestra en la Tabla 7. Si Priceler da la financiación del 11 % durante
el mes en curso, la distribución de probabilidad de las ventas durante el mes en curso será como se muestra en la
Tabla 8. Buenas ventas representan 400.000 ventas por mes, las malas ventas representan 300.000 ventas por mes.
Por ejemplo, si las ventas del mes pasado eran malas y Priceler da financiación 8 % durante el mes en curso, existe
la posibilidad de 0,40 de que las ventas de sean buenas durante el mes en curso. En 11 % las tasas de financiación,
Priceler gana $ 1.000 por auto, y en el 8 % de financiamiento, Priceler gana $ 800 por coche. El objetivo de Priceler
es maximizar el beneficio descontado esperado sobre un horizonte infinito (beta = 0,98).
1. Utilice el método de iteración de polı́tica para determinar una polı́tica estacionaria óptima.
2. Utilice la programación lineal para determinar una polı́tica estacionaria óptima.
3. Realice dos iteraciones del método de iteración de valores.
4. Encuentre una polı́tica que maximiza la ganancia media por mes.
2.2. MDP
Una máquina en condición excelente obtiene una ganancia de 100 dólares por semana, una máquina en condición
buena obtiene 70 dólares por semana y una máquina en condición mala obtiene 20 dólares por semana. Al comienzo
de cualquier semana se podrı́a enviar una máquina a reparación a un coste de 90 doláres o cambiarla por una nueva
a un coste de 250. Una máquina enviada a reparación vuelve en condición excelente al comienzo de la siguiente
semana y una nueva llega en estado excelente de manera instantánea. Si no se repara la máquina, la condición de
la máquina evoluciona según la cadena de Markov mostrada en la tabla 2.5.
Siguiente semana
Esta semana Excelente Buena Mala
Excelente 0.7 0.2 0.1
Buena 0.0 0.7 0.3
Mala 0.0 0.1 0.9
2
3. Utilice la iteración de polı́ticas para determinar una polı́tica estacionaria óptima. (Polı́tica estacionaria inicial
y una iteración)