Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Introducción
Toma de decisiones
Bibliografía
2
En el desarrollo del curso de investigación de operaciones II hemos
incursionado en la introducción a los principios de optimización de redes,
abordando algunos de los problemas típicos que se pueden resolver
mediante los diferentes algoritmos, relacionado y aplicando los mismos
a la solución de problemas específicos de estas áreas. Este segundo
referente del curso, sobre Principios de programación dinámica y análisis
de decisión, trata inicialmente algunos fundamentos de la
programación dinámica, una rama de la investigación de operaciones
que cuenta con procedimientos matemáticos útiles en el soporte de la
toma de decisiones secuenciales relacionadas. Vale destacar que uno de
los aspectos que diferencia otras ramas de la investigación de
operaciones, como la programación lineal, es que en programación
dinámica no hay un modelo matemático genérico para todos los
problemas que con ella se puede resolver, las situaciones particulares y
la deducción del respectivo modelo está fuertemente atada a la
capacidad de interpretar correctamente la situación y a partir de ahí
emprender la aplicación de estrategias de solución.
3
Introducción a la
programación dinámica
4
En el primer referente del curso Investigación de operaciones I señalamos
que la Programación Dinámica (PD) es una de las ramas de la Investigación
de operaciones, indicamos ahora, más específicamente, que es un conjunto
de procedimientos matemáticos de gran utilidad en el soporte de la toma
de decisiones secuenciales relacionadas. En relación con otros contenidos
de la Investigación de operaciones vale recordar que, por ejemplo, los problemas de
programación lineal se caracterizan por obedecer un modelo matemático general, es aquí
donde encontramos uno de los rasgos importantes diferenciadores entre programación
dinámica y programación lineal, en programación dinámica no se tiene un modelo o
formulación matemática genérica que abarque el conjunto de problemas que con ella se puede
resolver, por el contrario, cada problema es abordado con un enfoque general en el que las
formulaciones matemáticas se derivan de las situaciones particulares del problema específico y
la deducción del modelo matemático, a la que se le pueda aplicar las técnicas de programación
dinámica, está fuertemente atada a la capacidad de interpretar correctamente la situación y a
partir de ahí emprender la aplicación de estrategias de solución. En esta parte inicial del segundo
referente nos dedicamos a abordar algunos de los elementos que tienen que ver con la
Programación Dinámica, por lo que se considera conveniente presentar un conjunto de
situaciones típicas o ejemplos clásicos en los que se aplica las técnicas de la PD, de tal manera
que el estudiante adquiera un conocimiento genérico de la misma. Resaltamos además que la
importancia de estas técnicas, al igual que las de programación lineal y programación lineal
entera, es que en la práctica se usan en la solución de grandes problemas que se resuelven
mediante el uso de algoritmos computacionales basados en estos procedimientos. La
presentación de las técnicas es con fines de ilustración y no con el fin tratar detalladamente el
tema ni que se lleve a las prácticas de ingeniería de manera manual. En la siguiente sección se
presenta un problema del ámbito de la Programación Dinámica, se conoce como el problema
de la diligencia.
El problema de la diligencia
El problema de la diligencia es uno de los problemas típicos dentro del contexto de la
Programación Dinámica, se refiere a la necesidad de un viaje, de un ambicioso hombre, que en
una diligencia debe atravesar territorios expuestos a los peligros de asaltos por parte de
delincuentes.
El hombre parte de una ciudad A y debe llegar a la ciudad J, para lo cual cuenta con diferentes
posibilidades de rutas que cruzan las ciudades B a I. El problema consiste en elegir la mejor ruta
posible en el sentido de seguridad y costo, para ello tiene en cuenta la existencia de pólizas de
seguro, cuyo costo está definido en función del riesgo, (a mayor riesgo mayor costo). Los puntos
origen y destino, los intermedios y costos de las pólizas por etapas entre puntos intermedios se
muestran en la figura 1.
5
Figura 1. Grafo del problema de la diligencia
Fuente: propia
Solución
6
𝑛𝑛 = 𝑁𝑁ú𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑒𝑒𝑒𝑒 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑛𝑛 = 1, 2, 3, 4.
𝑥𝑥𝑛𝑛 = 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑑𝑑𝑑𝑑 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑ó𝑛𝑛 𝑞𝑞𝑞𝑞𝑞𝑞 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 𝑒𝑒𝑒𝑒 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑎𝑎𝑎𝑎 𝑞𝑞𝑞𝑞𝑞𝑞 𝑠𝑠𝑠𝑠 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 𝑎𝑎𝑎𝑎 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑛𝑛.
𝑓𝑓𝑛𝑛 (𝑠𝑠, 𝑥𝑥𝑛𝑛 ) = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔 𝑑𝑑𝑑𝑑 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑ó𝑛𝑛 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑙𝑙𝑙𝑙𝑙𝑙 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑎𝑎𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒
𝑒𝑒𝑒𝑒 𝑢𝑢𝑢𝑢 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑠𝑠 𝑎𝑎𝑎𝑎 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑛𝑛 𝑦𝑦 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 𝑥𝑥𝑛𝑛 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑
𝑥𝑥𝑛𝑛𝑜𝑜 = 𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑑𝑑𝑑𝑑 𝑥𝑥𝑛𝑛 𝑞𝑞𝑞𝑞𝑞𝑞 ℎ𝑎𝑎𝑎𝑎𝑎𝑎 𝑚𝑚í𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑒𝑒𝑒𝑒 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑑𝑑𝑑𝑑 𝑓𝑓𝑛𝑛 (𝑠𝑠, 𝑥𝑥𝑛𝑛 ) 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑢𝑢𝑢𝑢 𝑠𝑠 𝑦𝑦 𝑣𝑣 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑
𝑓𝑓𝑛𝑛𝑜𝑜 (𝑠𝑠) = 𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑚𝑚í𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑑𝑑𝑑𝑑 𝑓𝑓𝑛𝑛 (𝑠𝑠, 𝑥𝑥𝑛𝑛 ) = 𝑓𝑓𝑛𝑛 (𝑠𝑠, 𝑥𝑥𝑛𝑛𝑜𝑜 )
Si además denotamos con 𝐶𝐶𝑝𝑝𝑝𝑝 el costo del enlace que de un nodo 𝑝𝑝 a un nodo inmediato 𝑞𝑞 se
tiene entonces que:
𝑓𝑓𝑛𝑛 (𝑠𝑠, 𝑥𝑥𝑛𝑛 ) = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 ℎ𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑛𝑛 + 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑚𝑚í𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑑𝑑𝑑𝑑 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓
Se puede decir en resumen que la finalidad es hallar 𝑓𝑓4𝑜𝑜 (𝑠𝑠), la mejor opción de recorrido en la
cuarta etapa desde algún nodo 𝑠𝑠 hasta el nodo final, luego, teniendo en cuenta el valor de 𝑓𝑓4𝑜𝑜 (𝑠𝑠),
se debe hallar 𝑓𝑓3𝑜𝑜 (𝑠𝑠), o la mejor opción de recorrido desde algún nodo 𝑠𝑠 hasta algún destino
inmediato, luego hallar 𝑓𝑓2𝑜𝑜 (𝑠𝑠) y finalmente 𝑓𝑓1𝑜𝑜 (𝑠𝑠) = 𝑓𝑓1𝑜𝑜 (𝐴𝐴). Se puede ver que el problema
realmente se resuelve hacia atrás.
Al inicio de la cuarta etapa, cuando al viajero le falta una etapa, la ruta que se completa en esta
etapa depende si se encuentra en el nodo 𝑠𝑠 = 𝐻𝐻 o en 𝑠𝑠 = 𝐼𝐼. Dado que en esta cuarta etapa la
única opción de destino inmediato es el nodo 𝑥𝑥4 = 𝐽𝐽, entonces el tramo de ruta
correspondiente a la cuarta etapa es 𝑠𝑠 → 𝐽𝐽, por lo tanto 𝑓𝑓4𝑜𝑜 (𝑠𝑠) = 𝑓𝑓4 (𝑠𝑠, 𝐽𝐽) = 𝐶𝐶𝑠𝑠𝑠𝑠 . Entonces la
solución correspondiente a la etapa 4 se obtiene de la tabla 1 y las posibles procedencias se
muestran en la figura 1.
7
Cuarta etapa 𝑛𝑛 = 4
𝑠𝑠 𝑓𝑓4𝑜𝑜 (𝑠𝑠) 𝑥𝑥4𝑜𝑜
𝐻𝐻 3 𝐽𝐽
𝐼𝐼 4 𝐽𝐽
Cuando el viajero se dispone a iniciar la tercera etapa (le faltan dos recorridos), podría
encontrarse en los nodos 𝑠𝑠 = 𝐸𝐸, 𝑠𝑠 = 𝐹𝐹, 𝑠𝑠 = 𝐺𝐺, desde cada uno podría ir efectivamente a los
nodos 𝐻𝐻 o 𝐼𝐼. La figura 2 muestra las tres posibilidades de inicio y las respectivas posibilidades
de destino inmediato. Sobre cada línea de enlace entre nodos se muestra el costo inmediato de
ir del nodo inicial de la etapa a los posibles nodos finales, mientras que sobre los nodos finales
de etapa aparece el costo total desde dicho nodo hasta el nodo de destino final 𝑗𝑗, estos últimos
valores son resultado del análisis en la etapa 4 y se muestran en la tabla 1
Fuente: propia
8
La tabla 2 resume los cálculos correspondientes a las diferentes posibilidades. Se propone como
ejercicio de repaso al estudiante verificar los cálculos teniendo en cuenta el grafo de la figura 1
y las definiciones dadas hasta aquí.
Tercera etapa 𝒏𝒏 = 𝟑𝟑
𝑥𝑥3 𝑪𝑪𝒔𝒔𝒙𝒙𝟑𝟑 𝒇𝒇𝟑𝟑 (𝒔𝒔, 𝒙𝒙𝒏𝒏 ) = 𝑪𝑪𝒔𝒔𝒙𝒙𝟑𝟑 + 𝒇𝒇𝒐𝒐𝟒𝟒 ( 𝒙𝒙𝟑𝟑 )
𝑠𝑠 𝒇𝒇𝒐𝒐𝟑𝟑 𝒙𝒙𝒐𝒐𝟑𝟑
𝐻𝐻 𝐼𝐼 𝐻𝐻 𝐼𝐼
𝐸𝐸 1 4 4 8 4 𝐻𝐻
𝐹𝐹 6 3 9 7 7 𝐼𝐼
𝐺𝐺 3 3 6 7 6 𝐻𝐻
Vemos, por ejemplo, que si el viajero se encuentra en el nodo B podría llegar a los nodos E, F y
G incurriendo en costos inmediatos de 7, 4 y 6 respectivamente y los respectivos costos totales
hasta el nodo J serían 7, 4 y 6, valores hallados en la anterior iteración correspondientes a el
9
análisis de la etapa 3. La columna final de la tabla 3 nos deja ver empates en cuanto a los costos
totales desde los nodos B y D si los destinos inmediatos son los nodos E y F. Se propone como
ejercicio de repaso al estudiante verificar y completar los resultados que se resumen en la tabla
3.
Segunda etapa 𝒏𝒏 = 𝟐𝟐
𝑥𝑥2 𝑪𝑪𝒔𝒔𝒙𝒙𝟐𝟐 𝒇𝒇𝟐𝟐 (𝒔𝒔, 𝒙𝒙𝒏𝒏 ) = 𝑪𝑪𝒔𝒔𝒙𝒙𝟐𝟐 + 𝒇𝒇𝒐𝒐𝟑𝟑 ( 𝒙𝒙𝟐𝟐 )
𝒇𝒇𝒐𝒐𝟐𝟐 𝒙𝒙𝒐𝒐𝟑𝟑
𝐸𝐸 𝐹𝐹 𝐺𝐺 𝐸𝐸 𝐹𝐹 𝐺𝐺
𝑠𝑠
𝐵𝐵 7 4 6 11 11 12 11 𝐸𝐸 𝑜𝑜 𝐹𝐹
𝐶𝐶 3 2 4 7 9 10 7 𝐸𝐸
𝐷𝐷 4 1 5 8 8 11 8 𝐸𝐸 𝑜𝑜 𝐹𝐹
Tabla 3. Resultados del análisis de la segunda etapa
Fuente: propia
10
Primera etapa 𝒏𝒏 = 𝟏𝟏
𝑥𝑥1 𝑪𝑪𝒔𝒔𝒙𝒙𝟏𝟏 𝒇𝒇𝟏𝟏 (𝒔𝒔, 𝒙𝒙𝟏𝟏 ) = 𝑪𝑪𝒔𝒔𝒙𝒙𝟏𝟏 + 𝒇𝒇𝒐𝒐𝟐𝟐 ( 𝒙𝒙𝟏𝟏 )
𝒇𝒇𝒐𝒐𝟐𝟐 𝒙𝒙𝒐𝒐𝟏𝟏
𝑠𝑠 𝐵𝐵 𝐶𝐶 𝐷𝐷 𝐵𝐵 𝐶𝐶 𝐷𝐷
𝐵𝐵 2 4 3 13 11 11 11 𝐶𝐶 𝑜𝑜 𝐷𝐷
El conjunto de resultados hallados hasta ahora nos brinda el camino para hallar la mejor
solución. En la primera etapa de viaje la mejor opción es llegar al nodo 𝐶𝐶 o al 𝐷𝐷, si el destino
seleccionado es 𝐶𝐶, en la segunda etapa se debe seleccionar el nodo 𝐸𝐸 como destino inmediato.
Al partir de 𝐸𝐸, en la tercera etapa, la mejor opción es llegar al nodo 𝐻𝐻 y en la etapa final se llega
de H a J, en este caso la mejor ruta es 𝐴𝐴 → 𝐶𝐶 → 𝐸𝐸 → 𝐻𝐻 → 𝐽𝐽. El estudiante puede verificar que,
si en la primera etapa se escoge el nodo D como destino inmediato, se obtiene otras dos rutas
posibles, 𝐴𝐴 → 𝐷𝐷 → 𝐹𝐹 → 𝐼𝐼 → 𝐽𝐽, las tres rutas óptimas tienen costo de 11, se puede elegir
cualquiera de ellas.
11
Generalidades de problemas de programación dinámica
El estudio del problema de la diligencia constituye una situación concreta que permite un
acercamiento a la comprensión de las generalidades de problemas de programación dinámica,
lo que indica que, si un problema es análogo al problema de la diligencia, entonces se puede
modelar como un problema de programación dinámica. Las generalidades de un problema de
programación dinámica son las siguientes.
El problema completo se subdivide en varias etapas, en cada una de las cuales se debe
tomar la mejor decisión asociada con ella y relacionada con las de las otras etapas.
Las etapas en que se subdivide el problema están asociadas con diferentes estados
posibles.
La toma de decisiones en cada etapa da lugar a la asociación del estado actual con el
estado inicial de la etapa siguiente.
El objetivo es hallar una solución o política óptima del problema en su totalidad, lo que
está amarrado a la política de decisión de cada una de las etapas.
Para un estado actual, la política óptima para las etapas que faltan no depende de la
política de etapas anteriores.
El proceso de solución inicia hallando la solución óptima a acogerse en la última etapa.
Se hace uso de la recursividad con el fin de hallar la mejor solución de la etapa n a partir
de la solución óptima de la etapa n+1. La relación de recursividad hace uso de los
siguientes elementos:
𝑁𝑁 = 𝑛𝑛ú𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝑑𝑑𝑑𝑑 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑒𝑒𝑒𝑒 𝑞𝑞𝑞𝑞𝑞𝑞 𝑠𝑠𝑠𝑠 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑒𝑒𝑒𝑒 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝
𝑥𝑥𝑛𝑛 = 𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑑𝑑𝑑𝑑 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑ó𝑛𝑛 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 𝑎𝑎𝑎𝑎 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑑𝑑𝑑𝑑 𝑎𝑎𝑎𝑎 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑛𝑛
𝑓𝑓𝑛𝑛 (𝑠𝑠𝑛𝑛 , 𝑥𝑥𝑛𝑛 ) = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 ℎ𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑛𝑛 + 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑚𝑚í𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑑𝑑𝑑𝑑 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓
𝑓𝑓𝑛𝑛𝑜𝑜 (𝑠𝑠𝑛𝑛 )𝑥𝑥𝑛𝑛 = máx{𝑓𝑓𝑛𝑛 (𝑠𝑠𝑛𝑛 , 𝑥𝑥𝑛𝑛 )} 𝑜𝑜 𝑓𝑓𝑛𝑛𝑜𝑜 (𝑠𝑠𝑛𝑛 )𝑥𝑥𝑛𝑛 = mín{𝑓𝑓𝑛𝑛 (𝑠𝑠𝑛𝑛 , 𝑥𝑥𝑛𝑛 )} 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅ó𝑛𝑛 𝑑𝑑𝑑𝑑 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟
La relación de recurrencia se usa iniciando por la etapa final y se recorre hacia atrás,
encontrando la solución óptima de cada etapa, hasta lograr la solución óptima de la etapa
inicial, con lo cual inmediatamente se obtiene la solución óptima del problema.
12
Ejemplo de aplicación de programación dinámica a asignación de recursos
1 45 20 50
2 70 45 70
3 90 75 80
Fuente: propia
13
La formulación de este problema, en el ámbito de la investigación de operaciones, requiere
fundamentar la toma de decisiones sobre el número de equipos a asignar a los países que se
quiere beneficiar. En términos de programación dinámica, se puede considerar que los tres
países constituyen las etapas y que las variables de decisión 𝑥𝑥𝑛𝑛 (𝑛𝑛 = 1, 2, 3) se asocian con el
número de brigadas que se asigna a cada país.
Teniendo en cuenta que al final de cada etapa la decisión es realizar una asignación de una parte
del recurso disponible a algún país, es claro que al final de cada etapa cambia la cantidad de
recursos por asignar, lo cual constituye el estado del sistema, es decir:
𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑑𝑑𝑑𝑑𝑑𝑑 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 𝑠𝑠𝑛𝑛 = 𝑁𝑁ú𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑚𝑚é𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑝𝑝𝑝𝑝𝑝𝑝 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 (𝑛𝑛 = 1,2,3)
Según esta definición, al inicio de la etapa 1 estamos en el estado 𝑠𝑠1 y la cantidad de equipos
disponibles es 𝑠𝑠1 = 5, si al final de esta etapa se ha asignado una cantidad 𝑥𝑥1 de equipos,
entonces la etapa 2 inicia en el estado 𝑠𝑠2 = 5 − 𝑥𝑥1 , si aquí se asigna una cantidad 𝑥𝑥2 , la etapa 3
inicia en 𝑠𝑠3 = 𝑠𝑠2 − 𝑥𝑥2 . Al final de la etapa 3 se ha debido asignar todos los equipos. En cualquiera
de las etapas intermedias (2 y 3) es posible que el estado del sistema sea cualquiera de los
valores 1, 2, 3, 4 o 5. La figura 5 ilustra estas posibilidades, los enlaces entre nodos de red
corresponden a posibles transiciones de estados entre etapas y los números sobre los enlaces
son los beneficios logrados en la respectiva asignación.
14
Figura 5. Grafo de transiciones entre estados en cada etapa del problema
Fuente: propia
15
La finalidad en la solución del problema es maximizar los beneficios asociados con la asignación
de los cinco equipos de profesionales de la salud. Iniciamos el tratamiento analítico de la
solución denotando mediante 𝑥𝑥𝑗𝑗 la cantidad de equipos médicos asignados al país 𝑗𝑗 y con 𝑝𝑝𝑗𝑗 (𝑥𝑥𝑗𝑗 )
el beneficio obtenido por tal asignación, con esto el problema se traduce entonces en:
3
𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 𝑎𝑎: � 𝑥𝑥𝑗𝑗 = 𝑥𝑥1 + 𝑥𝑥2 + 𝑥𝑥3 = 5, 𝑐𝑐𝑐𝑐𝑐𝑐 𝑙𝑙𝑙𝑙𝑙𝑙 𝑥𝑥𝑗𝑗 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑛𝑛𝑛𝑛 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛.
𝑗𝑗=0
Es decir, el máximo beneficio en la etapa más el máximo beneficio de las etapas posteriores Lo
que se ilustra en la figura 6. Por tanto
𝑜𝑜 (𝑠𝑠
𝑓𝑓𝑛𝑛 (𝑠𝑠𝑛𝑛 , 𝑥𝑥𝑛𝑛 ) = 𝑝𝑝𝑛𝑛 (𝑥𝑥𝑛𝑛 ) + 𝑓𝑓𝑛𝑛+1 𝑛𝑛 − 𝑥𝑥𝑛𝑛 )
𝑜𝑜 (𝑠𝑠
𝑓𝑓𝑛𝑛𝑜𝑜 (𝑠𝑠𝑛𝑛 ) = max {𝑝𝑝𝑛𝑛 (𝑥𝑥𝑛𝑛 ) + 𝑓𝑓𝑛𝑛+1 𝑛𝑛 − 𝑥𝑥𝑛𝑛 )}
𝑥𝑥𝑛𝑛 =0,1,…𝑠𝑠𝑛𝑛
Fuente: propia
16
Al no haber un cuarto país al cual hacerle alguna asignación se puede decir que 𝑓𝑓4𝑜𝑜 = 0,
entonces, por ejemplo, para el caso de la tercera etapa tenemos:
𝑓𝑓3𝑜𝑜 (𝑠𝑠3 ) = max {𝑝𝑝3 (𝑥𝑥3 ) + 𝑓𝑓4𝑜𝑜 (𝑠𝑠𝑛𝑛 , 𝑥𝑥𝑛𝑛 )} = max {𝑝𝑝3 (𝑥𝑥3 ) + 0} = max {𝑝𝑝3 (𝑥𝑥3 )}
𝑥𝑥3 =0,1,…𝑠𝑠3 𝑥𝑥3 =0,1,…𝑠𝑠3 𝑥𝑥3 =0,1,…𝑠𝑠3
0 0 0
1 50 1
2 70 2
3 80 3
4 100 4
5 130 5
Fuente: propia
Siguiendo la idea de recorrido inverso de la etapas, al inicio de la segunda etapa (𝑛𝑛 = 2), la
finalidad es hallar el valor óptimo a asignar al pais 2, es decir, el valor de 𝑥𝑥2𝑜𝑜 y comparar los
diferentes valores de 𝑓𝑓2 (𝑠𝑠2 , 𝑥𝑥2 ) para 𝑥𝑥2 desde 0 hasta la cantidad 𝑠𝑠2 de equipos disponibles para
asignar, la figura 7 ilustra la situación correspondiente al caso en que, en la etapa 2, el estado
del sistema es 𝑠𝑠2 = 2.
17
Figura 7: Posibles transiciones de estado en la etapa 2
Fuente: propia
𝑜𝑜 (𝑠𝑠
𝑓𝑓𝑛𝑛 (𝑠𝑠𝑛𝑛 , 𝑥𝑥𝑛𝑛 ) = 𝑝𝑝𝑛𝑛 (𝑥𝑥𝑛𝑛 ) + 𝑓𝑓𝑛𝑛+1 𝑛𝑛 − 𝑥𝑥𝑛𝑛 )
El valor de 𝑝𝑝2 (𝑥𝑥2 ) se observa en la tabla 3.7 en la columna de beneficios para el país 2, mientras
que el valor de 𝑓𝑓3𝑜𝑜 (2 − 𝑥𝑥2 ) se toma de la tabla óptima de la etapa 3. Entonces:
𝑆𝑆𝑆𝑆 𝑥𝑥2 = 0: 𝑓𝑓2 (2, 𝑥𝑥2 ) = 𝑝𝑝2 (𝑥𝑥2 ) + 𝑓𝑓3𝑜𝑜 (2 − 𝑥𝑥2 ) = 𝑝𝑝2 (0) + 𝑓𝑓3𝑜𝑜 (2) = 0 + 70 = 70
𝑆𝑆𝑆𝑆 𝑥𝑥2 = 1: 𝑓𝑓2 (2,1) = 𝑝𝑝2 (1) + 𝑓𝑓3𝑜𝑜 (2 − 1) = 𝑝𝑝2 (1) + 𝑓𝑓3𝑜𝑜 (1) = 20 + 50 = 70
𝑆𝑆𝑆𝑆 𝑥𝑥2 = 2: 𝑓𝑓2 (2,2) = 𝑝𝑝2 (2) + 𝑓𝑓3𝑜𝑜 (2 − 2) = 𝑝𝑝2 (2) + 𝑓𝑓3𝑜𝑜 (0) = 45 + 0 = 45
18
Frente a la necesidad de maximizar los beneficios se tiene dos posibles valores óptimos para 𝑥𝑥2 ,
estos son 𝑥𝑥2𝑜𝑜 = 0 y 𝑥𝑥2𝑜𝑜 = 1 con un valor óptimo de 70 para 𝑓𝑓2𝑜𝑜 (0). Se propone como ejercicio de
repaso para el estudiante que realice los cálculos que le permitan verificar que la totalidad de
resultados son los que se resumen en la tabla 7.
Fuente: propia
Ahora, en el recorrido de etapas hacia atrás, lo que resta es considerar la primera etapa, esta
inicia con el único estado posible 𝑠𝑠1 = 5, al cual le corresponde la ilustración de la figura 8.
19
Figura 8. Posibles transiciones de estado en la etapa 1
Fuente: propia
El número de equipos médicos que se asigna al país 1 es 𝑥𝑥1 , con lo cual el número de equipos
disponibles al inicio de la etapa 2 es 𝑠𝑠2 = 5 − 𝑥𝑥1 , tenemos entonces que para los valores de 𝑥𝑥1 =
0, 1, 2, 3, 4, 5 se llega respectivamente a los valores de 𝑠𝑠2 = 5, 4, 3, 2, 1, 0. Los cálculos para este
caso son:
𝑜𝑜 (𝑠𝑠
𝑓𝑓𝑛𝑛 (𝑠𝑠𝑛𝑛 , 𝑥𝑥𝑛𝑛 ) = 𝑝𝑝𝑛𝑛 (𝑥𝑥𝑛𝑛 ) + 𝑓𝑓𝑛𝑛+1 𝑛𝑛 − 𝑥𝑥𝑛𝑛 )
20
El valor de 𝑝𝑝1 (𝑥𝑥1 ) se observa en la tabla 8 en la columna de beneficios para el país 1, el valor de
𝑓𝑓2𝑜𝑜 (5 − 𝑥𝑥1 ) se toma de la tabla óptima de la etapa 2. Entonces:
Fuente: propia
Con los cálculos anteriores se concluye que la forma óptima de asignar los cinco equipos de
profesionales médicos a los tres países es 𝑥𝑥1𝑜𝑜 = 1, con lo cual 𝑠𝑠2 = 4, de lo restante se asigna
𝑥𝑥2𝑜𝑜 = 3 al país 2 y por tanto 𝑥𝑥3𝑜𝑜 = 1. Se deja como ejercicio de repaso al estudiante realizar una
interpretación de estos resultados en términos de los beneficios.
21
Quizá como estudiante usted necesite mayores ilustraciones
sobre el uso de los fundamentos de solución de problemas de
programación dinámica, es por esa razón que se le sugiere, a
manera de lectura complementaria, revisar el ejemplo 1.4
Rodríguez, W.
Páginas: 13 - 17
Luego del análisis del ejemplo antes señalado y con el
fin de poner a prueba la apropiación de principios y
conceptos de está temática, recomendamos
desarrollar la actividad de aprendizaje: programación
dinámica.
22
Toma de decisiones
23
Todo lo estudiado en el curso de Investigación de operaciones II y lo que va de Investigación de
operaciones II, ha versado sobre la toma decisiones con fines de optimización, en ello vale la
pena anotar que se cuenta con un razonable grado de certeza
respecto a las consecuencias de tales decisiones, ello porque los
cálculos se basan en formulas o expresiones determinísticas. Sin
embargo, en otras áreas de la gestión, no siempre se tiene la suficiente
información de qué ocurrirá tras una decisión especifica debido a que
los resultados están marcados por una importante dosis de
incertidumbre. Por ejemplo, si una empresa saca al mercado un nuevo
producto de su especialidad, no conoce a ciencia cierta la acogida que
pueda tener por parte de los potenciales compradores, lo cual arroja
incertidumbre sobre la cantidad de unidades que resulta prudente
producir, las pruebas y promociones que debe realizar o las campañas
de publicidad que pueda requerir.
24
𝑪𝑪𝑪𝑪𝑪𝑪𝑪𝑪𝑪𝑪𝑪𝑪𝑪𝑪ó𝒏𝒏 𝒅𝒅𝒅𝒅𝒅𝒅 𝒕𝒕𝒕𝒕𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓
𝑰𝑰𝑰𝑰𝑰𝑰𝑰𝑰𝑰𝑰𝑰𝑰𝑰𝑰
Fuente: propia
Antes de optar por una decisión, la empresa propietaria podría realizar una exploración
consistente en estudios de sismología con el fin de obtener mayor conocimiento sobre las
probabilidades de hallar petróleo, esta posibilidad hace parte del contexto de toma de
decisiones con pruebas o con experimentación.
25
aleatoria asociada con tales estados, tal distribución se conoce como distribución a priori. No se
debe descartar el hecho que la distribución a priori está cargada de subjetividad.
Fuente: propia
Con base en la tabla de pagos se procede ahora al análisis desde la perspectiva de tres criterios
que se describen a continuación.
Ilustramos la aplicación de este principio al caso del ejemplo de la sección 4.2. En la tabla 3 se
ha extendido la tabla 2 para mostrar la selección de valores máximos y mínimos a los que se
refiere el criterio.
26
𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨 𝒅𝒅𝒅𝒅 𝒅𝒅𝒅𝒅𝒅𝒅𝒅𝒅𝒅𝒅𝒅𝒅ó𝒏𝒏 𝑬𝑬𝑬𝑬𝑬𝑬𝑬𝑬𝑬𝑬𝑬𝑬 𝒅𝒅𝒅𝒅 𝒍𝒍𝒍𝒍 𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏
𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽
𝑯𝑯𝑯𝑯𝑯𝑯 𝑵𝑵𝑵𝑵 𝒉𝒉𝒉𝒉𝒉𝒉
𝑴𝑴í𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏
𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑ó𝒍𝒍𝒍𝒍𝒍𝒍 𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑ó𝒍𝒍𝒍𝒍𝒍𝒍
𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃 𝑝𝑝𝑝𝑝𝑝𝑝 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 800.000 −100.000 −100.000
90.000
𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑒𝑒𝑒𝑒 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 90.000 90.000
(𝑀𝑀á𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥)
𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷 𝒂𝒂 𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑 𝟎𝟎, 𝟐𝟐𝟐𝟐 𝟎𝟎, 𝟕𝟕𝟕𝟕
Fuente: propia
Dado que el pago mínimo si se decide vender es mayor que el pago mínimo por realizar
perforaciones por cuenta propia, se elige la acción de vender el terreno. La idea de este criterio
de selección es dar el mejor pago, sin embargo vale anotar que se basa en el pesimismo ya que
elige la mejor opción posible asumiendo que pasa lo peor en cuanto al estado de la naturaleza.
27
𝑃𝑃(𝐸𝐸𝑖𝑖 ∩ 𝐴𝐴)
𝑃𝑃(𝐸𝐸𝑖𝑖 ⁄𝐴𝐴) = 𝑛𝑛
∑𝑖𝑖=1 𝑃𝑃(𝐸𝐸𝑖𝑖 )𝑃𝑃(𝐴𝐴⁄𝐸𝐸𝑖𝑖 )
La aplicación de este criterio toma en cuenta los valores de las probabilidades a priori de mayor
valor, con base en ello calcula el valor esperado del pago que corresponde a cada alternativa de
elección, la alternativa elegida es aquella que presenta el pago con mayor valor esperado
calculado en términos de probabilidad.
Para ilustrar el uso del criterio de decisión de Bayes al ejemplo en estudio, a partir de los datos
registrados en la tabla 3, los correspondientes pagos esperados son:
𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑑𝑑𝑑𝑑 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑝𝑝𝑝𝑝𝑝𝑝 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 = 𝐸𝐸[𝑃𝑃. 𝑃𝑃] = 0.25(800.000) + 0.75(– 100.000)
𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑑𝑑𝑑𝑑 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑝𝑝𝑝𝑝𝑝𝑝 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 = 𝐸𝐸[𝑃𝑃. 𝑉𝑉] = 0.25(90.000) + 0.75(90.000)
28
𝐸𝐸[𝑃𝑃. 𝑃𝑃] = 800.000𝑝𝑝 − 100.000(1 − 𝑝𝑝) = 100.000(9𝑝𝑝 − 1)
29
Figura 9. Análisis de sensibilidad según criterio de Bayes
Fuente: propia
30
Formulación de toma de decisiones con experimentación
Con el fin de disminuir los niveles de incertidumbre, los analista o tomadores de decisiones
usualmente se apoyan en la realización de pruebas que les brindan mejores estimaciones de las
probabilidades de los estados de la naturaleza, los nuevos valores de probabilidad se conocen
como probabilidades a posteriori. Generalmente el desarrollo de pruebas ocasiona cierto costo.
𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸. = 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑖𝑖) = 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃. 𝑎𝑎 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑞𝑞𝑞𝑞𝑞𝑞 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑠𝑠𝑠𝑠𝑠𝑠 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑖𝑖, 𝑖𝑖 = 1, … 𝑛𝑛
𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐 𝑒𝑒𝑒𝑒 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 𝑑𝑑𝑑𝑑𝑑𝑑 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑛𝑛𝑡𝑡𝑡𝑡
= 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃 𝑎𝑎 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑜𝑜𝑜𝑜𝑜𝑜 𝑑𝑑𝑑𝑑 𝑞𝑞𝑞𝑞𝑞𝑞 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑑𝑑𝑑𝑑 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑠𝑠𝑒𝑒𝑎𝑎 𝑖𝑖, 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑞𝑞𝑞𝑞𝑞𝑞 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝑗𝑗, 𝑖𝑖
= 1, … , 𝑛𝑛
El interés aquí radica en que, si se sabe los valores de probabilidades a priori de cada posible
estado de la naturaleza (𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸. = 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑖𝑖)) y las probabilidades condicionales
𝑃𝑃(𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝑗𝑗⁄𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑖𝑖 ), ¿cuál es el valor de la probabilidad condicional
𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸. = 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑖𝑖⁄𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝑗𝑗)?. Para responder a la pregunta acudimos a los
principios básicos de probabilidad que establecen:
𝑛𝑛
31
= 𝑃𝑃(𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝑗𝑗⁄𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑖𝑖 ). 𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸. = 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑖𝑖)
𝐸𝐸𝐸𝐸𝐸𝐸: 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠ó𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔 𝑑𝑑𝑑𝑑 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑜𝑜 𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑑𝑑𝑑𝑑 ℎ𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝ó𝑙𝑙𝑙𝑙𝑙𝑙
𝐸𝐸𝐸𝐸𝐸𝐸: 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠ó𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔 𝑑𝑑𝑑𝑑 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑜𝑜 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑑𝑑𝑑𝑑 ℎ𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝ó𝑙𝑙𝑙𝑙𝑙𝑙
32
𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸⁄𝑆𝑆í ℎ𝑎𝑎𝑎𝑎 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝ó𝑙𝑙𝑙𝑙𝑙𝑙) = 0,6
Aplicando la expresión antes hallada para el resultado 𝐸𝐸𝐸𝐸𝐸𝐸, encontramos que las
probabilidades a posteriori son:
(0,4)(0,25) 1
𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸. = 𝑆𝑆í ℎ𝑎𝑎𝑎𝑎 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝ó𝑙𝑙𝑙𝑙𝑙𝑙⁄𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝐸𝐸𝐸𝐸𝐸𝐸) = =
(0,4)(0,25) + (0,8)(0,75) 7
1 6
𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸. = 𝑁𝑁𝑁𝑁 ℎ𝑎𝑎𝑎𝑎 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝ó𝑙𝑙𝑙𝑙𝑙𝑙⁄𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝐸𝐸𝐸𝐸𝐸𝐸) = 1 − =
7 7
(0,6)(0,25) 1
𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸. = 𝑆𝑆í ℎ𝑎𝑎𝑎𝑎 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝ó𝑙𝑙𝑙𝑙𝑙𝑙⁄𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝐸𝐸𝐸𝐸𝐸𝐸 ) = =
(0,6)(0,25) + (0,2)(0,75) 2
1 1
𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸. = 𝑁𝑁𝑁𝑁 ℎ𝑎𝑎𝑎𝑎 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝ó𝑙𝑙𝑙𝑙𝑜𝑜⁄𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝐸𝐸𝐸𝐸𝐸𝐸 ) = 1 − =
2 2
Con base en estos cálculos podemos usar ahora el criterio de decisión de Bayes, pero
considerando las probabilidades a posteriori y los posibles resultados de estudio sismológico
negativo y positivo, tenemos entonces:
𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑑𝑑𝑑𝑑 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑝𝑝𝑝𝑝𝑝𝑝 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑞𝑞𝑞𝑞𝑞𝑞 𝑒𝑒𝑒𝑒 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 𝑒𝑒𝑒𝑒 𝐸𝐸𝐸𝐸𝐸𝐸
1 6
= 𝐸𝐸[𝑃𝑃. 𝑃𝑃 ⁄𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝐸𝐸𝐸𝐸𝐸𝐸] = (800.000) + (−100.000) − 30.000 = 1.428,57
7 7
𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑒𝑒𝑒𝑒𝑝𝑝𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑑𝑑𝑑𝑑 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑝𝑝𝑝𝑝𝑝𝑝 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑞𝑞𝑞𝑞𝑞𝑞 𝑒𝑒𝑒𝑒 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 𝑒𝑒𝑒𝑒 𝐸𝐸𝐸𝐸𝐸𝐸
33
1 6
= 𝐸𝐸[𝑃𝑃. 𝑃𝑃⁄𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝐸𝐸𝐸𝐸𝐸𝐸] = (90.000) + (90.000) − 30.000 = 60.000
7 7
𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑑𝑑𝑑𝑑 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑝𝑝𝑝𝑝𝑝𝑝 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑞𝑞𝑞𝑞𝑞𝑞 𝑒𝑒𝑒𝑒 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 𝑒𝑒𝑒𝑒 𝐸𝐸𝐸𝐸𝐸𝐸
1 1
= 𝐸𝐸[𝑃𝑃. 𝑃𝑃⁄𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝐸𝐸𝐸𝐸𝐸𝐸 ] = (800.000) + (−100.000) − 30.000
2 2
= 320.000
𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑑𝑑𝑑𝑑 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑝𝑝𝑝𝑝𝑝𝑝 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑞𝑞𝑢𝑢𝑢𝑢 𝑒𝑒𝑒𝑒 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 𝑒𝑒𝑒𝑒 𝐸𝐸𝐸𝐸𝐸𝐸
1 1
= 𝐸𝐸[𝑃𝑃. 𝑃𝑃⁄𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝐸𝐸𝐸𝐸𝐸𝐸] = (90.000) + (90.000) − 30.000 = 60
2 2
Los resultados de estos cálculos se resumen en la tabla 4, en la que se considera una disminución
del pago debido al costo del estudio.
Tabla 12
Fuente: propia
Garriga, F.
Páginas: capitulo 1
34
Diagrama de árbol de decisión
Un diagrama de árbol de decisión, o simplemente árbol de decisión, es una representación
mediante la cual se muestra las diferentes posibilidades asociadas con un problema de decisión.
En muchos casos facilita el desarrollo de los cálculos que apoyaran la elección.
Luego de elaborado el árbol, y con base en los datos numéricos del problema, se procede a
etiquetar cada línea con los respectivos valores que conducen a los respectivos pagos
dependiendo la decisión asociada con un camino específico. La figura 2 muestra los valores
correspondientes.
Fuente: propia
35
Como último elemento ilustrativo, desde este documento,
invitamos a ver el siguiente video:
Con la introducción dada al diagrama de árbol de decisión estamos llegando al final del presente referente
dentro de este eje articulador. Hemos tratado los fundamentos que subyacen a dos temáticas de suma
importancia, la programación dinámica y el análisis de decisión. Para la real finalización de este eje resta
presentar la actividad evaluativa, pero antes de enfrentarse a la evaluación correspondiente,
recomendamos que cada estudiante desarrolle la actividad de aprendizaje sobre conceptos y principios de
solución de análisis de decisión.
36
Bronson, R. (s.f.). Operation Research. Segunda Edición. Editorial Mc Graw Hill.
Videos
Castro, E. [Emily Castro]. (2008, noviembre 19). Programación Dinámica -
Investigación Operativa I [Archivo de video]. Recuperado de http:
https://youtu.be/DoCAJjEQjT0
37