Referente Pensamiento Eje 2 PDF

1
Introducción
Introducción a la programación dinámica
Toma de decisiones
Bibliografía
2
En el desarrollo del curso de investigación de operaciones II hemos
incursionado en la introducción a los principios de optimización de redes,
abordando algunos de los problemas típicos que se pueden resolver
mediante los diferentes algoritmos, relacionado y aplicando los mismos
a la solución de problemas específicos de estas áreas. Este segundo
referente del curso, sobre Principios de programación dinámica y análisis
de decisión, trata inicialmente algunos fundamentos de la
programación dinámica, una rama de la investigación de operaciones
que cuenta con procedimientos matemáticos útiles en el soporte de la
toma de decisiones secuenciales relacionadas. Vale destacar que uno de
los aspectos que diferencia otras ramas de la investigación de
operaciones, como la programación lineal, es que en programación
dinámica no hay un modelo matemático genérico para todos los
problemas que con ella se puede resolver, las situaciones particulares y
la deducción del respectivo modelo está fuertemente atada a la
capacidad de interpretar correctamente la situación y a partir de ahí
emprender la aplicación de estrategias de solución.
Un componente fundamental de este referente, y que en gran medida

da sentido a la pregunta orientadora sobre ¿Cómo afrontar la necesidad
de toma de decisiones en ingeniería a partir de la incertidumbre en los
resultados que se generan? Se refiere precisamente a las nociones
básicas de un área que es denominada análisis de decisión. El desarrollo
inicia con la presentación de un problema relacionado con toma de
decisiones en condiciones de incertidumbre, de donde se desprende su
posterior estudio en el contexto de decisiones sin experimentación,
dentro de lo cual se considera los criterios de solución de pago máximo,
máxima posibilidad y regla de Bayes. Teniendo en cuenta que las
decisiones se basan en los valores de la probabilidad y la posible
subjetividad de sus valores, así, resulta interesante considerar el análisis
de sensibilidad en función de las variaciones en la distribución de las
probabilidades involucradas. Posteriormente se trata los principios de
decisiones apoyados en el desarrollo de pruebas o experimentos para
finalizar este referente con la ilustración de árboles de decisión.
3
Introducción a la
programación dinámica
4
En el primer referente del curso Investigación de operaciones I señalamos
que la Programación Dinámica (PD) es una de las ramas de la Investigación
de operaciones, indicamos ahora, más específicamente, que es un conjunto
de procedimientos matemáticos de gran utilidad en el soporte de la toma
de decisiones secuenciales relacionadas. En relación con otros contenidos
de la Investigación de operaciones vale recordar que, por ejemplo, los problemas de
programación lineal se caracterizan por obedecer un modelo matemático general, es aquí
donde encontramos uno de los rasgos importantes diferenciadores entre programación
dinámica y programación lineal, en programación dinámica no se tiene un modelo o
formulación matemática genérica que abarque el conjunto de problemas que con ella se puede
resolver, por el contrario, cada problema es abordado con un enfoque general en el que las
formulaciones matemáticas se derivan de las situaciones particulares del problema específico y
la deducción del modelo matemático, a la que se le pueda aplicar las técnicas de programación
dinámica, está fuertemente atada a la capacidad de interpretar correctamente la situación y a
partir de ahí emprender la aplicación de estrategias de solución. En esta parte inicial del segundo
referente nos dedicamos a abordar algunos de los elementos que tienen que ver con la
Programación Dinámica, por lo que se considera conveniente presentar un conjunto de
situaciones típicas o ejemplos clásicos en los que se aplica las técnicas de la PD, de tal manera
que el estudiante adquiera un conocimiento genérico de la misma. Resaltamos además que la
importancia de estas técnicas, al igual que las de programación lineal y programación lineal
entera, es que en la práctica se usan en la solución de grandes problemas que se resuelven
mediante el uso de algoritmos computacionales basados en estos procedimientos. La
presentación de las técnicas es con fines de ilustración y no con el fin tratar detalladamente el
tema ni que se lleve a las prácticas de ingeniería de manera manual. En la siguiente sección se
presenta un problema del ámbito de la Programación Dinámica, se conoce como el problema
de la diligencia.
El problema de la diligencia
El problema de la diligencia es uno de los problemas típicos dentro del contexto de la
Programación Dinámica, se refiere a la necesidad de un viaje, de un ambicioso hombre, que en
una diligencia debe atravesar territorios expuestos a los peligros de asaltos por parte de
delincuentes.
El hombre parte de una ciudad A y debe llegar a la ciudad J, para lo cual cuenta con diferentes
posibilidades de rutas que cruzan las ciudades B a I. El problema consiste en elegir la mejor ruta
posible en el sentido de seguridad y costo, para ello tiene en cuenta la existencia de pólizas de
seguro, cuyo costo está definido en función del riesgo, (a mayor riesgo mayor costo). Los puntos
origen y destino, los intermedios y costos de las pólizas por etapas entre puntos intermedios se
muestran en la figura 1.
5
Figura 1. Grafo del problema de la diligencia
Fuente: propia
Solución
Si no se tiene el apoyo de fundamentos de alguna de las áreas de investigación de operaciones,

una de las alternativas a abordar podría ser la de enumarar todas las rutas posibles y sus
respectivos costos, sin embargo en casos de un gran número de nodos intermedios, la cantidad
de rutas a examinar sería excesiva y para efectos de cálculos mediante aplicaciones de software
representaría un costo computacional elevado. Una segunda alternativa sería aquella en la que
desde el punto inicial se tome la etapa de menor costo (porejemplo de A a B) y continuar con
esta política en cada punto intermedio hasta llegar al destino, pero esto realmente no es
eficiente, para ilustrarlo vemos que si se toma, la ruta 𝐴𝐴 → 𝐵𝐵 → 𝐹𝐹 → 𝐼𝐼 → 𝐽𝐽, esta tiene un costo
de 13, mientras que la ruta 𝐴𝐴 → 𝐷𝐷 → 𝐹𝐹 → 𝐼𝐼 → 𝐽𝐽 presenta un costo de 11.
Un enfoque basado en programación dinámica, para resolver el problema de la diligencia,

divide todo el problema en subproblemas más pequeños, inicia por hallar la ruta más económica
para aquel subproblema en que solo falta una etapa para llegar al destino y a partir de la lógica
solución, de ir desde donde se encuentre hasta el destino final, en una nueva iteración, se
propende por hallar la solución óptima para el problema en que falta dos etapas y así, en cada
sucesiva iteración, se agranda en una etapa el recorrido faltante. Para plantear un modelo
matemático de la situación se tiene las siguientes variables.
6
𝑛𝑛 = 𝑁𝑁ú𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑒𝑒𝑒𝑒 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑛𝑛 = 1, 2, 3, 4.
𝑥𝑥𝑛𝑛 = 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑑𝑑𝑑𝑑 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑ó𝑛𝑛 𝑞𝑞𝑞𝑞𝑞𝑞 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 𝑒𝑒𝑒𝑒 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑎𝑎𝑎𝑎 𝑞𝑞𝑞𝑞𝑞𝑞 𝑠𝑠𝑠𝑠 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 𝑎𝑎𝑎𝑎 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑛𝑛.
𝑓𝑓𝑛𝑛 (𝑠𝑠, 𝑥𝑥𝑛𝑛 ) = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔 𝑑𝑑𝑑𝑑 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑ó𝑛𝑛 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑙𝑙𝑙𝑙𝑙𝑙 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑎𝑎𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒
𝑒𝑒𝑒𝑒 𝑢𝑢𝑢𝑢 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑠𝑠 𝑎𝑎𝑎𝑎 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑛𝑛 𝑦𝑦 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 𝑥𝑥𝑛𝑛 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑
𝑥𝑥𝑛𝑛𝑜𝑜 = 𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑑𝑑𝑑𝑑 𝑥𝑥𝑛𝑛 𝑞𝑞𝑞𝑞𝑞𝑞 ℎ𝑎𝑎𝑎𝑎𝑎𝑎 𝑚𝑚í𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑒𝑒𝑒𝑒 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑑𝑑𝑑𝑑 𝑓𝑓𝑛𝑛 (𝑠𝑠, 𝑥𝑥𝑛𝑛 ) 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑢𝑢𝑢𝑢 𝑠𝑠 𝑦𝑦 𝑣𝑣 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑
𝑓𝑓𝑛𝑛𝑜𝑜 (𝑠𝑠) = 𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑚𝑚í𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑑𝑑𝑑𝑑 𝑓𝑓𝑛𝑛 (𝑠𝑠, 𝑥𝑥𝑛𝑛 ) = 𝑓𝑓𝑛𝑛 (𝑠𝑠, 𝑥𝑥𝑛𝑛𝑜𝑜 )
Si además denotamos con 𝐶𝐶𝑝𝑝𝑝𝑝 el costo del enlace que de un nodo 𝑝𝑝 a un nodo inmediato 𝑞𝑞 se
tiene entonces que:
𝑓𝑓𝑛𝑛 (𝑠𝑠, 𝑥𝑥𝑛𝑛 ) = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 ℎ𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑛𝑛 + 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑚𝑚í𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑑𝑑𝑑𝑑 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓
𝑓𝑓𝑛𝑛 (𝑠𝑠, 𝑥𝑥𝑛𝑛 ) = 𝐶𝐶𝑠𝑠𝑥𝑥𝑛𝑛 + 𝑓𝑓𝑛𝑛𝑜𝑜 ( 𝑥𝑥𝑛𝑛 )
Se puede decir en resumen que la finalidad es hallar 𝑓𝑓4𝑜𝑜 (𝑠𝑠), la mejor opción de recorrido en la
cuarta etapa desde algún nodo 𝑠𝑠 hasta el nodo final, luego, teniendo en cuenta el valor de 𝑓𝑓4𝑜𝑜 (𝑠𝑠),
se debe hallar 𝑓𝑓3𝑜𝑜 (𝑠𝑠), o la mejor opción de recorrido desde algún nodo 𝑠𝑠 hasta algún destino
inmediato, luego hallar 𝑓𝑓2𝑜𝑜 (𝑠𝑠) y finalmente 𝑓𝑓1𝑜𝑜 (𝑠𝑠) = 𝑓𝑓1𝑜𝑜 (𝐴𝐴). Se puede ver que el problema
realmente se resuelve hacia atrás.
Primera iteración: Análisis de la cuarta etapa
Al inicio de la cuarta etapa, cuando al viajero le falta una etapa, la ruta que se completa en esta
etapa depende si se encuentra en el nodo 𝑠𝑠 = 𝐻𝐻 o en 𝑠𝑠 = 𝐼𝐼. Dado que en esta cuarta etapa la
única opción de destino inmediato es el nodo 𝑥𝑥4 = 𝐽𝐽, entonces el tramo de ruta
correspondiente a la cuarta etapa es 𝑠𝑠 → 𝐽𝐽, por lo tanto 𝑓𝑓4𝑜𝑜 (𝑠𝑠) = 𝑓𝑓4 (𝑠𝑠, 𝐽𝐽) = 𝐶𝐶𝑠𝑠𝑠𝑠 . Entonces la
solución correspondiente a la etapa 4 se obtiene de la tabla 1 y las posibles procedencias se
muestran en la figura 1.
7
Cuarta etapa 𝑛𝑛 = 4
𝑠𝑠 𝑓𝑓4𝑜𝑜 (𝑠𝑠) 𝑥𝑥4𝑜𝑜
𝐻𝐻 3 𝐽𝐽
𝐼𝐼 4 𝐽𝐽
Tabla 1. Análisis de la cuarta etapa

Fuente: propia
Segunda iteración: análisis de la tercera etapa
Cuando el viajero se dispone a iniciar la tercera etapa (le faltan dos recorridos), podría
encontrarse en los nodos 𝑠𝑠 = 𝐸𝐸, 𝑠𝑠 = 𝐹𝐹, 𝑠𝑠 = 𝐺𝐺, desde cada uno podría ir efectivamente a los
nodos 𝐻𝐻 o 𝐼𝐼. La figura 2 muestra las tres posibilidades de inicio y las respectivas posibilidades
de destino inmediato. Sobre cada línea de enlace entre nodos se muestra el costo inmediato de
ir del nodo inicial de la etapa a los posibles nodos finales, mientras que sobre los nodos finales
de etapa aparece el costo total desde dicho nodo hasta el nodo de destino final 𝑗𝑗, estos últimos
valores son resultado del análisis en la etapa 4 y se muestran en la tabla 1
Figura 2. Alternativas de elección en la etapa 3
Fuente: propia
8
La tabla 2 resume los cálculos correspondientes a las diferentes posibilidades. Se propone como
ejercicio de repaso al estudiante verificar los cálculos teniendo en cuenta el grafo de la figura 1
y las definiciones dadas hasta aquí.
Tercera etapa 𝒏𝒏 = 𝟑𝟑
𝑥𝑥3 𝑪𝑪𝒔𝒔𝒙𝒙𝟑𝟑 𝒇𝒇𝟑𝟑 (𝒔𝒔, 𝒙𝒙𝒏𝒏 ) = 𝑪𝑪𝒔𝒔𝒙𝒙𝟑𝟑 + 𝒇𝒇𝒐𝒐𝟒𝟒 ( 𝒙𝒙𝟑𝟑 )
𝑠𝑠 𝒇𝒇𝒐𝒐𝟑𝟑 𝒙𝒙𝒐𝒐𝟑𝟑
𝐻𝐻 𝐼𝐼 𝐻𝐻 𝐼𝐼
𝐸𝐸 1 4 4 8 4 𝐻𝐻
𝐹𝐹 6 3 9 7 7 𝐼𝐼
𝐺𝐺 3 3 6 7 6 𝐻𝐻
Tabla 2. Resumen de cálculos de la tercera etapa

Fuente: propia
Tercera iteración: análisis de la segunda etapa

Al inicio de la segunda etapa, cuando falta recorrer tres etapas, el viajero se puede encontrar en
los nodos B, C o D, desde cada uno de los cuales podría ir a los nodos E, F, G. la figura 3 muestra
estas tres posibilidades de inicio, las respectivas posibilidades de destino inmediato y los costos
asociados, así como el costo total desde E, F o G hasta el destino final.
Figura 3. Alternativas de decisión en la segunda etapa

Fuente: propia
Vemos, por ejemplo, que si el viajero se encuentra en el nodo B podría llegar a los nodos E, F y
G incurriendo en costos inmediatos de 7, 4 y 6 respectivamente y los respectivos costos totales
hasta el nodo J serían 7, 4 y 6, valores hallados en la anterior iteración correspondientes a el
9
análisis de la etapa 3. La columna final de la tabla 3 nos deja ver empates en cuanto a los costos
totales desde los nodos B y D si los destinos inmediatos son los nodos E y F. Se propone como
ejercicio de repaso al estudiante verificar y completar los resultados que se resumen en la tabla
3.
Segunda etapa 𝒏𝒏 = 𝟐𝟐
𝑥𝑥2 𝑪𝑪𝒔𝒔𝒙𝒙𝟐𝟐 𝒇𝒇𝟐𝟐 (𝒔𝒔, 𝒙𝒙𝒏𝒏 ) = 𝑪𝑪𝒔𝒔𝒙𝒙𝟐𝟐 + 𝒇𝒇𝒐𝒐𝟑𝟑 ( 𝒙𝒙𝟐𝟐 )
𝒇𝒇𝒐𝒐𝟐𝟐 𝒙𝒙𝒐𝒐𝟑𝟑
𝐸𝐸 𝐹𝐹 𝐺𝐺 𝐸𝐸 𝐹𝐹 𝐺𝐺
𝑠𝑠
𝐵𝐵 7 4 6 11 11 12 11 𝐸𝐸 𝑜𝑜 𝐹𝐹
𝐶𝐶 3 2 4 7 9 10 7 𝐸𝐸
𝐷𝐷 4 1 5 8 8 11 8 𝐸𝐸 𝑜𝑜 𝐹𝐹
Tabla 3. Resultados del análisis de la segunda etapa
Fuente: propia
Cuarta iteración: análisis de la primera etapa

Al iniciar la primera etapa, la única posibilidad de inicio es el nodo A y los destinos inmediatos
son los nodos B, C y D. la figura 4 muestra estas posibilidades y los costos asociados, mientras
que la tabla 4 resume los cálculos. Se propone al estudiante como ejercicio de repaso la
verificación de los resultados de la primera etapa tabla 4.
Figura 4. Alternativas de decisión en la primera etapa

Fuente: propia
10
Primera etapa 𝒏𝒏 = 𝟏𝟏
𝑥𝑥1 𝑪𝑪𝒔𝒔𝒙𝒙𝟏𝟏 𝒇𝒇𝟏𝟏 (𝒔𝒔, 𝒙𝒙𝟏𝟏 ) = 𝑪𝑪𝒔𝒔𝒙𝒙𝟏𝟏 + 𝒇𝒇𝒐𝒐𝟐𝟐 ( 𝒙𝒙𝟏𝟏 )
𝒇𝒇𝒐𝒐𝟐𝟐 𝒙𝒙𝒐𝒐𝟏𝟏
𝑠𝑠 𝐵𝐵 𝐶𝐶 𝐷𝐷 𝐵𝐵 𝐶𝐶 𝐷𝐷
𝐵𝐵 2 4 3 13 11 11 11 𝐶𝐶 𝑜𝑜 𝐷𝐷
Tabla 4. Análisis de la primera etapa

Fuente: propia
El conjunto de resultados hallados hasta ahora nos brinda el camino para hallar la mejor
solución. En la primera etapa de viaje la mejor opción es llegar al nodo 𝐶𝐶 o al 𝐷𝐷, si el destino
seleccionado es 𝐶𝐶, en la segunda etapa se debe seleccionar el nodo 𝐸𝐸 como destino inmediato.
Al partir de 𝐸𝐸, en la tercera etapa, la mejor opción es llegar al nodo 𝐻𝐻 y en la etapa final se llega
de H a J, en este caso la mejor ruta es 𝐴𝐴 → 𝐶𝐶 → 𝐸𝐸 → 𝐻𝐻 → 𝐽𝐽. El estudiante puede verificar que,
si en la primera etapa se escoge el nodo D como destino inmediato, se obtiene otras dos rutas
posibles, 𝐴𝐴 → 𝐷𝐷 → 𝐹𝐹 → 𝐼𝐼 → 𝐽𝐽, las tres rutas óptimas tienen costo de 11, se puede elegir
cualquiera de ellas.
11
Generalidades de problemas de programación dinámica
El estudio del problema de la diligencia constituye una situación concreta que permite un
acercamiento a la comprensión de las generalidades de problemas de programación dinámica,
lo que indica que, si un problema es análogo al problema de la diligencia, entonces se puede
modelar como un problema de programación dinámica. Las generalidades de un problema de
programación dinámica son las siguientes.
 El problema completo se subdivide en varias etapas, en cada una de las cuales se debe
tomar la mejor decisión asociada con ella y relacionada con las de las otras etapas.
 Las etapas en que se subdivide el problema están asociadas con diferentes estados
posibles.
 La toma de decisiones en cada etapa da lugar a la asociación del estado actual con el
estado inicial de la etapa siguiente.
 El objetivo es hallar una solución o política óptima del problema en su totalidad, lo que
está amarrado a la política de decisión de cada una de las etapas.
 Para un estado actual, la política óptima para las etapas que faltan no depende de la
política de etapas anteriores.
 El proceso de solución inicia hallando la solución óptima a acogerse en la última etapa.
 Se hace uso de la recursividad con el fin de hallar la mejor solución de la etapa n a partir
de la solución óptima de la etapa n+1. La relación de recursividad hace uso de los
siguientes elementos:
𝑁𝑁 = 𝑛𝑛ú𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝑑𝑑𝑑𝑑 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑒𝑒𝑒𝑒 𝑞𝑞𝑞𝑞𝑞𝑞 𝑠𝑠𝑠𝑠 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑒𝑒𝑒𝑒 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝
𝑛𝑛 = 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑜𝑜 𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐ó𝑛𝑛 𝑒𝑒𝑒𝑒 𝑒𝑒𝑒𝑒 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑑𝑑𝑑𝑑 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠ó𝑛𝑛
𝑠𝑠𝑛𝑛 = 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑎𝑎𝑎𝑎 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑛𝑛
𝑥𝑥𝑛𝑛 = 𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑑𝑑𝑑𝑑 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑ó𝑛𝑛 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 𝑎𝑎𝑎𝑎 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑑𝑑𝑑𝑑 𝑎𝑎𝑎𝑎 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑛𝑛
𝑥𝑥𝑛𝑛𝑜𝑜 = 𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 ó𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑑𝑑𝑑𝑑 𝑥𝑥𝑛𝑛 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑠𝑠𝑛𝑛
𝑓𝑓𝑛𝑛 (𝑠𝑠𝑛𝑛 , 𝑥𝑥𝑛𝑛 ) = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 ℎ𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑛𝑛 + 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑚𝑚í𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑑𝑑𝑑𝑑 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓
𝑓𝑓𝑛𝑛𝑜𝑜 (𝑠𝑠𝑛𝑛 )𝑥𝑥𝑛𝑛 = máx{𝑓𝑓𝑛𝑛 (𝑠𝑠𝑛𝑛 , 𝑥𝑥𝑛𝑛 )} 𝑜𝑜 𝑓𝑓𝑛𝑛𝑜𝑜 (𝑠𝑠𝑛𝑛 )𝑥𝑥𝑛𝑛 = mín{𝑓𝑓𝑛𝑛 (𝑠𝑠𝑛𝑛 , 𝑥𝑥𝑛𝑛 )} 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅ó𝑛𝑛 𝑑𝑑𝑑𝑑 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟
La relación de recurrencia se usa iniciando por la etapa final y se recorre hacia atrás,
encontrando la solución óptima de cada etapa, hasta lograr la solución óptima de la etapa
inicial, con lo cual inmediatamente se obtiene la solución óptima del problema.
12
Ejemplo de aplicación de programación dinámica a asignación de recursos
Una ONG (Organización No Gubernamental), de alcance internacional, dedicada a la

promoción y atención en salud en países en vía de desarrollo, dispone de cinco grupos de
profesionales para prestar atención médica integral. Las directivas de la ONG quieren definir de
qué forma asignar los grupos de profesionales a tres países de tal forma que se logre el mayor
aprovechamiento posible de su capacidad de ayuda. Como los equipos están conformados para
la atención integral, cada uno de ellos se debe asignar como un todo a algún país. (debe ser un
entero). El beneficio logrado por esta labor se mide en la cantidad de años que se adiciona por
persona a la esperanza de vida. Para un país dado, esta medida de desempeño es al producto
del incremento promedio de esperanza de vida y el número de habitantes. La tabla 5 da
medidas de estimaciones del incremento adicional per cápita (en múltiplos de mil) para tales
países, frente a las posibles asignaciones de equipos. ¿Cuál asignación maximiza la medida de
desempeño?
𝐼𝐼 = 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑ñ𝑜𝑜

𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸
𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑃𝑃𝑃𝑃í𝑠𝑠
A B C
0 0 0 0
1 45 20 50
2 70 45 70
3 90 75 80
4 105 110 100
5 120 150 130
Tabla 5. relación entre número de equipos asignados y beneficio obtenido
Fuente: propia
13
La formulación de este problema, en el ámbito de la investigación de operaciones, requiere
fundamentar la toma de decisiones sobre el número de equipos a asignar a los países que se
quiere beneficiar. En términos de programación dinámica, se puede considerar que los tres
países constituyen las etapas y que las variables de decisión 𝑥𝑥𝑛𝑛 (𝑛𝑛 = 1, 2, 3) se asocian con el
número de brigadas que se asigna a cada país.
Teniendo en cuenta que al final de cada etapa la decisión es realizar una asignación de una parte
del recurso disponible a algún país, es claro que al final de cada etapa cambia la cantidad de
recursos por asignar, lo cual constituye el estado del sistema, es decir:
𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑑𝑑𝑑𝑑𝑑𝑑 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 𝑠𝑠𝑛𝑛 = 𝑁𝑁ú𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑚𝑚é𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑝𝑝𝑝𝑝𝑝𝑝 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 (𝑛𝑛 = 1,2,3)
Según esta definición, al inicio de la etapa 1 estamos en el estado 𝑠𝑠1 y la cantidad de equipos
disponibles es 𝑠𝑠1 = 5, si al final de esta etapa se ha asignado una cantidad 𝑥𝑥1 de equipos,
entonces la etapa 2 inicia en el estado 𝑠𝑠2 = 5 − 𝑥𝑥1 , si aquí se asigna una cantidad 𝑥𝑥2 , la etapa 3
inicia en 𝑠𝑠3 = 𝑠𝑠2 − 𝑥𝑥2 . Al final de la etapa 3 se ha debido asignar todos los equipos. En cualquiera
de las etapas intermedias (2 y 3) es posible que el estado del sistema sea cualquiera de los
valores 1, 2, 3, 4 o 5. La figura 5 ilustra estas posibilidades, los enlaces entre nodos de red
corresponden a posibles transiciones de estados entre etapas y los números sobre los enlaces
son los beneficios logrados en la respectiva asignación.
14
Figura 5. Grafo de transiciones entre estados en cada etapa del problema
Fuente: propia
15
La finalidad en la solución del problema es maximizar los beneficios asociados con la asignación
de los cinco equipos de profesionales de la salud. Iniciamos el tratamiento analítico de la
solución denotando mediante 𝑥𝑥𝑗𝑗 la cantidad de equipos médicos asignados al país 𝑗𝑗 y con 𝑝𝑝𝑗𝑗 (𝑥𝑥𝑗𝑗 )
el beneficio obtenido por tal asignación, con esto el problema se traduce entonces en:
3
𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 � 𝑝𝑝𝑗𝑗 �𝑥𝑥𝑗𝑗 � = 𝑝𝑝1 (𝑥𝑥1 ) + 𝑝𝑝1 (𝑥𝑥2 ) + 𝑝𝑝3 (𝑥𝑥3 )

𝑗𝑗=1
𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 𝑎𝑎: � 𝑥𝑥𝑗𝑗 = 𝑥𝑥1 + 𝑥𝑥2 + 𝑥𝑥3 = 5, 𝑐𝑐𝑐𝑐𝑐𝑐 𝑙𝑙𝑙𝑙𝑙𝑙 𝑥𝑥𝑗𝑗 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑛𝑛𝑛𝑛 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛.
𝑗𝑗=0
Atendiendo a la notación tratada en la sección 3.2, encontramos que:

3
𝑓𝑓𝑛𝑛 (𝑠𝑠𝑛𝑛 , 𝑥𝑥𝑛𝑛 ) = 𝑝𝑝𝑛𝑛 (𝑥𝑥𝑛𝑛 ) + 𝑚𝑚á𝑥𝑥 � 𝑝𝑝𝑗𝑗 �𝑥𝑥𝑗𝑗 �

𝑗𝑗=𝑛𝑛+1
𝑓𝑓𝑛𝑛𝑜𝑜 (𝑠𝑠𝑛𝑛 ) = max 𝑓𝑓𝑛𝑛 (𝑠𝑠𝑛𝑛 , 𝑥𝑥𝑛𝑛 )

𝑥𝑥𝑛𝑛 =0,1,…𝑠𝑠𝑛𝑛
Es decir, el máximo beneficio en la etapa más el máximo beneficio de las etapas posteriores Lo
que se ilustra en la figura 6. Por tanto
𝑜𝑜 (𝑠𝑠
𝑓𝑓𝑛𝑛 (𝑠𝑠𝑛𝑛 , 𝑥𝑥𝑛𝑛 ) = 𝑝𝑝𝑛𝑛 (𝑥𝑥𝑛𝑛 ) + 𝑓𝑓𝑛𝑛+1 𝑛𝑛 − 𝑥𝑥𝑛𝑛 )
𝑜𝑜 (𝑠𝑠
𝑓𝑓𝑛𝑛𝑜𝑜 (𝑠𝑠𝑛𝑛 ) = max {𝑝𝑝𝑛𝑛 (𝑥𝑥𝑛𝑛 ) + 𝑓𝑓𝑛𝑛+1 𝑛𝑛 − 𝑥𝑥𝑛𝑛 )}
𝑥𝑥𝑛𝑛 =0,1,…𝑠𝑠𝑛𝑛
Figura 6. Generalización de la base del cálculo de óptima asignación en cada etapa
Fuente: propia
16
Al no haber un cuarto país al cual hacerle alguna asignación se puede decir que 𝑓𝑓4𝑜𝑜 = 0,
entonces, por ejemplo, para el caso de la tercera etapa tenemos:
𝑓𝑓3𝑜𝑜 (𝑠𝑠3 ) = max {𝑝𝑝3 (𝑥𝑥3 ) + 𝑓𝑓4𝑜𝑜 (𝑠𝑠𝑛𝑛 , 𝑥𝑥𝑛𝑛 )} = max {𝑝𝑝3 (𝑥𝑥3 ) + 0} = max {𝑝𝑝3 (𝑥𝑥3 )}
𝑥𝑥3 =0,1,…𝑠𝑠3 𝑥𝑥3 =0,1,…𝑠𝑠3 𝑥𝑥3 =0,1,…𝑠𝑠3
Solución del problema
Si nos encontramos en la etapa 3 el estado del sistema, o número de equipos médicos

disponibles para asignar es 𝑠𝑠3 (cantidad hasta ahora desconocida). En este caso el mayor
beneficio 𝑝𝑝3 (𝑥𝑥3 ) se alcanza automáticamente al asignar en su totalidad los equipos disponibles
al país 3, es decir se toma la decisión de hacer 𝑥𝑥3 = 𝑠𝑠3 , con lo cual 𝑥𝑥3𝑜𝑜 = 𝑠𝑠3 y 𝑝𝑝3 (𝑥𝑥3 ) = 𝑓𝑓3𝑜𝑜 (𝑠𝑠3 ).
La tabla 6 muestra las diferentes posibilidades según los posibles valores de 𝑠𝑠3 .
𝑻𝑻𝑻𝑻𝑻𝑻𝑻𝑻𝑻𝑻𝑻𝑻𝑻𝑻 𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆 (𝒏𝒏 = 𝟑𝟑)

𝑠𝑠3 𝑓𝑓3𝑜𝑜 (𝑠𝑠3 ) 𝑥𝑥3𝑜𝑜
0 0 0
1 50 1
2 70 2
3 80 3
4 100 4
5 130 5
Tabla 6. posibilidades de asignación en la etapa 3 según valores de 𝑠𝑠3
Fuente: propia
Siguiendo la idea de recorrido inverso de la etapas, al inicio de la segunda etapa (𝑛𝑛 = 2), la
finalidad es hallar el valor óptimo a asignar al pais 2, es decir, el valor de 𝑥𝑥2𝑜𝑜 y comparar los
diferentes valores de 𝑓𝑓2 (𝑠𝑠2 , 𝑥𝑥2 ) para 𝑥𝑥2 desde 0 hasta la cantidad 𝑠𝑠2 de equipos disponibles para
asignar, la figura 7 ilustra la situación correspondiente al caso en que, en la etapa 2, el estado
del sistema es 𝑠𝑠2 = 2.
17
Figura 7: Posibles transiciones de estado en la etapa 2
Fuente: propia
Si no se asigna equipos al país 2, es decir, 𝑥𝑥2 = 0, entonces el resultado al inicio de la etapa 3

será 𝑠𝑠2 − 𝑥𝑥2 = 2 − 0 = 2. Si se asigna 1 (𝑥𝑥2 = 1), entonces al inicio de la etapa 3 tendremos
𝑠𝑠2 − 𝑥𝑥1 = 2 − 1 = 1, mientras que, si se asignan los dos disponibles, al iniciar la etapa 3 el
estado será 𝑠𝑠2 − 𝑥𝑥1 = 2 − 2 = 0. Los cálculos para el caso 𝑠𝑠2 − 𝑥𝑥1 = 2 son:
𝑜𝑜 (𝑠𝑠
𝑓𝑓2 (2, 𝑥𝑥2 ) = 𝑝𝑝2 (𝑥𝑥2 ) + 𝑓𝑓3𝑜𝑜 (2 − 𝑥𝑥2 )
El valor de 𝑝𝑝2 (𝑥𝑥2 ) se observa en la tabla 3.7 en la columna de beneficios para el país 2, mientras
que el valor de 𝑓𝑓3𝑜𝑜 (2 − 𝑥𝑥2 ) se toma de la tabla óptima de la etapa 3. Entonces:
𝑆𝑆𝑆𝑆 𝑥𝑥2 = 0: 𝑓𝑓2 (2, 𝑥𝑥2 ) = 𝑝𝑝2 (𝑥𝑥2 ) + 𝑓𝑓3𝑜𝑜 (2 − 𝑥𝑥2 ) = 𝑝𝑝2 (0) + 𝑓𝑓3𝑜𝑜 (2) = 0 + 70 = 70
𝑆𝑆𝑆𝑆 𝑥𝑥2 = 1: 𝑓𝑓2 (2,1) = 𝑝𝑝2 (1) + 𝑓𝑓3𝑜𝑜 (2 − 1) = 𝑝𝑝2 (1) + 𝑓𝑓3𝑜𝑜 (1) = 20 + 50 = 70
𝑆𝑆𝑆𝑆 𝑥𝑥2 = 2: 𝑓𝑓2 (2,2) = 𝑝𝑝2 (2) + 𝑓𝑓3𝑜𝑜 (2 − 2) = 𝑝𝑝2 (2) + 𝑓𝑓3𝑜𝑜 (0) = 45 + 0 = 45
18
Frente a la necesidad de maximizar los beneficios se tiene dos posibles valores óptimos para 𝑥𝑥2 ,
estos son 𝑥𝑥2𝑜𝑜 = 0 y 𝑥𝑥2𝑜𝑜 = 1 con un valor óptimo de 70 para 𝑓𝑓2𝑜𝑜 (0). Se propone como ejercicio de
repaso para el estudiante que realice los cálculos que le permitan verificar que la totalidad de
resultados son los que se resumen en la tabla 7.
𝑺𝑺𝑺𝑺𝑺𝑺𝑺𝑺𝑺𝑺𝑺𝑺𝑺𝑺 𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆 (𝒏𝒏 = 𝟐𝟐)

𝑥𝑥2 𝑓𝑓2 (𝑠𝑠2 , 𝑥𝑥2 ) = 𝑝𝑝2 (𝑥𝑥2 ) + 𝑓𝑓3𝑜𝑜 (𝑠𝑠2 − 𝑥𝑥2 )
𝑠𝑠2 0 1 2 3 4 5 𝒇𝒇𝒐𝒐𝟐𝟐 (𝒔𝒔𝟐𝟐 ) 𝒙𝒙𝒐𝒐𝟐𝟐
0 0 0 0
1 50 20 50 0
2 70 70 45 70 0o1
3 80 90 95 75 95 2
4 100 100 115 125 110 125 3
5 130 120 125 145 160 150 160 4
Tabla 7. Análisis de la etapa 2
Fuente: propia
Ahora, en el recorrido de etapas hacia atrás, lo que resta es considerar la primera etapa, esta
inicia con el único estado posible 𝑠𝑠1 = 5, al cual le corresponde la ilustración de la figura 8.
19
Figura 8. Posibles transiciones de estado en la etapa 1
Fuente: propia
El número de equipos médicos que se asigna al país 1 es 𝑥𝑥1 , con lo cual el número de equipos
disponibles al inicio de la etapa 2 es 𝑠𝑠2 = 5 − 𝑥𝑥1 , tenemos entonces que para los valores de 𝑥𝑥1 =
0, 1, 2, 3, 4, 5 se llega respectivamente a los valores de 𝑠𝑠2 = 5, 4, 3, 2, 1, 0. Los cálculos para este
caso son:
𝑜𝑜 (𝑠𝑠
𝑓𝑓1 (5, 𝑥𝑥1 ) = 𝑝𝑝1 (𝑥𝑥1 ) + 𝑓𝑓2𝑜𝑜 (5 − 𝑥𝑥1 )
20
El valor de 𝑝𝑝1 (𝑥𝑥1 ) se observa en la tabla 8 en la columna de beneficios para el país 1, el valor de
𝑓𝑓2𝑜𝑜 (5 − 𝑥𝑥1 ) se toma de la tabla óptima de la etapa 2. Entonces:
𝑆𝑆𝑆𝑆 𝑥𝑥1 = 0: 𝑓𝑓1 (5,0) = 𝑝𝑝1 (0) + 𝑓𝑓2𝑜𝑜 (5 − 0) = 0 + 160 = 160
𝑆𝑆𝑆𝑆 𝑥𝑥1 = 1: 𝑓𝑓1 (5,1) = 𝑝𝑝1 (1) + 𝑓𝑓2𝑜𝑜 (5 − 1) = 45 + 125 = 170
𝑆𝑆𝑆𝑆 𝑥𝑥1 = 2: 𝑓𝑓1 (5,2) = 𝑝𝑝1 (2) + 𝑓𝑓2𝑜𝑜 (5 − 2) = 70 + 95 = 165
𝑆𝑆𝑆𝑆 𝑥𝑥1 = 3: 𝑓𝑓1 (5,3) = 𝑝𝑝1 (3) + 𝑓𝑓2𝑜𝑜 (5 − 3) = 90 + 70 = 160

𝑆𝑆𝑆𝑆 𝑥𝑥1 = 4: 𝑓𝑓1 (5,4) = 𝑝𝑝1 (4) + 𝑓𝑓2𝑜𝑜 (5 − 4) = 105 + 50 = 155
𝑆𝑆𝑆𝑆 𝑥𝑥1 = 5: 𝑓𝑓1 (5,5) = 𝑝𝑝1 (5) + 𝑓𝑓2𝑜𝑜 (5 − 5) = 120 + 0 = 120
La tabla 8 muestra el resumen de los cálculos.
𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷 𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆 (𝒏𝒏 = 𝟏𝟏)

𝑥𝑥1 𝑓𝑓1 (𝑠𝑠1 , 𝑥𝑥1 ) = 𝑝𝑝1 (𝑥𝑥1 ) + 𝑓𝑓2𝑜𝑜 (𝑠𝑠1 − 𝑥𝑥1 )
𝑠𝑠1 0 1 2 3 4 5 𝒇𝒇𝒐𝒐𝟏𝟏 (𝒔𝒔𝟏𝟏 ) 𝒙𝒙𝒐𝒐𝟏𝟏
5 160 170 165 160 155 120 170 1
Tabla 8. Análisis de la etapa 1
Fuente: propia
Con los cálculos anteriores se concluye que la forma óptima de asignar los cinco equipos de
profesionales médicos a los tres países es 𝑥𝑥1𝑜𝑜 = 1, con lo cual 𝑠𝑠2 = 4, de lo restante se asigna
𝑥𝑥2𝑜𝑜 = 3 al país 2 y por tanto 𝑥𝑥3𝑜𝑜 = 1. Se deja como ejercicio de repaso al estudiante realizar una
interpretación de estos resultados en términos de los beneficios.
21
Quizá como estudiante usted necesite mayores ilustraciones
sobre el uso de los fundamentos de solución de problemas de
programación dinámica, es por esa razón que se le sugiere, a
manera de lectura complementaria, revisar el ejemplo 1.4
Conceptos y ejemplos básicos de programación dinámica
Rodríguez, W.
Recuperado de: https://bit.ly/2vA7zDt
Páginas: 13 - 17
Luego del análisis del ejemplo antes señalado y con el
fin de poner a prueba la apropiación de principios y
conceptos de está temática, recomendamos
desarrollar la actividad de aprendizaje: programación
dinámica.
22
Toma de decisiones
23
Todo lo estudiado en el curso de Investigación de operaciones II y lo que va de Investigación de
operaciones II, ha versado sobre la toma decisiones con fines de optimización, en ello vale la
pena anotar que se cuenta con un razonable grado de certeza
respecto a las consecuencias de tales decisiones, ello porque los
cálculos se basan en formulas o expresiones determinísticas. Sin
embargo, en otras áreas de la gestión, no siempre se tiene la suficiente
información de qué ocurrirá tras una decisión especifica debido a que
los resultados están marcados por una importante dosis de
incertidumbre. Por ejemplo, si una empresa saca al mercado un nuevo
producto de su especialidad, no conoce a ciencia cierta la acogida que
pueda tener por parte de los potenciales compradores, lo cual arroja
incertidumbre sobre la cantidad de unidades que resulta prudente
producir, las pruebas y promociones que debe realizar o las campañas
de publicidad que pueda requerir.
Cuando se habla de análisis de decisiones se habla precisamente del estudio de soluciones a

problemas en los cuales las decisiones a tomar están marcadas por la incertidumbre de sus
resultados. Dentro del ámbito de Investigación de operaciones, el análisis de decisión
constituye el enfoque mediante el cual se busca toma de decisiones apropiadas pese al efecto
probabilístico de sus resultados. Con frecuencia es importante tener presente el tiempo en que
se toma una decisión, es decir si se toma en un momento dado o si es preferible esperar la
realización de otros estudios o pruebas o experimentos que conduzcan a la reducción de la
incertidumbre. La posibilidad de tomar decisiones haciendo o no experimentos da lugar a la
división del análisis de decisión en toma de decisiones con experimentación y sin
experimentación.
Un ejemplo de análisis de decisión

A manera de ejemplo consideremos la siguiente situación en la cual se puede aplicar el análisis
de decisión. Una empresa vinculada a la explotación y aprovechamiento del suelo cuenta entre
sus propiedades con un extenso campo en el que posiblemente haya petróleo. Con base en el
concepto juicioso de expertos en el análisis de suelos y subsuelos se sabe que la probabilidad de
encontrar petróleo en el terreno de 0,25, frente a esto una empresa petrolera plantea una oferta
de compra del terreno por valor de 90.000 dólares, pero en su afán de sacar el mayor provecho
de su propiedad, la empresa propietaria contempla la posibilidad de realizar por sí misma la
explotación. Los costos de perforación son de 100.000 dólares, pero si se encuentra petróleo se
espera que el ingreso sea de 800.000. el interés aquí consiste en saber cuál será la decisión que
brinde el mejor beneficio. En la tabla 1 se resume las cifras asociadas con las posibilidades a
considerar.
24
𝑪𝑪𝑪𝑪𝑪𝑪𝑪𝑪𝑪𝑪𝑪𝑪𝑪𝑪ó𝒏𝒏 𝒅𝒅𝒅𝒅𝒅𝒅 𝒕𝒕𝒕𝒕𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓
𝑰𝑰𝑰𝑰𝑰𝑰𝑰𝑰𝑰𝑰𝑰𝑰𝑰𝑰
𝑯𝑯𝑯𝑯𝑯𝑯 𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑ó𝒍𝒍𝒍𝒍𝒍𝒍 𝑵𝑵𝑵𝑵 𝒉𝒉𝒉𝒉𝒉𝒉 𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑ó𝒍𝒍𝒍𝒍𝒍𝒍

𝑶𝑶𝑶𝑶𝑶𝑶𝑶𝑶ó𝒏𝒏 𝒂𝒂 𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄𝒄
𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃 𝑝𝑝𝑝𝑝𝑝𝑝 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 800.000 −100.000
𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑒𝑒𝑒𝑒 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 90.000 90.000
𝑪𝑪𝑪𝑪𝑪𝑪𝑪𝑪𝑪𝑪 𝒇𝒇𝒇𝒇𝒇𝒇𝒇𝒇𝒇𝒇𝒇𝒇𝒇𝒇𝒇𝒇𝒇𝒇𝒇𝒇 𝟏𝟏 𝒅𝒅𝒅𝒅 𝟒𝟒 𝟑𝟑 𝒅𝒅𝒅𝒅 𝟒𝟒
Tabla 9. Ejemplo de datos básicos para toma de decisiones
Fuente: propia
Antes de optar por una decisión, la empresa propietaria podría realizar una exploración
consistente en estudios de sismología con el fin de obtener mayor conocimiento sobre las
probabilidades de hallar petróleo, esta posibilidad hace parte del contexto de toma de
decisiones con pruebas o con experimentación.
Decisiones sin experimentación

El análisis de decisión, como ya hemos señalado se refiere a la toma de decisiones en
condiciones de incertidumbre debido a diversos factores aleatorios.
En este contexto se entiende por estado de la naturaleza a cada una
de las posibles situaciones en que se encuentre el objeto de estudio al
momento de la toma de la decisión. El analista o encargado de
soportar la toma de decisión tendrá conocimiento de pago que resulta
por cada una de las situaciones posibles que conjuga el estado de la
naturaleza y la elección que se haga, es decir, se define el pago como la cuantificación de las
consecuencias de determinada decisión, esta puede ser una ganancia o alguna otra medida
según el contexto bajo análisis. En caso en que las consecuencias de una decisión no son del
todo ciertas, con todo y que el estado de la naturaleza este determinado, el valor del pago
corresponde a un valor esperado estadístico. Usualmente se dispone de tablas que dan el pago
de cada posible combinación elección-estado de la naturaleza.
Para la toma de decisiones sin experimentación, en lo que se refiere al manejo de la

incertidumbre, el encargado de la toma de decisiones se basa solamente en la información que
pueda disponer sobre la probabilidad de ocurrencia de cada uno de los posibles estados de la
naturaleza, con lo cual se puede establecer la distribución de probabilidad de la variable
25
aleatoria asociada con tales estados, tal distribución se conoce como distribución a priori. No se
debe descartar el hecho que la distribución a priori está cargada de subjetividad.
Formulación de toma de decisiones sin experimentación

En este aparte tomaremos, como base para el análisis, la situación anteriormente, en la cual se
debe decidir qué acción tomar por parte de la empresa propietaria del terreno,
venderlo al oferente o emprender la explotación por su cuenta. Para analizar
el problema a la luz de análisis de decisión sin experimentación tenemos en
cuenta que los estados de la naturaleza corresponden en este caso a que haya
o que no haya petróleo. Las estimaciones sobre las posibilidades 1 de 4 de
hallar petróleo y 3 de 4 de no hallar, se asimilan a la distribución de
probabilidad a priori, en la cual las probabilidades de hallar y no hallar petróleo
son de 0,25 y 0,75 respectivamente. Los valores de ingresos correspondiente a
los pagos. La tabla 2 muestra la tabla de pagos que se obtiene directamente
de la tabla 1.
𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨 𝒅𝒅𝒅𝒅 𝒅𝒅𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆ó𝒏𝒏 𝑬𝑬𝑬𝑬𝑬𝑬𝑬𝑬𝑬𝑬𝑬𝑬 𝒅𝒅𝒅𝒅 𝒍𝒍𝒍𝒍 𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏

𝑯𝑯𝑯𝑯𝑯𝑯 𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑ó𝒍𝒍𝒍𝒍𝒍𝒍 𝑵𝑵𝑵𝑵 𝒉𝒉𝒉𝒉𝒉𝒉 𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑ó𝒍𝒍𝒍𝒍𝒍𝒍
𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃 𝑝𝑝𝑝𝑝𝑝𝑝 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 800.000 −100.000

𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷 𝒂𝒂 𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑 𝟎𝟎, 𝟐𝟐𝟐𝟐 𝟎𝟎, 𝟕𝟕𝟕𝟕
Tabla 10. relación de pagos obtenidos por cada alternativa
Fuente: propia
Con base en la tabla de pagos se procede ahora al análisis desde la perspectiva de tres criterios
que se describen a continuación.
Criterio de solución de pago máximo

Según este criterio, para cada alternativa de elección se debe hallar el mínimo pago que se
debería hacer sobre todos los posibles estados de la naturaleza, después se halla el máximo de
los pagos anteriores, para luego elegir la opción cuyo pago mínimo sea igual a este máximo.
Ilustramos la aplicación de este principio al caso del ejemplo de la sección 4.2. En la tabla 3 se
ha extendido la tabla 2 para mostrar la selección de valores máximos y mínimos a los que se
refiere el criterio.
26
𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨 𝒅𝒅𝒅𝒅 𝒅𝒅𝒅𝒅𝒅𝒅𝒅𝒅𝒅𝒅𝒅𝒅ó𝒏𝒏 𝑬𝑬𝑬𝑬𝑬𝑬𝑬𝑬𝑬𝑬𝑬𝑬 𝒅𝒅𝒅𝒅 𝒍𝒍𝒍𝒍 𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏
𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽
𝑯𝑯𝑯𝑯𝑯𝑯 𝑵𝑵𝑵𝑵 𝒉𝒉𝒉𝒉𝒉𝒉
𝑴𝑴í𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏
𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑ó𝒍𝒍𝒍𝒍𝒍𝒍 𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑ó𝒍𝒍𝒍𝒍𝒍𝒍
𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃 𝑝𝑝𝑝𝑝𝑝𝑝 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 800.000 −100.000 −100.000
90.000
(𝑀𝑀á𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥)
𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷 𝒂𝒂 𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑 𝟎𝟎, 𝟐𝟐𝟐𝟐 𝟎𝟎, 𝟕𝟕𝟕𝟕
Tabla 11. Análisis del criterio del pago máximo
Fuente: propia
Dado que el pago mínimo si se decide vender es mayor que el pago mínimo por realizar
perforaciones por cuenta propia, se elige la acción de vender el terreno. La idea de este criterio
de selección es dar el mejor pago, sin embargo vale anotar que se basa en el pesimismo ya que
elige la mejor opción posible asumiendo que pasa lo peor en cuanto al estado de la naturaleza.
Criterio de máxima posibilidad

El criterio de máxima posibilidad se aplica en función del más probable estado de la naturaleza.
Para tal estado, halla la alternativa a la que le corresponde el mayor pago. En el caso del ejemplo
de la sección 4.2, vemos que la mayor probabilidad corresponde al caso en que en el subsuelo
del terreno no hay petróleo, el mayor pago se da si la decisión es vender el terreno. En la práctica
este criterio puede presentar el inconveniente de ignorar otros datos importantes, por el solo
hecho de basarse en el estado más probable, máxime cuando hay muchos estados posibles y la
probabilidad del estado más probable no es significativamente mayor que la de los demás.
Criterio de decisión de Bayes

El criterio de decisión de Bayes guarda relación con lo que en cálculo de probabilidad se conoce
como regla de Bayes, esta mide la probabilidad de que un evento dado haya sido causado por
la ocurrencia de uno de evento específico de una partición del espacio muestral 𝑆𝑆. La regla
establece que dada una partición 𝐸𝐸1 , 𝐸𝐸2 , … , 𝐸𝐸𝑛𝑛 de 𝑆𝑆 y cualquier otro evento 𝐴𝐴 en 𝑆𝑆, se halla la
probabilidad de cualquiera de los eventos 𝐸𝐸𝑖𝑖 dada la ocurrencia de 𝐴𝐴 mediante:
27
𝑃𝑃(𝐸𝐸𝑖𝑖 ∩ 𝐴𝐴)
𝑃𝑃(𝐸𝐸𝑖𝑖 ⁄𝐴𝐴) = 𝑛𝑛
∑𝑖𝑖=1 𝑃𝑃(𝐸𝐸𝑖𝑖 )𝑃𝑃(𝐴𝐴⁄𝐸𝐸𝑖𝑖 )
La aplicación de este criterio toma en cuenta los valores de las probabilidades a priori de mayor
valor, con base en ello calcula el valor esperado del pago que corresponde a cada alternativa de
elección, la alternativa elegida es aquella que presenta el pago con mayor valor esperado
calculado en términos de probabilidad.
Para ilustrar el uso del criterio de decisión de Bayes al ejemplo en estudio, a partir de los datos
registrados en la tabla 3, los correspondientes pagos esperados son:
𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑑𝑑𝑑𝑑 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑝𝑝𝑝𝑝𝑝𝑝 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 = 𝐸𝐸[𝑃𝑃. 𝑃𝑃] = 0.25(800.000) + 0.75(– 100.000)
𝐸𝐸[𝑃𝑃. 𝑃𝑃] = 200.000 − 75.000 = 125.000
𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑑𝑑𝑑𝑑 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑝𝑝𝑝𝑝𝑝𝑝 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 = 𝐸𝐸[𝑃𝑃. 𝑉𝑉] = 0.25(90.000) + 0.75(90.000)
𝐸𝐸[𝑃𝑃. 𝑃𝑃] = 22.500 + 67.500 = 90.000
Según los cálculos anteriores, la alternativa a seleccionar es la de perforar el terreno en busca

de petróleo. No sorprende que esta alternativa entre en contraposición con las dos anteriores,
ya que en este caso se considera todos los datos asociados con el problema.
Criterio de decisión de Bayes y análisis de sensibilidad

Tal como sucede en programación lineal, en el análisis de decisiones también se realiza análisis
de sensibilidad con el fin de detectar los efectos de variaciones de los parámetros del modelo
sobre la solución hallada. En este caso lo más frecuente es realizar el análisis con base en los
cambios en los valores de las probabilidades a priori, sin que ello descarte otros valores como
los pagos. Por ejemplo, en el caso de la situación base tratado en este referente, podría pensarse
que la probabilidad de hallar petróleo sea un valor comprendido entre 0,15 y
0,35 y por consiguiente la de no encontrar debe estar entre 0,85 y 0,65. En
términos generales tenemos que si 𝑝𝑝 es la probabilidad a priori de hallar
petróleo, entonces el valor esperado del pago está dado por:
28
𝐸𝐸[𝑃𝑃. 𝑃𝑃] = 800.000𝑝𝑝 − 100.000(1 − 𝑝𝑝) = 100.000(9𝑝𝑝 − 1)
A esta expresión corresponde la representación gráfica dada en la Figura 1, en ella identificamos

la probabilidad a priori para la cual el valor esperado del pago por perforar es igual al pago
obtenido si se vende el terreno, es decir un valor de cruce o equilibrio. A la derecha del valor de
equilibrio se tiene la región en la que probabilísticamente es favorable perforar en busca de
petróleo, mientras que a la izquierda se encuentran los valores para los cuales es preferible
vender, es decir, donde es muy poco probable encontrar petróleo. Este análisis se puede
extender a problemas con múltiples alternativas de decisión, pero se tendrá una recta por cada
alternativa.
29
Figura 9. Análisis de sensibilidad según criterio de Bayes
Fuente: propia
30
Formulación de toma de decisiones con experimentación
Con el fin de disminuir los niveles de incertidumbre, los analista o tomadores de decisiones
usualmente se apoyan en la realización de pruebas que les brindan mejores estimaciones de las
probabilidades de los estados de la naturaleza, los nuevos valores de probabilidad se conocen
como probabilidades a posteriori. Generalmente el desarrollo de pruebas ocasiona cierto costo.
En el análisis de decisión con experimentación se considera en general las siguientes

expresiones o variables.
𝑛𝑛 = 𝑁𝑁ú𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑏𝑏𝑏𝑏𝑏𝑏 𝑑𝑑𝑑𝑑 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛.
𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸. = 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑖𝑖) = 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃. 𝑎𝑎 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑞𝑞𝑞𝑞𝑞𝑞 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑠𝑠𝑠𝑠𝑠𝑠 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑖𝑖, 𝑖𝑖 = 1, … 𝑛𝑛
𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐 𝑒𝑒𝑒𝑒 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 𝑑𝑑𝑑𝑑𝑑𝑑 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑛𝑛𝑡𝑡𝑡𝑡
𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝑗𝑗 = 𝑢𝑢𝑢𝑢 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅
𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸. = 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑖𝑖 ⁄𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝑗𝑗)
= 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃 𝑎𝑎 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑜𝑜𝑜𝑜𝑜𝑜 𝑑𝑑𝑑𝑑 𝑞𝑞𝑞𝑞𝑞𝑞 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑑𝑑𝑑𝑑 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑠𝑠𝑒𝑒𝑎𝑎 𝑖𝑖, 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑞𝑞𝑞𝑞𝑞𝑞 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝑗𝑗, 𝑖𝑖
= 1, … , 𝑛𝑛
El interés aquí radica en que, si se sabe los valores de probabilidades a priori de cada posible
estado de la naturaleza (𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸. = 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑖𝑖)) y las probabilidades condicionales
𝑃𝑃(𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝑗𝑗⁄𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑖𝑖 ), ¿cuál es el valor de la probabilidad condicional
𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸. = 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑖𝑖⁄𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝑗𝑗)?. Para responder a la pregunta acudimos a los
principios básicos de probabilidad que establecen:
𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸. = 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑖𝑖 𝑦𝑦 𝑞𝑞𝑞𝑞𝑞𝑞 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝑗𝑗)

𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸. = 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑖𝑖⁄𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝑗𝑗) =
𝑃𝑃(𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝑗𝑗)
𝑛𝑛
𝑃𝑃(𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝑗𝑗) = � 𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸. = 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑘𝑘 𝑦𝑦 𝑞𝑞𝑞𝑞𝑞𝑞 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝑗𝑗)

𝑘𝑘=1
𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸. = 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑖𝑖 𝑦𝑦 𝑞𝑞𝑞𝑞𝑞𝑞 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝑗𝑗)
31
= 𝑃𝑃(𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝑗𝑗⁄𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑖𝑖 ). 𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸. = 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑖𝑖)
De lo anterior se deduce que la probabilidad a posteriori está dada por:
𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸. = 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑖𝑖 ⁄𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝑗𝑗)

𝑃𝑃(𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝑗𝑗⁄𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 = 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑖𝑖 ). 𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸. = 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑖𝑖)
=
∑𝑛𝑛𝑘𝑘=1 𝑃𝑃(𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅= 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝑗𝑗⁄𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 = 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑘𝑘) . 𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸. = 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑘𝑘)
A manera de refuerzo proponemos al estudiante la

visualización el siguiente video.
Análisis de decisión: Toma de decisiones bajo Incertidumbre
Recuperado de: https://youtu.be/K05wvU3fStw
Ejemplo de toma de decisiones con experimentación

Estudiaremos los principios asociadas con la toma de decisiones con experimentación con base
en los datos del problema enunciado en la sección 4.2. Si además de los datos registrados en la
tabla 2, la empresa propietaria del terreno dispone realizar un estudio sismológico, cuyo costo
es de 30.000 dólares. Tal estudio permite obtener datos mas cercanos a las probabilidades de
hallar petróleo. En la realización del estudio se considera lo siguientes resultados:
𝐸𝐸𝐸𝐸𝐸𝐸: 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠ó𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔 𝑑𝑑𝑑𝑑 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑜𝑜 𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑑𝑑𝑑𝑑 ℎ𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝ó𝑙𝑙𝑙𝑙𝑙𝑙
𝐸𝐸𝐸𝐸𝐸𝐸: 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠ó𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔 𝑑𝑑𝑑𝑑 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑜𝑜 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑑𝑑𝑑𝑑 ℎ𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝ó𝑙𝑙𝑙𝑙𝑙𝑙
El desarrollo de los análisis da las siguientes probabilidades condicionales.
𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸⁄𝑆𝑆í 𝑎𝑎𝑎𝑎 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝ó𝑙𝑙𝑙𝑙𝑙𝑙) = 0,4
32
𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸⁄𝑆𝑆í ℎ𝑎𝑎𝑎𝑎 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝ó𝑙𝑙𝑙𝑙𝑙𝑙) = 0,6
𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸⁄𝑁𝑁𝑁𝑁 ℎ𝑎𝑎𝑎𝑎 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝ó𝑙𝑙𝑙𝑙𝑙𝑙) = 0,8
𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸⁄𝑁𝑁𝑁𝑁 ℎ𝑎𝑎𝑎𝑎 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝ó𝑙𝑙𝑙𝑙𝑙𝑙) = 0,2
Aplicando la expresión antes hallada para el resultado 𝐸𝐸𝐸𝐸𝐸𝐸, encontramos que las
probabilidades a posteriori son:
(0,4)(0,25) 1
𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸. = 𝑆𝑆í ℎ𝑎𝑎𝑎𝑎 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝ó𝑙𝑙𝑙𝑙𝑙𝑙⁄𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝐸𝐸𝐸𝐸𝐸𝐸) = =
(0,4)(0,25) + (0,8)(0,75) 7
1 6
𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸. = 𝑁𝑁𝑁𝑁 ℎ𝑎𝑎𝑎𝑎 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝ó𝑙𝑙𝑙𝑙𝑙𝑙⁄𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝐸𝐸𝐸𝐸𝐸𝐸) = 1 − =
7 7
Las probabilidades a posteriori para el resultado 𝐸𝐸𝐸𝐸𝐸𝐸 son:
(0,6)(0,25) 1
𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸. = 𝑆𝑆í ℎ𝑎𝑎𝑎𝑎 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝ó𝑙𝑙𝑙𝑙𝑙𝑙⁄𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝐸𝐸𝐸𝐸𝐸𝐸 ) = =
(0,6)(0,25) + (0,2)(0,75) 2
1 1
𝑃𝑃(𝐸𝐸𝐸𝐸𝐸𝐸. = 𝑁𝑁𝑁𝑁 ℎ𝑎𝑎𝑎𝑎 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝ó𝑙𝑙𝑙𝑙𝑜𝑜⁄𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝐸𝐸𝐸𝐸𝐸𝐸 ) = 1 − =
2 2
Con base en estos cálculos podemos usar ahora el criterio de decisión de Bayes, pero
considerando las probabilidades a posteriori y los posibles resultados de estudio sismológico
negativo y positivo, tenemos entonces:
Valor esperado del pago si el estudio da resultado negativo
𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑑𝑑𝑑𝑑 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑝𝑝𝑝𝑝𝑝𝑝 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑞𝑞𝑞𝑞𝑞𝑞 𝑒𝑒𝑒𝑒 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 𝑒𝑒𝑒𝑒 𝐸𝐸𝐸𝐸𝐸𝐸
1 6
= 𝐸𝐸[𝑃𝑃. 𝑃𝑃 ⁄𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝐸𝐸𝐸𝐸𝐸𝐸] = (800.000) + (−100.000) − 30.000 = 1.428,57
7 7
𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑒𝑒𝑒𝑒𝑝𝑝𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑑𝑑𝑑𝑑 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑝𝑝𝑝𝑝𝑝𝑝 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑞𝑞𝑞𝑞𝑞𝑞 𝑒𝑒𝑒𝑒 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 𝑒𝑒𝑒𝑒 𝐸𝐸𝐸𝐸𝐸𝐸
33
1 6
= 𝐸𝐸[𝑃𝑃. 𝑃𝑃⁄𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝐸𝐸𝐸𝐸𝐸𝐸] = (90.000) + (90.000) − 30.000 = 60.000
7 7
Valor esperado del pago si el estudio da resultado positivo
𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑑𝑑𝑑𝑑 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑝𝑝𝑝𝑝𝑝𝑝 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑞𝑞𝑞𝑞𝑞𝑞 𝑒𝑒𝑒𝑒 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 𝑒𝑒𝑒𝑒 𝐸𝐸𝐸𝐸𝐸𝐸
1 1
= 𝐸𝐸[𝑃𝑃. 𝑃𝑃⁄𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝐸𝐸𝐸𝐸𝐸𝐸 ] = (800.000) + (−100.000) − 30.000
2 2
= 320.000
𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑑𝑑𝑑𝑑 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑝𝑝𝑝𝑝𝑝𝑝 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑞𝑞𝑢𝑢𝑢𝑢 𝑒𝑒𝑒𝑒 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 𝑒𝑒𝑒𝑒 𝐸𝐸𝐸𝐸𝐸𝐸
1 1
= 𝐸𝐸[𝑃𝑃. 𝑃𝑃⁄𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝐸𝐸𝐸𝐸𝐸𝐸] = (90.000) + (90.000) − 30.000 = 60
2 2
Los resultados de estos cálculos se resumen en la tabla 4, en la que se considera una disminución
del pago debido al costo del estudio.
𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹 𝒅𝒅𝒅𝒅 𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆 𝑫𝑫𝑫𝑫𝑫𝑫𝑫𝑫𝑫𝑫𝑫𝑫ó𝒏𝒏 ó𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑 𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷 𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆

𝐸𝐸𝐸𝐸𝐸𝐸 𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 60.000
𝐸𝐸𝐸𝐸𝐸𝐸 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃 320.000
Tabla 12
Fuente: propia
En este punto del desarrollo del tema de análisis de decisión, cuando ya

hemos tratado buena parte de los principios de cálculo relacionados,
resulta pertinente analizar otras situaciones que ponen de manifiesto
la aplicación de tales principios, estas se encuentran en la siguiente
lectura:
Problemas resuletos de teoría de la decisión
Garriga, F.
Páginas: capitulo 1
Recuperado de: https://bit.ly/2KkEtxf
34
Diagrama de árbol de decisión
Un diagrama de árbol de decisión, o simplemente árbol de decisión, es una representación
mediante la cual se muestra las diferentes posibilidades asociadas con un problema de decisión.
En muchos casos facilita el desarrollo de los cálculos que apoyaran la elección.
En un árbol de decisión se tiene nodos de decisión y nodos de probabilidad, los primeros se

refieren a puntos en los que se ha de tomar una decisión a partir de diferentes alternativas. Los
segundos son puntos en los que se da un evento aleatorio. Ilustramos el uso de árbol de decisión
acudiendo al problema del ejemplo 1, la figura 2 muestra el respectivo árbol, en el cual los nodos
de decisión se representan con cuadros y los nodos de probabilidad se representan con círculos.
Véase que también se considera los casos sin experimentación y con experimentación.
Luego de elaborado el árbol, y con base en los datos numéricos del problema, se procede a
etiquetar cada línea con los respectivos valores que conducen a los respectivos pagos
dependiendo la decisión asociada con un camino específico. La figura 2 muestra los valores
correspondientes.
Figura 10. Ejemplo de árbol de decisión
Fuente: propia
35
Como último elemento ilustrativo, desde este documento,
invitamos a ver el siguiente video:
Análisis de decisión: Árbol de decisión y criterio del valor

esperado.
Recuperado de: https://youtu.be/lBO4bY5pdbs

Para una mirada resumida sobre las ideas básicas
del análisis de decisión, sugerimos al estudiante
revisar el videoresumen sobre análisis de decisión, allí
se expone un resumen de los puntos básicos sobre el
respectivo tema tratados en este referente.
Con la introducción dada al diagrama de árbol de decisión estamos llegando al final del presente referente
dentro de este eje articulador. Hemos tratado los fundamentos que subyacen a dos temáticas de suma
importancia, la programación dinámica y el análisis de decisión. Para la real finalización de este eje resta
presentar la actividad evaluativa, pero antes de enfrentarse a la evaluación correspondiente,
recomendamos que cada estudiante desarrolle la actividad de aprendizaje sobre conceptos y principios de
solución de análisis de decisión.
36
Bronson, R. (s.f.). Operation Research. Segunda Edición. Editorial Mc Graw Hill.
Garrira, F. (2013). Problemas resueltos sobre teoría de la decisión. Recuperado de

https://upcommons.upc.edu/bitstream/handle/2117/18004/garriga+garzon+p
roblemas+teoria+decision.pdf;jsessionid=E058478252C8C65EE28C38741DC59
709?sequence=1
Hiller, F. y Lieberman, G. (2009). Introducción a Investigación de operaciones. 9th

ed. McGraw-Hill.
Prawda, J. (s.f.). Métodos y Modelos de la Investigación de Operaciones (Tomo I y

II). Editorial Limusa.
Shamblin, J. (s.f.). Investigación de Operaciones. Editorial Mc Graw Hill.
Taha, H. (s.f.). Investigación de Operaciones. Editorial. Pearson, última Edición.
Videos
Castro, E. [Emily Castro]. (2008, noviembre 19). Programación Dinámica -
Investigación Operativa I [Archivo de video]. Recuperado de http:
https://youtu.be/DoCAJjEQjT0
37

Referente Pensamiento Eje 2 PDF

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Referente Pensamiento Eje 2 PDF

Caricato da

Copyright:

Formati disponibili

1

Introducción a la programación dinámica

Un componente fundamental de este referente, y que en gran medida

Si no se tiene el apoyo de fundamentos de alguna de las áreas de investigación de operaciones,

Un enfoque basado en programación dinámica, para resolver el problema de la diligencia,

𝑓𝑓𝑛𝑛 (𝑠𝑠, 𝑥𝑥𝑛𝑛 ) = 𝐶𝐶𝑠𝑠𝑥𝑥𝑛𝑛 + 𝑓𝑓𝑛𝑛𝑜𝑜 ( 𝑥𝑥𝑛𝑛 )

Primera iteración: Análisis de la cuarta etapa

Tabla 1. Análisis de la cuarta etapa

Segunda iteración: análisis de la tercera etapa

Figura 2. Alternativas de elección en la etapa 3

Tabla 2. Resumen de cálculos de la tercera etapa

Tercera iteración: análisis de la segunda etapa

Figura 3. Alternativas de decisión en la segunda etapa

Cuarta iteración: análisis de la primera etapa

Figura 4. Alternativas de decisión en la primera etapa

Tabla 4. Análisis de la primera etapa

𝑠𝑠𝑛𝑛 = 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑎𝑎𝑎𝑎 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑛𝑛

𝑥𝑥𝑛𝑛𝑜𝑜 = 𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 ó𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑑𝑑𝑑𝑑 𝑥𝑥𝑛𝑛 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑠𝑠𝑛𝑛

Una ONG (Organización No Gubernamental), de alcance internacional, dedicada a la

𝐼𝐼 = 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑ñ𝑜𝑜

4 105 110 100

5 120 150 130

Tabla 5. relación entre número de equipos asignados y beneficio obtenido

𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 � 𝑝𝑝𝑗𝑗 �𝑥𝑥𝑗𝑗 � = 𝑝𝑝1 (𝑥𝑥1 ) + 𝑝𝑝1 (𝑥𝑥2 ) + 𝑝𝑝3 (𝑥𝑥3 )

Atendiendo a la notación tratada en la sección 3.2, encontramos que:

𝑓𝑓𝑛𝑛 (𝑠𝑠𝑛𝑛 , 𝑥𝑥𝑛𝑛 ) = 𝑝𝑝𝑛𝑛 (𝑥𝑥𝑛𝑛 ) + 𝑚𝑚á𝑥𝑥 � 𝑝𝑝𝑗𝑗 �𝑥𝑥𝑗𝑗 �

𝑓𝑓𝑛𝑛𝑜𝑜 (𝑠𝑠𝑛𝑛 ) = max 𝑓𝑓𝑛𝑛 (𝑠𝑠𝑛𝑛 , 𝑥𝑥𝑛𝑛 )

Figura 6. Generalización de la base del cálculo de óptima asignación en cada etapa

Solución del problema

Si nos encontramos en la etapa 3 el estado del sistema, o número de equipos médicos

𝑻𝑻𝑻𝑻𝑻𝑻𝑻𝑻𝑻𝑻𝑻𝑻𝑻𝑻 𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆 (𝒏𝒏 = 𝟑𝟑)

Tabla 6. posibilidades de asignación en la etapa 3 según valores de 𝑠𝑠3

Si no se asigna equipos al país 2, es decir, 𝑥𝑥2 = 0, entonces el resultado al inicio de la etapa 3

𝑓𝑓2 (2, 𝑥𝑥2 ) = 𝑝𝑝2 (𝑥𝑥2 ) + 𝑓𝑓3𝑜𝑜 (2 − 𝑥𝑥2 )

𝑺𝑺𝑺𝑺𝑺𝑺𝑺𝑺𝑺𝑺𝑺𝑺𝑺𝑺 𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆 (𝒏𝒏 = 𝟐𝟐)

Tabla 7. Análisis de la etapa 2

𝑓𝑓1 (5, 𝑥𝑥1 ) = 𝑝𝑝1 (𝑥𝑥1 ) + 𝑓𝑓2𝑜𝑜 (5 − 𝑥𝑥1 )

𝑆𝑆𝑆𝑆 𝑥𝑥1 = 0: 𝑓𝑓1 (5,0) = 𝑝𝑝1 (0) + 𝑓𝑓2𝑜𝑜 (5 − 0) = 0 + 160 = 160

𝑆𝑆𝑆𝑆 𝑥𝑥1 = 1: 𝑓𝑓1 (5,1) = 𝑝𝑝1 (1) + 𝑓𝑓2𝑜𝑜 (5 − 1) = 45 + 125 = 170

𝑆𝑆𝑆𝑆 𝑥𝑥1 = 2: 𝑓𝑓1 (5,2) = 𝑝𝑝1 (2) + 𝑓𝑓2𝑜𝑜 (5 − 2) = 70 + 95 = 165

𝑆𝑆𝑆𝑆 𝑥𝑥1 = 3: 𝑓𝑓1 (5,3) = 𝑝𝑝1 (3) + 𝑓𝑓2𝑜𝑜 (5 − 3) = 90 + 70 = 160

𝑆𝑆𝑆𝑆 𝑥𝑥1 = 5: 𝑓𝑓1 (5,5) = 𝑝𝑝1 (5) + 𝑓𝑓2𝑜𝑜 (5 − 5) = 120 + 0 = 120

La tabla 8 muestra el resumen de los cálculos.

𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷 𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆 (𝒏𝒏 = 𝟏𝟏)

Tabla 8. Análisis de la etapa 1

Conceptos y ejemplos básicos de programación dinámica

Recuperado de: https://bit.ly/2vA7zDt

Cuando se habla de análisis de decisiones se habla precisamente del estudio de soluciones a

Un ejemplo de análisis de decisión

𝑯𝑯𝑯𝑯𝑯𝑯 𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑ó𝒍𝒍𝒍𝒍𝒍𝒍 𝑵𝑵𝑵𝑵 𝒉𝒉𝒉𝒉𝒉𝒉 𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑ó𝒍𝒍𝒍𝒍𝒍𝒍

Tabla 9. Ejemplo de datos básicos para toma de decisiones

Decisiones sin experimentación

Para la toma de decisiones sin experimentación, en lo que se refiere al manejo de la

Formulación de toma de decisiones sin experimentación

𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑒𝑒𝑒𝑒 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 90.000 90.000

Tabla 10. relación de pagos obtenidos por cada alternativa

Criterio de solución de pago máximo

Tabla 11. Análisis del criterio del pago máximo

Criterio de máxima posibilidad

Criterio de decisión de Bayes

𝐸𝐸[𝑃𝑃. 𝑃𝑃] = 200.000 − 75.000 = 125.000

𝐸𝐸[𝑃𝑃. 𝑃𝑃] = 22.500 + 67.500 = 90.000

Según los cálculos anteriores, la alternativa a seleccionar es la de perforar el terreno en busca