Sei sulla pagina 1di 6

Definición: Método que permite determinar de manera eficiente las decisiones

que optimizan el comportamiento de un sistema que evoluciona a lo largo de


una serie de etapas.

Características de los problemas dinámicos


Son problemas secuenciales: El problema se puede dividir en etapas.

Interrelación de las decisiones tomadas en cada etapa.

Las variables que describen el problema están gobernadas por


transformaciones en el tiempo.

 No cuenta con una formulación matemática estándar.


Concepto de solución Principio de optimalidad de Bellman
(1957)

“Una solución óptima tiene la propiedad de que,


cualesquiera sean el estado y la decisión inicial
tomadas, las decisiones restantes deben constituir
una política óptima con independencia del estado
resultante de la primera decisión.”

Descomponer en una serie de etapas el problema y la solución secuencial de los subproblemas


de decisión asociados con cada etapa es equivalente a la solución del problema de decisión del
sistema original.

Considerar un problema como una secuencia de decisiones equivale a dividirlo en subproblemas


más pequeños y por lo tanto más fáciles de resolver.
La programación dinámica se aplica cuando la subdivisión de un problema conduce a:

Gran cantidad Subproblemas cuyas soluciones Grupos de subproblemas de


de subproblemas. parciales se solapan. muy distinta complejidad.

Diferencias entre Programación dinámica y Programación Lineal:

• Describe una situación determinada en términos de un modelo matemático .(Lineal)


• Las decisiones se toman de manera simultánea. (Lineal)
• Formulación matemática estándar. (Lineal)
• Resolución mediante recursividad. (Dinámica)
Descripción de un modelo dinámico

1.- Etapas: particiones del problema en los que se pueden tomar decisiones que no dependen de las
alternativas anteriores. (Ej. Días, meses, años etc.)
2.- Estados en: es la información que relaciona la etapa actual y la siguiente o anterior.
Los estados pueden ser finitos o no.
3.- Decisión xn: Alternativas en la etapa n.
.
4.- Función costo cn (en ,xn ): Costo asociadodel estado y decisión tomada en la etapa n.
.
5.- Función de transición, en xn: Relaciona las variables de estado y decisión de una etapa con la
variable de estado de la etapa siguiente.
6.- Función costo acumulado, f n(en , xn ) : Costo total acumulado en n-etapas dado un estado y una
decisión particular.
7.- Función objetivo f n * (en ) : Objetivo a alcanzar al finalizar el problema. (Max o Mini).
Notemos que para un valor determinado de en se tendrán varias
decisiones posibles de , xn y entre ellas la decisión óptima, x*n .
Resolución de un problema de programación dinámica

 Identificar las etapas, variables de decisión y variables de estado

 Descripción de las ecuaciones de recurrencia.

 Optimizar cada subproblema en cada etapa en función de los resultados de la resolución del
subproblema siguiente.
 El método de solución determina inicialmente la política de decisión óptima para la última etapa.
Esto es generalmente trivial.

Recursividad hacia atrás


Clasificación de los problemas de programación dinámica
Programación dinámica determinística: son problemas dinámicos, donde el estado en la siguiente etapa está
completamente determinado por el estado y la decisión actual.
Discretos
Continuos

Programación dinámica probabilística: existe una distribución de probabilidad sobre lo que puede ser el
siguiente estado.

Potrebbero piacerti anche