Optimalidad de Bellman

Nombre del estudiante: Janeth Jacqueline Hernndez
Aguirre
Nombre del trabajo: Principio de optimalidad de Bellman
Fecha de entrega: 11 de octubre de 2015
Campus: Lomas Verdes
Carrera: Ingeniera Industrial
Semestre: Tercer semestre
Nombre del maestro: Mario Ernesto Jimnez Jimnez
NDICE
Introduccin3
Principio de Bellman.3
La ecuacin de Bellman..3
Ejemplo...4
Conclusin.7
Informacin adicional (aportaciones).8
Bibliografa.8
Introduccin
En este trabajo desarrollaremos el tema de Principio de optimalidad de Bellman,
que se refiere a principios bsicos de la programacin dinmica. La idea primaria de
la programacin dinmica (PD) es descomponer el problema en subproblemas
(ms manejables). Los clculos se realizan entonces recursivamente donde la
solucin ptima de un subproblema se utiliza como dato de entrada al siguiente
problema. La forma en que se realizan los clculos recursivos depende de cmo se
descomponga el problema original.
Principio de optimalidad de Bellman

Principio aplicado en programacin dinmica que consiste en que una secuencia
ptima de decisiones que resuelve un problema debe cumplir la propiedad de que
cualquier subsecuencia de decisiones, que tenga el mismo estado final, debe ser
tambin ptima respecto al subproblema correspondiente.
Entonces se dice que un problema de optimizacin satisface el principio de
optimalidad de Bellman si en una sucesin ptima si en una sucesin ptima de
decisiones o elecciones, cada subsolucin es a su vez ptima. Es decir, si miramos
una subsolucin de la solucin ptima, debe ser solucin del subproblema asociado
a esa subsolucin.
La ecuacin de Bellman
Esta ecuacin es una relacin recursiva fundamental que traduce matemticamente
el principio bsico de la programacin dinmica llamado el principio de optimalidad
de Bellman que se enuncia en lo siguiente:
Una poltica optima tiene la propiedad de que, cualesquiera que sean el estado y
las decisiones iniciales tomadas (es decir, el control), las restantes decisiones
deben constituir una poltica ptima con independencia del estado resultante de la
primer decisin.
En trminos matemticos el principio de optimalidad se puede expresar por medio
de lo que se le conoce como la relacin de recurrencia fundamental de la
programacin dinmica o Ecuacin de Bellman as:
( ) = max[( , ) + (+1 )]
: +1 = ( , )
Lo que coloquialmente dice que el valor mximo se puede obtener desde el estado
es el valor mximo desde el estado siguiente ms el valor mximo de f una vez
optimizada con respecto a variable de control para el periodo de t
Ejemplo (Problema de la ruta ms corta)

Supongamos que queremos seleccionar la ruta por carretera ms corta entre dos
ciudades. La red en la figura 1 proporciona las posibles rutas entre la ciudad de
inicio en el nodo 1 y la ciudad de destino en el nodo 7. Las rutas pasan por
ciudades intermedias designadas por los nodos 2 a 6.
Figura 1
Podemos resolver este problema enumerando todas las rutas entre los nodos 1 y 7.
Sin embargo la enumeracin exhaustiva es computacionalmente insoluble en redes
grandes.
Para resolver el problema por PD, primero lo descomponemos en etapas como se
indica mediante rayas verticales en la figura 2. A continuacin realizamos por
separado los clculos de cada etapa.
La idea general para determinar la ruta ms corta es calcular las distancias
(acumulativas) ms cortas a todos los nodos terminales de una etapa, y luego
utilizarlas como datos de entrada a la etapa inmediatamente subsiguiente.
Partiendo del nodo 1, la etapa 1 llega a tres nodos terminales (2, 3 y 4) y sus
clculos son simples.
Etapa 1
Distancia ms corta del nodo 1 al nodo 2= 7 millas (desde el nodo 1)
Figura 2
Luego la etapa 2 tiene dos nodos terminales, 5 y 6. La figura 2 nos muestra que se
puede llegar al nodo 5 desde los nodos 2, 3 y 4 por las rutas (2,5) (3,5) y (4,5). Esta
informacin junto con los resultados resumidos en la etapa 1, determina la distancia
(acumulativa) al nodo 5 como:
5

(Distancia ms corta al nodo 5) = min {(
) + (
)}
=2, 3,4

5
7 + 12 = 19
= min { 8 + 8 = 16 }=12 (desde el nodo 4)
.
5 + 7 = 13
Se puede llegar al nodo 6 solo desde los nodo 3 y 4. Por lo tanto:

) + (
)}
=3,4

6
8 + 9 = 17
= min {
}=17 (desde el nodo 3)
.
5 + 13 = 18
Etapa 2
El ltimo paso es considerar la etapa 3. Se puede llegar al nodo de destino 7 desde

el nodo 5 o desde el 6. Utilizando los resultados resumidos desde la etapa 2 y las
distancias de los nodos del 5 y 6 al nodo 7, obtenemos:

) + (
)}
=5,6

7
12 + 9 = 21
= min {
}=21 (desde el nodo 5)
.
17 + 6 = 23
Etapa 3
La distancia ms corta del nodo 1 al nodo 7 = 21 millas (desde el nodo 5)
El resumen de la etapa 3 muestra que la distancia ms corta entre los nodos 1 y 7
es de 21 millas. Para determinar la ruta ptima comenzamos con el resumen de la
etapa 3, donde el nodo 7 se conecta al nodo 5; en el resumen de la etapa 2 el nodo
4 se conecta al nodo 5, y en el resumen de la etapa 1 el nodo 4 se conecta al nodo
1. Por lo tanto la ruta ms corta es 1457.
El ejemplo revela las propiedades bsicas de los clculos de PD:
1. Los clculos de cada etapa son una funcin de las rutas factibles de dicha
etapa, y solo de esa etapa.
2. Una etapa actual est conectada a la etapa inmediatamente precedente slo
con base en el resumen de distancias ms corta de la etapa inmediatamente
precedente.
Conclusin
Podemos observar como claramente el principio de Bellman se basa en el famoso
divide y vencers, sin embargo se preocupa directamente por que la solucin
ptima de un problema sea tambin las solucin ptima de sus subproblemas, con
esto queremos decir que una ruta siempre tendr que ser optima, desde sus
pequeos subgrupos hasta el proyecto en s mismo.
Con esta tarea pude darme cuenta que adems de que podemos hacer el clculo
de la recursividad hacia atrs, tambin lo podemos hacer hacia adelante, sin tener
afectacin en el problema, ya que como lo menciona el principio la solucin ptima
siempre debe ser igual en el subgrupo y proyecto, sin embargo para m fue mucho
ms sencillo entender el clculo de recursividad yendo hacia adelante que hacia
atrs, esto debido a la confusin que me generaba el no reconocer cual sera la ruta
crtica.
7
Informacin adicional (aportaciones)

Inicialmente Bellman se haba concentrado en aquellos procesos que fueran
especficamente puestos como procesos de decisin por pasos o etapas.
Subsecuentemente comenz a estudiar un mtodo matemtico que incluyera
cualquier proceso que pudiera ser considerado por etapas. En el camino se
envolvi en el estudio de varias partes del clculo de variaciones, y en particular en
los procesos de control de retroalimentacin, adems de ser el pionero en la
investigacin de la PD sus bases siguen siendo utilizadas hasta ahora.
La naturaleza de los clculos de PD hace imposible desarrollar un cdigo de
computadora general que pueda manejar todos los problemas de PD. Tal vez esto
explique la persistente ausencia de un programa de PD comercial. Adems de la
variacin del nmero de etapas en el que un proyecto se puede dividir y esto hara
casi imposible que un programa calculara una sola ruta o una ruta ms viable, ya
que en su misma definicin la PD hace que las rutas crticas tengan posibilidades
infinitas, sin embargo existen mtodos en Excel cuando el valor mximo de
alternativas es 10 (Ejemplo de la mochila).
Bibliografa
Desconocido. (2015). Desconocido . Obtenido de
http://www.dc.uba.ar/materias/aed3/2013/1c/teorica/dinamica.pdf
Dreyfus, R. E. (1963). Applyed Dynamic Programming. United States: The Rand
corporation.
Real academia de Ingeniera. (2015). Real academia de Ingeniera. Obtenido de
Real academia de Ingeniera: http://diccionario.raing.es/es/lema/principio-deoptimalidad-de-bellman
Taha, H. A. (2012). Programacin dinmica determinstica. En H. A. Taha,
Investigacin de operaciones (pgs. 430-433). Pearson.

Optimalidad de Bellman

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Optimalidad de Bellman

Caricato da

Copyright:

Formati disponibili

Nombre del estudiante: Janeth Jacqueline Hernndez

Nombre del trabajo: Principio de optimalidad de Bellman

Fecha de entrega: 11 de octubre de 2015

Campus: Lomas Verdes

Carrera: Ingeniera Industrial

Semestre: Tercer semestre

Nombre del maestro: Mario Ernesto Jimnez Jimnez

Principio de optimalidad de Bellman

es el valor mximo desde el estado siguiente ms el valor mximo de f una vez

optimizada con respecto a variable de control para el periodo de t

Ejemplo (Problema de la ruta ms corta)

Se puede llegar al nodo 6 solo desde los nodo 3 y 4. Por lo tanto:

El ltimo paso es considerar la etapa 3. Se puede llegar al nodo de destino 7 desde

Informacin adicional (aportaciones)

Potrebbero piacerti anche