Sei sulla pagina 1di 21

Teorı́a de Control Óptimo y la Economı́a

Extracto de la propuesta presentada para el concurso de oposición del cargo interino de Profesor
Adjunto de Economı́a Matemática - Departamento de Métodos Matemático-cuantitativos, Facultad de
Ciencias Económicas y de Administración, Universidad de la República

Mijail Yapor
Diciembre 2011
Índice
1. Introducción 3

2. Breve reseña histórica 4

3. Teorı́a del Control Óptimo 6


3.1. Introducción e importancia . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.2. Presentación básica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.2.1. Trayectoria óptima: la toma de decisiones en varias etapas . . . . . 7
3.2.2. El concepto de Funcional . . . . . . . . . . . . . . . . . . . . . . . . 7
3.3. El porblema de Control Óptimo . . . . . . . . . . . . . . . . . . . . . . . . 8
3.4. El principio del máximo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3.4.1. Desarrollo y condiciones de primer orden . . . . . . . . . . . . . . . 9
3.4.2. Condiciones de transversalidad . . . . . . . . . . . . . . . . . . . . 12
3.4.3. El caso del Hamiltoniano Corriente . . . . . . . . . . . . . . . . . . 13
3.4.4. Problemas con más de una variable de estado y control . . . . . . . 14
3.4.5. Problemas con horizonte infinito . . . . . . . . . . . . . . . . . . . . 17
3.4.6. Condiciones suficientes . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.5. Interpretación económica del Principio del Máximo . . . . . . . . . . . . . 18

4. Referencias bibliográficas 21
1 Introducción

1. Introducción
El objeto central de estas notas es presentar los componentes básicos de la teorı́a de
Control Óptimo, ası́ como sus principales aplicaciones a la economı́a, en el marco de la
formación de grado universitario. La responsabilidad sobre lo que aquı́ figura es exclusiva
del autor.
La teorı́a de control óptimo, como cuerpo, podrı́a decirse que data de algo más de medio
siglo atrás, y se presenta como uno de los avances más importantes en el marco de los pro-
blemas de optimización dinámica. Desde los primeros problemas de cálculo de variaciones
hasta el uso creciente de la programación dinámica, el desarrollo de esta área se posiciona
como una de las de mayor trascendencia en el análisis económico actual. La conjugación
de matemática y economı́a (o si se prefiere la aplicación de la primera en la segunda), ha
adoptado un perfil creciente y vertiginoso en los últimos cincuenta años, reduciéndose en
algunos casos de forma notable el tiempo que transcurre entre el desarrollo de técnicas
matemáticas y su aplicación en la economı́a.
En lo que sigue, el segundo apartado tiene su foco en una breve perspectiva histórica
de la relación entre economı́a y matemática. En tercer lugar se presenta el desarrollo
teórico básico del Control Óptimo, avanzando hacia porblemas de mayor complejidad
como trabajar con más de una variable de estado y control. En último caso se presenta
la blibliografı́a utilizada.

Teorı́a de Control Óptimo y la Economı́a 3


2 Breve reseña histórica

2. Breve reseña histórica

Una posible definición de la economı́a matemática dirı́a que es una técnica que da ex-
presión matemática a la teorı́a económica. Es matemática aplicada; una asociación entre
matemática y economı́a (Allen, R; 1959). No es, por tanto, en sentido estricto una rama
más de la economı́a, como lo son la micro o macroeconomı́a. Su objeto es, fundamen-
talmente, la teorı́a económica, diferente a las técnicas de aplicación práctica como ser la
econometrı́a o estadı́stica.
La expansión de las herramientas matemáticas en la economı́a puede decirse que tu-
vo su ritmo más intenso en la segunda mitad del pasado siglo, en especial a finales de
la segunda guerra mundial. Sin embargo, el desarrollo de la economı́a matemática -o la
incorporación progresiva de la segunda en la primera- data de muchos años atrás. Pa-
ra acercarnos a una perspectiva histórica del desarrollo de la economı́a matemática se
seguirá en adelante la clasificación realizada por Arrow, K. e Intriligator, M (1984).

Según los autores, el desarrollo de la economı́a matemática puede dividirse en “tres grandes
y por momentos solapados perı́odos”: de 1838 a 1947, el perı́odo marginalista con base
en el cálculo; de 1948 a 1960, el perı́odo de la teorı́a de conjuntos/modelos lineales; y de
1961 en adelante un perı́odo de integración que unifica el instrumental matemático de los
dos anteriores.
El perı́odo marginalista se caracteriza por el intento de formalizar una teorı́a micro-
económica coherente del comportamiento de los agentes y una teorı́a completa del equili-
brio general. Las herramientas del cálculo como las derivadas parciales o el multiplicador
de Lagrange fueron los instrumentos principales utilizados. El trabajo germinal de Cour-
not (1838) sobre la teorı́a de la firma y los consumidores en el mercado, y las obras
independientes de Hicks (1946) y Samuelson (1947) integrando diversos desarrollos pre-
vios sobre la teorı́a del consumidor, la firma, el equilibrio general y la estabilidad del
equilibrio, representan los trabajos seminales que dan sentido a esta primera etapa.
El segundo perı́odo tiene su orı́gen en la posguerra, pero sin embargo pude decirse que
el trabajo de von Newman en 1937 representa la obra germinal. Uno de los avances
sustanciales de esta época es la incorporación de la teorı́a de conjuntos, que permite
generalizar el análisis económico-matemático a funciones no necesariamente continuas y
por tanto ampliar significativamente el horizonte de desarrollos en la materia. Los trabajos
de Wald (1933-1934) y Arrow y Debreu (1954) sobre la teorı́a del equilibrio general y
la existencia de equilibrio competitivo, son algunos ejemplos del desarrollo de la teorı́a
económica con fuerte base matemática de la época.
Se enmarca en estos ańos el desarrollo de la teorı́a de juegos y sus aplicaciones en economı́a.

Teorı́a de Control Óptimo y la Economı́a 4


2 Breve reseña histórica

Von Neuman y Morgenstern (1944), en la construcción de juegos cooperativos, y Nash


(1950) en la construcción de una axiomática con consistencia lógica y fundamento teórico,
son dos de los trabajos más destacados. Es también la etapa del desarrollo de los modelos
lineales, resaltando el trabajo de Leontief (1947) referente a la estructura de interrelaciones
entre sectores de producción. El desarrollo de la programación lineal corresponde también
a esta etapa. Entre el gran número de trabajos sobre la temática se pude resaltar el de
Dorfman, Samuelson y Solow (1958).
El tercer perı́odo que comienza en 1961 se caracteriza por la combinación de elementos del
cálculo, teorı́a de conjuntos y modelos lineales, siendo en estos ańos donde se extiende la
matemática prácticamente a todas las áreas de la economı́a. Los trabajos sobre problemas
con incertidumbre, el análisis global, el equilibrio temporal, la teorı́a de la elección social
y la teorı́a del crecimiento óptimo son algunos ejemplos entre tantos a resaltar. En la
actualidad los avances en la materia continúan, y como ya fuera mencionado, los métodos
basados en la optimización dinámica han tomado un rol central.

Teorı́a de Control Óptimo y la Economı́a 5


3 Teorı́a del Control Óptimo

3. Teorı́a del Control Óptimo

3.1. Introducción e importancia

La teorı́a de control óptimo se enmarca en un tipo de problema más general denomi-


nado optimización dinámica, cuya caracterı́stica sobresaliente es la incorporación de la
dimensión temporal en los problemas económicos de optimización. En contraposición a la
optimización estática, donde el objetivo es encontrar para cada variable de interés el valor
que maximiza o minimiza cierta función objetivo; en la optimización dinámica el objetivo
consiste en determinar el valor óptimo de las variables en cada momento o instante del
tiempo.
Para poder realizar este análisis se requiere de un cierto intervalo de tiempo sobre el cual
se estudiará la trayectoria óptima de las variables. A dicho intervalo se lo suele denominar
como el perı́odo de planificación, y puede tener tanto un horizonte finito (digamos el
perı́odo que va desde el momento 0 al momento T ), como un horizonte infinito (el perı́odo
[0, ∞)). Estos y otros conceptos necesarios para una cabal comprensión del tema serán
desarrollados con mayor detenimiento más adelante.
El desarrollo germinal de esta teorı́a puede ubicarse hacia finales de la década de los 50, a
partir de los trabajos de Pontryagin, quien generaliza el principio del máximo para todos
los problemas de variaciones (Kamien, M; Schwartz, N, 1991).
En los problemas de control óptimo, las variables se dividen en dos clases: variables de
estado y variables de control. El objetivo será encontrar las trayectorias óptimas, para
cada momento del tiempo, de ambas clases de variables, de forma de obtener el valor
máximo (o mı́nimo) de cierta función objetivo. Estas trayectorias o senderos óptimos
se representan a través de ecuaciones de movimiento, con la caracterı́stica de que las
ecuaciones de movimiento de las variables de estado dependen de la variable de control.
Planteado de esta manera el problema, las variables de control fungen como el instrumento
que, afectando las trayectorias de las variables de estado, permiten alcanzar el óptimo.
A continuación se presentan los principales componenetes teóricos de la teorı́a de contol
óptimo, partiendo de la formulación básica del problema y llegando a la presentación
de casos más generales como los problemas con varias variables de estado y control.
Concretamente, luego de comentar algunos conceptos previos necesarios y formulado el
problema báscico, la presente sección incluye: el principal resultado de la teorı́a y condición
necesaria denominado Principio del Máximo; las distintas condiciones de transversalidad
derivadas de condiciones terminales alternativas; el problema en tiempo corriente, con
más de una variable de estado y control y con horizonte infinito; y finalmente se incluye
una interpretación económica del principio del máximo.

Teorı́a de Control Óptimo y la Economı́a 6


3 Teorı́a del Control Óptimo

3.2. Presentación básica

3.2.1. Trayectoria óptima: la toma de decisiones en varias etapas

Como se mencionara más arriba, la caracterı́stica distintiva de los problemas de optimi-


zación dinámica es la incorporación del tiempo. Alcanzar el óptimo a lo largo del tiempo
puede ser visto como un problema de obtener la secuencia óptima de valores en distintas
etapas. Sin embargo, no siempre el valor que represente el óptimo en cada etapa será la
solución óptima para el problema a lo largo del tiempo. Quizá un ejemplo trivial sirva
para comprender esto con mayor claridad.
Imaginemos una persona que viven en medio del campo y desea llegar a la ruta desde
su casa. Hacerlo lo menos cansado posible, sano y salvo, depende no sólo del largo de
los posibles caminos, sino de las condiciones en que se encuentran, su mayor o menor
seguridad, etc. En estas condiciones tomar un camino en lı́nea recta no necesariamente
será lo más conveniente. Si por ejemplo en medio del mismo se encontrara un tajamar, ir
paso a paso en lı́nea recta (asimilemos esto a una decisión por etapas) implicarı́a al menos
un importante chapuzón (y letal si no supiera nadar...).
Este sencillo ejemplo intenta mostrar que, alcanzar el óptimo etapa a etapa no necesaria-
mente implicará alcanzar la trayectoria óptima. Por tanto, resulta necesario desarrollar
un método que tome en cuenta todo el perı́odo de planificación, como lo hace la teorı́a de
control óptimo.

3.2.2. El concepto de Funcional

En el punto anterior se intentó relacionar la noción de sendero o trayectoria con el valor


óptimo buscado. Matemáticamente, esto requiere encontrar una relación funcional entre
funciones (las trayectorias) y número reales (los valores óptimos). A esta relación se le da
el nombre de Funcional.
Si se denomina y(t) al sendero, el Funcional se representa como V [y(t)]. Esto implica que
V mapea funciones en valores. En la notación habitual de funciones, esto se interpretarı́a
como una función compuesta de V e y(t), por lo que en definitiva V depende del tiempo.
En el caso de V [y(t)], el Funcional es una función únicamente de y(t) como unidad, el
sendero. En suma, para cada sendero, yi (t), tenderemos un valor del Funcional.

Teorı́a de Control Óptimo y la Economı́a 7


3 Teorı́a del Control Óptimo

3.3. El porblema de Control Óptimo

Tomando en cuenta las consideraciones anteriores, el problema básico de control óptimo


puede escribirse de la siguiente manera: 1

RT
M ax V = 0 F (t, y, u)dt
sujeto a : ẏ = f (t, y, u) (1)
y(0) = yo y(T ) libre
yo , T dados

A efectos de la presentación, se ha optado por trabajar con un problema de maximización.


Sin embargo, si el caso de fuera de minimización, su resolución
RT es equivalente a la de
maximizar el opuesto del funcional objetivo. Es decir, M in 0 F (t, y, u)dt es equivalente
RT
a M ax 0 −F (t, y, u)dt.
Una segunda aclaración es importante: se presenta una versión simple del problema, con
una única variable de estado (y), y una única variable de control (u). Sin embargo, los
problemas económicos pueden implicar la presencia de más de una variable de control y
de estado, situación que puede ser tratada por la teorı́a de control óptimo sin mayores
dificultades.
Se asume que tanto F (t, y, u) como f (t, y, u) son diferenciables con derivadas parciales
contı́nuas respecto de sus tres argumentos. La variable de control u debse ser continua
respecto del tiempo al menos de a tramos; es decir, se admite un número finito de puntos
de discontinuidad. Por su parte, la variable de estado debe ser continua, admitiendo
sin embargo no diferenciabilidad en un número finito de puntos (admite la existencia
de puntos angulosos). La condición es que, de exisitr, los puntos de discontinuidad del
sendero de control deben coincidir con los puntos no diferenciables del sendero de estado.
La ecuación diferencial ẏ = f (t, y, u) se denomina ecuación de movimiento de la variable
de estado (o simplemente ecuación de estado) y muestra cómo la variable de control incide
en el sendero de la variable de estado. Para ilustrar esta interrelación, notemos que en
el momento inicial t = 0 e y(0) = y0 , el valor de f dependerá del valor inicial que tome
u. Si se repite este razonamiento para otros puntos del tiempo se evidencia de qué forma
la elección del valor de la variable de control se traslada al patrón de movimiento de la
variable de estado.
1
En la presente sección y siguientes del apartado se tomará, a grandes rasgos, la forma de presentación
desarrollada por Alpha Chiang en su libro Elements of Dinamic Optimization (1992).

Teorı́a de Control Óptimo y la Economı́a 8


3 Teorı́a del Control Óptimo

Por último, se establece un valor inicial fijo para la variable de estado (y(0) = yo ), mientras
que se deja libre el valor terminal. Esto último obedece a que pueden exisitr diferentes
formas terminales; su determinación se denomina condición de transversalidad y serán
analizadas en detalle posteriormente.

3.4. El principio del máximo

3.4.1. Desarrollo y condiciones de primer orden

Seguramente el resultado más relevante de esta teorı́a, el principio del máximo representa
la condición necesaria de primer orden, cuya exposición se basa en la utilización del
Hamiltoniano (o función Hamiltoniana).
2
Considérese el siguiente planteo general del problema de control óptimo:

RT
M ax V = 0 F (t, y, u)dt
sujeto a : ẏ = f (t, y, u) (2)
y(0) = yo

El correspondiente Hamiltoniano es:

H(t, y, u, λ) = F (t, y, u) + λ(t)f (t, y, u) (3)

Donde λ se denomina variable de coestado.

Si se reexpresa la ecuación de estado como f (t, y, u) − ẏ = 0 y se multiplica ambos


miembros de la igualdad por la variable de coestado, la suma contı́nua de esta expresión
entre el momento 0 y el momento T resulta:

Z T
λ(t)[f (t, y, u) − ẏ]dt = 0 (4)
0
2
Nótese que se omite la condición terminal, puesto que a los efectos del desarrollo siguiente no resulta
relevante. Su determinación será analizada con posterioridad.

Teorı́a de Control Óptimo y la Economı́a 9


3 Teorı́a del Control Óptimo

Puesto que este término es identicamente 0, lo podemos sumar al Funcional objetivo V


sin alterar el resultado. Llamando J al nuevo Funcional objetivo, tenemos:

Z T
J =V + λ(t)[f (t, y, u) − ẏ]dt , (5)
0

lo que puede escribirse como

Z T Z T
J= F (t, y, u)dt + λ(t)[f (t, y, u) − ẏ]dt , (6)
0 0

o alternativamente

Z T
J= {F (t, y, u) + λ(t)[f (t, y, u) − ẏ]}dt (7)
0

Recordando la formulación del Hamiltoniano definida en (3), la expresión anterior puede


escribirse como sigue:

Z T
J= [H(t, y, u, λ) − λ(t)ẏ]dt , (8)
0

es decir

Z T Z T
J= H(t, y, u, λ)dt − λ(t)ẏdt (9)
0 0

Integrando por partes este resultado se llega a:

Z T
J= [H(t, y, u, λ) + y(t)λ̇]dt − λ(T )yT + λ(0)y0 (10)
0

Recordando la formulación inicial del Funcional objetivo V y J, siempre que se cumpla


la condición f (t, y, u) − ẏ = 0, el sendero λ(t) no debe afectar el valor del Funcional.
Tomando en cuenta esto y observando que:

∂H(t, y, u, λ)
= f (t, y, u) , (11)
∂λ

Teorı́a de Control Óptimo y la Economı́a 10


3 Teorı́a del Control Óptimo

se llega a

∂H(t, y, u, λ)
⇒ ẏ = f (t, y, u)
ẏ = (12)
∂λ
Esta ecuación representa una de las condiciones del principio del máximo.

Continuando con la derivación de las restantes condiciones, pasemos ahora al estudio del
efecto del sendero de u(t) sobre la variable de estado y(t).
Si se conoce un sendero posible para las variables de estado y control, y ∗ y u∗ , y se le
adicionan perturbaciones, q(t) y p(t) respectivamente, se obtienen dos familias de senderos:

y(t) = y ∗ + q(t)
(13)
u(t) = u∗ + p(t)

Si a esto se le adiciona la condición de que el momento terminal T y el valor terminal de


la variable de estado yT sean variables, también se puede expresar:

T = T ∗ + ∆T ⇒ dT
d
= ∆T
∗ dyT (14)
yT = yT + ∆yT ⇒ d = ∆yT

Tomando las nuevas expresiones de y y u, y sustituyéndolas en J, tenemos que:

Z T ()
J= {H[t, y ∗ + q(t), u∗ + p(t), λ)] + λ̇[y ∗ + q(t)]}dt − λ(T )yT + λ(0)y0 (15)
0

Queda ası́ expresado el Funcional objetivo en términos de , sobre el cual es posible aplicar
la condición de primer orden dJ
d
= 0:

Z T ()   
dJ ∂H ∂H dT
= q(t) + p(t) + λ̇q(t) dt + [H + λ̇y]t=T − (16)
d 0 ∂y ∂u d
dyT dλ(T ) dT
−λ(T ) − yT =0
d dT d

o alternativamente:

Z T ()   
dJ ∂H ∂H
= q(t) + p(t) + λ̇q(t) dt + [H + λ̇y]t=T ∆T − (17)
d 0 ∂y ∂u
−λ(T )∆yT − yT λ̇(T )∆T = 0

Teorı́a de Control Óptimo y la Economı́a 11


3 Teorı́a del Control Óptimo

Si se toma en cuenta que uno de los componentes del segundo sumando de esta útlima
ecuación puede escribirse como:

dT
[λ̇y]t=T = λ̇(T )yT ∆T , (18)
d

la ecuación (17) se simplifica. Tomando en cuenta este hecho y reagrupando el integrando


se llega a:

Z T   
dJ ∂H ∂H
= + λ̇ q(t) + p(t) dt + [H]t=T ∆T − λ(T )∆yT = 0 (19)
d 0 ∂y ∂u

Este diferencial está compuesto por tres sumandos, cuya determinación es afectada por
diferentes componentes: en el primero (la integral) aparecen las curvas de perturbación
p(t) y q(t), mientras que en los dos restantes se involucran las variaciones ∆T y ∆yT
respectivamente. Dado que la condición de primer orden implica que el diferencial sea
inequı́vocamente 0, los tres sumandos que lo componen deben serlo. Y para que esto sea
cierto debe suceder que:

∂H ∂H
λ̇ = − y = 0, (20)
∂y ∂u

las cuales representan dos condiciones adicionales. A la primera se la denomina ecuación


de movimiento de la variable de coestado (o ecuación de coestado), mientras que a la
segunda representa la maximización del Hamiltoniano respecto de la variable de control.
El principio del máximo se completa con una cuarta condición denominada de transver-
salidad, que como fuera mencionado con antelación, depende de la condición terminal
particular del problema de control óptimo. El hecho notable es que dicha condición de
transversalidad se deriva de los dos restantes sumandos de la ecuación (19), como se verá a
continuación.

3.4.2. Condiciones de transversalidad

El ejemplo más sencillo de condición terminal es la que fija tanto el momento final como el
valor de la variable de estado en dicho momento. Es decir, cuando T está dado e y(T ) = yT
es fijo. En este caso, la condición de transversalidad es simpliemente el punto terminal

Teorı́a de Control Óptimo y la Economı́a 12


3 Teorı́a del Control Óptimo

y(T ) = yT . Adicionalmente, tomando la ecuación (19), pude observarse que esto hace
efectiva las condiciones [H]t=T ∆T = 0 y λ(T )∆yT = 0, puesto que tanto ∆T como ∆yT
resultan 0.
Un segundo caso posible es que T se encuentre fijo pero y(T ) = yT sea libre, el cual se
denomina lı́nea terminal vertical. Esto implica que si bien se fija el momento final de
planificación, no se imponen restricciones al valor final de la variable de estado. En este
caso, ∆T es cero pero no ası́ ∆yT . Por lo tanto, para que el miembro λ(T )∆yT = 0, la
condición de transversalidad es λ(T ) = 0.
Otro caso posible es el denominado lı́nea terminal horizontal, el cual implica que y(T ) = yT
sea fijo pero no el momento final T . Siguiendo el razonamiento de los casos anteriores,
∆T puede variar y para que [H]t=T ∆T = 0 la condición es [H]t=T = 0.
Existen otros casos de condiciones terminales, como ser los de curva terminal, lı́nea ter-
minal vertical u horizontal truncada, que no serán presentados aquı́. Para un desarrollo
de los mismos se puede consultar el texto Elements of dynamic optimization de Alpha C.
Chiang (páginas 182 a 184).

3.4.3. El caso del Hamiltoniano Corriente

Una posible variación a los porblemas de control óptimo vistos hasta el momento es
cuando en ciertas aplicaciones económicas puede resultar de interés analizar un fenómeno
en términos corrientes. En estos casos debe incorporarse un factor de descuento en el
integrando del Funcional objetivo, el cual se denota con la expresión e−ρt . Esto obliga a
reformular el Hamiltoniano, como se verá a continuación.
Reescribiendo F como:

F (t, y, u) = G(t, y, u)e−ρt , (21)


y en consecuencia el problema de control óptimo como:

RT
M ax V = 0 G(t, y, u)e−ρt dt
sujeto a : ẏ = f (t, y, u) (22)
y : condiciones de borde
El Hamiltoniano ahora es:

H(t, y, u, λ) = G(t, y, u)e−ρt + λ(t)f (t, y, u) (23)

Teorı́a de Control Óptimo y la Economı́a 13


3 Teorı́a del Control Óptimo

De modo de hacer más sencillo el cálculo de las condiciones del principio del máximo, el
Hamiltoniano se reexpresa utilizando un multiplicador lagrangiano en tiempo corriente,
definido como:

m = λ(t)eρt (24)

A partir de esta definición, se puede reexpresar el Hamiltonaino, obteniendo:

Hc = Heρt = G(t, y, u) + mf (t, y, u) (25)

Con estas consideraciones, el principio del máximo revisado resulta:

∂Hc
=0
∂u

∂Hc
ẏ = (26)
∂m

∂Hc
ṁ = − + ρm
∂y
Resta analizar las variaciones en cuanto a las condiciones de transversalidad. El estudio
de cada caso se mantiene respecto de la situación en tiempo presente, mientras que varı́a
la formulación de las restricciones. Ahora:

si antes λ(T ) = 0 ⇒ m(T )e−ρT = 0 (27)

si antes [H]t=T = 0 ⇒ m(T )[Hc ]t=T e−ρT = 0 (28)

3.4.4. Problemas con más de una variable de estado y control


En lo desarrollado hasta el momento se ha trabajado con problemas de una sola varia-
ble de estado y control. Sin embargo, la modelización de diversos problemas económicos
puede implicar la existencia de más de una de ellas. En esos casos, la formulación del

Teorı́a de Control Óptimo y la Economı́a 14


3 Teorı́a del Control Óptimo

problema no conlleva mayores dificultas, siendo sin embargo su resolución relativamente


más complicada.3
Para presentar el nuevo problema, considérese la exisencia de n variables de estado y m
variables de control, y1 , ..., yn y u1 , ..., um respectivamente. Extendiendo el análisis de una
sola variable, para cada variable de estado tendremos ahora una ecuación de movimiento:

y˙1 = f 1 (t, y1 , ..., yn , u1 , ..., um )


.............................. (29)
y˙n = f n (t, y1 , ..., yn , u1 , ..., um )

Y la función integrando del problema puede escribirse como F (t, y1 , ..., yn , u1 , ..., um ).
El problema requiere a su vez de n condiciones iniciales y n condiciones terminales.
Incluir de esta forma el integrando, las ecuaciones de movimiento y las condiciones ini-
ciales y terminales en la formulación del problema de control óptimo puede resultar muy
engorroso. Si asumimos la siguiente notación vectorial:

       
y1 u1 y˙1 f 1 (t, y, u)
y ≡  ...  u ≡  ...  ẏ ≡  ...  f (t, y, u) ≡  .. (30)
       
. 
n
yn um y˙n f (t, y, u)

entonces la presentación el problema se simplifica notablemente y su presentación es simi-


lar al caso inicial de una sola variable de estado y control (recordando que en aquel caso
trabajábamos con escalares y aquı́ con vectores):

RT
M ax V = 0 F (t, y, u)dt
sujeto a : ẏ = f (t, y, u) (31)
y(0) = yo
condiciones de borde

Presentado el problema, para poder determinar el principio del máximo se requiere de una
reformulación del Hamiltoniano para el caso de n restricciones. El mismo puede escribirse
como:
3
En general, los porblemas de este tipo vistos en cursos de grado incluyen a lo sumo dos variables de
estado y/o de control, por lo que si bien la dificultad aumenta, siguen siendo de manejo relativamente
accesible.

Teorı́a de Control Óptimo y la Economı́a 15


3 Teorı́a del Control Óptimo

n
X
H = F (t, y, u) + λj (t)f j (t, y, u) (32)
j=1

Si aplicamos la notación matricial anterior, tomando:


 
λ1 (t)
λ ≡  ...  , (33)
 
λn (t)
el Hamiltoniano es:

H(t, y, u, λ) = F (t, y, u) + λ0 (t)f (t, y, u) (34)

A partir de este resultado las nuevas condiciones necesarias establecidas en el principio


del máximo son:

∂H
máx H ⇒ =0 (i = 1, . . . , m)
u ∂ui
∂H
y˙j = ⇒ ẏ = f j (t, y, u) (j = 1, . . . , n) (35)
∂λj
∂H
λ˙j = − (j = 1, . . . , n)
∂yj

Por último, resta estudiar qué sucede con las condiciones de transversalidad. Además del
caso trivial de punto terminal fijo y siguiendo la lı́nea desarrollada hasta el momento, sólo
se presentarán los casos de punto terminal libre y valor terminal de la variable de estado
libre.
En el caso de una sola variable de estado y control, la condición de transversalidad requerı́a
que la expresión [H]t=T ∆T − λ(T )∆yt fuera identicamente 0. Trabajando con n variables
de estado, esta condición se expande a:

[H]t=T ∆T − λ1 (T )∆y1T − λ2 (T )∆y2T − . . . − −λn (T )∆ynT = 0 , (36)

siendo las condiciones de transversalidad:

Teorı́a de Control Óptimo y la Economı́a 16


3 Teorı́a del Control Óptimo

[H]t=T = 0 si T es libre (37)

λj (T ) = 0 si yjT es libre (38)

3.4.5. Problemas con horizonte infinito


Hasta aquı́ se ha desarrollado la teorı́a del control óptimo trabajando sobre un perı́do de
panificación finto. Sin emabrgo, puede resultar de interés económico analizar qué sucederı́a
si el perı́odo de planificación es infinito (o lo suficientemente extenso como para poder
considerarse como tal). En ese caso, el análisis anterior se ve modificado en sus condiciones
terminales, manteninendo las condiciones necesarias previas incambiadas. A continuación
se desarrollá brevemente esta variante del problema para el caso de una variable de estado
y control.
Adaptando la ecuación (19) a la nueva situación, se tiene que:

Z ∞   
dJ ∂H ∂H
= + λ̇ q(t) + p(t) dt + lı́m [H]∆T − lı́m λ(T )∆yt = 0 (39)
d 0 ∂y ∂u t→∞ t→∞

Dado que ahora T no es fijo, se debe cumplir que lı́mt→∞ [H] = 0, lo que resulta ser
la condición básica de transversalidad en condiciones de horizonte infinito. El otro caso
posible es que y(T ) = yT sea o no libre. Si no lo es, la condición adicional es simplemente
el dicho punto terminal. En caso contrario, si y(T ) es libre se debe imponer la restricción
de que lı́mt→∞ λ(T ) = 0.

3.4.6. Condiciones suficientes


Se ha presentado el problema general de Control Óptimo y las condiciones necesarias
para su resolución, expresadas en el principio del máximo, para diversas situaciones. Sin
embargo, dicho principio sólo bajo ciertas circunstancias representa también una condición
suficiente. A continuación se describe someramente la idea básica presentada por Arrow
en su teorema de suficiencia.
Tomando una formulación básica del problema de control óptimo como la que sigue:

Teorı́a de Control Óptimo y la Economı́a 17


3 Teorı́a del Control Óptimo

RT
M ax V = 0 F (t, y, u)dt
sujeto a : ẏ = f (t, y, u) (40)
y(0) = yo
yo , T dados
Es posible establecer, para cada momento del tiempo y para y y λ dados, cierto u*
que maximice el Hamiltoniano. Si llamamos H 0 (t, y, λ) a dicho hamiltoniano maximizado,
se tiene que:

H 0 (t, y, λ) = F (t, y, u∗ ) + λf (t, y, u∗ ) (41)

El teorema de Arrow establece que las condiciones del principio del máximo son suficientes
para hallar el máximo global de V , si el Hamiltoniano maximizado H 0 es cóncavo en la
variable de estado y para todo t perteneciente a [0, T ], y para un λ dado. Es decir, si
∂2H
∂y 2
< 0.

3.5. Interpretación económica del Principio del Máximo


Dorfman (1969) afirma que la teorı́a de control óptimo es formalmente idéntica a la teorı́a
del capital, y para probarlo desarrolla una interpretación económica del principio del
máximo basándose en un ejemplo de maximización de beneficios. Siguiendo su ejemplo,
si se denota con la letra π al beneficio, k el capital (variable de estado) y u la variable de
control que representa una determinada polı́tica (de inventarios, por ejemplo), el problema
a resolver puede escribirse como:

RT
M ax Π = 0
π(t, k, u)dt
sujeto a : k̇ = f (t, k, u) (42)
k(0) = ko
condiciones de borde
Asumiendo como k*, u* y λ∗ las trayectorias óptimas de las variables de estado, coontrol
y coestado respectivamente, y recordando la ecuación (10), podemos expresar el Funcional
objetivo en el óptimo como:

Z T

Π = [H(t, k ∗ , u∗ , λ∗ ) + k ∗ (t)λ̇∗ ]dt − λ∗ (T )kT∗ + λ∗ (0)k0∗ (43)
0

Teorı́a de Control Óptimo y la Economı́a 18


3 Teorı́a del Control Óptimo

Si se deriva esta expresión respecto de k0∗ y kT∗ se obtiene un primer resultado interesante.
Estas derivadas son:

∂Π∗

= λ∗ (0) (44)
∂k0

∂Π∗
= −λ∗ (T ) (45)
∂kT∗

En el primer caso podrı́a decirse que λ∗ (0) representa el incremento marginal de los
beneficios frente a un aumento de capital inicial, es decir, la sensibilidad del beneficio
óptimo respecto del stock de capital inicial. En el segundo caso, λ∗ (T ) puede interpretarse
como el opuesto de la tasa de cambio de los beneficios respecto al stock de capital final;
esto es, el sacrificio en términos de beneficios asociado a la no utilización de una unidad
de capital en el momento T . En términos generales, en cada momento del timepo t, λ∗ (t)
representa la sensibilidad de los beneficios óptimos frente a cambios en el stock de capital,
es decir, la tasa a la cual se aprecia (deprecia) una unidad de capital en el momento t.
Producto de esta interpretación, a la variable de coestado suele denominársela como valor
imputado o precio sombra.
Un segundo resultado de interés refiere al sentido económico del Hamiltoniano. Siguiendo
el ejemplo:

H = π(t, k, u) + λ(t)f (t, k, u) (46)


| {z } | {z }
I II

El primer sumando del lado izquierdo, I, representa los beneficios en el momento t


y dependen del capital corriente y la polı́tica tomada en dicho momento. El sumando
II se compone del producto entre el valor imputado al capital y la tasa de cambio del
mismo k̇. Dado que es un producto entre un componente fı́sico y un precio, el resultado es
un valor monetario, cuya interpretación usual es la “tasa de cambio del valor del capital
correspondiente a la polı́tica u”(traducción propia de Chiang, A., 1992, pág. 207). Repre-
senta por tanto una medida de los efectos sobre los beneficios futuros que tendrá cierta
polı́tica aplicada en el momento t. El Hamiltoniano es en definitiva una combinación de
dos efectos con perspectiva temporal distinta, y como el principio del máximo implica
su maximización, el planificador económico debe considerar ambos efectos. Se trata de
encontrar la combinación óptima entre los beneficios presentes derivados de cierta acción
y la potencial pérdida de beneficios futuros que ella conlleve. En términos matemáticos
esta idea puede verse mediante la maximización del Hamiltoniano respecto de u:

Teorı́a de Control Óptimo y la Economı́a 19


3 Teorı́a del Control Óptimo

∂H ∂π ∂f ∂π ∂f
= + λ(t) =0⇒ = −λ(t) (47)
∂u ∂u ∂u ∂u ∂u

En el óptmio, la polı́tica llevada a cabo de igualar el aumento marginal de los benficios


futuros contra la caı́da de los beneficios futuros a través de del cambio en el stock de
capital.
La tercera interpretación relevante se deriva de las ecuaciones de movimiento. Las mismas
aplicadas a este caso son:

∂H
k̇ = = f (t, k, u) (48)
∂λ

∂H ∂π ∂f (−1) ∂π ∂f
λ̇ = − =− − λ(t) =⇒ −λ̇ = + λ(t) (49)
∂k ∂k ∂k ∂k ∂k

Mientras que la primera describe la forma en que la variable de control afecta la trayectoria
del capital, la segunda ecuación muestra cómo la tasa depreciación del valor imputado
(−λ̇) debe igualarse a la suma de la contribución marginal del capital a los beneficios
presentes y de la contribución marginal del capital a su propia valorización. En otras
palabras, la condición a cumplir es que la depreciación del valor imputado del capital se
compense con la contribución del capital a los beneficios presentes y futuros.
Una última interpretación interesante del principio del máximo refiere a las condiciones
de transversalidad. En el caso de una lı́nea terminal vertical donde no se fija el valor
terminal de la variable de estado (k(T ) libre, T fijo), la condición de transversalidad
resultante era λ(T ) = 0. Esto implica que el valor imputado al capital en el momento
final de planificación debe ser 0. El sentido económico de este resultado es sumamente
razonable: razonando por el absurdo, si bajo estas condiciones al momento final el valor
marginal del capital fuese positivo, invertir una unidad adicional repercutirı́a en beneficios
positivos, por lo que la trayectoria elegida no serı́a óptima y se continuarı́a con la inversión.
En el caso de una lı́nea terminar horizontal (k(T ) fijo y T libre), la condición era [H]t=T =
0. Recordando la interpretación del Hamiltoniano, esta condición implica que para el
momento T resultante, la suma de beneficios presentes y futuro sea nula. Es decir, si se
llegase a dicho momento con el stock de capital prefijado y beneficios positivos, la elección
no serı́a óptima, pues continuar invirtiendo redundarı́a en mayores beneficios.

Teorı́a de Control Óptimo y la Economı́a 20


4 Referencias bibliográficas

4. Referencias bibliográficas
Allen, R.(1965) Economı́a Matemática. Aguilar.

Arrow, K. y Intriligator, M. (1984).Handbook of Mthematical Economics. Elsevier


Science Publishers.

Chiang, A. (1992). Elements of dynamic optimization. Capı́tulos 7 en adelante.


McGraw-Hill, Inc.

Chiang, A. y Wainwgright, K. (2006).Métodos Fundamentales de la Economı́a Ma-


temática. Cuarta Edición. McGraw-Hill, Inc.

Debreu, G. (1991).The mathematizaion of economic theory. The American Economic


Review.

Dorfman, R. (1969). An Economic Interpretation Optimal Control Theory.The Ame-


rican Economic Review.

Kamien,M. y Schwartz. (2001). N. Dynamic Optimization.. Sexta edición. Elsevier


Science Publishers.

Pulido, A. (2002). Posibilidades y limitaciones de las Matemáticas en la Economı́a.


N˚1. Instituto L.R Klein - Centro Stone. Facultad de Ciencias Económicas y Em-
presariales, Universidad Autónoma de Madrid.

Samuelson, P. (1952).Economic theory and mathematics. An appraisal.

Simon, C. y Blume, L. (1994). Mathematics for economists. W.W. Norton and Com-
pany.

Teorı́a de Control Óptimo y la Economı́a 21

Potrebbero piacerti anche