Sei sulla pagina 1di 23

Estratgias seqenciais subtimas para planejamento agregado

da produo sob incertezas


Oscar S. Silva Filho
CTI. Rod. D. Pedro I (SP 65) Km. 143,6. CEP 13081-970 Campinas SP Brasil. E-mail:
oscar@ia.cti.br

RESUMO
Dentro de uma cadeia de decises hierrquicas, uma grande parte dos problemas
dependente da componente tempo e fortemente influenciada por elementos perturbativos
tanto endgenos quanto exgenos. Estes problemas podem ser enquadrados dentro de uma
classe de problemas de controle timo estocstico. As dificuldades para gerar uma soluo
tima malha-fechada fazem com que se busque outros procedimentos alternativos. Neste
artigo, quatro destes procedimentos so analisados quanto a suas propriedades estruturais.
Um estudo de caso, com foco no problema de planejamento agregado da produo,
considerado com o propsito de comparar as solues timas fornecidas pelo procedimento.
A soluo com melhor desempenho considerada para anlises de cenrio, que tem por
objetivo ajudar a gerncia a ter uma viso de longo prazo quanto ao uso dos recursos
materiais da firma.
Palavras-chave: controle timo, sistemas dinmicos, procedimento subtimos,
programao dinmica, planejamento da produo.

ABSTRACT
Within a hierarchical decision chain, a major part of problems is dependent on the time
component and strongly sensitive to endogenous and exogenous components. These
problems can be related to an important class of stochastic optimal control. Difficulties to
provide a closed-loop policy for them, lead to look for sub-optimal alternatives. In this
paper, four different sub-optimal procedures are investigated in relation to their structural
properties. A case study, based on an aggregated production planning problem, is
considered with the purpose of comparing the different procedures. The best one is used to
provide managerial scenarios about the future use of material resources of the firm.
Key words: optimal control, dynamic systems, sub-optimal procedures, dynamic
programming, production planning.

1. Introduo
A necessidade de adotar decises mais ajustadas com os objetivos de produo tais
como: melhorar produtividade, reduzir desperdcios e ociosidade, minimizar custos, dentre
outros tem propiciado um ambiente frtil para aplicaes de metodologias qualitativas e
quantitativas de soluo de problemas industriais. Particularmente, no que tange a
metodologias quantitativas, verifica-se que tcnicas matemticas provenientes da teoria de
controle e pesquisa operacional passam a ter um espao importante como ferramentas
gerenciais para soluo de problemas da rea de produo. SURI (1985), GERSHWIN et al.
(1986) e SINGHAL et al. (1987) fornecem uma viso interessante das possibilidades de
aplicao de tcnicas quantitativas, no-seqenciais e seqenciais, na soluo de problemas
gerenciais.
Tcnicas quantitativas no-seqenciais, como as baseadas em programao matemtica,
vm sendo utilizadas em larga escala, para ajudar gerentes no processo de tomada de
deciso. Entretanto, para alguns problemas prticos, estas tcnicas apresentam uma sria
deficincia, que a de no conseguir refletir a caracterstica dinmica do processo de
deciso. Um exemplo disto o planejamento agregado da produo onde, para cada
perodo de tempo, as necessidades sobre o uso dos recursos materiais agregados da firma
devem ser revistas e ajustadas. De fato, as tcnicas no-seqenciais fornecem uma viso
limitada do processo de produo, pois assumem uma situao em que o processo
produtivo visto no tempo como se estivesse em estado de regime permanente, ou seja,
livre do efeito adverso das perturbaes do ambiente. Normalmente, esta uma falsa
suposio, basta para isto considerar as incertezas sobre as flutuaes de demanda em
horizontes de mdio e longo prazo.
Tcnicas quantitativas seqenciais, por seu turno, envolvem um grande nmero de
variveis inter-relacionadas de uma forma complexa atravs de um sistema dinmico, ao
qual esto incorporadas as incertezas do ambiente. Este sistema pode ser descrito na forma
entrada-sada, onde as entradas so selecionadas, seqencialmente no tempo, aps a
observao das sadas passadas, usando algum esquema de realimentao. Esta uma
caracterstica extremamente interessante que pode ser explorada em muitos problemas
gerenciais.
possvel definir, de uma maneira geral, as decises gerenciais como sendo atividades de
planejamento sobre o tempo, sob efeito de incertezas. Esta definio conduz a necessidade
de considerar modelos matemticos que incorporem tanto a componente tempo quanto a
componente perturbao. A teoria de controle timo estocstico lida com problemas
envolvendo decises dinmicas sob incertezas e suas tcnicas tanto analticas (BRYSON &
HO, 1975) quanto seqenciais (BERTESEKAS, 1995) podem oferecer uma importante base
ferramental para o processo de tomada de deciso em quase todos os nveis da hierarquia
da cadeia de produo, veja para detalhes (GERSHWIN et al., 1986).
Basicamente, os objetivos deste trabalho so formular uma classe de problemas de controle
timo estocstico seqencial orientado modelagem de problemas de planejamento da
produo e discutir alguns procedimentos subtimos de soluo. Esta classe de modelos
pode contemplar problemas das mais diferentes reas do conhecimento; em particular, ela
de grande interesse em reas gerenciais, como: Finanas, Marketing, Propaganda,
Controle de Estoque, Transportes e Planejamento da Produo (SETHI, 1978; RAO &
SCHENELLER, 1990 e SHEN, 1994).
O problema de controle timo estocstico, em questo, pode ser descrito pela composio
das seguintes partes:
(a) um sistema discreto no tempo caracterizado por uma dinmica linear estocstica
(equao de balano estoque-produo com incertezas sobre a demanda futura);
(b)um custo funcional geral, tomada em esperana matemtica (custo mdio de produo),
e
(c)restries de chance nas variveis de estado (estoque) e de controle (produo).
O propsito ento determinar uma poltica seqencial tima de controle que minimize (b)
quando sujeito a (a) e (c). Considerando que, a cada perodo de tempo, esta poltica possa
empregar informaes correntes do estado do sistema (a), via algum mecanismo de
realimentao, ento, ela dita ser uma soluo tima malha-fechada. Entretanto, desde
que este problema de natureza bastante complexa em virtude de fatores como:
incerteza, dimenso, restries nas variveis de deciso e a dinmica do processo uma
soluo malha-fechada s ser possvel em casos muito particulares. Por exemplo: quando
o critrio em (b) quadrtico e as restries em (c) so consideradas ilimitadas; neste
caso, possvel obter uma soluo tima malha-fechada para o problema usando a equao
matricial de Riccati (BRYSON & HO, 1975). Outras possibilidades de soluo tambm de
abrangncia limitada so discutidas em NECK (1984).
Sendo possvel, por outro lado, assegurar requisitos de separabilidade ao custo funcional, o
algoritmo de programao dinmica estocstica passa a ser a melhor opo para se obter
uma soluo tima malha-fechada para este problema. Entretanto, o emprego deste
algoritmo est limitado a problemas de pequena dimenso, pois estes, pelo menos
teoricamente, no requerem grande capacidade de carga computacional para serem
resolvidos. Uma vez que a maioria dos problemas prticos so multidimensionais, torna-se
necessrio procurar tcnicas alternativas, com caractersticas seqenciais, para tratar este
tipo de problema. Um dos caminhos, sugerido na literatura (BERTESEKAS, 1995), a
simplificao do problema estocstico original, de modo a permitir o emprego de
procedimentos de mais simples soluo. O preo pago, ao aplicar tais simplificaes, que
se abre mo da busca da soluo tima malha-fechada; obtendo-se, na verdade, solues
quasi-timas (subtimas).
Existe uma enorme variedade de procedimentos que conduzem a solues subtimas,
sendo difcil classific-los ou analis-los de uma maneira unificada (veja para detalhes
KLEINDORFER, 1978; SHEN, 1994 e BERTESEKAS, 1995). Em geral, estes algoritmos agem
no sentido de conseguir uma melhor eficincia computacional preservando as propriedades
estruturais do problema original. Alguns destes procedimentos sero investigados neste
trabalho e suas aplicaes particulares gerao de planos agregados da produo sero
objeto de um estudo de caso.
As sees seguintes discutem os seguintes assuntos: a seo 2 traz uma rpida viso da
cadeia hierrquica de decises no contexto de planejamento da produo. Ela ajudar a
localizar a rea de interesse neste estudo. Seo 3 apresenta a formulao matemtica do
problema de controle timo estocstico seqencial. Seo 4 discute estratgias para reduzir
a complexidade do problema estocstico. Seo 5 discute um modo de transformar as
restries probabilsticas, definidas no problema estocstico, em equivalentes
determinsticas, permitindo assim o uso delas diretamente nas formulaes dos
procedimentos a serem discutidos nas sees subseqentes. Seo 6 emprega o algoritmo
de programao dinmica estocstica como um caminho para determinao de uma poltica
tima malha-fechada para o problema estocstico. Seo 7 introduz alguns procedimentos
subtimos que podem ser utilizados como soluo aproximada para o problema estocstico.
Por fim, a seo 8 apresenta um estudo de caso onde, a partir de um problema de
planejamento agregado da produo monoproduto, os procedimentos da seo 7 so
aplicados e suas solues comparadas com a soluo tima malha fechada. Inclui-se, neste
estudo, um esquema de simulao onde a nfase gerar cenrios que permitam gerncia
obter informaes antecipadas sobre o uso futuro dos recursos materiais da empresa.
2. Planejamento da Produo: Viso Hierrquica
Uma grande quantidade de decises, consideradas no planejamento da produo, usada
para ajustar os recursos materiais da empresa para satisfazer as flutuaes de demanda ao
longo dos perodos de tempo. possvel dizer que o propsito do planejamento da produo
estabelecer taxas de produo de modo a atingir metas gerenciais. Manter os recursos de
produo relativamente estveis dentro do horizonte de planejamento uma destas metas.
No contexto de planejamento da produo, o processo de tomada de deciso somente pode
ser descrito por meio de uma estrutura hierrquica. Sucintamente, esta hierarquia consiste
de trs nveis distintos, porm altamente interativos, a saber (HAX & CANDEA, 1984):
Estratgico, Ttico e Operacional. A Tabela 1 resume alguns fatores que diferenciam estes
nveis de deciso. Pode ser verificado, a partir dela, que as decises tomadas nos nveis
Estratgico e Ttico so fortemente baseadas em padres de agregao dos dados de
produo. Muitas vezes, esta agregao responsvel pela reduo na dimensionalidade
dos problemas de produo. Este uma das razes que explicam por que pesquisadores, da
rea de teoria de controle, podem encontrar grandes oportunidades de aplicao de
metodologias de otimizao seqencial em problemas existentes nestes dois nveis, como
alertado em GERSHWIN (1985).

Este trabalho focaliza um importante tipo de problema de planejamento da produo
encontrado no nvel Ttico. Dentro deste nvel, uma das primeiras aes gerenciais
desenvolver um plano de produo (NELLEMANN & HARMON, 1986). Ele deve ser visto
como um guarda-chuva para o processo de produo como um todo, uma vez que ele cobre
todas as aes subseqentes das atividades de planejamento e tambm fornece
informaes para realizao do Plano de Negcio (APICS, 1994).
O plano de produo usado como alvo a ser seguido pelos gerentes durante o
desenvolvimento do planejamento detalhado. Esta caracterstica est ilustrada na Figura 1.
De modo genrico, o que se pretende mostrar com a Figura 1 o intenso fluxo de
informao entre os planejamentos agregado e detalhado da cadeia hierrquica. Neste
sentido, deve-se observar que no mdulo de planejamento agregado toma-se informaes
sobre a demanda prevista e sobre os recursos materiais agregados disponveis, para gerar o
plano de produo. Isto sugere um esquema de realimentao onde qualquer inconsistncia
do plano, quando de sua aplicao no nvel de planejamento detalhado, prontamente
revista.

Este plano pode ser estabelecido a partir de um problema de otimizao no seqencial (ou
seja, do tipo esttico). No entanto, como dito antes, este tipo de soluo no captura a
dinmica do processo de produo. Conseqentemente, ela fornece apenas alvos
congelados de produo que podem ser desastrosos quando aplicados diretamente cadeia
de decises da empresa. Portanto, na formulao do problema deve ser levado em conta a
dinmica e as incertezas do processo de produo. Neste caso, a teoria de controle timo
estocstico pode proporcionar planos de produo mais confiveis para utilizao na cadeia
hierrquica de decises. Nas sees seguintes discutem-se aspectos relacionados com a
formulao de um problema de controle timo estocstico e seus possveis esquemas de
soluo.
3. Formulao do Problema de Controle timo Estocstico
Seja um sistema linear estocstico a tempo discreto, o qual pode representar uma
variedade de processos reais, dentre estes, processos de produo por equaes de balano
econmico de estoque (KLEINDORFER & GLOVER, 1973):

(1)
onde Ae9
nxn
denota a matriz do sistema e Be9
nxm
denota a matriz de acoplamento do
sistema (por exemplo, cada linha desta matriz contm a seqncia de mquinas
responsveis pela produo de um determinado produto), x(k)e9
n
denota o vetor de estado
do sistema (contendo, por exemplo, informaes sobre os nveis de estoque de cada um dos
"n" produtos), u(k)e9
m
denota o vetor de controle do sistema (que contm os nveis de
capacidade de cada uma das "m" mquinas envolvidas na produo de cada um dos "n"
produtos); e d(k)e9
n
denota o vetor perturbao do sistema (que contm os nveis de
flutuao da demanda de cada um dos "n" produtos). Via de regra, d(k) descrito por um
vetor de variveis aleatrias independentes, com distribuio de probabilidade conhecida ao
longo dos perodos do horizonte de planejamento. Assume-se ainda que, durante a evoluo
da equao (1), as variveis de estado e controle esto sujeitas a adotarem valores dentro
de intervalos definidos pelos seguintes espaos X
k
={x
k
<x(k)<
k
} e U
k
={u
k
<u(k)<
k
}.
Devido a natureza estocstica de (1), o tratamento dado a este tipo de restrio a
penalizao no critrio. Entretanto, uma forma mais realista de preservar estas restries
explicitamente no modelo, garantindo a factibilidade das decises, assumi-las em
probabilidade, ou seja, consider-las como restries de chance. (Para maiores detalhes,
vide CHARNES & COOPER, 1959 e LASSERE et al., 1985).
Com as consideraes acima, pode-se formular uma importante classe de problemas de
controle timo estocstico seqencial, descrito como segue: dado um vetor de estado inicial
x(0)e9
n
, deseja-se determinar uma poltica de controle timo que resolve o seguinte
problema:

(2)
onde o=[o
1
o
2
... o
n
] e =[
1

2

m
] representam vetores de medidas de probabilidade
selecionados na faixa [0, 1). Dependendo do tipo de problema, estas medidas tm
significados diferentes, por exemplo em problemas de planejamento da produo, elas
denotam respectivamente: (i) a maior ou menor expectativa do decisor (gerentes da firma)
em atender os pedidos dos clientes nas datas combinadas para cada um dos "n" produtos e
(ii) estratgias para avaliao do uso da capacidade de produo disponvel (nveis de
ociosidade e de sobrecarga de cada uma das "m" mquinas). Veja para detalhes GONEDES
& LIEBER (1974).
O problema (2) um problema tipicamente seqencial e, por conseguinte, no pode ser
tratado como um problema esttico (ou seja, como um problema cuja soluo obtida em
um nico-estgio), pois as informaes disponveis, ao longo dos perodos, sobre o estado
do sistema, influenciam fortemente sua soluo tima. As caractersticas bsicas de (2)
ou seja: sua estrutura combinatorial ao longo dos perodos, as restries nas variveis de
estado e controle, a possibilidade de no linearidade do custo funcional, e a dinmica
estocstica do sistema fazem com que este problema seja extremamente difcil de
resolver e, com raras excees, todo o maquinrio de tcnicas disponveis para tratar
problemas de controle timo incuo. Buscando-se uma soluo seqencial para o
problema (2), pode-se pensar no emprego do algoritmo de programao dinmica
estocstica (PDE), o qual, infelizmente, invivel para problemas de grande dimenso.
Note-se que a virtude do algoritmo PDE proporcionar uma soluo tima global para o
problema, pois usa toda informao disponvel nos espaos de factibilidade das variveis de
deciso do sistema (1) para gerar tal soluo. Devido a isto, a soluo fornecida por este
mtodo vem sendo empregada como benchmark para testar e comparar outras tcnicas
alternativas.
Em virtude das dificuldades de resolver o problema (2) por mtodos convencionais, tem-se
procurado, na literatura, associar estratgias tipicamente empregadas na teoria de controle
(como por exemplo: esquemas de realimentao) com os mtodos da programao
matemtica. Para este fim, adotam-se simplificaes na formulao do problema original
(2), obtendo-se verses aproximadas e equivalentes, mais simples de serem resolvidas e,
portanto, de baixo custo computacional. A idia por trs destas aproximaes tentar
preservar as propriedades estruturais do problema original de modo a garantir que a
soluo subtima gerada no divirja significativamente da soluo tima esperada. A
confiabilidade destas aproximaes no sentido de obter uma soluo subtima confivel
discutida em BITRAN & YANASSE (1984).
O Valor da Informao Disponvel: quando o processo dinmico afetado por incertezas
(por exemplo: as flutuaes aleatria da demanda), as informaes disponveis, a cada
perodo de tempo, tornam-se vitais para garantir a confiabilidade da soluo do problema
de controle. Neste trabalho assume-se que as informaes necessrias para o processo de
tomada de deciso so perfeitamente conhecidas por meio das medidas do estado x(k) e do
controle u(k). Note-se que imprecises nestas medidas impem a utilizao de algum tipo
de mecanismo de estimao da informao (por exemplo, um observador de estado ou filtro
de Kalman, veja BRYSON & HO, 1975), o que implicar na elevao do grau de dificuldade
da soluo do problema (2). Muitos procedimentos subtimos j trazem implicitamente
esquemas que utilizam a informao disponvel para ajustes da poltica tima. Vistos no
tempo, estes procedimentos agem de uma maneira que lembra os esquemas tipo "horizonte
deslizantes" empregados para ajustar as solues geradas por problemas de otimizao
determinsticos (LASSERE et al., 1985). Alguns destes procedimentos sero discutidos na
seo 7, antes, porm, importante apresentar algumas caractersticas bsicas de reduo
de complexidade do problema (2) e, tambm, apresentar o algoritmo de programao
dinmica que ser utilizado na implementao algortmica dos procedimentos.
4. Estratgias Aproximativas
O objetivo desta seo discutir alguns esquemas aproximativos adotados para simplificar
o problema (2). A soluo tima gerada pelo problema modificado uma soluo quasi-
tima para o problema original. Como ser visto frente, a capacidade de adaptabilidade de
uma estratgia aproximativa a garantia de solues subtimas mais prximas do timo
global. Basicamente pode-se destacar quatro tipos de aproximaes para a classe de
problemas do tipo definido em (2), a saber (KLEINDORFER, 1978):
i) Aproximaes do Critrio e da Dinmica do Sistema: em geral, adota-se as sries de
Taylor para eliminar caractersticas no-lineares existentes nas funes de custo e nas
equaes do sistema dinmico. Em particular, linearizaes de funes so introduzidas via
aproximaes de primeira ordem enquanto que funes quadrticas o so via aproximaes
de segunda ordem. interessante observar que este tipo de estratgia viabiliza o uso de
tcnicas de programao linear e quadrtica, muito empregadas na prtica.
ii)Discretizao do Espao das Variveis de Deciso: as tcnicas de discretizao so
estratgias adotadas para converter problemas estocsticos seqenciais complexos, como o
proposto em (2), em uma seqncia de subproblemas mais simples, com um nmero finito
(contvel) de estados, controle e perturbaes. O algoritmo de programao dinmica
usurio deste tipo de aproximao. importante observar que quando os espaos das
variveis envolvidas esto restritos a conjuntos finitos, a tcnica de discretizao conduz a
bons resultados, principalmente quando o passo de discretizao (Ap) muito pequeno,
algo prximo de zero (BERTESEKAS, 1995). Entretanto, neste caso sempre existir um
compromisso na escolha do Ap. De fato, valores muito pequenos de Ap, embora conduzam a
solues mais refinadas, podem ser a causa de uma possvel instabilidade numrica do
algoritmo, alm de envolver um alto custo computacional. Por outro lado, para valores
muito altos de D p, a soluo gerada pode apresentar-se distorcida em relao soluo
tima malha-fechada. Neste sentido, encontrar um valor de compromisso para Ap uma
atividade importante nesta estratgia (BERTESEKAS, 1995).
iii) Regras de Deciso Lineares: neste caso a idia desenvolver uma estrutura funcional
simples para representar a poltica de controle do sistema. Por exemplo, pode-se assumir
que esta poltica depende linearmente das medidas de estado. Neste caso, pode-se utilizar
um ganho timo linear que, quando excitado por medidas de estado observadas do sistema,
fornea uma poltica de deciso a ser aplicada ao sistema. Em geral, este tipo de estratgia
utilizada conjuntamente com a soluo de um problema equivalente a (2), porm
essencialmente determinstico. Na subseo 7.4 discute-se o procedimento Parcialmente em
Malha-Fechada (PMF) usurio desta estratgia. Outros detalhes sobre regras de deciso so
encontrados em HAX & CANDEA (1984) e HAY & HOLT (1975).
iv)Aproximaes no Uso da Informao Disponvel: este tipo de aproximao diz respeito ao
modo como a estratgia de controle, a ser adotada, utiliza as informaes observadas a
partir do processo fsico. Resumidamente pode-se citar 4 estratgias, que do origem a
dezenas de outras:
a. Estratgia Malha-Fechada (EMF): neste tipo de estratgia, procura-se preservar a
natureza estocstica do problema, desenvolvendo para isto uma lei de controle que
considera todas as informaes disponveis sobre as variveis de deciso que compem o
sistema dinmico. Estas informaes so utilizadas para gerar uma poltica tima malha-
fechada como soluo do problema. Em problemas de controle estocstico com restries,
como o formulado em (2), somente solues numricas so possveis de ser encontradas, a
partir da aplicao do Princpio da Otimalidade (BERTESEKAS, 1995). Neste caso, uma
soluo tima malha-fechada para (2) pode ser obtida via algoritmo de programao
dinmica estocstica.
b. Estratgia Malha-Aberta (EMA): neste caso, tem-se um problema essencialmente
determinstico, geralmente definido fixando a varivel de perturbao em um valor
previamente conhecido (por exemplo, quando a demanda por produtos fixada nas
previses de vendas ou em mdias mensais previamente extradas de histricos de
vendas). Como conseqncia, o operador esperana matemtica relacionado com o custo e
os operadores probabilsticos das restries de chance perdem sentido na formulao (2) e
o problema estocstico torna-se um problema essencialmente determinstico. Deste modo,
quaisquer mtodos aplicveis da programao matemtica podem ser utilizados como
tcnica de soluo. Duas situaes podem ocorrer no emprego desta estratgia, a saber:
(b.1) Estratgia Malha-Aberta Sem-Observaes (MASO): nesta estratgia, o controle
considera as informaes disponveis somente no perodo inicial do horizonte de tempo (i.e.,
k=0), quaisquer outras informaes observadas nos perodos subseqentes so
completamente ignoradas. Note-se que neste tipo de estratgia o problema determinstico
resolvido de uma nica vez, ou seja, em um nico estgio. Portanto, este problema no-
seqencial (ou seja, esttico) e (b.2) Estratgia Malha-Aberta Com Observaes (MACO):
idntica estratgia da situao anterior, s que neste caso as observaes disponveis ao
longo dos perodos so empregadas na soluo do problema. Isto significa que para um
dado perodo k, to logo seja observada uma nova medida do estado (nvel de estoque) do
sistema, esta ser utilizada como condio inicial na soluo do problema determinstico
dentro do horizonte de planejamento [k, N]. O problema, neste caso, resolvido num total
de N vezes. Exemplo de um procedimento que emprega esta estratgia o "Naive Feedback
Controller" (NFC) que ser analisado na subseo 7.3.
c. Estratgia do Modelo Estatisticamente-Equivalente (EME): esta estratgia adota as
informaes estatsticas relacionadas ao processo dinmico estocstico (1) com objetivo de
reduzir a complexidade do problema. A funo distribuio de probabilidade associada ao
processo (1) geralmente empregada no processo de simplificao do problema estocstico
(2). Assumindo-se, por exemplo, (1) como sendo um processo Gaussiano, pode-se resumir
toda a informao estatstica necessria ao processo de simplificao de (2), exatamente,
na evoluo temporal do primeiro e segundo momento estatstico (ou seja, mdia e
varincia de (1)). Assim, com esta informao conhecida ao longo do tempo pode-se
converter o problema estocstico em um equivalente determinstico que preserva suas
principais caractersticas estatsticas (SILVA FILHO, 1999 e LASSERE et al., 1985).
interessante acrescentar que a estratgia EME um refinamento da estratgia EMA. Este
procedimento pode tambm ser empregado de dois modos distintos: (c.1) considerando a
estimativa de estado no instante inicial (k=0) e ignorando-se quaisquer futuras
observaes. Esta estratgia, denominada EESO, equivalente a MASO. Como ser visto
frente (subseo 7.4), o procedimento conhecido como Parcialmente em Malha-Fechada
(PMF) utiliza este tipo de estratgia; e (c.2) considera-se neste modo que, para cada novo
perodo k, o estado medido a partir do sistema (1) e utilizado como condio inicial para
soluo do problema determinstico equivalente na faixa de tempo [k, N]. Este
procedimento repete-se para cada novo perodo de tempo, assim, ao todo, o problema
equivalente resolvido N vezes. Denomina-se esta estratgia de EECO e ela semelhante
ao MACO. Um procedimento que emprega a estratgia EECO o "Open-Loop Feedback
Controller OLFC," a ser analisado na subseo 7.3.
Comentrios Gerais: interessante observar que quando o sistema linear sem restries
com o custo quadrtico, a lei de controle gerada pela estratgia EME anloga obtida pela
EMF e MACO. Outra caracterstica importante destas estratgias diz respeito caracterstica
"adaptabilidade" da soluo tima gerada por estas estratgias (BERTESEKAS, 1995). A
seguir define-se o significado desta caracterstica.
O Conceito de Adaptabilidade: sejam J
EMF
e J
EMA
respectivamente os valores timos do custo
funcional relacionados com as estratgias de soluo malha-fechada e malha-aberta (EMF e
EMA) para o problema estocstico (2). Segue ento a afirmativa de que o custo timo
gerado por tais estratgias ser sempre J
EMF
<J
EMA
. Isto uma conseqncia do fato de que
a classe de estratgias que no levam em conta as medidas observadas (malha-aberta)
um subconjunto da classe de estratgias que tiram vantagens das observaes (isto ,
usam esquemas de realimentao). Com base nisto, de se esperar que muitas estratgias
subtimas, que levam em conta as medidas do sistema, sejam considerados aceitveis
somente se o seu correspondente valor de custo funcional J
(.)
satisfazer a seguinte condio
(SILVA FILHO, 1998): J
EMF<
J
(.)<
J
EMA
. Neste caso, a estratgia denominada de quase-
adaptativo. No caso da desigualdade da direita ser estrita, diz-se que o controlador
adaptativo, o que leva classe dos controladores "auto-ajustveis" (ASTRON, 1970).
Analisando-se agora as estratgias apresentadas acima, sob a luz da caracterstica
adaptabilidade, possvel concluir antecipadamente que os custos timos obedecero a
seguinte escala de valor: J
EMF
<J
EECO
<J
MACO<
J
EESO
<J
MASO
. Da conclui-se que o uso de
informao disponvel garantia de melhorar a poltica tima de soluo do problema.
Antes de apresentar alguns dos procedimentos subtimos, encontrados na literatura, que
facilitam a soluo do problema (2), discute-se, nas sees seguintes, aspectos
relacionados com a aproximao das restries probabilsticas por equivalentes
determinsticos e a formulao do problema estocstico via algoritmo de programao
dinmica estocstica.
5. Restries Probabilsticas
Em problemas estocsticos a incluso de restrio nas variveis de estado e controle
aumenta enormemente a complexidade do problema. De fato, uma vez que a dinmica do
sistema um processo estocstico, no possvel garantir factibilidade da soluo frente s
restries impostas. Em outras palavras, pode ocorrer que para um dado perodo de tempo
k, alguns dos limitantes das restries de estado e controle sejam violados. Uma maneira
de contornar esta dificuldade adotar algum esquema de penalizao destas restries
associada ao critrio (MINOUX, 1983). A tcnica de penalizao, no entanto, exige certos
ajustes nos parmetros de penalizao, por meio de tentativa e erro, tornando o problema
totalmente dependente dos mesmos. Uma maneira de superar esta dificuldade considerar
as restries em probabilidade, como apresentado em (2). A seguir analisa-se um modo de
transformar as restries probabilsticas em uma equivalente determinstica que preserva
suas principais caractersticas estatsticas.
Seja o sistema dinmico linear estocstico dado em (1). Assume-se que a varivel aleatria
d(k) tem uma funo distribuio de probabilidade u
d,k
do tipo Gaussiana, com mdia (k)e
varincia finita Var(d(k)) = V
d
(k)>0, conhecidos para todos os perodos k. Note-se que com
esta suposio no h perda de generalidade, pois na prtica muitos processos estocsticos
podem ser aproximados por um processo do tipo Gaussiano (PARLAR, 1985). Assume-se,
tambm, que a variabilidade da varivel de controle ao longo do tempo pequena o
suficiente (ou seja, V
u
(k)~0), para que se possa considerar desprezveis os riscos de
violao dos limites impostos por sua restrio, ou seja, V
u
(k)~0 Prob.(u(k)eU
k
)>
u(k)eU
k
, . Com base nos pontos acima segue o seguinte lema:
LEMA: sejam |
1
e |
2
medidas de probabilidade, a serem definidas pelo projetista, segue,
ento, que a restrio Prob. {x(k+1)eX
k+1
}>o pode ser considerada na forma:

(3)
de onde se obtm que o<|1+|2-1.
Prova: segue da definio de probabilidade que (PAPOULIS, 1991),


comparando este resultado com (3) deduz-se que o<|
1
+|
2
1.o
A partir deste lema, nota-se que o valor de o , escolhido a priori pelo projetista, uma
funo linear das medidas |
1
e |
2
. Ela funciona tambm como um limite mnimo para
seleo destas medidas. Por simplicidade, assume-se que |
1
=|
2
=|, o que implica em o<2|
1. Deste modo, desde que o e [0,1),o valor de | dever ser escolhido na faixa [1/2, 1). A
partir deste resultado e usando a equao dinmica (1), pode-se reescrever (3) como
segue:

(4)
onde c
k
=(d(k)- (k))/V
d
(k) denota uma varivel aleatria Gaussiana normalizada, com a
mesma distribuio de d(k), ou seja u
d,k
, porm com mdia zero. Assumindo-se, ento que
a distribuio inversa existe, pode-se chegar ao seguinte resultado:

(5)
Este resultado mostra que possvel gerar um espao de factibilidade para a varivel de
controle que depende do estado observado no perodo k e da medida de probabilidade b .
Os limites mnimo e mximo deste espao esto definidos em (5) . Deve-se notar que a
matriz pseudo-inversa (BB
T
)
-1
deve ser positiva definida para evitar a degenerao deste
espao, ou seja, evitar que ocorra de u(x(k),|)> (x(k),|), para algum k. Por fim,
comparando-se o espao definido em (5) com o espao fsico U
k
, definido na seo 3,
chega-se ao subespao U
|
(x(k)), cujos limites mnimo e mximo so dados por:

(6)
Uma importante propriedade deste subconjunto est na sua dependncia ao valor da
medida |, por exemplo, sejam |
1
e |
2
, duas medidas de probabilidade, escolhidas na faixa
[1/2,1), segue que:U
|2
(x(k))_U
|1
(x(k))k, se |2>|1 .Isto significa dizer que quanto maior o
valor de | , mais restritivo ficao subespao U
|
(x(k)) e por conseguinte a soluo do
problema tender a fornecer custos muito elevados (SILVA FILHO & CEZARINO, 1999).
6. Programao Dinmica Estocstica
Uma poltica de controle tima para o problema (2) pode ser obtida por meio do algoritmo
de programao dinmica estocstica (PDE), tcnica desenvolvida na dcada de 50 por
Richard E. Bellman (BELLMAN, 1957). Neste sentido necessrio que a funo custo do
problema admita a condio de separabilidade, veja BERTESEKAS (1995) e MEIER III et al.
(1971). Aceita esta condio, por mais complicado que possa ser o problema, ele pode ser
decomposto em uma srie de subproblemas que so resolvidos recursivamente para cada
um dos perodos do horizonte de tempo. A recurso empregada pelo algoritmo pode ser
tanto forward quanto backward no tempo, sendo que para problemas seqenciais
estocsticos, a segunda a mais adequada. A principal desvantagem deste algoritmo est
no alto preo pago, tanto em memria quanto em tempo de processamento computacional,
para resolver problemas de grande dimenso.
A dificuldade acima no afeta o objetivo principal deste trabalho que o de adotar a soluo
tima malha fechada, gerada pelo algoritmo PDE, para compar-la com as solues obtidas
pelo emprego de procedimentos alternativos no problema (2).
6.1 Soluo tima Malha-Fechada via Algoritmo PDE (MF-PDE)
Seja ento o problema (2), incluindo agora a restrio definida em (6):

(7)
Com o custo funcional em (2) satisfazendo a condio de separabilidade no tempo, pode-se
aplicar o Princpio da Otimalidade (MEIER III et al., 1971) ao problema (7), obtendo-se uma
srie de subproblemas que so resolvidos recursivamente. Este procedimento dado como
segue:
Considere que no perodo k, o estado x(k) seja exatamente conhecido, ento a poltica
tima de controle capaz de levar o estado do sistema do perodo k at o perodo final N,
aquela que resolve o seguinte subproblema:

(8)
Supondo-se ento que a seqncia aleatria {d(i), i = k, ..., N-1} seja independente, pode-
se rescrever (8) como segue:


permitindo assim escrever que,

(9)
onde (9) representa a equao recursiva da programao dinmica, sendo resolvido
backwardno tempo, a partir de uma condio terminal fixada para o custo funcional, isto ,
J(x(N))=f(x(N)).
Resumindo: aplicar a tcnica PDE ao problema (7) significa implementar e resolver
recursivamente o seguinte algoritmo:

(10)
Como soluo de (10) obtm-se uma poltica tima de controle malha-fechada, dada por:

(11)
onde
k
():9
n9m
denota a relao funcional do controle ao valor corrente do estado do
sistema, para cada perodo k. O valor timo do custo funcional dado por J
*
=J
0
(x(0)), para
uma dada condio inicial x(0) definida pelo projetista.
7. Procedimentos Subtimos
A dificuldade de se obter uma soluo tima malha-fechada para o problema (2) tem levado
busca de procedimentos que produzem solues aproximadas ou subtimas (NECK,
1984). Estes procedimentos tomam por base simplificaes impostas estrutura original do
problema, possibilitando assim o emprego de tcnicas de otimizao antes inviveis. Nesta
seo analisa-se quatro tipos distintos de procedimentos subtimos. Estes procedimentos
distinguem-se pela forma com que utilizam as informaes disponveis observadas sobre o
estado do sistema e sobre as estatsticas relacionadas com as distribuies de probabilidade
da varivel perturbao.
7.2 Procedimento MVC (Mean-Value Controller)
Este procedimento apia-se no princpio da equivalncia-certeza (THEIL, 1957), que assume
que toda informao disponvel sobre as variveis de estado e perturbao est fixada em
seus respectivos valores mdios. Por conseguinte, o problema (2) pode ser aproximado por
um problema determinstico, cuja soluo pode ser obtida por meio de alguma tcnica da
teoria de controle moderno, como por exemplo o Princpio do Mximo de Pontryagin
(PARLAR, 1985) ou de algum mtodo aplicvel da programao matemtica (LASSERE et al,
1985). Note-se que esta soluo seria tima malha-fechada para o problema estocstico
(2), caso o comportamento das flutuaes de demanda, para os perodos futuros, ocorresse
exatamente igual aos valores mdios estimados para demanda.
Aqui neste trabalho adota-se o algoritmo de programao dinmica determinstica (PD)
como tcnica de soluo deste procedimento. Para tal, considere-se o problema (2)
centrado no valor mdio de suas variveis, isto , (k)=E{d(k)} (k)=E{x(k)} e
(k)=u(k), para todo k. Um ponto importante aqui que, sendo (2) determinstico, as
restries de controle e de estado no precisam ser tomadas em probabilidade. O
procedimento MVC com a utilizao do algoritmo de programao dinmica (PD) dado
como segue:

(12)
onde, (k)eU( (k))que tem os seguintes limitantes:


importante acrescentar que a soluo fornecida por (12) pode ser chamada de malha-
aberta, pois medidas observadas do estado real (corrente) do sistema so ignoradas
durante o processamento deste procedimento. Com isto pode-se dizer que ele opera
segundo a estratgia de simplificao MASO discutida na seo 4.
7.2 Procedimento NFC (Naive Feedback Controller)
A idia bsica deste procedimento considerar as incertezas do sistema fixadas em algum
valor conhecido, por exemplo, em seu valor mdio. Este procedimento distingue-se do
anterior pelo fato de que, em cada novo perodo de tempo k, ele aplica na entrada do
sistema uma lei de controle que leva em conta o estado real do sistema. Basicamente, o
procedimento NFC opera segundo os seguintes passos (SILVA FILHO, 1998):
(Passo 1) No incio do perodo k, o estado real do sistema (1) (isto , x(k)) observado.
(Passo 2) Esta informao empregada como condio inicial (isto , (i)=x(k)) na soluo
de uma verso determinstica equivalente ao problema (2), formulada via algoritmo PD
como segue:

(13)
(Passo 3) Uma vez que novas medidas do sistema no so permitidas, a soluo uma
seqncia de controle determinstica {(i),(i+1),,(N)}. Segue, ento, que o NFC adota
o primeiro elemento da seqncia u
*
(k)=(i) para atuar no sistema, ignorando os demais.
Por conseguinte, to logo uma nova medida de estado observada do sistema, no instante
i=k+l, o procedimento volta ao passo 2 e o problema (13) resolvido para o horizonte
i=k+1,,N.
Comentrios: Assim, tem-se que o procedimento NFC requer que a verso determinstica do
problema (2) seja resolvida um total de N vezes. Este procedimento opera segundo a
estratgia MACO discutida na seo 4.
7.3 Procedimento OLFC (Open-Loop Feedback Controller)
Oprocedimento OLFC preserva a natureza estocstica do sistema. Para isto ele leva em
conta as incertezas acerca de x(k) e d(k), quando calcula a varivel de controle u(k). Isto
torna este procedimento mais complicado que o NFC, pois necessrio conhecer as
distribuies de probabilidade da perturbao d(k) e do estado x(k). O procedimento pode
ser descrito pelos seguintes passos (SILVA FILHO & CARVALHO, 1998):
(Passo 1) Para cada instante k=0, 1, ..., N-1, to logo uma nova medida do estado do
sistema x(k) seja observada, atualiza-se o estado inicial =x(k).
(Passo 2) Com esta informao em mos, calcula-se a seguinte seqncia de controle {u(i),
u(i+l), , u(N-1)} atravs do algoritmo PD:

(14)
com a funo custo mdia calculada como segue,

(15)
onde u
x
denota a distribuio de probabilidade de estado, que calculada considerando a
natureza linear estocstica do sistema.
(Passo 3) Uma vez que novas medidas do sistema no so permitidas, a soluo uma
seqncia de controle determinstica {(i), (i+1),,(N)}; segue ento, como no
procedimento anterior, que o OLFC adota o primeiro elemento da seqncia u
*
(k)=(i) para
atuar no sistema, ignorando todos os demais elementos da seqncia. Por conseguinte, to
logo uma nova medida de estado observada do sistema, no instante i=k+l, o
procedimento volta ao passo 2 e o problema (14) resolvido para os perodos i=k+1, ..., N.
Comentrios: Deve-se notar que o OLFC distingui-se do NFC na medida que o custo timo
calculado usando as estatsticas relacionadas com as variveis aleatrias do critrio. Do
mesmo modo, o espao de controle leva em conta a natureza estocstica do problema u(i)
e U
|
(x(i)), sendo calculado de modo anlogo ao discutido na seo 5. Este procedimento
segue a estratgia de simplificao EECO, discutida na subseo 4.3.
Uma variante do OLFC, que permite obter resultados melhores, o POLFC (Partial Open-
Loop Feedback Controller). Este procedimento anlogo ao OLFC, a menos que ele utiliza
medidas futuras das incertezas quando disponveis (por exemplo, pelas previses). Para
ilustrar, considere o caso onde, dentro de um perodo de planejamento de N meses,
informaes sobre a demanda estaro disponveis somente para os primeiros M meses (M
<N). Conseqentemente, as decises sobre quanto produzir no perodo k=0 sero baseadas
no conhecimento de que possvel fazer correes nos nveis de produo para os prximos
M meses. No perodo k=1, existiro somente M-1 aes corretivas para o futuro e assim por
diante (vide BERTESEKAS, 1995).
7.4 Procedimento PMF (Parcialmente em Malha-Fechada)
A idia bsica adicionar um mecanismo de realimentao associado a uma poltica de
controle malha-aberta gerada a partir de um problema determinstico equivalente ao
problema (2) (para detalhes veja SILVA FILHO & VENTURA, 1999). Este problema
determinstico resultado da aplicao da estratgia simplificadora EE, discutida na
subseo 4.3. Por simplicidade, este esquema de realimentao pode ser dado por um
ganho linear G
k
, o qual ajustar as variveis de controle a cada perodo k, de modo a
corrigir possveis desvios dos estados, no perodo k+1, em relao aos nveis mdios timos
gerados a partir da soluo de um problema determinstico equivalente (SILVA FILHO,
1996). Segue, ento, uma breve descrio deste procedimento subtimo: seja uma regra
de deciso linear (RDL) para o problema (2) dada por:

(16)
onde (k) e (k)so obtidos resolvendo-se o seguinte problema determinstico equivalente:

(17)
onde F(.) so calculadas de modo anlogo a (15) e os limites mnimos e mximos dos
espaos de estado e controle dados respectivamente por (SILVA FILHO & VENTURA, 1999):

(18)


(19)
onde V
x
e V
u
representam as varincias do estado e controle respectivamente, que tem suas
funes distribuies inversas dadas por e . Note-se que para o uso deste
procedimento necessrio considerar toda informao estatstica disponvel relacionada
com as variveis de estado, controle e perturbao. Assumindo-se a hiptese de um
processo Gaussiano para a seqncia de variveis aleatrias d(k) e considerando ainda o
fato de a dinmica do sistema (1) ser linear, pode-se afirmar que toda a informao
estatstica, para efeito de derivao deste procedimento, resume-se no emprego da mdia e
varincia de cada uma das variveis envolvidas.
Uma questo particular aqui que as varincias de estado e controle, quando tomadas para
o sistema (1) sem o ajuste timo fornecido pelo regulador linear G
k
definido em (16), tm a
tendncia de crescerem ao longo dos perodos, atingindo seus respectivos valores mximos
no ltimo e penltimo perodo de tempo (isto , em V
x
(N) e V
u
(N-1)). Isto pode ser
explicado pelo fato de que, quanto mais distante do presente a deciso para ser tomada,
maiores so os riscos e as incertezas, devido principalmente s flutuaes aleatrias da
demanda. Uma conseqncia negativa disto que os espaos definidos pelos limites dados
em (18) e (19) tendem a estreitar-se, podendo ocasionar a degenerao de uma ou ambas
restries, tornando assim o problema (17) infactvel (SILVA FILHO, 1996). Para reduzir
este risco necessrio encontrar um ganho timo que minimize o crescimento no tempo
de ambas varincias. Para este fim, um problema de Varincia Mnima (ASTRON, 1970)
pode ser proposto:

(20)
onde V
x
(k+1) = (A+BG
k
)V
x
(k)(A+BG
k
)
T
+ V
d
(k) e V
u
(k)= V
x
(k)denotam a evoluo das
varincias e
k
denota o termo de compromisso entre as varincias de estado e controle.
Resolvendo-se (20) obtm-se uma representao analtica para o ganho linear que dada
por: G
k
= (B
T
A) [
k
I+BB
T
]
-1
, onde Ie9
nxn
denota a matriz identidade. Para escolha do
ganho timo , deve-se inicialmente determinar, por algum procedimento de busca, o
valor de
ke9+
que minimiza a soma acumulada dos valores das varincias de estado e
controle at os perodos k e k1, respectivamente, ou seja, Min(
k
)=V
x
(k)+V
u
(k1).
8. Estudo de Caso
Considere-se uma firma que produz uma grande variedade de produtos distintos, porm
bastante similares em termos do uso dos recursos de produo (ou seja, idntico uso da
capacidade de produo, aproximadamente o mesmo tempo de set-up, quantidade fixa de
mo-de-obra e flutuao de demanda estatisticamente similar). Com estas caractersticas,
torna-se possvel propor, com certa confiabilidade, a agregao deste diferentes produtos
em uma nica famlia de produtos. Assim, a idia desenvolver um plano timo de
produo multiperodo para esta famlia, que fornea os nveis timos de estoque e
produo resultantes da soluo do seguinte problema estocstico:

(21)
O objetivo deste plano fornecer uma viso ao gerente sobre o uso dos recursos agregados
da firma e portanto ajud-lo na tarefa de antecipar decises gerenciais que melhorem o
processo de tomada de deciso da cadeia de deciso como um todo. Os dados principais do
problema esto resumidos na Tabela 2.

importante acrescentar que para este estudo de caso, considerou-se tanto o quanto
iguais a . Isto significa que se assume o risco de obter solues infactveis, ou seja, que
violem os limitantes fsicos impostos pelas restries de estoque e produo (vide (21))
para algum k.
Com base nestes dados, pretende-se analisar numericamente o efeito da aplicao dos
diferentes procedimentos, estudados na seo 7, na soluo do problema de planejamento
(21). Os procedimentos aplicados so colocados na seguinte ordem: (a) procedimento
Malha-Fechada via PDE (MF-PDE); (b) procedimento MVC; (c) procedimento NFC; (d)
procedimento OLFC; e (e) procedimento PMF. Os procedimentos (b), (c), (d) e (e) tero
suas trajetrias subtimas de produo e estoque, alm do custo final obtido comparados
com os resultados da soluo tima malha-fechada (a).
Outro detalhe importante a ser considerado, relacionado aplicao do algoritmo de
programao dinmica, diz respeito ao passo de discretizao (Ap). Neste estudo adotou-se
Ap=1 para formar o grid de possibilidades relacionados aos espaos de estoque, produo e
demanda. Com isto, a faixa de variao que compreende os limites mnimo e mximo de
cada varivel de deciso do problema ser discretizada tendo como intervalo Ap=1.
8.1 Soluo Malha-Fechada via PDE (MF-PDE)
Para aplicao do algoritmo de PDE, deve-se inicialmente definir qual o espao de
variabilidade da demanda. Neste sentido, considera-se os dados fornecidos na Tabela 1
sobre a mdia e desvio padro da varivel de demanda d(k) e determina-se os seguintes
limites (mnimo e mximo) como segue: d(k)= (k)-2,58 e (k)= (k)+2,58 .
Desta forma garante-se uma concentrao em torno de 99% do espao de ocorrncia da
varivel aleatria d(k) (vide CHOU, 1972, pginas 105-110).
Aplicando-se ento o algoritmo (10) ao problema (21), segue que o custo timo da
operao foi de $ 1,560. As trajetrias timas de estado e controle relacionadas com esta
operao (ou seja, o plano timo de produo) so dados como ilustra a Figura 2.

8.2 Solues Geradas pelos Procedimentos Subtimos
Usando os resultados discutidos na seo 7, implementou-se os procedimento subtimos
pelo emprego do algoritmo de programao dinmica (PD). Com exceo do procedimento
MVC, os demais procuram tirar vantagem da informao disponvel, ou seja, eles usam o
nvel de estoque medido do sistema, no incio de cada ms, para atualizar suas respectivas
solues. Em particular o procedimento PMF mereceu um pouco mais de ateno, em
virtude dele requerer a determinao do ganho timo G
k
. Neste caso, o primeiro passo foi
calcular o valor timo do parmetro de ponderao
k
. Para isto, adotou-se um esquema de
busca, num intervalo de (0, +), visando minimizar a funo (
k
) = V
x
(k) + V
u
(k1),
definida a partir do problema (20). Os valores acumulados de V
x
(k) e V
u
(k-1) so
determinados a partir das seguintes equaes:

(22)
Sem perda de generalidade, foi assumido que =
N
k. A razo disto que o valor obtido
para
k
no perodo k=N contm a situao onde o crescimento das varincias dadas em (22)
atinge seu valor mximo, o que pode levar inviabilizao do procedimento PMF (vide
SILVA FILHO, 1996 para maiores detalhes). Como resultado, o valor timo obtido neste
processo de busca foi
*
=0.85, o que implicou em um ganho timo de G
*
()=0.46.
Anlise dos Resultados: a soluo Malha-Fechada, obtida pelo procedimento MF-PDE,
oferece uma soluo tima global para o problema (21), desde que escolhe dentro de todas
as possibilidades disponveis nos espaos das variveis de deciso do problema, aquela de
menor custo. Entretanto, como visto na seo 6, ela uma soluo cara e muitas vezes
invivel para problemas de grande dimenso. Deste modo, os procedimentos subtimos, em
particular aqueles que utilizam algum esquema de realimentao, so preferveis para
gerao de planos de produo. A Tabela 3 confirma esta caracterstica; a partir dela,
verifica-se que o procedimento malha-fechada apresenta o menor custo, enquanto que a
soluo malha-aberta MVC traz o custo mais alto. Conseqentemente, eles oferecem os
limites extremos para identificarmos qual o procedimento que apresenta a estratgia mais
adaptativa, como discutido na seo 4. Neste sentido, comparando-se os custos gerados
pelos procedimentos subtimos, apresentados na Tabela 3, conclui-se que:
J
MF<
J
PMF<
J
OLFC<
J
NFC<
J
MVC
. Assim, pode-se observar que o procedimento mais adaptativo, ou
seja de melhor desempenho, foi o PMF. Isto no deve causar surpresa, haja visto que ele
utiliza um mecanismo de realimentao, baseado na estratgia RDL (vide seo 4), para
atualizao dos nveis de estoque observados do sistema, a cada perodo de tempo k.

interessante acrescentar que este tipo de soluo pode substituir a soluo MF-PDE no
que tange a fornecer uma viso da utilizao dos recursos e tambm para fornecer um
plano timo de produo que possa ser empregado, como metas de produo, na cadeia
hierrquica de decises, como discutido na seo 2.
As polticas timas de estoque e produo, para cada um destes procedimentos, so
apresentadas na forma de trajetrias (curvas) de estoque e produo pela Figuras 4(a)-(d),
sendo comparadas individualmente, com as trajetria timas do procedimento MF-PDE.




Uma interessante observao destes resultados que as trajetrias fornecidas pelos
procedimentos NFC e OLFC (Figuras 4(b) e 4(c)) so mais sensveis s flutuaes de
demanda que o procedimento PMF (Figura 4(d)). Um explicao para este fato est no
emprego do ganho timo G
k
que funciona como um regulador capaz de ajustar, de modo
suave, a poltica de produo em respostas s oscilaes de demanda.
A seguir analisa-se o emprego da soluo PMF em um processo de simulao, onde o
objetivo desenvolver cenrios que possibilitem gerncia adquirir uma viso antecipada
sobre o uso dos recursos industriais da firma.
8.3 Anlise de Cenrios Usando o Procedimento PMF
Para efeito de simulao do procedimento PMF, adota-se o diagrama da Figura 5. Neste
diagrama, as variveis (k)e (k), que denotam, respectivamente, as trajetrias timas de
estoque e produo obtidas usando o procedimento PMF (Figura 4(d)), so utilizadas como
referncia (metas) durante a execuo da simulao. As variveis x(k) e u(k) contero as
decises simuladas de estoque e produo para cada perodo k.

A simulao foi realizada para um horizonte de planejamento de vinte e quatro meses (isto
, N=24); para obter este efeito, as trajetrias do procedimento PMF (Figura 4(d)), para os
12 meses iniciais, foram replicadas para os doze meses consecutivos (ou seja, k=13, 14, ...,
24). O objetivo disto foi oferecer uma viso de longo prazo gerncia. Considerou-se,
ainda, que as flutuaes de demanda foram geradas a partir de um modelo de previso no
estacionrio sazonal, dado por: d(k) = (6.0+0.25 k) (1+seno(3.14 k/6))+ z(k), onde
z(k) gerado aleatoriamente a partir de uma distribuio normal com mdia 0 e desvio
padro . A Figura 6 ilustra os resultados obtidos.

A principal observao, extrada desta anlise, que o esquema de realimentao definido
pelo ganho linear G
x
promove os ajustes necessrios na poltica de produo u(k), de modo
que as trajetrias simuladas mantm-se sempre prximas dos nveis desejados pela
gerncia, para o uso dos recursos de produo, mesmo sob o efeito das incertezas de
demanda.
9. Concluso
Neste artigo discutiu-se procedimentos subtimos para soluo de problemas de
planejamento da produo seqenciais estocsticos. Foram analisados e comparados, com a
soluo tima malha-fechada (MF-PDE), quatro procedimentos da literatura: MVC, NFC,
OLFC e o PMF. O procedimento PMF foi o que apresentou maior adaptabilidade soluo
malha-fechada e, como era de se esperar, o MVC, tcnica malha-aberta, foi o que
apresentou o pior desempenho. A principal vantagem destes mtodos seqenciais em
comparao com os mtodos estticos que eles permitem manter a caracterstica
temporal do problema estocstico original, alm de permitir que observaes sobre o estado
das variveis de deciso possam ser incorporadas soluo do problema. Este aspecto
garante maior confiabilidade no emprego desta soluo dentro da cadeia hierrquica de
decises. Outra vantagem foi observada com o emprego do procedimento PMF, que devido
a sua caracterstica de utilizar informaes extradas diretamente do sistema dinmico, via
um esquema de realimentao, tem-se mostrado um recurso a mais para ajudar os
gerentes a obterem uma viso racional sobre o uso dos recursos materiais de produo da
firma.
Agradecimento
Ao CNPq pelo apoio atravs do processo n
o
: 52.0196/96-1 e aos annimos revisores pelas
sugestes de melhoria do texto.
Referncias Bibliogrficas
APICS Dictionary:The American Production and Inventory Control Society, 500 West
Annadale Road, Falls Church, Virginia, 5
th
Edition, 1994. [ Links ]
ASTRON, K.J.: Introduction to Stochastic Control Theory, Academic Press, N.Y., 1970. [
Links ]
BELLMAN R.: Dinamic Programming, Princeton University Press, Princenton, USA. 1957. [
Links ]
BERTESEKAS, D.P.: Dynamic Programming and Optimal Control, vol. 1, Athena Scientific,
Belmont, USA, 1995. [ Links ]
BITRAN, G.R. & YANASSE, H.H.: "Deterministic Approximations to Stochastic Production
Problems", Operations Research, 5, 999-1018, 1984. [ Links ]
BRYSON, A.R. & HO, Y.: Applied Optimal Control, Hemisphere Publishing Corp., N.Y.,
1975. [ Links ]
CHARNES, A. & COOPER, W.W.: "Chance-Constraint Programming", Management
Science, 6, p. 73-79, 1959. [ Links ]
CHOU, Y.:Probability and Statistics for Decision Making, Holt, Rinehart & Winston, N.Y.,
1972. [ Links ]
GERSHWIN, S.B.; HILDERBRANT, R.R.; SURI R. & MITTER, S.: "A Control Perspective
on Recent Trends in Manufacturing Systems", IEEE Control System Magazine, vol. 6, n. 2,
p. 3-15, 1986. [ Links ]
GERSHWIN, S.B.: "Opportunities for Control in Manufacturing", IEEE Trans. on Automatic
Control, vol. AC-30, n. 9, 1985. [ Links ]
GONEDES, N.J. & LIEBER, Z.: "Production Planning for Stochastic Demand Process",
Operations Research, vol. 22, p. 771-787, 1974. [ Links ]
GRADY, P.J. & BONNEY, M.C.: "A General Approach to Linear-Quadratic Production
Planning Problems". In: DOUMEINGTS, G. et al. (Eds.): Advances in Production
Management Systems, Elsevier Science Publishers (North-Holland), p. 183-191, 1984. [
Links ]
HAY, G.A. & HOLT, C.C.: "A General Solution for Linear Decision Rules: An Optimal
Dynamic Strategy Applicable under Uncertainty", Econometrica, 25, p. 346-349, 1975. [
Links ]
HAX, A.C. & CANDEA, D.: Production and Inventory Management, Prentice-Hall, N.J.,
1984. [ Links ]
KLEINDORFER, P.R.: "Stochastic Control Models in Management Science: Theory and
Computation". In: BENSOUSSAN, A. et al. (Eds.): Applied Optimal Control. North-Holland,
p. 69-88, 1978. [ Links ]
KLEINDORFER, P.R. & GLOVER, K.: "Linear Convex Stochastic Optimal Control with
Applications in Production Planning", IEEE Trans. on Automatic Control, AC-18, p. 56-59,
1973. [ Links ]
LASSERE, J.B.; BES, C. & ROUBELAT, F.: "The Stochastic Discrete Dynamic Lot Size
Problem: An Open-Loop Solution", Operations Research, vol. 3, n. 3, p. 684-689, 1985. [
Links ]
MEIER III, L.; LARSON, R.E. & TETHER, A.J.: "Dynamic Programming for Stochastic
Control of Discrete Systems", IEEE Trans. on Automatic Control, vol. AC-16, 6, p. 767-775,
1971. [ Links ]
MINOUX, M.: Programmation Mathematique: Theory et Algorithmes, Dunod, Paris, 1983. [
Links ]
NECK, R.: "Stochastic Control Theory and Operational Research", European Journal of
Operational Research, 17, p. 283-301, 1984. [ Links ]
NELLEMANN, D.O. & HARMON, R.L.: Developing the Production Plan in: Computer in
Manufacturing, vol. 2, Auerbach Publishers Inc., 1986. [ Links ]
PARLAR, M.: "A Stochastic Production Planning Model with a Dynamic Chance Constraint",
European Journal of Operational Research, 20, p. 255-260, 1985. [ Links ]
PAPOULIS, A.: Probability, Random Variables, and Stochastic Processes, McGraw-Hill,
1991. [ Links ]
RAO, S. & SCHNELLER IV, G.O.: "On the Stochastic Non-sequential Production Planning
Problem", Journal of the Operational Research Society, 3, p. 241-247, 1990. [ Links ]
SHEN, R.F.C.: "Aggregate Production Planning by Stochastic Control", European Journal of
Operational Research, 73, p. 346-359, 1994. [ Links ]
SETHI, S.P.: "A Survey of Management Science Applications of the Deterministic Maximum
Principle", In: BENSOUSSAN, A. et. al. (Eds.): Applied Optimal Control. North-Holland,
Amsterdam, p. 33-67, 1978. [ Links ]
SILVA FILHO, O.S.: "An Aggregate Production Planning Model with Demand under
Uncertainty," Production Planning and Control, Taylor and Francis Ltd, vol. 10, 8, p. 745-75,
1999. [ Links ]
SILVA FILHO, O.S. & VENTURA S.D.: "Optimal Feedback Control Scheme Helping
Manager to Adjust Aggregate Industrial Resources", Control Engineering Practice, vol. 7, p.
555-563, 1999. [ Links ]
SILVA FILHO, O.S. & CEZARINO, W.: "Providing Optimal Production Policies for Make to
Stock Systems", 14
th
World IFAC Congress, vol. A, p. 249-254, 1999. [ Links ]
SILVA FILHO, O.S.: "A Constrained Optimal Control Problem with Application to Production
Planning", In: PEREIRA, C.E & KOPACEK, P. (Eds.): 5
th
IFAC Workshop on Intelligent
Manufacturing Systems, p. 339-344, Gramado, Brazil, 1998. [ Links ]
SILVA FILHO, O.S. & CARVALHO, M.: "A Revised Optimal Production Planning by
Sequential Sub-optimal Approach". In: MOREL, G. & VERNADAT, F. (Eds.): 9
th
Conference
INCOM'98, vol. 2, p. 473-478, Nancy-Metz, France, 1998. [ Links ]
SILVA FILHO, O.S.: "A Linear Feedback Rule for Stochastic Production Planning", 13
th
IFAC
World Congress, vol. B, p. 1-6, San Francisco, 1996. [ Links ]
SINGHAL, K.; FINE, C.H.; MEREDITH, J.R. & SURI, R.: "Research and Model for
Automated Manufacturing", Interfaces, 17:6, p. 5-14, 1987. [ Links ]
SINGH, M.G. & HINDI, K.: "A Multilevel Multilayer Framework for Manufacturing Control",
Journal of Intelligent and Robotic Systems, n. 4, p. 75-93, 1991. [ Links ]
SURI, R.: "Quantitatives Techniques for Robotics Systems Analysis". In: NOF, Shimon Y.
(Ed.): Handbook of Industrial Robotics, John Wiley and Sons, New York, p. 605-638, 1985. [
Links ]
THEIL, H.: "A Note on Certainty Equivalence in Dynamic Planning", Econometrica, 25, p.
346-349, 1957. [ Links ]


http://pt.scribd.com/doc/56184270/ADMINISTRACAO-DA-PRODUCAO-E-OPERACOES

Potrebbero piacerti anche