Sei sulla pagina 1di 126

Uma Introducao a` Otimizacao sob Incerteza

Humberto Jose Bortolossi

Bernardo Kulnig Pagnoncelli

Departamento de Matematica Aplicada


Universidade Federal
Fluminense

Departamento de Matematica
Pontifcia Universidade Catolica
do Rio de Janeiro

sio de Pesquisa Operacional e Logstica da Marinha


XI Simpo
5 e 6 de agosto de 2008

Sum
ario

Pref
acio
1 O Problema do Fazendeiro

iv
1

1.1 Representando cenarios . . . . . . . . . . . . . . . . . . . . .

1.2 EVPI e VSS . . . . . . . . . . . . . . . . . . . . . . . . . . .

2 O Problema do Jornaleiro

10

2.1 Resolucao do Problema . . . . . . . . . . . . . . . . . . . . .

11

2.2 Um exemplo numerico . . . . . . . . . . . . . . . . . . . . .

13

2.3 Outras interpretacoes para o problema . . . . . . . . . . . .

15

3 Programac
ao Linear com Coecientes Aleat
orios

17

3.1 O problema da mistura . . . . . . . . . . . . . . . . . . . . .

18

3.2 O problema da producao . . . . . . . . . . . . . . . . . . . .

27

4 Modelos de Recurso

32

4.1 Motivacao: programacao linear por metas . . . . . . . . . .

32

4.2 Modelos de recurso em otimizacao estocastica . . . . . . . .

36

4.3 Admissibilidade . . . . . . . . . . . . . . . . . . . . . . . . .

38

4.4 Propriedades das funcoes de recurso . . . . . . . . . . . . . .

45

4.5 Casos especiais: recurso completo e simples . . . . . . . . . .

45

4.6 Mnimos e esperancas . . . . . . . . . . . . . . . . . . . . . .

46

4.7 Cotas para o valor otimo . . . . . . . . . . . . . . . . . . . .

48

4.8 O caso nito . . . . . . . . . . . . . . . . . . . . . . . . .

50

5 O m
etodo L-shaped

52

5.1 A decomposicao de Benders . . . . . . . . . . . . . . . . . .

52

5.2 O algoritmo de Benders . . . . . . . . . . . . . . . . . . . .

55

5.3 Um exemplo completo . . . . . . . . . . . . . . . . . . . . .

56

5.4 Decomposicao de Benders em otimizacao estocastica: o metodo L-shaped . . . . . . . . . . . . . . . . . . . . . . . . . .

58

6 Restri
c
oes probabilsticas

61

6.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . .

61

6.2 Ativos e passivos em uma carteira . . . . . . . . . . . . . . .

63

6.3 Propriedades de restricoes probabilsticas . . . . . . . . . . .

71

7 M
etodos Amostrais

77

7.1 Aproximacao pela media amostral . . . . . . . . . . . . . . .

77

7.2 A decomposicao estocastica . . . . . . . . . . . . . . . . . .

82

A Probabilidade

90

B Estatstica

98

C Convexidade

102

D Programac
ao Linear

107

D.1 Programas lineares e o teorema fundamental da programacao


linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
D.2 Dualidade . . . . . . . . . . . . . . . . . . . . . . . . . . . .

113

D.3 Raios extremos . . . . . . . . . . . . . . . . . . . . . . . . .


Bibliograa

116
118

Pref
acio
A maioria dos problemas da vida real trazem, em si, incertezas: elas sao
inerentes em virtualmente todos os sistemas relacionados com atuaria, economia, meteorologia, demograa, ecologia, etc. Nos dias de hoje, problemas
envolvendo interacoes entre homem, natureza e tecnologia estao sujeitos a
mudancas rapidas, o que aumenta a incerteza. Cada nova revolucao tecnologica traz novos desaos para o conhecimento estabelecido ate entao.
Mesmo no contexto determinstico, existem sistemas que sao tao complexos,
que eles nao permitem uma medida precisa de seus parametros.
A area de otimizac
ao estocastica (tambem conhecida como otimizacao sob
incerteza) estuda modelos e metodos para abordar tais situacoes: elas incorporam incertezas na modelagem atraves da inclusao de variaveis aleatorias
com distribuicao de probabilidade conhecida. O objetivo e, entao, encontrar solucoes que sejam admissveis para todas as possveis realizacoes das
variaveis aleatorias que sao parte da modelagem.
A inclusao de variaveis aleatorias em um modelo de otimizacao cria muitas
diculdades: O que e uma solucao admissvel? O que e uma solucao otima?
Como resolver estes problemas? Apresentaremos neste texto algumas das
abordagens que procuram responder (dar um sentido) a estas perguntas.
Nos concentraremos em uma classe muito importante de problemas de otimizacao estocastica: os chamados modelos de recurso em dois est
agios. Em
linhas gerais, estes modelos permitem que se faca uma escolha inicial (dita
de primeiro estagio) antes de se conhecer o valor dos parametros incertos.
Apos o conhecimento dos valores dos mesmos, o agente de decisao faz novas
escolhas (ditas de segundo estagio) que visam corrigir possveis efeitos negativos gerados pela decisao de primeiro estagio (por este motivo, as decisoes
de segundo estagio tambem sao chamadas de acoes corretivas).
A solucao obtida atraves da resolucao de um problema de otimizacao
estocastica e balanceada para todos os possveis cenarios, ou seja, e a melhor solucao que leva em contas todos os possveis valores que os parametros
aleatorios podem assumir. Nao xamos simplesmente cada cenario e resolve-

Pref
acio

mos varios problemas de otimizacao: estamos incorporando todos os cenarios


em um mesmo de problema e nos perguntando qual e a melhor decisao a se
tomar levando em conta todas as situacoes que podem ocorrer.
um fato geral que muitas aplicacoes de otimizacao estocastica dao oriE
gem a problemas de otimizacao determinstica de grande porte, que sao
intrataveis mesmo para os computadores mais modernos. Uma area de pesquisa bastante ativa atualmente esta voltada para o desenvolvimento de algoritmos que aproximam as solucoes de problemas de grande porte. Neste
texto apresentaremos dois deles, a aproximacao pela media amostral e a
decomposic
ao estoc
astica.
Do ponto de vista pedagogico, a area de otimizacao estocastica e muito
rica, por usar conceitos e resultados de programacao linear, probabilidade e
estatstica.
Agradecimentos
Este texto e fruto de um ciclo de seminarios realizados na Pontifcia Universidade Catolica do Rio de Janeiro desde o segundo semestre de 2005, como
parte do programa de pos-graduacao em atuaria. Alem de varios artigos da
area, os livros [3, 11, 13, 17, 18, 24] foram muito inspiradores!
Gostaramos de agradecer a todos que participaram dos seminarios: Derek
Hacon, Jessica Kubrusly, Marina Sequeiros Dias, Debora Freire Mondaini,
Eduardo Teles da Silva, Niko A. Iliadis, Raphael M. Chabar e, em especial,
ao professor Carlos Tomei, organizador dos seminarios e co-autor de direito
deste texto!

Humberto Jose Bortolossi

Bernardo Kulnig Pagnoncelli

(hjbortol@vm.u.br)

(bernardo@mat.puc-rio.br)

Departamento de Matem
atica Aplicada

Departamento de Matem
atica

Universidade Federal

Pontifcia Universidade Catolica

Fluminense

do Rio de Janeiro

Captulo 1
O Problema do Fazendeiro
Vamos comecar nosso estudo de otimizacao estocastica pelo problema do
fazendeiro [3]. Joao e um fazendeiro que possui de 500 hectares (ha) de
terra disponveis para cultivo. Alias, lembre-se que 500 ha equivalem a
5 000 000 m2. Ele e especialista em tres cultivos: trigo, milho e cana-deacu
car. Durante o inverno, ele tem que decidir quanto de terra ser
a dedicada
a cada uma das tres culturas. A Figura 1.1 mostra duas possibilidades de
divisao.

milho

trigo

cana-de-acar

cana-de-acar

trigo

milho

Figura 1.1: Duas divisoes possveis da terra.

Alem do tamanho de sua propriedade, Joao possui outras restricoes a


serem consideradas. Ele tambem e proprietario de gado, que precisa ser
alimentado. Seu gado precisa de pelo menos 200 toneladas (T) de trigo e
240 T de milho para a racao. Alem do trigo e milho produzidos em suas
terras, ele pode comprar esses produtos de outros produtores, no mercado
local. Seu excesso de producao pode ser vendido para atacadistas, porem o
preco de venda e bem menor do que o preco de compra devido a margem de

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

lucro destes comerciantes.


A cana-de-acu
car e um cultivo exclusivamente para dar lucro: toda sua
producao e vendida para atacadistas a 36 reais por tonelada (R$/T). No
entanto, o governo impoe uma cota de producao de 6 000 T: qualquer quantidade produzida acima desse valor deve ser vendida por apenas 10 R$/T.
Baseado em informacoes de anos anteriores, Joao sabe que o rendimento
medio de suas lavouras e 2.5, 3.0 e 20 toneladas por hectare (T/ha). Alem
disso, existe um custo de producao especco de cada lavoura, que e dado
em R$/ha. Os dados completos do modelo estao representados na Tabela
1.1 a seguir:
Rendimento (T/ha)
Custo de producao (R$/ha)
Preco de venda (R$/T)
Preco de compra (R$/T)
Requerimento mnimo para o gado (T)
Total de terra disponvel: 500 ha

Trigo
2.5
150
170

Milho
3.0
230
150

238
200

210
240

Cana-de-acu
car
20
260
36 ( 6 000 T)
10 (> 6 000 T)

Tabela 1.1: Dados para o problema do fazendeiro.

Para ajudar Joao a decidir sobre como dividir suas terras de forma a
maximizar seus lucros, vamos formular um problema de otimizacao linear
que descreve essa situacao. Dena
x1
x2
x3
w1
y1
w2
y2
w3
w4

= hectares dedicados ao trigo,


= hectares dedicados ao milho,
= hectares dedicados a cana-de-acu
car,
= toneladas de trigo vendidas,
= toneladas de trigo compradas,
= toneladas de milho vendidas,
= toneladas de milho compradas,
= toneladas de cana-de-acu
car vendidas abaixo da cota de R$ 600 e
= toneladas de cana-de-acu
car vendidas acima da cota de R$ 600.

Queremos modelar essa situacao como um problema de minimizacao ao


inves de um de maximizacao, por razoes que caram claras um pouco mais

O Problema do Fazendeiro

a` frente no texto. Logicamente, o valor da funcao objetivo deve ser interpretado com o sinal oposto. Dessa forma o problema ca
minimizar

150 x1 + 230 x2 + 260 x3+


238 y1 170 w1 + 210 y2 150 w2 36 w3 10 w4
sujeito a
x1 + x2 + x3 500,
2.5 x1 + y1 w1 200,
3 x2 + y2 w2 240,
w3 + w4 20 x3,
w3 6 000,
x1, x2, x3, y1, y2 , w1, w2, w3, w4 0.

(1.1)

Esse e um problema de otimizacao linear e existem diversos programas


disponveis na internet que calculam sua solucao de maneira eciente. Em
nosso curso, usaremos uma linguagem especial, chamada AMPL ([10]), para
modelar problemas deste tipo. Essa linguagem e propria para problemas
de otimizacao e e muito simples de aprender, pois sua sintaxe e muito semelhante a maneira como escrevemos um problema de otimizacao. Mais
detalhes em http://www.ampl.com/. A solucao do Problema 1.1 esta descrita na Tabela 1.2.
Trigo

Area (ha)
120
Total produzido 300
Total vendido
100
Total comprado

Lucro total: R$ 118 600

Milho
80
240

Cana-de-acu
car
300
6 000
6 000

Tabela 1.2: Solucao do problema.

Pronto, o problema de Joao esta resolvido: basta dividir as terras de


acordo com a Tabela 1.2 para que ele maximize seus lucros. No entanto,
Joao ca desconado com a solucao. E se sua experiencia em relacao ao
rendimento medio das culturas nao for tao precisa quanto ele pensa? E se
o ano em questao tiver um clima particularmente desfavoravel e sua lavoura
render menos do que o esperado? Sera que a mesma divisao de terras e a
melhor possvel? Vamos estudar essas questoes na proxima secao.

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

1.1

Representando cen
arios

Vamos supor que num ano particularmente favoravel os rendimentos sejam 20% maiores que os rendimentos medios sugeridos por Joao. Alterando
esse dados e resolvendo o problema para esses rendimentos obtemos a solucao
descrita na Tabela 1.3. Por outro lado podemos ter um ano desfavoravel no
qual os rendimentos quem 20% abaixo da media. Nesse caso a solucao e
dada pela Tabela 1.4.
Trigo

Area (ha)
183.33
Total produzido
550
Total vendido
350
Total comprado
Lucro total: R$ 167 600

Milho
66.67
240
-

Cana-de-acu
car
250
6 000
6 000
-

Tabela 1.3: Solucao otima com rendimentos 20% acima da media.

Trigo

Area
(ha)
100
Total produzido 200
Total vendido
Total comprado
Lucro total: R$ 59 950

Milho
25
60
180

Cana-de-acu
car
375
6 000
6 000
-

Tabela 1.4: Solucao otima com rendimentos 20% abaixo da media.

Esses resultados sao alarmantes para as nancas de Joao: mudancas de


20% nos rendimentos das culturas em relacao ao rendimento medio fazem
o seu lucro variar de R$ 59 950 a R$ 167 667! Pensando na cana-da-acu
car,
Joao tem o seguinte dilema: se reservar uma area muito grande para esse
cultivo e os rendimentos foram acima da media, entao ele tera que vender
uma quantidade da producao a um preco desfavoravel por causa da cota. Por
outro lado, se ele reservar um area muito pequena e os rendimentos forem
abaixo da media, entao ele vai perder a oportunidade de vender cana-deacu
car a um preco favoravel.
Joao conclui que nao existe uma solucao que seja otima para todos os
casos. No entanto, ele se questiona se existe uma solucao que seja satisfatoria
para todos os tipos de rendimentos possveis. A resposta para essa pergunta

O Problema do Fazendeiro

vira com a primeira formulacao de otimizacao estocastica, que estudaremos


a seguir.
Vamos introduzir um pouco de nomenclatura: os cenarios 20% acima da
media, na media e 20% abaixo da media serao indexados por s = 1, 2, 3
respectivamente. As variaveis y e w terao o mesmo signicado da formulacao (1.1), mas serao indexadas por wis , i = 1, 2, 3, 4, s = 1, 2, 3 e
yjs , j = 1, 2, s = 1, 2, 3. Por exemplo, y23 representa a quantidade de
milho vendida no caso de precos abaixo da media. Vamos assumir que os
cenarios sao eq
uiprovaveis, ou seja, que cada um ocorre com probabilidade
1/3. Alem disso, supondo que Joao quer maximizar seus ganhos a longo
prazo, e razoavel supor que ele procura uma solucao que maximize seu lucro
esperado. Nesse caso o problema ca
minimizar
150 x1 + 230 x2 + 260 x3
1
(170 w11 238 y11 + 150 w21 210 y21 + 36 w31 + 10 w41)
3
1
(170 w12 238 y12 + 150 w22 210 y22 + 36 w32 + 10 w42)
3
1
(170 w13 238 y13 + 150 w23 210 y23 + 36 w33 + 10 w43)
3
sujeito a
x1 + x2 + x3 500

(1.2)

3 x1 + y11 w11 200, 3.6 x2 + y21 w21 240,


w31 + w41 24 x3, w31 6 000,
2.5 x1 + y12 w12 200, 3 x2 + y22 w22 240,
w32 + w42 20 x3, w32 6 000,
2 x1 + y13 w13 200, 2.4 x2 + y23 w23 240,
w33 + w43 16 x3, w33 6 000
x1, x2, x3 0,
y11, y21, y12, y22, y13, y23 0,
w11, w21, w31, w41, w12, w22, w32, w42, w13, w23, w33, w43 0
Esta e a chamada forma extensa de um problema de otimizacao es-

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

tocastica. Essa denominacao vem do fato que todas as variaveis que dependem de cenarios estao explicitamente descritas no modelo. As variaveis
x sao chamadas variaveis de primeiro est
agio, pois seu valor tem que ser
denido antes de se conhecer o clima e, conseq
uentemente, o rendimento das
culturas. As variaveis yis e wis sao variaveis de segundo est
agio. Sao variaveis
que sao escolhidas apos o conhecimento do rendimento das lavouras. Elas
servem para corrigir uma possvel situacao de decit nas necessidades alimentares do gado resultante da escolha x de primeiro estagio. O problema
do fazendeiro e um exemplo de problema de recurso com dois est
agios, que
sera estudado em detalhe mais adiante no texto.
Note que o problema 1.2 e linear e pode ser resolvido da mesma forma
que os anteriores. Exibimos na Tabela 1.5 a solucao otima, bem como as
quantidades produzidas em cada cenario e os valores de compra e venda das
culturas.
Primeiro estagio
s=1
(Acima)

Area
(ha)
Rendimento (T)
Venda (T)

Trigo
170
510
310

Milho
80
288
48

s=2
(Media)

Compra(T)
Rendimento (T)
Venda (T)

425
225

240

s=3
(Abaixo)

Compra(T)
Rendimento (T)
Venda (T)

340
140

192

48

Compra(T)
Lucro total: R$ 108 390

Cana-de-acu
car
250
6 000
6 000
(preco favoravel)
-5 000
5 000
(preco favoravel)

4 000
4 000
(preco favoravel)

Tabela 1.5: Solucao otima do modelo estocastico.

A primeira linha da Tabela 1.5 nos da a solucao de primeiro estagio enquanto que as outras descrevem a solucao de segundo estagio para cada
cenario. O aspecto mais interessante da solucao estocastica e que ela deixa
claro ser impossvel escolher uma solucao que seja otima para todos os
cenarios. No caso s = 3 por exemplo, onde os rendimentos sao 20% abaixo
da media, temos a compra de 48 toneladas de milho para suprir as necessida claro que se soubessemos que os rendimentos seriam abaixo
des do gado. E

O Problema do Fazendeiro

da media teramos reservado mais area para o plantio de milho para evitar
que este produto fosse comprado de outros comerciantes.
Dessa forma, a solucao de primeiro estagio (x1, x2, x3) = (170, 80, 250) do
problema (1.2) representa o melhor que se pode fazer diante dos diferentes
cenarios que podem ocorrer. Na proxima secao vamos tentar mensurar o
ganho de Joao por considerar o problema estocastico bem como a quantidade
de dinheiro perdida por nao conhecer com exatidao o futuro.

1.2

EVPI e VSS

Imagine que Joao tenha uma bola de cristal e consiga prever o clima no
futuro. Sob essa hipotese, ele nao precisa do modelo estocastico (1.2): sempre
que ele anteve um rendimento 20% abaixo da media (respectivamente 20%
acima da media) ele escolhe a solucao dada na Tabela 1.4 (resp. Tabela 1.3).
Se os rendimentos forem na media, ele se baseia na Tabela 1.2.
Se esperarmos um n
umero grande de anos, entao o rendimento medio de
Joao sob informacao perfeita (WS = Wait and See) sera
R$ 59 950 + R$ 167 667 + R$ 118 600
= R$ 115 406.
(1.3)
3
Note que estamos assumindo que os diferentes cenarios ocorrem ao acaso
com probabilidade 1/3 cada. Essa rendimento medio corresponde a` situacao
sob informacao perfeita, ou seja, a` situacao onde Joao sabe com precisao que
cenario ocorrera no futuro.
WS =

Infelizmente, nos e os meteorologistas sabemos que tal hipotese nao e


realista. Assim, ao longo de um perodo de, digamos, 20 anos, o melhor
que Joao tem a fazer e utilizar a solucao estocastica dada pela Tabela 1.5,
obtendo um lucro esperado de R$ 108 390. A diferenca entre este valor e o
lucro no caso sob informacao perfeita (equacao (1.3)) e o valor esperado de
informac
ao perfeita, ou EVPI:
EVPI = R$ 115 406 R$ 108 390 = R$ 7 016.

(1.4)

Um outro conceito importante em otimizacao estocastica e o valor da


soluc
ao estoc
astica (VSS). O VSS mede o ganho em considerar o modelo estocastico ao inves de simplesmente basear a decisao nos rendimentos medios.

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

Pense que Joao e um fazendeiro teimoso: mesmo sabendo que possveis variacoes de rendimento podem ocorrer, ele insiste em dividir sua terra de
acordo com a situacao de rendimentos medios dado pela Tabela 1.2. O lucro
obtido com essa poltica e chamado Solucao do Valor Esperado, ou EEV.
simples: xe a distribuicao de terras do caso de renComo calcula-lo? E
dimentos medios, ou seja, calcule a solucao do problema (1.1) nas variaveis
yis e wis, tomando x1 = 120, x2 = 80 e x3 = 300 e os rendimentos iguais
a 3.0, 3.6 e 24 (para s = 1) e depois 2, 2.4 e 16 (para s = 3). As solucoes
sao R$ 55 120 e R$ 148 000 respectivamente. Lembrando que a solucao e
R$ 118 600 no caso de rendimentos medios e R$ 108 390 no caso estocastico,
temos
R$ 55 120 + R$ 118 600 + R$ 148 000
= R$ 107 240,
3
VSS = R$ 108 390 R$ 107 240 = R$ 1 150.

EEV =

Os conceitos de EVPI e VSS sao importantes pois eles quanticam o valor


da informacao e o ganho em se considerar a formulacao estocastica. No
caso do EVPI, ele diz o quanto vale a pena pagar para se obter informacao
perfeita. Ja o VSS nos da acesso ao quanto estamos ganhando em considerar
o modelo estocastico ao inves de simplesmente supor que os rendimentos das
culturas sao dados pelos rendimentos medios.

Exerccios
[01] No problema do fazendeiro, suponha que quando os rendimentos sao
altos para um fazendeiro o mesmo ocorre para os fazendeiros vizinhos.
Assim ,o aumento na demanda reduz os precos. Considere por exemplo
que os precos do milho e do trigo caem 10% quando os rendimentos sao
acima da media e sobem 10% quando sao abaixo. Formule e resolva o
problema nesse caso, supondo que as alteracoes de preco sao vericadas
para compra e para venda de milho e trigo e que a cana-de-acu
car nao
sofre mudancas.
[02] Suponha agora que a propriedade do fazendeiro e dividida em quatro
lotes, de tamanhos 185, 145, 105 e 65 hectares respectivamente. Por

O Problema do Fazendeiro

razoes de eciencia, o fazendeiro so pode cultivar um tipo de produto


por lote. Formule e resolva o problema do fazendeiro nesse caso.
[03] Imagine que as compras e vendas de trigo e milho so podem ser feitas
em centenas de toneladas, ou seja, nao e possvel comprar nem vender
esses produtos em quantidades diferentes de m
ultiplos de 100. Formule
e resolva o problema do fazendeiro sob essas restricoes.

Captulo 2
O Problema do Jornaleiro
O segundo exemplo que vamos considerar e conhecido como problema do
jornaleiro ou problema da arvore de natal. Este problema e um classico na
area de otimizacao, possuindo vasta literatura a respeito. Uma interessante
aplicacao do problema do jornaleiro e descrita em [1]. Nesse artigo, ideias do
problema do jornaleiro sao aplicadas a` distribuicao de revistas da empresa
Time inc. e o processo desenvolvido pelos autores gerou uma economia de
3.5 milhoes de dolares por ano. Vamos descrever o problema seguindo a
formulacao proposta por [3].
O fazendeiro Joao tem um irmao na cidade chamado Jose, que e jornaleiro.
Toda manha ele vai ao editor do jornal e compra uma quantidade x de jornais
a um preco c por unidade. Essa quantidade x e limitada superiormente por
um valor u, pois Jose tem um poder de compra nito. Ele vende seus jornais
a um preco q por unidade. Jose possui um acordo com o editor do jornal:
qualquer jornal nao vendido pode ser devolvido ao editor, que paga um preco
r < c por ele.
O dilema de Jose diz respeito a demanda diaria por jornal, que e incerta.
Se ele comprar um n
umero muito grande de jornais corre o risco de nao
vende-los e perder dinheiro com isso. Por outro lado, se comprar poucos Jose
pode nao atender a demanda e deixar de faturar dinheiro. Vamos supor que
a demanda e uma variavel aleatoria nao-negativa com funcao densidade f
e funcao distribuicao F , que y e o n
umero de jornais efetivamente vendidos
e que b e o n
umero de possveis jornais devolvidos ao editor. A formulacao

O Problema do Jornaleiro

11

do problema do jornaleiro e
min {cx + Q(x)}

0xu

onde
Q(x) = E [Q(x, )]
e
Q(x, ) =

min
q y() r b()
sujeito a
y() ,
y() + b() x,
y(), b() 0.

O smbolo E representa a esperanca com respeito a . Para uma quantidade x de jornais comprados, a funcao Q(x, ) denota o lucro obtido com
a venda destes jornais para um valor xo de demanda . O valor Q(x) e
o lucro esperado calculado sobre todos os valores possveis.
Assim como no problema do fazendeiro, o problema do jornaleiro e estruturado em dois estagios: no primeiro estagio Jose decide quantos jornais vai
comprar atraves da variavel x. Apos essa escolha, ele vai tentar vender esses
jornais para uma demanda . As variaveis de segundo estagio representam
quanto ele conseguiu vender (y()) e quanto ele devolveu ao editor (b()).
Observe que a dependencia dessas variaveis em deixa claro que elas sao
de segundo estagio, pois seu valor so e determinado apos o conhecimento da
demanda .
Jose procura a quantidade certa de jornais a comprar de forma a maximizar seu lucro esperado sob incerteza de demanda. Note aqui a semelhanca
com o problema do fazendeiro: se a demanda fosse conhecida Jose simplesmente comprava jornais e obteria o lucro maximo. No entanto, como no
problema do fazendeiro, nao e possvel escolher um valor x que maximize
seu lucro para todos os possveis valores de demanda . O que Jose busca
entao e uma escolha que, em media, lhe de o maior lucro.

2.1

Resolu
c
ao do Problema

O primeiro passo para encontrar uma solucao explcita do problema do


jornaleiro e resolver o problema de segundo estagio. Felizmente a solucao

12

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

e imediata: se a demanda for menor que o n


umero de jornais comprados

entao y () = . Se for maior entao y () = x. Para encontar b() basta


observar que retornos de jornais ao editor so ocorrem se a demanda for
menor que x. Conclui-se entao que
y () = min{, x},
b () = max{x , 0}.
A resolucao desse problema nos permite escrever Q(x) explicitamente:
Q(x) = E [q min{, x} r max{x , 0}] .
Vamos ver posteriormente que a funcao Q e convexa e derivavel quando
a variavel aleatoria for contnua. Como estamos no intervalo [0, u] e a
funcao Q(x) e convexa, sabemos que se c + Q(0) > 0, entao a derivada nao
troca de sinal no intervalo e a solucao otima e x = 0. De maneira analoga,
se c + Q (u) < 0, entao a solucao otima e x = u. Caso nenhuma dessas
condicoes se verique temos que encontrar o ponto crtico de c + Q(x).
Usando a denicao A.15 dada no apendice A, temos que
 x

Q(x) =
(qt r(x t))f (t) dt +
qxf (t) dt.

Manipulando a expressao e usando a equacao (A.2) do apendice A obtemos


que
 x
Q(x) = (q r)
tf (t)dt rxF (x) qx(1 F (x)).

Usando integracao por partes, podemos simplicar ainda mais a expressao:


 x
Q(x) = qx + (q r)
F (t)dt.
(2.1)

A partir desta expressao podemos concluir que


Q (x) = q + (q r)F (x).
Finalmente, a solucao do problema e

qc

x
=
0,
se
< F (0),

qr

qc
x = u,
se qr
> F (u),



x = F 1 qc , caso contrario.
qr

(2.2)

(2.3)

O Problema do Jornaleiro

13

Qualquer modelagem razoavel da demanda admite que ela so assume valores positivos. Nesse caso F (0) = 0 e, portanto, nunca temos x = 0.
O exemplo do jornaleiro e mais um exemplo de problema de recurso com
dois estagios. Novamente o agente decisorio, nesse caso Jose, tem que fazer
uma escolha sob incerteza. Ele nao conhece a demanda no momento que
compra os jornais junto ao editor. Apos a compra ele ajusta as variaveis
de segundo estagio de acordo com o valor da demanda, agora conhecido.
A solucao do problema representa a poltica de compras que rende o maior
lucro esperado para Jose.

2.2

Um exemplo num
erico

Vamos apresentar um exemplo numerico do problema do jornaleiro. Suponha que o custo por jornal para o jornaleiro seja c = 10, que o preco de
venda seja q = 25, que o preco de devolucao ao editor seja de r = 5 por
jornal e que o poder de compra e u = 150. Alem disso, considere que a
demanda e dada por uma variavel aleatoria uniforme contnua denida
no intervalo [50, 150]. Na Tabela A.1 do apendice A listamos a densidade,
media e variancia dessa variavel aleatoria.
Integrando-se a densidade de ,
manda:

x50

100 ,
F (x) = 1,

0,

obtemos a funcao distribuicao da dese 50 x 150,


se x > 150,
caso contrario.

(2.4)

A inversa dessa funcao e F 1(y) = 100 y + 50 no intervalo [50, 150]. Usando (2.3), temos que a solucao do problema e
x = F 1 (3/4) = 125,
com lucro esperado de 1312.5. Assim, Jose deve comprar 125 jornais por dia
para maximizar seu lucro esperado.
Podemos tambem calcular o valor da solucao estocastica (VSS) para esse
problema. Lembrando: temos que inicialmente calcular a solucao otima para
o problema do jornaleiro para = 100, ou seja, com demanda constante igual

14

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

a media de , isto e, temos que resolver e


min { cx q min{100, x} r max{x 100, 0}} .

0x150

Ao inves de obter o maximo usando calculo, podemos ver imediatemente


pela Figura 2.1 que a solucao e x = 100.
cx +Q(x, 100)
0

100

150

{1250
{1500

Figura 2.1: Graco de cx + Q(x, ) para = 100.

Uma maneira ainda mais facil de ver e que se sabemos que a demanda e
100, entao devemos comprar x = 100 jornais para maximizar o lucro!
Ainda falta calcular o valor de EEV, que e o valor esperado da solucao
supondo que o jornaleiro comprou 100 jornais. Para isso fazemos
 100
50
EEV = E [10 100 + Q(100, )] = 100 10 25 100 + 20
d
100
50


75
25 = 1250,
= 1000 2500 + 20
2
que resulta num lucro de R$ 1 250. Logo, temos que
VSS = 1312.5 1250 = 62.5.
Por m, vamos ao calculo do EVPI. Recordando: para obter o EVPI,
supomos que se conhece o futuro, ou seja, que se sabe o valor que demanda

O Problema do Jornaleiro

15

. O valor do EVPI e a esperanca com relacao a de todas essas solucoes.


No problema do fazendeiro, a incerteza estava associada a apenas tres tipos
de acontecimentos. Aqui a demanda pode assumir uma quantidade nao
enumeravel de valores. Portanto, teremos que fazer uso da integral para
obter o EVPI.
Dado um valor qualquer de demanda , a solucao otima obviamente e
x = . Assim, temos

WS = E [c + q] = 15E () = 1500.

(2.5)

Conseq
uentemente, temos que
EVPI = 1500 1312.5 = 187.5.

2.3

Outras interpreta
c
oes para o problema

Primeiramente vamos usar o conceito de ganho marginal para derivar a


solucao do problema por uma outra trilha. A expressao ganho marginal em
economia se refere ao crescimento no lucro obtido quando se aumenta em
uma unidade a quantidade vendida ou adquirida de um determinado bem.
Vamos apresentar uma aplicacao desse conceito ao problema do jornaleiro
que nos permite chegar a resposta (2.3) do problema do jornaleiro de maneira
elementar.
Suponha que jornaleiro comprou k jornais. Qual e o lucro esperado na
venda do k-esimo jornal? A resposta e
lucro esperado do k-esimo jornal = P( < k)(r c)+P( k)(q c), (2.6)
onde P( < k) e probabilidade dele nao vender o k-esimo jornal e P( k)
e a probabilidade dele vender este k-esimo jornal.
A situacao ideal ocorre quando o lucro esperado com a venda do u
ltimo
jornal e zero: se fosse negativo a demanda seria menor que k (jornal encalhado) e se fosse positivo a demanda seria maior que k (falta de jornal para
venda). Igualando-se a equacao (2.6) a zero, temos
lucro esperado do k-esimo jornal = 0
= P( < k)(r c) + P( k)(q c)
= F (k)(r c) + (1 F (k))(q c).

16

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

Desta maneira, F (k) = (q c)/(q r) e, portanto,


c
.
k = F 1
qr

(2.7)

Assim, o n
umero de jornais a ser comprado para que em media todos sejam
qc
vendidos e k = F 1( qr
), a mesma solucao encontrada anteriormente.
Uma outra interpretacao interessante do problema do jornaleiro, mencionada em [2], surge quando nos perguntamos sobre a probabilidade de se
vender todos os jornais para um dada escolha de x. Esse valor e igual a
P({vender tudo}) = P( x) = 1 F (x).
Vamos ver qual e a probabilidade de se vender tudo se comprarmos x jornais,
onde x e dado pela expressao (2.3):
P({vender tudo}) = 1 F (x) = 1

cr
qc
=
.
qr
qr

comum encontrar na literatura artigos que nao permitem que um jornal


E
nao vendido seja devolvido ao editor, ou seja, r = 0. Nesse caso, temos que
a quantidade de jornal a ser comprada deve ser escolhida de maneira que a
probabilidade de se vender todos os jornais seja igual a razao custo unitario
c do jornal dividido pelo seu preco unitario q.

Captulo 3
Programa
c
ao Linear com Coecientes
Aleat
orios
Neste captulo apresentaremos as abordagens classicas usadas na modelagem e solucao de problemas de programacao linear onde um ou mais coecientes sao aleatorios (otimizacao estocastica linear).
Tradicionalmente, sao propostos dois tipos de modelos classicos para se
tratar problemas de otimizacao com coecientes aleatorios: a abordagem espere e veja (em ingles, wait and see) e a abordagem aqui e agora (em
ingles, here and now). Em espere e veja, o agente de decisao pode esperar por uma realizacao dos coecientes aleatorios para tomar a sua decisao.
Ja em aqui e agora, o agente de decisao deve fazer suas escolhas antes
ou sem o conhecimento das realizacoes dos coecientes aleatorios. Neste
segundo caso, uma diculdade adicional aparece: sem se conhecer os coecientes, as denicoes habituais de admissibilidade e otimalidade nao se aplicam
e especicacoes adicionais sao necessarias.
A teoria pressupoe que seja dada (conhecida) a distribuicao conjunta dos
coecientes. Poder-se-ia argumentar que esta hipotese e restritiva, visto que
dicilmente existem dados sucientes para a construcao de uma estimativa
conavel. Como conseq
uencia, e o modelador do problema que acaba fazendo a escolha da distribuicao conjunta. Note, contudo, que este tipo de
arbitrariedade nao e diferente da que uma abordagem determinstica faria
ao escolher uma realizacao particular dos coecientes aleatorios.

18

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

3.1

O problema da mistura

Vamos comecar com um exemplo onde a aleatoriedade se manifesta apenas


em alguns dos coecientes das restricoes em desigualdades. Para isto, considere a seguinte situacao: um fazendeiro consultou um engenheiro agronomo
que recomendou 7 g de um nutriente A e 4 g de um nutriente B para
cada 100 m2 de terra. O fazendeiro dispoe de dois tipos de adubo. Cada kg do
primeiro adubo possui 1 g do nutriente A e 2 g de um nutriente B. Cada kg
do segundo adubo, por sua vez, possui 1 g de cada nutriente. Os custos de
compra dos dois adubos sao iguais: uma unidade monetaria por kg. As quantidades 1 e 2 sao incertas: o fabricante dos adubos garante que elas sao
variaveis aleatorias independentes, uniformemente distribudas e com suportes nos intervalos [1, 4] e [1/3, 1], respectivamente. O problema (da mistura)
e entao decidir o quanto comprar de cada adubo para atender a necessidade
de nutrientes em 100 m2 de terra minimizando o custo de compra:
minimizar f (x1, x2) = x1 + x2
sujeito a
1 x1 + x2 7,
2 x1 + x2 4,
x1 0,
x2 0.

(3.1)

Note que o conjunto admissvel deste programa linear depende dos valores
dos coecientes 1 e 2 .
Abordagem Espere e Veja
Nesta abordagem, supoe-se que o agente de decisao possa fazer a escolha dos valores de x = (x1, x2) depois da realizacao de = (1, 2). Desta
maneira, o problema (3.1) pode ser considerado um programa linear parametrico1: as solucoes otimas e o valor otimo sao calculados em funcao
de . Por exemplo:
(a) Para = (1, 2) = (1, 1/3), o conjunto admissvel correspondente e o
apresentado na Figura 3.1, a solucao otima e
1

No endereco http://www.professores.u.br/hjbortol/car/activities/problema-da-mistura-01.html voce


encontrar
a um applet JAVA interativo que desenha o conjunto admissvel e calcula a solucao otima do
problema (3.1) para diferentes valores de 1 e 2 .

Programa
c
ao Linear com Coecientes Aleat
orios

19

x () = x (1, 1/3) = (x1(1, 1/3), x2(1, 1/3)) = (9/2, 5/2)


e o valor otimo e v (1, 1/3) = x1(1, 1/3) + x2(1, 1/3) = 7.

x2

4
5/2

9/2

12

x1

Figura 3.1: Conjunto admissvel do problema da mistura para = (1 , 2 ) =


(1, 1/3).

(b) Para = (1, 2) = (5/2, 2/3), o conjunto admissvel correspondente e


o apresentado na Figura 3.2, a solucao otima e
x () = x(5/2, 2/3) = (x1(5/2, 2/3), x2(5/2, 2/3)) = (18/11, 32/11)
e o valor otimo e v (5/2, 2/3) = x1(5/2, 2/3) + x2(5/2, 2/3) = 50/11 =
4.54.
(c) Para = (1, 2) = (4, 1), o conjunto admissvel correspondente e o
apresentado na Figura 3.3, a solucao otima e
x() = x (4, 1) = (x1(4, 1), x2(4, 1)) = (1, 3)
e o valor otimo e v (4, 1) = x1(4, 1) + x2(4, 1) = 4.

20

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

x2

4
32/11

18/11 14/5

x1

Figura 3.2: Conjunto admissvel do problema da mistura para = (1 , 2 ) =


(5/2, 2/3).

x2

4
3

1 7/4

x1

Figura 3.3: Conjunto admissvel do problema da mistura para = (1 , 2 ) =


(4, 1).

Programa
c
ao Linear com Coecientes Aleat
orios

21

De fato, e possvel mostrar (exerccio) que a solucao otima do problema (3.1)


para (1, 2) = [1, 4] [1/3, 1] e dada por

(x1(1, 2), x2(1, 2)) =

3
4 1 7 2
,
1 2 1 2

7
,0 ,
1

se

7
4
,
1
2

caso contrario,

e que o valor otimo associado e dado por

3 + 4 1 7 2

1
2
v (x1(1 , 2), x2(1, 2)) =

se

7
4
,
1
2

caso contrario.

A partir destas expressoes, o agente de decisao pode entao calcular as distribuicoes de x = (x1(1, 2), x2(1, 2)) e v (x1(1, 2), x2(1, 2)) e suas
caractersticas como media, variancia, etc. (veja o exerccio [03]).
Abordagem Aqui e Agora
Nesta abordagem, o agente de decisao deve fazer a escolha de x = (x1, x2)
sem conhecer os valores de = (1, 2) (mas sabendo a funcao distribuicao
de ). Sem se conhecer os coecientes, as denicoes habituais de admissibilidade e otimalidade nao se aplicam e especicacoes adicionais de modelagem
sao necessarias. Apresentaremos agora os tipos de especicacoes mais tradicionais.
1. Abolir incertezas
O agente de decisao simplesmente faz uma escolha apropriada para e,
entao, ele resolve o problema determinstico correspondente.
(a) Escolha pessimista:
= (1, 1/3).
Neste caso, o conjunto admissvel e o representado na Figura 3.1 e o
valor otimo correspondente e v = 7.

22

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

(b) Escolha neutra:


= (5/2, 2/3) = E[(1 , 2)].
Neste caso, o conjunto admissvel e o representado na Figura 3.2 e o
valor otimo correspondente e
v = 50/11 = 4.54.
(c) Escolha otimista:
= (4, 1).
Neste caso, o conjunto admissvel e o representado na Figura 3.3 e o
valor otimo correspondente e
v = 4.
Vantagem da especicacao: o problema reformulado e facil de se resolver,
pois ele e um programa linear determinstico. Desvantagem: a solucao
otima x = (x1, x2), quando implementada, pode nao ser admissvel.
2. Incorporar riscos nas restri
c
oes (chance constraints)
O agente de decisao descreve uma medida de risco, faz uma escolha do
nvel maximo de risco aceitavel e, entao, ele incorpora estes elementos nas
restricoes do programa linear. Aqui, o agente de decisao pode ainda escolher entre nveis de conabilidade individuais ou um nvel de conabilidade
conjunto.
(a) Nveis de conabilidade individuais.
O agente de decisao escolhe dois nveis de conabilidade individuais
1 , 2 [0, 1] e ele decreta que x = (x1, x2) [0, +) [0, +) e
admissvel se, e somente se,

P (1 x1 + x2 7) 1
.
(3.2)
P (2 x1 + x2 4) 2
Restricoes deste tipo sao denominadas restricoes probabilsticas individuais (separadas) (em ingles, individual (separate) chance constraints).
Os riscos sao denidos em termos da probabilidade de inadmissibilidade,
isto e,

risco1 := P (1 x1 + x2 < 7)
.
(3.3)
risco2 := P (2 x1 + x2 < 4)
Podemos reescrever as condicoes (3.2) de forma mais explcita usando as
funcoes distribuicao2 F1 e F2 das variaveis 1 e 2 . De fato, e possvel
2

No apendice A voce encontrar


a, entre outros conceitos de probabilidade, a denicao de funcao distribuicao de uma vari
avel aleat
oria.

Programa
c
ao Linear com Coecientes Aleat
orios

mostrar (exerccio) que se 0 < 1 < 1 e 0 < 2 < 1, entao



1
P (1 x1 + x2 7) 1
F1 (1 1 ) x1 + x2 7

F21(1 2 ) x1 + x2 4
P (2 x1 + x2 4) 2

23

(3.4)

onde
Fi1() :=

min

t[,+)

{t | Fi (t) }

(3.5)

e o -esimo quantil de i. Se denirmos F11(0) := 1 e F21(0) :=


1/3, entao a equivalencia (3.4) e valida mesmo para 1 = 1 e 2 =
1. As desigualdades em (3.4) que usam Fi1 sao denominadas formas
reduzidas das respectivas restricoes probabilsticas individuais.
Com esta abordagem, o problema da mistura (3.1) ca modelado assim:
minimizar
f (x1, x2) = x1 + x2
1
sujeito a F1 (1 1 ) x1 + x2 7,
F21 (1 2 ) x1 + x2 4,
x1 0,
x2 0,

(3.6)

isto e, como um programa linear! Por exemplo, para os nveis de conabilidade individuais 1 = 2 = 2/3, verica-se que
F11(1 1 ) = F11 (1/3) = 2

F21 (1 2 ) = F21(1/3) = 5/9.

Para estes valores3, o problema (3.6) se escreve como


minimizar f (x1, x2) = x1 + x2
sujeito a
2 x1 + x2 7,
5 x1/9 + x2 4,
x1 0,
x2 0,

(3.7)

que alcanca o valor otimo v = 64/13 = 4.923076 no ponto (otimo) x =


(x1, x2) = (27/13, 37/13) = (2.076923, 2.846153).
3

No endereco http://www.professores.u.br/hjbortol/car/activities/problema-da-mistura-02.html. voce


encontrar
a um applet JAVA interativo que desenha o conjunto admissvel e calcula a solucao otima do
problema (3.6) para diferentes valores dos nveis de conabilidade individuais 1 e 2 .

24

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

(b) Nvel de conabilidade conjunto.


O agente de decisao escolhe um nvel de conabilidade conjunto [0, 1]
e ele decreta que x = (x1, x2) [0, +) [0, +) e admissvel se, e
somente se,
P (1 x1 + x2 7 e 2 x1 + x2 4) .

(3.8)

Restricoes deste tipo sao denominadas restricoes probabilsticas conjuntas (em ingles, joint chance constraints). O risco e denido como a
probabilidade de inadmissibilidade do sistema de restricoes do programa
linear, isto e, como o n
umero
risco := P (1 x1 + x2 < 7 ou 2 x1 + x2 < 4) .

(3.9)

Para obter uma forma reduzida da restricao probabilstica conjunta (3.8),


note que
=

P (1 x1 + x2 7 e 2 x1 + x2 4)

P (1 x1 + x2 7) P (2 x1 + x2 4)

x
4

x
2
2

1 F2
, se x1 > 0,
1 F1
x1
x1
1,
se x1 = 0 e x2 7,

0,
se x1 = 0 e 0 x2 < 7,
onde, na primeira igualdade, usamos o fato de que 1 e 2 sao variaveis
aleatorias independentes.
Observe que a forma reduzida de uma restricao probabilstica conjunta
pode ser n
ao-linear. Por exemplo, para o nvel de conabilidade conjunto = 2/3, pode-se mostrar (exerccio) que a restricao
P (1 x1 + x2 7 e 2 x1 + x2 4)
e equivalente a

11 5 x1 + 9 18 x1 +
x2 max 2 x1 + 7,

43
3

2
3

x21

(3.10)

5 x1
+4

(3.11)

Programa
c
ao Linear com Coecientes Aleat
orios

25

Com esta abordagem e para este valor de , o problema da mistura (3.1)


ca modelado assim:
minimizar
f (x1, x2) = x1 + x2

x2 max

2 x1 + 7,

sujeito a

11 5 x1 + 9 18 x1 +
2

43
3

x21

5 x1
,
+4 ,

x1 0, x2 0.
(3.12)
Este problema de otimizacao nao-linear assume o valor mnimo
v = 220/43 = 5.1162790 . . .
no ponto otimo x = (x1, x2) = (54/43, 166/43) = (1.25 . . . , 3.86 . . .).
O conjunto admissvel4 de (3.12) e apresentado na Figura 3.4.
3. Aceitar inadmissibilidade, penalizando d
eficits esperados
A ideia aqui e acrescentar `a funcao objetivo parcelas que penalizam inadmissibilidade. Vamos primeiro estabelecer algumas notacoes. Note que a
restricao 1 x1 + x2 7 nao e satisfeita se, e somente se, 1 x1 + x2 7 < 0.
Usando-se a (conveniente) notacao

0, se z 0,

z =
z, se z < 0,
vemos que uma realizacao de 1 e escolhas de x1 e x2 nao satisfazem a
restricao 1 x1 +x2 7 se, e somente se, (1 x1 +x2 7) > 0 (podemos entao
pensar em (1 x1 + x2 7) > 0 como uma medida de inadmissibilidade
para a restricao 1 x1 +x2 7). Analogamente, 2 x1 +x2 4 nao e satisfeita
se, e somente se, (2 x1 + x2 4) > 0. Escolhendo-se custos de penalidade
unitarios q1 > 0 e q2 > 0, as expressoes




e q2 E2 (2 x1 + x2 4)
q1 E1 (1 x1 + x2 7)
4

No endereco http://www.professores.u.br/hjbortol/car/activities/problema-da-mistura-03.html. voce


encontrar
a um applet JAVA interativo que desenha o conjunto admissvel e calcula a solucao otima do
problema da mistura usando restricoes probabilsticas para diferentes valores dos nvel de conabilidade
conjunto .

26

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

x2

4
17/5

9/5

12

x1

Figura 3.4: Conjunto admissvel do problema da mistura usando restricoes


probabilsticas para o nvel de conabilidade conjunto = 2/3.

representam entao, respectivamente, os custos medios para inadmissibilidade


nas restricoes 1 x1 + x2 7 e 2 x1 + x2 4. Nesta abordagem, o agente
de decisao substitui o problema da mistura (3.1) original pelo problema
minimizar
g(x1, x2) = x1 + x2 + q1 E1 [(1 x1 + x2 7)] + q2 E2 [(2 x1 + x2 4)]
sujeito a x1 0, x2 0.
(3.13)
Varias questoes surgem neste momento: como calcular as medias (esperancas) envolvidas e como resolver o problema de otimizacao? Como veremos, o calculo das esperancas e elementar, mas nao-trivial. Apesar de ser
nao-linear, a funcao objetivo de (3.13) possui propriedades desejaveis para
os algoritmos numericos em otimizacao: ela e convexa e subdiferenciavel. Se
os coecientes aleatorios tem distribuicao contnua (como no problema da
mistura), o calculo da esperanca e especialmente difcil. Nestes casos, uma
pratica comum e substituir a distribuicao contnua por uma aproximacao
discreta.

Programa
c
ao Linear com Coecientes Aleat
orios

3.2

27

O problema da produ
c
ao

Vamos estudar agora um programa linear onde a aleatoriedade aparece


em uma restricao em igualdade. Mais precisamente, considere o problema
(da producao):
minimizar f (x) = c x
sujeito a
x = ,
x 0,

(3.14)

onde c > 0 e o custo unitario de producao. Este problema de otimizacao


simples modela o processo de minimizacao do custo de producao c x sob a
restricao de que a producao x atenda `a demanda . Aqui, vamos supor
que e uma variavel
 aleatoria2cont
 nua nao-negativa com media = E [],
2
variancia = E ( E []) e funcao distribuicao acumulada F (t) =
P ( t), com t R.
Abordagem Espere e Veja
Se o agente de decisao pode esperar pela realizacao da demanda antes
de escolher o valor da producao x, entao o problema e facil se resolver:
x() = e v () = c x () = c .
Abordagem Aqui e Agora
1. Abolir incertezas
Nesta abordagem, o agente de decisao pode, por exemplo, substituir o valor
de por
= ou
= + , onde e um estoque reserva (por exemplo,
= ou = 2 ). A probabilidade de que a demanda seja satisfeita (o nvel
de servico da produc
ao) e entao dada por P ( + ) = F ( + ).
2. Incorporar riscos nas restri
c
oes (chance constraints)
Construir uma restricao probabilstica P (x = ) baseada em uma restricao em igualdade (x = ) e in
util. De fato: se tem distribuicao contnua,
entao P (x = ) = 0. Se tem um distribuicao discreta nita, digamos
P ( = i ) = pi (com pi 0 e p1 + + pn = 1), entao P ( = x) = 0 para
todo x
{1 , . . . , n}.

28

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

Para valores adequados de 1 e 2 , tambem e in


util construir restricoes
probabilsticas P (x ) 1 e P (x ) 2 combinadas, pois nao existe
producao x que satisfaca as condicoes


P (x ) 1
F (x) 1

1 F (x) 1 2
P (x ) 2
1 F (x) 2
se, por exemplo, 1 = 2 = 3/4, uma vez que a funcao distribuicao F e
nao-decrescente.
Desta maneira, e preciso estabelecer prioridades. Podemos, por exemplo,
especicar um nvel de conabilidade mnimo (1/2, 1) e modelar o problema (3.14) na forma


min {cx | P (x ) } = min cx | x F 1 ()
x0

x0

cuja solucao e, evidentemente, x = F 1().


3. Aceitar inadmissibilidade, penalizando desvios esperados
Aqui devemos penalizar tanto decits quanto superavits na producao: usando-se as notacoes


0, se z 0,
z, se z 0,

+
z =
e z =
(3.15)
z, se z < 0,
0, se z < 0,
isto e feito considerando-se o seguinte problema de otimizacao
minimizar f (x) = c x + Q(x)
sujeito a
x 0,
onde

(3.16)



Q(x) = E h ( x) + q ( x)+ ,

com h e q custos unitarios de superavit e decit na producao, respectivamente


(h < c < q).
Nao e difcil de se mostrar (exerccio) que Q e uma funcao convexa e diferenciavel. De fato,
Q (x) = q + (q + h) F (x),

para x R.

Desta maneira, a solucao otima de (3.16) e obtida resolvendo-se a equacao


f (x) = c + Q (x) = c q + (q + h) F (x) = 0:

Programa
c
ao Linear com Coecientes Aleat
orios

29

c
.
x = F 1
q+h
Note que esta solucao tem a mesma forma da solucao obtida via restricoes
probabilsticas. De fato, se h = 0, a mesma solucao e obtida se q/c =
1/(1 ):

(nvel de confiabilidade)

0.990
0.975
0.950
0.900
0.800
0.500

q/c
(custo de d
eficit/custo de produ
c
ao)

100
40
20
10
5
2

Esta tabela e interessante: ela nos da uma ideia de que valores escolher para
o custo q em termos do nvel de conabilidade .

Exerccios
[01] Deduza as equacoes para a solucao otima (x1, x2) do problema da mistura apresentadas na pagina 19.
[02] Mostre 4 v (x1(1, 2), x2(1, 2)) 7 para todo (1, 2) no conjunto
= [1, 4] [1/3, 1], onde v = v (x1(1, 2), x2(1, 2)) e o valor otimo
do problema da mistura.
[03] Mostre que a funcao distribuicao F do valor
mistura e dada por

0,

8 t3 18 t2 105 t + 196

4 t2(7 t)
F (t) =

49 t3 307 t2 + 648 t 1008

36 t2(t 4)

1,

otimo v do problema da
se 0 t 4,
se 4 t 50/11,
se 50/11 t 7,
se t 7.

30

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

Note que, com esta expressao para F em maos, podemos entao calcular
a funcao de densidade de v (derivando-se F ):

0,
se 0 < t < 4,

38 t3 210 t2 + 1323 t 2744

, se 4 < t < 50/11,

4 t3(t 7)2
f (t) =

37 t3 432 t2 + 1872 t 2688

, se 50/11 < t < 7,

3 (t 4)2

12
t

0,
se t > 7,
e a sua media:


E [v ()] =

t f (t) dt = 4 +

35
77
11
27
ln 3
ln 2
ln 11 +
ln 7
2
6
12
4

= 4.7526655 . . . .
[04] Mostre a equivalencia entre (3.10) e (3.11) para x1 0 e x2 0.
[05] Mostre que o problema (3.13) pode ser reescrito na forma
minimizar g(x1, x2) = x1 + x2 + Q(x1, x2)
sujeito a
x1 0, x2 0,
onde

Q(x1, x2) = E

min

y1 0, y2 0



 1 x1 + x2 + y1

7
.
q1 y1 + q2y2 
2 x 1 + x 2
+ y2 4

[06] Prove as seguintes relacoes para os operadores z z + e z z denidos em (3.15):


z + = max{0, z},

z = max{0, z} = min{0, z},

(z) = z + , (cz)+ = cz + para todo c 0, z + + z = |z|,


z + z = z, z + = (|z| + z)/2, z = (|z| z)/2,
z + z = 0, max{z + , z } = |z|, min{z + , z } = 0,
(x+ + y + )+ = max{x + y, y, 0}, x+ + y + = max{x + y, x, y, 0},
x+ |y| (x y)+ x+ + |y|,

x |y| (x y) x + |y|.

Programa
c
ao Linear com Coecientes Aleat
orios

[07] Mostre que (3.16) pode ser reformulado como um modelo de recurso:






min
qy1 + hy2  x + y1 y2 =
.
min cx + E
x0

y1 0, y2 0

31

Captulo 4
Modelos de Recurso
Neste captulo nos concentraremos na abordagem aqui e agora que
aceita inadmissibilidade penalizando desvios medios. De fato, veremos que
esta abordagem motiva uma classe importante de modelos em otimizacao
estocastica: os modelos de recurso.

4.1

Motiva
c
ao: programa
c
ao linear por metas

Em problemas determinsticos, a tecnica de programacao linear por metas


(em ingles, goal programming) consiste em classicar (separar) as restricoes
do problema em dois tipos: as restricoes rgidas (hard constraints) que nao
podem ser violadas de maneira alguma e as restricoes exveis (soft constraints) que podem ser violadas, mas nao a qualquer preco. Mais precisamente, considere o programa linear determinstico:
min {cx | Ax = b e Tx h} ,
xX

(4.1)

onde
X = {x Rn | x x x} ou X = {x Rn | 0 x < +} (as
desigualdades entre vetores devem ser interpretadas componente a componente),

c Rn , A e uma matriz m
 n, b Rm
, T e uma matriz m n, h Rm ,

cx = ni=1 ci xi e

Modelos de Recurso

33

o smbolo representa uma das relacoes =, e (componente a componente).


Neste programa linear, consideraremos Ax = b como restricoes rgidas e
Tx h como restricoes exveis. Como antes, a ideia e penalizar o vetor de
desvios de meta z = h Tx das restricoes exveis atraves de uma funcao
de penalidade z v(z) que e incorporada `a funcao objetivo do problema de
otimizacao original:
min {cx + v(h Tx) | Ax = b} = min {cx + v(z) | Ax = b e Tx + z = h} .
xX

xX

(4.2)
A funcao de penalidade fornece uma medida do quanto se deve pagar pela
violacao das metas (restricoes) z 0 frente ao custo original cx. Existem
varias maneiras de se especicar a funcao de penalidade v, o que torna o
metodo exvel. Vamos ver algumas delas agora.
1. Fun
c
ao de penalidade com custos individuais
Escrevendo-se

T=

t1
t2
..
.
tm

h=

h1
h2
..
.

z=

hm

z1
z2
..
.

zm

vemos que a notacao vetorial Tx h (respectivamente, z 0) e uma


maneira compacta e conveniente de se representar as m restricoes escalares:
ti x hi (respectivamente, zi 0) para i = 1, . . . , m. Aqui
ti = (Ti1, Ti2, . . . , Tin)
representa a i-esima linha da matriz T e o produto ti x deve ser entendido

como o produto escalar nj=1 Tij xj .
Podemos entao construir uma funcao de penalidade v que e caracterizada por
custos de penalidade individuais, que podem ser diferentes para superavits
e decits:
m
m 

!
!
+

vi(zi ) =
q i zi + q i zi .
(4.3)
v(z) =
#$
%
i=1
i=1 "
vi (zi )

34

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

A especicacao dos custos de penalidade unitarios q i e q i podem seguir as


seguintes diretivas:
Se a restricao e do tipo ti x = hi , isto e, zi = 0, penalizamos superavits
e decits escolhendo q i > 0 e q i > 0. Note que, neste caso, a funcao vi e
convexa como soma de funcoes convexas.
Se a restricao e do tipo ti x hi , isto e, zi 0, penalizamos superavits
escolhendo q i > 0 e premiamos decits escolhendo q i 0. Para obter
convexidade, as escolhas de q i e q i devem ser tais que q i + q i 0. De fato:
observe que

+q i zi , se zi 0,
+

vi(zi ) = q i zi + q izi =
q z , se z < 0.
i
i i
Desta maneira, vi e convexa se a inclinacao da reta zi q izi e menor
ou igual do que a inclinacao da reta zi +q i zi , isto e, se q i +q i ou,
ainda, q i + q i 0.
v(zi )

zi

Se a restricao e do tipo tix hi , isto e, zi 0, penalizamos decits


escolhendo q i > 0 e premiamos superavits escolhendo q i 0. Novamente,
para que a funcao vi seja convexa, e necessario que q i + q i 0.
2. Fun
c
ao de penalidade com custos individuais refinados
Considere o caso de restricoes do tipo ti x = hi , isto e, zi = 0. Como antes, a
funcao v e construda usando-se custos de penalidade individuais mas, agora,

Modelos de Recurso

35

desvios muito grandes, digamos, fora de um intervalo [li, +ui] contendo 0,


receberao uma penalidade extra:




(1) +
(2)
(1)
+
(1)
(2)
(1)
vi(zi ) = q i zi + q i q i (zi ui) +q i zi + q i q i (zi +li), (4.4)
(1)

(2)

< q (1)
< 0 < q i < q i . Note que esta funcao de penalidade
com q (2)
i
i
tambem pode ser usada para se modelar restricoes do tipo zi [li, +ui]
(1)
bastando, para isto, tomar q (1)
=
q
i = 0.
i
3. Fun
c
ao de penalidade com custo conjunto
A seguinte funcao de penalidade pode ser usada se as restricoes do programa
linear sao do tipo zi 0 e se o desvio maximo e mais importante do que a
soma ponderada dos desvios individuais:

}.
v(z) = v(z1 , z2, . . . , zm ) = q0 max{z1 , z2 , . . . , zm

(4.5)

Como o maximo de funcoes convexas resulta em uma funcao convexa, seguese que v e uma funcao convexa de q0 > 0.
4. Fun
c
ao de penalidade via a
c
oes de recurso
Este quarto exemplo de funcao de penalidade e motivado pela ideia de
correcoes (y) para compensar desvios (z) gerados por decisoes (x) tomadas
a priori. Para construir a funcao de penalidade sao necessarios os seguintes
ingredientes:
1. Uma estrutura de recurso (q, W).
Aqui q Rp e W e uma matriz m p. A matriz W e denominada matriz
de recurso (ou matriz de tecnologia) e o vetor q especica os coecientes
do custo da acao de recurso.
2. Um conjunto Y de variaveis de recurso.
Em geral, Y = {y Rp | y y y} ou Y = {y Rp | 0 y +} =
Rp+ .
A funcao de recurso v da o custo mnimo das acoes de recurso necessarias
para compensar o desvio z Rm nas restricoes Tx h:
v(z) = min {qy | Wy z} .
yY

(4.6)

36

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

De fato, todas as funcoes de penalidade (4.3), (4.4) e (4.5) apresentadas


anteriormente podem ser representadas deste modo, isto e, como uma funcao
de penalidade via acoes de recursos para estruturas de recurso (q, W) e
conjuntos de acoes de recurso Y adequados:
Se p = 2 m,
&
'
q = q, q Rm Rm = Rp ,

W=

+Imm Imm


m2 m

p
m
Y = Rm
+ R+ = R+ ,

entao a funcao de recuso v em (4.6) obtem a funcao de penalidade em (4.3).


Aqui Imm denota a matriz identidade de tamanho m m.
Se p = 4 m,
&
'
q = q(2) , q(1) , q(1) , q(2) Rm Rm Rm Rm = Rp ,


W = +Imm +Imm Imm Imm m4 m e
m
m
m
(1)
u e y(1) l}
Y = {(y(2) , y(1) , y(1) , y(2) ) Rm
+ R+ R+ R+ | y

entao a funcao de recuso v em (4.6) obtem a funcao de penalidade em (4.4).


'

T
&
(de tamanho m 1) e
Se p = 1, q = q0 , W = 1 1 1
Y = R+ entao a funcao de recuso v em (4.6) obtem a funcao de penalidade
em (4.5).

4.2

Modelos de recurso em otimiza


c
ao estoc
astica

Nesta secao veremos como usar a ideia de funcao de penalidade via acoes
de recurso para criar um modelo para a seguinte versao estocastica do programa linear determinstico (4.1):
min {cx | Ax = b e T()x h()} ,
xX

(4.7)

De fato, o uso de acoes de recurso e muito adequado para uma modelagem


do tipo aqui e agora para o problema (4.7). Como o agente de decisao
deve fazer a escolha da variavel x sem conhecer os valores de , podemos
pensar nas restricoes estocasticas T()x h() como restricoes exveis,

Modelos de Recurso

37

que serao ou nao satisfeitas dependendo das realizacoes de . Os desvios


correspondentes sao, entao, penalizados via uma funcao de penalidade com
acoes de recurso:
gio 1
Esta

gio 2
Esta

decisao em x

ocorre

acao corretiva y

Aplicando entao a estrutura de recurso, obtemos o assim denominado modelo


de recurso em dois est
agios para o problema (4.7):





min cx + E min {q()y | W()y h() T()x}  Ax = b .
xX

yY

(4.8)
Podemos obter uma formulacao mais compacta de (4.8) atraves da funcao
de penalidade via ac
oes de recurso (tambem denominada funcao de valor de
segundo est
agio)
v(z, ) = min {q()y | W()y z}
yY

(4.9)

e da funcao de custo de recurso mnimo esperado (tambem denominada


funcao de valor esperado)
Q(x) = E [v(h() T()x, )] .

(4.10)

De fato, com estas funcoes, nao e difcil de se ver que o problema (4.8) e
equivalente a
(4.11)
min {cx + Q(x) | Ax = b} .
xX

muito importante notar que tanto no programa linear


o 1. E
Observac
a
de segundo estagio
min {q()y | W()y h() T()x}
yY

como no calculo da funcao de valor de segundo estagio (4.9), o valor de


esta xo! Neste sentido, os programas lineares envolvidos sao determinsticos
( e considerado um parametro)!
o 2. Como os exerccios [05] e [07] do captulo 3 pedem para
Observac
a
mostrar, os problemas (3.13) e (3.16) podem ser considerados como modelos
de recurso.

38

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

o 3. No problema do fazendeiro, as variaveis de primeiro estagio


Observac
a
correspondem a` distribuicao de terra em milho, trigo e cana-de-acu
car
(x1, x2 e x3). Elas devem ser escolhidas por Joao antes de ele saber quais
serao os rendimentos destes cultivos. As variaveis de segundo estagio correspondem `as vendas e a`s compras destes tres cultivos no mercado local
(w1, y1, w2 , y2, w3 e w4 ). Elas devem ser tomadas como acoes corretivas que
orientam Joao a como vender e comprar de maneira otima no mercado local
depois da colheita.
o 4. Sem perda de generalidade, podemos supor que T(),
Observac
a
h(), W() e q() dependem afinamente de = (1, . . . , r ) Rr :


T() = T0 + rk=1 k Tk , h() = h0 + rk=1 k hk ,


W() = W0 + rk=1 k Wk e q() = q0 + rk=1 k qk .
Aqui Tk , hk , Wk e qk sao todos constantes (isto e, nao-estocasticos), com
dimensoes m n, m, m p e p, respectivamente. Por exemplo, se


22
sen(1) 2 + 1
T(1, 2, 3, 4) =
,
3 + 4
4 + 5
podemos escrever 1 = sen(1) 2 , 2 = 22 , 3 = 3 + 4 e 4 = 4 , de
modo que

T(1, 2, 3, 4)

1 0
0 5


+ 1

1 0
0 0


+ 2

T(1, 2, 3, 4)


0 1
0 0


+ 3

0 0
0 1


+ 4

0 0
0 1


.

Note, contudo, que este procedimento introduz dependencia entre as variaveis 1 , 2 , 3 e 4 .

4.3

Admissibilidade

Nem todo programa linear tem solucao (o conjunto admissvel pode ser
vazio ou a funcao objetivo pode ser ilimitada neste conjunto) e nem toda

Modelos de Recurso

39

variavel aleatoria tem media nita. Nesta secao apresentaremos alguns resultados sobre a admissibilidade e nitude do modelo de recurso em dois
estagios (4.8).
Seja
= (q(), h(), t1 (), . . . , tm ()) RN = Rp+m+(mn)
o vetor aleatorio formado pelas componentes aleatorias do problema (4.8)
(com excecao das componentes da matriz de tecnologia W()) e seja o
suporte de , isto e, o menor subconjunto fechado de Rp+m+(mn) satisfazendo
a condicao P( ) = 1. Aqui ti () denota a i-esima linha da matriz T().
Vamos denir
Q(x, ) = v(h() T()x, )
(4.12)
= minp {q()y | W()y = h() T()x e y0} ,
yR

o valor do programa linear de segundo estagio. Quando o programa linear


em (4.13) e ilimitado inferiormente ou inadmissvel, deniremos Q(x, ) como
sendo e +, respectivamente. A funcao de custo de recurso mnimo
esperado e dada entao por
Q(x) = E [Q(x, )] .
No caso de ser uma variavel aleatoria discreta (isto e, nito ou enumeravel), Q(x) e uma soma (serie) ponderada de Q(x, ) para as possveis
realizacoes de :

! 

Q(x) =
P = Q(x, 
).


Neste contexto, para tornar a denicao completa, faremos a convencao de


que + + () = +. Isto corresponde a atitude conservadora de rejeitar
qualquer decisao x de primeiro estagio que leve a uma acao de recurso indenida, mesmo quando existem realizacoes do vetor aleatorio que induzem
um custo innitamente baixo.
Ao estudarmos questoes de admissibilidade e nitude em (4.8), e natural
considerarmos:
1. O conjunto de decisoes x que satisfazem as restricoes (rgidas) do primeiro
estagio:
K1 = {x Rn | Ax = b}.

40

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

2. O conjunto de decisoes x de primeiro estagio para as quais a funcao de


valor esperado e nita:
K2 = {x Rn | Q(x) = E [Q(x, )] < +}.
Com estes conjuntos, o problema (4.8) se reescreve da seguinte maneira:
minimizar
cx + Q(x)
sujeito a x K1 K2.

Note, contudo, que o calculo do conjunto K2 pode nao ser uma tarefa facil,
por conta da esperanca envolvida. Mais faceis de se calcular sao:
3. O conjunto de todas as decisoes x de primeiro estagio para as quais o
programa linear de segundo estagio e admissvel para um valor de
xo1:
K2 () = {x Rn | Q(x, ) < +}.
4. O conjunto de todas as decisoes x de primeiro estagio para as quais o
programa linear de segundo estagio e admissvel para os valores de :
(
K2().
K2P = {x Rn | , Q(x, ) < +} =

O proposito do conjunto K2P e o de construir um mecanismo que permita


identicar se Q(x) < + sem que, para isto, seja necessario calcular a
esperanca E [Q(x, )]. Os proximos teoremas descrevem propriedades geometricas de K2P e K2 e estabelecem condicoes sucientes para que K2 = K2P .
Teorema 4.1 O conjunto K2() e um politopo convexo fechado para
todo e, em particular, K2P e um conjunto convexo fechado. Se
e nito, entao K2P tambem e um politopo convexo fechado e K2P = K2.
1
ser escrito em termos
de , j
a que e o suporte do conjunto
 Note que v(h() T()x, ) pode

(q(), h(), t1 (), . . . , tm ()) Rp+m+(mn) | .

Modelos de Recurso

41

Demonstrac
ao: Se W()y = h()T()x, entao T()x = h()W()y.
O conjunto V = {h() W()y | y0} e um politopo convexo fechado.
Conseq
uentemente, a imagem inversa de V pela transformacao linear T(),
T()1(V ),
tambem e um politopo convexo fechado (veja o Teorema 19.3 na pagina 173
de [23]). Mas
{y Rp | W()y = h() T()x e y0}
=

x T()1(V ),

isto e, K2() = T()1(V ). Isto mostra que K2() e um politopo convexo


fechado. Como a intersecao de conjuntos convexos fechados e ainda um
conjunto convexo fechado, segue-se que K2P e um conjunto convexo fechado.
Suponha agora que = {1 , . . . , k }, com pi = P( = i). Como e
suporte de , segue-se que pi > 0 para todo i = 1, . . . , k. A funcao Q, neste
caso, e dada por
Q(x) = p1 Q(x, 1) + + pk Q(x, k ).
Se x K2P , entao Q(x, i) < + para todo i = 1, . . . , k. Sendo assim,
Q(x) < + e, portanto, x K2. Isto mostra que K2P K2 . Por outro
lado, se x K2 , entao Q(x) < +. Dada a nossa convencao de que
+ + () = +, isto implica que cada Q(x, i ) < + (tambem estamos
usando fortemente aqui o fato de que cada pi > 0). Desta maneira, x
K2(i ) para todo i = 1, . . . , k e, portanto, x K2P . Isto mostra que K2
K2P . Segue-se entao que K2 = K2P .
Se for uma variavel aleatoria contnua, pode acontecer de K2 ser diferente de K2, como mostra o exemplo a seguir.
Exemplo 4.1 Considere o programa de segundo estagio (com W () = ):
Q(x, ) = min{y | y = 1 x e y 0},
onde uma variavel aleatoria com distribuicao triangular no intervalo [0, 1],
isto e, sua funcao densidade e dada por f (x) = 2 x para x [0, 1]. Note que:
Se (0, 1], entao Q(x, ) < + se, e somente se, x 1. Neste caso,
Q(x, ) =

1x

K2 () = {x R | x 1}.

42

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

Se = 0, entao Q(x, ) = Q(x, 0) < + se, e somente se, x = 1. Neste


caso,
Q(x, 0) = 0
e
K2(0) = {1}.
)
Assim, K2P = [0,1] K2 () = {1} (, 1] = {1}. Por outro lado, para
x 1, temos que
 1
 1
1
2 d = 2 (1 x) < +.
Q(x, )f () d =
Q(x) =
x
0
0
Desta maneira, K2P = {1}  (, 1] = K2 . A diferenca entre os dois conjuntos esta relacionada com o fato de que um ponto nao esta K2P tao logo
ele e inadmissvel para algum , independentemente da distribuicao de ,
enquanto que K2 nao considera inadmissibilidades ocorrendo com probabilidade zero.
Nas consideracoes que se seguem, vamos supor que a matriz de tecnologia W e determinstica, isto e, vamos supor que ela nao depende de :
W() = W = constante.
Quando isto acontece, dizemos que (q(), W() possui uma estrutura de
recurso fixa.
Pode acontecer de Q(x, ) < + para todo e Q(x) = +?
A proxima proposicao da uma reposta negativa para o caso de recursos xos
e com segundos momentos nitos.
Teorema 4.2 Suponha que W() = W (recurso xo) e que tenha
segundos momentos nitos. Temos que
P ( | Q(x, ()) < +) = 1

Q(x) < +.

Demonstrac
ao: Considere
Q(x, ) = minp {q()y | W()y = h() T()x e y0} ,
yR

para x e dados. A solucao deste programa linear (supondo que ela exista)
e da forma
(yB , 0) = (B1 (h() T()x, 0)

Modelos de Recurso

43



correspondente a divisao W = B N , com B quadrada inversvel (uma
base) satisfazendo a condicao de otimalidade qTB () B1 Wq()T (veja o
Teorema D.2). Assim,
Q(x, ) = qTB () B1 (h() T()x)
= qTB () B1 h() qTB () B1 T()x.
Lembrando que qTB (), h() e T() sao componentes de , vemos que
Q(x, ) e uma soma de parcelas da forma i j . Supondo que Q(x, ) < +
com probabilidade 1 (isto e, supondo que o programa linear de segundo
estagio e admissvel para quase todo ) e que a mesma base B e obtida
para todos os valores de , podemos concluir que
Q(x) = E [Q(x, )]




= E qTB () B1 h() E qTB () B1 T()x < +,
uma vez que tem segundos momentos nitos, isto e, uma vez que E [i j ] <
+ para todo i, j = 1, . . . , N .
No caso geral, a base otima B e diferente para cada e a demonstracao,
neste caso, deve considerar as diferentes submatrizes de W. Nao a faremos
aqui. O leitor interessado pode consultar a referencia [25].

Teorema 4.3 Suponha que W() = W (recurso xo) e que tenha


segundos momentos nitos. Entao K2P = K2 e, em particular, K2 e
fechado e convexo.
Demonstrac
ao: Se x K2P , entao Q(x, ) < + para todo . Pelo
Teorema 4.2, segue-se Q(x) < +, ou seja, x K2. Isto mostra que

K2P K2. Vamos agora mostrar que K2 K2P . Seja x K2 e considere
um subconjunto fechado de RN com medida 1. A aplicacao

L:

Rp
L() = h() T()x
e contnua, pois ela e a restricao de uma transformacao linear (lembre-se
que h() e as linhas de T() sao componentes de ). Como pos(W) e

44

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

fechado em Rp e Q(x, ) < + se, e somente se, h() T()x pos(W),


conclumos que
 | Q(x, ) < +} = L1(pos(W))
S = {
 Mais ainda, S tem medida 1 pois, caso contrario
e fechado em .


Q(x, )f () d =
Q(x, )f () d = +,
Q(x) = E[Q(x, )] =


 = , vemos que S e um
o que contradiz o fato de que x K2 . Tomando
subconjunto de , fechado em (logo, fechado em RN ) e de medida 1. Pela
denicao de , S = . Portanto, Q(x, ) < + para todo . Sendo
assim, x K2P . Isto mostra que K2 K2P .
Teorema 4.4 Suponha que W() = W (recurso xo) e que tenha
segundos momentos nitos. Entao:
(a) Se T() = T = constante, entao o conjunto K2 e um politopo.
(b) Se h() e T() sao variaveis aleatorias independentes e se o suporte da distribuicao de T() e um politopo, entao K2 e um politopo.
Demonstrac
ao: Temos que x K2 = K2P se, e somente se, (h)() Tx
pos(W), h , onde h e o suporte da distribuicao de h. Logo
x K2 W(h(h() Tx)0, h W TxW h(), h
(W T)i x ui = S := sup {Wi h(), i = 1, . . . , l},
h()h

onde W e uma matriz cujas linhas sao formadas pelos geradores de


pol(pos(W)) = {u | uT l 0, l pos(W)}.
Se ui = +, entao o problema e inadmissvel e K2 = . Se ui < + para
todo i = 1, . . . , l, entao o sistema (W T)ix ui e nito e, assim,
K2 = {x | WTxu }
e um politopo. Isto demonstra (a). A demonstracao de (b) pode ser encontrada em [26].

Modelos de Recurso

4.4

45

Propriedades das fun


c
oes de recurso

Nesta secao apresentaremos, sem demonstracoes, as propriedades da funcao de segundo estagio Q(x, ) = v(h() T()x, ) e da funcao de valor
esperado Q(x) = E [v(h() T()x, )] = E [Q(x, )]. O leitor interessado pode consultar os livros [3, 17, 18].
Teorema 4.5 Se W() = W (recurso xo), entao Q(x, ) e (a) convexa e linear por partes em (h(), T()) (componentes do vetor
aleatorio ), (b) concava e linear por partes em q() e (c) convexa
e linear por partes para todo x K = K1 K2.

Teorema 4.6 Se W() = W (recurso xo) e tem segundos momentos nitos, entao (a) Q e uma funcao convexa, lipschitziana e nita
em K2, (b) Q e linear por partes se e nito e (c) Q e diferenciavel
em K2 se a funcao de distribuicao acumulada de for absolutamente
contnua.

4.5

Casos especiais: recurso completo e simples

Dizemos que o modelo de recurso em dois estagios (4.8) tem recurso relativamente completo se toda escolha de x que satisfaz as restricoes (rgidas)
do primeiro estagio tambem satisfaz as condicoes de admissibilidade e nitude do segundo estagio, isto e, dizemos que (4.8) tem recurso relativamente
completo se K1 K2. Embora a hipotese de recurso relativamente completo
seja muito desejavel e u
til do ponto de vista computacional, pode ser difcil
identicar se um determinado problema tem ou nao recurso relativamente
completo, ja que isto exigiria algum conhecimento dos conjuntos K1 e K2 .
Existe, contudo, um tipo particular de recurso relativamente completo que
e facil de se identicar a partir da matriz de tecnologia W (determinstica).
Esta forma, denominada recurso completo, ocorre quando a matriz de tecnologia W de (4.8) satisfaz a seguinte condicao:
para todo z Rm , existe y 0 tal que Wy = z.

(4.13)

46

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

Observe que se W satisfaz esta condicao, entao Q(x, ) < + para


qualquer realizacao de em . Wets e Witzgall propuseram, em [27], um
algoritmo para vericar se uma matriz W satisfaz ou nao (4.13).
Uma outra situacao especial e a derecurso simples.
Ela ocorre quando

a matriz de tecnologia W e da forma +I I , y e dividido em (y, y) e
q() = (q(), q()). De fato, se (4.8) tem recurso simples, entao vale o
seguinte resultado (veja [3], pagina 92):
Teorema 4.7 Se o modelo de recurso em dois estagios (4.8) tem recurso simples e se tem segundos momentos nitos, entao Q e nita
se, e somente se, q() + q() 0 com probabilidade 1.

4.6

Mnimos e esperan
cas

Nesta secao veremos uma reformulacao de (4.8) que sera u


til tanto do
ponto de vista teorico como do ponto de vista computacional. Considere os
dois problemas de otimizacao:

PL1




min cx + E min {q()y | W()y h() T()x}  Ax = b

yY

xX





min E min {cx + q()y | W()y h() T()x}  Ax = b
xX

yY


min

xX,y()Y

PL0


 Ax = b
,
E [cx + q()y()] 
W()y() h() T()x,

onde Y e o conjunto das funcoes (mensuraveis) y : Rp . Note que


existirao innitas restricoes em PL0 se for um conjunto innito.

Modelos de Recurso

47

Teorema 4.8 PL1 = PL0 .


Demonstrac
ao: A demonstracao completa deste fato usa teoria da medida, o
que foge do escopo deste texto. Ao leitor interessado, indicamos o livro [24],
paginas 16 a 21. Daremos uma justicativa admitindo que todas as funcoes
envolvidas sao mensuraveis.
(PL1 PL0 ) A solucao de PL1 nos da um ponto otimo x. Por outro lado,
a solucao de Q(x , ) nos da, para cada , um ponto otimo y(). Os pontos x e y () satisfazem as restricoes de PL0 . Sendo assim, (x, y()) e
admissvel para PL0 . Conseq
uentemente,
PL1 = cx + E [q()y()] = E [cx + q()y()]
PL0 = E [c
x + q()
y()] ,
()) sao pontos otimos de PL0 .
onde (
x, y
(PL1 PL0 ) Para cada x X satisfazendo Ax = b, x0 e para cada
, seja y (, x) um ponto otimo do problema
min{q()y | W()y = h() T()x}
yY

(, x) um ponto otimo do problema


e seja y
min {E [cx + q()y()] | W()y() = h() T()x}.

y()Y

(, x) satisfaz a restricao W()y() = h() T()x, vale que


Como y
q()
y(, x) q()y(, x). Logo
q()
y(, x) q()y(, x)

E [q()
y(, x)] E [q()y(, x)]

cx + E [q()
y(, x)] cx + E [q()y(, x)] .
e usando a otimalidade de x, temos que
Fazendo x = x
)] c
)]
PL0 = c
x + E [q()
y(, x
x + E [q()y (, x
cx + E [q()y(, x )] = PL1 .

48

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

4.7

Cotas para o valor o


timo

Se o agente de decisao pode esperar pelas realizacoes de para escolher


o valor de x, ele entao ira resolver cada um dos problemas de otimizacao




min f (x, ) = cx + min {q() | W() = h() T()x}  Ax = b
xX

yY

(4.14)
() representa a solucao deste
um para cada realizacao possvel de . Se x
problema otimizacao (que, evidentemente, depende de ) entao, em media,
ele ganhara


WS = E [f (
x(), )] = E min {f (x, ) | Ax = b}
(4.15)
xX

Este e o valor otimo para a abordagem espere e veja (WS = wait and see).
Por outro lado, se o agente de decisao deve fazer a escolha de x antes das
realizacoes de , entao ele ganhara
RP = min {E [f (x, )] | Ax = b} .
xX

(4.16)

resolvendo um modelo de recurso em dois estagios (RP = recourse problem).


Seja x representa a solucao otima deste problema, entao RP = E [f (x , )].
O valor esperado de informac
ao perfeita (EVPI = expected value of perfect
information) e, por denicao, a diferenca entre os valores otimos para as
abordagens espere e veja e modelo de recurso:
EVPI = RP WS.

(4.17)

No problema do fazendeiro, o valor otimo para a abordagem espere e


veja foi igual a WS = R$ 115 406,00 (quando convertido para um problema de minimizacao), enquanto que para a abordagem de modelo de recurso, o valor otimo foi igual a RP = R$ 108 390,00. O valor esperado de
informacao perfeita do fazendeiro foi, entao, igual a RP WS = R$ 7 016,00.
Esta e a quantidade de dinheiro que o fazendeiro deveria pagar em cada ano
para obter uma informac
ao perfeita sobre o clima no pr
oximo ano. Um bom
meteorologista poderia cobrar este valor do fazendeiro para assessor
a-lo em
questoes clim
aticas.

Modelos de Recurso

49

(), segue-se que f (


Pela denicao de x
x(), ) f (x, ) para todo
e para todo x X satisfazendo Ax = b. Em particular,
f (
x(), ) f (x , )
para todo . Tomando-se a esperanca dos dois lados, conclumos que
x(), )] E [f (x, )] = RP.
WS = E [f (
Isto mostra que WS da uma cota inferior para o valor otimo de RP (que e o
problema (4.8)). Como corolario, obtemos tambem que EVPI 0.
Para usar a abordagem espere e veja, o agente de decisao deve ser
capaz de (1) resolver cada um dos problemas (4.14) e (2) calcular a media
dos valores otimos correspondentes. Como o problema da mistura mostrou,
estas tarefas podem ser muito trabalhosas! Uma alternativa tentadora e a de
substituir todas as variaveis aleatorias pelas suas medias e, entao, resolver o
problema correspondente. Este problema e denominado problema do valor
esperado ou problema do valor medio:
*
+

EV = min f (x, ) | Ax = b
(4.18)
xX

(
onde
= E [] representa a media de . Vamos denotar por x
) a solucao
otima de (4.18), denominada solucao do valor esperado. Em princpio, nao
(
existe nenhum motivo para esperar que x
) esteja, de alguma maneira,
proxima da solucao x do modelo de recurso (4.16). O valor da solucao
estocastica (VSS = value of stochastic solution) (apresentado no problema
do fazendeiro) e o conceito que justamente mede o quao bom (ou o quao
(
ruim) e a decisao x = x
) em termos de (4.16). Vamos primeiro denir
o resultado esperado no uso da solucao do valor esperado (EEV = Expected
result of using the EV solution):
, 

(), .
EEV = E f x
(4.19)
(
EEV mede a ecacia da decisao x
), permitindo-se que decisoes do segundo
(
estagio sejam escolhidas de maneira otima como funcoes de x
) e . O valor
da solucao estocastica e, entao, denida como
VSS = EEV RP.

(4.20)

50

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

O valor de VSS d
a o custo que se paga quando incertezas s
ao ignoradas
no processo de decis
ao. No problema do fazendeiro, vimos que EEV =
R$ 107 240,00 e RP = R$ 108 390,00, de modo que VSS = R$ 1 150,00.
Pela denicao de RP, segue-se que E [f (x, )] E [f (x, )] para qualquer x X satisfazendo Ax = b. Em particular,
,


RP = E [f (x , )] E f (
x(), ) = EEV.
Isto mostra que EEV da uma cota superior para o valor otimo de RP (que
e o problema (4.8)). Como corolario, obtemos tambem que VSS 0.

4.8

O caso nito

Se e nito, digamos = { 1, . . . , S } Rr , o modelo de recurso (4.8),


via a equivalencia apresentada na secao 4.6, produz o seguinte programa
linear (basta abrir a esperanca em PL0!) denominada forma estendida de
minimizar
xX

cx + p1q1 y1 + p2 q2y2 + + pS qS yS

y1 ,y2 ,...,yS Y

sujeito a

Ax
=
1
T x + Wy1

1
2
+ Wy

Tx
..
..
...
.
.
TS x
+ WyS
&
'
onde ps = P = S , qs = q(s ), ys = y(s ) Ts = T( s )
Aqui estamos supondo que o recurso e xo (W() = W).

b,
h1 ,
h2 ,
..
.
hS ,

(4.21)

e hs = h( s ).

A vantagem deste modelo e que ele e um programa linear. A u


nica desvantagem e o seu tamanho: ele possui n + pS variaveis e m1 + mS restricoes
explcitas (isto e, nao contando as possveis restricoes na denicao de X e Y).

Exerccios
[01] Mostre que para os valores de p, q, W e Y indicados em cada um dos
tres casos na pagina 36, a funcao de recuso v em (4.6) obtem as funcoes
de penalidade (4.3), (4.4) e (4.5) como casos especiais.

Modelos de Recurso

51

[02] Considere um exemplo de (4.8) onde Q(x, ) = miny0 {y | y = 1 x}.


Mostre que se tem distribuicao triangular em [0, 1] (P( u) = u2),
entao K2P
= K2.


[03] Mostre que a matriz W = +I I satisfaz a condicao (4.13).


[04] Mostre que a matriz W = T I satisfaz a condicao (4.13). Aqui
representa o vetor com todas as componentes iguais a 1.
[05] Considere f (x, ) = (x )2, onde x R e e uma variavel aleatoria
com distribuicao uniforme no intervalo [0, 1]. Mostre que, para esta
situacao, min{} e E [] nao comutam:




E min {f (x, )}
= min E [f (x, )] .
xR

xR

Captulo 5
O m
etodo L-shaped
O L-shaped e possivelmente o metodo de resolucao e aproximacao de
problemas de otimizacao estocastica mais conhecido e tradicional. Ele se
originou do metodo de decomposicao de Benders, desenvolvido na decada de
sessenta por J. F. Benders para resolver de maneira mais eciente problemas
de otimizacao com uma determinada estrutura. Na realidade, o L-shaped
pode ser visto como uma aplicacao do metodo de Benders em otimizacao
estocastica. Esse e o ponto de vista que sera adotado nesse texto.

5.1

A decomposi
c
ao de Benders

Considere o problema de otimizacao linear abaixo


VAL =

min

cT x + qT y

sujeito a

Ax = b,
Tx + Wy = h
x, y 0,

x,y

(5.1)

onde c, q, x e y sao vetores em Rn , h e b sao vetores de Rm e A, T, W sao


matrizes m n. O primeiro passo e eliminar a variavel y da formulacao
do problema, criando um subproblema parametrizado por x. Para isso, a
decomposicao de Benders reescreve o problema da seguinte forma:
VAL =

min
x

sujeito a

cT x + Q(x)
Ax = b,
x 0,

(5.2)

O m
etodo L-shaped

53

onde Q(x) e o valor otimo do subproblema


Q(x) =

min
y

qT y

sujeito a Wy = h Tx,
y 0.

(P)

Dualizando (P), temos o problema (D) denido a seguir:


Q(x) =

max
p

sujeito a

pT (h Tx)
WT p q.

(D)

Repare que a dualidade tirou a dependencia do conjunto admissvel D de


(D) em relacao a x, ou seja, para qualquer escolha de x o conjunto admissvel
de (D) e o mesmo:
D = {p Rm | WT p q}.
Vamos assumir que o conjunto D e nao vazio e denotar seus pontos extremos
por p1 , . . . , pI e seus raios extremos por r1 , . . . , rJ . O problema (D) da
origem a duas situacoes distintas:
Se Q(x) = +, entao o simplex devolve o raio extremo r de D. Em
particular (r)T (h Tx) > 0.
Se Q(x) < +, entao o simplex devolve um ponto extremo p de D.
Usando o teorema fundamental da programacao linear (D.1), podemos
reescrever o problema (D) como
Q(x) =

min
z

sujeito a (pi )T (h Tx) z, i = 1, . . . , I,


(rj )T (h Tx) 0, j = 1, . . . , J.

(D)

Nao e difcil ver que esse problema possui o mesmo valor otimo de (D).
As primeiras I restricoes representam os valores da funcao objetivo de (D)
avaliada nos pontos extremos de D. Como queremos minimizar z, o valor
otimo de (D) corresponde ao maior valor de (pi)T (hTx), que e exatamente
o otimo de (D). As J restricoes restantes servem para garantir que estamos
na situacao onde (D) e limitado.

54

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

Finalmente, usando (D), chegamos em uma reformulacao do problema


original (5.1), conhecida por problema mestre completo (PMC), que e a base
para a decomposicao de Benders:
VAL =

cT x + z

min
x,z

sujeito a Ax = b, x 0,
(pi)T (h Tx) z, i = 1, . . . , I (),
(rj )T (h Tx) 0, j = 1, . . . , J ().

(5.3)

Essa formulacao, apesar de equivalente a (5.1), possui varios diferencas


que serao exploradas pela decomposicao de Benders. Primeiramente, a
variavel y nao aparece no PMC. Em seu lugar surge a variavel unidimensional z. Alem disso, nessa formulacao e preciso conhecer os pontos e raios
extremos do conjunto D. Possivelmente o n
umero de restricoes de (5.3) e
gigantesco se comparado a (5.1): se o conjunto admissvel D for muito facetado, entao teremos uma quantidade muito grande de pontos extremos.
Alias, em geral, nao temos nem os pontos nem os raios extremos do conjunto D de imediato. A ideia da algoritmo da decomposicao de Benders e
considerar um problema semelhante a (5.3) nas etapas intermediarias do algoritmo e ir acrescentando restricoes do tipo () ao problema em cada passo.
Mais precisamente, no passo k do algoritmo, o problema mestre restrito de
ordem k (PMRk ) com apenas k restricoes do tipo () e
VALk =

min
x,z

cT x + z

sujeito a Ax = b, x 0,
(pi)T (h Tx) z, i = 1, . . . , k l,
(rj )T (h Tx) 0, j = 1, . . . l.

(5.4)

Para obter pontos e raios extremos de D temos que resolver o problema


(D) em cada passo do algoritmo. Se ele for nito, entao ganhamos um
ponto extremo e, se for ilimitado, ganhamos um raio extremo. Eles serao
adicionado ao problema PMRk , originando o problema PMRk+1.

O m
etodo L-shaped

5.2

55

O algoritmo de Benders

Vamos apresentar o algoritmo de Benders passo a passo. Como a nalidade de um algoritmo e geralmente sua implementacao em computador,
incluiremos na sua descricao tanto a condicao de parada teorica quanto a
computacional. A teorica simplesmente diz que se uma certa condicao for
atingida, entao a solucao encontrada e otima. A computacional pode parar
antes da solucao otima ser encontrada: basta que a diferenca entre uma cota
superior e uma cota inferior sejam menores que uma dada tolerancia .
Passo 1: Dena a cota inferior CI = e a cota superior CS
= +.
Passo 2: Resolva o problema PMRk (5.4). Seja VALk o valor otimo
e (x, z) a solucao encontrada. Atualize CI = VALk .
Passo 3: (a) Se Q(x) < +, entao resolva tambem (P) para x = x
e guarde as solucoes y de (P) e p de (D), respectivamente.
(b) Se Q(x) > z, entao atualize a cota superior
CS = min{CS, cT x + qT y}.
Alem disso, faca
o = {(x, y)} .
melhor soluc
a
Por m, se CS CI < , pare. Caso contrario acrescente a restricao pT (h Tx) ao problema PMRk para
obter PMRk+1 e volte ao Passo 1.
(c) Se Q(x) = z, entao (x, y) e a solucao otima do problema original (5.1).
Passo 4: Se Q(x) = +, seja r o raio extremo gerado pelo resolvedor. Acrescente a restricao (r)T (h Tx) 0 a PMRk
para obter PMRk+1. Volte ao Passo 1.
Vamos analisar em detalhe alguns pontos do algoritmo. No Passo 1,
armamos que VALk e uma cota inferior para o problema original (5.1). De

56

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

fato, se pensarmos na formulacao (5.3), vemos que o conjunto admissvel


esta contido no conjunto admissvel de PMRk e, portanto, VALk e menor
ou igual ao valor otimo de (5.1). Dessa forma, a cota inferior vai sempre
aumentando. A cota superior nao e tao bem comportada. O valor cT x+qT y
e uma cota superior para (5.1) simplesmente por ser admissvel. No entanto,
novos pontos admissveis podem aumentar a cota superior CS, um efeito
por isso que a atualizacao de CS no Passo 3 (b) e um mnimo
indesejado. E
entre a cota antiga e o novo candidato gerado.
Para ver que a condicao Q(x) = z implica em otimalidade para PMC,
note que Q(x) = z implica que z e maior ou igual a (pi )T (h T x), para i de
1 ate I. Entao a solucao (x, z) tambem e admissvel para PMC e, portanto,
ela e otima. Mas o problema original e nas variaveis x e y. Sera que nesse
caso (x, y) e solucao de (5.1)? De fato,
VALk = cT x + z = cT x + Q(x) = cT x + qT y VAL,
onde a u
ltima desigualdade segue pois (x, y) e admissvel. Por outro lado,
o conjunto admissvel de PMRk contem o de PMC, que e uma reescrita do
problema original (5.1). Assim, e trivial que VALk VAL, completando a
prova.

5.3

Um exemplo completo

Considere o problema
VAL =

min
x,y

sujeito a

42 x1 + 18 x2 + 33 x3 8 y1 6 y2 + 2 y3
10 x1 + 8 x2
2 y1 y2 + y3 4,
5 x1 +
8 x3 y1 y2 y3 3,
xi {0, 1}, yi 0, i = 1, 2, 3.

(5.5)

Para ver que esse problema e da forma (5.1) basta considerar as matrizes


T
T
x = x1 x2 x3
, y = y1 y2 y3
,

T

T

T
c = 42 18 33 , q = 8 6 2 , h = 4 3 ,




10 8 0
2 1 1
T=
e W=
,
5 0 8
1 1 1

O m
etodo L-shaped

57

com A = 0. Esse problema e linear, mas as variaveis x1, x2 e x3 so podem


assumir os valores 0 e 1. Como a decomposicao de Benders xa os valores
de x e resolve o problema em y, ela tambem se aplica nesse caso. Vamos
chamar o conjunto de pontos extremos obtidos ate a iteracao k de Pk e os
raios de Rk . Os arquivos em AMPL necessarios para obter as solucoes dos
problemas intermediarios estao em http://www.mat.puc-rio.br/bernardo/.
o 0 CS = +, CI = , P0 = , R0 = .
Iterac
a
Resolvendo o problema PMR0 , vemos que ele claramente e nao
limitado (arquivo benders1.mod), pois nao existem restricoes
sobre z. Arbitramos x0 = (0, 0, 0) e atualizamos a cota inferior:
CI = 0. Resolvendo o problema (D) (arquivo bendersdu0.mod)
obtemos Q(x0 ) = e camos no Passo 4 do algoritmo. O
resolvedor CPLEX nos devolve o raio extremo r0 = (0, 1), que
sera acrescentado a PMR1.
o 1 CS = +, CI = , P1 = , R1 = {(0, 1)}.
Iterac
a
Novamente nao temos restricoes para a variavel z e, portanto,
o problema e ilimitado. Escolhemos x1 = (0, 0, 1), pois ele
e admissvel para PMR1 . Resolvendo o problema (D) (arquivo bendersdu1.mod) obtemos Q(x1 ) = 6 e p1 = (4, 2).
Como Q(x1 ) = 6 > = z 1, resolvemos (benderspr1.mod)
o problema (P) e encontramos y1 = (0, 0.5, 4.5). Assim, CS
= min{+, cT x1 + qT y1 } = 39. Por m acrescentamos o
ponto extremo (4, 2) ao problema PMR1 para obter PMR2 .
o 2 CS = 39, CI = , P2 = {(4, 2)}, R2 = {(0, 1)}.
Iterac
a
Resolvendo (arquivo benders2.mod) PMR2 encontramos que
VAL2 = 0, x2 = (1, 1, 0) e z 2 = 60. Apos atualizar CI
= 0, resolva (arquivo bendersdu2.mod) (D) para x = x2 . A
solucao encontrada foi Q(x2 ) = 16 e p2 = (0, 8). Como
16 > 60, temos que resolver (arquivo benderspr2.mod) o
problema (P). A solucao e y2 = (2, 0, 0). A cota superior ca
inalterada nesse caso pois o valor de cT y2 + qT y2 e maior que
39. Acrescentando-se o ponto extremo p2 a PMR2 obtemos
PMR3 .

58

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

o 3 CS = 39, CI = 60, P3 = {(4, 2), (0, 8)}, R3 = {(0, 1)}.


Iterac
a
Resolvendo (arquivo benders3.mod) PMR3 encontramos que
VAL3 = 17, x3 = (1, 1, 1) e z 3 = 76. Atualize CI = 17 e
resolva (bendersdu3.mod) (D) para x = x3 . O resultado e
Q(x)3 = 68, com p3 = (2, 4). Como 68 > 76, temos que
resolver (arquivo benderspr3.mod) o problema P. A solucao e
y3 = (4, 6, 0). A nova cota superior e CS = 25. Acrescentandose o ponto extremo p3 a PMR3 obtemos PMR4.
o 4 CS = 25, CI = 17, P4 = {(4, 2), (0, 8), (2, 4)}, R4 = {(0, 1)}.
Iterac
a
Resolvendo (arquivo benders4.mod) PMR4 encontramos que
VAL4 = 17, x4 = (1, 1, 1) e z 4 = 68. Atualize CI = 25 e
note que como x3 = x4 , entao Q(x4 ) = 68. Finalmente,
temos Q(x4 ) = z 4 = 68 e, portanto, a condicao de parada
foi satisfeita! A solucao otima e x = (1, 1, 1) e y = (4, 6, 0),
com VAL = 25.

5.4

Decomposi
c
ao de Benders em otimiza
c
ao estoc
astica: o m
etodo L-shaped

Considere um problema de otimizacao estocastica na forma estendida,


como em (4.21). Repare que o problema (5.1) tem o mesmo formato de (4.21),
porem com menos restricoes. Vamos apresentar duas versoes do metodo Lshaped: o classico e o multicortes. O metodo L-shaped multicortes consiste
em usar decomposicao de Benders na forma estendida de um problema estocastico.
O primeiro passo e reescrever o problema (4.8), de maneira analoga ao que
foi feito para (5.1). Denotando por = { 1, 2 , . . . , S } o espaco amostral
da variavel aleatoria subjacente a (4.21) e denindo pi = P( i), temos
VAL =

min
x

sujeito a

cT x +

S

s=1 ps Q

Ax = b,
x 0,

(x, s)
(5.6)

O m
etodo L-shaped

59

onde
Qs (x, s) =

qT ys

min
y

sujeito a Wys = hs Ts x,
ys 0.

(5.7)

para cada i de 1 a S.
Repare que a estrutura da formulacao estendida (4.21) naturalmente desacopla os s problemas (5.7). Dualizando cada um deles, tem-se
max

pT (hs Ts x)

sujeito a

Wp qs .

Qs (x, s) =

(5.8)

Agora vamos reescrever o problema (5.8) da mesma forma que foi feito
para (D):
Qs (x, s) =

min
zs

zs
i(s)

sujeito a (ps )T (hs Tx) zs , i(s) = 1, . . . , Is,


j(s)
(rs )T (hs Tx) 0, j(s) = 1, . . . , Js,

(5.9)

umero de pontos extremos do conjunto Ds = {p | W p qs },


onde I s e o n
i(s)
umero de raios extremos de Ds , ps sao os pontos extremos de D
J s e o n
j(s)
e rs sao os raios extremos, para cada s = 1, . . . , S. Portanto, podemos
reescrever o problema na forma estendida como
VAL =

min

cx +

x,z

i(s)

S

s=1 ps zs

sujeito a (ps )T (hs Tx) zs , i(s) = 1, . . . , Is, s = 1, . . . , S,


j(s)
(rs )T (hs Tx) 0, j(s) = 1, . . . , Js, s = 1, . . . , S,
(5.10)
que e tambem chamado de PMC. A partir da o algoritmo L-shaped multicortes e analogo a Benders. Considera-se problema mestre restrito PMRk
e, em cada passo do algoritmo, vao se adicionando cortes da mesma forma
que foi feita na secao 5.2. A u
nica diferenca e que no caso do L-shaped
serao acrescentados ate S cortes em cada passo, oriundos de cada um dos S
problemas (5.8). Alem disso, a condicao de otimalidade tem que se vericar
para todo s, ou seja, Q(xs ) = z s . para s de 1 a S.

60

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

O metodo L-shaped classico pode ser pensado como uma variante do Lshaped multicorte. Por simplicidade, vamos assumir que os s problemas
(5.8) possuem solucao otima. Ao inves de se construir S cortes a partir
dessas solucoes, constroi-se apenas um corte, que uma especie de media dos
cortes obtidos:
S
!

T
ps (pi(s)
s ) (hs Ts x) z, i(s) {1, . . . , Is }, s = 1, . . . , S.

(5.11)

s=1

Naturalmente, temos apenas uma variavel z nesse caso, pois temos apenas
um corte.

Exerccios
[01] Considere o problema (4.8) com c = 0, X = [0, 10], (q +, q ) = (1, 1) e
discreta assumindo os valores 1, 2 e 4 com probabilidade 1/3. Resolva
o problema usando o metodo L-shaped, classico ou multicorte.
[02] Considere o problema (4.8) com c = 1/2, X = [0, 5], (q +, q ) = (1, 3) e
discreta uniforme assumindo os valores 1, 2, 3 e 4. Resolva o problema
usando o metodo L-shaped (classico ou multicorte).

Captulo 6
Restri
c
oes probabilsticas
6.1

Introdu
c
ao

Os modelos de recurso em dois estagios se caracterizam por uma escolha


no primeiro estagio seguida de uma acao de recurso, que e uma decisao que
ocorre apos a realizacao da incerteza do problema. Conforme descrito no
Captulo 4, a acao de recurso tenta compensar possveis desvios das metas
pre-xadas no problema, sofrendo penalidades para faltas e excessos. Em
aplicacoes, muitas vezes nao e possvel modelar de maneira razoavel esses
custos de penalidade. Mais ainda: eles podem simplesmente nao existir em
certos contextos.
Em tais circunstancias, o agente de decisao esta interessado em satisfazer
suas metas na maioria dos casos. Mais precisamente, admite-se que para
algumas realizacoes extremas da incerteza do problema as metas nao sejam
atendidas. Uma decisao sera admissvel se ela satiszer as restricoes com probabilidade igual ou maior que um grau de conabilidade pre-determinado
pelo agente de decisao. Nesse caso usamos as restricoes probabilsticas
p(x) := P (T()x h()) , x Rn ,
onde [0, 1] e o grau de confiabilidade da restricao, escolhido pelo agente
de decisao, T e uma matriz m n e h e um vetor de tamanho m. Aqui
p(x) representa a conabilidade da decisao x, isto e, a probabilidade que a
meta T()x h() seja satisfeita. Em oposicao, seu complemento 1 p(x)
interessante
representa o risco de inadimissibilidade associado `a decisao x. E
notar o carater qualitativo das restricoes probabilsticas: o que esta em jogo e

62

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

satisfazer ou nao a meta T()x h(), nao importando o quanto a restricao


foi atendida ou violada. No caso dos modelos de dois estagios, a medida da
admissibilidade e qualitativa: decisoes que falham por pouco em satisfazer
as metas sao preferidas a`quelas que se distanciam mais das metas.
Existem essencialmente dois tipos de restricoes probabilsticas. Quando
queremos satisfazer as metas separadamente temos as as restricoes probabilsticas individuais (RPI):
pi (x) := P (Ti ()x hi ()) i , x Rn , i = 1, . . . , m,

(6.1)

onde i [0, 1] e Ti sao as linhas da matriz T. Um ponto x e considerado


admissvel se, e somente se,
pi (x) i i = 1, . . . , m.
Quando queremos satisfazer as metas de maneira conjunta temos a restricao
probabilstica conjunta (RPC)
p(x) := P (Ti()x hi (), i = 1, . . . , m) ,
onde [0, 1].
Como decidir entre o uso de restricoes probabilsticas individuais ou conjuntas? Do ponto de vista de modelagem, temos a seguinte distincao: se,
quando agrupadas, as metas individuais representam uma u
nica meta sntese,
entao e mais apropriado o uso de RPC. Se, por outro lado, cada uma das
metas individuais descreve um objetivo diferente, e mais apropriado o uso de
restricoes individuais, pois diferentes escolhas dos i resultam em pesos diferentes para as metas. Neste sentido, RPI sao uma ferramenta mais exvel
para se modelar um problema. Consideracoes de ordem pratica tambem sao
importantes: em geral e mais difcil trabalhar com uma RPC do que com
diversas RPI. Mesmo que numa determinada situacao faca mais sentido usar
RPC, pode-se usar RPI para se obter um ponto admissvel para o problema
conjunto:

Restri
co
es probabilsticas

63

Proposic
ao 6.1 Considere a RPC p(x) > . Se um vetor x satisfaz
pi (x) i , i = 1, . . . , m, para i = 1 (1 )/m, entao x satisfaz
p(x) > . Em outras palavras, para encontrar um ponto admissvel
para um problema com uma RPC e nvel de conabilidade , e suciente encontrar um ponto admissvel do problema com RPI com
i = 1 (1 )/m.
Demonstrac
ao: Pela Desigualdade de Bonferroni, para eventos arbitrarios
)
m
E1, . . . , Em vale que, P ( m
E
)

i=1 i
i=1 (1 P(Ei )).
Antes de estudarmos as propriedades matematicas e os resultados teoricos
sobre problemas com restricoes probabilsticas, vamos considerar um exemplo em nancas que aparece nos mais diversos contextos, desde nancas
pessoais ate na gestao de uma carteira de investimentos de uma empresa.

6.2

Ativos e passivos em uma carteira

Seguindo Henrion [12], considere o fundo de pensao de uma companhia


com certas obrigacoes nanceiras para os proximos 15 anos. Alem de um
capital disponvel de K = R$ 250 000, o fundo de pensao pode investir em
tres ttulos de investimento (bonds) que dao pequenos retornos anuais, os
chamados coupons. Ao nal da vigencia destes ttulos, o comprador recebe
uma quantia semelhante ao valor pago inicialmente, o chamado valor de face.
Queremos maximizar o total de dinheiro disponvel ao nal de 15 anos. Para
i = 1, . . . , 3 e j = 1, . . . , 15, denimos
ij
j
i
xi

:=
:=
:=
:=

rendimento por ttulo i no ano j;


pagamento a ser feito no ano j;
custo por ttulo do tipo i;
quantidade de ttulos do tipo i a serem comprados.

A quantidade de dinheiro disponvel no fundo ao nal do ano j e


K
"

n
!
i=1
#$

i x i +
%

dinheiro ap
os compra

j
n
!
!

"k=1 i=1
#$

ik xi
%

rendimentos dos ttulos

j
!

k .

"k=1
#$ %

pagamentos

(6.2)

64

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

Adotando um perl mais conservador, vamos exigir que (6.2) seja positivo para todo j. Iniciaremos nosso estudo do problema com um modelo
determinstico. Introduzindo as variaveis
aij :=

j
!

ik i

k=1

bj :=

j
!

k K,

k=1

o problema de otimizar a carteira do fundo honrando as obrigacoes nanceiras ca


 n
. n
/
 !
!

maxn
aim xi 
aij xi bj , j = 1, . . . , m ,
(6.3)
xR+

i=1

i=1

onde as restricoes obrigam que se tenha um capital total positivo no ano j


e a funcao objetivo corresponde ao total de dinheiro ao nal dos 15 anos
(a menos de uma constante igual a R$ 71 000). Note que x Rn+ obriga
que se compre quantidades positivas dos ttulos (nao se admite venda a
descoberto). Os dados do problema estao na Tabela 6.1.
Ano
Pagamentos
j
j
1
11 000
2
12 000
3
14 000
4
15 000
5
16 000
6
18 000
7
20 000
8
21 000
9
22 000
10
24 000
11
25 000
12
30 000
13
31 000
14
31 000
15
31 000
Custo por tipo de ttulo:

Rendimento por tipo de ttulo


1j
2j
3j
0
0
0
60
65
75
60
65
75
60
65
75
1 060
65
75
0
65
75
0
65
75
0
65
75
0
65
75
0
65
75
0
65
75
0
1 060
75
0
0
75
0
0
75
0
0
1 075
980
970
1 050

Tabela 6.1: Dados para o problema de ativos e passivos

Por simplicidade, vamos admitir que quantidades fracionarias de ttulos


possam ser adquiridas. Neste caso, a solucao do problema linear (6.3) e
(x1, x2, x3) = (31.11, 55.53, 147.29),

(6.4)

Restri
co
es probabilsticas

65

com R$ 127 331.97 ao nal de 15 anos. A quantidade de dinheiro em funcao


do tempo e apresentada na Figura 6.1. Podemos observar que esse valor e
igual a zero em 3 instantes. Formalmente isto nao contradiz as restricoes,
porem o fundo ca muito dependente da exatidao dos dados de pagamento
na Tabela 16.1. Nao e difcil imaginar situacoes em que as obrigacoes nanceiras j sofram pequenas alteracoes: mudancas demogracas, por exemplo,
podem aumentar as obrigacoes do fundo de pensao. Neste caso, a solucao
determinstica poderia gerar uxos de dinheiro nao admissveis.

140000
120000

dinheiro

100000
80000
60000
40000
20000
0
-20000

8
ano

10

12

14

Figura 6.1: Fluxo de dinheiro.

Vamos dar um passo adiante no modelo e assumir que os j sao medias


de variaveis aleatorias j que representam pagamentos aleatorios. Mais precisamente, vamos assumir que os j sao variaveis aleatorias normais independentes com medias j dadas na Tabela 6.1 e desvio-padrao j = 500 j,
j = 1, . . . , m. Essa escolha se justica pelo fato da incerteza crescer com o
tempo.
Fixando a solucao determinstica (6.4) e gerando 100 cenarios de pagamentos de acordo com as distribuicoes dos j , vemos na Figura 6.2 que os
uxos de dinheiro para diversos cenarios ca abaixo de zero, particularmente
nos anos em que ele era zero no modelo determinstico. Na instancia que
rodamos, 77 cenarios geraram uxo negativo. A Figura 6.3 comprova que
a solucao determinstica nao e mais satisfatoria para esta situacao: para
cada ano, a percentagem de cenarios que violam a restricao de positividade

66

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

e extremamente alta, ultrapassando 50% em alguns anos.

160000
140000
dinheiro final

120000
100000
80000
60000
40000
20000
0
2

-20000

8
ano

10?

14

12

-40000

Figura 6.2: Cenarios para a solucao determinstica.

0.5

probabilidade

0.4

0.3

0.2

0.1

8
ano

10

12

14

Figura 6.3: Probabilidades para solucao determinstica.

Para obter uma solucao mais robusta, propomos uma modelagem utilizando restricoes probabilsticas individuais. Em cada ano, pediremos que
a probabilidade de se estar com uma quantidade positiva de dinheiro seja

maior que = 95%. Denindo-se j = jk=1 j K como sendo a contrapartida estocastica da constante bj de (6.3), obtemos o seguinte problema

Restri
co
es probabilsticas

67

com restricoes probabilsticas individuais:


0 n
1
n
!
!
maxn
aim xi sujeito a P
aij xi j , j = 1, . . . , m.
xR+

i=1

(6.5)

i=1

Aqui P denota a medida de probabilidade associada as variaveis aleatorias j .


O problema (6.5) pode ser resolvido usando-se a ferramenta computacional SLP-IOR [16], desenvolvida pelos professores Peter Kall e Janos Mayer.
O SLP-IOR e um programa gratuito (para ns academicos) que permite modelar um problema de otimizacao estocastica linear e resolve-lo atraves de
um dos diversos solvers disponveis.
Para usar o SLP-IOR, e necessario fornecer a media e variancia das
variaveis aleatorias j . Sabemos que a esperanca E[j ] e igual a j . Usando
a denicao de j e o fato de que as variaveis aleatorias j sao independentes,
temos que a variancia de j e dada por
2j

j
!

k2, j = i, . . . , m,

(6.6)

k=1

onde j2 e a variancia de j . Para maiores detalhes sobre como entrar com


os dados referimos o leitor ao tutorial disponvel em [4].
Problemas de RPI como (6.5) sao, em geral, difceis de serem resolvidos e
temos que recorrer a aproximacoes e algoritmos para se obter uma solucao.
Por causa da hipotese de normalidade, podemos nesse caso converter as
restricoes de (6.5) em restricoes lineares e resolver o problema. Para cada j
dena
j := 1
(j bj ).
(6.7)
j
O leitor deve vericar que cada j e uma variavel aleatoria normal com
media 0 e variancia 1. Portanto temos
1
0
0 n
1
1
0 n
!
!
(6.8)
P
aij xi j = P 1
aij xi bj j .
j
i=1

i=1

Denotando-se por q o quantil da distribuicao normal padrao (por exemplo, q0.95 = 1.65), segue que
1
0 n
n
!
!
aij xi j
aij xi bj := bj + q .
(6.9)
P
j

i=1

i=1

68

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

Em outras palavras, convertemos cada restricao probabilstica individual


em uma restricao linear, o que facilita enormemente a resolucao do problema (6.5). Apos a conversao, percebe-se que o problema (6.9) e quase
identico ao problema determinstico original (6.3). A diferenca j qp no lado
direito de (6.9) pode ser interpretada como um termo de seguranca. Como
esta quantidade e positiva, a solucao para este problema e mais conservadora:
(x1, x2, x3) = (62.87, 72.63, 101.06),

(6.10)

interessante notar que ocorreu


com R$ 103 924.54 ao nal de 15 anos. E
uma migracao para os ttulos de curto prazo. Uma interpretacao e que existe
mais incerteza associada ao futuro. Portanto, um excesso de investimento
em ttulos de longo prazo pode gerar decit nos primeiros perodos em razao
da demora em se receber o valor de face daquele ttulo.
Vamos fazer uma analise de sensibilidade para o problema (6.5) em relacao
ao parametro . A Figura 6.4 mostra o valor da funcao objetivo de (6.10)
em funcao do nvel de conabilidade . O decrescimo e moderado para
valores ate 95%. Deste valor em diante, ganhos em conabilidade implicam
em grandes perdas na quantidade de dinheiro ao nal do u
ltimo ano.
140000

120000

dinheiro final

100000

80000

60000

40000

20000

0.5

0.6

0.7

0.8

0.9

1.0

Figura 6.4: Nvel de conanca versus dinheiro em j = 15.

Comparando com a Figura 6.2, a Figura 6.5 mostra que a solucao descrita
em (6.10) esta muito mais protegida contra variacoes no valor dos pagamentos. Vemos que em cada ano apenas um pequeno n
umero de cenarios gera

Restri
co
es probabilsticas

69

uxos de dinheiro negativos. A diferenca entre cenarios de cor e cinza e


preta sera explicada mais a` frente. A Figura 6.6 mostra que, para cada ano,
a probabilidade do capital car negativo gira em torno de 5%, que esta de
acordo com a escolha de = 95%.
O modelo com RPI e bastante atraente do ponto de vista pratico pois
e possvel converter as restricoes probabilsticas em simples restricoes (determinsticas) lineares. No entanto, ele esconde uma desvantagem: o fundo
de pensao nao esta totalmente protegido se a solucao (6.10) for adotada. A
razao e que as RPI garantem que em cada ano a probabilidade de se estar com balanco negativo e pequena. No entanto, a probabilidade de car
negativo em pelo menos um ano continua alta.
Para ilustrar essa armacao, voltemos a Figura 6.5. Os cenarios pintados
de preto sao aqueles para os quais o fundo cou negativo ao menos uma vez.
Isto ocorreu para um total de 14 cenarios, um n
umero elevado se considerarmos que a conabilidade desejada e de 95%. Para a solucao determinstica, o
experimento mostrado na Figura 6.2 revelou que 77 dos 100 cenarios caram
negativos ao menos uma vez.
140000
120000

dinheiro final

100000
80000
60000
40000
20000
0

10

12

14

ano

-20000

Figura 6.5: Cenarios para a solucao com RPI.

Para levar em conta esta conabilidade uniforme, e preciso trocar as m


RPI por uma restricao probabilstica conjunta da forma
0 n
1
n
n
!
!
!
ai1 xi 1,
ai2 xi 2 , . . . ,
aim xi m .
P
(6.11)
i=1

i=1

i=1

70

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

0.08
0.07

probabilidade

0.06
0.05
0.04
0.03
0.02
0.01
0

8
ano

10

12

14

Figura 6.6: Probabilidades para solucao com RPI.

O calculo de (6.11) requer integracao multidimensional e nao e conhecida


uma maneira de converter esta RPI em uma restricao determinstica. O programa SLP-IOR possui algoritmos para lidar com restricoes como (6.11) para
o caso normal multivariado.
Observe que o vetor aleatorio (1, . . . , m ) segue uma distribuicao normal
multivariada com media
0
1
2
m
!
!
= 1 K,
k K, . . . ,
k K
k=1

e matriz de covariancia

12
12
2 2 + 2
1 1
2
..
..
.
.
2
2
1 1 + 22

k=1

12

12 + 22
..
...
.
2
2
1 + + m

(6.12)

Usando o SLP-IOR, obtemos a seguinte solucao para o problema com uma


RPC:
(x1, x2, x3) = (66.91, 80.26, 89.30),
(6.13)
com um capital de R$ 99 101.75 ao nal de 15 anos. Comparando esta solucao
com a solucao do caso de RPI, novamente existe uma migracao para ttulos
de curto prazo. Alem disso ocorreu uma pequena reducao na quantidade

Restri
co
es probabilsticas

71

nal de dinheiro. No entanto, a robustez cresceu signicativamente: de 100


cenarios simulados, apenas 5 geraram uxos de dinheiro que cam negativos
ao menos uma vez, em sintonia com a conabilidade = 95% escolhida. A
Figura 6.7 mostra em preto os 5 cenarios que caram negativos ao menos
uma vez no perodo de 15 anos.
140000
120000

dinheiro final

100000
80000
60000
40000
20000
0

10

12

14

ano

-20000

Figura 6.7: Cenarios para solucao com RPC.

6.3

Propriedades de restri
c
oes probabilsticas

Vamos agora passar ao estudo das propriedades matematicas dos problemas com restricoes probabilsticas. Mais precisamente, estamos interessados
em propriedades dos conjuntos
C() = {x Rn | p(x) },

(6.14)

que e o conjunto admissvel para o caso de uma RPC, e do conjunto


C(1, . . . , m ) :=

m
(

Ci (i), Ci (i) = {x Rn | pi (x) i },

(6.15)

i=1

o analogo para o caso de RPI. Em particular, estamos interessados nas seguintes questoes:
Esses conjuntos sao fechados?

72

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

Esses conjuntos sao convexos?


Vejamos um exemplo: seja p(x) = P (x1 + x2 7), com uniforme em
[0, 1]. Qual e o conjunto C() nesse caso? Se x1 > 0 entao


7 x2
7 x2
=1F
.
p(x) = P (x1 + x2 7) = P
x1
x1
Logo, p(x) se, e somente se, F 1(1 )x1 + x2 7. Procedendo de
maneira analoga para os casos x1 < 0 e x1 = 0, mostra-se que C() =
2
2
C+() C0 () C (), onde


C+() = x R2 | x1 > 0 e F 1(1 ) x1 + x2 7 ,


C 0 () = (0, x2) R2 | x2 7 ,


C() = x R2 | x1 < 0 e F 1() x1 + x2 7 .

A Figura 6.8 exemplica C() para os valores 0.3 e 0.7 respectivamente. E


facil ver que C() e um conjunto fechado para todo [0, 1], mas ele so e
convexo para 0.5.
15

15

0
{10

10

{10

= 0.3

10

= 0.7
Figura 6.8: O conjunto C().

Observe que o conjunto C() e um nvel superior da funcao p(x) e que


portanto ele e fechado se, e somente se, a funcao p(x) e semi-contnua superiormente (SCS). Isso de fato ocorre, como mostra a proposicao a seguir:

Restri
co
es probabilsticas

73

Proposic
ao 6.2 Seja C() o conjunto denido em (6.14).
A funcao p(x) e semi-contnua superiormente e, portanto, os conjuntos C() sao fechados para todo [0, 1].
Se 0 1 < 2 1, entao C(1) C(2). Alem disso, C(0) =
Rn e vale que C()
= [0, 1] se, e somente se, C(1)
= .

A segunda parte da proposicao e imediata. Para uma prova da primeira


parte ver [11].
Em relacao a` convexidade, nao existem resultados gerais como a Proposicao 6.2. Na verdade, a Figura 6.8 mostra que nao podemos esperar
que o conjunto C() seja convexo para todo sem que hipoteses sejam
acrescentadas. O que faremos a partir de agora e estudar casos particulares importantes onde o conjunto C() e convexo para determinados valores
de .
Suponha que a matriz T seja determinstica, ou seja, T() = T e que
h() = . No caso univariado, temos o seguinte resultado:
Teorema 6.1 Seja T um vetor constante 1 n e uma variavel
aleatoria com funcao distribuicao F . Entao C() e um conjunto fechado e convexo para todo [0, 1]. De fato, podemos escrever C()
explicitamente:


C() = x Rn | Tx F 1() ,
onde F 1() := mintR {t | F (t) }, (0, 1).
Demonstrac
ao: Por denicao, temos C() = {x Rn | p(x) }. Mas
p(x) = P(Tx ) = F (Tx) . Passando a inversa (generalizada) de
F dos dois lados da u
ltima inequacao nos da o resultado.
No caso multidimensional nao temos um resultado tao simples quanto
o Teorema 6.1. Enunciaremos sem provar um teorema que combina dois
resultados para o caso multidimensional:

74

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

Teorema 6.2 Sejam T uma matriz constante mn (m 2) e Rn


um vetor aleatorio contnuo com funcao distribuicao F e densidade f .
(i) (Prekopa) Se log(f ) e concava (com log(0) := ) ou
(ii) (Borell) se f 1/m e convexa (com 01/m := ),
entao C() e um conjunto fechado e convexo para todo [0, 1].
A prova vai alem do escopo deste livro e pode ser encontrada em [24].
As condicoes (i) e (ii) do Teorema 6.2 sao satisfeitas para muitas distribuicoes importantes. Suponha que seja normal multivariada com media
e matriz de covariancia . Assumindo que e positiva denida, sua
densidade e


1
1
f (x) = n/2 1/2 exp
(x )T 1(x )
,
2
2 ||
onde || e o determinante da matriz . Nao e difcil vericar que a segunda
derivada de log(f (x)) e igual a 1 , o que mostra que log(f (x)) e concava
e, portanto, C() e convexo de acordo com a parte (i) do Teorema 6.2.
Outro exemplo e a distribuicao uniforme: seja Rn um conjunto
convexo. Considere a distribuicao uniforme em , com densidade

1/A(), se x ,
f (x) =
0,
caso contrario.
Usando a denicao de convexidade via epigrafos (ver [11]) e escolhendo qualquer uma das caracterizacoes do Teorema 6.2, obtem-se o resultado. Para
uma lista de distribuicoes importantes que satisfazem o Teorema 6.2 ver o
Captulo 5 de [24].
Quando a matriz T() nao e constante, o problema de restricoes probabilsticas cresce muito em diculdade. Tecnicas amostrais podem ser usadas
para se obter candidatos a solucao e cotas superiores para o valor da funcao
objetivo nesta situacao. Sugerimos a leitura de [21], onde os autores estudam
um problema de selecao de carteiras com T () aleatorio.
No entanto, existe um caso particular extremamente importante onde
T() e um vetor 1 n aleatorio para o qual e possvel obter uma expressao
fechada para o conjunto C():

Restri
co
es probabilsticas

75

Teorema 6.3 Suponha que h() = h e T() = (1, . . . , n), onde


(1, . . . , n) segue uma distribuicao normal multivariada com media
= (1 , . . . , n ) e matriz de covariancia . Entao
*
+

n
T
1
T
C() = x R | x h + () x x ,
onde e distribuicao de uma normal unidimensional com media 0 e
variancia 1. Nesse caso, C() e convexo se [1/2, 1].
Demonstrac
ao: A variavel aleatoria T x segue um distribuicao normal com
media T x e variancia 2(x) := xT x. Denindo-se Z como uma variavel
aleatoria normal padrao e assumindo que 2(x)
= 0, temos

T
& T
'
h T x
x T x

P xh P

T x
T x
x
x


h T x

1P Z
T x
x


h T x

1
T x
x

T
xh


xT x
T x h

1()
xT x

T x h + 1() xT x,
onde a quarta equivalencia segue de (x) = 1 (x), o que obtem a
1
expressao para C(). Para mostrar a convexidade, note
que () 0 se
[1/2, 1] e, portanto, basta mostrar que (x) = xT x e uma funcao
convexa em x. De fato, como e uma matriz simetrica positiva denida,
podemos escrever
= PDPT ,
onde D e diagonal com entradas maiores ou iguais a zero e P e a matriz
dos autovetores de . Denindo-se S como a matriz formada pelas razes
quadradas das entradas de D, temos que
= PDP = PSST PT = CT C,

76

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

onde C = (ST PT ). Logo


(x) = (xT x)1/2 = (xT CT Cx)1/2 = Cx2,
onde  2 denota a norma euclidiana, que e uma funcao convexa.
Diversos artigos em otimizacao estocastica zeram uso do Teorema 6.3.
O artigo de Charnes, Cooper e Symmonds [6], considerado pioneiro na area
de restricoes probabilsticas, usou a hipotese de normalidade para resolver
um problema de aquecimento de oleo. Outra aplicacao interessante pode
ser encontrada em [22], onde o autor considera uma versao estocastica do
problema da dieta. Mesmo para outras distribuicoes que nao a normal multivariada, o caso normal ainda serve de referencia para experimentos realizados
com outras distribuicoes como, por exemplo, a lognormal multivariada [21].
Exerccios
[01] Demonstre a Proposicao 6.1
[02] Considere T() = (1, 2), h() = 1, onde (1 , 2) possui distribuicao discreta com P ((1, 2) = (3, 0)) = 1/7, P ((1, 2) = (0, 3)) =
2/7 e P ((1, 2) = (1, 1)) = 4/7. Esboce conjunto admissvel C() para
esta situacao e mostre que ele e convexo para = 0, 2/7 4/7 e
5/7 1.
[03] Implemente o modelo do fundo de pensao determinstico e resolva-o no
seu solver linear predileto.
[04] Implemente e resolva no SLP-IOR o modelo do fundo de pensao com
restricoes probabilsticas individuais e com a restricao probabilstica
conjunta. Sugestao: dena cotas superiores articiais (e.g. x 200)
para a variavel de decisao x no caso conjunto pois os solvers precisam
desse valores.
[05] O que acontece no Teorema 6.3 quando (x) = 0?

Captulo 7
M
etodos Amostrais
Nessa secao vamos estudar metodos amostrais. Esses metodos diferem
dos anteriores por uma razao fundamental: eles supoem que podemos sortear
em computador n
umeros aleatorios com respeito a uma dada distribuicao.
Por essa razao, conceitos de estatstica vao aparecer no desenvolvimento dos
algoritmos. O primeiro deles, a aproximacao pela media amostral, e um
metodo de amostragem exterior: obtem-se uma amostra e, em seguida, se
resolve o problema. Ja a decomposicao estoc
astica e um metodo interior: a
amostragem ocorre durante a execucao do algoritmo.

7.1

Aproxima
c
ao pela m
edia amostral

Considere o problema



f (x) = E [F (x, )] =
VAL =
min
G(x, )g(x)dx
xX

(7.1)

Ax = b, x 0,

sujeito a

onde g e a densidade de . O problema de recurso com dois estagios (4.8) e


um caso particular de (7.1). Para ver isso dena
X = {x | Ax = b},

f (x) = cT x + Q(x),

Q(x) = E[Q(x, )],

Q(x, ) = min{qT y | Wy = h() T()x}.


yY

A principal diculdade em resolver o problema (7.1) e a presenca da esperanca, que e uma integral. Em geral, nao e possvel resolver explicitamente

78

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

essa integral, que pode ser n-dimensional se o vetor de variaveis aleatorias


tiver dimensao n. Como essa integral e a esperanca de F (x, ), podemos
aproxima-la pela soma de n sorteios da variavel aleatoria e dividir o resultado por n.
Essa ideia e natural: pense num lancamento de uma moeda honesta modelado por uma variavel aleatoria Y , que assume o valor 1 quando o resultado
e cara e 0 quando e coroa. Se quisermos aproximar a media dessa variavel
aleatoria, que e 1/2, podemos lancar uma moeda digamos 100 vezes, somar
os valores obtidos e dividir o total por 100. Espera-se que o valor seja perto
de 1/2.
Vamos denir a aproximac
ao da media amostral (AMA), que e uma aproximacao para o problema (7.1):
/
N
!
1
vn = min fN (x) =

F (x, i ) .
xX
N i=1
.

(7.2)

O estimador fN (x) e nao-viesado para o valor otimo f (x) do problema


(7.1):
4
3 N
!
1
1
E [f(x)] = E
F (x, ) = N f (x) = f (x).
N
N
i=1
Construindo uma cota inferior

Lema 7.1 O estimador vN subestima o valor otimo v do problema (7.1), isto e,


E[
vN ] v .

Prova. Note que


.

v = min E [F (x, )] = min E N 1


xX

xX

N
!
j=1

4/
F (x, j )

M
etodos Amostrais

79

Entao

.
min
xX

N
1 !
F (x, j )
N j=1

E min N 1
xX

N
!

N
1 !

F (x, j )
N j=1


/4
F (x, j )

3
E

j=1

3
vN ] min E
E [
xX

N
1 !
F (x, j )
N j=1

4
N
1 !
F (x, j ) = v .
N j=1

Temos assim uma cota inferior para o problema original (7.1). Infelizmente, nao e facil calcular E [
vN ]. O que faremos e aproximar esse valor
atraves de amostragem. Gere M amostras independentes 1,j , . . . N,j , j =
1, . . . , M, de tamanho N . Para cada pacote j de N amostras resolva o problema AMA correspondente:
/
.
N
!
1
j
= min
F (x, i,j ) .
(7.3)
vN
xX
N j=1
Cada um dos j problemas (7.3) fornece uma realizacao da variavel aleaj
j
toria vN
. Logo, conseguimos uma aproximacao para E[
vN
] tirando a media
dos M problemas (7.3):
M
1 ! j
v .
(7.4)
LN,M =
M j=1 N
j
facil ver que o estimador LN,M e nao viesado para E [
E
vN
] e, portanto, e
um bom candidato para aproximar a cota inferior do problema original (7.1).
j
vN
], da mesma
Podemos construir um intervalo de conanca para E [
forma que foi feito no apendice B, equacao (B.7). Pelo teorema central do
limite (A.2), em particular os resultados equivalentes (A.3), temos

n (LN,M E[
vN ]) (0, L2 ),

80

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

onde (, 2) e a variavel aleatoria normal com media e variancia 2 . Para


aproximar a variancia L2 , vamos usar o estimador S 2 , denido em (B.2).
1 ! j
=
(
vN LN,M )2 .
M 1 j=1
M

L2

(7.5)

Por m basta escolher um tolerancia e encontrar o valor z/2 correspondente (ver equacao (B.3)). Assim como foi feito para (B.7), temos um
intervalo (aproximado) 100 (1 )% conavel para o parametro E[
vN ]:


L
L
z
z
(7.6)
LN,M , LN,M +
M
M
Construindo uma cota superior
Vamos agora tentar encontrar uma cota superior para o problema (7.1).
um ponto admissvel para o problema (7.1). Por se
Para isso, considere x
tratar de um problema de minimizacao, e imediato que f (
x) e uma cota superior para o problema (7.1). Nossa tarefa sera encontrar um bom estimador
(nao-viesado) para f (
x) e assim obter uma cota superior para o problema
(7.1).
Comece gerando T amostras independentes 1,j , . . . , N ,j de tamanho N .
Para cada um dos T pacotes de amostras dena
N
1 !
j

fN (x) =
F (x, i,j ), x X e j = 1 . . . , T.
N i=1

(7.7)

x) e uma aproximacao para f (


x), para todo j. Tirando a
Em particular, fNj (
media entre as T aproximacoes temos um estimador nao-viesado para f (
x):
T
1 ! j
UN,T (
f (
x) =
x).
T j=1 N

Aplicando novamente o teorema central do limite A.2, temos

d
T (UN,T f (
x)) (0, U2 ),

(7.8)

(7.9)

M
etodos Amostrais

81

onde U2 e a variancia de f (
x). Novamente vamos aproximar a variancia pelo
2
estimador S :
1 ! j
=
(fN (
x) UN,T )2.
T 1 j=1
T

U2

Para uma tolerancia , temos imediatamente um intervalo 100 (1 )%


conavel para f (
x):


U (
x)
x)
z
z U (
UN,T (
x)
, UN,T +
T
T


(7.10)

Um algoritmo usando as cotas


Agora que sabemos calcular cotas inferiores e superiores para um problema do tipo (7.1), podemos obter uma aproximacao do valor otimo deste
problema. Vamos descrever um algoritmo que nada mais e do que uma
estruturacao das ideias para calcular cotas descrita nas secoes anteriores.
O primeiro passo e xar valores para N e M, por exemplo N = 100 e
M = 12. Em seguida, sorteiam-se M amostras de tamanho N . Em cada
um dos M sorteios obtemos uma aproximacao (7.3) para o valor otimo de
(7.1). O estimador LN,M para a cota inferior e obtido tirando-se a media
destes valores e o intervalo de conanca e construdo conforme (7.6). Alem
do valor otimo, em cada um dos M problemas foi obtido um ponto admissvel
j , j = 1, . . . , M. Fazendo T = 50 por exemplo e escolhendo N = 20 000,
x
construmos aproximacoes (7.8) para f (xj). Escolhemos a menor entre as
M cotas superiores e construmos o intervalo de conanca correspondente
(7.10).
Esse metodo e efetivamente usado para aproximar as solucoes de problemas de recurso com dois estagios de grande porte, inviaveis de serem resolvidos diretamente. Para alguns desses problemas as cotas inferior e superior
caram extremamente proximas, indicando que a solucao otima provavelmente foi estimada com precisao. Para a descricao precisa dos problemas e
maiores detalhes desse metodo sugerimos o artigo [19].

82

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

7.2

A decomposi
c
ao estoc
astica

Esse metodo foi desenvolvido por J. Higle e S. Sen em 1991, e posteriormente publicado em livro [13]. Diferentemente do metodo da aproximacao
pela media amostral, a decomposicao estocastica (DE) e um metodo de amostragem interior, ou seja, as amostras sao feitas durante a execucao do algoritmo. A DE tambem supoe que e possvel obter amostras de uma variavel
um metodo exclusivamente para problemas
ou vetor aleatorio qualquer. E
dois estagios e se baseia em aproximacoes lineares por partes da funcao objetivo do problema de recurso (4.8). Para chegar no algoritmo da DE vamos
passar por varios algoritmos intermediarios.

7.2.1

O algoritmo de planos de corte de Kelley

O algoritmo da DE e uma adaptacao de algoritmos existentes de otimizacao, visando eciencia computacional. O primeiro deles e o algoritmo
de Kelley, que se aplica a problemas da forma
min {cx + Q(x)} ,
xX

(7.11)

onde Q e uma funcao convexa e X e um conjunto compacto e convexo. A


escolha na notacao nao e por acaso: a funcao Q do problema (4.8) possui
estas propriedades.
Passo 0: Suponha x1 X dado.
Faca k = 0, 0(x) = , u0 = cx1 + Q(x1) e l0 = .
Passo 1: Faca k = k + 1. Encontre (k , k ) tais que Q(xk ) =
k + k xk e Q(x) k + k x, x X.
Passo 2: Faca uk = min{uk1, cxk + Q(xk )} e dena k (x) =
max{k1(x), k + k x}.
Passo 3: Faca lk = minxX {cx+k (x)} e denote por xk+1 a solucao.
Passo 4: Se uk lk = 0, entao pare. Caso contrario, volte ao
Passo 1.

M
etodos Amostrais

83

A ideia central do algoritmo e aproximar a funcao Q pelos planos de


corte k (x). Mas como encontrar (k , k ) no Passo 1? Considere o dual
do problema Q(xk , ), para cada elemento no espaco amostral:
Q(x, ) =

max

pT (h() T()xk )

sujeito a

WT p q.

(7.12)

Denotando por pk () a solucao otima do dual para cada , temos que




Q(xk ) = E pk ()(h() T()xk )




= E pk ()h() E pk ()T() xk .
(7.13)
Por outro lado, se deixarmos x variar temos que


Q(x) E pk ()(h() T()x)




= E pk ()h() E pk ()T() x.

(7.14)

Por (7.13) e (7.14), podemos usar o algoritmo de Kelley em otimizacao estocastica tomando


k = E pk ()h()
e k = E[pk ()T()].
(7.15)
Tudo parece resolvido, mas temos um problema computacional: esse procedimento pressupoe que em cada passo se resolva um problema de otimizacao para cada pertencente ao espaco amostral . Se tivermos um
vetor aleatorio independente com 10 coordenadas onde cada componente
aleatoria assume 4 valores, temos que resolver um total de 410 = 1 048 576
problemas de otimizacao em cada passo!
7.2.2

AMA + Kelley

O proximo passo na caminhada rumo a DE e combinar o metodo AMA


descrito em (7.1) com a algoritmo de Kelley. Na realidade, queremos uma
versao um pouco diferente do AMA: seja
1!
Qk (x) =
Q(x, t ),
k t=1
k

(7.16)

84

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

onde t sao observacoes de uma variavel aleatoria . Assim com no algoritmo AMA, a funcao Qk e um aproximacao de Q(x) = E [Q(x, )]. Essa
funcao e convexa (por que?) e, portanto, podemos usar o algoritmo de Kelley
para resolver o problema
min {fk (x) = cx + Qk (x)} .
xX

(7.17)

Intuitivamente, esperamos que as funcoes Qk sejam aproximacoes cada vez


melhores de Q(x), quando k cresce. O algoritmo abaixo, chamado aproximac
ao da media amostral sucessiva (AMAS), parte dessa premissa.
Passo 0: Faca k = 0 e Q0(x) 0.
Passo 1: Faca k = k + 1 e gere uma observacao k de independente das anteriores.
k1
1
Qk1(x) + Q(x, k ).
Passo 2: Faca Qk (x) =
k
k
Passo 3: Resolva minxX {cx + Qk (x)} e denote por xk a solucao
otima. Volte ao Passo 1.
possvel mostrar, usando a lei forte dos grandes n
E
umeros (A.1), que
existe uma subseq
uencia de iteracoes Qk (x) que converge para para Q(x)
sempre que xk convergem para x , a solucao otima de (4.8). No entanto,
esse algoritmo em geral e ineciente. A razao principal e que no Passo 2
temos que resolver um problema de otimizacao cru em cada passo, ou seja,
um problema onde nao existem restricoes sobre onde procurar uma solucao.
Alem disso, em cada passo minimizamos Qk (x) baseado numa nova sada de
, mesmo que essa sada nao melhore muito a aproximacao Qn.
Uma maneira de melhorar o algoritmo AMAS e reduzir o custo computacional no Passo 2, incluindo cortes que auxiliam na resolucao do problema. A ideia e aproveitar o aninhamento das amostras, ou seja, o fato que
t k
{ t }k1
t=1 { }t=1 .
Suponha que usamos o metodo de Kelley para otimizar fk1 e sejam
os pontos onde os cortes foram derivados. Os coecientes desses
k1
cortes sao (k1
j , j ), onde o subscrito denota que o corte foi derivado
{xj }qj=1

M
etodos Amostrais

85

em xj e o sobrescrito lembra que esses cortes foram obtidos na aplicacao de


Kelley a fk1. Queremos achar expressoes para cortes baseados em amostras
k1
de tamanho k (kj , kj ) a partir dos cortes (k1
j , j ) para amostras de
tamanho k 1.
Denotando por pj (t ) a solucao otima do dual do problema de segundo
estagio para cada t , temos por denicao (7.15) que
k1
j
kj

k1
j x

kj

k1
1 ! j t t
=
p ( )(h Tt x)
k 1 t=1

x=

1
k

k
!

pj ( t )(ht Tt x),

(7.18)
(7.19)

t=1

onde ht = h( t ) e Tt = T( t ). Assim, usando (7.18) e (7.19), denimos os


cortes na iteracao k recursivamente por
kj + kj x =

k 1 k1
1 j k t
(j + k1
p ( )(h Tt x),
j x) +
k
k

(7.20)

para cada j = 1, . . . , q. Essa denicao recursiva permite que no Passo 3 do


AMAS + Kelley otimizemos a funcao Qk com a inclusao destes cortes. No
entanto, para calcular pj ( k ) temos que guardar todos os vetores {xj }qj=1 e
resolver os sub-problemas duais (7.12) associados. Infelizmente, com o crescimento do n
umero de iteracoes, o custo computacional destas duas operacoes
cresce rapidamente e nao compensa mais a inclusao dos cortes para evitar a
resolucao de um problema cru no Passo 2 do AMAS.
A DE que veremos em seguida e exatamente uma estrategia para aliviar
o custo computacional do Passo 2 do AMAS. Ela evita o armazenamento
dos vetores {xj }qj=1 e a resolucao dos sub-problemas duais (7.12). Em contrapartida, o processo de formacao de cortes sera menos eciente.
M
etodo estoc
astico dos planos de cortes e decomposi
c
ao estoc
astica
Vamos ver um u
ltimo algoritmo antes da DE: o metodo estocastico dos
planos de cortes (MEPC). Assuma que exista um n
umero L tal que L
Q(x, ). Vamos a descricao do algoritmo:

86

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

Passo 0: Faca k = 0, 0(x) = e tome x1 X. Seja L um


n
umero tal que L Q(x, )
Passo 1: Faca k = k + 1 e gere uma observacao t de independente das anteriores.
Passo 2: Calculo de k (x), uma aproximacao linear por partes
de Qk :
(a) Calculo do k-esimo plano de corte:
k
1 ! k t t
k
k
k + k x =
p ( )(h Tt x),
k t=1
onde pk (k ) argmaxp {pT (hk Tk xk ) | WT p
q}.
(b) Atualizacao dos coecientes de todos os cortes anteriores:
k 1 k1 1
k 1 k1
kt =
t + L, kt =
t .
k
k
k
(c) Dena k (x) = max1tk {kt + kt x}.
Passo 3: Resolva minxX {cx + k (x)} e denote por xk+1 a solucao.
Volte ao Passo 1.

Comecemos tracando algumas semelhancas e diferencas entre o AMAS


e o MEPC. Ambos geram uma observacao da variavel aleatoria no curso
do algoritmo e a funcao a ser otimizada em cada passo e uma aproximacao
da funcao de recurso Q(x) = E [Q(x, )]. A natureza dessa aproximacao,
no entanto, e muito diferente. O AMAS gera uma observacao e otimiza a
funcao Qk , enquanto que o MEPC usa planos de corte para aproximar a
funcao Q(x).
Aqui aparece uma diferenca em relacao ao algoritmo de Kelley: os planos
de corte em MEPC so sao tangentes a funcao Q(x) no momento em que
sao criados: em Kelley, os planos permanecem tangentes durante todas as
iteracoes do algoritmo. Mais ainda: cada corte em MEPC e gerado com um
n
umero diferente de observacoes de .

M
etodos Amostrais

87

Quando se usa o algoritmo de Kelley combinado com o AMAS, temos que


em cada iteracao os cortes sao gerados de um mesmo n
umero de observacoes.
A aproximacao e mais uniforme, enquanto que em MEPC os cortes gerados
nas u
ltimas iteracoes, quando a amostra e maior, fornecem aproximacoes
mais precisas da funcao Q do que os cortes gerados nas primeiras iteracoes.
Em relacao a maneira como os cortes sao atualizados, podemos interpretar o Passo 2 (b) de MEPC como uma relaxacao do procedimento de
facil ver
atualizacao de cortes de AMAS usando Kelley (equacoes (7.20)). E
que


1
k1
k (x) = max
k1 (x) + L, kk + kk x
k
k

(7.21)

Comparando-se com (7.20), podemos ver que o termo pt ( k )(hk T k x) e


trocado simplesmente por L em MEPC.
Agora estamos prontos para a decomposicao estocastica. Em cada algoritmo que vimos havia uma pequena diferenca que o tornava mais eciente
que o anterior. O AMAS combinado com Kelley e mais eciente que AMAS,
pois a inclusao de cortes permite que se otimize a funcao Qk de maneira mais
eciente.
O metodo MEPC, por sua vez, apresenta uma maneira mais eciente de
se atualizar cortes, que da mais peso a cortes gerados quando o tamanho da
amostra e maior. No entanto, o Passo 2 deste algoritmo ainda depende da
resolucao de um problema de otimizacao para cada no espaco amostral o
que pode tornar o algoritmo intratavel computacionalmente.
exatamente esse ponto que a DE apresenta uma modicacao. Ao inves
E
de resolver estes problemas, o algoritmo resolve apenas um problema por
iteracao, baseado na amostra recem gerada. Essa solucao e um vertice do
conjunto admissvel = {p | WT p q} de (7.12). Os vertices que vao
sendo obtidos vao sendo armazenados no conjunto Vk . Novamente, assumimos que uma cota inferior L para Q(x, ) e dada.

88

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

Passo 0: Faca k = 0, 0(x) = e tome x1 X. Seja L um


n
umero tal que L Q(x, )
Passo 1: Faca k = k + 1 e gere uma observacao t de independente das anteriores.
Passo 2: Calculo de k (x), uma aproximacao linear por partes
de Qk :
(a) Resolva o subproblema dual e atualize Vk :
pk ( k ) = argmaxp {pT (hk Tk xk ) | WT p q} e
Vk = Vk1 {pk (k )}.
(b) Calculo do k-esimo plano de corte:
k
1 ! k t t
k
k
k + k x =
p ( )(h Tt x),
k t=1
onde pk (t ) = argmaxpVk {pT (hk Tk x)}.
(c) Atualizacao dos coecientes de todos os cortes anteriores:
k 1 k1 1
k 1 k1
kt =
t + L, kt =
t .
k
k
k
(d) Dena k (x) = max1tk {kt + kt x}.
Passo 3: Resolva minxX {cx + k (x)} e denote por xk+1 a solucao.
Volte ao Passo 1.

Pode-se mostrar que existe uma subseq


uencia do algoritmo da DE que
converge para a solucao otima do problema (4.8). O algoritmo que apresentamos aqui e a versao mais simples da DE. Existem melhorias que estabilizam
o metodo e aumentam sua eciencia. Para maiores detalhes sobre o algoritmo e orientacoes para a implementacao, sugerimos ao leitor o excelente
livro [13].
A DE foi aplicada com sucesso em problemas de grande porte e permanece ate hoje como um algoritmo eciente na resolucao de problemas de
otimizacao estocastica.

M
etodos Amostrais

89

Exerccios
[01] Considere o problema (4.8), com:



X = [0, 5], x = x1 , y = y1



T
c = 0.75 , q = 1 3 1 1 ,



10 8 0
1
T=
e W=
5 0 8
1

T
y2 y3 y4
,

T
h = 1 2
,

1 1 1
,
1 1 1

onde 1 e a distribuicao uniforme no intervalo [1, 0] e 2 = 1 + 1 .


Faca tres passos do algoritmo de decomposicao estocastica e encontre
uma aproximacao para x.

Ap
endice A
Probabilidade
Este apendice nao se propoe a ser um resumo completo de probabilidade:
queremos denir apenas os conceitos de probabilidade usados no texto. O
leitor interessado em se aprofundar no tema pode consultar [15]. O primeiro
conceito que vamos denir e o de vari
avel aleatoria. Para isso precisamos de
duas denicoes preliminares:
Denic
ao A.1 Uma colecao nao-vazia de conjuntos F de um conjunto e dita uma -algebra de subconjuntos de se as seguintes
propriedades se vericam:
(a) Se A F entao o complemento Ac de A tambem esta em F .
2
)
A
e
ao em F .
(b) Se An esta em F , n = 1, 2, . . . , entao
n
n=1
n=1 est

Vamos agora denir o que e uma medida de probabilidade. A partir


desse conceito vamos ser capazes de denir o ambiente onde toda a teoria
da probabilidade repousa: o espaco de probabilidade.
Denic
ao A.2 Uma medida de probabilidade P numa -algebra de
subconjuntos F de um conjunto e uma funcao real com domnio F
satisfazendo as seguintes propriedades:

Probabilidade

91

(a) P() = 1.
(b) P(A) 0 para todo A F .
(c) Se An , n = 1, 2, . . . , sao conjuntos mutuamente disjuntos em F
entao
1
0

5
!
P
An =
P(An ).
n=1

n=1

Um espaco de probabilidade (, F , P) e uma tripla formada por um


conjunto , chamado espaco amostral, uma -algebra F e uma medida
de probabilidade P denida em F . Os elementos de F sao chamados
eventos.
Nao e difcil construir espacos de probabilidade para situacoes simples.
Considere uma urna com s bolas numeradas e suponha que a probabilidade
de se retirar uma dada bola e 1/s, ou seja, todas possuem a mesma probabilidade de serem sorteadas. Nesse caso o conjunto e um conjunto com s
pontos, F e a colecao de todos os subconjuntos de e P e tal que P(A) = j/s
se A possui j pontos.
Um dos conceitos mais importantes de probabilidade e o de independencia. Vamos primeiramente denir o conceito de eventos independentes:
Denic
ao A.3 Seja (, F , P) um espacos de probabilidade e sejam A
e B eventos. Dizemos que os eventos A e B sao independentes se
P(A B) = P(A) P(B).
Tendo construdo o espaco de probabilidade (, F , P), podemos construir
o conceito de variavel aleatoria:
Denic
ao A.4 Uma variavel aleatoria discreta X num espaco de probabilidade (, F , P) e uma funcao X com domnio assumindo valores em um subconjunto nito ou enumeravel {x1, x2, . . .} de R tal que
{ | X() = xi } F para todo i.

92

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

Essa denicao se estende imediatamente para mais dimensoes:

Denic
ao A.5 Sejam X1 , X2, . . . , Xn variaveis aleatoria discretas. O
vetor aleatorio discreto X e denindo por
X = (X1, X2 , . . . , Xn ).

A variavel aleatoria e uma traducao do conjunto para os n


umeros reais,
onde sabemos trabalhar melhor. Seguindo o exemplo anterior, podemos
denir uma variavel aleatoria no espaco (, F , P) dado. Se i , i = 1, . . . , s
e o elemento de associado a i-esima bola, entao X(i) = i e uma variavel
aleatoria em (, F , P).

Denic
ao A.6 A funcao real f denida por f (x) = P(X = x) e chamada funcao densidade da variavel aleatoria X. De maneira similar,
sejam X1 , X2, . . . , Xn variaveis aleatorias discretas. A funcao g de Rn ,
denida por g(x) = P(X1 = x1, X2 = x2, . . . , Xn = xn ), e a densidade
conjunta do vetor aleatorio (X1 , X2, . . . , Xn), onde x pertence a Rn .

Ainda no exemplo das bolas, temos que f (x) = 1/s para x = 1, 2, . . . , s


e f (x) = 0 caso contrario. Passemos ao conceito de independencia para
variaveis aleatorias discretas:

Denic
ao A.7 Sejam X1, X2 , . . . , Xn variaveis aleatorias discretas,
com densidades f1 , f2, . . . , fn e com densidade conjunta f . Estas
variaveis sao ditas independentes se
f (x1, x2, . . . , xn) = f1(x1) f2(x2) fn (xn).

A seguir vamos denir a esperanca de uma variavel aleatoria discreta.

Probabilidade

93

Denic
ao A.8 Seja X uma variavel aleatoria discreta com densidade
f assumindo valores x1, x2, . . . , xj , . . .. A esperanca de X e denida
por

!
E[X] =
xj f (xj ),
j=1

desde que esse valor seja nito. Se for innito entao dizemos que a
esperanca de X nao esta denida.
Voltando ao nosso exemplo, temos que a esperanca de X e E[X] =
(1 + s)/2. A esperanca e linear:
Lema A.1 Sejam 1 , . . . , n constantes reais e X1, . . . , Xn variaveis
aleatorias. Entao
4
3 n
n
!
!
i Xi =
i E[Xi].
E
i=1

i=1

Outro conceito importante e a variancia de uma variavel aleatoria:


Denic
ao A.9 Seja X uma variavel aleatoria discreta com densidade
f assumindo valores x1, x2, . . . , xj , . . .. A variancia 2 de X e denida
por

!
2
=
(xj E[X])f (xj ),
j=1

desde que esse valor seja nito. Se for innito, entao dizemos que a
variancia de X nao esta denida.
O n
umero e chamado de desvio-padr
ao.

No exemplo da urna, a variancia de X nao e tao facil de calcular. E


preciso usar a formula da soma de quadrados a seguir:
s
!
j=1

j2 =

(2s + 1)(s + 1)(s)


.
6

(A.1)

94

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

Usando (A.1), temos que uma expressao para a variancia de X:


2(X) =

(s + 1)(s 1)
.
12

Para variaveis aleatorias independentes, temos o seguinte resultado:


Lema A.2 Sejam X1 , . . . Xn variaveis aleatorias independentes identicamente distribudas, com variancia 2 . Entao
variancia(X1 + + Xn ) = n 2.
Precisamos generalizar esses conceitos para o caso contnuo:
Denic
ao A.10 Uma variavel aleatoria contnua X num espaco de
probabilidade (, F , P) e uma funcao real X : R, tal que, para
todo x R, { | X() x} F .
A seguir temos a denicao de funcao distribuicao de uma variavel aleatoria
contnua ou discreta:
Denic
ao A.11 A funcao distribuicao F de uma variavel aleatoria
discreta ou contnua X denida em (, F , P) e denida por
F (x) = P(X x), < x < .

Denic
ao A.12 Se X1 , X2, . . . , Xn : R sao variaveis aleatorias
denidas em um espaco de probabilidade (, F , P), entao a funcao
F : Rn R denida por
F (x1, x2, . . . , xn) = PX1 x1, X2 x2 , . . . , Xn xn
e denominada funcao distribuicao conjunta do vetor aleatorio
(X1 , X2, . . . , Xn).

Probabilidade

95

Denic
ao A.13 Uma funcao densidade f e qualquer funcao nao negativa tal que

f (x) dx = 1.

comum descrever uma variavel aleatoria por sua densidade, pois a partir
E
dela podemos denir uma medida de probabilidade e, conseq
uentemente, sua
funcao distribuicao. Mais precisamente se X e uma variavel aleatoria com
densidade f entao denimos
 x
P (X x) = F (x) =
f (t) dt.
(A.2)

Denic
ao A.14 Seja X uma variavel aleatoria contnua com densidade f . Dizemos que X tem esperanca nita se

|x|f (x) dx < ,

e, nesse caso, denimos a esperanca de X como



E[X] =
xf (x) dx.

Uma generalizacao importante da denicao A.14 vem a seguir:


Denic
ao A.15 Seja g uma funcao contnua e X uma variavel
aleatoria contnua com funcao densidade f . Entao

g(x)f (x) dx,
E[g(x)] =

caso a integral exista.


Vamos considerar a variavel aleatoria contnua do problema do jornaleiro, que era uniforme entre 50 e 150. Dizer que uma variavel aleatoria

96

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

contnua e uniforme e o mesmo que dizer que a densidade de e f (x) = 1/100


se 50 x 150 e 0 caso contrario. Assim, temos que a funcao distribuicao
de e
 x
x 50
1
F (x) =
dt =
.
100
50 100
Logo, a esperanca de e obtida usando a denicao A.14:
 150
1
E[] =
dx = 100.
x
100
50
Vamos dar um salto conceitual para enunciar dois dos mais importantes
teorema de probabilidade. As demonstracoes nao sao simples e necessitam
de conceitos mais avancados de teoria da probabilidade.
Teorema A.1 (Lei Forte dos Grandes N
umeros) Sejam
X1 , X2, . . . , Xn , . . . variaveis aleatorias independentes identicamente
distribudas, com esperanca . Entao
X1 + Xn
(quase sempre).
n
Lembrando que a expressao quase sempre signica que o resultado vale a
menos de um conjunto com probabilidade 0. Uma conseq
uencia familiar da
lei dos grandes n
umeros ocorre no experimento de se lancar repetidamente
uma moeda honesta. Associando o valor 1 ao evento cara e 0 a coroa
esperamos que, apos um n
umero grande de lancamentos, aproximadamente
metade deles de cara e outra metade coroa. Nesse caso, a lei dos grande
n
umeros nos diz, de fato, que o n
umero de caras dividido pela quantidade
de lancamentos se aproxima de 1/2.
Teorema A.2 (Teorema Central do Limite) Considere
X1 , X2 , . . . , Xn , . . . variaveis aleatorias independentes identicamente distribudas, com esperanca e variancia 2 > 0. Se
Sn = X1 + + Xn , entao


 x
y2
1
Sn n

x =
e 2 dy.
lim P
n
n
2
Essa convergencia ocorre em distribuicao.

Probabilidade

97

Em palavras, o que o teorema central do limite diz e que as funcoes distribuicao das somas parciais Sn devidamente normalizadas, convergem para a
funcao distribuicao da variavel aleatoria normal, nao importando a distribuicao inicial de Xi ! O teorema central do limite possui enunciados equivalentes que serao u
teis no texto. Denotando-se por (, 2) a normal com
parametros e 2 e considerando-se as hipoteses do Teorema A.2, temos que

X d
d
n
(0, 1)
e
n(X ) (0, 2).
(A.3)

A convergencia tambem e em distribuicao, ou seja, as funcoes distribuicao das


variaveis aleatorias Sn normalizadas convergem para a funcao distribuicao
da normal.
Por m, apresentamos na Tabela A.1 as variaveis aleatorias usadas no
texto e suas respectivas densidades, esperancas e variancias.
Densidade
Uniforme discreta

Uniforme contnua

Normal (gaussiana)

1
f (x|s) = ,
s
x = 1, 2, . . . , s, s = 1, 2, . . ..
1
,
ba
a x b.

f (x|a, b) =

(x )2

1
2 2 ,
e
f (x|, ) =
2
x , , R,
> 0.

E[X]

2 (X)

s+1
2

(s + 1)(s 1)
12

a+b
2

(b a)2
12

Tabela A.1: Variaveis aleatoria usadas no texto.

Ap
endice B
Estatstica
Este apendice dene os conceitos basicos de estatstica, necessarios a` compreensao do captulo 7. Estatstica e uma area importante para otimizacao
comum usar tecnicas
estocastica, especialmente na parte de algoritmos. E
estatsticas para obter aproximacoes de problemas de otimizacao estocastica
difceis de se resolver analiticamente.
O conceito mais importante de estatstica e o de estimador.
Denic
ao B.1 Um estimador e simplesmente uma funcao =
(X1, . . . , Xn ) com contradomnio em Rn , onde X1 , . . . , Xn sao
variaveis aleatorias identicamente distribudas.
Nesse texto vamos considerar n = 1. Geralmente, um estimador aproxima
um parametro da densidade de uma variavel aleatoria X, sua esperanca ou
o problema inverso da probabilidade: dados n valores de
sua variancia. E
uma variavel aleatoria desconhecida, queremos obter informacao sobre essa
variavel. Vamos ver dois exemplos de estimadores:
X1 + + Xn
e
n
n
1 !
2
S =
(Xi X)2
n 1 i=1
X=

(B.1)
(B.2)

Uma propriedade desejavel de um estimador e que ele seja nao-viesado,


ou seja, que em media o seu valor seja igual ao parametro que ele estima. O

Estatstica

99

estimador (B.1) e nao viesado para a esperanca de uma variavel aleatoria


X, pois
1
E[X] = n E[X] = .
n
O estimador S 2 em (B.2) e nao-viesado para a variancia 2 de uma variavel
aleatoria X, mas nao vamos mostrar esse fato aqui.
 
E S 2 = 2.
Vamos ver um exemplo: suponha que seja dada uma amostra (x1, . . . , xn)
de uma variavel aleatoria X normal, com parametro desconhecido. Desejase construir um estimador que aproxime esse valor, baseado na amostra
fornecida. Uma possibilidade e o estimador X, que em media vale . Assim,
uma aproximacao
para o parametro e

x1 + + xn
.
n

Como o estimador e uma variavel aleatoria, podemos calcular sua vari prefervel trabalhar com estimadores de baixa variancia, pois um
ancia. E
n
umero pequeno de amostras permite aproximar bem o parametro a ser
estimado. Como exemplo, note que a variancia do estimador X e 2/n,
onde 2 e a variancia de Xi .
Apesar do estimador X ser nao-viesado para a esperanca, e importante
obter mais informacao sobre a qualidade da aproximacao que esse estimador
fornece. Essa a ideia dos intervalos de conanca: eles fornecem um intervalo
na reta com a propriedade que o parametro estimado pertence ao intervalo
com probabilidade, digamos, 90%.
Antes de prosseguirmos, vamos enunciar um resultado de probabilidade
que sera extremamente u
til para a construcao a seguir. A demonstracao
pode ser encontrada em [15].
Lema B.1 Sejam X1 , . . . , Xn variaveis aleatorias normais com
parametros (i , i2), i = 1, . . . , n. Entao a variavel aleatoria Y =
X1 + + Xn e normal com parametros (, 2), onde
= 1 + + n e 2 = 12 + + n2 .

100

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

Para construir um intervalo de conanca, vamos supor que a variavel


aleatoria Z e normal com parametros 0 e 1. O estimador X (B.1) se baseia
nas variaveis aleatorias independentes X1, . . . , Xn , com distribuicao normal
de parametros desconhecido e 2 conhecido. Comece escolhendo um nvel
de conabilidade . O parametro a ser estimado, no caso a esperanca ,
pertencera ao chamado intervalo de confianca com probabilidade 1 . Escolhido , dena z como sendo n
umero real tal que
P({Z > z }) = .

(B.3)

Os valores da normal sao tabelados: para um dado , basta consultar uma


tabela da distribuicao normal ([14]) para obter o valor z correspondente. A
variavel normal tem a propriedade
P(Z > z ) = 1 P(Z > z ).

(B.4)

Usando (B.4), podemos escrever


P(z/2 < Z < z/2) = 1 .

(B.5)

O proximo passo e calibrar o estimador X. Como a esperanca de X e

e a variancia e 2 /n, a variavel aleatoria n(X )/n e uma normal com


parametros 0 e 1. Assim, podemos reescrever a equacao (B.5) como

n(X )
P z/2 <
(B.6)
< z/2 .

Isolando-se em (B.6) temos um intervalo (1 )% conavel para :


P X z/2 < < X + z/2


= 1 .
(B.7)
n
n
Esse intervalo contem o parametro a ser estimado com 95% de certeza. Naturalmente, maior precisao implica em um intervalo maior e menor precisao
implica em um intervalo menor.
Apesar de termos feito as contas supondo que a amostra X1, . . . , Xn tivesse distribuicao normal, isso nao e necessario. Pelo teorema central do

limite (A.2), a distribuicao de n(X )/n e aproximadamente normal


para n sucientemente grande. No entanto, e importante ressaltar que o
intervalo de conanca construdo nessa situacao e aproximado.

Estatstica

101

Outra hipotese que pode ser relaxada e a do conhecimento da variancia


. Na maioria das situacoes, nao conhecemos com precisaoseu valor, mas
podemos substitu-lo pelo estimador S 2 em (B.2), ou por S no caso do
desvio-padrao. Novamente, nao teremos um intervalo de conanca exato,
mas aproximado.
2

Ap
endice C
Convexidade
Neste apendice apresentaremos as denicoes e propriedades basicas de
funcoes convexas necessarias no texto. As demonstracoes omitidas podem
ser encontradas em [5].
Denic
ao C.1 (Conjuntos convexos) Dizemos que U Rn e um
conjunto convexo se, e somente se, para todo p, q U tem-se
(1 t) p + t q U,
para todo t [0, 1], isto e, se o segmento de reta que une dois pontos
quaisquer de U esta sempre contido em U .

(a)

(b)

Figura C.1: O conjunto da esquerda e convexo enquanto que o da direita nao


o e.

Convexidade

103

Teorema C.1 Seja {U } uma famlia de conjuntos convexos em Rn


Entao
(
U

tambem e um conjunto convexo em Rn .

es convexas e co
ncavas)
Denic
ao C.2 (Func
o
(a) Dizemos que uma funcao f : U Rn R denida em um subconjunto convexo U de Rn e convexa se, e somente se,
f ((1 t) p + t q) (1 t) f (p) + t f (q),

(C.1)

para todo p, q U e todo t [0, 1].


A interpretacao geometrica de (C.1) e a seguinte: o segmento de
reta secante que passa pelos pontos (p, f (p)) e (q, f (q)) sempre
esta acima ou coincide com o graco de f para qualquer escolha
de pontos p e q em U (veja a Figura C.2).
(b) Dizemos que uma funcao f : U Rn R denida em um subconjunto convexo U de Rn e concava se, e somente se,
f ((1 t) p + t q) (1 t) f (p) + t f (q),

(C.2)

para todo p, q U e todo t [0, 1].


A interpretacao geometrica de (C.2) e a seguinte: o segmento de
reta secante que passa pelos pontos (p, f (p)) e (q, f (q)) sempre
esta abaixo ou coincide com o graco de f para qualquer escolha
de pontos p e q em U .
O proximo teorema estabelece o motivo de convexidade ser uma propriedade
tao desejavel em otimizacao.
Teorema C.2 Se f : U Rn R e convexa, entao todo ponto de
mnimo local de f em U tambem e ponto de mnimo global de f em U .

104

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

z
grfico de f

se

gm

en

to

de

ret

as

ec

an

te

q
p

(1 t) . p+t . q

Figura C.2: Para uma funcao convexa, o segmento de reta secante ca sempre acima ou coincide com o graco da funcao, para quaisquer
escolhas de p e q.

Teorema C.3 Se f1 : U Rn R e f2 : U Rn R sao funcoes


convexas, entao:
(a) A funcao 1 f1 + 2 f2 e convexa para todo 1 , 2 R+ .
(b) A funcao x max{f1(x), f2(x)} e convexa.

Convexidade

105

Teorema C.4 Seja f : U Rn R uma funcao de classe C 1 denida


em um subconjunto convexo U de Rn .
(a) f e uma funcao convexa em U se, e somente se,
f (q) f (p) + f (p) (q p),

(C.3)

para todo p, q U , isto e, se, e somente se, cada hiperplano


tangente ao graco de f esta sempre abaixo ou coincide com o
graco de f .
(b) f e uma funcao concava em U se, e somente se,
f (q) f (p) + f (p) (q p),

(C.4)

para todo p, q U , isto e, se, e somente se, cada hiperplano


tangente ao graco de f esta sempre acima ou coincide com o
graco de f .
Aqui f (p) denota o vetor gradiente de f em p.

grfico de f

Figura C.3: Para uma funcao convexa, cada reta tangente ao graco de f
esta sempre abaixo do graco de f .

106

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

Denic
ao C.3 (Semiplanos e Semi-Espa
cos) Seja a um vetor
n
umero real. Os conjuntos
nao-nulo em R e seja c um n
H+ = {x Rn | ax c}

H = {x Rn | ax c}

sao denominados, respectivamente, semi-espacos fechados correspondentes ao semiplano H = {x Rn | ax = c}.


Por linearidade, segue-se que semiplanos e semi-espacos sao conjuntos
convexos.
Denic
ao C.4 (Politopos e Poliedros) Um politopo e um conjunto
que pode ser expresso como a intersecao de um n
umero nito de semiespacos fechados. Um poliedro e um politopo limitado. Note que politopos e poliedros sao conjuntos convexos.

Ap
endice D
Programa
c
ao Linear
D.1

Programas lineares e o teorema fundamental da


programa
c
ao linear

Neste apendice apresentaremos as denicoes e propriedades basicas da


teoria de programacao linear necessarias no texto. Para detalhes, demonstracoes e extensoes, recomendamos os excelentes livros [7, 20].
Um programa linear e um problema de otimizacao onde a funcao que
queremos otimizar e as restricoes sao todas lineares. Por exemplo,
minimizar
x1 ,x2 R

sujeito a

x1 + x2
3 x1 + 2 x2
x1 + 5 x2
x1
x2

8,
7,
0,
0,

(D.1)

e um programa linear. Para resolve-lo, precisamos encontrar um ponto (x1, x2)


do conjunto admissvel
K = {(x1, x2) R2 | 3 x1 + 2 x2 8, x1 + 5 x2 7, x1 0, x2 0}
que torna o valor da funcao objetivo o(x1, x2) = x1 + x2 o menor possvel.
O conjunto K esta desenhado na Figura (D.1). Por inspecao, vemos que
a solucao otima e dada por (x1, x2) = (2, 1). Este ponto e a intersecao da
curva de nvel f (x1, x2) = x1 +x2 = c mais baixa que intercepta o conjunto
admissvel.

108

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

x2

4
3

1
0

x1

Figura D.1: O conjunto admissvel do programa linear (D.1).

Dizemos que um programa linear esta na forma padr


ao se todas as variaveis
de decisao sao nao-negativas e se todas as restricoes sao em igualdade:
minimizar R
x1 ,...,xn

sujeito a

c1 x1 + + cn xn
a11 x1 + + a1n xn
..
..
..
.
.
.
am1 x1 + + amn xn

= b1 ,
.. ..
. .
= bm ,

e x1 0, . . . , xn 0.

Todo programa linear pode ser reescrito na forma padrao com o uso de
vari
aveis de folga. Por exemplo, uma restricao da forma
ai1 x1 + + ain xn bi
pode ser substituda, de maneira equivalente, pelas restricoes
ai1 x1 + + ain xn yi = bi e yi 0.
Se uma variavel de decisao xi pode assumir qualquer valor real, isto e, se
nao existe restricao de nao-negatividade em xi, entao podemos substituir xi
por ui vi, a diferenca de dois n
umeros positivos. Se colocarmos o programa

Programa
c
ao Linear

109

linear (D.1) na forma padrao, obtemos o seguinte PL:


minimizar

x1 + x2

sujeito a

3 x1 + 2 x2 y1 = 8,
x1 + 5 x2 y2 = 7,
x1 0,
x2 0,
y1 0,
y2 0.

x1 ,x2 ,y1 ,y2 R

(D.2)

Um programa linear pode ser escrito de forma mais compacta usando-se


matrizes e vetores:
minimizar
n

cT x

sujeito a

Ax = b e x 0,

xR

(D.3)

onde x Rn , c Rn , b Rm e A e uma matriz m n. Note que o conjunto


admissvel K = {x Rn | Ax = b e x 0} de um programa linear, quando
nao-vazio, e um politopo convexo, e que as hipersuperfcies de nvel da funcao
objetivo sao hiperplanos.
Problemas de maximizacao podem ser transformados em problemas de
minimizacao substituindo-se a funcao objetivo o por o. Mais precisamente,
x e uma solucao otima de
maximizar
n

cT x

sujeito a

Ax = b e x 0,

xR

se, e somente se, x tambem e solucao de


minimizar
n

cT x

sujeito a

Ax = b e x 0.

xR

Na teoria de programacao linear, assume-se que m < n (existem mais


incognitas do que restricoes em igualdade) e que o posto da matriz A e m,

isto e, as m linhas de A sao linearmente independentes. Da teoria de Algebra


Linear sabemos, entao, que existem m colunas de A que sao linearmente

110

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

independentes. Renomeando-se ndices se necessario, podemos assumir que


estas colunas sejam as m primeiras. Isto induz uma decomposicao de A,
de x e de c:






xB
cB
A= B N ,
x=
,
c=
,
xN
cN
onde B e uma matriz m m inversvel. Com esta decomposicao, o Problema D.3 pode ser escrito na forma
minimizar

cTB xB + cTN xN

sujeito a

BxB + NxN = b,
xB 0, xN 0.

xB Rm ,xN Rnm

(D.4)

Como o sistema linear Ax = b e equivalente a BxB + NxN = b, segue-se


entao que existe uma solucao x de Ax = b na forma


xB
.
0
Esta solucao e denominada solucao basica do sistema linear Ax = b associada a` base B. As componentes de xB sao denominadas vari
aveis b
asicas.

Teorema D.1 (Teorema Fundamental da Programa


c
ao Linear) Considere um programa linear na forma padrao (D.3), com A
matriz m n de posto m.
(a) Se o programa linear possui um ponto admissvel, entao ele possui um ponto admissvel que e uma solucao basica do sistema linear Ax = b.
(b) Se o programa linear possui um ponto otimo, entao ele possui um
ponto otimo que e uma solucao basica do sistema linear Ax = b.

Teorema D.2 Seja B uma base do Problema D.3 e seja


 1 
B b
x=
0

Programa
c
ao Linear

111

a solucao basica correspondente. Temos que x e admissvel se, e somente se, B1b0. Mais ainda, x e otimo se, e somente se,
cTB B1A c.
Demonstracao: Por construcao,

x=

B1b
0

satisfaz a restricao Ax = b. Assim, para x seja admissvel, basta que x 0,


isto e, basta que B1b0. Para obter a condicao de otimalidade, seja


B
x
=
x
N
x
B =
um ponto admissvel qualquer. Entao B
xB + N
xN = b e, portanto, x
1
1
xN . Desta maneira,
B b B N
 1 
B b
e otimo
x=
0


cTB cTN

B1b
0

cTB cTN

B
x
N
x


,

N 0

xB , x


B + cTN x
N ,
cTB xB cTB x


N 0

xB , x

N ,
cTB xB cTB (B1b B1N
xN ) + cTN x

N ,
cTB B1N
xN cTN x



xN 0


xN 0

cTB B1N cTN



cTB B1A cT .
O proximo teorema da uma interpretacao geometrica para pontos admissveis que sao solucoes basicas: eles correspondem aos pontos extremos
(vertices) do politopo K = {x Rn | Ax = b e x 0}.

112

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

Denic
ao D.1 (Ponto Extremo) Dizemos que um ponto x em um
conjunto convexo U e ponto extremo de U se nao existem dois outros
pontos distintos x1 e x2 em U tais que x = x1 + (1 ) x2 para
algum no intervalo (0, 1).
nicos pontos extremos do conjunto
Na Figura (D.2), x1 , x2 e x3 sao os u
admissvel K do PL (D.1). O ponto x4 nao e um ponto extremo de K, pois
ele pode ser escrito como uma combinacao convexa de x2 K e x3 K.
Como x6 = x5 + (1 ) x7 para algum (0, 1), vemos que o ponto x6
(no interior do conjunto admissvel) tambem nao e um ponto extremo de K.
x2

4 x1

x5

x2

1
0

x7

x6

x4
3

x3
7

x1

Figura D.2: x1 , x2 e x3 sao os u


nicos pontos extremos do conjunto admissvel do PL (D.1).

Teorema D.3 (Equival


encia entre Pontos Extremos e Solu
c
oes
B
asicas) Seja A uma matriz m n de posto m, b um vetor em Rm
e K = {x Rn | Ax = b e x 0} o conjunto admissvel de (D.3).
Entao x e um ponto extremo de K se, e somente se, x e um ponto
admissvel que e solucao basica de Ax = b.
Os teoremas (D.1) e (D.3) dizem que, para se resolver o problema (D.3),
nao e preciso considerar todos os pontos do conjunto admissvel K: basta
procurar pelo ponto otimo entre os pontos extremos (vertices) de K! O
metodo simplex explora esta estrutura para construir um algoritmo muito

Programa
c
ao Linear

113

popular para se resolver (D.3). Outra categoria de metodos que recentemente


ganhou bastante popularidade e a classe dos metodos de ponto interior. Nao
e nosso proposito estudar estes algoritmos aqui. O leitor interessado podera
consultar os livros [7, 20]. O que e preciso se ter em mente e que programas
lineares podem ser resolvidos numericamente de maneira muito eciente nos
dias de hoje.

D.2

Dualidade

Denic
ao D.2 (O problema dual) O problema dual de
minimizar
n

cT x

sujeito a

Ax b e x 0,

maximizar
m

T b

sujeito a

AT c e 0,

xR

(D.5)

e o programa linear
R

(D.6)


onde T b = m
e denominado o problema dual de (D.5).
i=1 i bi . (D.6)
Neste contexto, (D.5) e denominado problema primal.

Por exemplo, o problema dual do programa linear (D.1) e


minimizar
1 ,2 R

sujeito a

8 1 + 7 2
3 1 + 2
2 1 + 5 2
1
2

1,
1,
0,
0.

(D.7)

114

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

O problema dual de qualquer programa linear pode ser encontrado convertendoo para o formato (D.5). Por exemplo, como Ax = b se, e somente se, Ax b
e Ax b, o programa linear na forma padrao (D.3) pode ser escrito na
forma do problema primal (D.5) da seguinte maneira equivalente
minimizar
n
xR

sujeito a

A
A

cT x



x

b
b


e x 0.

Particionando-se agora as variaveis duais na forma (u, v), o problema dual


deste u
ltimo PL e
minimizar
n

uT b vT b

sujeito a

AT u AT v c, u 0 e v 0.

xR

Fazendo-se = u v, o problema acima pode ser simplicado, o que nos


leva ao seguinte par de problemas duais:
Par Dual 1
(problema primal)

minimizar
n
xR

sujeito a

cT x
Ax = b,
x 0,

(problema dual)

maximizar
m
R

T b

sujeito a AT c.

Outros pares de problemas duais de interesse sao dados a seguir.


Par Dual 2
(problema primal)

maximizar
n
xR

sujeito a

cT x
Ax = b,
x 0,

(problema dual)

minimizar
m
R

T b

sujeito a AT c.

Programa
c
ao Linear

115

Par Dual 3 (O da Denicao (D.2))


(problema primal)

minimizar
n
xR

sujeito a

c x
Ax b,
x 0,

(problema dual)

maximizar
m
R

T b

sujeito a AT c,
0.

Par Dual 4
(problema primal)

maximizar
m
yR

sujeito a

b y
Ay c,
y 0,

(problema dual)

minimizar
n
xR

cT x

sujeito a xT A bT,
x 0.

Teorema D.4 (Teorema fraco de dualidade) Se x e sao admissveis para os problemas (D.3) e (D.6), respectivamente, entao
cT x T b.
Este teorema mostra que um ponto admissvel para um dos problemas
fornece uma cota para o valor da funcao objetivo do outro problema. Os
valores associados com o problema primal sao sempre maiores ou iguais aos
valores associados com o problema dual. Como corol
ario, vemos que se um
par de pontos admissveis pode ser encontrado para os problemas primal e
dual com valores iguais da funcao objetivo, entao estes pontos sao otimos.
Teorema D.5 (Teorema forte de dualidade) Se um dos problemas (D.3) ou (D.6) tem uma solucao otima nita, entao o outro
tambem tera uma solucao otima nita e, neste caso, os valores das
respectivas funcoes objetivo sao iguais. Se a funcao objetivo do problema primal nao e limitada inferiormente, entao o conjunto admissvel
do problema dual e vazio e, se a funcao objetivo do problema dual nao
e limitada superiormente, entao o conjunto admissvel do problema
primal e vazio.

116

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

O conjunto admissvel do problema dual (D.7) do programa linear (D.1)


esta desenhado na Figura (D.3). Por inspecao, vemos que a solucao otima
e dada por (1, 2) = (4/13, 1/13). Este ponto e a intersecao da curva
de nvel g(1 , 2) = 8 1 + 7 2 = c mais alta que intercepta o conjunto
admissvel. Lembrando que (x1, x2) = (2, 1) e a solucao do problema primal (D.1), vemos que
f (x1, x2) = x1 + x2 = 3 = 8 1 + 7 2 = g(1, 2 ),
como arma o teorema forte da dualidade.
2
3/7

1/5
(4/13, 1/13)
3/8
0

1/3

Figura D.3: O conjunto admissvel do problema dual (D.7) do programa linear (D.1).

D.3

Raios extremos

Por m, gostaramos de observar que se a funcao objetivo do programa


linear (D.3) nao e limitada inferiormente no conjunto admissvel
K = {x Rn | Ax = b e x 0} ,
 e raio extremo 
entao existem ponto extremo x
r de K tal que o valor da
 + t
funcao objetivo de (D.3) em x = x
r tende a quando t tende a +.
Em particular,
cT 
r < 0.

Programa
c
ao Linear

117

Dizemos que 
r e um raio de K se, e somente se, 
r
= 0 e o conjunto
n
{p R | p = x + t 
r e t 0} esta contido em K para todo x K.
Um raio 
r de K e extremo, se nao existem outros dois raios r1 e r2 de K
(com r1
= t r2 para todo t > 0) e um escalar s no intervalo (0, 1) tal que

r = s r1 + (1 s) r2 .
x2

r1

r2

r3
0

K
x1

Figura D.4: Os vetores r1 e r2 nao sao raios extremos de K. O vetor r3 e um raio extremo
de K.

Bibliograa
[1] G. Beek, J. Blatt, M. Koschat, N. Kunz, M. LePore e S. Blyakher,
News Vendors Tackle The News Vendor Problem. Interfaces, v. 33,
n. 3, pp. 7284, 2003.
[2] D. Bell, Incorporating The Customers Perspective into The Newsvendor Problem. Preprint, Harvard Business School, 2003.
[3] J. R. Birge e F. Louveaux, Introduction to Stochastic Programming.
Springer Series in Operations Research, Springer-Verlag, 1997.
[4] H. J. Bortolossi, Video Tutorial for SLP-IOR.
Disponvel em
http://www.mat.puc-rio.br/hjbortol/disciplinas/2008.1/soe/.
[5] S. Boyd e L. Vandenberghe, Convex Optimization. Cambridge University Press, 2005.
Disponvel em http://www.stanford.edu/boyd/cvxbook/.
[6] A. Charnes, W.W. Cooper e G.H. Symonds, Cost Horizons and Certainty Equivalents: An Approach to Stochastic Programming of Heating
Oil. Management Science, n. 4, pp. 235-263, 1958.
[7] V. Chvatal, Linear Programming. W. H. Freeman and Company, 1983.
[8] G. B. Dantzig e M. N. Thapa, Linear Programming 1: Introduction.
Springer Series in Operations Research, Springer-Verlag, 1997.
[9] G. B. Dantzig e M. N. Thapa, Linear Programming 2: Theory and
Extensions. Springer Series in Operations Research, Springer-Verlag,
2003.

BIBLIOGRAFIA

119

[10] R. Fourer, D. M. Gay, B. W. Kernighan, AMPL: A Modeling Language


for Mathematical Programming. Duxbury Press, 2002.
[11] W. K. K. Haneveld e M. H. van der Vlerk, Stochastic Programming.
Lecture notes, Departament of Econometrics & OR, University of Groningen, 2004.
[12] R. Henrion, Introduction to Chance-Constrained Programming. Artigotutorial para a pagina da comunidade de otimizacao estocastica, 2004.
Disponvel em http://stoprog.org/.
[13] J. Higle e S. Sen, Stochastic Decomposition: A Statistical Method for
Large Scale Stochastic Linear Programming. Nonconvex Optimization
and Its Applications, Kluwer Academic Research, 1996.
[14] W. Hines e D. Montgomery, Probability and Statistics in Engineering
and Management Science. John Willey & Sons, 1990.
[15] P. Hoel, S. Port e C. Stone, Introduction to Probability Theory. Houghton Miin Company, 1971.
[16] P. Kall e J. Mayer, SLP-IOR.
Disponvel em
http://www.ior.uzh.ch/Pages/English/Research/StochOpt/index en.php.
[17] P. Kall e J. Mayer, Stochastic Linear Programming: Models, Theory,
and Computation. International Series in Operations Research & Management Science, Springer-Verlag, 2005.
[18] P. Kall e S. W. Wallace, Stochastic Programming. Wiley-Interscience
Series in Systems and Optimization, John Willey & Sons, 1995.
[19] J. Linderoth, A. Shapiro, S. Wright, The Empirical Behavior of Sampling Methods for Stochastic Programming. Annals of Operations Research, n. 142, pp. 215241, 2006.
[20] D. G. Luenberger, Linear and Nonlinear Programming. AddisonWesley Publishing Company, 1989.
[21] B. K. Pagnoncelli, S. Ahmed e A. Shapiro, Computational Study of
A Chance-Constrained Portfolio Problem. Submetido para publicacao,
2008.

120

XI Simp
osio de Pesquisa Operacional e Logstica da Marinha

Disponvel em http://www.optimization-online.org/.
[22] C. van de Panne e W. Popp, Minimum-Cost Cattle Feed under Probabilistic Protein Constraints. Management Science, n. 9, pp. 405-430,
1963.
[23] R. T. Rockafellar, Convex Analysis. Princeton University Press, 1970.
[24] A. Ruszcy
nski e A. Shapiro, Stochastic Programming. Handbooks in
Operations Resarch and Management Science, vol. 10, Elsevier, 2003.
[25] D. Walkup e R. J.-B. Wets, Stochastic Programs With Recourse. SIAM
Journal on Applied Mathematics, n. 15, pp. 1299-1314, 1967.
[26] R. J.-B. Wets, Stochastic Programs with Fixed Recourse: The Equivalent Deterministic Problem. SIAM Review, n. 16, pp. 309-339, 1974.
[27] R. J.-B. Wets e C. Witzgall, Algorithms for Frames and Linearity Spaces of Cones. Journal of Research of the National Bureau of Standards
Section, B 71B, pp. 17, 1967.

Potrebbero piacerti anche