Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
CURITIBA
DEZEMBRO, 2010
CURITIBA
DEZEMBRO, 2010
Termo de Aprovao
Dedicatria
A Deus,
Pelo dom da vida.
ii
Agradecimentos
Agradeo primeiramente ao Senhor Jesus Cristo por mais uma importante etapa
concluda. Agradeo tambm a minha famlia, pelo apoio e dedicao. Meus amigos
do curso, pelo companheirismo e boas horas de estudo. Agradeo aos meus professores
pelos conhecimentos que me transmitiram, ao professor Paulo Henrique e professora Elizabeth que me orientaram e auxiliaram em pesquisas no decorrer do curso. E
agradeo especialmente ao professor Ademir, que com dedicao me orientou e me ajudou na concluso deste trabalho, pelo exemplo e lies que contribuiram para minha
formao profissional.
iii
Sumrio
Lista de Figuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
vi
Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii
1
INTRODUO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
ESTUDO DE SEQUNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1
Convergncia de Sequncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2
Nmero de Ouro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3
Velocidade de Convergncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MTODO DE CAUCHY . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3.1
Algoritmo de Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3.2
Algoritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.3
Convergncia Global . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.4
Velocidade de Convergncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
MTODO DE NEWTON . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
4.1
4.2
iv
4.3
Algoritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
4.4
Convergncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
5.1
Busca Unidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
5.2
5.3
Algoritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
5.4
5.5
Velocidade de Convergncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
CONCLUSO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Referncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
Lista de Figuras
Figura 1
Figura 2
Figura 3
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Figura 4
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Figura 5
Figura 6
Figura 7
Figura 8
Funes Unimodais
Figura 9
Seo urea
Figura 10
...............................
......................................
. . . . . . . . . . . . . . . 20
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
vi
. . . . . . . . . . . . . . . . . . . . . . . . . . 30
Figura 11
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Figura 12
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Figura 13
Figura 14
Figura 15
vii
. . . . . . . . . . . . . . . . . . . . . . . . . . 36
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
39
Resumo
viii
INTRODUO
ESTUDO DE SEQUNCIAS
2.1
Convergncia de Sequncias
Uma sequncia em IRn uma aplicao k IN 7 xk IRn , definida no
conjunto IN dos nmeros naturais. Denotaremos uma sequncia por (xk )kIN , ou simplesmente por (xk ). Por convenincia, consideramos que IN = {0, 1, 2, 3, . . .}.
Definio 2.1 Diz-se que o ponto a IRn o limite da sequncia (xk ) quando, para
todo > 0 dado, possvel obter k0 IN tal que
k k0 kxk ak < .
Neste caso, tambm dizemos que a sequncia (xk ) converge para a e indicamos este
fato por xk a ou lim xk = a.
k
de (xk ) uma sequncia do tipo (xk )kIN0 ou (xki )iIN , onde (ki )iIN uma sequncia
crescente de inteiros positivos. Note que ki i, para todo i IN.
Teorema 2.2 Se uma sequncia (xk ) converge para um limite a, ento toda subsequncia (xki ) tambm converge para a.
Demonstrao. Dado > 0 existe um k0 tal que para todo k > k0 tem-se kxk ak < .
Como os ndices da subsequncia formam um subconjunto infinito, existe entre eles um
ki0 k0 . Ento para ki ki0 temos ki k0 . Logo kxki ak < .
O limite de uma subsequncia (xk )kIN0 chamado valor de aderncia ou ponto
de acumulao da sequncia (xk ).
Exemplo 2.3 Considere a sequncia xk = (1)k +
1
.
k+1
Exemplo 2.4 Considere uma sequncia (xk ) IR. Se xk a > 0 ento existe k0 IN
a
tal que, para k k0 tem-se xk .
2
a
a
De fato, para = , existe k0 tal que, k k0 temos |xk a| < .
2
2
Ento,
a
a
< xk a <
2
2
a
3a
< xk <
2
2
a
Assim temos que, xk . (Conforme ilustrao na Figura 2).
2
1
, temos lim inf xk = 1 e lim sup xk = 1.
k+1
k
x = 1 + 1 + + 1 + 2.
1
1
1
+
5
Afirmamos que xk , onde =
o inverso do nmero de ouro.
De fato, podemos provar por induo finita que esta sequncia crescente e limitada,
com 1 xk 2. Ento, pelo Teorema 2.9, (xk ) converge, digamos xk x. De acordo
com o Teorema 2.2, a subsequncia (xk+1 ) tambm converge para o mesmo limite, isto
, xk+1 x. Ento (xk+1 xk ) 0.
O que resulta em
1 + x = 0 (x)2 x 1 = 0
1+ 5
Portanto a sequncia converge para x =
.
2
x
2.2
Nmero de Ouro
O Nmero de Ouro um nmero irracional misterioso e enigmtico que nos
surge numa infinidade de elementos da natureza na forma de uma razo, sendo considerada por muitos como uma oferta de Deus ao mundo. A designao adoptada para este
nmero 0, 618, a inicial do nome de Fdias que foi escultor e arquiteto encarregado da construo do Prtenon, em Atenas.
A histria deste enigmtico nmero perde-se na antiguidade. Esta razo ou
seco urea aparece em muitas esttuas da antiguidade que apresentavam uma especial
harmonia esttica. A excelncia dos desenhos de Leonardo Da Vinci (1452-1519), como
a Monalisa e o Homem Vitruviano revelam os seus conhecimentos matemticos bem
como a utilizao da razo urea como garantia de uma perfeio, beleza e harmonia
nicas.
2.3
Velocidade de Convergncia
No contexto de otimizao existe outro aspecto importante a ser analisado em
1
1
1
1
, y k = k , wk = k2 e z k = 2k
k+5
3
2
2
Vemos que todas elas convergem para 0, mas no com a mesma rapidez, conforme sugere a tabela abaixo.
k
xk
0.1667 0.1429
0.1250
0.1111
0.1000
0.0909
yk
0.3333 0.1111
0.0370
0.0123
0.0041
0.0014
2, 98 108
1, 46 1011
2 1010
5, 42 1020
wk
zk
0.5
0.2500 0.0625
0.0030
1 105
(2.1)
Exemplos:
A sequncia xk =
1
converge para 0, mas no linearmente.
k+5
De fato, temos
||xk+1 ||
k+5
=
1.
k
||x ||
k+6
A sequncia y k =
1
converge linearmente para 0, pois
3k
1
||y k+1 ||
=
.
||y k ||
3
As sequncias wk =
1
1
k
e
z
=
tambm convergem linearmente para 0.
2
2k
22k
1
converge superlinearmente para 0.
2k2
2
||wk+1 ||
2k
1
=
0.
2 =
k
2k+1
(k+1)
||w ||
2
2
z k tambm converge superlinearmente para 0.
(2.2)
10
(2.3)
1
converge quadraticamente para 0, pois,
22k
1
2 2
||z ||
0
22k+1 = 2
=
k = 2 = 1.
2
k
22
||z ||
2
1
k
2
2
k+1
1
no converge quadraticamente, pois,
2k2
2
(2k )2
||wk+1 ||
2k
22k
=
.
=
=
2
2
||wk ||2
22k+1
2(k+1)
2k +2k+1
Logo no existe M > 0, tal que
||wk+1 ||
M.
||wk ||2
11
MTODO DE CAUCHY
2010).
3.1
Algoritmo de Cauchy
Um dos mtodos mais conhecidos para minimizar uma funo o mtodo cls-
f (x)
.
v
f (x)
f (x)
.
d
v
Conclumos que a direo oposta ao gradiente a de maior decrescimento da funo.
12
3.2
Algoritmo
O Algoritmo de Cauchy faz uso da busca exata, que consiste em encontrar o
13
3.3
Convergncia Global
Teorema 3.2 O Algoritmo de Cauchy, com o tamanho do passo tk calculado pela busca
exata, globalmente convergente, isto , para qualquer sequncia (xk ) gerada pelo
algoritmo, qualquer ponto de acumulao x estacionrio.
Sejam (xk ) uma sequncia gerada pelo algoritmo e x um ponto de acumulao
IN0
de (xk ), digamos xk x.
Suponha por absurdo que x no seja estacionrio, isto , f (
x) 6= 0.
Assim d = (
x) uma direo de descida o que garante a existncia de t > 0, tal que
< f (
f (
x + td)
x). Considere h : IRn IR dada por h(x) = f (x) f (x tf (x)).
IN0
grande temos que h(xk ) , como vimos no Exemplo 2.4. Deste modo, como tk foi
2
obtido pela busca exata, podemos concluir que
(3.1)
2
para todo k IN0 , suficientemente grande. Por outro lado pela continuidade de f , temos
f (xk ) f (xk+1 )
IN0
f (xk ) f (
x). Como a sequncia (f (xk ))kIN montona decrescente pois temos que
f (xk+1 ) < f (xk ), o Teorema 2.12 garante que f (xk ) f (
x), contradizendo (3.1).
14
3.4
Velocidade de Convergncia
Os resultados mais importantes sobre a velocidade de convergncia do algo-
(dk )T dk
.
(dk )T Adk
De fato,
d
f (xk + tdk ) = f (xk + tdk )dk
dt
= [A(xk + tdk ) + b]T dk
= [Axk + b + Atdk ]T dk
= [f (xk ) + tAdk ]T dk
= f (xk )T dk + t(dk )T Adk
Como tk o passo timo temos: f (xk )T dk + t(dk )T Adk = 0.
Ento, tk =
(dk )T dk
f (xk )dk
=
.
(dk )T Adk
(dk )T Adk
15
No que segue, para facilitar a notao, sem perda de generalidade, vamos supor
que x = 0 e f (
x) = 0, isto ,
1
f (x) = xT Ax.
2
Lema 3.3 Dado x IRn , x 6= 0, considere d = Ax. Ento,
dT d
xT Ax
.
dT Ad
xT A2 x
Demonstrao. Temos xT Ax = dT A1 d e xT A2 x = dT d.
De fato,
dT A1 d = (Ax)T A1 (Ax) = (xT )AT A1 (Ax) = xT Ax;
dT d = (Ax)T (Ax) = (xT )AT (Ax) = xT A2 x.
Portanto,
(dT d)2
dT d xT A2 x
=
dT Ad xT Ax
(dT Ad)(dT A1 d)
(3.2)
Como A > 0, pela decomposio de Choleski, existe G IRnn tal que A = GGT .
Fazendo u = GT d e v = G1 d, temos que:
uT v = (GT d)T (G1 d) = dT GG1 d = dT d;
uT u = (GT d)T (GT d) = dT GGT d = dT Ad;
v T v = (G1 d)T (G1 d) = dT (G1 )T G1 d = dT A1 d.
Pela desigualdade de Cauchy-Schwarz, temos
(dT d)2
(uT v)2
| hu, vi |2
| hu, vi |2
=
=
=
1.
(dT Ad)(dT A1 d)
(uT u)(v T v)
hu, ui hv, vi
||u||2 ||v||2
Podemos concluir da equao (3.2) que:
d T d xT A 2 x
1,
dT Ad xT Ax
completando a prova.
(3.3)
16
17
Como tk =
(dk )T dk
> 0, temos
(dk )T Adk
(tk )2 (xk )T A2 xk = tk
(dk )T dk k T 2 k
(x ) A x tk (xk )T Axk .
(dk )T Adk
Assim,
||xk+1 ||2 = ||xk ||2 2tk (xk )T Axk + (tk )2 (xk )T A2 xk ||xk ||2 tk (xk )T Axk .
=
1
=
1
.(3.4)
||xk ||2
||xk ||2
||xk ||2
(dk )T Adk (xk )T xk
Pelo Lema 3.4 temos
(dk )T dk
1
k
T
k
(d ) Ad
n
(xk )T Axk
1 .
(xk )T xk
||xk+1 ||
||xk ||
2
1
1
.
n
18
19
MTODO DE NEWTON
4.1
(normalmente no linear)
F (x) = 0.
Como na maioria das vezes no conseguimos resolv-lo de forma direta, os processos iterativos constituem a forma mais eficiente de lidar com tais situaes. A idia
aproximar F por seu polinmio de Taylor de primeira ordem. Dada uma estimativa x,
considere o sistema linear
F (
x) + JF (
x)(x x) = 0,
(4.1)
20
Isto corresponde a uma iterao do mtodo de Newton para resoluo de equaes (veja
a Figura 5).
4.2
e x IRn
(4.2)
(4.3)
em relao a x IRn . Supondo que 2 f (xk ) seja no-singular para todo k, obtemos o
esquema iterativo seguinte:
k = 0, 1, ...
(4.4)
21
4.3
Algoritmo
Com base na relao (4.4) podemos agora formalizar o mtodo de Newton para
22
4.4
Convergncia
A direo de Newton pode no ser de descida, assim, no garantimos con-
vergncia global quando o problema a ser resolvido envolver uma funo arbitrria. No
entanto, para uma classe de funes convexas, podemos tirar concluses positivas.
23
,
2
(4.5)
para todo x B(
x, ). Assim, dado d IRn , com ||d|| = 1, temos que
dT 2 f (x)d = dT 2 f (
x)d + dT [2 f (x) 2 f (
x)]d
(4.6)
Note que, usando o Lema 3.4 temos que dT 2 f (x)d . Usando a desigualdade de
Cauchy-Schwarz temos que,
dT [2 f (x) 2 f (
x)]d ||d||||2 f (x) 2 f (
x)||||d||
.
2
= ,
2
2
24
1
||B y||.
2
1 x 2
||B 1 x||
.
||B || = sup
= sup B
||x||
||x||
x6=0
x6=0
1
2
, segue que
Lema 4.4 Sejam U IRn aberto e convexo. Se 2 f Lipschitz com constante L, ento
||f (x) f (y) 2 f (y)(x y)|| L||x y||2 ,
para todo x, y U .
25
1
, existe 2 > 0 tal que
4M
1
,
4M
1
,
4M
(4.7)
26
Ento
||2 f (x) 2 f (y)|| = ||2 f (x) 2 f (x) + 2 f (x) 2 f (y)||
||2 f (x) 2 f (x)|| + ||2 f (y) + 2 f (x)||
1
1
1
+
=
4M
4M
2M
Portanto sup ||2 f (x) 2 f (y)|| <
x,yU
1
, onde U = B(x, ) e = min{1 , 2 }.
2M
, onde U0 = B(
x, 0 ). Tome
considere 0 < tal que sup ||2 f (x) 2 f (y)|| <
M
x,yU
k0 IN tal que xk U0 , para todo k k0 . Aplicando novamente os Lemas 4.2 e 4.3 na
relao (4.7), obtemos
||xk+1 x|| ||xk x||,
provando assim (ii).
Finalmente, se 2 f Lipschitz, podemos usar os Lemas 4.2 e 4.4 em (4.7)
para obter
||xk+1 x|| M L||xk x||2 ,
completando a demonstrao.
27
5.1
Busca Unidimensional
28
5.2
x1
x2
x1=x2
29
Agora vamos analisar como o intervalo [a, b] deve ser particionado. A obteno
deste intervalo, que deve conter um minimizador de ser tratada adiante. A estratgia
mais natural dividir o intervalo em trs partes iguais, ou seja, definir
1
u = a + (b a)
3
2
e v = a + (b a).
3
1
do intervalo a cada iterao, conforme ilustrado na
3
Figura 10. Alm disso, se o intervalo descartado for o (v, b], temos como novo intervalo
Desta forma descartamos
30
a+
u+
v+
b+
51
0.618.
segmentos. Tal razo conhecida como o nmero de ouro e vale
2
Desta forma, temos que u e v devem satisfazer
bu
ua
=
ba
bu
va
bv
=
ba
va
(5.1)
v = a + 2 (b a)
(5.2)
1
1 1
(5.3)
31
3 5
51
Como u, v [a, b], encontramos 1 =
0, 382 e 2 =
0, 618. Das
2
2
relaes (5.3) e (5.4) temos:
2 =
(1 1 )2 = 1
(5.5)
(2 )2 = 1 2
(5.6)
E, ainda
e 1 + 2 = 1
(5.7)
32
a+
u+
v+
b+
33
a+
u+
v+
b+
34
5.3
Algoritmo
35
0, se k = 0
36
37
(ii) Suponha por absurdo que no exista minimizador no intervalo [a, v], portanto existe um mnimo t (v, b]. Note que t1 > v pois do contrrio teramos t1 < a e
assim [a, v] [t1 , t ] [t1 , t2 ], o que uma contradio, pois estamos supondo que no
existe minimizador em [a, v]. Como unimodal, ou seja, estritamente decrescente
em [0, t1 ], temos que u < v < t1 , implica em (u) > (v), o que contradiz a hiptese.
5.4
bk ak = r0 (2 )k
38
39
uk + vk
ak + b k
=
e t o
2
2
40
5.5
Velocidade de Convergncia
Provaremos que a velocidade de convergncia da sequncia bk linear com
taxa de convergncia igual ao nmero de ouro. Suponha que o intervalo (vk , bk ] foi
descartado. Assim temos que ak+1 = ak , vk+1 = uk e bk+1 = vk .
Teorema 5.12 As sequncias (ak ) e (bk ) geradas pelo Algoritmo da Seo urea tem
convergncia linear e a taxa de convergncia 2 , ou seja, ||bk+1 t|| 2 ||bk t||
para todo k IN.
Demonstrao. Para simplificar a notao vamos suprimir o indice k. Considere a
vk t
funo g : [a, v] IR, onde g(t) =
, temos que:
bk t
(1)(b t) (a + 2 (b a) t)(1)
(b t)2
b + t + a + 2 (b a) t
=
(b t)2
(b a)(1 + 2 )
=
(b t)2
1 (b a)
=
<0
(b t)2
g 0 (t) =
va
a + 2 (b a) a
=
= 2 ,
ba
ba
41
CONCLUSO
42
intervalo que sobrou contm pelo menos um minimizador. Mostramos que o algoritmo
realmente converge para um minimizador. E finalmente, demonstramos que a sequncia (ak ) ou (bk ) gerada pelo algoritmo converge linearmente, com taxa o nmero de
ouro. Realizamos o estudo deste captulo com base nas literaturas j citadas ao longo
do trabalho, mas os resultados demonstrados obtemos com um estudo independente.
43
Referncias