Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
+ k ser denotada por Z$ T + k . O nmero de instantes frente para o qual feita a previso (neste caso,
k) chamado de horizonte de previso. Por exemplo, a previso de ZT+1 denotada por Z$ T +1 .
A dependncia serial entre os valores da srie um aspecto essencial, pois nos permite gerar previses de
valores futuros da srie. Estas previses seriam puro chute se no houvesse dependncia serial.
Tambm, diferentes sries possuem diferentes graus de previsibilidade; por exemplo, freqentemente
mais fcil prever uma srie de temperaturas mdias mensais do que a taxa mensal de inflao. Logo, no
se pode garantir que a previso encontrada por este ou aquele mtodo ser sempre boa, tudo depende
das caractersticas da srie que est sendo estudada! No entanto, um aspecto deve ser levado em conta ao
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com
2
fazermos previses de sries temporais: o nvel de incerteza aumenta com o horizonte de previso quanto
mais longe no futuro, maior a incerteza associada previso. Isto intuitivamente razovel, sempre
mais difcil prever o futuro distante, e a nossa previso estar cercada de incertezas!
Uma medida do acerto das nossas previses o erro de previso k-passos frente, definido a seguir.
Definio 5.1.3. (Erro de Previso k passos frente)
O erro de previso k passos frente no instante t (onde k um inteiro maior ou igual a um) definido como
a diferena entre o valor real da srie no instante t e a previso deste valor feita k instantes antes, isto :
ek (t ) = Z t Z t k (k )
e1 (t ) = Z t Z t 1 (1)
Um bom modelo de previso produz previses com erro pequeno, e assim interessante acompanhar
quantidades como a soma dos quadrados dos erros de previso, ou a soma dos valores absolutos dos erros
de previso.
E como funcionam estas ferramentas quantitativas que nos permitem prever o futuro de uma srie
temporal?
Vamos utilizar o passado (dados histricos) para descrever a trajetria mais provvel da srie no futuro.
Isso no uma bola de cristal!
Na maioria dos problemas o passado traz informaes relevantes sobre o que ir ocorrer no futuro, pois
existe correlao entre as variveis em diversos instantes.
claro que o conhecimento do passado no nos diz exatamente como ser o futuro, e ento sempre
existe incerteza associada s nossas previses !
Mas, podemos ter uma boa idia de quais sero os valores mais provveis no futuro !
Ou seja, podemos especificar previses futuras e limites de confiana.
3
real da srie no instante t, e Z t seu valor ajustado pelo modelo. Ento, o resduo no instante t apenas
Zt - Z .
t
Sries temporais ocorrem com enorme freqncia na prtica. No quadro a seguir exibimos os grficos de
algumas sries temporais reais.
Quadro 5.1.1. - algumas sries temporais
Preos Mensais Internacionais de Celulose
em US$ fixos
Vendas Mensais de
embalagens de 290 ml
Refrigerantes
em
V E ND AS - E M BALAG E NS 2 9 0 ml
1050.00
950.00
300
850.00
250
750.00
200
650.00
150
550.00
100
450.00
50
350.00
g ua 290
lim 290
la ra nj290
jan-78jan-79jan-80jan-81jan-82jan-83jan-84jan-85jan-86jan-87jan-88jan-89jan-90jan-91jan-92jan-93jan-94jan-95jan-96jan-97
m s e a no
38.00
36.00
34.00
BRPREC
ARGPREC
MEXPREC
32.00
30.00
28.00
26.00
24.00
22.00
20.00
4
Consumo Mdio de Energia Eltrica
230
220
210
200
190
180
170
160
150
80%
60%
40%
20%
Jul96
Feb95
Sep93
Apr92
Nov90
-20%
Jun89
0%
Jan88
Jun-94
Nov-94
Jan-94
Aug-93
Oct-92
Mar-93
May-92
Jul-91
Dec-91
Feb-91
Sep-90
Apr-90
Jun-89
Nov-89
Jan-89
IPC-RJ (FGV)
100%
Podemos fazer uma distino bsica entre duas grandes classes de modelos:
Modelos Univariados: a srie temporal explicada (prevista) apenas pelos seus valores passados;
Modelos Multivariados ou Causais: a srie temporal explicada (prevista) pelos seus valores
passados e tambm pelos valores passados de outras variveis.
Neste captulo consideraremos apenas modelos univariados.
Exemplo 5.1.3. (Alguns Modelos Univariados)
i) Naive (ingnuo)
A previso de ZT+1 (valor da srie no instante T +1) apenas a ltima observao (ZT). claro que voc
no precisa de um software para ajustar isso e, em alguns casos, o nico mtodo disponvel. Um
exemplo clssico a previso do preo de uma ao - geralmente a melhor previso para o preo de
amanh o preo de hoje, o que certamente frustrante!
ii) Mdias mveis de tamanho N
A cada instante, a previso apenas a mdia das ltimas N observaes. Um dos problemas com este
mtodo a escolha de N, o tamanho da janela a ser utilizado. Quanto maior o valor de N, mais suave a
previso. Ao contrrio, se N pequeno, a previso tende a ser meio nervosa, isto , oscila muito. Uma
caracterstica importante do mtodo de mdias mveis : todas as observaes usadas para o clculo tm
o mesmo peso (que 1/N). Mas, na prtica razovel supor que as observaes mais recentes sejam
mais relevantes para a previso dos prximos valores da srie, e portanto deveriam receber um peso maior
que as observaes mais antigas. Esta idia de pesar ou ponderar as observaes de acordo com as suas
idades leva aos diversos mtodos de amortecimento exponencial.
iii) Amortecimento Exponencial (Exponencial Smoothing)
Existem inmeras variaes destes mtodos, para sries sazonais e no sazonais. A idia geral parecida
com a do mtodo de mdias mveis, mas os pesos das observaes decrescem medida que as
observaes esto mais longe no passado. A taxa de decrscimo do(s) peso(s) determinada por uma ou
mais constantes de amortecimento. A maior dificuldade na aplicao escolher a(s) constante(s) de
amortecimento, mas alguns softwares j ajustam os modelos de amortecimento automaticamente com
constantes de amortecimento otimizadas.
5
Na prtica, os mtodos de amortecimento so os mtodos de previso mais usados no dia a dia das
empresas, o que em parte explicado pela sua facilidade de implementao e capacidade em gerar boas
previses.
iv) Modelos ARIMA de Box e Jenkins
So modelos mais sofisticados, que usam as correlaes entre as observaes em diversos instantes. A
idia por trs dos modelos ARIMA envolve filtros lineares e algum conhecimento de Teoria de Sistemas
til. A identificao da estrutura do modelo um pouco complicada, mas alguns softwares j identificam
automaticamente a estrutura do modelo ARIMA, evitando o passo mais complicado da anlise. Como casos
particulares dos modelos ARIMA temos os processos AR (Autoregressivo) e MA (Mdias mveis ou moving
average), j estudados brevemente no captulo 2.
Os modelos ARIMA costumam apresentar melhores resultados que os mtodos de amortecimento quando a
srie relativamente longa e bem comportada.
Se a srie muito irregular, os resultados so, geralmente, inferiores aos obtidos por mtodos de
amortecimento.
Existem tambm modelos ARIMA multivariados, geralmente chamados de modelos de funo de
transferncia, mas eles no sero estudados aqui.
Decomposio de uma srie temporal
A maneira tradicional de analisar uma srie temporal atravs da sua decomposio nas componentes de
tendncia, ciclo e sazonalidade.
A tendncia de uma srie indica o seu comportamento de longo prazo, isto , se ela sobe, desce, ou
permanece estvel, e qual a velocidade destas mudanas. Nos casos mais comuns trabalhamos com
tendncia constante, linear ou quadrtica, como mostrado na prxima figura.
Quadro 5.1.2. Tendncia de uma srie
Tendncia Constante
Tendncia Linear
Tendncia Quadrtica
A sazonalidade indica a repetio de um padro na srie dentro do perodo de um ano. Por exemplo,
vendas de sorvete so altas no vero e baixas no inverno. No quadro 5.1.1., as sries de temperatura,
consumo de energia eltrica e vendas de refrigerantes so claramente sazonais, mas no se pode dizer o
mesmo das outras sries.
Os ciclos indicam padres que se repetem na srie em perodos superiores a um ano. Por exemplo, ciclos
relacionados atividade econmica ou ciclos meteorolgicos.
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com
6
Caractersticas de uma srie temporal e estimadores
Um processo estocstico estacionrio de 2 ordem pode ser descrito (no domnio do tempo) por sua mdia,
varincia e funo de autocovarincia (ou de autocorrelao). Na prtica no conhecemos totalmente o
processo estocstico que gerou a srie que est sendo observada, e estas quantidades (mdia, varincia,
autocorrelao) devem ser estimadas a partir da srie temporal, como indicado no captulo 2.
Seja Z T = Z1 , Z 2 ,..., Z T
VAR( Z t ) = 2 = constante
(5.2.1)
7
A seguir derivamos estimadores para os parmetros desconhecidos dos modelos de nvel constante, linear
e quadrtico e encontramos as respectivas equaes de previses.
Freqentemente iremos supor que os erros 1, 2, ..., T so independentes com uma distribuio de
probabilidade conhecida (por exemplo, a Normal) com mdia zero e varincia constante. Das equaes
acima fcil ver que a estimao da varincia de Zt (que igual varincia de t) no apresenta grandes
dificuldades, basta utilizar os estimadores usuais da varincia de uma amostra aleatria. Por isso, na
discusso a seguir, ns nos concentraremos na estimao dos parmetros que definem o nvel mdio da
srie.
5.2.1. Modelo Constante (Horizontal)
Este um modelo apropriado quando a srie temporal apenas oscila em torno de um valor constante, sem
exibir tendncia de crescimento ou queda. A funo nvel mdio dada por: (t) = a1 para todo instante t
= 1, 2, 3, ....., T.
Z T (k ) = E{Z T + k | Z T } = E{a1 + T + k | Z T } = a1 (T )
(5.2.2)
8
2) Estimador Mdias Mveis de tamanho N
O nvel mdio da srie num certo instante estimado como a mdia mvel de tamanho N usando as
observaes ZT, ZT-1, ..., ZT-N+1, isto :
a1 (T ) = M T =
Z T N +1 + ... + Z T 1 + Z T
N
(5.2.3)
Uma questo crucial neste caso definir qual o tamanho da janela a ser usada, isto , quantas
observaes sero utilizadas no clculo da mdia mvel. Note que, se N = 1, apenas a ltima observao
usada, e o mtodo se reduz ao mtodo ingnuo. Por outro lado, se N = T (tamanho da srie), temos o
chamado mtodo conservador, em que todas as observaes disponveis so empregadas na estimao
do nvel mdio da srie, e a1 (T ) = Z , a mdia amostral da srie.
O tamanho da janela utilizada (N) pode ser escolhido como aquele inteiro positivo que minimiza a soma de
quadrados dos erros de previso 1 passo frente, isto , escolhe-se N de forma a minimizar:
T
S ( N ) = e12 (t )
t =1
a1 (T ) = M T =
Z ZT N
Z T N +1 + ... + Z T 1 + Z T
= M T 1 + T
N
N
(5.2.4)
Onde MT-1 a mdia mvel de tamanho N calculada no instante anterior. Em outras palavras, o estimador
do nvel envolve uma informao atual (representada por ZT, o ltimo valor observado da srie) e uma
informao passada (MT-1 e ZT-N).
O mtodo de amortecimento exponencial estende esta idia de ponderao da informao presente e
passada. Na equao (5.2.4) substitua ZT-N por MT-1. Isso nos leva ao seguinte estimador:
a1 (T ) = M T 1 +
Z T M T 1 1
1
= Z T + 1 M T 1
N
N
N
N
Ou seja, este novo estimador tem a forma: (peso)*(informao atual) + (1 peso)*(informao passada).
Note que 1 (T) a previso do nvel da srie efetuada no instante atual T e podemos reescrever esta
ltima equao como:
1
1
1
a1 (T ) = ZT + 1 M T 1 = ZT + 1 a1 (T 1)
N
N
N
9
baseada na ponderao do valor mais recente da srie (ZT) e da ltima previso para o nvel (1 (T
1)).
Uma forma mais geral de definir um estimador com esta caracterstica de ponderao das informaes
passadas e presentes :
a1 (T ) = M T = ZT + (1 ) M T 1 = .ZT + (1 )a1 (T 1)
(5.2.5)
(5.2.6)
A expresso (5.2.6) freqentemente conhecida como forma de correo do erro. Nela, o mecanismo de
atualizao da previso do nvel fica explcito: o nvel estimado num instante T igual ao nvel estimado no
instante anterior mais um mltiplo do erro de previso um passo frente cometido no instante anterior (que
ZT 1(T-1)).
Seja eT-1 o erro de previso um passo frente no instante T-1, isto :
eT-1 = ZT 1(T-1) e ento podemos rearranjar os termos e escrever: ZT = eT-1 + 1(T-1).
Se aplicarmos a equao (5.2.6) previso do nvel no instante T + 1 encontramos:
a1 (T + 1) = ZT +1 + (1 ) M T = a1 (T ) + (ZT +1 a1 (T )) = a1 (T ) + .eT
Da:
ZT +1 ZT = (eT +1 + a1 (T )) (eT + a1 (T 1)) = eT +1 eT + (a1 (T ) a1 (T 1)) = eT +1 eT + .eT = eT +1 + (1 ).eT
Esta expresso no til do ponto de vista preditivo, pois o lado direito contm os outputs (erros de
previso um passo frente) enquanto o dado esquerdo contm os inputs (observaes). Mas, esta
expresso importante em termos estruturais, pois se os es (erros de previso um passo frente) so
substitudos por choques aleatrios, o modelo resultante um ARIMA (0,1,1), que ser estudado na
prxima seo. Num modelo ARIMA(0,1,1) o mtodo de amortecimento exponencial simples estudado aqui
fornece previses timas.
Por substituies sucessivas na equao (5.2.5) encontramos:
MT = ZT + (1-) ZT-1 + (1-)2 ZT-2 + ... + (1-)T-1 Z1
(5.2.7)
Esta ltima equao mostra claramente como funciona o mtodo de amortecimento exponencial: cada
estimativa do nvel (dada por MT) uma soma ponderada da observao atual (ZT) e das observaes
10
passadas. Os pesos decrescem exponencialmente, e a taxa de decaimento dos pesos depende da
constante .
Qual o efeito da constante de amortecimento ? Note que, da equao (5.2.7), o peso da observao
ZT-k (1-)k (para k = 0, 1, 2, ...). Logo, a razo entre os pesos da observao ZT-k e da observao atual
(ZT) (1-)k . Se grande (prximo de 1) os pesos decaem rapidamente, e uma observao que est
longe no passado no tem qualquer influncia sobre a estimativa atual do nvel, que estimado usando
quase exclusivamente as observaes mais recentes. Ao contrrio, se pequeno (por exemplo, menor
que 0.3), uma observao longe no passado pode ainda ter uma influncia considervel na estimao do
nvel feita hoje.
A tabela a seguir apresenta alguns valores de e a meia vida das observaes, isto , quantas
defasagens so necessrias at que o peso da observao se reduza metade. A meia vida das
observaes encontrada resolvendo a seguinte equao para k (o lag):
peso de Z T k 1
(1 )k 1
log(2)
=
= k .log(1 ) = log(2) k =
onde log(.) indica o
peso de Z T
2
2
log(1 )
logaritmo natural. Como k indica uma defasagem, deve-se escolher o valor k inteiro no negativo que
satisfaz (aproximadamente) esta equao.
Tabela 5.2.1. Meia Vida das Observaes como Funo de
0,99
0,15
0,95
0,23
0,90
0,30
0,80
0,43
0,70
0,58
0,60
0,76
0,50
1,00
0,45
1,16
0,40
1,36
0,35
1,61
0,30
1,94
0,25
2,41
0,20
3,11
0,15
4,27
0,10
6,58
0,05
13,51
0,02
34,31
0,01
68,97
11
Nota: reparametrizao
Em alguns livros encontra-se o mtodo de amortecimento escrito de maneira diferente. Seja = 1- na
equao (5.2.7). Em termos de esta equao torna-se:
MT = (1-)ZT + (1-) ZT-1 + 2(1-) ZT-2 + ... + T(1-)Z1
(5.2.8)
Logo, o peso da observao atual (1-) e o da k-sima observao no passado k (1-). Nesta
parametrizao, valores altos de indicam que a memria do processo relativamente longa, ou seja, a
influncia das observaes passadas demora a decair.
Exemplo 5.2.1.
A tabela a seguir exibe os primeiros valores da srie temporal: Zt = 2 + et onde os et s so rudos iid com
distribuio Normal de mdia 0 e desvio padro . Supomos que em t = 0, Z0 = 0 (apenas para permitir a
inicializao do processo), e o objetivo aqui demonstrar a estimao seqencial de a1 por amortecimento
exponencial e mdias mveis (de tamanho 2, 3 e 4). Note que, dependendo da escolha da constante de
amortecimento (ou da janela utilizada na mdia mvel), a estimativa do nvel mais ou menos nervosa (e
oscila mais ou menos medida que recebemos cada valor da srie). Verifique os valores estimados para o
nvel da srie. Faa (em casa) o grfico da evoluo no nvel estimado ao longo do tempo para todos os
mtodos indicados.
Estimador
MM(3)
Estimador
MM(4)
Estimador
Amort. Expo.
(Alfa = 0.2)
Estimador
Amort. Expo.
(Alfa = 0.3)
0,098
0,147
0,494
0,692
Instante t
Erros (e(t))
Srie (Z(t))
Estimador
MM(2)
-1,512
0,488
0,244
0,080
2,080
1,284
0,856
-0,433
1,567
1,824
1,379
1,034
0,709
0,816
0,437
2,437
2,002
2,028
1,643
1,054
1,227
0,107
2,107
2,272
2,037
2,048
1,265
1,370
-0,025
1,975
2,041
2,173
2,021
1,407
1,478
-0,192
1,808
1,891
1,963
2,082
1,487
1,527
0,629
2,629
2,219
2,137
2,130
1,716
1,830
0,463
2,463
2,546
2,300
2,219
1,865
1,940
10
0,332
2,332
2,398
2,475
2,308
1,958
2,005
11
-0,469
1,531
1,931
2,109
2,239
1,873
1,830
12
0,538
2,538
2,034
2,134
2,216
2,006
2,072
13
0,277
2,277
2,408
2,115
2,170
2,060
2,087
14
0,017
2,017
2,147
2,277
2,091
2,052
2,047
15
-0,256
1,744
1,880
2,013
2,144
1,990
1,959
12
5.2.2. Modelo Linear
Esta estrutura adequada quando existe uma tendncia clara de crescimento (ou queda) ao longo do
tempo, como indicado na prxima figura. A funo nvel mdio dada por: (t) = a1 + a2.t para todo
instante t = 1, 2, 3, ....., T.
E (Z t ) = a1 + a 2 .t e VAR(Z t ) = 2 = VAR( t )
(5.2.9)
Neste modelo necessrio estimar trs parmetros: a1 (coeficiente linear da srie), a2 (coeficiente angular
da reta, ou seja, a taxa de crescimento da srie) e 2 (a varincia da srie).
A previso k passos frente obtida no instante T :
(5.2.10)
A previso dada pela equao (5.2.10) pode ser escrita de uma forma ligeiramente diferente, desde que
faamos uma mudana da origem.
13
1) Estimadores de Mnimos Quadrados Ordinrios (MQO)
Nosso objetivo encontrar a1 e a2 tais que a seguinte soma seja minimizada:
T
SSE =
+ a t )]
[Z144(a24
4
3
t
t =1
(5.2.11)
SSE chamado de soma dos quadrados dos erros (ou soma do quadrado dos resduos). O mtodo de
mnimos quadrados bastante geral, e se aplica estimao de um nmero qualquer de parmetros a1, a2,
..., ak (supe-se que k menor que o tamanho da srie, para permitir a estimao). Considere, de maneira
onde f(.) uma funo
mais geral, um modelo com a seguinte estrutura: Z t = f (a1 , a 2 ,...., a k , t ) + t
(possivelmente no linear) do tempo e dos parmetros desconhecidos. Ento a soma dos quadrados dos
erros dada por:
T
SSE =
(Z
t =1
2
t
t =1
O mtodo de mnimos quadrados procura encontrar estimadores dos parmetros desconhecidos de forma a
minimizar a soma do quadrado dos erros (SSE).
Note que os estimadores por mnimos quadrados encontrados pela minimizao da soma do quadrado dos
erros so calculados usando a srie inteira, ou seja, usamos todos os dados disponveis de uma s vez. Ao
contrrio, nos mtodos mdias mveis e de amortecimento, a atualizao dos parmetros seqencial, e o
recebimento de uma nova observao resulta em novos valores estimados para a1 e a2.
2) Estimadores pelo Mtodo de Mdias Mveis Duplas
Defina a mdia mvel dupla de tamanho N como:
M [2]
T =
M T + M T 1 + ... + M T N +1
N
(5.2.12)
Onde MT a mdia mvel (simples) de tamanho N calculada usando todas as observaes at o instante T
(inclusive).
Por que usar mdias mveis duplas?
Se os dados exibem uma tendncia linear, o uso de mdias mveis simples para a previso dos valores da
srie induz a erros sistemticos, pois a mdia mvel simples segue a tendncia com um certo atraso, e este
efeito amplificado quando tentamos prever valores futuros. O mtodo de mdias mveis duplas procura
diminuir este efeito sistemtico.
Pode-se mostrar que:
N 1
.a 2 (T )
2
E{M [2]
T } = a1 (T ) + T .a 2 (T ) ( N 1) a 2 (T )
E{M T } = a1 (T ) + T .a 2 (T )
14
a 1 (T ) = 2.E{M T } E{M T[ 2] } - T .a 2 (T )
a 2 (T ) =
2
E{M T } E{M T[ 2] }
( N 1)
(5.2.13)
a 1 (T ) = M T + M T M T[2 ] - T .a 2 (T ) = 2.M T M T[ 2] T .a 2 (T )
a 2 (T ) =
2
M T M T[ 2 ]
( N 1)
}
(5.2.14)
O estimador 1(T) encontrado corrigindo-se a mdia mvel simples (MT) pela diferena entre ela e a mdia
mvel dupla. Se, na verdade, no existisse uma tendncia linear, o fator de correo seria pequeno.
A previso k passos frente no instante T :
Z T + k = a1 (T ) + a 2 (T ).(T + k ) = 2.M T M T[ 2 ] T .a 2 (T ) + T .a 2 (T ) + k .a 2 (T ) =
= 2.M T M T[ 2] + k .a 2 (T ) = 2.M T M T[ 2 ] + k .
M T M T[ 2 ]
N 1
a1 (T ) = M T + M T M T[2 ] = 2.M T M T[ 2]
a 2 (T ) =
2
M T M T[ 2]
( N 1)
(5.2.15)
2
ZT + k = a1 (T ) + a2 (T ).(k ) = 2.M T M T[ 2] + k .a2 (T ) = 2.M T M T[ 2] + k .
M T M T[ 2]
N 1
15
Exemplo 5.2.2.
Um ponto importante a ser lembrado quando tratamos de mtodos de mdias mveis : estes
procedimentos implicam num conjunto de pesos definidos para as observaes passadas. Isso nos permite
compar-los com os mtodos de amortecimento exponencial.
Por exemplo, considere um modelo linear onde os parmetros desconhecidos so estimados por mdias
mveis simples e duplas de tamanho 3. Como podemos escrever os estimadores em termos dos valores
observados da srie?
Note que, neste caso, para qualquer instante t maior que 3:
Mt =
Z t + Z t 1 + Z t 2
3
M t[ 2] =
M t + M t 1 + M t 2
3
2
. 1) = 2 M T M T[ 2] +
ZT +1 = a1 (T ) + a2 (T )(
M T M T[ 2] =
3 1
M + M T 1 + M T 2
= 2M T M T[ 2] + M T M T[ 2] = 3.M T 2.M T[ 2] = 3.M T 2 T
=
3
= M T 2M T 1 2 M T 2 =
=
3
3
3
3
3
1 7
5
3
4
2
= ZT + ZT 1 + ZT 2 +
ZT 3 +
ZT 4
3
3
3
3
3
3
(5.2.16)
16
)
}
a1 (T ) = M T + M T M T[2 ] = 2.M T M T[ 2]
a 2 (T ) =
M M T[ 2]
(1 ) T
(5.2.17)
Ou seja, estes estimadores tm a mesma forma que na equao (5.2.15). No entanto, agora MT e MT[2]
no mais representam as mdias mveis descritas no tem 5.2.2., e so calculados atravs das equaes
(5.2.16).
A previso k passos frente no instante T :
ZT + k = a1 (T ) + a2 (T ).(k ) = 2.M T M T[ 2] +
M T M T[ 2] .k
1
(5.2.18)
(Z 2 Z1 ) + (Z 4 Z3 )
2
(5.2.19)
a1 (T ) = M T
17
Caractersticas importantes do mtodo
(Z 2 Z1 ) + (Z 4 Z3 )
2
Srie Z(t)
Instante (puramente
determinstica)
t
1
5,00
2
8,00
3
11,00
4
14,00
5
17,00
6
20,00
7
23,00
8
26,00
9
29,00
10
32,00
11
35,00
12
38,00
13
41,00
14
44,00
15
47,00
MM(3)
8,00
11,00
14,00
17,00
20,00
23,00
26,00
29,00
32,00
35,00
38,00
41,00
44,00
Erro de
Previso 1
Previso 1
passo
frente
passo
frente de Z(t)
usando
usando MM(3)
MM(3)
8,00
11,00
14,00
17,00
20,00
23,00
26,00
29,00
32,00
35,00
38,00
41,00
6,00
6,00
6,00
6,00
6,00
6,00
6,00
6,00
6,00
6,00
6,00
6,00
MM Dupla (3)
11,00
14,00
17,00
20,00
23,00
26,00
29,00
32,00
35,00
38,00
41,00
Previso 1
passo frente
Diferena
= MM(3) +
Erro de Previso
(MM(3)entre MM(3)
1 passo frente
e MM Dupla MMDup(3)) +
usando MM
(3)
tendncia
Dupla
3,00
3,00
3,00
3,00
3,00
3,00
3,00
3,00
3,00
3,00
3,00
20,00
23,00
26,00
29,00
32,00
35,00
38,00
41,00
44,00
47,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
18
Exemplo 5.2.4.
Considere o exemplo anterior, mas agora adicione um erro aleatrio Zt. O modelo gerador destes dados :
Zt = 2 + 3.t + et onde os ets so rudos aleatrios independentes Normais, com mdia zero e varincia .
Refaa o exemplo anterior e note que os erros de previso um passo frente usando mdias mveis
simples so consideravelmente maiores que os erros encontrados quando usamos a equao (5.2.15) para
prever Zt. Calcule a soma do quadrado dos erros de previso um passo frente segundo os dois mtodos.
Instante t
Erros
(e(t))
Srie (Z(t))
MM(3)
Erro de
Previso 1
Erro de
Previso 1
passo frente = Previso 1
Previso 1
passo
MM(3) +
passo
frente
Diferena
(MM(3)frente
passo frente
de Z(t) usando
usando
entre MM(3) e MMDup(3)) +
usando
MM(3)
MM(3)
MM Dupla (3) MM Dupla (3)
tendncia
MMDupla
-0,150
4,850
-0,639
7,361
0,122
11,122
7,778
0,638
14,638
11,041
7,778
6,861
0,599
17,599
14,453
11,041
6,559
11,090
3,363
0,867
20,867
17,701
14,453
6,413
14,398
3,303
21,179
-0,31
-1,092
21,908
20,125
17,701
4,207
17,426
2,698
24,307
-2,40
-0,117
25,883
22,886
20,125
5,758
20,237
2,649
25,521
0,36
0,548
29,548
25,780
22,886
6,662
22,930
2,850
28,183
1,36
10
-0,543
31,457
28,962
25,780
5,677
25,876
3,086
31,479
-0,02
11
-0,345
34,655
31,886
28,962
5,693
28,876
3,010
35,135
-0,48
12
-0,845
37,155
34,422
31,886
5,268
31,757
2,665
37,907
-0,75
13
-0,923
40,077
37,295
34,422
5,654
34,535
2,761
39,752
0,32
14
-0,489
43,511
40,248
37,295
6,216
37,322
2,926
42,817
0,69
15
-0,387
46,613
43,400
40,248
6,366
40,314
3,086
46,099
0,51
Exemplo 5.2.5.
No grfico a seguir mostramos o consumo comercial de energia eltrica anual no Brasil no perodo 1963 a
1998, e os resultados do ajuste de um modelo de Holt srie.
Componente
Constante de
Amortecimento
Valor Final
Nvel
Tendncia
0.8086
0.9994
41539
3536
19
Consumo Comercial (GWh)
45,000
40,000
35,000
30,000
25,000
20,000
15,000
10,000
5,000
0
1963
1965
1967
1969
1971
1973
1975
1977
1979
1981
1983
1985
1987
1989
1991
1993
1995
1997
1999
As previses geradas pelo modelo para o perodo 1999-2002 so indicadas a seguir, assim como os
respectivos erros de previso em 1999 e 2000.
Ano
1999
2000
2001
2002
Limite Inferior
Previso
(2.5%)
42,949
44,570
46,842
49,362
Previso
Limite
Superior
Previso
(97.5%)
Valor Real
45,074
48,610
52,145
55,681
47,199
52,650
57,448
62,000
43,583
47,365
Erro
Percentual
Absoluto de
Previso
3.4%
2.6%
20
ZT (k ) = E{ZT + k | Z1, Z 2 ,...., ZT } =
= E{a1 + a2 .k + a 3k 2 | Z1, Z 2 ,...., ZT } (com a origem transladada, isto , fazendo T = 0)
= a1 (T) + k .a 2 (T) + k 2 . a 3 (T)
Analogamente aos modelos constante e linear, existem diversos mtodos para a estimao dos parmetros
que especificam o nvel da srie. Aqui, ao contrrio dos casos anteriores, no iremos exibir em detalhes as
equaes de atualizao.
SSE =
t =1
M[3]
T =
M T[ 2] + M T[ 2]1 + ... + M T[ 2] N +1
N
(5.2.20)
a i (T ) = f i [ M T , M T[ 2 ] , M T[ 3 ] ] ; i = 1, 2, 3
3) Amortecimento Exponencial
M T = ZT + (1 ) M T 1
M T[ 2] = M T + (1 ) M T[ 2]1
M T[3] = M T[3] + (1 ) M T[3]1
Onde [0,1] a nica constante de amortecimento usada para atualizar todas as mdias mveis.
Os estimadores dos parmetros a1, a2 e a3 (correspondentes origem transladada para o instante T) no
instante T so obtidos atravs das equaes:
21
(1 )(2 ) a (T )
1
M T = a1 (T )
a 2 (T ) +
3
2. 2
MT
[ 2]
MT
[ 3]
2(1 )(3 2 )
1
= a1 (T ) 2
a 3 (T )
a 2 (T ) +
2. 2
3.(1 )(4 3 )
1
= a1 (T ) 3
a 3 (T )
a 2 (T ) +
2. 2
22
MODELO ADITIVO
Zt = (t) + t + t
MODELO MULTIPLICATIVO
Zt = (t) . t . t ou Zt = (t) . t + t
(5.3.1)
Neste caso precisamos estimar o nvel da srie (a1) e os fatores sazonais t para todos os meses t. Note
que, no caso de dados mensais, precisamos estimar 12 fatores sazonais e o nvel, ou seja, existem 13
parmetros a serem estimados. No caso de dados trimestrais, existem 4 fatores sazonais (e tambm o
nvel), o que resulta na estimao de 5 parmetros. Na verdade, se S o perodo sazonal, existem S fatores
sazonais a serem estimados, mas a soma destes fatores est sujeita a uma restrio, e na prtica o nmero
de fatores sazonais a serem estimados S 1. Logo, na prtica, no modelo mensal devemos estimar 11
fatores sazonais (pois o remanescente obtido a partir da restrio).
A previso k passos frente feita no instante T dada por:
Z T (k ) = E{Z T + k | Z T } = a1 (T ). T + k (T )
(5.3.2)
T + k (T )
Os parmetros do modelo so atualizados seqencialmente da forma indicada a seguir. Suponha que, para
um instante genrico T, as estimativas de a1 e do fator sazonal para o instante anterior esto disponveis
23
(isto , so conhecidas), ou seja, a1 (T 1) e
m (T ) (T 1)
ZT
a1 (T ) =
+ (1 ).a1 (T 1)
(
1
)
T
m (T )
Z
m (T ) (T ) = T + (1 ). m (T ) (T 1)
a1 (T )
(5.3.3)
(5.3.4)
Note que, nas equaes (5.3.3) e (5.3.4) so usadas duas constantes de amortecimento diferentes, uma
para o nvel e outra para o fator sazonal.
Alm disso, uma caracterstica importante da atualizao do fator sazonal : ele s muda quando
recebemos uma informao referente ao ms m(T). Por exemplo, o fator sazonal referente ao ms de
maio s atualizado quando recebemos uma informao relativa a este ms. Ou seja:
Em seguida, os fatores sazonais estimados so normalizados, de tal forma que a sua soma seja igual ao
perodo sazonal (S). Esta condio de normalizao vlida para fatores sazonais multiplicativos. No caso
de fatores aditivos, sua soma (para todos os meses) zero.
S
j =1
(T ) = S
(5.3.5)
necessrio fornecer estimativas iniciais do nvel e dos fatores sazonais. O procedimento de inicializao
descrito brevemente a seguir.
1 PASSO: Clculo das Mdias Anuais
Ano 1
Z1
Z2
...
ZS
Mdia do Ano 1
Ano 2
ZS+1
ZS+2
...
Z2S
Mdia do Ano 2
Ano J
.
ZJS -(S-1)
.
ZJS -(S-2)
...
...
.
ZJS
Mdia do Ano J
Z (1)
Z (2)
J = T/S
Z (J )
C1 =
Z1
Z (1)
...
...
CJS ( S 1) =
Z JS ( S 1)
Z(J)
...
...
CS =
ZS
Z (1)
...
CJS =
Z JS
Z(J)
24
O fator sazonal grosseiro para o ms i apenas a observao Zi dividida pela mdia do ano
correspondente. Este procedimento simples funciona bem desde que a srie no apresente componente de
tendncia, Do contrrio, se existe tendncia, as estimativas dos fatores sazonais encontradas por este
mtodo iro conter componentes de tendncia, e as previses resultantes sero prejudicadas.
Note que, neste passo, encontramos J (um para cada ano em que existem dados) fatores sazonais para
cada ms. No passo seguinte tomamos a mdia destes J fatores para obter um nico fator sazonal para o
ms i.
3 PASSO: Clculo dos fatores sazonais "suaves"
Os fatores sazonais para cada um dos meses so encontrados atravs da mdia dos fatores encontrados
no passo anterior, isto :
i (0) =
S
S
C
i =1
(5.3.6)
25
Neste caso precisamos estimar o nvel da srie (a1), sua taxa de crescimento (a2) e os fatores sazonais t
para todos os meses t. A atualizao de parmetros feita seqencialmente, pelo mtodo de HoltWinters descrito a seguir.
Suponha que no instante T-1 conhecemos as estimativas do nvel, taxa de crescimento e fatores sazonais
dadas por: a1 (T 1), a 2 (T 1) e j (T 1) . O procedimento de atualizao bem semelhante ao
apresentado antes (modelo com nvel constante e sazonalidade multiplicativa). A grande diferena em
relao ao modelo da seo 5.3.1. que agora temos mais uma quantidade a ser atualizada
seqencialmente, a taxa de crescimento a2.
ZT
a1 (T ) =
+ (1 )[a1 (T 1) + a 2 (T 1)]
m (T ) (T 1)
Note que, do lado direito da equao (5.3.7), o termo
(5.3.7)
ZT
representa a observao do instante T
m (T ) (T 1)
dessazonalizada.
Atualizao da tendncia
(5.3.8)
A equao de atualizao da tendncia exatamente igual do mtodo de Holt (usado para sries com
tendncia linear e sem sazonalidade), como indicado na expresso (5.2.19). Note que o termo
a1 (T ) a1 (T 1) a diferena entre os nveis estimados nos instantes T e T-1.
m* (T ) = T + (1 ) m (T ) (T 1)
a1 (T )
(5.3.9)
(5.3.10)
A atualizao dos fatores sazonais feita apenas no ms correspondente ao fator sazonal que se procura
estimar. Logo, pela equao (5.3.10) segue que o fator sazonal permanece fixo at recebermos a
informao relativa ao ms atual. Quando esta informao recebida (isto , quando o instante T
corresponde ao ms m(T)), o fator sazonal estimado atravs da expresso (5.3.9). Nesta equao nota-se
que o fator sazonal correspondente ao ms m(T) atualizado no instante T uma mdia ponderada da
estimativa feita no ano passado para o fator deste ms e tambm da observao sem o nvel (dada por
ZT
).
a1 (T )
26
* (T )
.S
j (T ) = S j
*
j (T )
j =1
O objetivo desta normalizao fazer com que os fatores sazonais encontrados pela equao (5.3.9)
tenham soma igual a S (perodo sazonal).
A previso k passos frente no instante T obtida substituindo-se os parmetros desconhecidos a1, a2 e
por suas estimativas, isto :
Z T + k (T ) = [a1 (T ) + k .a 2 (T )] m (T + k ) (T )
(5.3.11)
Inicializao do Mtodo
A exemplo do que fizemos na seo anterior, aqui encontramos estimativas iniciais para o nvel, taxa de
crescimento e fatores sazonais.
Sejam Z (1) , Z ( 2) ,...., Z ( J ) as mdias anuais, onde J o ltimo ano disponvel.
A estimativa inicial da taxa de crescimento :
Z ( J ) Z (1)
a 2 (0) =
(J 1)S
A estimativa inicial do nvel :
(S + 1) a (0)
a1 (0 ) = Z (1)
2
2
A estimativa inicial dos fatores sazonais :
t
Ct =
onde t = 1, 2, ...., JS e i o ano correspondente ao instante t.
S
1
+
(i ) 2
27
a1 (T ) = Z T m (T ) (T 1) + (1 )[a1 (T 1) + a 2 (T 1)]
(5.3.12)
representa a observao do
instante T dessazonalizada.
Atualizao da tendncia
(5.3.13)
m* (T ) = [Z T a1 (T )] + (1 ) m (T ) (T 1)
(5.3.14)
(5.3.15)
Note que, em (5.3.14), o termo Z T a1 (T ) uma medida da variao sazonal dos dados, obtida pela
diferena entre a observao atual e a estimativa mais recente do nvel.
Da equao (5.3.15) conclui-se que as estimativas de cada fator sazonal s so atualizadas uma vez a cada
ano, quando observamos o dado correspondente quele ms.
A previso 1 passo frente no instante T obtida substituindo-se os parmetros desconhecidos a1, a2 e
por suas estimativas, isto :
Z T +1 (T ) = [a1 (T ) + a 2 (T )] + m (T +1) (T )
(5.3.16)
importante lembrar que os fatores sazonais aditivos sofrem uma restrio diferente dos fatores
multiplicativos. No caso dos fatores aditivos, a sua soma (para todos os meses) zero.
Inicializao do mtodo
Montgomery e Johnson sugerem obter as estimativas iniciais dos parmetros atravs de um procedimento
de mnimos quadrados ordinrios, que permite a estimao simultnea dos S + 2 parmetros
desconhecidos.
28
Exemplo 5.3.1.
O prximo grfico exibe o nvel dos reservatrios (isto , a combinao das usinas hidroeltricas) na regio
Sudeste do Brasil entre Janeiro de 1989 e Agosto de 2001.
Nvel dos Reservatrios - Sudeste
100
90
80
70
60
50
40
30
20
10
ja
n
/8
9
ju
l/8
9
ja
n/
90
ju
l/9
0
ja
n/
91
ju
l/9
1
ja
n/
92
ju
l/9
2
ja
n/
93
ju
l/9
3
ja
n/
94
ju
l/9
4
ja
n/
95
ju
l/9
5
ja
n/
96
ju
l/9
6
ja
n/
97
ju
l/9
7
ja
n/
98
ju
l/9
8
ja
n/
99
ju
l/9
9
ja
n/
00
ju
l/0
0
ja
n/
01
ju
l/0
1
Valor
Final
25.109
-0.179
1.028
1.181
1.282
1.241
1.176
1.126
1.052
0.936
0.877
0.751
0.727
0.829
Este modelo foi ento ajustado at Dezembro de 2000 e as previses obtidas para o perodo entre Janeiro e
Agosto de 2001 para testar sua capacidade preditiva. A prxima tabela apresenta os valores reais e
ajustados no perodo, alm dos erros percentuais de previso.
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com
29
Limite
Erro de
Limite Inferior
Superior
previso
Data
do IC 95% Previso do IC 95% Valor Real (em %)
jan/01
24.3
48.9
-5.2
36.6
31.4
fev/01
27.4
59.0
-9.8
43.2
33.4
mar/01
28.1
65.1
-12.1
46.6
34.5
abr/01
24.6
63.7
-12.0
44.2
32.2
mai/01
20.7
61.2
-11.2
40.9
29.7
jun/01
17.2
59.0
-9.6
38.1
28.6
jul/01
13.7
56.3
-8.2
35.0
26.8
ago/01
9.4
52.3
-7.4
30.9
23.5
Os erros so bastante grandes, o que certamente conseqncia de uma mudana no padro de evoluo
dos reservatrios, que se torna ntida a partir de 2001. Note que, neste ltimo ano, a amplitude no nvel de
reservatrios bem menor que nos anos anteriores, indicando que no foi possvel recuperar o nvel dos
reservatrios com as chuvas de vero. Portanto, (pelo menos a posteriori) clara a necessidade de impor o
racionamento de energia (iniciado em Junho de 2001).
Se agora consideramos apenas as previses um passo frente, a capcidade preditiva do modelo
sensivelmente melhor, como indicado na prxima tabela. Os erros, especialmente nos meses de inverno,
so sensilvelmente reduzidos.
Previses um passo frente
Limite
Limite
Inferior do
Superior
IC 95% Previso do IC 95% Valor Real
Data
jan/01 24.3
48.9
36.6
31.4
fev/01 24.9
53.5
39.2
33.4
mar/01 23.3
53.9
38.6
34.5
abr/01 20.1
49.3
34.7
32.2
mai/01 17.5
44.8
31.1
29.7
jun/01 15.7
41.3
28.5
28.6
jul/01 14.5
38.2
26.4
26.8
ago/01 13.0
34.2
23.6
23.5
Erro de
previso
(em %)
-5.2
-5.8
-4.1
-2.5
-1.4
0.1
0.4
-0.1
30
A abreviao ARIMA em Ingls significa "Auto-Regressive Integrated Moving Average", ou seja, autoregressivo, integrado e mdias mveis. Os termos autoregressivos correspondem a defasagens da srie
transformada, e os termos mdias mveis ("moving averages") referem-se s defasagens dos erros
aleatrios. Finalmente, o termo "integrado" refere-se ao processo de diferenciar a srie original para torn-la
estacionria.
Modelos "Random Walk" (passeio aleatrio), autoregressivos e de amortecimento exponencial so apenas
casos particulares de modelos ARIMA.
Uma srie temporal {Z1, Z2, ..., ZT} pode ser encarada como uma realizao de um processo estocstico.
Para descrevermos completamente um processo estocstico precisamos especificar a distribuio conjunta
do vetor {Z1, Z2, ..., ZT}. Suponha que os Zt s so conjuntamente Gaussianos. Ento, para conhecer a sua
distribuio conjunta, basta especificar o vetor de mdias {1, 2, ...., T} e a matriz de varincia-covarincia
. Mas, uma matriz simtrica de dimenso T, e contm T(T+1)/2 elementos diferentes. Logo, a completa
especificao deste processo requer o conhecimento de T + T(T+1)/2 parmetros. Podemos perceber
claramente que inferir sobre todos estes parmetros com base em apenas uma realizao do processo
uma tarefa impossvel, e portanto algumas simplificaes devem ser feitas. A hiptese simplificadora mais
comum estacionariedade.
Dizemos que um processo estocstico estacionrio se ele atingiu o equilbrio. Em termos formais, num
processo estacionrio, a distribuio de probabilidade conjunta nos instantes t1, t2, ...., tm a mesma que a
distribuio nos instantes t1 +k, t2 + k, ...., tm + k para qualquer k, ou seja, um descolamento de k unidades
de tempo no afeta a distribuio de probabilidade conjunta. Note que, nesta definio, m arbitrrio. Se
tomarmos m = 1 acima, segue que, num processo estacionrio, a distribuio marginal de Zt a mesma que
a distribuio marginal de Zt+k. Logo, a distribuio marginal de Zt no depende do instante de tempo
escolhido e, em particular, a mdia e varincia de Zt so constantes para qualquer t. Analogamente, se m =
2, as distribuies de probabilidade bivariadas p(Zt, Zt+k) no dependem de t, e ento a covarincia entre Zt
e Zt+k depende apenas do lag k.
Em resumo, a condio de estacionariedade implica em:
Mdia do processo constante;
Varincia do processo constante;
Covarincia entre Zt e Zt+k depende apenas do lag k.
Um processo dito fracamente estacionrio (ou estacionrio de 2a. Ordem) se estas trs condies so
satisfeitas. Note que estas condies referem-se apenas aos dois primeiros momentos da distribuio de
probabilidade dos Zts, o que explica a terminologia processo estacionrio de 2a. ordem" . A definio de
estacionariedade mais geral envolve momentos de todas as ordens (m arbitrrio na definio) e muito
mais complicada de verificar que a estacionariedade de segunda ordem. Se os Zt s so conjuntamente
Gaussianos, as duas condies (estacionariedade estrita e estacionariedade de 2a. ordem) so
equivalentes.
Algumas das definies a seguir j foram apresentadas no captulo 2, e esto novamente aqui apenas para
relembrar o leitor!
Definio 5.4.1. (Autocovarincia de lag k)
A autocovarincia de lag k definida como a covarincia entre Zt e Zt+k isto :
k = Cov(Zt , Zt+k) = E[(Zt - )(Zt+k - )] para k = 0, 1,2, ....
(5.4.1)
31
Note que 0 = Var(Zt) = 2 pois Cov(Zt, Zt) = Var(Zt).
A autocovarincia uma das funes usadas na identificao da estrutura de um modelo ARIMA.
k =
Cov (Z t , Z t + k ) k
= 2 para k = 0, 1,2, ....
Var (Z t )
(5.4.2)
k = -k , e portanto basta
ck =
1 T -k
(Z t Z ).(Z t + k Z z )
T t =1
(5.4.3)
c0 =
1 T
(Z t Z ) 2
T t =1
c
rk = k =
c0
(Z
Z ).( Z t + k Z )
t =1
(5.4.4)
(Z
Z)
t =1
32
Frmula de Bartlett
Sob a hiptese k = 0 para todo lag k > U (onde U indica um lag grande) segue que:
cov(rk , rk s )
1 U
i iS
T i = U + s
Valores sucessivos de rk podem exibir altas correlaes e portanto as autocorrelaes estimadas podem
levar a concluses errneas.
Fazendo s = 0 na equao anterior leva a:
Var (rk )
1 U 2
i
T i = U
Para T grande e sob a hiptese k = 0, a distribuio de rk aproximadamente Normal com mdia zero e
varincia
1 U 2
i . Na prtica substitui-se as correlaes (desconhecidas) na expresso acima por seus
T i = U
estimadores rk e ento:
Var (rk )
U
1
1 + 2 ri 2
T
i =1
Esta frmula ser usada para obter intervalos de confiana para rk. Tambm, se o tamanho (T) da srie
grande, rk aproximadamente Normal com mdia zero, e os intervalos de confiana podem ser construdos
a partir desta distribuio.
ARIMA(0,1,0)
ARIMA(1,1,0)
ARIMA(0,1,1) sem termo constante
ARIMA(0,1,1) com termo constante
Seja {a1, a2, ..., aT} uma seqncia de variveis independentes e identicamente distribudas com mdia zero
e varincia constante, isto , os ats so um rudo branco. Considere uma outra seqncia {w1, w2, ..., wT},
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com
33
que representa um processo estocstico estacionrio. Note que os ws exibem dependncia serial. A Teoria
Geral de Sistemas nos permite gerar a seqncia dos ws a partir de uma combinao linear infinita de
rudos brancos. Esquematicamente temos:
Rudo Branco
at
Modelo
Linear
Ou seja,
wt = at - 1 at-1 - 2 at-2 - ....
Proc.
Estacionrio
wt
(memria infinita)
(5.4.5)
A prxima definio nos permite escrever de maneira conveniente os polinmios que aparecem na
modelagem ARIMA de Box e Jenkins.
Definio 5.4.5. (Operador de atraso, backward shift operator )
O operador de atraso B definido como: B.wt = wt-1. Tambm, suas potncias so dadas por:
Bk wt = wt-k .
Logo, a expresso (5.4.5) pode ser reescrita em termos de um polinmio infinito envolvendo o operador de
atraso como:
wt = at 1 at B 2 at B 2 ....
wt = (1 - 1 B - 2 B 2 ...) a t = ( B)at
A expresso anterior pode ser invertida, e a seqncia {at} pode ser expressa em termos dos wt s como:
w t = ( B ) a t a t = ( B ) 1 w t
1
424
3
( B)
(5.4.6)
34
(B ) = { (B )}1 =
1
= 1 + .B + 2 .B 2 + 3 .B 3 + ......
1 .B
Box e Jenkins propem escrever (B) como a razo de dois polinmios em B, ou seja:
(B )
(B ) =
(5.4.7)
(B )
Onde:
(B) = 1 - 1B - 2B2 ....-qBq um polinmio de grau q, chamado de Polinmio MA(q), e
(B) = 1 - 1B - 2B2 ....-pBp denominado polinmio AR(p).
Substituindo (5.4.7) em (5.4.5) leva a:
wt = (B ).a t =
(B )
.a t (B ).a t = (B ).wt
(B )
Isto :
(B ).wt = (B ).at
(5.4.8)
O modelo (5.4.8) chamado de ARMA(p,q). Note que o parmetro p indica a ordem do polinmio (B)
(polinmio AR), enquanto q o grau do polinmio (B) (polinmio MA).
(5.4.9)
wt = (B ).at wt = 1 1 .B 2 .B 2 .... q .B q at
wt = at + 1 .at 1 + 2 .at 2 + .... + q .at q
(5.4.10)
35
Exemplo 5.4.9. (Modelo ARMA(1,1))
Nesta caso p = q = 1 na equao (5.4.8) e o modelo :
(1 - 1B)wt = (1- 1B)at e ento:
wt - 1wt-1 = at - 1at-1
Ou seja:
wt = 1wt-1 + at - 1at-1
Exemplo 5.4.10. (Modelo ARMA(2,2))
A equao do modelo :
(1 - 1B - 2B2)wt = (1- 1B - 2B2)at e ento:
wt - 1wt-1 - 2wt-2 = at - 1at-1 - 2at-2
Ou seja:
wt = 1wt-1 - 2wt-2 + at - 1at-1 - 2at-2
Condies de Estacionariedade e Inversibilidade dos modelos ARMA(p,q)
Num processo ARMA(p,q) como o da equao (5.4.8) precisamos verificar quais as condies a serem
impostas sobre os coeficientes i's (ou i's, i's e i's) para garantir a estacionariedade e a inversibilidade do
processo wt.
Existem dois tipos de condies de interesse:
1) Condio de estacionariedade
2) Condio de inversibilidade
Examinaremos inicialmente a condio de estacionariedade.
Se a entrada de um filtro linear como (5.4.5) um rudo branco (que sempre estacionrio) ento a sada
do filtro (wt) s pode ser no estacionria se houver alguma instabilidade no comportamento do filtro. Isso
nos permite encontrar as restries necessrias sobre os parmetros do filtro (isto , as condies que
devem ser aplicadas aos i s e j s) para garantir a estacionariedade da srie de sada wt.
Pode-se mostrar que se wt = (B)at ento a funo de autocovarincia do processo {wt} :
k = Cov(wt , wt-k) =
2 j . j k
j =0
j =0
<
i =1
36
Logo, a varincia do processo de sada no vai convergir para uma constante se os pesos 0, 1, ... no
for infinita.
i =1
Isso implica na necessidade de restringir os pesos i para que o filtro seja estvel e, conseqentemente, o
processo de sada seja estacionrio.
.B
j =0
converge se |B| 1.
Ou seja:
A idia de inversibilidade est relacionada com a possibilidade de escrevermos a srie de rudo branco
como sada de um filtro linear cuja entrada a srie estacionria {wt}. Em linhas gerais, o processo {wt}
inversvel se podemos escrever a expresso (5.4.6), isto , se:
a t = ( B) 1 wt
1
424
3
( B)
a t = (B ).wt
onde (B) = 1 - 1 B - 2 B2 .....
Note que (B) = -1(B) e ento os coeficientes I s podem ser encontrados a partir dos Is e vice versa. A
condio de inversibilidade aplicada aos coeficientes I, e totalmente independente da condio de
estacionariedade.
i =0
do crculo unitrio. Note que a condio de inversibilidade anloga condio de estacionariedade, mas a
primeira aplicada ao polinmio (B), enquanto a segunda refere-se ao polinmio (B).
A seguir examinaremos as condies de estacionariedade e inversibilidade para processos ARMA escritos
na forma (5.4.8), ou seja:
wt = (B ).a t =
(B )
.a t (B ).a t = (B ).wt
(B )
(B ) =
(B )
= (B ). 1 (B )
(B )
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com
37
Exemplo 5.4.11. (Estacionariedade dos modelos AR(1))
Considere o modelo AR(1) dado por:
wt =
1
1
.a t
.a t =
(B )
1 1 .B
Neste caso (B ) =
1
1 1 .B
= 1 + 1 .B + ( 1 .B ) + .....
2
(5.4.11)
Para garantir a estacionariedade do processo precisamos que (B) convirja para |B| 1. Mas, por (5.4.11),
esta srie converge apenas quando | 1 | < 1. Como a raiz (B ) = 1 1 .B B = 1/1, segue que | 1 | < 1
implica numa raiz deste polinmio situada fora do crculo unitrio.
Logo, a condio raiz de (B) dentro do crculo unitrio equivalente condio raiz de (B) fora do
crculo unitrio, e assim, a estacionariedade estar garantida se a raiz do polinmio (B) = 1 - 1.B estiver
for a do crculo, ou seja, se | 1 | < 1.
Exemplo 5.4.12. (Estacionariedade dos processos AR(p))
Considere um processo AR(p) dado pela equao:
wt =
1
1
.a t
.a t =
(B )
1 1 .B 2 .B 2 ... p .B p
(B ) = (1 G1 .B )(1 G 2 .B )....(1 G p .B )
onde 1/G1, 1/G2, ..., 1/Gp so as razes de (B) = 0.
Se expandirmos 1/(B) em fraes parciais obtemos:
o
ki
1
wt =
.a t =
.a t
(B )
i =1 1 G i .B
Para garantir a estacionariedade do processo {wt} precisamos que o polinmio (B) = -1 (B) convirja
quando | B| 1, o que implica em:
| Gi | < 1, isto , | 1/Gi | > 1 para i = 1, 2, ...p, isto , as razes de (B) = 0 esto fora do crculo unitrio.
Em resumo:
Um processo AR(p) estacionrio se as razes do polinmio (B) = 0 esto fora do crculo unitrio.
38
Exemplo 5.4.13. (Estacionariedade dos processos AR(2))
O processo AR(2) pode ser escrito como:
wt =
1
1
.a t
.a t =
(B )
1 1 .B 2 .B 2
2 + 1 < 1
2 1 < 1
1< 2 <1
-1
2
Razes reais
Razes
Complexas
+1
-2
+2
Processo
wt = 0.7wt-1 + 0.4wt-2+at
wt = 0.7wt-1 + 0.2wt-2+at
wt = -0.4wt-1 + 0.8wt-2+at
wt = +0.4wt-1 + 0.8wt-2+at
wt = 0.8wt-1 - 0.4wt-2+at
1
+0.7
+0.7
-0.4
+0.4
+0.8
2
+0.4
+0.2
+0.8
+0.8
-0.4
Estacionrio?
No
Sim
No
No
Sim
39
Exemplo 5.4.15. (Estacionariedade dos processos MA(q))
Considere um processo MA(q) dado por:
wt = (B ).at wt = 1 1 .B 2 .B 2 .... q .B q at
wt = at + 1 .at 1 + 2 .at 2 + .... + q .at q
Neste caso (B) = (B) um polinmio finito de grau q, e portanto a convergncia trivial.
(B ).wt = (B ).at
Podemos representar este processo esquematicamente como:
at
(B)
-1(B)
Rudo
branco
wt
Processo
Estacionrio
(B ).wt = at
(5.4.12)
Note que, nesta equao o rudo escrito explicitamente como funo da srie estacionria wt e portanto
(5.4.12) j define um processo inversvel. Tambm, o polinmio AR tem grau finito e assim segue que um
processo AR(p) trivialmente inversvel.
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com
40
Neste caso,
at =
1
1 .B
wt
(1 + .B +
=
.B 2 + ... + k .B k
wt
1 k +1 .B k +1
2
(5.4.13)
MA(q) = AR() e
AR(p) = MA()
Note que a condio de inversibilidade , neste caso | | < 1 e equivale condio: raiz de (B) = (1-.B) =
0 fora do crculo unitrio.
Exemplo 5.4.19. (Inversibilidade de um modelo MA(2))
A condio de inversibilidade de um modelo MA(2) completamente anloga condio de
estacionariedade de um processo AR(2). Para garantir a inversibilidade, precisamos que a seguinte
condio seja satisfeita: razes de (B) = 0 fora do crculo unitrio. Em termos dos coeficientes que
definem o processo estas condies podem ser escritas como:
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com
41
2 + 1 < 1
2 - 1 < 1
-1 < 2 < 1
E a regio de inversibilidade do processo indicada na figura a seguir.
-1
2
Razes reais
Razes
Complexas
+1
-2
+2
Estacionariedade: |1 | < 1
Inversibilidade: |1 | < 1
42
1
+1
-1
+1
0
-1
E[ wt + k .wt + k j ] = k1 .E[ wt + k 1 .wt + k j ] + k 2 .E[ wt + k 2 .wt + k j ] + ... + kk .E[ wt .wt + k j ] + E[et + k .wt + k j ]
Fazendo j = 1, 2, ..., k e levando em conta que k = -k obtemos o seguinte sistema de k equaes com k
incgnitas (k1 , k2 , ..., kk):
o 1 .... k 1 k1 1
1 o .... k 2 k 2 2
. = .
. .
.
.
. .
. .
k 1 k 2 .... o kk k
(5.4.14)
43
As equaes (5.4.14) so conhecidas como equaes de Yule-Walker. Elas fornecem um algoritmo
simples para determinar a ordem de um processo AR. Na prtica, os j s na equao acima so
substitudos por seus estimadores rj.
A resoluo do sistema (5.4.14) para todo k fornece as autocorrelaes parciais de lag 1, 2, .... Pela regra
de Cramer aplicada ao sistema anterior temos:
kk
1 2 .....
1
2 .....
1
det 1
.....
k -1 k - 2 k -3 ....
=
1 2 .....
1
2 .....
1
det 1
.....
k -1 k - 2 k -3 ....
1
2
k
k 1
k -1
(5.4.15)
Ou seja, a matriz no numerador em (5.4.15) a mesma que a matriz no denominador, exceto pela ltima
coluna, que substituda por [ 1, 2, ..., k]t.
Em particular, 11 = 1 sempre, e
22
1
det
1
=
1
det
1
1
2 2 12
=
1 1 12
1
Pode-se provar que, num processo AR(p), as autocorrelaes parciais so nulas para todos os lags
maiores que p. Logo, o grfico da PACF nos permite identificar o grau do polinmio AR, pois a partir
de um certo lag todas as autocorrelaes parciais so nulas. Por exemplo, veja Box, Jenkins e
Reinsel (1994), pgina 66.
Exemplo 5.4.23. Comportamento da ACF e PACF para o modelo AR(p)
Considere um modelo AR(p), cuja equao :
(1 - 1 B - 2 B2 - ... - p Bp ).wt = at
Isto :
wt = 1wt-1 + 2wt-2 +...+ pwt-p + at
Multiplicando por wt-k e tirando o valor esperado, lembrando que E(wt .wt-k) = k , obtm-se:
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com
44
E(wt . wt-k ) = 1 . E(wt-1 . wt-k ) + 2 . E(wt-2 . wt-k ) + ... + p . E(wt-p . wt-k ) + E(at . wt-k)
k = 1 k-1 + 2 k-2 + ... + p k-p
Como k = k / 0 , obtm-se finalmente:
k = 1 k-1 + 2 k-2 + p k-p
Ou seja, as autocorrelaes de um processo AR(p) satisfazem a equao: (B).k = 0.
A ACF do modelo AR(p) obtida por uma equao de diferenas de ordem p, cuja soluo formada por
uma mistura de exponenciais e/ou senides amortecidas.
Em resumo:
para um AR(p) tem-se:
ACF:
22
1 1
det
2
2
2
1 2 = 2 1 = 1 1 = 0
=
1 1
1 12
1 12
det
1 1
e kk = 0 para k = 3, 4, 5, ....
Os grficos da ACFe PACF tericas so mostrado a seguir.
45
ou
k = 1k
A PACF s diferente de zero no lag 1, e exibe um corte brusco aps este lag. Logo, num processo AR(1)
apenas a primeira autocorrelao parcial no nula, e o grfico da PACF versus o lag exibe um corte
brusco.
Resultado 5.4.25. (Intervalo de Confiana para a PACF Frmula de Quenouille)
Seja kk o estimador da autocorrelao parcial de lag k, encontrado pela substituio dos i pelos seus
estimadores ri nas equaes de Yule-Walker.
Ento:
( )
1
onde T o tamanho da srie.
T
Para T grande, tem aproximadamente a distribuio Normal.
Var kk
kk
46
k =
( k + 1 k +1 + ... + q k q )
(1 + 12 + ... + q ) 2
k = 1,2,..., q e
k = 0 se k > q
Ou seja, num processo MA(q) a ACF tem um corte brusco a partir do lag q+1.
Pela propriedade de inversibilidade, um modelo MA(q) equivale a um AR() e ento a regresso de wt+k
nos ws anteriores (que usada para definir a PACF) indica que kk no possuir a propriedade de corte
brusco; decaindo com k.
Em resumo:
Num modelo MA(q) tem-se:
ACF: apresenta um corte brusco no lag k = q
PACF: tem o comportamento de exponenciais e/ou senides amortecidas, e ento no apresenta corte
brusco.
A k-sima autocorrelao parcial (vide Box, Jenkins e Reinsel (1994), pgina 73):
k 1 2
kk = 1 2 k + 21
1 1
)
)
Como kk < 1k , a funo de autocorrelao parcial dominada por uma exponencial amortecida. Se 1 for
positivo (e ento 1 negativo), as PACFs tm sinais alternantes. Ao contrrio, se 1 for positivo, as
autocorrelaes parciais so todas negativas.
Existe uma dualidade no comportamento das funes ACF e PACF para os modelos AR(p) e MA(q),
ou seja, o aspecto da PACF de um processo AR tem um corte brusco (assim como a ACF de um MA),
e a ACF de um AR tem a cara da PACF de um MA (senides amortecidas e/ou decrscimo
exponencial).
47
Exemplo 5.4.28. (Modelo ARMA(p,q))
A estrutura do modelo :
(B ).wt = (B ).a t
Box, Jenkins e Reinsel (1994, pgina 79) mostram que a funo de autocorrelao tem a forma:
(5.4.16)
a2
( k 0 + k +1 1 + .... + q q k ) para k = 0, 1,... q
0
0 = 1 1 + 2 2 + .... + p p + a2 (1 1 1 .... q q )
Esta expresso precisa ser resolvida em conjunto com as equaes (5.4.16) para k = 1, 2, ...p para obter 0,
1, ...., p.
A funo de autocorrelao parcial infinita, e eventualmente se comporta como a PACF de um processo
MA puro, sendo dominada por uma mistura de exponenciais amortecidas e/ou senides, dependendo da
ordem do polinmio MA e de seus parmetros.
Exemplo 5.4.29. (Processo ARMA(1,1))
A estrutura do modelo :
(1- 1.B).wt = (1-1.B).at
A funo de autocorrelao encontrada pelas equaes:
0 = Var (wt ) = 1 . 1 + a2 (1 1 . 1 )
1 = 1 . 0 a2 ( 1 )
2 = 1 . k 1 para k = 2, 3, 4, .....
onde 1 = 1 - 1
Se resolvermos as duas primeiras equaes para 0 e 1, a funo de autocovarincia do processo torna-se:
0 =
1 + 12 21 1 2
a
1 12
(5.4.17)
48
1 =
(1 1 1 )(1 1 )
1
k = 1 . k 1
2
1
a2
(5.4.18)
para k = 2, 3, 4...
(5.4.19)
2 = 1 . 1
segue que
k = 1k 1 . 1
k = 1 . k 1
e como
exponencialmente a partir do valor inicial 1 que, por sua vez, depende dos parmetros 1 e 1 .
A primeira autocorrelao do processo pode ser escrita como:
1 =
(1 1 1 )(1 1 )
1 21 . 1 + 12
A funo de autocorrelao parcial de um processo ARMA(1,1) consiste num nico valor inicial 11 = 1 e a
partir do lag 2 comporta-se como a PACF de um processo MA(1), sendo dominada por uma exponencial.
A seguir exibimos um quadro resumo contendo as principais caractersticas dos modelos AR, MA e ARMA.
Quadro resumo das caractersticas principais dos modelos AR(p), MA(q) e ARMA(p,q)
AR(p)
MA(q)
ARMA(p,q)
Estrutura do modelo
(B)Zt = at
Zt = (B).at
(B)Zt = (B).at
Condio de
estacionariedade
Razes de
(B) = 0 fora do
crculo unitrio
Sempre Estacionrio
Razes de
(B) = 0 fora do
crculo unitrio
Condio de
inversibilidade
Sempre inversvel
Razes de
(B) = 0 fora do
crculo unitrio
Razes de
(B) = 0 fora do
crculo unitrio
Funo de
Autocorrelao
k
Infinita (Exponenciais
e/ou senides
amortecidas)
Infinita (Exponenciais
e/ou senides
amortecidas aps o
lag "q-p")
Funo de
Autocorrelao
Parcial kk
Infinita (Exponenciais
e/ou senides
amortecidas)
Infinita (Exponenciais
e/ou senides
amortecidas aps o
lag "p-q")
49
PACF
PACF
50
Exemplo 5.4.31.
.31. (Processo AR(1) com 1 = - 0.8)
Geramos duas sries que seguem processos AR(1) com parmetro 1 = - 0.8. A primeira srie tem 50
observaes, e a segunda, 300 observaes. A ACF e PACF estimadas para as duas sries esto no
prximo quadro.
PACF
PACF
51
Exemplo 5.4.32. (Processo MA (1) com 1 = +0.8)
Geramos duas sries que seguem processos MA(1) com parmetro 1 = +0.8. A primeira srie tem 50
observaes, e a segunda, 300 observaes. A ACF e PACF estimadas para as duas sries esto no
prximo quadro.
PACF
PACF
52
Exemplo 5.4.33. (Processo MA (1) com 1 = - 0.8)
Geramos duas sries que seguem processos MA(1) com parmetro 1 = - 0.8. A primeira srie tem 50
observaes, e a segunda, 300 observaes. A ACF e PACF estimadas para as duas sries esto no
prximo quadro.
PACF
PACF
Note que o sinal da autocorrelao parcial de lag 1 no modelo MA(1) o oposto do sinal do coeficiente 1,
ou seja, se o parmetro 1 positivo (negativo), a autocorrelao parcial de lag 1 negativa(positiva).
53
Exemplo 5.4.34. (Modelo AR(2) com 1 = +0.3 e 2 = +0.5 )
A seguir exibimos o grfico da ACF e PACF estimadas (a partir de uma srie de tamanho 300) de um
processo AR(2) estacionrio com 1 = +0.3 e 2 = +0.5. Note que as autocorrelaes decrescem
exponencialmente e as autocorrelaes parciais so diferentes de zero apenas nos dois primeiros lags.
300 observaes de um processo AR(2) com 1 = +0.3
e 2 = +0.5
ACF
PACF
PACF
54
Exemplo 5.4.36. (Modelo MA(2) com 1 = +0.3 e 2 = +0.5)
A seguir exibimos o grfico da ACF e PACF estimadas (a partir de uma srie de tamanho 300) de um
processo MA(2) com 1 = +0.3 e 2 = +0.5.
300 observaes de um processo MA(2) com
+0.3 e 2 = +0.5
ACF
1 =
PACF
PACF
Note a significncia das duas primeiras autocorrelaes e o decrscimo das PACFs (com alternncia de
sinais).
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com
55
Exemplo 5.4.38. (Modelo ARMA(1,1) com 1 = +0.7 e 1 = +0.4)
300 observaes de um processo ARMA(1,1) com 1
= +0.7 e 1 = +0.4
ACF
PACF
PACF
56
Exemplo 5.4.40. (Modelo ARMA(1,1) com 1 = -0.7 e 1 = -0.4)
300 observaes de um processo ARMA(1,1) com 1 =
-0.7 e 1 = -0.4
ACF
PACF
PACF
Modelos ARIMA(p,d,q)
Na prtica estaremos freqentemente interessados em modelar sries no estacionrias na mdia, isto ,
sries que exibem uma tendncia. A metodologia ARMA pode ser estendida para lidar com certo tipo de
57
sries no estacionrias, conhecidas na literatura como "NO-ESTACIONRIA HOMOGNEA", conforme
ilustrado a seguir:
Uma srie no estacionria homognea pode se tornar estacionria atravs da aplicao de diferenas
sucessivas, como definido a seguir.
Definio 5.4.42. (Operador Diferena)
Seja Zt uma srie qualquer. O operador diferena aplicado a esta srie : Zt = (1-B) Zt = Zt - Zt-1.
A srie diferenciada wt = Zt - Zt-1. = (1-B) conhecido como operador diferena.
Se wt ainda no estacionrio, tenta-se uma outra diferena:
Yt
= wt - wt-1
= (1 - B)wt = (1 - B)2 Zt = 2 Zt
Em geral, deve-se aplicar tantas diferenas quanto necessrio at produzir uma srie estacionria na mdia
(isto , com nvel constante). Genericamente, a srie wt estacionria obtida pela aplicao de "d" (d = 0, 1,
2, ...) diferenas na srie original:
wt = d Zt
Em seguida, modela-se a srie estacionria wt usando a modelagem ARMA(p,q) j estudada. Neste caso
diz-se que a srie original (no estacionria) Zt segue um modelo ARIMA(p,d,q). ARIMA, em ingls,
significa Autoregressive Integrated Moving Average e o termo Integrated refere-se s d diferenas
necessrias para tornar a srie original estacionria. O parmetro d na notao ARIMA(p,d,q) indica o grau
de diferenciao da srie original e p, q so, como sempre, os graus dos polinmios AR e MA
respectivamente.
Exemplo 5.4.43. Modelo ARIMA(0,1,0)
Neste caso, p = q = 0 e d = 1 e a estrutura do modelo :
Z t = a t Z t Z t 1 = a t Z t = Z t 1 + a t
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com
58
Random Walk
ACF
59
PACF
Z t = (1 1 B )a t Z t Z t 1 = a t 1 .a t 1 Z t = Z t 1 + a t 1 .a t 1
A seguir exibimos uma srie simulada a partir deste modelo (com 1 = 0.8), e sua ACF e PACF (antes e
depois da diferenciao).
Srie Original
6
Legend
ARI_011
-2
10
15
20
25
60
ACF e PACF da srie original
_DIFF
-1
-2
-3
10
15
20
25
61
ACF e PACF da srie diferenciada
62
Exemplo 5.4.45. (Modelo ARIMA(1,1,0))
Neste caso, p = d = 1 e q = 0 e a estrutura do modelo :
(1 1 B)(1 B) Z t = a t
1424
3
wt
ARI_110
80
60
40
20
-20
10
15
20
25
63
Grfico da srie diferenciada
-2
-4
10
15
20
25
64
(1 1 B)(1 B) Z t = (1 1 B)a t
1424
3
wt
Notas:
A aplicao do operador diferena d vezes (i.e. d ) equivale a considerar "d" zeros no crculo unitrio na
parte AR do modelo, j que = 1 B.
Uma extenso dos modelos ARIMA tradicionais consiste em considerar d como fracionrio (por exemplo, d
= 0.5 ; 0.2 ; - 0.3, etc..), o que d origem aos modelos conhecidos como "fracionais" ou de "memria
longa".
Deve-se notar que d = (1-B)d diferente de (1-Bd) = Zt Zt-d.
O diagrama a seguir exibe os passos necessrios para o ajuste de modelos ARIMA de Box e Jenkins.
65
METODOLOGIA BOX & JENKINS
Fluxograma Operacional
Zt
d
Identificao do
Modelo
p,q
's , 's , a 2
O modelo
adequado
Estimao
Paramtrica
Testes
Estatsticos
Previses
Futuras Z t (j)
Previso Final
66
Srie Original
3000
2500
2000
1500
1000
500
10
15
20
25
67
Grfico da Primeira Diferena da Srie
15
10
10
15
20
25
Note que as autocorrelaes ainda permanecem muito grandes em lags altos, e portando uma nova
diferenciao da srie necessria.
68
-1
-2
10
15
20
25
Ateno: no grfico anterior, as autocorrelaes da srie de 2as. diferenas so todas zero, pois (por
construo) a srie de 2as. diferenas era apenas um rudo branco. Isso no necessariamente
verdade no caso geral, isto , geralmente sobram autocorrelaes e autocorrelaes parciais no
nulas na srie aps d diferenas; o que justificar o ajuste de um modelo ARMA a esta srie
diferenciada d vezes.
69
d Z
~
70
(ii) Identificao de "p" e "q"
Feita atravs da comparao dos estimadores da ACF e PACF com os correspondentes padres tericos.
Na prtica, raramente necessrio ajustar modelos com p e q maiores que 2. Note que, num modelo
ARMA(p,q) existem p + q + 1 parmetros desconhecidos (os is, os js e a varincia do erro, a2).
Passo 2 Estimao dos parmetros do modelo
Aps a identificao do nmero de diferenas (d) e dos graus dos polinmios AR e MA (p e q,
respectivamente), estima-se os parmetros. Atualmente esta etapa no causa grande preocupao ao
usurio comum, pois feita automaticamente pelos softwares especializados em sries temporais.
Suponha que a ordem (p, d, q) de um modelo ARIMA j foi identificada, isto , j sabemos qual o grau de
diferenciao (d) e os graus dos polinmios AR e MA. O prximo passo estimar os parmetros
desconhecidos do modelo, isto , encontrar os i s e j s.
Na estimao dos parmetros desconhecidos procuramos minimizar a soma do quadrado dos erros, ou
seja, no caso de uma ARIMA(p,d,q) buscamos minimizar: S ( ) =
a
t =1
2
t
onde a t =
( B). ( B). d Z t
Por causa das defasagens presentes nos polinmios (B) e (B) freqentemente impossvel calcular a
soma do quadrado dos erros como descrita acima, pois ela dependeria de observaes inexistentes (Z0 , Z1 , Z-2 , ...) . Box e Jenkins sugerem um procedimento conhecido como backforecasting, que gera
previses para estes valores iniciais desconhecidos. Se supormos a normalidade dos erros podemos
escrever a funo de verossimilhana sem muita dificuldade, e podemos proceder estimao dos
parmetros por mxima verossimilhana. Os resultados obtidos pela aplicao deste mtodo so
equivalentes aos encontrados pela minimizao da soma do quadrado dos erros. A estimao por mxima
verossimilhana possui uma grande vantagem: a distribuio assinttica (quando T tende a infinito) dos
estimadores conhecida e pode-se encontrar facilmente o erro padro destes estimadores, o que permite
estabelecer a significncia dos parmetros.
Existem diferentes mtodos para a estimao dos parmetros do modelo, e em geral todos produzem
estimativas semelhantes, mas podem existir diferenas quanto eficincia de cada mtodo de estimao.
De maneira geral, durante a etapa de estimao de parmetros usa-se algum algoritmo para minimizao
(ou maximizao). Alguns dos possveis mtodos so: mxima verossimilhana aproximada, mxima
verossimilhana aproximada com backforecasting e mxima verossimilhana exata. O primeiro destes o
mais rpido, e deve ser usado em sries muito longas (com mais de 30000 observaes). O mtodo de
mxima verossimilhana exata no eficiente para modelos sazonais quando o perodo sazonal grande
(por exemplo, dados dirios). De maneira geral os mtodos aproximados servem pelo menos para produzir
estimativas iniciais dos parmetros de interesse e, em seguida, pode-se refinar estas estimativas atravs do
mtodo de mxima verossimilhana exata. As estimativas dos parmetros so acompanhadas de seus
erros padro assintticos, o que nos permite acessar a significncia dos parmetros estimados.
71
Testes de Sobrefixao
A idia por trs dos testes de sobrefixao ajustar um modelo maior (aumentando os graus dos
polinmios AR e MA) para verificar se os parmetros extras so significantes. Por exemplo, se o modelo
identificado um MA(1) (ARIMA(0,0,1)) pode-se testar os modelos MA(2) e ARMA(1,1) e verificar se a
incluso dos novos parmetros resultou em algum ganho adicional.
72
k
Q = T (T + 2).
i =1
i( a )
(T i )
onde T o tamanho da srie. A regra de deciso deste teste : se o valor da estatstica Q for grande rejeitase a hiptese de que as k primeiras autocorrelaes dos resduos sejam nulas. Mas, o quo grande Q deve
ser? Deve-se compar-lo aos pontos percentuais de uma varivel Qui-Quadrado com k (p+q+1) graus de
liberdade, onde k o nmero de autocorrelaes sendo testadas e p e q so os graus dos polinmios AR e
MA respectivamente.
Quantas autocorrelaes devem ser testadas em conjunto, isto , qual o valor de k? Uma escolha usual
fazer k aproximadamente igual a
( ( ))
( ( ))
BIC = T . log a2
z2
2 1
a
m
T
m
73
( ( ))
Exemplo 5.4.48.
Considere novamente a srie de consumo anual de energia eltrica (classe comercial) do Exemplo 5.2.5. .
Iremos ajustar um modelo da classe ARIMA a esta srie, e comparar as previses obtidas com as
encontradas pelo modelo de Holt.
A autocorrelao e PACF da srie original so:
74
Nitidamente foram necessrias duas diferenas da srie original para torn-la estacionria, pois aps uma
nica diferenciao a autocorrelao ainda decaa de forma muito lenta. Logo, deve-se partir de um modelo
ARIMA com d = 2, e resta agora identificar p e q, as ordens dos polinmios AR e MA respectivamente.
O grfico da autocorrelao parcial (da srie duplamente diferenciada) sugere que a ordem p =1 deve ser
apropriada. Testamos as estruturas ARIMA(1,2,0) e ARIMA(1,2,1) (teste de sobrefixao) e nesta ltima o
coeficiente do termo MA no foi significante, portanto a estrutura escolhida a ARIMA (1,2,0), com as
caractersticas mostradas a seguir.
Termo
AR(1)
Coeficiente
-0.366
Erro Padro
0.160
Estatstica t
-2.287
Significncia
97.1%
Ano
1999
2000
2001
2002
Limite
Inferior
Previso
(2.5%)
44,277
47,042
49,605
52,053
Previso
45,066
48,553
52,029
55,508
Limite
Erro
Superior
Percentual
Previso
Absoluto de
(97.5%) Valor Real
Previso
45,855
3.4%
43,583
50,065
2.5%
47,365
54,452
58,963
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com
75
As previses so bastante semelhantes s produzidas pelo mtodo de Holt, mas os intervalos de confiana
so mais estreitos que os do exemplo 5.2.5.
Passo 4 Previso
As previses j passos frente so obtidas diretamente a partir da equao do modelo ARIMA escolhido nos
passos anteriores.
Seja Zt(j) a previso de Zt+j obtida no instante t. A equao de previso apenas a equao obtida da
prpria expresso do modelo para Zt, escrita para o instante de interesse t + j.
A idia por trs das previses substituir os zs e as por suas mdias condicionais, ou seja, as mdias
dada a srie j observada z1, z2, ..., zt-1, zt.
a t + j se j = ....,-3,-2,-1,0
E (a t + j z t , z t 1 , z t 2 ,..., z1 ) =
se j = 1, 2, 3, ....
0
z t + j se j = ....,-3,-2,-1,0
E (z t + j z t , z t 1 , z t 2 ,..., z1 ) =
se j = 1, 2, 3, ....
z t + j
Ou seja, para encontrarmos as previses basta:
1) Substituir os valores esperados passados da srie pelos valores efetivamente observados da srie
(isto , os zt+j com j negativo);
2) Substituir os valores esperados futuros da srie pelas suas previses (ou seja, os z t + j );
3) Substituir os valores esperados futuros dos erros por zero;
4) Substituir os valores passados dos erros at-j por zt-j zt-j-1.
Exemplos deste procedimento so mostrados a seguir.
Z t ( j ) = 1 .E (Z t + j 1 Z 1 , Z 2 ,..., Z t ) + E (a t + j Z 1 , Z 2 ,..., Z t )
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com
76
2
Z t (2) = 1 .E (Z t +1 Z 1 , Z 2 ,..., Z t ) + E (a t + 2 Z 1 , Z 2 ,..., Z t ) = 1 .Z t (1) + 0 = 1 (1 .Z t ) = 1 .Z t
j
Z t ( j ) = 1 .Z t e como o processo suposto estacionrio (e ento | 1| < 1) esta previso tende zero
medida que o horizonte de previso aumenta. Note tambm que zero a mdia do processo, e assim as
previses em horizontes longos tendero mdia.
Z t ( j ) = E (a t + j Z 1 , Z 2 ,..., Z t ) 1 .E (a t + j 1 Z 1 , Z 2 ,..., Z t )
Para j = 1 temos:
Em geral, para j 2 a previso ser zero (que a mdia do processo), pois o processo tem memria de
dois perodos apenas, e a equao de previso depender de E a t + j Z 1 , Z 2 ,..., Z t , que zero para j 1.
Exemplo 5.4.51. (Previso para o ARIMA(1,1,1)
Considere o modelo ARIMA(1,1,1) aplicado a Zt. A equao do modelo :
77
(1 1 B)(1 B) Z t = (1 1 B)at
[1 (1 + 1 ) B + 1 B 2 ]Z t = (1 1 B)at
Z t = (1 + 1 ) Z t 1 + 1 Z t 2 + at 1at 1
No instante t + j teremos:
Z t + j = (1 + 1 ) Z t + j 1 + 1 Z t + j 2 + a t + j 1 a t + j 1
A previso j passos frente dada por:
Z t ( j ) = (1 + 1 ) E (Z t + j 1 Z 1 , Z 2 ,...Z t ) + 1 E (Z t + j 2 Z 1 , Z 2 ,...Z t ) +
+ E (a t + j Z 1 , Z 2 ,...Z t ) 1 E (a t + j 1 Z 1 , Z 2 ,...Z t )
Assim, a previso 1 passo frente :
Z t (1) = (1 + 1 ) Z t + 1 Z t 1 1 (Z t Z t 1 )
A previso 2 passos frente (lembre-se que o valor esperado condicional dos erros futuros zero):
Z t (2) = (1 + 1 ) Z t (1) + 1 Z t
Z t ( j ) = (1 + 1 ) Z t ( j 1) + 1 Z t ( j 2)