Sei sulla pagina 1di 77

1

Captulo 5: Introduo s Sries Temporais e aos Modelos ARIMA


Neste captulo faremos uma introduo s sries temporais. O nosso objetivo aqui puramente operacional
e estaremos mais preocupados com as definies bsicas e alguns exemplos simples, j que o estudo de
sries temporais to extenso que justifica um curso em separado.
Sries Temporais no so comumente estudadas em cursos bsicos de Estatstica. Por que? Pois no
estudo de Sries Temporais a noo de dependncia entre as observaes crucial. Ao contrrio, na
maioria dos procedimentos estudados em cursos elementares, supe-se que as observaes formam uma
amostra aleatria, isto , so independentes e identicamente distribudas.

5.1. Introduo - algumas consideraes sobre sries temporais


Definio 5.1.1. (Srie Temporal)
Uma Srie Temporal um conjunto de observaes ordenadas no tempo (no necessariamente igualmente
espaadas), e que apresentam dependncia serial (isto , dependncia entre instantes de tempo). A
notao usada aqui para denotar uma Srie Temporal Z1, Z2, Z3..., ZT , que indica uma srie de tamanho
T. O instante T geralmente indica o ltimo instante disponvel.
De uma maneira um pouco mais formal, dizemos que uma srie temporal uma realizao de um
processo estocstico.

Definio 5.1.2. (Processo ergdico)


Um processo estocstico dito ergdico se uma nica realizao do processo o suficiente para
caracteriz-lo. Na anlise de sries temporais existe apenas uma realizao do processo disponvel e
portanto precisamos supor que o processo subjacente ergdico, pois iremos usar apenas uma de suas
realizaes para caracteriz- lo.
Em geral, ao estudarmos uma Srie Temporal estaremos interessados em dois aspectos:
Anlise e Modelagem da Srie Temporal - descrever a srie, verificar suas caractersticas mais
relevantes e suas possveis relaes com outras sries;
b) Previso da Srie Temporal - a partir de valores passados da srie (e talvez de outras sries tambm)
encontrar boas previses (de curto prazo) de valores futuros da srie. A previso da srie no instante T
a)

+ k ser denotada por Z$ T + k . O nmero de instantes frente para o qual feita a previso (neste caso,
k) chamado de horizonte de previso. Por exemplo, a previso de ZT+1 denotada por Z$ T +1 .

A dependncia serial entre os valores da srie um aspecto essencial, pois nos permite gerar previses de
valores futuros da srie. Estas previses seriam puro chute se no houvesse dependncia serial.
Tambm, diferentes sries possuem diferentes graus de previsibilidade; por exemplo, freqentemente
mais fcil prever uma srie de temperaturas mdias mensais do que a taxa mensal de inflao. Logo, no
se pode garantir que a previso encontrada por este ou aquele mtodo ser sempre boa, tudo depende
das caractersticas da srie que est sendo estudada! No entanto, um aspecto deve ser levado em conta ao
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com

2
fazermos previses de sries temporais: o nvel de incerteza aumenta com o horizonte de previso quanto
mais longe no futuro, maior a incerteza associada previso. Isto intuitivamente razovel, sempre
mais difcil prever o futuro distante, e a nossa previso estar cercada de incertezas!
Uma medida do acerto das nossas previses o erro de previso k-passos frente, definido a seguir.
Definio 5.1.3. (Erro de Previso k passos frente)
O erro de previso k passos frente no instante t (onde k um inteiro maior ou igual a um) definido como
a diferena entre o valor real da srie no instante t e a previso deste valor feita k instantes antes, isto :

ek (t ) = Z t Z t k (k )

Um caso particular importante o erro de previso um passo frente, dado por:

e1 (t ) = Z t Z t 1 (1)

Um bom modelo de previso produz previses com erro pequeno, e assim interessante acompanhar
quantidades como a soma dos quadrados dos erros de previso, ou a soma dos valores absolutos dos erros
de previso.
E como funcionam estas ferramentas quantitativas que nos permitem prever o futuro de uma srie
temporal?

Vamos utilizar o passado (dados histricos) para descrever a trajetria mais provvel da srie no futuro.
Isso no uma bola de cristal!
Na maioria dos problemas o passado traz informaes relevantes sobre o que ir ocorrer no futuro, pois
existe correlao entre as variveis em diversos instantes.
claro que o conhecimento do passado no nos diz exatamente como ser o futuro, e ento sempre
existe incerteza associada s nossas previses !
Mas, podemos ter uma boa idia de quais sero os valores mais provveis no futuro !
Ou seja, podemos especificar previses futuras e limites de confiana.

Por que usar previses quantitativas, baseadas em modelos estatsticos?


As previses quantitativas, baseadas em modelos estatsticos, so importantes pois podem ser
reproduzidas, isto : dois analistas diferentes chegam s mesmas concluses se utilizarem o mesmo
modelo.
Tambm, as previses obtidas por mtodos estatsticos tm uma justificativa terica - o resultado
encontrado no baseado apenas em argumentos do tipo : eu acho que..., baseado na minha
experincia ... , etc...
Finalmente, as previses so obtidas a partir de um modelo, que uma simplificao da realidade. O
processo de modelagem nos leva naturalmente a considerar apenas os aspectos essenciais do nosso
problema e por si s costuma trazer bastante informao sobre o problema que est sendo tratado.
Afinal, o que queremos ao modelar uma srie temporal ?

Capturar toda a estrutura de dependncia existente na srie;


Logo, nos resduos no deve sobrar estrutura, pois ela j foi captada pelo modelo. Nota: o resduo
apenas a diferena entre o valor real e o ajustado por um modelo qualquer. Por exemplo, seja Zt o valor
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com

3
real da srie no instante t, e Z t seu valor ajustado pelo modelo. Ento, o resduo no instante t apenas
Zt - Z .
t

Em particular, se o modelo bom, os resduos no devem apresentar correlao serial (isto ,


correlao entre os resduos em diferentes instantes de tempo);
Explicar o comportamento da srie com o menor nmero de parmetros (parcimnia).

Dica Prtica .... Por onde comear


Em geral, a primeira coisa que fazemos ao estudar uma srie temporal construir um grfico para mostrar a
sua evoluo ao longo do tempo. Este procedimento simples costuma ser bastante esclarecedor, e nos
permite identificar como evolui a tendncia da srie, se existe ou no sazonalidade, se ocorrem
observaes aberrantes, etc ... Logo, a minha sugesto : sempre comece a sua anlise da maneira mais
simples faa o grfico da srie de interesse!

Sries temporais ocorrem com enorme freqncia na prtica. No quadro a seguir exibimos os grficos de
algumas sries temporais reais.
Quadro 5.1.1. - algumas sries temporais
Preos Mensais Internacionais de Celulose
em US$ fixos

Vendas Mensais de
embalagens de 290 ml

Refrigerantes

em

V E ND AS - E M BALAG E NS 2 9 0 ml

1050.00
950.00

300

850.00

250

750.00

200

650.00

150

550.00

100

450.00

50

350.00

g ua 290
lim 290
la ra nj290

jan-78jan-79jan-80jan-81jan-82jan-83jan-84jan-85jan-86jan-87jan-88jan-89jan-90jan-91jan-92jan-93jan-94jan-95jan-96jan-97

Temperatura Mxima Mensal no Rio de


Janeiro (mdia das mximas dirias)

m s e a no

Preos de Ttulos da Dvida Externa do


Brasil, Argentina e Mxico
Legend

38.00
36.00
34.00

BRPREC
ARGPREC
MEXPREC

32.00
30.00
28.00
26.00
24.00
22.00
20.00

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

4
Consumo Mdio de Energia Eltrica

Inflao Mensal do Rio de Janeiro

Consumo Mdio de Energia Eltrica

Inflao Mensal no Rio de Janeiro

230
220
210
200
190
180
170
160
150

80%
60%
40%
20%

Jul96

Feb95

Sep93

Apr92

Nov90

-20%

Jun89

0%

Jan88

Jun-94

Nov-94

Jan-94

Aug-93

Oct-92

Mar-93

May-92

Jul-91

Dec-91

Feb-91

Sep-90

Apr-90

Jun-89

Nov-89

Jan-89

IPC-RJ (FGV)

100%

Podemos fazer uma distino bsica entre duas grandes classes de modelos:
Modelos Univariados: a srie temporal explicada (prevista) apenas pelos seus valores passados;
Modelos Multivariados ou Causais: a srie temporal explicada (prevista) pelos seus valores
passados e tambm pelos valores passados de outras variveis.
Neste captulo consideraremos apenas modelos univariados.
Exemplo 5.1.3. (Alguns Modelos Univariados)
i) Naive (ingnuo)
A previso de ZT+1 (valor da srie no instante T +1) apenas a ltima observao (ZT). claro que voc
no precisa de um software para ajustar isso e, em alguns casos, o nico mtodo disponvel. Um
exemplo clssico a previso do preo de uma ao - geralmente a melhor previso para o preo de
amanh o preo de hoje, o que certamente frustrante!
ii) Mdias mveis de tamanho N
A cada instante, a previso apenas a mdia das ltimas N observaes. Um dos problemas com este
mtodo a escolha de N, o tamanho da janela a ser utilizado. Quanto maior o valor de N, mais suave a
previso. Ao contrrio, se N pequeno, a previso tende a ser meio nervosa, isto , oscila muito. Uma
caracterstica importante do mtodo de mdias mveis : todas as observaes usadas para o clculo tm
o mesmo peso (que 1/N). Mas, na prtica razovel supor que as observaes mais recentes sejam
mais relevantes para a previso dos prximos valores da srie, e portanto deveriam receber um peso maior
que as observaes mais antigas. Esta idia de pesar ou ponderar as observaes de acordo com as suas
idades leva aos diversos mtodos de amortecimento exponencial.
iii) Amortecimento Exponencial (Exponencial Smoothing)
Existem inmeras variaes destes mtodos, para sries sazonais e no sazonais. A idia geral parecida
com a do mtodo de mdias mveis, mas os pesos das observaes decrescem medida que as
observaes esto mais longe no passado. A taxa de decrscimo do(s) peso(s) determinada por uma ou
mais constantes de amortecimento. A maior dificuldade na aplicao escolher a(s) constante(s) de
amortecimento, mas alguns softwares j ajustam os modelos de amortecimento automaticamente com
constantes de amortecimento otimizadas.

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

5
Na prtica, os mtodos de amortecimento so os mtodos de previso mais usados no dia a dia das
empresas, o que em parte explicado pela sua facilidade de implementao e capacidade em gerar boas
previses.
iv) Modelos ARIMA de Box e Jenkins
So modelos mais sofisticados, que usam as correlaes entre as observaes em diversos instantes. A
idia por trs dos modelos ARIMA envolve filtros lineares e algum conhecimento de Teoria de Sistemas
til. A identificao da estrutura do modelo um pouco complicada, mas alguns softwares j identificam
automaticamente a estrutura do modelo ARIMA, evitando o passo mais complicado da anlise. Como casos
particulares dos modelos ARIMA temos os processos AR (Autoregressivo) e MA (Mdias mveis ou moving
average), j estudados brevemente no captulo 2.
Os modelos ARIMA costumam apresentar melhores resultados que os mtodos de amortecimento quando a
srie relativamente longa e bem comportada.
Se a srie muito irregular, os resultados so, geralmente, inferiores aos obtidos por mtodos de
amortecimento.
Existem tambm modelos ARIMA multivariados, geralmente chamados de modelos de funo de
transferncia, mas eles no sero estudados aqui.
Decomposio de uma srie temporal
A maneira tradicional de analisar uma srie temporal atravs da sua decomposio nas componentes de
tendncia, ciclo e sazonalidade.
A tendncia de uma srie indica o seu comportamento de longo prazo, isto , se ela sobe, desce, ou
permanece estvel, e qual a velocidade destas mudanas. Nos casos mais comuns trabalhamos com
tendncia constante, linear ou quadrtica, como mostrado na prxima figura.
Quadro 5.1.2. Tendncia de uma srie
Tendncia Constante
Tendncia Linear

Tendncia Quadrtica

A sazonalidade indica a repetio de um padro na srie dentro do perodo de um ano. Por exemplo,
vendas de sorvete so altas no vero e baixas no inverno. No quadro 5.1.1., as sries de temperatura,
consumo de energia eltrica e vendas de refrigerantes so claramente sazonais, mas no se pode dizer o
mesmo das outras sries.
Os ciclos indicam padres que se repetem na srie em perodos superiores a um ano. Por exemplo, ciclos
relacionados atividade econmica ou ciclos meteorolgicos.
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com

6
Caractersticas de uma srie temporal e estimadores
Um processo estocstico estacionrio de 2 ordem pode ser descrito (no domnio do tempo) por sua mdia,
varincia e funo de autocovarincia (ou de autocorrelao). Na prtica no conhecemos totalmente o
processo estocstico que gerou a srie que est sendo observada, e estas quantidades (mdia, varincia,
autocorrelao) devem ser estimadas a partir da srie temporal, como indicado no captulo 2.

5.2. Mtodos de Amortecimento Exponencial (sries no sazonais)


Existem inmeras variaes de mtodos de amortecimento exponencial. Todas elas, na verdade, tm uma
caracterstica comum: a informao atual (representada pelo ltimo valor observado) ponderada com a
informao contida nos instantes anteriores. A existncia de uma ou mais constantes de amortecimento ir
determinar como funciona este mecanismo de ponderao ou, em outras palavras, o quo rapidamente
decai a influncia das observaes passadas. Os parmetros do modelo sofrem uma atualizao
seqencial, e a chegada de uma nova observao resulta numa nova estimativa dos parmetros.
Nesta seo estudamos diversos mtodos de amortecimento exponencial para sries no sazonais. A
extenso destes mtodos para sries sazonais mostrada na prxima seo.
Os mtodos de amortecimento exponencial so formas at certo ponto arbitrrias de representar uma srie
temporal, mas so muito importantes na prtica, pois geralmente produzem previses razoveis a partir de
um esforo computacional baixo. Na verdade, estes mtodos so freqentemente citados como os
favoritos dos no especialistas em sries temporais, pela qualidade das previses geradas e facilidade
de implementao. Os mtodos de amortecimento mais famosos so: Brown, Holt e Winters.
Um ponto potencialmente complicado em todos estes mtodos a escolha da(s) constante(s) de
amortecimento, mas na prtica isso no mais problema, j que a maioria dos softwares de sries
temporais ajusta modelos com a(s) constante(s) otimizadas.

Seja Z T = Z1 , Z 2 ,..., Z T

) uma srie temporal de tamanho T. Desejamos escrever um modelo geral para

explicar o comportamento da srie a cada instante e permitir a produo de previses futuras.


Suponha que o modelo geral para uma observao qualquer no instante t genrico : Z t = ( t ) + t onde
t um rudo aleatrio com mdia zero e varincia constante 2 . O termo (t) representa o nvel mdio da
srie, que funo apenas do instante de tempo.
Iremos estudar trs casos particulares: (t) constante, uma funo linear e uma funo quadrtica do
tempo.
A partir das propriedades da mdia e da varincia podemos concluir que:

E ( Z t ) = ( t ) para todo t = 1,2,3,....

VAR( Z t ) = 2 = constante

(5.2.1)

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

7
A seguir derivamos estimadores para os parmetros desconhecidos dos modelos de nvel constante, linear
e quadrtico e encontramos as respectivas equaes de previses.
Freqentemente iremos supor que os erros 1, 2, ..., T so independentes com uma distribuio de
probabilidade conhecida (por exemplo, a Normal) com mdia zero e varincia constante. Das equaes
acima fcil ver que a estimao da varincia de Zt (que igual varincia de t) no apresenta grandes
dificuldades, basta utilizar os estimadores usuais da varincia de uma amostra aleatria. Por isso, na
discusso a seguir, ns nos concentraremos na estimao dos parmetros que definem o nvel mdio da
srie.
5.2.1. Modelo Constante (Horizontal)
Este um modelo apropriado quando a srie temporal apenas oscila em torno de um valor constante, sem
exibir tendncia de crescimento ou queda. A funo nvel mdio dada por: (t) = a1 para todo instante t
= 1, 2, 3, ....., T.

Neste modelo necessrio estimar apenas 2 parmetros:


a1 (o nvel mdio da srie) e
2 (a varincia da srie).
A previso k passos frente obtida no instante T :

Z T (k ) = E{Z T + k | Z T } = E{a1 + T + k | Z T } = a1 (T )

(5.2.2)

Logo, se conhecermos um estimador do parmetro a1 poderemos encontrar as previses pontuais para


qualquer horizonte de tempo k.
E como podemos estimar a constante a1 (nvel mdio da srie)? Existem diversas possibilidades, mostradas
a seguir.

Modelo Constante - Estimao do nvel mdio da srie


1) Estimador ingnuo (naive)

a1 (T ) = Z T onde ZT indica a ltima observao disponvel.

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

8
2) Estimador Mdias Mveis de tamanho N
O nvel mdio da srie num certo instante estimado como a mdia mvel de tamanho N usando as
observaes ZT, ZT-1, ..., ZT-N+1, isto :

a1 (T ) = M T =

Z T N +1 + ... + Z T 1 + Z T
N

(5.2.3)

Uma questo crucial neste caso definir qual o tamanho da janela a ser usada, isto , quantas
observaes sero utilizadas no clculo da mdia mvel. Note que, se N = 1, apenas a ltima observao
usada, e o mtodo se reduz ao mtodo ingnuo. Por outro lado, se N = T (tamanho da srie), temos o
chamado mtodo conservador, em que todas as observaes disponveis so empregadas na estimao
do nvel mdio da srie, e a1 (T ) = Z , a mdia amostral da srie.

O tamanho da janela utilizada (N) pode ser escolhido como aquele inteiro positivo que minimiza a soma de
quadrados dos erros de previso 1 passo frente, isto , escolhe-se N de forma a minimizar:
T

S ( N ) = e12 (t )
t =1

3) Estimador pelo Mtodo de Amortecimento Exponencial


Note que o estimador do nvel da srie produzido pelo mtodo de mdias mveis pode ser escrito como:

a1 (T ) = M T =

Z ZT N
Z T N +1 + ... + Z T 1 + Z T
= M T 1 + T
N
N

(5.2.4)

Onde MT-1 a mdia mvel de tamanho N calculada no instante anterior. Em outras palavras, o estimador
do nvel envolve uma informao atual (representada por ZT, o ltimo valor observado da srie) e uma
informao passada (MT-1 e ZT-N).
O mtodo de amortecimento exponencial estende esta idia de ponderao da informao presente e
passada. Na equao (5.2.4) substitua ZT-N por MT-1. Isso nos leva ao seguinte estimador:

a1 (T ) = M T 1 +

Z T M T 1 1
1

= Z T + 1 M T 1
N
N
N
N

Ou seja, este novo estimador tem a forma: (peso)*(informao atual) + (1 peso)*(informao passada).
Note que 1 (T) a previso do nvel da srie efetuada no instante atual T e podemos reescrever esta
ltima equao como:
1
1
1

a1 (T ) = ZT + 1 M T 1 = ZT + 1 a1 (T 1)
N
N
N

onde 1 (T 1) a mdia mvel de tamanho N calculada at (inclusive) a observao T-1, ou seja, a


estimativa prvia do nvel da srie, Em outras palavras: a previso atual do nvel (dada por 1 (T) )

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

9
baseada na ponderao do valor mais recente da srie (ZT) e da ltima previso para o nvel (1 (T
1)).
Uma forma mais geral de definir um estimador com esta caracterstica de ponderao das informaes
passadas e presentes :
a1 (T ) = M T = ZT + (1 ) M T 1 = .ZT + (1 )a1 (T 1)

(5.2.5)

onde [0, 1] a constante de amortecimento, que controla a taxa de decaimento da informao.


A equao (5.2.5) apresenta algumas caractersticas interessantes:
1) bastante econmica do ponto de vista computacional, pois preciso guardar, a cada instante,
apenas o ltimo valor observado e a estimativa anterior do nvel, isto , no precisamos guardar
todos os valores anteriores da srie temporal para gerar a previso do nvel;
2) o mtodo funciona bastante bem, desde que a srie no apresente uma tendncia.
Ao rearranjar os termos da equao (5.2.5) e encontramos:
a1 (T ) = ZT + (1 ) M T 1 = a1 (T 1) + (ZT a1 (T 1))

(5.2.6)

A expresso (5.2.6) freqentemente conhecida como forma de correo do erro. Nela, o mecanismo de
atualizao da previso do nvel fica explcito: o nvel estimado num instante T igual ao nvel estimado no
instante anterior mais um mltiplo do erro de previso um passo frente cometido no instante anterior (que
ZT 1(T-1)).
Seja eT-1 o erro de previso um passo frente no instante T-1, isto :
eT-1 = ZT 1(T-1) e ento podemos rearranjar os termos e escrever: ZT = eT-1 + 1(T-1).
Se aplicarmos a equao (5.2.6) previso do nvel no instante T + 1 encontramos:
a1 (T + 1) = ZT +1 + (1 ) M T = a1 (T ) + (ZT +1 a1 (T )) = a1 (T ) + .eT
Da:
ZT +1 ZT = (eT +1 + a1 (T )) (eT + a1 (T 1)) = eT +1 eT + (a1 (T ) a1 (T 1)) = eT +1 eT + .eT = eT +1 + (1 ).eT

Esta expresso no til do ponto de vista preditivo, pois o lado direito contm os outputs (erros de
previso um passo frente) enquanto o dado esquerdo contm os inputs (observaes). Mas, esta
expresso importante em termos estruturais, pois se os es (erros de previso um passo frente) so
substitudos por choques aleatrios, o modelo resultante um ARIMA (0,1,1), que ser estudado na
prxima seo. Num modelo ARIMA(0,1,1) o mtodo de amortecimento exponencial simples estudado aqui
fornece previses timas.
Por substituies sucessivas na equao (5.2.5) encontramos:
MT = ZT + (1-) ZT-1 + (1-)2 ZT-2 + ... + (1-)T-1 Z1

(5.2.7)

Esta ltima equao mostra claramente como funciona o mtodo de amortecimento exponencial: cada
estimativa do nvel (dada por MT) uma soma ponderada da observao atual (ZT) e das observaes

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

10
passadas. Os pesos decrescem exponencialmente, e a taxa de decaimento dos pesos depende da
constante .
Qual o efeito da constante de amortecimento ? Note que, da equao (5.2.7), o peso da observao
ZT-k (1-)k (para k = 0, 1, 2, ...). Logo, a razo entre os pesos da observao ZT-k e da observao atual
(ZT) (1-)k . Se grande (prximo de 1) os pesos decaem rapidamente, e uma observao que est
longe no passado no tem qualquer influncia sobre a estimativa atual do nvel, que estimado usando
quase exclusivamente as observaes mais recentes. Ao contrrio, se pequeno (por exemplo, menor
que 0.3), uma observao longe no passado pode ainda ter uma influncia considervel na estimao do
nvel feita hoje.
A tabela a seguir apresenta alguns valores de e a meia vida das observaes, isto , quantas
defasagens so necessrias at que o peso da observao se reduza metade. A meia vida das
observaes encontrada resolvendo a seguinte equao para k (o lag):

peso de Z T k 1
(1 )k 1
log(2)
=
= k .log(1 ) = log(2) k =
onde log(.) indica o
peso de Z T
2

2
log(1 )
logaritmo natural. Como k indica uma defasagem, deve-se escolher o valor k inteiro no negativo que
satisfaz (aproximadamente) esta equao.
Tabela 5.2.1. Meia Vida das Observaes como Funo de

nmero de "lags" at o peso


cair pela metade

0,99

0,15

0,95

0,23

0,90

0,30

0,80

0,43

0,70

0,58

0,60

0,76

0,50

1,00

0,45

1,16

0,40

1,36

0,35

1,61

0,30

1,94

0,25

2,41

0,20

3,11

0,15

4,27

0,10

6,58

0,05

13,51

0,02

34,31

0,01

68,97

Por exemplo, se = 0,02, a observao situada h 34 lags contm aproximadamente metade da


informao do dado atual. Se = 0,05, so necessrias cerca de 14 defasagens at que o peso da
observao caia pela metade.
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com

11
Nota: reparametrizao
Em alguns livros encontra-se o mtodo de amortecimento escrito de maneira diferente. Seja = 1- na
equao (5.2.7). Em termos de esta equao torna-se:
MT = (1-)ZT + (1-) ZT-1 + 2(1-) ZT-2 + ... + T(1-)Z1

(5.2.8)

Logo, o peso da observao atual (1-) e o da k-sima observao no passado k (1-). Nesta
parametrizao, valores altos de indicam que a memria do processo relativamente longa, ou seja, a
influncia das observaes passadas demora a decair.

Exemplo 5.2.1.
A tabela a seguir exibe os primeiros valores da srie temporal: Zt = 2 + et onde os et s so rudos iid com
distribuio Normal de mdia 0 e desvio padro . Supomos que em t = 0, Z0 = 0 (apenas para permitir a
inicializao do processo), e o objetivo aqui demonstrar a estimao seqencial de a1 por amortecimento
exponencial e mdias mveis (de tamanho 2, 3 e 4). Note que, dependendo da escolha da constante de
amortecimento (ou da janela utilizada na mdia mvel), a estimativa do nvel mais ou menos nervosa (e
oscila mais ou menos medida que recebemos cada valor da srie). Verifique os valores estimados para o
nvel da srie. Faa (em casa) o grfico da evoluo no nvel estimado ao longo do tempo para todos os
mtodos indicados.

Estimador
MM(3)

Estimador
MM(4)

Estimador
Amort. Expo.
(Alfa = 0.2)

Estimador
Amort. Expo.
(Alfa = 0.3)

0,098

0,147

0,494

0,692

Instante t

Erros (e(t))

Srie (Z(t))

Estimador
MM(2)

-1,512

0,488

0,244

0,080

2,080

1,284

0,856

-0,433

1,567

1,824

1,379

1,034

0,709

0,816

0,437

2,437

2,002

2,028

1,643

1,054

1,227

0,107

2,107

2,272

2,037

2,048

1,265

1,370

-0,025

1,975

2,041

2,173

2,021

1,407

1,478

-0,192

1,808

1,891

1,963

2,082

1,487

1,527

0,629

2,629

2,219

2,137

2,130

1,716

1,830

0,463

2,463

2,546

2,300

2,219

1,865

1,940

10

0,332

2,332

2,398

2,475

2,308

1,958

2,005

11

-0,469

1,531

1,931

2,109

2,239

1,873

1,830

12

0,538

2,538

2,034

2,134

2,216

2,006

2,072

13

0,277

2,277

2,408

2,115

2,170

2,060

2,087

14

0,017

2,017

2,147

2,277

2,091

2,052

2,047

15

-0,256

1,744

1,880

2,013

2,144

1,990

1,959

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

12
5.2.2. Modelo Linear
Esta estrutura adequada quando existe uma tendncia clara de crescimento (ou queda) ao longo do
tempo, como indicado na prxima figura. A funo nvel mdio dada por: (t) = a1 + a2.t para todo
instante t = 1, 2, 3, ....., T.

O modelo linear pode ser escrito como:

Z t = a1 + a 2 .t + t onde t = 1,2,...., T e os t so os erros (choques) aleatrios, supostos independentes


e identicamente distribudos com mdia zero e varincia constante 2. Desta expresso (e usando as
propriedades da mdia e varincia) segue direto que:

E (Z t ) = a1 + a 2 .t e VAR(Z t ) = 2 = VAR( t )

(5.2.9)

Neste modelo necessrio estimar trs parmetros: a1 (coeficiente linear da srie), a2 (coeficiente angular
da reta, ou seja, a taxa de crescimento da srie) e 2 (a varincia da srie).
A previso k passos frente obtida no instante T :

Z T (k ) = E{Z T + k | Z T } = E{a1 + a 2 (T + k ) + T + | Z T } = a1 (T ) + a 2 (T ).(T + k )

(5.2.10)

A previso dada pela equao (5.2.10) pode ser escrita de uma forma ligeiramente diferente, desde que
faamos uma mudana da origem.

Modelo Linear - Estimao dos parmetros a1 e a2


Analogamente ao que fizemos para o modelo constante, a seguir apresentaremos diversos estimadores
para os parmetros desconhecidos que descrevem a evoluo do nvel da srie.
A partir dos valores estimados de a1 e a2 podemos encontrar a previso de uma observao futura qualquer,
apenas aplicando a equao (5.2.10).

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

13
1) Estimadores de Mnimos Quadrados Ordinrios (MQO)
Nosso objetivo encontrar a1 e a2 tais que a seguinte soma seja minimizada:
T

SSE =

+ a t )]
[Z144(a24
4
3
t

t =1

(5.2.11)

SSE chamado de soma dos quadrados dos erros (ou soma do quadrado dos resduos). O mtodo de
mnimos quadrados bastante geral, e se aplica estimao de um nmero qualquer de parmetros a1, a2,
..., ak (supe-se que k menor que o tamanho da srie, para permitir a estimao). Considere, de maneira
onde f(.) uma funo
mais geral, um modelo com a seguinte estrutura: Z t = f (a1 , a 2 ,...., a k , t ) + t
(possivelmente no linear) do tempo e dos parmetros desconhecidos. Ento a soma dos quadrados dos
erros dada por:
T

SSE =

(Z

f (a1 , a 2 ,...., a k , t ))2 =

t =1

2
t

t =1

O mtodo de mnimos quadrados procura encontrar estimadores dos parmetros desconhecidos de forma a
minimizar a soma do quadrado dos erros (SSE).
Note que os estimadores por mnimos quadrados encontrados pela minimizao da soma do quadrado dos
erros so calculados usando a srie inteira, ou seja, usamos todos os dados disponveis de uma s vez. Ao
contrrio, nos mtodos mdias mveis e de amortecimento, a atualizao dos parmetros seqencial, e o
recebimento de uma nova observao resulta em novos valores estimados para a1 e a2.
2) Estimadores pelo Mtodo de Mdias Mveis Duplas
Defina a mdia mvel dupla de tamanho N como:

M [2]
T =

M T + M T 1 + ... + M T N +1
N

(5.2.12)

Onde MT a mdia mvel (simples) de tamanho N calculada usando todas as observaes at o instante T
(inclusive).
Por que usar mdias mveis duplas?
Se os dados exibem uma tendncia linear, o uso de mdias mveis simples para a previso dos valores da
srie induz a erros sistemticos, pois a mdia mvel simples segue a tendncia com um certo atraso, e este
efeito amplificado quando tentamos prever valores futuros. O mtodo de mdias mveis duplas procura
diminuir este efeito sistemtico.
Pode-se mostrar que:

N 1
.a 2 (T )
2
E{M [2]
T } = a1 (T ) + T .a 2 (T ) ( N 1) a 2 (T )
E{M T } = a1 (T ) + T .a 2 (T )

Resolvendo o sistema anterior para a1 e a2 leva a:


M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com

14

a 1 (T ) = 2.E{M T } E{M T[ 2] } - T .a 2 (T )
a 2 (T ) =

2
E{M T } E{M T[ 2] }
( N 1)

(5.2.13)

Se substituirmos os valores esperados de MT e MT[2] na expresso (5.2.13) pelos valores efetivamente


observados MT e MT[2] encontramos os estimadores de a1 e a2 com base na srie observada at o instante
T, dados por:

a 1 (T ) = M T + M T M T[2 ] - T .a 2 (T ) = 2.M T M T[ 2] T .a 2 (T )
a 2 (T ) =

2
M T M T[ 2 ]
( N 1)

}
(5.2.14)

O estimador 1(T) encontrado corrigindo-se a mdia mvel simples (MT) pela diferena entre ela e a mdia
mvel dupla. Se, na verdade, no existisse uma tendncia linear, o fator de correo seria pequeno.
A previso k passos frente no instante T :

Z T + k = a1 (T ) + a 2 (T ).(T + k ) = 2.M T M T[ 2 ] T .a 2 (T ) + T .a 2 (T ) + k .a 2 (T ) =

= 2.M T M T[ 2] + k .a 2 (T ) = 2.M T M T[ 2 ] + k .
M T M T[ 2 ]
N 1

Expresso alternativa para as equaes de atualizao do mtodo de mdias mveis duplas


DeLurgio (1998) prope o uso de uma verso modificada das equaes de atualizao (5.2.14). As novas (e
mais simples) equaes de atualizao so:

a1 (T ) = M T + M T M T[2 ] = 2.M T M T[ 2]
a 2 (T ) =

2
M T M T[ 2]
( N 1)

(5.2.15)

E a equao de previso k passos frente torna-se:

2
ZT + k = a1 (T ) + a2 (T ).(k ) = 2.M T M T[ 2] + k .a2 (T ) = 2.M T M T[ 2] + k .
M T M T[ 2]

N 1

Vantagens e Desvantagens deste mtodo


a implementao trivial;
os estimadores obtidos pelo mtodo no so muito influenciados por outliers;
a escolha do nmero timo de lags a serem usados nas mdias mveis simples e duplas no trivial.

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

15
Exemplo 5.2.2.
Um ponto importante a ser lembrado quando tratamos de mtodos de mdias mveis : estes
procedimentos implicam num conjunto de pesos definidos para as observaes passadas. Isso nos permite
compar-los com os mtodos de amortecimento exponencial.
Por exemplo, considere um modelo linear onde os parmetros desconhecidos so estimados por mdias
mveis simples e duplas de tamanho 3. Como podemos escrever os estimadores em termos dos valores
observados da srie?
Note que, neste caso, para qualquer instante t maior que 3:
Mt =

Z t + Z t 1 + Z t 2
3

M t[ 2] =

M t + M t 1 + M t 2
3

E assim a previso 1 passo frente no instante T (com a origem transladada) :

2
. 1) = 2 M T M T[ 2] +
ZT +1 = a1 (T ) + a2 (T )(
M T M T[ 2] =
3 1
M + M T 1 + M T 2
= 2M T M T[ 2] + M T M T[ 2] = 3.M T 2.M T[ 2] = 3.M T 2 T
=
3

1 7.(ZT + ZT 1 + ZT 2 ) 2(ZT 1 + ZT 2 + ZT 3 ) 2(ZT 2 + ZT 3 + ZT 4 )


1 7

= M T 2M T 1 2 M T 2 =
=
3
3
3
3
3

1 7
5
3
4
2
= ZT + ZT 1 + ZT 2 +
ZT 3 +
ZT 4
3
3
3
3
3
3


3) Mtodo de Amortecimento Exponencial Duplo (Mtodo de Brown)


Um mtodo semelhante ao anterior o mtodo de amortecimento exponencial duplo, tambm conhecido
como mtodo de Brown. Nele, uma nica constante de amortecimento empregada no processo de
atualizao de ambos os parmetros a1 e a2. Analogamente ao mtodo de mdias mveis duplas, a
componente de tendncia estimada atravs da diferena entre um valor amortecido simples e um
duplo.
As equaes de atualizao no mtodo de Brown so:
M T = ZT + (1 )MT 1
[ 2]
M[2]
T = MT + (1 ) MT 1

(5.2.16)

onde a constante de amortecimento.


Os estimadores de a1 e a2 encontrados pelo mtodo de Brown so:

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

16

)
}

a1 (T ) = M T + M T M T[2 ] = 2.M T M T[ 2]
a 2 (T ) =

M M T[ 2]
(1 ) T

(5.2.17)

Ou seja, estes estimadores tm a mesma forma que na equao (5.2.15). No entanto, agora MT e MT[2]
no mais representam as mdias mveis descritas no tem 5.2.2., e so calculados atravs das equaes
(5.2.16).
A previso k passos frente no instante T :

ZT + k = a1 (T ) + a2 (T ).(k ) = 2.M T M T[ 2] +
M T M T[ 2] .k
1

(5.2.18)

Escolha dos valores iniciais


Em todos os mtodos de amortecimento necessrio escolher valores iniciais dos parmetros de forma a
inicializar as equaes de atualizao. Algumas escolhas possveis so:
M1 = Z1
a1 (1) = Z1
a 2 (1) =

(Z 2 Z1 ) + (Z 4 Z3 )
2

Vantagens e Desvantagens do mtodo de Brown


modela o nvel e a tendncia da srie;
mais eficiente em termos computacionais que as mdias mveis duplas;
menos flexvel que o modelo de Holt (a seguir), que usa duas constantes de amortecimento.

4) Mtodo de Holt (2 parmetros)


Este mtodo bastante parecido com o anterior, mas agora existem duas constantes de amortecimento
diferentes, responsveis pela velocidade de decaimento da informao na estimao dos coeficientes
linear e angular, respectivamente.
O modelo de Holt implementado atravs das seguintes equaes:
M T = .ZT + (1 ).(M T 1 + a2 (T 1))
a2 (T ) = .(M T M T 1 ) + (1 ).a2 (T 1)

(5.2.19)

a1 (T ) = M T

onde e so as constantes de amortecimento.

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

17
Caractersticas importantes do mtodo

As constantes de amortecimento usadas para clculo do nvel e tendncia so diferentes;


Na equao de atualizao do nvel, o novo nvel funo de 3 variveis: a observao mais recente
(ZT), a estimativa anterior do nvel (MT-1) e a taxa de crescimento estimada no instante anterior (2 (T1));
A taxa de crescimento atualizada funo da taxa de crescimento no instante anterior e tambm
depende da diferena entre os nveis nos instantes T-1 e T.

Escolha dos valores iniciais


Possveis escolhas so:
a1 (1) = Z1
a 2 (1) =

(Z 2 Z1 ) + (Z 4 Z3 )
2

Vantagens e Desvantagens do mtodo de Holt


modela o nvel e a tendncia da srie;
mais flexvel que o mtodo de Brown, pois usa constante de amortecimento separadas para o nvel e
a tendncia;
a contrapartida deste ganho em flexibilidade a existncia de um parmetro adicional a ser otimizado, o
que dificulta o processo de otimizao.
Exemplo 5.2.3.
Considere uma srie temporal puramente determinstica, Zt = 2 + 3.t. A tabela a seguir exibe alguns valores
da srie e as previses um passo frente de Zt usando: 1) uma mdia mvel simples de tamanho 3, 2) a
mdia mvel simples e a mdia mvel dupla, como na equao (5.2.15). Verifique os valores encontrados
na tabela, e note que o erro da previso um passo frente obtida atravs da equao (5.2.15) nulo em
todos os instantes.

Srie Z(t)
Instante (puramente
determinstica)
t
1
5,00
2
8,00
3
11,00
4
14,00
5
17,00
6
20,00
7
23,00
8
26,00
9
29,00
10
32,00
11
35,00
12
38,00
13
41,00
14
44,00
15
47,00

MM(3)

8,00
11,00
14,00
17,00
20,00
23,00
26,00
29,00
32,00
35,00
38,00
41,00
44,00

Erro de
Previso 1
Previso 1
passo
frente
passo
frente de Z(t)
usando
usando MM(3)
MM(3)

8,00
11,00
14,00
17,00
20,00
23,00
26,00
29,00
32,00
35,00
38,00
41,00

6,00
6,00
6,00
6,00
6,00
6,00
6,00
6,00
6,00
6,00
6,00
6,00

MM Dupla (3)

11,00
14,00
17,00
20,00
23,00
26,00
29,00
32,00
35,00
38,00
41,00

Previso 1
passo frente
Diferena
= MM(3) +
Erro de Previso
(MM(3)entre MM(3)
1 passo frente
e MM Dupla MMDup(3)) +
usando MM
(3)
tendncia
Dupla

3,00
3,00
3,00
3,00
3,00
3,00
3,00
3,00
3,00
3,00
3,00

20,00
23,00
26,00
29,00
32,00
35,00
38,00
41,00
44,00
47,00

0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00
0,00

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

18
Exemplo 5.2.4.
Considere o exemplo anterior, mas agora adicione um erro aleatrio Zt. O modelo gerador destes dados :
Zt = 2 + 3.t + et onde os ets so rudos aleatrios independentes Normais, com mdia zero e varincia .
Refaa o exemplo anterior e note que os erros de previso um passo frente usando mdias mveis
simples so consideravelmente maiores que os erros encontrados quando usamos a equao (5.2.15) para
prever Zt. Calcule a soma do quadrado dos erros de previso um passo frente segundo os dois mtodos.

Instante t

Erros
(e(t))

Srie (Z(t))

MM(3)

Erro de
Previso 1
Erro de
Previso 1
passo frente = Previso 1
Previso 1
passo
MM(3) +
passo
frente
Diferena
(MM(3)frente
passo frente
de Z(t) usando
usando
entre MM(3) e MMDup(3)) +
usando
MM(3)
MM(3)
MM Dupla (3) MM Dupla (3)
tendncia
MMDupla

-0,150

4,850

-0,639

7,361

0,122

11,122

7,778

0,638

14,638

11,041

7,778

6,861

0,599

17,599

14,453

11,041

6,559

11,090

3,363

0,867

20,867

17,701

14,453

6,413

14,398

3,303

21,179

-0,31

-1,092

21,908

20,125

17,701

4,207

17,426

2,698

24,307

-2,40

-0,117

25,883

22,886

20,125

5,758

20,237

2,649

25,521

0,36

0,548

29,548

25,780

22,886

6,662

22,930

2,850

28,183

1,36

10

-0,543

31,457

28,962

25,780

5,677

25,876

3,086

31,479

-0,02

11

-0,345

34,655

31,886

28,962

5,693

28,876

3,010

35,135

-0,48

12

-0,845

37,155

34,422

31,886

5,268

31,757

2,665

37,907

-0,75

13

-0,923

40,077

37,295

34,422

5,654

34,535

2,761

39,752

0,32

14

-0,489

43,511

40,248

37,295

6,216

37,322

2,926

42,817

0,69

15

-0,387

46,613

43,400

40,248

6,366

40,314

3,086

46,099

0,51

Exemplo 5.2.5.
No grfico a seguir mostramos o consumo comercial de energia eltrica anual no Brasil no perodo 1963 a
1998, e os resultados do ajuste de um modelo de Holt srie.
Componente

Constante de
Amortecimento

Valor Final

Nvel
Tendncia

0.8086
0.9994

41539
3536

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

19
Consumo Comercial (GWh)
45,000

40,000

35,000

30,000

25,000

20,000

15,000

10,000

5,000

0
1963

1965

1967

1969

1971

1973

1975

1977

1979

1981

1983

1985

1987

1989

1991

1993

1995

1997

1999

As previses geradas pelo modelo para o perodo 1999-2002 so indicadas a seguir, assim como os
respectivos erros de previso em 1999 e 2000.
Ano

1999
2000
2001
2002

Limite Inferior
Previso
(2.5%)
42,949
44,570
46,842
49,362

Previso

Limite
Superior
Previso
(97.5%)

Valor Real

45,074
48,610
52,145
55,681

47,199
52,650
57,448
62,000

43,583
47,365

Erro
Percentual
Absoluto de
Previso
3.4%
2.6%

5.2.3. Modelo Quadrtico


A funo nvel mdio dada por (t) = a1 + a2t + a3t2 para t = 1, 2, ...T. Agora existem trs parmetros
a serem estimados para o nvel, a1, a2 e a3. Supondo que o modelo tem a forma:

Z t = a1 + a 2 .t + a 3 .t 2 + t onde t = 1,2,...., T e E ( t ) = 0, VAR( t ) = 2 segue que:


E(Zt) = (t) = a1 + a2t + a3t2 e VAR(Zt) = 2 = constante.
O modelo quadrtico se aplica a sries que tm o comportamento indicado na figura a seguir.

A previso k passos frente no instante T dada por:

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

20
ZT (k ) = E{ZT + k | Z1, Z 2 ,...., ZT } =
= E{a1 + a2 .k + a 3k 2 | Z1, Z 2 ,...., ZT } (com a origem transladada, isto , fazendo T = 0)
= a1 (T) + k .a 2 (T) + k 2 . a 3 (T)

Analogamente aos modelos constante e linear, existem diversos mtodos para a estimao dos parmetros
que especificam o nvel da srie. Aqui, ao contrrio dos casos anteriores, no iremos exibir em detalhes as
equaes de atualizao.

1) Estimadores de Mnimos Quadrados Ordinrios (MQO)


Devemos encontrar os estimadores de a1, a2 e a3 que minimizem:
T

SSE =

[Z14 (4a 4+2a 4t +4a4.t3)]


t

t =1

2) Mdias Mveis Triplas


Defina a mdia mvel tripla de tamanho N avaliada no instante T como:

M[3]
T =

M T[ 2] + M T[ 2]1 + ... + M T[ 2] N +1
N

(5.2.20)

Onde MT[2] a mdia mvel dupla de tamanho N avaliada no instante T.


Os estimadores dos parmetros do modelo so obtidos como funes das mdias mveis simples, dupla e
tripla.

a i (T ) = f i [ M T , M T[ 2 ] , M T[ 3 ] ] ; i = 1, 2, 3

3) Amortecimento Exponencial
M T = ZT + (1 ) M T 1
M T[ 2] = M T + (1 ) M T[ 2]1
M T[3] = M T[3] + (1 ) M T[3]1

Onde [0,1] a nica constante de amortecimento usada para atualizar todas as mdias mveis.
Os estimadores dos parmetros a1, a2 e a3 (correspondentes origem transladada para o instante T) no
instante T so obtidos atravs das equaes:

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

21

(1 )(2 ) a (T )
1
M T = a1 (T )
a 2 (T ) +
3
2. 2

MT

[ 2]

MT

[ 3]

2(1 )(3 2 )
1
= a1 (T ) 2
a 3 (T )
a 2 (T ) +
2. 2

3.(1 )(4 3 )
1
= a1 (T ) 3
a 3 (T )
a 2 (T ) +
2. 2

5.3. Mtodos de Amortecimento Exponencial (sries sazonais)


Sries sazonais ocorrem com enorme freqncia na prtica. Por exemplo, sries de temperatura mdia
mensal e sries de consumo de energia eltrica so claramente sazonais, e exibem caractersticas que se
repetem ano a ano sempre no mesmo ms (ou semana, ou trimestre, ...). No caso de sries de consumo de
energia no Brasil, existe um ntido aumento de consumo nos meses de vero, devido s elevadas
temperaturas e ao uso de ar refrigerado. Entender a sazonalidade de uma srie fundamental no apenas
para gerar previses consistentes, mas tambm para propor polticas governamentais ou empresariais. Por
exemplo, o horrio de vero no Brasil conseqncia direta do aumento de consumo observado neste
perodo, e tem o objetivo de reduzir o consumo e evitar black-outs cujas conseqncias em termos
econmicos poderiam ser dramticas. A sazonalidade pode ser modelada de duas formas: atravs de
fatores sazonais ou atravs de funes trigonomtricas. Aqui estaremos
interessados apenas na
modelagem atravs de fatores sazonais.
As tcnicas j estudadas de amortecimento exponencial podem ser estendidas para modelar sries que
apresentam tendncia e sazonalidade.
Um dos modelos mais utilizados na prtica (especialmente em empresas) o modelo de amortecimento
exponencial de Holt e Winters. Este procedimento capaz de modelar sries sazonais e gera, na maioria
dos casos, boas previses, a um custo computacional bastante baixo. O modelo de Holt e Winters utiliza a
idia de amortecimento das informaes passadas trs vezes para:
estimar o nvel da srie;
estimar a taxa de crescimento da srie;
estimar os fatores sazonais.
Em cada um dos passos indicados emprega-se uma constante de amortecimento diferente.
Seja S o perodo sazonal, por exemplo, S = 12 no caso de dados mensais, S = 4 no caso de observaes
trimestrais. Na discusso a seguir iremos nos referir, com freqncia, ao ms t, mas todos os resultados
se aplicam a perodos arbitrrios, e no se referem exclusivamente a dados mensais. Denote por t o fator
sazonal correspondente ao ms t, onde t = 1, 2, ...S.
Existem dois tipos de modelos para a sazonalidade: modelos aditivos e multiplicativos. Nos modelos
aditivos, o padro sazonal no se altera medida que o nvel da srie muda. Ao contrrio, nos modelos
multiplicativos, a sazonalidade da srie afetada pelo nvel da mesma, como indicado nos grficos a seguir.

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

22
MODELO ADITIVO
Zt = (t) + t + t

MODELO MULTIPLICATIVO
Zt = (t) . t . t ou Zt = (t) . t + t

5.3.1. Modelo Horizontal (constante) Sazonal Multiplicativo


Neste caso o nvel da srie ((t)) uma constante, e a estrutura do modelo :
Zt = a1. t + et

(5.3.1)

Neste caso precisamos estimar o nvel da srie (a1) e os fatores sazonais t para todos os meses t. Note
que, no caso de dados mensais, precisamos estimar 12 fatores sazonais e o nvel, ou seja, existem 13
parmetros a serem estimados. No caso de dados trimestrais, existem 4 fatores sazonais (e tambm o
nvel), o que resulta na estimao de 5 parmetros. Na verdade, se S o perodo sazonal, existem S fatores
sazonais a serem estimados, mas a soma destes fatores est sujeita a uma restrio, e na prtica o nmero
de fatores sazonais a serem estimados S 1. Logo, na prtica, no modelo mensal devemos estimar 11
fatores sazonais (pois o remanescente obtido a partir da restrio).
A previso k passos frente feita no instante T dada por:

Z T (k ) = E{Z T + k | Z T } = a1 (T ). T + k (T )

(5.3.2)

importante conhecer o significado dos estimadores de a1 e t na equao (5.3.2).

a1 (T ) indica o estimador do nvel da srie usando todas as observaes at o instante T (inclusive), ou


seja, a estimativa mais atualizada do nvel da srie.

T + k (T )

o estimador do fator sazonal correspondente ao ms T + k no futuro efetuado usando todas as

observaes at o instante T (inclusive). Ou seja, T + k (T ) a estimativa mais atualizada do fator sazonal


que corresponde ao ms T + k.

Os parmetros do modelo so atualizados seqencialmente da forma indicada a seguir. Suponha que, para
um instante genrico T, as estimativas de a1 e do fator sazonal para o instante anterior esto disponveis

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

23
(isto , so conhecidas), ou seja, a1 (T 1) e

m (T ) (T 1)

so dados, onde m(T) o ms

correspondente ao instante T. Ento, os parmetros atualizados no instante T so encontrados a partir das


seguintes frmulas:

ZT
a1 (T ) =
+ (1 ).a1 (T 1)

(
1
)
T

m (T )
Z
m (T ) (T ) = T + (1 ). m (T ) (T 1)
a1 (T )

(5.3.3)

(5.3.4)

Note que, nas equaes (5.3.3) e (5.3.4) so usadas duas constantes de amortecimento diferentes, uma
para o nvel e outra para o fator sazonal.
Alm disso, uma caracterstica importante da atualizao do fator sazonal : ele s muda quando
recebemos uma informao referente ao ms m(T). Por exemplo, o fator sazonal referente ao ms de
maio s atualizado quando recebemos uma informao relativa a este ms. Ou seja:

j (T ) = j (T 1) para j = 1,2,..., S e j m(T )

Em seguida, os fatores sazonais estimados so normalizados, de tal forma que a sua soma seja igual ao
perodo sazonal (S). Esta condio de normalizao vlida para fatores sazonais multiplicativos. No caso
de fatores aditivos, sua soma (para todos os meses) zero.
S


j =1

(T ) = S
(5.3.5)

necessrio fornecer estimativas iniciais do nvel e dos fatores sazonais. O procedimento de inicializao
descrito brevemente a seguir.
1 PASSO: Clculo das Mdias Anuais
Ano 1

Z1

Z2

...

ZS

Mdia do Ano 1

Ano 2

ZS+1

ZS+2

...

Z2S

Mdia do Ano 2

Ano J

.
ZJS -(S-1)

.
ZJS -(S-2)

...
...

.
ZJS

Mdia do Ano J

Z (1)
Z (2)

J = T/S

Z (J )

2 PASSO: Clculo dos fatores sazonais grosseiros Ci

C1 =

Z1
Z (1)

...

...

CJS ( S 1) =

Z JS ( S 1)
Z(J)

...
...

CS =

ZS
Z (1)

...

CJS =

Z JS
Z(J)

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

24
O fator sazonal grosseiro para o ms i apenas a observao Zi dividida pela mdia do ano
correspondente. Este procedimento simples funciona bem desde que a srie no apresente componente de
tendncia, Do contrrio, se existe tendncia, as estimativas dos fatores sazonais encontradas por este
mtodo iro conter componentes de tendncia, e as previses resultantes sero prejudicadas.
Note que, neste passo, encontramos J (um para cada ano em que existem dados) fatores sazonais para
cada ms. No passo seguinte tomamos a mdia destes J fatores para obter um nico fator sazonal para o
ms i.
3 PASSO: Clculo dos fatores sazonais "suaves"
Os fatores sazonais para cada um dos meses so encontrados atravs da mdia dos fatores encontrados
no passo anterior, isto :

C1* = [C1 + CS+1 +...+ CJS ( S1) ] / J


.

CS* = [CS + C2S +...+ CJS ] / J


Por exemplo, o fator sazonal correspondente ao ms 1 a mdia dos fatores sazonais previamente
estimados para os meses 1, 13, 25, 37, ....
4 PASSO: Normalizao dos fatores sazonais "suaves"
A partir dos fatores sazonais suaves encontrados no passo anterior, calcula-se os fatores sazonais
normalizados simplesmente aplicando a restrio de que a soma dos fatores sazonais deve ser igual a S
(perodo sazonal). Ou seja, o fator sazonal normalizado correspondente ao ms i apenas:

i (0) =

S
S

C
i =1

.C i* onde C i* o fator sazonal suave calculado no passo anterior.


*
i

5 PASSO: Obteno da estimativa inicial do nvel


A partir dos fatores sazonais normalizados i (0 ) encontrados no passo anterior, e supondo que o nvel
inicial estimado seja igual mdia do primeiro ano de dados, a1 (0) = Z (1) , pode-se inicializar o processo
de estimao. Em seguida usa-se as equaes (5.3.3) e (5.3.4) para obter as estimativas do nvel e fatores
sazonais em cada instante.

5.3.2. Modelo Linear Sazonal Multiplicativo


Neste caso o nvel da srie ((t)) uma funo linear, e a estrutura do modelo :
Zt = (a1 + a2. t).t + et

(5.3.6)

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

25
Neste caso precisamos estimar o nvel da srie (a1), sua taxa de crescimento (a2) e os fatores sazonais t
para todos os meses t. A atualizao de parmetros feita seqencialmente, pelo mtodo de HoltWinters descrito a seguir.
Suponha que no instante T-1 conhecemos as estimativas do nvel, taxa de crescimento e fatores sazonais
dadas por: a1 (T 1), a 2 (T 1) e j (T 1) . O procedimento de atualizao bem semelhante ao
apresentado antes (modelo com nvel constante e sazonalidade multiplicativa). A grande diferena em
relao ao modelo da seo 5.3.1. que agora temos mais uma quantidade a ser atualizada
seqencialmente, a taxa de crescimento a2.

Atualizao do nvel (a1)

ZT
a1 (T ) =
+ (1 )[a1 (T 1) + a 2 (T 1)]
m (T ) (T 1)
Note que, do lado direito da equao (5.3.7), o termo

(5.3.7)

ZT
representa a observao do instante T
m (T ) (T 1)

dessazonalizada.

Atualizao da tendncia

a 2 (T ) = .[a1 (T ) a1 (T 1)] + (1 ).a 2 (T 1)

(5.3.8)

A equao de atualizao da tendncia exatamente igual do mtodo de Holt (usado para sries com
tendncia linear e sem sazonalidade), como indicado na expresso (5.2.19). Note que o termo
a1 (T ) a1 (T 1) a diferena entre os nveis estimados nos instantes T e T-1.

Atualizao dos fatores sazonais j (T)

m* (T ) = T + (1 ) m (T ) (T 1)
a1 (T )

(5.3.9)

*j (T ) = j (T 1); j = 1,2,..., S ; j m(T )

(5.3.10)

A atualizao dos fatores sazonais feita apenas no ms correspondente ao fator sazonal que se procura
estimar. Logo, pela equao (5.3.10) segue que o fator sazonal permanece fixo at recebermos a
informao relativa ao ms atual. Quando esta informao recebida (isto , quando o instante T
corresponde ao ms m(T)), o fator sazonal estimado atravs da expresso (5.3.9). Nesta equao nota-se
que o fator sazonal correspondente ao ms m(T) atualizado no instante T uma mdia ponderada da
estimativa feita no ano passado para o fator deste ms e tambm da observao sem o nvel (dada por

ZT
).
a1 (T )

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

26

Normalizao (padronizao) dos fatores sazonais

* (T )
.S
j (T ) = S j

*
j (T )

j =1
O objetivo desta normalizao fazer com que os fatores sazonais encontrados pela equao (5.3.9)
tenham soma igual a S (perodo sazonal).
A previso k passos frente no instante T obtida substituindo-se os parmetros desconhecidos a1, a2 e
por suas estimativas, isto :

Z T + k (T ) = [a1 (T ) + k .a 2 (T )] m (T + k ) (T )

(5.3.11)

Inicializao do Mtodo

A exemplo do que fizemos na seo anterior, aqui encontramos estimativas iniciais para o nvel, taxa de
crescimento e fatores sazonais.
Sejam Z (1) , Z ( 2) ,...., Z ( J ) as mdias anuais, onde J o ltimo ano disponvel.
A estimativa inicial da taxa de crescimento :
Z ( J ) Z (1)
a 2 (0) =
(J 1)S
A estimativa inicial do nvel :
(S + 1) a (0)
a1 (0 ) = Z (1)
2
2
A estimativa inicial dos fatores sazonais :

t
Ct =
onde t = 1, 2, ...., JS e i o ano correspondente ao instante t.
S
1
+

m(t ).a 2 (0)

(i ) 2

Em seguida o procedimento igual ao da seo anterior.


5.3.3. Modelo Linear Sazonal Aditivo
A estrutura do modelo : Zt = a1 + a2t + t + et .
A atualizao seqencial dos parmetros anloga s equaes (5.3.7) a (5.3.10), com pequenas
modificaes, mostradas abaixo.

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

27

Atualizao do nvel (a1)

a1 (T ) = Z T m (T ) (T 1) + (1 )[a1 (T 1) + a 2 (T 1)]

(5.3.12)

Note que, do lado direito da equao (5.3.12), o termo Z T m (T ) (T 1)

representa a observao do

instante T dessazonalizada.

Atualizao da tendncia

a 2 (T ) = .[a1 (T ) a1 (T 1)] + (1 ).a 2 (T 1)

(5.3.13)

A equao de atualizao da tendncia exatamente igual do modelo multiplicativo e do mtodo de Holt


(expresses (5.3.8) e (5.2.19)).

Atualizao dos fatores sazonais j (T)

m* (T ) = [Z T a1 (T )] + (1 ) m (T ) (T 1)

(5.3.14)

*j (T ) = j (T 1); j = 1,2,..., S ; j m(T )

(5.3.15)

Note que, em (5.3.14), o termo Z T a1 (T ) uma medida da variao sazonal dos dados, obtida pela
diferena entre a observao atual e a estimativa mais recente do nvel.
Da equao (5.3.15) conclui-se que as estimativas de cada fator sazonal s so atualizadas uma vez a cada
ano, quando observamos o dado correspondente quele ms.
A previso 1 passo frente no instante T obtida substituindo-se os parmetros desconhecidos a1, a2 e
por suas estimativas, isto :

Z T +1 (T ) = [a1 (T ) + a 2 (T )] + m (T +1) (T )

(5.3.16)

importante lembrar que os fatores sazonais aditivos sofrem uma restrio diferente dos fatores
multiplicativos. No caso dos fatores aditivos, a sua soma (para todos os meses) zero.
Inicializao do mtodo
Montgomery e Johnson sugerem obter as estimativas iniciais dos parmetros atravs de um procedimento
de mnimos quadrados ordinrios, que permite a estimao simultnea dos S + 2 parmetros
desconhecidos.

Requisitos mnimos para usar o mtodo de Holt e Winters


Para modelar adequadamente a sazonalidade, necessrio pelo menos 3 anos de dados mensais e 4
anos de dados trimestrais.

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

28
Exemplo 5.3.1.
O prximo grfico exibe o nvel dos reservatrios (isto , a combinao das usinas hidroeltricas) na regio
Sudeste do Brasil entre Janeiro de 1989 e Agosto de 2001.
Nvel dos Reservatrios - Sudeste
100
90
80
70
60
50
40
30
20
10

ja
n

/8
9
ju
l/8
9
ja
n/
90
ju
l/9
0
ja
n/
91
ju
l/9
1
ja
n/
92
ju
l/9
2
ja
n/
93
ju
l/9
3
ja
n/
94
ju
l/9
4
ja
n/
95
ju
l/9
5
ja
n/
96
ju
l/9
6
ja
n/
97
ju
l/9
7
ja
n/
98
ju
l/9
8
ja
n/
99
ju
l/9
9
ja
n/
00
ju
l/0
0
ja
n/
01
ju
l/0
1

Os resultados de um modelo Holt-Winters ajustado a esta srie so:


Constante
Componente Amortec.
Nvel
0.540
Tendncia
0.002
Sazonalidade
0.529

Valor
Final
25.109
-0.179

Os fatores sazonais multiplicativos estimados so:


Fatores Sazonais
Jan
Fev
Mar
Abr
Mai
Jun
Jul
Ago
Set
Out
Nov
Dez

1.028
1.181
1.282
1.241
1.176
1.126
1.052
0.936
0.877
0.751
0.727
0.829

Este modelo foi ento ajustado at Dezembro de 2000 e as previses obtidas para o perodo entre Janeiro e
Agosto de 2001 para testar sua capacidade preditiva. A prxima tabela apresenta os valores reais e
ajustados no perodo, alm dos erros percentuais de previso.
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com

29

Limite
Erro de
Limite Inferior
Superior
previso
Data
do IC 95% Previso do IC 95% Valor Real (em %)
jan/01
24.3
48.9
-5.2
36.6
31.4
fev/01
27.4
59.0
-9.8
43.2
33.4
mar/01
28.1
65.1
-12.1
46.6
34.5
abr/01
24.6
63.7
-12.0
44.2
32.2
mai/01
20.7
61.2
-11.2
40.9
29.7
jun/01
17.2
59.0
-9.6
38.1
28.6
jul/01
13.7
56.3
-8.2
35.0
26.8
ago/01
9.4
52.3
-7.4
30.9
23.5

Os erros so bastante grandes, o que certamente conseqncia de uma mudana no padro de evoluo
dos reservatrios, que se torna ntida a partir de 2001. Note que, neste ltimo ano, a amplitude no nvel de
reservatrios bem menor que nos anos anteriores, indicando que no foi possvel recuperar o nvel dos
reservatrios com as chuvas de vero. Portanto, (pelo menos a posteriori) clara a necessidade de impor o
racionamento de energia (iniciado em Junho de 2001).
Se agora consideramos apenas as previses um passo frente, a capcidade preditiva do modelo
sensivelmente melhor, como indicado na prxima tabela. Os erros, especialmente nos meses de inverno,
so sensilvelmente reduzidos.
Previses um passo frente
Limite
Limite
Inferior do
Superior
IC 95% Previso do IC 95% Valor Real
Data
jan/01 24.3
48.9
36.6
31.4
fev/01 24.9
53.5
39.2
33.4
mar/01 23.3
53.9
38.6
34.5
abr/01 20.1
49.3
34.7
32.2
mai/01 17.5
44.8
31.1
29.7
jun/01 15.7
41.3
28.5
28.6
jul/01 14.5
38.2
26.4
26.8
ago/01 13.0
34.2
23.6
23.5

Erro de
previso
(em %)
-5.2
-5.8
-4.1
-2.5
-1.4
0.1
0.4
-0.1

5.4. Modelos ARIMA de Box e Jenkins no sazonais


A classe de modelos ARIMA de Box e Jenkins talvez a classe mais geral de modelos de previso para
sries temporais. Nesta seo faremos uma breve introduo a estes modelos, e iremos considerar apenas
os modelos para sries no sazonais.
Modelos ARIMA podem ser aplicados a sries estacionrias ou no. A condio necessria para a
aplicao destes modelos a sries no estacionrias que a estacionariedade possa ser obtida atravs de
diferenas e/ou transformaes no lineares da srie original (por exemplo, logaritmo ou raiz quadrada).

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

30
A abreviao ARIMA em Ingls significa "Auto-Regressive Integrated Moving Average", ou seja, autoregressivo, integrado e mdias mveis. Os termos autoregressivos correspondem a defasagens da srie
transformada, e os termos mdias mveis ("moving averages") referem-se s defasagens dos erros
aleatrios. Finalmente, o termo "integrado" refere-se ao processo de diferenciar a srie original para torn-la
estacionria.
Modelos "Random Walk" (passeio aleatrio), autoregressivos e de amortecimento exponencial so apenas
casos particulares de modelos ARIMA.
Uma srie temporal {Z1, Z2, ..., ZT} pode ser encarada como uma realizao de um processo estocstico.
Para descrevermos completamente um processo estocstico precisamos especificar a distribuio conjunta
do vetor {Z1, Z2, ..., ZT}. Suponha que os Zt s so conjuntamente Gaussianos. Ento, para conhecer a sua
distribuio conjunta, basta especificar o vetor de mdias {1, 2, ...., T} e a matriz de varincia-covarincia
. Mas, uma matriz simtrica de dimenso T, e contm T(T+1)/2 elementos diferentes. Logo, a completa
especificao deste processo requer o conhecimento de T + T(T+1)/2 parmetros. Podemos perceber
claramente que inferir sobre todos estes parmetros com base em apenas uma realizao do processo
uma tarefa impossvel, e portanto algumas simplificaes devem ser feitas. A hiptese simplificadora mais
comum estacionariedade.
Dizemos que um processo estocstico estacionrio se ele atingiu o equilbrio. Em termos formais, num
processo estacionrio, a distribuio de probabilidade conjunta nos instantes t1, t2, ...., tm a mesma que a
distribuio nos instantes t1 +k, t2 + k, ...., tm + k para qualquer k, ou seja, um descolamento de k unidades
de tempo no afeta a distribuio de probabilidade conjunta. Note que, nesta definio, m arbitrrio. Se
tomarmos m = 1 acima, segue que, num processo estacionrio, a distribuio marginal de Zt a mesma que
a distribuio marginal de Zt+k. Logo, a distribuio marginal de Zt no depende do instante de tempo
escolhido e, em particular, a mdia e varincia de Zt so constantes para qualquer t. Analogamente, se m =
2, as distribuies de probabilidade bivariadas p(Zt, Zt+k) no dependem de t, e ento a covarincia entre Zt
e Zt+k depende apenas do lag k.
Em resumo, a condio de estacionariedade implica em:
Mdia do processo constante;
Varincia do processo constante;
Covarincia entre Zt e Zt+k depende apenas do lag k.
Um processo dito fracamente estacionrio (ou estacionrio de 2a. Ordem) se estas trs condies so
satisfeitas. Note que estas condies referem-se apenas aos dois primeiros momentos da distribuio de
probabilidade dos Zts, o que explica a terminologia processo estacionrio de 2a. ordem" . A definio de
estacionariedade mais geral envolve momentos de todas as ordens (m arbitrrio na definio) e muito
mais complicada de verificar que a estacionariedade de segunda ordem. Se os Zt s so conjuntamente
Gaussianos, as duas condies (estacionariedade estrita e estacionariedade de 2a. ordem) so
equivalentes.
Algumas das definies a seguir j foram apresentadas no captulo 2, e esto novamente aqui apenas para
relembrar o leitor!
Definio 5.4.1. (Autocovarincia de lag k)
A autocovarincia de lag k definida como a covarincia entre Zt e Zt+k isto :
k = Cov(Zt , Zt+k) = E[(Zt - )(Zt+k - )] para k = 0, 1,2, ....

(5.4.1)

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

31
Note que 0 = Var(Zt) = 2 pois Cov(Zt, Zt) = Var(Zt).
A autocovarincia uma das funes usadas na identificao da estrutura de um modelo ARIMA.

Definio 5.4.2. (Autocorrelao de lag k)


A autocorrelao de lag k definida como:

k =

Cov (Z t , Z t + k ) k
= 2 para k = 0, 1,2, ....
Var (Z t )

(5.4.2)

Note que 0 = 1 sempre.


As definies 5.4.1. e 5.4.2. referem-se autocovarincia e autocorrelao tericas. Na prtica, apenas
observamos uma srie temporal, e estas funes devem ser estimadas a partir da srie. A seguir definimos
a autocovarincia e autocorrelaes amostrais, isto , calculadas a partir dos dados observados (ou seja, a
partir da srie temporal). Normalmente iremos nos referir funo de autocorrelao como ACF (do ingls,
Autocorrelation Function).
Tambm, pela estacionariedade do processo,

k = -k , e portanto basta

fazer o grfico para as

autocorrelaes com lags positivos. Este grfico chamado de correlograma.

Definio 5.4.3. (Autocovarincia amostral de lag k)

ck =

1 T -k
(Z t Z ).(Z t + k Z z )
T t =1

(5.4.3)

Note que, para o lag zero, esta expresso torna-se:

c0 =

1 T
(Z t Z ) 2

T t =1

que a varincia amostral da srie.

Definio 5.4.4. (Autocorrelao amostral de lag k)


T-k

c
rk = k =
c0

(Z

Z ).( Z t + k Z )

t =1

(5.4.4)

(Z

Z)

t =1

Da expresso (5.4.4) segue que r0 = 1 sempre!


Essas estimativas so assintoticamente no-tendenciosas quando T (o tamanho da srie) . Em geral
deve-se ter T 50 (e k T/4).
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com

32
Frmula de Bartlett
Sob a hiptese k = 0 para todo lag k > U (onde U indica um lag grande) segue que:

cov(rk , rk s )

1 U
i iS
T i = U + s

Valores sucessivos de rk podem exibir altas correlaes e portanto as autocorrelaes estimadas podem
levar a concluses errneas.
Fazendo s = 0 na equao anterior leva a:

Var (rk )

1 U 2
i
T i = U

Para T grande e sob a hiptese k = 0, a distribuio de rk aproximadamente Normal com mdia zero e
varincia

1 U 2
i . Na prtica substitui-se as correlaes (desconhecidas) na expresso acima por seus
T i = U

estimadores rk e ento:

Var (rk )

U
1

1 + 2 ri 2
T
i =1

Esta frmula ser usada para obter intervalos de confiana para rk. Tambm, se o tamanho (T) da srie
grande, rk aproximadamente Normal com mdia zero, e os intervalos de confiana podem ser construdos
a partir desta distribuio.

Justificativa Terica para os Modelos ARMA e ARIMA


Um modelo ARIMA no sazonal classificado como um modelo ARIMA(p,d,q) onde: p o nmero de
termos autoregressivos, d o nmero de diferenas no sazonais e q o nmero de termos mdias
mveis. Note que p, d e q so todos inteiros maiores ou iguais a zero.
Alguns casos particulares importantes so:

ARIMA(0,1,0)
ARIMA(1,1,0)
ARIMA(0,1,1) sem termo constante
ARIMA(0,1,1) com termo constante

passeio aleatrio ("random walk")


modelo auto-regressivo de ordem 1 aplicado srie diferenciada
amortecimento exponencial simples
amortecimento exponencial simples com crescimento

Seja {a1, a2, ..., aT} uma seqncia de variveis independentes e identicamente distribudas com mdia zero
e varincia constante, isto , os ats so um rudo branco. Considere uma outra seqncia {w1, w2, ..., wT},
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com

33
que representa um processo estocstico estacionrio. Note que os ws exibem dependncia serial. A Teoria
Geral de Sistemas nos permite gerar a seqncia dos ws a partir de uma combinao linear infinita de
rudos brancos. Esquematicamente temos:

Rudo Branco

at

Modelo
Linear

Ou seja,
wt = at - 1 at-1 - 2 at-2 - ....

Proc.
Estacionrio

wt

(memria infinita)

(5.4.5)

A prxima definio nos permite escrever de maneira conveniente os polinmios que aparecem na
modelagem ARIMA de Box e Jenkins.
Definio 5.4.5. (Operador de atraso, backward shift operator )
O operador de atraso B definido como: B.wt = wt-1. Tambm, suas potncias so dadas por:
Bk wt = wt-k .
Logo, a expresso (5.4.5) pode ser reescrita em termos de um polinmio infinito envolvendo o operador de
atraso como:

wt = at 1 at B 2 at B 2 ....
wt = (1 - 1 B - 2 B 2 ...) a t = ( B)at
A expresso anterior pode ser invertida, e a seqncia {at} pode ser expressa em termos dos wt s como:
w t = ( B ) a t a t = ( B ) 1 w t
1
424
3
( B)

onde: (B) = 1 - 1 B - 2 B2 .....

(5.4.6)

Na prtica, as representaes (5.4.5) e (5.4.6) no so implementveis, pois os respectivos polinmios em


B so de grau infinito, e precisaramos estimar um nmero infinito de coeficientes. Box e Jenkins
propuseram uma representao equivalente, na qual o polinmio infinito (B) substitudo pelo quociente
de dois polinmios de graus finitos.
Um exemplo elementar deste argumento dado pela srie Geomtrica. O polinmio infinito (B) = 1 + B +
B2 + B3 + ..... igual a 1/(1-B) (se |B| < 1) e portanto igual razo de dois polinmios (um numerador
constante e um denominador de grau um).
Exemplo 5.4.6.
Considere o modelo: wt = at - .at-1 = (1-.B).at onde || < 1 e os at s formam uma seqncia de rudos
brancos. Neste caso, (B) = 1-.B e o polinmio (B) pode ser encontrado facilmente:
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com

34

(B ) = { (B )}1 =

1
= 1 + .B + 2 .B 2 + 3 .B 3 + ......
1 .B

Box e Jenkins propem escrever (B) como a razo de dois polinmios em B, ou seja:
(B )
(B ) =
(5.4.7)
(B )
Onde:
(B) = 1 - 1B - 2B2 ....-qBq um polinmio de grau q, chamado de Polinmio MA(q), e
(B) = 1 - 1B - 2B2 ....-pBp denominado polinmio AR(p).
Substituindo (5.4.7) em (5.4.5) leva a:
wt = (B ).a t =

(B )
.a t (B ).a t = (B ).wt
(B )

Isto :

(B ).wt = (B ).at

(5.4.8)

O modelo (5.4.8) chamado de ARMA(p,q). Note que o parmetro p indica a ordem do polinmio (B)
(polinmio AR), enquanto q o grau do polinmio (B) (polinmio MA).

Exemplo 5.4.7. (Modelo AR(p))


Os modelos AR(p) (ou modelos autoregressivos de ordem p) j foram apresentados no captulo 2, e so
apenas um caso particular do ARMA(p, q) fazendo q = 0. A estrutura do modelo AR(p) :

(B ).wt = at (1 1 .B 2 .B 2 .... p .B p )wt = at

(5.4.9)

wt = 1 .wt 1 + 2 .wt 2 + ... + p .wt p + at


Um caso particular importante o modelo AR(1), dado por: wt = 1.wt-1 + at.

Exemplo 5.4.8. (Modelo MA(q))


O modelo MA(q) (modelo mdias mveis (ou moving average )de ordem q) apenas um modelo ARMA(p,
q) no qual p = 0. Pela equao (5.4.8) temos a seguinte estrutura:

wt = (B ).at wt = 1 1 .B 2 .B 2 .... q .B q at
wt = at + 1 .at 1 + 2 .at 2 + .... + q .at q

(5.4.10)

O modelo MA(1) escrito como: wt = at + 1.at-1.

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

35
Exemplo 5.4.9. (Modelo ARMA(1,1))
Nesta caso p = q = 1 na equao (5.4.8) e o modelo :
(1 - 1B)wt = (1- 1B)at e ento:
wt - 1wt-1 = at - 1at-1
Ou seja:
wt = 1wt-1 + at - 1at-1
Exemplo 5.4.10. (Modelo ARMA(2,2))
A equao do modelo :
(1 - 1B - 2B2)wt = (1- 1B - 2B2)at e ento:
wt - 1wt-1 - 2wt-2 = at - 1at-1 - 2at-2
Ou seja:
wt = 1wt-1 - 2wt-2 + at - 1at-1 - 2at-2
Condies de Estacionariedade e Inversibilidade dos modelos ARMA(p,q)
Num processo ARMA(p,q) como o da equao (5.4.8) precisamos verificar quais as condies a serem
impostas sobre os coeficientes i's (ou i's, i's e i's) para garantir a estacionariedade e a inversibilidade do
processo wt.
Existem dois tipos de condies de interesse:
1) Condio de estacionariedade
2) Condio de inversibilidade
Examinaremos inicialmente a condio de estacionariedade.
Se a entrada de um filtro linear como (5.4.5) um rudo branco (que sempre estacionrio) ento a sada
do filtro (wt) s pode ser no estacionria se houver alguma instabilidade no comportamento do filtro. Isso
nos permite encontrar as restries necessrias sobre os parmetros do filtro (isto , as condies que
devem ser aplicadas aos i s e j s) para garantir a estacionariedade da srie de sada wt.
Pode-se mostrar que se wt = (B)at ento a funo de autocovarincia do processo {wt} :

k = Cov(wt , wt-k) =

2 j . j k
j =0

Em particular, a varincia de wt dada por:


VAR(wt ) = 2

onde 0 = 1 e 2 a varincia de at. Logo, a varincia de wt finita apenas quando:

j =0

<

i =1

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

36
Logo, a varincia do processo de sada no vai convergir para uma constante se os pesos 0, 1, ... no

decarem para zero rapidamente. Ou seja, o processo {wt} no estacionrio se a soma

for infinita.

i =1

Isso implica na necessidade de restringir os pesos i para que o filtro seja estvel e, conseqentemente, o
processo de sada seja estacionrio.

Box e Jenkins mostram que a srie (B ) =

.B
j =0

converge se |B| 1.

Ou seja:

O processo {wt } estacionrio se os zeros de (B) = 0 estiverem dentro do crculo unitrio

A idia de inversibilidade est relacionada com a possibilidade de escrevermos a srie de rudo branco
como sada de um filtro linear cuja entrada a srie estacionria {wt}. Em linhas gerais, o processo {wt}
inversvel se podemos escrever a expresso (5.4.6), isto , se:

a t = ( B) 1 wt
1
424
3
( B)

a t = (B ).wt
onde (B) = 1 - 1 B - 2 B2 .....
Note que (B) = -1(B) e ento os coeficientes I s podem ser encontrados a partir dos Is e vice versa. A
condio de inversibilidade aplicada aos coeficientes I, e totalmente independente da condio de
estacionariedade.

Dizemos que o processo {w t} inversvel se

i =0

< , o que implica na convergncia da srie dentro

do crculo unitrio. Note que a condio de inversibilidade anloga condio de estacionariedade, mas a
primeira aplicada ao polinmio (B), enquanto a segunda refere-se ao polinmio (B).
A seguir examinaremos as condies de estacionariedade e inversibilidade para processos ARMA escritos
na forma (5.4.8), ou seja:
wt = (B ).a t =

(B )
.a t (B ).a t = (B ).wt
(B )

O polinmio (B) pode ser escrito em termos dos polinmios MA e AR como:

(B ) =

(B )
= (B ). 1 (B )
(B )
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com

37
Exemplo 5.4.11. (Estacionariedade dos modelos AR(1))
Considere o modelo AR(1) dado por:

wt =

1
1
.a t
.a t =
(B )
1 1 .B

Neste caso (B ) =

1
1 1 .B

= 1 + 1 .B + ( 1 .B ) + .....
2

(5.4.11)

Para garantir a estacionariedade do processo precisamos que (B) convirja para |B| 1. Mas, por (5.4.11),
esta srie converge apenas quando | 1 | < 1. Como a raiz (B ) = 1 1 .B B = 1/1, segue que | 1 | < 1
implica numa raiz deste polinmio situada fora do crculo unitrio.
Logo, a condio raiz de (B) dentro do crculo unitrio equivalente condio raiz de (B) fora do
crculo unitrio, e assim, a estacionariedade estar garantida se a raiz do polinmio (B) = 1 - 1.B estiver
for a do crculo, ou seja, se | 1 | < 1.
Exemplo 5.4.12. (Estacionariedade dos processos AR(p))
Considere um processo AR(p) dado pela equao:

wt =

1
1
.a t
.a t =
(B )
1 1 .B 2 .B 2 ... p .B p

Note que (B) pode ser escrito como:

(B ) = (1 G1 .B )(1 G 2 .B )....(1 G p .B )
onde 1/G1, 1/G2, ..., 1/Gp so as razes de (B) = 0.
Se expandirmos 1/(B) em fraes parciais obtemos:
o
ki
1
wt =
.a t =
.a t
(B )
i =1 1 G i .B

Para garantir a estacionariedade do processo {wt} precisamos que o polinmio (B) = -1 (B) convirja
quando | B| 1, o que implica em:
| Gi | < 1, isto , | 1/Gi | > 1 para i = 1, 2, ...p, isto , as razes de (B) = 0 esto fora do crculo unitrio.

Em resumo:
Um processo AR(p) estacionrio se as razes do polinmio (B) = 0 esto fora do crculo unitrio.

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

38
Exemplo 5.4.13. (Estacionariedade dos processos AR(2))
O processo AR(2) pode ser escrito como:

wt =

1
1
.a t
.a t =
(B )
1 1 .B 2 .B 2

Para garantir a estacionariedade, as razes do polinmio: (B ) = 1 1 .B 2 .B precisam estar fora do


crculo unitrio. Isto implica que os parmetros 1 e 2 precisam estar na regio triangular:
2

2 + 1 < 1
2 1 < 1
1< 2 <1
-1

2
Razes reais

Razes
Complexas

+1
-2

+2

Exemplo 5.4.14. Estacionariedade dos processos AR(2)


Em todos os casos a seguir, verifique se as condies de estacionariedade so satisfeitas.

Processo
wt = 0.7wt-1 + 0.4wt-2+at
wt = 0.7wt-1 + 0.2wt-2+at
wt = -0.4wt-1 + 0.8wt-2+at
wt = +0.4wt-1 + 0.8wt-2+at
wt = 0.8wt-1 - 0.4wt-2+at

1
+0.7
+0.7
-0.4
+0.4
+0.8

2
+0.4
+0.2
+0.8
+0.8
-0.4

Estacionrio?
No
Sim
No
No
Sim

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

39
Exemplo 5.4.15. (Estacionariedade dos processos MA(q))
Considere um processo MA(q) dado por:

wt = (B ).at wt = 1 1 .B 2 .B 2 .... q .B q at
wt = at + 1 .at 1 + 2 .at 2 + .... + q .at q
Neste caso (B) = (B) um polinmio finito de grau q, e portanto a convergncia trivial.

Logo, um modelo MA(q) sempre estacionrio!

Exemplo 5.4.16. (Estacionariedade de um processo ARMA(p,q))


A equao geral do processo :

(B ).wt = (B ).at
Podemos representar este processo esquematicamente como:

at

(B)

-1(B)

Rudo
branco

wt
Processo
Estacionrio

Seja bt = (B).at. O processo bt a sada de um modelo MA(q), e portanto um processo estacionrio.


Para garantir que {w t} seja estacionrio basta que (B) satisfaa as condies de estacionariedade
de um processo AR(p).
Logo, um modelo ARMA(p, q) estacionrio se as razes do polinmio (B) = 0 esto fora do crculo
unitrio.

Exemplo 5.4.17. (Inversibilidade dos processos AR(p))


Seja o processo AR(p) dado por:

(B ).wt = at

(5.4.12)

Note que, nesta equao o rudo escrito explicitamente como funo da srie estacionria wt e portanto
(5.4.12) j define um processo inversvel. Tambm, o polinmio AR tem grau finito e assim segue que um
processo AR(p) trivialmente inversvel.
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com

40

Neste caso,

(B ) = (B ) , que um polinmio de grau finito p.

Exemplo 5.4.18. (Inversibilidade de um MA(1))


Considere um processo MA(1):
wt = (1-.B)at
Logo:

at =

1
1 .B

wt

(1 + .B +
=

.B 2 + ... + k .B k
wt
1 k +1 .B k +1
2

Ou seja, escrevendo wt em termos de seus valores passados e de at encontramos:

wt = .wt 1 2 .wt 2 .... k .wt k + a t k +1 .a t k

(5.4.13)

Nesta expresso, os coeficientes j do polinmio (B) so os -j.


No importa qual o valor de , o processo wt ser estacionrio, pois um processo MA(1), e estes so
trivialmente estacionrios. Mas, se | | 1, o valor atual de wt depende dos valores passados wt-1, wt-2,
....wt-k com pesos crescentes medida que o lag aumenta. Podemos evitar esta situao se forarmos | |
< 1, e neste caso dizemos que o processo inversvel.
Na expresso (5.4.13) se supormos | | < 1 e tomarmos o limite quando k tende a infinito teremos:

wt = .wt 1 2 .wt 2 3 .wt 3 .... + a t


Ou seja, o processo wt (um MA(1) inversvel) pode ser escrito como um AR de ordem infinita e estacionrio
( pois | | < 1 por hiptese).
Este resultado , na verdade, mais geral do que se possa supor primeira vista:

MA(q) = AR() e
AR(p) = MA()

Note que a condio de inversibilidade , neste caso | | < 1 e equivale condio: raiz de (B) = (1-.B) =
0 fora do crculo unitrio.
Exemplo 5.4.19. (Inversibilidade de um modelo MA(2))
A condio de inversibilidade de um modelo MA(2) completamente anloga condio de
estacionariedade de um processo AR(2). Para garantir a inversibilidade, precisamos que a seguinte
condio seja satisfeita: razes de (B) = 0 fora do crculo unitrio. Em termos dos coeficientes que
definem o processo estas condies podem ser escritas como:
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com

41
2 + 1 < 1
2 - 1 < 1
-1 < 2 < 1
E a regio de inversibilidade do processo indicada na figura a seguir.
-1

2
Razes reais

Razes
Complexas
+1
-2

+2

Exemplo 5.4.20. (Inversibilidade de um modelo ARMA(p,q))


A inversibilidade do modelo ARMA(p,q) s depende da parte MA do modelo, pois a parte AR trivialmente
inversvel. O modelo ARMA(p,q) ser inversvel se as razes de (B) = 0 estiverem fora do crculo unitrio.
Exemplo 5.4.21. (Estacionariedade e inversibilidade de um modelo ARMA(1,1))
Como j mencionado, as condies de estacionariedade e inversibilidade so independentes. Tambm,
para garantirmos a estacionariedade precisamos olhar apenas para a parte AR(1) do modelo, e a
inversibilidade assegurada olhando-se s para a parte MA(1) do modelo. Assim, para garantir que o
modelo ARMA(1,1) seja estacionrio e inversvel precisamos das seguintes condies:

Estacionariedade: |1 | < 1
Inversibilidade: |1 | < 1

O processo ser estacionrio e inversvel se os parmetros 1 e 1 estiverem na regio abaixo:

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

42
1
+1

-1

+1
0

-1

Definio 5.4.22. Funo de Autocorrelao Parcial (PACF)


A funo de autocorrelao parcial mede a dependncia linear entre wt e wt+k , eliminando o efeito das
variveis intermedirias wt+1 , wt+2 , ... , wt+k-1. A funo de autocorrelao parcial usada para
identificar a ordem de um modelo AR(p). Note que necessrio usar uma outra funo, alm da ACF, para
identificar a ordem de um modelo AR, pois todos os modelos AR tm uma ACF que decresce
exponencialmente, e portanto apenas o correlograma no traz informao sobre o grau p do polinmio
autoregressivo na representao ARMA.

Considere um modelo AR(p).


Uma maneira de definir a PACF atravs da regresso linear de wt+k em wt+k-1 ...wt , ou seja:
wt+k = k1 wt+k-1 + k2 wt+k-2 + ... + kk wt + et+k
Multiplicando ambos os lados da equao acima por wt+k-j e tomando o valor esperado tem-se:

E[ wt + k .wt + k j ] = k1 .E[ wt + k 1 .wt + k j ] + k 2 .E[ wt + k 2 .wt + k j ] + ... + kk .E[ wt .wt + k j ] + E[et + k .wt + k j ]
Fazendo j = 1, 2, ..., k e levando em conta que k = -k obtemos o seguinte sistema de k equaes com k
incgnitas (k1 , k2 , ..., kk):

o 1 .... k 1 k1 1

1 o .... k 2 k 2 2
. = .
. .
.

.
. .
. .

k 1 k 2 .... o kk k

(5.4.14)

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

43
As equaes (5.4.14) so conhecidas como equaes de Yule-Walker. Elas fornecem um algoritmo
simples para determinar a ordem de um processo AR. Na prtica, os j s na equao acima so
substitudos por seus estimadores rj.
A resoluo do sistema (5.4.14) para todo k fornece as autocorrelaes parciais de lag 1, 2, .... Pela regra
de Cramer aplicada ao sistema anterior temos:

kk

1 2 .....
1

2 .....
1
det 1

.....

k -1 k - 2 k -3 ....
=
1 2 .....
1

2 .....
1
det 1

.....

k -1 k - 2 k -3 ....

1
2

k
k 1
k -1

(5.4.15)

Ou seja, a matriz no numerador em (5.4.15) a mesma que a matriz no denominador, exceto pela ltima
coluna, que substituda por [ 1, 2, ..., k]t.

Em particular, 11 = 1 sempre, e

22

1
det
1
=
1
det
1

1
2 2 12
=
1 1 12
1

Pode-se provar que, num processo AR(p), as autocorrelaes parciais so nulas para todos os lags
maiores que p. Logo, o grfico da PACF nos permite identificar o grau do polinmio AR, pois a partir
de um certo lag todas as autocorrelaes parciais so nulas. Por exemplo, veja Box, Jenkins e
Reinsel (1994), pgina 66.
Exemplo 5.4.23. Comportamento da ACF e PACF para o modelo AR(p)
Considere um modelo AR(p), cuja equao :
(1 - 1 B - 2 B2 - ... - p Bp ).wt = at
Isto :
wt = 1wt-1 + 2wt-2 +...+ pwt-p + at
Multiplicando por wt-k e tirando o valor esperado, lembrando que E(wt .wt-k) = k , obtm-se:
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com

44
E(wt . wt-k ) = 1 . E(wt-1 . wt-k ) + 2 . E(wt-2 . wt-k ) + ... + p . E(wt-p . wt-k ) + E(at . wt-k)
k = 1 k-1 + 2 k-2 + ... + p k-p
Como k = k / 0 , obtm-se finalmente:
k = 1 k-1 + 2 k-2 + p k-p
Ou seja, as autocorrelaes de um processo AR(p) satisfazem a equao: (B).k = 0.
A ACF do modelo AR(p) obtida por uma equao de diferenas de ordem p, cuja soluo formada por
uma mistura de exponenciais e/ou senides amortecidas.

Em resumo:
para um AR(p) tem-se:
ACF:

k x k exponenciais e/ou senides amortecidas

PACF: kk x k corte brusco no lag k = p

Exemplo 5.4.24. (ACF e PACF de um modelo AR(1) )


Considere um modelo AR(1) estacionrio, isto : (1-1 ,B)Zt = at onde |1| < 1. Ento a autocorrelao de

lag k k = 1k. As autocorrelaes parciais so:


11 = 1 = 1

22

1 1
det

2
2
2
1 2 = 2 1 = 1 1 = 0
=
1 1
1 12
1 12
det

1 1

e kk = 0 para k = 3, 4, 5, ....
Os grficos da ACFe PACF tericas so mostrado a seguir.

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

45

ou

k = 1k

A PACF s diferente de zero no lag 1, e exibe um corte brusco aps este lag. Logo, num processo AR(1)
apenas a primeira autocorrelao parcial no nula, e o grfico da PACF versus o lag exibe um corte
brusco.
Resultado 5.4.25. (Intervalo de Confiana para a PACF Frmula de Quenouille)
Seja kk o estimador da autocorrelao parcial de lag k, encontrado pela substituio dos i pelos seus
estimadores ri nas equaes de Yule-Walker.
Ento:

( )

1
onde T o tamanho da srie.
T
Para T grande, tem aproximadamente a distribuio Normal.
Var kk

kk

Exemplo 5.4.26. (ACF e PACF do modelo MA(q))


Considere um modelo MA(q), isto :
wt = (B)at wt = (1 - 1B - 2B2 ... qBq)at
wt = at - 1 at-1 - 2at-2 - ... - qat-q
Multiplicando a equao anterior por wt-k e tomando o valor esperado leva a:
E(wt . wt-k) = E[(at - 1 at-1 - ... - q at-q)(at-k - 1 at-k-1 - ... - q at-k-q)]
Ou seja, a autocovarincia de lag k :
k = (-k + 1k+1 + q-kq) onde k = 1, 2, ..., q e k = 0 para lags maiores que q.
Como k = k / 0 conclui-se que:
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com

46

k =

( k + 1 k +1 + ... + q k q )
(1 + 12 + ... + q ) 2

k = 1,2,..., q e

k = 0 se k > q
Ou seja, num processo MA(q) a ACF tem um corte brusco a partir do lag q+1.
Pela propriedade de inversibilidade, um modelo MA(q) equivale a um AR() e ento a regresso de wt+k
nos ws anteriores (que usada para definir a PACF) indica que kk no possuir a propriedade de corte
brusco; decaindo com k.
Em resumo:
Num modelo MA(q) tem-se:
ACF: apresenta um corte brusco no lag k = q
PACF: tem o comportamento de exponenciais e/ou senides amortecidas, e ento no apresenta corte
brusco.

Exemplo 5.4.27. (Modelo MA(1))


wt = (1 - 1B)at
O processo trivialmente estacionrio, e inversvel quando | 1 | < 1. A varincia do processo dada por:
1
0 = Var (wt ) = a2 1 + 12 , e as autocorrelaes so: 1 =
e k = 0 se k > 1.
1 + 12

A k-sima autocorrelao parcial (vide Box, Jenkins e Reinsel (1994), pgina 73):
k 1 2
kk = 1 2 k + 21
1 1

)
)

Como kk < 1k , a funo de autocorrelao parcial dominada por uma exponencial amortecida. Se 1 for
positivo (e ento 1 negativo), as PACFs tm sinais alternantes. Ao contrrio, se 1 for positivo, as
autocorrelaes parciais so todas negativas.

Existe uma dualidade no comportamento das funes ACF e PACF para os modelos AR(p) e MA(q),
ou seja, o aspecto da PACF de um processo AR tem um corte brusco (assim como a ACF de um MA),
e a ACF de um AR tem a cara da PACF de um MA (senides amortecidas e/ou decrscimo
exponencial).

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

47
Exemplo 5.4.28. (Modelo ARMA(p,q))
A estrutura do modelo :

(B ).wt = (B ).a t

Box, Jenkins e Reinsel (1994, pgina 79) mostram que a funo de autocorrelao tem a forma:

k = 1 k 1 + 2 k 2 + .... + p k p para k = q + 1, q + 2, q + 3 ,....


k = 1 k 1 + 2 k 2 + .... + p k p

(5.4.16)

a2
( k 0 + k +1 1 + .... + q q k ) para k = 0, 1,... q
0

onde usamos a conveno: 0 = -1, 0 a varincia do processo wt e os i s so os coeficientes do


polinmio (B) na expanso wt = (B).at.
A varincia do processo wt dada por:

0 = 1 1 + 2 2 + .... + p p + a2 (1 1 1 .... q q )
Esta expresso precisa ser resolvida em conjunto com as equaes (5.4.16) para k = 1, 2, ...p para obter 0,
1, ...., p.
A funo de autocorrelao parcial infinita, e eventualmente se comporta como a PACF de um processo
MA puro, sendo dominada por uma mistura de exponenciais amortecidas e/ou senides, dependendo da
ordem do polinmio MA e de seus parmetros.
Exemplo 5.4.29. (Processo ARMA(1,1))
A estrutura do modelo :
(1- 1.B).wt = (1-1.B).at
A funo de autocorrelao encontrada pelas equaes:

0 = Var (wt ) = 1 . 1 + a2 (1 1 . 1 )
1 = 1 . 0 a2 ( 1 )
2 = 1 . k 1 para k = 2, 3, 4, .....
onde 1 = 1 - 1
Se resolvermos as duas primeiras equaes para 0 e 1, a funo de autocovarincia do processo torna-se:

0 =

1 + 12 21 1 2
a
1 12

(5.4.17)

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

48

1 =

(1 1 1 )(1 1 )
1

k = 1 . k 1

2
1

a2

(5.4.18)

para k = 2, 3, 4...

(5.4.19)

Da equao (5.4.19) segue que as autocorrelaes a partir do lag 2 tm a forma:

2 = 1 . 1

segue que

k = 1k 1 . 1

k = 1 . k 1

e como

para k = 2, 3, 4, .... . Logo, a autocorrelao decresce

exponencialmente a partir do valor inicial 1 que, por sua vez, depende dos parmetros 1 e 1 .
A primeira autocorrelao do processo pode ser escrita como:

1 =

(1 1 1 )(1 1 )
1 21 . 1 + 12

A funo de autocorrelao parcial de um processo ARMA(1,1) consiste num nico valor inicial 11 = 1 e a
partir do lag 2 comporta-se como a PACF de um processo MA(1), sendo dominada por uma exponencial.
A seguir exibimos um quadro resumo contendo as principais caractersticas dos modelos AR, MA e ARMA.

Quadro resumo das caractersticas principais dos modelos AR(p), MA(q) e ARMA(p,q)
AR(p)

MA(q)

ARMA(p,q)

Estrutura do modelo

(B)Zt = at

Zt = (B).at

(B)Zt = (B).at

Condio de
estacionariedade

Razes de
(B) = 0 fora do
crculo unitrio

Sempre Estacionrio

Razes de
(B) = 0 fora do
crculo unitrio

Condio de
inversibilidade

Sempre inversvel

Razes de
(B) = 0 fora do
crculo unitrio

Razes de
(B) = 0 fora do
crculo unitrio

Funo de
Autocorrelao
k

Infinita (Exponenciais
e/ou senides
amortecidas)

Finita (corte aps o


lag "q")

Infinita (Exponenciais
e/ou senides
amortecidas aps o
lag "q-p")

Funo de
Autocorrelao
Parcial kk

Finita (corte aps o


lag p)

Infinita (Exponenciais
e/ou senides
amortecidas)

Infinita (Exponenciais
e/ou senides
amortecidas aps o
lag "p-q")

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

49

Mas.... NA PRTICA NEM TUDO FUNCIONA COMO PREVISTO!!!!


A seguir exibimos a ACF e PACF de sries simuladas a partir dos processos AR(1) e MA(1) indicados. Note
que, para sries curtas difcil identificar os padres tericos descritos acima. Na verdade freqente
encontrar valores esprios para autocorrelaes e autocorrelaes parciais estimadas em sries curtas, o
que dificulta o processo de identificao da ordem dos polinmios AR e MA.
Exemplo 5.4.30. (Processo AR(1) com 1 = +0.8)
Geramos duas sries que seguem processos AR(1) com parmetro 1 = + 0.8. A primeira srie tem 50
observaes, e a segunda, 300 observaes. A ACF e PACF estimadas para as duas sries esto no
prximo quadro.

Srie 1 50 observaes de um processo AR(1) com


parmetro + 0.8
ACF

Srie 2 300 observaes de um processo AR(1) com


parmetro + 0.8
ACF

PACF

PACF

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

50
Exemplo 5.4.31.
.31. (Processo AR(1) com 1 = - 0.8)
Geramos duas sries que seguem processos AR(1) com parmetro 1 = - 0.8. A primeira srie tem 50
observaes, e a segunda, 300 observaes. A ACF e PACF estimadas para as duas sries esto no
prximo quadro.

Srie 1 50 observaes de um processo AR(1)


com parmetro - 0.8
ACF

PACF

Srie 2 300 observaes de um processo AR(1)


com parmetro - 0.8
ACF

PACF

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

51
Exemplo 5.4.32. (Processo MA (1) com 1 = +0.8)
Geramos duas sries que seguem processos MA(1) com parmetro 1 = +0.8. A primeira srie tem 50
observaes, e a segunda, 300 observaes. A ACF e PACF estimadas para as duas sries esto no
prximo quadro.

Srie 1 50 observaes de um processo MA (1)


com parmetro +0.8
ACF

Srie 2 300 observaes de um processo MA(1)


com parmetro +0.8
ACF

PACF

PACF

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

52
Exemplo 5.4.33. (Processo MA (1) com 1 = - 0.8)
Geramos duas sries que seguem processos MA(1) com parmetro 1 = - 0.8. A primeira srie tem 50
observaes, e a segunda, 300 observaes. A ACF e PACF estimadas para as duas sries esto no
prximo quadro.

Srie 1 50 observaes de um processo MA (1)


com parmetro - 0.8
ACF

Srie 2 300 observaes de um processo MA(1)


com parmetro - 0.8
ACF

PACF

PACF

Note que o sinal da autocorrelao parcial de lag 1 no modelo MA(1) o oposto do sinal do coeficiente 1,
ou seja, se o parmetro 1 positivo (negativo), a autocorrelao parcial de lag 1 negativa(positiva).

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

53
Exemplo 5.4.34. (Modelo AR(2) com 1 = +0.3 e 2 = +0.5 )
A seguir exibimos o grfico da ACF e PACF estimadas (a partir de uma srie de tamanho 300) de um
processo AR(2) estacionrio com 1 = +0.3 e 2 = +0.5. Note que as autocorrelaes decrescem
exponencialmente e as autocorrelaes parciais so diferentes de zero apenas nos dois primeiros lags.
300 observaes de um processo AR(2) com 1 = +0.3
e 2 = +0.5
ACF

PACF

Exemplo 5.4.35. (Modelo AR(2) com 1 = +0.3 e 2 = -0.5)


A seguir exibimos o grfico da ACF e PACF estimadas (a partir de uma srie de tamanho 300) de um
processo AR(2) estacionrio com 1 = +0.3 e 2 = -0.5
300 observaes de um processo AR(2) com 1 = +0.3
e 2 = -0.5
ACF

PACF

As autocorrelaes se alternam em sinal e decrescem para zero e apenas as duas primeiras


autocorrelaes parciais so no nulas.
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com

54
Exemplo 5.4.36. (Modelo MA(2) com 1 = +0.3 e 2 = +0.5)
A seguir exibimos o grfico da ACF e PACF estimadas (a partir de uma srie de tamanho 300) de um
processo MA(2) com 1 = +0.3 e 2 = +0.5.
300 observaes de um processo MA(2) com
+0.3 e 2 = +0.5
ACF

1 =
PACF

As autocorrelaes parciais decrescem exponencialmente, e as autocorrelaes so no nulas apenas nos


dois primeiros lags, sofrendo um corte brusco aps o segundo lag, o que permite identificar claramente a
estrutura MA(2).
Exemplo 5.4.37. (Modelo MA(2) com 1 = +0.3 e 2 = -0.5)
A seguir exibimos o grfico da ACF e PACF estimadas (a partir de uma srie de tamanho 300) de um
processo MA(2) com 1 = +0.3 e 2 = -0.5
300 observaes de um processo MA(2) com 1 =
+0.3 e 2 = -0.5
ACF

PACF

Note a significncia das duas primeiras autocorrelaes e o decrscimo das PACFs (com alternncia de
sinais).
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com

55
Exemplo 5.4.38. (Modelo ARMA(1,1) com 1 = +0.7 e 1 = +0.4)
300 observaes de um processo ARMA(1,1) com 1
= +0.7 e 1 = +0.4
ACF

PACF

Exemplo 5.4.39. (Modelo ARMA(1,1) com 1 = +0.7 e 1 = -0.4)


300 observaes de um processo ARMA(1,1) com 1 =
+0.7 e 1 = -0.4
ACF

PACF

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

56
Exemplo 5.4.40. (Modelo ARMA(1,1) com 1 = -0.7 e 1 = -0.4)
300 observaes de um processo ARMA(1,1) com 1 =
-0.7 e 1 = -0.4
ACF

PACF

Exemplo 5.4.41. (Modelo ARMA(1,1) com 1 = -0.7 e 1 = +0.4)


300 observaes de um processo ARMA(1,1) com 1 =
-0.7 e 1 = +0.4
ACF

PACF

Modelos ARIMA(p,d,q)
Na prtica estaremos freqentemente interessados em modelar sries no estacionrias na mdia, isto ,
sries que exibem uma tendncia. A metodologia ARMA pode ser estendida para lidar com certo tipo de

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

57
sries no estacionrias, conhecidas na literatura como "NO-ESTACIONRIA HOMOGNEA", conforme
ilustrado a seguir:

Uma srie no estacionria homognea pode se tornar estacionria atravs da aplicao de diferenas
sucessivas, como definido a seguir.
Definio 5.4.42. (Operador Diferena)
Seja Zt uma srie qualquer. O operador diferena aplicado a esta srie : Zt = (1-B) Zt = Zt - Zt-1.
A srie diferenciada wt = Zt - Zt-1. = (1-B) conhecido como operador diferena.
Se wt ainda no estacionrio, tenta-se uma outra diferena:
Yt
= wt - wt-1
= (1 - B)wt = (1 - B)2 Zt = 2 Zt
Em geral, deve-se aplicar tantas diferenas quanto necessrio at produzir uma srie estacionria na mdia
(isto , com nvel constante). Genericamente, a srie wt estacionria obtida pela aplicao de "d" (d = 0, 1,
2, ...) diferenas na srie original:

wt = d Zt

Em seguida, modela-se a srie estacionria wt usando a modelagem ARMA(p,q) j estudada. Neste caso
diz-se que a srie original (no estacionria) Zt segue um modelo ARIMA(p,d,q). ARIMA, em ingls,
significa Autoregressive Integrated Moving Average e o termo Integrated refere-se s d diferenas
necessrias para tornar a srie original estacionria. O parmetro d na notao ARIMA(p,d,q) indica o grau
de diferenciao da srie original e p, q so, como sempre, os graus dos polinmios AR e MA
respectivamente.
Exemplo 5.4.43. Modelo ARIMA(0,1,0)
Neste caso, p = q = 0 e d = 1 e a estrutura do modelo :

Z t = a t Z t Z t 1 = a t Z t = Z t 1 + a t
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com

58

Note que este apenas o modelo random walk


(passeio aleatrio) descrito no captulo 2
(equivalementemente, um processo AR(1) no estacionrio com parmetro =1). As prximas figuras
apresentam o grfico de uma srie random walk simulada (com tamanho T = 300) e sua ACF e PACF.

Random Walk

ACF

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

59
PACF

Exemplo 5.4.44. (Modelo ARIMA(0,1,1))


Neste caso, p = 0, d = q = 1 e a estrutura do modelo :

Z t = (1 1 B )a t Z t Z t 1 = a t 1 .a t 1 Z t = Z t 1 + a t 1 .a t 1
A seguir exibimos uma srie simulada a partir deste modelo (com 1 = 0.8), e sua ACF e PACF (antes e
depois da diferenciao).
Srie Original
6

Legend
ARI_011

-2

10

15

20

25

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

60
ACF e PACF da srie original

Srie Diferenciada uma vez


Legend

_DIFF

-1

-2

-3

10

15

20

25

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

61
ACF e PACF da srie diferenciada

Note as enormes autocorrelaes na srie original, que justificam a diferenciao.

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

62
Exemplo 5.4.45. (Modelo ARIMA(1,1,0))
Neste caso, p = d = 1 e q = 0 e a estrutura do modelo :

(1 1 B)(1 B) Z t = a t
1424
3
wt

[1- (1+1)B + 1B2]Zt = at


Zt = (1+1)Zt-1 - 1Zt-2 + at
A seguir exibimos o grfico de uma srie simulada com 1 = +0.8, sua autocorrelao e a ACF e PACF para
a srie diferenciada.
Grfico da srie original
Legend
100

ARI_110

80

60

40

20

-20

10

15

20

25

ACF da srie original

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

63
Grfico da srie diferenciada

-2

-4

10

15

20

25

ACF e PACF da Srie Diferenciada

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

64

Exemplo 5.4.46. Modelo ARIMA(1,1,1)


Aqui p = d = q = 1 e a estrutura do modelo :

(1 1 B)(1 B) Z t = (1 1 B)a t
1424
3
wt

[1- (1+1)B + 1B2]Zt = (1 - 1B)at


Zt = (1+1)Zt-1 - 1Zt-2 + at - 1.at-1

Notas:
A aplicao do operador diferena d vezes (i.e. d ) equivale a considerar "d" zeros no crculo unitrio na
parte AR do modelo, j que = 1 B.
Uma extenso dos modelos ARIMA tradicionais consiste em considerar d como fracionrio (por exemplo, d
= 0.5 ; 0.2 ; - 0.3, etc..), o que d origem aos modelos conhecidos como "fracionais" ou de "memria
longa".
Deve-se notar que d = (1-B)d diferente de (1-Bd) = Zt Zt-d.
O diagrama a seguir exibe os passos necessrios para o ajuste de modelos ARIMA de Box e Jenkins.

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

65
METODOLOGIA BOX & JENKINS
Fluxograma Operacional
Zt

d
Identificao do
Modelo

p,q

's , 's , a 2

O modelo
adequado

Estimao
Paramtrica

Testes
Estatsticos

Previses
Futuras Z t (j)

Previso Final

A seguir descrevemos os passos necessrios na implementao da metodologia.


Passo 1 Identificao
Diferencia-se a srie original Zt at encontrar uma srie com mdia constante. Note que, a princpio, as
diferenciaes sucessivas de Zt no servem para estacionarizar sries no estacionrias na varincia
(por exemplo, como sries de retornos de aes).
Exemplo 5.4.47.
No grfico a seguir apresentamos uma srie no estacionria, para a qual so necessrias duas diferenas
at encontrar uma srie estacionria.

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

66

Srie Original

3000

2500

2000

1500

1000

500

10

15

20

25

ACF da Srie Original

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

67
Grfico da Primeira Diferena da Srie

15

10

10

15

20

25

ACF da Srie Diferenciada

Note que as autocorrelaes ainda permanecem muito grandes em lags altos, e portando uma nova
diferenciao da srie necessria.

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

68

Grfico da Segunda Diferena da Srie


3

-1

-2

10

15

20

25

ACF da Srie de Segunda Diferena

Ateno: no grfico anterior, as autocorrelaes da srie de 2as. diferenas so todas zero, pois (por
construo) a srie de 2as. diferenas era apenas um rudo branco. Isso no necessariamente
verdade no caso geral, isto , geralmente sobram autocorrelaes e autocorrelaes parciais no
nulas na srie aps d diferenas; o que justificar o ajuste de um modelo ARMA a esta srie
diferenciada d vezes.

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

69

No passo de identificao de um modelo ARIMA (tambm chamado de identificao estrutural) procuramos


encontrar procedimentos que permitem identificar a estrutura do modelo, isto , conhecer os valores "p", "d"
e "q" que caracterizam a estrutura do modelo ARIMA para a srie temporal em estudo.
Um ponto importante na identificao do modelo ARIMA parcimnia, ou seja, deve-se buscar o modelo
com melhor ajuste e menor nmero possvel de parmetros. Em outras palavras, dados dois modelos com
ajustes igualmente bons, escolha aquele com menor nmero de parmetros. Existem duas justificativa para
isso: i) simplicidade na estrutura identificada, o que permite uma melhor compreenso do processo
subjacente e ii) em geral modelos superparametrizados so ruins em termos preditivos, pois se ajustam
bem ao que acontece dentro da amostra mas no conseguem generalizar o comportamento da srie.
Na verdade, o princpio da parcimnia geral, e deve ser aplicado em qualquer problema de modelagem
estatstica, e no apenas na modelagem ARIMA.
O primeiro passo na identificao de um modelo ARIMA para representar uma srie temporal a escolha da
ordem de diferenciao, ou seja, quantas diferenas so necessrias para transformar a srie original numa
srie estacionria.
Em geral, o nmero correto de diferenas a menor ordem de diferenciao tal que a srie resultante flutue
ao redor de um valor mdio bem definido e cuja funo de autocorrelao decaia a zero rapidamente. Se,
aps a diferenciao, o grfico da ACF da srie ainda exibe valores significantes em defasagens altas,
necessrio diferenciar a srie mais vezes.
Um modelo com d = 0 supe que a srie original estacionria. Se a ordem de diferenciao 1, a srie
original tem uma tendncia constante, enquanto nos modelos em que d maior ou igual a 2, a srie original
tem uma tendncia variante no tempo.
O processo de diferenciao da srie tende a introduzir correlaes negativas. Se a srie original exibe altas
autocorrelaes positivas, ento uma diferena no sazonal ir reduzir as autocorrelaes e talvez at levar
a autocorrelao de lag 1 a ter um valor negativo. A aplicao de uma segunda diferena no sazonal
muitas vezes torna a autocorrelao de lag 1 ainda mais negativa.
Deve-se tomar cuidado para no diferenciar a srie original mais do que o necessrio para torn-la
estacionria. Alguns indcios de sobre-diferenciao podem ser obtidos a partir da ACF ou do prprio grfico
da srie. Uma srie sobre-diferenciada pode parecer aleatria primeira vista, mas geralmente percebe-se
a existncia de alguns padres suspeitos, por exemplo: autocorrelao de lag 1 muito negativa (entre 0.6
e 1), trocas de sinal entre uma observao e a prxima, indicando a existncia de um padro repetitivo do
tipo para cima, para baixo, para cima, para baixo ...
(i) Identificao de "d"
Verifica-se pelo grfico das sries diferenciadas

d Z
~

; d = 0, 1, 2, ... o valor de "d" que "estacionarizou"

(ou seja, "horizontalizou") a srie.

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

70
(ii) Identificao de "p" e "q"
Feita atravs da comparao dos estimadores da ACF e PACF com os correspondentes padres tericos.
Na prtica, raramente necessrio ajustar modelos com p e q maiores que 2. Note que, num modelo
ARMA(p,q) existem p + q + 1 parmetros desconhecidos (os is, os js e a varincia do erro, a2).
Passo 2 Estimao dos parmetros do modelo
Aps a identificao do nmero de diferenas (d) e dos graus dos polinmios AR e MA (p e q,
respectivamente), estima-se os parmetros. Atualmente esta etapa no causa grande preocupao ao
usurio comum, pois feita automaticamente pelos softwares especializados em sries temporais.

Suponha que a ordem (p, d, q) de um modelo ARIMA j foi identificada, isto , j sabemos qual o grau de
diferenciao (d) e os graus dos polinmios AR e MA. O prximo passo estimar os parmetros
desconhecidos do modelo, isto , encontrar os i s e j s.
Na estimao dos parmetros desconhecidos procuramos minimizar a soma do quadrado dos erros, ou
seja, no caso de uma ARIMA(p,d,q) buscamos minimizar: S ( ) =

a
t =1

2
t

onde a t =

( B). ( B). d Z t

Por causa das defasagens presentes nos polinmios (B) e (B) freqentemente impossvel calcular a
soma do quadrado dos erros como descrita acima, pois ela dependeria de observaes inexistentes (Z0 , Z1 , Z-2 , ...) . Box e Jenkins sugerem um procedimento conhecido como backforecasting, que gera
previses para estes valores iniciais desconhecidos. Se supormos a normalidade dos erros podemos
escrever a funo de verossimilhana sem muita dificuldade, e podemos proceder estimao dos
parmetros por mxima verossimilhana. Os resultados obtidos pela aplicao deste mtodo so
equivalentes aos encontrados pela minimizao da soma do quadrado dos erros. A estimao por mxima
verossimilhana possui uma grande vantagem: a distribuio assinttica (quando T tende a infinito) dos
estimadores conhecida e pode-se encontrar facilmente o erro padro destes estimadores, o que permite
estabelecer a significncia dos parmetros.

Existem diferentes mtodos para a estimao dos parmetros do modelo, e em geral todos produzem
estimativas semelhantes, mas podem existir diferenas quanto eficincia de cada mtodo de estimao.
De maneira geral, durante a etapa de estimao de parmetros usa-se algum algoritmo para minimizao
(ou maximizao). Alguns dos possveis mtodos so: mxima verossimilhana aproximada, mxima
verossimilhana aproximada com backforecasting e mxima verossimilhana exata. O primeiro destes o
mais rpido, e deve ser usado em sries muito longas (com mais de 30000 observaes). O mtodo de
mxima verossimilhana exata no eficiente para modelos sazonais quando o perodo sazonal grande
(por exemplo, dados dirios). De maneira geral os mtodos aproximados servem pelo menos para produzir
estimativas iniciais dos parmetros de interesse e, em seguida, pode-se refinar estas estimativas atravs do
mtodo de mxima verossimilhana exata. As estimativas dos parmetros so acompanhadas de seus
erros padro assintticos, o que nos permite acessar a significncia dos parmetros estimados.

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

71

Passo 3 Testes Estatsticos


Nesta etapa procuramos responder questo: o modelo identificado adequado e capaz de bem
representar a srie observada? Existem diversos testes para tentar responder a esta pergunta. A grande
maioria dos testes baseia-se nos resduos dos modelos.
Lembre-se que, ao ajustarmos um modelo ARIMA, estamos buscando capturar toda a estrutura de
dependncia serial presente na srie. Logo, o que sobra (isto , os resduos do modelo) no deve
apresentar qualquer tipo de dependncia no tempo, pois se ainda existe dependncia nos resduos sinal
de que esta dependncia deveria ter sido capturada e incorporada no modelo. Logo, num modelo ARIMA
bem ajustado, os erros de previso um passo frente (os resduos) devem ser uma seqncia de rudos
brancos, ou seja, no devem exibir autocorrelaes (e autocorrelaes parciais) significantes.

O que um bom modelo?


Em geral, um bom modelo deve:
Produzir previses suficientemente prximas da realidade (mas no exatamente iguais aos valores
observados!);
Ter resduos independentes com mdia zero e varincia constante, e ento o correlograma dos
resduos no deve revelar a existncia de dependncia serial;
Ser parcimonioso, isto , apresentar um nmero relativamente pequeno de parmetros.

Testes de Sobrefixao
A idia por trs dos testes de sobrefixao ajustar um modelo maior (aumentando os graus dos
polinmios AR e MA) para verificar se os parmetros extras so significantes. Por exemplo, se o modelo
identificado um MA(1) (ARIMA(0,0,1)) pode-se testar os modelos MA(2) e ARMA(1,1) e verificar se a
incluso dos novos parmetros resultou em algum ganho adicional.

Critrios baseados nos resduos do modelo


Conforme j mencionado, num bom modelo, os resduos no devem exibir qualquer estrutura de
dependncia. Em particular, a mdia dos resduos deve ser zero e a varincia deve ser constante. Tambm,
a ACF no deve ser significante em qualquer lag. A existncia de autocorrelaes nos resduos sugere
que o modelo no foi corretamente especificado.
Um teste muito usado para verificar a existncia de autocorrelaes nos resduos o teste de Ljung e Box,
ou teste Portmanteau, descrito a seguir.
No teste de Ljung e Box desejamos testar a hiptese de que as k primeiras autocorrelaes dos resduos
so nulas, isto : H0 : 1(a) = 2(a) = ... = k(a) = 0 onde os i(a) so as autocorrelaes dos resduos.
A estatstica do teste :

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

72
k

Q = T (T + 2).
i =1

i( a )

(T i )

onde T o tamanho da srie. A regra de deciso deste teste : se o valor da estatstica Q for grande rejeitase a hiptese de que as k primeiras autocorrelaes dos resduos sejam nulas. Mas, o quo grande Q deve
ser? Deve-se compar-lo aos pontos percentuais de uma varivel Qui-Quadrado com k (p+q+1) graus de
liberdade, onde k o nmero de autocorrelaes sendo testadas e p e q so os graus dos polinmios AR e
MA respectivamente.
Quantas autocorrelaes devem ser testadas em conjunto, isto , qual o valor de k? Uma escolha usual
fazer k aproximadamente igual a

T , onde T o tamanho da srie.

Critrios de Seleo de Modelos


Estes critrios permitem a comparao de diferentes modelos para a srie, e a conseqente escolha do
melhor modelo. Este o que minimiza a varincia dos resduos e, simultaneamente, sofre uma
penalidade pela incluso de mais parmetros. Note que esta penalizao pelo nmero de parmetros
coerente com o princpio da parcimnia pois, em geral a incluso de mais parmetros leva a uma melhora
do ajuste do modelo, mas paga-se um preo, que o prprio excesso na parametrizao. Os principais
critrios so:
Critrio de Akaike (ou AIC, AKAIKE INFORMATION CRITERION)
Se "m" o nmero de parmetros do modelo estimado, o critrio de AKAIKE estabelece que o modelo
timo para uma mesma srie aquele que minimiza a quantidade AIC, dada por:

( ( ))

AIC = T . log a2 + 2.m


O critrio AIC tende a superestimar a ordem do polinmio AR, o que motivou a criao do critrio BIC
mostrado a seguir.

Critrio BIC (BAYESIAN INFORMATION CRITERION)


um refinamento do critrio AIC em que procura-se contornar um problema existente no AIC, que , a
tendncia a escolher modelos com polinmio AR de grau alto. O preo pago a maior complexidade na
frmula do clculo da estatstica.

( ( ))

BIC = T . log a2

z2

2 1
a
m

(T m). log1 + m. log(T ) + m. log

T
m

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

73

CRITRIO DE SCHWARTZ (SBC CRITERION)


Foi sugerido por Schwartz em 1978, e uma simplificao do critrio BIC acima, que tem a mesma
eficincia no que diz respeito super-estimao de p pelo critrio AIC. dado por:

( ( ))

SBC = T . log a2 + m. log(T )


Note que, nem sempre os trs critrios iro concordar quanto ao melhor modelo dentro de uma classe de
modelos em considerao, mas em geral as diferenas entre os resultados dos trs critrios sero
pequenas.

Exemplo 5.4.48.
Considere novamente a srie de consumo anual de energia eltrica (classe comercial) do Exemplo 5.2.5. .
Iremos ajustar um modelo da classe ARIMA a esta srie, e comparar as previses obtidas com as
encontradas pelo modelo de Holt.
A autocorrelao e PACF da srie original so:

Aps uma diferena, a ACF e PACF tornam-se:

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

74

E aps duas diferenas:

Nitidamente foram necessrias duas diferenas da srie original para torn-la estacionria, pois aps uma
nica diferenciao a autocorrelao ainda decaa de forma muito lenta. Logo, deve-se partir de um modelo
ARIMA com d = 2, e resta agora identificar p e q, as ordens dos polinmios AR e MA respectivamente.
O grfico da autocorrelao parcial (da srie duplamente diferenciada) sugere que a ordem p =1 deve ser
apropriada. Testamos as estruturas ARIMA(1,2,0) e ARIMA(1,2,1) (teste de sobrefixao) e nesta ltima o
coeficiente do termo MA no foi significante, portanto a estrutura escolhida a ARIMA (1,2,0), com as
caractersticas mostradas a seguir.
Termo
AR(1)

Coeficiente
-0.366

Erro Padro
0.160

Estatstica t
-2.287

Significncia
97.1%

As previses encontradas a partir deste modelo so:

Ano
1999
2000
2001
2002

Limite
Inferior
Previso
(2.5%)
44,277
47,042
49,605
52,053

Previso
45,066
48,553
52,029
55,508

Limite
Erro
Superior
Percentual
Previso
Absoluto de
(97.5%) Valor Real
Previso
45,855
3.4%
43,583
50,065
2.5%
47,365
54,452
58,963
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com

75
As previses so bastante semelhantes s produzidas pelo mtodo de Holt, mas os intervalos de confiana
so mais estreitos que os do exemplo 5.2.5.
Passo 4 Previso
As previses j passos frente so obtidas diretamente a partir da equao do modelo ARIMA escolhido nos
passos anteriores.
Seja Zt(j) a previso de Zt+j obtida no instante t. A equao de previso apenas a equao obtida da
prpria expresso do modelo para Zt, escrita para o instante de interesse t + j.
A idia por trs das previses substituir os zs e as por suas mdias condicionais, ou seja, as mdias
dada a srie j observada z1, z2, ..., zt-1, zt.

As mdias condicionais so:

a t + j se j = ....,-3,-2,-1,0
E (a t + j z t , z t 1 , z t 2 ,..., z1 ) =
se j = 1, 2, 3, ....
0

z t + j se j = ....,-3,-2,-1,0
E (z t + j z t , z t 1 , z t 2 ,..., z1 ) =
se j = 1, 2, 3, ....
z t + j
Ou seja, para encontrarmos as previses basta:
1) Substituir os valores esperados passados da srie pelos valores efetivamente observados da srie
(isto , os zt+j com j negativo);
2) Substituir os valores esperados futuros da srie pelas suas previses (ou seja, os z t + j );
3) Substituir os valores esperados futuros dos erros por zero;
4) Substituir os valores passados dos erros at-j por zt-j zt-j-1.
Exemplos deste procedimento so mostrados a seguir.

Exemplo 5.4.49. (Previso no modelo AR(1))


Considere o modelo AR(1):
Zt - 1 .Zt-1 = at
A equao do modelo escrita para o instante t +j :
Zt+j - 1 .Zt-+j1 = at+j
A previso de Zt+j feita no instante t :

Z t ( j ) = 1 .E (Z t + j 1 Z 1 , Z 2 ,..., Z t ) + E (a t + j Z 1 , Z 2 ,..., Z t )
M. Barros Consultoria Ltda.
e-mail: barrosm@alumni.utexas.net
info@mbarros.com

76

Para j = 1 (previso um passo frente) temos:

Z t (1) = 1 .E (Z t Z 1 , Z 2 ,..., Z t ) + E (a t +1 Z 1 , Z 2 ,..., Z t ) = 1 .Z t + 0 = 1 .Z t

Para j = 2 (previso dois passos frente feita no instante t):

2
Z t (2) = 1 .E (Z t +1 Z 1 , Z 2 ,..., Z t ) + E (a t + 2 Z 1 , Z 2 ,..., Z t ) = 1 .Z t (1) + 0 = 1 (1 .Z t ) = 1 .Z t

Em geral, a previso j passos frente :

j
Z t ( j ) = 1 .Z t e como o processo suposto estacionrio (e ento | 1| < 1) esta previso tende zero

medida que o horizonte de previso aumenta. Note tambm que zero a mdia do processo, e assim as
previses em horizontes longos tendero mdia.

Exemplo 5.4.50. (Previso no modelo MA(1))


Considere o processo MA(1) dado por:
Zt = at - 1.at-1
A equao do modelo aplicada ao instante t +j fornece:
Zt +j = at +j - 1.at-+j-1
A previso j passos frente dada por:

Z t ( j ) = E (a t + j Z 1 , Z 2 ,..., Z t ) 1 .E (a t + j 1 Z 1 , Z 2 ,..., Z t )
Para j = 1 temos:

Z t (1) = E (a t +1 Z 1 , Z 2 ,..., Z t ) 1 .E (a t Z 1 , Z 2 ,..., Z t ) = 0 1 .(Z t Z t 1 ) = 1 .(Z t Z t 1 )


Para j = 2:

Z t (2) = E (a t + 2 Z 1 , Z 2 ,..., Z t ) 1 .E (a t +1 Z 1 , Z 2 ,..., Z t ) = 0 1 .0 = 0

Em geral, para j 2 a previso ser zero (que a mdia do processo), pois o processo tem memria de

dois perodos apenas, e a equao de previso depender de E a t + j Z 1 , Z 2 ,..., Z t , que zero para j 1.
Exemplo 5.4.51. (Previso para o ARIMA(1,1,1)
Considere o modelo ARIMA(1,1,1) aplicado a Zt. A equao do modelo :

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

77

(1 1 B)(1 B) Z t = (1 1 B)at
[1 (1 + 1 ) B + 1 B 2 ]Z t = (1 1 B)at
Z t = (1 + 1 ) Z t 1 + 1 Z t 2 + at 1at 1
No instante t + j teremos:

Z t + j = (1 + 1 ) Z t + j 1 + 1 Z t + j 2 + a t + j 1 a t + j 1
A previso j passos frente dada por:

Z t ( j ) = (1 + 1 ) E (Z t + j 1 Z 1 , Z 2 ,...Z t ) + 1 E (Z t + j 2 Z 1 , Z 2 ,...Z t ) +

+ E (a t + j Z 1 , Z 2 ,...Z t ) 1 E (a t + j 1 Z 1 , Z 2 ,...Z t )
Assim, a previso 1 passo frente :

Z t (1) = (1 + 1 ) Z t + 1 Z t 1 1 (Z t Z t 1 )
A previso 2 passos frente (lembre-se que o valor esperado condicional dos erros futuros zero):

Z t (2) = (1 + 1 ) Z t (1) + 1 Z t

E, em geral, a previso j passos frente (para j > 2) :

Z t ( j ) = (1 + 1 ) Z t ( j 1) + 1 Z t ( j 2)

M. Barros Consultoria Ltda.


e-mail: barrosm@alumni.utexas.net
info@mbarros.com

Potrebbero piacerti anche