Sei sulla pagina 1di 79

CE-442

Métodos de Análise
Econômica IV
Prof. Marcelo Justus
mjustus@unicamp.br

Última atualização: 03.06.2019

1 / 79
2 / 79
Um curso de introdução à
análise de séries temporais

3 / 79
Metodologia Box-Jenkins para
processos ARIMA não
sazonais
I Identificação do processo
I Estimação do modelo
I Diagnósticos nos resı́duos
I Previsão dos valores

4 / 79
Metodologia de Box-Jenkins

O objetivo principal na análise Box-Jenkins


(1976) é prever valores de uma série
temporal utilizando a correlação entre os
valores realizados do processo estocástico.

5 / 79
Metodologia de Box-Jenkins

A análise Box-Jenkins consiste em quatro


etapas:
1. identificação,
2. estimação,
3. diagnóstico, e
4. previsão.

6 / 79
Identificação

A série {yt} foi gerada por um processo


AR(p), MA(q), ARMA(p, q) ou
ARIMA(p, q, d)?

7 / 79
Identificação

Na identificação queremos determinar:


1 os filtros (AR, I, MA) que compõem o
processo gerador da série;
2 as respectivas ordens (p, q, d) dos filtros.

8 / 79
Identificação

Em geral, a identificação é baseada no


comportamento da fac e facp empı́ricas.

9 / 79
Identificação

O primeiro passo na etapa de identificação é


a verificação da propriedade de
estacionariedade da série a {yt}, ou seja, a
identificação da ordem de integração
(d).

10 / 79
Identificação

A metodologia de Box-Jenkins é restrita à


séries estacionárias, porém, é possı́vel
aplicá-la à séries que se tornam
estacionárias após a aplicação diferenças.

11 / 79
Identificação

Nestes casos, a série {yt} é dita


diferença-estacionária, e a ordem d é o
número de raı́zes unitárias existentes no
processo estocástico.

12 / 79
Identificação

Lembrete:
Se a série {yt} é não estacionária mas a sua
primeira diferença ∆yt = yt − yt−1 é
estacionária, então {yt} é dita integrada
de ordem 1. Nesse caso, como d = 1,
segue que:
∆yt ∼ I(0)

13 / 79
Identificação

O gráfico da série original pode indicar


a não estacionariedade, mas não permite
identificar a ordem d.

14 / 79
Identificação

Na prática, observamos o
comportamento da fac amostral e
quando necessário aplicamos testes de
raı́z unitária.

15 / 79
Identificação

Lembrete:
Quando uma série é não estacionária os
valores dos coeficientes de autocorrelação
decrescem muito lentamente com o aumento
de k.

16 / 79
Identificação

Lembrete:
Na prática, uma fac amostral com os
primeiros valores altos e que não declinam
rapidamente para um valor
estatisticamente nulo com o aumento
de k, indica que a série é não estacionária.
Portanto, a série original precisa ser
diferenciada.

17 / 79
Identificação

Lembrete:
A análise do comportamento da fac é
revelador para julgar a estacionariedade,
porém, em alguns casos convém realizar
testes de raiz unitária para uma
conclusão definitiva sobre a presença de
tendência estocástica na série.

18 / 79
Identificação

Em suma, o comportamento teórico da


fac e facp caracterı́sticos dos processos é
Processo fac facp
AR(p) declinante truncada em k = p
MA(q) truncada em k = q declinante
ARMA(p, q) declinante declinante

19 / 79
Aplicação no R

Vamos simular processos AR(p), MA(q) e


ARMA(p, q).

20 / 79
Aplicação no R

Vamos simular processos AR(p), MA(q) e


ARMA(p, q) para plotar os gráficos da FAC
e FACP na tenativa de identificar os
modelos.

Use o R!
Script: CE442Aulas10-11.R

21 / 79
Identificação

Como trabalhamos com as funções fac e


facp empı́ricas, exige-se uma análise da
significância estatı́stica das
autocorrelações. Portanto, a amostra deve
ter (no mı́nimo) de 40 a 50 observações.

22 / 79
Identificação

Como é difı́cil identicar processos mistos


pela fac e facp, Tsay & Tiao (1984) sugerem
o uso da função de autocorrelação
estendida, abreviadamente face (ver
Morettin & Toloi 2006, p. 493).

23 / 79
Identificação

A apresentação da face é feita em uma


tabela de dupla entrada.
As linhas são enumeradas 0, 1, 2. . . . ,
indicando a ordem p do filtro AR.
As colunas, também enumeradas, indicam
a ordem q da parte MA.

24 / 79
Identificação

25 / 79
Identificação

Simplifica-se substituindo as estimativas


da face por “zeros” e “X’s”,
respectivamente, quando elas caem dentro e
fora do intervalo de confiança (±2
erros padrão).

26 / 79
Identificação

27 / 79
Identificação

As ordens p e q são determinadas pela


posição (p0, q0) de tal forma que todos os
valores na tabela sejam “zeros” para (i, j)
na região triangular em que i = p0 + k e
j ≥ qo + k, k = 0, 1, 2 . . . .

28 / 79
Aplicação no R
O pacote TSA do R tem o comando
eacf() para estimar uma face amostral.
Aplicaremos essa metodologia de
identificação nos processos AR(p), MA(q) e
ARMA(p, q) simulados.

Use o R!
Script: CE442Aulas10-11.R
29 / 79
Estimação

Uma vez determinados os valores p, d e q,


passa-se para a estimação dos p parâmetros
φ, dos q parâmetros θ e da variância σε2.

30 / 79
Estimação

O pacote forecast tem o comando


Arima() para estimar uma classe geral de
modelos ARIMA(p, q, d).

31 / 79
Estimação

Lembre-se que um ARIMA(1,0,1) é um


ARMA(1,1), um ARIMA(1,0,0) é um
AR(1), um ARIMA(0,0,2) é um AR(2), e
assim por diante.

32 / 79
Critérios de seleção

Em geral, haverá mais de um modelo


candidato a gerador da série {yt}.

33 / 79
Critérios de seleção

Na prática, ajustamos um conjunto de


modelos candidatos e utilizamos critérios
de informação (ou de seleção) para
selecionar o “melhor” modelo.

34 / 79
Critérios de seleção

Os critérios de informação mais utilizados


são:
I Akaike (AIC);

I Schwartz ou Baysiano (BIC);

I Hannan-Quinn (HQ).

35 / 79
Critérios de seleção

2(p + q)
AIC(p, q) = ln(σε2) +
T
ln T (p + q)
BIC(p, q) = ln(σε2) +
T
ln{ln(T )}(p + q)
HQ(p, q) = ln(σε2) +
T

36 / 79
Critérios de seleção

Na prática, estimamos modelos


correspondentes a vários pares (p, q) para
selecionar a especificação que minimiza o
critério de informação adotado.

37 / 79
Critérios de seleção

Os critérios de informação são


“penalizadores” de modelos com muitos
parâmetros, pois modelos parcimoniosos
são preferidos a modelos de ordens elevadas.

38 / 79
Critérios de seleção

Ao decidir coim base em critérios de


informação tenha em mente que:
I É necessário comparar séries com o

mesmo número de observações;


I O BIC tende a escolher um modelo

mais parcimonioso do que o AIC;

39 / 79
Critérios de seleção

I O AIC é melhor em quando a amostra é


pequena, porém, tende a indicar
modelos sobreparametrizados;
I O HQ é menos forte que o critério BIC.

40 / 79
Critérios de seleção

I Os critérios de informação devem ser


aplicados como procedimento
complementar e não alternativo àquele
baseado na observação do
comportamento amostral da facp e facp.

41 / 79
Aplicação no R

Realizaremos a etapa de estimação e escolha


inicial do modelo usando os dados do
processo ARMA(p, q) simulado
anteriormente.

Use o R!
Script: CE442Aulas10-11.R

42 / 79
Verificação

Nessa etapa verificamos se o modelo


estimado é adequado.

43 / 79
Verificação

Se o modelo é julgado adequado, então ele


será utilizado para a próxima etapa:
previsão; em caso negativo, outra
especificação deve ser escolhida para
modelar a série.

44 / 79
Verificação

Se julgado inadequado, então será


necessário refazer a etapas 1 e 2:
identificação e estimação.

45 / 79
Verificação

Os diagnósticos de verificação mais comuns


são:

I Avaliação da ordem do modelo;


I Análise dos resı́duos.

46 / 79
Ordem do modelo

O objetivo é verificar se o modelo não está


superespecificado.

47 / 79
Ordem do modelo

O critério da parcimônia estabelece


que o modelo não deve conter parâmetros
em excesso.

48 / 79
Ordem do modelo

A verificação da presença de coeficientes


irrelevantes é feita por meio dos erros
padrão dos coeficientes φ̂ e θ̂.

49 / 79
Ordem do modelo

Queremos coeficientes altamente


significativos. Assim, recomenda-se que o
valor coeficiente deve ser pelo menos duas
vezes o valor do seu erro padrão.

50 / 79
Ordem do modelo

Se o coeficiente estatisticamente não


significativo for o de maior ordem, por
exemplo φ̂4 em uma ARMA(4,2), deve-se
excluı́-lo do modelo, estimando um modelo
de menor ordem, ou seja, um ARMA(3,2)
nesse exemplo.

51 / 79
Ordem do modelo

Mesmo que o coeficiente não for o de maior


ordem, digamos que fosse o φ̂2, ele também
será eliminado na maioria das aplicações.

52 / 79
Análise dos resı́duos

Os resı́duos do modelo estimado, ε̂, são


estimativas de ε. Logo, devem ser
aproximadamente ruı́do branco se o
modelo estiver adequadamente especificado.

53 / 79
Análise dos resı́duos

Especificamente, seus coeficientes de


autocorrelação devem ser
estatisticamente nulos.

54 / 79
Análise dos resı́duos

A análise das autocorrelações é feita


aplicando a estatı́stica Q de
Ljung-Box para testar se os primeiros k
coeficientes de autocorrelação
P
ε̂tε̂t−j
ρ̂j = ,
t−j
são estatisticamente nulos.

55 / 79
Análise dos resı́duos

As hipóteses nula e alternativa do


teste Q de Ljung-Box são, respectivamente,
k
X
H0 : ρj = 0 e
j=1

k
X
H1 : ρj 6= 0.
j=1

56 / 79
Análise dos resı́duos

A estatı́stica do teste é
k
X ρ̂2j
Q(k) = T (T + 2) −→d χ2k
j=1
T −j

ou seja Q(k) converge em distribuição para uma


distribuição qui-quadrado com k graus de liberdade.

57 / 79
Análise dos resı́duos

No R, o teste Q de Ljung-Box é aplicado


pela função Box.test() do pacote stats.

58 / 79
Análise dos resı́duos

Se os resı́duos são autocorrelacionados,


então voltamos para etapa de identificação e
estimação.

59 / 79
Análise dos resı́duos

Convém, adicionalmente, verificar se os


resı́duos são homocedásticos. No R,
aplicamos o teste ARCH pela função
ArchTest() do pacote FinTS.

60 / 79
Normalidade do resı́duos

Verificamos, ainda, se os resı́duos têm (pelo


menos aproximadamente) uma
distribuição normal.

61 / 79
Normalidade do resı́duos

Fazemos um gráfico da densidade


estimada dos resı́duos utilizando o kernel
como ponderador e/ou utilizar um teste de
hipótese.

62 / 79
Normalidade do resı́duos

Os dois testes de hipótese de normalidade


mais aplicados são:

I Shapiro-Wilk;
I Jarque-Bera.

63 / 79
Teste Jarque-Bera

A hipótese nula do teste é


H0 : os resı́duos têm distribuição normal,

e a hipótese alternativa,
H1 : os resı́duos não têm distribuição normal.

64 / 79
Teste Jarque-Bera

A estatı́stica do teste é

A2 (C − 3)2
 
JB = T + →d χ22
6 24

65 / 79
Teste Jarque-Bera

Não rejeitamos a hipótese nula de


resı́duos com distribuição normal, na
prática, se o p-valor da estatı́stica JB for
maior que 0,05 (5%).

66 / 79
Normalidade do resı́duos

A função shapiro.test() do pacote


stats do R aplica o teste Shapiro-Wilk.

67 / 79
Normalidade do resı́duos

A função jarque.bera.test() do pacote


tseries do R aplica o teste Jarque-Bera.

68 / 79
Aplicação no R

Realizaremos a etapa de verificação (ou


diagnóstico) no modelo incial escolhido
usando para os dados do processo
ARMA(p, q) simulado.

Use o R!
Script: CE442Aulas10-11.R

69 / 79
Previsão

Dentre os modelos candidatos estimados,


usamos o “melhor” deles para prever
valores da série {yt} em instantes de tempo
posteriores a T .

70 / 79
Previsão

Como a variância do erro de previsão


cresce à medida que a previsão se
afasta de T , o intervalo de previsão vai
sendo ampliado com o horizonte de previsão.

71 / 79
Previsão

Obtemos as previsões após estimar o modelo


utilizando a função forecast.Arima() do
pacote forecast.

72 / 79
Aplicação no R

Realizaremos a etapa final – previsão – no


modelo final escolhido para os dados do
processo ARMA(p, q) simulado.

Use o R!
Script: CE442Aulas10-11.R

73 / 79
Atualização das previsões

Convém, sempre que possı́vel, atualizar


as previsões já realizadas à medida que
novas realizações do processo estocástico
se tornem conhecidas.

74 / 79
Atualização das previsões

Na prática, reestima-se o modelo e repete-se


as etapas de verificação e previsão. Algumas
vezes, porém, é necessário voltar a etapa de
identificação.

75 / 79
Aplicação no R
Usaremos a ST do ı́ndice de Atividade
Econômica do Banco Central do Brasil
(IBC-BR) para aplicar a metodologia
Box-Jenkins. Por hora, ignorando os dados
discrepantes nas observações 72:73.

Use o R!
Script: CE442Aulas10-11.R
76 / 79
Seleção automática do “melhor” modelo
no R
A função auto.arima do pacote forecast
faz uma pesquisa, dentro das restrições de
ordem fornecidas, e retorna com os
ressutados do melhor modelo ARIMA de
acordo com o valor AIC, AICc ou BIC.

Use o R!
Script: CE442Aula10-11.R
77 / 79
Aplicação no R
Aplicaremos a função auto.arima na ST
do ı́ndice de Atividade Econômica do
Banco Central do Brasil (IBC-BR),
ignorando os dados discrepantes nas
observações 72:73.

Use o R!
Script: CE442Aulas10-11.R
78 / 79
Leitura indicada

1. Barros, A. C. et al.; P. G. C. Ferreira (Org.). Análise de séries temporais


em R: curso introdutório. Rio de Janeiro: Elsevier, FGV IBRE, 2018.
2. Bueno, R. L. S. Econometria de Séries Temporais, 2a Edição. Cencage
Learning, 2011.
3. Morettin, P. A. e Toloi, C. M. C. Análise de Séries Temporais, 2a Edição.
Blücher, 2006.
4. Hanck, C.; Arnold, M.; Gerber, A. and Schmelzer, M. Introduction to
Econometrics with R, 2018-12-19. Disponı́vel em
https://www.econometrics-with-r.org/
5. Kerns, G. J. Introduction to Probability and Statistics Using R. Third
Edition, 2018-08-29. Disponı́vel em
https://cran.r-project.org/web/packages/IPSUR/vignettes/IPSUR.pdf
6. Oliveira, P. F.; Guerra, S., McDonnell, R. Ciência de dados com R:
Introdução. Brası́lia: Editora IBPAD, 2018. Disponı́vel em
https://cdr.ibpad.com.br/cdr-intro.pdf

79 / 79

Potrebbero piacerti anche