Sei sulla pagina 1di 8

FACULDADE DE CIÊNCIAS ECONÔMICAS

Segundo Relatório de Econometria 2

Professora Ana Hermeto

Aluna Thalita Borges Oliveira

Introdução

As séries temporais permitem a análise de dados de duas formas distintas. É possível


usar o modelo de séries temporais para, por um lado estruturar relações de causa e efeito entre
duas séries, como por exemplo, relação temporal entre os valores de desemprego e
inadimplência ou ainda, por outro fazer modelos uni ou multivariados a fim de se prever o
comportamento de uma determinada variável.

Dado a importância desse modelo, é essencial que se estabeleça algumas premissas para
que não se tire conclusões inadequadas sobre a correlação (ou não) das variáveis estudadas. É,
portanto, fundamental que a série apresente uma estrutura que possa ser caracterizada ou
descrita ao longo do tempo. Nesse contexto a estacionariedade ganha especial relevância.

Estacionariedade e os Passeios Aleatórios

Ao estimar qualquer modelo econométrico é importante que os coeficientes das


variáveis explicativas sejam estatisticamente significantes. No entanto, é possível que se
estabeleça relações entre duas variáveis que, mesmo que aparentemente correlacionadas, não
guardem nenhuma relação de causa e efeito entre si. Da mesma forma, se o modelo for de
previsão de uma variável com relação aos seus valores passados, e não existir o cuidado de se
verificar se a série apresenta mudanças estruturais significativas, o resultado será uma previsão
ineficaz do comportamento futuro da série. Nesses casos, a relação entre as variáveis
dependentes e as variáveis independentes dos modelos se revelem pouco explicativas.

Quando uma série temporal apresenta comportamento constante no tempo ela é


considerada estacionária e consegue resolver o problema da inconsistência dos coeficientes
explicativos. Isso porque a estacionariedade apresenta como condicionalidades os seguintes
fatores:

a) Média constante: 𝐸 (𝑌𝑡 ) = µ

b) Variância constante: 𝑉𝑎𝑟 ( 𝑌𝑡 ) = 𝜎 2 = 𝛾0

c) Covariância entre dois valores de uma determinada variável – Y – depende apenas da


distância (temporal) entre eles

Portanto, na medida que uma série consegue apresentar um comportamento previsível


via estacionariedade ela passa a garantir que as relações entre duas variáveis temporais sejam
verdadeiras (no sentido de expressar uma relação válida) porque nesse caso não há mudanças
estruturais bruscas nessa relação (o valor de Y tende a média – µ - ao longo do tempo). Além
disso com o pressuposto da estacionariedade os modelos de previsão conseguem cumprir seu
papel sem a dificuldade de se lidar com variações esporádicas que influenciem fortemente a
relação entre o comportamento passado de determinada variável e o seu valor futuro.
Definido estacionariedade se torna essencial que se determine como descobrir se uma
série é ou não estacionária. Uma característica das séries não estacionárias é que ao representá-
la por um modelo de regressão 𝑌𝑡 em função de seus valores defasados, a soma dos coeficientes
associados às variáveis defasadas será igual a 1, se por outro lado, a série for estacionária essa
soma será inferior a 1.

A lógica por trás desse processo está relacionada com o coeficiente de relação entre o
valor de Y presente e seu valor defasado. Quando esse coeficiente (ρ) é menor que 1, o valor de
Y presente depois de um ‘‘choque não esperado’’ tende a se dissipar nos períodos posteriores e
convergir para a média de Y. Se o coeficiente (ρ) for igual a 1 esse choque nunca se dissipa e
tende a acumular com outros erros aleatórios que podem surgir com o passar do tempo. A
representação desse processo pode ser feita por:

𝑌𝑡 = 𝜌𝑌𝑡−1 + 𝑒𝑡
Essa regressão pode ser denominada tanto como modelo sem constante com
componente autorregressivo (de 1a ordem) quanto como passeio aleatório. O erro 𝑒𝑡 dessa
regressão representa os choques aleatórios, e vai ser responsável por explicar a parte que a
variável defasada 𝑌𝑡−1 não foi capaz de contemplar. Esse erro, por sua vez, pode ser chamado
de ruído branco, e independente da série ser estacionária ou não, ele precisa obedecer os
pressupostos de média igual a 0, variância constante (e igual a 0) e não correlacionada com o
erro dos períodos posteriores (𝑐𝑜𝑣 (𝑒𝑡 , 𝑒𝑡+1 ) = 0). Por obedecer esses pressupostos ele se
torna por si só um processo estacionário.

A identificação de uma série, se ela é estacionária ou não, por meio da raiz unitária pode
ser feita, além desse caso de passeio aleatório, nos casos de passeio aleatório com
deslocamento ou passeio aleatório em torno de uma tendência. As respectivas funções são:

a) Passeio aleatório com deslocamento: 𝑌𝑡 = 𝛼 + 𝜌𝑌𝑡−1 + 𝑒𝑡

b) Passeio aleatório em torno de uma tendência: 𝑌𝑡 = 𝛼 + 𝜌𝑌𝑡−1 + 𝛽𝑡 + 𝑒𝑡

O passeio aleatório com deslocamento além de absorver integralmente (𝜌 = 1) os


choques passados, apresenta uma tendência constante de variação em cada período α, e por
isso, a sua média e a sua variância variam com o tempo. Mas, é possível corrigir isso, por meio
da diferenciação da série: ∆𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1 = 𝑒𝑡 . Ao diferenciar a série, o que ‘‘sobra’’ é o ruído
branco, que por definição é estocástico.

Já o passeio aleatório (com deslocamento) em torno de uma tendência, tem um


comportamento muito mais difícil de se normatizar. Porque, além de apresentar variações
constante em cada período α, essas séries também têm um comportamento imprevisível em
torno de uma tendência. Essa tendência é determinada pelo coeficiente beta da equação da
série.

Importante destacar o que é uma tendência determinística na teoria. Essa série


apresenta um comportamento estacionário em cima de uma tendência no tempo. Ou seja, a
média de sua variável explicativa não converge para um valor único, no entanto, essa média
pode ser prevista caso se saiba o valor de t. 𝑌𝑡 = 𝛼 + 𝛽𝑡 + 𝑒𝑡

Testes
Entre os testes utilizados para descobrir e até mesmo corrigir a não estacionariedade estão a
função de autocorrelação e o correlograma, o teste de raiz unitária e ainda o teste de Dickey-
Fuller.

1. A função de autocorrelação fornece os dados para a plotagem do correlograma. O


gráfico é feito com as ordenadas do coeficiente 𝜌𝑘 em função de 𝑘. Essa função descreve
o quão relacionado está a variável 𝑌𝑡 com os seus valores defasados. Se o valor de 𝜌𝑘
for muito alto então, provavelmente trata-se de um processo não estacionário.
Normalmente, os valores de 𝜌𝑘 são mais altos para 𝑘 = 1 e por esse motivo o processo
de diferenciação faz mais sentido nos casos de modelos AR(1), porque elimina a alta
correlação entre a variável 𝑌𝑡 e o seu antecessor imediato.

𝑐𝑜𝑣 (𝑌𝑡 , 𝑌𝑡−𝑘 ) 𝑐𝑜𝑣 (𝑌𝑡 , 𝑌𝑡−𝑘 )


𝜌𝑘 = =
𝐷𝑃(𝑌𝑡 )𝐷𝑃(𝑌𝑡−𝑘 ) 𝑉𝑎𝑟(𝑌𝑡 )

Correlograma:

Série Estacionária Série Não Estacionária


𝜌K

𝜌K

K
0 1 2 3 4 5

0 1 2 3 4 5 K

2. Teste de raiz unitária

O teste consiste na verificação estatística da existência de não estacionariedade na série


temporal a ser analisada. A ideia do teste é a verificação do valor em módulo do
coeficiente 𝜌 associado a defasagem de primeira ordem, se igual a 1, então trata-se de
raiz unitária e, portanto, é o caso de não estacionariedade, se menor que 1, trata-se de
estacionariedade. (Menor ou igual estatisticamente falando)

O teste de Dickey-Fuller pretende analisar se o coeficiente associado a variável defasada


apresenta ou não raiz unitária. A estatística DF, usada no teste, é um número negativo,
e quanto mais negativo, maior a tendência para rejeitar a hipótese nula de que existe
raiz unitária na série.
Dickey e Fuller pode ser usado em todos os casos de passeio aleatório, já mencionados,
para observar se existe ou não raiz unitária. Nesse sentido, é importante que antes de
se fazer o teste ocorra a especificação de qual processo estocástico será utilizado, se é
o processo sem constante, com constante ou ainda com constante e tendência
determinística.

a) Sem constante: 𝑌𝑡 = 𝜌𝑌𝑡−1 + 𝑒𝑡


b) Com constante: 𝑌𝑡 = 𝛼 + 𝜌𝑌𝑡−1 + 𝑒𝑡
c) Com constante e tendência determinística: 𝑌𝑡 = 𝛼 + 𝜌𝑌𝑡−1 + 𝛽𝑡 + 𝑒𝑡

𝐻𝑜 : 𝜌 = 1
As hipóteses são { . Seria de se esperar que fosse utilizado o teste t para
𝐻1 : 𝜌 < 1
verificar a significância do coeficiente 𝜌. No entanto, a hipótese nula com 𝜌 = 1 faria
com que o estimador de MQO fosse tendencioso para 0 levando a uma possível rejeição
indevida da hipótese nula.

Nesse contexto o teste introduzido por Dicky e Fuller passa por uma transformação da
equação do processo, na qual é subtraído o termo defasado 𝑌𝑡−1 nos dois lados da
igualdade dos modelos, de modo a se obter uma variável independente estacionária.
Ficando assim:

a) 𝑌𝑡 = 𝜌𝑌𝑡−1 + 𝑒𝑡 → ∆𝑌𝑡 = 𝛿𝑌𝑡−1 + 𝑒𝑡


b) 𝑌𝑡 = 𝛼 + 𝜌𝑌𝑡−1 + 𝑒𝑡 → ∆𝑌𝑡 = 𝛼 + 𝛿𝑌𝑡−1 + 𝑒𝑡
c) 𝑌𝑡 = 𝛼 + 𝜌𝑌𝑡−1 + 𝛽𝑡 + 𝑒𝑡 → ∆𝑌𝑡 = 𝛼 + 𝛿𝑌𝑡−1 + 𝛽𝑡 + 𝑒𝑡
𝐻𝑜 : 𝛿 = 0
As hipóteses, portanto, se transformam também e passam a ser: { . Na qual
𝐻1 : 𝛿 < 0
𝛿 = 𝜌 − 1. A hipótese nula é de não estacionariedade da série, já que quando δ chega
perto de 0 o valor de ρ necessariamente se aproxima de 1, ou seja, é o caso de raiz
unitária. A estatística de teste, chamada estatística de teste tau (𝜏) para o coeficiente δ
apresenta uma distribuição especial para o caso. Essa distribuição vai depender tanto
do tamanho da amostra quanto da especificação do modelo.

𝛿̂
𝜏=
𝑑𝑃(𝛿̂ )

Tabela de valores críticos de τ a 5% para teste de Dicky-Fuller

Constante
Sem Com
N e
constante constante
tendência
25 -1,95 -3,00 -3,6
50 -1,95 -2,93 -3,5
100 -1,95 -2,89 -3,45
250 -1,95 -2,88 -3,43
500 -1,95 -2,87 -3,42
∞ -1,95 -2,86 -3,41
O teste de Dicky-Filler apresenta limitações, tais como a desconsideração de situações
em que os erros 𝑒𝑡 sejam autocorrelacionados o que gera viés na variância de δ .̂ Para
resolver isso foi proposto o teste de Dicky-Fuller aumentado que considera defasagens
da variável dependente entre os regressores como forma de controlar a autocorrelação
nos erros 𝑒𝑡 . Nesse contexto é realizado diferenciações, além da regressão de primeira
ordem, indo em direção ao número de diferenciações necessárias até que o efeito da
correlação serial entre os erros seja extinguido da regressão. A estatística de teste é a
mesma que o teste Dicky-Fuller mais simples e com a mesma distribuição.

EXERCÍCIO PRÁTICO

2. Escolha duas séries temporais de variáveis obtidas em www.ipeadata.gov.br ou


wid.world. Usando o programa Gretl, faça análises de testes de estacionariedade,
gráficos ao longo do tempo e estime modelos (passeio aleatório, passeio aleatório com
deslocamento e com inclusão de tendência). Interprete os resultados.

Decidi pela análise entre coeficiente de Gini como medida da desigualdade e PIB per capita, afim
de se tentar entender se (e até que ponto) a evolução do PIB consegue influenciar na diminuição
da desigualdade no Brasil.

Gini

O primeiro passo a fazer é testar a estacionariedade da série. Podemos fazer isso via análise do
correlograma ou por testes estatísticos, como ADF. Antes, no entanto, é válido a verificação via
gráfico Gini x anos para tentar entender a estacionariedade de forma mais visual.

Pela análise visual do gráfico é possível prever que talvez não há estacionariedade, os valores
não convergem para uma média, no entanto, a variância, se analisada levando em conta a escala
que varia apenas entre 0,5 e 0,64, parece não ser muito grande. De qualquer forma a covariância
dos valores de Gini entre um período e outro não parecem depender apenas da distância entre
esses períodos.

Uma melhor forma de verificar isso, seria incialmente fazendo o correlograma. Infelizmente, há
ausência de alguns dados do IBGE a respeito do coeficiente de Gini, e o Gretl, não permitiu fazer
um correlograma nesse caso.

De qualquer forma é possível enxergar a estacionariedade (ou não) via teste de raiz unitária.
Escolhi utilizar inicialmente o teste ADF com a variável em nível, para logo após analisar essa
variável diferenciada para enxergar o quão melhor ela fica. O Gretl já retorna os 3 modelos de
processos não estacionários, portanto, é possível fazer uma análise completa de qual seria o
caso em que o coeficiente de defasagem se revelaria mais significativo.

Teste Dickey-Fuller aumentado, de ordem 1, para Gini


dimensão de amostragem 20
hipótese nula de raiz unitária: a = 1
Teste sem constante
modelo: (1 - L)y = (a-1)*y(-1) + ... + e Estimativas OLS usando 20 observações a partir de
1981-2014
valor estimado de (a - 1): -0,00368357 Observações omissas ou incompletas foram
ignoradas: 14
estatística de teste: tau_nc(1) = - 0,9467 Variável dependente: d_Gini
p-valor assimptótico 0,3069

Variável Coeficiente Erro-Padrão Teste t


Gini_1 -0,00368 0,00389 -0,947

d_Gini_1 0,12537 0,26604 0,471

De cara, não parece existir relação significativa entre o coeficiente defasado de primeira ordem
– d_Gini_1 . Considerando que o programa considera a-1 como estatística de teste e sob a
hipótese nula de raiz unitária a =1 (ou seja, coeficiente de Gini defasado em primeira ordem ser
aproximadamente igual a 1), conclui-se que se trata de uma série não estacionária. Isso é
empiricamente observável pelo valor estimado de (a-1): -0,00368. O resultado é, pouco teor
explicativo da variável defasada em relação a variável de interesse.

Os testes com constante e com constante e tendência revelaram resultados muito próximos
desse primeiro caso, o que leva a conclusão de que independente do modelo de especificação
a variável Gini é não estacionária.

Teste com constante


modelo: (1 - L)y = b0 + (a-1)*y(-1) + ... + e
valor estimado de (a - 1): 0,0550284
estatística de teste: tau_c(1) = 0,494361
p-valor assimptótico 0,9866
Regressão aumentada de Dickey-Fuller
Estimativas OLS usando 20 observações a partir de 1981-2014
Observações omissas ou incompletas foram ignoradas: 14
Variável dependente: d_Gini
Erro- P-
Variável Coeficiente Teste t
Padrão valor
Const -0,0342753 0,0649412 -0,528
Gini_1 0,0550284 0,111312 0,494 0,986
d_Gini_1 0,00804916 0,350924 0,023

Nesse segundo caso a única diferença é a inclusão da constante, que como se revelou pouco
significante não é de muita importância para explicar Gini.

com constante e tendência


modelo: (1 - L)y = b0 + b1*t + (a-1)*y(-1) + ... + e
valor estimado de (a - 1): -0,137462
estatística de teste: tau_ct(1) = -1,04132
p-valor assimptótico 0,9368

Regressão aumentada de Dickey-Fuller


Estimativas OLS usando 20 observações a partir de 1981-2014
Observações omissas ou incompletas foram ignoradas: 14
Variável dependente: d_Gini
Coeficient Erro-
Variável Teste t P-valor
e Padrão
Const 0,0909 0,0809 1,124
Gini_1 -0,1375 0,1320 -1,041 0,9368
d_Gini_1 -0,0951 0,3190 -0,298
time -0,0007 0,0003 -2,238

Ao usar o teste ADF com diferenciação já de primeira ordem é possível encontrar relativo grau
de significância, isso parece significar que o processo de estacionarização da variável deu certo.
É possível, portanto criar um modelo de estimação com relevância explicativa entre a variação
de Gini no ano 2014 e essa mesma variável no ano de 2013 e a variável defasada dessa diferença,
ou seja, o período de um ano imediatamente anterior a esse.

Os outros testes não mostraram significantes, portanto, não vou coloca-los aqui.

Teste Dickey-Fuller aumentado, de ordem 1, para d_Gini


dimensão de amostragem 16
hipótese nula de raiz unitária: a = 1

teste sem constante


modelo: (1 - L)y = (a-1)*y(-1) + ... + e
valor estimado de (a - 1): -0,81483
estatística de teste: tau_nc(1) = -2,01908
p-valor assimptótico 0,04168

Regressão aumentada de Dickey-Fuller


Estimativas OLS usando 16 observações a partir de 1981-2014
Observações omissas ou incompletas foram ignoradas: 18
Variável dependente: d_d_Gini
VARIÁVEL COEFICIENTE ERRO PADRÃO ESTAT. T P-VALOR

d_Gini_1 -0,814830 0,403564 -2,019 0,04168 **


d_d_Gini_1 -0,181970 0,413917 -0,440

Potrebbero piacerti anche