Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Introdução
Dado a importância desse modelo, é essencial que se estabeleça algumas premissas para
que não se tire conclusões inadequadas sobre a correlação (ou não) das variáveis estudadas. É,
portanto, fundamental que a série apresente uma estrutura que possa ser caracterizada ou
descrita ao longo do tempo. Nesse contexto a estacionariedade ganha especial relevância.
A lógica por trás desse processo está relacionada com o coeficiente de relação entre o
valor de Y presente e seu valor defasado. Quando esse coeficiente (ρ) é menor que 1, o valor de
Y presente depois de um ‘‘choque não esperado’’ tende a se dissipar nos períodos posteriores e
convergir para a média de Y. Se o coeficiente (ρ) for igual a 1 esse choque nunca se dissipa e
tende a acumular com outros erros aleatórios que podem surgir com o passar do tempo. A
representação desse processo pode ser feita por:
𝑌𝑡 = 𝜌𝑌𝑡−1 + 𝑒𝑡
Essa regressão pode ser denominada tanto como modelo sem constante com
componente autorregressivo (de 1a ordem) quanto como passeio aleatório. O erro 𝑒𝑡 dessa
regressão representa os choques aleatórios, e vai ser responsável por explicar a parte que a
variável defasada 𝑌𝑡−1 não foi capaz de contemplar. Esse erro, por sua vez, pode ser chamado
de ruído branco, e independente da série ser estacionária ou não, ele precisa obedecer os
pressupostos de média igual a 0, variância constante (e igual a 0) e não correlacionada com o
erro dos períodos posteriores (𝑐𝑜𝑣 (𝑒𝑡 , 𝑒𝑡+1 ) = 0). Por obedecer esses pressupostos ele se
torna por si só um processo estacionário.
A identificação de uma série, se ela é estacionária ou não, por meio da raiz unitária pode
ser feita, além desse caso de passeio aleatório, nos casos de passeio aleatório com
deslocamento ou passeio aleatório em torno de uma tendência. As respectivas funções são:
Testes
Entre os testes utilizados para descobrir e até mesmo corrigir a não estacionariedade estão a
função de autocorrelação e o correlograma, o teste de raiz unitária e ainda o teste de Dickey-
Fuller.
Correlograma:
𝜌K
K
0 1 2 3 4 5
0 1 2 3 4 5 K
𝐻𝑜 : 𝜌 = 1
As hipóteses são { . Seria de se esperar que fosse utilizado o teste t para
𝐻1 : 𝜌 < 1
verificar a significância do coeficiente 𝜌. No entanto, a hipótese nula com 𝜌 = 1 faria
com que o estimador de MQO fosse tendencioso para 0 levando a uma possível rejeição
indevida da hipótese nula.
Nesse contexto o teste introduzido por Dicky e Fuller passa por uma transformação da
equação do processo, na qual é subtraído o termo defasado 𝑌𝑡−1 nos dois lados da
igualdade dos modelos, de modo a se obter uma variável independente estacionária.
Ficando assim:
𝛿̂
𝜏=
𝑑𝑃(𝛿̂ )
Constante
Sem Com
N e
constante constante
tendência
25 -1,95 -3,00 -3,6
50 -1,95 -2,93 -3,5
100 -1,95 -2,89 -3,45
250 -1,95 -2,88 -3,43
500 -1,95 -2,87 -3,42
∞ -1,95 -2,86 -3,41
O teste de Dicky-Filler apresenta limitações, tais como a desconsideração de situações
em que os erros 𝑒𝑡 sejam autocorrelacionados o que gera viés na variância de δ .̂ Para
resolver isso foi proposto o teste de Dicky-Fuller aumentado que considera defasagens
da variável dependente entre os regressores como forma de controlar a autocorrelação
nos erros 𝑒𝑡 . Nesse contexto é realizado diferenciações, além da regressão de primeira
ordem, indo em direção ao número de diferenciações necessárias até que o efeito da
correlação serial entre os erros seja extinguido da regressão. A estatística de teste é a
mesma que o teste Dicky-Fuller mais simples e com a mesma distribuição.
EXERCÍCIO PRÁTICO
Decidi pela análise entre coeficiente de Gini como medida da desigualdade e PIB per capita, afim
de se tentar entender se (e até que ponto) a evolução do PIB consegue influenciar na diminuição
da desigualdade no Brasil.
Gini
O primeiro passo a fazer é testar a estacionariedade da série. Podemos fazer isso via análise do
correlograma ou por testes estatísticos, como ADF. Antes, no entanto, é válido a verificação via
gráfico Gini x anos para tentar entender a estacionariedade de forma mais visual.
Pela análise visual do gráfico é possível prever que talvez não há estacionariedade, os valores
não convergem para uma média, no entanto, a variância, se analisada levando em conta a escala
que varia apenas entre 0,5 e 0,64, parece não ser muito grande. De qualquer forma a covariância
dos valores de Gini entre um período e outro não parecem depender apenas da distância entre
esses períodos.
Uma melhor forma de verificar isso, seria incialmente fazendo o correlograma. Infelizmente, há
ausência de alguns dados do IBGE a respeito do coeficiente de Gini, e o Gretl, não permitiu fazer
um correlograma nesse caso.
De qualquer forma é possível enxergar a estacionariedade (ou não) via teste de raiz unitária.
Escolhi utilizar inicialmente o teste ADF com a variável em nível, para logo após analisar essa
variável diferenciada para enxergar o quão melhor ela fica. O Gretl já retorna os 3 modelos de
processos não estacionários, portanto, é possível fazer uma análise completa de qual seria o
caso em que o coeficiente de defasagem se revelaria mais significativo.
De cara, não parece existir relação significativa entre o coeficiente defasado de primeira ordem
– d_Gini_1 . Considerando que o programa considera a-1 como estatística de teste e sob a
hipótese nula de raiz unitária a =1 (ou seja, coeficiente de Gini defasado em primeira ordem ser
aproximadamente igual a 1), conclui-se que se trata de uma série não estacionária. Isso é
empiricamente observável pelo valor estimado de (a-1): -0,00368. O resultado é, pouco teor
explicativo da variável defasada em relação a variável de interesse.
Os testes com constante e com constante e tendência revelaram resultados muito próximos
desse primeiro caso, o que leva a conclusão de que independente do modelo de especificação
a variável Gini é não estacionária.
Nesse segundo caso a única diferença é a inclusão da constante, que como se revelou pouco
significante não é de muita importância para explicar Gini.
Ao usar o teste ADF com diferenciação já de primeira ordem é possível encontrar relativo grau
de significância, isso parece significar que o processo de estacionarização da variável deu certo.
É possível, portanto criar um modelo de estimação com relevância explicativa entre a variação
de Gini no ano 2014 e essa mesma variável no ano de 2013 e a variável defasada dessa diferença,
ou seja, o período de um ano imediatamente anterior a esse.
Os outros testes não mostraram significantes, portanto, não vou coloca-los aqui.