Sei sulla pagina 1di 11

Multicolinearidade

Econometria
Alexandre Gori Maia

Ementa:
• Definição;
• Fator Inflacionário da Variância;
• Identificação: Estatística Conflitantes e Ajsute entre Regressores;
• Medidas Paliativas;

Bibliografia Básica:
- Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap 10.
Definição FIV Identificação Medidas Paliativas

Multicolinearidade - Conceito
Seja o modelo definido por: Y    1 X1i  2 X 2i  ei
Variabilidade de Variabilidade Se X1 e X2 são independentes, a
Y explicada por de Y explicada variabilidade de Y explicada pelo modelo
X1 (SQReg1) Variabilidade por X2
de RLM divide-se em duas partes
total de Y (SQReg 2 )
disjuntas: o efeito isolado de X1 (SQReg1)
e o efeito isolado de X2 (SQReg2).
Variabilidade Teríamos ainda os mesmos coeficientes
Variabilidade total de X2 angulares das regressões simples:
total de X1
Y  1  1 X1i  e1i SQ Re g1
Y   2  2 X 2i  e2i SQ Re g 2
Variabilidade No outro extremo, poderíamos ter uma
total de Y
relação linear exata entre X1 e X2 (perfeita
colinearidade), ou seja:
Efeito
conjunto de X1i  2 X 2i
Variabilidade X1 e X2
X Nesta situação, seria impossível estimar
conjunta 1de X1 sobre Y
e X2 os efeitos isolados de X1 e X2 sobre Y.
2/11
Definição FIV Identificação Medidas Paliativas

Multicolinearidade - Conceito
Seja o modelo definido por: Y    1 X1i  2 X 2i  ei
Frequentemente observamos relação entre
Efeito Efeito
Variabilidade
isolado de isolado de as variáveis independentes X1 e X2 e,
total de Y
X1 em Y X2 em Y nesses casos, oefeito sobre Y poderá ser
dividido em 3 partes: i) efeito isolado de
X1; ii) isolado de X2; e iii) efeito conjunto
Variabilidade de X1 e X2.
Variabilidade total de X2
total de X1 O problema é que quando há uma forte
relação linear entre X1 e X2
Efeito conjunto de (multicolinearidade) pode ficar muito
X1 e X2 sobre Y difícil identificar os efeitos isolados de X1
Efeito
Efeito
isolado de
isolado de
e X2 sobre Y. Ou seja, a maior parcela da
X1 em Y Variabilidade
total de Y X2 em Y variabilidade de Y é explicada pelo efeito
conjunto de X1 e X2.
Efeito
Algebricamente, essa relação de
conjunto de multicolinearidade seria dada por:
X2
X1 X1 e X2 X1i  2 X 2i  vi
sobre Y
3/11
Definição FIV Identificação Medidas Paliativas

Multicolinearidade - Definição
Colinearidade Perfeita
Duas variáveis são ditas perfeitamente colineares quando há uma relação linear
exata entre essas. De maneira genérica, podemos representar a linearidade perfeita
por: X j  1 X 1  2 X 2  ...  k X k
i i i i

Multicolinearidade
Há multicolinearidade em um modelo de regressão múltipla quando duas ou mais
variáveis independentes são fortemente relacionadas linearmente entre si. Nesse
caso, teríamos: X j  1 X 1  2 X 2  ...  k X k  vi
i i i i

Conseqüências da Multicolinearidade
A existência de uma colinearidade exata entre duas ou mais variáveis
independentes torna impossível a obtenção dos coeficientes dos parâmetros por
MQO. Por sua vez, na presença de muiltcolinearidade os estimadores de MQO
continuam sendo os MELNV. O problema é que a multicolinearidade torna muitas
vezes as estimativas dos coeficientes dos parâmetros (’s) insignificantes, já que
cada um pressupõe, por definição, a variação em Y dada uma variação unitária em
X, mantendo-se constantes as demais informações. Ou seja, se duas variáveis
independentes são fortemente correlacionadas, tornár-se-á muito difícil haver
variação em uma sem que haja em outra. 4/11
Definição FIV Identificação Medidas Paliativas

Fator Inflacionário da Variância


Sabemos que a variância dos estimadores será:
Var (βˆ )  ( XT X) 1 2
Var(ˆ j )
Alternativamente, podemos chegar às
estimativas das variâncias individuais por:
2 2 1 2
Var( ˆ j )  n 2  n  FIV j
i 1 x ji (1  R j ) i 1 x ji 
2 (1  R 2 ) n
2
j x2
i 1 ji

Onde R2j é o coeficiente de


determinação do ajuste: R 2j
X ji  0  1 X1i  ... k 1 X ki  vi

Fator Inflacionário da Variância - FIV


Representa o quanto a variância de ^j está sendo inflacionada pela relação de
multcolinearidade entre Xj e as demais variáveis independentes. Quando não houver relação
entre as variáveis independentes (R2j =0) o FIVj será igual a 1 e, à medida que aproximamo-
nos de uma relação exata (R2j =1), o FIVj tenderá a infinito.

5/11
Definição FIV Identificação Medidas Paliativas

Multicolinearidade - Identificação
Alguns sinais de multicolinearidade:
Conflito entre estatísticas R2 e F do modelo e testes t para os parâmetros : as
estatísticas R2 e F podem indicar um modelo significativo, enquanto os testes t dos
parâmetros ´s seriam insignificantes.
Y    1 X1i  2 X 2i  ei H 0 : 1   2  0 X H 0 : 1  0 e H 0 :  2  0

Ajuste linear significativo entre as variáveis independentes: uma das variáveis


independentes apresentaria forte relação de linearidade com as demais.
X ji  0  1 X1i  ... k 1 X ki  vi R 2j
Fator Inflacionário da Variância: uma consequência de uma relação linear forte
entre um dos regressores e os demais será um elevado valor para o respectivo FIV.
R 2j FIVj

6/11
Definição FIV Identificação Medidas Paliativas

Multicolinearidade - Exemplo
Sejam as informações sobre emissões de CO2, PIB e população de 8 países:
CO2 1.5 8.7 2.8 9.4 4.4 8.4 3.2 0.9
PIB 13.2 197.0 128.6 286.4 72.6 167.8 114.4 58.0
Pop 3.2 35.5 19.1 40.4 3.1 22.3 8.4 9.0
O ajuste de MQO forneceu os seguintes resultados para o modelo:
CO2  β0  β1 PIB  β2 Pop  e CO2  0,472  0,030PIB  0,028 Pop  eˆ
Para a tabela ANOVA:
Fonte gl SQ QM F p CO2
Regressão 2 63.9 31.9 8.80 0.023
Resíduos 5 18.2 3.6
PIB Pop
Total 7 82.0
E para os testes t dos coeficientes:
Embora o ajuste seja significativo no
Variável ^ S^ t p
conjunto (teste F), as contribuições
Intercepto 0.472 1.328 0.356 0.737 marginais de cada variável são
PIB 0.030 0.025 1.226 0.275 insignificantes. Resultados que sugerem
a presença de multicolinearidade.
Pop 0.028 0.150 0.183 0.862 7/11
Definição FIV Identificação Medidas Paliativas

Multicolinearidade - Exemplo
Para nos certificarmos da presença de multicolinearidade, relacionamos os
regressores PIB e Pop:
O ajuste de MQO forneceu os seguintes resultados para a relação entre os regressores:

PIB  0  1 Pop  v PIB  29,2  5,7 Pop  vˆ

Os resultados da tabela ANOVA:


Fonte gl SQ QM F p
Regression 1 46.871,2 46.871,2 47,88 0,0005 PIB Pop
Residual 6 5.873,5 978,9
Total 7 52.744,6
2
RPIB  0,889
Podemos ainda calcular o FIV por:
1 1 Há multicolinearidade nos regressores, o que
FIV    8,98
(1  R j )
2
(1  0,889 ) estaria dificultando a identificação dos impactos
isolados dos regressores. O FIV é 9 vezes
superior ao que seria na ausência de relação
entre os regressores.
8/11
Definição FIV Identificação Medidas Paliativas

Multicolinearidade - Correção
Alguma medidas paliativas na presenção de multicolinearidade:
Aumentar o tamanho da amostra: aumentando o tamanho da amostra estaremos
aumentando a variabilidade de Xj e, conseqüentemente, reduzindo a variância do
estimador de j.
 2

Y    1 X1i  2 X 2i  ei Var ( ˆ j )  n FIV j


i1 x j
2
i

Tranformar as variáveis: a multicolinearidade pode ser eliminada a partir de


funções das variáveis independentes.
Y    1 X1i  2 X 2i  ei Y   0   0 Z i  ui onde Zi  f ( X1i , X 2i )

Omitir regressor que apresentar alta colinearidade com os demais: uma


solução simples, mas perigora, é excluir uma ou mais variáveis que apresentam
multicolinearidade. A exclusão de variáveis essenciais para compreensão do
problema pode, entretanto, gerar viés de especificação.
Y    1 X1i  2 X 2i  ei Y    1 X1i  ei

9/11
Definição FIV Identificação Medidas Paliativas

Correção Multicolinearidade - Exemplo


Sejam as informações sobre emissões de CO2, PIB e população de 8 países:
O ajuste de MQO nos forneceu os seguintes resultados :
CO2  β0  β1 PIB  β2 Pop  e CO2  0,472  0,030PIB  0,028 Pop  eˆ
Como havia multicolinearidade e os coeficientes eram insignificantes estatisticamente,
podemos propor um novo ajuste:
CO 2 PIB CO 2 PIB
 0  1 v  0,123  0,058  vˆ
Pop Pop Pop Pop
Os resultados da ANOVA seriam: CO2/
Fonte gl SQ QM F p Pop

Regressão 1 0,96 0,96 20,1 0,004


R2  0,77
Resíduos 6 0,29 0,05 PIB/
Total 7 1,25 Pop

O ajuste é significativo. Como se trata de um modelo de RLS, a significância do


teste t será igual à da estatística F.
10/11
Definição FIV Identificação Medidas Paliativas

Correção Multicolinearidade - Exemplo


Sejam as informações sobre emissões de CO2, PIB e população de 8 países:
O ajuste de MQO nos forneceu os seguintes resultados :
CO2  β0  β1 PIB  β2 Pop  e CO2  0,472  0,030PIB  0,028 Pop  eˆ
Como havia multicolinearidade e os coeficientes eram insignificantes estatisticamente,
podemos propor a exclusão de uma das variáveis:
CO 2  β0  β1 PIB  e CO2  0,401 0,035PIB  eˆ

Os resultados da ANOVA seriam:


CO2
Fonte gl SQ QM F p
Regressão 1 63,77 63,77 20,93 0,004
Resíduos 6 18,28 3,05
PIB
Total 7 82,05

Como pode-se comparar, as estimativas do segundo modelo são apenas ligeiramente


tendenciosas. E a relação entre CO2 e PIB passou a ser significativa. A decisão ideal
deveria, entretanto, basear-se em pressupostos teóricos sobre a forma de
relacionamento das variáveis... 11/11