Sei sulla pagina 1di 27

Introduc

ao ao curso: Revis
ao

Rafael Terra
Universidade de Braslia-Unb

17 de Agosto, 2015

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 1 / 27
Causalidade

Queremos identificar se x y . Isto e, se x causa y.


Exemplo:
educacao w.
educacao infantil desempenho em testes padronizados.
alquota de imposto atividade econ
omica.

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 2 / 27
Causalidade

A condicao de ceteris paribus e crucial para identificar uma relacao de


causalidade.
A correlacao e pouco informativa para inferir causalidade.
Na maioria das vezes nao e possvel realizar um experimento controlado,
com tudo mais constante.
Uma analise ceteris paribus focada na resposta media envolve estimar
E (y |w , c) em que y e a variavel de resposta, w e a variavel de interesse, e c
sao variaveis de controle.
Controlamos por variaveis c, pois w pode estar correlacionado com c, que
afeta y . Ao omitirmos c, podemos atribuir um efeito sobre y a w que se
deve na verdade a c
E (y |w ,c)
O efeito que queremos estimar e w .

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 3 / 27
Causalidade: Problemas

Que controles utilizar?


Cabe `a n
os decidirmos...Normalmente com base na teoria.
Mas e comum nao observarmos alguma variavel de controle em c. Se essa
variavel omitida for correlacionada com algum outro regressor de interesse,
obteremos estimativas enviesadas.
Mesmo que observemos todas as variaveis em c, w ou y podem ser medidas
com erro, o que podera causar problemas.
Podemos observar somente valores de equilbrio de y e w que sao
determinadas simultaneamente.

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 4 / 27
Estrutura de Dados

Na graduacao aprendemos que o regressando y e uma variavel aleatoria, e


os regressores w e c sao fixos, no sentido de serem exogenos.
Agora vamos trabalhar com a hip
otese de amostra aleatoria.
O modelo populacional foi especificado (E (y |w , c)), o que requer a
definicao da populacao de interesse.
Uma amostra independente e identicamente distribuda (i.i.d) pode ser
retirada.
Uma amostra aleatoria de uma populacao em um dado perodo de tempo,
da qual obtemos tanto y quanto w e c, permite obter variaveis aleatorias.
Essa hipotese permite que surjam situac
oes em que w ou c sejam
correlacionados com o termo de erro, i.e. nao sao fixos, mas endogenos.

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 5 / 27
Estrutura de Dados

Cross-section: Hip
otese de amostragem aleat
oria implica em regressores
aleat
orios i.i.d.
Dados experimentais: Diferente da amostra aleat
oria.
As variaveis explicativas sao fixas, i.e. definidas pelo pesquisador.
Pooled Cross Section: As observac oes nao sao i.i.d, sao independentes e nao
identicamente distribudas (i.n.i.d), isto e, a variancia muda ao longo do
tempo.
Correlacao Espacial: ocorre quando lidamos com grandes unidades
geograficas, que nao podemos assumir serem retiradas de uma populacao
muito grande e serem independentes, e.g. o desemprego em uma regiao
deve estar correlacionado com o da regiao vizinha.

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 6 / 27
Estrutura de Dados

Clusters em Cross Sections: Por exemplo, em escolas. Nao e i.i.d, mas


podemos corrigir o problema se o n
umero de clusters e grande em relacao ao
tamanho de cada cluster.
Selecao Amostral: As amostras de cross section nao sao representativas da
populacao. Podem apresentar selecao intencional ou nao intencional.
Painel: correlacao entre unidades seccionais ao longo do tempo deve existir.
Mas a amostra pode ser i.i.d. entre cross sections. Essa correlacao ao longo
do tempo nao e restritiva, especialmente em paineis com grande n umero de
unidades seccionais e pequeno n umero de perodos de tempo. Nao
precisamos disto para provar consistencia e eficiencia.

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 7 / 27
Mnimos Quadrados Ordinarios

Seja um modelo populacional simples:

y = x + u, (1)

x e uma matriz N K , em que N e o n umero de observacoes e K e o


n
umero de variaveis do modelo. y e x sao compostas por escalares
aleatorios observaveis. O termo u e a disturbancia aleatoria nao observavel.
Quais condic
oes garantem a estimacao consistente de por OLS?

E (u) = 0, Cov (xj , u) = E (xj u) = 0, j = 1, 2, ..., K . (2)

E (u|x1 , ..., xK ) = 0 e suficiente para garantir as condicoes em (2). Essa


condicao indica que nenhuma funcao adicional de xj ajuda a explicar y .

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 8 / 27
Mnimos Quadrados Ordinarios

A equacao (1) juntamente com a condicao em (2) nos informa a projecao


linear de y em (1, x1 , ..., xk ).

E (y |x) = x, (3)

Para duas variaveis explicativas

Projecao Linear de y sobre o espaco (x1 , x2 )

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 9 / 27
Mnimos Quadrados Ordinarios:Estimacao

Suponha que voce queira estimar os coeficientes do modelo populacional


y = x + u. Voce ira estimar y = x
ck + ub

ub = y x ,
b

ub0 ub = (y x )
b 0 (y x ) b
(4)
ub0 ub = y 0 y y 0 x b b0 x 0 y + b0 x 0 x b
ub0 ub = y 0 y 2b0 x 0 y + b0 x 0 x ,
b

Derivando com relacao a b e igualando a 0:

ub0 ub
= 2x 0 y + 2x 0 x b = 0
(5)
b = (x 0 x)1 x 0 y ,

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 10 / 27
Mnimos Quadrados Ordinarios:Estimacao

A matriz inversa (x 0 x)1 pode ser expressa como:

1
(x 0 x)1 = adj(x 0 x) (6)
det(x 0 x)

em que adj(xx) e a matriz adjunta.

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 11 / 27
Mnimos Quadrados Ordinarios: Endogeneidade

O principal problema quando buscamos determinar causalidade e a


endogeneidade de uma variavel xj . Nesse caso Cov (xj , u) 6= 0.
Ha basicamente tres fontes de endogeneidade.
Omissao de variaveis relevantes: Se q faz parte de x,mas nao e
observavel, podemos reescrever (1) como y = x + q + . Se q esta
correlacionada com alguma variavel xj em x , entao
Cov (xj , q + ) 6= 0, i.e. xj sera end
ogena, e seu coeficiente sera
enviesado.

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 12 / 27
Mnimos Quadrados Ordinarios:Endogeneidade

Erros de Medida: Suponha que voce queira estimar o efeito de xk sobre


y , mas voce s
o disp
oe de uma medida imperfeita xk tal que
xk = xk + .
Entao, voce quer estimar y = 0 + k xk + , mas substituindo

xk = xk temos y = 0 + k xk + ( k ).
f
E acil ver que Cov (xk , ( k )) = k Cov (xk , ). Considerando o
erro de medida em xk temos Cov (xk , ( k )) = k 2 .
A estimativa de k e inconsistente, produzindo um vies de atenuac ao
(subestima quando k > 0 e superestima quando k < 0).
Simultaneidade: suponha que xk = xk (y ) e y = 0 + k xk + . Nesse
caso, Cov (xk , ) 6= 0, e obteremos uma estimativa enviesada de k .

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 13 / 27
Condicoes para identificacao consistente dos parametros
por Mnimos Quadrados Ordinarios

As condic
oes para identificacao consistente de sao:
OLS.1: E [x 0 u] = 0
Para ver porque essa condic
ao e essencial vamos tomar a express
ao (5)
e substituir y por x + u

b = (x 0 x)1 x 0 y
b = (x 0 x)1 x 0 (x + u) (7)
0 1 0 0 1 0
b = (x x) x x + (x x) x u,

Tomando a Esperanca de b

b = E [(x 0 x)1 x 0 x] + E [(x 0 x)1 x 0 u]


E []
(8)
b = + (x 0 x)1 E [x 0 u]
E []

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 14 / 27
Condicoes para identificacao consistente dos parametros
por Mnimos Quadrados Ordinarios

otese OLS.1 E [x 0 u] = 0, temos que


Dada a hip

E []
b = (9)

Se E [x 0 u] 6= 0, E []
b = + (x 0 x)1 E (x 0 u) 6=

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 15 / 27
Condicoes para identificacao consistente dos parametros
por Mnimos Quadrados Ordinarios

OLS.2: rankE (x 0 x) = K
Essa condic ao e necessaria para garantir que haja K colunas n ao nulas
em (x 0 x). Colunas nulas ocorrem quando h a multicolinearidade
perfeita, i.e. uma ou mais colunas s ao combinaco es lineares de outras
colunas includas na matriz.
Se houver uma coluna que e uma combinacao linear de outra, o
det(x 0 x) = 0 e (x 0 x) ser
a singular (nao invertvel). Logo, n
ao ser
a
possvel estimar b = (x 0 x)1 x 0 y ,

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 16 / 27
Condicoes para identificacao consistente dos parametros
por Mnimos Quadrados Ordinarios

A violacao de OLS.1 resulta em estimativas inconsistentes de . Se interessa


estimar a magnitude exada deste coeficiente, temos que recorrer ao uso de
variaveis instrumentais (que veremos mais adiante no curso).
Normalmente a violacao dessa hip otese se baseia na teoria ou no bom
senso. Mas e possvel realizar testes para detectar endogeneidade como
veremos mais adiante no curso.
A violacao de OLS.2 nao permite identificacao do parametro. A quase
violacao, e.g. quando ha forte associacao entre duas variaveis includas no
modelo (forte colinearidade), tambem atrapalha a realizacao de testes de
hip
otese sobre o parametro de interesse.

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 17 / 27
Condicoes para identificacao consistente dos parametros
por Mnimos Quadrados Ordinarios

Para ver isso note que

b = E [(b )(b )0 ]
Var ()
= E [(x 0 x)1 x 0 uu 0 x(x 0 x)1 ]
(10)
= (x 0 x)1 E (uu 0 )
= (x 0 x)1 u2

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 18 / 27
Condicoes para identificacao consistente dos parametros
por Mnimos Quadrados Ordinarios

Note que no u ltimo slide usamos uma hip


otese adicional de distubancia
esferica que chamaremos de OLS.3.
OLS.3: E (uu 0 |x) = u2 I .
Note que quando ha forte correlacao entre duas variaveis includas no
modelo, (x 0 x)1 e a Var ()
b , e os testes de hipoteses
tendem a nao rejeitar que os coeficientes sejam iguais a zero.

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 19 / 27
Condicoes para identificacao consistente dos parametros
por Mnimos Quadrados Ordinarios

Para testar o grau de colinearidade, ha alguns procedimentos.


Voce pode verificar a matriz de correlac oes, mas nesse caso voce estara
verificando a correlacao das variaveis duas a duas.
Voce pode estimar regress
oes auxiliares para cada regressor xj em funcao
dos demais regressores:

xj = 0 + 1 x1 + ... + j1 xj1 + j+1 xj+1 + ...j+n xj+n + (11)

Isto e um problema quando voce tem muitos regressores.

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 20 / 27
Condicoes para identificacao consistente dos parametros
por Mnimos Quadrados Ordinarios

Um R 2 muito alto significa indcio de alta colinearidade com uma ou mais


variaveis.
Pode-se verificar o Fator de Inflacao da Variancia:
1
F (bj ) = (12)
1 R2

Geralmente, um F > 5 indica problemas de forte colineridade na variavel.


Possveis soluc
oes consistem em excluir a variavel se a teoria nao indicar essa
variavel como importante para o modelo.
Podemos criar indicadores-sntese por componentes principais.
Na verdade, alta colinearidade entre variaveis nao e um grande problema. O
principal problema nesse curso e como tratar a endogeneidade.

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 21 / 27
Estimacao eficiente

O que ocorre quando OLS.3 nao e valida, isto e,


2
1 0 0
0 22 0
E (uu 0 ) = 2 = . (13)

.. . . ..
.. . . .
0 o n2

Nesse caso a matriz e uma matriz de pesos i,j .


Nesse caso, a estimativa por OLS continua consistente, mas os erros-padrao
serao inconsistentes.
Uma forma de contornar esse problema e usar o estimador de White para a
matriz de variancia-covariancia

n
1 2 0 1X 2 0
= x x = i xi xi (14)
n n
i=1

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 22 / 27
Estimacao eficiente

White propoe que sob condicoes gerais pode-se estimar consistentemente


essa matriz, usando os resduos ub ao quadrado como estimadores de i2 .

n
1 2 0 1X 2 0
S0 = x x = ubi xi xi (15)
n n
i=1

Logo temos

b = n(x 0 x)1 S0 (x 0 x)1 .


Var () (16)

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 23 / 27
Estimacao eficiente

Como testar a existencia de heterocedasticidade?


Teste de Breusch-Pagan (BP): regrida

ub2 = x + . (17)

Depois realize um teste F:

Rub22
F = (18)
(1 Rub22 )/(n k 1)

Teste de White: realize o mesmo teste F com base na seguinte regressao.


n X
X n
ub2 = x + jl xj xl + . (19)
j=1 l=1

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 24 / 27
Estimacao eficiente

Outra forma de lidar com o problema e usando o estimador eficiente FGLS


(Feasible Generalized Least Squares).
A f
ormula do estimador consiste em ponderar as observacoes pelo inverso de

wi,j , e pode ser representada por

b = (x 0 1 x)1 x 0 1 y (20)

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 25 / 27
Estimacao eficiente

Mas como estimar ?


Podemos usar os quadrados dos resduos ubi2 do estimador OLS que e
consistente. Da regredimos esses resduos sobre os regressores do modelo e
obtemos obtemos u bb2 um estimador consistente de 2 wi,j e montamos uma
i
matriz de variancia-covariancia
b e substitumos no lugar de .
1
Estimamos agora bFGLS ponderando as observac
oes por 2. Obtemos
ubi
b

novamente resduos e re-inserimos este na matriz , b i.e. reponderamos as


observac oes com esses novos resduos, ate atingir uma convergencia em que
a variacao no estimador seja nfima.
Podemos tratar o problema de auto-correlacao (resduos
auto-correlacionados) e heterocedasticidade com o mesmo procedimento.
De fato, podemos tratar os dois problemas de uma s o vez com os
procedimentos acima descritos.

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 26 / 27
Referencias

Wooldridge Cap. 1 e 4
Greene Cap. 11

Rafael Terra (Unb) Econometria do Setor P


ublico 17 de Agosto, 2015 27 / 27

Potrebbero piacerti anche