Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Mestrado em Economia Aplicada Faculdade de Economia e Administrao Prof. Rogrio Silva de Mattos
ECONOMETRIA CLSSICA
Notas de Aula
1. INTRODUO
1.3 VISO ESTATSTICA Modelo Populacional Modelo Gerador dos Dados (MGD) Modelo Probabilstico Modelo Gerador dos Dados (MGD)
2. MODELO DE REGRESSO MLTIPLA 2.1 MODELO LINEAR GAUSSIANO (verso bsica) MGD: Y
Yi b1 b2 X 2i bk X ki
i
bj
E (Yi )
que corta o espao euclidiano Rk; Hipteses Bsicas 1. Y uma funo linear de X 2 , , X k ; 2. X 2 , , X k so variveis no-estocsticas; 3. Cada X j no uma funo linear das demais X s , j s, j, s 1,, k; ; 4. E ( i ) 0 ; 2 5. Var ( i ) e E ( i j ) 0; i j, i, j 1,n; ; 6.
i
~ N (0,
Yi ~ N ( E (Yi ),
).
Observaes Modelo linear vem da rea de planejamento de experimentos, da a hiptese 2 que diz que cada Xj no varivel aleatria; Hiptese 3, implica que cada X j no combinao linear das demais variveis explicativas; Hipteses 4, 5, e 6 dizem respeito ao termo de erro aleatrio i , que apresenta as seguintes caractersticas:
mdia nula (hip. 4); homocedstico, pois possui varincia constante (hip. 5); no autocorrelacionado com os demais j (hip. 5); distribuio normal (hip. 6), logo Yi tambm normal com mdia E (Yi ) e varincia 2 ;
Xb
Yn
n k
1 X 21 X k1 1 X 2 n X kn
k 1
b1 bk
1 n 1
E(Y )
Xb .
Hipteses Bsicas Re-escritas 1. Vetor Y funo linear dos vetores colunas da matriz X; 2. X uma matriz no-estocstica; 3. X possui posto completo igual a k; 4. E( ) 0 , onde 0 um vetor n1 de elementos nulos; 2 I , onde I uma matriz identidade nn; 5. Var ( ) E ( ) 2 Y ~ MN ( Xb, 2 I ) ; 6. ~ MN (0, I ) Observaes As hipteses correspondem s anteriores para a verso nomatricial; Hiptese 3 implica que cada coluna de X no uma combinao linear exata das k-1 colunas restantes; Hipteses 4-6 dizem respeito ao vetor de erros aleatrios ; Hiptese 6 diz que vetor segue uma distribuio normal multivariada com vetor de mdias 0 e matriz de varinciacovarincia 2 I ; Hiptese 6 tambm diz que vetor Y segue uma distribuio normal multivariada com vetor de mdias Xb e matriz de varincia-covarincia 2 I ;
2.3 ESTIMADOR DE MNIMOS QUADRADOS ORDINRIOS Conceitos Modelo Amostral: Preditor Linear: Resduo: Representao Matricial Modelo Amostral: Preditor Linear: Resduo:
Y1 Yn b1 bk
n 1
Yi Yi
i
b1 b2 X 2i bk X ki b1 b2 X 2i bk X ki
Yi Yi Y b
i
b2 X 2i bk X ki
Y Y
Xb Xb
Y Y
Xb
1 n
onde:
n 1
k 1
i para b , ou
Prova
Como se tem de minimizar uma funo de b , usa-se as regras de determinao de valores mnimos de funes diferenciveis de vrias variveis. Ou seja, acha-se as derivadas parciais da funo, iguala-se estas a zero e resolve-se o sistema resultante. Os passos so os seguintes:
1. (Y Xb) (Y Xb) (Y YY 2b X Y b X Xb
b X )(Y
b
( b) 2
2
Xb)
YY
bXY
0
YXb b X Xb
2. Condio de 1. Ordem:
3. b ( X X ) 1 X Y
2X Y
2 X Xb
EMQO para b.
2( X X )
k k
4. Condio de 2. Ordem:
definida positiva*
* Como X tem posto k, segue que a matriz quadrada XX de ordem kk tambm apresenta posto k e, logo, no singular. Sendo no singular, possui inversa. Alm disso, XX definida positiva ( z X Xz 0, z 0 ; veja-se, por exemplo, JD, 1988:
Nota: Derivao Vetorial Seja a um vetor k 1 de constantes, A uma matriz k k de constantes e b um vetor k 1 de variveis. Ento:
( a b) b (b Ab) b (b a) b 2 Ab a
Exemplo: Vendas trimestrais de automveis nos EUA (1959.I-1988.I). MGD: onde: S = consumo pessoal de automveis novos em US$ bilhes; YP = renda pessoal em US$ bilhes; R = taxa de juros trimestral (de ttulo do Tesouro Americano); CPI = ndice de preos ao consumidor para novos carros (1983=100)
Modelo Emprico: S t 35,7 0,0391YPt 1,586Rt 0,654CPI t
St b1 b2YPt b3 Rt b4 CPI t
t
Prova:
b (X X ) 1 X Y ( X X ) 1 X ( Xb ) b (X X ) 1 X . Do que segue que b b ( X X ) 1 X .
Mdia
Vis(b) E (b b) E (b) b . E (X X ) 1 X ( X X ) 1 X E( ) 0;
Var (b)
(X X )
X ( X X ) 1] )X (X X ) I)X (X X )
1 1
(X X )
2.5 PROPRIEDADES DOS EMQO Eficincia Eficincia Restrita: dadas as hipteses 1-5, o EMQO o mais eficiente (no enviesado e com varincia mnima) dentro da classe dos estimadores lineares de b; ou seja, o EMQO o Melhor Estimador Linear No Enviesado (MELNE) de b.
Nota: Um estimador linear aquele que pode ser escrito como b uma matriz k n.
MY , onde M
Prova (Teorema de Gauss Markov): A prova s usa hipteses 1-5. Sejam A ambas de ordem k n. Por R1, b b A , ~ Seja tambm b ( A C )Y um estimador ~ Ento, pode-se escrever b ( A C)( Xb ) ~ b ser no enviesado, ele tem de satisfazer:
~ E(b )
(X X ) 1 X
AXb CXb b CXb ( I CX )b b . ~ Logo, preciso que CX 0 . Supondo CX 0 , ento (b b) ( A C ) ~ ~ ~ de modo que Var(b ) E[(b b)(b b) ] pode ser desenvolvida como:
~ Var (b ) E[( A C )
2
( A C )' ] ( A C ) E (
)( A C )
( A C )( A C )
Mas,
( A C )( A C ) AA (X X ) (X X ) CA
1 1
AC CC
CC
1
CX ( X X )
(X X ) 1 X C
CC
Pois CX
X 'C '
0 . Ento:
CC ] Var (b)
~ Var (b )
[( X X )
CC
CC
estimador linear, diferente do EMQO, que seja mais eficiente (no-enviesado e com varincia mnima).
Eficincia Irrestrita: Quando vale tambm a hiptese 6 (erros normalmente distribudos), o EMQO o mais eficiente dentre todos os estimadores (lineares e no-lineares). A prova envolve mostrar que no caso de normalidade dos erros o EMQO equivalente ao Estimador de Mxima Verossimilhana (EMV).
Consistncia
EMQO consistente para b, ou seja, p lim(b) b ;
X n X n
p lim
k 1
Logo:
p lim(b) b
N (0,1) ;
Ou seja, em amostras grandes, podemos aproximar a distribuio de b j como uma normal, isto : para n grande, b j ~ N (b j , b2j ) ; Logo, se a amostra grande, no precisamos da hiptese 6. Qualquer que seja a distribuio de i , podemos aplicar a teoria da normal para o EMQO e os procedimentos de testes de hiptese;
2.6 QUALIDADE DO AJUSTAMENTO Como avaliar se o modelo est aderindo bem aos dados ou no? Estatsticas descritivas: R 2 , R 2 , Critrio de Informao de Akaike (AIC) e Critrio de Schwarz (SC)
R2
Yi Yi
Desvio Noexplicado
Yi Y
Desvio Explicado
Desvio Total
(Yi Y ) 2
i 1
(Yi
i 1
+ Yi ) 2
n i 1
(Yi Y ) 2
Variao Total
Variao Noexplicada
Variao Explicada
Matricialmente: y y onde: y Y Y
n 1
yy
y
n 1
Y Y
n 1
Y Y
Grau de ajustamento
R2 yy yy
ou
R2 1
yy
Propriedades
R2 [0,1] ;
R 2 1 ; Fraco ajustamento Bom ajustamento R2 0 ; R 2 tende a aumentar sempre com novas variveis explicativas; R 2 nunca diminui com novas variveis explicativas
R 2 ou R 2 - ajustado
Propriedades
R 2 R 2 se k = 1; R 2 R 2 se k > 1; R 2 pode diminuir se incluo variveis pouco explicativas; R 2 pode ser negativo;
Propriedades ; Quanto menor AIC, melhor o ajustamento; AIC penaliza bem mais que o R 2 a presena de variveis irrelevantes; AIC valoriza mais a parcimnia.
AIC
Critrio de Schwarz SC
SC log n k log n n
Propriedades ; Quanto menor SC, melhor o ajustamento; SC penaliza bem mais que o R 2 a presena de variveis irrelevantes; SC tambm valoriza mais a parcimnia do que o AIC, penalizando mais ainda o nmero de parmetros/variveis no modelo.
SC
i2 n
i 1
Problema: 2 um estimador enviesado de 2 ; Soluo: usa-se um corretor de vis que redunda em:
n
i2
S2
i 1
n k
n k
S 2 a chamada varincia residual e ser usada em vrios contextos, por exemplo, o R 2 - ajustado pode ser escrito como:
n
R2 1
S , onde: S Y2 2 SY
(Yi
i 1
Y )2
n 1
Nota: Dados anuais referentes ao Brasil; CO = consumo das famlias; Y = renda disponvel das famlias; GR = gastos do governo; I = investimento direto; NE = Exportaes lquidas
diag S b2
2.8 RESULTADOS IMPORTANTES Supondo que valem todas as hipteses, inclusive a 6, de normalidade dos erros : R3. /
2
2 n k
;
~
2 n k
R4. (n k )S 2 /
R6. (n k ) S 2 /
e (b j b j ) so independentes;
(b j bj ) S Vj ~ tn
k
(b j b j ) /
V j ~ N (0,1) .
Agora
(n k ) S 2 , (n k ) 2
temos uma VA N(0,1) dividida pela raz quadrada de uma VA 2 n k (dividida, por sua vez, por n k), ambas independentes, o que resulta numa VA tn-k. Fazendo as simplificaes necessrias, obtm-se o resultado R7.
2.9 ESTIMAO INTERVALAR Objetivo: achar intervalos de confiana para bj; Em geral, usa-se intervalos bilaterais; Critrio: P(b jL b j b jH ) 1 ;
b j , L = limite inferior b j , H = limite superior
1
= nvel de confiana
Soluo:
b j,L b j,H bj bj t1 t1
/ 2,n k b j / 2,n k b j
Prova: Defina sb
t1
bj sb
j
t1
/ 2,n k
P t1
/ 2,n k b j
bj
bj
t1
/ 2, n k b j
bj
bj
t1
/ 2,n k b j
bj
bj
t1
/ 2,n k b j
Exemplos de hipteses de interesse: H0: b1 = 0 (E(Y) atravessa a origem do espao Rk); H1: b1 0 (E(Y) no atravessa a origem do espao Rk); H0: b2 = 0 (variaes em X2 no explicam variaes em Y); H1: b2 0 (variaes em X2 explicam variaes em Y); H0: b3 = 1 (variaes em X3 produzem variaes idnticas em Y); H1: b3 1 (variaes em X3 no produzem vars. idnticas em Y); Conceitos e definies = nvel de significncia = P(Erro Tipo I) = P(Rejeitar H0|H0 V); = P(Erro Tipo II) = P(No Rejeitar H0|H0 F); Poder do teste = 1 - ; Representao Geral H0: bj = b0j ; H1: bj b0j Caso tpico em econometria: b0j = 0; Por R7, segue que (b j b0, j ) Sb ~ t n k ou b S b ~ t n k (caso b0j= 0);
j j
Procedimentos do teste t (tpico) 1. Enunciado das hipteses: H0: bj = 0 ; H1: bj 2. Escolha de = nvel de significncia; 3. Clculo de tb
bj
j
S b
No rejeito H0;
j
Se P( | Tn k | tb )
Rejeito H0;
MGD: COt
b1
b2Yt
b3GR b4 I t
b5 NE t
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion
2.12 TESTE F (SIGNIFICNCIA GERAL DA REGRESSO) H0: b2 b3 bk 0 (nenhuma Xj explica variaes em Y); H1: pelo menos um b j 0 (pelo menos uma Xj explica variaes em Y); j = 2...,k-1; Suponha vlidas as hipteses 1 a 6 e considere H0 verdadeira: R8.
n i 1
(Yi
Y )2
yy
b* x* x*b*
2 k 1
, onde
* n ( k 1)
X*
X*
a matriz X em forma de desvios em relao mdia com a primeira coluna (referente constante) excluda. Prova: Ver [VA: pp. 59-60]; R9.
y y /(k 1) ~ Fk /(n k )
1, n k
1, n k
Estatstica de Teste:
F y y /(k 1) /(n k ) Variao Explicada /(k 1) Variao No Explicada /(n k )
F) F)
b2 b3
2 ( x2i yi x3i ) ( x3i yi )( x2i x3i ) 2 2 ( x2i )( x3i ) ( x2i x3i ) 2 2 ( x3i yi x2i ) ( x2i yi )( x2i x3i ) 2 2 ( x2i )( x3i ) ( x2i x3i ) 2
b1
b2 X 2
b3 X 3
Se X 2
X 3 , com
Alta mas no perfeita colinearidade possvel computar EMQO, pois hip. 2 no violada; Sejam as varincias estimadas dos EMQO, (obtidas como os 2 ltimos elementos da diagonal principal de S b2 S 2 ( X X ) 1 ):
S b2 S2 2 x2i (1 r23 ) S b2 S2 2 x3i (1 r23 )
2 r23
Sb
e Sb
Logo:
2 r23
t b
0 e t b
Conseqncias da Multicolinearidade Estatsticas t podem ficar artificialmente muito baixas; Inclusive, possvel acontecer R 2 1 com t b contraditrio;
2
0 e t b
0 , o que
Solues Alternativas Retira-se uma das variveis do modelo; Trabalha-se com variveis em diferenas: o Exemplo: Modelo de interesse: C t b1 b2Yt b3Wt t Se Yt e Wt muito correlacionadas, usa-se: Ct Ct 1 b2 (Yt Yt 1 ) b3 (Wt Wt 1 ) ( t t 1 )
Caso 2: Modelo com 1 var. dependente e k-1 vars. independentes: Multicolinearidade Perfeita
Yi b1 b2 X 2i bk X ki
i
X 2i
X 3i
X ki
Ou seja, uma varivel explicativa no pode ser linearmente dependente das demais.
X 3i
X ki
);
f (Yi )
exp
(Yi
b1 b2 X 2i bk X ki ) 2 2 2
Funo de verossimilhana:
n
L(b1 ,, bk ,
)
i 1
f (Yi ) 1 2
2 n 2 n
exp
i 1
(Yi
b1 b2 X 2i 2
2
bk X ki ) 2
Em forma matricial:
L(b,
2
1 2
2
n 2
exp
(Y
Xb) (Y 2 2
Xb)
Log-verosssimilhana:
n ln 2 2 n ln 2 (Y Y b X Y YXb b X Xb) 2 2
(b,
1 2
2
(2 X Y
~ 2 X Xb ) 0
~ b
~2
(X X ) 1 X Y
~~ n
n 2 ~2
~~ 2 ~4
~ onde: ~ Y Xb
mximo
Logo, o EMV de b ( b ) o mesmo que o EMQO ( b ); e o EMV de 2 ~2 ( ) difere do usado antes para 2 ( S 2 ) apenas no denominador;
tambm eficiente;
Concluso Sob hiptese 6 de normalidade dos erros, EMQO e EMV so equivalentes e portanto constituem o melhor estimador de b dentre os estimadores lineares e os no-lineares.
2.15 PREVISO Objetivo: acertar um valor de Y condicional a valores particulares de X 2 ,, X k ; Previso Pontual Seja x f
[1 X 2 f X kf ] , ento:
Yf
b1 b2 X 2 f
bk X kf
xf b
Pelo T. Gauss-Markov:
o b o melhor estimador linear de b; o Logo, Y f um preditor timo de Yf;
Erro de previso: e f
Yf
Yf ;
o Note que: E(Y f ) x f E(b) x f b E(Y f ) ; o Logo: E(e f ) E(Y f Y f ) E(Y f ) E(Y f ) 0; o Ou seja Y f um previsor no enviesado de Y f .
2 f
Var (Y f Var (
2 2 f
Y f ) Var (
x f (b b))
2 2
) Var ( x f (b b))
2
E[ x f (b b)(b b) x f ]
x f Var (b) x f [1 x f ( X X ) 1 x f ]
xf (X X ) 1 xf
Resultados de interesse Sejam vlidas hips. 1-6. Considere os seguintes resultados: R10. R11. R12. R13.
(Y f (Y f Y Yf )
2 f
f
2 f
ef
~
2 n k
~ N (0,1);
2 f
(n k ) S
; so independentes;
Yf )
Yf Sf
e (n k ) S 2 f
k
~ tn
Yf
(n k ) S 2 f (n k )
2 f
Y Yf Sf
~ tn k ,
Previso Intervalar
Soluo:
Y fL Y fH Yf Yf t1 t1
/ 2, n k
Sf Sf
/ 2,n k
Yf Sf
t1
/ 2,n k
) 1
Sf
Yf
Yf
t1
/ 2, n k
Sf ) 1
Isto :
P(Y fL Yf Y fH ) 1
29.589.820 0,789Yt
CL 1046 1073 1095 1114 1132 1148 C 1087 1114 1136 1156 1174 1190 CH 1128 1155 1177 1197 1215 1233
0,686GR 0,606I t
Y 1848 1907 1958 2008 2055 2102 G 157 165 173 182 191 201
0,781NE t
I 364 382 401 421 442 464 NE 94 97 99 101 102 102
3. USOS E EXTENSES DO MODELO DE REGRESSO MLTIPLA 3.1 COEFICIENTES PADRONIZADOS Os coeficientes do MGD linear no podem ser comparados entre si; Suas magnitudes dependem da escala de medida das variveis explicativas; Soluo: modelo com as variveis padronizadas, isto :
Yi SY Y
* b2
X 2i X 2 S X2
* bk
X ki X k S Xk
ei
j = 2,...,k.
Coeficientes padronizados so a-dimensionais, isto , no possuem uma unidade particular de medida; A comparao entre coeficientes padronizados possvel porque agora todas as variveis apresentam a mesma mdia e varincia; 3.2 ELASTICIDADES Muito usada em microeconomia, a elasticidade mede a variao relativa na varivel dependente dada uma variao relativa numa varivel independente (com as demais constantes);
Ej E (Yi ) X ji X ji E (Yi ) bj X ji E (Yi )
No caso do modelo log-log (todas as variveis so medidas em logaritmos), a elasticidade constante para todo i = 1,...,n.
3.3 MODELOS NO-LINEARES Modelo Linear: Yi b1 b2 X 2i bk X ki i Modelo No-Linear: qualquer modelo que no linear.
Yi F ( X 2i ,, X ki , i )
Modelos no-lineares intrinsecamente lineares (MNLIL): o So lineares nos parmetros ou ; o Podem ser transformados em lineares nos parmetros; Modelos no-lineares intrinsecamente no-lineares (MNLINL): o no podem ser transformados em lineares nos parmetros.
b1
b2 X i
2
b3 X i2 bk X ik
k
1 i
b b Modelo multiplicativo: Y b1 X 2i X ki
* i
i
b2 ln X 2i
bk ln X ki
log-log
bk
i
deriva
ln
* i
do
modelo
exp(b1 b2 X 2i
b2 X 2i
bk X ki ) ln
bk X ki
b1
b2 X 2i
1 bk X ki
b2 X 2i
b2 ln X 2i
bk X ki
bk ln X ki b3 X 3i
i i
Modelo lin-log: Yi
Modelo interativo: Yi
b1
b2 X 2i
b4 ( X 2i X 3i )
3.4 TESTE F PARA SIGNIFICNCIA DE BLOCOS DE VARIVEIS Considere o MGD: Yi Teste de Hiptese: o H0: b4 o H1: b4 Definies: o Modelo irrestrito (IR): Yi o Modelo restrito(R): Yi
b1 b1 b2 X 2i b2 X 2i b3 X 3i
i
b1 b2 X 2i
b3 X 3i
b4 X 4 i
b5 X 5i
b5
0 e/ou b5
b4 X 4 i
b5 X 5i
b3 X 3i
o SQT = Soma dos Quadrados Totais = o SQE = Soma dos Quadrados Explicados:
(Yi
Y )2
y y;
(Yi
i2
Y )2
y y;
Estatstica de Teste:
F ( SQE IR SQE R ) /(k IR k R ) ~ Fk IR SQRIR (n k IR )
k R , n k IR
k R , n k IR k R , n k IR
F) F)
IR
0 e/ou b4
= 5%;
0,77 Yt
( 6 , 35)
1,1 t
(1, 59 )
0,32 t 2
(1, 43)
o SQEIR o SQRIR o k IR
4;
65.965,10 ; 77,17 ;
Modelo restrito: Ct
2,3
(17 , 31)
0,77 Yt
( 7 , 49 )
o SQER o kR
F
65.898,24 ;
2
4,765
P( F2,11
4,765)
0,0323
Rejeitamos H0 a 5% de significncia
MGD:
Yi
b1
b2 X 2i
bk X ki
Divida o conjunto {X2,...,Xk} em 2 grupos, sendo um deles formado por q < k 1 variveis a serem testadas; Agrupe as variveis a serem testadas no final do MGD, reescrevendo-o como segue:
Yi b1 b2 X 2i bk q X k bk Xk bk X ki
q ,i
q 1
q 1,i
H0: bk
q 1
bk
0 ( Xk
q 1
,, X k so no-significativas);
q + 1,...,k,
k R , n k IR k R , n k IR
F) F)
IR
Nota: modernos softwares economtricos, como o Eviews, implementam automaticamente esse procedimento, sendo necessrio informar apenas o grupo de q variveis a serem testadas em bloco;
3.5 VARIVEIS DUMMY Variveis qualitativas: que refletem estado, situao, classe, etc., ou seja, eventos qualitativos que no podem ser medidos numericamente; Varivel dummy: varivel binria (assume valor 0 ou 1) usada para representar, num modelo quantitativo/matemtico como o MGD, as influncias de eventos qualitativos; Variveis dummy podem ser usadas no papel de dependente ou independente num modelo economtrico. Veremos por ora s o caso de variveis dummy independentes; Regresso com uma varivel dummy MGD: Yi
b1 b2 Di
i
Yi uma varivel quantitativa; Di uma varivel dummy (qualitativa) que assume s valores 0 ou 1; Exemplo: Estudo americano em escola secundria n = 20 professores pesquisados; Yi = renda do i simo professor; Di = sexo do i simo professor (1
homem; 0
mulher);
Modelo emprico: Yi
Yi | ( Di Yi | ( Di 0) 1) b1 b1
21,2 1,5 Di
( 3.15) ( 2, 7 )
Exemplo: Estudo americano em escola secundria (continuao) n = 20 professores pesquisados; Yi = renda do i simo professor; DSi = sexo do i simo professor (1 homem; 0 mulher); DRi = raa do i simo professor (1 branco(a) ; 0 negro(a));
Sexo\Raa Homem (H) Mulher(M) Branco (B) DS = DR = 1 DS = 0, DR = 1 Negro (N) DS=1, DR = 0 DS = DR =0
Interpretao do MGD: o E (Yi | DSi DRi 0) b1 : sal. mdio/esperado da M.N.; o E (Yi | DSi 1, DRi o E (Yi | DSi o E (Yi | DSi
0, DRi DRi 1)
( 3, 74 )
0) 1) b1
b1 b1 b2
( 3,14 )
b2 : sal. mdio/esperado do H.N.; b3 : sal. mdio/esperado de uma M.B.; b3 : sal. mdio/esperado do H.B.;
(1, 01)
Nota: a rigor, no se somaria o coeficiente estimado b3 0,74 porque ele se no mostrou diferente de zero a 5% de significncia. Apenas para fins ilustrativos que o inclumos;
Hipteses de interesse: o H0: b2 0 (no h discriminao sexual); o H0: b3 0 (no h discriminao racial); o H0: b2
b3 0 (no h discriminao de qualquer tipo);
Exemplo: Estudo americano em escola secundria (continuao) n = 20 professores pesquisados; Yi = renda do i simo professor; Di = sexo do i simo professor (1 homem; 0 mulher); Xi = nmero de anos de servio do i-simo professor. Interpretao do MGD: o E (Yi | Di 0, X i ) b1 b3 X i : salrio mdio/esperado da professora como funo do nmero de anos de servio.; o E (Yi | Di 1, X i ) (b1 b2 ) b3 X i : salrio mdio/esperado do professor como funo do nmero de anos de servio;
o Yi | ( Di
0, X i ) 19,5 0,53X i ;
o Yi | ( Di 1, X i ) 20,67 0,53X i ;
Hiptese de interesse: o H0: b2 0 (no h diferena, entre homens e mulheres, na relao entre salrio recebido e anos de servio );
a b1 D1t
1 t j 0 outro
b2 D2t
bs 1 Ds
1,t
j 1,..., s 1
s = comprimento do perodo sazonal: s = 2 (semestral) s = 6 (bimestral) s = 3 (quadrimestral) s = 12 (mensal) s = 4 (trimestral) bj = fator sazonal do j simo ms, bimestre, etc. (j = 1,...,s 1); usa se s s-1 dummies p/evitar colinearidade perfeita c/a constante; Normalizao dos fatores sazonais MGD2:
Yt
s j 1
a b1 D1t bj 0
b2 D2t
bs Dst
Verifica se que este modelo pode ser re escrito como: MGD2: Yt o Onde: D
* jt
a b1 D1*t
b2 D1*t
bs 1 Ds* 1,t
1 t
j j 1,..., s 1
1 t s 0 outro
Xb
a
D1* 1 0 0 1 1 0 0 1
* D2
, X [1n D] .
3 j 1
a
D2 0 1 0 0 0 1 0 0
3 j 1
b j D jt
MGD2: Yt
b j D* jt
D3 0 0 1 0 0 0 1 0
* D3
0 1 0 1 0 1 0 1
0 0 1 1 0 0 1 1
4. VIOLAO DE HIPTESES BSICAS 4.1 AUTOCORRELAO SERIAL DOS ERROS Violao da hiptese 5 ( E( i , j ) Cor( i , j ) Cov( i , j ) 0 , i Caso Geral MGD:
Yi b1 b2 X 2i 0 bk X ki ui Cor (u i , u j )
j);
para algum j
Cor (ut , ut j )
j = 1, 2, ...
Cor (ut , ut 1 )
Razes para haver ACS1 o Inrcia tpica das variveis econmicas; o Varives explicativas excludas do MGD considerado: MGD: Yt
b1 b2 X 2t b3 X 3t b1
t
b2 X 2t
ut
b3 X t2
b1
b2 X t
ut
b3 X 2,t
b1
b4Yt
MGD considerado: Yt
b2 X 2t
ut
Conseqncias da ACS1: Propriedades do EMQO: o b continua no enviesado para b; o b (EMQO) no mais o MELNE para b, logo ineficiente; Varincia residual enviesada: u t2 (n k ) em geral subestima 2 ; o S2 o Elementos de diag(S b ) ficam, em geral, subestimados; o R 2 e R 2 ficam, em geral, superestimados; o Estatsticas t b b j S b (j = 1,...,k) ficam,
j j
em
geral,
superestimadas; o Estatstica F fica superestimada; o Critrios de informao AIC e SC ficam em geral subestimados; Matriz de var-covar dos parmetros: 2 o Com ACS1: Var(b) ( X X ) 1 C( , xt , xt 1, ) ; o
Cor (u t , u t 1 ) ;
o Computadores tipicamente reportam resultados calculados com base na ausncia de ACS1, isto : S b2 S 2 ( X X ) 1 ; Verificando a presena/ausncia de ACS1 Graficamente:
Termo de Erro com ACS1
0.8 0.6 0.4 0.2 0 -0.2 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 -0.4 -0.6 -0.8 -1
b2 X 2t
1 t 1 t
bk X kt
ut
2
ut Cor (
1 t
0; E ( t )
0,Var ( t )
chamado
processo
AR(1)
Cor (u t , u t 1 ) ;
0 ; H1:
0;
n
(u t
n t 1
ut 1 ) 2 u
2 t n
t 2
2(1
u ut
n 2 t 1 t
u ;
o Note-se que:
0 1 1 1 1 0 0
DW 0 2 DW DW DW DW
0 2 2 4 4
o Regra de deciso Se
0
dL
dU 4 dU
DW
DW
DW DW
dL
dU
4 dU 4 dL
4 dL
DW
Prob. 0.0234 0.0000 0.0000 0.0000 0.0000 8.19E+08 3.28E+08 36.96178 37.16252 1983.966 0.000000
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
o Considerando n = 45, k = 4 e
0 (j=1,...,m)
QLB
n(n 2)
j 1
2 j n j
2 m
PAC
Prob
. . . . .
. |****** . | . . *| . . | . . |* .
1 2 3 4 5
b2 X 2t
1 t 1 t
bk X kt
ut
2
MGD:
ut Cor (
0; E ( t )
0,Var ( t )
o Onde Yt* Yt
Yt 1 , X * jt
X jt
X j ,t
ut
ut 1 ;
o Primeira observao: Y1* Y1 1 Representao matricial MGD: Note que Var (u ) E (uu )
1 1
2
2
, X *1 j
X j1 1
Xb u ,
, porque h ACS1;
n 1 n 2 n 3
o Onde
2 n n
n 1
n 3
1
n 3
1 1 0 1 0 0 1 0 1 0 0 0
2
n n
0 0 0
HXb Hu ;
u H Hu , tm se o
i2
1
X) 1X
o Note se que
~
e normalmente distribudo
v(1),t ;
t ;
Yt
b1 b2 X 2t bk X kt ;
5. Repete se passos 2, 3 e 4 iterativamente at que: | 1 | 0 (onde indica iterao); Exemplo: Consumo Anual Brasil 1960 2004
Dependent Variable: CO Sample (adjusted): 1971 2004 Included observations: 34 after adjustments Convergence achieved after 22 iterations Variable C Y GR I NE AR(1) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient 1.22E+08 0.769876 -0.679646 -0.828333 -0.932487 0.865912 0.997571 0.997138 9368116. 2.46E+15 -590.7392 2.156901 Std. Error 54126485 0.043924 0.062333 0.074674 0.087990 0.070015 t-Statistic 2.257963 17.52743 -10.90354 -11.09262 -10.59761 12.36746 Prob. 0.0319 0.0000 0.0000 0.0000 0.0000 0.0000 7.49E+08 1.75E+08 35.10231 35.37167 2300.268 0.000000
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
Estatstica Q de Ljung Box Date: 06/07/06 Time: 15:20 Sample: 1971 2004 Autocorrelation
. *| . . . . *| . .
Partial Correlation
. *| . . . . *| . .
J 1 2 3 4 5
Prob
|* . | . |* .
|* . | . |* .
i ; ou Var ( ) E (
I );
bk X ki
ui
Var (ui )
bk X kt
ut
Var (ut )
Consequncias da Heterocedasticidade Propriedades do EMQO: o b continua no enviesado para b; o b (EMQO) no mais o MELNE para b, logo ineficiente; Varincia residual enviesada: n 2 k ) um estimador enviesado de sigma2i; o S2 i 1 ui ( n o Elementos de diag(S b ) ficam enviesados; o R 2 e R 2 ficam enviesados; o Estatsticas t b b j S b (j = 1,...,k) ficam enviesadas;
j j
o Estatstica F fica enviesada; o Critrios de informao AIC e SC ficam enviesados; Matriz de var-covar dos parmetros: 2 o Sob heterocedasticidade: Var (b) , onde ( X X ) 1 ; o Computadores tipicamente reportam resultados calculados com base na ausncia de heterocedasticidade, isto : S b2 S 2 ( X X ) 1 ; Mnimos Quadrados Ponderados (MQP) um caso particular do EMQG; MGD: Supondo
2 i
Yi
b1
b2 X 2i
2 i
bk X ki
ui
Var (ui )
b1
1
i
b2
X 2i
i
bk
X ki
i
ui
i
ui
1
i
homocedstico;
2 i 2 i
Var ui 2
Xb u ,
, onde :
0 0
2 3
0
2 2
1
1
0 0 0 ;
2 n
2 n n
0 0 0
0 0
0 1
2
0 0 1
n
0 0
HXb Hu ;
u H Hu , tm se o
i2
X) 1X
o Note se que (
~
HH ;
e normalmente distribudo
desconhecida
cZ i
cZ (Yi , X 1i ,, X ki )
Logo, no MGD transformado o termo de erro homocedstico. Exemplos de funes Zi que podem ser usadas: o Z i Yi ; o Zi o Zi o Zi
X ji ;
X2; ji
c1 X 1i c 2 X 2i c k X ki ;
Exemplo: Consumo Anual Brasil 1970 2004 Mnimos Quadrados Ponderados: Assumindo que Var(ut)=c.Yt
Dependent Variable: CO/SQR(Y) Method: Least Squares Date: 06/12/06 Time: 15:01 Sample (adjusted): 1970 2004 Included observations: 35 after adjustments Variable 1/SQR(Y) SQR(Y) GR/SQR(Y) I/SQR(Y) NE/SQR(Y) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Coefficient 42489845 0.794932 -0.664485 -0.690385 -0.705055 0.956610 0.950824 545.4779 8926386. -267.5234 Std. Error 11564215 0.032469 0.076533 0.115316 0.110605 t-Statistic 3.674252 24.48296 -8.682316 -5.986888 -6.374556 Prob. 0.0009 0.0000 0.0000 0.0000 0.0000 21405.12 2459.812 15.57277 15.79496 0.336312
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat
X 2i ,
X 3i , ...,
2 i 2 t
X ki ;
2 i
2 i
t
X 2i ,
t ou
X 3i , ..., t.
X ki ;
, onde q [k (k 1) 2] 1 ;
o O cmputo dessa estatstica de teste envolve regredir os quadrados dos resduos de um MGD estimado por MQO contra um conjunto V de variveis formado por: Todas as variveis explicativas no redundantes; Os quadrados dessas variveis; Os produtos cruzados entre si dessas variveis; Regra de Deciso o Se P( o Se P(
2 q 2 q
nR 2 ) nR 2 )
c4 ( X 2i X 3i ) wi ;
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 06/12/06 Time: 14:57 Sample (adjusted): 1970 2004 Included observations: 35 after adjustments Variable C Y Y^2 Y*GR Y*I Y*NE GR GR^2 GR*I GR*NE I I^2 I*NE NE NE^2 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient 3.22E+15 -25802647 0.025064 -0.103383 -0.088866 0.067251 72030518 0.134210 0.098590 -0.162626 68674186 0.043314 0.109893 -89816669 -0.138321 0.919926 0.863875 3.66E+14 2.67E+30 -1213.511 2.029315 Std. Error 1.03E+15 9318834. 0.009505 0.038220 0.047901 0.040232 25197051 0.048908 0.089595 0.113055 35064179 0.067828 0.141270 21962399 0.103752 t-Statistic 3.118874 -2.768871 2.636992 -2.704923 -1.855195 1.671590 2.858688 2.744141 1.100397 -1.438473 1.958528 0.638594 0.777892 -4.089565 -1.333191 Prob. 0.0054 0.0118 0.0158 0.0136 0.0784 0.1102 0.0097 0.0125 0.2842 0.1658 0.0643 0.5303 0.4457 0.0006 0.1975 4.78E+14 9.91E+14 70.20062 70.86719 16.41214 0.000000
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
4.3 VARIVEIS INDEPENDENTES ESTOCSTICAS Estudaremos este assunto com base na regresso simples: MGD: Yi
a bX i
i
Violao da hiptese 2, isto : X i estocstica ( uma V.A.); Situaes em que X uma V.A.: o Erro de medida nas variveis independentes; o Variveis independentes tambm dependem da dependente; o Varivel dependente defasada entre as independentes; Nesses casos, possvel que Cov( X i , i ) EMQO enviesado e inconsistente:
X,
0 e, se isso ocorre,
Prova o Seja a seguinte forma em desviosdo MGD: y i bxi ei ; onde e ei i . Neste caso, o EMQO yi Yi Y , xi X i X para b dado por:
b xi y i x
2 i
xi (bxi x
2 i
ei )
xi e i xi2
xi e i xi2
o Nada
garante
p lim(b)
p lim(b)
p lim
xi e i x
2 i
p lim p lim
xi e i n x
X,
2 i
X, 2 X
Se X , 0 , ento b consistente para b (embora no se possa determinar se enviesado ou no); Se X , 0 , isto significa que b inconsistente para b (e, em decorrncia, tambm enviesado para b);
Mnimos Quadrados de Variveis Instrumentais (MQVI) Seja X estocstica e Cov( X i , i ) MQO inconsistente neste caso?
xi z i n zi ei n
X ,Z
X ,e
Definio de instrumento: Seja Z uma V.A. tal que: o p lim o p lim o onde xi
0; 0;
Z,
Xi
X e zi
Zi
Z.
z i yi xi z i
consistente para b;
Prova o Novamente, seja o MGD em forma de desvio: Ento, o EMQVI pode ser desenvolvido como:
~ b z i yi xi z i b xi z i xi z i z i (bxi xi z i zi e i b zi e i xi z i ei ) (bxi z i xi z i z i ei )
yi
bxi
ei .
p lim p lim
zi e i n xi zi n
Z, X ,Z
X2i,...,Xki so todas estocsticas; Cada Xji (j = 2,...,k) correlacionada com o termo de erro i; Aplicar o MQVI neste caso envolve usar um instrumento para cada varivel independente; Z 2i X 2i ,..., Z ki X ki . E usar o estimador geral de MQVI:
~ b (Z X ) 1 Z Y
Trigve Haavelmo
(1911-1999) Economista Noruegus Premio Nobel de Economia de 1989
Abordagem probabilstica em econometria Sistemas de equaes simultneas
X 1i X 1i
12
X 2i X 2i
1i 2i
21
22
Terminologia: o Y variveis endgenas; o X variveis exgenas; o b coeficientes das endgenas; o coeficientes das exgenas o Variveis pr determinadas: Exgenas; Endgenas defasadas; Mdia:
E (Y1i ) E (Y2i ) b10 b20 b12Y2i b21Y1i
Y1i Y2i b10 b b10 b
11
X 1i X 1i
12
X 2i X 2i
12 X 2i 22 X 2i 22 X 2i 12 X 2i 1i 2i
21
22
20
b12Y2i b Y
11 X 1i 21 X 1i 21 X 1i 11 X 1i
21 1i
2i
20
b12Y2i b Y
21 1i
X 1i X 1i
1i 2i
21
X 1i X 1i
w1i w2i
21
10
11
20
21
Problema da Identificao Definio: Em um SES uma equao est identificada quando possvel obter se estimativas numricas dos parmetros estruturais a partir de estimativas dos parmetros da forma reduzida; Status de identificao: o Equao no identificada: no possvel; o Equao identificada exatamente: obtm se uma nica estimativa dos parmetros estruturais; o Equao sobre identificada: obtm se mais de uma estimativa dos parmetros estruturais; Sistema Identificado: quando todas as equaes do SES esto identificadas (exatamente ou sobreidentificadas); Condio de Ordem (necessria) para identificao Regra: Em um SES com M equaes simultneas, uma equao estar identificada se o nmero de varveis pr determinadas excludas da equao (K k) for maior ou igual ao nmero de endgenas includas na equao (m) menos um ( K k m 1 );
Y1i b10 b20 b30 b12Y2i b21Y1i b31Y1i
12 21 3i
X 2i X 1i
1i 22
(1) X 2i
2i
(2) (3)
Regra: Em um SES com M equaes em M variveis endgenas, uma equao identificada se e somente se no mnimo um determinante no nulo de ordem (M 1) (M 1) puder ser construdo a partir dos coeficientes das variveis (endgenas e pr determinadas) excludas daquela equao particular mas includas em outras equaes do modelo; Ilustrao
Y1i Y2i Y3i Y4i b10 b20 b30 b40 b31Y1i b41Y1i b42Y2i b12Y2i b13Y3i b23Y3i
11 21 31
X 1i X 1i
22 32
1i
X 2i X 3i
2i 3i 43 4i
X 1i
X 2i
X2 0
22 32
X3 0 0 0
43
0 0
43
o Equao (1): A
0 1 0
0
22 32
Procedimentos para aplicar a condio de posto Passo 1: re escrever o SES com todas as variveis e parmetros do lado esquerdo e s os erros aleatrios do lado direito; Passo 2: montar a tabela de coeficientes do sistema; Passo 3: construir para cada equao a matriz A respectiva (a partir dos coeficientes nulos da linha correspondente equao em anlise); Regra Geral de Identificao K k>m 1 Posto de A = M 1 Eq. Sobre identificada K k=m 1 Posto de A = M 1 Eq. Exatam. identificiada K k m 1 Posto de A < M 1 Eq. Sub identificada K k<m 1 Eq. No identificada (Posto de A < M 1)
X 1i X 1i
12
X 2i X 2i
1i 2i
21
22
Simultaneidade: quando h causalidade bidirecional entre endgenas; Problema: correlao da endgena do lado direito com o termo de erro; No MGD acima: Cor (Y2i , 1i ) 0 e Cor (Y1i , 2i ) 0 , logo: o EMQO inconsistente para estimar parmetros das duas equaes; Quando no h simultaneidade, possvel usar EMQO, desde que as hipteses bsicas do SES sejam satisfeitas; Estimao de SES
Y1i b10 b20 bM 0 b12Y2i b21Y1i bM 1Y1i b1g Ygi b2 g Ygi bM , M 1YM
1,i 11
X 1i
21
M1
1k
X ki
2k
1i
MGD:
Y2i YMii
X 1i
X ki
2i
X 1i
Mk
X ki
Mi
Hipteses Bsicas: o Relao linear entre as variveis; o Xjis so no estocsticas, j = 1,...,k; o E ( ri ) 0 , Var ( ri ) r2 , Cov( ri , rj ) 0 para r = 1,...,M e i o Cov( ri , o
ri
si
j;
)
2 r
0 para r
s; r = 1,...,M; s = 1,...,M;
2 r
~ N (0,
Yri ~ N ( E (Yri ),
) , r = 1,...,M.
Antes da estimao, verificar: o Identificao; o Simultaneidade; Mtodos de Informao Limitada: considera restries relacionadas apenas equao de interesse; o EMQO; o Estimador de Mnimos Quadrados Indiretos (EMQI); o Estimador de Mnimos Quadrados de 2 Estgios (EMQ2E); Mtodos de Informao Completa: considera restries entre equaes; o Estimador de Mnimos Quadrados de 3 Estgios (EMQ3E); o Estimador de Mxima Verossimilhana com Informao Completa (EMVIC);
X 1i X 2i 0
1i 2i
22 2i )
X 1i 0
1i 2i
22 X 2 i 2i
Nota: neste caso, estima se por algum mtodo sistmico, o mais usual sendo o MQ3E;
o Sistemas Recursivos
Y1i Y2i Cov( b10 b20
1i 11
X 1i 0
12 21
X 2i
1i 22
b21Y1i
2i
X 1i
X 2i
2i
1i
; substituindo na 2. equao
11
X 1i
12
X 2i
1i 2i 32 2i
21 X 1i
22 X 2 i 31 3i
b32Y2i
1i
X 1i Cov(
X 2i ,
3i
3i
Cov(
o Sistemas Simultneos:
Y1i Y2i
b10 b20
b12Y2i b21Y1i
11
X 1i X 1i
12
X 2i X 2i
1i 2i
21
22
Mnimos Quadrados de 2 Estgios Caso particular do EMQVI; Serve para estimar equaes exatamente ou sobre identificadas; Seja o seguinte:
Y1t Y2t b10 b20 b12Y2t b21Y1t X 1t X 2t
MGD:
11 2t
12
1t
fcil verificar (pelas condies de ordem e de posto) que: o 1. equao no est identificada; o 2. equao est sobre identificada; o Logo, s possvel estimar a 2. equao; fcil verificar tambm que devido causalidade bidirecional (simultaneidade) entre Y1t e Y2 t , ocorre:
0;
Cov(Y1t ,
2t
Estimao da 2. equao por MQ2E: o 1. Estgio: construo de instrumento para Y1t via forma reduzida; Forma Reduzida (FR):
Y1t Y2t
10 20 11
X 1t X 1t
12
X 2t X 2t
w1t w2t
21
21
o 2. Estgio: usa se Y1t no lugar de Y1t para estimar a 2. equao da FE por MQVI;
Y2t
2t 2t
b21
b20
Y2
b21Y1
Nota: possvel mostrar que a formula acima para b21 equivalente ao estimador de MQO (ver PR pg. 402)
o p lim o p lim
0;
* 1t
Cov( E (Y1t ),
Logo, EM2QE um estimador consistente para os parmetros estruturais de equaes exatamente ou sobre identificadas.
Mean dependent var S.D. dependent var Sum squared resid Second-stage SSR
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)