Sei sulla pagina 1di 15

E

O Modelo de Regresso Linear em Forma Matricial

ste apndice deriva vrios resultados da estimao do modelo de regresso linear mltipla usando notao matricial e lgebra de matrizes (veja um resumo no Apndice D). O material apresentado aqui muito mais avanado do que aparece no texto deste livro.

E.1 O MODELO E A ESTIMAO DE MNIMOS QUADRADOS ORDINRIOS


Em todo este Apndice, usamos o subscrito t para indexar observaes e n para representar o tamanho da amostra. til escrevermos o modelo de regresso linear mltipla com k parmetros, como segue: yt
2xt2 3xt3

...

kxtk

ut, t

1, 2, ..., n,

(E.1)

onde yi a varivel dependente para a observao t, e xij, j = 2, 3, ..., k so as variveis independentes. Observe como nossa conveno notacional neste apndice difere do texto do livro: chamamos o intercepto de 1 e fazemos 2, ..., k representar os parmetros de inclinao. Essa terminologia no importante, mas simplifica a notao do mtodo matricial na regresso mltipla. Para cada t, defina um vetor 1 k, xt = (1, xt2, ..., xtk) e seja = ( 1, 2, ..., k) o vetor k 1 de todos os parmetros. Ento, podemos escrever (E.1) como yt xt ut, t 1, 2, ..., n. (E.2)

[Alguns autores preferem definir xt como um vetor coluna, caso em que xt substitudo por x t em (E.2). Matematicamente, faz mais sentido defini-lo como um vetor linha]. Podemos escrever (E.2) em notao matricial completa, definindo apropriadamente os dados dos vetores e matrizes. Seja y o vetor n 1 das observaes de y: o t-simo elemento de y yt. Seja X o vetor n k das observaes das variveis explicativas. Em outras palavras, a t-sima linha de X consistir do vetor xt. De forma equivalente, o (t, j)-simo elemento de X simplesmente xij: x1 x2 k xn 1 1 1 x12 x22 xn2 x13 x23 xn3 x1k x2k xnk

X n

108

Wooldridge

Apndice E

O Modelo de Regresso Linear em Forma Matricial

109

Finalmente, seja u o vetor n 1 dos distrbios no observados. Ento, podemos escrever (E.2) de todas as n observaes em notao matricial: y X u. (E.3)

Lembre-se, como X n k e k 1, X ser n 1. A estimao de prossegue minimizando a soma dos resduos quadrados, como na Seo 3.2. Defina a funo da soma dos resduos quadrados para qualquer possvel vetor de parmetros b k 1 como
n

SQR(b)
t 1

(yt

xtb)2.

O vetor k 1 das estimativas de mnimos quadrados ordinrios, ( 1, 2, ..., k) , minimiza SQR(b) de todos os possveis vetores b k 1. Isso um problema no clculo multivariado. Para que minimize a soma dos resduos quadrados, ele deve satisfazer a condio de primeira ordem SQR( )/ b Usando o fato que a derivada de (y1 equivalente a 0. k 2(yt (E.4) xt b)xt, (E.4)

xt b)2 em relao a b o vetor 1

xt (yt
t 1

xt )

0.

(E.5)

(Dividimos por

2 e tomamos a transposta.) Podemos escrever essa condio de primeira ordem como


n

(yt
t 1 n

1 1

2xt2 2xt2

... ...

kxtk) kxtk)

0 0

xt2(yt
t 1 n

xtk(yt
t 1

2xt2

...

kxtk)

0,

que, exceto pela nova conveno notacional, idntica s condies de primeira ordem da equao (3.13). Queremos escrev-las na forma matricial para torn-las mais teis. Usando a frmula da multiplicao particionada do Apndice D, vemos que (E.5) equivalente a X (y ou X ) 0 (E.6)

110

Introduo Econometria Editora Thomson

(X X)

X y.

(E.7)

possvel mostrar que (E.7) sempre tem pelo menos uma soluo. Solues mltiplas no nos ajudam, j que estamos querendo um conjunto nico de estimativas MQO, dado nosso conjunto de dados. Assumindo que a matriz simtrica k k X X no singular, podemos premultiplicar ambos os lados 1 de (E.7) por (X X) para encontrar o estimador MQO : (X X) 1X y. ( E.8)

Essa a frmula bsica para a anlise matricial do modelo de regresso linear mltipla. A hiptese de que X X inversvel equivalente hiptese de que posto(X) k, o que significa que as colunas de X devem ser linearmente independentes. Essa a verso matricial do RLM.4 do Captulo 3. Antes de continuar, precisamos fazer um alerta sobre (E.8). tentador simplificar a frmula de como segue: (X X)
1

Xy

X 1(X ) 1X y

X 1y.

A falha desse raciocnio que em geral X no uma matriz quadrada e, portanto, ela no poder ser invertida. Em outras palavras, no podemos escrever (X X) 1 X 1(X ) 1 a menos que n k, um caso que na prtica virtualmente nunca aparece. Os vetores n 1 dos valores ajustados dos MQO e os resduos so dados por y X , u y y y X .

A partir de (E.6) e da definio de u, podemos ver que a condio de primeira ordem de o mesmo que Xu 0. (E.9)

Como a primeira coluna de X consiste inteiramente de unidades, (E.9) implica que os resduos MQO sempre somaro zero quando um intercepto for includo na equao e que a covarincia amostral entre cada varivel independente e os resduos MQO ser zero. (Examinamos essas duas propriedades no Captulo 3.) A soma dos resduos quadrados pode ser escrita como
n

SQR
t 1

u2 t

uu

(y

X ) (y

X ).

(E.10)

Todas as propriedades algbricas do Captulo 3 podem ser derivadas usando lgebra matricial. Por exemplo, podemos mostrar que a soma dos quadrados total igual soma dos quadrados explicada mais a soma dos resduos quadrados [veja (3.27)]. O uso de matrizes no oferece uma prova mais simples que a notao somatria, de modo que no apresentamos outra derivao. O mtodo matricial da regresso mltipla pode ser usado como a base para uma interpretao geomtrica da regresso. Isso envolve conceitos matemticos ainda mais avanados dos que os abordados no Apndice D [Veja Goldberger (1991) ou Greene (1997)].

Wooldridge

Apndice E

O Modelo de Regresso Linear em Forma Matricial

111

E.2 PROPRIEDADES DE AMOSTRA FINITA DO MQO


A derivao do valor esperado e da varincia do estimador MQO facilitada pela lgebra matricial, mas devemos ter algum cuidado na apresentao das hipteses.

H I P T E S E

E . 1

(LINEAR NOS PARMETROS)

O modelo poder ser escrito como em (E.3), quando y for um vetor observado n vada n k, e u for um vetor n 1 de erros ou distrbios no observados.

1, X for uma matriz obser-

H I P T E S E

E . 2

(MDIA CONDICIONAL ZERO)

Condicional em relao totalidade da matriz X, cada erro ut ter mdia zero: E(ut | X) Na forma vetorial,

0, t

1, 2, ..., n.

E(u|X)

0.

(E.11)

Essa hiptese sugerida por RLM.3 sob a hiptese de amostragem aleatria, RLM.2. Em aplicaes de sries temporais, a hiptese E.2 impe exogeneidade estrita nas variveis explicativas, algo que explicamos em profundidade no Captulo 10. Ela exclui variveis explicativas cujos valores futuros sejam correlacionados com ut; em particular, ela elimina variveis dependentes defasadas. Sob a hiptese E.2, podemos condicionar a xtj quando calculamos o valor esperado de .

H I P T E S E E . 3 A matriz X tem posto k.

(INEXISTNCIA DE COLINEARIDADE PERFEITA)

Essa uma declarao cuidadosa da hiptese que elimina dependncias lineares entre as variveis explicativas. Sob a Hiptese E.3, X X no singular e, assim, ser nica e poder ser escrita como em (E.8).

T E O R E M A

E . 1

(INEXISTNCIA DE VIS DO MQO)

Sob as Hipteses E.1, E.2 e E.3, o estimador MQO ser no-viesado para . . P R O V A : Use as Hipteses E.1 e E.3 e lgebra simples para escrever
1

(X X) 1X y

(X X) 1X (X
1

u) (X X) 1X u,

(E.12)

(X X) (X X)

(X X) X u

(Continua...)

112

Introduo Econometria Editora Thomson

(... continuao)

onde usamos o fato de que (X X) (X X) E( |X)

Ik. Tomando a expectativa condicional em relao a X, teremos (X X) X E(u|X) = (X X) X 0


1 1

, , de modo

porque E(u |X) 0 sob a Hiptese E.2. Esse argumento claramente no depende do valor de que mostramos que no-viesado.

Para obter a forma mais simples da matriz de varincias-covarincias de , impomos as hipteses de homoscedasticidade e correlao no-serial.

H I P T E S E E . 4 (HOMOSCEDASTICIDADE E AUSNCIA DE CORRELAO SERIAL) 2 (i) Var(ut |X) , t 1, 2, ..., n. (ii) Cov(ut,us |X) 0, para todo t s. Em forma matricial, podemos escre-

ver essas duas hipteses como Var(u|X) onde In a matriz identidade n


n.
2

In,

(E.13)

A Parte (i) da Hiptese E.4 a hiptese de homoscedasticidade: a varincia de ut no pode depender de qualquer elemento de X, e a varincia deve ser constante ao longo das observaes, t. A Parte (ii) a hiptese de correlao no-serial: os erros no podem ser correlacionados ao longo das observaes. Sob amostragem aleatria e em qualquer outro esquema de amostragem de corte transversal com observaes independentes, a parte (ii) da Hiptese E.4 mantida automaticamente. Em aplicaes de sries temporais, a parte(ii) elimina a correlao nos erros ao longo do tempo (tanto condicional em relao a X como incondicionalmente). Por causa de (E.13), freqentemente dizemos que u tem matriz de varincias-covarincias escalar quando a hiptese E.4 for vlida. Agora podemos derivar a matriz de varincias-covarincias do estimador MQO.

T E O R E M A

E . 2

(MATRIZ DE VARINCIA-COVARINCIA DO ESTIMADOR MQO)

Sob as Hipteses E.1 a E.4, Var( |X) PROVA: Da ltima frmula na equao (E.12), temos
(Continua...)
2

(X X) 1.

(E.14)

Wooldridge

Apndice E

O Modelo de Regresso Linear em Forma Matricial

113

(... continuao)

Var( |X)

Var[(X X) X u|X]

(X X) X [Var(u|X)]X(X X) .

Agora, usamos a Hiptese E.4 para obter Var( |X) (X X) X ( 2In)X(X X)


2 1 1 2

(X X) X X(X X)

(X X) .

A frmula (E.14) significa que a varincia de j (condicional em relao a X) obtida pela multiplicao de 2 pelo j-simo elemento de (X X) 1. Para os coeficientes de inclinao, demos uma frmula interpretvel na equao (3.51). A equao (E.14) tambm nos informa como obter a covarincia entre quaisquer duas estimativas MQO: multiplicar 2 pelo elemento fora da diagonal apropriado de (X X) 1. No Captulo 4, mostramos como evitar explicitamente, encontrar covarincias para obter intervalos de confiana e testes de hipteses pela reformulao apropriada do modelo. O Teorema de Gauss-Markov, em sua generalidade total, pode ser provado.

T E O R E M A

E . 3

(TEOREMA DE GAUSS-MARKOV)

Sob as hipteses E.1 a E.4, o melhor estimador linear no-viesado. PROVA: Qualquer outro estimador linear de pode ser escrito como A y, (E.15)

onde A uma matriz n k. Para que seja no-viesado condicional em X, A pode consistir de nmeros e funes no aleatrias de X. (Por exemplo, A no poder ser uma funo de (y). Para verificar que outras restries sobre A so necessrias, escreva A (X u) (A X) A u.
(E.16)

Ento, E( |X) A X + E(A u|X) AX A E(u|X), pois A uma funo de X A X , pois E(u|X) 0. Para que seja um estimador no-viesado de , dever ser verdade que E( |X) k 1 , isto , AX para todos os vetores k 1 . para todos os vetores

(E.17)
(Continua...)

114

Introduo Econometria Editora Thomson

(... continuao)

Como A X uma matriz k k, (E.17) ser vlida se, e somente se, A X caracterizam a classe de estimadores lineares, no-viesados de . Em seguida, a partir de (E.16), temos Var( |X) pela Hiptese E.4. Portanto, Var( |X) Var( |X) [ 2A A
2 2 2

Ik. As equaes (E.15) e (E.17)

A [Var(u|X)]A

A A,

(X X) ] A X(X X) X A], pois A X = Ik X(X X) X ]A


1 1

[A A

A [In A MA,

onde M In X(X X) X . Como M simtrica e idempotente, A MA positiva definida para qualquer matriz A n k. Isso estabelece que o estimador MQO o melhor estimador linear no-viesado. O quanto ele significante? Seja c qualquer vetor k 1 e considere a combinao linear c c1 1 c2 2 ... ck k, que um escalar. Os estimadores no-viesados de c so c e c . Entretanto, Var(c |X) Var(c |X) c [Var( |X) Var( |X)]c 0,

pois [Var( |X) Var( |X)] p.s.d. Portanto, quando usado para estimar qualquer combinao de , os MQO produzem a menor varincia. Particularmente, Var( j |X) Var( j |X) para qualquer outro estimador linear, no-viesado de j. O estimador no-viesado da varincia do erro 2 u u/(n
2

pode ser escrito como k),

onde neste apndice denominamos as variveis explicativas de forma que h um total de k parmetros, incluindo o intercepto.

T E O R E M A

E . 4

(INEXISTNCIA DE VIS EM 2)
2

Sob as hipteses E.1 a E.4, 2 no-viesado para


1

: E( 2 |X )

para todo

0.
1

PROVA: Escreva u y X y X(X X) X y My Mu, onde M In X(X X) X , e a ltima igualdade segue-se automaticamente, pois MX 0. Como M simtrica e idempotente, u u u M Mu u Mu.

Como u Mu uma escalar, ele igual a seu trao. Portanto,


(Continua...)

Wooldridge

Apndice E

O Modelo de Regresso Linear em Forma Matricial

115

(... continuao)

E(u Mu|X)

E[tr(u Mu)|X] tr[E(Muu |X] tr(M 2In)


2

E[tr(Muu )|X] tr[ME(uu |X)] tr(M)


n
2

(n

k).
1

A ltima igualdade resulta de tr(M) k. Portanto, E(


2

tr(In)

tr[X(X X) X ]

tr[(X X) X X]

tr(Ik)

|X)

E(u Mu|X)/(n

k)

E.3 INFERNCIA ESTATSTICA


Quando adicionamos a hiptese final do modelo linear clssico, ter uma distribuio normal multivariada, que leva as distribuies t e F para os testes estatsticos padres tratados no Captulo 4.

H I P T E S E

E . 5

(NORMALIDADE DOS ERROS)

Condicional em relao a X, os ut sero independente e identicamente distribudos como Normal(0, 2). De forma equivalente, u dado X ter distribuio normal multivariada com mdia zero e matriz de varinciascovarincias 2In: u Normal(0, 2In).

Sob a hiptese E.5, cada ut ser independente das variveis explicativas para todas as t. Em um cenrio de sries temporais, essa basicamente a hiptese de exogeneidade estrita.

T E O R E M A

E . 5

(NORMALIDADE DE )

Sob as hipteses E.1 a E.5 do modelo linear clssico, condicional em relao a X ter distribuio normal multivariada com mdia e matriz de varincias-covarincias 2(X X) 1.

O teorema E.5 a base da inferncia estatstica envolvendo . De fato, com as propriedades das distribuies t, F e qui-quadrado que resumimos no Apndice D, podemos usar o Teorema E.5 para estabelecer que as estatsticas t tm uma distribuio t sob as Hipteses E.1 a E.5 (sob as hipteses nulas) e igualmente para as estatsticas F. Ilustramos a questo com uma prova para a estatstica t.

116

Introduo Econometria Editora Thomson

T E O R E M A

E . 6

Sob as hipteses E.1 at a E.5, ( j


j)/ep( j)

tn k, j

1, 2, ..., k.

PROVA: A prova exige vrias etapas; as seguintes afirmaes so, inicialmente, condicionais em relao a X. Primeira, pelo Teorema E.5, ( j )/dp( ) Normal(0,1), onde dp( j) cjj, e cjj o j-simo elemento j 1 de (X X) . Em seguida, sob as hipteses E.1 a E.5, condicional em relao a X, k) 2/
2 2 n k.

(n

(E.18)

Isso assim porque (n k) 2/ 2 (u/ ) M(u/ ), onde M a matriz simtrica, idempotente n n definida no Teorema E.4. Mas u/ Normal(0,In) pela hiptese E.5. Resulta, pela Propriedade 1 da distribui2 o qui-quadrado no Apndice D, que (u/ ) M(u/ ) k). n k (pois M tem posto n 1 e 2 so independentes. Mas Tambm precisamos mostrar que (X X) X u, e 2 1 u Mu/(n k). Agora, [(X X) X ]M 0, pois X M 0. Resulta, pela Propriedade 5 da distribuio normal multivariada do Apndice D, que e Mu so independentes. Como 2 uma funo de Mu, e 2 tambm so independentes. Finalmente, podemos escrever ( j
j )/ep( j)

[( j

j)/dp( j)]/(

2/ 2)1/2,

que a razo entre uma varivel aleatria normal padro e a raiz quadrada de uma varivel aleatria 2 k). Acabamos de mostrar que elas so independentes e, assim, pela definio de uma varivel n k /(n aleatria t, ( j )/ep( j) ter distribuio tn k. Como essa distribuio no depende de X, ela tambm j a distribuio incondicional de ( j j)/ep( j).

A partir desse teorema, podemos agregar qualquer valor hipottico de j e usar a estatstica t para testar hipteses, como sempre. Sob as hipteses E.1 a E.5, podemos calcular o que conhecido como o limite inferior de CramerRao para a matriz de varincias-covarincias dos estimadores no-viesados de (novamente condicional em X) [veja Greene (1997, Captulo 4)]. possvel mostrar que isso 2(X X) 1, que exatamente a matriz de varincias-covarincias dos estimadores MQO. Isso implica que o estimador de varincia mnima no-viesado de (condicional em X): Var( |X) Var( |X) positiva semidefinida para qualquer outro estimador no-viesado ; no mais precisamos restringir nossa ateno sobre os estimadores lineares em y. fcil mostrar que o estimador MQO na verdade o estimador de mxima verossimilhana de sob a hiptese E.5. Para cada t, a distribuio de yt dado X Normal(xt, , 2). Como os yt so independentes condicionais em X, a funo de verossimilhana para a amostra obtida do produto das densidades:
n

(2
t 1

1/2

exp[ (yt

xt )2/(2 2)],

Wooldridge

Apndice E

O Modelo de Regresso Linear em Forma Matricial

117

onde representa o produto. Maximizar essa funo em relao a seu logaritmo natural:
n

o mesmo que maximizar

[ (1/2) log(2
t 1

(yt

xt )2 /(2 2)].
n

Para a obteno de , isso o mesmo que minimizar

t 1

(yt

xt )2 a diviso por 2
2

no afeta a

otimizao , que simplesmente o problema que o MQO soluciona. O estimador de que temos usado, SQR/(n k), revela-se como no sendo o EMV de 2; o EMV SQR/n, que um estimador viesado. Como o estimador no-viesado de 2 resulta nas estatsticas t e F com distribuies t e F exatas sob a hiptese nula, ele sempre usado em lugar do EMV.

E.4 UM POUCO SOBRE ANLISE ASSIMPTTICA


O mtodo matricial do modelo de regresso mltipla tambm pode tornar as derivaes das propriedades assimptticas mais concisas. De fato, podemos apresentar provas generalizadas das afirmaes do Captulo 11, usando as mesmas notaes e hipteses deste captulo, com a pequena exceo que fazemos k representar o nmero total de parmetros no modelo, como viemos fazendo ao longo de todo este apndice. Comeamos provando o resultado da consistncia do Teorema 11.1. Recorde que essas hipteses contm, como um caso especial, as hipteses da anlise de corte transversal sob a amostragem aleatria.
PROVA DO TEORE MA 11.1: Como no problema E.1 e usando a hiptese ST.1 , escrevemos o esti-

mador MQO como


n 1 n n 1 n

x t xt
t 1 t 1

x t yt
t 1 n

x t xt
t 1 1 n

x t (x t x t ut

ut (E.19)

x t xt
t 1 n 1 1 t 1 t 1

x t xt

1 t 1

x t ut .

Agora, de conformidade com a lei dos grandes nmeros,


n 1 t 1

x t xt

Aen

x t ut
t 1

0,

(E.20)

onde A E(x t xt) a matriz no singular k k sob a hiptese ST.3 e onde usamos o fato de que E(x t ut) 0 sob a hiptese ST.2 . Agora, devemos usar uma verso matricial da Propriedade PLIM.1 do Apndice C. Ou seja, como A no singular,

118

Introduo Econometria Editora Thomson

x t xt
t 1

A 1.

(E.21)

[Wooldridge (2002, Captulo 3) contm uma discusso sobre esses tipos de resultados de convergncia]. Agora segue de (E.19), (E.20) e (E.21) que plim ( ) Isso completa a prova. A
1

A seguir, delineamos uma prova do resultado da normalidade assimpttica do Teorema 11.2.


PROVA DO TEORE MA 11.2: Pela equao (E.19), podemos escrever
n 1 n

n (

) A
1

n n

1 t 1 n

x t xt x t ut

1/2 t 1

x t ut (E.22)

1/2 t 1

op(1),

onde o termo op(1) o termo residual que converge em probabilidade para zero. Esse termo igual
n 1 n

1 t 1

x t xt

1/2 t 1

x t ut . O termo entre colchetes converge em probabilidade para


n 1/2 t 1

zero (pelo mesmo argumento usado na prova do Teorema 11.1), enquanto n

x t ut limitado

em probabilidade porque ele converge para uma distribuio normal multivariada pelo teorema do limite central. Um resultado bastante conhecido na teoria assimpttica que o produto de tais termos converge em probabilidade para zero. Alm disso, n ( ) herda sua distribuio assimpttica de
n

1/2 t 1

x t ut . Veja Wooldridge (2002, Captulo 3) para mais detalhes sobre os resultados de conn

vergncia usados nesta prova. De acordo com o teorema do limite central, n


1/2 t 1

x t ut tem uma distribuio normal assimpt-

tica com mdia zero e, digamos, matriz de varincias-covarincias k k B. Ento, n ( ) tem uma distribuio normal multivariada assimpttica com mdia zero e matriz de varincias-covarincias 1 1 2 A BA . Agora mostramos que, sob as hipteses ST.4 e ST.5 , B = A. (A expresso geral til, pois ela sustenta os erros-padro robustos em relao heteroscedasticidade e correlao serial do MQO, de forma semelhante examinada no Captulo 12.) Primeiro, sob a hiptese ST.5 , x t ut e x sus so no-correlacionados quando t s. Por qu? Concretamente, suponha que s t. Ento, pela lei das expectativas iteradas, E(x t utusxs) E[E(ut usx t xs)|x t xs)] E[E(utus|x t xs)x t xs)] E[0 x t xs] 0. As covarincias zero implicam que a varincia da soma a soma das varincias. Entretanto, Var(x t ut) E(x t ut ut xt) E(u2 x t xt). Pela lei das expectativas iteradas, E(u2 x t xt) E[E(u2x t xt | xt)] t t t

Wooldridge

Apndice E

O Modelo de Regresso Linear em Forma Matricial

119

E[E(u2 | xt)x t xt] E( 2x t xt) t e ST.4 . Isso mostra que B

2 2 E(x t xt) A, onde usamos E(u2 |xt) sob as hipteses ST.2 t A e, assim, sob as hipteses ST.1 a ST.5 , temos

n ( Isso completa a prova.

a ) Normal (0, 2A 1).

(E.23)

A partir da equao (E.23), tratamos como se fosse, de maneira aproximada, normalmente distribudo com mdia e matriz de varincias-covarincias 2A 1/n. A diviso pelo tamanho da amostra, n, nesse caso esperada: a aproximao matriz de varincias-covarincias de se contrai para zero taxa 1/n. Quando substitumos 2 por seu estimador consistente, 2 SQR/(n k), e substitun

mos A por seu estimador consistente n assimpttica de :

1 t 1

xt xt

X X/n, obtemos um estimador para a varincia

A ar( )

(X X) 1.

(E.24)

Observe como as duas divises por n se anulam, e o lado direito de (E.24) a maneira habitual como estimamos a matriz de varincias do estimador MQO sob as hipteses de Gauss-Markov. Para resumir, mostramos que, sob as hipteses ST.1 a ST.5 que contm RLM.1 a RLM.5 como casos especiais , os erros-padro e as estatsticas t habituais so assimptoticamente vlidas. perfeitamente legtimo usar a distribuio t habitual para obter valores crticos e p-valores para se testar uma hiptese nica. Interessantemente, na organizao geral do Captulo 11, assumir a normalidade dos erros digamos ut dados xt,ut 1,xt 1, ..., u1, x1 distribuda como Normal(0, 2) no ajuda necessariamente, pois as estatsticas t no sero de forma geral estatsticas t exatas sob esse tipo de hiptese de normalidade. Quando no assumimos a exogeneidade estrita das variveis explicativas, resultados distribucionais exatos so difceis, se no impossveis, de serem obtidos. Se modificarmos o argumento acima, poderemos derivar uma matriz de varincias-covarincias robustas em relao heteroscedasticidade. O importante que deveremos estimar E(u2x t xt) separat damente, pois essa matriz no mais iguala 2E(x t xt). Entretanto, se os ut forem os resduos MQO, um estimador consistente ser (n k)
1
n t 1

t u2 x t xt,

(E.25)

onde a diviso por n k em vez de por n um ajuste dos graus de liberdade que hipoteticamente auxilia nas propriedades de amostra finita do estimador. Quando usamos a expresso na equao (E.25), obtemos
n

A ar( )

[n/(n

k]X X)

1
t 1

t u2 x t x t (X X) 1.

(E.26)

120

Introduo Econometria Editora Thomson

As razes quadradas dos elementos diagonais dessa matriz so os mesmos erros-padro robustos em relao heteroscedasticidade que obtivemos na Seo 8.2, no caso de corte transversal puro. Uma extenso matricial de erros-padro robustos em relao correlao serial (e heteroscedasticidade) que obtivemos na Seo 12.5 tambm est disponvel, mas a matriz que deve substituir (E.25) complicada devido correlao serial. Veja, por exemplo, Hamilton (1994, Seo 10.5).

Estatstica de Wald para Testes de Mltiplas Hipteses


Argumentos semelhantes podem ser usados para a obteno da distribuio assimpttica da estatstica de Wald para testar mltiplas hipteses. Seja R uma matriz q k, com q k. Assuma que as q restrir, onde r um vetor es sobre o vetor q 1 de parmetros, , possam ser expressas como H0: R q 1 de constantes conhecidas. Sob as hipteses ST.1 a ST.5 , possvel mostrar que, sob H0, [ n(R r)] ( 2RA 1R ) 1[ n(R r)]
2 q,

(E.27)

onde A E(x t xt), como nas provas dos teoremas 11.1 e 11.2. A intuio por trs da equao (E.25) simples. Como n ( ) aproximadamente distribuda como Normal(0, 2A 1), R[ n ( )] n R( ) ser aproximadamente Normal(0, 2RA 1R ), pela Propriedade 3 da distribuio normal multivariada do Apndice D. Sob H0, R r e, assim, n (R r) Normal(0, 2RA 1R ) sob a H0. Para obter formalmente o resultado final, precisaremos usar uma verso assimpttica desta propriedade, que pode ser encontrada em Wooldridge (2002, Captulo 3). Conhecido o resultado em (E.25), obtemos uma estatstica computvel, fazendo a substituio de A e 2 por seus estimadores consistentes; isso no alterar a distribuio assimpttica. O resultado ser a chamada estatstica de Wald, a qual, aps o cancelamento dos tamanhos das amostras e o uso de um pouco de lgebra, poder ser escrita como W (R r) [R(X X) 1R ] 1(R r)/ 2. (E.28)

Sob H0, W X2 , onde recordamos que q o nmero de restries sendo testadas. Se 2 SQR/(n q k), possvel mostrar que W/q ser exatamente a estatstica F que obtivemos no Captulo 4 no teste de restries lineares mltiplas. [Veja, por exemplo, Greene (1997, Captulo 7).] Portanto, sob as hipteses do modelo linear clssico, ST.1 a ST.6 do Captulo 10, W/q ter uma distribuio Fq,n k exata. Sob as hipteses ST.1 a ST.5 , somente teremos o resultado assimpttico em (E.26). No entanto, apropriado, e comum, tratar a estatstica F usual como tendo uma distribuio Fq,n k aproximada. Uma estatstica de Wald robusta quanto heteroscedasticidade de forma desconhecida pode ser obtida com o uso da matriz em (E.26) em lugar de 2(X X) 1, e de forma semelhante para um teste estatstico robusto tanto em relao heteroscedasticidade como quanto correlao serial. As verses robustas da estatstica dos testes no podem ser computadas via somas dos resduos quadrados ou dos R-quadrados das regresses restritas e irrestritas.

Wooldridge

Apndice E

O Modelo de Regresso Linear em Forma Matricial

121

RESUMO
Este apndice apresentou uma breve explicao do modelo de regresso linear usando a notao matricial. Este material foi includo para aulas mais avanadas que usam lgebra matricial, mas no essencial para a leitura do livro. Na verdade, este apndice faz prova de alguns dos resultados que, ou afirmamos sem provas, provamos somente em casos especiais, ou provamos por meio de mtodos excessivamente complicados. Outros tpicos tais como, propriedades assimptticas, estimao de variveis instrumentais e modelos de dados de painel podero ser tratados de forma concisa com o uso de matrizes. Textos avanados sobre econometria, entre os quais inclumos Davidson e MacKinnon (1993), Greene (1997) e Wooldridge (2002), podem ser consultados para detalhes.

PROBLEMAS
E.1 Seja xt o vetor 1 k das variveis explicativas da observao t. Mostre que o estimador MQO pode ser escrito como
n 1 n

x t xt
t 1 t 1

x t yt .

A diviso de cada somatrio por n mostrar que uma funo de mdias amostrais. E.2 Seja o vetor k 1 das estimativas MQO. (i) Mostre que para qualquer vetor b k dos como SQR(b) {Sugesto: Escreva (y fato que X u 0.} (ii) uu Xb) (y ( 1, podemos escrever a soma dos resduos quadrab) X X( Xb) [u

b). X( b)] [ u X( b)] e use o

Explique como a expresso de SQR(b) na parte (i) prova que minimiza de forma nica a SQR(b) para quaisquer possveis valores de b, assumindo que X tem posto k.

E.3 Seja a estimativa pelos MQO da regresso de y sobre X. Seja A uma matriz no singular k k e defina zt xtA, t 1, ..., n. Portanto, zt 1 k e uma combinao linear no singular de xt. Seja Z a matriz n k com linhas zt. Seja a estimativa MQO de uma regresso de y sobre Z. (i) Mostre que A 1 . (ii) Sejam yt os valores ajustados da regresso original e yt os valores ajustados da regresso de y sobre Z. Mostre que yt yt para todo t 1, 2, ..., n. Como se comparam os resduos das duas regresses?
1

(iii) Mostre que a matriz de varincias estimada de 2A 1(X X) 1A mativa usual da varincia da regresso de y sobre X.

, onde 2 a esti-

(iv) Sejam j as estimativas MQO da regresso de yt sobre 1, xt2, ..., xtk, e j as estimativas MQO da regresso de yt sobre 1, a2xt2, ..., akxtk, onde aj 0, j 2, ..., k. Use os resultados da parte (i) para encontrar a relao entre j e j.

122

Introduo Econometria Editora Thomson

(v)

Assumindo a estrutura da parte (iv), use a parte (iii) para mostrar que ep( j )

ep( j)/|aj |.

(vi) Assumindo a estrutura da parte (iv), mostre que os valores absolutos da estatsticas t de j e j so idnticos. E.4 Assuma que o modelo y X u satisfaz as hipteses de Gauss-Markov, defina G como uma matriz no aleatria, no singular k k, e defina G , de forma que tambm seja um vetor k 1. Seja o vetor k 1 dos estimadores MQO e defina G como o estimador MQO de . (i) Mostre que E( |X) = . (ii) , X e G. (iii) Use o Problema E.3 para verificar que e a estimativa apropriada de Var( | X) so obtidas a partir da regresso de y sobre XG 1. Encontre Var( |X) em termos de
2

(iv) Agora, seja c um vetor k 1 com pelo menos uma entrada diferente de zero. Para maior clareza, assuma que ck 0. Defina c , de forma que seja um escalar. Defina j , j 1, 2, ..., k 1 e k . Mostre como definir uma matriz G no sinj gular k k, de forma que G . (Sugesto: Cada uma das primeiras k 1 linhas de G deve conter k 1 zeros e um 1. Qual ser a ltima linha?) (v) Mostre que para a escolha de G na parte (iv), 1 0 G
1

0 1 0 c2/ck

0.. 0.. ... ...

. . 1 ck 1/ck

0 0 0 1/ck .

0 c1/ck

Use essa expresso para G 1 e a parte (iii) para concluir que e seus erros-padro so obtidos como o coeficiente de xtk/ck na regresso de yt sobre [xt1 (c1/ck)xtk], [xt2 (c2/ck)xtk], ..., [xt, k
1

(ck 1/ck)xtk], xtk/ck, t

1, ..., n.

Essa regresso exatamente a que foi obtida escrevendo k em termos de e 1, 2, ..., k 1, agregando o resultado no modelo original e reorganizando. Portanto, podemos justificar formalmente o truque que usamos em todo o livro para obter o erro-padro de uma combinao linear de parmetros. E.5 Assuma que o modelo y X u satisfaz as hipteses de Gauss-Markov e que seja o estimador MQO de . Seja Z G(X) uma funo matricial n k de X e assuma que Z X (uma matriz k k) no singular. Defina um novo estimador de por (Z X) 1Z y. (i) Mostre que E( |X) , de forma que tambm no-viesado condicional em relao a X. (ii) Encontre Var( |X). Certifique-se de que ela uma matriz k k simtrica que depende de Z, X e 2. (iii) Qual estimador voc prefere, ou ? Explique.

Potrebbero piacerti anche