Sei sulla pagina 1di 16

A econometria uma ferramenta da economia que busca estabelecer relaes causais e correlaes entre variveis dentro de um contexto econmico.

. Modelos so construdos (ex.: ) com o objetivo de descobrir o comportamento de uma varivel dado o comportamento de uma varivel ( ). Em toda a estimao, existe um termo de erro que chamado de resduo ( ). Tal termo de erro so fatores no observados. Para fazer a estimao de , antes necessrio assumir alguns pressupostos:

O valor esperado do resduo zero. ( )

. nulo, ( ) , ou seja, a varivel ( ) .

O valor esperado do resduo condicionado a

explicativa e o resduo so independentes, o que tambm implica que Os dois pressupostos so importantes, pois o objetivo estimar base de dados de forma que o valor esperado de ( ) ( ). Caso ( ) , ento ( )

a partir de uma

seja o valor verdadeiro da populao. .

Modelo de Regresso Simples Um mtodo para estimar o mtodo de Mnimos Quadrados Ordinrios

(MQO). O objetivo do mtodo obter os estimadores minimizando a soma dos quadrados dos resduos (SQR).
( ( )

( )
)

( (
( (


)( )

)
)

Para a demonstrao do mtodo, consultar seu livro de econometria. O estimador pode ser interpretado como de modo que e

qualquer variao de explicada por uma variao em ( e ( )) implica que se e so positivamente correlacionados ento positivo.

. A covarincia entre

so negativamente correlacionados ento negativo. Se

Uma vez estimado o modelo, a variao total de y em relao mdia pode ser calculada pela soma total dos quadrados. SQT o quadrado da diferena entre o valor de Y observado e sua mdia amostral [ ( ) ]. Pelo fato da regresso ser uma aproximao, fatores no

observados sempre existem. Portanto o modelo capaz de explicar uma parte da variao de y. A Soma dos Quadrados Explicados (SQE) o quadrado da diferena entre valor de Y estimado e sua mdia amostral ( ) ]. A variao de y que no pode ser ( ) ]. A Soma dos

explicada pelo modelo definida pela Soma dos Quadrados dos Resduos. SQR o quadrado da diferena entre o valor de Y observado e o valor estimado [

Quadrados Total (SQT) pode ser interpretado como a soma total da variao de y que explicada pelo modelo e da variao de y que no explicada [ ( ) ( ) ].

Uma vez estimado o modelo com o mtodo MQO, pode-se medir quo bem ajustado o modelo est em relao base amostral de dados. Essa medida da qualidade do ajuste dada por . Tambm chamado de coeficiente de determinao, ). calculado por uma proporo assumindo . Quanto menor o

valores entre 0 e 1 ( SQR, maior

, portanto melhor ajustado o modelo est em relao aos dados amostrais. de forma alguma uma medida

Apesar de ser chamado de coeficiente de determinao, Modelo de Regresso Mltipla

O mtodo MQO para estimar o modelo de regresso mltipla tambm tem como objetivo de minimizar SQR. Porm sempre h algum nvel de correlao entre as variveis independentes, afetando assim a estimao dos . O estimador pode ser estimado da mesma forma que na regresso simples, tem interpretaes de efeito parcial, dado uma variao de
( ( ) )

. As estimativas

. Para observar a variao de . descontado o efeito das

, controla-se as outras variveis,

O estimador pode tambm ser expresso pelo efeito parcial de

outras variveis. Para determinar a correlao entre as variveis estima-se a regresso de forma reduzida

. O resduo

inclui os fatores no . Chegamos

observados que no so explicados pelas outras variveis, mas que explicam frmula , sendo

. Quanto maior o resduo , menor a disperso de . resulta uma menor ( ), que aumenta ( ).

Uma alta correlao entre as variveis

Uma forma de medir a correlao de cada varivel de correlao mltipla

com as outras calculando o coeficiente

, que nada mais o coeficiente de determinao da regresso .

O coeficiente de determinao mltipla calculado da mesma forma que no modelo de regresso simples, . O coeficiente de determinao pode ser expresso e os valores ajustados de ,

pelos coeficientes de correlao entre o valor real de


( ( ( )( ) ( )) )

. Pelo fato do

sempre aumentar quando se adiciona variveis

independentes em uma regresso, isso faz dele um instrumento fraco para decidir quais variveis devem ser adicionadas. Uma alternativa para medir a qualidade do ajuste o R ajustado. Enquanto o R habitual nunca diminui quando outra varivel adicionada na regresso, o R-adj penaliza o nmero de regressores e o seu valor pode diminuir quando uma varivel independente adicionada, R-adj ( ) ( ) com

sendo o nmero de regressores incluindo o termo de intercepto. Isso o faz prefervel para modelos com diferentes quantidades de variveis independentes. Porm nem o R nem o Radj podem ser usados para comparar modelos com diferentes formas funcionais de (ex.: e

). No entanto, R-adj pode ser bastante til para comparar modelos com diferentes formas funcionais de (ex.: e ).

Mais importante do que procurar uma forma funcional ou um conjunto de variveis que se ajustem de forma tima aos dados amostrais obter estimativas confiveis dos verdadeiros coeficientes de regresso para a populao e fazer inferncias estatsticas sobre eles. Um bom modelo deve ter coeficientes significativos e condizentes com a teoria e/ou lgica.

Pressupostos do mtodo MQO Linearidade dos parmetros: para qualquer dado amostral de independente por , a varivel dada

tem uma mesma relao linear com a varivel dependente . ( )

Mdia condicional zero: o valor esperado do resduo deve ser igual zero, quaisquer que sejam os valores das variveis independentes, . Tal hiptese implica

que fatores no observados no afetam sistematicamente o valor mdio de Y e sua violao implica na existncia de vis de especificao (m-especificao da forma funcional, omisso de varivel importante ou incluso de varivel desnecessria). Ausncia de multicolinearidade: uma varivel outras variveis independentes. Homocedasticidade: o resduo tem a mesma varincia quaisquer que sejam os valores das variveis explicativas, ( ) . no pode ter alta correlao com

Caso nenhum dos pressupostos seja violado, o teorema de Gauss-Markov prova que os estimadores MQO so os estimadores no viesados mais eficientes (eficincia=mnima varincia dos estimadores). Vis e Inconsistncia Vis no estimador pode ser definido quando para uma dada amostra inconsistncia pode ser definida quando a amostra tende para a populao
( ( )

( ) ( )

. E .

Problemas como multicolinearidade e erro de medida podem subestimar ou sobrestimar ( ) conduzindo a uma estimao imprecisa de ( ) , pois ( )
)

. Quando

, o pressuposto da mdia condicional zero violada, , pois ( )

, conduzindo ( ).

tambm a uma estimao imprecisa de

importante observar que a violao da hiptese de homocedasticidade no causa vis ou inconsistncia nos estimadores, pois a estimao de no influenciada pela varincia do resduo. Estatstica t Para que seja possvel fazer inferncia sobre os estimadores necessrio assumir alguns pressupostos. O resduo deve ter uma distribuio normal e ser constante, e ( ( ) , para que seja possvel calcular o p-valor dos testes t e F. da funo de regresso populacional ( )

). O estimador MQO deve seguir uma distribuio normal,

O verdadeiro valor de um parmetro

desconhecido. No entanto possvel formular hipteses sobre o valor real do parmetro


( )

. Para inferir se

significativo, ou seja, se a varivel independente

tem algum efeito sobre a varivel dependente , usa-se a estatstica t. A estatstica do teste t . Formula-se a hiptese nula .

Como o valor real de

desconhecido, fazemos inferncia estatstica sobre a partir de

uma dada amostra populacional. A estatstica usada

( ) , pois consideramos .A

. Porm continuamos a testar a hiptese nula do parmetro populacional,

intuio do teste inferir quo distante est de zero, pois a estimativa pontual nunca ser exatamente zero, seja fornece evidncias contra verdadeira ou no. Um valor amostral muito distante de zero . Entretanto, existe um erro amostral inerente

estimativa , de modo que usamos o erro-padro de que uma estimativa do desvio-

padro de . Portanto

mede quantos desvios-padro estimados est afastado do zero. menor a varincia de (lembrando que
( ( ) )

Quanto maior a variabilidade de

),

portanto mais preciso a medio do parmetro. Considera-se a varincia do resduo homocedstico, ( ) ( ) constante. A

varincia do resduo a soma quadrtica do resduo corrigido pelos graus de liberdade,


( )

no caso da regresso linear e

No modelo de regresso linear simples, o erro-padro de calculado da seguinte forma ( ) ( )


( )

. Para o modelo de regresso mltipla o erro-padro de , sendo o coeficiente de correlao mltipla. Uma . Se

calculado por

( )(

vez calculado a estatstica

compara-se com

rejeita-se a

hiptese nula e conclui-se que a varivel significncia significncia rejeita-se

estatisticamente significante ao nvel de

. Pode-se comparar atravs do p-valor tambm. Para dado um nvel de calcula-se o valor crtico. Se o p-valor da estatstica menor que o valor crtico, . Ao aceitar a hiptese nula, isto significa que no h evidncias amostrais

comprovando que a varivel independente tem alguma relao com a varivel independente. Intervalo de confiana Outra forma de estimar a significncia de construindo o intervalo de confiana de ( ) ,

( ). O uso do Intervalo de Confiana tem e sendo calculados cada vez, ento o ) em 95% das amostras

algumas limitaes prticas, pois para muitos problemas s h uma amostra. Caso amostras aleatrias fossem obtidas repetidas vezes, com

valor populacional (desconhecido) estaria dentro do intervalo ( dado um nvel de significncia de IC, no se sabe se

. Porm para a nica amostra usada para a construo

est contido no intervalo, pois no h garantias que essa nica .

amostra seja uma das 95% de todas as amostras em que a estimativa de intervalo contm Estatstica F

A estatstica F usada para inferir se um grupo de variveis independentes no tem efeito sobre a varivel dependente, testando assim a significncia geral da regresso. A estatstica F definida como
( )( )

. A hiptese nula de que todos os parmetros so zero,

. ( )

Outra

maneira

de

formular

hiptese

nula

( ), ou seja, os valores de e

no afetam o valor

esperado de . Compara-se

, diretamente ou calculando os p-valores respectivos.

Caso a hiptese nula seja aceita, significa que o modelo nulo ou restrito ( ).

importante observar que um

aparentemente pequeno resulta em uma estatstica

altamente significativa. Portanto, importante testar a significncia conjunta e no apenas analisar o valor do .

Vis e Inconsistncia na inferncia Vieses ( ( ) ) que subestimem ou sobrestimem ( ( )


( )

( ) podem subestimar ou

sobrestimar a varincia

). Isso gera problemas na inferncia sobre os


( )

estimadores, pois a estatstica t [

] depende do valor correto de . Portanto

estimadores viesados podem resultar em uma estatstica de teste errnea. Por exemplo, quando uma hiptese nula deveria ser rejeitada, mas por conta dos estimadores viesados essa aceita. Outro problema que afeta a estatista t a heterocedasticidade ( no constante). Apesar

de no causar vis nos estimadores , a heterocedasticidade causa vis na estimao da varincia de ( regresso mltipla). Variveis Dummy Informaes qualitativas podem ser usadas como variveis na anlise de regresso. Essas variveis so conhecidas como variveis dummies e so normalmente estimadas por MQO. A varivel dummy binria, assumindo valores de 0 ou 1. No caso mais simples ( )
( )

para regresso simples e

( )

( )(

para a

, uma varivel dummy utilizada para fazer a distino entre dois grupos, e o coeficiente estimado da varivel dummy estima a diferena da mdia ceteris paribus entre os dois grupos. Um exemplo de varivel dummy dicotmica gnero. possvel construir modelos com duas (ou mais) dummies dicotmicas, . A

interpretao anloga ao modelo com uma dummy, o objetivo tambm captar diferenas da mdia entre os grupos. Porm os grupos agora so todas as combinaes possveis entre as

duas variveis, (Ex.:

: homens e mulheres,

brancos e negros; n de grupos=4: homens

brancos, homens negros, mulheres brancas e mulheres negras). Em modelo com varivel dummy e varivel quantitativa um pouco diferente. Nesse caso, o objetivo captar diferena de nveis de dado a varivel , a intuio entre os grupos

. Tambm possvel estipular interao entre uma varivel dummy e uma . A intuio que existe um efeito

varivel quantitativa,

multiplicativo onde alm da diferena da mdia entre os grupos, existe uma variao dessa diferena (graficamente o coeficiente angular se altera, com as retas no mais sendo paralelas). Por fim pode-se estipular um modelo com interao entre dummies, . A intuio que existe uma diferena adicional diferena de mdia entre os grupos. As variveis dummies no so usadas somente para variveis dicotmicas. Pode-se usar um conjunto de variveis dummy para categorias mltiplas (ex.: macrorregies, religio, etc). Cada dummy representa uma categoria. importante ressaltar que se houver g grupos ento g-1 variveis dummy so includas no modelo. Ao se omitir um dos grupos, o objetivo evitar a multicolinearidade perfeita entre as variveis dummies. Esse grupo omitido chamado de grupo-base. As variveis dummies categorizadas tambm podem ser usadas para incorporar informaes ordinais, como classificaes de crdito, IDH, etc. O teste de Chow pode ser usado para detectar se existem diferenas estatisticamente significantes entre os grupos e assim validar ou no o uso da varivel dummy. Modelo de Probabilidade Linear O modelo de probabilidade linear MPL, que simplesmente estimado pelo MQO, possibilita explicar uma resposta binria usando anlise de regresso, ( )

. As estimativas MQO agora so interpretadas como alteraes na probabilidade de sucesso (y=1), dado um aumento de uma unidade na varivel explicativa correspondente, ( ) . O MPL tem algumas inconvenincias: pode produzir probabilidades

previstas menores que zero ou maiores que um; implica um efeito marginal constante de cada varivel independente que aparece em sua forma original; e contm heterocedasticidade.

M-especificao do modelo Quando o valor esperado do resduo condicionado ao valor de ( ) diferente de zero

, tal hiptese implica que fatores no observados afetam sistematicamente o valor

mdio de Y e sua violao implica na existncia de vis de especificao. O vis da especificao pode ser fruto da omisso de uma varivel importante, seja por excluso seja por subespecificao do modelo. Isso geralmente conduz a vis e inconsistncia em todos os estimadores MQO. A m-especificao do modelo tambm pode ser causada pela m-especificao da forma funcional da varivel independente ou varivel dependente, caso haja uma relao no linear entre e . Um exemplo de uso inapropriado de uma forma funcional da varivel dependente

salrioh ao invs de log(salrioh). Um modelo de regresso mltipla sofre de mespecificao da forma funcional quando no explica de maneira apropriada a relao entre as variveis explicativas e a varivel dependente observada. Apesar de trazer srias consequncias, o problema secundrio uma vez que temos os dados necessrios de todas as variveis necessrias para obter uma relao funcional que se ajuste bem aos dados. Diante de uma relao no linear entre e , pode-se fazer transformao funcional da e

varivel independente para corrigir o problema. A logaritmizao da varivel apropriada para modelos de elasticidade constante ( variao percentual de ). semilogartmico percentual em . Para em ( ( provoca uma variao percentual proporcional em em relao a (

). Qualquer

muitas vezes chamado elasticidade de

. Para o modelo

, uma variao absoluta de ).

provoca uma variao em relao a

chamado semi elasticidade de

, uma variao percentual de ). e

provoca uma variao absoluta

Outra relao no linear entre ( )

bastante comum a forma quadrtica. Para causa uma variao em condicionada ao valor de

, uma variao de ( (mx/mn=| |),

). A medida que

se aproxima do ponto de mximo/mnimo

varia a taxas decrescentes. importante ressaltar que para o modelo

quadrtico e outras formas polinomiais, no existe multicolinearidade, pois no se trata de efeitos separados. Por fim, efeitos multiplicativos causados por interaes entre as variveis independentes podem ocorrer, paribus, causa uma variao em . A variao de , mas que amplificada pelo valor de [ , ceteris (

) )

. Assim como o efeito da variao de ].

influenciada pelo valor de

Para identificar problemas de m-especificao da forma funcional, o teste de erro de especificao da regresso (RESET) bem til. O teste RESET adiciona polinmios aos valores estimados MQO para detectar tipos gerais de m-especificao de formas funcionais. Na maior parte dos casos incluem-se os termos quadrticos e cbicos ( e so funes no lineares de ). A hiptese nula do teste que o

modelo est corretamente especificado. A estatstica do teste RESET a estatstica


( ( )( )( ) )

para

. Uma estatstica F

significativa sugere algum tipo de problema na forma funcional. Uma desvantagem do teste RESET que ela no fornece uma orientao prtica de como proceder se o modelo for rejeitado. Alm disso, mesmo se a forma funcional for apropriadamente especificada, o teste RESET no tem poder para detectar heterocedasticidade. Erro de Medida Quando se usa uma medida imprecisa de uma varivel econmica em um modelo de regresso, o modelo conter um erro de medida. O mtodo MQO ser consistente sob certas hipteses, mas existem outras sob as quais ele ser inconsistente. Em alguns casos, pode-se inferir o tamanho do vis assimpttico. O erro de medida (na populao) definido como a diferena entre o valor observado e o valor real: estimado como . O erro de medida pode ser . natural supor que o erro de medida ser viesado. Se a correlao e no so

tem mdia zero, caso contrrio o estimador do intercepto entre e correlacionados, ento var( varivel dependente sobrestima hiptese nula. O erro de medida em uma varivel explicativa ou zero. Presume-se que ( ) formula-se a hiptese que e que )

nula, os estimadores MQO sero no viesados e consistentes. Se

. Isso implica que o erro de medida na ( ), a estatstica t subestimado aceitando, assim, a

, podendo ser negativo, positivo e . Sendo assim,

no correlacionado com e

no correlacionado com

. Se a hiptese for falsa, o

estimador MQO no ser consistente.

Varivel Proxy A omisso de uma importante varivel no modelo pode conduzir a vis e inconsistncia nos estimadores MQO. Porm sua excluso muitas vezes ocorre por indisponibilidade de dados. Uma forma de remediar o uso de varivel proxy que uma varivel altamente correlacionada com a varivel no observada. A varivel Proxy tambm pode ser usada para substituir variveis com erro de medida. Uma varivel Proxy uma varivel que possui alta correlao com outro varivel. Mas mais importante, para que uma varivel seja uma boa Proxy, esta no deve ter relao causal com a varivel a ser substituda. um tanto contra intuitivo que uma varivel que tenha uma elevada correlao com outra, no existe relao causal entre elas. Um exemplo de varivel Proxy usado em modelos econmicos a varivel PIB per capita substituindo a varivel qualidade de vida. Como j definido, a varivel Proxy busca mimetizar certa varivel. Ela uma boa soluo no caso de variveis omitidas que sejam complicadas de obter sua mensurao. Um exemplo usar a Proxy QI no lugar da varivel aptido em um modelo de salrio. razovel supor que QI e aptido esto altamente correlacionadas, mas no h uma relao causal entre elas. Pelo fato de no ser possvel mensurar a aptido dos indivduos, a varivel um fator no observado. Assim sendo, a varivel Proxy QI deve ter correlao com o resduo. Heterocedasticidade O problema da heterocedasticidade ocorre quando a varincia do termo de erro no constante. Tal hiptese no provoca vis ou inconsistncia (consistncia: quando o tamanho da amostra tende ao infinito, o estimador tende ao seu valor real, MQO. Todavia os estimadores de varincias var( ) so viesados, pois ) nos estimadores ( ) ( ),

muitas vezes implicando em resultados no esperados. A varincia no sendo constante afeta a estatstica t. Quando a hiptese nula. Quando assim, a hiptese nula. Um estimador vlido de formas homocedsticas, de ( ) ( ) ( ) para qualquer forma de heterocedasticidade, inclusive para
( )

( ) subestimada, a estatstica t sobrestimado rejeitando, assim, ( ) superestimada, a estatstica t subestimada aceitando,

. Para o modelo de regresso mltipla, o estimador vlido

. A sua raiz quadrada chamada de erro-padro robusto em

relao heterocedasticidade. Assim possvel construir uma estatstica robusta em relao

heterocedasticidade, onde

( )

. A varivel que era estatisticamente significante com o

uso da estatstica t habitual continua estatisticamente significante com o uso da estatstica t robusta em relao heterocedasticidade. Em amostras de tamanho grande cuja varincia seja desconhecida pode-se usar erros-padro robustos em relao heterocedasticidade. Apesar de vlido, o estimador MQO no mais ser o estimador linear no viesado mais eficiente. Para usar outras aes corretivas mais eficientes necessrio realizar testes que detectem heterocedasticidade e a sua forma. O teste Breusch-Pagan busca captar uma relao linear entre o resduo e as variveis (
( )( )

). Constri-se ento a estatstica . Se o p-valor for abaixo do nvel de significncia selecionado, ento

rejeita-se a hiptese nula de homocedasticidade. J o teste de White mais completo que o teste Breusch-Pagan, pois acrescenta iteraes e formas funcionais de xi para captar tanto linearidades quanto no linearidades entre o resduo e as variveis ( ). Pode-se reescrever a equao desta forma . O teste de White que no inclui iteraes ser

um teste de heterocedasticidade pura. Se tais termos estiverem presentes, trata-se de um teste tanto de heterocedasticidade quanto de vis de especificao. Havendo, por exemplo, uma relao linear entre resduos e a varivel ( conhecido) pode-

se usar o mtodo de Mnimos Quadrados Ponderados (MQP). O mtodo consiste em dividir a equao de previso ponderando todas as variveis por ( ) , ( )
( )

, obtendo assim

( )

( )

( )

( )

. Se corretamente especificada a forma

da heterocedasticidade, o mtodo MQP mais eficiente que MQO, pois novas estatsticas t e F so produzidas. A intuio do mtodo que o peso atribudo a cada observao inversamente proporcional a sua , ou seja, observaes vindas de uma populao com menor tero

maior obtero peso relativamente menor e aquelas de uma populao com peso proporcionalmente maior na minimizao da SQR.

Porm na maioria dos casos, a forma exata de heterocedasticidade, h(x), no bvia. Para isso, temos o mtodo de Mnimos Quadrados Generalizados Factveis (MQGF) que transforma o resduo em semilogartmico, . Sendo ( ) de previso ponderada igual a
( )

, temos a equao
( )

( )

( )

( )

. Apesar de o estimador MQGF ser viesado, ele consistente e assimptoticamente

(para uma grande amostra) mais eficiente que o MQO. Multicolinearidade O problema da multicolinearidade ocorre na regresso mltipla quando existe uma correlao entre as variveis independentes, causada geralmente por vis de omisso de varivel ou vis de erro de medida. O problema da multicolinearidade essencialmente amostral, tanto que os no so significativos. Uma baixa variabilidade de aumenta a disperso do , se ( )

sobrestimado temos uma estatstica t subestimada. importante ressaltar que formas funcionais de xi no violam a hiptese de multicolinearidade, apesar de que o coeficiente de correlao mostrar que e esto altamente correlacionados.

Se a multicolinearidade for perfeita, os estimadores de MQO sero indeterminados e seus erros-padro infinitos. Se a multicolinearidade for menos que perfeita, os estimadores possuiro grandes erros-padro, em relao aos prprios estimadores, o que significa que no podem ser estimados com grande preciso ou exatido. Os so os mais eficientes, pois a multicolinearidade reduz subestimado resulta em ( ), porm causando vis nos (
( ) ). ( )

Um

( )

( ) sobrestimado, sobrestimando a estatstica t e assim

aceitando a hiptese nula. Mesmo que a razo t seja estatisticamente insignificante, o R pode ser muito alto. A velocidade com a qual as varincias e covarincias aumentam pode ser observada pelo fator de inflao das variveis (FIV), definido como ( ). Quando , coeficiente de

correlao mltipla, tende a 1, o FIV tende ao infinito. Ou seja, quanto maior a colinearidade, maior a varincia de um estimador e, no limite, pode tornar-se infinita. Se no houver colinearidade entre Xi, o FIV ser 1. A varincia do estimador
( )

( ) pode ser expressa como

mostrando que a varincia de diretamente proporcional ao FIV.

Outra forma de identificar a varivel independente que est correlacionada a outras variveis independentes do modelo fazer uma regresso para Xi contra as demais variveis X e calcular o R correspondente, . Cada uma dessas regresses (ex.:
( )(

)
)

chamada de regresso auxiliar. A varivel Xi segue distribuio Se o F calculado excede o

crtico no nvel de significncia escolhido, considera-se que Xi

colinear com os outros X, se no exceder o varivel no modelo.

crtico, este no ser colinear mantendo a

Para corrigir o problema, Gujarati sugere algumas opes. Em caso de uma alta multicolinearidade, uma opo excluir uma das variveis colineares. Porm tal soluo pode incorrer a outro problema mais grave que o vis de especificao. Outra possvel soluo que pode atenuar o problema aumentar o tamanho da amostra ou at mesmo obter uma nova base de dados. Endogeneidade O problema da endogeneidade ocorre quando a varivel independente e o resduo so correlacionados, ( ) . Dizemos que endgena quando esta varivel observada

quantificada tem relao com uma varivel no observada. Assim como na multicolinearidade, problema da endogeneidade ocorre por erro de medida ou omisso de varivel. Variveis instrumentais so usadas para mitigar o problema. Uma boa varivel instrumental alta correlao com a varivel endgena e mnima correlao com o resduo, ( ) ( deve ter ) e

. Um exemplo de varivel instrumental a proximidade da universidade, pois a

varivel dependente fazer ensino superior muito correlacionado com a presena de faculdade na cidade. importante observar que uma varivel Proxy no um instrumento, pois para que uma varivel seja uma boa varivel instrumental necessrio que haja um princpio de causalidade entre a varivel instrumental e a varivel a ser substituda. O mtodo para estimar os com a varivel instrumental denominada de Mnimos Quadrados Dois Estgios (MQ2E). No 1 estgio, usando o mtodo de MQO estima-se (forma reduzida), com varivel instrumental tem um alto no primeiro estgio. Como ( . Uma boa ) ( ), a

varivel instrumental significante somente se

, o que verificado atravs da estatstica

t. No 2 estgio, tambm se usa o MQO para estimar . No caso da estimao do modelo simples algebricamente. Temos que ( )
(

, o pode ser calculado ( ) ( ). Sendo ( ) e

(
( ( )( )(

)
) . )

( (

) )

Para fazer inferncia sobre o estimador, ) . Pela frmula da varincia do estimador ), apesar de mais eficiente geralmente o

( )

, pressupe que ( ( ) (

observa-se que

estimador MQO inconsistente. Porm caso

) seja estatisticamente consistente,

descarta-se o uso da varivel instrumental. Neste caso o teste de Hausman busca testar se a varivel instrumental corrige o problema de endogeneidade. Para o teste estabelece-se a ( ) . O teste usa o MQ2E, sendo o 1 estgio: . Se estatisticamente significativo,

. O 2 estgio: rejeita-se

e a varivel instrumental no corrigiu o problema da endogeneidade.

Mais de uma varivel instrumental pode ser usada no MQ2E, porm tal medida corretiva pode no contribuir efetivamente para a soluo do problema. necessrio testar se uma varivel instrumental suficiente. O teste de sobre-identificao consiste primeiramente em estimar . Depois estima-se teste Estimado , estima-se , onde o valor da estimao , sendo que . A estatstica do eqo

nmero de instrumentos adicionais. Compara-se o valor do multiplicador de Lagrange com o valor crtico da distribuio qui-quadrada Equaes Simultneas Em modelos uniequacionais, existe uma relao causal unidirecional entre variveis independentes e variveis dependentes. Porm existem situaes onde essa relao causal no unidirecional, ou seja, as variveis independentes afetam as variveis dependentes e as variveis dependentes tambm afetam as variveis independentes. Temos ento uma situao caracterizada por endogeneidade perfeita. Para lidar com este tipo de problema usamos modelos de equaes simultneas, nas quais h mais do que uma equao de regresso, uma para cada varivel interdependente. Se no h problema de simultaneidade, os estimadores MQO produzem estimadores consistentes e eficientes. Por outro lado, se h simultaneidade, os estimadores MQO no so sequer consistentes. Na presena da simultaneidade, o mtodo de MQ2E oferece estimadores consistentes e eficientes. Curiosamente, se usarmos variveis instrumentais quando no h de fato simultaneidade, estes nos oferecero estimadores consistentes, mas no eficientes. Porm antes de descartar o uso do mtodo MQ2E, caso as variveis dependentes no sejam simultneas necessrio testar se realmente o problema inexiste. Para esse propsito usamos o teste de Hausman. Para que haja simultaneidade essencial que o regressor endgeno seja correlacionado com o termo de erro. A hiptese nula do teste de que no h simultaneidade, ( ) . No 1 estgio estimamos e no 2 estgio .

. Se

estatisticamente significativo, rejeita-se

e h

simultaneidade entre as variveis dependentes. Propriedades assintticas Assinttico significa que o tamanho da amostra tende ao infinito, ou seja, quando o tamanho da amostra tende sua populao. O n depende da varincia de x populacional. A partir deste conceito definimos consistncia dos estimadores MQO como o valor esperado de tendendo ao quando o tamanho da amostra tende populao, o que pode ser representado

graficamente na figura 5.1. Sob os pressupostos de Gauss-Markov, os estimadores MQO so consistentes. A inexistncia de vis dos estimadores, embora importante, no pode ser conseguida sempre. Por exemplo, o erro-padro da regresso no um estimador no viesado do desvio-padro do erro em um modelo de regresso mltipla.

O estimador da regresso simples pode ser interpretado como sendo o parmetro populacional acrescido do termo de erro:
( ( ) ) ( ( ) )

. Usando as ) ( ).

propriedades dos limites da probabilidade, obtemos:

Caso no haja violao do pressuposto

, ento

. Portanto, a

consistncia pode ser definida como a probabilidade limite do estimador ser igual ao parmetro populacional. Quanto maior ( ), mais distante est de . Quanto maior

o tamanho de n, menor o efeito da correlao entre fatores observados e fatores no observados sobre a estimao. A consistncia de um estimador uma importante propriedade, mas ela sozinha no nos permite trabalhar com inferncia estatstica. Para isso necessrio que os estimadores MQO sigam uma distribuio normal. A normalidade exata dos estimadores de MQO depende crucialmente da normalidade da distribuio do erro na populao. Se os erros forem extraes aleatrias de alguma distribuio diferente da normal, o no ser normalmente distribudo, o que significa que no ser possvel obter p-valores das distribuies e . importante observar que a no normalidade do termo de erro no implica de modo algum em vis nos estimadores MQO. O estimador tambm continua sendo o mais eficiente sob as hipteses de Gauss-Markov. Ainda que no sigam uma distribuio normal, podemos usar o

teorema do limite central para concluir que os estimadores de MQO satisfazem a normalidade assimpttica, o que significa que eles so, de maneira aproximada, normalmente distribudos em amostras de tamanhos suficientemente grandes.

Potrebbero piacerti anche