Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
. Modelos so construdos (ex.: ) com o objetivo de descobrir o comportamento de uma varivel dado o comportamento de uma varivel ( ). Em toda a estimao, existe um termo de erro que chamado de resduo ( ). Tal termo de erro so fatores no observados. Para fazer a estimao de , antes necessrio assumir alguns pressupostos:
explicativa e o resduo so independentes, o que tambm implica que Os dois pressupostos so importantes, pois o objetivo estimar base de dados de forma que o valor esperado de ( ) ( ). Caso ( ) , ento ( )
a partir de uma
Modelo de Regresso Simples Um mtodo para estimar o mtodo de Mnimos Quadrados Ordinrios
(MQO). O objetivo do mtodo obter os estimadores minimizando a soma dos quadrados dos resduos (SQR).
( ( )
( )
)
( (
( (
)( )
)
)
Para a demonstrao do mtodo, consultar seu livro de econometria. O estimador pode ser interpretado como de modo que e
qualquer variao de explicada por uma variao em ( e ( )) implica que se e so positivamente correlacionados ento positivo.
. A covarincia entre
Uma vez estimado o modelo, a variao total de y em relao mdia pode ser calculada pela soma total dos quadrados. SQT o quadrado da diferena entre o valor de Y observado e sua mdia amostral [ ( ) ]. Pelo fato da regresso ser uma aproximao, fatores no
observados sempre existem. Portanto o modelo capaz de explicar uma parte da variao de y. A Soma dos Quadrados Explicados (SQE) o quadrado da diferena entre valor de Y estimado e sua mdia amostral ( ) ]. A variao de y que no pode ser ( ) ]. A Soma dos
explicada pelo modelo definida pela Soma dos Quadrados dos Resduos. SQR o quadrado da diferena entre o valor de Y observado e o valor estimado [
Quadrados Total (SQT) pode ser interpretado como a soma total da variao de y que explicada pelo modelo e da variao de y que no explicada [ ( ) ( ) ].
Uma vez estimado o modelo com o mtodo MQO, pode-se medir quo bem ajustado o modelo est em relao base amostral de dados. Essa medida da qualidade do ajuste dada por . Tambm chamado de coeficiente de determinao, ). calculado por uma proporo assumindo . Quanto menor o
, portanto melhor ajustado o modelo est em relao aos dados amostrais. de forma alguma uma medida
O mtodo MQO para estimar o modelo de regresso mltipla tambm tem como objetivo de minimizar SQR. Porm sempre h algum nvel de correlao entre as variveis independentes, afetando assim a estimao dos . O estimador pode ser estimado da mesma forma que na regresso simples, tem interpretaes de efeito parcial, dado uma variao de
( ( ) )
. As estimativas
outras variveis. Para determinar a correlao entre as variveis estima-se a regresso de forma reduzida
. O resduo
observados que no so explicados pelas outras variveis, mas que explicam frmula , sendo
. Quanto maior o resduo , menor a disperso de . resulta uma menor ( ), que aumenta ( ).
O coeficiente de determinao mltipla calculado da mesma forma que no modelo de regresso simples, . O coeficiente de determinao pode ser expresso e os valores ajustados de ,
. Pelo fato do
independentes em uma regresso, isso faz dele um instrumento fraco para decidir quais variveis devem ser adicionadas. Uma alternativa para medir a qualidade do ajuste o R ajustado. Enquanto o R habitual nunca diminui quando outra varivel adicionada na regresso, o R-adj penaliza o nmero de regressores e o seu valor pode diminuir quando uma varivel independente adicionada, R-adj ( ) ( ) com
sendo o nmero de regressores incluindo o termo de intercepto. Isso o faz prefervel para modelos com diferentes quantidades de variveis independentes. Porm nem o R nem o Radj podem ser usados para comparar modelos com diferentes formas funcionais de (ex.: e
). No entanto, R-adj pode ser bastante til para comparar modelos com diferentes formas funcionais de (ex.: e ).
Mais importante do que procurar uma forma funcional ou um conjunto de variveis que se ajustem de forma tima aos dados amostrais obter estimativas confiveis dos verdadeiros coeficientes de regresso para a populao e fazer inferncias estatsticas sobre eles. Um bom modelo deve ter coeficientes significativos e condizentes com a teoria e/ou lgica.
Pressupostos do mtodo MQO Linearidade dos parmetros: para qualquer dado amostral de independente por , a varivel dada
Mdia condicional zero: o valor esperado do resduo deve ser igual zero, quaisquer que sejam os valores das variveis independentes, . Tal hiptese implica
que fatores no observados no afetam sistematicamente o valor mdio de Y e sua violao implica na existncia de vis de especificao (m-especificao da forma funcional, omisso de varivel importante ou incluso de varivel desnecessria). Ausncia de multicolinearidade: uma varivel outras variveis independentes. Homocedasticidade: o resduo tem a mesma varincia quaisquer que sejam os valores das variveis explicativas, ( ) . no pode ter alta correlao com
Caso nenhum dos pressupostos seja violado, o teorema de Gauss-Markov prova que os estimadores MQO so os estimadores no viesados mais eficientes (eficincia=mnima varincia dos estimadores). Vis e Inconsistncia Vis no estimador pode ser definido quando para uma dada amostra inconsistncia pode ser definida quando a amostra tende para a populao
( ( )
( ) ( )
. E .
Problemas como multicolinearidade e erro de medida podem subestimar ou sobrestimar ( ) conduzindo a uma estimao imprecisa de ( ) , pois ( )
)
. Quando
, conduzindo ( ).
importante observar que a violao da hiptese de homocedasticidade no causa vis ou inconsistncia nos estimadores, pois a estimao de no influenciada pela varincia do resduo. Estatstica t Para que seja possvel fazer inferncia sobre os estimadores necessrio assumir alguns pressupostos. O resduo deve ter uma distribuio normal e ser constante, e ( ( ) , para que seja possvel calcular o p-valor dos testes t e F. da funo de regresso populacional ( )
. Para inferir se
tem algum efeito sobre a varivel dependente , usa-se a estatstica t. A estatstica do teste t . Formula-se a hiptese nula .
( ) , pois consideramos .A
intuio do teste inferir quo distante est de zero, pois a estimativa pontual nunca ser exatamente zero, seja fornece evidncias contra verdadeira ou no. Um valor amostral muito distante de zero . Entretanto, existe um erro amostral inerente
padro de . Portanto
mede quantos desvios-padro estimados est afastado do zero. menor a varincia de (lembrando que
( ( ) )
),
portanto mais preciso a medio do parmetro. Considera-se a varincia do resduo homocedstico, ( ) ( ) constante. A
. Para o modelo de regresso mltipla o erro-padro de , sendo o coeficiente de correlao mltipla. Uma . Se
calculado por
( )(
compara-se com
rejeita-se a
. Pode-se comparar atravs do p-valor tambm. Para dado um nvel de calcula-se o valor crtico. Se o p-valor da estatstica menor que o valor crtico, . Ao aceitar a hiptese nula, isto significa que no h evidncias amostrais
comprovando que a varivel independente tem alguma relao com a varivel independente. Intervalo de confiana Outra forma de estimar a significncia de construindo o intervalo de confiana de ( ) ,
( ). O uso do Intervalo de Confiana tem e sendo calculados cada vez, ento o ) em 95% das amostras
algumas limitaes prticas, pois para muitos problemas s h uma amostra. Caso amostras aleatrias fossem obtidas repetidas vezes, com
valor populacional (desconhecido) estaria dentro do intervalo ( dado um nvel de significncia de IC, no se sabe se
amostra seja uma das 95% de todas as amostras em que a estimativa de intervalo contm Estatstica F
A estatstica F usada para inferir se um grupo de variveis independentes no tem efeito sobre a varivel dependente, testando assim a significncia geral da regresso. A estatstica F definida como
( )( )
. ( )
Outra
maneira
de
formular
hiptese
nula
( ), ou seja, os valores de e
no afetam o valor
esperado de . Compara-se
Caso a hiptese nula seja aceita, significa que o modelo nulo ou restrito ( ).
altamente significativa. Portanto, importante testar a significncia conjunta e no apenas analisar o valor do .
( ) podem subestimar ou
sobrestimar a varincia
estimadores viesados podem resultar em uma estatstica de teste errnea. Por exemplo, quando uma hiptese nula deveria ser rejeitada, mas por conta dos estimadores viesados essa aceita. Outro problema que afeta a estatista t a heterocedasticidade ( no constante). Apesar
de no causar vis nos estimadores , a heterocedasticidade causa vis na estimao da varincia de ( regresso mltipla). Variveis Dummy Informaes qualitativas podem ser usadas como variveis na anlise de regresso. Essas variveis so conhecidas como variveis dummies e so normalmente estimadas por MQO. A varivel dummy binria, assumindo valores de 0 ou 1. No caso mais simples ( )
( )
( )
( )(
para a
, uma varivel dummy utilizada para fazer a distino entre dois grupos, e o coeficiente estimado da varivel dummy estima a diferena da mdia ceteris paribus entre os dois grupos. Um exemplo de varivel dummy dicotmica gnero. possvel construir modelos com duas (ou mais) dummies dicotmicas, . A
interpretao anloga ao modelo com uma dummy, o objetivo tambm captar diferenas da mdia entre os grupos. Porm os grupos agora so todas as combinaes possveis entre as
: homens e mulheres,
brancos, homens negros, mulheres brancas e mulheres negras). Em modelo com varivel dummy e varivel quantitativa um pouco diferente. Nesse caso, o objetivo captar diferena de nveis de dado a varivel , a intuio entre os grupos
. Tambm possvel estipular interao entre uma varivel dummy e uma . A intuio que existe um efeito
varivel quantitativa,
multiplicativo onde alm da diferena da mdia entre os grupos, existe uma variao dessa diferena (graficamente o coeficiente angular se altera, com as retas no mais sendo paralelas). Por fim pode-se estipular um modelo com interao entre dummies, . A intuio que existe uma diferena adicional diferena de mdia entre os grupos. As variveis dummies no so usadas somente para variveis dicotmicas. Pode-se usar um conjunto de variveis dummy para categorias mltiplas (ex.: macrorregies, religio, etc). Cada dummy representa uma categoria. importante ressaltar que se houver g grupos ento g-1 variveis dummy so includas no modelo. Ao se omitir um dos grupos, o objetivo evitar a multicolinearidade perfeita entre as variveis dummies. Esse grupo omitido chamado de grupo-base. As variveis dummies categorizadas tambm podem ser usadas para incorporar informaes ordinais, como classificaes de crdito, IDH, etc. O teste de Chow pode ser usado para detectar se existem diferenas estatisticamente significantes entre os grupos e assim validar ou no o uso da varivel dummy. Modelo de Probabilidade Linear O modelo de probabilidade linear MPL, que simplesmente estimado pelo MQO, possibilita explicar uma resposta binria usando anlise de regresso, ( )
. As estimativas MQO agora so interpretadas como alteraes na probabilidade de sucesso (y=1), dado um aumento de uma unidade na varivel explicativa correspondente, ( ) . O MPL tem algumas inconvenincias: pode produzir probabilidades
previstas menores que zero ou maiores que um; implica um efeito marginal constante de cada varivel independente que aparece em sua forma original; e contm heterocedasticidade.
M-especificao do modelo Quando o valor esperado do resduo condicionado ao valor de ( ) diferente de zero
mdio de Y e sua violao implica na existncia de vis de especificao. O vis da especificao pode ser fruto da omisso de uma varivel importante, seja por excluso seja por subespecificao do modelo. Isso geralmente conduz a vis e inconsistncia em todos os estimadores MQO. A m-especificao do modelo tambm pode ser causada pela m-especificao da forma funcional da varivel independente ou varivel dependente, caso haja uma relao no linear entre e . Um exemplo de uso inapropriado de uma forma funcional da varivel dependente
salrioh ao invs de log(salrioh). Um modelo de regresso mltipla sofre de mespecificao da forma funcional quando no explica de maneira apropriada a relao entre as variveis explicativas e a varivel dependente observada. Apesar de trazer srias consequncias, o problema secundrio uma vez que temos os dados necessrios de todas as variveis necessrias para obter uma relao funcional que se ajuste bem aos dados. Diante de uma relao no linear entre e , pode-se fazer transformao funcional da e
varivel independente para corrigir o problema. A logaritmizao da varivel apropriada para modelos de elasticidade constante ( variao percentual de ). semilogartmico percentual em . Para em ( ( provoca uma variao percentual proporcional em em relao a (
). Qualquer
. Para o modelo
bastante comum a forma quadrtica. Para causa uma variao em condicionada ao valor de
). A medida que
quadrtico e outras formas polinomiais, no existe multicolinearidade, pois no se trata de efeitos separados. Por fim, efeitos multiplicativos causados por interaes entre as variveis independentes podem ocorrer, paribus, causa uma variao em . A variao de , mas que amplificada pelo valor de [ , ceteris (
) )
Para identificar problemas de m-especificao da forma funcional, o teste de erro de especificao da regresso (RESET) bem til. O teste RESET adiciona polinmios aos valores estimados MQO para detectar tipos gerais de m-especificao de formas funcionais. Na maior parte dos casos incluem-se os termos quadrticos e cbicos ( e so funes no lineares de ). A hiptese nula do teste que o
para
. Uma estatstica F
significativa sugere algum tipo de problema na forma funcional. Uma desvantagem do teste RESET que ela no fornece uma orientao prtica de como proceder se o modelo for rejeitado. Alm disso, mesmo se a forma funcional for apropriadamente especificada, o teste RESET no tem poder para detectar heterocedasticidade. Erro de Medida Quando se usa uma medida imprecisa de uma varivel econmica em um modelo de regresso, o modelo conter um erro de medida. O mtodo MQO ser consistente sob certas hipteses, mas existem outras sob as quais ele ser inconsistente. Em alguns casos, pode-se inferir o tamanho do vis assimpttico. O erro de medida (na populao) definido como a diferena entre o valor observado e o valor real: estimado como . O erro de medida pode ser . natural supor que o erro de medida ser viesado. Se a correlao e no so
tem mdia zero, caso contrrio o estimador do intercepto entre e correlacionados, ento var( varivel dependente sobrestima hiptese nula. O erro de medida em uma varivel explicativa ou zero. Presume-se que ( ) formula-se a hiptese que e que )
no correlacionado com e
no correlacionado com
Varivel Proxy A omisso de uma importante varivel no modelo pode conduzir a vis e inconsistncia nos estimadores MQO. Porm sua excluso muitas vezes ocorre por indisponibilidade de dados. Uma forma de remediar o uso de varivel proxy que uma varivel altamente correlacionada com a varivel no observada. A varivel Proxy tambm pode ser usada para substituir variveis com erro de medida. Uma varivel Proxy uma varivel que possui alta correlao com outro varivel. Mas mais importante, para que uma varivel seja uma boa Proxy, esta no deve ter relao causal com a varivel a ser substituda. um tanto contra intuitivo que uma varivel que tenha uma elevada correlao com outra, no existe relao causal entre elas. Um exemplo de varivel Proxy usado em modelos econmicos a varivel PIB per capita substituindo a varivel qualidade de vida. Como j definido, a varivel Proxy busca mimetizar certa varivel. Ela uma boa soluo no caso de variveis omitidas que sejam complicadas de obter sua mensurao. Um exemplo usar a Proxy QI no lugar da varivel aptido em um modelo de salrio. razovel supor que QI e aptido esto altamente correlacionadas, mas no h uma relao causal entre elas. Pelo fato de no ser possvel mensurar a aptido dos indivduos, a varivel um fator no observado. Assim sendo, a varivel Proxy QI deve ter correlao com o resduo. Heterocedasticidade O problema da heterocedasticidade ocorre quando a varincia do termo de erro no constante. Tal hiptese no provoca vis ou inconsistncia (consistncia: quando o tamanho da amostra tende ao infinito, o estimador tende ao seu valor real, MQO. Todavia os estimadores de varincias var( ) so viesados, pois ) nos estimadores ( ) ( ),
muitas vezes implicando em resultados no esperados. A varincia no sendo constante afeta a estatstica t. Quando a hiptese nula. Quando assim, a hiptese nula. Um estimador vlido de formas homocedsticas, de ( ) ( ) ( ) para qualquer forma de heterocedasticidade, inclusive para
( )
heterocedasticidade, onde
( )
uso da estatstica t habitual continua estatisticamente significante com o uso da estatstica t robusta em relao heterocedasticidade. Em amostras de tamanho grande cuja varincia seja desconhecida pode-se usar erros-padro robustos em relao heterocedasticidade. Apesar de vlido, o estimador MQO no mais ser o estimador linear no viesado mais eficiente. Para usar outras aes corretivas mais eficientes necessrio realizar testes que detectem heterocedasticidade e a sua forma. O teste Breusch-Pagan busca captar uma relao linear entre o resduo e as variveis (
( )( )
). Constri-se ento a estatstica . Se o p-valor for abaixo do nvel de significncia selecionado, ento
rejeita-se a hiptese nula de homocedasticidade. J o teste de White mais completo que o teste Breusch-Pagan, pois acrescenta iteraes e formas funcionais de xi para captar tanto linearidades quanto no linearidades entre o resduo e as variveis ( ). Pode-se reescrever a equao desta forma . O teste de White que no inclui iteraes ser
um teste de heterocedasticidade pura. Se tais termos estiverem presentes, trata-se de um teste tanto de heterocedasticidade quanto de vis de especificao. Havendo, por exemplo, uma relao linear entre resduos e a varivel ( conhecido) pode-
se usar o mtodo de Mnimos Quadrados Ponderados (MQP). O mtodo consiste em dividir a equao de previso ponderando todas as variveis por ( ) , ( )
( )
, obtendo assim
( )
( )
( )
( )
da heterocedasticidade, o mtodo MQP mais eficiente que MQO, pois novas estatsticas t e F so produzidas. A intuio do mtodo que o peso atribudo a cada observao inversamente proporcional a sua , ou seja, observaes vindas de uma populao com menor tero
maior obtero peso relativamente menor e aquelas de uma populao com peso proporcionalmente maior na minimizao da SQR.
Porm na maioria dos casos, a forma exata de heterocedasticidade, h(x), no bvia. Para isso, temos o mtodo de Mnimos Quadrados Generalizados Factveis (MQGF) que transforma o resduo em semilogartmico, . Sendo ( ) de previso ponderada igual a
( )
, temos a equao
( )
( )
( )
( )
(para uma grande amostra) mais eficiente que o MQO. Multicolinearidade O problema da multicolinearidade ocorre na regresso mltipla quando existe uma correlao entre as variveis independentes, causada geralmente por vis de omisso de varivel ou vis de erro de medida. O problema da multicolinearidade essencialmente amostral, tanto que os no so significativos. Uma baixa variabilidade de aumenta a disperso do , se ( )
sobrestimado temos uma estatstica t subestimada. importante ressaltar que formas funcionais de xi no violam a hiptese de multicolinearidade, apesar de que o coeficiente de correlao mostrar que e esto altamente correlacionados.
Se a multicolinearidade for perfeita, os estimadores de MQO sero indeterminados e seus erros-padro infinitos. Se a multicolinearidade for menos que perfeita, os estimadores possuiro grandes erros-padro, em relao aos prprios estimadores, o que significa que no podem ser estimados com grande preciso ou exatido. Os so os mais eficientes, pois a multicolinearidade reduz subestimado resulta em ( ), porm causando vis nos (
( ) ). ( )
Um
( )
aceitando a hiptese nula. Mesmo que a razo t seja estatisticamente insignificante, o R pode ser muito alto. A velocidade com a qual as varincias e covarincias aumentam pode ser observada pelo fator de inflao das variveis (FIV), definido como ( ). Quando , coeficiente de
correlao mltipla, tende a 1, o FIV tende ao infinito. Ou seja, quanto maior a colinearidade, maior a varincia de um estimador e, no limite, pode tornar-se infinita. Se no houver colinearidade entre Xi, o FIV ser 1. A varincia do estimador
( )
Outra forma de identificar a varivel independente que est correlacionada a outras variveis independentes do modelo fazer uma regresso para Xi contra as demais variveis X e calcular o R correspondente, . Cada uma dessas regresses (ex.:
( )(
)
)
Para corrigir o problema, Gujarati sugere algumas opes. Em caso de uma alta multicolinearidade, uma opo excluir uma das variveis colineares. Porm tal soluo pode incorrer a outro problema mais grave que o vis de especificao. Outra possvel soluo que pode atenuar o problema aumentar o tamanho da amostra ou at mesmo obter uma nova base de dados. Endogeneidade O problema da endogeneidade ocorre quando a varivel independente e o resduo so correlacionados, ( ) . Dizemos que endgena quando esta varivel observada
quantificada tem relao com uma varivel no observada. Assim como na multicolinearidade, problema da endogeneidade ocorre por erro de medida ou omisso de varivel. Variveis instrumentais so usadas para mitigar o problema. Uma boa varivel instrumental alta correlao com a varivel endgena e mnima correlao com o resduo, ( ) ( deve ter ) e
varivel dependente fazer ensino superior muito correlacionado com a presena de faculdade na cidade. importante observar que uma varivel Proxy no um instrumento, pois para que uma varivel seja uma boa varivel instrumental necessrio que haja um princpio de causalidade entre a varivel instrumental e a varivel a ser substituda. O mtodo para estimar os com a varivel instrumental denominada de Mnimos Quadrados Dois Estgios (MQ2E). No 1 estgio, usando o mtodo de MQO estima-se (forma reduzida), com varivel instrumental tem um alto no primeiro estgio. Como ( . Uma boa ) ( ), a
t. No 2 estgio, tambm se usa o MQO para estimar . No caso da estimao do modelo simples algebricamente. Temos que ( )
(
(
( ( )( )(
)
) . )
( (
) )
Para fazer inferncia sobre o estimador, ) . Pela frmula da varincia do estimador ), apesar de mais eficiente geralmente o
( )
, pressupe que ( ( ) (
observa-se que
descarta-se o uso da varivel instrumental. Neste caso o teste de Hausman busca testar se a varivel instrumental corrige o problema de endogeneidade. Para o teste estabelece-se a ( ) . O teste usa o MQ2E, sendo o 1 estgio: . Se estatisticamente significativo,
. O 2 estgio: rejeita-se
Mais de uma varivel instrumental pode ser usada no MQ2E, porm tal medida corretiva pode no contribuir efetivamente para a soluo do problema. necessrio testar se uma varivel instrumental suficiente. O teste de sobre-identificao consiste primeiramente em estimar . Depois estima-se teste Estimado , estima-se , onde o valor da estimao , sendo que . A estatstica do eqo
nmero de instrumentos adicionais. Compara-se o valor do multiplicador de Lagrange com o valor crtico da distribuio qui-quadrada Equaes Simultneas Em modelos uniequacionais, existe uma relao causal unidirecional entre variveis independentes e variveis dependentes. Porm existem situaes onde essa relao causal no unidirecional, ou seja, as variveis independentes afetam as variveis dependentes e as variveis dependentes tambm afetam as variveis independentes. Temos ento uma situao caracterizada por endogeneidade perfeita. Para lidar com este tipo de problema usamos modelos de equaes simultneas, nas quais h mais do que uma equao de regresso, uma para cada varivel interdependente. Se no h problema de simultaneidade, os estimadores MQO produzem estimadores consistentes e eficientes. Por outro lado, se h simultaneidade, os estimadores MQO no so sequer consistentes. Na presena da simultaneidade, o mtodo de MQ2E oferece estimadores consistentes e eficientes. Curiosamente, se usarmos variveis instrumentais quando no h de fato simultaneidade, estes nos oferecero estimadores consistentes, mas no eficientes. Porm antes de descartar o uso do mtodo MQ2E, caso as variveis dependentes no sejam simultneas necessrio testar se realmente o problema inexiste. Para esse propsito usamos o teste de Hausman. Para que haja simultaneidade essencial que o regressor endgeno seja correlacionado com o termo de erro. A hiptese nula do teste de que no h simultaneidade, ( ) . No 1 estgio estimamos e no 2 estgio .
. Se
e h
simultaneidade entre as variveis dependentes. Propriedades assintticas Assinttico significa que o tamanho da amostra tende ao infinito, ou seja, quando o tamanho da amostra tende sua populao. O n depende da varincia de x populacional. A partir deste conceito definimos consistncia dos estimadores MQO como o valor esperado de tendendo ao quando o tamanho da amostra tende populao, o que pode ser representado
graficamente na figura 5.1. Sob os pressupostos de Gauss-Markov, os estimadores MQO so consistentes. A inexistncia de vis dos estimadores, embora importante, no pode ser conseguida sempre. Por exemplo, o erro-padro da regresso no um estimador no viesado do desvio-padro do erro em um modelo de regresso mltipla.
O estimador da regresso simples pode ser interpretado como sendo o parmetro populacional acrescido do termo de erro:
( ( ) ) ( ( ) )
. Usando as ) ( ).
, ento
. Portanto, a
consistncia pode ser definida como a probabilidade limite do estimador ser igual ao parmetro populacional. Quanto maior ( ), mais distante est de . Quanto maior
o tamanho de n, menor o efeito da correlao entre fatores observados e fatores no observados sobre a estimao. A consistncia de um estimador uma importante propriedade, mas ela sozinha no nos permite trabalhar com inferncia estatstica. Para isso necessrio que os estimadores MQO sigam uma distribuio normal. A normalidade exata dos estimadores de MQO depende crucialmente da normalidade da distribuio do erro na populao. Se os erros forem extraes aleatrias de alguma distribuio diferente da normal, o no ser normalmente distribudo, o que significa que no ser possvel obter p-valores das distribuies e . importante observar que a no normalidade do termo de erro no implica de modo algum em vis nos estimadores MQO. O estimador tambm continua sendo o mais eficiente sob as hipteses de Gauss-Markov. Ainda que no sigam uma distribuio normal, podemos usar o
teorema do limite central para concluir que os estimadores de MQO satisfazem a normalidade assimpttica, o que significa que eles so, de maneira aproximada, normalmente distribudos em amostras de tamanhos suficientemente grandes.