Sei sulla pagina 1di 10

Elementos de teoria assinttica: aplicaes Econometria1

Suponha que uma sequncia finita de vetores aleatrios Para cada i P , ..., N}, existe . Uma que associa a cada ponto

independentes e identicamente distribudos em uma funo de distribuio definida em uma probabilidade

amostra aleatria de tamanho N , como se sabe, um caso particular de sequncia finita de vetores aleatrios. O experimento por trs de toda a teoria assinttica imaginar um processo de amostragem capaz de gerar uma sequncia em que o nmero de observaes tende ao infinito ou, em termos mais intuitivos, torna-se to grande quanto quisermos. Existem resultados bastante fortes para o caso, e nesse sentido que as aproximaes apresentadas nessa seo valem para as chamadas amostras grandes (no ser discutida no entanto a velocidade com que elas melhoram). Tais resultados devem ser utilizados portanto mediante a abstrao prvia de imaginar uma sequncia infinita indexados pelo tamanho N da amostra. O objetivo deste material introduzir os conceitos de convergncia mais utilizados pela econometria de dados de corte transversal e de painel, bem como os teoremas de maior utilidade para manejo destes conceitos. Como os cursos de Probabilidade e Estatstica acabam por dar maior nfase s propriedades das variveis aleatrias, foi feito esforo para que a apresentao incorporasse de modo to natural quanto possvel o caso mais geral de vetores e matrizes aleatrias, que aparecem com frequncia nos cursos de Econometria I e II. As provas dos teoremas so menos importantes do que os resultados propriamente ditos, e por isso podem ser omitidas em uma primeira leitura. Algumas delas, seja pela extenso ou pela dificuldade, no foram reproduzidas mas podem ser encontradas nos livros indicados como referncia. Optou-se por enunciar os teoremas para vetores em de vetores).
Material elaborado por Flvio Luiz Russo Riva para monitoria no curso de Econometria II ministrado pela Prof Cristine Xavier Pinto no segundo semestre de 2013 na Escola de Economia de So Paulo (EESP-FGV). Qualquer correo, crtica ou sugesto favor entrar em contato pelo e-mail flaviorussoriva@gmail.com.
1

de vetores aleatrios

, embora decorra imediatamente das definies a

validade para matrizes e, obviamente, para variveis aleatrias (casos particulares

1. Convergncia em probabilidade: definies e resultados relevantes Uma sequncia de variveis aleatrias converge em probabilidade a er m = =

para a varivel aleatria Z quando dado

0. Analogamente, diz-se que uma sequncia de vetores aleatrios p-dimensionais converge em probabilidade para o vetor aleatrio quando dado arbitrrio, m

= 0 para todo j = 1,..., p.

Note que o segundo caso apenas uma extenso do primeiro, com convergncia em probabilidade coordenada a coordenada. A mesma definio se aplica a uma sequncia de matrizes aleatrias, e diremos que a sequncia termo. A notao utilizada a mesma a mesma para os trs casos: ou plim Isso significa que, fixado um valor arbitrrio para s f c entemente grande para , basta tomar N converge em probabilidade para a matriz aleatria quando a convergncia ocorrer termo a

e a probab dade do evento o vetor a eatr o e so aproximadamente iguais com

dista de mais do que torne-se to pequena quanto queiramos para valores suficientemente grandes de N, os vetores probabilidade alta. importante observar que essa definio engloba os casos em que as sequncias de variveis, vetores ou matrizes aleatrias convergem em probabilidade para uma constante. Os teoremas abaixo so chamados respectivamente de Lei Fraca dos Grandes Nmeros (provado por Khintchin, e denotado a partir de agora por LGN) e Teorema do Mapeamento Contnuo (por vezes atribudo e chamado de Slutsky, denotado por TMC). Eles so utilizados com grande frequncia quando o objetivo avaliar o comportamento assinttico de variveis, vetores e matrizes aleatrias. LGN) Seja que valha Var uma sequncia de vetores aleatrios p-dimensionais para todo i ,e . Ento:

independentes, identicamente distribudos. Suponha que exista


2

A hiptese de varincia finita pode ser deixada de lado, mas a prova do teorema se torna um pouco mais complicada. Como trata-se de uma condio de regularidade sem significado econmico forte e normalmente suposta para o Teorema Central do Limite no se perde muito em assum-la.

prova: Devemos mostrar que, escolhendo uma coordenada arbitrria j p e fixado , ento ( , o que o mesmo que demonstrar a convergncia em probabilidade do vetor. Isso decorrncia direta da Desigualdade de Tchebychev (que afirma que se X varivel aleatria com esperana e varincia bem definida ento ar para todo ). Dado ento j p fixado e utilizando algumas propriedade do est mador md a podemos tomar o m te ando na expresso abaixo:

ar

Como ar e m

para todo j

p o lado esquerdo tende a zero quando N . Uma aplicao do teorema do

sanduche para sequncias de nmeros reais ento acaba de provar o teorema.

TMC) Seja g:

ma f no contn a em m ponto

,e

uma

sequncia de vetores aleatrios p-dimensionais tal que g ou, utilizando a notao alternativa, plimg g , g p m

, constante. Ento:

prova: Devemos mostrar que, escolhendo uma coordenada arbitrria j e fixado , ento g g A cont n dade em significa que tomando arbitrariamente , existe tal que sempre que ocorre necessariamente g g . Fixe e uma coordenada arbitrria j p . Segue que:

g
g g

g
g g

A primeira igualdade garantida pelos axiomas da funo de probabilidade, e a desigualdade na segunda linha decorre dos fatos: (i) o primeiro termo denota um evento impossvel (pela continuidade da funo); (ii) o segundo termo menos provvel do que o que aparece na linha seguinte, j que aquele menos restritivo do que o outro, e ento representa um limite superior. Levando em conta que ento tomando o m te da e presso nte ra ando resulta que g g . Como j arbitrrio g g .

2. Convergncia em distribuio: definies e resultados relevantes A partir de agora, as definies lanaro mo apenas do conceito primitivo de vetor aleatrio, mas o leitor deve se convencer da possibilidade de aplic-los a variveis e matrizes aleatrias conforme a necessidade. Uma sequncia de vetores aleatrios p-dimensionais = em quando converge em distribuio para o vetor aleatrio m para todo nc a . A ponto de notao

continuidade de . Nessa definio utilizada :

funo de distribuio do vetor aleatrio e

denota a mesma f no para cada vetor a eatr o da se

Repare na diferena em relao ao conceito de convergncia em probabilidade: aqui no so os vetores aleatrios propriamente ditos que tornam-se arbitrariamente prximos medida que N cresce, mas as suas funes de distribuio acumulada. A proposio abaixo caracteriza a relao entre os dois modos de convergncia estudados at aqui. Em particular, ela mostra em que sentido convergncia em probabilidade uma propriedade mais forte do que convergncia em distribuio.

PROP1) Sejam dimenses adequadas:

sequncias de vetores ou matrizes aleatrias de

(i) (ii) (iii)

Se Se Se

, ento e e

e vale a volta se , ento c constante ento c

c constante.

prova: ver [1]. O resultado mais importante envolvendo convergncia em distribuio chamado de Teorema Central do Limite para Vetores (TCLV daqui pra frente). Abaixo, enunciada sem prova uma verso geral o suficiente para uma sequncia de vetores aleatrios que representa bem uma amostra aleatria retirada de uma populao. Um bom exerccio para o leitor tentar enxergar nessa verso tambm o caso unidimensional utilizado nos cursos de Estatstica Bsica para caracterizar a distribuio limite do estimador mdia para amostras aleatrias.

TCLV)

Sejam

vetores

aleatrios

p-dimensionais, . Ento:

independentes,

identicamente distribudos. de modo que exista cada vetor tenha varincia finita Var

para todo i Suponha que

quando N prova: ver [1].

Aplicaes Econometria (1) Comportamento assinttico do estimador de Mnimos Quadrados Ordinrios com e sem a hiptese de homocedasticidade condicional (adaptado de [3]) Suponha que: (i) seja possvel extrair uma amostra aleatria de uma

populao qualquer (por exemplo, o conjunto das escolas pblicas do Estado de So Paulo) e que no perodo de amostragem o processo gerador dos dados tenha se mantido inalterado. Como antes da amostragem existe uma probabilidade associada a cada realizao, para cada i , ..., N} na populao um vetor aleatrio de dimenso k+2. Como a amostragem aleatria, os vetores so em conjunto independentes e identicamente distribudos. Como j foi referido, assume-se tambm que eles cumprem algumas condies de regularidade no primeiro e segundo momento (esperana e varincia bem definidas). (ii) seja possvel relacionar as variveis explicativas varivel dependente por meio de um modelo semi-paramtrico linear para a i-sima unidade populacional, como abaixo:

(iii) erro (iv) posto

, hiptese que implicada pela exogeneidade condicional do e cuja fora j foi discutida no curso de Econometria I. completo, de modo que exista inversa para a matriz na

populao, e que ela seja finita.

TEO) Sob as hipteses acima : a) b) consistente para , isto , ; ;

c)

se

Antes de comear a prova, talvez seja til enquadrar a abstrao implcita no uso da teoria assinttica para o caso em que os vetores aleatrios so estimadores, como frequente em Estatstica ou Econometria. Imagine uma amostra que comea com 1 indivduo e que pode crescer arbitrariamente conforme a vontade do pesquisador (para estilmular essa abstrao, o estimador sequncia infinita de estimadores vem indexado com o tamanho da amostra). O interesse recai ento no comportamento de uma potencialmente obtidos para cada tamanho amostral. A estratgia utilizada expressar essa sequncia em termos de vetores cujo comportamento assinttico descrito pelas hipteses do modelo e levar N ao infinito, na esperana de que a aproximao seja boa para amostras grandes prova: Como se sabe o estimador de mnimos quadrados ordinrios assume a seguinte forma funcional fechada:

(substuindo pelo modelo verdadeiro na populao de ii)

(a) Levar N ao infinito na expresso acima permite provar a consistncia com facilidade. Para o primeiro termo entre parnteses, utilizando a notao da LGN enunciada na seo 1 em que uma matriz aleatrio de dimenso k+2, logo ... uma sequncia de operadores aleatrios independentes, identicamente distribudos e por (iv) existe invertvel. A inverso de matrizes uma aplicao contnua no espao de matrizes (ver [2] para esse resultado), logo, pelo TMC e pela condio (iv) de invertibilidade:

Alm disso, a LGN aplicada sequncia de vetores aleatrios juntamente com (iii) que:

nos d

Os resultados em conjunto implicam pela PROP1, (ii) que o produto termo converge em probabilidade para 0 e portanto que o mesmo que dizer que consistente para . quando N , o que

(b) Uma manipulao algbrica imediata de como:

permite representar a expresso

Levando N ao infinito o primeiro termo do parnteses converge em probabilidade para pelos mesmos motivos apresentados em (a) acima. O segundo termo, da maneira como vem representado, permite aplicar o TCLV: ar Repare que nos valemos fortemente da hiptese de ortogonalidade . Alm disso, ar j que . Pela PROP1 o produto do limite em distribuio pelo limite em probabilidade converge em distribuio como abaixo:

onde quando N Pelas propriedades da esperana e da varincia vetoriais ocorre , onde omitimos a

que notao da matriz transposta porque ela simtrica.

(c) Exerccio Mostre que a hiptese consequncia de (iiv) juntamente com a hiptese de homocedasticidade condicional do erro ar . Prove o resultado e seguindo os passos da observao abaixo proponha um estimador consistente para a varincia assinttica encontrada.

Como o economista aplicado pode aproveitar um resultado como esse se, na rea dade s pode ser no me hor dos casos grande e f o? Teoremas como esse , particularmente importantes para o processo de inferncia servem de base para a construo de estimadores consistentes da varincia associada a estatstica porque captam a incerteza associada a toda e qualquer estimao. Suponha por exemplo que tenhamos em mos o teorema acima e estejamos interessados em propor um estimador desse tipo para a varincia (lembre-se que no existe inferncia nem concluso estatstica sem esse passo!). Se N grande e fixo ento razovel esperar que se comporte aproximadamente

como uma varivel aleatria normal tal como a caracterizada em (b) acima. Nesse caso, legtimo multiplicar ambos os lados por e somar de ambos os lados.

Obtm-se ento, o seguinte resultado, um pouco mais palpvel:

onde Avar(

-se tem comportamento ass ntt co e a var nc a dentro do . Qual a melhor maneira de estim-la? Na realidade, trata-se mais uma

parnteses recebe o nome de varincia assinttica do estimador, denotada por vez do uso (agora invertido) da LGN: se N grande o melhor estimador para a esperana a mdia amostral. Como no fizemos hiptese de homocedasticidade condicional ento:

Avar

onde

o resduo ao quadrado obtido por meio do estimador

que sabemos ser consistente sob boa especificao do modelo por (a).

Bibliografia [1] JAMES, B. Probabilidade: um curso em nvel intermedirio. Rio de Janeiro: IMPA, 2011, 3 ed. [2] LIMA, E. Anlise Real: Funes de n Variveis. Rio de Janeiro: IMPA, 2010, 5 ed. [3] WOOLDRIDGE, J. Econometric Analysis of Cross-Section and Panel Data. Massachusetts: The MIT Press, 2010.

Potrebbero piacerti anche