TD 1508

1508
TPICOS EM ECONOMETRIA ESPACIAL PARA DADOS CROSS-SECTION
Alexandre Xavier Ywata Carvalho Pedro Henrique Melo Albuquerque
1508
TEXTO PARA DISCUSSO
Braslia, agosto de 2010
TPICOS EM ECONOMETRIA ESPACIAL PARA DADOS CROSS-SECTION

Alexandre Xavier Ywata Carvalho* Pedro Henrique Melo Albuquerque**
* Tcnico de Planejamento e Pesquisa da Diretoria de Estudos e Polticas Regionais, Urbanas e Ambientais (Dirur) do Ipea. E-mail: alexandre.ywata@ipea.gov.br. ** Pesquisador do Programa de Pesquisa para o Desenvolvimento Nacional (PNPD) na Coordenao de Mtodos Quantitativos da Dirur do Ipea e professor do departamento de administrao da Universidade de Braslia (UnB).
Governo Federal
Secretaria de Assuntos Estratgicos da Presidncia da Repblica Ministro Samuel Pinheiro Guimares Neto
Texto para
Discusso
Publicao cujo objetivo divulgar resultados de estudos direta ou indiretamente desenvolvidos pelo Ipea, os quais, por sua relevncia, levam informaes para prossionais especializados e estabelecem um espao para sugestes.
Fundao pblica vinculada Secretaria de Assuntos Estratgicos da Presidncia da Repblica, o Ipea fornece suporte tcnico e institucional s aes governamentais possibilitando a formulao de inmeras polticas pblicas e programas de desenvolvimento brasileiro e disponibiliza, para a sociedade, pesquisas e estudos realizados por seus tcnicos.
Presidente Marcio Pochmann Diretor de Desenvolvimento Institucional Fernando Ferreira Diretor de Estudos e Relaes Econmicas e Polticas Internacionais Mrio Lisboa Theodoro Diretor de Estudos e Polticas do Estado, das Instituies e da Democracia Jos Celso Pereira Cardoso Jnior Diretor de Estudos e Polticas Macroeconmicas Joo Sics Diretora de Estudos e Polticas Regionais, Urbanas e Ambientais Liana Maria da Frota Carleial Diretor de Estudos e Polticas Setoriais, de Inovao, Regulao e Infraestrutura Mrcio Wohlers de Almeida Diretor de Estudos e Polticas Sociais Jorge Abraho de Castro Chefe de Gabinete Persio Marco Antonio Davison Assessor-chefe de Imprensa e Comunicao Daniel Castro URL: http://www.ipea.gov.br Ouvidoria: http://www.ipea.gov.br/ouvidoria
As opinies emitidas nesta publicao so de exclusiva e de inteira responsabilidade do(s) autor(es), no exprimindo, necessariamente, o ponto de vista do Instituto de Pesquisa Econmica Aplicada ou da Secretaria de Assuntos Estratgicos da Presidncia da Repblica.
permitida a reproduo deste texto e dos dados nele contidos, desde que citada a fonte. Reprodues para ns comerciais so proibidas.
ISSN 1415-4765 JEL: C21, R15
SUMRIO
SINOPSE
ABSTRACT
1 INTRODUO.......................................................................................................... 7
2 MODELOS PARAMTRICOS PARA DEPENDNCIA ESPACIAL.................................... 10
3 CRTICAS AOS MODELOS DE DEPENDNCIA ESPACIAL ..........................................19
4 TESTES PARA DEPENDNCIA ESPACIAL ..................................................................22
5 ESTIMAO VIA MNIMOS QUADRADOS DE DOIS ESTGIOS .................................30
6 MTODO DE MOMENTOS GENERALIZADO COM CORREO PARA DEPENDNCIA ESPACIAL.......................................................................................34
7 COMENTRIOS FINAIS...........................................................................................38
REFERNCIAS ........................................................................................................... 39
SINOPSE
Este texto apresenta uma discusso sobre diversos modelos economtricos para estimao de modelos paramtricos na presena de dependncia espacial, com dados cross-section. O foco inicial so modelos de dependncia espacial com lags espaciais da varivel resposta ou lags espaciais do resduo, com estimao dos parmetros feita via mxima verossimilhana. Uma anlise crtica destes modelos apresentada em seguida, alm de se discutirem testes para detectar presena de dependncia espacial. Finalmente, discutem-se mtodos de estimao mais robustos, os quais permitem a contabilizao de endogeneidade em algumas das variveis explicativas.
ABSTRACTi
This paper presents a discussion on several econometric models for estimating parametric models in the presence of spatial dependence with cross-section data. Initially, we cover models for spatial dependence with spatial lags of the response variable and spatial lags of the residues, and estimation is accomplished by maximum likelihood. A critical analysis for these models is also presented, followed by a discussion on tests for spatial dependence. Finally, we present a discussion no more robust estimation methods, allowing for endogeneity in some of the explanatory variables.
i. The versions in English of the abstracts of this series have not been edited by Ipeas editorial department. As verses em lngua inglesa das sinopses (abstracts) desta coleo no so objeto de reviso pelo Editorial do Ipea.
Texto para Discusso 1 5 0 8
Tpicos em Econometria Espacial para Dados Cross-Section
1 INTRODUO
Nas ltimas dcadas, um conjunto cada vez maior de ferramentas analticas para tratamento de dados espaciais tem surgido na literatura especializada. Estas ferramentas tm auxiliado pesquisadores em diferentes campos da cincia a lidar com a crescente disponibilidade de bases de dados georreferenciados. De fato, diferentemente de sries temporais macroeconmicas, por exemplo, uma base de dados totalmente nova e detalhada, com dados cross-section espaciais, pode surgir de um ano para o outro. Alm disso, o crescente desenvolvimento de dispositivos de coleta e armazenamento de dados geogrcos tem contribudo para a construo de inmeras bases de dados com componentes espaciais. Apesar de todo o avano ocorrido nas dcadas recentes, ainda h um grande terreno a ser explorado em termos de ferramentas para dados geogracamente localizados. Os avanos esperados para os prximos anos tm a ver tanto com a formalizao de resultados matemticos, quanto com avanos mais conceituais sobre a aplicao dos modelos que vm sendo utilizados at o presente momento. Uma discusso sobre tpicos de natureza mais conceitual pode ser encontrada, em Pinkse e Slade (2010), Holmes (2010), e McMillen (2010). Holmes (2010) apresenta uma discusso interessante sobre os trs tipos bsicos de abordagem para estudos empricos em anlise de dados espaciais. As trs abordagens discutidas so: i) abordagem estruturalista; ii) abordagem experimentalista; e iii) abordagem descritiva. Um entendimento destas trs abordagens importante, para que os pesquisadores possam identicar em quais das trs um determinado trabalho emprico se situa, de forma que as vantagens e as limitaes do trabalho quem mais claras. Na abordagem estruturalista, o exerccio emprico parte de um modelo econmico totalmente especicado, com base em uma teoria geralmente microfundamentada. O objetivo do exerccio estimar parmetros estruturais do modelo (deep model parameters), relativos a preferncias e/ou tecnologias. A partir do modelo estimado, possvel simular impactos de polticas, inclusive polticas que ainda no foram implementadas. Na literatura de organizao industrial mais recente,1 os modelos
1. Ver Berry, Levinsohn e Pakes (1995; 2004), Nevo (2001), Petrin (2002) e Ackerberg et al. (2007)
microfundamentados estimados permitem, por exemplo, avaliar a priori o impacto da fuso de duas empresas. Apesar de a abordagem estruturalista estar mais desenvolvida para pesquisas em organizao industrial, pesquisadores em economia poltica (EPPLE e SIEG, 1999) e economia do trabalho (KEANE e WOLPIN, 1997; ECKSTEIN e WOLPIN, 1999) j comearam a utiliz-la. A abordagem experimentalista surgiu inicialmente na literatura de economia do trabalho. Nesta abordagem, o interesse principal a identicao do efeito causal de uma determinada poltica (efeito tratamento). Ao invs de se preocupar com a especicao de um modelo terico, a ideia bsica encontrar experimentos naturais ou instrumentos vlidos para a identicao de causalidade de polticas que j foram implementadas. Para maiores detalhes, o leitor pode recorrer a manuais como Angrist e Pischke (2009) ou Cameron e Trivedi (2005). Nesse contexto, mtodos de estimao do tipo mnimos quadrados de dois estgios, ou de forma mais geral, mtodos de momentos generalizados, tm um papel muito importante. Outro procedimento comumente empregado a regresso de descontinuidade (HAHN, TODD e VAN DER KLAAUW, 2001). Ao contrrio das duas abordagens anteriores, a abordagem descritiva no tem por objetivo quanticar o efeito causal de determinadas polticas. Em geral, os artigos que utilizam a abordagem descritiva se iniciam com uma discusso da teoria econmica, que pode estar ou no embasada em modelos matematicamente fundamentados. A partir de regresses e outros indicadores estatsticos, os autores buscam encontrar evidncias nas relaes entre as variveis que possam corroborar uma determinada teoria (possivelmente, em detrimento de teorias alternativas). As regresses em geral correspondem a formas reduzidas de equaes estruturais mais completas. Uma das limitaes desta abordagem que, alm de no permitir inferncias causais, ela tambm est sujeita crtica de Lucas. Dessa forma, alteraes no regime econmico podem incorrer em alteraes nos parmetros do modelo, tornando a utilizao dos modelos reduzidos menos crveis do ponto de vista de simulaes a priori de impactos de polticas.2 A maioria dos estudos em economia regional e urbana segue a abordagem descritiva. Nos ltimos anos, tm surgido estudos que utilizam a abordagem experimentalista
2. Ver Hendry (1995).
para avaliao de polticas. Por sua vez, a utilizao da abordagem estruturalista pode trazer vrios benefcios para a economia regional, dada a diculdade de se encontrar bons instrumentos ou bons experimentos naturais. Uma das diculdades na utilizao da abordagem experimentalista em economia regional a disponibilidade de dados (comparando-se ao nmero de observaes de estudos em economia do trabalho, por exemplo). Uma sugesto para o uso da abordagem experimentalista em economia regional e urbana a utilizao de dados em nvel de rmas, por exemplo, ao invs de dados em nvel de municpios. A utilizao da abordagem estruturalista para economia regional ou urbana deve se iniciar com a construo de um modelo terico (o que pode no ser to fcil como no caso de modelos de organizao industrial). Por seu turno, a utilizao de abordagens estruturalistas em economia regional poderia ser interessante para simulaes de polticas pblicas. No entanto, pouco tem sido feito neste sentido at agora. Neste trabalho, apresenta-se uma discusso sobre alguns dos modelos economtricos comumente utilizados para modelagem de dados espaciais. De maneira geral, os modelos apresentados estariam mais adequados para estudos empricos seguindo as abordagens experimentalista e descritiva. De fato, os estimador de mnimos quadrados de dois estgios, de Kelejian e Prucha, e o estimador de mtodo de momentos generalizado, de Conley, permitem a estimao de parmetros na presena de variveis endgenas do lado direito da equao, contabilizando e/ou corrigindo para a presena de autocorrelao espacial nos resduos do modelo. Mesmo no tratando diretamente a abordagem estruturalista, as ideias apresentadas neste texto fornecero ao leitor uma noo dos procedimentos para estimao com dados com presena de dependncia espacial, o que poder ser til para a estimao de parmetros estruturais em modelos microfundamentados. Dado o grande avano pelo qual a literatura em mtodos estatsticos para dados espaciais tem passado nos ltimos anos, no h interesse aqui em ser exaustivo em termos de metodologias discutidas. Pelo contrrio, optou-se por apresentar apenas alguns dos mtodos mais comumente utilizados, de forma a transmitir ao leitor uma ideia bsica, mas elucidativa, sobre os fundamentos da estimao de modelos economtricos com dependncia espacial. Nesse sentido, no sero tratados, por exemplo, dados de painel (vejam-se, entre outros, Elhorst, 2003; Druska e Horrace, 2004; Egger et al., 2005), mas apenas dados cross-section. Alm disso, a abordagem ser predominantemente frequentista. Apesar da simpatia em relao aos mtodos bayesianos principalmente no
contexto de dados espaciais , para no se estenderem demasiado os autores preferiram ater-se aos procedimentos frequentistas. O leitor poder encontrar boas exposies em Banerjee, Carlin e Gelfand (2004) e Schabenberger e Gotway (2009). Alm desta introduo, este texto contm mais seis sees. Na seo 2, apresentase uma discusso sobre os modelos economtricos espaciais para dados cross-section provavelmente mais utilizados na literatura. Na seo 3, discutem-se algumas das crticas mais comuns aos modelos espaciais apresentados na seo 2. Na seo 4, so apresentados alguns dos testes mais utilizados para vericao da presena ou no de dependncia espacial. As sees 5 e 6 discutem procedimentos de estimao para contabilizar para a presena de variveis endgenas no lado direito da equao: a seo 5 apresenta o estimador espacial de mnimos quadrados de dois estgios, e a seo 6 apresenta o estimador de mtodo de momentos generalizados, com correo para a presena de autocorrelao espacial. Comentrios nais encontram-se na seo 7.
2 MODELOS PARAMTRICOS PARA DEPENDNCIA ESPACIAL

Nesta seo, ser feita uma discusso de alguns dos modelos paramtricos comumente utilizados em econometria espacial. A discusso se limitar a regresses com dados cross-section.3 Para modelos envolvendo dados de painel espacial, o leitor pode recorrer a Elhorst (2003), Druska e Horrace (2004), Egger, Pfaffermayr e Winner (2005). 2.1 MODELOS SAR Um dos modelos mais comumente utilizados para modelagem de correlao espacial o modelo autorregressivo espacial (spatial autorregressive model), ou simplesmente modelo SAR. A ideia dos modelos SAR utilizar a mesma ideia dos modelos AR (autorregressivos) em sries temporais, por meio da incorporao de um termo de lag entre os regressores da equao. Na sua forma mais simples, o modelo SAR tem expresso:
3. Ver Anselin (1988), Anselin e Florax (2000), Anselin, Florax e Rey (2004), Lesage e Pace (2009), Lesage (1997 e 1999), e Pace e Barry (1997 e 1998).
10
(1) onde um vetor coluna, contendo n observaes na amostra para a varivel resposta , o coeciente escalar corresponde ao parmetro autorregressivo, o termo corresponde a um vetor coluna contendo os resduos da equao. Por enquanto, considera-se que os resduos so independentes e identicamente distribudos, com distribuio normal, mdia zero e varincia homognea . Um dos componentes presentes em uma grande quantidade de modelos espaciais a matriz . Esta matriz conhecida como matriz de vizinhana, e pode ser denida de diversas formas, o que traz crticas aos modelos espaciais utilizando (muitos autores consideram as denies para deveras arbitrrias; a este respeito, ver Pinkse e Slade, 2010). se Uma das formas mais comumente empregadas de denio da matriz d por meio da identicao de vizinhos de primeira ordem. Considere-se que cada observao no vetor esteja associada a um polgono e um sistema georreferenciado. Por exemplo, o vetor pode corresponder a observaes de uma determinada varivel observada para cada municpio brasileiro, ou corresponder a observaes de uma varivel para cada setor censitrio na cidade de So Paulo. Neste caso, o elemento da matriz assume valor , caso os polgonos i e j sejam vizinhos, e , caso i e j no sejam vizinhos. A diagonal principal de possui todos os elementos iguais a zero, por denio. Para identicar polgonos (municpios, setores censitrios etc.) vizinhos, podese considerar uma vizinhana do tipo queen, quando os dois polgonos possuem pelo menos um vrtice em comum, ou pode-se considerar uma vizinhana do tipo rook, quando os polgonos possuem pelos menos um lado inteiro em comum. Note-se que a vizinhana do tipo queen menos restritiva que a vizinhana do tipo rook. Alm da vizinhana de primeira ordem, podem-se utilizar vizinhanas de ordem maior. Na denio de vizinhana de segunda ordem, por exemplo, os polgonos i e j so vizinhos caso exista um outro polgono k, para o qual i e k sejam vizinhos de primeira ordem, e j e k tambm sejam vizinhos de primeira ordem. 4
4. Ver Lesage e Pace (2009).
11
A matriz , com elementos 0 ou 1, conhecida como matriz de vizinhana no normalizada, em contraposio matriz normalizada. A matriz normalizada construda a partir da matriz original (no normalizada), dividindo-se todos os elementos de cada linha de pela soma da linha. Portanto, a matriz possui todas as linhas com soma igual a 1. Por sua vez, a matriz original simtrica, o que no vale para a matriz . O vetor conhecido como lag espacial. No caso de se utilizar a matriz de contiguidade normalizada, o vetor corresponde a um vetor de mdias simples das observaes para a varivel dos vizinhos. A partir de agora, a matriz de contiguidade ser referida simplesmente como , independentemente de ser uma matriz normalizada ou no normalizada. O modelo paramtrico em (1) contm, como parmetros desconhecidos, o . A estimao do parmetro permite, por exemplo, coeciente e a varincia inferir o grau de correlao espacial entre as observaes . Alm disso, testando-se a signicncia do parmetro , tem-se um procedimento para inferir a presena ou no de dependncia espacial entre as observaes. A seguir, se discutir o processo de inferncia dos parmetros do modelo em (1). Uma das primeiras sugestes para a estimao do coeciente a utilizao do estimador de mnimos quadrados ordinrios. No entanto, quando o vetor de covariveis (variveis do lado direito da equao) correlacionado com o resduo da regresso, sabe-se que o estimador de mnimos quadrados ordinrios inconsistente. Esta correlao entre os resduos e o regressor observada no modelo em (1).5 Portanto, estimao via mnimos quadrados ordinrios resultaria em uma estimativa inconsistente para o coeciente Como alternativa, o analista pode utilizar estimao via mxima verossimilhana, que no sofre do problema de inconsistncia do estimador de mnimos quadrados ordinrios, devido endogeneidade do regressor . Em linhas gerais, a estimao e parte da distribuio normal via mxima verossimilhana dos parmetros multivariada para o vetor de resduos A partir de (1), pode-se escrever
5. Ver Anselin (1988) e Lesage e Pace (2009).
12
(2)
onde servado uma matriz identidade com dimenso n. Dado que possui distribui-
o normal multivariada, com mdia nula e covarincia
, ento o vetor ob-
possui distribuio normal multivariada com mdia nula e covarincia . A partir desta matriz de covarincia, pode-se escre. Maximizando-se ,
ver a funo de log-verossimilhana
obtm-se os estimadores de mxima verossimilhana dos parmetros do modelo.
Uma das diculdades na estimao de modelos SAR (mesmo no caso mais simples, no qual no h covariveis exgenas) a necessidade de se realizarem operaes com matrizes de grandes dimenses. No processo iterativo para obteno , preciso calcular o logaritmo do determinante da do mximo da funo matriz , que possui dimenso n. Se o analista estiver fazendo uma aplicao com observaes de setores censitrios da cidade de So Paulo, por exemplo, o valor de n est em torno de 18 mil; portanto, a matriz possui dimenso 18 mil por 18 mil. Felizmente, pela prpria denio da matriz de contiguidade , pode-se trat-la como matriz esparsa; ou seja, a grande maioria dos elementos de so nulos. Para matrizes esparsas, existe uma literatura bem desenvolvida sobre algoritmos que tornam o processo computacional mais eciente.6 Portanto, apesar de a codicao do estimador de mxima verossimilhana no ser trivial ( preciso programar algumas rotinas para matrizes esparsas), o esforo computacional pode ser bastante reduzido. Uma vez dentro do arcabouo de estimao via mxima verossimilhana, pode-se recorrer a vrios dos resultados para este tipo de estimador. Pode-se, ento, testar a signicncia do parmetro , utilizando-se o teste de Wald, o teste da razo de verossimilhana ou o teste dos multiplicadores de Lagrange. Testando-se a signicncia do parmetro , se est implicitamente testando a presena de dependncia espacial das observaes para a varivel .
6. Ver Davis (2006).
13
O modelo SAR em (1) pode ser estendido, para incorporar variveis exgenas no lado direito da equao, obtendo-se (3) uma matriz contendo as observaes das variveis exgenas. onde a matriz A dimenso de , sendo o nmero de regressores. Cada linha da matriz corresponde a uma observao na base de dados (um polgono, em um sistema georreferenciado). No caso de a regresso incluir um intercepto, a primeira coluna da matriz possui apenas valores 1. O vetor um vetor coluna de coecientes para as variveis exgenas, e possui dimenso . O modelo em (3) conhecido como modelo SAR misto. Da mesma forma que no SAR simples (equao (1)), a estimao dos parmetros no modelo SAR misto via mnimos quadrados ordinrios tambm produz estimativas correlacionado com o inconsistentes, uma vez que o vetor de lags espaciais vetor de resduos . Novamente, pode-se utilizar mxima verossimilhana, a partir da hiptese de que o vetor de resduos possui distribuio normal multivariada com mdia nula e covarincia . Pode-se ento escrever (4) e o vetor de variveis observadas possui distribuio (condicional a multivariada, com mdia condicional , e matriz de varincia condicional . (6) ) normal
(5)
A partir da distribuio de , obtm-se a funo de log-verossimilhana condicional . Maximizando-se a funo de log-verossimilhana em relao aos parmetros do modelo, encontram-se as estimativas para os coecientes e para a varincia dos resduos. Para uma discusso sobre o processo iterativo para estimao dos parmetros do modelo SAR misto, podem-se consultar Anselin (1988) e Lesage e Pace (2009).
14
2.2 MODELOS SEM Da mesma forma que os modelos SAR partem da especicao de modelos AR para sries temporais, uma outra classe de modelos espaciais parte da especicao de modelos MA (mdias mveis) para observaes no tempo. Estes modelos espaciais so denominados modelos de erros espaciais (spatial error models), ou simplesmente SEM. Os modelos SEM possuem a seguinte especicao: (7) No caso, os resduos da equao observada possuem uma estrutura autorregressiva, da forma (8) O vetor de resduos possui distribuio normal multivariada, com mdia nula e matriz de covarincia . O coeciente escalar indica a intensidade da autocorrelao espacial entre os resduos da equao observada. Note-se que, ao contrrio dos modelos SAR, os modelos SEM no apresentam a varivel resposta como uma funo direta dos seus lags espaciais. A autocorrelao espacial nos modelos SEM aparece nos termos de erro. Outra diferena dos modelos SEM em relao aos modelos SAR que os coecientes no vetor podem ser estimados consistentemente via mnimos quadrados ordinrios. De fato, a regresso em (7) pode ser vista como uma regresso linear com resduos correlacionados. O estimador de mnimos quadrados ordinrios produz estimativas consistentes, mas a matriz de covarincia das estimativas no ser mais . 7 Devido aos erros correlacionados, a matriz de covarincia de dada por (9)
7. Ao longo deste texto, a expresso da forma denotar o transposto do elemento em vetor coluna, um vetor linha, ou mesmo um escalar.
, onde
uma matriz, um
15
onde . Note-se que a matriz depende do coeciente e da varincia . A estimativa destes dois parmetros pode ser obtida consistentemente a partir da estimao de um modelo SAR via mxima verossimilhana, conforme discutido no item anterior, para os resduos . Uma vez estimados os escalares e , pode-se obter uma estimativa para a matriz de covarincia de (10) onde .
Sabe-se que, no caso de modelos lineares com regressores exgenos (que o caso nos modelos SEM), com resduos correlacionados, o estimador de mnimos quadrados ordinrios consistente, mas no eciente, havendo outros estimadores lineares que produzem varincias menores.8 Especicamente para o modelo SEM, o estimador linear com varincia mnima o estimador de mnimos quadrados generalizados (generalized least squares GLS), dado por (11) Na prtica, no se conhece a matriz , uma vez que esta depende dos parmetros desconhecidos e . Utiliza-se ento o estimador de mnimos quadrados generalizados executvel (feasible generalized least squares FGLS), com expresso (12) onde , com e estimativas via mxima . Portanto, verossimilhana do modelo SAR simples, a partir dos resduos uma alternativa para a estimao dos parmetros do modelo SEM dada pelos passos:
8. Quando os autores se referem a varincias menores, na verdade referem-se ao fato de que a diferena uma matriz positiva denida, onde um estimador linear mais eciente do que o estimador de mnimos quadrados ordinrios.
16
i) Obter a estimativa de mnimos quadrados ordinrios ii) Calcular os resduos iii) Estimar os parmetros e em , . iv) Calcular a estimativa v) Obter a estimativa vi) Obter a estimativa para a covarincia , . .
, via mxima verossimilhana, para o modelo SAR .
Inferncia para os coecientes em
pode ser efetuada a partir da matriz no precisa parar no passo , pode-se obter um novo
. Note-se que a estimativa nal para o vetor (v) acima. De fato, uma vez obtida uma estimativa vetor e . Para este novo vetor
, estimam-se novamente os parmetros atinjam a convergncia. Finalizam-se
, repetindo-se em seguida os passos (iv) e (v). Este processo pode ser efetuado
repetidamente at que os valores no vetor ento as estimaes com o passo (vi).
Alm das estimativas via mnimos quadrados ordinrios (com correo da matriz de covarincia das estimativas dos coecientes) e das estimativas via mnimos quadrados generalizados efetuvels (FGLS), a literatura apresenta uma discusso sobre estimao dos parmetros do modelo SEM via mxima verossimilhana. Combinando as expresses (7) e (8), obtm-se (13) onde possui distribuio normal multivariada com mdia nula e covarincia . Portanto, o vetor de varivel resposta possui distribuio normal multivariada com mdia condicional , e matriz de varincia condicional . (15) (14)
17
A partir da distribuio de , obtm-se a funo de log-verossimilhana condicional . Maximizando-se a funo de log-verossimilhana em relao aos parmetros do modelo, encontram-se as estimativas para os coecientes e para a varincia dos resduos. Para uma discusso sobre o processo iterativo para estimao dos parmetros do modelo SEM, consultem-se Anselin (1988) e Lesage e Pace (2009). Similarmente s estimaes no caso de modelos SAR, a estimao de modelos SEM tambm envolve operaes com matrizes esparsas. Novamente, utilizando-se rotinas mais ecientes para matrizes esparsas, o esforo computacional pode ser bem menor. 2.3 MODELOS SARMA Finalmente, os modelos SEM e SAR podem ser combinados em uma especicao mais geral, seguindo a ideia nos modelos ARMA (autorregressive and moving average) para sries temporais. Os modelos SARMA (spatial autorregressive and moving average) tm uma especicao da forma (16) na qual os resduos da equao observada possuem uma estrutura autorregressiva, da forma (17) As matrizes e so matrizes de contiguidade no necessariamente iguais. De fato, quando = , o modelo no identicado, e as estimativas para os coecientes e podem resultar bastante instveis, 9 a menos que a matriz de delineamento contenha pelo menos uma varivel exgena alm do intercepto. Uma das crticas em relao utilizao dos modelos SARMA justamente o fato de eles exigirem, em alguns casos, a especicao de duas matrizes de contiguidade diferentes. Em geral, a escolha de uma matriz de contiguidade arbitrria; a escolha de duas matrizes diferentes implica um grau de arbitrariedade ainda mais criticvel.
9. Ver Anselin (1988) e Lesage e Pace (2009).
18
Estimao dos parmetros do modelo SARMA pode ser feita via mxima verossimilhana. A partir das expresses (16) e (17), pode-se escrever
. Assumindo-se que possui distribuio normal multivariada, com mdia zero e covarincia , conclui-se que o vetor de observaes para a varivel resposta possui distribuio normal multivariada com mdia condicional , e matriz de varincia condicional . (19) (18)
Utilizando-se a frmula para a distribuio normal multivariada, pode-se chegar funo de log-verossimilhana , como funo dos parmetros desconhecidos do modelo. Similarmente aos modelos SAR e SEM, as estimativas de mxima verossimilhana no possuem frmula fechada, necessitando de um processo iterativo para maximizao da funo . Uma discusso sobre os passos no processo iterativo para estimao dos parmetros no modelo SARMA pode ser encontrada em Anselin (1988) e Lesage e Pace (2009).
3 CRTICAS AOS MODELOS DE DEPENDNCIA ESPACIAL

Apesar do seu uso bastante disseminado, os modelos paramtricos para tratamento de dependncia espacial (exemplos: SAR, SEM e SARMA) vm recebendo vrias crticas na literatura. Estas crticas no necessariamente retiram destes modelos quaisquer utilidades em pesquisas empricas. No entanto, alguns dos pontos levantados pelos crticos so importantes para: i) antecipar aos usurios alguns cuidados e limitaes acerca dos quais eles devem estar cientes; ii) fornecer um certo balizamento para pesquisas futuras para os modelos espaciais, de maneira a corrigir ou amenizar algumas das limitaes. Nesta seo, ser feita uma discusso sobre algumas das crticas aos
19
modelos apresentados na seo 3 (e seus equivalentes para dados de painel). Estas crticas se aplicam mais fortemente ao problema de especicao paramtrica (ou no) para capturar corretamente a dependncia espacial. No caso de testes de hiptese para presena ou no de dependncia espacial, os testes atualmente disponveis (conforme seo 4) se comportam de forma bastante satisfatria. Maiores detalhes podem ser encontrados, em Pinkse e Slade (2010). De maneira geral, o embasamento terico para a modelagem em econometria espacial ainda se encontra em um estgio inicial. Dessa forma, uma das diculdades encontrar um modelo que se adeque a todos os tipos de situao. Nesse sentido, alguns autores defendem que os pesquisadores se concentrem no desenvolvimento de teorias especcas para classes particulares de aplicaes, ao invs de seguirem na busca de extenses para tcnicas j existentes. Entre as limitaes para os modelos de SAR e outros modelos da forma ARMA espaciais (incluindo extenses para dados de painel), podem-se citar os itens a seguir.
i) Hiptese improvvel e desnecessria de normalidade dos resduos. ii) O fato de depender dos seus prprios lags espaciais pode implicar que tambm dependa dos lags espaciais do vetor de covariveis , incorrendo no problema de reexo (reexion problem), apontado por Manski (1993). A consequncia prtica que a incluso de lags espaciais de pode ocasionar uma matriz de design com altssimo grau de multicolinearidade. iii) Os modelos SAR e demais modelos ARMA assumem relaes lineares entre os regressores e a varivel resposta . Este fato nem sempre verdade na prtica, e pode haver a necessidade de especicaes no lineares da relao entre o vetor de regresses e a varivel . iv) Os modelos SAR e correlatos no levam em considerao a presena de dependncia entre o vetor de regressores e o resduo , causada pela presena de regressores endgenos em e/ou pela presena de heteroscedasticidade. v) H fortes crticas representao excessivamente simplista de toda a dependncia espacial em um nico coeciente . vi) A matriz de contiguidade implica um alto grau de arbitrariedade na sua especicao, principalmente levando-se em considerao a irregularidade dos mapas de municpios e de setores censitrios.
20
De maneira geral, os modelos SAR e correlatos foram inicialmente propostos como possveis extenses dos modelos para dependncia em sries temporais. No entanto, h uma srie de crticas analogia dos procedimentos para dependncia espacial com os procedimentos para dependncia temporal. Algumas destas crticas esto listadas a seguir.
a) A hiptese de estacionariedade, diferentemente de diversas aplicaes em sries temporais, no vlida para o caso espacial. b) Os dados no so igualmente espaados. c) A presena de observaes ausentes (missing values) pode incorrer na presena de endogeneidade, ocasionando vieses nos estimadores de mxima verossimilhana. d) Observaes espaciais, em muitos casos, so agregaes de observaes (por polgono, por exemplo) do comportamento de vrios agentes. Portanto, modelos baseados no comportamento de agentes individuais podem no ser mais vlidos. e) Nos modelos para sries temporais, os procedimentos so teoricamente validados a partir de proposies sobre o comportamento assinttico dos estimadores, (intervalo total da srie histrica) assume quando o nmero de observaes valores cada vez maiores ( . Para modelos para dados espaciais, no claro se a expanso assinttica ocorre com o aumento da densidade de observaes dentro do mapa (inll asymptotics), ocorre com o aumento das fronteiras (increasing domain asymptotics), ou ocorre com as suas expanses simultaneamente. f ) O item anterior particularmente importante, porque no h garantia de que as relaes de dependncia espacial se alteram quando mais observaes so adicionadas aos dados. Por exemplo, no caso de inll asymptotics, a adio de novas observaes pode ocasionar um aumento da dependncia espacial, uma vez que as observaes estaro cada vez mais prximas em mdia. g) Diferentemente dos modelos para sries temporais, a estimao dos modelos com dados espaciais pode sofrer do grave problema de endogeneidade das decises locacionais das unidades observadas na amostra. Uma consequncia da endogeneidade das localizaes que as distncias entres os agentes, bem como as estruturas de vizinhana, tambm so endgenas. Este problema tem se mostrado de difcil soluo at o momento, e vem sendo desprezado na maioria das aplicaes.
Diversos artigos recentes tm focalizado alguns dos problemas discutidos anteriormente. Para adicionar maior exibilidade modelagem da vizinhana, por exemplo, algumas extenses do modelo SAR tradicional consistem em substituir a matriz de contiguidade por uma expanso de funes base, da forma
21
(20) Na prtica, necessrio truncar o nmero de elementos no somatrio da expresso . Como tpico em estimaes com expanses de funes (20), at um nmero base, faz-se aumentar para o innito, quando o tamanho da amostra aumenta. Neste caso, a expresso torna-se
(21) e o problema de rigidez em relao forma funcional da dependncia espacial pode ser amenizado (para maiores detalhes, ver Pinkse, Slade e Bret, 2002; Pinkse e Slade, 2004; e Pofahl, 2007). Boa parte dos problemas de endogeneidade pode ser tratada com a utilizao de variveis instrumentais apropriadas, conforme discutido nas sees 5 e 6. Para o problema de observaes ausentes (missing data), no qual o processo gerador das observaes ausentes exgeno, podem-se utilizar procedimentos de mnimos quadrados de dois estgios (LEE, 2007). Para situaes nas quais a gerao das observaes ausentes endgena, no h soluo conhecida na literatura. De maneira geral, ainda existe um grande caminho a ser trilhado em termos de procedimentos e tratamentos tericos, para lidar com os problemas nos modelos para dados espaciais.
4 TESTES PARA DEPENDNCIA ESPACIAL

Na seo anterior, foram discutidos alguns modelos mais comumente utilizados para contabilizar para a presena de dependncia espacial nos resduos (ou na prpria varivel resposta) do modelo de regresso. Nesta seo, ser apresentada uma discusso sobre testes para dependncia espacial. De maneira geral, os modelos paramtricos apresentados na seo 2 tm sofrido diversas crticas, conforme ser visto na seo 4. Por seu turno, os testes para a presena de dependncia espacial no sofrem o mesmo ataque, e so relativamente bem aceitos na literatura.
22
4.1 ESTATSTICA DE MORAN Uma das estatsticas para testes de dependncia espacial mais disseminadas a estatstica I de Moran. Esta estatstica pode ser aplicada varivel diretamente, ou aos resduos da regresso de versus um conjunto de variveis explicativas. Considere-se ento um modelo de regresso linear, da forma (22) onde um vetor coluna ( de variveis resposta, uma matriz com cada linha contendo as observaes para as variveis explicativas, um vetor de coecientes e um vetor coluna contendo os resduos da regresso. A partir da estimativa de mnimos quadrados ordinrios para o vetor de coecientes, obtm-se a seguinte expresso para os resduos . (23)
A estatstica I de Moran para a autocorrelao espacial pode ser aplicada nos resduos do modelo de regresso de maneira direta. Formalmente, a estatstica I dada por
(24) onde o vetor de resduos da regresso por mnimos quadrados ordinrios, a matriz de contiguidade espacial, o nmero de observaes da amostra e s um fator de padronizao igual soma de todos os elementos da matriz . A partir da estatstica I, pode-se construir um teste para a hiptese nula de presena de independncia espacial. Por sua vez, a especicao da hiptese alternativa no to simples. A distribuio assinttica para a estatstica I foi derivada por Cliff e Ord (1972). Dessa forma, considere-se , (25)
23
onde e so respectivamente a mdia e a varincia assinttica da estatstica I de Moran. Sob a hiptese nula, a distribuio da estatstica pode ser estimada via simulaes de Monte Carlo. Quando a estatstica construda a partir dos resduos , a rejeio da hiptese nula implica em evidncias de que h autocorrelao espacial no modelo de regresso. A partir da, o analista pode recorrer a um dos modelos paramtricos discutidos na seo 2, na seo 4 ou na seo 5. 4.2 TESTE DE KELEJIAN-ROBINSON Kelejian e Robinson (1992) propuseram um teste com o mesmo objetivo do teste I de Moran. No entanto, diferentemente do teste I de Moran, o teste de Kelejian-Robinson no pressupe normalidade da varivel sendo testada (a varivel observada ou os resduos da regresso). Portanto, o teste de Kelejian-Robinson mais robusto no normalidade dos resduos ou da varivel observada, sendo mais apropriado quando a hiptese similaridade ao padro gaussiano seja questionvel. O teste de Kelejian-Robinson tem como pressuposto inicial , (26)
onde um vetor de covariveis, tipicamente tomadas como funes das variveis explicativas originais para e , com e sendo localidades contguas em um espao geral de observaes ordenadas. Por exemplo, pode ser construdo a partir de produtos cruzados dos elementos de e . O vetor no necessariamente possui a mesma dimenso de (ou ). O elemento um vetor de parmetros, indicando o quanto os componentes de podem explicar a covarincia entre os resduos. Intuitivamente, a ausncia de autocorrelao espacial poder no produzir relaes signicativas entre e , resultando em estimativas no signicantes para os coecientes no vetor . A hiptese nula ento construda como de tamanho , seja um vetor de dimenses em (24). Dada uma amostra , contendo as covarincias s
24
no nulas 10 (por construo) para todo . O teste implementado regredindose os produtos cruzados dos resduos versus os vetores , para todo , com e polgonos vizinhos. Seja ento a matriz , com dimenso , construda a partir do empilhamento dos vetores linha , e seja um vetor coluna, com dimenso , construdo a partir do empilhamento dos valores de . Uma estimativa para pode ser obtida via mnimos quadrados ordinrios, resultando em . A partir da estimativa , pode-se construir a estatstica teste de KelejianRobinson, dada pela expresso
, onde de
(27)
um estimador consistente de , e a varincia para o resduo da regresso versus . Uma estimativa para pode ser dada, por exemplo, por
. Sob a hiptese nula, tem-se que converge em probabilidade para mostrar ento que uma forma alternativa para a estatstica teste dada por . Pode-se
(28)
Sob a hiptese nula de ausncia de dependncia espacial, a estatstica KR possui distribuio assinttica qui-quadrada, com graus de liberdade.
10. Nesse caso, as covarincias no nulas so aquelas para as quais os polgonos denio de vizinhana utilizada para a anlise.
e so vizinhos, de acordo com a
25
4.3 TESTES ASSINTTICOS A PARTIR DE ESPECIFICAES PARAMTRICAS Nas sees 3.1 e 3.2, foram discutidos dois procedimentos de testes estatsticos para presena de dependncia espacial, os quais no dependem de uma especicao paramtrica para a forma de autocorrelao no espao. Nesta seo, sero revisitados os modelos discutidos na seo 2, para se construrem outros procedimentos de testes, a partir de especicaes paramtricas. De forma geral, os procedimentos discutidos so obtidos a partir de trs metodologias tradicionais, empregadas para testes de hipteses em geral. Estas metodologias so:
i) teste de Wald; ii) teste da razo de verossimilhana (likelihood ratio LR); e iii) teste dos multiplicadores de Lagrange (Lagrange multipliers LM).
4.3.1 Princpios gerais

Os testes de Wald, LR e LM so baseados nas propriedades dos estimadores de mxima verossimilhana.11 Mais especicamente, estas propriedades partem do pressuposto de normalidade assinttica dos estimadores. Formalmente, seja um vetor de parmetros e suas respectivas estimativas por mxima verossimilhana, satisfazendo a convergncia em distribuio , o valor real do parmetro no modelo (assumindo um modelo corretamente onde especicado), o elemento a matriz de informao de Fisher para uma observao, e o nmero de observaes na amostra. Considere-se ento que o conjunto de hipteses, sobre os parmetros do modelo a serem testadas, pode ser escrito da forma
11. O teste de Wald pode ser utilizado em outros contextos que no o de estimao via mxima verossimilhana.
26
Texto para Discusso 1 5 0 8 onde ,
, uma funo linear ou no linear do vetor de parmetros . Considerem-se, por exemplo, os modelos SAR ou SEM, vistos na seo 2. Como casos especiais de testes de hipteses para os modelos paramtricos, tm-se os testes individuais dos parmetros de autocorrelao espacial: no modelo SAR, ou no modelo SEM. Os testes de Wald, LR e LM so baseados nas distncias das estimativas para o modelo irrestrito e as estimativas satisfazendo s restries impostas pela hiptese nula. Por exemplo, se o vetor de parmetros particionado em dois vetores distintos, da forma , e a hiptese nula pode ser escrita da forma , a estimativa de no modelo restrito consistir das estimativas para concatenada com todos os elementos de iguais a zero. A estimativa irrestrita a estimativa do vetor completo . Os testes sero ento baseados na medida da diferena entre as estimativas do modelo completo e o vetor restrito . Intuitivamente, se a distncia entre os dois resultados muito grande, a hiptese nula rejeitada. Para a realizao dos testes necessrio estimar:
i) Wald: apenas o modelo completo (irrestrito); ii) RV: o modelo completo (irrestrito) e o modelo restrito (sob a hiptese nula); e iii) LM: apenas o modelo restrito (sob a hiptese nula).
A seguir se far uma discusso um pouco mais detalhada dos trs tipos de testes. Dadas certas condies de regularidade, e assumindo-se que a hiptese nula verdadeira, as estatsticas testes comumente empregadas para os trs procedimentos possuem distribuio assinttica qui-quadrada , com nmero de graus de liberdade iguais a (dimenso da funo vetorial ).
4.3.2 Teste de Wald

O teste de Wald pode ser expresso na forma geral , (29)
com um vetor das estimativas obtidas por mxima verossimilhana dos parmetros irrestritos, uma matriz de derivadas da funo e uma estimativa consistente da matriz de varincias e covarincias do estimador do vetor de parmetros .
27
Considere-se, por exemplo, o modelo espacial SARMA, com resduos homocedsticos, com um parmetro de autocorrelao igual a , e suponha-se que h interesse em testar se este parmetro igual a zero. Para isso, pode-se escrever a hiptese nula como . A derivada , e chega-se ento a
, onde o primeiro elemento da diagonal principal da estimativa .
4.3.3 Teste da razo de verossimilhana

. A partir de uma Considere-se o modelo paramtrico indexado pelo parmetro amostra de tamanho , constri-se a funo de log-verossimilhana, como funo de . Seja o valor da funo de log-verossimilhana, computada no ponto , e seja o valor da funo de log-verossimilhana, computada no ponto . Conforme discutido anteriormente, a estimativa irrestrita do parmetro ,
e a estimativa do parmetro , impondo-se a restrio correspondente hiptese nula, de forma que . Ou seja,
A estatstica do teste da razo de verossimilhana dada por (30)
28
Sob a hiptese nula, e assumindo certas condies de regularidade, tem-se . Considerando-se novamente o modelo SARMA, pretende-se testar a hiptese nula . A funo de log-verossimilhana do modelo irrestrito tem expresso
enquanto a funo de log-verossimilhana do modelo restrito dada por
A estatstica teste dada por assinttica .
, e tem distribuio
4.3.4 Teste dos multiplicadores de Lagrange

O teste dos multiplicadores de Lagrange, tambm conhecido como teste do escore, baseado na abordagem de otimizao, mais precisamente, nas condies de primeira ordem da funo lagrangiana da funo de log-verossimilhana
onde
o vetor dos multiplicadores de Lagrange correspondendo s . A estatstica deste dada por
restries em
onde o vetor escore do modelo restrito calculado sob a hiptese nula. a matriz de informao de Fisher calculada sob a hiptese nula. A estatstica LM ter distribuio .
4.3.5 Teste dos multiplicadores de Lagrange no modelo SEM

No caso do modelo de erros espaciais (SEM), os resduos so modelados na forma , e, para se testar a hiptese de ausncia de autocorrelao espacial, o interesse reside em se testar a hiptese nula de que . Das trs abordagens de testes
29
(Wald, razo de verossimilhana e multiplicadores de Lagrange), a mais conveniente a abordagem dos multiplicadores de Lagrange, uma vez que ela requer apenas a estimao do modelo restrito. Neste caso, a partir da estimao dos coecientes da regresso via mnimos quadrados ordinrios, e das estimativas para os erros da regresso, dados por , pode-se mostrar que a estatstica teste tem expresso
(31)
onde
trao . Caso a matriz seja simtrica (i.e., ), obtm-se . Computacionalmente, os testes de Wald e da razo de verossimilhana so mais complexos, uma vez que necessrio o clculo das estimativas de mxima verossimilhana sem a restrio sobre o parmetro . A estatstica teste em (29) converge assintoticamente para uma distribuio qui-quadrada com um grau de liberdade. Note-se que o teste dos multiplicadores de Lagrange constitui-se em um procedimento simples para se testar a hiptese de ausncia de dependncia espacial nos erros da regresso.
5 ESTIMAO VIA MNIMOS QUADRADOS DE DOIS ESTGIOS

Os modelos apresentados na seo 2 tratam de situaes nas quais no h variveis endgenas no lado direito da equao, de forma que a estimao via mxima verossimilhana fornece estimativas consistentes para os parmetros do modelo. No entanto, em muitas situaes, principalmente quando se tem o objetivo de identicar relaes de causalidade entre determinadas polticas, o problema de endogeneidade aparece nos modelos espaciais, surgindo a necessidade de se utilizarem abordagens que estendam, por exemplo, os estimadores de variveis instrumentais para situaes com dependncia espacial. Kelejian e Prucha, em diversos artigos,12 exploraram este problema, e propuseram o estimador espacial de mnimos quadrados de dois estgios (S2SLS).
12. Ver Kelejian e Prucha (1997; 1998; 2002; 2007; 2009), e Kelejian, Prucha e Yuzefovich (2004).
30
Entre as caractersticas da abordagem de mnimos quadrados espaciais de dois estgios de Kelejian e Prucha, podem-se citar: i) visa estimao de modelos de regresso linear, com um termo de lag espacial da varivel resposta do lado direito da equao; ii) permite a estimao de modelos com regressores endgenos; iii) os coecientes (inclusive o coeciente do termo de lag espacial da varivel resposta) so todos estimados por intermdio do procedimento de mnimos quadrados de dois estgios; iv) o coeciente de lag espacial da varivel resposta tem como instrumento, para resolver o problema de endogeneidade, os lags espaciais dos regressores exgenos; e v) o procedimento permite a incorporao de correes para a presena de heteroscedasticidade e autocorrelao espacial residual nos termos de erro da regresso estimada. Para fazer a exposio de metodologia de mnimos quadrados espacial de dois estgios, considere-se a equao geral a seguir: (32) onde y um vetor coluna contendo as observaes empilhadas para a varivel resposta, o coeciente do lag espacial da varivel resposta, W uma matriz de vizinhana, Y uma matriz com regressores endgenos, o vetor um vetor de coecientes dos regressores endgenos, X uma matriz com os regressores exgenos, o vetor o vetor com coecientes dos regressores exgenos, o vetor u um vetor coluna, de dimenso com os resduos do modelo. Escrevendo-se a equao (32) de forma mais concisa, com = , , , = , , , tem-se
Seja uma matriz com observaes das variveis instrumentais para os regressores endgenos em . Os instrumentos para a varivel endgena so dados pelos lags espaciais dos regressores exgenos . A matriz com todas as variveis instrumentais pode ser ento representada como:
O estimador de mnimos quadrados espacial de dois estgios (spatial two stage least squares S2SLS) tem expresso
31
(33)
Na ausncia de heteroscedasticidade e autocorrelao espacial dos resduos, um estimador para a varincia assinttica dos estimadores dada por: , com ( . 34)
Na presena de heteroscedasticidade dos resduos, uma estimativa robusta para a matriz de varincia assinttica tem expresso
(35)
,e uma matriz diagonal contendo o quadrado dos resduos onde da equaco estimada via S2SLS. Na presena de heteroscedasticidade e autocorrelao espacial, pode-se utilizar um estimador robusto (HAC). Para isso, preciso estimar . Uma forma para esta estimativa dada por
onde so elementos da matriz , e o vetor de resduos da equao estimada via S2SLS. O termo uma funo kernel (que uma funo de densidade, com integral igual a 1). Algumas alternativas para as funes kernel esto apresentadas na tabela 1.
32

TABELA 1
Alguns tipos de kernel a serem utilizados no estimador HAC para a matriz de covarincia assinttica do estimador S2SLS
Tipo de kernel Expresso
Kernel triangular ou de Barlett
Kernel de Epanechnikov
Kernel biquadrado (bi-squared kernel)
Elaborao dos autores.
Na expresso na segunda coluna da tabela 1, o valor corresponde distncia entre os polgonos (ou demais entidades localizadas em um espao de coordenadas) e . A distncia uma distncia mxima de corte. Pode-se escolher com um valor xo para todas as observaes, ou varivel, de forma a considerar um nmero xo de vizinhos mais prximos de cada observao (podem-se escolher distncias variveis, de forma a incluir os 40 vizinhos mais prximos, por exemplo, de cada observao). A partir da equao anterior para , pode-se escrever a varincia assinttica, robusta heteroscedasticidade e autocorrelao espacial nos resduos, para os estimadores S2SLS, com a expresso (36) onde .
A correo dada pela expresso (36), para contabilizar para desvios em relao hiptese de homocedasticidade e ausncia de correlao entre os resduos da regresso, baseia-se no trabalho de Conley (1999), que prope um estimador robusto para correo da matrix de varincia assinttica no contexto de mtodo de momentos generalizados. Na prxima seo, faz-se uma discusso especicamente sobre a abordagem de Conley, a qual se mostra bastante exvel, permitindo estimar modelos com especicaes no lineares. Nesse contexto, ser discutido, por exemplo, como a abordagem GMM de Conley pode ser utilizada para estimar modelos probit, logit etc., quando h correlao espacial entre as observaes.
33
6 MTODO DE MOMENTOS GENERALIZADO COM CORREO PARA DEPENDNCIA ESPACIAL

Nesta seo, apresenta-se uma discusso sobre o procedimento de Conley (1999), por meio do qual se permite a estimao de modelos gerais via mtodo de momentos generalizados, na presena de autocorrelao espacial nas observaes. Entre as vantagens deste procedimento, podem-se citar: i) conta com a exibilidade da estimao via GMM; ii) possibilita a estimao de modelos com especicaes no lineares; iii) apresenta uma extenso, para o caso espacial, da estimao no paramtrica da matriz de varincia, inicialmente proposta, para dados com dependncia temporal, por Newey e West (1987); e iv) possibilita a estimao de sistemas de equaes. Para simplicar a exposio, sero considerados apenas modelos uniequacionais. Considere-se ento a forma geral do modelo de regresso (linear ou no linear) (37) O termo um termo de erro que possui mdia zero. O vetor um vetor de variveis explicativas, e corresponde a um vetor de parmetros desconhecidos do modelo. Assume-se que pode haver endogeneidade em algumas das variveis do lado direito da equao. Considere-se ento um vetor de instrumentos . No caso de no haver endogeneidade, o vetor de instrumentos exatamente o vetor de covariveis; ou seja, . A partir do vetor de variveis instrumentais, podem-se ento escrever as condies de momento (momentos populacionais) (38) Para prosseguir a estratgia de estimao, substituem-se os momentos populacionais por seus equivalentes amostrais, obtendo-se
(39)
34
Assumindo-se algumas condies de regularidade, quando o nmero de coecientes exatamente igual ao nmero de instrumentos, diz-se que o modelo exatamente identicado e possvel encontrar um vetor de coecientes para o qual a igualdade acima satisfeita.13 No entanto, quando a dimenso de maior que o nmero de coecientes, a probabilidade de se obter uma amostra para a qual a igualdade seja exatamente satisfeita zero (conjunto de medida nula). Uma alternativa encontrar o vetor que minimiza a forma quadrtica
A matriz como
Pode-se mostrar que o estimador GMM consistente (supondo-se que as devidas condies de regularidade so satisfeitas). Ecincia obtida utilizando-se a matriz tima , onde
Na prtica, quando no h dependncia entre as observaes, pode-se estimar por intermdio da expresso
(40)
13. Ver Hamilton (1994) e Matyas (2008).
35
No entanto, quando h possveis dependncias entre as observaes para os vetores correspondentes s condies de momento, o estimador supracitado para no mais vlido. No caso de as observaes para , e acontecerem em perodos discretos de tempo igualmente espaados, Newey e West (1987) propem uma correo no paramtrica e robusta para o estimador . Este estimador foi revisitado em Andrews (1991) e Andrews e Monahan (1992). Conley (1999) props um estimador robusto tanto a heteroscedasticidade quanto autocorrelao espacial, no caso de dados cross-section, espacialmente distribudos, seguindo os mesmos princpios que Newey e West (1987). De maneira geral, o estimador proposto por Conley tem expresso
(41) onde para e , e , caso contrrio. O valor corresponde distncia horizontal entre unidades e , o valor corresponde distncia vertical entre e , a distncia de corte horizontal, e a distncia de corte vertical. Em geral, a minimizao de no resulta em uma soluo explcita, devendo ser feita via algoritmos numricos. Uma exceo ocorre no caso de modelos lineares; neste caso, o estimador GMM pode ser escrito em forma fechada, sem haver necessidade de minimizao numrica. A exibilidade da estimao via GMM, na formulao , permite o tratamento de modelos no lineares, com formulaes paramtricas comumente encontradas na literatura. A tabela 2 apresenta alguns exemplos de modelos que podem ser incorporados na formulao GMM. Pode-se ento proceder com a abordagem de estimao, corrigindo, por exemplo, para problemas de dependncia espacial.
36

TABELA 2
Exemplos de modelos paramtricos enquadrados na formulao GMM, que podem ser estimados corrigindo-se para dependncia espacial
Modelos paramtricos
Modelos lineares
Formulao
Modelos logit
Modelos probit Modelos complementary log-log Modelos exponenciais
Elaborao dos autores.
Uma vez estimado o vetor de coecientes , pode-se proceder com o processo de inferncia a partir da matriz de covarincia dos estimadores, estimvel a partir da expresso
Quando o modelo exatamente identicado, com nmero de instrumentos igual ao nmero de parmetros, a minimizao da forma quadrtica resulta em . Quando o modelo sobreidenticado, pode ser testada a validade das condies de momento, utilizando-se a estatstica de Hansen (1982) . (42) Sob a hiptese nula de validade dos instrumentos, pode-se mostrar que a estatstica em (42) tem distribuio assinttica qui-quadrada, com graus de liberdade, sendo o nmero de coecientes e o nmero de condies de momento.
37
7 COMENTRIOS FINAIS
Este texto apresenta uma discusso sobre alguns dos modelos economtricos comumente utilizados para modelagem de dados espaciais. Os modelos apresentados estariam mais adequados para estudos empricos seguindo as abordagens experimentalista e descritiva, nas quais o objetivo identicar efeitos causais de uma determinada poltica, ou encontrar relaes entre variveis econmicas. De fato, o estimador de mnimos quadrados de dois estgios, de Kelejian e Prucha, e o estimador de mtodo de momentos generalizado, de Conley (ambos discutidos neste estudo), permitem a estimao de parmetros na presena de variveis endgenas do lado direito da equao, contabilizando e/ou corrigindo para a presena de autocorrelao espacial nos resduos do modelo. Mesmo no tratando diretamente a abordagem estruturalista, as ideias apresentadas neste texto fornecero ao leitor uma noo dos procedimentos para estimao com dados com presena de dependncia especial, o que poder ser til para a estimao de parmetros estruturais em modelos microfundamentados. Dado o grande avano recente na literatura de anlise de dados espaciais, optou-se por apresentar apenas alguns dos mtodos mais comumente utilizados, de forma a transmitir ao leitor uma ideia bsica, mas clara, dos fundamentos da estimao de modelos economtricos com dependncia espacial. No foram cobertos modelos para dados de painel,14 mas apenas para dados cross-section. Outro tpico de extrema importncia na anlise de dados espaciais, que no foi tratado aqui, so os modelos estimados via abordagem bayesiana. O leitor poder encontrar boas exposies em Banerjee, Carlin e Gelfand (2004), Schabenberger e Gotway (2009), e Tanner (1996), entre outros.
14. Ver, por exemplo, Elhorst (2003), Druska e Horrace (2004), e Egger, Pfaffermayr e Winner (2005).
38
REFERNCIAS
ACKERBERG, D. et al. Econometric tools for analyzing market outcomes. In: HECKMAN, J. J.; LEAMER, E. E. (Eds.). Handbook of Econometrics. Amsterdam: Elsevier, vol. 6A, 2007. ANDREWS, D. W. K. Heteroskedasticity and autocorrelation consistent covariance matrix estimation. Econometrica, vol. 59, p. 817-858, 1991. ANDREWS, D. W. K.; MONAHAN, J. C. An improved heteroskedasticity and autocorrelation consistent covariance matrix estimator. Econometrica, vol. 60, p. 953-966, 1992. ANGRIST, J. D.; PISCHKE, J. S. Mostly harmless econometrics: an empiricists companion. New Jersey, Princenton University Press, 2009. ANSELIN, L. Spatial econometrics: methods and models. Kluwer Academic, Dordrecth, 1988. ANSELIN, L.; FLORAX, R. Advances in spatial econometrics. Heidelberg, Springer-Verlag, 2000. ANSELIN, L., FLORAX, R., REY, S. J. Advances in spatial econometrics Methodology, Tools and Applications. Springer: Advances in Spatial Science, Heidelberg, 2004. BANERJEE, S.; CARLIN, B. P.; GELFAND, A. E. Hierarchical modeling and analysis for Spatial Data. Monographs on Statistics and Applied Probability 101, Chapman & Hall/CRC, Florida, 2004. BERRY, S.; LEVINSOHN, J.; PAKES, A. Automobile prices in market equilibrium. Econometrica, vol. 63, no. 4, pp. 841-890, 1995. ______. Differentiated products demand systems from a combination of micro and macro data: the new car market. Journal of Political Economy, vol. 112, n. 1, 2004. CAMERON, A. C.; TRIVEDI, P. K. Microeconometrics: methods and applications. Cambridge University Press, New York, 2005. CLIFF, A. D. ; ORD, J. K. Spatial autocorrelation Pion, London,1972. CONLEY, T. GMM estimation with cross-sectional dependence. Journal of Econometrics, vol. 92, p. 1-45, 1999. DAVIS, T. A. Direct methods for sparse linear systems (Fundamentals of Algorithms). Society for Industrial and Applied Mathematics, 2006. DRUSKA, V.; HORRACE, W. C. Generalized moments estimation for spatial panel data: Indonesian rice farming. American Journal of Agricultural Economics, vol. 86, n. 1, p. 185-198, 2004. ECKSTEIN, Z.; WOLPIN, K. Why youths drop out of High School: the impact of preferences, opportunities, and abilities. Econometrica, 67, 1295-1340, 1999.
39
EGGER, P.; PFAFFERMAYR, M.; WINNER, H. An unbalanced spatial panel data approach to US state tax competition. Economic Letters, vol. 88, n. 3, p. 329-335, 2005. ELHORST, J. P. Specication and estimation of spatial panel data models. International Reginal Science Review, vol. 26, n. 3, p. 244-268, 2003. EPPLE, D.; SIEG, H. Estimating equilibrium models of local jurisdictions. Journal of Political Economy, 107, 645-681, 1999. HAMILTON, J. D. Time Series Analysis. Princeton University Press, 1994. HENDRY, D. F. Dynamic econometrics. Advanced Texts in Econometrics, Oxford University Press, Oxford, 1995. HAHN, J.; TODD, P.; VAN DER KLAAUW, W. Identication and estimation of treatment effects with a regression-discontinuity design. Econometrica, 69, 201-209. 2001. HOLMES, T. J. Structural, experimentalist, and descriptive approaches to empirical work in regional economics. Journal of Regional Science, vol. 50, n. 1, p. 5-22, 2010. KELEJIAN, H. H.; PRUCHA, I. R. A generalized spatial two-stage least squares procedure for estimating a spatial autoregressive model with autoregressive disturbances. The Journal of Real State Finance and Economics, vol. 17, n. 1, p. 99-121, 1998. KELEJIAN, H. H.; PRUCHA, I. R. Estimation of spatial regression models with autoregressive errors by two-stage least squares procedures: a serious problem. International Regional Science Review, vol. 20, n. 1, p. 103-111, 1997. KELEJIAN, H. H.; ROBINSON, D. P. Spatial autocorrelation : a new computationally simple test with an application to per capita county police expenditures.Regional Science and Urban Economics, vol. 22, issue 3, p. 317-331,1992. ______. 2SLS and OLS in a spatial autoregressive model with equal spatial weights. Regional Science and Urban Economics, vol. 32, n. 6, p. 691-707, 2002. ______. HAC estimation in a spatial framework. Journal of Econometrics, vol. 140, n. 1, p. 131-154, 2007. ______. Specication and estimation of spatial autoregressive models with autoregressive and heteroskedastic disturbances. Journal of Econometrics. No prelo. 2009. KELEJIAN, H. H.; PRUCHA, I. R.; YUZEFOVICH, Y. Instrumental variable estimation of a spatial autoregressive model with autoregressive disturbances: large and small sample results. In: LESAGE, J.; PACE, R. K. Spatial and Spatiotemporal Econometrics, Advances in Econometrics, New York: Elsevier, vol. 18, p. 163-198, 2004. KEANE, M.; WOLPIN, K. I. The career decisions of young men. Journal of Political Economy, 105, 473-522, 1997.
40
LEE, L. GMM and 2SLS estimation of mixed regressive, spatial autoregressive models. Journal of Econometrics, vol. 137 (2), p. 489-514, 2007. LESAGE, J. Bayesian estimation of spatial autoregressive models. International Regional Science Review, 20, n. 1 and 2, p. 113-129, 1997. ______. The theory and practice of spatial econometrics. Department of Economics, University of Toledo, 1999. LESAGE, J., PACE, R. K. Introduction to spatial econometrics. CRC Press, Boca Raton, 2009. MANSKI, C. Identication of endogenous social effects: the reection problem. The Review of Economic Studies, vol. 60(3), p. 531-542, 1993. MATYAS, L. Generalized method of moments estimation - Themes in Modern Econometrics. Cambridge University Press, 2008. McMILLEN, D. P. Issues in spatial data analysis. Journal of Regional Science, vol. 50, n. 1, p. 119-141, 2010. NEVO, A. Measuring market power in the ready-to-eat cereal industry. Econometrica, vol. 69, n. 2, p. 307-342, 2001. NEWEY, W. K.; WEST, K. D. A simple, positive semi-denite, heteroskedasticity and autocorrelation consistent covariance matrix. Econometrica, vol. 55, p. 703-708, 1987. PACE, K.; BARRY, R. Sparse spatial autoregressions. Statistics and Probability Letters, 33, 291-7, 1997. ______. Simulating mixed regressive spatially autoregressive estimators, computational statistics. Vol.13, p. 397-418, 1998. PETRIN, A. Quantifying the benets of new products: the case of the minivan. Journal of Political Economy, vol. 110, n. 4, 2002. PINKSE, J.; SLADE, M. E. Mergers, brand competition, and the price of a pint. European Economic Review, vol. 48, n. 3, p. 617-643, 2004. ______. The future of spatial econometrics. Journal of Regional Science, vol. 50, n. 1, p. 103-117, 2010. PINKSE, J.; SLADE, M. E.; BRET, C. Spatial price competition: a semiparametric approach. Econometrica, vol. 70, n. 3, p. 1111-1153, 2002. POFAHL, G. Essays on horizontal merger simulation: the curse of dimensionality, retail price discrimination, and supply channel stage-games. Tese (Doutorado), Texas A&M, 2007.
41
SCHABENBERGER, O.; GOTWAY, C. A. Statistical methods for spatial data analysis. Texts in Statistical Science, Chapman & Hall/CRC, Florida, 2009. TANNER, M. Tools for statistical inference, methods for the exploration of posterior distributions and likelihood functions. Springer Series in Statistics, 1996.
BIBLIOGRAFIA COMPLEMENTAR
ANSELIN, L.; FLORAX, R. New directions in spatial econometrics. Springer-Verlag, Advances in Spatial Science, 1995. ARBIA, G.; BALTAGI, B. H. Spatial econometrics - Methods and Applications. PhysicaVerlag, Heidelberg, 2009. BARRY, R.; PACE, R. A Monte Carlo estimator of the log determinant of large sparse matrices Linear algebra and its applications. 289, n. 1-3, p. 41-54, 1999. CARVALHO, A. X. Y.; ALBUQUERQUE, C. W.; MOTA, J. A.; PIANCASTELLI, M. (Orgs.). Dinmica dos municpios. Braslia: Ipea, 2008. CHOMITZ, K. M.; DA MATA, D.; CARVALHO, A.; MAGALHAES, J. C. R. Spatial dynamics of labor markets in Brazil. World Bank Policy Research Working Paper 3752, 2005. PINKSE, J.; SLADE, M. E.; SHEN, L. Dynamic spatial discrete choice using one-step GMM: an application to mine operating decisions. Spatial Economic Analysis, vol. 1, n. 1, p. 53-99, 2006.
42
Instituto de Pesquisa Econmica Aplicada ipea 2010
EDITORIAL
Coordenao
Cludio Passos de Oliveira
Reviso
Luciana Dias Jabbour Marco Aurlio Dias Pires Reginaldo da Silva Domingos Leonardo Moreira de Souza (estagirio) Maria Angela de Jesus Silva (estagiria)
Editorao
Bernar Jos Vieira Cludia Mattosinhos Cordeiro Everson da Silva Moura Lus Cludio Cardoso da Silva Renato Rodrigues Bueno Eudes Nascimento Lins (estagirio)
Capa
Lus Cludio Cardoso da Silva

Projeto Grco
Renato Rodrigues Bueno
Livraria do Ipea
SBS Quadra 1 - Bloco J - Ed. BNDES, Trreo. 70076-900 Braslia DF Fone: (61) 3315-5336 Correio eletrnico: livraria@ipea.gov.br Tiragem: 500 exemplares

TD 1508

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

TD 1508

Caricato da

Copyright:

Formati disponibili

1508

TPICOS EM ECONOMETRIA ESPACIAL PARA DADOS CROSS-SECTION

Alexandre Xavier Ywata Carvalho Pedro Henrique Melo Albuquerque

TPICOS EM ECONOMETRIA ESPACIAL PARA DADOS CROSS-SECTION

ISSN 1415-4765 JEL: C21, R15

2 MODELOS PARAMTRICOS PARA DEPENDNCIA ESPACIAL.................................... 10

3 CRTICAS AOS MODELOS DE DEPENDNCIA ESPACIAL ..........................................19

4 TESTES PARA DEPENDNCIA ESPACIAL ..................................................................22

5 ESTIMAO VIA MNIMOS QUADRADOS DE DOIS ESTGIOS .................................30

6 MTODO DE MOMENTOS GENERALIZADO COM CORREO PARA DEPENDNCIA ESPACIAL.......................................................................................34

Texto para Discusso 1 5 0 8

Tpicos em Econometria Espacial para Dados Cross-Section

Braslia, agosto de 2010

2. Ver Hendry (1995).

Texto para Discusso 1 5 0 8

Tpicos em Econometria Espacial para Dados Cross-Section

Braslia, agosto de 2010

2 MODELOS PARAMTRICOS PARA DEPENDNCIA ESPACIAL

Texto para Discusso 1 5 0 8

Tpicos em Econometria Espacial para Dados Cross-Section

4. Ver Lesage e Pace (2009).

Braslia, agosto de 2010

5. Ver Anselin (1988) e Lesage e Pace (2009).

Texto para Discusso 1 5 0 8

Tpicos em Econometria Espacial para Dados Cross-Section

o normal multivariada, com mdia nula e covarincia

, ento o vetor ob-

ver a funo de log-verossimilhana

obtm-se os estimadores de mxima verossimilhana dos parmetros do modelo.

6. Ver Davis (2006).

Braslia, agosto de 2010

Texto para Discusso 1 5 0 8

Tpicos em Econometria Espacial para Dados Cross-Section

Braslia, agosto de 2010

Texto para Discusso 1 5 0 8

Tpicos em Econometria Espacial para Dados Cross-Section

, via mxima verossimilhana, para o modelo SAR .

Inferncia para os coecientes em

, estimam-se novamente os parmetros atinjam a convergncia. Finalizam-se

repetidamente at que os valores no vetor ento as estimaes com o passo (vi).

Braslia, agosto de 2010

9. Ver Anselin (1988) e Lesage e Pace (2009).

Texto para Discusso 1 5 0 8

Tpicos em Econometria Espacial para Dados Cross-Section

3 CRTICAS AOS MODELOS DE DEPENDNCIA ESPACIAL

Braslia, agosto de 2010

Texto para Discusso 1 5 0 8

Tpicos em Econometria Espacial para Dados Cross-Section

Braslia, agosto de 2010

4 TESTES PARA DEPENDNCIA ESPACIAL

Texto para Discusso 1 5 0 8

Tpicos em Econometria Espacial para Dados Cross-Section

Braslia, agosto de 2010

Texto para Discusso 1 5 0 8

Tpicos em Econometria Espacial para Dados Cross-Section

e so vizinhos, de acordo com a

Braslia, agosto de 2010

4.3.1 Princpios gerais

Texto para Discusso 1 5 0 8 onde ,

Tpicos em Econometria Espacial para Dados Cross-Section

4.3.2 Teste de Wald

Braslia, agosto de 2010

, onde o primeiro elemento da diagonal principal da estimativa .