Sei sulla pagina 1di 87

Tpicos de Estatstica Espacial

Areas
Anderson Castro Soares de Oliveira

Notes

Anlise de dados de area

Notes

Em algumas situaes prticas a localizao geogrfica


dos eventos (pontos) no est disponvel.

Mas pode-se encontrar dados aglomerados por de rea,


como um estado, municpio, bairro, distrito, setor censitrio,
etc.

Nestes casos os dados em geral, so contagens por unidade de rea tais como: nmero de nascimentos, nmero
de crimes, nmero de arvores, etc.

Os dados de rea tambm podem ser expressos em forma


de taxas, mdias, medianas, por exemplo: taxa de mortalidade, percentual de adultos analfabetos; renda mdia do
chefe da familia, mediana etria em mulheres.

Anlise de dados de area


I

A forma usual de apresentao de dados de reas por


meio dos mapas temticas,

Figura 1: Renda mdia mensal dos municpios de Mato Grosso


(Fonte: IBGE)

Notes

Anlise de dados de area


I

Os mapas temticos representam padro espacial do fenmeno nas areas


A anlise estatstica permite alm de visualizar o fenmeno
nas areas:
I
I

Notes

definir se o padro aleatrio ou no


verificar se existe tendncia

Anlise de dados de area


I

Para analisar dados de area em geral utiliza-se o modelo


de variao espacial discreta.
Considere-se a existncia de um processo estocstico Zi
i = 1, ..., n , em que:
I
I

Notes

Zi a realizao do processo espacial na rea i e


n o total de reas (A1 , ...An

O objetivo principal da anlise construir uma aproximao para a distribuio conjunta de variveis aleatrias Z =
{Z1 , ...Zn }.

Em geral supes que Zi segue uma distribuio Poisson,


mas quando a varivel taxas ou mdias, pode-se supor
que Zi segue uma distribuio normal

Anlise de dados de area

Notes

Um dos problemas bsicos com dados agregados por rea


que, para uma mesma populao estudada, a definio
espacial das fronteiras das reas afeta os resultados obtidos.

As estimativas obtidas dentro de um sistema de unidades


de rea so funo das diversas maneiras segundo as quais
essas unidades podem ser agrupadas.

Pode-se obter resultados diferentes simplesmente alterando


as fronteiras entre essas reas.

Este problema conhecido como "problema da unidade de


rea modificvel"

Vizinhana

Notes

importante estabelecer quais reas esto conectadas entre si;

Tipos de vizinhana

Vizinhana

Notes

Inicialmente deve-se escolher o critrio de vizinhana a ser


utilizado;

Em seguida deve-se atribuir pesos para a ligaes entre os


vizinhos identificados.

Vizinhana
I

A vizinhana representada por uma matriz de proximidade espacial, tambm chamada matriz de vizinhana.

Dado um conjunto de n reas (A1 , ..., An ), a matriz de vi(1)


zinhana de primeira ordem represetando porW(nxn) , e
cada um dos elementos wi j representa uma medida de proximidade entre Ai e Aj .
Existem vrios critrios para escolha de wij

I
I

I
I

Notes

wij = 1 se Ai faz fronteira com Aj e wij = 0 caso contrrio


wij = 1 se Ai est a uma certa distncia de Aj e wij = 0
caso contrrio
wij = 1/d representa inverso da distncia d entre Ai e Aj
wij = 1/d 2 representa inverso do quadrado da distncia d
entre Ai e Aj

Vizinhana
I

Notes

Considere um gride regular com 9 observaes em x e y


so as coordenadas de cada rea
y
x
0,2
0,5
1,2
0,5 Z1 = 1 Z4 = 3 Z7 = 3
1,5 Z2 = 3 Z5 = 10 Z8 = 1
2,5 Z3 = 5 Z6 = 8 Z9 = 3

Vizinhana
I

Como temos 9 reas a matrix W ter ordem 9

Considerando como vizinhos apenas as areas que fazem


fronteiras norte, sul, leste e oeste
Assim, teriamos por exemplo:

I
I

A1 tem como vizinhos A2 e A4


A5 tem como vizinhos A2 , A4 , A6 e A8

Matriz de pesos

0
1

W =
0
0

0
0

Notes

1
0
1
0
1
0
0
0
0

0
1
0
0
0
1
0
0
0

1
0
0
0
1
0
1
0
0

0
1
0
1
0
1
0
1
0

0
0
1
0
1
0
0
0
1

0
0
0
1
0
0
0
1
0

0
0
0
0
1
0
1
0
1

0
0

1
0

Vizinhana
I

Para utilizar a distncia para definir vizinhana necessrio


obter a matriz de distncias,

A matriz de distncia uma matriz simtrica em que cada


di j pode ser obtido pela distncia euclidiana entre as reas
Temos a seguinte matriz de distncia

0, 00
1, 00

2, 00

0, 50

D=
1, 12
2, 06

1, 00

1, 00
1, 41

Notes

1, 00
0, 00
1, 00
1, 12
0, 50
1, 12
1, 41
1, 41
1, 00

2, 00
1, 00
0, 00
2, 06
1, 12
0, 50
2, 24
2, 24
1, 41

0, 50
1, 12
2, 06
0, 00
1, 00
2, 00
0, 50
0, 50
1, 12

1, 12
0, 50
1, 12
1, 00
0, 00
1, 00
1, 12
1, 12
0, 50

2, 06
1, 12
0, 50
2, 00
1, 00
0, 00
2, 06
1, 12
0, 50

1, 00
1, 41
2, 24
0, 50
1, 12
2, 06
0, 00
1, 00
2, 00

1, 00
1, 41
2, 24
0, 50
1, 12
1, 12
1, 00
0, 00
1, 00

1, 41
1, 00

1, 41

1, 12

0, 50

0, 50

2, 00

1, 00
0, 00

Vizinhana
I
I

Considerando como vizinhos apenas as areas que tem distncia menor que 1, 5
Assim, a matrix de vizinhana dada por:

0
1

W =
1
0

1
1

Notes

1
0
1
1
1
1
1
1
1

0
1
0
0
1
1
0
0
1

1
1
0
0
1
0
1
1
1

1
1
1
1
0
1
1
1
1

0
1
1
0
1
0
0
1
1

1
1
0
1
1
0
0
1
0

1
1
0
1
1
1
1
0
1

1
1

1
0

Vizinhana
I
I

Considerando todos como vizinhos e os pesos dados pelo


inverso da distncia
A matrix de vizinhana dada por:

0, 00
1, 00

0, 50

2, 00

W =
0, 89
0, 49

1, 00

1, 00
0, 71

Notes

1, 00
0, 00
1, 00
0, 89
2, 00
0, 89
0, 71
0, 71
1, 00

0, 50
1, 00
0, 00
0, 49
0, 89
2, 00
0, 45
0, 45
0, 71

2, 00
0, 89
0, 49
0, 00
1, 00
0, 50
2, 00
2, 00
0, 89

0, 89
2, 00
0, 89
1, 00
0, 00
1, 00
0, 89
0, 89
2, 00

0, 49
0, 89
2, 00
0, 50
1, 00
0, 00
0, 49
0, 89
2, 00

1, 00
0, 71
0, 45
2, 00
0, 89
0, 49
0, 00
1, 00
0, 50

1, 00
0, 71
0, 45
2, 00
0, 89
0, 89
1, 00
0, 00
1, 00

0, 71
1, 00

0, 71

0, 89

2, 00

2, 00

0, 50

1, 00
0, 00

Vizinhana
I

A matriz W conhecida como matriz de vizinhana no


normalizada, pode-se trabalhar com matrizes normalizadas
em que os todos os elementos esto entre 0 e 1
A matriz W , designada de matriz normalizada por linha
I

Notes

Esta matriz construda a partir da matriz W original, dividindose todos os elementos de cada linha de W pela soma da
linha
Portanto, a matriz W possui todas as linhas com a soma
igual a 1 e no simtrica

Vizinhana
I

A matriz Wn , designada de matriz normalizada global


I

Esta matriz construda a partir da matriz W original:


Wn =

n
n P
n
P

W
wij

i=1 j=1

Notes

em que n o numero de reas e wij so os pesos da matrix


W
Wn esta matriz simtrica

Mdia Movel Espacial


I

A mdia mvel espacial pode ser utilizada para analisar a


existncia de tendncia espacial

Para calcular a mdia mvel espacial utiliza-se a expresso:


n
P
wij zi
i =

j=1
n
P

wij

j=1

em que
I
I

Notes

wij so os pesos da matriz de vizinhana


zi o valor da varivel na area i

Mdia Movel Espacial


n
P

Zi

wij

j=1

1
3
5
3
10
8
3
1
3

Notes

0, 00
1, 00

0, 50

2, 00

0, 89

0, 49

1, 00

1, 00
0, 71

1, 00
0, 00
1, 00
0, 89
2, 00
0, 89
0, 71
0, 71
1, 00

0, 50
1, 00
0, 00
0, 49
0, 89
2, 00
0, 45
0, 45
0, 71

2, 00
0, 89
0, 49
0, 00
1, 00
0, 50
2, 00
2, 00
0, 89

0, 89
2, 00
0, 89
1, 00
0, 00
1, 00
0, 89
0, 89
2, 00

0, 49
0, 89
2, 00
0, 50
1, 00
0, 00
0, 49
0, 89
2, 00

1, 00
0, 71
0, 45
2, 00
0, 89
0, 49
0, 00
1, 00
0, 50

1, 00
0, 71
0, 45
2, 00
0, 89
0, 89
1, 00
0, 00
1, 00

0, 71
1, 00

0, 71

0, 89

2, 00

2, 00

0, 50

1, 00
0, 00

7, 6
8, 2
6, 5
9, 8
9, 6
8, 3
7, 0
7, 9
8, 8

Mdia Movel Espacial


wi1 z1

wi2 z2

wi3 z3

wi4 z4

wi5 z5

wi6 z6

wi7 z7

wi8 z8

wi9 z9

n
P

wij zi

j=1

0, 00
1, 00
0, 50
2, 00
0, 89
0, 49
1, 00
1, 00
0, 71

Notes

3, 00
0, 00
3, 00
2, 68
6, 00
2, 68
2, 13
2, 13
3, 00

2, 50
5, 00
0, 00
2, 43
4, 46
10, 00
2, 23
2, 23
3, 55

6, 00
2, 68
1, 46
0, 00
3, 00
1, 50
6, 00
6, 00
2, 68

8, 93
20, 00
8, 93
10, 00
0, 00
10, 00
8, 93
8, 93
20, 00

3, 88
7, 14
16, 00
4, 00
8, 00
0, 00
3, 88
7, 14
16, 00

3, 00
2, 13
1, 34
6, 00
2, 68
1, 46
0, 00
3, 00
1, 50

1, 00
0, 71
0, 45
2, 00
0, 89
0, 89
1, 00
0, 00
1, 00

2, 13
3, 00
2, 13
2, 68
6, 00
6, 00
1, 50
3, 00
0, 00

30, 44
41, 66
33, 80
31, 78
31, 93
33, 01
26, 67
33, 43
48, 43

Mdia Movel Espacial


Zi

n
P

wij zi

j=1

1
3
5
3
10
8
3
1
3

Notes

30,44
41,66
33,80
31,78
31,93
33,01
26,67
33,43
48,43

n
P

wij

j=1

7,59
8,20
6,48
9,77
9,57
8,26
7,03
7,94
8,81

4,01
5,08
5,22
3,25
3,34
4,00
3,79
4,21
5,50

Mdia Movel Espacial

Figura 2: Taxa de homicdio por 1000 habitantes do estado de mato


grosso. esquerda valores observados. direita mdia mvel local,
considerando uma vizinhana do tipo Queen.

Notes

Dependncia Espacial
I

Na anlise de dados de area um dos objetivos verifica o


tipo de interao entre as reas, surgindo questes do tipo
I

Notes

Se em uma rea existe um alto numero de ocorrncias de


um evento, em uma rea vizinha a ocorrncia tambm ser
alta?
Se em uma rea existe um alto numero de ocorrncias de
um evento, em uma rea vizinha a ocorrncia ser baixa?

Neste contexto importante estudar a dependncia espacial, mostrando como os valores esto correlacionados no
espao

Dependncia Espacial
I

A dependncia espacial pode ser expressa pela autocorrelao espacial que indica quanto uma varivel varia em
funo dos seus vizinhos
Para estimar a dependencia espacial pode-se utilizar dois
indices
I
I

Notes

Indice de Moran
Indice de Geary

ndice de Moran
I

O ndice de Moran um coeficiente muito til para medir a


correlao espacial.

Este ndice mede a relao do desvio padronizado de uma


varivel Z numa rea i com o desvio padronizado das
reas vizinhas para a mesma varivel Z.
n
I=

Notes

n P
n
P

wij (zi z )(zj z )

i=1 j=1

S0 (zi z )2

n total de reas;

I
I

zi e zj os valores da varivel nas reas i e j;


z mdia geral ;

wij a matriz de pesos

S0 o somatrio dos elementos wij da matriz de pesos

ndice de Moran
I

A interpretao deste ndice :


I

Notes

I > 0 correlao positiva indicando presena de conglomerados ou agrupamentos.


I = 0 ausncia de correlao indicando que a distribuio
espacial aleatria
I < 0 correlao negativa indicando a existncia de regularidade

ndice de Moran
I

Aps calcular o ndice de Moran importante testar as seguintes hipteses



H0 : I = 0 no existe correlao espacial
H1 : I 6= 0 existe correlao espacial

A significncia do ndice de Moran por duas suposies bsicas


I
I

Notes

Normalidade
Aletadoriedade

ndice de Moran
I

Sob a suposio de normalidade temos que


I

I o valor esperado do ndice de Moran dado por:


I =

1
n1

I2 a varincia do ndice de Moran dada por:




3
2
2
n

n
S
+
n

n
S2 + (2 4n) S02
1
2
I =
(n3 n2 n + 1) S02
em que
n

1 XX
2
S1 =
(wij + wji )
2
i=1 j=1

S2 =

n
X
i=1

Notes

(wi. + w.i )

wi. =

n
X
j=1

wij

ndice de Moran
I

Sob hiptese de aleatoriedade a distribuio de probabilidade desconhecida e assim, temos que:


I

IR o valor esperado do ndice de Moran dado por:


IR =

1
n1

I2 a varincia do ndice de Moran dada por:


2
R



i
h


i
h
n 3S0 2 + n2 3n + 3 S1 nS2 k 6S0 2 + n2 n S1 2nS2
(n 3) (n 2) (n 1) S0

em que
n
P
i=1

k=


n

n
P

i=1

Notes

(zi z)

(zi z)

2

1
(n 1)2

ndice de Moran
I

Em ambos os casos a significncia do ndice de Moran utilizado a estatstica


I
zc =
2
em que e 2 so o valor esperando e varincia

Notes

Rejeita-se H0 se valor p ou zc > z , em que z


obtido da distribuio normal padro

ndice de Geary
I

O ndice de Geary utilizado para medir a correlao espacial

Este ndice se baseia na diferena entre os pares de reas


(n 1)
C=

n P
n
P

wij (zi zj )2

i=1 j=1
n
P

S0

i=1

Notes

zi2

n total de reas;

zi e zj os valores da varivel nas reas i e j;

wij a matriz de pesos

S0 o somatrio dos elementos wij da matriz de pesos

ndice de Geary
I

A interpretao deste ndice :


I

Notes

I < 1 correlao positiva indicando presena de conglomerados ou agrupamentos.


I = 1 ausncia de correlao indicando que a distribuio
espacial aleatria
I > 1 correlao negativa indicando a existncia de regularidade

ndice de Geary
I

Para verificar a significncia do ndice de Geary pode-se


utilizar duas suposies bsicas
I
I

Notes

Normalidade
Aletadoriedade

ndice de Geary
I

Para ambas as suposies temos que c = 1

Sob suposio de normalidade temos que


C2

I
2

C =

Notes

(n 1)(2S1 + S2 )) 4S02
=
2(n + 1)S02

Sob suposio de alaetoriedade temos que

h
i
h
i h
i
(n 1)S1 (n2 3n + 3 (n 1)k 14 (n 1)S2 (n2 + 3n 6 (n2 n + 2)k ) + S02 (n2 3 (n 1)2 k )
n(n 2)(n 3)S02

ndice de Geary
I

Em ambos os casos a significncia do ndice de Moran utilizado a estatstica


I1
zc =
2
em que e 2 so o valor esperando e varincia

Notes

Rejeita-se H0 se valor p ou zc > z , em que z


obtido da distribuio normal padro

Exemplo
I

Utilizando taxa homicdios no ano de 2012 em mato grosso,


e considerando vizinhana tipo Queen

ndice de Moran
I

ndice de Grey
I

Notes

I=0,0027, suposio normal valor-p=0.4228, suposio de


aleatoriedade valor-p=0,4240
Como valor-p>0,05 temos evidncias de que no existe
correlao entre as areas.
I=0,9559, suposio normal valor-p=0,2514, suposio de
aleatoriedade valor-p=0,2173
Como valor-p>0,05 temos evidncias de que no existe
correlao entre as areas.

Correlograma Espacial

Notes

Os ndices de Moran e Geary so utilizados para estimar a


dependncia espacial

Para cada classe de distncia d pode-se estabelecer uma


matriz de vizinhana W (d) permitindo o clculo diferentes
valores destes ndices para a mesma varivel.

Isso permite avaliar o comportamento de autocorrelao


espacial como uma funo de distncia, em um grfico chamado de correlograma espacial, que fornece um descritor
do padro espacial nos dados.

Correlograma Espacial
I

O nmero e o tipo de classes de distncia a ser condiseradas so em principio, arbitrrios e podem ser consideradas
diferentes possibilidades a partir de um mesmo conjunto de
dados.

Pode-se utilizar a frmula de Sturges para determinar o nmero k de classe de distncia, em que
k = 1 + log2 n
sendo n numero de distncias na rea amostral.

Notes

Correlograma Espacial

Notes

Neste caso, os valores obtidos pelo correlograma podem


ser considerados significativos a um determinado nvel de
significncia , utilizando o critrio de correo de Bonferroni

Esta correo consiste em ajustar o nvel de probabilidade


em que se avalia a significncia, dividindo pelo numero
de classes de distncia k de maneira que 0 = /k .

Correlograma Espacial

Figura 3: Correlograma de Moran (circulos em preto correspondem a


correlaes significativas)

Notes

Correlograma Espacial

Figura 4: Padro de dados com gradiente linear - Correlograma apresenta correlaes positiva em distncias curtas e correlaes negativos em grandes distncias

Notes

Correlograma Espacial

Figura 5: Padro de grandes manchas - Correlograma apresenta correlaes positiva em pequenas e grandes distncias e correlaes
negativos distncias intermedirias

Notes

Correlograma Espacial

Figura 6: Padro de pequenas manchas e regulares - Correlograma


apresenta correlaes positiva e negativas significativas oscilando em
funo das distncias

Notes

Correlograma Espacial

Figura 7: Padro aleatrio - Correlograma apresenta a maioria das


correlaes no significativas oscilando em torno de zero

Notes

Correlograma Espacial
I

Notes

Vrios outros padres podem ser encontrados no correlogramas

Correlograma Espacial

Figura 8: Renda mdia mensal dos municpios de Mato Grosso e correlogramas de Moran e Geary

Notes

Correlograma Espacial

Figura 9: Taxa de homicdio por 1000 habitantes do estado de mato


grosso e correlogramas de Moran e Geary

Notes

Diagrama de Espalhamento de Moran


I

O diagrama de espalhamento de Moran uma maneira adicional de visualizar a dependncia espacial.

Para construir esse grfico utiliza-se os valores normalizados da varivel


z
a=

Em seguida plotado os valores normalizados a da varivel


com a mdia do seu vizinho com a mdia dos seus vizinhos
Wa

Notes

Diagrama de Espalhamento de Moran


I

O diagrama de espalhamento de Moran dividido em


quatro quadrantes, que so interpretados da seguinte forma
I

Notes

reas que que encontram-se no Q1 (valores positivos, mdias positivas) e Q2 (valores negativos, mdias negativas)
apresentam associao espacial positiva, no sentido que
uma localizao possui vizinhos com valores semelhantes.
reas que que encontram-se no Q3 (valores positivos, mdias negativas) e Q4 (valores negativos, mdias positivas)
apresentam associao espacial negativa, no sentido que
uma localizao possui vizinhos com valores distintos

Diagrama de Espalhamento de Moran

Figura 10: Diagrama de Espalhamento de Moran

Notes

Diagrama de Espalhamento de Moran


I

O diagrama reflete a estrutura espacial nas duas escalas


de anlise: vizinhana e tendncia

O ndice de Moran I e equivalente ao coeficiente de regresso linear entre a e Wa

A regresso linear entre a e Wa permite identificar valores extremos (outliers), para isso localiza-se pontos no diagrama de Moran que so extremos em relao tendncia
central, refletida pela inclinao da reta de regresso.
A presena de valores extremos pode significar:

Notes

problemas com a especificao da matriz de proximidade


ou com a escala espacial de observao dos dados.
a existncia de regies de transio entre regimes
espaciais distintos, os quais geralmente pertencem aos
quadrantes Q3 e Q4

O diagrama de espalhamento de Moran tambm pode ser


apresentado na forma de um mapa temtico, no qual cada
area apresentada com a cor do respectivo quadrante

Diagrama de Espalhamento de Moran

Notes

O diagrama de espalhamento de Moran tambm pode ser


apresentado na forma de um mapa temtico, no qual cada
area apresentada com a cor do respectivo quadrante

As areas que se encontram nos quadrantes 3 e 4 (correlao negativa), podem podem ser entendidos como regies
de transio entre as reas que se encontram nos quadrantes 1 e 2 (correlao positiva)

Diagrama de Espalhamento de Moran

Figura 11: Diagrama de Espalhamento de Moran para renda mdia


mensal dos municpios de Mato Grosso

Notes

Diagrama de Espalhamento de Moran

Figura 12: Diagrama de Espalhamento de Moran para taxa de homicdio por 1000 habitantes dos municpios de Mato Grosso

Notes

Indicadores Locais de Associao Espacial (LISA)


I

A estatstica espacial local quantifica o grau de associao


espacial a que cada localizao est submetida em funo
de um modelo de vizinhana preestabelecido

Para este tipo de anlise utilizas-e os Indicadores Locais


de Associao Espacial (LISA)

O LISA para cada observao d uma indicao da extenso da aglomerao espacial significativa de valores similares em torno de que a observao
Um LISA ser qualquer estatstica que satifaa a dois critrio:

Notes

Um indicador LISA deve possuir, para cada observao,


uma indicao de clusters espaciais significantes de valores similares em torno da observao (e.g. regio)
O somatrio dos LISAs, para todas as regies, proporcional ao indicador de autocorrelao espacial global.

ndice local de Moran


I

O ndice local de Moran um indicador LISA baseado na


ndice de Moran.
n
(zi z ) X
wij (zj z )
Ii =
2
Si
j=1

n total de reas;

I
I

zi e zj os valores da varivel nas reas i e j;


z mdia geral ;

wij a matriz de pesos


n
P

Notes

Si2 =

wij

j=1,i6=j

n1

z 2

ndice local de Moran


I

O valor esperado para o ndice local de Moran


n
P

Ii =
I

j=1

n1

A varincia dada por:


(n k )
I2i =

Notes

wij

n
P
j=1,i6=j

n1

wij2

(2k n)
+

n
P

n
P

j=1,i6=j k =1,i6=j,j6=k

(n 1)(n 2)

wij wik

n
P

wij
j=1

n1

ndice local de Moran

Notes

A significncia do ndice local de Moran testada utilizado


a estatstica
Ii I
zc = q i
I2i

Rejeita-se H0 se valor p ou zc > z , em que z


obtido da distribuio normal padro

ndice local de Moran


I

A anlise do ndice local de Moran muito semelhante ao


do ndice de Moran.
I
I
I

Notes

I > Ii correlao positiva


I = Ii ausncia de correlao
I < Ii correlao negativa

Determinada a significncia estatstica do ndice local de


Moran, em geral apresentado um mapa temtico indicando as regies que apresentam correlao local significativamente diferente do resto do dados

ndice local de Moran

Notes

Figura 13: Indice local de Moran para renda mdia mensal dos municpios de Mato Grosso

ndice local de Moran

Notes

Figura 14: Indice local de Moran para taxa de homicdio por 1000
habitantes dos municpios de Mato Grosso

Regresso Espacial
I

A anlise de regresso uma tcnica que estuda a relao


entre duas ou mais variveis quantitativas estabelecendo
uma equao matemtica

Por meio do modelos de regresso possvel o investigar o


efeito de variveis explicativas (X ) na mudana da varivel
resposta (Y )
Existem diversos modelos de regresso

I
I
I

Notes

regresso linear
regresso linear mltipla
regresso no linear

Regresso Espacial
I

Quando ajustado um modelo de regresso tem-se a pressuposio so:


I
I
I

Notes

Os erros tem distribuio normal


Os erros tem varincia constante
Os erros so independentes

Quando os dados so distribudos espacialmente em areas,


em geral a hiptese de independncia dos erros no atendida

Regresso Espacial

Notes

Em dados distribudos espacialmente em areas deve-se verificar a presena da autocorrelao espacial no resduos
da regresso

A autocorrelao ou dependncia espacial pode afetar o


erro, a varivel dependente ou ambos

Regresso Espacial
I

Quando detectada a presena de autocorrelao espacial,


necessrio ajustar modelos de regresso espacial
Os principais modelos de regresso espacial so:
I
I
I

Notes

Modelo SAR
Modelo SEM
Modelo SARMA

Modelo SAR
I

O modelo autorregressivo espacial (SAR) utilizado para


modelar o efeito a interao espacial entre uma rea e seus
vizinhos

um modelo que considera o efeito de defasagem espacial


ou lag espacial.

O modelo SAR dada por:


y = W y + X + 
em
que:
I y o vetor de observaes
I
I
I
I
I

Notes

o coeficiente de autocorrelao espacial


W a matriz de vizinhana
X matriz de regresso
vetor de covariveis
 o vetor de erros, em que i so independentes e
identicamente distribudos com i N(0, 2 )

Modelo SAR
I

A estimao do modelo SAR feita assumindo que o vetor


de erros  tem distribuio normal multivariada com mdia
zero e covarincia 2 I

O modelo SAR pode ser escrito da seguinte forma:


y = (I W )1 X + (I W )1 

O vetor de observaes y possui distribuio condicional a


X normal multivariada, com mdia e varincia condicional,
dadas por:
E[Y |X ] = (I W )1 X
h
i0
2
1
1
[Y |X ] = (I W )
(I W )

Notes

Modelo SAR
I

Notes

A partir da distribuio de y obtm-se a verosimilhana


condicional e estimao dos parmetros (, , 2 ) feita
por mtodo iterativos.

Modelo SEM
I

O modelo de erro espacial (SEM) considera um processo


espacial autoregressivo em termo de erro

O modelo SEM dada por:


y = X + u
u = W u + 
em que:
I
I
I
I
I
I

Notes

y o vetor de observaes
o coeficiente de autocorrelao espacial de erro
W a matriz de vizinhana
X matriz de regresso
vetor de covariveis
 o vetor de erros, em que i so independentes e
identicamente distribudos com i N(0, 2 )

Modelo SEM

Notes

A varivel u uma varivel latente no observada

Essa varivel latente pode representar uma observao no


medida como por exemplo: cultura, capital social, violncia,
etc

A varivel u tambm pode se entendida como uma varivel


que expressa a heterogeneidade espacial

Modelo SEM
I

O modelo SEM pode ser escrito da seguinte forma


y = X + (I W )1 

Notes

A estimao do modelo SEM feita assumindo que o vetor


de erros  tem distribuio normal multivariada com mdia
zero e covarincia 2 I

Modelo SEM
I

O vetor de observaes y possui distribuio condicional a


X normal multivariada, com mdia e varincia condicional,
dadas por:
E[Y |X ] = X
2

[Y |X ] = (I W )
I

Notes

i0
h
1
(I W )

A estimao feita por maxima verosimilhana condicional

Modelo SARMA
I

O modelo de autoregressivo de mdias mveis espcial (SARMA)


uma combinao dos modelos SAR e SEM

O modelo SARMA dada por:


y = W1 yX + u
u = W2 u + 
em que:
I
I

I
I
I

Notes

y o vetor de observaes
so coeficientes de autocorrelao espacial de
defasagem e de erro
W1 e W2 a matriz de vizinhana, em que W1 pode ser
diferente de W2
X matriz de regresso
vetor de covariveis
 o vetor de erros, em que i so independentes e
identicamente distribudos com i N(0, 2 )

Modelo SARMA
I

A estimao do modelo feita por mxima verossimilhana,


assumindo que o  N(0, 2 I), e reescrevendo o modelo
y = (I W1 )1 X + (I W1 )1 (I W2 )1 

O vetor de observaes y possui distribuio condicional a


X normal multivariada, com mdia e varincia condicional,
dadas por:
E[Y |X ] = (I W1 )1 X
2

[Y |X ] = (I W )

Notes

(I W2 )

h
i0
1
1
(I W ) (I W2 )

Teste de Autocorrelao Espacial


I

Os principais testes utilizados para detectar a autocorrelao espacial so:


1. Teste de Moran
2. Teste de Multiplicador de Lagrange para a dependncia
espacial de erro (LMe )
3. Teste de Multiplicador de Lagrange para a dependncia
espacial de defasagem (LMlag )
4. Teste de Multiplicador de Lagrange para a dependncia
espacial de defasagem e erro (LMsarma )

Notes

Teste de Moran
I

O teste de Moran consiste em aplicar o indice de Moran


aos resduos da regresso

O problema deste teste que ele no identifica o tipo de


efeito (erro ou defasagem espacial)

A estatstica do teste dada por


n e0 W e
I=
S0 e0 e
em que
I
I
I
I

Notes

n total de reas;
e o vetor de erros
W matriz de vizinhana ;
S0 o somatrio dos elementos wij da matriz de vizinhana

Teste de Moran
I

Sob a suposio de normalidade temos que


I

I o valor esperado do ndice de Moran dado por:


I =

tr (MW )
nk

I2 a varincia do ndice de Moran dada por:


I2

tr (MWMW 0 ) + tr (MWMW ) + (tr (MW ))2


=
2I
(n k )(n k + 2)

em que
M = I X (X 0 X )1 X 0
sendo X a matriz do modelo

Notes

Teste de Moran
I

A significncia do ndice de Moran pode ser testada utilizando a estatstica


I I
zc = q
I2
em que e 2 so o valor esperando e varincia

Notes

Rejeita-se H0 se valor p ou zc > z , em que z


obtido da distribuio normal padro

Teste de Moran
I

A significncia do ndice de Moran pode ser testada utilizando a estatstica


I I
zc = q
I2
em que e 2 so o valor esperando e varincia

Notes

Rejeita-se H0 se valor p ou zc > z , em que z


obtido da distribuio normal padro

Teste de LMe

Notes

O Teste de Multiplicador de Lagrange para a dependncia


espacial de erro (LMe ) utilizado para detectar efeitos de
autocorrelao espacial no termo no erro do modelo

Este teste verifica a existncia de componente que expressa a dependncia espacial

As hipteses do teste so

H0 : = 0 no existe correlao espacial no erro
H1 : 6= 0 existe correlao espacial no erro

Teste de LMe
I

A significncia pode ser testada utilizando a estatstica




LMe =

2

e0 W e
S2
tr (W 0 W +

W 2)

em que
I
I
I
I

Notes

n total de reas;
e o vetor de erros
W matriz de vizinhana ;
e0 e
2
S =
n

A estatstica LMe tem distribuio assinttica 2(1)

Rejeita-se H0 se valor p ou 2c > 2

Teste de LMlag

Notes

O teste de Multiplicador de Lagrange para a dependncia espacial de defasagem (LMlag ) utilizado para detectar
efeitos de autocorrelao espacial proveniente da varivel observada

Este teste verifica a existncia de componente que expressa a dependncia espacial

As hipteses do teste so

H0 : = 0 no existe correlao espacial
H1 : 6= 0 existe correlao espacial

Teste de LMlag
I

A significncia pode ser testada utilizando a estatstica



LMlag =

0 MWX
(WX )
S2

e0 W z
S2

2

+ tr (W 0 W + W 2 )

em que
I
I
I
I
I
I
I

Notes

n total de reas;
e o vetor de erros
z o vetor de observaes
W matriz de vizinhana ;
e0 e
2
S =
n
M = I X (X 0 X )1 X 0 sendo X a matriz do modelo
so os coeficientes estimados no modelo de regresso

Teste de LMlag

Notes

A estatstica LMlag tem distribuio assinttica 2(1)

Rejeita-se H0 se valor p ou 2c > 2

Teste de LMSARMA

Notes

O teste de Multiplicador de Lagrange para a dependncia


espacial de defasagem e erro (LMSARMA ) utilizado para
detectar efeitos de autocorrelao espacial no erro e na
varivel observada

Este teste verifica a existncia de duas componentes ev


que expressa a dependncia espacial

As hipteses do teste so

H0 : = 0 = 0 no existe correlao espacial
H1 : 6= 0 6= 0 existe correlao espacial

Teste de LMSARMA
I

A significncia pode ser testada utilizando a estatstica


2
e0 W ze0 W e
S2
0 MWX
(WX )
+ tr (W 0 W
S2


LMSARMA =

+ W 2)

2

e0 W e
S2
+
tr (W 0 W +

W 2)

em que
I
I
I
I
I
I
I

Notes

n total de reas;
e o vetor de erros
z o vetor de observaes
W matriz de vizinhana ;
e0 e
S2 =
n
M = I X (X 0 X )1 X 0 sendo X a matriz do modelo
so os coeficientes estimados no modelo de regresso

Teste de LMlag

Notes

A estatstica LMSARMA tem distribuio assinttica 2(2)

Rejeita-se H0 se valor p ou 2c > 2

Procedimento para Regresso Espacial


I

Para ajustar uma regresso de dados distribudos espacialmente deve-se seguir os seguintes passos:
1. Ajustar o modelo de regresso
2. Estabelecer uma matriz de vizinhana
3. Testar a presena da autocorrelao espacial utilizando o
teste de Moran
4. Se for detectada a presena da autocorrelao espacial ajustar um novo modelo SAR, SEM ou SARMA
I
I

Notes

Para escolha do modelo a ser ajustado utilizar os testes LM


Quando mais de um teste LM for significativo, ajustar os modelos e escolher o melhor modelo pelos critrios de Akaike
ou Schwartz.

Potrebbero piacerti anche