Sei sulla pagina 1di 8

Departamento de Cincias e Engenharia de Biossistemas

Agrupamento de Matemtica
Matemtica II
Introduo Geostatstica
2012/2013
(F. Valente e M. Mesquita) (F. Valente e M. Mesquita)
2
Anlise espacial de dados
Estudar e modelar Ienomenos que se distribuem no espao.
Obter modelo inIerencial que considere o relacionamento
espacial presente no Ienomeno em estudo.
Objectivo: caracterizao da distribuio espacial de
variaveis que apresentam uma certa estrutura no espao e
quantiIicao da incerteza ligada ao Ienomeno espacial em
estudo.
3
Anlise espacial de dados
Exemplos:
modelao de recursos geologicos (concentrao de metais
em jazidos minerais, qualidade de aguas subterrneas),
estudos pedologicos (distribuio superIicial de
caracteristicas do solo),
ecologia (distribuio de especies vegetais ou animais,
padro espacial de aves de migratorias),
ambiente (ordenamento do territorio, estudos de poluio
do solo, da agua ou do ar).
Exemplo pioneiro:
Estudo eIectuado por John Snow em meados do seculo
XIX, durante uma epidemia de colera em Londres, para
avaliar a relao entre a distribuio dos obitos por colera
e a localizao das bombas de agua que abasteciam a
cidade.
4

5
Tipos de dados em anlise espacial
Padres pontuais dados provenientes de Ienomenos que
se localizam em pontos no espao.
Exemplos: localizao de especies vegetais, ocorrncia de doenas;
Superfcies contnuas (dados geoestatsticos) dados
provenientes de Ienomenos que se distribuem de Iorma
continua no espao.
Exemplos: dados geologicos, topograIicos, ecologicos, climatologicos,
pedologicos, hidrologicos.
Dados de reas dados associados a unidades de analise,
habitualmente delimitadas por poligonos Iechados onde se
supe haver homogeneidade.
Exemplos: dados de censos, estatisticas de saude.
6
Objectivos especficos
Analise de padres de pontos o objectivo e estudar a
distribuio espacial (localizao) dos acontecimentos
estudados (padro aleatorio, aglomerado ou regularmente
distribuido).
Analise de dados geoestatisticos o objectivo e
reconstruir a superIicie continua com base num conjunto
Iinito de dados observados na regio de estudo.
Analise de dados de areas o objectivo e modelar o
padro espacial dos dados (areas diIerenciadas vs.
continuidade espacial) e estabelecer associaes com
outras variaveis.
7
Dados geoestatsticos
Tipicamente, os dados geoestatisticos podem ser
representados por
em que x
i
identiIica uma localizao espacial (a 1, 2
ou 3 dimenses) e z
i
e o valor da variavel em estudo
(variavel resposta) associado a localizao x
i
.
Exemplos:
cotas de 52 locais numa dada regio; objectivo: construir um
mapa de altitudes para toda a regio;
conteudo em calcio de 178 locais numa dada regio;
objectivo: construir um mapa da variao espacial do
conteudo de calcio no solo nesta regio.
( x
i
, :
i
) , i=1,... , n
8
9
Representao computacional de dados geogrficos
Como construir este tipo de mapas?
Num computador, a representao de uma
superIicie continua pode ser Ieita por discretizao
numa malha regular.
A cada celula vai estar
associado um valor numerico
da variavel em estudo.
Como obter esse valor?
10
Modelao espacial de superfcies
A superIicie que representa o Ienomeno em estudo pode
ser obtida por modelao/interpolao espacial atraves de:
1) modelos determinsticos
de efeitos locais
admitindo que predominam os eIeitos locais, cada ponto da
superIicie e estimado por interpolao das observaes mais
proximas;
de efeitos globais
supondo que a variao em larga escala e dominante, a
superIicie e aproximada por um ajustamento polinomial aos
dados;
2) modelos estatsticos (krigagem),
cada ponto da superIicie e estimado atraves de um estimador
estatistico;
11
Modelos determnisticos locais
O valor a estimar no ponto x
0
e calculado por combinao linear dos
valores observados numa sua vizinhana.
Frmula geral de interpolao:
:(x
0
) e o valor a estimar no ponto x
0
,
:(x
f
) e o valor observado em x
f

w
f
e um Iactor de ponderao
O valor a atribuir a w
f
depende do metodo utilizado:
interpolao por vizinho mais prximo
(ou metodo dos poligonos de inIluncia)
Iactor de ponderao 1 (w
f
1)
para a observao :(x
f
) mais proxima de x
0

e zero para as restantes observaes.
: ( x
0
)=
_
f =1
m
w
f
:( x
f
)
_
f =1
m
w
f
12
Modelos determnisticos locais (cont.)
interpolao por mdia simples
o valor de :(x
0
) e dado pela media
aritmetica dos valores :(x
f
) de m
observaes vizinhas (Iactor de
ponderao 1 para as m observaes
vizinhas e zero para
as restantes).
interpolao pelo inverso da
potncia das distncias
o Iactor de ponderao e dado por
w
f
(1/d
f
)
k
, em que d
f
a distncia
euclideana do ponto x
f
ao ponto x
0
,
para m observaes vizinhas, e zero
para as restantes.
13
Exemplo:
Ponto x y z distncia
1 45 25 40 11.18
2 60 30 38 25.00
3 40 45 45 15.81
4 35 15 28 15.00
5 10 30 32 25.00
A 35 30 ? 0.00
2
0 3
0
14
Principais vantagens e desvantagens dos modelos
determinsticos
Vantagens:
Iaceis de implementar (esto disponiveis em muitas
aplicaes computacionais);
razoavelmente Iieis aos valores observados;
uteis para uma rapida visualizao dos dados.
Desvantagens:
metodos que tm por base criterios estritamente
geometricos que podem ser contraditorios com a estrutura
espacial do Ienomeno (por exemplo, existncia de
direces privilegiadas);
no estimam valores da variavel em estudo Iora da gama
de valores observados;
no avaliam a incerteza associada a caracterizao do
Ienomeno espacial.
15
Modelos geoestatsticos
Procuram ultrapassar as limitaes dos metodos
deterministicos
Tm em considerao:
1) a estrutura espacial da grandeza em estudo,
em geral, os Ienomenos distribuem-se no espao de uma Iorma no
aleatoria;
2) a avaliao da incerteza associada a caracterizao
do Ienomeno espacial,
a inIormao disponivel (o conjunto de observaes) e em geral
escassa pelo que a modelao probabilistica vai permitir a inIerncia
espacial em pontos no amostrados e a quantiIicao da incerteza
associada a essa estimao.
16
Conceitos bsicos
Dependncia espacial a maior parte das
ocorrncias apresentam entre si uma relao que
depende da distncia entre elas.
Exemplos: se existe poluio num dado local e provavel que
locais proximos tambem estejam poluidos; se a presena de uma
arvore adulta inibe o desenvolvimento de outras, essa inibio ira
diminuir com a distncia.
Autocorrelao espacial medida que avalia a
dependncia espacial; o preIixo auto indica que a
correlao e avaliada para a mesma variavel, mas
medida em locais distintos.
Exemplo de indicadores de autocorrelao espacial: covarincia,
coeIiciente de correlao e variograma.
17
Conceitos bsicos (cont.)
Varivel aleatria (

):
O conjunto de dados observados nos locais x
i
, i 1, 2, ., n, :(x
1
),
:(x
2
), . , :(x
n
)}, e interpretado como uma realizao de um conjunto
de variaveis aleatorias Z(x
1
), Z(x
2
), ., Z(x
n
)} correlacionadas entre si.
Cada uma destas variaveis tem
Entre quaisquer duas variaveis aleatorias pode deIinir-se
media E Z( x
i
)|=(x
i
)
varincia Jar Z( x
i
)|=E Z
2
( x
i
)|-
2
( x
i
)
covarincia C Z( x
i
) , Z ( x
f
)|=E Z ( x
i
) Z ( x
f
)|-( x
i
)( x
f
)
coeIiciente de correlao p=
C Z( x
i
) , Z( x
f
)|

Jar Z( x
i
)|Jar Z(x
f
)|
variograma y Z ( x
i
), Z( x
f
)|=
1
2
Jar (Z ( x
i
)-Z (x
f
))|
18
Conceitos bsicos (cont.)
Como do conjunto de v.a.s Z(x
i
)}
n
i1
so se conhece uma
realizao :(x
i
)}
n
i1
, o conjunto de dados experimentais, e
impossivel determinar qualquer parmetro estatistico.
Soluo geoestatistica: assumir varias hipoteses que
permitam Iazer inIerncia, com a (pouca) inIormao
disponivel:
1) Hiptese de estacionariedade da mdia admite-se que
todas as v.a. tm a mesma media
2) Hiptese de estacionariedade da covarincia e do
variograma a covarincia e o variograma entre duas
variaveis aleatorias so depende do vector distncia que as
separa e e independente da sua localizao,
E Z ( x
i
)|= , \i.
C Z ( x
i
) , Z ( x
f
)|=C Z ( x
i
) , Z ( x
i
+)|=C()
y Z( x
i
) , Z( x
f
)|=y Z ( x
i
) , Z ( x
i
+)|=y()
19
Consequncias da estacionaridade
A varincia das v.a.s Z(x
i
) e constante,
O coeIiciente de correlao tambem so depende do
vector distncia ,
O variograma pode escrever-se como
Jar Z ( x
i
)|=C(0)=o
2
,\i
p()=
C()
o
2
=
C()
C(0)
y()=
1
2
E(Z( x
i
)-Z ( x
i
+))
2
|
y()=o
2
(1-p())=C(0)-C()
20
Variograma e covarincia espacial

Distncia, h
21
Estacionaridade
Com as hipoteses de estacionaridade, a media, o variograma e
a covarincia passam a ser independente da localizao x
i
(e
x
f
) e podem ser estimadas pelos estimadores
*=
_
i=1
n
Z( x
i
)
n
y
*
()=
_
k=1
n()

Z( x
k
)-Z ( x
k
+)
|
2
2n()
C
*
()=
_
k=1
n()

Z( x
k
) Z( x
k
+)-*(x
k
)*( x
k
+)
|
n()
em que *( x
k
)=
1
n()
_
k=1
n()
Z( x
k
) , *( x
k
+)=
1
n()
_
k=1
n()
Z( x
k
+)
e n() e o numero de pares de pontos (x
k
, x
k
) para cada valor .
22
Isotropia
Quando para alem da estacionaridade, a covarincia
e o variograma tm o mesmo comportamento em
todas as direces diz-me que ha isotropia. Isto e,
C() e () so dependem de h ,,,,, a distncia
euclediana entre as localizaes.
Caso contrario, quando a estrutura de correlao
varia, quer com a distncia h, quer com a direco,
o Ienomeno e anisotrpico.
sotropia
anisotropia
23
Modelos geoestatsticos: aspectos fundamentais
Os valores da amostra so realizaes de variaveis
aleatorias localizadas espacialmente numa regio A.
A correlao entre estas v.a.s, medida pela
covarincia ou variograma, no depende da sua
localizao mas unicamente do vector e avalia a
continuidade espacial/disperso da variavel em
estudo na regio A.
Um valor no amostrado em x
0
e tambem
considerado uma v.a. Z(x
0
) que podera ser estimado
atraves de um novo estimador Z
*
(x
0
).
24
Fases de um estudo geoestatstico
Anlise exploratria dos dados
representao visual dos dados em graIicos e mapas;
estatistica descritiva: medidas de localizao e disperso,
histograma, caixa-de-bigodes, 'outliers;
identiIicao de padres de dependncia espacial no
Ienomeno em estudo, procura de regies no homogeneas.
Anlise estrutural dos dados
estudo da continuidade espacial: determinao do
variograma experimental e sua modelao.
Estimao
determinao da variavel em estudo em pontos no
amostrados: krigagem
25
Anlise exploratria dos dados
Descrio univariada com o objectivo de avaliar a
disperso da variavel (atributo) em estudo;
Descrio bivariada com o objectivo de estudar o
comportamento conjunto de dois atributos, ou o
mesmo atributo medido em localizaes distintas;
Descrio espacial com o objectivo de visualizar
o modo como o atributo se dispersa no espao:
localizao espacial dos valores extremos (valores
extremos distribuem-se na regio em estudo vrs. valores
muito altos/baixos concentrados);
anisotropia, anomalias, descontinuidades,...
26
Anlise estrutural dos dados
Objectivo: caracterizao e quantiIicao do modo
como se dispersa espacialmente a variavel em
estudo.
Esta etapa e a base dos processos de inIerncia/estimao
espacial.
Ferramenta bsica: variograma
Representa a taxa media de variao do Ienomeno em
estudo com a distncia;
Descreve o padro de variao espacial;
Resume a inIormao num ponto, a partir dos valores
observados em pontos proximos.
27
Variograma
Variograma experimental construido com os
dados da amostra
Variograma terico modelo teorico que
relaciona a varincia entre
dois pontos distanciados de
h unidades
o y
*
(h)=
_
k=1
n(h)

:( x
k
)-: (x
k
+h)
|
2
2n(h)
- modelo
28
Caractersticas do variograma
Para Ienomenos estacionarios, o variograma
apresenta as seguintes caracteristicas:
1) (0) 0, mas pode ser descontinuo na origem;
2) e uma Iuno crescente;
3) quando h -, y(h)-C(0)
patamar
amplitude
patamar
amplitude
} efeito pepita
29
Patamar, amplitude e efeito pepita
Patamar representa a variabilidade da variavel Z.
Amplitude mede a distncia a partir da qual os
valores da variavel Z deixam de estar
correlacionados.
Efeito pepita mede Iundamentalmente duas
parcelas da variabilidade total do Ienomeno em
estudo:
variao espacial numa escala inIerior a distncia minima
entre pontos amostrados;
variabilidade devida a erros de medio.
30
Modelos de variogramas
Antes do variograma poder ser utilizado, tem de ser
ajustado aos dados um modelo teorico (uma Iuno
matematica).
A Iuno a ajustar tem de satisIazer certas condies.
Na pratica, a modelao do variograma limita-se ao
uso de um conjunto restrito de Iunes que cobrem
a generalidade das situaes de disperso dos
Ienomenos espaciais que nos interessam estudar:
modelo esfrico,
modelo exponencial,
modelo Gaussiano.
31
Modelo esfrico
Um dos modelos mais usuais em geoestatistica.
y(h)=

C

1.5
h

-0.5
(
h

)
3
|
, 0h
C , h>.
patamar
amplitude
Funo de dois parmetros:
C - patamar
| a - amplitude
32
Modelo exponencial
Funo de 2 parmetros: C - patamar e | a/3.
Neste caso, o valor da amplitude a e a distncia em que o
modelo atinge 95 do patamar, isto e, (a) 0.95C(0).
y(h)=C(1-e
-h/
) , h>0
patamar
amplitude
33
Modelo Gaussiano
Funo de 2 parmetros: C - patamar e | a/\3.
Tambem aqui, o valor da amplitude a e a distncia em que
o modelo atinge 95 do patamar, isto e, (a) 0.95C(0).
y(h)=C(1-e
-( h/)
2
) , h>0
Contrariamente aos
modelos anteriores,
este modelo tem um
crescimento lento
junto a origem.
patamar
amplitude
34
Ajustar um modelo ao variograma experimental
Processo que envolve varias tentativas e no qual a
experincia e o conhecimento do Ienomeno e muito
importante.
Pode Iazer-se o ajustamento de Iorma manual,
analisando o resultado visualmente, ou utilizar
tecnicas de ajustamento automatico.
A Iorma analitica de um modelo no e muito
importante desde que as principais caracteristicas
do Ienomeno sejam respeitadas, nomeadamente:
o eIeito pepita,
o declive na origem,
a amplitude,
o patamar,
as anisotropias.
35
Variograma ajustado
Com o comando eyefit do package geoR e
possivel visualizar no variograma experimental
alguns modelos teoricos, nomedamente, os modelos
reIeridos anteriormente.
> eyefit(exemplo.variog)
cov.model sigmasq phi tausq kappa kappa2 practicalRange
exponential 9.52 1.06 1.19 <NA> <NA> 3.18
Neste exemplo, o modelo escolhido Ioi o exponencial com
parmetros C 9.52 (sigmasq) e | 1.06 (phi), eIeito pepita
C
0
1.61 (tausq) e amplitude a 3.18 (practicalRange)
O variograma resultante pode ser descrito por
y
afust
(h)=C
0
+y(h) , h>0
36
Estimao
Krigagem:
metodo de estimao que deve o seu nome ao
trabalho pioneiro de D.G. Krige (1951).
metodo que utiliza o 'melhor estimador linear
no-enviezado (centrado).
A krigagem pode assumir diversas Iormas. A mais
usual e designada por krigagem normal ou
ordinaria (ordinarv kriging): assume-se que o
Ienomeno em estudo e estacionario mas de media
desconhecida.
37
Estimao
Objectivo: estimao do valor da variavel Z num
ponto x
0
no amostrado, Z(x
0
).
Estimador a utilizar: Z
*
(x
0
), que devera
1) ser combinao linear dos valores conhecidos
Z(x
i
), i 1, ., n
2) com media do erro de estimao (c) nula
3) com varincia do erro de estimao minima
Z
*
( x
0
)=
_
i=1
n

i
Z( x
i
)
Er(x
0
)|=E Z
*
( x
0
)-Z (x
0
)|=0
min Jarr(x
0
)|=E(Z
*
(x
0
)-Z (x
0
))
2
|
38
Estimao
Considerando as hipoteses de estacionaridade e a
primeira condio,
a segunda condio e satisIeita se
e a terceira pode ser reescrita em termos da
covarincia ou do variograma

E Z
*
( x
0
)|=E Z( x
0
)|=
E Z
*
( x
0
)|=E
_
i =1
n

i
Z( x
i
)|=
_
i=1
n

i
_
i=1
n

i
=1
min Jar r( x
0
)|=C(0)+
_
i
_
f

i

f
C( x
i
, x
f
)-2
_
i

i
C( x
i
, x
0
)
min Jar r( x
0
)|=2
_
i

i
y( x
i
, x
0
)-
_
i
_
f

i

f
y(x
i
, x
f
)
39
Krigagem
O problema de determinar
1
,
2
, . ,
n
que

pode ser resolvido atraves do sistema linear de (n 1)
equaes a (n 1) incognitas sistema de krigagem
em que o e mais uma incognita (o parmetro de Lagrange), introduzida pelo
metodo utilizado na resoluo deste problema (metodo dos multiplicadores de
Lagrange).
min Jar r(x
0
)| s.a
_
i=1
n

i
=1

1
C( x
1
, x
1
)+
2
C( x
1
, x
2
)+.+
n
C( x
1
, x
n
)+o=C( x
1
, x
0
)

1
C( x
2
, x
1
)+
2
C( x
2
, x
2
)+.+
n
C( x
2
, x
n
)+o=C( x
2,
x
0
)

1
C( x
n
, x
1
)+
2
C( x
n
, x
2
)+.+
n
C( x
n
, x
n
)+o=C( x
n
, x
0
)

1
+
2
+.+
n
=1
40
Krigagem
O sistema de krigagem pode tambem ser descrito em
Iuno do variograma
O valor minimo da varincia do erro de estimao (c) e

1
y( x
1
, x
1
)+
2
y( x
1
, x
2
)+.+
n
y( x
1
, x
n
)-o=y( x
1
, x
0
)

1
y( x
2
, x
1
)+
2
y( x
2
, x
2
)+.+
n
y( x
2
, x
n
)-o=y( x
2
, x
0
)

1
y( x
n
, x
1
)+
2
y( x
n
, x
2
)+.+
n
y( x
n
, x
n
)-o=y( x
n
, x
0
)

1
+
2
+.+
n
=1
Jar r( x
0
)|=C(0)-
_
i=1
n

i
C( x
i
, x
0
)-o
Jar r( x
0
)|=
_
i=1
n

i
y( x
i
, x
0
)+o
Varincia de
krigagem
41
Sistema de krigagem: notao matricial
O sistema anterior pode ser escrito sob a Iorma matricial
, em que
e uma matriz quadrada de ordem (n 1) cujos elementos so
(x
i
, x
f
)
ij
, o variograma entre os pontos observados x
i
e x
f
,
e o vector das incognitas (
1
,
2
, ,
n
, o),
M e um vector cujos elementos so (x
i
, x
0
)
i0
, o variograma
entre o ponto observado x
i
e o ponto a estimar x
0
.

2
...

n
o

11

12
...
1n
1

21

22
...
2n
1
... ... ... ... ...

n1

n2
...
nn
1
1 1 ... 1 0
=
10

20
...

n0
1
=
42
Estimao e erro
Obtida a soluo do sistema de krigagem,
a estimativa do valor da variavel Z num ponto x
0
no
amostrado, :
*
(x
0
), e calculada com base no conjunto de
dados experimentais :(x
1
), :(x
2
), . , :(x
n
)} como
a estimativa da varincia do erro de estimao e
calculada como
:
*
( x
0
)=
_
i=1
n

i
:( x
i
)
Jar r( x
0
)|=
_
i=1
n

i
y( x
i
, x
0
)+o
43
Bibliografia:
Armstrong, M. (1998) Basic Linear Geostatistics,
Springer-Verlag.
Diggle, P. e Ribeiro Jr., P (2007) Model-based
Geostatistics, Springer.
Soares, A. (2000) Geoestatistica para as Cincias da
Terra e do Ambiente, IST Press.

Potrebbero piacerti anche