Sei sulla pagina 1di 24

Dati geostastici

Analisi dei dati


geostatistici

Analisi statistiche esplorative


Processi spaziali
Ipotesi di stazionariet
Modellazione spaziale: possibili quesiti
Modellazione della componente di larga scala
Propriet di variogramma e covariogramma
Modelli teorici di variogramma
Stima parametrica della funzione di variogramma
Metodi di previsione stocastica e non
Metodi per la valutazione della bont di previsione

Analisi statistiche esplorative

Analisi statistiche esplorative


Le analisi esplorative mirano a:
-trovare eventuali siti con attributo caratterizzato da valore
anomalo spazialmente;
-individuare
direzioni
che
mostrano
aumento/diminuzione
dellattributo (TREND);
-considerare correlazione tra i valori osservati.
Gli strumenti per lanalisi che vengono proposti:
-permettono di costruire modelli che descrivono la dipendenza tra i
dati osservati

Prime analisi descrittive univariate sulle variabili oggetto di studio


Analisi grafiche (es. istogrammi per saggiare la normalit distributiva)
Analisi statistiche (es. analisi della simmetria,)
Analisi descrittive bivariate
Analisi grafiche (es. grafici che rappresentano le coppie di due
variabili per studiarne il tipo di relazione)
Analisi statistiche (es. regressione lineare e non lineare)
Descrizione spaziale delle variabili esaminate
Valori alti e bassi (dove sono posizionati? Sono raggruppati??)

La motivazione che spinge a modellare la dipendenza spaziale


riguarda leffetto che ha sugli intervalli di confidenza e sulla
procedura di test di ipotesi.
3

Analisi statistiche esplorative


Strumenti grafici: contour plots, symbol maps, grayscale maps,
indicator maps
Analisi grafica delle relazioni spaziali (sia direzione che distanza)
tra punti-griglia (h-scatterplot)

Introduzione agli strumenti


dipendenza spaziale

per

misurare

la

Variogramma:
Variogramma una funzione della distanza e del relativo
orientamento delle coppie di punti che descrive il grado di
correlazione tra tali punti.
Kriging:: strumento per effettuare previsioni spaziali tenendo
conto della distanza e della correlazione attraverso la
funzione di variogramma.
Costruzione di mappe.

Processi spaziali

Processi spaziali

Il fenomeno studiato pu essere descritto per mezzo di processi


stocastici (variabili casuali).
Un processo stocastico un insieme di variabili casuali i cui membri
possono essere identificati (e indicizzati) seguendo una specifica
metrica.
Un processo spaziale un insieme di variabili casuali che sono indicizzate
d
da un insieme D contenente le coordinate spaziali di s.

{Z( s ) : s D }

0.0

0.2

0.4

0.6

0.8

1.0

z(si) il valore osservato nel punto si i=1,2,,n;

si D

(dominio)

Per ogni punto si , z(si) la realizzazione di una variabile casuale Z(si) con
valore atteso:
E[Z(si)]=m(si )

0.2

0.4

0.6

0.8

1.0

Il valore atteso rappresenta la media di larga scala di un attributo nel


sito si nellinsieme delle possibili realizzazioni di un esperimento
casuale

0.0

0.2

0.4

0.6

0.8

1.0

0.0

0.0

0.2

0.4

0.6

0.8

1.0

Il processo spaziale pu essere indicato con

I dati geostatistici sono osservati in un insieme finito di punti nello


spazio s1,s2,.,sn.

0.0

0.2

0.4

0.6

0.8

1.0

0.0

0.2

0.4

0.6

0.8

1.0

Processi spaziali

Processi spaziali
Come possibile apprendere informazioni riguardanti la variabilit di un
processo spaziale se si ha a disposizione una sola realizzazione?
Si d pi enfasi alla previsione: si cerca la relazione tra le osservazioni
disponibili nei punti campionati e quelli non campionati.
Come si pu procedere nellinferenza statistica con un campione di
dimensione 1.
Se il processo gode di precise propriet (che verranno illustrate nei
lucidi seguenti) un campione di dimensione 1 pu fornire informazioni
riguardanti il processo generatore dei dati.

Il modello pi semplice per rappresentare una variabile aleatoria


spaziale tiene conto di due aspetti:
a) aspetto strutturale che riflette le caratteristiche globali del
fenomeno (trend) e tiene conto delle variazioni di larga scala
(m(s));
b) aspetto casuale che tiene conto delle irregolarit locali
(variazioni su piccola scala) che il fenomeno presenta ((s))

Z( s ) = m( s ) + ( s )

sD

10

Processi spaziali

Processi spaziali
Quando interessa la interpretazione del fenomeno: si d pi
peso alla componente di larga scala.
Quando interessa la previsione: si d pi peso alla componente di
piccola scala.
Assunzioni tipiche del modello lineare precedentemente
proposto:
La componente di larga scala (m(s)) pu essere considerata
come una funzione delle coordinate spaziali;
La componente di piccola scala ((s)) generalmente segue
una distribuzione normale multivariata

~ MVN ( 0, ( ) )
11

Un processo casuale generalmente definito dalle funzioni di


distribuzione finito-dimensionali:
Fs1,s2,,sn(z1,z2,zn) = P {Z(s1) z1, Z(s2)z2,,Z(sn)zn}
In generale, per dati spaziali, la seguente assunzione risulta
valida
Fs1 ,s2 ,...,sn ( z1 , z2 ,..., zn ) Fs1 ( z1 ) Fs2 ( z2 ) ...Fsn ( zn )
Linsieme delle funzioni Fs1,s2,,sn(z1,z2,zn) per ogni n
E per ogni possibile valore del dominio (s1,s2,sn) linsieme delle
distribuzioni finito dimensionali del processo casuale Z(s).
In molto casi, la conoscenza della distribuzione congiunta del
processo stocastico non necessaria, poich generalmente molto
spesso vengono utilizzati i primi due momenti che permettono
soddisfacenti approssimazioni nel caso generale e soluzioni
12
esatte nel caso gaussiano.

Processi spaziali: i momenti

Processi spaziali:ipotesi di stazionariet forte

Quando si parla di geostatistica lineare vengono presi in


considerazione solo i primi due momenti del processo casuale Z(s).

STAZIONARIETA FORTE

d
Un processo stocastico Z( s ) : s D
viene detto stazionario in
senso stretto quando: Fs1,s2,,sm(z1,z2,zm)= Fs1+h,s2+h,,sm+h(z1,z2,zm)

Un processo stazionario in senso stretto si ripete invariato in tutto il


dominio.
La stazionariet in senso stretto una condizione restrittiva e non
necessaria per utilizzare molti metodi statistici dellanalisi
statistica dei dati spaziali.

Processi spaziali: i momenti

Un esempio di funzione di covarianza spaziale e di


variogramma

Il variogramma un misura della variabilit spaziale con le


propriet pi importanti: queste assumono maggiore importanza
quando i dati spaziali sono disposti su una griglia regolare e
quando seguono una distribuzione normale multivariata.

2.5
2.0
(h)

Le funzioni C(,) e (,) dipendono dai siti si e sj considerati cos che si


dovrebbe disporre di alcune realizzazioni per stimarli.
Ma se C(,) e (,) dipendono solo dal vettore di separazione h=si-sj tra
i punti del dominio, allora ogni coppia di dati separata dal vettore
h pu essere considerata come una realizzazione della coppia
[Z(si)-Z(sj)].

0.0

0.5

1.0

1.5
0.0

0.5

1.0

Il maggiore svantaggio che sensibile ai valori estremi

1.5

2.5
2.0

3.0

Variogram

3.0

2.Funzione di covarianza: se Z(si) e Z(sj) hanno una varianza finita


nei punti si e sj allora hanno una funzione di covarianza che dipende
da si e sj.
C Z ( si ) , Z ( s j ) = E ( Z ( si ) m ( si ) ) Z ( s j ) m ( s j )
3.Semivariogramma (varianza degli incrementi): la funzione di
semivariogramma definita come la varianza delle differenze
[Z(si)-Z(sj)] :
1
( si , s j ) = V Z ( si ) Z ( s j )
14
2

13

C(h)

Momenti del secondo ordine


2
1.Varianza del processo: V [ Z ( s )] = E ( Z ( s ) m ( s ) )

Le condizioni di stazionariet possono essere basate anche sui primi


due momenti della distribuzione del processo spaziale.

Covariance function

Momento del primo ordine


Si consideri Z(s) nel punto generico s nel dominio; se Z(s) ha valore
atteso finito, in generale dipendente da s, possibile scrivere
che: E [ Z ( s )] = m ( s )

0.0

0.5

1.0
h

1.5

0.0

0.5

1.0

1.5

15

16

Processi spaziali: i momenti

Processi spaziali: ipotesi di stazionariet

Ai fini inferenziali, si dovrebbe disporre di pi di un campione.


Poich questo non avviene generalmente nella pratica, alcune
ipotesi sono necessarie.
Ipotesi: necessario che il variogramma e il covariogramma
dipendano solamente dal vettore di separazione: h= si-sj e non solo
dalla posizione relativa di si e sj (in questo caso si parla di stazionariet
in senso debole)

Si possono individuare due tipi di stazionariet basati sui momenti del


secondo ordine a seconda se lassunzione riguardi la covarianza o il
variogramma.
STAZIONARIETA DEL SECONDO ORDINE: Un processo spaziale
Z( s ) : s D d stazionario del secondo ordine quando:
Il valore atteso esiste e non dipende dalla posizione: E(Z(s))= m
Per ogni coppia di variabili (Z(s),Z(s+h)) il covariogramma esiste e
dipende solo da h (covariogramma stazionario)

Cov[Z(s),Z(s+h)]= E[Z(s)Z(s+h)]-m2=C(h)
In tal caso, si considerano replicazioni del
corrispondenza della distanza h, tutte le coppie
(Z(si),Z(sj)) caratterizzate da una distanza h.

processo in
del processo

La variabilit di un processo spaziale stazionario del secondo ordine la


stessa ovunque nel dominio:

Cov[Z(s),Z(s+0)]= C(0)=E[Z(s)2]-m2=V[Z(s)]

Tale assunzione importante perch ci suggerisce che il processo


effettivamente si ripete nello spazio, producendo replicazioni
necessarie per la stima e linferenza
17

Processi spaziali: ipotesi di stazionariet

Stazionariet del secondo ordine presuppone lesistenza del


covariogramma.
Lesistenza della funzione di covarianza implica lesistenza di una
varianza finita.
Sotto la condizione di stazionariet del secondo ordine
covariogramma e variogramma sono equivalenti nella descrizione
della correlazione spaziale.
Se tutte le varianze sono assunte finite, allora la stazionariet in
senso forte.
Un processo stocastico detto gaussiano quando k 1 and s1 ,..., sk D
vettore Z ( s1 ) , Z ( s2 ) ,..., Z ( sk )
distribuito come una normale
multivariata, cio: Z ( s1 ) , Z ( s2 ) ,..., Z ( sk ) ~ MVN ( , )
Un processo gaussiano stazionario del secondo ordine anche
stazionario in senso stretto.
19

Come conseguenza si ha che se il covariogramma stazionario, allora


anche la varianza e il variogramma sono stazionari:

V[Z(s)]=E[(Z(s)-m)2]= C(0) e 2(h)=2[C(0)-C(h)] (dimostrazione)


18

Processi spaziali: ipotesi di stazionariet


Lesistenza del variogramma non una assunzione forte come
quella che si pu porre sul covariogramma: le ipotesi di
stazionariet del secondo ordine possono essere indebolite
(parzialmente rilassate) assumendo lesistenza del variogramma.
Anche se un processo Z(s) non stazionario, gli incrementi Z(s+h)-Z(s)
potrebbero comunque essere stazionari.
STAZIONARIETA INTRINSECA
Un processo spaziale {Z( s ) : s D d } intrinsecamente stazionario
quando:
il valore atteso esiste e non dipende dalla posizione: E(Z(s))= m (pu
essere indebolita)
V(Z(s+h)-Z(s))=2(h) (il variogramma esiste)

La stazionariet del secondo ordine implica quella intrinseca,


linverso non sempre vero.
Il processo ha una varianza finita che non dipende da s: V(Z(s))=2
20

Processi spaziali: ipotesi di stazionariet


Sotto le ipotesi di stazionariet intrinseca:
a) La varianza degli incrementi corrisponde al valore atteso del quadrato
degli incrementi;
b) La famiglia dei processi intrinsecamente stazionari pi ampia di
quella dei processi stazionari del secondo ordine.
Lipotesi posta sul valore atteso significa che non si ammette un trend in
una direzione specifica.
Quando un processo stocastico intrinsecamente stazionario con
semivariogramma ( h ) , h R d
allora:
se ( h ) = 0 ( h ) per una qualche funzione 0 , cio se il semivariogramma dipende da h solo per mezzo del valore assoluto h , allora il
processo detto isotropico.

Modellazione spaziale: Possibili quesiti


1. Come stimare il trend : modellazione della componente di larga scala
(stima di superfici di trend)
2. Come caratterizzare la dipendenza spaziale: stima della funzione di
variogramma/covariogramma (variogramma)
3. Come prevedere un valore Z(s) in un punto s* diverso da quelli
osservati: previsione (kriging)

Isotropia: dipendenza solo dalla distanza e non dalla direzione


Un processo stocastico che intrinsecamente stazionario e isotropico
detto omogeneo.
21

Modellazione della componente di larga scala


-Analisi grafica descrittiva (grafici a barre tridimensionali)

22

Analisi statistica della componente di larga


scala: metodi non parametrici
Scomposizione della variabilit:

-Analisi statistica:

Z ( s ) = Z ( sx , y ) = + x + y + xy

Metodi non parametrici:


Scomposizione della variabilit
Algoritmo median-polish
Metodi parametrici

23

Algoritmo di Median Polish:


1)Si calcola la mediana per ogni riga e si riporta alla fine della riga. Si
sottrae dunque tale mediana di riga da ogni punto per ogni riga;
2)Si calcola la mediana della mediana di riga e si registra tale valore
come effetto complessivo. Si sottrae tale effetto complessivo da
ognuna delle mediane di riga;
3)Si calcola la mediana di ogni colonna e si registra alla fine delle
colonne. Si sottrae la mediana di colonna da ogni colonna;
4)Si calcola la mediana della mediana di colonna e si aggiunge all
effetto complessivo. Si sottrae tale somma alleffetto complessivo da
ognuna delle mediane di colonna;
5)Si ripetono i passi 1)-4) fino a che non ci sono variazioni nelle
mediane.
24

Analisi statistica della componente di larga scala:


metodi parametrici

Analisi statistica della componente di larga scala:


applicazione sui dati di wolfcamp

Il modello di trend pi semplice una funzione lineare nelle


coordinate (piano):
s=(x,y); (s)=0+ 1x+ 2y, sD
Posso aggiungere termini di ordine superiore:
s=(x,y); (s)=0+ 1x+ 2y+3x2+4xy+5y2, sD

Tanti pi termini aggiungo tanto migliore sar ladattamento ai


dati, ma tanto pi rigida sar la funzione di larga scala
Pi in generale abbiamo delle superfici di trend della forma:

s=(x,y); (s)=0+ 1x+ 2y, sD

( s ) = i f ( si )
i =1

i parametri si possono stimare con il metodo dei minimi quadrati


(almeno in prima approssimazione) ottenendo:

s=(x,y); (s)=0+ 1x+ 2y+3x2+4xy+5y2, sD

( s) = i f ( si )

25

26

i =1

Propriet di variogramma e covariogramma

Propriet di variogramma e covariogramma


La specificazione di una funzione parametrica per 0
inferenziali.

utile per fini

1)Il covariogramma C(h) di un processo stocastico stazionario del secondo


ordine Z(s) dovrebbe essere una funzione definita positiva:
n

i =1 j =1

s1 ,..., sn D

and i , i = 1,..., n

n n
n
i j C si s j = V i Z ( si )

i =1

i =1 j =1

where

(spiegazione dettagliata in Cressie, 1993)

i = 0

i =1

Utilizzando le propriet 1) e 2) si possono definire 2 ulteriori propriet


nella specificazione di modelli teorici (modelli parametrici) per
covariogrammi e semi-variogrammi.
3) Una combinazione lineare di covariogrammi (semi-variogrammi) con
coefficienti positivi ancora un covariogramma (semi-variogramma):

Questa condizione necessaria perch per definizione si ha che:


i =1 j =1

i j si s j 0

Per una adeguata specificazione di una funzione parametrica necessario


definire le propriet che riguardano variogramma e covariogramma.

i j C si s j 0

2) Se il processo stocastico Z(s) soddisfa le ipotesi intrinseche con


semivariogramma ( h ) , allora questa funzione deve essere definita
n
negativa, cio: n n

C ( h ) = ai 2Ci ( h )

i =1

27

( h ) = ai 2 i ( h )
i =1

28

Propriet di variogramma e covariogramma

Variogramma empirico
Il variogramma dato dalla varianza delle differenze della variabile
casuale in due siti.
Se due unit sono tra loro vicine la loro differenza sar piccola e
cos pure la sua varianza. Al crescere della lontananza tra i siti, le
differenze diventano pi grandi e la varianza assume valori maggiori.

4) Un prodotto di covariogrammi ancora un covariogramma


n

C ( h ) = Ci ( h )
i =1

(questa propriet non vera per i semi-variogrammi)


5)

C ( h ) = C ( h )

6)

C ( h) C (0)

7)

( h) 0

( h) = ( h)
Graficamente si pu rappresentare un diagramma di
dispersione delle coppie (||si-sj||, (Z(si)-Z(sj))2/2)

(il covariogramma decresce allaumentare di h)

(0) = 0

* Utile per rilevare valori


anomali globali

29

30

Variogramma empirico: proposta di stimatori

Variogramma empirico: una applicazione ai dati di wolfcamp

classico:
2(h) =

1
N(h)

(Z(s ) Z(s )) ;
2

N ( h)

robusto:
1
1
2 (h) =
(0.457+ 0.494/ | N(h) |) N(h)

La media campionaria molto


sensibile ai valori anomali ci serve
uno stimatore robusto
4

|
Z
(
s
)
Z
(
s
)
|
,

i
j

N ( h)
1/ 2

h d , h = d (si , s j ) ,
Dove N(h) il numero di coppie a lag h

31

32

Propriet di variogramma e covariogramma

Il variogramma empirico (h) uno stimatore corretto per (h)


fornisce stime solo fino ad un certo numero di lags spaziali.

ma

3.0
2.5
2.0
0.0

0.5

1.0

1.5

(h)

2.0
(h)

1.5
1.0
0.0

b) seguendo una o pi direzioni:


se i variogrammi sono differenti rispetto alle direzioni che si
prendono in considerazione, questo pu dipendere dallesistenza di un
trend o di anisotropia.

0.5

Come effettuare valutazioni empiriche?


a) seguendo tutte le direzioni, sotto lipotesi che il processo spaziale sia
stazionario e la correlazione spaziale sia isotropica:
questo variogramma stimato utilizzando tutti i dati ( come una
media su tutti i variogrammi che seguono qualche direzione specifica);

2.5

3.0

Variogramma empirico: alcune considerazioni

0.0

0.5

1.0

1.5

2.0

0.0

Per ottenere stime di (h) ad un arbitrario lag spaziale il variogramma


empirico va smussato: per questo motivo si adatta un modello di
variogramma parametrico.
33

0.5

1.0

1.5

2.0

Sill(soglia): corrisponde al valore del semivariogramma corrispondente ad


osservazioni incorrelate (asintoto del semivariogramma); solamente i processi
stazionari in senso debole presentano una soglia e questa coincide con C(0).
range: distanza alla quale le osservazioni non sono pi correlate (pu essere infinito
o finita) (h) diviene costante (C(h) 0). Lo definiamo in maniera approssimata
34
perch per alcuni processi la correlazione zero solo asintoticamente

Propriet di variogramma e covariogramma


3.0
2.5
2.0
(h)

1.5
0.0

0.5

1.0

1.5
0.0

0.5

1.0

(h)

2.0

2.5

3.0

Variogram

0.0

0.5

1.0
h

1.5

2.0

0.0

0.5

1.0

1.5

2.0

effetto pepita (nugget effect): rappresenta variazioni di piccolissima scala e/o


errori di misura. Effetto di discontinuit allorigine.
Il significato di questo termine deriva dallesperienza in mineralogia (nelle miniere
doro) ed stato proposto da Matheron (1962).
35

36

Propriet di variogramma e covariogramma

Covariance Function

Rappresentazione grafica del semi-variogramma


a meno che il nugget effect non sia presente.
(0) = 0

( range ) = sill

Vicino allorigine, il semi-variogramma pu presentare alcuni


andamenti tipici:
a) andamento parabolico (la variabile continua e differenziabile
fino al secondo ordine)
b) andamento lineare (la variabile continua rispetto al secondo
ordine ma non differenziabile)
c) curva piatta (la variabile non mostra alcuna struttura, poich per
tutte le distanze i suoi valori non sono mai correlati).

37

38

Semivariogramma

Semivariogramma
Se s e s+h sono due punti nello spazio bidimensionale R2, allora
h=(h1,h2)

Per un angolo fissato , il grafico di

( h)

ha un andamento come:

( h) = (h1 , h2 ) = (| h |, )

Per un angolo fissato , il semi-variogramma misura le differenze


allaumentare delle distanze tra i punti (poich la varianza
degli incrementi).
Al variare di , i variogrammi corrispondenti evidenziano gli aspetti
legati alla direzione del fenomeno in esame (se al variare di il
semi-variogramma non cambia, il processo detto isotropico)

39

Se h=0, ( h) = 0
Aumenta al crescere di |h|
Aumenta indefinitamente o diviene stabile raggiunto un certo valore
40

Semivariogramma

Se il semi-variogramma raggiunge un limite (soglia), significa che


esiste una distanza a(), oltre la quale Z(s) e Z(s+h) non sono pi
correlate.
La distanza a detta range (e dipende da )

Modelli teorici di variogramma


Classe generale di funzioni di variogramma (Matrn):

1
h
h
(h) = c0 + c1 1 1
K
r
2 ( ) r

Poich il processo spaziale stazionario allora V [ Z (u )] = ,2 e per h>a:

2 (h) = V [ Z ( s + h) Z ( s )]

= V [ Z ( s + h)] + V [ Z ( s )] = 2 2
Alcuni andamenti
dellorigine:
parabolico

tipici

dei

semi-variogrammi

lineare

in

prossimit

nugget effect

0,

r > 0, Bounded

r , Unbounded
De Wijs: log(h)

> 0, integer

h2 log(h)

> 0, noninteger

Power: h2

= 0.5

Exponential:
exp( h / r)

=1

Whittle: (h / r)
K1(h / r)

Gaussian:
exp( h2 / r2)

h2 log(h)

42

Modelli teorici di variogramma

gaussiano (valido per D d , d 1) :

esponenziale (valido per D d , d 1) :

( h, ) =

Approximate function

41

Modelli teorici di variogramma

Equivalent function

0, h = 0
2
2
c0 + c g 1 exp || h || / a g , h 0

h=0

( h, ) =

c0 + ce 1 exp ( || h || / ae ), h 0
= ( c0 , ce , a e ) 0

)]

= ( c0 , c g , a g ) 0

Anche questo modello stazionario del secondo ordine, raggiunge la sill


(C(0)) pi lentamente del modello sferico, per funziona anche per d>3,
facilmente interpretabile e semplice da stimare. Il valore di range
maggiore di ae e la sill c0+ce.
43

Anche questo modello stazionario del secondo ordine e per


esso valgono le stesse considerazioni fatte per il modello
esponenziale.
44

Modelli teorici di variogramma


sferico (valido per D d , d = 1,2,3) :

Modelli teorici di variogramma


lineare

(valido

( h , ) =

per

0,
h=0

( h, ) = c0 + cs (3 / 2 )(|| h || / a s ) (1 / 2)(|| h || / a s ) 3 , 0 <|| h || a s

|| h ||> a s
c0 + c s ,

= ( c0 , c s , a s ) 0

,d 1 ):

0,
h = 0
+ b l || h ||,
h 0

c0
= ( c 0 , b l ), c 0 0 , b l 0

stazionari o del secondo ordine

Questo un modello isotropico ma non stazionario del secondo ordine,


infatti tende a per h che cresce, per stazionario intrinseco ed
quindi utilizzabile quando voglio studiare processi spaziali non
stazionari. Ovviamente non ha un valore range ne una sill.
45

Per d>3 questo modello non rispetta pi la condizione di semidefinita


negativit introdotta prima. E di facile interpretazione, realistico e
quindi molto usato nella pratica. Il valore range as, mentre il valore
di sill c0+cs.
Modello buono per modellare correlazioni spaziali che diminuiscono in
modo approssimativamente lineare con la distanza e sono nulle oltre
46
una certa distanza.

Altri modelli

ra zio n a le :

0,

( h , ) =

h = 0

2
2
c 0 + c r h / (1 + h / a r ) ,

h > 0

O nda :

( h , ) =
c0 + cw

P o w er la w (so lo

0,

0,

h
aw

1
sin

a , h > 0
h
w

stazio n a riet in trin seca) :


h = 0
h > 0

( h , ) =

c0 + c p h ,
0 < 2

h = 0

47

48

Anisotropia

Anisotropia

Se i semi-variogrammi variano con langolo (differenti direzioni nello


spazio) allora il processo detto essere anisotropico.

0.4
0.2
0.0

0.2
0.0

Lidea alla base che un processo che non isotropico nello spazio
originario, pu essere trasformato in uno isotropico per mezzo di una
trasformazione lineare dello spazio. In generale se il valore della
soglia tendono ad essere costanti in tutte le direzioni, allora il
processo presenta una anisotropia geometrica.

0.4

0.6

0 un semi-variogramma isotropico
A una matrice dxd (trasformazione lineare di Rd)

0.6

0.8

( h) = 0 (| Ah |)

0.8

1.0

Due semplici esempi di anisotropia:


Anisotropia geometrica (ellittica)

Anisotropic Process
1.0

Isotropic Process

0.0

0.2

0.4

0.6

0.8

1.0

0.0

0.2

0.4

0.6

49

0.8

1.0

50

Anisotropia
Anisotropia

15

11

12

-0 . 5

13
10
7
4
1

14
11
8
5
2

15
12
9
6
3

0.5

1.0

1.5

-1 . 5

-0 . 5

0.5

1.0

1.5

con
0.5 1.0 1.5

12
14

9
6

11
13

8
5

10

15
14
13

-0.5

10

11
4

12
5

4
1
-1 . 5

51

-1.5

0.5 1.0 1.5

sin
;
cos

= /4 e = 0 .5

15

-0.5

1 0 cos
A=

0 sin

= /4 e = 1

-1.5

Si ha che

0.5 1.0 1.5

14

10

-0.5

13

-1 . 5

s*=As

= 0 e = 0 .5

-1.5

-0.5

0.5 1.0 1.5

=0 e =1

-1.5

La correzione per lanisotropia geometrica consiste nel trovare una


trasformazione (ovvero una matrice A) del sistema di coordinate
s=(x,y) in un nuovo vettore di coordinate s*= (x*,y*) tale che il
processo Z(s*)=Z(As) abbia una funzione di covarianza ( o
variogramma) isotropica.
Ossia si cerca di riparametrizzare la distanza in ogni direzione in
modo che ci sia uniformit.

-0 . 5

0.5

1.0

1.5

-1 . 5

-0 . 5

0.5

1.0

1.5

52

Anisotropia

Lanisotropia geometrica pu essere corretta utilizzando una


trasformazione lineare dei siti (riferimento ad es. la deformation analysis
di Guttorp-Sampson*)
25 24
4

18

23

11
9

10

29

(h) = 1 (h) ++ p (h)

19
17
2
1620
3

8 5
32
7
14

12

(in cui i il semivariogramma di Zi). Quindi:

28
26
21
27
1
2524
23

15
13
22
31
30

4
29 18
19
17
2
16
11
9
20
3
10
6
32
78 5
14
12
28
26
27
121
15
1322
31
30

*Sampson P.D. and Guttorp P. (1992). Nonparametric estimation of


nonstationary spatial covariance structure. Journal of the American
Statistical Association, 87, 108119.
Meiring W., Guttorp P. and Sampson P.D. (1998). Space-time estimation
of grid-cell hourly ozone levels for assessment of a deterministic
model.Environmetal and Ecological Statistics, 5: 197222.
53

Strategia generale per la correzione dellanisotropia


1)
2)
3)

Se landamento delle correlazioni spaziali


isotropico, si modella quello che si dice
omnidirectional variogram.
Se landamento delle correlazioni spaziali
anisotropico, identificare se tale anisotropia
geomentrica o zonale.
Se c anisotropia geometrica:
a)
b)
c)

4)

Anisotropia

Anisotropia zonale:
Una generalizzazione della anisotropia ottenuta considerando
che se Z1 , Z 2 ,, Z p sono processi indipendenti ed intrinsecamente
stazionari, allora Z = Z1 + Z 2 ++ Z p un processo intrinsecamente
stazionario con semi-variogramma:

Identificare la rotazione degli assi per avere isotropia,


Correggere aggiustando la distanza di separazione nella
direzione di minimo-massimo
Adattare un variogramma isotropico al variogramma
empirico ottenuto con le nuove distanze.

Se lanisotropia geometrica e zonale, si corregge


la parte zonale con una struttura di variogramma e
la restante geometrica con una seconda struttura
55
di variogramma.

(h) = 0 ( Ai h)
i =1

(dove 0 un variogramma isotropico e Ai sono matrici) un


semivariogramma che generalizza lanisotropia geometrica in cui
ogni modello semplice ha il suo grado e la sua direzione di
anisotropia.
La generalizzazione detta anisotropia globale.
Lanisotropia zonale si presenta quando sia la soglia sia il range del
variogramma cambiano con la direzione (detta anche anisotropia
54
di soglia).

Stima parametrica del variogramma


Le stime non parametriche di (h) non necessariamente sono funzioni
condizionatamente definite negative (CNS)
Per poter fare delle previsioni spesso necessaria una stima a
distanze e/o direzioni non presenti nei dati
Dopo aver scelto una famiglia parametrica di variogrammi quale
criterio di adattamento utilizzare ?

Alcuni metodi a confronto (Zimmerman and Zimmerman,


Technometrics, 1991 pagg 77-91)
Minimi quadrati;
Massima verosimiglianza
Massima verosimiglianza ristretta

56

Stima del variogramma: Minimi quadrati

Stima del variogramma: Minimi quadrati

Il metodo dei minimi quadrati non richiede ipotesi distributive su (h)


Sia

( h ; ) una specificazione parametrica del semi-variogramma.

Vengono presi in considerazione tre tipi di stimatori dei minimi


quadrati:
1) OLS (Minimi quadrati ordinari)
( ( ))T ( ( ))
Si sceglie tale che
sia minimo.
2) GLS (Minimi quadrati generalizzati)
T
1
Si sceglie tale che ( ( )) V ( ) ( ( )) sia minimo.
dove V() la matrice di covarianza di che dipende da , dato
che il contesto non lineare.
3) WLS (minimi quadrati pesati)
Si sceglie tale che ( ( ))T W ( )1( ( )) sia minimo.
dove W() una matrice diagonale (nella diagonale ha V()) 57

Consideriamo solo il caso di un processo gaussiano e un caso pi


generale che permetta la considerazione di un trend deterministico
lineare
Z distribuito come N ( X , )

In molte applicazioni si pu assumere = V ( )

Se V non dipende da , si in un problema di minimi quadrati non


lineari (il problema risolto iterativamente)
Cressie (1985) suggerisce di approssimare i valori della diagonale
della matrice V() con:
2 ( h ; )
V [( h )] 2
N (h )
Nel caso di minimi quadrati pesati, si tratta di minimizzare la
quantit:
( ( ))T W ( )1( ( )) =
k

N ( hm )
2
( hm ) ( hm , )}
2{
m , )

2 ( h
m =1

58

Come si risolve questo problema?


Per mezzo della verosimiglianza profilo.
Si fissa

= ( X TV ( )1 X ) X TV ( ) Z
1

G 2 ( ) = Z X

parametro di scala

V ( )

Come si devono specificare W ( ) e V ( ) ?

Stima del variogramma: massima verosimiglianza

Stima del variogramma: massima verosimiglianza

In generale la valutazione di efficienza segue lordinamento:


eff(OLS) < eff(WLS) < eff(GLS)

matrice di covarianza standardizzata

) V ( ) (Z X )
T

Quindi per sostituzione:

dipendente da parametri ingnoti


La log-verosimiglianza :
1
1
n
n
l ( , , ) = log(2 ) + log( ) + log|V ( )| +
( Z X )V ( )1 ( Z X )
2
2
2
2
un parametro di disturbo.

59

1
1 2
n
n
l ( ( ), , ) = log(2 ) + log( ) + log|V ( )| +
G ( )
2
2
2
2

e derivando rispetto a si ottiene la soluzione


G 2 ( )
( ) =

n
G 2 ( ) 1
n
n
n
l * ( ) = l ( ( ), ( ), ) = log(2 ) + log
+ log|V ( )| +
2
2
n
2
2

Questo procedimento viene ripetuto per ogni per cui l* 60deve


essere valutata

Stima del variogramma: massima verosimiglianza

Stima del variogramma: massima verosimiglianza


ristretta

Vantaggi e svantaggi della MV:


1) I risultati asintotici sono validi sotto condizioni forti (difficili
da verificare)
2) Verosimiglianza multimodale
3) Sensibilit verso i valori di partenza
4) Calcolo della verosimiglianza con n punti un problema di
complessit O(n2)
5) Stime pi efficienti
6) Errori standard asintotici facilmente calcolati dalla Hessiana

Si consideri un semplice esempio: se

y 1 , , y n ~ N ( , 2 )

Lo stimatore di massima verosimiglianza di 2 :


che distorta.

(y
i

y )2 / n

La proposta di stimare dal campione dei contrasti:

y 1 y , y 2 y , , y n y

Pu essere facilmente mostrato che la stima di massima


verosimiglianza di
( y y )2 / ( n 1) (non distorto)

61

Stima del variogramma: massima verosimiglianza ristretta


Sia ora W = A T Z un vettore di n-q contrasti linearmente
indipendenti, con A T X = 0 . Allora:
W ~ N (0, A t A )
l W ( , ) =

1
n q
n q
1
1
log(2 ) +
log( ) + log| ATV ( ) A|+ W T ( ATV ( ) A) W
2
2
2
2

Che pu essere semplificato in:


l W ( , ) =

n q
n q
1
1
log(2 ) +
log( ) log| X T X | + log| X TV ( )1 X |
2
2
2
2
1
1 2
+ log|V ( )| +
G ( )
2
2

63

62

Previsione
Vi sono due tipi di previsione che si possono fare:
stimare la media del processo o il processo stesso sullintera
regione (stima globale)
prevedere il valore del processo in un nuovo sito u0 (stima
puntuale).
Metodi non stocastici (proposti per identificare il trend)
1) Metodo della media campionaria;
2) Metodo dei poligoni;
3) Metodo di triangolazione;
4) Median Polish (gi anticipato);
5) Splines.

Metodi stocastici
6) Kriging
64

Previsione: metodi non stocastici

Previsione: metodi non stocastici

Lo stimatore Z ( s ) di Z(s) pu essere costruito utilizzando una


combinazione lineare di Z(si) i=1,,n.
n

Z ( s0 ) = i ( s ) Z ( si )
i =1

with

Possibili estensioni:
Medie mobili

Z (s0 ) =

i ( s ) = 1
i =1

I (dist(s , s ) r)
0

i =1

1)

Metodo della media campionaria


Previsore:
1 n
Z ( s0 ) = Z ( si )
n i =1

1
i

Z (s )I (dist(s , s ) r)
i =1

Propriet: necessario scegliere r (grado di lisciamento),


richiede algoritmi di ordinamento, non un interpolatore esatto
(a meno che r 0).

Pregi e difetti: semplicit, velocit di calcolo, ma non robusto e


non un interpolatore esatto ( Z ( s i ) Z ( s i ) )

Medie pesate in base alle distanze:

Z ( s0 ) =

1
n

dist ( s0 , si )

dist ( s0 , si )

p i =1

Z ( si ); p 0

i =1

65

66

Previsione: metodi non stocastici

Previsione: metodi non stocastici

2) Metodo dei poligoni


Questo metodo utilizza poligoni di influenza per determinare larea di
influenza in un punto campionato. (il valore della variabile in un poligono
ponderato per la proporzione che larea occupa sullarea totale)
Si sceglie il pi vicino valore
osservato come stimatore di
Z(s0)
In questo caso se il punto
appartiene ad un poligono gli
viene dato il valore del punto
campionato (si sceglie il valore
pi vicino al sito). Questo metodo
sceglie i punti pi vicini per la stima

3) Metodo di triangolazione: in questo caso si interpola un piano passante


per i tre punti campionati pi vicini (in questo modo si evita il
problema della discontinuit che caratterizza la tecnica dei poligoni)
Sostanzialmente si risolve il sistema lineare

ax1 + by1 + c = z1
ax2 + by2 + c = z2
ax3 + by3 + c = z3
ottenendo

67

z0 = ax0 + by0 + c

68

Previsione: metodi non stocastici

Previsione: metodi non stocastici

4) Splines
Per stimare una funzione generica di trend possiamo adottare
una tecnica non parametrica, cio in cui non si definisce una
forma specifica della funzione di trend, ma si fissano solo
alcune ipotesi su di esse.
Esistono innumerevoli tecniche (non parametriche) che
consentono questo, noi ne esamineremo una in particolare,
quella basata sulle spline.
Per spline si intende una funzione smussata che passa per un
certo numero di punti (da scegliere) detti nodi.
Le ipotesi sottostanti sono:
-la superficie da prevedere (p(x,y)) sufficientemente
regolare.
- esistono le derivate parziali 2p/ x2, 2p/ y2, p/ x y, in
s0=(x0,y0)

Sia p(x,y) la superficie da prevedere, nel sito s0=(x0,y0):


n

p (Z, s0 ) = a0 + a1 x0 + a2 y0 + bi e( s0 si )
i =1

con e( s ) = s log( s ) /(16 );


2

I vettori a e b sono ottenuti risolvendo il sistema:


(K + n I )b + Xa = Z

X 'b = 0

dove (K )i , j = e( si s j )
e X una matrice la cui i-esima riga corrisponde a (1, xi , yi ) e 0 < .
Limite: questo metodo non produce precisione delle stime

69

70

Metodi stocastici: Kriging

Previsione: metodi non stocastici


5) Median Polish
Ipotesi di scomporre la media globale in effetto di coordinata x
ed effetto di coordinata y

m ( x, y ) = a + r ( x ) + c ( y )
Con funzione mediana (o media): mkl = a + rk + cl

{rk } e {c j } sono costanti arbitrarie con mediana (o media) nulla


Lidea quella di applicare lanalisi della varianza sulle mediane
(Tukey)

Si cerca un previsore esatto


Si considera un modello per la stima: un modello continuo per
variazione spaziale stocastica, che usi il modello di
variogramma.
Nella sua pi semplice formulazione il previsore una combinazione
lineare dei dati
Si cercano i pesi seguendo un criterio di ottimizzazione:
funzione di perdita quadratica e minimizzazione dellMSE di
previsione
stimatori non distorti che minimizzano la varianza di previsione

Si propone un algoritmo ricorsivo per la stima di a, r e c

71

72

Metodi stocastici: Kriging

Metodi stocastici: Kriging


IL RUOLO DELLA MATRICE X

Modello generale Z(s) = m(s) + (s)

X una matrice di covariate misurate nei siti s: le sue componenti


sono funzioni riferite allorigine

Kriging Universale (kriging in presenza di un drift)

Z=X+

In particolare, X pu avere la seguente forma:

f 0 ( s1 )

X =
f (s )
0 n

Questo modello appare realistico in quanto:


ha una componente deterministica (il drift non stazionario)
ha una componente stocastica che sfrutta il variogramma
Lidea che noi siamo in grado di stimare il variogramma sui residui
dal drift.
Il Kriging universale considera le componenti di larga scala e di
piccola scala.

f p ( s1 )

f p ( sn )

Se la variabile regionalizzata mostra un trend in una direzione


fissa, si pu ipotizzare un trend polinomiale:
L

m( s ) = al fl ( s )
l =0

73

74

Metodi stocastici: Kriging

Metodi stocastici: Kriging


In un generico sito s0:

ASSUNZIONI

E ( ) = E (0 ) = 0

z0 = xT0 + 0

E (Z ) = X

Inoltre:

Cov ( ,0 ) = Cov ( Z , Z 0 ) = T

= V ( )

= w ( )

in cui x0 il vettore di covariate in s0

Si cerca il previsore lineare:


02

z0 = T Z

02 = v0 ( )

Gli elementi della matrice di varianza/covarianza sono espressi come


una funzione di un numero finito di parametri (in funzione di
covariogramma parametrici)
contiene le varianze dei residui tra coppie di punti
contiene le varianze dei residui tra i punti e il punto obiettivo
75

sotto il vincolo:

T X = x0T

Il motivo che spinge a formulare questo vincolo riguarda il fatto


che pu essere introdotta anche lipotesi di non conoscenza dei e
si possono comunque determinare stimatori non distorti.

z0 z0 = x0T + 0 T ( X + )
= 0 T
76

Metodi stocastici: Kriging

Metodi stocastici: Kriging

Lerrore quadratico medio di previsione :

La soluzione trovata dunque:

2
E ( z0 z0 ) = 02 2 T + T
che pu essere minimizzato sotto il vincolo: T X = x0T

Sia

= 1 + 1 X ( X T 1 X )

(x

X T 1 )

Questo genera il predittore:

z0 = T Z = ( x0 X T 1 ) + T 1Z

2un vettore di moltiplicatori di Lagrange, cos che:

L = 02 2 T + T 2 ( T X x0T )

Sostitudendo si ottiene una misura della precisione dello stimatore:

Il condizionamento del primo ordine (differenziando rispetto a )

+ X = 0

2
E ( z0 z0 ) = 02 2 T + T

= 02 T 1 + ( x0 X T 1 )

= 1 ( + X )

(X

1 X )

(x

X T 1 )

Osservazione: Il variogramma non noto ma stimato.

Per trovare si sostituisce nellespressione lequazione trovata,


ottenendo:
1

= ( X T 1 X )

(x

X T 1 )

77

Metodi stocastici: Kriging

Metodi stocastici: Kriging

un vettore di dimensione ( n 1) il cui i-esimo elemento la


varianza degli incrementi:

Caso particolare: Kriging Ordinario

Z = mi n +

In questo caso:
Il valore atteso:

i = ( s0 si )

X = in

E ( Z ) = mi n

la matrice di varianza-covarianza con elementi: ij = ( si s j )



= ( + 1m* ) 1
Tale che Cov ( ,0 ) = Cov ( Z , Z 0 ) =

E ( z0 ) = m 02 = 0
n

Il predittore lineare quindi:

z0 = ' Z = i z ( ui )

m* =

i =1

Il vincolo del moltiplicatore di Lagrange quindi:

' in = 1

1 1 1
1 11

il vincolo del moltiplicatore di Lagrange

z0 = T Z = ( + 1m* ) 1 Z

Il predittore :

Necessario per garantire la correttezza.


Il kriging ordinario uno stimatore esatto.

78

Il suo MSE : E ( z0 z0 )2 = T 1 (1 1 1 ) (1 1 1)
T

79

= T 1 (1 1 1 ) / (1 1 1)
2

(1 1 )
1

80

Metodi stocastici: Kriging

Metodi stocastici: Kriging

Caso particolare: Kriging Semplice m(s), posto =0

1. Kriging semplice: m(s) una funzione nota;


2. Kriging ordinario: m(s) = m, m ignoto;
3. Kriging universale: m(s) = f(s), ignoto;

Z =
Il valore atteso:

E (Z ) = 0

E ( z0 ) = 0

Una volta stimata m(s) e lavorando sui residui 2 e 3 sono


equivalenti.

Il predittore lineare n quindi:

z0 = ' Z = i z ( ui )
i =1

E ( z0 ' Z) 2 = E ( z0 2 2 ' Zz0 + 'ZZ' ) = c( s0 , s0 ) 2'c + '


dove

c = (C ( s0 , s1 ),..., C ( s0 , sn )) ' e = (C ( si , s j ))i , j =1,...,n

c = = 1c
quindi il predittore risulta:
z0 = ' Z = c ' 1Z

Problema: si vuole prevedere Z(s0), con s0 {s1, , sn}


mediante le n osservazioni Z = (Z(s1), ,Z(sn)) disponibili.

Lerrore quadratico medio di previsione :


ks2 = E (e( s0 ) 2 ) = C ( s0 , s0 ) c' 1c

81

Metodi stocastici: Kriging

82

Metodi stocastici: Kriging su dati Wolfcamp

Esempio: dati Wolfcamp


Applichiamo un kriging universale ai dati wolfcamp stimando un
trend lineare (piano), il modello di variogramma che viene utilizzato
(e quindi stimato usando la massima verosimiglianza) esponenziale.
Si richiede la stima di 400 punti posti su di una griglia 20x20
allinterno del dominio di studio.

83

84

Metodi stocastici: Kriging su dati Wolfcamp

Metodi stocastici: tipi di kriging proposti in letteratura


Distinti da

Metodo conosciuto come

Dimensione dellobiettivo Punti


Cosa conosciuto?

Distribuzione

Numero di variabile
Linearit
85

Metodi stocastici: Kriging

(point) kriging

Aree

Block kriging

Media conosciuta

Simple kriging

Media sconosciuta ma
costante

Ordinary kriging

Media non costante

Universal kriging

Z(s) gaussiana

Kriging

lnZ(s) gaussiana

Log-normal kriging

Z(s) indicator variable

Indicator kriging

Gaussiana con qualche v.


anomalo isolato

Robust kriging

Sconosciuta

Median-polish kriging

(s) il processo casuale

Kriging bayesiano

Singola

Kriging

Multivariata

Cokriging

Predittore lineare in Z(s)

Kriging

Predittore lineare in
funzione di Z(s)

Disjunctive kriging

86

Metodi stocastici: Kriging

Lo stimatore Kriging un interpolatore perfetto: un


predittore che riproduce i dati. In altre parole, si pu calcolare
la previsione in un punto osservato e il valore ottenuto deve
coincidere con il valore osservato.
INFLUENZA DEI PARAMETRI DEL MODELLO SPAZIALE SULLA
STIMA DEL KRIGING
Effetto della scala

Se due semi-variogrammi differiscono solo per un fattore di scala, e la soglia


dei due semi-variogrammi differisce solo a meno di una costante, i pesi del
kriging sono uguali.
Quindi la stima in siti non campionati non cambia. Al contrario la varianza
riscalata con lo stesso coefficiente

Effetto della forma

Quando due semivariogrammi raggiungono asintoticamente la stessa soglia, ma


differenti pesi vicino allorigine
E un modello parametrico che descrive un processo regolare vicino allorigine.
La procedura di stima d pi peso ai dati vicini al punto di stima.
87

Effetto pepita (riguarda variabilit di microscala)


Se si ha un effetto pepita puro (il variogramma costante): tutte le
osservazioni sono incorrelate e la migliore previsione di un punto in
una regione sar una media semplice dei punti campionati.

0 per | h |= 0
c0 per | h |> 0

( h) =

Se si ha un effetto pepita non nullo, allora al crescere del rapporto


C(0)/C(h) le varianze dellerrore di stima aumenteranno.
Effetto del range: variazioni nel range modificano i pesi in modo
trascurabile. La stima globale, tuttavia, pu variare in modo
considerevole, mentre la varianza dellerrore diminuisce al crescere
del range.
Effetto dellanisotropia: quando c anisotropia i pesi relativi alla
direzione di massima continuit sono pi variabili di quelli delle altre
direzioni.
88

Validazione dei risultati

Metodi stocastici: Kriging


Adattare un modello che incorpora correlazione spaziale un
processo iterativo:
a) Viene adattata una superficie senza assumere correlazione
spaziale;
b)Viene fatta una verifica della correlazione spaziale nei residui;
c) Una nuova superficie che incorpori correlazione spaziale viene
introdotta;
d)I nuovi residui vengono analizzati.
Esistono diversi fattori che rendono non immediata la valutazione
della qualit delle stime kriging.
Usare direttamente lerrore di stima implica assumere che il
variogramma usato nel calcolo della previsione sia noto. INVECE
stimato!! Ci porta ad avere delle sovrastime degli errori.

Per valutare le performances di previsione vengono proposte


tecniche di cross-validation.
In una procedura di cross-validation un punto alla volta viene
rimosso dallinsieme dei dati disponibili. Quindi la variabile di
interesse stimata in tale punto utilizzando il modello da testare.
Indicando con Z(s) il valore rimosso dallinsieme delle osservazioni
e con Z(s[]) il valore stimato, dove e()= Z(s)- Z(s[]) indica la
differenza tra valore osservato e stimato. Se la media degli errori
di cross-validation vicina a zero, si pu ragionevolmente pensare
che lerrore non sia molto elevato. Al contrario, pu presentarsi un
errore si sovrastima sistematico.

89

90

Validazione dei risultati

Validazione dei risultati via cross-validation

Schema dei passi per la validazione dei risultati via CROSSVALIDATION

val.oss

val.prev.

residuo

Z ( s1 )

1 ( Z ( s 2 ),..., Z ( s n ))

e1 = Z ( s1 ) 1

Z ( s1 )

1 ( Z ( s1 ),..., Z ( s n 1 )) e1 = Z ( s n ) n
1 n ei2
CV =
n i =1 var(ei )

dove var(ei ) la stima della varianza ottenuta


omettendo l' osservazio ne i esima
CV > 1 sottostima
CV < 1 sovrastima
91

1)

Grafico a dispersione tra I


dati originali e quelli stimati

2)

Confronto tra quantili della


distribuzione empirica e
quella stimata

3)

Diagramma a dispersione dei


siti (rosso errore negativo,
blu errore positivo)

4)

Istogramma
dei
standardizzati

5)

Grafico a dipersione dei


residui standardizzati e i
valori previsti

6)

Grafico a dispersione dei


residui standardizzati e
valori osservati

residui

92

Eventuali approfondimenti

Armstrong M. (1998), Basic Linear Geostatistics, Springer


Verlag
Cressie, N. (1989) Geostatistics. The American Statistician, 43,
197-202.
Cressie, N. (1990) The origins of kriging. Mathematical Geology,
22, 239-252.
Chils J.P., Delfiner P. (1999), Geostatistics, modelling spatial
uncertainty, Wiley
Smith R. L. COURSE IN ENVIRONMENTAL STATISTICS
http://www.stat.unc.edu/postscript/rs/envstat/env.html
SITO: www.statistical.org (sito di statistica spaziale)

93

Principali pacchetti di elaborazione dati


Utilizzo di R (software gratuito) o SPLUS
(http://www.r-project.org/)

Con pacchetti specifici per le analisi spaziali:


Fields
(http://www.cgd.ucar.edu/stats/Software/Fields/)
Spatstat
(http://cran.rproject.org/src/contrib/Descriptions/spatstat.html)

95

Bibliografia utile
Per la parte di dati geostatistici(in ordine di chiarezza):
Schabenberger e Gotway (2005). Statistical Methods for spatial
data analysis. Chapman & Hall. Qualche paragrafo del capitolo 1, e
capitoli 4 e 5 (escludendo la trattazione dei processi spaziali nel
dominio delle frequenze)
Cressie (1993). Statistics for spatial data, Wiley capitoli 2,3.
Per collegamenti alla parte in laboratorio
Bivand, Pebesma e Gomez-Rubio (2008). Applied Spatial Data
Analysis with R. Springer. Capitolo 8.

94

Potrebbero piacerti anche