2) Dati Geostatistici

Dati geostastici
Analisi dei dati

geostatistici
Analisi statistiche esplorative

Processi spaziali
Ipotesi di stazionariet
Modellazione spaziale: possibili quesiti
Modellazione della componente di larga scala
Propriet di variogramma e covariogramma
Modelli teorici di variogramma
Stima parametrica della funzione di variogramma
Metodi di previsione stocastica e non
Metodi per la valutazione della bont di previsione

Le analisi esplorative mirano a:
-trovare eventuali siti con attributo caratterizzato da valore
anomalo spazialmente;
-individuare
direzioni
che
mostrano
aumento/diminuzione
dellattributo (TREND);
-considerare correlazione tra i valori osservati.
Gli strumenti per lanalisi che vengono proposti:
-permettono di costruire modelli che descrivono la dipendenza tra i
dati osservati
Prime analisi descrittive univariate sulle variabili oggetto di studio

Analisi grafiche (es. istogrammi per saggiare la normalit distributiva)
Analisi statistiche (es. analisi della simmetria,)
Analisi descrittive bivariate
Analisi grafiche (es. grafici che rappresentano le coppie di due
variabili per studiarne il tipo di relazione)
Analisi statistiche (es. regressione lineare e non lineare)
Descrizione spaziale delle variabili esaminate
Valori alti e bassi (dove sono posizionati? Sono raggruppati??)
La motivazione che spinge a modellare la dipendenza spaziale

riguarda leffetto che ha sugli intervalli di confidenza e sulla
procedura di test di ipotesi.
3

Strumenti grafici: contour plots, symbol maps, grayscale maps,
indicator maps
Analisi grafica delle relazioni spaziali (sia direzione che distanza)
tra punti-griglia (h-scatterplot)
Introduzione agli strumenti

dipendenza spaziale
per
misurare
la
Variogramma:
Variogramma una funzione della distanza e del relativo
orientamento delle coppie di punti che descrive il grado di
correlazione tra tali punti.
Kriging:: strumento per effettuare previsioni spaziali tenendo
conto della distanza e della correlazione attraverso la
funzione di variogramma.
Costruzione di mappe.
Processi spaziali
Processi spaziali
Il fenomeno studiato pu essere descritto per mezzo di processi

stocastici (variabili casuali).
Un processo stocastico un insieme di variabili casuali i cui membri
possono essere identificati (e indicizzati) seguendo una specifica
metrica.
Un processo spaziale un insieme di variabili casuali che sono indicizzate
d
da un insieme D contenente le coordinate spaziali di s.
{Z( s ) : s D }
0.0
0.2
0.4
0.6
0.8
1.0
z(si) il valore osservato nel punto si i=1,2,,n;
si D
(dominio)
Per ogni punto si , z(si) la realizzazione di una variabile casuale Z(si) con
valore atteso:
E[Z(si)]=m(si )
0.2
0.4
0.6
0.8
1.0
Il valore atteso rappresenta la media di larga scala di un attributo nel

sito si nellinsieme delle possibili realizzazioni di un esperimento
casuale
0.0
0.2
0.4
0.6
0.8
1.0
0.0
0.0
0.2
0.4
0.6
0.8
1.0
Il processo spaziale pu essere indicato con
I dati geostatistici sono osservati in un insieme finito di punti nello

spazio s1,s2,.,sn.
0.0
0.2
0.4
0.6
0.8
1.0
0.0
0.2
0.4
0.6
0.8
1.0
Processi spaziali
Processi spaziali
Come possibile apprendere informazioni riguardanti la variabilit di un
processo spaziale se si ha a disposizione una sola realizzazione?
Si d pi enfasi alla previsione: si cerca la relazione tra le osservazioni
disponibili nei punti campionati e quelli non campionati.
Come si pu procedere nellinferenza statistica con un campione di
dimensione 1.
Se il processo gode di precise propriet (che verranno illustrate nei
lucidi seguenti) un campione di dimensione 1 pu fornire informazioni
riguardanti il processo generatore dei dati.
Il modello pi semplice per rappresentare una variabile aleatoria

spaziale tiene conto di due aspetti:
a) aspetto strutturale che riflette le caratteristiche globali del
fenomeno (trend) e tiene conto delle variazioni di larga scala
(m(s));
b) aspetto casuale che tiene conto delle irregolarit locali
(variazioni su piccola scala) che il fenomeno presenta ((s))
Z( s ) = m( s ) + ( s )
sD
10
Processi spaziali
Processi spaziali
Quando interessa la interpretazione del fenomeno: si d pi
peso alla componente di larga scala.
Quando interessa la previsione: si d pi peso alla componente di
piccola scala.
Assunzioni tipiche del modello lineare precedentemente
proposto:
La componente di larga scala (m(s)) pu essere considerata
come una funzione delle coordinate spaziali;
La componente di piccola scala ((s)) generalmente segue
una distribuzione normale multivariata
~ MVN ( 0, ( ) )
11
Un processo casuale generalmente definito dalle funzioni di

distribuzione finito-dimensionali:
Fs1,s2,,sn(z1,z2,zn) = P {Z(s1) z1, Z(s2)z2,,Z(sn)zn}
In generale, per dati spaziali, la seguente assunzione risulta
valida
Fs1 ,s2 ,...,sn ( z1 , z2 ,..., zn ) Fs1 ( z1 ) Fs2 ( z2 ) ...Fsn ( zn )
Linsieme delle funzioni Fs1,s2,,sn(z1,z2,zn) per ogni n
E per ogni possibile valore del dominio (s1,s2,sn) linsieme delle
distribuzioni finito dimensionali del processo casuale Z(s).
In molto casi, la conoscenza della distribuzione congiunta del
processo stocastico non necessaria, poich generalmente molto
spesso vengono utilizzati i primi due momenti che permettono
soddisfacenti approssimazioni nel caso generale e soluzioni
12
esatte nel caso gaussiano.
Processi spaziali: i momenti
Processi spaziali:ipotesi di stazionariet forte
Quando si parla di geostatistica lineare vengono presi in

considerazione solo i primi due momenti del processo casuale Z(s).
STAZIONARIETA FORTE
d
Un processo stocastico Z( s ) : s D
viene detto stazionario in
senso stretto quando: Fs1,s2,,sm(z1,z2,zm)= Fs1+h,s2+h,,sm+h(z1,z2,zm)
Un processo stazionario in senso stretto si ripete invariato in tutto il

dominio.
La stazionariet in senso stretto una condizione restrittiva e non
necessaria per utilizzare molti metodi statistici dellanalisi
statistica dei dati spaziali.
Un esempio di funzione di covarianza spaziale e di

variogramma
Il variogramma un misura della variabilit spaziale con le

propriet pi importanti: queste assumono maggiore importanza
quando i dati spaziali sono disposti su una griglia regolare e
quando seguono una distribuzione normale multivariata.
2.5
2.0
(h)
Le funzioni C(,) e (,) dipendono dai siti si e sj considerati cos che si

dovrebbe disporre di alcune realizzazioni per stimarli.
Ma se C(,) e (,) dipendono solo dal vettore di separazione h=si-sj tra
i punti del dominio, allora ogni coppia di dati separata dal vettore
h pu essere considerata come una realizzazione della coppia
[Z(si)-Z(sj)].
0.0
0.5
1.0
1.5
0.0
0.5
1.0
Il maggiore svantaggio che sensibile ai valori estremi
1.5
2.5
2.0
3.0
Variogram
3.0
2.Funzione di covarianza: se Z(si) e Z(sj) hanno una varianza finita

nei punti si e sj allora hanno una funzione di covarianza che dipende
da si e sj.
C Z ( si ) , Z ( s j ) = E ( Z ( si ) m ( si ) ) Z ( s j ) m ( s j )
3.Semivariogramma (varianza degli incrementi): la funzione di
semivariogramma definita come la varianza delle differenze
[Z(si)-Z(sj)] :
1
( si , s j ) = V Z ( si ) Z ( s j )
14
2
13
C(h)
Momenti del secondo ordine

2
1.Varianza del processo: V [ Z ( s )] = E ( Z ( s ) m ( s ) )
Le condizioni di stazionariet possono essere basate anche sui primi

due momenti della distribuzione del processo spaziale.
Covariance function
Momento del primo ordine

Si consideri Z(s) nel punto generico s nel dominio; se Z(s) ha valore
atteso finito, in generale dipendente da s, possibile scrivere
che: E [ Z ( s )] = m ( s )
0.0
0.5
1.0
h
1.5
0.0
0.5
1.0
1.5
15
16
Processi spaziali: ipotesi di stazionariet
Ai fini inferenziali, si dovrebbe disporre di pi di un campione.

Poich questo non avviene generalmente nella pratica, alcune
ipotesi sono necessarie.
Ipotesi: necessario che il variogramma e il covariogramma
dipendano solamente dal vettore di separazione: h= si-sj e non solo
dalla posizione relativa di si e sj (in questo caso si parla di stazionariet
in senso debole)
Si possono individuare due tipi di stazionariet basati sui momenti del

secondo ordine a seconda se lassunzione riguardi la covarianza o il
variogramma.
STAZIONARIETA DEL SECONDO ORDINE: Un processo spaziale
Z( s ) : s D d stazionario del secondo ordine quando:
Il valore atteso esiste e non dipende dalla posizione: E(Z(s))= m
Per ogni coppia di variabili (Z(s),Z(s+h)) il covariogramma esiste e
dipende solo da h (covariogramma stazionario)
Cov[Z(s),Z(s+h)]= E[Z(s)Z(s+h)]-m2=C(h)
In tal caso, si considerano replicazioni del
corrispondenza della distanza h, tutte le coppie
(Z(si),Z(sj)) caratterizzate da una distanza h.
processo in
del processo
La variabilit di un processo spaziale stazionario del secondo ordine la

stessa ovunque nel dominio:
Cov[Z(s),Z(s+0)]= C(0)=E[Z(s)2]-m2=V[Z(s)]
Tale assunzione importante perch ci suggerisce che il processo

effettivamente si ripete nello spazio, producendo replicazioni
necessarie per la stima e linferenza
17
Stazionariet del secondo ordine presuppone lesistenza del

covariogramma.
Lesistenza della funzione di covarianza implica lesistenza di una
varianza finita.
Sotto la condizione di stazionariet del secondo ordine
covariogramma e variogramma sono equivalenti nella descrizione
della correlazione spaziale.
Se tutte le varianze sono assunte finite, allora la stazionariet in
senso forte.
Un processo stocastico detto gaussiano quando k 1 and s1 ,..., sk D
vettore Z ( s1 ) , Z ( s2 ) ,..., Z ( sk )
distribuito come una normale
multivariata, cio: Z ( s1 ) , Z ( s2 ) ,..., Z ( sk ) ~ MVN ( , )
Un processo gaussiano stazionario del secondo ordine anche
stazionario in senso stretto.
19
Come conseguenza si ha che se il covariogramma stazionario, allora

anche la varianza e il variogramma sono stazionari:
V[Z(s)]=E[(Z(s)-m)2]= C(0) e 2(h)=2[C(0)-C(h)] (dimostrazione)

18

Lesistenza del variogramma non una assunzione forte come
quella che si pu porre sul covariogramma: le ipotesi di
stazionariet del secondo ordine possono essere indebolite
(parzialmente rilassate) assumendo lesistenza del variogramma.
Anche se un processo Z(s) non stazionario, gli incrementi Z(s+h)-Z(s)
potrebbero comunque essere stazionari.
STAZIONARIETA INTRINSECA
Un processo spaziale {Z( s ) : s D d } intrinsecamente stazionario
quando:
il valore atteso esiste e non dipende dalla posizione: E(Z(s))= m (pu
essere indebolita)
V(Z(s+h)-Z(s))=2(h) (il variogramma esiste)
La stazionariet del secondo ordine implica quella intrinseca,

linverso non sempre vero.
Il processo ha una varianza finita che non dipende da s: V(Z(s))=2
20

Sotto le ipotesi di stazionariet intrinseca:
a) La varianza degli incrementi corrisponde al valore atteso del quadrato
degli incrementi;
b) La famiglia dei processi intrinsecamente stazionari pi ampia di
quella dei processi stazionari del secondo ordine.
Lipotesi posta sul valore atteso significa che non si ammette un trend in
una direzione specifica.
Quando un processo stocastico intrinsecamente stazionario con
semivariogramma ( h ) , h R d
allora:
se ( h ) = 0 ( h ) per una qualche funzione 0 , cio se il semivariogramma dipende da h solo per mezzo del valore assoluto h , allora il
processo detto isotropico.
Modellazione spaziale: Possibili quesiti

1. Come stimare il trend : modellazione della componente di larga scala
(stima di superfici di trend)
2. Come caratterizzare la dipendenza spaziale: stima della funzione di
variogramma/covariogramma (variogramma)
3. Come prevedere un valore Z(s) in un punto s* diverso da quelli
osservati: previsione (kriging)
Isotropia: dipendenza solo dalla distanza e non dalla direzione

Un processo stocastico che intrinsecamente stazionario e isotropico
detto omogeneo.
21
Modellazione della componente di larga scala

-Analisi grafica descrittiva (grafici a barre tridimensionali)
22
Analisi statistica della componente di larga

scala: metodi non parametrici
Scomposizione della variabilit:
-Analisi statistica:
Z ( s ) = Z ( sx , y ) = + x + y + xy
Metodi non parametrici:

Scomposizione della variabilit
Algoritmo median-polish
Metodi parametrici
23
Algoritmo di Median Polish:

1)Si calcola la mediana per ogni riga e si riporta alla fine della riga. Si
sottrae dunque tale mediana di riga da ogni punto per ogni riga;
2)Si calcola la mediana della mediana di riga e si registra tale valore
come effetto complessivo. Si sottrae tale effetto complessivo da
ognuna delle mediane di riga;
3)Si calcola la mediana di ogni colonna e si registra alla fine delle
colonne. Si sottrae la mediana di colonna da ogni colonna;
4)Si calcola la mediana della mediana di colonna e si aggiunge all
effetto complessivo. Si sottrae tale somma alleffetto complessivo da
ognuna delle mediane di colonna;
5)Si ripetono i passi 1)-4) fino a che non ci sono variazioni nelle
mediane.
24
Analisi statistica della componente di larga scala:

metodi parametrici
Analisi statistica della componente di larga scala:

applicazione sui dati di wolfcamp
Il modello di trend pi semplice una funzione lineare nelle

coordinate (piano):
s=(x,y); (s)=0+ 1x+ 2y, sD
Posso aggiungere termini di ordine superiore:
s=(x,y); (s)=0+ 1x+ 2y+3x2+4xy+5y2, sD
Tanti pi termini aggiungo tanto migliore sar ladattamento ai

dati, ma tanto pi rigida sar la funzione di larga scala
Pi in generale abbiamo delle superfici di trend della forma:
s=(x,y); (s)=0+ 1x+ 2y, sD
( s ) = i f ( si )
i =1
i parametri si possono stimare con il metodo dei minimi quadrati

(almeno in prima approssimazione) ottenendo:
s=(x,y); (s)=0+ 1x+ 2y+3x2+4xy+5y2, sD
( s) = i f ( si )
25
26
i =1

La specificazione di una funzione parametrica per 0
inferenziali.
utile per fini
1)Il covariogramma C(h) di un processo stocastico stazionario del secondo

ordine Z(s) dovrebbe essere una funzione definita positiva:
n
i =1 j =1
s1 ,..., sn D
and i , i = 1,..., n
n n
n
i j C si s j = V i Z ( si )
i =1
i =1 j =1
where
(spiegazione dettagliata in Cressie, 1993)
i = 0
i =1
Utilizzando le propriet 1) e 2) si possono definire 2 ulteriori propriet

nella specificazione di modelli teorici (modelli parametrici) per
covariogrammi e semi-variogrammi.
3) Una combinazione lineare di covariogrammi (semi-variogrammi) con
coefficienti positivi ancora un covariogramma (semi-variogramma):
Questa condizione necessaria perch per definizione si ha che:

i =1 j =1
i j si s j 0
Per una adeguata specificazione di una funzione parametrica necessario

definire le propriet che riguardano variogramma e covariogramma.
i j C si s j 0
2) Se il processo stocastico Z(s) soddisfa le ipotesi intrinseche con

semivariogramma ( h ) , allora questa funzione deve essere definita
n
negativa, cio: n n
C ( h ) = ai 2Ci ( h )
i =1
27
( h ) = ai 2 i ( h )
i =1
28
Variogramma empirico
Il variogramma dato dalla varianza delle differenze della variabile
casuale in due siti.
Se due unit sono tra loro vicine la loro differenza sar piccola e
cos pure la sua varianza. Al crescere della lontananza tra i siti, le
differenze diventano pi grandi e la varianza assume valori maggiori.
4) Un prodotto di covariogrammi ancora un covariogramma

n
C ( h ) = Ci ( h )
i =1
(questa propriet non vera per i semi-variogrammi)

5)
C ( h ) = C ( h )
6)
C ( h) C (0)
7)
( h) 0
( h) = ( h)
Graficamente si pu rappresentare un diagramma di
dispersione delle coppie (||si-sj||, (Z(si)-Z(sj))2/2)
(il covariogramma decresce allaumentare di h)
(0) = 0
* Utile per rilevare valori

anomali globali
29
30
Variogramma empirico: proposta di stimatori
Variogramma empirico: una applicazione ai dati di wolfcamp
classico:
2(h) =
1
N(h)
(Z(s ) Z(s )) ;
2
N ( h)
robusto:
1
1
2 (h) =
(0.457+ 0.494/ | N(h) |) N(h)
La media campionaria molto

sensibile ai valori anomali ci serve
uno stimatore robusto
4
|
Z
(
s
)
Z
(
s
)
|
,
i
j
N ( h)
1/ 2
h d , h = d (si , s j ) ,
Dove N(h) il numero di coppie a lag h
31
32
Il variogramma empirico (h) uno stimatore corretto per (h)

fornisce stime solo fino ad un certo numero di lags spaziali.
ma
3.0
2.5
2.0
0.0
0.5
1.0
1.5
(h)
2.0
(h)
1.5
1.0
0.0
b) seguendo una o pi direzioni:

se i variogrammi sono differenti rispetto alle direzioni che si
prendono in considerazione, questo pu dipendere dallesistenza di un
trend o di anisotropia.
0.5
Come effettuare valutazioni empiriche?

a) seguendo tutte le direzioni, sotto lipotesi che il processo spaziale sia
stazionario e la correlazione spaziale sia isotropica:
questo variogramma stimato utilizzando tutti i dati ( come una
media su tutti i variogrammi che seguono qualche direzione specifica);
2.5
3.0
Variogramma empirico: alcune considerazioni
0.0
0.5
1.0
1.5
2.0
0.0
Per ottenere stime di (h) ad un arbitrario lag spaziale il variogramma

empirico va smussato: per questo motivo si adatta un modello di
variogramma parametrico.
33
0.5
1.0
1.5
2.0
Sill(soglia): corrisponde al valore del semivariogramma corrispondente ad

osservazioni incorrelate (asintoto del semivariogramma); solamente i processi
stazionari in senso debole presentano una soglia e questa coincide con C(0).
range: distanza alla quale le osservazioni non sono pi correlate (pu essere infinito
o finita) (h) diviene costante (C(h) 0). Lo definiamo in maniera approssimata
34
perch per alcuni processi la correlazione zero solo asintoticamente

3.0
2.5
2.0
(h)
1.5
0.0
0.5
1.0
1.5
0.0
0.5
1.0
(h)
2.0
2.5
3.0
Variogram
0.0
0.5
1.0
h
1.5
2.0
0.0
0.5
1.0
1.5
2.0
effetto pepita (nugget effect): rappresenta variazioni di piccolissima scala e/o

errori di misura. Effetto di discontinuit allorigine.
Il significato di questo termine deriva dallesperienza in mineralogia (nelle miniere
doro) ed stato proposto da Matheron (1962).
35
36
Covariance Function
Rappresentazione grafica del semi-variogramma

a meno che il nugget effect non sia presente.
(0) = 0
( range ) = sill
Vicino allorigine, il semi-variogramma pu presentare alcuni

andamenti tipici:
a) andamento parabolico (la variabile continua e differenziabile
fino al secondo ordine)
b) andamento lineare (la variabile continua rispetto al secondo
ordine ma non differenziabile)
c) curva piatta (la variabile non mostra alcuna struttura, poich per
tutte le distanze i suoi valori non sono mai correlati).
37
38
Semivariogramma
Semivariogramma
Se s e s+h sono due punti nello spazio bidimensionale R2, allora
h=(h1,h2)
Per un angolo fissato , il grafico di
( h)
ha un andamento come:
( h) = (h1 , h2 ) = (| h |, )
Per un angolo fissato , il semi-variogramma misura le differenze

allaumentare delle distanze tra i punti (poich la varianza
degli incrementi).
Al variare di , i variogrammi corrispondenti evidenziano gli aspetti
legati alla direzione del fenomeno in esame (se al variare di il
semi-variogramma non cambia, il processo detto isotropico)
39
Se h=0, ( h) = 0
Aumenta al crescere di |h|
Aumenta indefinitamente o diviene stabile raggiunto un certo valore
40
Semivariogramma
Se il semi-variogramma raggiunge un limite (soglia), significa che

esiste una distanza a(), oltre la quale Z(s) e Z(s+h) non sono pi
correlate.
La distanza a detta range (e dipende da )

Classe generale di funzioni di variogramma (Matrn):
1
h
h
(h) = c0 + c1 1 1
K
r
2 ( ) r
Poich il processo spaziale stazionario allora V [ Z (u )] = ,2 e per h>a:
2 (h) = V [ Z ( s + h) Z ( s )]
= V [ Z ( s + h)] + V [ Z ( s )] = 2 2
Alcuni andamenti
dellorigine:
parabolico
tipici
dei
semi-variogrammi
lineare
in
prossimit
nugget effect
0,
r > 0, Bounded
r , Unbounded
De Wijs: log(h)
> 0, integer
h2 log(h)
> 0, noninteger
Power: h2
= 0.5
Exponential:
exp( h / r)
=1
Whittle: (h / r)
K1(h / r)
Gaussian:
exp( h2 / r2)
h2 log(h)
42
gaussiano (valido per D d , d 1) :
esponenziale (valido per D d , d 1) :
( h, ) =
Approximate function
41
Equivalent function
0, h = 0
2
2
c0 + c g 1 exp || h || / a g , h 0
h=0
( h, ) =
c0 + ce 1 exp ( || h || / ae ), h 0
= ( c0 , ce , a e ) 0
)]
= ( c0 , c g , a g ) 0
Anche questo modello stazionario del secondo ordine, raggiunge la sill

(C(0)) pi lentamente del modello sferico, per funziona anche per d>3,
facilmente interpretabile e semplice da stimare. Il valore di range
maggiore di ae e la sill c0+ce.
43
Anche questo modello stazionario del secondo ordine e per

esso valgono le stesse considerazioni fatte per il modello
esponenziale.
44

sferico (valido per D d , d = 1,2,3) :

lineare
(valido
( h , ) =
per
0,
h=0
( h, ) = c0 + cs (3 / 2 )(|| h || / a s ) (1 / 2)(|| h || / a s ) 3 , 0 <|| h || a s
|| h ||> a s
c0 + c s ,
= ( c0 , c s , a s ) 0
,d 1 ):
0,
h = 0
+ b l || h ||,
h 0
c0
= ( c 0 , b l ), c 0 0 , b l 0
stazionari o del secondo ordine
Questo un modello isotropico ma non stazionario del secondo ordine,

infatti tende a per h che cresce, per stazionario intrinseco ed
quindi utilizzabile quando voglio studiare processi spaziali non
stazionari. Ovviamente non ha un valore range ne una sill.
45
Per d>3 questo modello non rispetta pi la condizione di semidefinita

negativit introdotta prima. E di facile interpretazione, realistico e
quindi molto usato nella pratica. Il valore range as, mentre il valore
di sill c0+cs.
Modello buono per modellare correlazioni spaziali che diminuiscono in
modo approssimativamente lineare con la distanza e sono nulle oltre
46
una certa distanza.
Altri modelli
ra zio n a le :
0,
( h , ) =
h = 0
2
2
c 0 + c r h / (1 + h / a r ) ,
h > 0
O nda :
( h , ) =
c0 + cw
P o w er la w (so lo
0,
0,
h
aw
1
sin
a , h > 0
h
w
stazio n a riet in trin seca) :

h = 0
h > 0
( h , ) =
c0 + c p h ,
0 < 2
h = 0
47
48
Anisotropia
Anisotropia
Se i semi-variogrammi variano con langolo (differenti direzioni nello

spazio) allora il processo detto essere anisotropico.
0.4
0.2
0.0
0.2
0.0
Lidea alla base che un processo che non isotropico nello spazio
originario, pu essere trasformato in uno isotropico per mezzo di una
trasformazione lineare dello spazio. In generale se il valore della
soglia tendono ad essere costanti in tutte le direzioni, allora il
processo presenta una anisotropia geometrica.
0.4
0.6
0 un semi-variogramma isotropico
A una matrice dxd (trasformazione lineare di Rd)
0.6
0.8
( h) = 0 (| Ah |)
0.8
1.0
Due semplici esempi di anisotropia:

Anisotropia geometrica (ellittica)
Anisotropic Process
1.0
Isotropic Process
0.0
0.2
0.4
0.6
0.8
1.0
0.0
0.2
0.4
0.6
49
0.8
1.0
50
Anisotropia
Anisotropia
15
11
12
-0 . 5
13
10
7
4
1
14
11
8
5
2
15
12
9
6
3
0.5
1.0
1.5
-1 . 5
-0 . 5
0.5
1.0
1.5
con
0.5 1.0 1.5
12
14
9
6
11
13
8
5
10
15
14
13
-0.5
10
11
4
12
5
4
1
-1 . 5
51
-1.5
0.5 1.0 1.5
sin
;
cos
= /4 e = 0 .5
15
-0.5
1 0 cos
A=
0 sin
= /4 e = 1
-1.5
Si ha che
0.5 1.0 1.5
14
10
-0.5
13
-1 . 5
s*=As
= 0 e = 0 .5
-1.5
-0.5
0.5 1.0 1.5
=0 e =1
-1.5
La correzione per lanisotropia geometrica consiste nel trovare una

trasformazione (ovvero una matrice A) del sistema di coordinate
s=(x,y) in un nuovo vettore di coordinate s*= (x*,y*) tale che il
processo Z(s*)=Z(As) abbia una funzione di covarianza ( o
variogramma) isotropica.
Ossia si cerca di riparametrizzare la distanza in ogni direzione in
modo che ci sia uniformit.
-0 . 5
0.5
1.0
1.5
-1 . 5
-0 . 5
0.5
1.0
1.5
52
Anisotropia
Lanisotropia geometrica pu essere corretta utilizzando una

trasformazione lineare dei siti (riferimento ad es. la deformation analysis
di Guttorp-Sampson*)
25 24
4
18
23
11
9
10
29
(h) = 1 (h) ++ p (h)
19
17
2
1620
3
8 5
32
7
14
12
(in cui i il semivariogramma di Zi). Quindi:
28
26
21
27
1
2524
23
15
13
22
31
30
4
29 18
19
17
2
16
11
9
20
3
10
6
32
78 5
14
12
28
26
27
121
15
1322
31
30
*Sampson P.D. and Guttorp P. (1992). Nonparametric estimation of

nonstationary spatial covariance structure. Journal of the American
Statistical Association, 87, 108119.
Meiring W., Guttorp P. and Sampson P.D. (1998). Space-time estimation
of grid-cell hourly ozone levels for assessment of a deterministic
model.Environmetal and Ecological Statistics, 5: 197222.
53
Strategia generale per la correzione dellanisotropia

1)
2)
3)
Se landamento delle correlazioni spaziali

isotropico, si modella quello che si dice
omnidirectional variogram.
Se landamento delle correlazioni spaziali
anisotropico, identificare se tale anisotropia
geomentrica o zonale.
Se c anisotropia geometrica:
a)
b)
c)
4)
Anisotropia
Anisotropia zonale:
Una generalizzazione della anisotropia ottenuta considerando
che se Z1 , Z 2 ,, Z p sono processi indipendenti ed intrinsecamente
stazionari, allora Z = Z1 + Z 2 ++ Z p un processo intrinsecamente
stazionario con semi-variogramma:
Identificare la rotazione degli assi per avere isotropia,

Correggere aggiustando la distanza di separazione nella
direzione di minimo-massimo
Adattare un variogramma isotropico al variogramma
empirico ottenuto con le nuove distanze.
Se lanisotropia geometrica e zonale, si corregge

la parte zonale con una struttura di variogramma e
la restante geometrica con una seconda struttura
55
di variogramma.
(h) = 0 ( Ai h)
i =1
(dove 0 un variogramma isotropico e Ai sono matrici) un

semivariogramma che generalizza lanisotropia geometrica in cui
ogni modello semplice ha il suo grado e la sua direzione di
anisotropia.
La generalizzazione detta anisotropia globale.
Lanisotropia zonale si presenta quando sia la soglia sia il range del
variogramma cambiano con la direzione (detta anche anisotropia
54
di soglia).
Stima parametrica del variogramma

Le stime non parametriche di (h) non necessariamente sono funzioni
condizionatamente definite negative (CNS)
Per poter fare delle previsioni spesso necessaria una stima a
distanze e/o direzioni non presenti nei dati
Dopo aver scelto una famiglia parametrica di variogrammi quale
criterio di adattamento utilizzare ?
Alcuni metodi a confronto (Zimmerman and Zimmerman,

Technometrics, 1991 pagg 77-91)
Minimi quadrati;
Massima verosimiglianza
Massima verosimiglianza ristretta
56
Stima del variogramma: Minimi quadrati
Stima del variogramma: Minimi quadrati
Il metodo dei minimi quadrati non richiede ipotesi distributive su (h)

Sia
( h ; ) una specificazione parametrica del semi-variogramma.
Vengono presi in considerazione tre tipi di stimatori dei minimi

quadrati:
1) OLS (Minimi quadrati ordinari)
( ( ))T ( ( ))
Si sceglie tale che
sia minimo.
2) GLS (Minimi quadrati generalizzati)
T
1
Si sceglie tale che ( ( )) V ( ) ( ( )) sia minimo.
dove V() la matrice di covarianza di che dipende da , dato
che il contesto non lineare.
3) WLS (minimi quadrati pesati)
Si sceglie tale che ( ( ))T W ( )1( ( )) sia minimo.
dove W() una matrice diagonale (nella diagonale ha V()) 57
Consideriamo solo il caso di un processo gaussiano e un caso pi

generale che permetta la considerazione di un trend deterministico
lineare
Z distribuito come N ( X , )
In molte applicazioni si pu assumere = V ( )
Se V non dipende da , si in un problema di minimi quadrati non

lineari (il problema risolto iterativamente)
Cressie (1985) suggerisce di approssimare i valori della diagonale
della matrice V() con:
2 ( h ; )
V [( h )] 2
N (h )
Nel caso di minimi quadrati pesati, si tratta di minimizzare la
quantit:
( ( ))T W ( )1( ( )) =
k
N ( hm )
2
( hm ) ( hm , )}
2{
m , )
2 ( h
m =1
58
Come si risolve questo problema?

Per mezzo della verosimiglianza profilo.
Si fissa
= ( X TV ( )1 X ) X TV ( ) Z
1
G 2 ( ) = Z X
parametro di scala
V ( )
Come si devono specificare W ( ) e V ( ) ?
Stima del variogramma: massima verosimiglianza
In generale la valutazione di efficienza segue lordinamento:

eff(OLS) < eff(WLS) < eff(GLS)
matrice di covarianza standardizzata
) V ( ) (Z X )
T
Quindi per sostituzione:
dipendente da parametri ingnoti

La log-verosimiglianza :
1
1
n
n
l ( , , ) = log(2 ) + log( ) + log|V ( )| +
( Z X )V ( )1 ( Z X )
2
2
2
2
un parametro di disturbo.
59
1
1 2
n
n
l ( ( ), , ) = log(2 ) + log( ) + log|V ( )| +
G ( )
2
2
2
2
e derivando rispetto a si ottiene la soluzione

G 2 ( )
( ) =
n
G 2 ( ) 1
n
n
n
l * ( ) = l ( ( ), ( ), ) = log(2 ) + log
+ log|V ( )| +
2
2
n
2
2
Questo procedimento viene ripetuto per ogni per cui l* 60deve

essere valutata

ristretta
Vantaggi e svantaggi della MV:

1) I risultati asintotici sono validi sotto condizioni forti (difficili
da verificare)
2) Verosimiglianza multimodale
3) Sensibilit verso i valori di partenza
4) Calcolo della verosimiglianza con n punti un problema di
complessit O(n2)
5) Stime pi efficienti
6) Errori standard asintotici facilmente calcolati dalla Hessiana
Si consideri un semplice esempio: se
y 1 , , y n ~ N ( , 2 )
Lo stimatore di massima verosimiglianza di 2 :

che distorta.
(y
i
y )2 / n
La proposta di stimare dal campione dei contrasti:
y 1 y , y 2 y , , y n y
Pu essere facilmente mostrato che la stima di massima

verosimiglianza di
( y y )2 / ( n 1) (non distorto)
61
Stima del variogramma: massima verosimiglianza ristretta

Sia ora W = A T Z un vettore di n-q contrasti linearmente
indipendenti, con A T X = 0 . Allora:
W ~ N (0, A t A )
l W ( , ) =
1
n q
n q
1
1
log(2 ) +
log( ) + log| ATV ( ) A|+ W T ( ATV ( ) A) W
2
2
2
2
Che pu essere semplificato in:

l W ( , ) =
n q
n q
1
1
log(2 ) +
log( ) log| X T X | + log| X TV ( )1 X |
2
2
2
2
1
1 2
+ log|V ( )| +
G ( )
2
2
63
62
Previsione
Vi sono due tipi di previsione che si possono fare:
stimare la media del processo o il processo stesso sullintera
regione (stima globale)
prevedere il valore del processo in un nuovo sito u0 (stima
puntuale).
Metodi non stocastici (proposti per identificare il trend)
1) Metodo della media campionaria;
2) Metodo dei poligoni;
3) Metodo di triangolazione;
4) Median Polish (gi anticipato);
5) Splines.
Metodi stocastici
6) Kriging
64
Previsione: metodi non stocastici
Lo stimatore Z ( s ) di Z(s) pu essere costruito utilizzando una

combinazione lineare di Z(si) i=1,,n.
n
Z ( s0 ) = i ( s ) Z ( si )
i =1
with
Possibili estensioni:
Medie mobili
Z (s0 ) =
i ( s ) = 1
i =1
I (dist(s , s ) r)
0
i =1
1)
Metodo della media campionaria

Previsore:
1 n
Z ( s0 ) = Z ( si )
n i =1
1
i
Z (s )I (dist(s , s ) r)
i =1
Propriet: necessario scegliere r (grado di lisciamento),

richiede algoritmi di ordinamento, non un interpolatore esatto
(a meno che r 0).
Pregi e difetti: semplicit, velocit di calcolo, ma non robusto e

non un interpolatore esatto ( Z ( s i ) Z ( s i ) )
Medie pesate in base alle distanze:
Z ( s0 ) =
1
n
dist ( s0 , si )
dist ( s0 , si )
p i =1
Z ( si ); p 0
i =1
65
66
2) Metodo dei poligoni

Questo metodo utilizza poligoni di influenza per determinare larea di
influenza in un punto campionato. (il valore della variabile in un poligono
ponderato per la proporzione che larea occupa sullarea totale)
Si sceglie il pi vicino valore
osservato come stimatore di
Z(s0)
In questo caso se il punto
appartiene ad un poligono gli
viene dato il valore del punto
campionato (si sceglie il valore
pi vicino al sito). Questo metodo
sceglie i punti pi vicini per la stima
3) Metodo di triangolazione: in questo caso si interpola un piano passante

per i tre punti campionati pi vicini (in questo modo si evita il
problema della discontinuit che caratterizza la tecnica dei poligoni)
Sostanzialmente si risolve il sistema lineare
ax1 + by1 + c = z1
ax2 + by2 + c = z2
ax3 + by3 + c = z3
ottenendo
67
z0 = ax0 + by0 + c
68
4) Splines
Per stimare una funzione generica di trend possiamo adottare
una tecnica non parametrica, cio in cui non si definisce una
forma specifica della funzione di trend, ma si fissano solo
alcune ipotesi su di esse.
Esistono innumerevoli tecniche (non parametriche) che
consentono questo, noi ne esamineremo una in particolare,
quella basata sulle spline.
Per spline si intende una funzione smussata che passa per un
certo numero di punti (da scegliere) detti nodi.
Le ipotesi sottostanti sono:
-la superficie da prevedere (p(x,y)) sufficientemente
regolare.
- esistono le derivate parziali 2p/ x2, 2p/ y2, p/ x y, in
s0=(x0,y0)
Sia p(x,y) la superficie da prevedere, nel sito s0=(x0,y0):

n
p (Z, s0 ) = a0 + a1 x0 + a2 y0 + bi e( s0 si )
i =1
con e( s ) = s log( s ) /(16 );

2
I vettori a e b sono ottenuti risolvendo il sistema:

(K + n I )b + Xa = Z
X 'b = 0
dove (K )i , j = e( si s j )
e X una matrice la cui i-esima riga corrisponde a (1, xi , yi ) e 0 < .
Limite: questo metodo non produce precisione delle stime
69
70
Metodi stocastici: Kriging

5) Median Polish
Ipotesi di scomporre la media globale in effetto di coordinata x
ed effetto di coordinata y
m ( x, y ) = a + r ( x ) + c ( y )
Con funzione mediana (o media): mkl = a + rk + cl
{rk } e {c j } sono costanti arbitrarie con mediana (o media) nulla

Lidea quella di applicare lanalisi della varianza sulle mediane
(Tukey)
Si cerca un previsore esatto

Si considera un modello per la stima: un modello continuo per
variazione spaziale stocastica, che usi il modello di
variogramma.
Nella sua pi semplice formulazione il previsore una combinazione
lineare dei dati
Si cercano i pesi seguendo un criterio di ottimizzazione:
funzione di perdita quadratica e minimizzazione dellMSE di
previsione
stimatori non distorti che minimizzano la varianza di previsione
Si propone un algoritmo ricorsivo per la stima di a, r e c
71
72

IL RUOLO DELLA MATRICE X
Modello generale Z(s) = m(s) + (s)
X una matrice di covariate misurate nei siti s: le sue componenti

sono funzioni riferite allorigine
Kriging Universale (kriging in presenza di un drift)
Z=X+
In particolare, X pu avere la seguente forma:
f 0 ( s1 )
X =
f (s )
0 n
Questo modello appare realistico in quanto:

ha una componente deterministica (il drift non stazionario)
ha una componente stocastica che sfrutta il variogramma
Lidea che noi siamo in grado di stimare il variogramma sui residui
dal drift.
Il Kriging universale considera le componenti di larga scala e di
piccola scala.
f p ( s1 )
f p ( sn )
Se la variabile regionalizzata mostra un trend in una direzione

fissa, si pu ipotizzare un trend polinomiale:
L
m( s ) = al fl ( s )
l =0
73
74

In un generico sito s0:
ASSUNZIONI
E ( ) = E (0 ) = 0
z0 = xT0 + 0
E (Z ) = X
Inoltre:
Cov ( ,0 ) = Cov ( Z , Z 0 ) = T
= V ( )
= w ( )
in cui x0 il vettore di covariate in s0
Si cerca il previsore lineare:

02
z0 = T Z
02 = v0 ( )
Gli elementi della matrice di varianza/covarianza sono espressi come

una funzione di un numero finito di parametri (in funzione di
covariogramma parametrici)
contiene le varianze dei residui tra coppie di punti
contiene le varianze dei residui tra i punti e il punto obiettivo
75
sotto il vincolo:
T X = x0T
Il motivo che spinge a formulare questo vincolo riguarda il fatto

che pu essere introdotta anche lipotesi di non conoscenza dei e
si possono comunque determinare stimatori non distorti.
z0 z0 = x0T + 0 T ( X + )
= 0 T
76
Lerrore quadratico medio di previsione :
La soluzione trovata dunque:
2
E ( z0 z0 ) = 02 2 T + T
che pu essere minimizzato sotto il vincolo: T X = x0T
Sia
= 1 + 1 X ( X T 1 X )
(x
X T 1 )
Questo genera il predittore:
z0 = T Z = ( x0 X T 1 ) + T 1Z
2un vettore di moltiplicatori di Lagrange, cos che:
L = 02 2 T + T 2 ( T X x0T )
Sostitudendo si ottiene una misura della precisione dello stimatore:
Il condizionamento del primo ordine (differenziando rispetto a )
+ X = 0
2
E ( z0 z0 ) = 02 2 T + T
= 02 T 1 + ( x0 X T 1 )
= 1 ( + X )
(X
1 X )
(x
X T 1 )
Osservazione: Il variogramma non noto ma stimato.
Per trovare si sostituisce nellespressione lequazione trovata,

ottenendo:
1
= ( X T 1 X )
(x
X T 1 )
77
un vettore di dimensione ( n 1) il cui i-esimo elemento la

varianza degli incrementi:
Caso particolare: Kriging Ordinario
Z = mi n +
In questo caso:
Il valore atteso:
i = ( s0 si )
X = in
E ( Z ) = mi n
la matrice di varianza-covarianza con elementi: ij = ( si s j )

= ( + 1m* ) 1
Tale che Cov ( ,0 ) = Cov ( Z , Z 0 ) =
E ( z0 ) = m 02 = 0
n
Il predittore lineare quindi:
z0 = ' Z = i z ( ui )
m* =
i =1
Il vincolo del moltiplicatore di Lagrange quindi:
' in = 1
1 1 1
1 11
il vincolo del moltiplicatore di Lagrange
z0 = T Z = ( + 1m* ) 1 Z
Il predittore :
Necessario per garantire la correttezza.

Il kriging ordinario uno stimatore esatto.
78
Il suo MSE : E ( z0 z0 )2 = T 1 (1 1 1 ) (1 1 1)
T
79
= T 1 (1 1 1 ) / (1 1 1)
2
(1 1 )
1
80
Caso particolare: Kriging Semplice m(s), posto =0
1. Kriging semplice: m(s) una funzione nota;

2. Kriging ordinario: m(s) = m, m ignoto;
3. Kriging universale: m(s) = f(s), ignoto;
Z =
Il valore atteso:
E (Z ) = 0
E ( z0 ) = 0
Una volta stimata m(s) e lavorando sui residui 2 e 3 sono

equivalenti.
Il predittore lineare n quindi:
z0 = ' Z = i z ( ui )
i =1
E ( z0 ' Z) 2 = E ( z0 2 2 ' Zz0 + 'ZZ' ) = c( s0 , s0 ) 2'c + '

dove
c = (C ( s0 , s1 ),..., C ( s0 , sn )) ' e = (C ( si , s j ))i , j =1,...,n
c = = 1c
quindi il predittore risulta:
z0 = ' Z = c ' 1Z
Problema: si vuole prevedere Z(s0), con s0 {s1, , sn}

mediante le n osservazioni Z = (Z(s1), ,Z(sn)) disponibili.
Lerrore quadratico medio di previsione :

ks2 = E (e( s0 ) 2 ) = C ( s0 , s0 ) c' 1c
81
82
Metodi stocastici: Kriging su dati Wolfcamp
Esempio: dati Wolfcamp

Applichiamo un kriging universale ai dati wolfcamp stimando un
trend lineare (piano), il modello di variogramma che viene utilizzato
(e quindi stimato usando la massima verosimiglianza) esponenziale.
Si richiede la stima di 400 punti posti su di una griglia 20x20
allinterno del dominio di studio.
83
84
Metodi stocastici: Kriging su dati Wolfcamp
Metodi stocastici: tipi di kriging proposti in letteratura

Distinti da
Metodo conosciuto come
Dimensione dellobiettivo Punti

Cosa conosciuto?
Distribuzione
Numero di variabile
Linearit
85
(point) kriging
Aree
Block kriging
Media conosciuta
Simple kriging
Media sconosciuta ma
costante
Ordinary kriging
Media non costante
Universal kriging
Z(s) gaussiana
Kriging
lnZ(s) gaussiana
Log-normal kriging
Z(s) indicator variable
Indicator kriging
Gaussiana con qualche v.

anomalo isolato
Robust kriging
Sconosciuta
Median-polish kriging
(s) il processo casuale
Kriging bayesiano
Singola
Kriging
Multivariata
Cokriging
Predittore lineare in Z(s)
Kriging
Predittore lineare in
funzione di Z(s)
Disjunctive kriging
86
Lo stimatore Kriging un interpolatore perfetto: un

predittore che riproduce i dati. In altre parole, si pu calcolare
la previsione in un punto osservato e il valore ottenuto deve
coincidere con il valore osservato.
INFLUENZA DEI PARAMETRI DEL MODELLO SPAZIALE SULLA
STIMA DEL KRIGING
Effetto della scala
Se due semi-variogrammi differiscono solo per un fattore di scala, e la soglia

dei due semi-variogrammi differisce solo a meno di una costante, i pesi del
kriging sono uguali.
Quindi la stima in siti non campionati non cambia. Al contrario la varianza
riscalata con lo stesso coefficiente
Effetto della forma
Quando due semivariogrammi raggiungono asintoticamente la stessa soglia, ma

differenti pesi vicino allorigine
E un modello parametrico che descrive un processo regolare vicino allorigine.
La procedura di stima d pi peso ai dati vicini al punto di stima.
87
Effetto pepita (riguarda variabilit di microscala)

Se si ha un effetto pepita puro (il variogramma costante): tutte le
osservazioni sono incorrelate e la migliore previsione di un punto in
una regione sar una media semplice dei punti campionati.
0 per | h |= 0
c0 per | h |> 0
( h) =
Se si ha un effetto pepita non nullo, allora al crescere del rapporto

C(0)/C(h) le varianze dellerrore di stima aumenteranno.
Effetto del range: variazioni nel range modificano i pesi in modo
trascurabile. La stima globale, tuttavia, pu variare in modo
considerevole, mentre la varianza dellerrore diminuisce al crescere
del range.
Effetto dellanisotropia: quando c anisotropia i pesi relativi alla
direzione di massima continuit sono pi variabili di quelli delle altre
direzioni.
88
Validazione dei risultati

Adattare un modello che incorpora correlazione spaziale un
processo iterativo:
a) Viene adattata una superficie senza assumere correlazione
spaziale;
b)Viene fatta una verifica della correlazione spaziale nei residui;
c) Una nuova superficie che incorpori correlazione spaziale viene
introdotta;
d)I nuovi residui vengono analizzati.
Esistono diversi fattori che rendono non immediata la valutazione
della qualit delle stime kriging.
Usare direttamente lerrore di stima implica assumere che il
variogramma usato nel calcolo della previsione sia noto. INVECE
stimato!! Ci porta ad avere delle sovrastime degli errori.
Per valutare le performances di previsione vengono proposte

tecniche di cross-validation.
In una procedura di cross-validation un punto alla volta viene
rimosso dallinsieme dei dati disponibili. Quindi la variabile di
interesse stimata in tale punto utilizzando il modello da testare.
Indicando con Z(s) il valore rimosso dallinsieme delle osservazioni
e con Z(s[]) il valore stimato, dove e()= Z(s)- Z(s[]) indica la
differenza tra valore osservato e stimato. Se la media degli errori
di cross-validation vicina a zero, si pu ragionevolmente pensare
che lerrore non sia molto elevato. Al contrario, pu presentarsi un
errore si sovrastima sistematico.
89
90
Validazione dei risultati
Validazione dei risultati via cross-validation
Schema dei passi per la validazione dei risultati via CROSSVALIDATION
val.oss
val.prev.
residuo
Z ( s1 )
1 ( Z ( s 2 ),..., Z ( s n ))
e1 = Z ( s1 ) 1
Z ( s1 )
1 ( Z ( s1 ),..., Z ( s n 1 )) e1 = Z ( s n ) n
1 n ei2
CV =
n i =1 var(ei )
dove var(ei ) la stima della varianza ottenuta

omettendo l' osservazio ne i esima
CV > 1 sottostima
CV < 1 sovrastima
91
1)
Grafico a dispersione tra I

dati originali e quelli stimati
2)
Confronto tra quantili della

distribuzione empirica e
quella stimata
3)
Diagramma a dispersione dei

siti (rosso errore negativo,
blu errore positivo)
4)
Istogramma
dei
standardizzati
5)
Grafico a dipersione dei

residui standardizzati e i
valori previsti
6)
Grafico a dispersione dei

residui standardizzati e
valori osservati
residui
92
Eventuali approfondimenti
Armstrong M. (1998), Basic Linear Geostatistics, Springer

Verlag
Cressie, N. (1989) Geostatistics. The American Statistician, 43,
197-202.
Cressie, N. (1990) The origins of kriging. Mathematical Geology,
22, 239-252.
Chils J.P., Delfiner P. (1999), Geostatistics, modelling spatial
uncertainty, Wiley
Smith R. L. COURSE IN ENVIRONMENTAL STATISTICS
http://www.stat.unc.edu/postscript/rs/envstat/env.html
SITO: www.statistical.org (sito di statistica spaziale)
93
Principali pacchetti di elaborazione dati

Utilizzo di R (software gratuito) o SPLUS
(http://www.r-project.org/)
Con pacchetti specifici per le analisi spaziali:

Fields
(http://www.cgd.ucar.edu/stats/Software/Fields/)
Spatstat
(http://cran.rproject.org/src/contrib/Descriptions/spatstat.html)
95
Bibliografia utile
Per la parte di dati geostatistici(in ordine di chiarezza):
Schabenberger e Gotway (2005). Statistical Methods for spatial
data analysis. Chapman & Hall. Qualche paragrafo del capitolo 1, e
capitoli 4 e 5 (escludendo la trattazione dei processi spaziali nel
dominio delle frequenze)
Cressie (1993). Statistics for spatial data, Wiley capitoli 2,3.
Per collegamenti alla parte in laboratorio
Bivand, Pebesma e Gomez-Rubio (2008). Applied Spatial Data
Analysis with R. Springer. Capitolo 8.
94

2) Dati Geostatistici

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

2) Dati Geostatistici

Caricato da

Copyright:

Formati disponibili

Dati geostastici

Analisi dei dati

Analisi statistiche esplorative

Analisi statistiche esplorative

Analisi statistiche esplorative

Prime analisi descrittive univariate sulle variabili oggetto di studio

La motivazione che spinge a modellare la dipendenza spaziale

Analisi statistiche esplorative

Introduzione agli strumenti

Il fenomeno studiato pu essere descritto per mezzo di processi

z(si) il valore osservato nel punto si i=1,2,,n;

Il valore atteso rappresenta la media di larga scala di un attributo nel

Il processo spaziale pu essere indicato con

I dati geostatistici sono osservati in un insieme finito di punti nello

Il modello pi semplice per rappresentare una variabile aleatoria

Un processo casuale generalmente definito dalle funzioni di

Processi spaziali: i momenti

Processi spaziali:ipotesi di stazionariet forte

Quando si parla di geostatistica lineare vengono presi in

Un processo stazionario in senso stretto si ripete invariato in tutto il

Processi spaziali: i momenti

Un esempio di funzione di covarianza spaziale e di

Il variogramma un misura della variabilit spaziale con le

Le funzioni C(,) e (,) dipendono dai siti si e sj considerati cos che si

Il maggiore svantaggio che sensibile ai valori estremi

2.Funzione di covarianza: se Z(si) e Z(sj) hanno una varianza finita

Momenti del secondo ordine

Le condizioni di stazionariet possono essere basate anche sui primi

Momento del primo ordine

Processi spaziali: i momenti

Processi spaziali: ipotesi di stazionariet

Ai fini inferenziali, si dovrebbe disporre di pi di un campione.

Si possono individuare due tipi di stazionariet basati sui momenti del

La variabilit di un processo spaziale stazionario del secondo ordine la

Tale assunzione importante perch ci suggerisce che il processo

Processi spaziali: ipotesi di stazionariet

Stazionariet del secondo ordine presuppone lesistenza del

Come conseguenza si ha che se il covariogramma stazionario, allora

V[Z(s)]=E[(Z(s)-m)2]= C(0) e 2(h)=2[C(0)-C(h)] (dimostrazione)

Processi spaziali: ipotesi di stazionariet

La stazionariet del secondo ordine implica quella intrinseca,

Processi spaziali: ipotesi di stazionariet

Modellazione spaziale: Possibili quesiti

Isotropia: dipendenza solo dalla distanza e non dalla direzione

Modellazione della componente di larga scala

Analisi statistica della componente di larga

Metodi non parametrici:

Algoritmo di Median Polish:

Analisi statistica della componente di larga scala:

Analisi statistica della componente di larga scala:

Il modello di trend pi semplice una funzione lineare nelle

Tanti pi termini aggiungo tanto migliore sar ladattamento ai

s=(x,y); (s)=0+ 1x+ 2y, sD

i parametri si possono stimare con il metodo dei minimi quadrati

s=(x,y); (s)=0+ 1x+ 2y+3x2+4xy+5y2, sD

Propriet di variogramma e covariogramma

Propriet di variogramma e covariogramma

utile per fini

1)Il covariogramma C(h) di un processo stocastico stazionario del secondo

(spiegazione dettagliata in Cressie, 1993)

Utilizzando le propriet 1) e 2) si possono definire 2 ulteriori propriet

Questa condizione necessaria perch per definizione si ha che:

Per una adeguata specificazione di una funzione parametrica necessario

2) Se il processo stocastico Z(s) soddisfa le ipotesi intrinseche con