Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
per
misurare
la
Variogramma:
Variogramma una funzione della distanza e del relativo
orientamento delle coppie di punti che descrive il grado di
correlazione tra tali punti.
Kriging:: strumento per effettuare previsioni spaziali tenendo
conto della distanza e della correlazione attraverso la
funzione di variogramma.
Costruzione di mappe.
Processi spaziali
Processi spaziali
{Z( s ) : s D }
0.0
0.2
0.4
0.6
0.8
1.0
si D
(dominio)
Per ogni punto si , z(si) la realizzazione di una variabile casuale Z(si) con
valore atteso:
E[Z(si)]=m(si )
0.2
0.4
0.6
0.8
1.0
0.0
0.2
0.4
0.6
0.8
1.0
0.0
0.0
0.2
0.4
0.6
0.8
1.0
0.0
0.2
0.4
0.6
0.8
1.0
0.0
0.2
0.4
0.6
0.8
1.0
Processi spaziali
Processi spaziali
Come possibile apprendere informazioni riguardanti la variabilit di un
processo spaziale se si ha a disposizione una sola realizzazione?
Si d pi enfasi alla previsione: si cerca la relazione tra le osservazioni
disponibili nei punti campionati e quelli non campionati.
Come si pu procedere nellinferenza statistica con un campione di
dimensione 1.
Se il processo gode di precise propriet (che verranno illustrate nei
lucidi seguenti) un campione di dimensione 1 pu fornire informazioni
riguardanti il processo generatore dei dati.
Z( s ) = m( s ) + ( s )
sD
10
Processi spaziali
Processi spaziali
Quando interessa la interpretazione del fenomeno: si d pi
peso alla componente di larga scala.
Quando interessa la previsione: si d pi peso alla componente di
piccola scala.
Assunzioni tipiche del modello lineare precedentemente
proposto:
La componente di larga scala (m(s)) pu essere considerata
come una funzione delle coordinate spaziali;
La componente di piccola scala ((s)) generalmente segue
una distribuzione normale multivariata
~ MVN ( 0, ( ) )
11
STAZIONARIETA FORTE
d
Un processo stocastico Z( s ) : s D
viene detto stazionario in
senso stretto quando: Fs1,s2,,sm(z1,z2,zm)= Fs1+h,s2+h,,sm+h(z1,z2,zm)
2.5
2.0
(h)
0.0
0.5
1.0
1.5
0.0
0.5
1.0
1.5
2.5
2.0
3.0
Variogram
3.0
13
C(h)
Covariance function
0.0
0.5
1.0
h
1.5
0.0
0.5
1.0
1.5
15
16
Cov[Z(s),Z(s+h)]= E[Z(s)Z(s+h)]-m2=C(h)
In tal caso, si considerano replicazioni del
corrispondenza della distanza h, tutte le coppie
(Z(si),Z(sj)) caratterizzate da una distanza h.
processo in
del processo
Cov[Z(s),Z(s+0)]= C(0)=E[Z(s)2]-m2=V[Z(s)]
22
-Analisi statistica:
Z ( s ) = Z ( sx , y ) = + x + y + xy
23
( s ) = i f ( si )
i =1
( s) = i f ( si )
25
26
i =1
i =1 j =1
s1 ,..., sn D
and i , i = 1,..., n
n n
n
i j C si s j = V i Z ( si )
i =1
i =1 j =1
where
i = 0
i =1
i j si s j 0
i j C si s j 0
C ( h ) = ai 2Ci ( h )
i =1
27
( h ) = ai 2 i ( h )
i =1
28
Variogramma empirico
Il variogramma dato dalla varianza delle differenze della variabile
casuale in due siti.
Se due unit sono tra loro vicine la loro differenza sar piccola e
cos pure la sua varianza. Al crescere della lontananza tra i siti, le
differenze diventano pi grandi e la varianza assume valori maggiori.
C ( h ) = Ci ( h )
i =1
C ( h ) = C ( h )
6)
C ( h) C (0)
7)
( h) 0
( h) = ( h)
Graficamente si pu rappresentare un diagramma di
dispersione delle coppie (||si-sj||, (Z(si)-Z(sj))2/2)
(0) = 0
29
30
classico:
2(h) =
1
N(h)
(Z(s ) Z(s )) ;
2
N ( h)
robusto:
1
1
2 (h) =
(0.457+ 0.494/ | N(h) |) N(h)
|
Z
(
s
)
Z
(
s
)
|
,
i
j
N ( h)
1/ 2
h d , h = d (si , s j ) ,
Dove N(h) il numero di coppie a lag h
31
32
ma
3.0
2.5
2.0
0.0
0.5
1.0
1.5
(h)
2.0
(h)
1.5
1.0
0.0
0.5
2.5
3.0
0.0
0.5
1.0
1.5
2.0
0.0
0.5
1.0
1.5
2.0
1.5
0.0
0.5
1.0
1.5
0.0
0.5
1.0
(h)
2.0
2.5
3.0
Variogram
0.0
0.5
1.0
h
1.5
2.0
0.0
0.5
1.0
1.5
2.0
36
Covariance Function
( range ) = sill
37
38
Semivariogramma
Semivariogramma
Se s e s+h sono due punti nello spazio bidimensionale R2, allora
h=(h1,h2)
( h)
ha un andamento come:
( h) = (h1 , h2 ) = (| h |, )
39
Se h=0, ( h) = 0
Aumenta al crescere di |h|
Aumenta indefinitamente o diviene stabile raggiunto un certo valore
40
Semivariogramma
1
h
h
(h) = c0 + c1 1 1
K
r
2 ( ) r
2 (h) = V [ Z ( s + h) Z ( s )]
= V [ Z ( s + h)] + V [ Z ( s )] = 2 2
Alcuni andamenti
dellorigine:
parabolico
tipici
dei
semi-variogrammi
lineare
in
prossimit
nugget effect
0,
r > 0, Bounded
r , Unbounded
De Wijs: log(h)
> 0, integer
h2 log(h)
> 0, noninteger
Power: h2
= 0.5
Exponential:
exp( h / r)
=1
Whittle: (h / r)
K1(h / r)
Gaussian:
exp( h2 / r2)
h2 log(h)
42
( h, ) =
Approximate function
41
Equivalent function
0, h = 0
2
2
c0 + c g 1 exp || h || / a g , h 0
h=0
( h, ) =
c0 + ce 1 exp ( || h || / ae ), h 0
= ( c0 , ce , a e ) 0
)]
= ( c0 , c g , a g ) 0
(valido
( h , ) =
per
0,
h=0
|| h ||> a s
c0 + c s ,
= ( c0 , c s , a s ) 0
,d 1 ):
0,
h = 0
+ b l || h ||,
h 0
c0
= ( c 0 , b l ), c 0 0 , b l 0
Altri modelli
ra zio n a le :
0,
( h , ) =
h = 0
2
2
c 0 + c r h / (1 + h / a r ) ,
h > 0
O nda :
( h , ) =
c0 + cw
P o w er la w (so lo
0,
0,
h
aw
1
sin
a , h > 0
h
w
( h , ) =
c0 + c p h ,
0 < 2
h = 0
47
48
Anisotropia
Anisotropia
0.4
0.2
0.0
0.2
0.0
Lidea alla base che un processo che non isotropico nello spazio
originario, pu essere trasformato in uno isotropico per mezzo di una
trasformazione lineare dello spazio. In generale se il valore della
soglia tendono ad essere costanti in tutte le direzioni, allora il
processo presenta una anisotropia geometrica.
0.4
0.6
0 un semi-variogramma isotropico
A una matrice dxd (trasformazione lineare di Rd)
0.6
0.8
( h) = 0 (| Ah |)
0.8
1.0
Anisotropic Process
1.0
Isotropic Process
0.0
0.2
0.4
0.6
0.8
1.0
0.0
0.2
0.4
0.6
49
0.8
1.0
50
Anisotropia
Anisotropia
15
11
12
-0 . 5
13
10
7
4
1
14
11
8
5
2
15
12
9
6
3
0.5
1.0
1.5
-1 . 5
-0 . 5
0.5
1.0
1.5
con
0.5 1.0 1.5
12
14
9
6
11
13
8
5
10
15
14
13
-0.5
10
11
4
12
5
4
1
-1 . 5
51
-1.5
sin
;
cos
= /4 e = 0 .5
15
-0.5
1 0 cos
A=
0 sin
= /4 e = 1
-1.5
Si ha che
14
10
-0.5
13
-1 . 5
s*=As
= 0 e = 0 .5
-1.5
-0.5
=0 e =1
-1.5
-0 . 5
0.5
1.0
1.5
-1 . 5
-0 . 5
0.5
1.0
1.5
52
Anisotropia
18
23
11
9
10
29
19
17
2
1620
3
8 5
32
7
14
12
28
26
21
27
1
2524
23
15
13
22
31
30
4
29 18
19
17
2
16
11
9
20
3
10
6
32
78 5
14
12
28
26
27
121
15
1322
31
30
4)
Anisotropia
Anisotropia zonale:
Una generalizzazione della anisotropia ottenuta considerando
che se Z1 , Z 2 ,, Z p sono processi indipendenti ed intrinsecamente
stazionari, allora Z = Z1 + Z 2 ++ Z p un processo intrinsecamente
stazionario con semi-variogramma:
(h) = 0 ( Ai h)
i =1
56
N ( hm )
2
( hm ) ( hm , )}
2{
m , )
2 ( h
m =1
58
= ( X TV ( )1 X ) X TV ( ) Z
1
G 2 ( ) = Z X
parametro di scala
V ( )
) V ( ) (Z X )
T
59
1
1 2
n
n
l ( ( ), , ) = log(2 ) + log( ) + log|V ( )| +
G ( )
2
2
2
2
n
G 2 ( ) 1
n
n
n
l * ( ) = l ( ( ), ( ), ) = log(2 ) + log
+ log|V ( )| +
2
2
n
2
2
y 1 , , y n ~ N ( , 2 )
(y
i
y )2 / n
y 1 y , y 2 y , , y n y
61
1
n q
n q
1
1
log(2 ) +
log( ) + log| ATV ( ) A|+ W T ( ATV ( ) A) W
2
2
2
2
n q
n q
1
1
log(2 ) +
log( ) log| X T X | + log| X TV ( )1 X |
2
2
2
2
1
1 2
+ log|V ( )| +
G ( )
2
2
63
62
Previsione
Vi sono due tipi di previsione che si possono fare:
stimare la media del processo o il processo stesso sullintera
regione (stima globale)
prevedere il valore del processo in un nuovo sito u0 (stima
puntuale).
Metodi non stocastici (proposti per identificare il trend)
1) Metodo della media campionaria;
2) Metodo dei poligoni;
3) Metodo di triangolazione;
4) Median Polish (gi anticipato);
5) Splines.
Metodi stocastici
6) Kriging
64
Z ( s0 ) = i ( s ) Z ( si )
i =1
with
Possibili estensioni:
Medie mobili
Z (s0 ) =
i ( s ) = 1
i =1
I (dist(s , s ) r)
0
i =1
1)
1
i
Z (s )I (dist(s , s ) r)
i =1
Z ( s0 ) =
1
n
dist ( s0 , si )
dist ( s0 , si )
p i =1
Z ( si ); p 0
i =1
65
66
ax1 + by1 + c = z1
ax2 + by2 + c = z2
ax3 + by3 + c = z3
ottenendo
67
z0 = ax0 + by0 + c
68
4) Splines
Per stimare una funzione generica di trend possiamo adottare
una tecnica non parametrica, cio in cui non si definisce una
forma specifica della funzione di trend, ma si fissano solo
alcune ipotesi su di esse.
Esistono innumerevoli tecniche (non parametriche) che
consentono questo, noi ne esamineremo una in particolare,
quella basata sulle spline.
Per spline si intende una funzione smussata che passa per un
certo numero di punti (da scegliere) detti nodi.
Le ipotesi sottostanti sono:
-la superficie da prevedere (p(x,y)) sufficientemente
regolare.
- esistono le derivate parziali 2p/ x2, 2p/ y2, p/ x y, in
s0=(x0,y0)
p (Z, s0 ) = a0 + a1 x0 + a2 y0 + bi e( s0 si )
i =1
X 'b = 0
dove (K )i , j = e( si s j )
e X una matrice la cui i-esima riga corrisponde a (1, xi , yi ) e 0 < .
Limite: questo metodo non produce precisione delle stime
69
70
m ( x, y ) = a + r ( x ) + c ( y )
Con funzione mediana (o media): mkl = a + rk + cl
71
72
Z=X+
f 0 ( s1 )
X =
f (s )
0 n
f p ( s1 )
f p ( sn )
m( s ) = al fl ( s )
l =0
73
74
ASSUNZIONI
E ( ) = E (0 ) = 0
z0 = xT0 + 0
E (Z ) = X
Inoltre:
Cov ( ,0 ) = Cov ( Z , Z 0 ) = T
= V ( )
= w ( )
02
z0 = T Z
02 = v0 ( )
sotto il vincolo:
T X = x0T
z0 z0 = x0T + 0 T ( X + )
= 0 T
76
2
E ( z0 z0 ) = 02 2 T + T
che pu essere minimizzato sotto il vincolo: T X = x0T
Sia
= 1 + 1 X ( X T 1 X )
(x
X T 1 )
z0 = T Z = ( x0 X T 1 ) + T 1Z
L = 02 2 T + T 2 ( T X x0T )
+ X = 0
2
E ( z0 z0 ) = 02 2 T + T
= 02 T 1 + ( x0 X T 1 )
= 1 ( + X )
(X
1 X )
(x
X T 1 )
= ( X T 1 X )
(x
X T 1 )
77
Z = mi n +
In questo caso:
Il valore atteso:
i = ( s0 si )
X = in
E ( Z ) = mi n
E ( z0 ) = m 02 = 0
n
z0 = ' Z = i z ( ui )
m* =
i =1
' in = 1
1 1 1
1 11
z0 = T Z = ( + 1m* ) 1 Z
Il predittore :
78
Il suo MSE : E ( z0 z0 )2 = T 1 (1 1 1 ) (1 1 1)
T
79
= T 1 (1 1 1 ) / (1 1 1)
2
(1 1 )
1
80
Z =
Il valore atteso:
E (Z ) = 0
E ( z0 ) = 0
z0 = ' Z = i z ( ui )
i =1
c = = 1c
quindi il predittore risulta:
z0 = ' Z = c ' 1Z
81
82
83
84
Distribuzione
Numero di variabile
Linearit
85
(point) kriging
Aree
Block kriging
Media conosciuta
Simple kriging
Media sconosciuta ma
costante
Ordinary kriging
Universal kriging
Z(s) gaussiana
Kriging
lnZ(s) gaussiana
Log-normal kriging
Indicator kriging
Robust kriging
Sconosciuta
Median-polish kriging
Kriging bayesiano
Singola
Kriging
Multivariata
Cokriging
Kriging
Predittore lineare in
funzione di Z(s)
Disjunctive kriging
86
0 per | h |= 0
c0 per | h |> 0
( h) =
89
90
val.oss
val.prev.
residuo
Z ( s1 )
1 ( Z ( s 2 ),..., Z ( s n ))
e1 = Z ( s1 ) 1
Z ( s1 )
1 ( Z ( s1 ),..., Z ( s n 1 )) e1 = Z ( s n ) n
1 n ei2
CV =
n i =1 var(ei )
1)
2)
3)
4)
Istogramma
dei
standardizzati
5)
6)
residui
92
Eventuali approfondimenti
93
95
Bibliografia utile
Per la parte di dati geostatistici(in ordine di chiarezza):
Schabenberger e Gotway (2005). Statistical Methods for spatial
data analysis. Chapman & Hall. Qualche paragrafo del capitolo 1, e
capitoli 4 e 5 (escludendo la trattazione dei processi spaziali nel
dominio delle frequenze)
Cressie (1993). Statistics for spatial data, Wiley capitoli 2,3.
Per collegamenti alla parte in laboratorio
Bivand, Pebesma e Gomez-Rubio (2008). Applied Spatial Data
Analysis with R. Springer. Capitolo 8.
94