Sei sulla pagina 1di 96

DISPENSE DI GEOSTATISTICA APPLICATA

G. Raspa

Capitolo 3 – Geostatistica di base1

1
Il presente capitolo costituisce le dispense del modulo di Geostatistica del corso integrato “Calcolo
delle Probabilità e Geostatistica” impartito nel corso di laurea in Ingegneria per l’Ambiente e il Territorio
(Laurea di 1° livello) della Facoltà di Ingegneria dell’Università di Roma “La Sapienza”.
3. GEOSTATISTICA DI BASE .................................................................................3
3.1 Introduzione alla Geostatistica ............................................................................3
3.2 L’approccio probabilistico ..................................................................................9
3.3 Modelli di Base.................................................................................................11
3.3.1 Modelli Stazionari......................................................................................12
3.3.2 Modelli non Stazionari...............................................................................16
3.3.3 Considerazioni sulla Scelta dei Modelli......................................................24
3.4 Analisi ed interpretazione dei variogrammi sperimentali ..................................25
3.4.1 Calcolo dei variogrammi sperimentali .........................................................25
3.4.2 Identificazione del modello di FA ..............................................................28
3.4.3 Comportamento nell’origine del variogramma ...........................................37
3.4.4 Andamento e modelli del variogramma elementare ....................................41
3.4.5 Variogrammi a strutture annidate ...............................................................49
3.4.6 Anisotropie nei variogrammi......................................................................54
3.5 Aggiustamento di un variogramma modello......................................................57
3.6 Regolarizzazione di una FA ..............................................................................61
3.6.1 Calcolo delle funzioni γ ............................................................................66
3.6.2 Regolarizzazione di un effetto pepita..........................................................67
3.7 Varianza di dispersione.....................................................................................69
3.8 Il kriging ordinario............................................................................................75
3.8.1 Gli stimatori lineari .....................................................................................76
3.8.2 Correttezza della stima................................................................................79
3.8.3 Precisione della stima..................................................................................79
3.8.4 Stimatori tradizionali...................................................................................80
3.8.5 Il Kriging Ordinario ....................................................................................82
3.9 Il kriging semplice ............................................................................................94

2
3. GEOSTATISTICA DI BASE

3.1 Introduzione alla Geostatistica

La Geostatistica studia i fenomeni naturali che si sviluppano su base spaziale a partire


dalle informazioni derivanti da un loro campionamento.

In particolare studia la variabilità spaziale dei parametri che descrivono i suddetti


fenomeni estraendone le regole in un quadro modellistico di riferimento e usandole per
effettuare le operazioni volte a dare soluzione a specifiche problematiche riguardanti la
caratterizzazione e la stima dei fenomeni stessi.

I metodi della Geostatistica sono applicabili in tutti quei settori delle scienze applicate
in cui i fenomeni di studio hanno carattere spaziale. In relazione alle applicazioni
registrate negli ultimi tre decenni, tra i settori applicativi si possono citare: le scienze
geologiche e minerarie, l’idrologia, l’idrogeologia, la scienza dei suoli, l’agronomia, la
geotecnica, la geofisica, il telerilevamento, la climatologia, la meteorologia,
l'
oceanografia, le scienze forestali, la zoologia, l’epidemiologia, l’igiene ambientale.

Si consideri un fenomeno spaziale, per es. l’inquinamento di un sito da metalli pesanti.


Indicando con z la concentrazione di uno di essi e con x il generico punto di coordinate
(xu, xv)1 del campo di indagine, z(x) è una funzione numerica che rappresenta la
concentrazione dell' inquinante nei punti del sito. In questo quadro si possono dare le
seguenti definizioni:

Variabile regionalizzata (VR)


Si intende la funzione matematica z(x) sopra introdotta. Il termine regionalizzata
specifica che si tratta di una funzione numerica il cui valore dipende dalla
localizzazione, espressa normalmente dalle coordinate spaziali, e che si presenta
strutturata spazialmente.

Campo:
E'il dominio nel quale la variabile z è suscettibile di assumere determinati valori e,
all'
interno del quale, se ne studia la variabilità. Coincide con lo spazio di osservazione
(o di indagine) del fenomeno in esame.

Supporto:
E'l'entità geometrica sulla quale la variabile z è definita od anche misurata; essa è
caratterizzata dalle sue dimensioni e dalla sua forma. Quando le dimensioni sono molto
piccole (rispetto alla scala del lavoro) il supporto può considerarsi puntuale (per es. un

1
Nel seguito del testo la posizione di un punto nello spazio di lavoro sarà sinteticamente indicata con x,
sottointendendo che si tratta di un punto di coordinate xu , xv, essendo u e v i due assi coordinati del
riferimento.

3
campione areale di suolo di qualche decina di dm2 può essere considerato puntuale
rispetto ad una distanza tra campioni successivi di alcune decine di m). Non è così
invece per un pixel di una scena Landsat TM, che ha dimensioni 30 x 30 m, in un’area
di indagine di alcuni Km2.
Il concetto di supporto e le sue implicazioni giuocano un ruolo importante nella teoria e
nelle applicazioni geostatistiche. Data una variabile regionalizzata riferita ad un
determinato supporto, si ha che, cambiando la forma e le dimensioni di esso, si ottiene
una variabile regionalizzata diversa dalla prima, ma non senza analogia con essa.

Si osservi, a titolo di esempio, la figura 3.1. In essa è riportato l’andamento della


conducibilità idraulica misurata su campioni successivi di terreno di dimensioni 10 cm;
in tratto più grosso è riportato l’andamento dei valori mediati su un metro (su 10
campioni). Nel primo caso la VR ha un supporto 10 cm e nel secondo ha come supporto
1m. Si tratta di due variabili che presentano un andamento molto diverso tra di loro.

Fig. 3.1 - Andamento della conducibilità idraulica riferita a due diversi supporti (da “Stochastic models of
fluid flow in heterogeneous media” di Leslie Smith,Proceedings of the workshop on soil spatial variability
of the ISSS and the SSSA, Las Vegas, 1984).

In base alla definizione data, una VR è una variabile puramente deterministica; da un


punto di vista matematico è una funzione z(x) che assume in ogni punto dello spazio un
determinato valore numerico. Si osservi per es. la figura 3.2 che rappresenta
l’andamento, lungo una determinata direzione, della tensione acqua-suolo (tas) di un
terreno ad un giorno dall’irrigazione. Si può osservare, da una parte, un andamento
irregolare alla piccola scala che non incoraggia uno studio matematico diretto, e
dall’altra, una variabilità strutturata, cioè una variabilità che sembra ubbidire a delle
regole. Vi si notano infatti tratti con elevati valori della tas e tratti con medi e bassi
valori. Pertanto, campioni prelevati in vicinanza dei tratti ad alto valore avranno una
elevata probabilità di avere un tas elevata, mentre vi avranno una media e bassa
probabilità i campioni prelevati negli altri tratti.

4
Fig. 3.2 - Andamento di una variabile spaziale rappresentante la tensione acqua-suolo, lungo una
direzione, di un terreno ad un giorno dall’irrigazione (da “Spatial variability of soil-water properties in
irrigated soils”, di P.J.Wierenga, Proceedings of the workshop on soil spatial variability of the ISSS and
the SSSA - Las Vegas, USA 1984) .

Un approccio corretto allo studio dei fenomeni spaziali deve considerare entrambi gli
aspetti della variabilità e fornire degli strumenti operativi alla risoluzione dei problemi.
Un tale approccio è quello probabilistico, cioè basato sulle Funzioni Aleatorie.

Prima di passare ad illustrare l’approccio probabilistico vediamo come è possibile,


facendo uso dei concetti di varianza, covarianza e coefficiente di correlazione empirici,
caratterizzare intuitivamente la variabilità spaziale di una VR.

Sia z(x) una VR, di supporto puntuale, definita in un’area S avente un’estensione di
alcune centinaia di metri (fig. 3.3) e nota in tutti i punti. Si consideri una coppia di punti
distanti h(vettore) di posizione x e x+ h, con |h| = h1 piccolo rispetto alle dimensioni di
S, per es. un metro (fig. 3.3 A1). In corrispondenza dei due punti la VR assume i valori
z(x) e z(x+h).

Se, in maniera analoga, si fanno assumere al primo punto della coppia n posizioni xi ( i
=1,n ) all’interno di S in maniera che anche il secondo punto stia all’interno del
campo, si ottengono altrettante coppie di valori: z(xi), z(xi+h) che graficamente
possono essere rappresentati da una nuvola di correlazione in cui gli assi esprimono i
valori del primo e del secondo punto (fig. 3.3 A2).

5
Fig. 3.3 - Descrizione empirica della variabilità spaziale: covarianza delle coppie

Essendo |h| piccolo saranno verosimilmente anche piccole le differenze tra le coppie
di valori, per cui la nuvola sarà poco dispersa attorno alla retta a 45°, tanto più o tanto
meno a seconda della differenza tra i valori di ciascuna coppia. Per una distanza tra le
coppie pari a zero, le differenze sono tutte nulle ed i punti della nuvola si collocano
esattamente sulla retta a 45°. Quantitativamente l’entità del legame tra le coppie di
valori z(xi) e z(xi+h) è misurata dalla covarianza empirica:

n n n
Sx , x + h = Z ( xi ) Z ( xi + h) / n − Z ( xi) Z ( xi + h) / n / n
i=1 i =1 i =1

6
od, ancora meglio, dal coefficiente di correlazione empirico:

Sx, x + h
ρx , x + h =
Sx ⋅ Sx + h

dove Sx e Sx+h sono le deviazioni standard empiriche dei valori rispettivamente del
primo e del secondo punto:

n n n
S2x = Z2 ( xi) / n − Z ( xi ) Z ( xi ) / n / n
i =1 i =1 i =1

e
n n n
S2x + h = Z 2 ( xi + h) / n − Z ( x i + h) Z ( x i + h) / n / n
i =1 i =1 i =1

Se ora si considera un valore di |h| = h2 più grande di un metro, per es. 5 m (fig. 3.3 B1)
è verosimile pensare di ottenere una nuvola di punti (fig. 3.3 B2) più dispersa di
quella ottenuta per la distanza di 1 m. La covarianza ed il coefficiente di correlazione
saranno più piccoli dei corrispondenti valori .

Se ora consideriamo valori di |h| sempre crescenti si ha che la covarianza ed il


coefficiente di correlazione decresceranno, potendosi anche annullare se le coppie di
valori risultano indipendenti. In tal caso la nuvola di correlazione ha una dispersione
uniforme nel piano z(xi) e z(xi+h) (fig. 3.3 C2). Appare pertanto immediato graficare il
coefficiente di correlazione (o la covarianza) in funzione della distanza |h| e considerare
questa curva come una forma quantitativa che esprime, limitatamente alla direzione in
esame, la variabilità spaziale di z(x) (fig. 3.4). Per |h| = 0 le due variabili z(xi) e z(xi+h)
coincidono e di conseguenza il coefficiente di correlazione ρ è uguale a uno.

Esaminiamo ancora un’altra forma intuitiva di caratterizzare la variabilità spaziale.


Sempre con riferimento alle situazioni descritte nella fig. 3.3, consideriamo per ogni
coppia di punti xi e xi+h le differenze:

ε( xi , xi + h) = Z ( xi + h) − Z ( x i) ( i = 1, n )

7
r (h)
1
Fig. 3.4 - Correlazione della coppia
in funzione della distanza.

0.5

0
h1 h2 h3
h

Queste, per ogni situazione, presentano istogrammi caratterizzati da dispersioni che


aumentano all’aumentare di |h|. La fig. 3.5 mostra in termini di varianza degli
incrementi ciò che nelle fig. 3.4 era mostrato in termini di coefficiente di correlazione.

Fig. 3.5 - Descrizione empirica della variabilità spaziale: dispersione degli incrementi.

8
Come è noto, la dispersione dei valori attorno alla media è misurata dalla varianza.
Pertanto la curva che esprime la varianza degli incrementi in funzione della distanza è
un’altra forma per caratterizzare la variabilità spaziale di un parametro regionalizzato.
Quando |h| = 0 la varianza è zero e generalmente aumenta all’aumentare di |h| (fig.
3.6).

g (h)
S23
Fig. 3.6 - Dispersione degli
S 22 incrementi in funzione della
distanza.

S 21

h1 h2 h3 h

Il trasferimento di questi concetti di carattere empirico nel quadro di un formalismo


teorico esigente costituisce l’approccio probabilistico della Geostatistica allo studio dei
fenomeni naturali a carattere spaziale.

3.2 L’approccio probabilistico

Prendiamo in esame un fenomeno spaziale, per es. l’andamento ad un certo istante ed


all’interno di un’area S, della tavola d’acqua di un acquifero sedimentario ed
indichiamo con z la sua profondità (rispetto al piano di campagna). La funzione
matematica, che esprime l’andamento di z in funzione della posizione geografica x
(caratterizzata dalle coordinate xu e xv) all’interno dell’area S, è, secondo la definizione
data in precedenza, la Variabile Regionalizzata (VR) che descrive il fenomeno in esame.
Essa è chiaramente una funzione deterministica.

Consideriamo ora un particolare punto di S di posizione x0. In esso si può definire una
variabile aleatoria (VA) continua Z(x0), cioè una variabile che assume dei valori
numerici appartenenti ad un certo intervallo secondo una legge di densità di probabilità
f0 (Z) (vedi fig. 3.7).

9
Fig. 3.7 - Descrizione di una
Funzione Aleatoria nel
dominio S.

In queste condizioni il valore z(x0) della profondità della falda nel punto x0 può essere
considerato come una realizzazione della VA Z(x0).
Così come in x0, in ogni altro punto x di S può essere definita una VA Z(x). Allora
l’insieme di tutte le VA definite in S costituisce una Funzione Aleatoria (FA).

La FA Z(x) sarà caratterizzata dall’insieme di tutte le funzioni di distribuzione


multivariabili:

FZ 1,Z 2,...,Zk ( z1, z 2,..., zk ) = prob{Z ( x1) < z1, Z ( x 2) < z 2,..., Z ( xk ) < zk ,}
che si possono definire in S per qualsiasi intero k e per qualsiasi configurazione dei k
punti: x1 , x2, ... xk,.

Questo insieme di funzioni, data la natura spaziale del fenomeno che si vuole
modellizzare, costituisce la legge spaziale della FA Z(x).

Nel caso di indipendenza, a due a due, delle variabili Z(x1), Z(x2),…,Z(xk), la legge
spaziale di Z(x) è costituita dall’insieme di tutte le funzioni di distribuzione
monovariabili:

F Z ( x ) ( z ) = prob {Z ( x ) < z } ∀ x ∈ S

Con riferimento all’esempio della falda, considerando i valori delle profondità z(x)
come particolari realizzazioni delle VA definite in tutti i punti x di S, possiamo
affermare che l’interpretazione probabilistica del fenomeno di studio (e cioè l’approccio
probabilistico) consiste nel considerare la VR z(x) come una particolare realizzazione
della FA Z(x).

L’interpretazione probabilistica dei fenomeni spaziali, od il ricorso, come si usa dire, ad


un modello topo-probabilista, non corrisponde ad una particolare concezione della
realtà: questo modello non è l’immagine di nessuna realtà fisica, è un intermediario di
calcolo, una forma di collocarsi all’interno di un quadro imperativo, in cui è possibile
usare gli strumenti del calcolo delle probabilità, senza i quali, dotati semplicemente di
modelli empirici o deterministici, sarebbe difficile fare molta strada verso la soluzione
dei problemi.

10
E’ innegabile quindi il vantaggio dell’approccio probabilistico, ma le condizioni sono
che è necessario disporre di modelli. Si pone subito quindi un problema metodologico:
il problema dell’inferenza statistica, cioè della stima dei parametri del modello
mediante i dati di una campionatura del fenomeno.

Il modello più completo sarebbe costituito dalla legge spaziale sopra definita. Ma tale
legge è impossibile da stimare a partire da una realizzazione unica, per di più conosciuta
solo in un limitato numero di punti: sarebbe come pretendere di stimare con un solo
risultato la legge di probabilità associata al lancio di un dado, e quindi capire, per es., se
un dado è truccato o no. E’ necessario quindi fare delle ipotesi per rendere più semplice
il modello. Ma è evidente che la formulazione delle ipotesi deve essere tale che il
modello risultante abbia dei requisiti minimali, quali per esempio:

• il modello deve poter essere stimabile nei suoi parametri, considerando il tipo e la
quantità di informazioni generalmente disponibili per tale operazione;

• il modello deve, come strumento, essere sufficiente per effettuare le operazioni più
frequentemente richieste nello studio dei fenomeni di interesse (stime di variabili,
stime di probabilità, simulazioni);

• a prescindere dalle operazioni che devono essere effettuate, il modello deve poter
esprimere, in forma qualitativa e quantitativa, la variabilità spaziale del fenomeno di
studio, ai fini della sua comprensione.

In relazione al tipo di operazioni, tra quelle sopra ricordate, che con l’ausilio del
modello devono essere condotte, accenniamo fin da ora ai requisiti che esso deve
possedere. Per ciò che concerne le stime (predizioni in termini di statistica classica) le
più diffuse sono quelle lineari. Per la loro implementazione, sarà mostrato, è sufficiente,
dell’intera legge spaziale, la conoscenza dei primi due momenti della FA; è ad essi
quindi che le proprietà del modello saranno riferite.

Per ciò che riguarda le simulazioni e le stime non lineari, quest’ultime comprendenti le
stime di probabilità, le proprietà del modello riguarderanno non solo i primi due
momenti ma anche la legge bivariabile delle coppie, cioè la legge spaziale appena
introdotta limitata a k = 2.

3.3 Modelli di Base

Come è stato accennato nel paragrafo precedente il ricorso ad un modello probabilistico


solleva un problema metodologico: la scelta del modello e la stima dei suoi parametri. Il
problema è tutt’altro che banale, considerando che, da un lato, si è di fronte ad una vastità
di modelli di Funzioni Aleatorie e, dall’altro, si dispone solo di una realizzazione unica, per
di più nota solo in pochi punti del campo.

Per superare le difficoltà poste da questo problema sembra opportuno porre dei vincoli ai
modelli, sì da ridurre la famiglia di quelli praticamente utilizzabili.. A questo punto è utile
fare la considerazione seguente:

11
la maggior parte dei problemi con cui normalmente si ha a che fare, e che sono quelli a cui
si fa riferimento in queste dispense, sono problemi locali, cioè problemi, generalmente di
stima, che interessano una piccola porzione del campo che comprende il supporto della
stima, cioè l’entità geometrica da stimare, e l’insieme dei dati con cui effettuare la stima
stessa. Questa porzione di campo, così configurata, la chiameremo d’ora in poi, con una
parola presa a prestito dal francese, vicinaggio. La nozione di vicinaggio giuoca un ruolo
metodologico molto importante nella Geostatistica. Poichè in generale non ci si limita ad un
solo problema locale, ma si tende a fare delle stime su tutto il campo, questo vicinaggio,
quasi identico per dimensioni e configurazione, è destinato a percorrere tutto il campo:
diventa un vicinaggio mobile.

La considerazione precedente fa sorgere una esigenza legittima: lavorando in vicinaggio


mobile si vorrebbe vedere nella ripetizione spaziale legata alla traslazione del vicinaggio, un
sostituto di una molteplicità di realizzazioni della FA. E ciò è tanto più leggittimo quanto
più è lecito pensare ad un modello che non coinvolga tutto il campo, ma che sia definito al
livello di vicinaggio. Ecco configurarsi la necessità di sollecitare per la FA condizioni di
stazionarietà. Una ulteriore spinta a questo tipo di sollecitazione viene dal fatto che si
dispone di una realizzazione unica del modello.

3.3.1 Modelli Stazionari

Stazionarietà Strictu Sensu

La stazionarietà strictu sensu di una FA è una proprietà che si definisce molto


chiaramente: è l’invarianza per traslazione della legge spaziale del processo aleatorio.
Più esplicitamente: comunque siano fissati un numero intero k > 0 ed un insieme di
k punti in S aventi posizione: {x1, x 2,..., xk } , i due vettori aleatori:
{Z ( x1), Z ( x2),..., Z ( xk )} e {Z ( x1 + h), Z ( x2 + h),..., Z ( xk + h)} con h vettore qualsiasi ,
hanno la stessa legge o, più specificamente, hanno la stessa funzione di distribuzione
k-variabile.

La legge spaziale, anche nel quadro di un’ipotesi molto forte come la stazionarietà, continua
a rimanere, per gli stessi motivi specificati nel paragrafo predente, un riferimento teorico
con scarso o nullo significato pratico (se non nel caso di multigaussianità). Poichè, come è
stato detto nel paragrafo precedente, la maggior parte delle operazioni geostatistiche
richiedono solo la conoscenza dei primi due momenti della FA, è a questi ultimi che la
proprietà della stazionarietà deve essere riferita. Prima di esaminare questa questione
introduciamo i momenti del primo e del secondo ordine di una FA.

Momento Primo

Sia S il campo di indagine. In accordo con l’interpretazione probabilistica in ogni punto


x ∈ S è definita una VA Z(x). Il suo momento primo:

E Z ( x) = m ( x )

12
se esiste è generalmente funzione di x.

Momento secondo

Si considerino due punti x1 e x2 entrambi appartenenti ad S , rispettivamente di coordinate


x1u, x1v e x2u, x2v. La covarianza tra le variabili aleatorie Z(x1) e Z(x2):

Cov( x1, x 2) = C ( x1, x 2) = E{[Z ( x1) − m( x1)]⋅ [Z ( x 2) − m( x 2)]}

= E[Z ( x1) ⋅ Z ( x 2)] − m( x1) ⋅ m( x 2)

è generalmente funzione delle posizioni x1 e x2.

Variogramma

E’ la funzione più comune della Geostatistica, usata nelle applicazioni principalmente per
caratterizzare la variabilità spaziale di un fenomeno regionalizzato. Introdotto
empiricamente nel paragrafo 3.2 sarà ora presentato nel quadro probabilistico.
Sia S il dominio in cui è definita la FA Z(x) e siano x0 e x0+h una coppia di punti
appartenenti ad S e distanti h1 (fig.3.4) La differenza tra Z(x0 ) e Z(x0+h) definisce una
nuova VA detta accrescimento o incremento:

[Z(x0+h) - Z(x0)].

La sua semi-varianza, è per definizione il variogramma:

1
γ ( x 0, h ) = Var{[Z ( x 0 + h) − Z ( x 0)]} .
2

Esso in generale è funzione di h e del punto di appoggio x0 .

Modelli Stazionari di Ordine 2

Un modello di FA si dice essere stazionario di ordine 22 quando sono verificate le due


seguenti condizioni:

• il momento primo esiste ed è invariante rispetto alla posizione x:

1
Il simbolo di vettore indica che la distanza è considerata tenendo conto anche della direzione individuata
dalla coppia di punti.
2
Nella letteratura geostatistica è frequente l’uso del termine stazionario senza l’ulteriore specificazione
“di ordine 2” o “strictu sensu”. In questi casi la stazionarietà, o eventualmente la non stazionarietà, sono
generalmente da intendendersi di ordine 2, rimanendo comunque inteso che il corretto significato lo si
deduce sempre dal contesto.

13
E Z ( x ) = m; (3.0)

• la covarianza C ( x 1, x 2 ) esiste e non dipende dalla particolare posizione di


x1 e x2 ma dipende solo dalla loro distanza h:

C ( x 1, x 2 ) = C ( x 1, x 1 + h ) = C ( h ) . (3.1)

L’esistenza della funzione covarianza implica che per x 2 → x1 , cioè per h → 0 il


valore della covarianza C(0) esiste ed ha valore finito. Esso corrisponde alla varianza
di Z(x), detta anche varianza a priori, che è quindi anch’essa invariante per
traslazione:

C ( x 1, x 1 ) = Var ( x 1) = C ( 0 ) .

Quando sono verificate le due condizioni precedenti la funzione C(h) è chiamata


funzione covarianza. Essa esprime la correlazione tra le variabili Z(x) e Z(x+h) in
funzione della distanza h dei loro punti di appoggio:
C ( h ) = E Z ( x + h ). Z ( x ) − m2

Proprietà della covarianza:

• è una funzione pari:

C(h) = C ( −h) ;

• la covarianza nel punto h = 0 assume sempre valori positivi:

C ( 0 ) = var Z ( x ) ≥ 0 ;

• vale la disuguaglianza di Schwartz:

C ( h ) ≤ C ( 0) ( 3.2 )

Poichè, come è ragionevole pensare, la correlazione tra le variabili Z(x) e Z(x+h)


tende ad indebolirsi con l’aumento della distanza tra i due punti di appoggio, si ha che
la funzione C(h) tende a decrescere con |h| = h, fino anche a potersi annullare se le
due variabili diventano indipendenti.

14
a: range
C(h)

C(0)

a h

Fig. 3.8. Andamento generale della funzione covarianza.

Se ciò ha luogo la distanza alla quale le due variabili diventano indipendenti si chiama
portata (range nella terminologia inglese e portée in quella francese) (fig.3.8)

Esaminiamo ora il comportamento della funzione variogramma nel quadro di un


modello stazionario di ordine 2. Partiamo dalla definizione:

1
γ ( x , h ) = Var Z ( x + h ) − Z ( x ) ( 3.3)
2

=
1
2
{ 2
}
E [Z ( x + h) − Z ( x)] − {E [Z ( x + h) − Z ( x)]}
2

Poichè, per ipotesi, il momento primo della FA Z(x) è invariante per traslazione, si
ha che:

E Z ( x + h) − Z ( x) = 0.

Quindi la ( 3.3 ) diventa:

γ (x , h ) =
1
2
E {[ Z ( x + h ) − Z ( x )]
2
}
. (3.4)
Il variogramma alla distanza h coincide, a meno del fattore ½ con la media degli
accrescimenti quadrati di Z(x) di entità h.

Ancora la ( 3.4 ) sviluppata secondo la relazione ( 1.20) diventa:

1
γ ( x, h ) = {Var[Z ( x + h)] + Var[Z ( x)] − 2Cov[Z ( x + h), Z ( x)]} (3.5)
2

Ora, sempre in virtù delle ipotesi di stazionarietà di ordine 2, la varianza e la funzione


covarianza sono invarianti per traslazione e quindi la ( 3.5 ) diventa:

15
1
γ (h ) = { 2Var [Z (x )] − 2C (h )} ,
2

da cui, riscrivendo più chiaramente, si ottiene l’importante relazione:

γ ( h ) = C ( 0) − C ( h ) ( 3.6 )

Questa relazione mostra che la funzione variogramma è strettamente legata alla


funzione covarianza e pertanto si può affermare che:

• anche γ(h) è invariante per traslazione;

• è indifferente utilizzare, come strumento di lavoro, la covarianza o il variogramma.

C (0 )

g (h)

C (h)

R ange h

Fig. 3.9- Funzione covarianza e funzione variogramma.

Dalla ( 3.6 ), tenendo conto della relazione di Schwartz ( 3.2 ), si deduce che la
funzione γ(h) è necessariamente limitata; il limite superiore è rappresentato dalla
varianza a priori (fig. 3.9).

3.3.2 Modelli non Stazionari

Le FA non stazionarie sono quelle che non rispettano le condizioni (3.0) e (3.1). Più
esplicitamente sono quelle che soddisfano anche ad una delle due condizioni:

• la media E Z ( x ) = m( x ) non è costante nel campo;

• la funzione covarianza o non esiste (perchè non esiste la varianza) o non è invariante per
traslazione.

Prima di esaminare le forme con cui le FA non stazionarie vengono affrontate e


caratterizzate al fine di rendere possibile la loro manipolazione, ci soffermiamo su due tipi

16
di modelli, non stazionari secondo la definizione data, che in maniera molto immediata si
riconducono allo stesso formalismo delle FA stazionarie.

Modelli quasi Stazionari

Una FA è detta essere quasi-stazionaria quando la sua media E[Z(x)] = m(x),


pur non essendo costante su tutto il campo, vi varia molto debolmente, sì da poter
essere considerata costante all’interno di domini di dimensioni non inferiori a quelle
del vicinaggio di lavoro.
Vediamo come si esprime un modello quasi-stazionario.

Consideriamo, per svincolarci dalla notazione vettoriale, di operare su uno spazio a


una dimensione, o su un allineamento (uno qualsiasi) di un campo bidimensionale.
Siano x0 e x0 +h due punti sull’allineamento. Il variogramma di Z(x) per la coppia
Z(x0) e Z(x0+h), in base alla ( 3.3) è dato da:

{
2γ (x 0 , h ) = E [ Z (x 0 + h ) − Z (x 0 )]
2
} − [ m (x 0 + h ) − m (x 0 )]
2

E’ facile verificare che il variogramma sopra definito è anche il variogramma di: Y(x)
= Z(x) - m(x), che è una variabile, detta residuo, di media nulla. Supponiamo che tale
residuo sia stazionario di ordine 2, il che equivale a supporre, essendo il residuo di
media costante, che γ ( x 0 , h ) dipenda solo da h e sia limitato superiormente.
Supponiamo ancora che m(x) sia una funzione, per semplicità, di tipo lineare:

m( x ) = a 0 + a 1 x .

l’espressione :

1
2
{ }
E [Z ( x 0 + h) − Z ( x 0)] ,
2

che coinciderebbe con il variogramma di Z(x) se E Z ( x ) fosse costante, risulta


essere:

2
1
{ }
E [ Z ( x 0 + h ) − Z (x 0 )] = γ (h ) + a 12 h 2
2
( 3.7 )

Ora, se il coefficiente a1 è molto piccolo, i termini di destra della espressione


precedente, dove il primo rappresenta un variogramma limitato (fig. 3.10 a), il
secondo una funzione parabolica (fig. 3.10 b), sommati danno luogo all’andamento di
fig. 3.10 c, che può essere considerato come l’andamento di un variogramma di una
FA Z(x) stazionaria entro i limiti fissati dalla distanza b alla quale la curva comincia
ad impennarsi. Tale distanza definisce il dominio di stazionarietà della FA Z(x). In
altri termini Z(x) può essere considerata stazionaria di ordine 2 per vicinaggi di
dimensioni ≤ b ed il suo variogramma è espresso da:

γ (h) ≅
1
2
{
E [Z ( x 0 + h) − Z ( x 0)]
2
}

17
In pratica si è considerato, sempre per h ≤ b, a 1 2 h 2 ≅ 0 .
E’ importante notare che la illustrazione del concetto di quasi-stazionarietà è stata
effettuata servendosi della funzione variogramma; non sarebbe stato possibile usando
la covarianza. E’ questa una delle ragioni per cui nella geostatistica applicata si opera
in principio con la funzione variogramma.

g (h)
a)

h
2
m (h)

b)

g *(h) c)

Fig. 3.10 - Andamento del variogramma sperimentale per modelli quasi-stazionari.

Modelli intrinseci

18
Può succedere che una FA Z(x) non stazionaria sia tale che i suoi incrementi lo siano.
Una situazione del genere è classica e corrisponde al moto browniano, vale a dire al
moto disordinato di una particella provocato dagli urti con una grande quantità di altre
particelle in movimento costituenti un liquido. Il risultato di una simulazione del moto
browniano a una dimensione, su 6000 unità temporali, è riportata in figura 3.11 e
consiste nell’andamento, in funzione del tempo, della progressiva che identifica la
posizione della particella.

80
Progressiva

60
40
20
0
-20
-40
-60
-80
0 1000 2000 3000 4000 5000 6000
Tempo

Fig. 3.11 – Andamento delle progressive (simulate) relative al moto (browniano monodimensionale)
casuale di una particella a seguito degli innumerevoli urti subiti ad opera di altre particelle.

Come si evince dal grafico la variabile presenta un andamento senza regole che non
consente di fare alcuna considerazione su media e varianza. Gli incrementi invece
sono stazionari, nel senso che essi fluttuano attorno un valore costante (zero in
particolare) e con fluttuazioni di ampiezza paragonabile.
Nella figura 3.12 si riporta l’andamento di 500 incrementi a passo temporale 3 e 6
calcolati nella parte iniziale, nella parte di mezzo e nella parte finale della
simulazione. L’andamento di fig. 3.11 è modellizzabile con una FA intrinseca.

19
4 (1) 8

progressiva (Dt=3)

progressiva (Dt=6)
3 6

Incrementi di

Incrementi di
2 4
1 2
0 0
-1 -2
-2 -4
-3 -6
-4 -8
0 100 200 300 400 500 0 100 200 300 400 500
Tempo Tempo

4 (2) 8
progressiva (Dt=3)

progressiva (Dt=6)
3 6
Incrementi di

Incrementi di
2 4
1 2
0 0
-1 -2
-2 -4
-3 -6
-4 -8
0 100 200 300 400 500 0 100 200 300 400 500
Tempo Tempo

4 (3) 8
progressiva (Dt=3)

progressiva (Dt=6)
3 6
Incrementi di

2
Incrementi di 4
1 2
0 0
-1 -2
-2 -4
-3
-6
-4
-8
0 100 200 300 400 500
0 100 200 300 400 500
Tempo
Tempo

Fig. 3.12 – Andamento delle progressive (simulate) a passo temporale 3 (parte sinistra) e 6 (parte
destra) calcolati rispettivamente sui valori 1-500 (1), 2500-3000 (2) e 5500-6000 (3) della simulazione.

Una FA si dice intrinseca in S (e si indica FAI) se per ogni vettore h i corrispondenti


accrescimenti sono stazionari di ordine 2, vale a dire: dati due punti di posizione x0 e
x0 + h l’accrescimento: Z(x0 ) - Z(x0 + h) ammette momenti ordine uno e due di
valore finito ed invarianti per traslazione, cioè non dipendenti dal punto di appoggio x0
ma solo dalla posizione h. Le due condizioni si esprimono come segue:
segue:

= [m(h)
E Z ( x 0 + h ) − Z ( x 0 ) ] = m(h) ( 3.8 )

D 2 Z ( x 0 + h ) − Z ( x 0) = 2 γ ( h ) ( 3.9 )

m(h) rappresenta la deriva di Z(x) che è necessariamente lineare.

Infatti la (3.8) si può anche scrivere:

[
E Z ( x 0 + h + h ') − Z ( x 0 ) = m( h + h ) ] ’
(3.10)

e anche

20
[ ] ’
E Z ( x 0 + h + h ') − Z ( x 0 + h ) = m(h ) (3.11)

Sottraendo la (3.8) dalla (3.10) e tenendo conto della (3.11) si deduce la linearità di
m(h):

m(h+h’) - m(h) = m(h’).

Le FAI cui si farà riferimento nel seguito saranno quelle senza deriva e cioè con m(h)
= 0. Questa restrizione, che nell’ambito della Geostatistica di base è utile per la
esemplificazione delle procedure, deve essere verificata. In un ambito più generale,
quello in cui si studiano i fenomeni non stazionari, tale restrizione è invece fondata.

Si precisa che una FAI senza deriva non significa una FA di media costante, perché,
per definizione, una FAI non fa nessun riferimento alle VA Z(x) ma solo agli
incrementi. L’andamento di fig. 3.11 non evidenzia una fluttazione attorno ad un
valore costante, eppure gli incrementi sono di media nulla.

Nella (3.9) γ(h) rappresenta la funzione variogramma già introdotta all’inizio del
paragrafo. Il variogramma, appunto perchè espressione di una FA intrinseca, è anche
chiamata nella terminologia geostatistica funzione intrinseca.

Un modello intrinseco è chiaramente meno esigente di un modello stazionario: le


condizioni che lo definiscono sono meno restrittive. Si osserva che un modello
stazionario è necessariamente intrinseco: infatti nel paragrafo 3.3.1 è stato dimostrato
che se un modello è stazionario esso ammette variogramma, che risulta essere legato
alla funzione covarianza dalla relazione (3.6). Si ribadisce che un modello intrinseco
non ammette obbligatoriamente funzione covarianza: si ricorda anzi che il modello
intrinseco è stato proprio introdotto per trattare FA prive di covarianza. Un modello
(o una FA) intrinseco ma non stazionario è chiamato strettamente intrinseco.

Senza entrare nel merito di cose che saranno esaminate più avanti, è importante tener
presente in questa fase che nella stima lineare il formalismo di calcolo per le FA
intrinseche è identico a quello delle FA stazionarie, a patto di sostituire la funzione
covarianza con la funzione variogramma cambiata di segno.

I due modelli sopra presentati, molto ricorrenti nella pratica geostatistica, soprattutto il
primo, sono modelli non stazionari molto particolari, che, come si è visto, sono stati
facilmente ricondotti a situazioni di stazionarietà: il primo restringendo la stazionarietà su
aree ristrette, il secondo cercando la stazionarietà dell’incremento. Anche per le altre
situazioni di non stazionarietà, quelle più proprie, ma anch’esse molto frequentemente
ricorrenti nella modellizzazione geostatistica, si seguirà un cammino analogo: attraverso il
ricorso a particolari forme ci si ricondurrà sempre a un qualcosa di stazionario. Due sono i
tipi di modelli proposti nella geostatistica non stazionaria: modello con deriva e modello
intrinseco di ordine k: sono due facce della stessa medaglia (non stazionaria); entrambi
filtrano dal trattamento probabilistico tutto ciò che non è caratteristica intrinseca del
fenomeno; il secondo modello è una generalizzazione del modello intrinseco.

21
Senza entrare nei particolari, diamo qui di seguito un breve cenno sugli approcci per
completare il quadro sui modelli delle Funzioni Aleatorie.

Modello con Deriva

Questo tipo di modello trae spunto dall’osservazione di alcuni fenomeni naturali:


quelli che mostrano una componente di variabilità a scala regionale o una variabilità
che ingloba un trend, vale a dire una variazione sistematica della variabile più o meno
accentuata, in un senso o nell’altro. Empiricamente questa tendenza potrebbe essere
descritta dall’andamento della media (della variabile di interesse) su vicinaggi mobili
all’interno dell’area di indagine. Il punto di vista del vicinaggio determina la scala alla
quale bisogna osservare il fenomeno ai fini dello studio geostatistico, perchè, è
evidente, certe frequenze appaiono o non appaiono a seconda della scala di
osservazione.
Se un fenomeno quindi manifesta con evidenza, alla corretta scala di osservazione, un
progressivo aumento o diminuzione, vuol dire che bisogna scegliere una FA modello
con media variabile: E Z ( x ) = m( x ) ; quest’ultima nel linguaggio geostatistico è
chiamata deriva (dérive nella terminologia francese e trend in quella inglese), termine
già introdotto per caratterizzare una FAI.

Pertanto nel modello con deriva è supposto che la FA oggetto di studio Z(x) possa
essere considerata, in ogni punto x, come la sovrapposizione di due componenti:

• la deriva m(x), che costituisce la componente deterministica;

• il residuo Y ( x ) = Z ( x ) − m ( x ) , che costituisce la parte aleatoria.

Si ha ovviamente che:

Z ( x ) = Y ( x ) + m( x ) .

Questa dicotomia, decomponendo la variabilità totale in due componenti, una


deterministica e l’altra stocastica, con un criterio che, come è stato detto sopra, è
influenzato dalla scala di osservazione del fenomeno, sembra introdurre un forte
elemento di soggettività. In verità, spesso questa dicotomia risponde ad una esigenza
naturale, e ciò accade quando la deriva è espressione di una componente regionale,
regolare, di una tendenza che ha un significato fisico rispetto al fenomeno studiato.

Generalmente la deriva viene modellizzata con una funzione polinomiale:

m( x ) = al f l ( x ) ,
l

dove al sono i coefficienti del polinomio e fl(x) monomi di grado l.


Il residuo Y(x), essendo esso a media costante (perchè nulla), viene modellizzato con
una FA o stazionaria o intrinseca a seconda che ammetta covarianza o solo
variogramma. In un caso avremo un modello con deriva e residuo stazionario,
nell’altro un modello con deriva e residuo intrinseco. Al variogramma e la
covarianza del residuo, espressi nella forma consueta:

22
C ( h) = E Y ( x ) ⋅ Y ( x + h ) ; {
2γ (h ) = E [Y (x + h ) − Y (x )]
2
}
è attribuito l’appellativo di sottogiacenti, perché la loro inferenza, quando è possibile,
non è diretta.

Modello Intrinseco di ordine k

La definizione di questo modello è il risultato della generalizzazione del procedimento


seguito per la definizione del modello strettamente intrinseco: allora si è operato
considerando in ogni punto x invece della variabile diretta Z(x) l’accrescimento in x
relativo ad una distanza orientata h: Z(x+h) - Z(x). In questo modello la nozione di
accrescimento è generalizzata ad una combinazione lineare di ordine k, cioè ad una
combinazione lineare:
n
Z Λk ( x ) = λiZ ( x i ) (3.12)
i =1

che, affinché possa essere stazionaria, deve filtrare dei polinomi di grado k, cioè deve
soddisfare alle seguenti condizioni:
n
λif l ( x i ) = 0 (l = 0, 1,...,k) (3.13)
i =1

Nella (3.12) {x1, x 2,..., xn} sono le posizioni di n punti ∈S ; {Z ( x1), Z ( x 2),..., Z ( xn)}
sono le VA ad essi associate; Λk un insieme di numeri reali {λ 1, λ 2,..., λn} , che
costituiscono i coefficienti della combinazione lineare.

Nella (3.13) f l ( x i ) sono i monomi di grado l delle coordinate degli n punti. Nel caso
che il campo S sia bidimensionale, indicando con {xu1, xu 2,..., xun} e {xv1, xv 2,..., xvn} le
coordinate degli n punti, per un ordine per es uguale a 2, la (3.13) equivale ai seguenti
tre gruppi di condizioni:

I° gruppo: { i
λi = 0

λixui = 0
II°gruppo: i

i
λixvi = 0

i
λix ui = 0
2

III°gruppo: i
λix vi = 0
2

λixuixvi =0
i

23
Per un ordine k = 1 le condizioni sono quelle del primo e del secondo gruppo, mentre
per un ordine k = 0 le condizioni sono solo quelle del primo gruppo.

Possiamo ora enunciare le proprietà del modello. Una FA Z(x) si dice essere
n
intrinseca di ordine k se la FA : Z Λk ( x ) = λiZ ( x i ) è stazionaria di ordine 2. In tal
i =1
caso la combinazione Z Λk ( x ) è detta combinazione lineare autorizzata di ordine k.

A questo punto non è difficile riconoscere nell’accrescimento stazionario Z(x+h) -


Z(x) una combinazione lineare autorizzata di ordine 0. Infatti in questo caso i
coefficienti dei termini della combinazione lineare sono 1. e -1. e rispettano la
condizione del primo gruppo.

3.3.3 Considerazioni sulla Scelta dei Modelli

Dopo questa disamina sui modelli di FA che ricorrono nelle applicazioni della Geostatistica
inevitabilmente si pone il problema della scelta del modello con interrogativi del tipo: con
quale criterio, con quali dati, con quali tecniche, con che conseguenze. A tutte queste
domande verrà risposto specificamente nel successivo paragrafo 3.4 per ciò che concerne
una parte dei modelli, e nel Cap. 4 per la restante parte, atteso che tutto lo sviluppo di
queste dispense contribuisce in maniera generale a chiarire questo problema. In questo
punto ci limitiamo a qualche considerazione di principio.
Innanzi tutto va chiarito il rapporto fenomeno/modello. Le proprietà che definiscono un
modello sono delle proprietà matematiche e sono da attribuire unicamente alla FA. Non si
possono attribuire delle proprietà matematiche ai fenomeni. Con riferimento a una delle
scelte più ricorrenti nella pratica geostatistica, se adottare un modello stazionario o un
modello non stazionario per lo studio di un fenomeno, possiamo efficacemente citare P.
Chauvet (“Aide mémoire de Géostatistique linéaire”, pag.89) “... una variabile
regionalizzata (quindi un fenomeno) non è, in sé, nè stazionaria, nè non stazionaria. Per
essere precisi bisognerebbe dire tale variabile regionalizzata, per un dominio dato e per
una data scala di lavoro, può ragionevolmente essere (o non essere) modellizzata da una
Funzione Aleatoria stazionaria. E si sottolinea ancora una volta che l’avverbio
ragionevolmente, che può scandalizzare gli statistici, potrebbe essere presa come la pietra
angolare del procedimento del geostatistico. Così nel caso preciso che ci interessa, non c’è
vera risposta alla questione stazionario o non stazionario, ma piuttosto una assunzione di
responsabilità da parte del geostatistico, fatta con cognizione di causa, nel migliore accordo
possibile coi dati, seguendo sempre il principio dell’economia, e cosciente che comunque
alla fine ci sarà sempre un rischio”.

Bisogna precisare che in geostatistica non si ha alcuna avversione pregiudiziale per i test,
ma si deve tener presente che questi test necessitano di disporre già di un modello
interamente specificato. Anzi, proporre dei test di stazionarietà esigerebbe, a livello teorico,
una specificazione del modello probabilista molto più completa di quanto non sia richiesto
ulteriormente dalla Geostatistica Lineare e di quanto realisticamente si possa sperare di
raggiungere.

24
Dal punto di vista pratico la scelta del modello non presenta poi particolari difficoltà se si
ha un pizzico di esperienza e si dispone di software geostatistici adeguati. Il più delle volte il
modello da adottare viene suggerito in maniera inequivocabile dal comportamento dei dati
rispetto a certe operazioni. E ciò non è casuale dato che i modelli proposti traggono spunto
dalla realtà.

Quando poi sorgono delle difficoltà ricordiamo che esiste sempre un criterio empirico che
aiuta a fare scelte efficaci: quello di scegliere il modello sulla base dei risultati di una
validazione incrociata.

3.4 Analisi ed interpretazione dei variogrammi sperimentali

Con riferimento ai modelli di FA esaminati nel paragrafo precedente, si ha che il


modello stazionario, il modello quasi-stazionario ed il modello intrinseco possono
essere tutti e tre descritti nella stessa forma: tramite la funzione variogramma. In tutti e
tre i casi infatti, per le proprietà del modello, la funzione variogramma esiste ed è
invariante per traslazione, con una restrizione per il modello quasi-stazionario che limita
queste proprietà al dominio di stazionarietà. Per questi modelli si ricorda che il
variogramma ha la seguente forma:

γ (h) =
1
2
{
E [Z ( x + h) − Z ( x)]
2
} (3. 14)

Questa espressione si presta ad una stima diretta a partire dai valori misurati e ciò rende
piuttosto semplice l’ inferenza della funzione variogramma.
Questo paragrafo sarà dedicato alla stima del variogramma e della sua interpretazione
nell’ambito dei modelli citati. Per gli altri modelli, che sono quelli tipicamente non
stazionari, la definizione ed il riconoscimento del modello richiedono procedure diverse
che saranno descritte nel cap. 4, dedicato totalmente ai fenomeni “non stazionari”.

Quando si affronta uno studio geostatistico, la prima fase di esso, dopo una necessaria
analisi preliminare consistente nella elaborazione delle statistiche elementari e
finalizzata a prendere conoscenza dei dati ed alla loro verifica, è dedicata al calcolo ed
alla interpretazione dei variogrammi sperimentali. Uno dei risultati dell’interpretazione
è la identificazione del modello di FA: se stazionario, quasi-stazionario, intrinseco, o
qualcosa altro di non stazionario. Spesso l’ identificazione del modello, come sarà
mostrato più avanti, avviene in maniera molto chiara e inequivocabile.

Con riferimento ai modelli di FA introdotti ed ai metodi che saranno descritti in queste


dispense si ricorda che, ad eccezione del cap. 6 dedicato al trattamento dei fenomeni
non stazionari, il resto dei capitoli tratterà le metodologie per modelli stazionari e
quasi-stazionari. Tutto quanto è svolto nell’attuale cap. 3 vale anche per i modelli
intrinseci.

3.4.1 Calcolo dei variogrammi sperimentali

25
La stima della funzione variogramma viene effettuata sulla base dei dati provenienti dal
campionamento del fenomeno oggetto di studio. Si consideri per esempio la fig. 3.13 in
cui è schematizzato un campo di lavoro ed i punti di prelievo, disposti a maglia
regolare, di campioni di suolo su cui è stato misurato il contenuto in metalli pesanti, tra
essi il Cadmio (Cd). Si vuole effettuare il calcolo del variogramma sperimentale.
Si tratta di stimare l’espressione (3.14), che per FA stazionarie, quasi-stazionarie e
intrinseche, rappresenta appunto il variogramma. Il suo stimatore, come ogni altro
stimatore considerato in queste dispense, viene convenzionalmente notato
contrassegnando con un asterisco l’entità da stimare:

1
{
γ ∗ (h) = Stima E [Z ( x + h) − Z ( x)]2 .
2
} (3. 15)

Fig. 3.13 - Disposizione di un piano di campionatura a maglia regolare.

Per le FA sopra menzionate, data la stazionarietà dell’ incremento Z ( x + h) − Z ( x ) , in


assenza di deriva γ ∗ ( h ) è dato dalla media aritmetica degli incrementi quadrati misurati
a distanza h.
Siano infatti r il lato della maglia e xi , xi + r la posizione di due punti distanti r e allineati
secondo la direzione X, il variogramma sperimentale alla distanza r nella direzione X è
dato da:
Nr
2
γ ∗ (r ) = z ( xi + r ) − z ( xi )
i =1

dove N r è il numero di coppie di punti aventi tra di loro distanza r e allineati secondo la
direzione X. Alla stessa maniera si può calcolare, secondo la stessa direzione X il
variogramma sperimentale per h=2r, 3r; analogamente il tutto è ripetibile per la
direzione Y. Per la direzione a 45° è possibile calcolare γ ∗ ( h ) per i valori di h:
r 2 ,2r 2 ,3r 2 . .

Non così immediato è il calcolo dei variogrammi sperimentali quando la maglia è


irregolare, come per esempio lo schema di campionature riportato in fig. 3.14 a.
Supponiamo di voler calcolare il valore del variogramma ad una distanza r lungo la
direzione φ (fig. 3.14 b). Il contributo al calcolo del variogramma suddetto deriva da
tutte le coppie di campioni che si possono individuare distanti r e allineate secondo la

26
direzione φ. Può accadere che non vi sia alcuna coppia così disposta. E’ allora
necessario introdurre una tolleranza angolare ∆φ sulla direzione ed una tolleranza ∆r
sulla distanza; così facendo tutte le coppie di campioni aventi distanza compresa tra r-
∆r e r+∆r e allineate secondo una direzione conpresa tra φ-∆φ e φ+∆φ contribuiscono
al calcolo del variogramma r ,φ.

Dal punto di vista operativo è immediato verificare, con semplici considerazioni


geometriche, se la coppia di campioni individuata dai punti p1 e p2 di coordinate
rispettivamente (u1 , v1 ) e (u2 , v2 ) contribuisce al calcolo del variogramma per la
direzione φ ± ∆φ e la distanza r ± ∆r.

Fig. 3.14 - Disposizione di un piano di campionatura a maglia irregolare.

Infatti , indicando con d la distanza tra i due punti: d = sqrt ((u2 -u1)∗∗2+(v2 -v1)∗∗2 ),
con con C1 = d / (u2 -u1) e C2 = d /(v2 -v1) i coseni direttori della direzione p1 - p2 e
con D1 = cos(φ) e D2 = sin(φ) i coseni direttori della direzione φ, il coseno dell’angolo
α , formato dalla congiungente i punti p1 , p2 e dalla direzione φ, è dato da:
cos(α ) = C1∗D1 + C2∗D2 . Quindi la coppia contribuirà al calcolo del variogramma se:
cos(α ) ≥ cos(∆φ ) e r-∆r ≤ d ≤ r+∆r.

I valori delle tolleranze ∆φ e ∆r da adottare dipendono ovviamente dalla quantità di


campioni di cui si dispone: più essi sono di numero elevato e più piccole possono essere
le tolleranze, consentendo con ciò maggiore precisione nel calcolo dei variogrammi. E’
comunque di uso abbastanza frequente calcolare i variogrammi sperimentali per
distanze multiple di una distanza di base, chiamata passo, con un valore di ∆r pari
proprio a metà del passo e secondo quattro direzioni, a novanta gradi tra di loro, con
un valore di ∆φ di 22.50 ° . Questo consente di utilizzare tutte le coppie individuate
dall’insieme dei campioni disponibili.

In conclusione, sia partendo da una maglia regolare che da una maglia non regolare,
utilizzando le tecniche di calcolo sopra illustrate, è possibile stimare per diverse
distanze h il variogramma sperimentale γ∗(h), i cui valori possono essere graficati come
in fig. 3.15. L’andamento di γ∗(h) in funzione di h esprime quasi sempre situazioni
facilmente riconoscibili, che riguardano sia il modello di FA sia lo stile della
variabilità spaziale del fenomeno considerato. Esamineremo di seguito questi aspetti

27
facendo riferimento a casi di studio e fornendo di volta in volta i presupposti teorici
dell’interpretazione.

Fig. 3.15 - Rappresentazione di un variogramma sperimentale.

3.4.2 Identificazione del modello di FA

Quando il variogramma sperimentale, sia pur con delle fluttuazioni, si attesta su di un


valore che poi rimane costante, e tale valore è pressappoco coincidente con la varianza
empirica, allora questo è un segno che il fenomeno in esame può essere descritto da un
modello stazionario (di ordine 2). Si ricorda che per tale modello il momento primo ed
il momento secondo sono invarianti per traslazione e che la funzione variogramma è
legata alla funzione covarianza dalla relazione seguente:

γ ( h ) = C ( 0) − C ( h )

C(0) è il valore di soglia che corrisponde alla varianza della FA Z(x).

Nelle tre figure seguenti riportiamo altrettanti variogrammi sperimentali, presi dalla
letteratura, in cui appare molto evidente l’esistenza di un valore di soglia che rimane poi
costante. In ogni figura accanto al variogramma sperimentale è tracciato il variogramma
modello, cioè la funzione analitica aggiustata sui punti sperimentali; l’aggiustamento
del variogramma sarà trattato nel paragrafo 3.5.

La fig. 3.16 mostra il variogramma secondo la direzione verticale, costruito sui dati di
40 perforazioni, della variabile saturazione in olio della formazione sabbiosa canadese
Athabasca. Il variogramma presenta delle oscillazioni attorno ad un valore stimato
essere attorno a 19, raggiunto ad una distanza di 36 m. Nella figura per alcuni punti
sperimentali è indicato il numero di coppie con cui il variogramma è stato calcolato.

28
Fig. 3.16 - Variogramma sperimentale della saturazione in olio di un giacimento
petrolifero. (figura tratta da Mining Geostatistics di Journel & Huijsbregts, pag 237).

La fig. 3.17 si riferisce al variogramma sperimentale del contenuto in Cu del


giacimento cileno di Los Bronces costruito sulla base di circa 4000 campioni. Il valore
di soglia di 0.73 è stato considerato essere raggiunto asintoticamente; stando alla
definizione, si direbbe che il variogramma ha un range infinito.

La fig. 3.18 rappresenta il variogramma della variabile conducibilità elettrica, costruito


sui dati trasformati (trasformazione gaussiana), misurata per il controllo della salinità
su

Fig. 3.17 - Variogramma sperimentale Fig. 3.18 - Variogramma della conducibilità elettrica
della variabile Cu in un giacimento del ca in un suolo della valle del Giordano in Israele.
Cile (da Mining Geostatistics di Jour- (da ”Disjunctive Kriging in Agriculture”, di R. Web-
nel & Huijsbregts, pag.240) ster and Oliver”, M.Armstrong(ed.), Geostatistics, vol. I)

campioni di suolo della regione di Bet Shean nella valle del Giordano in Israele. Come
nel caso precedente il valore di soglia 1 è raggiunto asintoticamente.

29
Le situazioni sopra riportate sono inequivocabili, esse ricorrono abbastanza
frequentemente nel trattamento dei dati spaziali: l’adozione di un modello stazionario
appare quanto mai appropriata.
Un’altra situazione, anch’ essa frequente nella pratica delle applicazioni, è quella in cui
il variogramma sperimentale raggiunge un valore di soglia che si mantiene costante per
un breve tratto e poi si impenna crescendo indefinitamente. Questo comportamento lo
si può osservare nella fig. 3.19, che rappresenta il variogramma verticale di una
mineralizzazione di Cu, in cui il contenuto di Cu diminuisce debolmente e
sistematicamente con la profondità. L’andamento di un siffatto variogramma
sperimentale indica inequivocabilmente, sulla base di quanto detto nel punto 3.3.2, un
comportamento della VR modellizzabile con una FA quasi-stazionaria. Il valore di h al
quale il variogramma sperimentale comincia ad impennarsi è di 100 ft, e corrisponde
alla distanza al di sotto della quale il trend di variazione del contenuto in Cu è
trascurabile. Operando al di sotto dei 100 ft si ha il diritto di modellizzare la variabile di
studio con una FA stazionaria, il cui variogramma è rappresentato appunto dal tratto di
curva al di sotto dei 100 ft. E’ importante notare che in questi casi il valore di soglia del
variogramma non corrisponde, al contrario di quanto accade nel caso stazionario, alla
varianza empirica dei campioni, in quanto questa, essendo calcolata su tutti i campioni,
ingloba anche la variabilità dovuta alla variazione sistematica.

Fig. 3.19 - Variogramma sperimentale indicante una situazione di quasi-


stazionarietà (fig. tratta da tratta da Mining Geostatistics di Journel & Huijsbregts,
pag 44).

Facendo ancora riferimento alle considerazioni sulla quasi-stazionarietà del già citato
paragrafo 3.3.2, si ha che, se la variazione sistematica della media non è più debole ma
accentuata, la somma delle due componenti, il variogramma e la parabola, produce una
curva che si impenna rapidamente non evidenziando alcun dominio di stazionarietà,
come risulta dalla fig. 3.20: ci si trova di fronte ad una situazione non stazionaria.

30
Essendo i fenomeni naturali strutturati e spesso regolati da fattori che agiscono su
direzioni preferenziali, può accadere che un fenomeno sia stazionario in una direzione e
non stazionario in un’altra direzione. Si osservi, ad esempio, la fig. 3.21. In essa sono

g*(h)

2
m (h)

g(h)

h h

Fig. 3.20 - andamento del variogramma sperimentale in presenza di un trend accentuato

riportati i variogrammi sperimentali del geopotenziale1 a 500 mbar, uno in direzione


EW (longitudine), l’altro in direzione NS (latitudine). Il variogramma EW presenta un
valore di soglia raggiunto ad una distanza di circa 3000 Km, denunciando una
situazione di stazionarietà o meglio di quasi-stazionarietà. Il variogramma NS mostra
invece un marcato andamento parabolico, che, per quanto detto sopra, è il segnale della
presenza di una deriva, cioè di una sensibile variazione sistematica del geopotenziale.

Fig. 3.21 - variogrammi del geopotenziale (da Mining Geostatistics di Journel & Huijsbregts,
pag. 242).

1
Il geopotenziale è una grandezza usata in meteorologia e corrisponde all’altezza H(x) in un punto x di
una determinata isobara superficiale.

31
A conferma di questa interpretazione si osservino nella figura seguente gli andamenti
misurati del geopotenziale lungo le due direzioni precedenti. Mentre l’andamento nella
direzione EW (fig. 3.22b) mostra delle fluttuazioni attorno ad una

Fig. 3.22 - Andamento del geopotenziale nelle direzioni N-S, E-W (da Mining Geostatistics di pag. 242-
243).

media pressocchè costante, l’andamento nella direzione NS (fig. 3.21a) mostra un


progressivo aumento del geopotenziale dal polo all’equatore.

Diamo ancora un altro esempio di come passando da una direzione all’altra si passa da
una situazione stazionaria ad una non stazionaria. Nella fig. 3.23 è raffigurata un’area
di 100 mila ettari lungo il fiume Batanghary (ovest di Sumatra). L’area è stata
campionata mediante il prelievo di circa 150 campioni, su cui sono state misurate le
caratteristiche del suolo, tra cui la tessitura, che, in termine di scienza dei suoli, consiste
nelle percentuali di sabbia, limo, argilla. La tessitura come è noto è legata alla
morfologia dell’area.

Sui dati di campionatura è stato condotto uno studio geostatistico finalizzato allo studio
della variabilità del suolo. Nella fig. 3.24 si riportano i variogrammi del contenuto in
sabbia calcolati su quattro direzioni. Come si può osservare il variogramma lungo la
direzione SE-NW (che pressappoco corrisponde a quella dell’asse del fiume) raggiunge
un valore di soglia di circa 150 ad una distanza di 15-20 Km. Nella direzione ortogonale
alla precedente NE-SW il variogramma mostra invece un comportamento parabolico,
che è il segno della presenza di un trend nella variabile. Nelle direzioni intermedie i
variogrammi hanno un comportamento intermedio, anche se non simmetrico. In
particolare si nota che la direzione E-W presenta una situazione di quasi-stazionarietà
con dominio di stazionarietà di circa 5 Km, somigliando un po'alla dirzione SE-NW,
mentre il variogramma nella direzione N-S somiglia più a quello della direzione NE-
SW. Ciò si spiega molto semplicemente: l’asse del fiume non coincide esattamente con
la direzione NW-SE e quindi le direzioni N-S, E-W non sono simmetriche rispetto
all’asse del fiume. Accade che l’asse del fiume forma con la direzione E-W un angolo
minore di quello formato con la direzione N-S.

32
Fig. 3.23 - Area di Sitiung (Est Sumatra). Principali unità geomorfiche e localizzazione dei campioni (da
“soil variability of soil properties”, di G. Uehara et al., Proceedings of the workshop on soil spatial
variability of the ISSS and the SSSA, Las Vegas 1984).

I due esempi precedenti non sono dei casi isolati; sono molto frequenti i fenomeni in
cui una variabile di studio manifesta una tendenza sistematica ad aumentare o a
diminuire, e ciò quasi sempre avviene secondo una determinata direzione. Il modello di
FA da adottare è ovviamente un modello complessivo non stazionario; come e con
quale approccio sarà illustrato nel par. 4.

Fig. 3.24 - Variogrammi della percentuale di sabbia calcolati su quattro direzioni del piano (elaborati da
“soil variability of soil properties”, di G. Uehara et al., Proceedings of the workshop on soil spatial
variability of the ISSS and the SSSA, Las Vegas 1984).

33
Non necessariamente quando il variogramma sperimentale non raggiunge un valore di
soglia, esso deve avere un comportamento parabolico. E’ frequente il caso in cui
l’andamento è lineare, come il variogramma mostrato nella fig. 3.25b. Esso si riferisce
al variogramma dei mm d’acqua misurati dopo un evento nel bacino di Kadjemeur nel
Tchad (Africa Centrale). La sottostante figura 3.25a mostra la localizzazione dei
pluviometri. Un variogramma come quello di figura, non avendo un limite superiore,
indica chiaramente la non esistenza della funzione covarianza, ma, mancando
l’andamento parabolico, indica anche che la media della variabile non ha un trend,
senza però essere necessariamente costante nel campo. Il modello che in maniera
specifica interpreta questa situazione è quello strettamente intrinseco, che, si ricorda, è
un modello di FA in cui gli incrementi a distanza h sono stazionari.

Fig. 3.25 - Bacino di Kadjemeur: localizzazione dei pluviomatri e variogramma sperimentale dei mm di
pioggia dopo un evento (da Mining Geostatistics di Journel & Huijsbregts, pag. 19).

Per rendersi conto di ciò riprendiamo l’andamento della FAI mostrata nella figura 3.11.
Il suo variogramma (fig 3.26), calcolato per 50 passi sui sei mila dati, è lineare e non
raggiunge un valore di soglia, neanche se calcolato per 5000 passi. In questa situazione,
come ricordato sopra, non esiste la funzione covarianza in quanto questa, per una FAI
strettamente intrinseca, non è invariante per traslazione ma dipende dalla posizione
rispetto al campo.
Nella figura 3.27 è riportata la covarianza (centrata) sperimentale calcolata per 50 passi
sull’inera area. Ma se la stessa funzione viene calcolata in zone diverse si ottengono
risultati diversi, come mostra la fig 3.28 dove sono riportate le covarianze sperimentali
calcolate, per 50 passi, sui primi 2000 valori del campo, sui valori da 2001 a 4000 e
sugli ultimi 2000 valori. Le covarianze sono tutte e tre diverse tra di loro e da quella
calcolata su tutto il campo, riportata anche nello stesso grafico. Non così è per i
variogrammi sperimentali che, calcolati sugli stessi tratti, hanno andamento molto
simile tra loro e rispetto al variogramma globale (fig 3.29).

34
50

Variogramma 40

30

20

10

0
0 10 20 30 40 50

Tempo

Fig. 3.26 - Variogramma sperimentale delle progressive calcolato su tutti i valori della simulazione

690
Covarianza

685

680

675

670

665

660
0 10 20 30 40 50
Tempo

Fig. 3.27 - Covarianza sperimentale delle progressive calcolata su tutti i valori della simulazione.

35
750

Covarianza
Zona 1-2000
Zona 2001-4000
550 Zona 4001-6000
Totale

350

150
0 5 10 15 20 25 30 35 40 45 50
Tempo

Fig. 3.28 - Covarianze sperimentali calcolate su tutto il campo e sui tratti 1-2000, 2001-4000 e 4001-6000
della simulazione

50
Variogramma

Zona 1-2000
40 Zona 2001-4000
Zona 4001-6000
30
Totale

20

10

0
0 10 20 30 40 50

Tempo
Fig. 3.29 - Variogrammi sperimentali calcolati su tutto il campo e sui tratti 1-2000, 2001-4000 e 4001-
6000 della simulazione

36
Un altro tipo di variogramma espressione dello stesso modello è il variogramma ad
andamento logaritmico; anch’esso non è limitato superiormente ed è lontano da un
andamento parabolico.

3.4.3 Comportamento nell’origine del variogramma

La continuità e la regolarità spaziale della VR sono responsabili del comportamento del


variogramma nell’origine (cioè quando h → 0) . Nell’esaminare questa proprietà
facciamo riferimento a variogrammi sperimentali riconducibili a FA stazionarie, quasi-
stazionarie e strettamente intrinseche. Si possono individuare tre forme di
comportamento: parabolico1, lineare, discontinuo. Nella fig. 3.30 sono riportati tre
coppie di grafici: a, b, c; ogni coppia rappresenta nel grafico di sinistra l’andamento di
una variabile v(x) lungo una progressiva x e nel grafico di destra il relativo
variogramma.

Fig. 3.30 -Comportamento del variogramma nell’origine: discontinuo (a); lineare (b); parabolico (c) (da
“An introduction to Applied Geostatistics” di E.H. Isaaks & R.M.Srivasatava).

1
Da non confondere il comportamento parabolico (o lineare) nell’origine del variogramma con il
comportamento parabolico (o lineare) del variogramma nel suo complesso. Un variogramma può avere un
comportamento lineare o parabolico nell’origine e nello stesso tempo ammettere un valore di soglia finito
.

37
Tutti e tre i variogrammi raggiungono un valore di soglia che si mantiene poi costante,
ma il comportamento all’origine è diverso. In particolare esaminando i grafici dal basso
verso l’alto:
• il variogramma (c) ha un comportamento parabolico nell’origine che interpreta
l’elevata regolarità e continuità spaziale della variabile v di sinistra. La funzione
variogramma è due volte derivabile nell’origine ed anche v(x) è derivabile;

• il variogramma (b) ha nell’origine un comportamento lineare, ma non è più


derivabile. La variabile v(x) è continua, ma anch’essa non derivabile;

• il variogramma (a) presenta una discontinuità nell’origine: γ ( h ) non tende a zero


quando h tende a zero, pur dovendo sempre essere per definizione γ ( 0) = 0 . Anche
l’andamento di v(x) non è continuo, come mostra il corrispondente grafico di sinistra:
la variabilità tra due valori v(x) e v(x+h) presi in due punti molto vicini può essere
piuttosto elevata e questo tanto più quanto più è elevata la discontinuità nell’origine.
Questa variabilità locale può essere paragonata al concetto fisico di rumore di fondo.
Man mano che la distanza h aumenta, la variabilità spesso diventa più continua e ciò
si riflette nella continuità di γ ( h ) per h maggiore di zero. Questa discontinuità del
variogramma nell’origine viene chiamata effetto pepita (nugget effect nella
terminologia inglese e effet de pépite nella terminologia francese). Nel punto
successivo verrà data una spiegazione a questo comportamento.

Sempre con riferimento alla fig. 3.30 si osservi che i tre grafici v(x), campionati in
maniera regolare ad un certo intervallo (sette punti campionati lungo il tratto dell’asse x
mostrato), danno luogo a valori uguali (punti più marcati del grafico), pur mostrando i
tre andamenti una variabilità sostanzialmente diversa. Questo fatto mette in luce un
fatto molto importante: per evidenziare il comportamento all’origine del variogramma è
necessario campionare il fenomeno a piccola scala. Ciò nella pratica si realizza
intensificando localmente la campionatura in alcune zone, per es. secondo lo schema di
fig. 3.31, dove su una campionatura a maglia regolare quadrata sono inpostate due croci
di campionatura più fitta.

Fig. 3.31 - Schema di una campionatura per il riconoscimento della piccola scala.

38
La variabilità esaminata nei grafici della fig. 3.30 si riferisce ad una ricostruzione
numerica (simulazione) realizzata per una rappresentazione didattica del comportamento
all’origine del variogramma. Esaminiamo ora lo stesso problema su variabili realmente
misurate: si tratta di uno studio realizzato da J. P. Delhomme (1976) su dati
piezometrici della zona di Korhogo (Costa d’Avorio) riportato su Mining Geostatics di
A. Jornail e Ch. Huijbegts. I dati si riferiscono alla profondità della falda misurata
giornalmente su un certo numero di piezometri distanti tra di loro circa 500 m (vedi fig.
3.32).
Per ogni piezometro era disponibile il profilo delle altezze piezometriche giornaliere per
la durata della stagione delle piogge (da Agosto a Novembre).

Fig. 3.32 - Schema dell’indagine sulle piezometriche a Korhogo (da Mining Geostatics di A. Journel e
Ch. Huijbegts).

La fig. 3.33 mostra quattro di questi profili relativi ai piezometri N° 3, 4, 33, 18,
localizzati a profondità crescente della falda. La stessa figura nella parte bassa mostra i
quattro variogrammi corrispondenti. Premesso che la quantità d’acqua trattenuta dal
sottosuolo è proporzionale allo spessore di terreno attraverso cui l’acqua filtra prima di
raggiungere la falda, sui profili si possono fare le seguenti osservazioni.

Piezometro N° 3: la falda è molto prossima alla superficie ed il livello reagisce ad ogni


precipitazione. Il profilo è molto erratico ed è direttamente legato alla precipitazione
giornaliera. Il variogramma è lineare con la presenza di un effetto pepita.

Piezometro N° 4: La falda è un po’ più profonda e l’effetto dell’assorbimento del


sottosuolo comincia a farsi sentire. Il variogramma mostra un effetto pepita più piccolo
e si intravede un valore di soglia.

Piezometro N° 33: La falda è ancora più profonda e l’effetto di regionalizzazione del


terreno è totale. Rimangono ancora alcune discontinuità del profilo dovute a bruschi
riempimenti della falda. Il variogramma presenta ancora un piccolo effetto pepita, che

39
rappresenta i riempimenti discontinui e seguita con un andamento parabolico
caratteristico di un’elevata continuità della variabile.

Piezometro N. 18: La falda è ancora più profonda e gli effetti dei riempimenti
discontinui sono scomparsi. E’ quindi scomparso l’effetto pepita ed il variogramma
presenta un comportamento parabolico perfetto.

Si fa notare che nella fig. 3.33 è mostrato solo il comportamento all’origine del
variogramma e non il suo andamento globale. Ciò si deduce dal fatto che i variogrammi
sono tracciati per distanze fino a 15 giorni, quando il profilo si sviluppa per 180 giorni.

Fig. 3.33 - Profili dell’altezza piezometrica e variogrammi corrispondenti (da Mining Geostatics di A.
Journel e Ch. Huijbegts).

40
Un altro esempio di corrispondenza tra andamento del profilo e comportamento del
variogramma è mostrato nella fig. 3.34. Essa si riferisce a due profili di tensione acqua-
suolo misurati uno ad una profondità di 30 cm e due giorni dell’evento irriguo, l’altro a
profondità di 120 cm e dopo 14 giorni dell’evento irriguo. I due profili differiscono per
la presenza in quello (B) di alcune marcate discontinuità, che sono responsabili del forte
effetto pepita che compare nel variogramma (B). Il resto del variogramma ha un
andamento analogo, come analoghi sono i profili, non considerando le discontinuità.

Fig. 3.34 - Profili di tensione acqua-suolo e variogrammi corrispondenti (da “spatiall variability of soil-
water properties in irrigated soils”, di G. Uehara et al., Proceedings of the workshop on soil spatial
variability of the ISSS and the SSSA, Las Vegas 1984).

3.4.4 Andamento e modelli del variogramma elementare

Il comportamento nell’origine di un variogramma, così come è stato descritto nel punto


precedente, può essere: parabolico, lineare, discontinuo e con l’aumentare di h il
variogramma aumenta di valore ed evolve sostanzialmente secondo due forme:
• raggiunge un valore di soglia;
• aumenta indefinitamente.
Nel primo caso la FA rappresentata dal variogramma è stazionaria, o quasi- stazionaria,
mentre nel secondo caso la FA è intrinseca.

Il valore di soglia e la distanza alla quale esso è raggiunto vengono chiamati nella
letteratura geostatistica rispettivamente: paliér e portée secondo la terminologia

41
francese e sill e range secondo la terminologia inglese (v. fig. 3.35); il relativo
variogramma è perciò detto con paliér o con sill. Senza paliér o senza sill è detto invece
il variogramma di una FA intrinseca. Nel seguito di queste dispense noi faremo
riferimento alla terminologia inglese.

g (h)

Sill

Fig. 3.35 - Variogramma con valore di soglia


e significato dei parametri sill/paliér e
range/portée.

Range h

Sia che si tratti di un variogramma con sill che senza sill il suo andamento in funzione
della distanza può seguire diversi stili in dipendenza del tipo di variabilità spaziale del
fenomeno di studio. Piuttosto che descrivere direttamente il comportamento dei
variogrammi sperimentali, cosa che sarebbe oltre che difficile poco praticabile, lo
faremo attraverso l’esame delle funzioni analitiche , che, comunemente vengono assunte
per descrivere il comportamento dei variogrammi sperimentali. E’ però prima
necessario richiamare ed integrare le proprietà matematiche della funzione
variogramma:

• è una funzione che assume sempre valori positivi:

γ (h) ≥ 0

• per h=0 si ha sempre:

γ ( 0) = 0

• il variogramma è una funzione pari:

γ (h) = γ ( − h)

• quando la FA è stazionaria e quindi esiste la funzione di covarianza C(h):

γ ( h ) = C ( 0) − C ( h ) (3.16)

• è dimostrato che il variogramma cresce all’infinito meno rapidamente che h 2 , cioè:


γ (h)
lim 2 = 0 per h → 0
h

42
• la funzione variogramma deve essere tale da dar luogo a combinazioni lineari
autorizzate. Rendiamo esplicita questa condizione:

Le combinazioni lineari giocano un ruolo molto importante in Geostatistica: esse possono


rappresentare uno stimatore, una varianza o altre entità, e pertanto è necessario che esse siano
autorizzate, cioè ammettano una varianza finita. Sia Z(x) una FA stazionaria, di media m,
covarianza C(h) e variogramma γ ( h ) e sia Y una combinazione lineare finita del tipo:

n
Y= λiZ ( xi ) (3.17)
i =1

con λi reali qualsiasi. La varianza di Y non può essere negativa: Var (Y ) ≥ 0 . Esplicitamente essa
è data da:

Var{Y } = λiλjC ( xi − xj ) ≥ 0 . (3.18)


i j

Infatti, essendo:

E{Y } = E { }
i
λiZi =
i
λiE{Zi} = m λi ;
i

EY { 2}= i j
λiλjE{Z ( xi ) ⋅ Z ( xj )} ;

Var{Y } = E Y { 2 }− E{Y }⋅ E{Y },


e tenendo conto di:

C ( xi − xj ) = E{Z ( xi ) ⋅ Z ( xj )} − m ,
2

si ottiene la (3.18). La funzione C(h) deve essere tale da assicurare che l’espressione (3.18) sia
non negativa. Quindi, per definizione C(h), deve essere semi-definita positiva. Tenendo conto
della relazione (3.16) che lega covarianza e variogramma, la precedente può scriversi in funzione
del variogramma:

Var{Y } = C (0) λi λj − λiλjγ ( xi − xj ) (3.19)


i j
i j

Se Z(x) non ammette covarianza ma solo variogramma, cioè nel caso che la FA sia intrinseca, la
varianza di Y, in base alla espressione precedente esiste solo se

λi = 0 (3.20)
i

ed è data da:

Var{Y } = − λiλjγ ( xi − xj )
i j

43
Essa assume valori positivi o nulli solo se la funzione - γ ( h ) è semidefinita positiva con la
condizione (3.20). Con riferimento a quest’ultima si dice anche che - γ ( h ) deve essere una
funzione semidefinita positiva condizionale.

Tra le funzioni matematiche che hanno le proprietà sopra enunciate la letteratura


geostatistica ne propone alcune che sin qui si sono rivelate adatte a descrivere
l’andamento dei variogrammi sperimentali. Diamo di seguito le loro espressioni
analitiche, classificandoli tra quelle con sill e quelle senza sill. Queste funzioni di
variogramma sono anche chiamate modelli di variogramma o schemi di variogramma.

3.4.4.1 Variogrammi con sill

1. Modello pepitico

γ (h) = c 1 − δ (r ) r= h ≥0

δ(r) è una funzione che vale 1. quando r = 0 e 0. per ogni altro valore di r. Il
parametro c è il sill del variogramma, che è caratterizzato dall’avere un range nullo.
Questo modello esprime una discontinuità nell’origine.

2. Modello sferico

γ ( h) =
[
c 1.5 ⋅ r a − 0.5 ⋅ r 3 a 3 ] r= h ≤a
c r= h ≥a

a e c sono i parametri del modello e rappresentano rispettivamente il range ed il sill.


Il comportamento nell’origine è lineare con una pendenza pari a 1.5 c/a.

3. Modello esponenziale

γ ( h) = c 1. − exp( − r a ) r= h ≥0

Il parametro c rappresenta il sill, che è per questo modello è raggiunto


asintoticamente. Il modello è pertanto a range infinito. Comunque, per avere una
misura della distanza entro cui si manifesta la correlazione ed anche per confronto
con altri modelli è stato introdotto un range pratico a’, definito come la distanza alla
quale viene raggiunto il 95% del sill. Esso risulta essere: a’= 3a. Il comportamento
nell’origine è lineare con una pendenza pari a c/a.

44
4. Modello gaussiano

γ ( h) = c 1. − exp( − r 2 a 2 ) r= h ≥0

Il parametro c rappresenta il sill, che anche per questo modello è raggiunto


asintoticamente con range infinito. Anche per il modello gaussiano è stato introdotto
un range pratico a’ avente lo stesso significato di quello esponenziale, cioè la
distanza alla quale viene raggiunto il 95% del sill. Esso risulta essere: a '= a 3 . Il
comportamento nell’origine è parabolico, quindi con tangente orizzontale.

5. Modello a effetto buco

γ (h) = c[1 − exp(− r a) ⋅ cos(2πfr )] r = h ≥ 0

Questo modello ha l’andamento di un esponenziale, ma con una forma oscillatoria di


periodo 1/f. I parametri a e c hanno lo stesso significato del modello esponenziale.
Affinchè questa funzione abbia le caratteristiche matematiche sopra enunciate è
necessario che in R2 f e a soddisfino il seguente vincolo: 1 f ≥ 2 π a . Questa
restrizione non è richiesta in R1.

3.4.4.2 Variogrammi senza sill

Questi modelli, si ricorda, corrispondono a FA che hanno una illimitata capacità di


dispersione e quindi non ammettono funzione covarianza. I modelli più noti sono quelli
appartenenti alla classe seguente:

1. Modelli potenza

γ (h) = r θ ; r = h > 0 e 0 < θ < 2

Quello più correntemente usato nella pratica è il modello lineare:

γ ( h ) = ωr r = h > 0 ,

dove ω è la pendenza nell’origine.

Man mano che nel modello potenza θ aumenta da 1 a 2, il comportamento di γ ( h )


diventa sempre più regolare nell’origine, rappresentando una FA sempre più
regolare. In questa situazione però spesso non si riesce a distinguere se si tratta di
una FA stazionaria che ammette un variogramma potenza con valore di θ
prossimo a 2, o se si tratta di una FA con deriva. La scelta è lasciata alla sensibilità
dell’utente.

45
3.4.4.3 Altri tipi di variogramma

Vi è un modello di variogramma che gioca un importante ruolo nello studio


geostatistico dei fenomeni periodici. Questo modello si chiama appunto periodico, non
rientra nelle due categorie precedenti e viene presentato a parte.

1. Modello Periodico

γ ( h ) = ξ 1 − cos( 2 π T ⋅ r ) ; ξ ≥ 0; r = h ≥ 0;

E’ un variogramma che non si stabilizza su un valore di soglia, nemmeno


all’infinito, quindi non ammette sill e la correlazione spaziale non si estingue mai.
Nello stesso tempo non cresce indefinitamente, ma è limitato ed il limite superiore
vale ξ. Tuttavia è possibile associare al variogramma una varianza pari a ξ. Il
parametro T è il periodo del variogramma.

Per ognuno dei modelli di variogramma presentati, nei grafici seguenti viene mostrato
l’andamento della funzione analitica e l’andamento di una variabile spaziale che può
essere descritta da una FA avente come funzione strutturale quel variogramma. Nelle
figure, le funzioni variogramma sono riportate a destra e le variabili spaziali a sinistra.

46
Fig. 3.36 – Variogrammi modello

47
Fig. 3.37 – Variogrammi modello

48
3.4.5 Variogrammi a strutture annidate

E’ frequente nella pratica delle applicazioni riscontrare nell’andamento di un


variogramma sperimentale variazioni di pendenza. Per rendersi conto si possono
osservare i variogrammi di fig. 3.38. Essi rappresentano, dall’alto verso il basso, i
variogrammi del contenuto in Ca, Cl e NO3 disciolti in acqua misurati in 68 sorgenti del
bacino di Dyle (Belgio), in tre anni diversi:1975, 1981, 1983. Senza ora entrare nel
merito dell’interpretazione (lo faremo un po’ più avanti) ci limitiamo ad osservare che
tutti i variogrammi presentano un cambiamento di pendenza, per alcuni più accentuato
per altri meno, che si verifica sistematicamente attorno al chilometro. Un altro
cambiamento di pendenza ha luogo, per alcuni variogrammi più visibile per altri meno
visibile, attorno agli otto chilometri, quando viene raggiunto il valore di soglia. Inoltre
alcuni dei variogrammi mostrano un debolissimo effetto pepita. Questo comportamento,
che è riconducibile alla particolare fenomenologia, ha una spiegazione molto semplice.

Fig. 3.38 - Variogrammi sperimentali dei contenuti in Ca, Cl e NO3 misurati in tre diversi periodi (da
“study of spatial and temporal variations of hydrogeochemical variables using factorial kriging analysis”
di P. Goovaerts & Ph. Sonnet, Proc. 4th Int. Geostat. Congress, Troia, 1992).

49
Il cambiamento di pendenza è un segno che il variogramma sperimentale è costituito
dalla sovrapposizione di più variogrammi elementari, aventi diversi valori di range. In
particolare i cambiamenti di pendenza si verificano in corrispondenza dei ranges dei
variogrammi elementari. Ciò appare evidente osservando gli schemi di fig. 3.39. Là
dove i variogrammi di fig. 3.38 non presentano effetto pepita essi possono quindi essere
considerati come la somma di due variogrammi, uno con range 1 Km e l’altro con range
8 Km. Per i variogrammi che presentano effetto pepita ai due variogrammi elementari
precedenti bisogna aggiungere un altro variogramma elementare: un effetto di pepita
puro.

E’ evidente che i variogrammi elementari perchè possano essere riconosciuti dai


cambiamenti di pendenza devono essere dei variogrammi che ammettono sill, perchè
solo essi ammettono range.

I variogrammi elementari che compongono variogrammi di questo tipo vengono anche


chiamati strutture spaziali, ognuna rappresentante di una scala spaziale paragonabile al
proprio range. Poiché le scale spaziali sono progressive, queste strutture sono chiamate
annidate (nested nella terminologia inglese e gigognes in quella francese) ad indicare
che esse sono inscatolate l’una dentro l’altra. Anche i variogrammi risultanti da strutture
annidate vengono chiamati annidati. E’ chiaro che nel corso di una indagine le strutture
che possono essere evidenziate sono quelle che si esprimono alle scale del lavoro, che
vanno da distanze pari al lato della maglia di campionatura a distanze pari alle
dimensioni e forse anche più del dominio di lavoro: le strutture a distanze più elevate
non si colgono, mentre le strutture a distanze più piccole si confondono.

g 1(h)+g 2(h)
g 1(h)

g 2(h)

h h

g 1(h)+g 2(h)+g 3(h)

g 1(h)

g 2(h)

g 3(h)

h h

Fig. 3.39- Sovrapposizione di variogrammi elementari.

Ora, poichè un variogramma elementare è l’espressione di un fenomeno particolare a


cui è da attribuirsi l’esistenza e la strutturazione spaziale di una variabile, un
variogramma annidato può essere considerato come l’espressione di più fenomeni

50
sovrapposti, anzi, dimostreremo quì di seguito, che una variabile che presenta un
variogramma annidato può essere considerata come la somma di più variabili
indipendenti.

Sia Z(x) una FA stazionaria che ammette variogramma γ ( h ) . Supponiamo che essa
sia composta dalla somma di S variabili indipendenti, ognuna Z u ( x ) stazionaria di
variogramma γu ( h ) . Si ha:
S −1
Z ( x) = Zu( x) (3.21)
u=0

e anche:
S −1
Z ( x + h) = Zu ( x + h) .
u =0

Il variogramma di Z(x) è data pertanto dalla seguente espressione:

{ }
S −1 S − 1 S −1
γ (h) = E [Z ( x + h) − Z ( x)]2 = E (Zu ( x + h) − Zu( x)) = E{[Zu ( x + h) − Zu ( x)] ⋅ [Zu '( x + h) − Zu '( x)]}
u =0 u = 0 u '= 0

Separando nella precedente i termini rettangolari si ha che:

γ (h) = {
E [Zu ( x + h) − Zu ( x)] +
2
} E{[Zu ( x + h) − Zu ( x)] ⋅ [Zu '( x + h) − Zu '( x)]}
u≠ u'

Ora essendo le variabili Zu(x) spazialmente indipendenti i termini rettangoli sono nulli
e quindi si ottiene:

{ }
S −1 S −1
γ (h) = E [Zu ( x + h) − Zu ( x)] = γu (h) ,
2

u =0 u =0

cioè il variogramma di Z(x) è costituito dalla somma dei variogrammi delle variabili
Zu(x). Queste ultime variabili vengono anche chiamate componenti spaziali di Z(x),
perchè ognuna si esprime ad una determinata scala spaziale. Il sill di ogni componente
spaziale rappresenta la quota parte della dispersione della variabile che compete a
quella scala.

Alla luce di questo fatto possiamo dare un’interpretazione di ciò che è stato chiamato
effetto pepita. Supponiamo che una variabile, il cui variogramma mostra un effetto
pepita, abbia un certo numero di strutture spaziali a scale inferiori del lato della maglia,
o inferiori alla più piccola distanza tra i campioni, e che ognuna di queste strutture
spaziali sia rappresentata da un variogramma con sill. Sommando tutti questi
variogrammi e rappresentando la somma alla scala dei variogrammi sperimentali, si ha
che essa è visibile come una discontinuità nell’origine di entità pari alla somma dei sills.
Quindi quando si riscontra in un variogramma sperimentale con una discontinuità
nell’origine, questa può essere dovuta alla variabilità espressa da un numero imprecisato

51
di strutture spaziali presenti a scale più piccoli di quelle di lavoro. Queste strutture sono
confuse in un unico rumore di fondo.

Un’altra causa che concorre alla formazione di un effetto pepita sono gli errori di
misura. L’errore di misura può infatti, anche se non ha carattere spaziale, essere
considerato come una componente della variabile bruta: una delle componenti Z u '( x ) di
Z(x) secondo l’espressione (3.21). Poichè Z u '( x ) è indipendente da ogni altra variabile,
il variogramma di Z(x) comprende il variogramma degli errori di misura, che, essendo
indipendenti spazialmente, presentano come variogramma un effetto di pepita puro a
tutte le scale.

Siamo ora in grado di dare una interpretazione fenomenologica alla variabilità espressa
dai variogrammi sperimentali di fig. 3.38. Tale interpretazione è quella contenuta nel
lavoro citato. La struttura a piccola scala può essere dovuta alla presenza di sorgenti
locali di inquinamento come aziende agricole, discariche di rifiuti solidi o aree
urbanizzate, mentre la struttura a grande scala è principalmente da attribuirsi alla
variabilità delle caratteristiche geologiche dell’acquifero che ha luogo su vasta area. I
contributi delle due strutture ai variogrammi riflettono il ruolo giocato dai fattori
geologici e antropici nel comportamento spaziale di ogni ione. Infatti mentre la
provenienza di NO3 e Cl può essere attribuita ad attività umane, il contenuto di Ca nelle
sorgenti d’acqua è controllato su vasta scala dalla presenza nell’acquifero di carbonati.
Il comportamento dei variogrammi mostra inoltre che la componente a grande scala del
Ca si mantiene inalterata nel tempo, mentre quella a piccola scala si indebolisce.
Quanto al Cl e NO3 il contributo della granda scala varia sensibilmente con gli anni,
mentre quello a piccola scala si mantiene sostanzialmente invariato.

Diamo ancora altri esempi di variogrammi annidati: quello di fig. 3.40 si riferisce al
variogramma del Co, costruito sui dati trasformati (trasformazione gaussiana)
provenienti da una campionatura dei suoli del sud-est della Scozia. La campionatura,
che ha interessato anche il Cu, è stata condotta per lo studio della deficienza dei due
metalli della regione scozzese. Come si può osservare il variogramma presenta un forte
effetto pepita, una struttura locale a 3 km e mezzo ed un’altra a 16 km. Della
dispersione totale il 60% si consuma a piccola scala, un altro 25% alla scala dei 3 km e
mezzo ed il resto alla scala dei 16 km.

52
Fig. 3.40 - Variogramma del Co nei suoli del sud-est della Scozia (da “Disjunctive kriging in agricolture”
di R. Webster and M.A. Oliver in M. Armstrong (ed), Geostatistisc, vol.I, pag.427).

I variogrammi di fig. 3.41 si riferiscono ai contenuti in Cu, Pb e Zn di campioni di


suolo provenienti da una campagna di prospezione geochimica nella regione di Munster
(Francia). I variogrammi mostrano la presenza di tre strutture spaziali per tutte e tre le
variabili. Per il Pb: una pepitica, una a 1.5 km e l’altra a 10 km. Per lo Zn: una pepitica,
una a 2.0 km e l’altra a 7.5 km. Per il Cu: una pepitica, una a 2.0 km e l’altra a 9.0.

53
Fig. 3.41 - Variogrammi di Cu, Pb e Zn di una campagna geochimica nella regione di Munster (Francia)
(da “Analyse krigeante de données geoquimiques” di L. Sandjivy in Sciences de la Terre, n.24).

3.4.6 Anisotropie nei variogrammi

Le VR sono quasi sempre riferibili a fenomeni naturali od a fenomeni in cui è presente


una componente naturale. Tali fenomeni spesso si sviluppano in maniera differente in
funzione della direzione: un fenomeno quasi sempre presenta delle direzioni principali.
Lo si è già visto nel paragr. 3.4.2 dove in alcuni esempi mostrati il fenomeno si
presentava non stazionario in una direzione e stazionario in quella ortogonale. Si tratta
di una anisotropia che riguarda la presenza di deriva, che quasi sempre per sua natura si
svolge secondo una determinata direzione.

Le anisotropie però di cui ci occupiamo in questo paragrafo riguardano il


comportamento del variogramma in situazioni di stazionarietà. Esso infatti può avere lo
stesso andamento in tutte le direzioni, ed allora la funzione variogramma è isotropa. Si
osservi per esempio la fig. 3.42 in cui sono mostrati i variogrammi sperimentali della
riflettanza di una scena Landsat TM7 (Path 182,row 066 del 14.06.2000). I variogrammi si
riferiscono alle quattro direzioni geografiche principali. In questo caso il variogramma
medio, vale a dire quello calcolato lungo una (qualsiasi) direzione con una tolleranza
angolare di 90°, rappresenta la funzione variogramma in tutto il piano.

Fig. 3.42 – Variogrammi secondo le quattro direzioni principali (N-S, NE-SW, NE-SW) della riflettanza
di una porzione di scena Landsat TM7 (Path 182,row 066 del 14.06.2000).

Si osservi invece la fig. 3.43. Essa mostra i variogrammi sperimentali relativi alle
variabili Cr, Cu e Ni misurate su campioni di sedimenti di lago dell’area di Schefferville

54
(Quebec Nord). Come si può notare il sill è uguale a 3.2 per entrambe le direzioni,
mentre il range è 7 km per la direzione N58E (B) e 13 km per la direzione N32W (A).
Questa differenza di comportamento che riguarda il range lasciando il sill invariato è
noto in geostatistica come anisotropia geometrica.

Fig. 3.43 - Anisotropia geometrica del variogramma multivariabile calcolato sui dati di Schefferville (fig.
tratta da “Spatial filtering under the linear coregionalization model” di G. Bourgault e D. Marcotte,
Troia 92).

Un altro esempio di anisotropia geometrica si può osservare nella fig. 3.44, che riporta i
variogrammi orizzontale e verticale della conducibilità idraulica derivati dall’analisi
granulometrica di campioni raccolti in un sito della Germania del Nord ad una distanza
orizzontale di 2.5 m e verticale di 0.5 m. I valori dei ranges che si osservano sono 1.5 e
14 m.

Si osservi ora la fig. 3.45. Essa si riferisce ai variogrammi relativi al contenuto in


metallo Pb+Zn di una miniera italiana nelle Alpi Orientali. Lo schema di sinistra riporta
le direzioni indagate. Le direzioni 3 e 4 avendo dato dei variogrammi con andamento
simile sono stati mediate ed il variogramma medio ottenuto assieme a quello della
direzione 1 sono mostrati nella figura. Vi si nota una marcata differenza di
comportamento tra i due variogrammi mostrati. Quello relativo alla direzione 1 presenta
un sill molto più elevato

Fig. 3.44 - Variogrammi orizzontale e


verticale della conducibilità idraulica
manifestanti una anisotropia geometrica
(da “Spatial structure of hidraulic
conductivity in various porous media-
problems and experien-ces” di M.Th.
Schafmeister & A. Pekdeger, Troia, 92)

55
dell’altro variogramma, che corrisponde ad una direzione suborizzontale. Una tale
differenza nei variogrammi, che riguarda il grado di variabilità con la direzione, prende
in geostatistica il nome di anisotropia zonale. Essa è caratterizzata dall’avere una
direzione in cui la variabilità è massima e tale direzione è chiamata appunto direzione di
zonalità. Nel caso di figura la direzione di zonalità è la direzione 1, che corrisponde alla
direzione ortogonale alla giacitura di stratificazione dei calcari in cui la
mineralizzazione è insediata.

Fig. 3.45 - Esempio di anisotropia zonale in una miniera di Pb e Zn delle Alpi Orientali (fig. tratta da
“evaluation and optimization of a metal mine” di M. Guarascio e G. Raspa, Proceedings Apcom 74,
Denver).

Un altro esempio di anisotropia zonale è riportato nella fig. 3.46. Esso si riferisce ad
uno studio dei suoli in un bacino della Costa d’Avorio. La variabile studiata è
l’impoverimento di sostanze umiche nel terreno, misurata dal rapporto tra la quantità di
argille e limi presenti negli orizzonti d’accumulazione e quella presente negli orizzonti
umici. La parte superiore della figura mostra lo schema di campionatura; esso è
costituito da una serie di allineamenti subparalleli ortogonali all’asse del bacino, che è
orientato NE-SW. I grafici B e C sottostanti si riferiscono ai variogrammi lungo la
direzione NE-SW e lungo la direzione ortogonale.
Il variogramma NE-SW mostra una struttura elementare caratterizzata da un range di
300-400 m ed un sill di 0.5, mentre Il variogramma della direzione NW-SE mostra
chiaramente la sovrapposizione di due strutture una di range attorno ai 300 e sill 0.5 (la
stessa che compare nel variogramma precedente), l’altra di range 1240 e sill 0.35.Si può
pertanto affermare che il fenomeno presenta due strutture spaziali: una isotropa di range
300 m e l’altra anisotropa zonale di range 1240 m e direzione di zonalità NW-SE.

56
Quest’ultima direzione, essendo ortogonale all’asse del bacino, si conferma essere
appunto quella di maggiore variabilità.
Nel paragrafo 3.4.6 sarà mostrato come procedere alla modellizzare delle anisotropie
della funzione variogramma.

Fig. 3.46 - Schema di campionatura e variogrammi della carenza in sostanze umiche in un bacino della
Costa d’Avorio (da “Analyse de la variabilité d’un parametre pedologique” di J.M.Iris, in Sciences de la
Terre, Vol 24, 1984).

3.5 Aggiustamento di un variogramma modello

Affinché quanto espresso dai variogrammi sperimentali possa essere usato, quale
modello di variabilità spaziale, per svolgere le operazioni geostatistiche che sono
richieste nell’ambito di un progetto, è necessario che sia trasformato in una funzione
analitica γ ( h ) capace di fornire un valore del variogramma in funzione della distanza e
dell’orientazione di una qualsiasi coppia di punti dello spazio. In pratica se x1 e x2 sono
le posizioni di due punti in R2 (definite dalle coordinate x1u, x1v; x2u, x2v), la funzione
variogramma deve potersi esprimere come funzione delle componenti: hu = x2u-x1u e
hv = x2v-x1v.

Inoltre la funzione - γ ( h ) deve essere semidefinita positiva, cioè tale che, per qualunque
n finito e maggiore di zero e per qualunque set di numeri reali { λi} (i = 1, n) associati
ad altrettanti punti dello spazio { xi} , comunque posizionati, si abbia:

57
- λiλjγ ( x i − x j ) ≥ 0 ,
i j

con la condizione λi = 0 se il modello è solo intrinseco.


i

Sulla base di quanto è stato detto nel paragrafo 3.4.5 a proposito delle strutture annidate,
la funzione γ ( h ) in generale può considerarsi come costituita dalla somma di s
variogrammi elementari, ognuno espresso da una delle funzioni presentate nel paragrafo
3.4.4. Utilizzeremo d’ora in poi la notazione seguente:
s −1
γ (h) = γu ( h )
u=0

dove u è l’indice della struttura elementare e γu il suo variogramma. Nella precedente si


è inteso indicare con l’indice 0 la struttura pepitica, quasi sempre presente. Se non vi è
effetto pepita la struttura può essere formalmente mantenuta attribuendo ad essa un sill
nullo.

In queste condizioni aggiustare un modello vuol dire:


♦ definire il numero s di strutture;
♦ per ogni struttura specificare:
se essa è isotropa o anisotropa
se è anisotropa quale è il tipo di anisotropia (geometrica, zonale)
i parametri dell’anisotropia
il tipo di funzione modello (sferica, exp, gauss, etc)
i valori dei parametri della funzione (sill, range)

L’aggiustamento viene effettuato operando un fitting tra la funzione analitica γ ( h ) così


composta ed il variogramma sperimentale.

Le funzioni variogramma elementare ed il significato dei loro parametri sono stati già
descritti nel paragrafo 3.4.4. Introduciamo ora i parametri che caratterizzano le
anisotropie e diamo l’algoritmo per il calcolo di γ ( h ) in funzione di detti parametri.

Anisotropia geometrica

Questo tipo di anisotropia ricorre per di più nei fenomeni bidimensionali. In esso il
range del variogramma varia con la direzione, presentandone una dove il range è
massimo e l’altra, perpendicolare alla prima, dove il range è minimo. In funzione
della direzione il range varia come il raggio vettore di una ellisse, i cui assi maggiore
e minore, sono appunto i ranges massimo e minimo. I parametri dell’anisotropia,
sono facilmente identificabili:
• angolo ϕg che la direzione di massimo range forma con l’asse u del riferimento di
lavoro;
• rapporto λ tra range maggiore e range minore;

Dato un vettore h, di componenti hu e hv, la maniera più usuale di calcolare il valore


di γ(h) in funzione dei parametri precedenti è di operare come segue:

58
a) effettuare una rotazione di ampiezza ϕg degli assi coordinati fino a far coincidere
l’asse u con l’asse maggiore dell’ellisse. La matrice di trasformazione è in questo
caso:

cos( ϕ ) sin( ϕ )
R ϕg =
− sin( ϕ
g
) cos( ϕ
g
)
g g

Pertanto:

hu''' hu
= [ Rϕg ] × ;
h'
v
''
hv

b) trasformare l’ellisse in un cerchio avente raggio uguale all’asse maggiore


dell’ellisse. Ciò si ottiene moltiplicando h ''' per il rapporto di anisotropia. La
matrice di trasformazione corrispondente sarà:

1 0
[λ] = .
0 λ

Pertanto:

hu'' hu'''
= [λ] × ;
hv'' hv'''

c) riportare gli assi coordinati nella posizione originaria effettuando una rotazione di
ampiezza -ϕg , opposta alla precedente. La matrice di trasformazione sarà:

cos(ϕg ) − sin ( ϕg )
R − ϕg =
sin ( ϕg ) cos( ϕg )

e pertanto:

hu' hu''
= [ R − ϕg ] × .
hv' hv''

La trasformazione complessiva sarà:

hu' hu hu
= [ R − ϕg ] × [ λ ] × [ Rϕg ] × = [ A] ×
hv' hv hv

59
con

a c
A=
c b

a = cos2 ϕg + λsin2ϕg
b = sin2ϕg + λ cos2 ϕg
c = (1 − λ ) sin ( ϕg ) ⋅ cos ϕg

Ottenuti hu' e hv' , il valore di γ(h) = γ(hu,hv) si calcola utilizzando una funzione
isotropa con range pari a quello massimo e con valore di h trasformato:

2 2
γ (hu , hv ) = γ ' hu' + hv' .

Anisotropia zonale

Qualsiasi anisotropia non riconducibile ad una trasformazione lineare delle


coordinate può essere ricondotta a questo modello di anisotropia. Esso prevede che la
variabilità si manifesti secondo una particolare direzione, che è detta direzione di
zonalità. Questa direzione, individuata dal versore z, è, a due dimensioni,
caratterizzata dall’angolo ϕz che essa forma con l’asse u.

Nella anisotropia zonale la funzione variogramma si esprime analiticamente nel


modo seguente:

γ ( h ) = γ ( hz ) ,

dove hz è la componente del vettore h nella direzione di zonalità: hz = h⋅z =


|h|⋅⋅cos(ϕz).

Si è ora in possesso di tutti gli elementi per calcolare il valore analitico di γ(h) per
qualsiasi tipo di variogramma. L’aggiustamento del modello complessivo può essere
fatto in due modi:

Interattivamente
Attraverso un opportuno programma di calcolo, vengono forniti dall’utente i
parametri del modello, cioè tutte le grandezze sopra specificate. Il programma
calcola i valori di γ(h) nelle direzioni indicate e l’utente, sempre attraverso lo stesso
programma, li confronta con i valori sperimentali. Procedendo per tentativi l’utente
modifica interattivamente i parametri del modello fino a quando non è soddisfatto del
fitting, valutato visivamente (al video).

60
Automaticamente
L’aggiustamento può essere automatizzato nella definizione dei sills. L’utente
fornisce interattivamente il numero di strutture e, per ogni struttura: la funzione
modello ed il relativo range; il tipo di anisotropia (se presente) ed i suoi parametri. I
sills delle strutture possono essere calcolate minimizzando con il criterio dei minimi
quadrati gli scarti tra i valori calcolati e quelli analitici del modello. La quantità da
minimizzare può essere definita come segue:

siano

• nd il numero di direzioni (id=1,nd) su cui sono stati calcolati i variogrammi


sperimentali o che si vogliono far intervenire nell’aggiustamento;
• pas(id) il passo di calcolo del variogramma per la direzione id;
• np(id) il numero di passi per la direzione id su cui è stato calcolato il variogramma
o che si vogliono considerare ai fini dell’aggiustamento.
• γ id* ( k ⋅ pas(id )) il variogramma sperimentale a passo k della direzione id;
• γ id ( k ⋅ pas(id )) il variogramma analitico (calcolato con il modello) a passo k della
direzione id. Esso è funzione dei sills.

La quantità da minimizzare è:

nd np ( id ) 2

id =1 k =1
[ ]
W ( k , id ) γ id* ( k ⋅ pas(id ) ) − γ id ( k ⋅ pas(id ))

dove W(k,id) è un opportuno coefficiente per tener conto del numero delle coppie del
variogramma sperimentale e dei primi passi rispetto agli ultimi. Data la complessità
della espressione precedente, la procedura di minimizzazione conviene che sia
iterativa, piuttosto che regressiva.

Un esempio di aggiustamento lo si può avere considerando i variogrammi delle figure


3.46b e 3.46c. In questo esempio i variogrammi sperimentali interessano due sole
direzioni: NE-SW e NW-SE. Sulla base di quanto espresso come commento ai
variogrammi sperimentali, si può aggiustare un modello a due strutture:
• la prima isotropa, di modello sferico di range 300 m e sill 0.5;
• la seconda anisotropa zonale con direzione di zonalità NW-SE modellizzata con un
variogramma sferico di range 1250 m e sill 0.5.

3.6 Regolarizzazione di una FA

Nel paragrafo 3.1 è stato introdotto il concetto di supporto. Esso, ripetiamo, è l’entità
geometrica, caratterizzata da forma e dimensioni, su cui è definita una variabile. Con
riferimento a questo problema quanto è stato esposto nei paragrafi precedenti è del tutto
generale e vale per qualsiasi supporto anche se, per semplicità di esposizione, si è fatto

61
sempre riferimento a variabili puntuali, cioè a supporto puntuale. E’ stato anche detto
nel paragrafo citato e fatto osservare nella fig. 3.1 che se si passa da una VR puntuale
ad un’altra di supporto più grande si ottiene una VR più regolare, ma in qualche forma
legata alla prima. Questo passaggio da un supporto puntuale ad un altro di dimesioni più
grandi è noto nella terminologia geostatistica con il nome di regolarizzazione e la
variabile corrispondente è chiamata variabile regolarizzata.

Questo paragrafo sarà dedicato alla ricerca del formalismo di passaggio riguardante i
primi due momenti delle FA coinvolte. Il passaggio invece che interessa la legge
monovariabile e la legge bivariabile viene trattato nella Geostatistica non lineare. Per
tutte queste operazioni concernenti la regolarizzazione opereremo nel quadro dei
modelli stazionari e quasi-stazionari.

Sia Z(x) una FA puntuale stazionaria di media m, covarianza C(h), variogramma γ(h) e
dominio di definizione S. In ogni punto x di S si può definire una nuova FA Zv(x),
derivata dalla quella puntuale:

1
Zv ( x ) = Z (ξ )dξ
v vx

dove vx è un elemento di volume centrato in x e v il suo volume.

Chiamando con mv, Cv(h) e γv(h) rispettivamente la media, la covarianza ed il


variogramma di Zv(x), vediamo di seguito come esse possono essere espresse in
funzione delle equivalenti grandezze di Z(x).

Media

1
mv = E {Zv ( x )} = E { Z (ξ )}dξ
v vx
Poichè Z(x) è stazionaria, E {Z ( x )} = m , e quindi si ha:

mv = m

Covarianza

Cv (h) = E [ Zv ( x + h) ⋅ Zv ( x )] − m2 (3.22)

Nel termine di destra Zv(x) e Zv(x+h) sono due variabili aleatorie definite su
supporti di volume v centrati nei punti x e x+h (vedi fig. 3.47).

62
Fig. 3.47 - Supporti delle variabili
Zv(x) e Zv(x+h).

Indicando con:

1
Zv ( x ) = Z (ξ )dξ
v vx
e (3.23)
1
Zv ( x + h ) = Z (ξ ')dξ '
v vx + h

e sviluppando la (3.22) si ottiene:

1 1
Cv (h) = E [ Z (ξ ) ⋅ Z (ξ ')]dξdξ '
−m2 = C (ξ − ξ ')dξdξ '
. (3.24)
v2 vx vx + h v2 vx vx + h

L’ultimo termine a destra indica il valor medio che la funzione covarianza puntuale
C(h) assume quando gli estremi del segmento ξ − ξ ' variano, in maniera
indipendente, l’uno in vx e l’altro in vx + h (fig. 3.47). Essendo la funzione C(h)
dipendente solo dalla distanza della coppia di punti ξ − ξ 'e non dalla particolare
posizione, si ha, per la (3.24), che anche Cv(h) non dipende dal punto di appoggio, e
quindi Zv(x) è anch’essa stazionaria.

Per h=0, Cv(0) rappresenta la varianza della variabile regolarizzata Zv(x). Essa, in
base alla (3.24), risulta essere:

1 1
Cv (0) = C (ξ − ξ ')dξdξ '
.= C (ξ − ξ ')dξdξ ' (3.25)
v2 vx vx v2 v v

Sostituendo nella precedente C( ξ − ξ '


) con la sua espressione in funzione del
variogramma si ottiene:

1
Cv (0) = C (0) − γ (ξ − ξ ')dξdξ ' (3.26)
v2 v v

Essa mostra che la varianza della variabile regolarizzata è più bassa di quella della
variabile puntuale e la differenza è data dal termine:

63
1
γ (ξ − ξ ')dξdξ ', (3.27)
v2 v v

che dipende dalla funzione variogramma e dal volume v, nella sua forma e
dimensioni. Esso, entro dimensioni più piccole del range del variogramma, aumenta
con le dimensioni di v e conseguentemente la varianza di Zv(x) diminuisce, così
come deve essere.

E’ molto ricorrente nella letteratura geostatistica usare per i termini integrali che
compaiono nelle espressioni (3.24), (3.25), (3.26) una espressione più sintetica,
tramite la quale la (3.24) si scriverebbe per esempio:

Cv ( h ) = C ( v x , v x + h ) (3.28)

dove la barra sulla C indica che si tratta di un valor medio della funzione C(h) e gli
argomenti indicano i supporti su cui gli estremi del segmento sono di volta in volta
fatti variare in maniera indipendente.

Data la stazionarietà di Zv(x) la (3.28) si scrive in forma più generale:

Cv ( h ) = C ( v , v h )

Variogramma

γ v (h) =
1
2
{
E [ Zv ( x + h ) − Zv ( x ) ]
2
} (3.29)

Sostituendo nella precedente le Zv con le espressioni (3.23) si ottiene:

1 1 1 2
γv (h) = E Z (ξ ) dξ − Z (ξ ')dξ ' ;
2 v vx v vx + h

1 1 1
γv (h) = E [ Z(ξ) ⋅ Z(ξ '
) ]dξdξ '
+ E [ Z(ξ) ⋅ Z(ξ '
) ]dξdξ ' +
2 v2 vx vx v2 vx + h vx + h

1 2
− E [ Z(ξ) ⋅ Z(ξ '
)]dξdξ ' ;
2 v2 vx vx + h

64
1 1 1
γv (h) = C(ξ − ξ '
)dξdξ '+ C(ξ − ξ '
)dξdξ ' +
2 v2 vx vx v2 vx + h vx + h

1 2
− C(ξ − ξ '
)dξdξ ' ; (3.30)
2 v2 vx vx + h

Data la stazionarietà di Z(x) i primi due termini della espressione precedente sono
uguali e quindi, adottando la notazione sintetica, l’espressione (3.30) si può scrivere:

γv ( h ) = C ( v x , v x ) − C ( v x , v x + h ) (3.31)

Sostituendo nella (3.30) C( ξ − ξ ' ) con C(0) - γ( ξ − ξ '


) ed usando anche per il
variogramma la notazione sintetica, la (3.31) diventa:

γv ( h ) = γ ( v x , v x + h ) − γ ( v x , v x )

e, data la stazionarietà di Zv(x):

γv ( h ) = γ ( v , v h ) − γ ( v , v ) (3.32)

Poichè la FA Z(x) è dotata di sill, per h= ∞ la precedente diventa:

γv ( ∞) = γ ( ∞) − γ ( v , v ) (3.33)

La precedente è analoga alla (3.26) e mostra come il sill del variogramma


regolarizzato è più basso di quello del puntuale della quantità γ ( v , v ) . E’ la stessa
quantità (cfr. la 3.25) di cui si abbassava la varianza per effetto della
regolarizzazione. Non può essere altrimenti dato che, in condizioni di stazionarietà,
la varianza di una FA, regolarizzata o no, rappresenta sempre il sill del variogramma.

Nella operazione di regolarizzazione anche il range del variogramma subisce delle


variazioni e queste dipendono esclusivamente dalla forma e dalle dimensioni del
supporto di regolarizzazione. In particolare passando da una FA puntuale ad una
regolarizzata di supporto v convesso, il range del variogramma in una certa direzione
aumenta esattamente del diametro di v nella direzione considerata. La spiegazione è
immediata se si pensa alla definizione di range (esso è dato dalla distanza più piccola
alla quale due variabili spaziali sono indipendenti) e al fatto che due variabili
regolarizzate (cioè due variabili definite su due volumi posti ad una certa distanza)
sono indipendenti quando tutte le coppie di variabili associate a tutte le coppie di
punti, appartenenti un punto ad un volume, l’altro punto all’altro volume, sono
indipendenti. Questo concetto è espresso nella fig. 3.48.

65
Fig. 3.48 - Ranges e regolarizzazione.

3.6.1 Calcolo delle funzioni γ

Il calcolo delle espressioni intergrali che compaiono nel punto precedente viene nella
pratica effettuato non analiticamente (perchè sarebbe molto complicato trattandosi, in
R2, di integrali quadrupli di funzioni del tipo esaminate 3.4.4) ma numericamente. Ciò
si realizza discretizzando i volumi in insiemi di punti e trasformando gli integrali in
sommatorie.

Supponiamo per es. di dover calcolare l’espressione:

1
γ (v1, v 2) = γ (ξ − ξ ')dξdξ
v1v 2 v1 v 2

dove v1 v2 sono due volumi di forma quasiasi, diversi tra loro e comunque posizionati
nello spazio. E’ questo un caso generale che comprende tutte le configurazioni sopra
esaminate, dove i due volumi sono sempre uguali, posizionati alcune volte in maniera
coincidente, altre volte ad una certa distanza tra di loro. Si discretizzano dapprima, con
la stessa modalità, i due volumi in due insiemi di punti di numero rispettivamente n1 e
n2 e se ne calcolano le coordinate. Si considerano poi tutte le coppie di punti, il primo
nel volume v1, il secondo nel volume v2 e per ogni coppia si calcola la distanza ed il
valore corrispondente del variogramma. In fine si mediano su tutte le coppie i valori del
variogramma. Questo tipo di operazione è illustrata nella figura 3.49.

La precisione nel calcolo dipende dalla densità di discretizzazione rispetto alla forma
dei volumi. Per figure regolari quali blocchi rettangolari una discretizzazione in 16 punti
dà, per i problemi più comuni, risultati accettabili.

66
n1 n2
1
γ (v1, v 2) = γ ( xi − xj )
n1n 2 i =1 j =1

Fig. 3.49 - Calcolo numerico dell’espressione γ.

3.6.2 Regolarizzazione di un effetto pepita


.
Supponiamo che il variogramma da regolarizzare si componga di S strutture elementari:
ns −1
γ (h) = γu ( h )
u=0

e tra queste una microstruttura (componente pepitica) γ 0( h ) . Il valore di γv ( h ) si ottiene


normalmente dalla (3.32) sommando il contributo di tutte le strutture, calcolato come
indicato nel paragrafo 3.6.1. E’ però possibile ricavare il contributo della componente
pepitica γov ( h ) direttamente dalla 3.32 in maniera molto immediata. Riportiamo di
seguito il metodo a solo scopo didattico, essendo dal punto di vista pratico più
conveniente eseguire il calcolo secondo la procedura già citata, se non altro per
conformità con le altre strutture.

Consideriamo nella 3.32 una distanza h più grande delle dimensioni di v, cioè tale che i
volumi v e vh siano disgiunti. Applichiamo la 3.32 alla sola componente pepitica:

γ 0 v ( h ) = γ 0 ( v , v h ) − γ 0( v , v ) . (3.34)

Per comodità operiamo con la covariaza, anzicchè con il variogramma:

γ 0 (h ) = C 0 (0) − C 0 (h ). (3.35)

C 0 (h ) è chiaramente una funzione di covarianza con un range a0 molto piccolo


rispetto alla scala del lavoro, quindi anche rispetto alla taglia di v (v.fig. 3.50).

67
C(h)

C(0)

a0 << v
Fig. 3.50 - Funzione Covarianza della
microstruttura.

a h

I due termini di destra della 3.34 nella loro forma esplicita e con la sostituzione data
dalla 3.35 precedente, diventano:

1 1
γ 0 ( v , vh ) = C 0(0) dξdξ '− C 0(ξ − ξ ')dξdξ ' (3.36)
v2 v v+h v2 v v+h

1 1
γ 0( v , v ) = C 0(0) dξdξ '− C 0(ξ − ξ ')dξdξ ' (3.37)
v2 v v v2 v v

Nella 3.36 il primo termine di sinistra è una costante ( C0(0) ), mentre il secondo
termine è nullo poichè, essendo i due volumi v e vh disgiunti ed essendo a0 molto
piccolo rispetto alla scala del lavoro, si ha che sempre ξ − ξ '
>> a0 e quindi C( ξ − ξ '
)=
0.

Nella 3.37 il primo termine di sinistra è ancora la costante precedente, mentre il


secondo termine, essendo i due volumi coincidenti, è un integrale non più nullo e può
essere calcolato sulla base del ragionamento seguente.

Poichè le dimensioni di v sono molto grandi rispetto ad a0 ( v>> a0 ) nell’integrale in


questione quando ξ ‘ varia in v per una fissata posizione di ξ (fig. 3.51) si hanno
contributi positivi soltanto in un intorno D( ξ ) molto piccolo di centro ξ e raggio a0.

per ξ '∈ D( ξ ) C 0 ( ξ − ξ ') ≠ 0

per ξ '∉ D( ξ ) C 0 ( ξ − ξ ') = 0

Fig. 3.51 - Integrazione di un effetto pepita.

68
La somma di questi contributi, trascurando gli effetti di bordo, è data da:

A= C 0(ξ − ξ ')dξdξ '= C 0(h )dh


v v

L’ultimo integrale è esteso a tutto lo spazio e il valore di A è invariante rispetto a ξ .


Quindi:

1 A
γ 0 v ( h) = Adξ = .
v2 v v

A/v è dunque il contributo della struttura pepitica nella regolarizzazione.

Sulla base di quanto è stato detto possiamo dare il contributo dell’effetto pepita nel
calcolo della seguente espressione generale :

1
γ (v1, v 2) = γ (ξ − ξ ')dξdξ
v1v 2 v1 v 2

che comprende, come caso parrticolare, i due termini di sinistra della 3.32.
L’espressione precedente ricorre in molte operazioni geostatistiche. In essa i volumi v1
e v2 sono di dimensioni qualsiasi e localizzati in posizione qualsiasi. Il contributo della
struttura pepitica è:

Mis ( v 1 ∩ v 2 )
γ 0( v 1, v 2 ) = C 0( 0) − A . (3.38)
v 1v 2

SE v1 e v2 sono disgiunti la precedente vale: γ 0 ( v 1, v 2 ) = C 0 ( 0) .

1
Se v1 = v2 = v si ha: γ 0( v , v ) = C 0( 0) − A .
v

1
Se v1 ⊂ v2 si ha: γ 0 ( v 1, v 2 ) = C 0 ( 0) − A .
v2

3.7 Varianza di dispersione

In molte applicazioni, relative soprattutto a problemi di polluzione e di variabilità dei


suoli, si è interessati al calcolo della dispersione spaziale di una variabile. Il suo valore
generalmente dipende sia dalle dimensioni del supporto su cui essa è definita, sia dalle
dimensioni del dominio entro cui si vuole studiare tale variabilità. In questo paragrafo
vengono dati gli strumenti analitici per il calcolo della dispersione quando si conosce la
funzione variogramma. Un classico problema è quando si conosce la dispersione di una
variabile misurata su un supporto puntuale e si vuole calcolare il corrispondente valore
per un supporto più grande.

69
Sia Z(x) una FA stazionaria di covarianza C(h) e variogramma γ ( h ) . Consideriamo un
dominio di volume V all’interno del campo in cui la FA è definita (fig. 3.52). Per ogni
punto x di V indichiamo con z(x) una realizzazione 1di Z(x) e con zv il valor medio di
z(x) all’interno di V:

1
zV = z( x )dx.
V V

Fig. 3.52 - Definizione di un


1 dominio V nel campo di
Z (x) ZV = Z ( x)dx definizione di Z(x).
V V

La dispersione dei valori z(x) all’interno di V è data dalla varianza statistica:

1
s2 =
V V
( z( x) − z )2 dx.
V

Il valore di s2 dipende dalla posizione di V nel campo di definizione di Z(x) e dai


particolari valori di z(x).

Se ora consideriamo in ogni punto x di V la variabile aleatoria Z(x) possiamo definire


la variabile aleatoria:

1
ZV = Z ( x )dx. (3.39)
V V

Anche la dispersione S2 di Z(x) rispetto a ZV è una variabile aleatoria. Il suo valore


atteso è chiamato varianza di dispersione di Z(x) rispetto in ZV ed è indicata con la
notazione σ2 ( O / V ) , dove il simbolo O indiva che la dispersione si riferisce ad un
elemento puntuale:
1
σ2 ( O / V ) = E S 2 = E
V V
( Z ( x ) − ZV ) dx .
2
(3.40)

1
Si ricorda che per realizzazione nel punto x della VA Z(x) si intende il particolare valore misurato o
misurabile della variabile nel punto x.

70
In un modello stazionario σ2 ( O / V ) non dipende dalla posizione di V ma soltanto dalla
forma e dimensioni di V ed è una caratteristica della FA Z(x).

Sostituendo nella 3.40 l’espressione di Zv e sviluppando si ottiene:

1 1 2
σ 2 (O / V ) = E [ Z 2 (ξ )] + E [ Z (ξ ') ⋅ Z (ξ '')]dξ 'dξ ''− E [ Z (ξ ) ⋅ Z (ξ ')]dξ 'dξ
V V V2 V V V V

1 1 2
= C (0) + C (ξ '
−ξ '')dξ 'dξ ''− C (ξ − ξ ')dξ 'dξ
V V V2 V V V V

= C ( 0) + C (V ,V ) − 2C (V ,V ) = C ( 0) − C (V ,V )

= γ (V ,V ) (3.41)

L’espressione precedente, molto semplice da calcolare, da la varianza di dispersione di


una variabile puntuale all’interno di un volume V. Essa dipende dalla funzione
variogramma e dalla forma e dimensioni di V.
Si noti (confronta l’espressione 3.24) che essa corrisponde alla quantità di cui si abbassa
il sill passando da un variogramma puntuale ad uno regolarizzato di supporto V.

Per V → ∞ si ha che:

D2 ( O / ∞ ) = lim D2 ( O / V ) = lim γ (V ,V ) = C ( 0) .
V →∞ V →∞

Quando C(0) esiste, cioè quando le ipotesi di stazionarietà sono verificate, il sill del
variogramma, chiamato anche varianza a priori, coincide con la varianza di dispersione
di un punto in un campo illimitato.

Passiamo ora ad esaminare la dispersione all’interno di un volume V di una variabile


non più puntuale ma definita su certo supporto. Suddividiamo il volume V in elementi di
volume v. Se v<<V , quest’ultimo può essere schematizzato come l’unione degli
elementi v il cui baricentro cade all’interno di V. In tale caso, chiamando con ZV la
variabile aleatoria riferita al volume V e Zvi la variabile aleatoria riferita all’elemento
vi si ha che (fig. 3.53):

1 n
1 n
1 1
ZV = Zvi = Z ( x)dx = Z ( x)dx.
n i =1 n i =1 v vi V V

Con procedura analoga a quella fatta in precedenza si può calcolare la varianza di


dispersione di Zv all’interno di V:

1 n
σ 2 (v / V ) = E ( Zvi − ZV ) 2 .
n i =1

71
Fig. 3.53 - Discretiz-zazione di
V in una unione di elementi vi

Nella precedente sostituendo Zvi e Zv rispettivamente con:

1
Zvi = Z ( x )dx.
v vi

1
ZV = Z ( x )dx.
V V

e sviluppando si ottiene:

Nella precedente sostituendo Zvi e Zv rispettivamente con:

1 n
1 1
σ2 (v / V) = E [ Z(ξ ' )] dξ 'dξ '
) ⋅ Z(ξ '
' '+ E [ Z(ξ ' )] dξ 'dξ '
) ⋅ Z(ξ '
' '+
n i =1 v2 v v V2 V V

1 n
2
− E [ Z(ξ ' ) ] dξ 'dξ '
) ⋅ Z(ξ '
' '=
n i =1 vV V V

1 n
=
n i =1
{C (vi , vi ) + C (V ,V ) − 2C (vi,V )}

Essendo nella ultima espressione i primi due termini tra parentesi indipendenti dalla
particolare posizione di vi, ed essendo:

n
1
C ( vi ,V ) = C (V ,V )
n i =1

si ottiene:

σ2 ( v / V ) = C ( v , v ) − C (V ,V )

ed in funzione del variogramma:


σ2 ( v / V ) = γ (V ,V ) − γ ( v , v ) (3.42)

72
Se v si riduce ad un punto, il termine γ ( v , v ) della espressione precedente si riduce a
zero e quindi ritroviamo, come caso particolare, la 3.41.

Se la funzione variogramma contiene una componente pepitica caratterizzata da :

A = C (h)dh

il suo contributo alla varianza di dispersione è dato, ricordando la 3.39 da:

A A 1 1
C 0(0) − − C 0(0) − = A −
V v v V

La linearità dell’espressione 3.42 conduce alla proprietà dell’additività della varianza di


dispersione. Infatti siano v, V, G tre volumi tali che v ⊂ V ⊂ G , si ha:

σ2 ( v / V ) = γ (V ,V ) − γ ( v , v ) (3.43)

σ2 ( v / G ) = γ ( G , G ) − γ ( v , v ) (3.44)

σ2 (V / G ) = γ ( G , G ) − γ (V ,V ) (3.45)

Sostituendo nella 3.44 γ ( G , G ) con la sua espressione ricavata dalla 3.45, si ottiene:

σ2 ( v / G ) = σ 2 (V / G ) + γ (V ,V ) − γ ( v , v ) ,

cioè:

σ2 ( v / G ) = σ2 (V / G ) + σ2 ( v / V ) .

Quindi la varianza di dispersione di una unità v nel dominio G è uguale alla somma
della varianza di dispersione dell’unità v nell’unità inermedia V e della varianza di
dispersione dell’unità V nel dominio G.

Illustrazione di un esempio

L’esempio che sarà illustrato è una elaborazione condotta su dati contenuti nella
memoria: “Spatial Variability of soil Properties” di Goro Uehara et al. in Soil Spatial
Variability, Proceedings of a Workshop of the ISSS and the SSSA, Las Vegas 1994.

La mappa di fig. 3.54 rappresenta lo schema di campionatura di un sito dell’area di


Kenana (Sudan). In essa sono stati prelevati 254 campioni si suolo su cui sono stati
misurate diverse variabili tra cui l’ESP (Exchangeable Sodium Percentage), il cui

73
variogramma medio è riportato nella fig. 3.55a. L’aggiustamento più immediato è
quello fatto con uno schema sferico di range di 3 Km ed un sill di 22. Si disponeva
inoltre anche di 18 campioni di verifica ubicati in prossimità di punti campionati.

Fig. 3.54- Localiz-zazione della campionatura. a Kenana (da “Spatial Variability of soil Properties” di
Goro Uehara et al. in Soil Spatial Variability, Proceedings of a Workshop of the ISSS and the SSSA, Las
Vegas 1994).

Ciò ha consentito una stima del variogramma anche a piccola scala. Il risultato è stato
un variogramma con un sensibile effetto pepita (v. fig. 3.55b), per nulla ipotizzabile sul
precedente grafico.

Ciò dimostra quanto sia importante, quando si studia un fenomeno spaziale, campionare
anche la piccola scala. Come si evince dalla figura, il nuovo variogramma è stato
riaggiustato con uno schema sferico di range 4 e sill 16 ed un effetto pepita di 6.

Fig. 3.55 - Variogrammi sperimentali del ESP (da “Spatial Variability of soil Properties” di Goro Uehara
et al. in Soil Spatial Variability, Proceedings of a Workshop of the ISSS and the SSSA, Las Vegas 1994).

74
Fig.3.56 - Andamento delle varianze di dispersione in funzione del supporto.

Utilizzando ognuno dei due variogrammi è stata calcolata la varianza di dispersione


dell’ESP regolarizzato in funzione delle dimensioni del supporto, considerato come un
quadrato di lato L. Nella fig. 3.56 sono riportati gli andamenti ottenuti con i due
variogrammi. Come si nota la varianza diminuisce con l’aumentare di L. In particolare
si può notare come il variogramma con effetto pepita (b) produce un forte calo della
varianza di disper sione anche per piccoli supporti. Ciò è intuitivo: più è forte la
variabilità a piccola scala, maggiore è l’effetto regolarizzante del supporto.

3.8 Il kriging ordinario

Una delle operazioni più comuni che vengono effettuate nell’ambito del trattamento dei
dati spaziali, è la costruzione di carte tematiche, cioè carte georeferenziate relative a
porzioni di aree geografiche, in cui è riportato, mediante un adeguato metodo di
rappresentazione, l’andamento di una variabile di studio.

La carta è normalmente costruita a partire dai valori della variabile misurati all’interno
dell’area. Per esempio da una situazione di partenza espressa dalla fig. 3.57a, che
rappresenta la posizione dei campioni ed i valori misurati di una variabile, si vuole
costruire una carta ad isovalori come quella riportata nella fig. 3.57b. Si noti
nell’esempio una distribuzione non uniforme della campionatura.

75
4955000

4950000

4945000

4940000

4935000

4930000

4925000
1640000 1650000 1660000 1670000

a) b)

Fig. 3.57. Costruzione di una carta a partire dai punti di misura.

La carta ad isovalori, che nel gergo cartografico è anche chiamata carta vettoriale, è una
delle tante forme di rappresentazione di una variabile geografica. Essa si ottiene non
direttamente, ma successivamente ad una ricostruzione a maglia regolare della variabile
tramite una operazione di stima (fig. 3.58a). Le linee di contorno si ottengono
interpolando sui lati della maglia i valori da rappresentare (v. fig. 3.58b). Se ne deduce
che la qualità di una carta è riconducibile alla qualità della stima che ha prodotto il
grigliato di valori.

3.8.1 Gli stimatori lineari

Poichè i campioni sono raramente disposti a maglia regolare e, quand’anche lo fossero


la densità della campionatura non sarebbe comunque sufficiente per operare un
dettagliato tracciamento delle linee isovalori, la costruzione di un fitto grigliato di punti
passa attraverso una operazione di stima, cioè una operazione mediante la quale viene
attribuito in qualche maniera un valore ad una variabile in un punto in cui essa non è
nota. La maniera con cui il valore viene calcolato definisce il tipo di stimatore.

76
Fig. 3.58 - Costruzione di una carta vettoriale: a) ricostruzione della variabile a maglia regolare; b)
tracciamento per interpolazione delle linee di isovalori.

Questo tipo di operazione ha carattere locale in quanto la stima che si vuole effettuare
non riguarda le caratteristiche generali (o caratteristiche globali) della variabile nel
campo, ma riguarda appunto delle caratteristiche locali. Per tale ragione questo tipo di
stima è chiamato nel gergo geostatistico stima locale. Gli stimatori più adatti e più usati
per questo tipo di operazione sono quelli lineari. In essi il valore da attribuire ad un
punto x0 del campo è calcolato mediante una combinazione lineare dei valori noti
situati nelle vicinanze del punto da stimare, per es. entro un dominio circolare (vedi fig.
3.59). Tale dominio, che in realtà può avere qualsiasi forma e contenere alcune decine
di punti (da 20 a 60) sarà chiamato d’ora in poi vicinaggio di stima.

77
Sia n il numero di punti noti che concorrono alla stima del valore in x0 e siano xα e
z(xα) (α =1, n)1 rispettivamente le loro posizioni ed i corrispondenti valori della

Fig. 3.59 - Carattere locale


4955000 dell’operazione di stima.

4950000

4945000 variabile. Siano ancora z(x0) il


valore sconosciuto in x0 e z* ( x 0 )
4940000
lo stimatore lineare considerato.
Esso ha la seguente forma:
4935000

n
4930000 z* ( x 0 ) = λαz ( x a ) (3.46)
α =1

4925000
1640000 1650000 Nella precedente λα sono i
1660000 1670000

coefficienti della combinazione


lineare, chiamati anche ponderatori dato che la combinazione lineare non è nient’altro
che una media ponderata.

Proviamo ora ad usare gli strumenti geostatistici che abbiamo in possesso per
caratterizzare questo stimatore e per definirne le condizioni ottimali in relazione anche
agli stimatori lineari tradizionali.

Poniamoci per semplicità nel quadro del modello stazionario, rimanendo inteso che le
conclusioni alle quali arriveremo sono valide anche per i modelli quasi-stazionario e
intrinseco.

Sia pertanto Z(x) la FA stazionaria assunta per interpretare in senso probabilistico il


fenomeno di studio e siano C(h) e γ(h) le funzioni covarianza e variogramma.
Indicando con Z(x0) e Z(xα) le VA nei punti x0 e xα si ha per lo stimatore lineare:

n
Z * ( x 0) = λαZ ( x a ) (3.47)
α =1

A questa stima, come in genere ad ogni stima, è associato un errore, detto appunto
errore di stima. Esso è dato dalla differenza tra il valore vero ed il valore stimato:

n
Z(x0) - λαZ ( x a ) . (3.48)
α =1

Esso continua ovviamente ad essere una VA.


1
La notazione xα ora introdotta sarà mantenuta anche nel seguito di queste dispense e starà sempre ad
indicare la pozione dei punti di misura.

78
3.8.2 Correttezza della stima

Lo stimatore introdotto deve avere la fondamentale proprietà di essere corretto, cioè di


essere di media nulla:
n
E Z ( x 0) − λαZ ( xa ) = 0 (3.49)
α =1

La precedente equazione diventa:


n
E Z ( x 0) − λαE Z ( x a ) = 0 (3.50)
α =1

In condizioni di stazionarietà E Z ( x ) = m e la (3.50) si riduce a:

n
m 1− λα = 0 ,
α =1

che equivale alla seguente condizione sui ponderatori:


n
λα = 1
α =1

3.8.3 Accuratezza della stima

La qualità della stima dipende dalla


ampiezza degli errori (di stima). Essi
sono caratterizzati da una legge di
densità di probabilità che ha media nulla,
se lo stimatore è corretto, e una
dispersione che è responsabile
dell’accuratezza della stima.(fig. 3.60).

Più la funzione di densità è dispersa e


più frequenti sono gli errori elevati.
Come si può intuire, dal momento che si
opera in un quadro probabilistico
descritto da momenti del secondo ordine,
non è possibile accedere a tale funzione, Fig. 3.60 - Distribuzione dell’errore di stima
ma si è in grado, come si vedrà, di
calcolarne la sua varianza, che viene
chiamata varianza di stima ed è assunta quale grandezza per quantificare, in termini
inversi, l’accuratezza della stima.

79
Useremo per tale varianza la notazione σ2s , dove il pedice s sta per stima.

σ = D Z ( x 0) −
2
s
2
λαZ ( xα ) = E Z ( x 0) − λαZ ( xα )
α α

= E Z 2 ( x 0) − λαλβZ ( xα ) Z ( xβ ) − 2 λα Z ( xα ) Z ( x 0)
α β α

= C ( 0) + λαλβC ( x a − x β ) − 2 λαC ( x α − x 0 ) . (3.51)


α β α

Sostituendo nella precedente C(h) con C ( 0) − γ ( h ) , poiché la somma dei ponderatori è


uguale a uno, si ottiene la varianza di stima in funzione del variogramma:

σ2s = 2 λαγ ( x α − x 0) − λαλβγ ( x a − x β )


α α β
(3.52)

Si noti dall’espressione precedente che la varianza di stima non necessità dell’esistenza


di C(0) e quindi della stazionarietà d’ordine 2.

3.8.4 Stimatori tradizionali

Esaminiamo dal punto di vista delle caratteristiche sopra specificate due degli stimatori
tradizionali più usati: l’inverso delle distanze e l’inverso dei quadrati delle distanze.

Inverso delle distanze:

I ponderatori da attribuire ai campioni compresi entro il vicinaggio di stima hanno un


peso proporzionale all’inverso delle distanze:

k 1
λα = , con k=
dα 1
i di

Nella precedente di è la distanza di xi da x0

80
Inverso dei quadrati delle distanze

I ponderatori da attribuire ai campioni hanno in questo caso un peso proporzionale


all’inverso del quadrato delle distanze:

k 1
λα = , con k=
di2 1
i di2

Come si può notare entrambi gli stimatori sono corretti, ed i valori dei ponderatori da
attribuire ai campioni xα dipendono solo dalla loro distanza dal punto da stimare e non
dalla loro reciproca posizione. Essi inoltre prescindono dalla variabilità spaziale del
fenomeno di studio espressa dai variogrammi.

Comunque, avendo in qualsiasi maniera calcolato dei ponderatori, se si dispone della


funzione variogramma, è possibile calcolare mediante l’espressione (3.52) la precisione
dello stimatore corrispondente.

Diamo un esempio: si consideri lo schema di figura 3.61. Esso rappresenta la


localizzazione di cinque punti di misura (1,2,3,4,5) e di un sesto, identificato da una
crocetta, che è il punto in cui bisogna effettuare la stima.

Considerate le distanze dei 5 punti da quello da stimare, i ponderatori derivanti dai due
stimatori tradizionali sono riportati nella tabella 3.1. Nella ultima colonna della tabella è
riportata la precisione della stima calcolata con la
seguente funzione variogramma:

γ (h) = 4.2 γ exp(h, 5) + 13.5γsph (h,18)

Si tratta del variogramma aggiustato per la variabile


Cs137 campionata nell’area di Briansk, cittadina russa.
Con questo variogramma la stima con l’inverso del
quadrato delle distanze risulta essere leggermente più
precisa. Fig. 3.61 - Configurazione di stima.

Tab. 3.1

Stimatore λ1 λ2 λ3 λ4 λ5 σs
inverso distanze 0.1903 0.1715 0.1887 0.2755 0.1739 2.813
inverso quadrati distanze 0.1747 0.1418 0.1718 0.366 0.1457 2.829

81
3.8.5 Il Kriging Ordinario

Come si è visto, dato un set di ponderatori, si è in grado di calcolare, con l’ausilio del
variogramma, la precisione della stima corrispondente. E’ immediato quindi porsi come
problema quello di determinare quei ponderatori che danno luogo alla stima migliore,
nel senso di una maggiore precisione. E’ un problema che si risolve minimizzando la
varianza di stima, data dalla espressione (3.52), con il rispetto della condizione di
correttezza. Il metodo di ottimizzazione è quello di Lagrange, che consiste
nell’eguagliare a zero le n derivate parziali della (3.52) rispetto ai ponderatoti λα.:

∂σ 2s n
=0 ∀α = 1, n con la condizione: λα = 1.
∂λ α α =1

Si ottiene:
∂σ s2 ∂
= 2 λαγ ( xα − x 0) − λαλβγ ( xα − xβ ) + 2 µ (1 − λα ) = 0 , ∀α = 1,n
∂λα ∂λα a α β α

e svolgendo le derivate:

∂σ 2s
= 2 γ ( x α − x 0) − 2 λβ γ ( x α − x β ) − 2 µ = 0 , ∀α = 1,n (3.53)
∂λα β

Nel seguito, quando ragioni di praticità lo richiederanno, adotteremo la notazione più


compatta γαβ in luogo di γ ( x α − x β ) . L’espressione, ricordiamo, indica il valore della
funzione variogramma per una distanza orientata che va, in questo caso, dalla posizione
xα alla posizione xβ .

Integrando la (3.53) con la condizione di correttezza si ottiene il seguente sistema:

λβγαβ + µ = γαo , ∀α = 1,n


β (3.54)

λβ = 1
β

Il sistema precedente è un sistema lineare di n+1 equazioni in n+1 incognite. Le


incognite sono costituite dagli n ponderatori λα ed dal parametro µ, detto parametro di
Lagrange. Lo stimatore associato è detto kriging ed il sistema (3.54) è chiamato sistema
di kriging. Si dimostra che se le posizioni xα sono distinte, il sistema è sempre
regolare, e quindi ammette sempre soluzione che è unica.

82
L’espressione (3.52) delle varianza di stima, che ormai possiamo chiamare varianza di
kriging ed indicare con la notazione σk2, tenendo conto delle (3.54), può essere scritta
nella forma più semplificata:

σ2k = λβγβo + µ . (3.55)


β

Scriviamo il sistema (3.54) in forma più esplicita:

λ1γ11 + λ2γ12 + ⋅ ⋅ ⋅ + λαγ1α + ⋅ ⋅ ⋅ ⋅ + λnγ1n + µ = γ10


λ1γ21 + λ2γ22 + ⋅ ⋅ ⋅ + λαγ2α + ⋅ ⋅ ⋅ ⋅ + λnγ2n + µ = γ20
λ1γ31 + λ2γ32 + ⋅ ⋅ ⋅ + λαγ3α + ⋅ ⋅ ⋅ ⋅ + λnγ3n + µ = γ30
⋅ ⋅ ⋅⋅ ⋅ ⋅⋅ ⋅ ⋅⋅ ⋅ ⋅⋅ ⋅ ⋅⋅ ⋅ ⋅⋅ ⋅ ⋅⋅ ⋅ ⋅⋅ ⋅ ⋅⋅ ⋅ ⋅⋅ ⋅ ⋅⋅ ⋅ ⋅⋅ ⋅ ⋅⋅ ⋅ ⋅⋅
λ1γα1 + λ2γα + ⋅ ⋅ ⋅ + λαγαα + ⋅ ⋅ ⋅ ⋅ + λnγαn + µ = γα0
⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅ (3.56)
λ1γn1 + λ2γn2 + ⋅ ⋅ ⋅ + λαγnα + ⋅ ⋅ ⋅ ⋅ + λnγnn + µ = γn0
λ1 + λ2 + ⋅ ⋅ ⋅ + λα + ⋅ ⋅ ⋅ ⋅ + λn = 1

Il sistema precedente, scritto in termini matriciali, diventa:

γ 11 γ 12 ⋅⋅⋅ γ 1α ⋅⋅⋅ γ 1n 1 λ1 γ 10
γ 21 γ 22 ⋅⋅⋅ γ 2α ⋅⋅⋅ γ 2n 1 λ2 γ 20
⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅ ⋅⋅ ⋅ ⋅⋅
γα 1 γα 2 ⋅⋅⋅ γ αα ⋅⋅⋅ γαn 1 x λα = γα 0 (3.57)
⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅ ⋅⋅ ⋅ ⋅⋅
γ n1 γ n 2 ⋅⋅⋅ γ nα ⋅⋅⋅ γnn 1 λn γn 0
1 1 ⋅⋅⋅ 1 ⋅⋅⋅ 1 0 µ 1

La matrice dei coefficienti non dipende dall’entità da stimare ma dipende


esclusivamente dalla posizione reciproca dei punti di misura, cioè delle informazioni
che si utilizzano per effettuare la stima, e dalla funzione variogramma. In particolare
essa rappresenta la struttura spaziale dell’informazione. Il vettore dei termini noti è
legato all’entità da stimare e descrive i rapporti spaziali tra questa ed i punti di misura.

Il Kriging Raster

Il sistema di kriging descritto sopra si riferisce alla stima di una variabile puntuale e
perciò esso viene normalmente chiamato kriging puntuale. In molte applicazioni,
soprattutto di carattere territoriale, si ha necessità di stimare le variabili su supporti
areali, normalmente celle di forma quadrata o rettangolare. Tale necessità può sorgere
per esempio nella integrazione delle stime in ambienti GIS, dove le elaborazioni delle
carte avvengono su formati raster.

Procedendo come per il caso puntuale possiamo dedurre le equazioni di kriging per la
stima ottimale di una variabile su supporto raster.

83
Supponiamo che si debba stimare il valore della variabile Z estesa ad un volume v
centrato in x0 a partire dal valore misurato della stessa su n punti di posizione xα. (fig.
3.62). L’entità da stimare è

1
Zv(x0) = Zv0 = Z ( x )dx .
v v0

e lo stimatore lineare adottato Zv* ( x 0) è una


combinazione lineare dei valori noti:

n
Zv* ( x 0) = λαZ ( x a ) .
α =1

Fig. 3.62 Configurazione di una stima raster.

Si vuole una stima corretta e di varianza minima. Essendo E Z v ( x 0) = m , la condizione


di correttezza si traduce, come per il caso della stima puntuale, alla condizione sui λα:

λα = 1.
α

Per quando concerne l’altra condizione, si tratterà di minimizzare l’espressione della


varianza di stima rispetto ai ponderatori tenendo conto della condizione di correttezza.

La varianza di stima in questo caso è data da:

2
1 1
σ = D
2
s
2
Z ( x )dx − λα Z ( xα ) = E Z ( x )dx − λα Z ( xα )
v v0
α v v0
α

=
1 1
E [ Z ( x ) ⋅ Z ( x ')]dxdx '+ λαλβ E [ Z ( xα ) ⋅ Z ( xβ )] − 2 λα E [ Z ( x ) ⋅ Z ( xα )]dx
v2 v0 v0
α β α v v0

1 1
= C ( x − x ')dxdx '+ λαλβC ( xα − xβ ) − 2 λα C ( x − xα )dx .
v2 v0 v0
α β α v v0

84
In funzione del variogramma essa si esprime:

1 1
σ2s = 2 λα γ ( x − xα )dx − γ ( x − x ')dxdx '− λαλβγ ( xα − xβ ) .
α v v0 v2 v0 v0
α β

Le equazioni di kriging si ottengono eguagliando a zero le derivate parziali della


precedente tenendo conto della condizione di correttezza:


σ s2 + 2 1 − λα =0 ∀α = 1, n
∂λα α

Si ottiene il seguente sistema:

1
λαγ ( xα − xβ ) + µ = γ ( x − xa )dx ∀α = 1,n
β v v0

(3.58)
λβ = 1
β

con varianza di stima:

1 1
σ k2 = λβ γ ( xβ − x )dx + µ − γ ( x − x ')dxdx '
β v v0 v2 v0 v0

Con scrittura più compatta si ha:

λαγαβ + µ = γα , vo ∀α = 1, n
β
(3.59)
λβ = 1
β

85
σ2k = λβγβv + µ − γ ( v , v )
0 (3.60)
β

In termini matriciali il sistema si può scrivere:

γ 11 γ 12 ⋅⋅⋅ γ 1α ⋅⋅⋅ γ 1n 1 λ1 γ 1v o

γ 21 γ 22 ⋅⋅⋅ γ 2α ⋅⋅⋅ γ 2n 1 λ2 γ 2v o

⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅


γα 1 γα 2 ⋅⋅⋅ γαα ⋅⋅⋅ γαn 1 X λα = γ αvo (3.61)
⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅
γ n1 γ n 2 ⋅⋅⋅ γnα ⋅⋅⋅ γ nn 1 λn γ nv o

1 1 ⋅⋅⋅ 1 ⋅⋅⋅ 1 0 1 1

Come si può notare la matrice dei coefficienti è identica a quella della stima puntuale.
Essa infatti dipende solo dalla configurazione dei punti di misura usati per la stima, che
è identica nei due casi. E’ solo il termine noto che tiene conto della entità da stimare.

Esso, per la generica linea α, esprime il valor medio che la funzione variogramma
assume quando un estremo è fisso in nel punto di misura α e l’altro varia all’interno del
volume da stimare v0 .

Il suo calcolo normalmente viene


effettuato numericamente
discretizzando il volume in un
insieme di punti e trasformando
quindi l’integrale in sommatora:

N
1 1
γ ( xα − x )dx = γ ( xα − xj )
v v0 N j =1

Di solito una discretizzazione del


volume in sedici punti a maglia
regolare (v. fig. 3.63) è sufficiente a
garantire una approssimazione
accettabile.

Fig. 3.63 Discretizzazione del volume da stimare

86
Prima di enunciare alcune importanti proprietà del sistema di kriging, esaminiamo
come si comportano i ponderatori in un caso limite, quando il variogramma è un effetto
di pepita puro, vale a dire un variogramma con range zero (o molto piccolo rispetto alla
scala del lavoro):

0 se h = 0
γ ( h) =
C 0 se h ≠ 0

Consideriamo il caso di una stima puntuale e quindi facciamo riferimento al sistema


3.60. Consideriamo la generica riga α del sistema. Tutti i valori dei coefficienti valgono
C0 eccetto γαα che vale 0. Pertanto, tenendo conto della λβ = 1, la riga si riduce a:
β

C 0(1 − λα ) + µ = C 0 ,

ovvero:

µ
λα = = C te
C0

Quindi tutti i ponderati sono uguali e pari a 1/n. Il kriging si riduce ad essere una
media aritmetica dei campioni selezionati per la stima. Si noti come l’assenza di
correlazione spaziale rende i campioni tutti equivalenti ai fini della stima, qualunque sia
la loro posizione nello spazio.
Proprietà del Kriging.

a) Il kriging è un interpolatore esatto

Applichiamo le equazioni del kriging puntuale per la stima di un punto noto,


supponendo che sia quello di posizione xβ..

Se si risolve il sistema di 3.57 con la regola di kramer si ha che:

• quando l’incognita da determinare è λν ≠ λβ si ha che il determinante a


numeratore dell’espressione risolutiva di Kramer vale zero, poiché la matrice
corrispondente ha due colonne uguali (costituite dai termini: γαβ ( α = 1, n ) ):
una già contenuta nella matrice dei coefficienti, l’altra costituita dalla colonna
dei termini noti, che sostituisce la colonna corrispondente all’incognita. I
ponderatori saranno sistematicamente nulli.

• quando la incognita da determinare è λβ , i due termini che compaiono a


numeratore e denominatore sono uguali e quindi il ponderatore vale 1.

Il valore stimato perciò coinciderà con il valore vero: in questo senso il kriging è un
interpolatore esatto.

87
b) Il kriging di una combinazione lineare coincide con la combinazione lineare del
kriging dei suoi elementi.

Analiticamente questa proprietà si esprime nella seguente forma:


[ ]
*
p( x ) Z ( x )dx = p( x ) Z * ( x )dx (3.62)

Nella precedente si è utilizzata per maggiore generalità una misura di ponderazione


p(x). L’asterisco indica la stima tramite kriging.

Questa proprietà deriva dalla linearità delle equazioni di kriging. Diamo la


dimostrazione facendo riferimento alla stima del valore medio di una variabile su una
entità geometrica di volume v. Per la stima diretta del volume vale il sistema (3.61)
dalla cui soluzione si ricavano i coefficienti, che per evitare ogni confusione,
noteremo con λvα :

*
1
Zv* = Z ( x )dx = λα Z ( xα ) . (3.63)
v

v v α

Se ora vogliamo stimare il valore di Zv


come media delle stime effettuate sui
punti interni di v dobbiamo considerare il
sistema (3.57) applicato ad ognuno di
essi.
Sia x il generico punto all’interno di v
(fig. 3.64). Notiamo con λα ( x ) i pondera-
tori corrispondenti. Fig. 3.64 - Stima dei punti interni al volume

Integrando in v il sistema (3.57) si ottiene:

γ 11 γ 12 ⋅⋅⋅ γ 1α ⋅⋅⋅ γ 1n 1 λ 1, v γ 1, v
γ 21 γ 22 ⋅⋅⋅ γ 2α ⋅⋅⋅ γ 2n 1 λ 2, v γ 2, v
⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅
γα 1 γα 2 ⋅⋅⋅ γαα ⋅⋅⋅ γαn 1 X λ α,v = γα, v
⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅
γ n1 γ n 2 ⋅⋅⋅ γnα ⋅⋅⋅ γ nn 1 λ n, v γ n, v
1 1 ⋅⋅⋅ 1 ⋅⋅⋅ 1 0 µv 1

dove si è posto:

1 1
λ α,v = λα ( x )dx e γ a, v = γ ( xa − x )dx .
v v v v

88
Questo sistema coincide con il sistema (3.61): essi hanno la stessa matrice dei
coefficienti e lo stesso termine noto. Avranno pertanto le stesse soluzioni:

λvα = λα , v .

Questo implica l’uguaglianza tra le due entità:

Zv* = λvα Z ( x α )
α

1 1
Z * ( x )dx = λα ( x )dx ⋅ Z ( xα ) = λ α , vZ ( xa ) .
v v
α v v α

La proprietà descritta in questo punto è una importante proprietà di congruenza del


kriging, che gli stimatori tradizionali non posseggono.

c) Confronto con gli stimatori tradizionali

Con riferimento alla configurazione (fig. 3.63) si possono calcolare e confrontare i


ponderatori di kriging e la relativa varianza di stima con quelli degli stimatori
tradizionali. La tabella che segue riprende la tab.1 mostrata in precedenza e la integra
con i dati del kriging.

Tab. 3.2

Stimatore λ1 λ2 λ3 λ4 λ5 σs
inverso distanze 0.1903 0.1715 0.1887 0.2755 0.1739 2.813
inverso quadrati distanze 0.1747 0.1418 0.1718 0.366 0.1457 2.829
Kriging 0.1981 0.2069 0.2212 0.3297 0.441 2.781

Si osservi l’avvenuta riduzione della varianza di stima.

Un’altra forma di elaborazione è stata condotta per evidenziare la differenza tra gli
stimatori tradizionali ed il kriging. Il caso è sempre quello del Cesio 137, da cui è stato
tratto il variogramma utilizzato per il precedente confronto. Per ognuno dei tre stimatori
sono stati stimati i valori del Cs137 nei 1978 punti dove il valore della variabile era
noto, rimuovendolo di volta in volta. Un tale modo di procedere, che va sotto il nome di
test kriging, è frequentemente usato in Geostatistica per il controllo del modello e dei
parametri del modello. Relativamente ad ogni stima è stata elaborata la nuvola dei

89
correlazione valori veri/ valori stimati ed è stato costruito l’istogramma degli errori,
calcolando la media e la varianza. Nella fig. 2.65 sono riportati questi risultati.

100 100
Z* 100 Z* Z*
80 80 80

60 60 60

40 40 40

20 20 20

0 0 0
0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100
Z Z Z

f. rel. f. rel. f. rel


400 400 400

300 300 300

200 200 200

100 100 100

0 0 0
-5 -4 -3 -2 -1 0 1 2 3 4 5 -5 -4 -3 -2 -1 0 1 2 3 4 5 -5 -4 -3 -2 -1 0 1 2 3 4 5
Z-Z* Z-Z* Z-Z*

m[Z-Z*]=0.0489 m[Z-Z*]=0.060 m[Z-Z*]=0.017


s2 [Z-Z*]=13.105 s2[Z-Z*] =9.374 s2[Z-Z*] =7.659
n=1978 n=1978 n=1978

a) b) c)

Fig. 3.65 - Nuvola di correlazione veri/stimati ed istogramma degli errori: a) inverso distanze; b) inverso
quadrati distanze; c) kriging.

I risultati ovviamente sono favorevoli al kriging: la varianza di stima è più piccola,


l’istogramma degli errori è meno disperso e la retta di regressione, anche se non
tracciata, si avvicina di più alla retta a 45°.

Ancora un altro confronto con gli stimatori tradizionali: si osservi la fig. 3.66. In essa
sono riportati cinque configurazioni di stima. La configurazione a) presenta quattro
campioni localizzati sui vertici di un quadrato ed il punto da stimare occupa il centro del
quadrato. La configurazione b) deriva dalla precedente rimuovendo il campione 4. Si
passa poi dalla configurazione b) alla configurazione e) lasciando invariato il punto da
stimare e avvicinado,via via fino a farli coincidere, il campione 1 al campione 2. Le
stime sono state fatte impiegando un variogramma isotropo.

Per la configurazione a) il kriging fornisce per i quattro pondaratori lo stesso valore,


come è giusto che sia per simmetria. Anche i ponderatori tradizionali danno questo
risultato. Per le restanti quattro configurazioni i metodi tradizionali attribuirebbero ai
campioni uguali ponderatori. E ciò non sarebbe proprio. Nella configurazione b) il
ponderatore 1 ed il ponderatore 3 devono essere uguali per simmetria, ma il ponderatore
2 è più piccolo degli altri due. Passando poi dalla configurazione a) alla configurazione
d) il contributo dei ponderatori 1 e 2 , come si può intuire, deve diminuire, mentre
quello del campione 3 deve aumentare. Come caso limite, quando il campione 1 ed il

90
campione 2 risultano coincidenti (configurazione d) il loro peso equivale a quello di un
solo campione.

Fig. 3.66 - Configurazioni


di stima con valore dei
ponderatori di kriging.

Sensibilità ai parametri strutturali

I risultati di un kriging consistono normalmente, per una data configurazione di stima,


nel valore dei ponderatori e nella precisione della stima. Essi dipendono essenzialmente
dal numero di punti di misura, dalla loro posizione geometrica, reciproca e rispetto
alla entità da stimare, e dalla funzione variogramma. Per dare una idea della dipendenza
dei risultati della stima dai parametri del variogramma abbiamo scelto una
configurazione di stima a maglia regolare, che è riportata nella fig. 3.67. Essa si riferisce
ad una stima puntuale in cui l’entità da stimare è posta al centro della configurazione e
l’informazione è costituita da 12 punti di misura disposti e numerati come nella citata
figura.

Fig. 3.67 - Configurazione


scelta per la sensitività dei
risultati del kriging ai parametri
del variogramma.

91
Operando con un variogramma isotropo, le simmetrie sui campioni danno luogo a
simmetrie sui ponderatori, per cui è comodo raccogliere i campioni in tre gruppi: (1, 2,
3, 4); (5, 6, 7, 8); (9, 10, 11, 12). Ai quattro campioni di ogni gruppo compete per
simmetria un eguale valore del ponderatore, per cui sommando il loro contributo, e
notandolo rispettivamente λ1, λ2, λ3, riduciamo a tre il numero dei ponderatori da
considerare nell’analisi di sensitività.

Andamento dei ponderatori con il range

L’analisi consiste nell’esprimere l’andamento dei pondaratori λ1, λ2, λ3 in funzione del
range del variogramma. E stato considerato un variogramma di tipo sferico avente sill
1. e range a. Per svincolarsi dal particolare valore del range i ponderatori sono stati
espressi in funzione del rapporto a/d, dove d è il lato della maglia elementare (v. la già
citata fig. 3.67). Nella fig. 3.68 sono riportato i risultati dell’analisi. Si nota come per
valori del range molto piccolo rispetto a d i tre ponderatori sono pressocchè uguali e
valgono 1/3. Man mano che il valore di a aumenta (sempre rispetto a d) aumenta λ1

Fig. 3.68 - Andamento dei ponderatori


con il range del variogramma

mentre λ2 e λ3 diminuiscono: aumenta in pratica il peso dei campioni più vicini al


punto da stimare a scapito di quelli più lontani.

Andamento dei ponderatori con la frazione nugget del variogramma

Con riferimento alla configurazione di fig. 3.68, si riporta nella fig. 3.69 l’andamento di
l1, l2 e l3 in funzione del rapporto C0/(C0+C), dove C0 è la componente nugget del
variogramma e C0+C il sill complessivo.
Il calcolo è stato effettuato con un variogramma sferico di range pari a 5 volte il lato
della maglia.

92
Fig. 3.69 - Andamento dei
ponderatori con l'
effetto pepita.

Relazione varianza di stima/densità di campionatura

Sempre con riferimento allo schema di fig. 3.67 è stato calcolato il valore della varianza
di stima in funzione del rapporto a/d. Il grafico corrispondente è riportato nella fig.
3.70. Si osservi come, partendo da bassi valori di a/d , all’aumentare di tale rapporto
(cioè, per un fissato range, all’aumentare della densità di campionatura) si sconta subito
un forte guadagno di precisione fino a valori di a/d di 3-4, divenendo poi il guadagno
più modesto anche per forti aumenti della densità di campionatura. Anche in questo
caso è stato considerato un sill unitario, per cui per ottenere il valore della varianza di
stima quando il variogramma è uno schema sferico di sill c, basta moltiplicare per c il
valore risultante dal grafico.

Fig. 3.70 - Andamento della


varianza di stima in funzione
della densità di campionatura.

93
3.9 Il kriging semplice

Si consideri il caso una Funzione Aleatoria stazionaria Z(x) , in cui la media E[Z(x)] =
m, costante in tutto il campo, è anche nota. Il kriging in queste condizioni è chiamato
kriging semplice (KS) o kriging a media nota. Normalmente la media di una FA non si
conosce, a meno di non disporre di innumerevole quantità di dati. Comunque il KS
costituisce un importante riferimento teorico e metodologico e gode di importanti
proprietà.

Lavorare con una FA di media nota è lo stesso che lavorare con una FA di media nulla:
infatti si può definire Y(x) = Z(x) – m che ha media nulla:

E[Y(x)] = E[Z(x)] - m = 0 (3.63)

Il kriging pertanto di Z(x0) a partire dalle informazioni Z(xα) (α =1,n) si ottiene


attraverso la stima di Y(x0):

Z * ( x0 ) = m + Y * ( x0 ) = m + λα Y ( xα ) (3.64)
α

La condizione di correttezza per la stima di Y(x0) diventa:

E[Y ( x0 ) − λα Y ( xα )] = 0
α

ovvero

E[Y ( x0 )] − λα E[Y ( xα )] = 0
α

che per la (3.62), data la stazionarietà, è sempre verificata, qualsiasi sia l’insieme dei
ponderatori {λ}.

Per la varianza della stima vale la (3.51):

σ ks2 = C ( 0 ) + λ α λ βC ( x a − x β ) − 2 λαC ( xα − x 0 )
α β α

che non è più equivalente alla (3.52) ottenuta dalla 3.51 sostituendo C(h) con C(0)-γ(h)
e sfruttando la relazione

λα = 1
α

non più necessaria.

94
Derivando la (3.51) rispetto ai ponderatori ed eguagliando a zero si ottiene

λ β C ( x a − x β ) = C ( xα − x 0) ∀ α = 1, n (3.65)
β

Esprimendo Y in funzione di Z la 3.64 diventa:

Z * ( x0 ) = m + Y * ( x0 ) = m + λα [ Z ( xα ) − m] = m (1 − λα ) + λα Z ( xα )
α α α

Come si può osservare il complemento a 1 di λα costituisce il peso da attribuire alla


α
media.

La varianza di stima espressa dalla 3.51 si può scrivere, tenendo conto delle equazioni
3.65, nella forma più esemplificata:

σ ks2 = C ( 0 ) − λαC ( xα − x 0 )
α

Proprietà del kriging semplice:

• L’errore di stima Y(x0)-Y*(x0) è ortogonale sia con la generica variabile Y(xα)


coinvolta nella stima che con la stima stessa Y*(x0). Infatti la covarianza:

E[(Y0 − λ β Yβ )Yα ] = E (Y0Yα ) − λ β E (Yβ Yα )


β β

è nulla in virtù delle equazioni 3.65. Analogamente la covarianza:

E[(Y0 − λβ Yβ )( λα Yα )] = λβ E (Yβ Y0 ) − λα λβ E (Yα Yβ ) =


β α β α β

= λβ C0 β − λα λβ Cα β
β α β

è anch’essa nulla. Infatti, per ottenere l’eguaglianza dei due termini di destra, basta
moltiplicare entrambi i termini della 3.65 per λα e sommare in α.

Nelle precedenti per brevità sono state utilizzate delle notazioni più semplificate: Yα
per Y(xα) e Cαβ per C(xα-xβ).

• Se la F.A ammette legge spaziale multigaussiana FY1 ,Y2 ,...,Yk ( y1 , y2 ,..., yk ) stazionaria
(v.paragrafo 3.3) il kriging semplice della variabile Y(x0) calcolato a partire dalle
variabili Y(xα) (α=1.n) e la corrispondente varianza di stima costituiscono la media e
la varianza della legge gaussiana di Y(x0) noti Y(xα) (α=1.n)

95

E(Y0/y1,y2,…,yn) = Y*

Var (Y0/y1,y2,…,yn) = σ ks
2

• La retta di regressione tra valori veri e valori stimati ha pendenza unitaria. Infatti,
considerando la stima di Y nel punto x, la retta di regressione, che fornisce la migliore
approssimazione lineare di E[Y(x)/Y*(x)], è data da:

Cov[Y * ( x), Y ( x)] *


Yˆ ( x) = Y ( x)
Var (Y * ( x))

Il coefficiente lineare è uguale a uno poiché

Cov(Yx* , Yx ) = λβ Cβx
β

Var (Yx* ) = λα λβ Cαβ = λβ Cβx in virtù della 3.65


α β β

Stima con una sola variabile

Si supponga di voler effettuare la stima nel punto x0 a partire da una misura nel punto
x0+h , il sistema 3.65, ridotto ad una sola equazione, diventa:

λh x C(0) = C(h)

da cui λh = C(h)/C(0) = ρ(h) coefficiente di correlazione tra Z(x0) e Z(x0+h) .

La varianza di stima σKS è data da C(0) – C(h)/C(0) x C(h) = C(0) [1-ρ2 (h)]. Quando h
raggiunge il range, la varianza assume il valore massimo che vale C(0).

Se nelle stesse condizioni la stima fosse stata effettuata con il kriging ordinario, il
ponderatore sarebbe stato 1 e la varianza di stima σKO sarebbe stata 2γ(h) = 2[C(0)-
C(h)], sistematicamente, eccetto che per h=0, più alta di σKS. Il rapporto σKS/σKO risulta
essere infatti:

σ KS 1 C ( h)
= 1+
σ KO 2 C (0 )

Il rapporto assume valore uno per h=0 e diminuisce progressivamente fino a 0.5 quando
h raggiunge il range.

Il KO, che è operato a media non nota, implica la stima della media e pertanto la
varianza di stima è più alta di quella del KS dovendo tener conto dell’incertezza sulla
media.

96

Potrebbero piacerti anche