Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Bibliografia:
N. Cressie (1993) Statistics for spatial data, Wiley.
R.L. Smith (2001) Environmental Statistics, scaricabile
dal sito:
http://www.stat.unc.edu/postscript/rs.envnotes.pdf.
B.D. Ripley (1981) Spatial Statistics, Wiley.
Schabenberger, C. A. Gotway (2005) Statistical
methods for spatial data analysis, Chapman and Hall.
R. Webster, M. A. Oliver (2001) Geostatistics for
environmental scientists, Wiley.
Francesca Bruno
Dipartimento di Scienze Statistiche P.Fortunati
francesca.bruno@unibo.it
Lattice Data
Processi di punto
Modelli CAR
Modelli SAR (Econometria Spaziale)
Processi di Poisson Omogenei
Dati geostatistici
Dati geostatistici
Qui di seguito elenco alcuni data set che useremo nel corso e che
sono facilmente reperibili o gi disponibili in R:
elevation: dati di altitudine presi da Davis (1972).
gambia: dati di malaria in Gambia (Diggle, P., Moyeed, R.,
Rowlingson, B. & Thomson, M. (2002). Childhood malaria in The
Gambia: a case-study in model-based geostatistics, Applied
Statistics)
10
12
600000
500
Y Coord
300
0
100
Y Coord
300
100
0
800
400
600
X Coord
800
100
-100
0
X Coord
100
400
600
800
1000
250
350
400
Density
0.004
150
300
data
350
400
14
20
Y Coord
10
15
20
Y Coord
10
15
200
100
-200
-200
0
X Coord
200
300
data
-100
Y Coord
0
200
100
Y Coord
-100
0
data
10
X Coord
15
20
15
20
10
10
12
14
data
16
18
-200
0.30
16
Density
0.20
data
12
14
0.10
10
400
600
800
1000
data
15
10
X Coord
0.00
0.0000
400
600
data
Density
0.0010
800
0.0020
1000
18
-100
250
0.006
350
data
300
250
200
-200
200
400
400
600
X Coord
0.002
500000
I dati si riferiscono a
143 stazioni di
monitoraggio in tutto
lo stato di Paran in
Brasile.
0.000
400000
200
200
1450000
1550000
1350000
300000
12
14
data
16
18
16
10
Columns
Inoltre, fornisce pi
informazioni
sulla
direzione delle relazioni
spaziali
15
17
Lattice data
I dati su reticolo sono caratterizzati da un numero (finito) di siti
spaziali in cui lattributo viene misurato.
Linsieme di tutti i siti viene chiamato reticolo, che supportato da
informazioni di vicinato.
Aspetto importante: come la struttura dei siti che indicizza il
processo integrata con informazioni sul vicinato dei siti.
8
15
15
20
20
8
10
10
12
10
10
12
10
10
10
10
12
12
14
16
12
5
x
x o
o
10
11
Coal Ash %
Il primo grafico
rappresenta le curve di
livello, mentre nel secondo i
livelli sono rappresentati da
colori diversi
10
10
12
10
10 10
10
10
10
10
12 16
o
x
x x x o
x
o
o x o o
x
o
Coal Ash %
8 9 10 11
10
Rows
10 15 20
oo x x
ox ox
o xxo ox
xo
ooxx
o x o oxx
o x xo
xxoo
ox xo
o
x
xo
x o
Questo
grafico
rappresenta medie e
mediane per riga e
colonna e permette di
identificare, attraverso
il loro scostamento, la
presenza di outliers,
spesso problematici da
trattare in fase di
costruzione del modello.
10
x
15
10
15
18
20
(116) <
(50)
0.5 -
0.7
(31)
0.7 -
0.9
(29)
0.9 -
1.1
(31)
1.1 -
1.3
(24)
1.3 -
1.5
(60) >=
0.5
1.5
SMRi =
100.0km
Oi
Ei
21
22
(0) <
0.5
(18)
0.5 -
0.7
(83)
0.7 -
0.9
(87)
0.9 -
1.1
(100)
(37)
1.1 1.3 -
(16) >=
Obbiettivo:
ridurre la variabilit delle stime del rischio relativo
sfruttare la correlazione spaziale dei dati
1.3
1.5
1.5
100.0km
23
24
I dati si riferiscono al
numero di casi di SIDS e
di nascite raccolti nelle
100 contee del NC in due
periodi dal 1974-78 e
1979-1984
26
Processi di punto
300
200
100
55 56
54
58 65
75
82 77
74
74 69
61
62 71
73
63
62 63
64
59 85
88
95 106 110 99 89
82
79 84
97
79
55 55
56
60 91
95
85
68
55 54
53
61 82 102 88 93
96
68
59 58
60
64 88
99
82 81
71
80 89
89
89 102 104 75
63 57
58
58 77
92
82 71
59
90 105 92
79 98 110 83
62 55
56
56 80
90
99 88
64
91 112 94
76 91 100 85
62 59
55
61 99
97
93 80
65
87 107 80
59 60
67
66
65 62
68
72 102 94
90 83
74
81 96
69
52 50
51
54
62 62
86
85 55
59
64 72
75
70 70
62
66 61
55
57
52 59
61
56 41
40
43 44
46
48 50
52
68 69
60
61
42 43
44
43 42
41
42 44
43
43 44
47
58 59
55
61
44 41
39
42 44
43
42 42
42
43 43
49
56 53
53
61
43 42
40
42 42
42
41 42
42
43 42
53
66 61
51
62
40 42
41
40 43
49
46 42
42
43 43
49
59 62
53
62
40 41
42
43 49
54
47 44
42
44 43
46
52 56
56
61
La variabile di interesse
esiste ed osservata solo in
un insieme finito di
localizzazioni.
400
100
200
300
400
27
Tipi di dati:
-punti: un dataset di questo tipo contiene le posizioni degli
oggetti/eventi che si presentano nella regione sotto studio. I
punti possono rappresentare alberi, rifugi di animali, epicentri di
terremoto, omicidi, casi di influenza.
-marcati: i punti hanno un attributo associato. La variabile che
marca pu essere categorica (come ad es. specie o malattia)
oppure continua (diametro dellalbero).
I punti dovrebbero essere posti in una regione del piano
bidimensionale, o sulla superficie della terra, o in un volume
tridimensionale,
Datasets:
Posizione e diametri di alberi in una regione della Georgia (USA)
28
di 200x200 metri (dataset redwood e longleaf di R)
29
31
30
32
33
34
35
GeoR
Spatial
Gstat
Spatstat
Splancs
DCluster
36