Sei sulla pagina 1di 6

Schema degli argomenti trattati

Processi di punto

Definizione di un processo di punto


Processi di punto omogenei
Processi di poisson non omogenei
Test per valutare la completa casualizzazione
Propriet dei Processi di Poisson
La funzione K
La stima della funzione K
Stima della funzioni di intensit
Individuazione della presenza di raggruppamento
Processi di punto marcati
Alcune applicazioni in epidemiologia spaziale
Studi caso-controllo

Processi di punto
Dato un processo spaziale {Z ( s ) : s D} quando si in una situazione in

cui la casualizzazione si ha nel dominio: il dominio discreto D


caratterizzato da siti che costituiscono eventi casuali.
Il dominio D={s1,s2,,sn} una raccolta casuale di punti nel
piano.
Un attributo Z pu essere osservato (in tal caso si parla di
processi di punto marcati) oppure no.
Idea sottostante quella di casualit completa: ci significa che
equamente probabile che un evento accada in un qualsiasi punto
nellarea di studio, indipendentemente da altri eventi.

Processi di Poisson omogenei


Un processo di Poisson OMOGENEO, N(A), la rappresentazione
stocastica di completa casualizzazione spaziale.
Esso caratterizzato da due propriet:
Se N(A) indica il numero degli eventi che accadono entro
unarea finita A, allora una variabile casuale N(A)~Poi(|A|).
dove >0 indica la funzione di intensit costante del
processo e dove |A| indica larea di A.
Se A1 e A2 sono due regioni disgiunte di D, allora N(A1) e
N(A2) sono indipendenti

Gli eventi seguono una distribuzione uniforme


Gli eventi sono indipendenti
Lobiettivo quello di determinare se ci sono raggruppamenti o
qualche altra regolarit nei siti.
3

Processo di Poisson non omogeneo

Test per valutare la completa casualizzazione

Se lintensit del processo (s) varia spazialmente si dice che un


processo di Poisson non omogeneo.
Quindi, un processo di Poisson detto NON OMOGENEO quando:
Se N(A) indica il numero degli eventi che accadono entro
unarea finita A, allora una variabile casuale N(A)~Poi((A)).
dove (s)>0 indica la funzione di intensit del processo nel
sito s e ( A) = ( s )ds
A

Se A1 e A2 sono due regioni disgiunte di D, allora N(A1) e N(A2)


sono indipendenti
Il Processo di Poisson omogeneo un caso particolare di quello non
omogeneo

Test basati su conteggi quadrati


Partizione del dominio D in regioni quadrate (r righe e c colonne). Il
test si traduce in un Chi-quadrato (la statistica test un rc2 1 )
ALTERNATIVA DEI QUADRATI CONTIGUI: il dominio inizialmente
viene suddiviso in 2qx2q quadrati (q=4 o 5), quindi successivamente i
blocchi sono combinati in 2x1, 2x2, 2x4 4x4

Test basati sulle distanze


Non sono influenzati dalla forma dellarea di riferimento.
Sia hij=||si-sj|| la distanza tra i due eventi si e sj. La distanza tra si e il
suo vicino pi prossimo hi. Ripley e Silverman (1978) propongono un
test semplice: t1=min(tij) allora t12 si distribuisce come una
esponenziale sotto casualit completa.

Propriet dei Processi di Poisson

Propriet dei Processi di Poisson

( s ) cattura la funzione media di un processo di punto


Per catturare la interazione spaziale: funzione di intensit del
secondo ordine 2 ( si , s j )

Un processo stazionario quando la intensit del secondo ordine


dipende solo dalle differenze tra le posizioni dei siti:
2 ( si , s j ) = 2* ( si s j )

I due momenti possono essere visti in modo pi complesso.


Lintensit del primo ordine definita come

Per un processo stazionario (s)=

Se il processo isotropico allora lintensit del secondo ordine


dipende solo dalla distanza

Lintensit del secondo ordine definita come:

Il processo di Poisson eterogeneo non stazionario ma esso pu


essere o no isotropico.

Per un processo stazionario 2(s,u)=2(s-u)


Per un processo isotropico 2(s-u)=2(h)

2 ( si , s j ) = 2* ( si s j ) = 2* ( h )

La funzione K (la misura del secondo momento ridotto)


La funzione K viene proposta da Ripley (1976) come: K (h) = 22 x2 ( x)dx
0
h

Le propriet del secondo ordine possono essere esaminate per


mezzo della funzione K.
se un processo semplice K(h) rappresenta il numero medio di
eventi extra entro una distanza h da un evento fissato. Per un
processo omogeneo con intensit questo numero h2 e la
funzione K semplicemente K(h)=h2.
se K(h) nota per un particolare processo, lintensit del secondo
ordine facilmente derivata
La definizione per processi semplici suggerisce un metodo per
stimare K(h) come funzione del numero medio di eventi a distanza h.
In un processo clusterizzato, un evento verosimilmente
circondato da eventi dello stesso cluster. Il numero di eventi extra
entro piccole distanze sar grande. In un pattern regolare, il
numero di eventi extra per distanze piccole sar piccolo.
9

La stima della funzione K


Per processi omogenei, stazionari e isotropici.
La funzione K pu essere stimata da (Ripley, 1976):
1 n n
K ( h) = w( si , s j ) 1 I (hij h)
i =1 j i

dove hi,j la distanza tra si e sj,


wij rappresenta la porzione di un cerchio centrato su si con
raggio hi,j che interno allarea di studio.
Spesso si confrontano i valori di K(h) per diverse distanze con K(h)=
h2 nel caso di completa casualizzazione.
A volte non possibile calcolare empiricamenteb perch i due grafici
si sovrappongono. La varianza delle funzioni K stimata aumenta
velocemente con h, si suggerisce di costruire
la funzione L(h) = K (h) /
e stimarla.

Si suggerisce di costruire e graficare L(h)- h.


Le deviazioni dallasse orizzontale suggeriscono lallontanamento dalla
10
disposizione casuale (sopra: raggrupamento, sotto:regolarit)

Stima della funzioni di intensit

Bande derrore per


Approccio di Monte Carlo pu essere usato per graficare le bande
derrore di
come tipo di test di ipotesi
Bande derrore:
Sono generate dai dati seguendo lipotesi di campionamento
casuale semplice basato sulla regione e lintensit stimata dai
dati.
Calcolo
per i dati generati.
Ripeto le operazioni un grande numero di volte.
Grafico i quantili appropriati come bande di errore superiore e
inferiore.

Anche per processi omogenei pu essere utile stimare lintensit


degli eventi pi localmente, per esempio, per determinare se
procedere con unanalisi delle funzioni di secondo ordine.
In pratica, per stimare (s) si propongono metodi di smoothing non
parametrici di conteggi al quadrato o i metodi di stima di densit.
Il metodo della stima Kernel (Silverman 1986)
( s0 ) =

Oppure ipotizzando un kernel bivariato


( s0 ) =

con
11

x x0 yi y0
1
k i

k
i
| A | hx hy
hx hy

1
1 s s0
k i

ph ( s ) i h 2 h

s u
ph ( s ) = (1 h 2 )k
du
A
h

fattore di correzione
12

Individuazione della presenza di raggruppamento

Individuazione della presenza di raggruppamento

Ipotesi nulla alla base


Ho: non ci sono gruppi di casi
Raggruppamenti vs gruppi (Besag and Newell, 1991)
Lindividuazione di un gruppo richiede di trovare una raccolta di
casi specifici inconsistenti con lipotesi nulla.
Un aspetto locale una anomalia nei dati

Mentre la funzione K permette di individuare la presenza di


raggruppamento in caso di processi di poisson omogenei,
lassunzione di stazionariet su cui si basa preclude il suo utilizzo
in presenza di processi di Poisson non omogenei.

Individuare raggruppamenti richiede una valutazione della


propensione globale di casi a raggrupparsi insieme
Un aspetto globale una tendenza dei casi a raggrupparsi

Proposta di Cuzick e Edwards (1990) adattano il metodo basato


sulle distanze del vicino pi prossimo per processi di Poisson non
omogenei.
Viene considerato un gruppo di controllo per definire la
distribuzione di riferimento e la statistica di nearest neigbour
associano al caso o al controllo ogni osservazione e ogni suo
vicino.
Ma dove sono i gruppi???

13

14

Individuazione della presenza di raggruppamento

Individuazione della presenza di raggruppamento

1)Individuare gruppi
2)Determinare se contengono un numero di valori significativamente
+ alto o + basso di ci che ci aspettiamo;
3)Identificare la posizione e lestensione del gruppo.

Scansione spaziale
Una statistica scansione riguarda la costruzione di una
finestra e confronta una misura entro la finestra e la stessa
misura fuori dalla finestra.
Si considera un insieme di possibili siti raggruppati
Porre una finestra di ampiezza variabile centrata in ogni punto
griglia e calcolare il valore della statistica.
La statistica test proporzionale a:

Kulldorff e Nagarwalla (1995): si utilizzano finestre mobili circolari


per comparare un valore (ad es. un numero di eventi o una
proporzione) entro una finestra e al di fuori.
Rapporto di verosimiglianza locali sotto lipotesi di rischio costante.
Se C il numero di casi totali e c il numero di quelli compresi nella
finestra mobile. Sotto lassunzione che il numero di casi segua una
distribuzione di Poisson, la funzione di verosimiglianza per una data
finestra proporzionale a :
c
C c
dove n il numero atteso nellipotesi di
c C c

I (.)
rischio costante nellintero dominio.
n C n
I() una funzione indicatrice che pu essere =1 quando il numero di
casi nella finestra molto alto
15

Tscan rappresenta un insieme di test di rapporti di


verosimiglianze locali che confrontano lipotesi nulla di rischio
costante a quello del maggior rischio entro la finestra rispetto
a fuori la finestra.
16

Processi di punto marcati

La stima della funzione K

Interesse nello studiare come un attributo si manifesta in un


dominio casuale. (generalmente a scopi di pianificazione)
Si hanno due fonti di casualit: la casualit della variabile
marcante in s dato un evento che avviene in un altro sito e la
distribuzione del processo che ha generato gli eventi.
Si possono studiare condizionatamente luno allaltro oppure
congiuntamente.

Quando si considera un processo di punto marcato, si pu costruire


la funzione K in modo da tenere conto sia del processo spaziale
sottostante sia della marcatura.
Una generalizzazione di K(h) per un processo di punto bidimensionale
(Ripley, 1981)
K ij (h) =

E[N.di eventi di tipo j entro una dist. h da eventi di tipo i]

Supponendo che gli eventi di tipo i in A siano osservati con intensit


i nel sito s e che eventi di tipo j in A siano osservati con intensit j
nel sito u. Allora uno stimatore per Kij(h) :
K ij (h) =

Estensione anche al caso di processo marcante multivariato


(Moller e Waagepetersen (2003))

17

Alcune applicazioni in epidemiologia spaziale

w( sk , ul ) I ( hkl h)

i j | A | k

Per un processo bivariato stazionario, le cross funzioni K sono


simmetriche K12=K21. Viene proposto lo stimatore pi efficiente:
K ij* = j K ij (h) + i K ji ( h) / j + i
sotto lipotesi nulla di indipendenza
Kij(h)=h2
Passando alle L questo test risulta troppo complesso da essere
valutato in alcuni casi.
18

Studio caso-controllo

Distribuzione dei casi di una certa malattia pu essere riguardata


come realizzazione di un processo di punto, che riflette la
distribuzione sottostante della popolazione (generalmente non
omogenea) + qualche fattore di rischio legato alla malattia e che
dipende dal soggetto.
Il processo spaziale non pu essere considerato da solo in quanto
strettamente legato alla distribuzione della popolazione.
Proposta studio caso-controllo
Gruppo controllo. Scelto casualmente dalla popolazione a rischio
cos che la sua variabilit spaziale possa essere valutata. (in
letteratura vengono proposte alcune alternative per selezionare il
gruppo di controllo)
n1 casi e n0 controlli.
19

Condizionatamente al numero di casi e di controlli, si possono


assumere essere dei processi di Poisson non omogenei con intensit
1(s) e 0(s).
Kersall e Diggle (1995) considerano il rischio di malattia dato dal
rapporto tra caso e controllo: (s)= 1(s)/0(s). (sotto Ho: (s)= n1/n0.
In maniera analoga si lavora con il logaritmo delle densit dei casicontrollo:
se assume che le densit in una qualche regione di interesse D per
il caso f1 e il controllo f0 siano date da:

In questo caso sotto Ho:r(s)=0

20

Studio caso-controllo

Studio caso-controllo

Rapporto di intensit Kernel (Kersall e Diggle, 1995)


Le stime kernel per f0 e f1 possono essere inglobate in r(s).
Le ampiezze di banda possono essere scelte diverse o uguali
per f0 e f1
Le ampiezze di banda possono essere scelte automaticamente
(cross-validation, plug-in,) o pu essere esaminata una
sequenza di ampiezze di banda (pi piccola indica pi
cambiamenti locali nellandamento del processo.
Le mappe o i contour plot dello stimatore di r(s) possono essere
informative:
>0 indica che i siti s sono pi simili di quelli del controllo.

21

Bibliografia utile
Per la parte dei processi di punto (in ordine di chiarezza):
Schabenberger e Gotway (2005). Statistical Methods for spatial
data analysis. Chapman & Hall. Qualche paragrafo del capitolo 1,
capitolo 3.
Waller e Gotway(2004) Applied Spatial Statistics for Public Health
Data. Wiley . Capitoli 5 e 6.
Cressie (1993). Statistics for spatial data, Wiley capitolo 8.
Per collegamenti alla parte in laboratorio
Bivand, Pebesma e Gomez-Rubio (2008). Applied Spatial Data
Analysis with R. Springer. Capitolo 7.

23

Differenza delle funzioni K (Diggle e Chetwynd, 1991)


Un esame delle propriet del secondo ordine pu essere trovato
usando le differenze di funzioni K, cio: KD(h)=K1(h)-K0(h)
Sotto disposizione casuale KD dovrebbe essere pari a zero in
corrispondenza di qualunque distanza h.
Valori positivi indicano raggruppamento dei casi .
Interpretazione: confrontare natura di deviazioni dal
campionamento casuale.

22