Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Statistica Matematica e
trattamento Informatico dei Datiati
Università di Genova
Lezione 1
Introduzione al modello di Poisson negli studi di coorte
a) studi sperimentali
c) studi semi-sperimentali
d) studi osservazionali
test di laboratorio
interventi di comunità
Disegno
dello studio in quasi-sperimentale
(o semi-sperimentale)
Epidemiologia ecologico
descrittivo
trasversale
(cross-sectional)
osservazionale
di coorte
analitico (follow-up)
caso-controllo
Gli studi sperimentali (o esperimenti) sono indagini in cui la
distribuzione del fattore in studio viene decisa dallo sperimentatore,
attraverso una procedura denominata randomizzazione.
b) gli studi analitici, tra cui i più importanti sono lo studio di coorte
e lo studio caso-controllo, che costituiranno l’oggetto della
presente esercitazione.
a) la coorte chiusa
b) la coorte aperta.
Nella coorte chiusa il campione in studio viene identificato
interamente in un preciso istante temporale.
1
Esposti
2
Popolazione in studio
3
4
5
Non-esposti
6
7
8
1 2 3 4 5 6 7 8
= Evento Periodo di follow-up (anni)
In uno studio di coorte chiusa è possibile stimare direttamente la
probabilità del verificarsi degli eventi di interesse durante il
periodo di osservazione.
Esposti
2
3
4
Non-esposti 5
6
7
8
1 2 3 4 5 6 7 8
Periodo di follow-up (anni)
Esposti
2
3
4
Non-esposti 5
6
7
8
1 2 3 4 5 6 7 8
Periodo di follow-up (anni)
Esposti
2
3
4
Non-esposti 5
6
7
8
1 2 3 4 5 6 7 8
Periodo di follow-up (anni)
Esposti
2
3
4
Non-esposti 5
6
7
8
1 2 3 4 5 6 7 8
Periodo di follow-up (anni)
1
Esposti
2
Popolazione in studio
3
4
5
Non-esposti
6
7
8
= Osservazione troncata 1 2 3 4 5 6 7 8
(censored) Periodo di follow-up (anni)
= Evento
Un caso particolare, ma molto comune di coorte aperta, è la coorte
dinamica, che è costituita da individui che possono cambiare nel
tempo, per movimenti naturali, anagrafici o amministrativi.
1
Esposti
2
Popolazione in studio
3
4
5
Non-esposti
6
7
8
= Osservazione troncata 1 2 3 4 5 6 7 8
(censored) Periodo di follow-up (anni)
= Evento
ESEMPIO SCHEMATICO DI COORTE APERTA
RICAVATA DA UNA COORTE DINAMICA
1
Esposti
2
Popolazione in studio
3
4
5
Non-esposti
6
7
8
= Osservazione troncata 1 2 3 4 5 6 7 8
(censored) Periodo di follow-up (anni)
= Evento
1
Esposti
2
3
Non-esposti 4
5
6
7
8
1 2 3 4 5 6 7 8
Periodo di follow-up (anni)
Esposti
2
3
Non-esposti 4
5
6
7
8
1 2 3 4 5 6 7 8
Periodo di follow-up (anni)
R 1 e ( t ) dt
t
R 1 e
R t
ANDAMENTO DEL RISCHIO IN FUNZIONE DEL TASSO
1.0
0.9
0.8
0.7
Rischio
0.6
= 0.0010.t-1
0.5
= 0.0005.t-1
0.4
= 0.0003.t-1
0.3
= 0.0002.t-1
0.2
0.1
0.0
1 2 3 4 5 6 7 8 9 10
0.6
= 0.0010.t-1
0.5
= 0.0005.t-1
0.4
= 0.0003.t-1
0.3
= 0.0002.t-1
0.2
0.1
0.0
1 2 3 4 5 6 7 8 9 10
O
m
RE E t RNE NE t
E
RR
NE
dove il pedice E indica la sub-coorte degli esposti e il pedice NE
quella dei non-esposti.
Variabilità della stima dei tassi e
distribuzione di Poisson
La variabilità della stima di un tasso e il confronto tra tassi diversi
necessitano di assunzioni sulla distribuzione di probabilità che si
ritiene generi gli eventi osservati.
p!
R 1 R
O p O
O! p O !
Considerando invariante la popolazione a rischio, la funzione
binomiale può essere riparametrizzata nel modo seguente:
O p O
p!
1
O! p O ! p p
Essendo:
p O
p! pO
lim lim 1 e
p , O! p O ! O!
O0
p ,
O 0
p
O O
O
p e
P O
e
O! p O!
P(O) segue una distribuzione di Poisson, con parametro che
rappresenta sia il valore atteso che la varianza, e che corrisponde
al prodotto p.R della corrispondente distribuzione binomiale.
O O O ˆ ˆ 2
Var
Var
Var
m
m 2
2
m m O
Variabilità del rapporto tra tassi
e inferenza statistica
Applicando alla stima del logaritmo di RR l’approssimazione
alla distribuzione normale se ne possono ottenere gli intervalli di
confidenza a uno specifico valore di 1-:
1 z / 2 1
1
O1 O2
e
2
Var log
1
O
L’applicazione di tale formula per l’inferenza statistica nello studio
di coorte può essere illustrata mdiante il seguente esempio.
51
2 242.1 10 5
21063
Esposizione Morti Persone/Anno
da cui:
1 242.7 105
RR 0.99
2 240.1 10
5
1.96
1 1
0.99 e 108 51
0.71;1.4
Dal momento che tali intervalli comprendono il valore di 1, atteso
sotto l’ipotesi nulla di uguaglianza del rischio nei due gruppi a
confronto, tale ipotesi non può essere rigettata.
E Y , x 0 1 x ... p x p
con:
Y e
P Y , x Y!
Comunemente si utilizza una funzione di link logaritmico, che
permette di evitare valori attesi negativi (che non hanno senso se si
tratta di modellare un conteggio).
log 0
E
1
da cui si ricava che l’antilogaritmo del coefficiente per la dummy
di esposizione rappresenta la stima di RR ricercata:
E
e 1
RR
NE
95% IC RR RR e 1.96 ES 1
Grazie a tale modellamento, il modello di Poisson risulta del tutto
analogo ad un modello di regressione lineare semplice o multipla
che utilizzi come variabile risposta il logaritmo di un tasso.
T 0.99
RR 1 2.5
RR 2 2.5
RR
0.71,1.4 1.6,3.9 1.2,5.4
T 0.99
RR 1 2.5
RR 2 2.5
RR
0.71,1.4 1.6,3.9 1.2,5.4
Maschi Femmine
30 78
Esposti E ,M 932.3 105 E , F 187.3 105
3218 41652
44 7
Non-Esposti NE , M 376.1 10 5 NE , F 74.8 10 5
11699 9364
I tassi nei maschi sono più elevati dei corrispondenti tassi nelle
femmine entro ogni categoria di esposizione (associazione
tra stimatore di rischio e variabile di stratificazione).
Tutti i soggetti Strato 1 Strato 2
Maschi Femmine
Morti Pers/anno Morti Pers/anno Morti Pers/anno
log
0
E
1
C
2
Dal rapporto tra i valori stimati attesi per gli esposti e per i non
esposti e passando all’antilogaritmo:
E
1
e RR
NE
Quindi l’anti-logaritmo della stima del coefficiente 1 per
l’esposizione rappresenta una stima del rapporto tra il tasso E
negli esposti e il tasso NE nei non-esposti.
T 1.5
RR 1 1.2
RR 2 2.0
RR
1.2,1.9 0.94,1.6 1.4,2.8
T 1.5
RR 1 1.2
RR 2 2.0
RR
1.2,1.9 0.94,1.6 1.4,2.8
log
0
E
1
M
2
EM
3
log M 0 0 1 E RR M 0 e 1
log M 1 0 1 E 2 3 E RR M 1 e 1 3