Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
DI CONTINGENZA
91
TABELLE DI CONTINGENZA
Esempio
SESSO
INTERESSE PER
Maschio Femmina Totale
STATISTICA
Alto 62 26 88
Medio 35 29 64
Basso 3 45 48
Totale 100 100 200
I criterio
1 2 Totale
II criterio
1 a b a+b
2 c d c+d
93
TABELLA DI CONTINGENZA m x n
I criterio
1 2 … m
1
II criterio
94
IL TEST DI INDIPENDENZA χ2
Stato nutrizionale
Povero Buono Totale
Rendimento
scolastico
Ipotesi
H0: le due variabili sono indipendenti;
H1: le due variabili non sono indipendenti.
Stato nutrizionale
Povero Buono Totale
Rendimento
scolastico
97
I gradi di libertà
In generale
Esempi:
gdl di una tabella 2 x 2 = (2-1) x (2-1) = 1
gdl di una tabella 3 x 2 = (3-1) x (2-1) = 2
98
Confronto tra frequenze osservate e attese
Test χ2
Stato nutrizionale
Povero Buono Totale
Rendimento
scolastico
Stato nutrizionale
Povero Buono Totale
Rendimento
scolastico
Evidentemente No
99
?
Le differenze tra le due distribuzioni sono
attribuibili al caso oppure il rendimento
scolastico è, in qualche modo, legato allo stato
nutrizionale?
Test χ2
2
(O - E)
χ2 = ∑
E
dove O=frequenze osservate
E= frequenze attese
100
Calcolo di χ2
Calcoliamo il valore di χ2 utilizzando le
informazioni contenute nelle tabelle precedenti.
χ =
2 (105 − 44.4)
2
+
(15 − 75.6)
2
+
(80 − 140.6)
2
+
(300 − 239.4 )
2
=
44.4 75.6 140.6 239.4
60.6 2 (−60.6) 2 (−60.6) 2 (60.6) 2
= + + + =
44.4 75.6 140.6 239.4
3672.36 3672.36 3672.36 3672.36
= + + + =
44.4 75.6 140.6 239.4
= 82.71 + 48.58 + 26.12 + 15.34 =
= 172.75
Si ottiene un valore del test χ2=172.75 con 1gdl.
La consultazione della tavola sinottica del χ2
consente la lettura dei valori critici.
Per α = 0.05 e 1gdl, il valore critico di χ2 =3.84
Decisione statistica
Regola di decisione
Rifiuto H0 se χ2 calcolato > χ2 tabulato
102
RIASSUMENDO:
COME UTILIZZARE IL TEST χ2
104
Test χ2 di indipendenza e
test z sulla differenza tra 2 proporzioni.
Stato nutrizionale
Povero Buono Totale
Rendimento
scolastico
( pˆ − pˆ ) − ( p − p )
z= 1 2 1 2 0
p(1 − p) p(1 − p)
+
n1 n2
105 15
p̂ 1 = = 0 . 57 p̂ 2 = = 0 . 05
185 315
x1 + x 2 105 + 15 120
p= = = = 0 .24
n1 + n 2 185 + 315 500
0 .57 − 0 .05
z= = 13
0 .24 ⋅ (1 − 0 .24 ) 0 .24 ⋅ (1 − 0 .24 )
+
185 315
Decisione statistica
Rifiuto H0, perché 13, maggiore di 1.96, cade
nella regione di rifiuto.
Conclusione
La proporzione di studenti con rendimento scarso
non è uguale all’interno dei due gruppi con
diverso stato nutrizionale.
Ciò equivale a dire che esiste una relazione di
dipendenza tra rendimento scolastico e stato
nutrizionale.
106
MISURE DI ASSOCIAZIONE TRA
DUE VARIABILI NOMINALI.
Si ricorda che:
107
STUDI PROSPETTIVI E
RISCHIO RELATIVO
In generale:
MALATTIA
FATTORE DI RISCHIO Sì No Totale
Esposti a b a+b
Non esposti c d c+d
Totale a+c b+d n
a ( a + b)
RR= c (c + d )
109
Come interpretare i valori assunti dal RR
Esempio
L’essere sposati con un fumatore è associato a un
rischio relativo di malattie cardiache pari a 1.3.
Ciò significa che i non fumatori sposati con
fumatori sono colpiti 1.3 volte di più da malattie
cardiache rispetto a non fumatori sposati con non
fumatori.
110
Intervallo di confidenza per RR
i =1 Ei
111
Esercizio Daniel pag.506 12.7.1
Tra i dati raccolti in uno studio prospettivo sulla
depressione postnatale nelle donne (Boyce et al.)
compaiono i dati riassunti nella tabella che segue.
Dal campione dei soggetti in studio, si vuole stimare il
rischio relativo di diventare un “caso” di depressione
postnatale in donne primipare, sposate o conviventi in
maniera stabile, ad un mese dal parto, quando è presente il
fattore di rischio, rappresentato da un partner indifferente.
Depressione
Partner indifferente Sì No Totale
Sì 5 21 26
No 8 82 90
Totale 13 103 116
5 26 0.1923
RR= 8 90 = 0.0889 = 2.2
112
Calcoliamo l’intervallo di confidenza al 95% per
RR con la seguente formula:
1± ( z1− a / 2 / χ 2 )
100(1 − α )% I .C. = RR
k
(O − E ) 2
χ2 = ∑ i i
= 2.1682
z=1.96 i =1 Ei
Depressione
Partner indifferente Sì No Totale
Sì 5 (2.92) 21(23.09) 26
No 8(10.08) 82(79.91) 90
Totale 13 103 116
113
STUDI CASO-CONTROLLO E
ODDS RATIO
INFARTO MIOCARDICO
FATTORE DI RISCHIO Casi Controlli Totale
Colesterolo ≥240 mg/dl 100 70 170
Colesterolo <240mg/dl 87 193 280
Totale 187 263 450
In generale:
MALATTIA
FATTORE DI RISCHIO Casi Controlli Totale
Esposti a b a+b
Non esposti c d c+d
Totale a+c b+d n
114
Definizione di odds
Probabilità di malattia
Odds di malattia =
Probabilità di non malattia
116
Come interpretare i valori assunti da =OR
117
Esercizio Daniel pag.509 12.7.2
La tavola che segue riporta 158 soggetti classificati come
casi e controlli rispetto alla presenza dell’infezione da
sifilide e secondo il numero di partner sessuali (fattore di
rischio) negli ultimi 90 giorni.
Si desidera confrontare l’odds dell’infezione da sifilide tra i
soggetti con tre o più partner sessuali, negli ultimi 90
giorni, rispetto all’odds dei soggetti con nessun partner
sessuale negli ultimi 90 giorni.
Infezione da
sifilide
O
N di partner sessuali negli Casi Controlli Totale
ultimi 90 gg
≥3 41 58 99
0 10 49 59
Totale 51 107 158
Cohen et al., American Journal of Public Health, 82(1992), 552-556
a
b = ad = 41 ⋅ 49 = 3.46
OR= c bc 58 ⋅10
d
Coloro che hanno avuto tre o più partner sessuali
negli ultimi 90 giorni hanno una probabilità di
infezione 3.46 volte più elevata dei non casi.
118
I.C. al 95% per OR
1± ( z1− a / 2 / χ 2 )
I .C. = OR
k
(Oi − Ei ) 2
χ =∑
2
= 10.1223
i =1 E i
1± (1.96 / 10.1223)
L1;L2= 3.46 = 1.61;7.43
Conclusione
Abbiamo un grado di fiducia del 95% che l’OR
della popolazione sia compreso entro i due limiti
calcolati.
Poiché l’intervallo non contiene 1 è possibile
concludere che nella popolazione aver avuto 3 o
più partner sessuali negli ultimi 90 gg aumenta la
probabilità di contrarre la malattia di 3.46 volte.
119
IL χ2 DI MANTEL-HAENSZEL
Variabile di confounding
Nello studio della relazione tra una data malattia
e un presunto fattore di rischio, può capitare che
vi sia un’altra variabile (associata alla malattia,
al fattore di rischio o ad entrambi), che può
falsare la vera relazione tra le due variabili.
Come procedere?
I soggetti, casi o controlli, vengono assegnati a
strati, che corrispondono alle diverse modalità
della variabile di confounding.
La variabile di confounding può essere
categoriale o continua; se è continua deve essere
categorizzata.
Esempio: se la variabile di confounding è l’età, è possibile categorizzarla
raggruppando i dati in classi di età mutuamente esclusive.
120
Come calcolare il χ2 di
Mantel-Haenszel
Campione
Fattore di rischio Casi Controlli Totale
Presente ai bi ai+bi
Assente ci di ci+di
Totale ai+ci bi+di ni
121
3.Per ogni strato calcolare la quantità:
∑ (a i − ei ) 2
χ MH
2
= i =1
k
∑v
i =1
i
122
L’ODDS RATIO DI MANTEL-HAENSZEL
k
ai di
∑
n
= i =k1
i
ORMH
bi ci
∑i =1
ni
123
Esercizio
Si vuole valutare l’efficacia di una profilassi antibiotica su
pazienti da sottoporre a due diversi tipi di intervento
chirurgico (intervento A e intervento B), in relazione alla
comparsa di eventuali infezioni postoperatorie.
Prima dell’intervento, fu somministrato antibiotico a 303
dei 606 pazienti da sottoporre all’intervento A, mentre i
restanti 303 ricevettero un placebo;
fu somministrato antibiotico a 301 dei 612 pazienti da
sottoporre all’intervento B, mentre i restanti 311
ricevettero un placebo.
La comparsa di infezioni postoperatorie nei pazienti
esaminati è sintetizzata nella tabella seguente.
Intervento B
Numero totale di pazienti 301 311 612
Numero di pazienti affetti da 14 25 39
infezione postoperatoria
Assunzioni
Sono verificate le assunzioni necessarie per un
uso appropriato del test χ di Mantel-Haenszel
2
Ipotesi
H0: non c’è associazione tra trattamento
antibiotico perioperatorio e comparsa di infezioni
postoperatorie in pazienti sottoposti a intervento
di tipo A e di tipo B.
H1: c’è associazione tra trattamento antibiotico
perioperatorio e comparsa di infezioni
postoperatorie in pazienti sottoposti a intervento
di tipo A e di tipo B.
Test
∑ (a i − ei ) 2
χ MH
2
= i =1
k
∑v
i =1
i
125
Regola di decisione
Per α=0.05 il valore di χ2 critico è 3.841.
Rifiutiamo H0 se il valore calcolato della statistica
test è ≥ 3.841.
Intervento B: strato 2
Infezione
postoperatoria
Fattore di rischio (nessun antibiotico Sì No Totale
prima dell’intervento)
Sì 25 286 311
No 14 287 301
Totale 39 573 612
126
Calcolo delle frequenze attese:
e1=(43+260)(43+26)/606=303·69/606=34.5
e2=(25+286)(25+14)/612=311·39/612=19.82
Calcolo di v1 e di v2:
v1=(303)(303)(69)(537)/(6062)(606-1)=15.3112
v2=(311)(301)(39)(573)/(6122)(612-1)=9.1418
Calcolo di χ2:
127
Calcolo dell’odds ratio di Mantel-Haenszel
- calcoliamo il denominatore:
(b1c1/n1) + (b2c2/n2) =
= [(260)(26)/606] + [(286)(14)/612] = 17.697599