Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
1 di 19
Alice Mannocci - Test per variabili qualitative
Indice
1. INTRODUZIONE ....................................................................................................................................... 3
2. IL TEST DEL CHI-QUADRATO (Χ²) ............................................................................................................ 6
3. TEST ESATTO DI FISHER .......................................................................................................................... 11
4. ESERCITAZIONE CON EPI INFO –TEST DEL Χ² ED ESATTO DI FISHER .................................................... 13
BIBLIOGRAFIA................................................................................................................................................ 19
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
2 di 19
Alice Mannocci - Test per variabili qualitative
1. Introduzione
La presente lezione riguarderà due tra i principali test per varabili qualitative.
Per introdurre i test prendiamo in esame due variabili aleatore di tipo dicotomico: consumo
di alcool [si/no] (che chiameremo esposizione) ed avere malattia coronarica [si/no] (evento). Si
- esposizione ed evento sono tra loro indipendenti, cioè non esiste alcuna associazione,
ovvero il verificarsi dell'uno non influisce sul calcolo della probabilità del verificarsi dell'altro;
- esposizione e malattia sono tra loro dipendenti, cioè l’esposizione modifica la probabilità
di malattia, in altre parole il verificarsi dell'uno influisce sul calcolo della probabilità del verificarsi
dell'altro.
In termini di probabilità:
si pensi al lancio di una moneta non truccata. Qual è la probabilità che esca la sequenza «testa;
testa»?
Chiamiamo P(T) la probabilità che esca “testa”: allora P(T)=1/2 dove 1 è l’esito di interesse e
P(T;T)= 1/4 dove 1 è l’esito di interesse e 4 il numero di esiti possibili (CC; TC;CT;TT);
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
3 di 19
Alice Mannocci - Test per variabili qualitative
malattia:
Si tratta di una tabella 2x2 (2 righe e 2 colonne), poiché le variabili che si sono scelte sono
qualitative binarie.
Alla luce di tali dati possiamo immaginare che se gli eventi fossero indipendenti le
La tabella in figura 1 rappresenta la tabella delle frequenze attese, o modello teorico, o nel
contesto dei test statistici, l’ipotesi nulla (H0). Tale tabella riporta la situazione che noi dovremmo
osservare per dire che malattia ed esposizione non sono “legate” tra loro.
Se avessimo 100 individui e non vi fosse associazione tra malattie ed alcool dovremmo
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
4 di 19
Alice Mannocci - Test per variabili qualitative
100
Supponiamo di condurre uno studio e di raccogliere i dati per 100 individui e di osservare la
Quello che si dovrà testare sarà se la tabella degli “osservati” è diversa dal modello
teorico.
100
La differenza andrà valutata non confrontando banalmente i valori nelle celle delle due
tabelle, ma a livello statistico: se ripetessimo l’esperiemnto 100, 1000, 10.000 volte, otterremmo
sempre una tabella delle frequenze osservate “lontana” da quella delle frequenze attese?
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
5 di 19
Alice Mannocci - Test per variabili qualitative
Date due variabili di tipo qualitativo per valutare se siano tra loro «associate/dipendenti» si
L’ipotesi nulla (H0) per il test del χ2 può essere scritta, come è discusso nell’introduzione, in
• P(B ∩ A) = P(B)*P(A)
• La proporzione di soggetti che hanno avuto l’evento A è la stessa per i diversi livelli
Il test del chi-quadrato traduce questa ipotesi nulla nel confronto tra le frequenze osservate
(O) e quelle attese (E): si domanda se sono troppo grandi per essere attribuite al caso. Il confronto
avviene utilizzando quindi le differenze tra O ed E delle diverse celle. Da tale confronto
Dove
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
6 di 19
Alice Mannocci - Test per variabili qualitative
Nella formula la differenza “Oi- Ei” rappresenta la distanza che intercorre tra i valori delle
libertà della tabella. I gradi di libertà (gl o df) sono dati da:
gl = (r-1)*(c-1)
una correzione, detta “Correzione di Yates”. Ovvero si sottrae 0,5 alla differenza tra Oi ed Ei:
Tale correzione va quindi a ridurre la distanza tra osservati ed attesi, e fa in modo che il
modello osservato si avvicini a quello teorico. Tale correzione in altre parole, qualora si arrivi a
rifiutare l’ipotesi nulla, ovvero che ci sia differenza tra osservati ed attesi, rende la conclusione
Esempio
In uno studio sulle proprietà della curcuma, si vuole capire se questa oltre ad essere una
spezia per insaporire e colorare i piatti riduca le infiammazioni del tratto gastrointestinale.
Si considera un campione casuale di 793 soggetti, tra le variabili raccolte vi sono le seguenti
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
7 di 19
Alice Mannocci - Test per variabili qualitative
Figura 4. Tabella delle frequenze osservate per lo studio sulla curcuma e le infiammazioni
gastrointestinali.
oppure come:
abituali e no di curcuma”.
3) Il test, poiché si tratta di un confronto tra due variabili qualitative è il test del χ².
Per calcolare la statistica del test occorre costruire la tabella delle frequenze attese
utilizzando i valori marginali (valori situati sul bordo) della tabella degli osservati.
Per stimare la cella di riga 1 e colonna 1 occorrerà quindi fare la seguente proporzione:
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
8 di 19
Alice Mannocci - Test per variabili qualitative
Dunque 43,6 è il valore che si dovrebbe avere perché non vi sia associazione tra uso di
etc.
Una volta completata la tabella delle frequenze attese occorre fare un “controllo della
- si accetta un massimo del 20% di celle con una frequenza attesa minore di 5.
Qualora anche una sola delle due condizioni non sia verificata non possiamo utilizzare il test
del chi-quadrato.
condizioni.
Si calcolano dunque i gradi di libertà abbiamo gl =1, che ci suggerisce quindi di utilizzare il
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
9 di 19
Alice Mannocci - Test per variabili qualitative
Da cui:
con gl=1.
4) Consultando le tavole statistiche del chi-quadrato (si veda cartella documenti del corso
o un qualsiasi libro di statistica) con gl=1 per χ²=27,27 abbiamo un p<0,005 (figura 6).
Possiamo concludere il test rifiutando l’ipotesi nulla vi è una differenza significativa tra la
proporzione di malati nel gruppo che utilizza curcuma abitualmente rispetto a chi non la usa.
Se volessimo capire chi è che si ammala meno nei due gruppi basterà calcolare e
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
10 di 19
Alice Mannocci - Test per variabili qualitative
Quindi l’uso della curcuma sembra ridurre le infezioni gastrointestinali in modo significativo.
Se la condizione di applicabilità del test χ² non è soddisfatta è possibile utilizzare il test della
Esposti
Si No
Evento Si a b a+b
No c d c+d
a+c b+d N
La statistica è:
p di Fisher
a b !c d !a c!b d !
N!a! b! c!d!
Dove:
• p è la probabilità;
Si ricorda che 0! = 1.
Esempio
1. L’ipotesi nulla sarà: vi è una diversa proporzione tra maschi e femmine di aderenza
alla dieta.
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
11 di 19
Alice Mannocci - Test per variabili qualitative
Genere
M F
Dieta Si 1 10 10
No 10 3 14
11 13 24
Questi dati non sono idonei ad essere analizzati con il test del chi quadrato in quanto uan
delel condizioni di applicabilità non è soddisfatta: il valore atteso in una cella è inferiore a 5 e
Genere
M F
Dieta Si 4,6 5,4 10
No 6,4 7,6 14
11 13 24
10 !14 !11!13 !
p di Fisher
Calcoliamo quindi la statistica: 24!1!10!10!3! =0,00044
Quindi la dieta è stata seguita in modo significativamente diverso tra uomini e donne.
Inoltre dal calcolo delle due proporzioni si osserva che le donne siano quelle che hanno
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
12 di 19
Alice Mannocci - Test per variabili qualitative
Utilizzando i dataset contenuti nella cartella documenti del corso ripetiamo gli esercizi
proposti.
Prima di utilizzare il software apriamo il dataset relativo allo studio sulla curcuma e le
- codice dell’individuo;
Dopo aver chiuso il file Excel contenente il dataset si apre Epi Info /Classic.
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
13 di 19
Alice Mannocci - Test per variabili qualitative
Per eseguire il test per variabili qualitative utilizziamo il comando “Tables” nella cartella
“Statistics”.
“Outcome” infezione
“Exposure” curcuma
Ai fini del test è indifferente dove vengano caricate le variabili, l’importante è aver
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
14 di 19
Alice Mannocci - Test per variabili qualitative
Osserviamo una prima parte dove è riportata la tabella delle frequenze osservate.
Nella seconda parte “Single Table Analysis” abbiamo una sezione dedicata ai test statistici:
“STATISTICAL TESTS”.
Non essendoci da parte di Epi Info alcuna segnalazione sulle frequenze attese possiamo
utilizzare sulla base del fatto che la nostra tabella è di tipo 2x2 il p relativo al chi-quadrato con la
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
15 di 19
Alice Mannocci - Test per variabili qualitative
Prima di utilizzare il software apriamo il dataset relativo allo studio sul genere e l’aderenza
- codice dell’individuo;
Dopo aver chiuso il file Excel contenente il dataset si apre Epi Info /Classic.
- selezioniamo il “foglio1”.
Utilizzando il comando “Tables” nella cartella “Statistics” carichiamo all’interno della finestra
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
16 di 19
Alice Mannocci - Test per variabili qualitative
Ai fini del test è indifferente dove vengano caricate le variabili, l’importante è aver
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
17 di 19
Alice Mannocci - Test per variabili qualitative
Tale frase informa gli utenti che è raccomandato utilizzare il test Esatto di Fisher poiché la
Andremo a leggere la riga relativa al test di Fisher. Concluderemo che il p del test= 0,001349
che risulta essere inferiore al livello di significatività prefissato di 0,05. Si rifiuta l’ipotesi nulla e dunque
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
18 di 19
Alice Mannocci - Test per variabili qualitative
Bibliografia
(2015)
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e
per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
19 di 19