Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
I test di ipotesi
Esempi di ipotesi:
1
I test di ipotesi
LE IPOTESI:
Vengono formulate due ipotesi sul valore del parametro:
H0 : IPOTESI NULLA
È l’ipotesi di totale casualità
casualità dei risultati
H1 : IPOTESI ALTERNATIVA
È una possibile ipotesi alternativa a quella di casualità
casualità; non
sempre è possibile formularla compiutamente.
I test di ipotesi
Le ipotesi sul valore del parametro possono
essere:
semplici:
semplici: è specificato un solo valore (per
es. μ = μ0)
composte:
composte: sono specificati uno o più
più
intervalli di valori
2
I test di ipotesi
Osservazione
3
L’ipotesi nulla e l’ipotesi
alternativa - Esempio
Vogliamo verificare se un certo farmaco (il farmaco A) migliora
la capacità
capacità di concentrazione.
Se la statistica-
statistica-test e inferiore a una certa soglia stabilita,
non si rifiuta H0. Se la statistica test calcolata supera la soglia,
si rifiuta H0.
24 novembre 2011 Statistica sociale 8
4
Come funziona un test di
ipotesi
La regola di decisione consiste quindi nel
suddividere lo spazio campionario C in due
regioni, C0 regione di “accettazione”
accettazione”, C1
regione di rifiuto,
rifiuto, sulla base dei possibili valori
della statistica-
statistica-test.
IMPORTANTE:
IMPORTANTE:
Se non si rifiuta l’ipotesi nulla, questo non significa
che la teoria (espressa dall’
dall’ipotesi nulla) è provata,
ma solo che ha superato una prova.prova. In termini
popperiani,
popperiani, possiamo dire che la teoria da cui
l’ipotesi discende è stata corroborata.
corroborata.
5
Più in generale:
Errori di I e II tipo
In un test di ipotesi, si possono commettere
due tipi di errore:
H0 è vera H0 è falsa
6
Errori di I e II tipo
Errore di I tipo:
tipo: rifiuto un’
un’ipotesi quando essa è
vera
Errore di II tipo:
tipo: accetto un’
un’ipotesi quando essa è
falsa
La probabilità
probabilità di errore di I tipo,
tipo, , è detta
“livello di significatività”
significatività” e, come si può notare,
è affine al “grado di confidenza”
confidenza” che abbiamo visto
negli intervalli di confidenza.
Errori di I e II tipo
= Pr(rifiutare H0| H0 è vera)
Più
Più sarà
sarà piccolo, minore sarà
sarà la probabilità
probabilità di
rifiutare erroneamente l’l’ipotesi nulla.
Probabilità
Probabilità di errore di II tipo:
tipo:
= Pr(accettare H0| H0 è falsa)
7
Errori di I e II tipo
Se rifiutiamo l’ipotesi nulla H0 :
– H0 era falsa OK!
– H0 era vera errore di 1° tipo
Errori di I e II tipo:
tipo: li vediamo attraverso
una rappresentazione grafica
Nell’
Nell’esempio riportato in figura, vengono formulate due ipotesi, H0 e
H1, che danno luogo, nel caso si prenda = 0,05, a una probabilità
probabilità
di errore di II tipo = 0,089, e quindi a una potenza del test (1-
(1- )=
0,911= 91,1%
8
Esempio: test di ipotesi su una
media (test “z”) – Varianza nota
Formalmente:
H0 : m0 = μ (IPOTESI NULLA)
H1 : m0 > μ (IPOTESI ALTERNATIVA, test a una coda)
9
Esempio: test di ipotesi su una
media (test “z”) – Varianza nota
Osservazione
Il livello del 5 % di indica che vi sono 95
probabilità su 100 che il risultato ottenuto sul mio
campione non sia casuale.
Tuttavia, esistono sempre 5 probabilità su 100 che
tale risultato sia del tutto casuale.
10
Esempio: test di ipotesi su una media
(test “z”) – Varianza nota
Il “p-value”
NB:
NB: il valore esatto della probabilità
probabilità in
corrispondenza della statistica-
statistica-test calcolata sui dati
(in questo caso, 0,006),
0,006), ottenuto da una tavola
oppure attraverso un software statistico, è detto
p-value.
value.
NB:
NB: da 20 anni a questa parte, grazie allo sviluppo
dei software statistici, è praticamente sempre
possibile ottenere il p-value esatto del test, senza
dover necessariamente fare ricorso a una tavola.
11
Il p-value
Il “p-value”
value” è si basa sul principio che,
che, data la
distribuzione di probabilità
probabilità di interesse,
interesse, è possibile
calcolare l’esatta probabilità
probabilità di ottenere per solo
effetto del caso il risultato osservato nel campione
(partendo dall’
dall’ipotesi che H0 sia vera).
vera).
Il p-
p-value dipende dall’
dall’ampiezza del campione.
campione.
12
Esempio: test di ipotesi su una media
(test “t”) – Varianza incognita
13
Esempio: test di ipotesi su una media
(test “t”) – Varianza incognita
La statistica-
statistica-test è:
0
t n 1
s/ n
Dove:
s non è più
più la radice quadrata della varianza di popolazione,
ma una sua stima, cioè
cioè la d.s. calcolata empiricamente sul
campione; si noti che è importante tenere conto anche del
numero di gradi di libertà
libertà, che è dato da (n
(n-1)
n 1
24 novembre 2011 Statistica sociale 28
14
Esempio: test di ipotesi su una media
(test “t”) – Varianza incognita
In un campione di n=10 maschi è stata misurata una frequenza di
pulsazione di 68,7 battiti per minuto, con d.s. pari a 8,67;
Il valore “normale”
normale” è indicato in 72 bpm.bpm.
Si vuole saggiare l’l’ipotesi che il nostro campione differisca
significativamente (in senso negativo) dal valore “normale”
normale” di 72
bpm (test a una coda).
Calcoliamo la “t” empirica.
0
tn 1
s/ n
72 68,7 3,3
1,20
8,67 / 10 2,74
15
La tavola della “t di Student”
Student” – Unilaterale, a
destra
Per tutti i test di ipotesi che abbiamo visto finora, una condizione
condizione
ineludibile era che le variabili fossero QUANTITATIVE e, in
particolare, la condizione per potere applicare i test era che la scala
di misura dei dati da analizzare fosse – almeno – una scala ad
intervalli.
intervalli.
16
Un esempio
B 8 19 27
AB 6 5 11
0 9 70 79
17
Per prima cosa, confrontiamo le due
distribuzioni (ammalate e sane),
osservando le percentuali di colonna
Gruppo Donne % Donne % Totale %
sangui-
sangui- trombo-
trombo- sane
gno emboliti-
emboliti-
che
A 32 58,2 51 35,2 83 41,5
L’ipotesi di non
indipendenza
È facile osservare che il gruppo sanguigno A è molto più
più
frequente della media nel gruppo delle donne
tromboembolitiche, mentre il gruppo 0 è molto meno
frequente;
18
In generale, la funzione del test “chi quadrato”
quadrato” consiste nel valutare
se vi sia (o meno) una differenza statisticamente significativa
tra due distribuzioni, una empirica e una “teorica”
teorica”
Quest’
Quest’ultima distribuzione non è, pertanto, una distribuzione
reale, ma “obbedisce”
obbedisce” ad una qualche ipotesi che viene
formulata sui dati.
dati.
Uno dei “modelli”
modelli” teorici più
più utilizzati esprime semplicemente l’l’idea
che i due fenomeni siano tra loro indipendenti.
indipendenti.
24 novembre 2011 Statistica sociale 37
19
Calcolo delle frequenze
attese
Applicando una nota regola del calcolo delle
probabilità
probabilità (la regola del prodotto), le frequenze
attese (teoriche) nel caso di indipendenza tra i due
caratteri si possono calcolare con la seguente
formula:
F O i F O j
F A ij
n
24 novembre 2011 Statistica sociale 39
20
Calcolo delle frequenze
attese
21
Tabella delle frequenze attese:
i valori in rosso sono i valori “attesi”
attesi”
A 22,8 60,2 83
B 7,4 19,6 27
AB 3,0 8,0 11
0 21,7 57,3 79
Il test “chi-quadrato”
Il valore della statistica-
statistica-test “chi quadrato”
quadrato”, se si dispone di
una tabella di contingenza formata da p righe e k colonne, si
ottiene applicando la formula che segue :
2
p k
F O i F Ai
2
i1 F Ai
Dove :
FOi è la frequenza osservata (empirica) che si trova nella i-i-
esima casella della tabella ;
FAi è la frequenza attesa (teorica) che si trova nella i-
i-esima
casella.
24 novembre 2011 Statistica sociale 44
22
Il test “chi-quadrato”
Nel nostro esempio, il valore empirico della statistica-
statistica-test “chi
quadrato”
quadrato” è pari a 19,46.
19,46.
Come possiamo, ora, stabilire se il test si può considerare
statisticamente significativo oppure no ?
Per prima cosa, dovremo stabilire quanti gradi di libertàlibertà
vanno considerati.
Nel caso del test “chi quadrato”
quadrato”, la formula per il calcolo dei
gradi di libertà
libertà è la seguente:
Gl = (p 1)(k 1)
Il test “chi-quadrato”
Nel caso del nostro esempio, visto che la tabella di
contingenza ha 4 righe e 2 colonne, avremo tre gradi di
libertà
libertà.
23
Il test “chi-quadrato”
Giunti a questo punto, andiamo a consultare la tavola dei
valori teorici della distribuzione “chi quadrato”
quadrato”.
24
Il test “chi-quadrato”
Si tratta di un valore, seppure non di molto, inferiore a quello
empirico (19,46
(19,46).). Ricordiamo, poi, che abbiamo scelto un
valore molto basso di (=0,001, cioè
cioè uno per mille), che
praticamente ci mette in una “botte di ferro”
ferro”.
H0: = 0
25
Un esempio
L’articolo, del 1997, dal titolo:
Medical record validation of
maternally reported birth
characteristics and pregnancy-
pregnancy-
related events:
events: a report from the
Children's
Children's Cancer Group
è tratto dall’
dall’American Journal of
Epidemiology
26