Sei sulla pagina 1di 34

Test d’ipotesi

L’inferenza statistica
Abbiamo visto che gli intervalli di confidenza ci permettono di
trarre delle conclusioni sui parametri di una popolazione (ovvero
di fare inferenza statistica) a partire da un campione estratto
dalla popolazione

Un altro modo di fare inferenza statistica è il test d’ipotesi che ci


permette di misurare la forza dell’evidenza statistica con cui i dati
smentiscono una certa affermazione di interesse (ipotesi nulla)

1
Test d’ipotesi
Ipotesi statistica
Una ipotesi statistica è una affermazione circa uno o più parametri di una
popolazione o in generale circa la distribuzione di probabilità della variabile
casuale 𝑋 che descrive la popolazione
Per saggiare una ipotesi statistica è necessario formulare un’ipotesi nulla
(che il ricercatore vorrebbe confutare) e un’ipotesi alternativa (quella che il
ricercatore vorrebbe dimostrare)
Nell’eseguire il test d’ipotesi occorre definire
ipotesi nulla H0: l’ipotesi che desideriamo confutare
vs (in contrapposizione)
ipotesi alternativa Ha
2
Test d’ipotesi
Esempio di domanda
Fra i 100 pazienti trattati con un nuovo farmaco per una certa
malattia, si osserva un valore medio dei globuli rossi pari a 3.4 (in
unità 1000/ml) con deviazione standard 4.5. Il valore medio di
riferimento per questo tipo di soggetti è pari a 4.0.
Mi chiedo: è corretto concludere che il trattamento ha avuto un
effetto sui globuli rossi?

3
Test d’ipotesi
La procedura del test d’ipotesi
Un test d’ipotesi è una procedura che consente di prendere
una decisione circa una particolare ipotesi (detta «nulla») a
partire dalle informazioni contenute in un campione casuale
estratto dalla popolazione in esame

1) Formulo l’ipotesi che si vuole sottoporre a verifica e un’ipotesi alternativa


2) Seleziono un campione casuale
3) Calcolo il valore di una statistica del campione utile alla verifica dell’ipotesi
4) Uso il valore calcolato per prendere una decisione sulla validità dell’ipotesi

4
Test d’ipotesi
Sistema di ipotesi
Un test d’ipotesi è una procedura che consente di prendere
una decisione circa una particolare ipotesi (detta «nulla») a
partire dalle informazioni contenute in un campione casuale
estratto dalla popolazione in esame
Se l’informazione del Se l’informazione del
campione è consistente campione NON è
con H0 consistente con H0

H0 non è rigettabile H0 è rigettabile


5
Test d’ipotesi
Esempio: sistema di ipotesi
Fra i 100 pazienti trattati con un nuovo farmaco per una certa malattia, si osserva un valore
medio dei globuli rossi pari a 3.4 (in unità 1000/ml), deviazione standard=4.5. Il valore
medio di riferimento per questo tipo di soggetti è pari a 4.0.

1) Formulo l’ipotesi nulla e l’ipotesi alternativa


𝐻0: 𝜇 = 𝜇0 = 4.0
vs
𝐻𝑎: 𝜇 ≠ 𝜇0

6
Test d’ipotesi
Esempio: campione
Fra i 100 pazienti trattati con un nuovo farmaco per una certa malattia, si osserva un valore
medio dei globuli rossi pari a 3.4 (in unità 1000/ml), deviazione standard=4.5. Il valore
medio di riferimento per questo tipo di soggetti è pari a 4.0.

2) Selezione un campione causale


100 pazienti

7
Test d’ipotesi
Esempio: statistica test
Fra i 100 pazienti trattati con un nuovo farmaco per una certa malattia, si osserva un valore
medio dei globuli rossi pari a 3.4 (in unità 1000/ml), deviazione standard=4.5. Il valore
medio di riferimento per questo tipo di soggetti è pari a 4.0.

3) Calcolo il valore di una statistica del campione utile alla verifica dell’ipotesi
Il valore calcolato non mi permetterà di rifiutare o non rifiutare l’ipotesi nulla
con CERTEZZA ma il risultato del test sarà sempre accompagnato da una
valutazione della possibilità di commettere un ERRORE rigettando o non
rigettando l’ipotesi nulla

8
Test d’ipotesi
Esempio: statistica test
Fra i 100 pazienti trattati con un nuovo farmaco per una certa malattia, si osserva un valore
medio dei globuli rossi pari a 3.4 (in unità 1000/ml), deviazione standard=4.5. Il valore
medio di riferimento per questo tipo di soggetti è pari a 4.0.

3) Calcolo il valore di una statistica del campione utile alla verifica dell’ipotesi
media campionaria 𝑥ҧ = 3.4

9
Test d’ipotesi
Esempio: decisione
Fra i 100 pazienti trattati con un nuovo farmaco per una certa malattia, si osserva un valore
medio dei globuli rossi pari a 3.4 (in unità 1000/ml), deviazione standard=4.5. Il valore
medio di riferimento per questo tipo di soggetti è pari a 4.0.

4) Uso il valore calcolato per prendere una decisione sulla validità dell’ipotesi
Mi chiedo se il valore trovato nel campione, pari a 3.4, sia
sufficientemente vicino al valore della popolazione, pari a 4.0
𝒙𝒐𝒃𝒔 = 𝟑. 𝟒 𝜇0 = 4.0

? 10
Test d’ipotesi
Regione di rifiuto e di non-rifiuto
Solitamente si definiscono due valori, x1 e x2, tali che
1) non rifiuto l’ipotesi nulla H0 se il valore della statistica calcolato sul
campione cade nell’intervallo [x1; x2], detto regione di non-rifiuto
2) rifiuto l’ipotesi nulla H0 se il valore della statistica calcolato sul
campione non cade nella regione di non rifiuto, ovvero se cade
nella regione di rifiuto (−∞, 𝑥1 ) ∪ (𝑥2 , +∞), detta regione di rifiuto

x1 x2

11
Test d’ipotesi
Errori
La regione di rifiuto è determinata prefissando la
probabilità di uno dei possibili errori che posso
commettere, il cosiddetto errore di I tipo.

12
Test d’ipotesi
Errori del I tipo e del II tipo
Errore del I tipo: rifiutare l’ipotesi nulla quando questa è
vera
Errore del II tipo: non rifiutare l’ipotesi nulla quando
questa è falsa
Situazione reale
Decisione H0 è vera H0 è falsa
statistica
Rifiuto H0 Errore del I tipo Decisione corretta
Non rifiuto H0 Decisione corretta Errore del II tipo 13
Test d’ipotesi
Errore del I tipo
Errore del I tipo: rifiutare l’ipotesi nulla quando questa è
vera
Situazione reale
Decisione H0 è vera H0 è falsa
statistica
Rifiuto H0 Errore del I tipo Decisione corretta
Non rifiuto H0 Decisione corretta Errore del II tipo

𝛼 = 𝑃(𝑟𝑖𝑓𝑖𝑢𝑡𝑜 𝐻0 | 𝐻0 è 𝑣𝑒𝑟𝑎) si chiama livello di significatività


1 − 𝛼 = 𝑃(𝑛𝑜𝑛 𝑟𝑖𝑓𝑖𝑢𝑡𝑜 𝐻0|𝐻0 è 𝑣𝑒𝑟𝑎), rappresenta la probabilità di prendere una decisione
corretta quando è vera l’ipotesi nulla
14
Test d’ipotesi
Errore del II tipo
Errore del II tipo: non rifiutare l’ipotesi nulla quando
questa è falsa
Situazione reale
Decisione H0 è vera H0 è falsa
statistica
Rifiuto H0 Errore del I tipo Decisione corretta
Non rifiuto H0 Decisione corretta Errore del II tipo
𝛽 = 𝑃(𝑛𝑜𝑛 𝑟𝑖𝑓𝑖𝑢𝑡𝑜 𝐻0 | 𝐻0 è 𝑓𝑎𝑙𝑠𝑎)
1 − 𝛽 = 𝑃(𝑟𝑖𝑓𝑖𝑢𝑡𝑜 𝐻0 | 𝐻0 è 𝑓𝑎𝑙𝑠𝑎), detta potenza, rappresenta la probabilità di prendere
una decisione corretta quando è falsa l’ipotesi nulla
15
Test d’ipotesi
Errori
Per convenzione si determina la regione di rifiuto (detta anche
regione critica) fissando il livello di significatività ad un certo
valore (solitamente 0.05, raramente 0.01 o altri valori)

16
Test d’ipotesi
Determinare la regione di non-rifiuto
1 − 𝛼 = 𝑃(𝑛𝑜𝑛 𝑟𝑖𝑓𝑖𝑢𝑡𝑜 𝐻0|𝐻0 è 𝑣𝑒𝑟𝑎),

Fissato 𝛼, vogliamo trovare i due valori critici,


𝑧1 e 𝑧2 tali che 1 − 𝛼 = 𝑃(𝑧1 < 𝑍 < 𝑧2 ) oppure
𝑡1 e 𝑡2 tali che 1 − 𝛼 = 𝑃(𝑡1 < 𝑡𝑛−1 < 𝑡2 )

p.e. per z e α =5%


i valori sono ±1.96
Regione Regione Regione 17
di rifiuto di non- rifiuto di rifiuto
Test d’ipotesi
Esempio: calcolo della regione di non-rifiuto
Fra i 100 pazienti trattati con un nuovo farmaco per una certa malattia, si osserva un valore
medio dei globuli rossi pari a 3.4 (in unità 1000/ml), deviazione standard=4.5. Il valore
medio di riferimento per questo tipo di soggetti è pari a 4.0.

Fissato 𝛼, vogliamo trovare 𝑥1 e 𝑥2 tali che 1 − 𝛼 = 𝑃 𝑥1 < 𝑋 < 𝑥2


𝑥 −4 𝑥 −4
Standardizziamo 1 − 𝛼 = 𝑃 𝑥1 < 𝑋 < 𝑥2 = P 4.5/1 100 < 𝑍 < 4.5/2 100
Se 𝛼 =5%, la precedente affermazione è vera
𝑥2 −4 4.5
quando =1.96→ 𝑥2 = 1.96 ∙ + 4=4.9
4.5/ 100 100
𝑥1 −4 4.5
=-1.96→ 𝑥1 = −1.96 ∙ + 4=3.1
4.5/ 100 100

ҧ
𝑥−4
Quindi la regione di non rifiuto è (3.1,4.9) ovvero NON RIFIUTO l’ipotesi nulla se < 1.96
4.5/ 100
18
Test d’ipotesi
Esempio: decisione del test
Fra i 100 pazienti trattati con un nuovo farmaco per una certa malattia, si osserva un valore
medio dei globuli rossi pari a 3.4 (in unità 1000/ml), deviazione standard=4.5. Il valore
medio di riferimento per questo tipo di soggetti è pari a 4.0.
ҧ
𝑥−4
NON RIFIUTO l’ipotesi nulla se < 1.96
4.5/ 100

La regione di non rifiuto è (3.1,4.9)

Siccome ho ottenuto un valore


medio dei globuli rossi uguale
a 3.4 ∈ [3.1; 4.9], allora NON RIFIUTO H0
3.1 4 3.9
e non posso escludere che la media della 3.1 4 4.9
popolazione sia uguale a 4.0 Regione Regione Regione
di rifiuto di non- rifiuto di rifiuto
19
Test d’ipotesi
Esempio: decisione del test
Fra i 100 pazienti trattati con un nuovo farmaco per una certa malattia, si osserva un valore
medio dei globuli rossi pari a 3.4 (in unità 1000/ml), deviazione standard=4.5. Il valore
medio di riferimento per questo tipo di soggetti è pari a 4.0.
ҧ
𝑥−4
NON RIFIUTO l’ipotesi nulla se 4.5/ 100
< 1.96

Il non rifiutare H0 implica che:


▪ se H0 è falsa commetto un errore del II tipo
▪ se H0 è vera non commetto errori

3.1 4 4.9
Regione Regione Regione
di rifiuto di non- rifiuto di rifiuto 20
Test d’ipotesi
Esempio: decisione del test
Fra i 100 pazienti trattati con un nuovo farmaco per una certa malattia, si osserva un valore
medio dei globuli rossi pari a 3.4 (in unità 1000/ml), deviazione standard=4.5. Il valore
medio di riferimento per questo tipo di soggetti è pari a 4.0.
ҧ
𝑥−4
RIFIUTO l’ipotesi nulla se 4.5/ 100
> 1.96
Se ottenevo un valore che NON
apparteneva a (3.1,4.9) rifiutavo H0 e
concludevo che la media NON è 4.0
Se H0 è falsa→ Nel rifiutare H0 non commetto
errore
Se H0 è vera→ Nel rifiutare H0 commetto un
errore solo nel 5% dei casi, ossia 5 volte su 100 3.1 4 4.9
tale conclusione è errata Regione Regione Regione
di rifiuto di non-rifiuto di rifiuto 21
Test d’ipotesi
Riassumendo
Per saggiare un’ipotesi in condizioni di incertezza si procede come segue:
Passo 1) si formula una ipotesi nulla ed una ipotesi alternativa; cioè si
traduce l’ipotesi scientifica in una ipotesi circa il parametro o la forma della
distribuzione di probabilità di una variabile casuale
Passo 2) si estrae un campione dalla popolazione
Passo 3) si calcola, sulla base delle osservazioni, una statistica test, per
la quale è stata ricavata una regione di rifiuto (o ‘critica’) fissando a 0.05
il livello di significatività (o probabilità di un errore di I tipo)
Passo 4) si confronta la statistica test con i valori che delimitano la zona
critica (valori critici), quindi si rifiuta l’ipotesi nulla a seconda dell’esito del
confronto.
22
Test d’ipotesi
Test direzionali e non direzionali
Le ipotesi alternative che è possibile formulare sono di due tipi:
non direzionali: stabiliscono che il parametro è diverso, a meno della
variabilità casuale, dal valore secondo l’ipotesi nulla. La regione di rifiuto
corrisponde ad un’area di 𝛼, complessivamente.
In questo caso si parla di test a due code, bilaterale o non direzionale.
direzionali: l’ipotesi alternativa stabilisce che il parametro è superiore (o
inferiore) al valore secondo l’ipotesi nulla. La regione di rifiuto corrisponde
ad 𝛼 unilateralmente. Si parla di test ad una coda, unilaterale o
direzionale.
Ci limiteremo ai test non direzionali, che sono quelli più largamente utilizzati.

23
Test d’ipotesi
Test d’ipotesi per una media (con varianza 𝜎2 nota)
Consideriamo un campione casuale 𝑥1 , 𝑥2 , … , 𝑥𝑛 tratto da una popolazione con
media 𝜇 e varianza 𝜎 2 (supposta nota)
[Nota: se la popolazione segue una distribuzione normale, la dimensione del
campione n non è importante; altrimenti n deve essere grande]
consideriamo il seguente test 𝐻0 : 𝜇 = 𝜇0 𝑣𝑠 𝐻𝑎 : 𝜇 ≠ 𝜇0
Fissiamo la probabilità dell’errore di I tipo α
Calcoliamo la media campionaria 𝑥ҧ
Regola decisionale:
ҧ 0
𝑥−𝜇
Rifiutiamo 𝐻0 se 𝑧𝑜𝑏𝑠 = 𝜎 > 𝑧1−𝛼 ,
𝑛 2
𝛼
dove 𝑧1−𝛼 è tale che 𝑃(𝑍 < 𝑧1−𝛼 ) = 1 −
2 2 2

24
Test d’ipotesi
Test d’ipotesi per una media (con varianza 𝜎2 ignota)
Consideriamo un campione casuale 𝑥1 , 𝑥2 , … , 𝑥𝑛 tratto da una popolazione
con media 𝜇 e varianza 𝜎 2 (ignota)
consideriamo il seguente test 𝐻0 : 𝜇 = 𝜇0 𝑣𝑠 𝐻𝑎 : 𝜇 ≠ 𝜇0
Fissiamo la probabilità dell’errore di I tipo α
Calcoliamo la media e la deviazione standard campionaria, 𝑥ҧ ed s
Regola decisionale:
ҧ 0
𝑥−𝜇
Rifiutiamo 𝐻0 se 𝑡𝑜𝑏𝑠 = 𝑠 > 𝑡1−𝛼,𝑛−1
𝑛 2
𝛼
dove 𝑡1−𝛼,𝑛−1 è tale che 𝑃 𝑇 < 𝑡1−𝛼,𝑛−1 = 1 −
2 2 2

25
Test d’ipotesi
Test d’ipotesi per una media (con varianza 𝜎2 ignota): esempio
Si estrae da una popolazione affetta da una certa patologia un campione casuale di
25 soggetti, su cui si trova che il valore medio di colesterolemia è di 270 mg/dl e che
la deviazione standard è s = 79. Nella popolazione dei soggetti sani il livello di
colesterolemia ha distribuzione normale con media 210 mg/dl. Verificare se ci sia
evidenza statistica di una differenza della colesterolemia media nella popolazione
dei sani e dei malati a un livello di significatività dell’1%.
Formuliamo ipotesi nulla e ipotesi alternativa: 𝐻0 : 𝜇 = 210 𝑣𝑠 𝐻𝑎 : 𝜇 ≠ 210
𝑥ҧ𝑜𝑏𝑠 −𝜇0 270−210
Calcoliamo la statistica test: 𝑡𝑜𝑏𝑠 = 𝑠 = 79 = 3.79
𝑛 25

Rifiutiamo l’ipotesi nulla? Rifiutiamo 𝐻0 se: 𝑡𝑜𝑏𝑠 > 𝑡1−α,𝑛−1 = 2.797→ RIFIUTIAMO
2
H0 26
Test d’ipotesi
Test d’ipotesi per una proporzione
Consideriamo un campione casuale tratto da una popolazione con
proporzione di successi 𝜋0 . Assumiamo che 𝑛𝜋0 > 5 e 𝑛 1 − 𝜋0 > 5.
Calcoliamo la proporzione di successi osservati 𝑝.
Consideriamo il test 𝐻0 : 𝜋 = 𝜋0 𝑣𝑠 𝐻𝑎 : 𝜋 ≠ 𝜋0
Regola decisionale:
𝑝−𝜋0
Rifiuto 𝐻0 se: 𝑧𝑜𝑏𝑠 = > 𝑧1−𝛼
𝜋𝑜 1−𝜋0 2
𝑛
𝛼
dove 𝑧1−𝛼 è tale che P(Z < 𝑧1−𝛼 ) = 1 −
2 2 2

27
Test d’ipotesi
Test d’ipotesi per una proporzione: esempio
Una ditta farmaceutica asserisce che un suo farmaco è efficace nel 90% dei
casi. In un campione di 50 persone che lo hanno usato, il farmaco si è rivelato
efficace in 40 casi. Stabilire se l’affermazione della ditta farmaceutica è
legittima con un livello di significatività uguale a 0.05
Formuliamo ipotesi nulla e ipotesi alternativa: 𝐻0 : 𝜋 = 0.90 𝑣𝑠 𝐻𝑎 : 𝜋 ≠ 0.90
40
𝑝−𝜋0 50
−0.90
Calcoliamo la statistica test: 𝑧𝑜𝑏𝑠 = = = −2.36
𝜋𝑜 1−𝜋𝑜 0.90 1−0.90
𝑛 50

Rifiutiamo l’ipotesi nulla? 𝑧𝑜𝑏𝑠 = −2.36 < − 1.96 = −𝑧1−𝛼 → RIFIUTO H0


2

28
Test d’ipotesi
Interpretazione test statistici: il p-value
Il p-value rappresenta la probabilità di ottenere un risultato pari o più
estremo di quello osservato, supposta vera l'ipotesi nulla
L'ipotesi nulla viene rifiutata se il test fornisce un valore p-value inferiore al
livello di significatività del test.
La regola decisionale è:
Rifiuto 𝐻0 se p-value < α

29
Test d’ipotesi
Il calcolo del p-value
Dato, ad esempio, un campione casuale 𝑥1 , 𝑥2 , … , 𝑥𝑛 tratto da una
popolazione con media 𝜇 e varianza 𝜎 2 (supposta nota)
Consideriamo il seguente test 𝐻0 : 𝜇 = 𝜇0 𝑣𝑠 𝐻𝑎 : 𝜇 ≠ 𝜇0
Calcolo la statistica test
𝑥ҧ − 𝜇
𝑧𝑜𝑏𝑠 =
𝜎/ 𝑛
p-value = 2 ∙ 𝑃 𝑍 > |𝑧|

e rifiuto 𝐻0 se p-value < 𝛼

30
Test d’ipotesi
Test d’ipotesi per una proporzione: esempio
Una ditta farmaceutica asserisce che un suo farmaco è efficace nel 90% dei
casi. In un campione di 50 persone che lo hanno usato, il farmaco si è rivelato
efficace in 40 casi. Stabilire se l’affermazione della ditta farmaceutica è
legittima con un livello di significatività uguale a 0.05
Formuliamo ipotesi nulla e ipotesi alternativa: 𝐻0 : 𝜋 = 0.90 𝑣𝑠 𝐻𝑎 : 𝜋 ≠ 0.90
40
𝑝−𝜋0 50
−0.90
Calcoliamo la statistica test: 𝑧𝑜𝑏𝑠 = = = −2.36
𝜋𝑜 1−𝜋𝑜 0.90 1−0.90
𝑛 50

Rifiutiamo l’ipotesi nulla? 𝑧𝑜𝑏𝑠 = −2.36 < − 1.96 = −𝑧1−𝛼 → RIFIUTO H0


2

Equivalentemente: p-value = 2 ∙ 𝑃 𝑍 > 𝑧 = 1.8% < 5% = 𝛼 → RIFIUTO H0


31
Formulario
(𝛼 livello di significatività)
Supponiamo di estrarre un campione di n soggetti da una popolazione (normale se n<30, qualunque se n≥30)
con media 𝜇 sconosciuta.
Supponiamo che 𝑥ҧ sia la media dei valori osservati nel campione.
Se la varianza 𝜎 2 nella popolazione è nota
𝜎
▪ Un intervallo di confidenza al 1 − 𝛼 100% per la media 𝜇 è 𝑥ҧ ±𝑧1−𝛼 𝑛
2
ҧ 0
𝑥−𝜇
▪ Nel test d’ipotesi 𝐻0 : 𝜇 = 𝜇0 𝑣𝑠 𝐻𝑎 : 𝜇 ≠ 𝜇0 , rifiuto 𝐻0 se 𝜎 > 𝑧1−𝛼
𝑛 2

32
Formulario
(𝛼 livello di significatività)
Supponiamo di estrarre un campione di n soggetti da una popolazione (normale se n<30, qualunque se n≥30)
con media 𝜇 sconosciuta.
Supponiamo che 𝑥ҧ sia la media dei valori osservati nel campione e 𝑠 sia la deviazione standard dei valori
osservati.
Se la varianza 𝜎 2 nella popolazione è non nota
𝑠
▪ Un intervallo di confidenza al 1 − 𝛼 100% per la media 𝜇 è 𝑥ҧ ±𝑡1−𝛼,𝑛−1 𝑛
2
ҧ 0
𝑥−𝜇
▪ Nel test d’ipotesi 𝐻0 : 𝜇 = 𝜇0 𝑣𝑠 𝐻𝑎 : 𝜇 ≠ 𝜇0 , rifiuto 𝐻0 se 𝑠 > 𝑡1−𝛼,𝑛−1
𝑛 2

33
Formulario
(𝛼 livello di significatività)
Supponiamo di estrarre un campione di n soggetti da una popolazione in cui la proporzione di successi sia 𝜋.
Supponiamo che 𝑝 sia la proporzione di successi nel campione.
Se il campione è sufficientemente grande [cioè se 𝑛𝑝 > 5 e 𝑛 1 − 𝑝 > 5]
𝑝 (1−𝑝)
▪ Un intervallo di confidenza al 1 − 𝛼 100% per la proporzione 𝜋 è: 𝑝 ± 𝑧1−𝛼
2 𝑛
𝑝−𝜋0
▪ Nel test d’ipotesi 𝐻0 : 𝜋 = 𝜋0 𝑣𝑠 𝐻𝑎 : 𝜋 ≠ 𝜋0 , rifiuto 𝐻0 se > 𝑧1−𝛼
𝜋𝑜 1−𝜋𝑜 2
𝑛

34

Potrebbero piacerti anche