Esplora E-book
Categorie
Esplora Audiolibri
Categorie
Esplora Riviste
Categorie
Esplora Documenti
Categorie
L’inferenza statistica
Abbiamo visto che gli intervalli di confidenza ci permettono di
trarre delle conclusioni sui parametri di una popolazione (ovvero
di fare inferenza statistica) a partire da un campione estratto
dalla popolazione
1
Test d’ipotesi
Ipotesi statistica
Una ipotesi statistica è una affermazione circa uno o più parametri di una
popolazione o in generale circa la distribuzione di probabilità della variabile
casuale 𝑋 che descrive la popolazione
Per saggiare una ipotesi statistica è necessario formulare un’ipotesi nulla
(che il ricercatore vorrebbe confutare) e un’ipotesi alternativa (quella che il
ricercatore vorrebbe dimostrare)
Nell’eseguire il test d’ipotesi occorre definire
ipotesi nulla H0: l’ipotesi che desideriamo confutare
vs (in contrapposizione)
ipotesi alternativa Ha
2
Test d’ipotesi
Esempio di domanda
Fra i 100 pazienti trattati con un nuovo farmaco per una certa
malattia, si osserva un valore medio dei globuli rossi pari a 3.4 (in
unità 1000/ml) con deviazione standard 4.5. Il valore medio di
riferimento per questo tipo di soggetti è pari a 4.0.
Mi chiedo: è corretto concludere che il trattamento ha avuto un
effetto sui globuli rossi?
3
Test d’ipotesi
La procedura del test d’ipotesi
Un test d’ipotesi è una procedura che consente di prendere
una decisione circa una particolare ipotesi (detta «nulla») a
partire dalle informazioni contenute in un campione casuale
estratto dalla popolazione in esame
4
Test d’ipotesi
Sistema di ipotesi
Un test d’ipotesi è una procedura che consente di prendere
una decisione circa una particolare ipotesi (detta «nulla») a
partire dalle informazioni contenute in un campione casuale
estratto dalla popolazione in esame
Se l’informazione del Se l’informazione del
campione è consistente campione NON è
con H0 consistente con H0
6
Test d’ipotesi
Esempio: campione
Fra i 100 pazienti trattati con un nuovo farmaco per una certa malattia, si osserva un valore
medio dei globuli rossi pari a 3.4 (in unità 1000/ml), deviazione standard=4.5. Il valore
medio di riferimento per questo tipo di soggetti è pari a 4.0.
7
Test d’ipotesi
Esempio: statistica test
Fra i 100 pazienti trattati con un nuovo farmaco per una certa malattia, si osserva un valore
medio dei globuli rossi pari a 3.4 (in unità 1000/ml), deviazione standard=4.5. Il valore
medio di riferimento per questo tipo di soggetti è pari a 4.0.
3) Calcolo il valore di una statistica del campione utile alla verifica dell’ipotesi
Il valore calcolato non mi permetterà di rifiutare o non rifiutare l’ipotesi nulla
con CERTEZZA ma il risultato del test sarà sempre accompagnato da una
valutazione della possibilità di commettere un ERRORE rigettando o non
rigettando l’ipotesi nulla
8
Test d’ipotesi
Esempio: statistica test
Fra i 100 pazienti trattati con un nuovo farmaco per una certa malattia, si osserva un valore
medio dei globuli rossi pari a 3.4 (in unità 1000/ml), deviazione standard=4.5. Il valore
medio di riferimento per questo tipo di soggetti è pari a 4.0.
3) Calcolo il valore di una statistica del campione utile alla verifica dell’ipotesi
media campionaria 𝑥ҧ = 3.4
9
Test d’ipotesi
Esempio: decisione
Fra i 100 pazienti trattati con un nuovo farmaco per una certa malattia, si osserva un valore
medio dei globuli rossi pari a 3.4 (in unità 1000/ml), deviazione standard=4.5. Il valore
medio di riferimento per questo tipo di soggetti è pari a 4.0.
4) Uso il valore calcolato per prendere una decisione sulla validità dell’ipotesi
Mi chiedo se il valore trovato nel campione, pari a 3.4, sia
sufficientemente vicino al valore della popolazione, pari a 4.0
𝒙𝒐𝒃𝒔 = 𝟑. 𝟒 𝜇0 = 4.0
? 10
Test d’ipotesi
Regione di rifiuto e di non-rifiuto
Solitamente si definiscono due valori, x1 e x2, tali che
1) non rifiuto l’ipotesi nulla H0 se il valore della statistica calcolato sul
campione cade nell’intervallo [x1; x2], detto regione di non-rifiuto
2) rifiuto l’ipotesi nulla H0 se il valore della statistica calcolato sul
campione non cade nella regione di non rifiuto, ovvero se cade
nella regione di rifiuto (−∞, 𝑥1 ) ∪ (𝑥2 , +∞), detta regione di rifiuto
x1 x2
11
Test d’ipotesi
Errori
La regione di rifiuto è determinata prefissando la
probabilità di uno dei possibili errori che posso
commettere, il cosiddetto errore di I tipo.
12
Test d’ipotesi
Errori del I tipo e del II tipo
Errore del I tipo: rifiutare l’ipotesi nulla quando questa è
vera
Errore del II tipo: non rifiutare l’ipotesi nulla quando
questa è falsa
Situazione reale
Decisione H0 è vera H0 è falsa
statistica
Rifiuto H0 Errore del I tipo Decisione corretta
Non rifiuto H0 Decisione corretta Errore del II tipo 13
Test d’ipotesi
Errore del I tipo
Errore del I tipo: rifiutare l’ipotesi nulla quando questa è
vera
Situazione reale
Decisione H0 è vera H0 è falsa
statistica
Rifiuto H0 Errore del I tipo Decisione corretta
Non rifiuto H0 Decisione corretta Errore del II tipo
16
Test d’ipotesi
Determinare la regione di non-rifiuto
1 − 𝛼 = 𝑃(𝑛𝑜𝑛 𝑟𝑖𝑓𝑖𝑢𝑡𝑜 𝐻0|𝐻0 è 𝑣𝑒𝑟𝑎),
ҧ
𝑥−4
Quindi la regione di non rifiuto è (3.1,4.9) ovvero NON RIFIUTO l’ipotesi nulla se < 1.96
4.5/ 100
18
Test d’ipotesi
Esempio: decisione del test
Fra i 100 pazienti trattati con un nuovo farmaco per una certa malattia, si osserva un valore
medio dei globuli rossi pari a 3.4 (in unità 1000/ml), deviazione standard=4.5. Il valore
medio di riferimento per questo tipo di soggetti è pari a 4.0.
ҧ
𝑥−4
NON RIFIUTO l’ipotesi nulla se < 1.96
4.5/ 100
3.1 4 4.9
Regione Regione Regione
di rifiuto di non- rifiuto di rifiuto 20
Test d’ipotesi
Esempio: decisione del test
Fra i 100 pazienti trattati con un nuovo farmaco per una certa malattia, si osserva un valore
medio dei globuli rossi pari a 3.4 (in unità 1000/ml), deviazione standard=4.5. Il valore
medio di riferimento per questo tipo di soggetti è pari a 4.0.
ҧ
𝑥−4
RIFIUTO l’ipotesi nulla se 4.5/ 100
> 1.96
Se ottenevo un valore che NON
apparteneva a (3.1,4.9) rifiutavo H0 e
concludevo che la media NON è 4.0
Se H0 è falsa→ Nel rifiutare H0 non commetto
errore
Se H0 è vera→ Nel rifiutare H0 commetto un
errore solo nel 5% dei casi, ossia 5 volte su 100 3.1 4 4.9
tale conclusione è errata Regione Regione Regione
di rifiuto di non-rifiuto di rifiuto 21
Test d’ipotesi
Riassumendo
Per saggiare un’ipotesi in condizioni di incertezza si procede come segue:
Passo 1) si formula una ipotesi nulla ed una ipotesi alternativa; cioè si
traduce l’ipotesi scientifica in una ipotesi circa il parametro o la forma della
distribuzione di probabilità di una variabile casuale
Passo 2) si estrae un campione dalla popolazione
Passo 3) si calcola, sulla base delle osservazioni, una statistica test, per
la quale è stata ricavata una regione di rifiuto (o ‘critica’) fissando a 0.05
il livello di significatività (o probabilità di un errore di I tipo)
Passo 4) si confronta la statistica test con i valori che delimitano la zona
critica (valori critici), quindi si rifiuta l’ipotesi nulla a seconda dell’esito del
confronto.
22
Test d’ipotesi
Test direzionali e non direzionali
Le ipotesi alternative che è possibile formulare sono di due tipi:
non direzionali: stabiliscono che il parametro è diverso, a meno della
variabilità casuale, dal valore secondo l’ipotesi nulla. La regione di rifiuto
corrisponde ad un’area di 𝛼, complessivamente.
In questo caso si parla di test a due code, bilaterale o non direzionale.
direzionali: l’ipotesi alternativa stabilisce che il parametro è superiore (o
inferiore) al valore secondo l’ipotesi nulla. La regione di rifiuto corrisponde
ad 𝛼 unilateralmente. Si parla di test ad una coda, unilaterale o
direzionale.
Ci limiteremo ai test non direzionali, che sono quelli più largamente utilizzati.
23
Test d’ipotesi
Test d’ipotesi per una media (con varianza 𝜎2 nota)
Consideriamo un campione casuale 𝑥1 , 𝑥2 , … , 𝑥𝑛 tratto da una popolazione con
media 𝜇 e varianza 𝜎 2 (supposta nota)
[Nota: se la popolazione segue una distribuzione normale, la dimensione del
campione n non è importante; altrimenti n deve essere grande]
consideriamo il seguente test 𝐻0 : 𝜇 = 𝜇0 𝑣𝑠 𝐻𝑎 : 𝜇 ≠ 𝜇0
Fissiamo la probabilità dell’errore di I tipo α
Calcoliamo la media campionaria 𝑥ҧ
Regola decisionale:
ҧ 0
𝑥−𝜇
Rifiutiamo 𝐻0 se 𝑧𝑜𝑏𝑠 = 𝜎 > 𝑧1−𝛼 ,
𝑛 2
𝛼
dove 𝑧1−𝛼 è tale che 𝑃(𝑍 < 𝑧1−𝛼 ) = 1 −
2 2 2
24
Test d’ipotesi
Test d’ipotesi per una media (con varianza 𝜎2 ignota)
Consideriamo un campione casuale 𝑥1 , 𝑥2 , … , 𝑥𝑛 tratto da una popolazione
con media 𝜇 e varianza 𝜎 2 (ignota)
consideriamo il seguente test 𝐻0 : 𝜇 = 𝜇0 𝑣𝑠 𝐻𝑎 : 𝜇 ≠ 𝜇0
Fissiamo la probabilità dell’errore di I tipo α
Calcoliamo la media e la deviazione standard campionaria, 𝑥ҧ ed s
Regola decisionale:
ҧ 0
𝑥−𝜇
Rifiutiamo 𝐻0 se 𝑡𝑜𝑏𝑠 = 𝑠 > 𝑡1−𝛼,𝑛−1
𝑛 2
𝛼
dove 𝑡1−𝛼,𝑛−1 è tale che 𝑃 𝑇 < 𝑡1−𝛼,𝑛−1 = 1 −
2 2 2
25
Test d’ipotesi
Test d’ipotesi per una media (con varianza 𝜎2 ignota): esempio
Si estrae da una popolazione affetta da una certa patologia un campione casuale di
25 soggetti, su cui si trova che il valore medio di colesterolemia è di 270 mg/dl e che
la deviazione standard è s = 79. Nella popolazione dei soggetti sani il livello di
colesterolemia ha distribuzione normale con media 210 mg/dl. Verificare se ci sia
evidenza statistica di una differenza della colesterolemia media nella popolazione
dei sani e dei malati a un livello di significatività dell’1%.
Formuliamo ipotesi nulla e ipotesi alternativa: 𝐻0 : 𝜇 = 210 𝑣𝑠 𝐻𝑎 : 𝜇 ≠ 210
𝑥ҧ𝑜𝑏𝑠 −𝜇0 270−210
Calcoliamo la statistica test: 𝑡𝑜𝑏𝑠 = 𝑠 = 79 = 3.79
𝑛 25
Rifiutiamo l’ipotesi nulla? Rifiutiamo 𝐻0 se: 𝑡𝑜𝑏𝑠 > 𝑡1−α,𝑛−1 = 2.797→ RIFIUTIAMO
2
H0 26
Test d’ipotesi
Test d’ipotesi per una proporzione
Consideriamo un campione casuale tratto da una popolazione con
proporzione di successi 𝜋0 . Assumiamo che 𝑛𝜋0 > 5 e 𝑛 1 − 𝜋0 > 5.
Calcoliamo la proporzione di successi osservati 𝑝.
Consideriamo il test 𝐻0 : 𝜋 = 𝜋0 𝑣𝑠 𝐻𝑎 : 𝜋 ≠ 𝜋0
Regola decisionale:
𝑝−𝜋0
Rifiuto 𝐻0 se: 𝑧𝑜𝑏𝑠 = > 𝑧1−𝛼
𝜋𝑜 1−𝜋0 2
𝑛
𝛼
dove 𝑧1−𝛼 è tale che P(Z < 𝑧1−𝛼 ) = 1 −
2 2 2
27
Test d’ipotesi
Test d’ipotesi per una proporzione: esempio
Una ditta farmaceutica asserisce che un suo farmaco è efficace nel 90% dei
casi. In un campione di 50 persone che lo hanno usato, il farmaco si è rivelato
efficace in 40 casi. Stabilire se l’affermazione della ditta farmaceutica è
legittima con un livello di significatività uguale a 0.05
Formuliamo ipotesi nulla e ipotesi alternativa: 𝐻0 : 𝜋 = 0.90 𝑣𝑠 𝐻𝑎 : 𝜋 ≠ 0.90
40
𝑝−𝜋0 50
−0.90
Calcoliamo la statistica test: 𝑧𝑜𝑏𝑠 = = = −2.36
𝜋𝑜 1−𝜋𝑜 0.90 1−0.90
𝑛 50
28
Test d’ipotesi
Interpretazione test statistici: il p-value
Il p-value rappresenta la probabilità di ottenere un risultato pari o più
estremo di quello osservato, supposta vera l'ipotesi nulla
L'ipotesi nulla viene rifiutata se il test fornisce un valore p-value inferiore al
livello di significatività del test.
La regola decisionale è:
Rifiuto 𝐻0 se p-value < α
29
Test d’ipotesi
Il calcolo del p-value
Dato, ad esempio, un campione casuale 𝑥1 , 𝑥2 , … , 𝑥𝑛 tratto da una
popolazione con media 𝜇 e varianza 𝜎 2 (supposta nota)
Consideriamo il seguente test 𝐻0 : 𝜇 = 𝜇0 𝑣𝑠 𝐻𝑎 : 𝜇 ≠ 𝜇0
Calcolo la statistica test
𝑥ҧ − 𝜇
𝑧𝑜𝑏𝑠 =
𝜎/ 𝑛
p-value = 2 ∙ 𝑃 𝑍 > |𝑧|
30
Test d’ipotesi
Test d’ipotesi per una proporzione: esempio
Una ditta farmaceutica asserisce che un suo farmaco è efficace nel 90% dei
casi. In un campione di 50 persone che lo hanno usato, il farmaco si è rivelato
efficace in 40 casi. Stabilire se l’affermazione della ditta farmaceutica è
legittima con un livello di significatività uguale a 0.05
Formuliamo ipotesi nulla e ipotesi alternativa: 𝐻0 : 𝜋 = 0.90 𝑣𝑠 𝐻𝑎 : 𝜋 ≠ 0.90
40
𝑝−𝜋0 50
−0.90
Calcoliamo la statistica test: 𝑧𝑜𝑏𝑠 = = = −2.36
𝜋𝑜 1−𝜋𝑜 0.90 1−0.90
𝑛 50
32
Formulario
(𝛼 livello di significatività)
Supponiamo di estrarre un campione di n soggetti da una popolazione (normale se n<30, qualunque se n≥30)
con media 𝜇 sconosciuta.
Supponiamo che 𝑥ҧ sia la media dei valori osservati nel campione e 𝑠 sia la deviazione standard dei valori
osservati.
Se la varianza 𝜎 2 nella popolazione è non nota
𝑠
▪ Un intervallo di confidenza al 1 − 𝛼 100% per la media 𝜇 è 𝑥ҧ ±𝑡1−𝛼,𝑛−1 𝑛
2
ҧ 0
𝑥−𝜇
▪ Nel test d’ipotesi 𝐻0 : 𝜇 = 𝜇0 𝑣𝑠 𝐻𝑎 : 𝜇 ≠ 𝜇0 , rifiuto 𝐻0 se 𝑠 > 𝑡1−𝛼,𝑛−1
𝑛 2
33
Formulario
(𝛼 livello di significatività)
Supponiamo di estrarre un campione di n soggetti da una popolazione in cui la proporzione di successi sia 𝜋.
Supponiamo che 𝑝 sia la proporzione di successi nel campione.
Se il campione è sufficientemente grande [cioè se 𝑛𝑝 > 5 e 𝑛 1 − 𝑝 > 5]
𝑝 (1−𝑝)
▪ Un intervallo di confidenza al 1 − 𝛼 100% per la proporzione 𝜋 è: 𝑝 ± 𝑧1−𝛼
2 𝑛
𝑝−𝜋0
▪ Nel test d’ipotesi 𝐻0 : 𝜋 = 𝜋0 𝑣𝑠 𝐻𝑎 : 𝜋 ≠ 𝜋0 , rifiuto 𝐻0 se > 𝑧1−𝛼
𝜋𝑜 1−𝜋𝑜 2
𝑛
34