Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Lezione 7
Verifica di ipotesi
statistiche
Insegnamento: Statistica
Corso di Laurea Magistrale in Matematica
Università di Ferrara
E-mail: susanna.ragazzi@unife.it
Argomenti
Logica e caratteristiche fondamentali dei test
Struttura probabilistica del test
Lemma di Neyman e Pearson
Test uniformemente più potenti
Test del rapporto di verosimiglianza
Test parametrici ad un campione:
Test di ipotesi sul valore medio (se è nota la varianza)
Test di ipotesi sul valore medio (se non è nota la varianza)
Test di ipotesi sulle frequenze di una attributo (per la
proporzione)
Approccio del p-value
La verifica di ipotesi
La verifica di ipotesi è una procedura inferenziale che ha
come scopo quello di considerare l’informazione
empirica (ottenuta da una statistica campionaria) e di
stabilire se questa è favorevole ad una asserzione di
interesse sui parametri della popolazione
La verifica d’ipotesi si affianca ai problemi di stima
nell’ambito dell’inferenza statistica: consente di operare
una scelta decisionale su due o più ipotesi riguardanti il
tipo di distribuzione del carattere in oggetto di studio o su
valori alternativi dei parametri che identificano la
distribuzione, accettando una di tale ipotesi sulla base
delle informazioni campionarie disponibili
La verifica di ipotesi
Il test delle ipotesi statistiche è una regola istituita sullo
spazio campionario mediante la quale, in funzione del
campione osservato, si decide se rifiutare o non rifiutare una
ipotesi statistica H0 riferita alla popolazione, detta ipotesi
nulla.
( )
Test consistente
θ∈ω₀ θ ∉ ω0
E' possibile dimostrare che tutti i test derivati dal Lemma di Neyman e
Pearson sono consistenti.
( ) ( )
Similarità ed Invarianza
Definizione: Un test di ampiezza α per un'ipotesi riguardante il vettore
di parametri θ si definisce similare allo spazio campionario ℜⁿ se γ(θ)=α
per tutti i θ ∈ ω₀.
Tale test può essere applicato anche se la distribuzione non è normale purché
l’ampiezza sia sufficientemente elevata (Teorema Centrale del limite).
Test parametrici: Test sui parametri di una v.c.
normale
Test sul valore medio se è nota la varianza (Test Z sulla media)
Esempio
Si vuole stabilire se un processo produttivo di scatole di cerali funziona in
maniera adeguata, allo scopo si estrae un campione di 25 scatole, esse sono
pesate e si confronta il peso medio delle scatole del campione (la statistica
campionaria) con la media di 368 grammi (il valore ipotizzato del parametro).
L’ipotesi nulla e l’ipotesi alternativa in questo esempio sono rispettivamente:
H0: μ = 368 H1: μ ≠ 368
Se si assume che la popolazione abbia distribuzione normale e che scarto
quadratico medio della popolazione σ sia noto, la verifica di ipotesi viene
condotta utilizzando il cosiddetto test di ipotesi Z.
Test di ipotesi Z per la media (varianza nota)
Si considera la statistica test Z. Il numeratore dell’equazione
misura di quanto la media osservata differisce dalla media μ
ipotizzata, mentre al denominatore troviamo l’errore standard
della media. Pertanto Z ci dice per quanti errori standard
differisce da μ.
Statistica Z per la verifica d’ipotesi sulla media (σ noto)
X n 0
Z
/ n
Per definire le regioni di accettazione e di rifiuto è necessario
determinare i valori critici della statistica test, facendo
riferimento alla distribuzione normale standardizzata una volta
fissato l’errore di prima specie α.
Test di ipotesi Z per la media (varianza nota)
Ad esempio, se si fissa α=0.05, l’area sottesa in corrispondenza
della regione di rifiuto deve essere pari a 0.05. Poiché la regione
di rifiuto coincide con le due code della distribuzione (si parla di
un test a due code), l’area 0.05 viene divisa in due aree di 0.025.
Una regione di rifiuto di 0.025 nelle due code della distribuzione
normale dà luogo a un’area cumulata di 0.025 alla sinistra del
valore critico più piccolo e a un’area pari a 0.975 alla sinistra del
valore critico più grande.
Cercando queste aree nella tavola della distribuzione normale,
troviamo che i valori critici che dividono la regione di rifiuto da
quella di accettazione sono –1.96 e +1.96.
La Figura mostra che se la media μ ha valore 368, come ipotizza
H0, allora la statistica test Z ha una distribuzione normale
standardizzata. Valori di Z maggiori di +1.96 o minori di –1.96
indicano che è così distante dal valore ipotizzato per μ (368) che
non è probabile che questo valore si verifichi quando H0 è vera.
Pertanto la regola decisionale è la seguente:
Rifiutare H0 se Zα/2<–1.96 oppure se Zα/2>+1.96
Non rifiutare H0 altrimenti
Supponiamo che la media campionaria calcolata a partire dal
campione di 25 scatole sia 372.5 grammi e che σ sia 15 grammi,
allora X n 0
Z 1.50
/ n
e quindi non è possibile rifiutare l’ipotesi nulla.
Test di ipotesi Z per la media (varianza nota)
Le 6 fasi della verifica di ipotesi utilizzando l’approccio
del valore critico
n ≥ 30 X n 0 Distribuzione
1 Z
Varianza σ2 nota / n normale
n ≥ 30
X n 0 Distribuzione
2 Varianza σ2 Z normale
incognita S/ n
n < 30
X n 0 Distribuzione
3 Pop. normale Z normale
Varianza σ2 nota / n
n < 30
Distribuzione t di
Pop. normale X n 0
4 Student con n -1
Varianza σ2 t
S/ n gradi di libertà
incognita
Il proc. 4 può essere usato anche per grandi campioni da pop .normale al posto del
procedimento 2: il proc. esatto è quello basato sulla distribuzione t mentre l’altro è
approssimato.
Il test di ipotesi Z per la proporzione
In alcuni casi si è interessati a verificare ipotesi su , la
proporzione di unità nella popolazione che possiedono una certa
caratteristica. A tale scopo, per un campione casuale estratto
dalla popolazione, si deve calcolare la proporzione campionaria
P = X/n. Se il numero di successi X e di insuccessi (n−X) sono
entrambi >5, la distribuzione della proporzione di successi può
essere approssimata dalla distribuzione normale e, quindi, si può
ricorrere alla statistica Z per la proporzione.