Sei sulla pagina 1di 16

Esercitazione 7 stat - 18/05/21

Test di ipotesti
Il terzo modo, dopo stima puntuale ed intervallare, di fare inferenza statistica.
In esso il nostro spazio dei parametri � è partizionato nei due sottoinsiemi � 0 e � 1 che
sono rispettivamente relativi alla ipotesi nulla H 0 e alla ipotesi alternativa H 1
Quindi avremo un sistema di ipotesi:

H 0 : � ∈ � 0 → x ∈ C C = "regione di accettazione"
H 1 : � ∈ � 1 → x ∈ C = "regione di rifiuto"
Per condurre il test abbiamo definito delle procedure di test.
Per esempio:
⏨n - 2 |
|X
⏨n - 2 | ⩾ k }
C = {x ∈ X / |X
Posso commettere degli errori:
1. specie → accettare H 1 quando è vera H 0 P "errore di prima specie" = �
2. specie → accettare H 0 quando è vera H 1 P "errore di seconda specie" = �
Dopodiché abbiamo determinato la potenza del test:
�(�) � ∈ � 0
Π(�) =
�(�) � ∈ � 1
Nel caso di ipotesi sempici:
H0 : � = �0
⇝ Lemma di Neyman-Pearson
H1 : � = �1
Il lemma di neyman-pearson ci dice che il test più potente è proprio quello con regione
critica:

L(� 0 )
C = (x 1 , … , x n ) / ⩽k
L(� 1 )

Esercizio 1 Sia X = (X 1 ,........., X 100 ) un campione casuale di taglia n = 100 estratto


da
una popolazione X ∼ Be(p)
Definiamo l'evento:
{ Xi = 1 } = "i^ lampadina difettosa"
Il campione si realizza in maniera tale da avere:
100
∑ xi = 15
i=1
Viene imposta l'ampiezza del test:
Il mio sistema di ipotesi è:
H 0 : p = 0, 1
H 1 : p > 0, 1
Ci viene anche data la regione critica:
⏨n ⩾ k }
C = {(x 1 , … , x n ) / X (1)

Dove k è tale che P "errore di prima specie" = �


Soluzione
Io so come è fatta la media campionaria:
100
∑ Xi ∼ Bin(100, p)
i=1

Quindi per calcolare il valore di k, io potrei valutare la distribuzione di probabilità di ⏨


Xn
Però io sto pensando ad approssimazioni tramite il teorema del limite centrale.
Io so che n è grande (n = 100) ⟹ ricordo il teorema del limite centrale:
n
∑ Xi - np
i=1

Xn - p d
= ⏪⏫ Z ∼ N(0, 1)
np(1 - p) p( 1 - p)
n
Quindi io qui non ho la convergenza, però, essendo che n è abbastanza grande posso
approssimare ad una normale standard.
Dobbiamo valutare la probabilità dell'errore di prima specie:


Xn - p k-p
⏨n ⩾ k; p = 0, 1) = P
P(X ⩾ ; p = 0, 1 = � = 0, 1
(2)
p( 1 - p) p( 1 - p)
n n
Devo determinare da questa equazione k.

Il ";" non significa nè il condizionamento, né ∩ per


il semplice fatto che p = 0, 1 non è un evento è
semplicemente uno dei valori che può assumere il
parametro.
Per il teorema del limite centrale possiamo approssimare (2)

k-p
≅ P Z ∼ N(0, 1) ⩾ ; p = 0, 1 = 0, 1
p( 1 - p)
n
k-p
= 1-P Z < ; p = 0, 1 = 0, 1
p( 1 - p)
n
Cioè:

k-p
P Z⩽ ; p = 0, 1 = 0, 9
p( 1 - p)
n

0 k'

0, 9

Quindi k' è il quantile a livello 0, 9 della normale standard: k = z 0,9 = il valore che ci dicono le tabelle
In particolare le tabelle ci dicono che z 0,9 = 1, 29
k-p
= z 0,9
p( 1 - p)
n

p( 1 - p)
k = z 0,9 +p
n
Noi sappiamo che p = 0, 1 e n = 100, per cui:

0, 1 ⋅ 0, 9
k = 1, 29 + 0, 1
100
Quindi la nostra regola di rifiuto (1) diventa:
⏨n ⩾ k }
C = {(x 1 , … , x n ) / X

0, 1 ⋅ 0, 9
C = (x 1 , … , x n ) / ⏨
X n ⩾ 1, 29 + 0, 1
100

Esercizio 2 Abbiamo un campione casuale X = (X 1 ,........., X n ) di taglia n = 1


Quindi il nostro campione casua,le coincide con la genitrice.
�y �-1 0 < y < 1
Y è il nostro campione casuale, Y ∼ f Y (y; �) = = �y �-1 1 (0,1) (y)
0 altrove
Determinare il test più potente con livello � = 0, 05 per il sistema di ipotesi:
H0 : � = 2 = �0
H1 : � = 1 = �1

Soluzione usiamo il lemma di Neymann-Pearson

L(� 0 )
C = x/ ⩽k
L(� 1 )
La nostra funzione di verosimiglianza viene ad essere:

L(� 0 ) = � 0 y �0 -1 1 (0,1) (y)


L(� 1 ) = � 1 y �1 -1 1 (0,1) (y)
Per cui:
L(� 0 ) �0
= y �0 -�1 = 2y
L(� 1 ) �1
C = { y / 2y ⩽ k } con k tale che P "errore di prima specie" = � = 0, 05
Tentiamo di derivare l'errore di k.
P(Y ∈ C ; � = � 0 = 2) = P(2Y ⩽ k ; � = 2)
k k
P Y ⩽ ; � = 2 = FY | �=2
2 2
⏨⏨
NB
y y
F Y (y) = ∫ �x �-1 dx = x � 0
= y�
0
2
k k
FY | �=2 =
2 2
Quindi:
2
k
= 0, 05 ⟺ k 2 = 4 ⋅ 0, 05 ⟺ k = 2 0, 05
2
Il test più potente è quello di regione critica:
k
C = y/y ⩽ = y/y ⩽ 0, 05
2
Calcoliamo �
P "errore di seconda specie" = P(Y ∉ C ; � = � 1 = 1) =
= 1 - P(Y ∈ C ; � = � 1 = 1) = 1 - P Y ⩽ 0, 05 ; � = 1 =

= 1 - FY 0, 05 | �=1 = 1 - 0, 05 | �=1 = 1 - 0, 05 ⋍ 0, 77
La probabilità dell'errore di seconda specie è molta alta.
Osservazione
� è così alto perché � è fissato ad un valore basso, mentre il mio n = 1 quindi molto
basso.
Con pochissime prove le probabiltà di errore non possono che essere alte.
Esercizio 3 Sia X = (X 1 ,........., X n ) un campione casuale di taglia n estratto da una
popolazione
1
X ∼ Exp

Determinare un test di ampiezza � = 0, 05 per il sistema di ipotesi:
H0 : � = 2 = �0
H1 : � = 1 = �1

Soluzione ipotesi semplici e quindi uso leymann-Pearson

n xi n n 1 n
- - ∑ xi n
1 1
L(� 0 ) = ∏ ∏ 1(0,+∞) (xi ) = ∏ 1R
�0 �0 i=1
e e (x i )
�0 �0 +
i=1 i=1 i=1
n xi n n 1 n
1 - 1 - ∑ xi n
L(� 1 ) = ∏ ∏ 1(0,+∞) (xi ) = ∏ 1R
�1 �1 i=1
e e (x i )
�1 �1 +
i=1 i=1 i=1
n
1
n - ∑ xi n
1 2 i=1
e ∏ 1 R + (x i ) 1 n
-1 ∑ xi
1 n
∑ xi
L(� 0 = 2) 2
i=1 1 -
2 1 2 i=1
= = n
e i=1
= e
2n
n
L(� 1 = 1) - ∑ xi n 2
e i=1 ∏ 1 R + (x i )
i=1
Posso ora scrivere la regione critica:
1 n 1 n
∑ xi ∑ xi
1 2 i=1 2 i=1
C = x1 , … , xn / n
e ⩽ k = x1 , … , xn / e ⩽ 2nk =
2
n n
= x 1 , … , x n / ∑ x i ⩽ 2 log 2 k n
= x 1 , … , x n / ∑ x i ⩽ k'
i=1 ⏠⏣⏣⏣
⏡⏣⏣⏣
k' ⏢ i=1

Dove k' è tale che l'ampiezza � = 0, 05


Devo determinare k' / � = 0, 05
n
0, 05 = P(X = (X1 ,........., Xn ) ∈ C ; � = � 0 = 2 } = P ∑ Xi ⩽ k' ; � = 2 = 0, 05 =
i=1

⏨⏨
NB
n
1 1
Xi ∼ Exp ⟹ ∑ Xi ∼ � n,
� i=1 �
Quando � = 2
n
1
∑ Xi ∼ � n, 2
∼ � 2n
i=1 2
2
= P � 2n ⩽ k'
2
Quindi k' è il quantile di � 2n che taglia a sinistra una massa di probabilità pari a 0, 05

f �2n2

0 k' 10

0, 05

2
Quindi k' = � 2n , 0,05
Ricapitolando:
n
C = (x 1 , … , x n ) / ∑ x i ⩽ � 2n
2
, 0,05
i=1

Esercizio 4 sia X = (X 1 ,........., X n ) un campione casuale di taglia n = 10 estratto da


una
popolazione X ∼ N �, � 2 , � 2 = 16. Esso ha un media campionaria realizzata x
⏨n = 24, 3
Testare le ipotesi:
H 0 : � = 20
H 1 : � > 20
con � = 0, 05

Soluzione
Considero le ipotesi semplici:
H 0 : � 0 = 20
H1 : � = �1 > �0
applico allora neymann-pearson:
n (xI - µ) 2 n 1 n
- - 2 ∑ (xi -�) 2
1 -
L(�) = ∏ 2� 2 2 2� i=1
e = 2�� 2 e
2
i=1 2��
n n n n
1 n
1 n 1
∑ (xi -� 0 ) 2 + ∑ (xi -� 1 ) 2 - ∑ xi2 +� 02 -2�0 ∑ xi - ∑ xi2 -n�12 +2�1 ∑ xi
L(� 0 ) -
2� 2 i=1 2� 2 i=1 2� 2 i=1 i=1 i=1 i=1
=e =e =
L(� 1 )
n
1
- n � 02 -� 12 -2 ∑ xi (� 0 -� 1 )
2� 2 i=1 n
⏠⏣⏣
⏡⏣⏣ ⏢ 2 x⏨n (� 1 -� 0 )+ � 02 -� 12
2� 2
=e nx⏨n
=e
Quindi la nostra regione critica:
n
2 x⏨n (� 1 -� 0 )+ � 02 -� 12
2� 2
C = (x 1 , … , x n ) / e ⩽k

Risolviamo rispetto alla media campionaria:

2� 2 � 02 - � 12
C = (x 1 , … , x n ) / x⏨n ⩾ log k -
n 2( � 0 - � 1 )
⏠⏣⏣⏣⏣⏣
g⏡⏣⏣⏣⏣⏣
(k) ⏢
⏨⏨
NB
Xi ∼ N �0 , � 2
sotto l'ipotesi nulla
�2
⏨n ∼ N � 0 ,
X
n
Se noi vogliamo andare a valutare:
⏨n ⩾ g(k) ; � = � 0 ) =
� = P "errore di prima specie" = P(X ∈ C ; � = � 0 ) = P(X
Faccio una standardizzazione per ottenere una normale standard:
⏨n - � 0
X g(k) - � 0 g(k) - �
=P �
⩾ �
= P Z ∼ N(0, 1) ⩾ �
= 0.05 =
n n n

g(k) - � 0
= 1-P Z ⩽ �
n

Cioè devo avere:

g(k) - � 0
P Z⩽ �
= 0, 95
n
⏠⏣⏣⏣
⏡⏣⏣⏣

N(0,1)0,95 =z0,95
quantile

Io posso allora risolvere rispetto a g(k):

g(k) - � 0 n

= z 0,95 ⟹ g(k) = z 0,95 + � 0 =

n
z 0,95 = 1, 65
� 0 = 20
n = 10
�=4
g(k) ≅ 22, 08
Riscriviamo quindi la regione critica.
C = {(x 1 , … , x n ) / x⏨n ⩾ 22, 08 }
Siamo arrivati alla fine e non c'è dipendenza con � 1 .

Questo non è però il test più potente delle ipotesi composte.

Potrebbero piacerti anche