Sei sulla pagina 1di 12

Lezione 28 - 14/05/2021

Test d'ipotesi
La funzione potenza del test
Π(�) = P(X ∈ C; � ∈ � 0 ∪ � 1 )
Ampiezza del test:

� = sup Π(�) = sup �


�∈� 0 �∈� 0 ⏦
�(�)

Fissiamo � (quindi la probabilità massima di commmettere l'errore di prima specie) ad un


valore basso. (per esempio � = 0, 05)
Cercare tra tutte le procedure di test quella che abbia � più piccolo.

Se abbiamo ipotesi semplici:

� = sup �(�) = �(� 0 ) con � 0 = { � 0 }


�∈� 0

Esempio Abbiamo un campione casuale X = (X 1 ,........., X 20 ) di taglia n = 20, tale che


la popolazione X ∼ Be(p).
Vogliamo fare inferenza su p

Soluzione fissiamo il sistema delle due ipotesi


Vogliamo testare le ipotesi:
H 0 : p = 0, 9
H 1 : p = 0, 6
Possiamo pensare al lancio di una moneta per 20 volte volendo capire quanto essa sia
sbilanciata.

Immaginiamo che ci venga data una regola di rifiuto, cioè che sia fissata la partizione
dello
spazio campionario.
Supponiamo che la regione critica del test sia:
20
C = (x 1 , … , x n ) / ∑ x i ⩽ 14
i=1

Calcoliamo le probabilità dei due errori, di prima e sconda specie:

� = P "rifiutare H 0 "; H 0 è vera = P(X ∈ C; p = 0, 9) =



probabilità di errore
di prima specie
20
=P ∑ Xi ⩽ 14 ; p = 0, 9 = P(Y ⩽ 14 ) dove Y ∼ Bin(20 ; 0, 9)
i=1
14
=∑
20
(0, 9) k (1 - 0, 9) 20-k = 0, 0114
k=0
k
Abbiamo trovato �, che in questo caso è un numero.

� = P "accettare H 0 " ; H 1 è vera = P X ∈ C C ; p = 0, 6 = 1 - P(X ∈ C ; p = 0, 6) =


Stiamo calcolando la stessa cosa, ma con l'altra ipotesi, l'altro valore del parametro.
20
= 1-P ∑ Xi ⩽ 14 ; p = 0, 6 = 1 - P(W ⩽ 14) dove W ∼ Bin(20 ; 0, 6) =
i=1
14
= 1-∑
20
(0, 6) k (1 - 0, 6) 20-k = 1 - 0, 8744 = 0, 1256
k=0
k
La potenza del test è:
� = 0, 014 , p = 0, 9
Π(p) =
1 - � = 0, 1256 , p = 0, 6
e l'ampiezza del test:

� = sup Π(p) = sup Π(p) = Π(0, 9) = 0, 0114


p∈�0 p=0,9

⏨⏨
NB
Diamo un'altra regola di rifiuto e perciò modifichiamo la regione critica:
20
C' = (x 1 , … , x 20 ) / ∑ x i ⩽ 15
i=1

Rifacendo i conti:
• La probabilità dell'errore di prima specie aumenta.
• La probabilità dell'errore di seconda specie diminuisce.
Normalmente si fissa � ad un valore basso e si determina C (che vuol dire fissare la
regola
di rifiuto, fissare la procedura di test) in modo tale che � sia minimo.
Definizione test più potente

Un test Y di ampiezza � per H 0 : � ∈ � 0 contro H 1 : � ∈ � 1 , viene detto "più potente" se


∀ altro test Y' di ampiezza �' ⩽ � si ha:
�'(�) ⩾ �(�) ∀� ∈ � 1

L'idea è quindi cercare il nostro test più potente, noi abbiamo un teorema che risponde a
questa domanda, esso riguarda solo le ipotesi semplici:
Lemma di Neyman-Pearson
Dato un campione casuale X = (X 1 ,........., X n ) campione casuale estratto da una
popolazione parametrizzata da �, e sia L(�) la funzione di verosimiglianza associata.
Allora il test più potente di ampiezza � per verificare il sistema di ipotesi:
H0 : � = �0
H1 : � = �1
è quello di regione critica:

L(� 0 )
C = (x 1 , … , x n ) / ⩽k
L(� 1 )

dove k è scelto in modo che l'ampiezza del test sia proprio �.


Dimostrazione
Sia C una regione critica tale che:

P (X1 , … , Xn ) ∈ C ; H 0 vera = � (1)

e che soddisfi:

L(� 0 )
C = (x 1 , … , x m ) / ⩽k (2)
L(� 1 )

Sia inoltre D una seconda regione critica di ampiezza �.


Dimostriamo che C ha una probabilità di errore di seconda specie minore di D.
Fissiamo � che è la probabilità (1)
� = ∫…∫L(� 0 ) dx 1 ⋅…⋅ dx n = ∫…∫L(� 0 ) dx 1 ⋅…⋅ dx n
C D

⏨⏨
NB
C = (C ∩ D) ∪ C ∩ D C
D = ( D ∩ C) ∪ D ∩ C C

∫…∫L(� 0 ) dx 1 ⋅…⋅ dx n + ∫…∫L(� 0 ) dx 1 ⋅…⋅ dx n =
C∩D C C∩D
∫…∫L(� 0 ) dx 1 ⋅…⋅ dx n + ∫…∫L(� 0 ) dx 1 ⋅…⋅ dx n
D∩C D∩C C

∫…∫L(� 0 ) dx 1 ⋅…⋅ dx n = ∫…∫L(� 0 ) dx 1 ⋅…⋅ dx n
C∩D C D∩C C
⏠⏣⏣⏣⏣⏣ ⏡⏣⏣⏣⏣⏣
punti che soddisfano (2) ⏢ ⏠⏣⏣⏣⏣⏣
punti che non⏡⏣⏣⏣⏣⏣
soddisfano (2) ⏢

∫…∫ kL(� 1 ) dx 1 ⋅…⋅ dx n ⩾ ∫…∫L(� 0 ) dx 1 ⋅…⋅ dx n =
C∩D C ⏠⏣⏣ ⏡⏣⏣ ⏢
in quanto C∩D C (3)
vale (2)
= ∫…∫L(� 0 ) dx 1 ⋅…⋅ dx n ⩾ ∫…∫ kL(� 1 ) dx 1 ⋅…⋅ dx n
D∩C C ⏠⏣⏣
D∩C C in ⏡⏣⏣
quanto

non vale (2)

Quindi posso prende gli estremi della disuguaglianza e scrivere:


∫…∫kL(� 1 ) dx 1 ⋅…⋅ dx n ⩾ ∫…∫kL(� 1 ) dx 1 ⋅…⋅ dx n (4)
C∩D C D∩C C

∫…∫L(� 1 ) dx 1 ⋅…⋅ dx n = ∫…∫L(� 1 ) dx 1 ⋅…⋅ dx n + ∫…∫L(� 1 ) dx 1 ⋅…⋅ dx n =


C C∩D C∩D C
⏠⏣⏣⏣⏣⏣ ⏡⏣⏣⏣⏣⏣
probabilità di scegliere� 1 ⏢ ⏠⏣⏣⏣⏣⏣⏣⏣⏣⏣⏣ ⏡⏣⏣⏣⏣⏣⏣⏣⏣⏣⏣
decompongo in insiemi disgiunti

quando è vera H 1

Utilizzo ora, la disuguaglianza (4)


⩾ ∫…∫L(� 1 ) dx 1 ⋅…⋅ dx n + ∫…∫L(� 1 ) dx 1 ⋅…⋅ dx n =
C∩D D∩C C
= ∫…∫L(� 1 ) dx 1 ⋅…⋅ dx n
D
Perciò se prendo gli estremi della disequazione, mi rimane:
∫…∫L(� 1 ) dx 1 ⋅…⋅ dx n ⩾ ∫…∫L(� 1 ) dx 1 ⋅…⋅ dx n
C D
⏠⏣⏣⏣⏣⏣ ⏡⏣⏣⏣⏣⏣
probabilità di scegliere� 1

quando è vera H 1


P (X1 , … , Xn ) ∈ C ; H 1 vera ⩾ P (X1 , … , Xn ) ∈ D ; H 1 vera

1 - �C ⩾ 1 - �D

� D ⩾ � C QED ⊠
Esempio Sia X = (X 1 ,........., X n ) un campione casuale tale che la sua popolazione sia:
X ∼ f(x; �) = �e -�x 1 R+ (x) , � > 0
Consideriamo le seguenti ipotesi semplici:
H0 : � = �0
con � 0 , � 1 noti , � 0 > � 1
H1 : � = �1
Determinare il test più potente

Soluzione Cioè la procedura di decisione che minimizza le probabilità di errore di prima


e
seconda specie, usiamo il lemma di Neyman-Pearson

L(� 0 )
C = (x 1 , … , x n ) / ⩽k , k / P X ∈ C ; H 0 vera = � (5)
L(� 1 )
n
n n n -� ∑ xi n
L(�) = ∏ f(x i ; �) = ∏ �e -�xi ∏ 1 R+ (x i ) = � n e i=1 ∏ 1R +
(x i )
i=1 i=1 i=1 i=1
n n

L(� 0 ) �0 -(�0 -�1 ) ∑ xi


= e i=1

L(� 1 ) �1
La regione critica è tale che dalla regola:
n n

�0 -(�0 -�1 ) ∑ xi
e i=1
⩽k
�1

n
�0
n log - (� 0 - � 1 )∑ x i ⩽ log k
�1 i=1

n
�0
(� 0 - � 1 )∑ x i ⩾ n log - log k
i=1 �1

�0
n n log � - log k
∑x ⩾ 1
= k'
i=1 (� 0 - � 1 )
Cioè, riscrivendo (5) con quanto ho calcolato:
n
C = (x 1 , … , x n ) / ∑ x i ⩾ k'
i=1

e siccome:

P X ∈ C ; H 0 vera = �

n
P ∑ xi ⩾ k' ; H0 vera =�
i=1

Cioè:
∼�(n,�0 )
⏜⏟⏟
n ⏝⏟⏟

P ∑ Xi ⩽ k' ; H 0 vera = 1 - �
i=1
⏠⏣⏣⏣⏣⏣ ⏡⏣⏣⏣⏣⏣
evento complementare

f∑n Xi
i=1
1

0 k'
1-�

Sostanzialmente sto cercando il quantile a livello 1 - �, che è proprio k'


In generale
n
∑ Xi ∼ �(n, �0 )
i=1
è detta statistica test.

Potrebbero piacerti anche