Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
=0
=1
=0
0
0
<0
0
>0 .
X 0
che, se lipotesi nulla vera, al variare del campione si distribuisce come una v.a. normale
standardizzata. La regione critica dipende dal tipo di ipotesi alternativa.
Se decidiamo per unipotesi alternativa del tipo
H1 : 0
la regione critica riguarda la coda di sinistra della normale, il valore critico cio z e si
ha
RC : X 0 z
la regione critica riguarda la coda di destra della normale, il valore critico cio z e si ha
RC : X 0 z
la regione critica riguarda entrambe le code della normale, i valori critici sono cio z / 2 e
z / 2 e si ha
X 0 z / 2 n
RC :
X 0 z / 2
TEST SULLA MEDIA DI UNA POPOLAZIONE CON VARIANZA NON NOTA. TEST t
DI STUDENT
La varianza di una popolazione si pu presupporre nota se si certi della sua
distribuzione normale. In tal caso infatti la varianza della v.a. normale standardizzata
uguale ad 1.
Se la varianza della popolazione non nota e la numerosit del campione scarsa,
nulla si pu dire circa la normalit della sua distribuzione.
Supponiamo di disporre di un campione di dimensione n<30 che fornisca solo una
stima (corretta) della varianza della popolazione.
Vogliamo testare lipotesi
H 0 : 0 .
X 0
S
n
che se lipotesi nulla vera si distribuisce al variare del campione come una v.a. t di
Student con n-1 gradi di libert.
Con unipotesi alternativa
H1 : 0
la regione critica
RC : X 0 t ;n1
la regione critica
S
n
RC : X 0 t ;n 1
S
n
la regione critica
S
X 0 t ;n1 n
RC :
X 0 t ;n1
S
n
( n 1) S 2
02
che al variare del campione, se lipotesi nulla vera, si distribuisce come una v.a. chi
quadrato con n-1 gradi di libert.
Fissando una soglia di significativit , la regione critica sar:
2
2
- Per lipotesi alternativa H1 : 0
RC : S 2
02 2
1 ;n1
n 1
2
2
- Per lipotesi alternativa H 1 : 0
RC : S 2
02 2
;n1
n 1
2
2
- Per lipotesi alternativa H1 : 0
02 2
1 / 2;n1
n 1
2
S
RC :
02 2
/ 2;n1
S
n 1
H 0 : 1 2 0
1 2 0
e varianza
S X2 1 X 2
12 22
.
n1
n2
X1 X 2
1 2
n1 n2
che se lipotesi nulla vera si distribuisce come una v.a. normale standardizzata.
X1 X 2
1
1
S
n1 n2
che se lipotesi nulla vera si distribuisce come una v.a. t di Student con n1 n2 2 gradi di
libert.
TEST SULLA DIFFERENZA FRA MEDIE PER CAMPIONI APPAIATI. TEST t DI
STUDENT
Spesso a livello sperimentale si vuole verificare una variazione di valor medio prima e
dopo un dato trattamento, in cui si sono istituiti campioni appaiati X ed Y corrispondenti ad
una medesima unit statistica, ossia non indipendenti ma rilevati prima e dopo il
trattamento.
Le ipotesi a confronto sono:
H 0 : 1 2 0
contro:
1. H 1 : 1 2 0
2. H 1 : 1 2 0
3. H 1 : 1 2 0
In questo caso il test fa riferimento alla statistica:
T
D
SD
Che al variare del campione, se lipotesi nulla vera, si distribuisce come una v.a. t di
Student in cui:
-
i 1
n
n
SD
(D D )
i 1
n 1
omoschedasticit
S12
S 22
(*)
(n1 1) S1
(n 1) S
e 2 2 2
2
1
2
gradi di libert.
Se quindi rapportiamo le variabili ai loro rispettivi gradi di libert otteniamo
Per H1 : 12 22
RC : F F ;n11;n 21
Per H1 : 12 22
F F1 / 2;n11;n 21
RC :
F F / 2;n11;n 21
y 21, y 22 , ,...., y 2 n 2
Trattamento A2
..
y k 1, y k 2, ,...., y knk
Trattamento Ak
Sottoporremo a verifica lipotesi che i valori medi dei diversi trattamenti siano uguali fra
loro:
H 0 : 1 2 ... k
contro lipotesi:
H 1 : non vera H 0 .
Se lipotesi nulla vera, ognuno dei k trattamenti pu essere pensato come estratto da
ununica popolazione X~N(,2) : in modo che tutti gli elementi dei trattamenti possono
essere visti come elementi casuali di un unico campione trattamento estratto da ununica
popolazione normale.
Il test consiste nella scomposizione della variabilit globale in variabilit entro gruppi e
variabilit fra gruppi.
Partiamo dalla v.a. media campionaria del trattamento i-esimo
n
Yi
1 j
Yij
n j 1
1 k j
1 k
Y Yij Yi.
n i 1 j 1
n i 1
nj
i 1
j 1
(Yij Y ) =
2
i 1
i 1
i 1
2
= ni (Yi Y )
nj
((Y
j 1
nj
j 1
ij
Yi ) (Yi Y )) 2
(Yij Yi ) 2
Distinguiamo:
devianza fra gruppi (B=between)
k
D( B ) ni (Yi Y ) 2
i 1
D( B) ni (Yi ) 2 n(Y ) 2 ,
i 1
D(W )
i 1
j 1
(Yij Yi ) 2
k
Queste devianze si possono anche chiamare devianza spiegata (perch la devianza fra
medie) e devianza residua (o dellerrore, devianza non spiegata).
Si dimostra che due stimatori non distorti delle devianze D(B) e D(W) sono forniti da
S B2
D( B)
k 1
S w2
D(W )
.
nk
i 1
i 1
gdltot n 1 ni 1 (ni 1) (k 1)
S B2
F 2
SW
che, se lipotesi nulla vera, si distribuisce come una v.a. F di Fisher con k-1 e n-k gradi di
libert.
Nella pratica si calcola il valore sperimentale delle devianze e si confronta il loro rapporto
con il valore critico F ;k 1;n k a livello di significativit desunto dalle tavole.
H 0 : p p0
H 1 : p p0
H 1 : p p0 .
TEST BINOMIALE
Si usa se la numerosit n dei campioni non alta.
Con la distribuzione cumulativa della v.a. binomiale si calcola la probabilit che un dato
evento si presenti in n prove con frequenza relativa inferiore o uguale ad f, ossia un
numero di volte inferiore o uguale a k=nf:
n x
p0 (1 p0 ) n. x
k
x 0
P ( X k )
TEST NORMALE
Per il teorema limite centrale, quando la numerosit del campione n elevata, la v.a.
frequenza relativa F pu essere approssimata ad una distribuzione normale di media p e
p (1 p )
varianza
.
n
La statistica da utilizzare sar
F p0
p0 (1 p0 )
n
che, se lipotesi nulla vera, al variare del campione si distribuisce come una v.a. normale
standardizzata.
Le regole di decisione sono le stesse utilizzate nella verifica di ipotesi sulle medie.
TEST SULLA DIFFERENZA FRA TENDENZE CENTRALI
La tendenza centrale, nei test non parametrici, rappresentata non dalla media ma dalla
mediana.
Vogliamo confrontare le tendenze centrali di due popolazioni a partire da due campioni
indipendenti n1 e n2 . Se non possiamo usare la distribuzione t di Student utilizziamo il
test della mediana.
Lipotesi nulla :
H 0 : Me1 Me2 Me
p1 (1 p1 )
n1
p2 (1 p2 )
n2
n1 n2
e si utilizza la statistica
F1 F2
1
1
F (1 F )
n1 n2
che se lipotesi nulla vera si distribuisce al variare del campione come una v.a. normale
standardizzata, con le note regole di decisione.
TEST SULLA DIFFERENZA FRA FREQUENZE PER CAMPIONI APPAIATI. TEST DI
McNEMAR
Vogliamo verificare se un campione di individui sottoposti in tempi diversi ad uguale
trattamento esprimono un carattere dicotomico secondo statistiche diverse.
Dobbiamo quindi disporre di campioni appaiati e dati in forma di frequenze.
Potremmo anche usare il test binomiale, che per meno immediato.
Segnaliamo con + la presenza del carattere, con la sua assenza.
+
PRIMA -
DOPO
-
n11
n21
n12
n22
n 2.
n.1
n.2
n1.
La statistica da utilizzare per il test, come si potr ricavare dal test 2 per tabelle a doppia
entrata,
(n12 n21 ) 2
X
n12 n21
2
che se lipotesi nulla vera si distribuisce come una v.a. chi quadrato con 1 grado di
libert.
Si rifiuta lipotesi H0 : il trattamento non determina cambiamento significativo nelle
2
frequenze se X ,1 .
Per valori n 20 si utilizza lapprossimazione
X2
(| n12 n21 | 1) 2
.
n12 n21
ni . n. j
n
ni . n. j
n
T
dove nij la frequenza teorica calcolata per ciascuna coppia di caratteri.
La statistica da utilizzare
r
X
2
i 1 j 1
(nij nijT )
nijT
che se lipotesi nulla vera si distribuisce come una v.a. chi quadrato con (r-1)(c-1) gradi di
libert.
2
2
Quindi si rifiuta H0 se X ;( r 1)( c 1) .
X 2
i 1 j 1
+
n11
n21
n.1
n12
n22
n.2
n1.
n2.
n
b
d
b+d
a+b
c+d
n
Vogliamo verificare lipotesi nulla che le popolazioni di origine dei due campioni abbiano la
stessa suddivisione dicotomica e che le differenze osservate con i dati campionari siano
dovute semplicemente al caso.
Ronald Fisher dimostr, basandosi sulla funzione densit della v.a. ipergeometrica, che la
probabilit di ottenere i valori in tabella si ricava dalla formula
a b c d
c c
P
n
a c
Questa formula d le probabilit esatte di osservare i valori a, b, c, d (dati a+b, a+c, c+d,
b+d) qualora fosse vera l'ipotesi nulla sopra enunciata.
Mantenendo fissi i totali marginali si fa variare verso 0 la frequenza osservata minore,
calcolando cio che la probabilit di ottenere quella tabella equivalga alla probabilit di
ottenere le risposte pi estreme. In questo modo si verifica se i valori osservati sono
eccessivamente diversi da quanto previsto dall'ipotesi nulla.
Nella pratica ci si regola in questo modo:
- si individua la cella con frequenza osservata minore e si calcola la probabilit di
ottenere esattamente la tabella osservata:
a b c d
c c
P
n
a c
a questo punto si diminuisce il valore della frequenza minore (ma non i totali
marginali) e si ricalcola la probabilit con la stessa formula.
- si continua fino ad avere zero per questa frequenza. Sommando tutti i valori di
probabilit ottenuti, si ottiene la probabilit che la tabella di frequenze osservate sia
dovuta al caso.