Sei sulla pagina 1di 88

STATISTICA

INFERENZIALE
Premessa importante: si ipotizza che il comportamento della popolazione rispetto ad
una variabile casuale X viene descritto attraverso una funzione parametrica di
probabilit pX (x | ) o di densit fX (x | ) di cui non si conosce . Non si conosco i dati
relativi a tutta la popolazione, ma solo quelli relativi ad un campione rappresentativo di n
unit: X1 = x1 , . . . , Xn = xn . Attraverso la conoscenza del campione si cerca di
stimare o di verificare la validit di alcune congetture per . Quindi linferenza un
processo attraverso il quale dal campione si deducono informazioni sulla popolazione ed
necessario valutare la qualit e la veridicit di tali informazioni.

Statistica, CLEM p. 1/88

Problema inferenziale (1)


Unazienda produce dei bulloni di ferro. Durante la produzione, capita che dei bulloni
prodotti siano difettosi e quindi vanno eliminati. Lazienda, per capire la qualit del suo
processo produttivo, vuole conoscere la proporzione p di prodotti difettosi in un mese.
Lazienda inoltre valuta che il processo produttivo buono se tale proporzione in un
mese p < 15%
Problema inferenziale:
stimare un valore per p
stimare un intervallo di valori per p
valutare se il processo produttivo buono o necessita di interventi per migliorie

Statistica, CLEM p. 2/88

Interpretazione del problema inferenziale (1)


C una variabile casuale binaria X = numero di pezzi difettosi in un mese (1:
difettoso; 0: non difettoso)
per conoscere la vera proporzione p di pezzi difettosi, basterrebbe osservare
tutta la POPOLAZIONE = tutti i pezzi prodotti in un mese classificandoli come 1
(difettosi) o 0 (non difettosi) e si calcola la proporzione, cio il PARAMETRO p
della popolazione
per vari motivi, non si pu osservare tutta la popolazione, ma un CAMPIONE
(x1 , . . . , xn ) di n bulloni prodotti in un mese
Dato il campione, si cerca di conoscere la popolazione:
STIMA PUNTUALE: stimare un valore per p
INTERVALLI DI CONFIDENZA: stimare un intervallo di valori per p
TEST DI IPOTESI: verificare che p < 0.15 per sincerarsi che il processo
produttivo buono

Statistica, CLEM p. 3/88

Problema inferenziale (2)


Consideriamo gli iscritti al primo anno del CLEM. Siamo interessati a conoscere laltezza
media dei maschi M e laltezza media delle femmine F . Inoltre vogliamo verificare
che in media i maschi sono pi alti delle femmine.
Problema inferenziale:
stimare due valori per F e M
stimare due intervalli di valori per F e M
verificare lipotesi che i maschi sono in media pi alti delle femmine

Statistica, CLEM p. 4/88

Interpretazione del problema inferenziale (2)


Ci sono due variabili casuali continue M = altezza dei maschi e F = altezza delle
femmine
per conoscere le vere altezze medie F e M , basterrebbe osservare la
POPOLAZIONE dei MASCHI = altezza di tutti i maschi iscritti al primo anno e la
POPOLAZIONE delle FEMMINE = altezza di tutte le femmine iscritte al primo
anno. Facendo le medie dei dati osservati, si ottengono i PARAMETRI F e M
delle due popolazioni
per vari motivi, non si possono osservare entrambe le popolazioni, ma due
CAMPIONI (m1 , . . . , mn ) e (f1 , . . . , fm ) rispettivamente di n e m dimensioni
Dati i due campioni, si cerca di conoscere i parametri di entrambe le popolazioni:
STIMA PUNTUALE: stimare due valori per M e F
INTERVALLI DI CONFIDENZA: stimare due intervalli di valori per M e F
TEST DI IPOTESI: verificare che M F > 0 per attestare che effettivamente i
maschi in media sono pi altri delle femmine

Statistica, CLEM p. 5/88

Perch il campione
Le indagini svolte sullintera popolazione sono dette censuarie poich svolte attraverso
dei CENSIMENTI. Ma spesso pu convenire osservare solo un sottoinsieme della
popolazione, cio un CAMPIONE
costi elevati di un censimento
tempi lunghi di un censimento
la popolazione pu essere infinita

Statistica, CLEM p. 6/88

Campione probabilistico
Un campione (X1 , . . . , Xn ) probabilistico quando nota la probabilit di ogni singola
unit di entrare a far parte del campione
PRIMA dellestrazione delle n unit il campione
(X1 , . . . , Xn )
una variabile casuale perch non sappiamo esattamente le unit che faranno
parte del campione
DOPO lestrazione delle n unit il campione (x1 , . . . , xn ) contiente delle
osservazioni e non pi una variabile casuale
(X1 = x1 , . . . , Xn = xn )

Statistica, CLEM p. 7/88

Campionamento casuale semplice


Un CAMPIONE (X1 , . . . , Xn ) detto CASUALE SEMPLICE quando ogni unit della
popolazione ha la stessa probabilit di entrare a far parte del campione. Consideriamo
due tecniche di campionamento
estrazione con reinserimento
estrazione senza reinserimento
Nel primo caso si ha un campione casuale semplice perch ogni unit mantiene la
stessa probabilit di entrare a far parte del campione. Nel secondo caso non si ha un
campione casuale semplice perch, a seguito di ogni estrazione, varia la probabilit
delle singole unit di entrare a far parte del campione.
Le differenze fra le due tecniche sono minime quando si hanno popolazioni molto grandi.
In generale consideriamo sempre CCS (campioni casuali semplici) ottenuti con
estrazione con reinserimento
estrazione senza reinserimento in grandi popolazioni

Statistica, CLEM p. 8/88

Struttura probabilistica del CCS


Data una popolazione per una variabile casuale X con distribuzione di probabilit
pX (x), un CCS, PRIMA dellestrazione, una successione di variabili casuali
X1 , . . . , X i , . . . , X n ,

i = 1, . . . , n

X1 , . . . , Xn sono i.i.d.
ogni Xi ha la stessa distribuzione di probabilit della popolazione p Xi (xi )
per lindipendenza, la distribuzione di probabilit del campione

pX1 ,...,Xn (x1 , . . . , xn ) =

n
Y

pXi (xi )

i=1

DOPO lestrazione, il campione non pi una variabile casuale, ma una


successione di osservazioni con cui fare inferenza sulla popolazione
x1 , . . . , x i , . . . , x n ,

i = 1, . . . , n

Statistica, CLEM p. 9/88

Come fare inferenza


Supponiamo di considerare una variabile casuale X= altezza ed ipotizziamo
X N (, 2 ).
effettuiamo un CCS {X1 , . . . , Xn }
osserviamo n unit {x1 , . . . , xn }

Cerchiamo un criterio per utilizzare i dati del CAMPIONE per fare inferenza sui
PARAMETRI media e varianza 2 della POPOLAZIONE

Cerchiamo degli indicatori sintetici da calcolare nel campione che possono darci
informazioni sui parametri

STATISTICHE CAMPIONARIE

Statistica, CLEM p. 10/88

Statistica campionaria
Una statistica campionaria T (X1 , . . . , Xn ) una funzione che dipende solo dai dati del
campione e non da variabili incognite. Dato un CCS {X 1 , . . . , Xn }
1 P2
la media campionaria: X = n
i=1 Xi
1 Pn
2
la varianza campionaria: S 2 = n1
i=1 (Xi X) oppure
1 Pn
2

S =
(Xi X)2
n

i=1

la mediana campionaria

semisomma dei valori estremi: (Xmax Xmin )/2


...

Struttura probabilistica della statistica campionaria


PRIMA dellestrazione del campione T (X1 , . . . , Xn ) una variabile casuale
ottenuta come combinazioni di variabili casuali Xi la cui funzione di distribuzione
quella della popolazione
DOPO lestrazione del campione, T (x1 , . . . , xn ) = t non una variabile casuale,
ma il valore t che la statistica campionaria assume nel campione estratto.

Statistica, CLEM p. 11/88

Stimatore di un parametro
Lo stimatore una statistica campionaria T (X1 , . . . , Xn ) che viene utilizzata per
stimare (dedurre informazioni) il parametro della popolazione.
Esempio. Sia X Be(p). Sia {x1 , . . . , xn } un CCS osservato del tipo {1, 0, 0 . . . , 1}.
Si vuole trovare uno stimatore per p, parametro che rappresenta la proporzione di
successi nella popolazione. Un possibile stimatore la statistica campionaria
n
1X
p =
xi
n i=1

Esempio. Sia X N (0, 2 ). Sia {x1 , . . . , xn } un CCS osservato. Si vuole trovare uno
stimatore per 2 , parametro che rappresenta la variabilit nella popolazione. Possibili
stimatori sono
n
1X
(xi 0)2 ,
S =
n i=1

n
1 X
S =
(xi 0)2 ,
n 1 i=1
2

T = (Xmax Xmin )/2

Statistica, CLEM p. 12/88

Come si sceglie lo stimatore?


si devono studiare le propriet degli stimatori e scegliere quello con le propriet
pi desiderabili
per conoscere le propriet degli stimatori necessario conoscere la loro struttura
probabilistica, cio la loro distribuzione di probabilit
dato che nota la distribuzione di probabilit della popolazione, si pu dedurre
anche la distribuzione di probabilit di una statistica campionaria, poich questa
funzione del CCS {X1 , . . . , Xn } composto di var. casuali i.i.d.
Alcune propriet di uno stimatore
correttezza
efficienza
consistenza

Statistica, CLEM p. 13/88

Correttezza di uno stimatore (1)


Sia X una variabile casuale con distribuzione di probabilit p X (x | ) con parametro .
Sia T una funzione del campione {X1 , . . . , Xn } usata come stimatore di . Se pT (t | )
la distribuzione di probabilit dello stimatore T , questo corretto o non distorto se
E(T ) =
Esempio. Sia T = X la media campionaria usata come stimatore di . Se T corretto,
significa che in media riproduce il valore di :
si estraggono m = 1000 campioni {x1 , . . . , xn }

in ogni campione si calcola la media campionaria x1 , . . . , xm


la media di tutte le medie uguale a
m
1 X
xj =
m j=1

Statistica, CLEM p. 14/88

Correttezza di uno stimatore (2)


4

T1

T2

densit

theta = 1.6
3 T 1 corretto
T 2 non corretto

0
1

1.2

1.4

1.6
T

1.8

2.2
Statistica, CLEM p. 15/88

Efficienza di uno stimatore (1)


Sia X una variabile casuale con distribuzione di probabilit p X (x | ) con parametro .
Siano T1 e T2 due possibili stimatori di . Se pT1 (t1 | ) pT2 (t2 | ) sono le distribuzioni
di probabilit dei due stimatori, T1 pi efficiente di T2
V(T1 ) < V(T2 )
Esempio. Siano T1 = X la media campionaria e T2 = M e la mediana campionaria,
due stimatori di . X pi efficiente di M e se meno variabile:
si estraggono m = 1000 campioni {x1 , . . . , xn }

in ogni campione si calcolano i due stimatori x1 , . . . , xm , me1 , . . . , mem


2 e 2 per entrambe le successioni di stimatori
si calcolano la varianze T
T2
1

la media campionaria pi efficiente delle mediana campionaria se


2
2
T
<

T
1
2

N.B. Lefficienza di uno stimatore definita in termini relativi (rispetto ad altri stimatori) e
non in termini assoluti.
Statistica, CLEM p. 16/88

Efficienza di uno stimatore (2)


8

densit

T1
VAR(T1) < VAR(T2)

0
1

T2

1.2

1.4

1.6
T

1.8

2.2
Statistica, CLEM p. 17/88

Errore quadratico medio (1)


Lerrore quandratico medio di uno stimatore T di un parametro considera
congiuntamente sia lefficienza sia la distorsione dello stimatore
M SE(T ) = E(T )2 = V(T ) + D(T )2
dove D(T ) = E(T ) . Se uno stimatore corretto, D(T ) = 0, quindi lerrore
quadratico medio coincide con la varianza
M SE(T ) = V(T ),

per stimatori non distorti

Siano T1 e T2 due possibili stimatori di . Lo stimatore T1 migliore di T2 se


M SE(T1 ) < M SE(T2 )
Se T1 e T2 sono due stimatori corretti di , si ritorna alla definizione di efficienza, per cui
lo stimatore T1 migliore di T2 se
V(T1 ) < V(T2 )
Statistica, CLEM p. 18/88

Errore quadratico medio (2)


Anche se T1 distorto, comunque migliore di T2 perch ha una maggiore efficienza.

T1

densit

theta = 1.60
E(T1) = 1.70
E(T2) = 1.60
6 V(T1) < V(T2)
MSE(T1) < MSE(T2)

2
T2

0
1

1.2

1.4

1.6
T

1.8

2.2
Statistica, CLEM p. 19/88

Consistenza (1)
La consistenza una propriet asintotica, nel senso che vale per campioni molto grandi,
cio quando n .
Indichiamo con Tn lo stimatore calcolato su campioni di dimensioni n. Uno stimatore T n
di un parametro consistente quando
lim P (| Tn |< ) = 1,

 un numero piccolissimo positivo

Questo significa che quando il campione molto grande


tende ad 1 la probabilit che la stima Tn = t cade in un intervallo molto piccolo
del parametro
la stima Tn = t ottenuta attraverso uno stimatore consistente molto vicina al
valore vero del parametro .

Statistica, CLEM p. 20/88

Consistenza (2)
40
35
30
densit

25

theta = 1.60
n = 50
n = 100
n = 200

20
15
10
5
0

1.3

1.4

1.5

1.6
T

1.7

1.8

1.9

Statistica, CLEM p. 21/88

La distribuzione degli stimatori


Dato uno stimatore Tn , per conoscere le sue propriet necessario conoscere la sua
distribuzione di probabilit.
Studiamo la distribuzione di probabilit e le propriet dei seguenti stimatori
1 Pn
X= n
i=1 Xi
1 Pn
2
S 2 = n1
i=1 (Xi X)
1 Pn
2
S2 = n
i=1 (Xi X)
P
p = n
i=1 Xi , quando X una variabile binaria discreta (0, 1)

Statistica, CLEM p. 22/88

La distrib. della media campionaria X (1)


Sia X una variabile casuale con E(X) = e V(X) = 2 e sia {X1 , . . . , Xn } un CCS
con variabili i.i.d.
Consideriamo la variabile casuale media campionaria
n
1X
X=
Xi
n i=1

dato che il campione CS costituito di variabili i.i.d.


n
1 Pn
E(X) = n
E(X
)
=
= : X uno stimatore CORRETTO di
i
i=1
n
Pn
n 2
2
V(X) = n12
V(X
)
=
=
i
i=1
n
n2
N.B. Notare che la media campionaria X ha una variabilit inferiore alla variabile X
2
V(X) =
n

<

V(X) = 2

Statistica, CLEM p. 23/88

La distrib. della media campionaria X (2)


Se X una variabile casuale normale, X N (, 2 ) e se {X1 , . . . , Xn } un
CCS, la media campionaria
n
1X
X=
Xi
n i=1
una combinazione di variabili casuali i.i.d. Per le propriet della normale
X N (, 2 /n)
Se X variabile casuale qualsiasi con E(X) = e V(X) = 2 , la media
campionaria sempre una combinazione di variabili i.i.d., ma potremmo non
conoscere la distribuzione esatta di X

ma se il campione abbastanza grande, per il TLC (teorema del limite centrale),


la distribuzione di X si approssima con una distribuzione normale
X N (, 2 /n)
Statistica, CLEM p. 24/88

La media campionaria per una pop. normale


20
T = media campionaria

18
16
14

densit

12
T = N(1.60, 0.2/10)

10

X = N(1.60, 0.2)

8
6
4
X

2
0
1

1.5

2.5
Statistica, CLEM p. 25/88

La distribuzione della stat. campionaria S2


Sia X una variabile casuale normale N (, 2 ) e sia {X1 , . . . , Xn } un CCS con variabili
i.i.d.. Consideriamo la statistica campionaria
n
1X
S =
(Xi X)2
n i=1

dato che il campione CS costituito da variabili i.i.d., si dimostra che


nS2
2(n1) ,
2

N.B. solo se X N

da cui si pu facilmente verificare che S2 uno stimatore DISTORTO di 2


nS2
E( 2 ) = n 1,

E(S2 ) =

n1 2
< 2
n

Quindi lo stimatore distorto S2 tende a sottostimare 2 .

Statistica, CLEM p. 26/88

La distribuzione della stat. campionaria S 2


Sia X una variabile casuale normale N (, 2 ) e sia {X1 , . . . , Xn } un CCS con variabili
i.i.d.. Consideriamo la statistica campionaria
n
1 X
S =
(Xi X)2
n 1 i=1
2

dato che il campione CS costituito da variabili i.i.d., si dimostra che


(n 1)S 2
2

(n1) ,
2

N.B. solo se X N

da cui si pu facilmente verificare che S 2 uno stimatore CORRETTO di 2


(n 1)S 2
E(
) = n 1,
2

E(S 2 ) =

n1 2
= 2
n1

Quindi si predilige S 2 come stimatore della varianza 2 .

Statistica, CLEM p. 27/88

La distrib. di (n 1)S 2 / 2 per pop. normali


Distribuzione della varianza campionaria

0.12

0.1
chiquadrato
n1 gradi di libert

densit

0.08

0.06

0.04

0.02

0
0

10

15

20

25

30
Statistica, CLEM p. 28/88

La distrib. della proporzione campionaria p


Sia X una variabile casuale binaria X Be(p) con E(X) = p e V(X) = p(1 p) e sia
{X1 , . . . , Xn } un CCS con variabili i.i.d.
Consideriamo la variabile casuale p = proporzione campionaria di successo
n
1X
p =
Xi
n i=1

dato che il campione CS fatto variabili i.i.d. Xi Be(p),


p Bin(n, p)
Pn

E(
p) =

1
n

V(
p) =

1
n2

np
E(X
)
=
= p: p uno stimatore CORRETTO di p
i
i=1
n
Pn
np(1p)
p(1p)
=
2
i=1 V(Xi ) =
n
n

N.B. Se il campione molto grande, per il TLC p si approssima con una normale
p N (p,

p(1 p)
)
n
Statistica, CLEM p. 29/88

La distrib. approssimata di p per vari n


Densit approssimata della proporzione camp.
160 p = 0.4
p(1p) = 0.24
140 n = 100

densit

120

N(0.4, 0.24/100)

n = 50

N(0.4, 0.24/50)

n = 30

N(0.4, 0.24/30)

100
80
60
40
20
0
0.35

0.4
Statistica, CLEM p. 30/88

Stima puntuale
Sia X distribuita con una legge di probabilit pX (x | ) o funzione di densit fX (x | ).
Sia T (X) uno stimatore di e {X1 , . . . , Xn } un CCS. Una volta estratto il campione
X1 = x1 , . . . , X n = xn
la stima puntuale il valore assunto dallo stimatore nel campione
T (x1 , . . . , xn ) = t
Si assume t come stima per .
Laccuratezza della stima puntuale dipende dallerrore standard della stima
SE(T ) =

V(T )

Statistica, CLEM p. 31/88

Stima puntuale della media


Sia X N (, 2 ). Supponiamo che 2 sia noto e lunico parametro . Una volta
estratto il campione
X1 = x1 , . . . , X n = xn
la stima puntuale
n
1X
x=
xi
n i=1

e laccuratezza della stima di

SE(x) =
n
dato che V(X) =

2
n

Statistica, CLEM p. 32/88

Stima puntuale di una proporzione


Sia X Be(p) di parametro p. Una volta estratto il campione
X1 = x1 , . . . , X n = xn
la stima puntuale di p

e laccuratezza della stima

n
1X
pb =
xi
n i=1

SE(b
p) =
dato che V(b
p) =

p(1p)
n

pb(1 pb)
n

Statistica, CLEM p. 33/88

Stima per intervallo (1)


A volte, piuttosto che stimare il parametro con un unico valore (stima puntuale), si
preferisce stimare un intervallo di valori plausibili per il parametro: un intervallo di
confidenza (o fiduciario).
La stima per intervallo si basa su:
uno stimatore T per il parametro
la distribuzione di probabilit pT (t | ) dello stimatore T

un livello di confidenza = una probabilit che indica laffidabilit della stima


un intervallo di confidenza: un insieme di valori per

Statistica, CLEM p. 34/88

Stima per intervallo (2)


Sia X una variabile casuale per la popolazione con parametro non noto. Sia T uno
stimatore corretto di , E(T ) = , e {X1 , . . . , Xn } un CCS.
PRIMA dellestrazione del campione, T una variabile casuale che consideriamo
standardizzata e per la quale possiamo definire un intervallo (a, b) tale che
P (a

T
b) = 1 ,
SE(T )

con abbastanza piccolo

P (T a SE(T ) T + b SE(T )) = P (a0 b0 ) = 1


Gli estremi dellintervallo (a0 , b0 ) dipendono da T e sono anche loro variabili casuali.
= P [
/ (a0 , b0 )],

1 = P [ (a0 , b0 )]

= probabilit di estrarre un certo campione in cui T = t da cui deriva un intervallo


[t a SE(t), t + b SE(T )] che non contiene il parametro , quindi produce una
stima per intervallo errata

Statistica, CLEM p. 35/88

Intervallo di confidenza
PRIMA dellestrazione del campione,
P (T v T + k) = 1 ,

v = a SE(T ),

k = b SE(T )

(T v, T + k) un intervallo i cui estremi sono variabili casuali

1 = probabilit si estrarre un certo campione in cui T = t da cui deriva una


stima per intervallo intervallo (t v, t + k) che contiene il parametro .

DOPO lestrazione del campione CS {x1 , . . . , xn }

(t v, t + k) lintervallo di confidenza i cui estremi sono valori certi, non pi


variabili casuali
per un molto piccolo {0.10, 0.05, 0.01}, abbiamo che la probabilit a priori di
estrarre un campione che genera un intervallo che non contiene bassissma,
perci confidiamo nel fatto che
(t v, t + k)

Statistica, CLEM p. 36/88

Intervallo di confidenza (2)


Consideriamo una variabile casuale X N (, 1) con varianza nota. Sia {X 1 , . . . , Xn }
un CCS e sia T N (, 1/n) lo stimatore media campionaria per il parametro . Se
= 0.05 = 5%,
p
p
T
P (a p
b) = P (T a 1/n T + b 1/n) = 0.95 = 95%
1/n

In pratica, supponiamo di estrarre 1000 campioni:

950 di questi campioni generano una stima T = t tale che la stima per intervallo
corretta
p
p
(t a 1/n, t + b 1/n)

50 di questi campioni generano una stima T = t tale che la stima per intervallo
errata
p
p

/ (t a 1/n, t + b 1/n)

Statistica, CLEM p. 37/88

Come si scelgono a e b?
Consideriamo = 0.10
T
P (a p
b) = P (a Z b) = 90%
1/n

Ci sono tantissimi intervalli (a, b) che soddisfano quella condizione

P (2.05 Z 1.41) = P (1.48 Z 1.88) = P (1.64 Z 1.64) = 90%


Lintervallo di confidenza migliore di solito quello simmetrico, cio quello per cui la
probabilit = 10% si divide a met
P (1.64 Z 1.64) = 90%
P (Z 1.64) = /2 = 5%,

P (Z < 1.64) = /2 = 5%

Statistica, CLEM p. 38/88

Alcuni intervalli per = 0.10


Quello in rosso lintervallo simmetrico (1.64, 1.64)
Int. Confidenza, alpha = 10%

0.4

IC = (2.05, 1,41)

alpha = 2% + 8%
0.35 alpha = 5%+ 5%
0.3

IC = (1.64, 1,64)

alpha = 7% + 3%

IC = (1.48, 1,88)

densit

0.25
0.2
0.15
0.1
0.05
0
4

0
Z

4
Statistica, CLEM p. 39/88

Intervallo di confidenza simmetrico


Consideriamo una variabile casuale X N (, 1) con varianza nota. Sia {X 1 , . . . , Xn }
un CCS e sia T N (, 1/n) lo stimatore media campionaria per il parametro .
Lintervallo di confidenza simmetrico si ottiene
P (z/2

p
p
T
p
z/2 ) = P (T z/2 1/n T + z/2 1/n) = 1
1/n

Se = 0.05, z0.025 = 1.96 e z0.025 = 1.96. Lintervallo di confidenza casuale


(T 1.96
poich

p
p
1/n, T + 1.96 1/n)

T
P (1.96 p
1.96) = 1 5% = 95%
1/n

Una volta estratto un campione {x1 , . . . , xn } in cui T = t, la stima per intervallo del
parametro data dallintervallo di confidenza
(t 1.96

1/n, t + 1.96

1/n)
Statistica, CLEM p. 40/88

Alcuni valori z/2 per una normale standard


0.4

0.4
0.35

Normale Standard

0.35

0.3

0.3

0.25

0.25

0.2

0.2

90%

0.15

0.1

0.05

0.05

5%

5%
2
1.64

95%

0.15

0.1

0
3

Normale Standard

0
3

1.64

2.5%

2.5%
2

1.96

1.96

0.4
Normale Standard

0.35
0.3
0.25
0.2

99%

0.15
0.1
0.05

0.5%

0.5%

0
3

2
2.57

3
2.57

Statistica, CLEM p. 41/88

IC per la media in caso di varianza nota


IC per di pop. normale con varianza nota
Sia X N (, 2 ) con varianza 2 nota

Sia X N (, 2 /n) lo stimatore per il parametro


Sia {x1 , . . . , xn } un CCS estratto in cui X = x

Lintervallo di confidenza simmetrico

(x 1.64 / n, x + 1.64 / n), per = 10%

(x 1.96 / n, x + 1.96 / n), per = 5%

(x 2.57 / n, x + 2.57 / n), per = 1%


IC per di pop. non normale con varianza nota e grandi campioni
Gli stessi intervalli si possono usare per ottenere IC asintotici per il parametro
E(X) = anche per variabili casuali X NON NORMALI, ma solo nel caso di
GRANDI CAMPIONI (n abbastanza grande). Poich, per il teorema del limite
centrale
n
1X
X=
Xi si approssima con N (, 2 /n) per n grande
n i=1

Statistica, CLEM p. 42/88

Stima giusta o errata?


IC rossi sono stime errate di generate da campioni in cui t = x poco probabile
2

Stime per intervallo corrette ed errate


T

1.8
1.6

t = 0.90

1.4
t = 2.10

1.2
1

t = 1.40

0.8
0.6

t = 1.80

0.4
0.2
0
0.5

1.5
mu = 1.60

2.5
Statistica, CLEM p. 43/88

IC per la media con varianza non nota (1)


IC per di pop. normale con varianza non nota
Sia X N (, 2 ) con varianza 2 non nota
1 Pn
2
2
usiamo S 2 = n1
i=1 (Xi X) come stimatore di

Sia X lo stimatore per il parametro , se X N , si dimostra che


X
tn1 ,
S/ n

t Student con n 1 g.l.

Sia {x1 , . . . , xn } un CCS estratto in cui X = x e S 2 = s2

Lintervallo di confidenza simmetrico

(x t(n1),/2 s/ n, x + t(n1),/2

s/ n)

(x 1.83 s n, x + 1.83 s/ n), per = 10% e n = 10

(x 2.26 s/ n, x + 2.26 s/ n), per = 5% e n = 10

(x 3.25 s/ n, x + 3.25 s/ n), per = 1% e n = 10


Statistica, CLEM p. 44/88

IC per la media con varianza non nota (2)


IC per di pop. non normale con varianza non nota e grandi campioni
Nel caso di grandi campioni, sia che X sia normale sia che X sia non normale,
per il teorema del limite centrale
X

S/ n

si approssima con N (0, 1)

Lintervallo di confidenza asintotico e simmetrico per quindi

(x z/2 s/ n, x + z/2 s/ n)
Ad esempio, con n = 10 con = 5%, IC per

(x 1.96 s/ n, x + 1.96 s/ n)

Statistica, CLEM p. 45/88

IC per la proporzione p in grandi campioni


Sia X Be(p) una variabile binaria (0, 1) e sia {X1 , . . . , Xn } un CCS
1 Pn
Sia pb = n
i=1 Xi lo stimatore per il parametro p. Per il teorema del limite
centrale
pb p
q
si approssima con N (0, 1)
p
b(1b
p)
n

Sia {x1 , . . . , xn } un GRANDE CAMPIONE estratto in cui si calcola pb

Lintervallo di confidenza asintotico e simmetrico


(b
p z/2
(b
p 1.64
(b
p 1.96
(b
p 2.57

p
b(1b
p)
,
n

p
b(1b
p)
,
n

p
b(1b
p)
,
n

pb(1 pb)
, pb + z/2
n

pb + 1.64
pb + 1.96
pb + 2.57

pb(1 pb)
)
n

p
b(1b
p)
),
n

per = 10%

p
b(1b
p)
),
n

per = 1%

p
b(1b
p)
),
n

per = 5%

Statistica, CLEM p. 46/88

IC per la varianza 2 in pop. normali (1)


IC per 2 di pop. normale con non nota
Sia X N (, 2 ) con non nota
1 Pn
2
2
usiamo S 2 = n1
i=1 (Xi X) come stimatore di . Si ha che
(n 1)S 2
2

n1 ,
2

chi-quadrato con n 1 g.l.

per un certo
P [2(n1),1/2

(n 1)S 2

2(n1),/2 ] = 1
2

P [(n 1)S 2 /2(n1),/2 2 (n 1)S 2 /2(n1),1/2 ] = 1


Sia {x1 , . . . , xn } un CCS estratto in cui S 2 = s2

Lintervallo di confidenza simmetrico

[(n 1)s2 /2(n1),/2 , (n 1)s2 /2(n1),1/2 ]


Statistica, CLEM p. 47/88

IC per la varianza 2 in pop. normali (2)


(9s2 /16.92, 9s2 /3.33), per = 10% e n = 10
(9s2 /19.02, 9s2 /2.70), per = 5% e n = 10
(9s2 /23.59, 9s2 /1.73), per = 1% e n = 10

IC per 2 di pop. normale con nota


Se X N (, 2 ) dove nota, la differenza che
(n 1)S 2
2

n,
2

chi-quadrato con n g.l.

quindi, per un certo valore s2 ed un certo , IC simmetrico per 2


[(n 1)s2 /2n,/2 , (n 1)s2 /2n,1/2 ]

Statistica, CLEM p. 48/88

Quantili 29,/2 e 29,1/2


Chiquadro con 9 gradi di libert

0.12

IC 90%

0.1

IC 95%
IC 99%

0.08

0.06

0.04

0.02

0
0

10

15

20

25

30
Statistica, CLEM p. 49/88

IC per X Y : pop. normali, var. note


2 ) e Y N ( , 2 ), con X
IC per X Y con X N (X , X
Y
Y
Y
2 e 2 note
Siano le varianze X
Y
2 /n) e Y N ( , 2 /m) gli stimatori di
Siano X N (X , X
Y
X e Y
Y

Siano {x1 , . . . , xn } e {y1 , . . . , ym } due CCS indipendenti in cui X = x e Y = y

Per lindipendenza si ha che

(X Y ) (X Y )
q 2
N (0, 1)
2
X
Y
+ m
n
Lintervallo di confidenza simmetrico
q 2
q 2
2
X
Y
X
[(x y) 1.64
+
,
(x

y)
+
1.64

+
n
m
n
q 2
q 2
2
X
Y
X
[(x y) 1.96
+
,
(x

y)
+
1.96

+
n
m
n
q 2
q 2
2
X
Y
X
[(x y) 2.57
+
,
(x

y)
+
2.57

+
n
m
n

2
Y
m

], per = 10%

2
Y
m

], per = 5%

2
Y
m

], per = 1%

Statistica, CLEM p. 50/88

IC per X Y : pop. normali, var. non note


2 ) e Y N ( , 2 ), con X
IC per X Y con X N (X , X
Y
Y
Y
2 = 2 (omoschedasticit)
Siano le varianze non note ma uguali 2 = X
Y

Assumiamo come stimatore per la varianza comune


Sp2

2 + (m 1)S 2
(n 1)SX
Y
=
n+m2

2 /n) e Y N ( , 2 /m) gli stimatori di


Siano X N (X , X
Y
X e Y
Y

Siano {x1 , . . . , xn } e {y1 , . . . , ym } due CCS indipendenti in cui X = x e Y = y

Se X ed Y sono normali ed indipendenti si ha che


(X Y ) (X Y )
q
tk ,
1
1
2
Sp ( n + m )

k =n+m2

Lintervallo di confidenza simmetrico


[(x y) tk,/2

1
1
s2p ( + ), (x y) + tk,/2
n
m

s2p (

1
1
+ )]
n
m
Statistica, CLEM p. 51/88

IC per X Y per grandi campioni (1)


IC per X Y per popolazioni non normali con varianze note e grandi campioni
Anche se X ed Y sono NON NORMALI, ma INDIPENDENTI, per costruire
intervalli di confidenza per il parametro X Y si pu comunque utilizzare la
distribuzione Normale, ma solo nel caso di GRANDI CAMPIONI, poich, per il
teorema del limite centrale
(X Y ) (X Y )
q 2
2
X
Y
+ m
n

si approssima con N (0, 1) per n ed m grandi

Lintervallo di confidenza asintotico e simmetrico

[(x y) z/2

2
X

2
Y

, (x y) + z/2

2
X

2
Y

Statistica, CLEM p. 52/88

IC per X Y per grandi campioni (2)


IC per X Y per popolazioni non normali con varianze non note e grandi campioni
2 ed S 2 come stimatori corretti per 2 e 2
Consideriamo SX
Y
X
Y

Anche se X ed Y sono NON NORMALI, ma INDIPENDENTI, per costruire


intervalli di confidenza per il parametro X Y si pu comunque utilizzare la
distribuzione Normale, ma solo nel caso di GRANDI CAMPIONI, poich, per il
teorema del limite centrale
(X Y ) (X Y )
q 2
2
SX
SY
+ m
n

si approssima con N (0, 1) per n ed m grandi

Lintervallo di confidenza asintotico e simmetrico

[(x y) z/2

s2X
n

s2Y
m

, (x y) + z/2

s2X
n

s2Y
m

Statistica, CLEM p. 53/88

Decisioni in condizioni di incertezza


Unazienda che produce pezzi di ricambio per auto ha acquistato un nuovo macchinario
per realizzare tali pezzi in una lega pi leggera di alluminio. Vuole testare e valutare il
nuovo processo produttivo sulla base dei pezzi prodotti. Valuta che
in media i pezzi dovrebbero pesare = 1.5 kg
se i pezzi pesano in media pi o meno di 1.5 kg, il processo produttivo va
fermato e revisionato.
La decisione si basa su un campione scelto casualmente di n = 50 pezzi prodotti: come
si fa a prendere una decisione?
1. si osserva il peso dei 16 pezzi x1 , . . . , x16 , si calcola la media e, se x 6= 1.5,
allora si decide di fermare il processo produttivo
2. dato che non si conosce lintera popolazione, la decisione deve tenere conto
dellincertezza dovuta alla stima campionaria: x pu essere diverso da 1.5 nel
campione, ma la media nella popolazione potrebbe comunque essere 1.5
3. per decidere se fermare o no la produzione sulla base del campione,
necessario definire una regola che tiene conto dellerrore campionario x

Statistica, CLEM p. 54/88

Verifica di ipotesi
Sia X un certo fenomeno casuale oggetto di interesse (peso dei pezzi prodotti) di cui si
conosce la famiglia di distribuzione di probabilit pX (x | ) o fX (x | ), ma non si
conosce il valore del parametro .
Si vuole verificare una certa ipotesi su sulla base di un campione di osservaioni. La
verifica di ipotesi si basa su:
uno stimatore T per
la distribuzione fT (t | ) dello stimatore T
lipotesi nulla H0 : = 0
lipotesi alternativa H1
semplice: H1 : = 1
unidirezionale: H1 : > 0 o H1 : < 0
bi-direzionale: H1 : 6= 0

una regola per prendere una decisione sulla base del campione estratto:
accettare H0 o rifiutare H0
la probabilit di commettere un errore nel prendere una decisione: rifiutare H 0
anche se vera.
Statistica, CLEM p. 55/88

Sistema di ipotesi
Lipotesi nulla H0 : = 0 esprime ci che ci interessa verificare. Nellesempio
precedente:
H0 : = 15
Lipotesi alternativa H1 smentisce lipotesi nulla ed indica altri possibili valori per
diversi da 0 . Nellesempio precedente:
H1 : = 30 o H1 : > 15 o H1 < 15 o H1 6= 15
Esempio:
Sia X = il peso dei pezzi prodotti e sia x1 , . . . , x16 un campione di 50 pezzi osservati.
Assumiamo che X N (, 4) con non nota. Prendiamo X come stimatore di :
X N (, 4/16)
Dato che nel campione osservato x = 14, serve una REGOLA per decidere se
accettare H0 : = 15 e non fermare il processo produttivo
rifiutare H0 poich 6= 15 e fermare il processo produttivo
Statistica, CLEM p. 56/88

Regola decisionale (1)


Sia lo spazio campionario, cio linsieme di tutti i possibili campioni x 1 , . . . , xn
che si possono estrarre
La regola va definita sullo spazio il quale viene diviso in due parti disgiunte ed
esaustive, = A R, A R =
A: linsieme dei campioni per cui si accetta H0
R: linsieme dei campioni per cui si rifiuta H0
Consideriamo il sistema di ipotesi
H0 : = 0 , H1 : 6= 0 .
e lo stimatore T di che in ogni campione x1 , . . . , xn assume un certo valore t. La
regola dovrebbe essere definita in modo tale che
per ogni campione contenuto in A, t deve essere abbastanza vicino a 0
per ogni campione contenuto in R, t deve essere abbastanza diverso da 0

Statistica, CLEM p. 57/88

Regola decisionale (2)


La regola deve essere definita in modo tale che campioni che producono stime T = t per
il parametro molto vicine (diverse) a 0 portano ad accettare (rifiutare) lipotesi nulla H0

Si considera la distribuzione di probabilit fT (t | 0 ) dello stimatore T quando


vera H0
sulla base di fT (t | 0 ), la regola definisce

A: zona di accettazione, cio i valori di T per cui si accetta H 0


R: zona di rifiuto o zona critica, cio i valori di T per cui si rifiuta H 0

se H0 vera, A un insieme di valori di T molto probabili secondo la funzione


fT (t | 0 )
se H0 vera, R un insieme di valori di T poco probabili secondo la funzione
fT (t | 0 )

Statistica, CLEM p. 58/88

Zona R di rifiuto e zona di A accettazione


Sia X N (, 4) e X N (, 4/16) lo stimatore di . Vogliamo verificare lipotesi
H0 : = 15, contro H1 : 6= 15
1.6

Distribuzione della media camp. sotto lipotesi nulla

1.4
1.2

densit

1
0.8
0.6
0.4

0.2
0
13

13.5

14

14.5
15
15.5
media campionaria

16

16.5

17

A: insieme di molto probabili e R: insieme di poco probabili se vera H0


Statistica, CLEM p. 59/88

Livello di significativit e valori critici


Il livello di significativit una probabilit da cui derivano i valori critici x /2 che
delimitano la zona di rifiuto (zona critica) R e di accettazione A
Distribuzione della media camp. sotto H0

1.6

H0
1.4

alpha = 10%

14.5 = valore critico


1.2 15.5 = valore critico

densit

1
0.8
0.6
0.4
0.2
0
13

13.5

5%

90%

A
14

14.5
15
15.5
media campionaria

5%

R
16

16.5

17

x/2 = (14.5, 15.5)

R : (, 14.5) (15.5, +) P (X R) = 0.10 = : prob. di rifiutare H0


A : (14.5, 15.5) P (X A) = 0.90 = 1 : prob. di accettare H0

Statistica, CLEM p. 60/88

Errori di I e II tipo
R : (, 14.5) (15.5, +),

A : (14.5, 15.5)

Se estraggo un campione x1 , . . . , x16 in cui = 14.8, ACCETTO H0 perch


x A. Se
se H0 vera prendo una decisione corretta
se H0 falsa prendo una decisione errata
Se estraggo un campione x1 , . . . , x16 in cui x = 15.9, RIFIUTO H0 perch
x R. Se
se H0 vera prendo una decisione errata

se H0 falsa prendo una decisione corretta


Nel prendere queste decisioni si possono commettere due errori:
ERRORE di I tipo: rifiuto H0 ma vera
ERRORE di II tipo: accetto H0 ma falsa

Statistica, CLEM p. 61/88

Errore di I tipo
Se estraggo un campione con x = 15.9 o con x = 13.9, questi valori sotto H 0 sono poco
plausibili, mentre sono pi plausibili sotto H1 : RIFIUTO H0
1.6

Distribuzione della media camp. sotto H0 e H1


H0

H1

H1

1.4
1.2

densit

1
0.8
0.6
0.4
0.2
0
13

13.5

R
14

14.5
15
15.5
media campionaria

16

16.5

17

se H0 falsa ho preso una giusta decisione


se H0 vera ho commesso un ERRORE DI I TIPO
Statistica, CLEM p. 62/88

Errore di II tipo
Se estraggo un campione con x = 14.8, questo valore sotto H 0 molto plausibile,
mentre poco plausibile sotto H1 : ACCETTO H0
1.6

Distribuzione della media camp. sotto H0 e H1


H0

H1

H1

1.4
1.2

densit

1
0.8
0.6
0.4
0.2
0
13

13.5

R
14

14.5
15
15.5
media campionaria

16

16.5

17

se H0 falsa ho commesso un ERRORE DI II TIPO


se H0 vera ho preso una giusta decisione
Statistica, CLEM p. 63/88

Test unidirezionale semplice (1)


Verifica di ipotesi unidirezionale semplice con = 10%
H0 : = 15 H1 : = 15.6
Il valore critico x = 15.3 e la zona di rifiuto o critica x > 15.3
1.6

H1

H0
1.4

alpha = 10%

1.2

densit

1
0.8
0.6
0.4
0.2
0
14

A
14.5

15

15.3

15.5

16

Statistica, CLEM p. 64/88

Test unidirezionale semplice (2)


Verifica di ipotesi unidirezionale semplice con = 5%
H0 : = 15 H1 : = 14.3
Il valore critico x = 14.5 e la zona di rifiuto o critica x < 14.5
1.6
H1

H0

1.4
alpha = 5%
1.2

densit

1
0.8
0.6
0.4

0.2
0
14

14.5

15

15.5

16

Statistica, CLEM p. 65/88

Probabilit dell errore di I e II tipo


PRIMA di estrarre il campione posso calcolare la probabilit di decisioni errate.
P (Errore I tipo) = P (X R | H0 vera) =

P (Errore II tipo) = P (X A | H0 falsa) = P (X A | H1 vera) =

PRIMA di estrarre il campione posso calcolare la probabilit di decisioni corrette


P (X A | H0 vera) = 1

P (X R | H1 vera) = 1 : potenza del test


DOPO lestrazione del campione, si ha un valore preciso X = x per il quale si confida
nella decisione presa
ACCETTO H0 se x A o
RIFIUTO H0 se x R

sulla base della zona di rifiuto o critica stabilita secondo un livello di significativit

Statistica, CLEM p. 66/88

H0 : = 15 H1 : = 15.6

x = 15.3

1.6
1.4

H0

alpha = 10%

H1

beta = 32%
1.2
1
0.8
0.6
0.4
A

0.2
0
13.5

14

14.5

15

15.3

15.5

16

P (X R | H0 ) = P (X > 15.3 | = 15) = = 0.10: prob. errore I tipo


P (X A | H1 ) = P (X < 15.3 | = 15.6) = = 0.32: prob. errore II tipo
P (X A | H0 ) = P (X < 15.3 | = 15) = 1 = 0.90:
P (X R | H1 ) = P (X > 15.3 | = 15.6) = 1 = 0.78: potenza del test
Statistica, CLEM p. 67/88

Test unidirezionale composto (1)


Verifica di ipotesi unidirezionale semplice con = 5%
H0 : = 15 H1 : > 15 (lipotesi H1 non semplice, definita per ogni > 15)
Il valore critico x = 15.3 e la zona di rifiuto o critica x > 15.3
1.6
H1

H0
1.4
alpha = 10%
1.2
1
0.8
0.6
0.4

0.2
0
14

15

15.3

16

17

Statistica, CLEM p. 68/88

Test unidirezionale composto (2)


Verifica di ipotesi unidirezionale semplice con = 5%
H0 : = 15 H1 : < 15 (lipotesi H1 non semplice, definita per ogni < 15)
Il valore critico x = 14.5 e la zona di rifiuto o critica x < 14.5
1.6
H0

H1
1.4

alpha = 5%

1.2
1
0.8
0.6
0.4
R

0.2
0
13

14

14.5

15

16

Statistica, CLEM p. 69/88

H0 : = 15 H1 : = 1 < 15
1.6
H0

H1
1.4

alpha = 5%

1.2
1
0.8
0.6
0.4
R

0.2
0
13

14

14.5

15

16

P (X R | H0 ) = P (X < 14.5 | = 15) = = 0.5: prob. errore I tipo


P (X A | H1 ) = P (X > 14.5 | 1 ) = (1 ): prob. errore II tipo
P (X A | H0 ) = P (X > 14.5 | = 15) = 1 = 0.95:
P (X R | H1 ) = P (X < 14.5 | 1 ) = 1 (1 ): potenza del test
Statistica, CLEM p. 70/88

Test bi-direzionale
Verifica di ipotesi bi-direzionale con = 10%,
H0 : = 15 H1 : 6= 15 (lipotesi H1 non semplice, definita per ogni 6= 15)
Abbiamo due valori critici che si ottengono convenzionalmente usando /2:
x/2 = (14.5, 15.5) e la zona di rifiuto o critica x < 14.5 x > 15.5
Test bidirezionale con alpha = 10%

1.6

H1

H1

H0

1.4
1.2
1
0.8
0.6
0.4

0.2
0
13

13.5

14

14.5

15

15.5

16

16.5

17
Statistica, CLEM p. 71/88

H0 : = 15 H1 : = 1 6= 15
Test bidirezionale con alpha = 10%

1.6

H1

H1

H0

1.4
1.2
1
0.8
0.6
0.4

0.2
0
13

13.5

14

14.5

15

15.5

16

16.5

17

P (X R | H0 ) = P (X > 15.5 X < 14.5 | = 15) = = 0.10: prob. errore I tipo


P (X A | H1 ) = P (14.5 < X < 15.5 | 1 ) = (1 ): prob. errore II tipo
P (X A | H0 ) = P (14.5 < X < 15.5 | = 15) = 1 = 0.90
P (X R | H1 ) = P (X > 15.5 X < 14.5 | 1 ) = 1 (1 ): potenza del test
Statistica, CLEM p. 72/88

Considerazioni sulla verifica di ipotesi (1)


Data una variabile casuale X con distribuzione di probabilit f X (x | ), attraverso un
test statistico si vuole verificare una certa ipotesi sul parametro . Il test di ipotesi di
basa su
unipotesi nulla H0 ed unipotesi alternativa H1 che sono fra loro incompatibili
uno stimatore T di , detto anche statistica test che ha una certa distribuzione di
probabilit fT (t | )
un livello di significativit che, sulla base della distribuzione di probabilit
fT (t | 0 ) sotto H0 definisce:
dei valori critici t oppure t/2

una zona critica R di rifiuto e una zona di accettazione A per verificare


lipotesi H0
dato un campione CS x1 , . . . , xn in cui T = t
se t A, si accetta H0
se t R si rifiuta H0

Statistica, CLEM p. 73/88

Considerazioni sulla verifica di ipotesi (2)


La regola decisionale del test che porta ad accettare/rifiutare lipotesi nulla, dipende solo
dal livello di significativit
dalla distribuzione fT (t | 0 ) sotto H0

Lipotesi alternativa H1 consente

di valutare lerrore di II tipo e la potenza del test 1

di capire la direzione del test (unidirezionale o bi-direzionale)


Si possono commettere due errori, le cui probabilit PRIMA di estrarre il campione sono:
P (T R | H0 ) = : prob. errore di I tipo

P (T A | H1 ) = : prob. errore di II tipo

DOPO lestrazione del campione, dato il valore della statistica test T = t, si valuta se
accettare H0 : il test non significativo al livelllo
rifiutare H0 : il test significativo al livello
N.B. Al variare di , varia la regione critica R e con lo stesso campione si possono
prendere decisioni diverse

Statistica, CLEM p. 74/88

H0 : = 15 H1 : = 15.6
Dato un campione CS in cui x = 15.4,
il test significativo (rifiuto H0 ) al livello = 10%
il test non significativo (accetto H0 ) al livello = 1%
1.6

H0

alpha = 10%
1.4 valore critico = 15.64
beta = 53%
1.2
alpha = 1%
1 valore critico = 15.6
beta = 87%
0.8

H1

0.6
0.4
0.2
0
13

14

15

15.64 16 16.16

17
Statistica, CLEM p. 75/88

Test per la media con varianza nota (1)


Test per H0 : = 0 in pop. normale con varianza nota
Sia X N (, 2 ) con varianza 2 nota

Sia X N (, 2 /n) la statistica test per e il livello di significativit del test


Sia {x1 , . . . , xn } in cui X = x Il valore standardizato di x sotto H0
z=

Media campionaria, N(5,4)

0.2
0.18

x 0
,
/ n

P(T > 5.5)= 0.4

P(T > 3.3) = 0.80

Media campionaria standardizzata, N(0,1)

0.4
0.35

z = (5.5 5)/2) = 0.25


P(Z > 0.25)= = 0.4

z = (33 5)/2) = 0.85


P(Z > 0.85)= = 0.80

0.16
0.3

0.14
0.12

0.25

0.1

0.2

0.08

0.15

0.06
0.1

0.04

0.05

0.02
0
0

3
3.3

6
5.5

10

0
3

1
0.85

0.25

Statistica, CLEM p. 76/88

Test per la media con varianza nota (2)


H0 : = 5 H 1 : > 5
Per = 5%, i valori critici sono z sulla N (0, 1),

x = 0 + z / n = 5 + 1.64 2 = 8.3 sulla N (5, 2)


Media camp. standardizzata, N(0,1) e Media campionaria, N(5,4)
0.4
alpha = 5%
N(0,1)
0.35
valore critico: 1.64
R: z > 1.64
0.3
N(5,4)
0.25
valore critico: 8.3
R: t > 8.3 = 1.64*2 + 5
0.2
0.15
0.1
0.05
0
3 2 1

1 2 3
1.64

8 9 10
8.3
Statistica, CLEM p. 77/88

Test per la media con varianza nota (3)


se H1 : = 1 > 0 , o H1 : 0 , il valore critico per un certo
z :A = (, z ), R = (z , +)
rifiuto H0 se z > z
se H1 : = 1 < 0 , o H1 : 0 , il valore critico per un certo
z :A = (z , +), R = (, z )
rifiuto H0 se z < z
se H1 : 6= 0 , i valori critici per un certo sono z/2 :
A = (z/2 , z/2 ), R = (, z/2 ) (z/2 , +)
rifiuto H0 se z < z/2 o z > z/2
Test per di pop. non normale con varianza nota e grandi campioni
Per il TLC si pu usare lo stesso test asintotico per la verifica di ipotesi del
parametro E(X) = anche per variabili NON NORMALI in GRANDI CAMPIONI.
Statistica, CLEM p. 78/88

Alcuni valori critici z


Test unidirezionali
0.4

Test inidirezionale a sinistra

0.4

alpha = 10%

0.35

0.35

alpha = 5%
alpha = 1%

0.3

0.3

0.25

0.25

0.2

0.2

0.15

0.15

0.1

0.1

0.05

0.05

0
3

2
1
2.32 1.64 1.28

Test unidirezionale a destra

0
3

alpha = 10%
alpha = 5%
alpha = 1%

1
2
3
1.28 1.64 2.32

Statistica, CLEM p. 79/88

Alcuni valori critici z/2


Test bi-direzionali

0.4

Test bidirezionali
alpha = 10%

0.35

alpha = 5%
alpha = 1%

0.3
0.25
0.2
0.15
0.1
0.05
0
3
2
1
1.64
2.57 1.96

2
3
1.96
2.57
1.64

Statistica, CLEM p. 80/88

Test per la media con varianza non nota (1)


Test per H0 : = 0 in pop. normale con varianza non nota
Sia X N (, 2 ) con varianza 2 non nota

con S 2 come stimatore di 2 e X come stimatore di , sotto H0


t=

X 0
tn1 ,
S/ n

t Student con n 1 g.l.

Dato un campione CS in cui X = x, per un certo fissato


se H1 : = 1 > 0 , o H1 : 0 ,
rifiuto H0 se t > t
se H1 : = 1 < 0 , o H1 : 0 ,
rifiuto H0 se t < t
se H1 : 6= 0 ,

rifiuto H0 se t < t/2 o t > t/2


Statistica, CLEM p. 81/88

Test per la media con varianza non nota (2)


Test per di pop. non normale con varianza non nota e grandi campioni
Nel caso di grandi campioni, sia che X sia normale sia che X sia non normale,
per il TLC, sotto H0
z=

X 0

S/ n

si approssima con N (0, 1)

Il test asintotico per si pu fare utilizzando la distribuzione normale. Per un certo


se H1 : = 1 > 0 , o H1 : 0 ,
rifiuto H0 se z > z
se H1 : = 1 < 0 , o H1 : 0 ,
rifiuto H0 se z < z
se H1 : 6= 0 ,

rifiuto H0 se z < z/2 o z > z/2


Statistica, CLEM p. 82/88

Test per la proporzione p in grandi campioni


Sia X Be(p) una variabile binaria (0, 1) e sia {X1 , . . . , Xn } un CCS
1 Pn
Sia pb = n
i=1 Xi lo stimatore per il parametro p. Per il TLC, sotto H 0 : p = p0
z= q

pb p0

p0 (1p0 )
n

si approssima con N (0, 1)

Sia {x1 , . . . , xn } un GRANDE CAMPIONE estratto in cui si calcola pb e z

Il test asintotico per un certo fissato

se H1 : p = p1 > p0 , o H1 : p p0 ,

rifiuto H0 se z > z
se H1 : p = p1 < p0 , o H1 : p p0 ,
rifiuto H0 se z < z
se H1 : p 6= p0 ,

rifiuto H0 se z < z/2 o z > z/2

Statistica, CLEM p. 83/88

Test per X Y : pop. normali, var. note


2 ) e Y N ( , 2 ), con X
Test per H0 : X Y = 0 con X N (X , X
Y
Y
Y
2 e 2 note
Siano le varianze X
Y
2 /n) e Y N ( , 2 /m) gli stimatori di
Siano X N (X , X
Y
X e Y
Y

Siano {x1 , . . . , xn } e {y1 , . . . , ym } due CCS indipendenti in cui X = x e Y = y

Per lindipendenza si ha che, sotto H0


z= q

Il test per un certo fissato


se H1 : X Y > 0,
se H1 : X Y < 0,

X Y

2
X
n

2
Y
m

N (0, 1)

rifiuto H0 se z > z

rifiuto H0 se z < z

se H1 : X Y 6= 0,
rifiuto H0 se z < z/2 o z > z/2

Statistica, CLEM p. 84/88

Test per X Y : pop. normali, var. non note


2 ) e Y N ( , 2 ), con X
Test per H0 : X Y = 0 con X N (X , X
Y
Y
Y
2 = 2 (omoschedasticit)
Siano le varianze non note ma uguali 2 = X
Y

Assumiamo come stimatore per la varianza comune


Sp2

2 + (m 1)S 2
(n 1)SX
Y
=
n+m2

2 /n) e Y N ( , 2 /m) gli stimatori di


Siano X N (X , X
Y
X e Y
Y

Siano {x1 , . . . , xn } e {y1 , . . . , ym } due CCS indipendenti in cui X = x e Y = y

Se X ed Y sono normali ed indipendenti si ha che, sotto H 0


t= q

X Y

1
Sp2 ( n

1
)
m

tk ,

k =n+m2

Statistica, CLEM p. 85/88

Test per X Y : pop. normali, var. non note


Il test per un certo fissato
se H1 : X Y > 0,
se H1 : X Y < 0,

rifiuto H0 se t > t

rifiuto H0 se t < t

se H1 : X Y 6= 0,
rifiuto H0 se t < t/2 o t > t/2

Statistica, CLEM p. 86/88

Test per X Y per grandi campioni (1)


Test per H0 : X Y = 0 per popolazioni non normali con varianze note e grandi campioni
Anche se X ed Y sono NON NORMALI, ma INDIPENDENTI, per costruire
intervalli di confidenza per il parametro X Y si pu utilizzare la distribuzione
Normale, perch per il TLC, nel caso di GRANDI CAMPIONI, sotto H 0
z= q

X Y

2
X
n

2
Y
m

si approssima con N (0, 1) per n ed m grandi

Il test per un certo fissato


se H1 : X Y > 0,
se H1 : X Y < 0,

rifiuto H0 se z > z

rifiuto H0 se z < z

se H1 : X Y 6= 0,
rifiuto H0 se z < z/2 o z > z/2
Statistica, CLEM p. 87/88

Test per X Y per grandi campioni (2)


Test per H0 : X Y = 0 per popolazioni non normali con varianze non note e grandi campioni
2 ed S 2 come stimatori corretti per 2 e 2
Consideriamo SX
Y
X
Y

Anche se X ed Y sono NON NORMALI, ma INDIPENDENTI, il test asintotico


per X Y si pu fare usando la distribuzione Normale, perch per il TLC, nel
caso di GRANDI CAMPIONI, sotto H0
z= q

X Y

2
SX
n

2
SY
m

si approssima con N (0, 1) per n ed m grandi

Il test asintotico per un certo fissato


se H1 : X Y > 0,
se H1 : X Y < 0,

rifiuto H0 se z > z

rifiuto H0 se z < z

se H1 : X Y 6= 0,
rifiuto H0 se z < z/2 o z > z/2
Statistica, CLEM p. 88/88