Sei sulla pagina 1di 24

Inferenza_2 pagina 1

INFERENZA PARAMETRICA
Parte seconda




VARIABILI CASUALI LEGATE ALLA DISTRIBUZIONE NORMALE................................ 2
DISTRIBUZIONE CHI-QUADRO............................................................................................................. 2
DISTRIBUZIONE T DI STUDENT............................................................................................................ 5
DISTRIBUZIONE DELLA VARIANZA CAMPIONARIA.............................................................................. 7
STIMA DEGLI INTERVALLI DI CONFIDENZA....................................................................... 8
INTERVALLO DI CONFIDENZA DELLA MEDIA CON VARIANZA NOTA................................................... 8
INTERVALLO DI CONFIDENZA DELLA MEDIA CON VARIANZA NON NOTA......................................... 12
INTERVALLO DI CONFIDENZA DELLA VARIANZA.............................................................................. 16
INTERVALLO DI CONFIDENZA DELLA DIFFERENZA TRA DUE MEDIE CON VARIANZE NOTE............. 19
INTERVALLO DI CONFIDENZA DELLA DIFFERENZA TRA DUE MEDIE CON VARIANZE NON NOTE..... 20
INTERVALLO DI CONFIDENZA DI UNA PERCENTUALE....................................................................... 23
















Appunti ad uso degli studenti

di

C. Romaniello


ITI Leonardo da Vinci Carpi (MO)


Inferenza_2 pagina 2
Variabili casuali legate alla distribuzione Normale


Accanto alla distribuzione Normale si trovano altre distribuzioni, che incontreremo spesso, che sono
in vario modo collegate alla Normale.



Distribuzione Chi-quadro


Vale il seguente Teorema 1.

Sia Z una variabile casuale Normale Standard, ( ) 0,1 Z N , allora la trasformata
2
Z si
distribuisce secondo una v.c. Chi-quadro con 1 grado di liberrt

( )
2 2
1
Z .


Ovvero il quadrato di una normale standard si distribuisce secondo una Chi-quadro con 1 g.d.l. .


La v.c. Chi-quadro gode della seguente Propriet.

Siano date due v.c. Chi-quadro con m ed n gradi di libert. Allora la loro somma ancora una v.c.
Chi-quadro con m n + g.d.l.

( ) ( ) ( )
2 2 2

m n m n

+
+ =

e la loro differenza ancora una v.c. Chi-quadro con m n g.d.l., con m n >

( ) ( ) ( )
2 2 2

m n m n


=


Ad esempio,
( ) ( ) ( )
2 2 2
5 3 8
+ = e
( ) ( ) ( )
2 2 2
5 3 2
= .


Come conseguenza di ci la variabile casuale somma dei quadrati di n v.c. Normali Standard sar
una v.c. Chi-quadro con n g.d.l.

( )
2 2
1

n
i n
i
Z
=







Inferenza_2 pagina 3
Il valore atteso di una Chi-quadro pari ai suoi gradi di libert, e la sua varianza pari al doppio dei
suoi gradi di libert

( )
2

n
E n ( =


( )
2
2
n
V n ( =





Poich una v.c. Chi-quadro ricavata dal quadrato di una v.c. Normale Standard, assumer solo
valori positivi. Inoltre landamento della distribuzione Chi-quadro dipende dai gradi di libert.

Per valori piccoli dei gradi di libert ha un andamento asimmetrico. Mentre allaumentare dei gradi
di libert la forma della distribuzione diventa simmetrica e si approssima ad una Normale con
media e varianza pari alla media e varianza della Chi-quadro.


Nella tabella della pagina seguente riportato landamento della distribuzione
( )
2
n
(in blue), per
vari valori dei suoi g.d.l. n, messo a confronto con landamento della distribuzione
( )
2
, 2 N n n = = (in rosso). La linea tratteggiata in verde tracciata proprio in corrispondenza
della media
( )
2
n
E n ( = =

.



Inferenza_2 pagina 4


Inferenza_2 pagina 5
Distribuzione t di Student


Vale il seguente Teorema 2.

Sia Z una variabile casuale Normale Standard, ( ) 0,1 Z N , e sia Y una v.c. Chi-quadro con n
g.d.l.,
( )
2
n
Y , allora la trasformata

Z
Y
n
si distribuisce secondo una v.c. t di Student con n
gradi di libert

( )

n
Z
t
Y
n
.


Il valore atteso e la varianza sono rispettivamente

( )
0 0
n
E t n = > (

e
( )
2
2
n
n
V t n
n
= > (





La distribuzione t di Student ha un andamento molto simile a quello della Normale Standard.
Entrambe le distribuzioni sono simmetriche attorno allo zero. La Normale Standard per ha le due
code che decadono pi velocemente a zero ed una maggiore densit concentrata attorno alla media.






Inferenza_2 pagina 6
Allaumentare dei gradi di libert comunque la t di Student si approssima abbastanza velocemente
alla Normale Standard. Per 30 n = gi la t quasi del tutto coincidente con la Normale Standard,
come si pu vedere nella tabella seguente, dove landamento della distribuzione t (in blue), per vari
valori dei g.d.l., messa a confronto con landamento della distribuzione ( )
2
0, 1 N = =






Per questo motivo la distribuzione t di Student viene utilizzata solo per i piccoli campioni: 30 n .

Per 30 n > praticamente ininfluente usare la t di Student o la Normale Standard.






Inferenza_2 pagina 7
Distribuzione della varianza campionaria


valido il seguente Teorema 3.

Sia data una variabile casuale Normale ( )
2
, X N , allora si dimostra che vale il seguente
risultato

( )
( )
( )
2
2 2
2 1
1 2 2 2
1

n
i
i
n
X X
n S n S


= =




Dimostrazione

Si gi visto (controlla gli appunti Inferenza_1 alle pagine 8 e 9) che la devianza pu essere
riscritta come

( )
2
2 2
1 1
( ) ( )
n n
i i
i i
X X X n X
= =
=



Quindi possiamo scrivere

( )
2
2 2 2
2
1 1 1
2 2 2 2
2 2 2
2
2
1 1
2
2
( ) ( ) ( )
( )

( )

n n n
i i i
i i i
n n
i i i
i i
i
Z
Z
X X X n X X
n X
X X X X
n n


= = =
= =
=
=


= = =
| | | | | |
= = =
| |
|
\ \
|
\



( ) ( ) ( ) ( ) ( )
2 2 2 2 2 2 2
1 1 1 1
1 1

n n
i n n i
i i
Z Z

= =
= = = =

come volevasi dimostrare.













Inferenza_2 pagina 8
Stima degli intervalli di confidenza


La stima di un parametro incognito pu essere effettuata in due modi.

Si pu calcolare un unico valore del parametro: il caso, ad esempio, della stima della media che si
ottiene utilizzando la media campionaria, come si gi visto negli appunti Statistica_1. In questo
caso si parla di stima puntuale.

Ma possibile anche determinare un intervallo, al cui interno, con un livello di confidenza
prefissato, siamo fiduciosi che cada il valore incognoto del parametro da stimare. In questo caso si
parla allora di stima degli intervalli di confidenza (o stima intervallare, o stima per intervallo).

Stimare gli intervalli di confidenza possibile solo ipotizzando che il carattere oggetto di studio
nella popolazione sia distribuito secondo una Normale ( )
2
, X N .

Dalla popolazione si estrae quindi un campione di n unit ciascuna delle quali eredita la
distribuzione Normale della popolazione.

In caso contrario non si riesce a pervenire a distribuzioni note delle statistiche campionarie.

Le distribuzioni che utilizzeremo sono oltre alla Normale, la Chi-quadro e la t di Student.

Affronteremo il problema degli intervalli di confidenza per alcune situazioni tipiche:
1. intervallo di confidenza della media con varianza nota;
2. intervallo di confidenza della media con varianza non nota;
3. intervallo di confidenza della varianza;
4. intervallo di confidenza della differenza tra due medie con varianze note;
5. intervallo di confidenza della differenza tra due medie con varianze non note;
6. intervallo di confidenza di una percentuale;




Intervallo di confidenza della media con varianza nota


Si fissa innanzitutto il livello di confidenza dellintervallo, che viene indicato con 1 , dove
solitamente 0, 05 = oppure 0, 01 = .

Si vogliono trovare due funzioni dei dati campionari, ( )
1 i
h X e ( )
2 i
h X , tali per cui la probabilit
che la media incognita compresa tra le due funzioni sia pari a 1 :

( ) ( ) { }
1 2
Pr 1
i i
h X h X = .

Inferenza_2 pagina 9
Per calcolare gli estremi dellintervallo necessario conoscere la forma distributiva delle variabili
coinvolte. Nel nostro caso dovremmo conoscere la distribuzione delle due funzioni ( )
1 i
h X e
( )
2 i
h X . Ma non sappiamo ancora nulla su come queste funzioni siano fatte.

Allora lidea di partire dalla media campionaria che, oltre ad essere lo stimatore puntuale per la
media della popolazione, ha una distribuzione nota

2
, X N
n

| |
|
\



Quindi partiamo da un intervallo di confidenza dell 1 con al centro la media campionaria

( ) ( ) { }
1 2
Pr 1
i i
k X X k X =

dove ( )
1 i
k X e ( )
2 i
k X sono altre due funzioni dei dati campionari distinte da ( )
1 i
h X e ( )
2 i
h X .

Si va quindi a standardizzare la media campionaria

( ) ( )
1 2
Pr 1
i i
k X k X X
n n n




=
`

)



dove, per tutte le ipotesi fatte, si ha

( ) 0, 1
X
N
n



e quindi i due estremi dellintervallo sono dei percentili della Normale Standard

( )
1
2

i
k X
z
n

= e
( )
2
1
2

i
k X
z
n

=


Lintervallo di confidenza diventa

1
2 2
Pr 1
X
z z
n




=
`

)



dove
2
z

e
1
2
z

sono, rispettivamente, l
2
esimo

e l 1
2
esimo
| |

|
\
percentile della
distribuzione Normale Standard.
Inferenza_2 pagina 10
Cio alla sinistra di
2
z

, nella distribuzione della Normale Standard, vi una probabilit pari a


2

, e
alla sinistra di
1
2
z

una probabilit pari a 1


2

.
Nel seguente grafico sono rappresentati i due percentili.

Si noti che, data la simmetria della Normale, i due percentili sono uguali fra di loro in valore
assoluto. In particolare vale che

1
2
0 z

> e
1
2 2
0 z z

= <

Poich il nostro obiettivo trovare un intervallo di confidenza per la media , dobbiamo
modificare lespressione
1
2 2

X
z z
n



in maniera tale che al centro rimanga solo la media.
Inferenza_2 pagina 11
Innanzitutto togliamo il denominatore della frazione, moltiplicando tutto per
n

, ottenendo
1
2 2
z X z
n n


Quindi consideriamo le due diseguaglianze separatemente
2
z X
n


1
2
X z
n



con semplici passaggi algebrici , spostando dallaltro lato delle diseguaglianza cambiando di
segno
2
z X
n

+
1
2
X z
n

+

e spostando tutto il resto dallaltro lato cambiando di segno

( )
2
2

i
h X
X z
n


( )
1
2
1

i
h X
X z
n



si ottengono gli estremi superiore e inferiore dellintervallo di confidenza per la media di
popolazione, che sono proprio le due funzioni ( )
1 i
h X e ( )
2 i
h X che si volevano trovare.

Lintervallo di confidenza per la media con varianza nota allora

1
2 2
Pr 1 X z X z
n n



=
`
)
.


Si noti che dal punto di vista matematico le quantit n, ,
2
z

e
1
2
z

sono tutte note. Quindi


lntervallo di confidenza della media dipende esclusivamente dalla media campionaria. Poich la
media campionaria una variabile casuale, anche gli estremi dellintervallo diu confidenza sono
variabili casuali, di cui si potrebbe calcolare la distribuzione.
Una volta estratto il campione, la media campionaria assume un certo valore numerico (che la
stima puntuale della media di popolazione) in corrispondenza del quale si avr un determinato
intervallo (che la stima puntuale dellintervallo di confidenza).

Dal punto di vista pratico del calcolo numerico, essendo
1
2 2
z z

= con
1
2
0 z

> , lintervallo
di confidenza si ottiene sottraendo e sommando la stessa quantit
1
2 2
z z
n n

= dalla
media campionaria.

Inferenza_2 pagina 12
Inoltre lampiezza dellintervallo, estremo superiore meno estremo inferiore, sar pari proprio al
doppio di questa stessa quantit

( ) ( )
2 1
1
2 2
Ampiezza
i i
h X h X X z X z X
n n

| |
= = =
|
\ 2
z X
n


1
2
1 1
2 2 2

2
z
n
z z z
n n n


+ =
| |
= =
|
\




Esempio.

Immaginiamo di voler stimare la media di un carattere che in popolazione si distribuisce secondo
una Normale con varianza nota
2
9 = . Si estrae un campione di 16 n = unit e su questo si calcola
la media campionaria che, ipotizziamo, risulti essere 3, 4 x = .
Calcolare lintervallo di confidenza per al livello di confidenza del 95%.

Allora si ha 1 0, 95 = quindi 0, 025
2

= e 1 0, 975
2

= .

Sulle tavole della Normale troviamo il percentile
0,975
1, 96 z = . Allora gli estremi dellintervallo
sono

( )
1
1
2
3 3
3,4 1, 96 3,4 1, 96 3,4 1, 47 1, 93
4 16
i
h X X z
n

= = = = =

( )
2
2
3,4 1, 47 4,87
i
h X X z
n

= = + =

e lampiezza dellintervallo 2 1, 47 2, 94 =




Intervallo di confidenza della media con varianza non nota


Nel caso in cui la varianza in popolazione non nota, non si conoscer nemmeno la varianza della
media camnpionaria. Quindi nella procedura di ricerca dellintervallo di confidenza non pi
possibile standardizzare la media campionaria per ottenere una distribuzione Normale Standard.

possibile tuttavia stimare la varianza di popolazione con la varianza campionaria,
2
S o
2
S . In
questo caso si perviene ad una distribuzione t di Student.

Andiamo a dimostrare questa affermazione.

Inferenza_2 pagina 13
Si dimostra che
( ) 1

1
n
X X
t
S
S
n
n




Iniziamo con il verificare che
1
S S
n n
=

.

Infatti ,se
2 2
1
n
S S
n
=

, dividendo ambo i membri per n si ottiene


2 2
1
S S
n n
=

, e passando alla
radice quadrata
2 2
1
S S
n n
=

si ha proprio
1
S S
n n
=

.

Per la dimostrazione allora prendiamo in considerazione lespressione con lo scostamento
quadratico medio campionario corretto S


X
S
n

= moltiplichiamo e dividiamo il denominatore
S
n
per


X
S
n

= =

si pu quindi riscrivere quella frazione nel modo seguente



1

X
S
n

= = dove come noto ( ) 0, 1


X
Z N
n

= ; inoltre dividiamo e
moltiplichiamo il termine
S

per 1 n

1
Z
1
1
S n
n
= =

adesso portiamo il termine


S

sotto il segno di radice quadrata elevando



al quadrato

( )
2
2

1 1
1
Z
n S
n
= =

dove per il Teorema 3


( )
( )
2
2
1 2
1

n
n S
Y



= per cui diventa

( ) 1

1
n
Z
t
Y
n

per il Teorema 2 . Abbiamo cos terminato la dimostrazione.


Inferenza_2 pagina 14
Per trovare lintervallo di confidenza della media nel caso di varianza non nota, si seguir la stessa
procedura adottata nel caso di varianza nota.

Partiamo sempre da un intervallo di confidenza dell 1 con al centro la media campionaria

( ) ( ) { }
1 2
Pr 1
i i
k X X k X =

ma ora effettuiamo la trasformazione che genera la t di Student

( ) ( )
1 2
Pr 1
i i
k X k X X
S S S
n n n



=
`

)


I due estremi dellintervallo sono dei percentili della t di Student con 1 n gradi di liberta

( )
1
2

i
k X
t
S
n


= e
( )
2
1
2

i
k X
t
S
n

=

che sono, come i percentili della Normale Standard, luno lopposto dellaltro

1
2
0 t

> e
1
2 2
0 t t

= <

Lintervallo di confidenza diventa

1
2 2
Pr 1
X
t t
S
n



=
`

)


e, con dei passaggi che sono del tutto equivalenti a quelli visti nel caso di varianza nota, si arriva al
seguente intervallo di confidenza della media con varianza non nota

1
2 2
Pr 1
S S
X t X t
n n


=
`
)


Notare lanalogia con il caso di varianza nota. Cosa cambia? Al posto dei percentili della Normale
Standard qui abbiamo i percentili della t di Student; e al posti di abbiamo S .

Nel caso si utilizzi lo scostamento quadratico medio campionario distorto S si perviene ad una
formulazione analoga dellintervallo di confidenza

1
2 2
Pr 1
1 1
S S
X t X t
n n


=
`

)


ricordando, come abbiamo visto in precedenza, che
1
S S
n n
=

.
Inferenza_2 pagina 15
Sempre in analogia con il caso di varianza nota, lampiezza dellintervallo di confidenza della
media con varianza non nota sar pari a

1 1
2 2
2 2
1
S S
t t
n n


| |
| |
=
|
|

\ \



Esempio.

Immaginiamo di voler stimare la media di una variabile casuale X che in popolazione si
distribuisce secondo una Normale con varianza non nota. Si estrae un campione di 25 n = unit e su
questo si calcola la media campionaria e la varianza campionaria corretta che, ipotizziamo, risultano
essere 10 x = e
2
36 S = .

Calcolare lintervallo di confidenza per al livello di confidenza del 95%.

Allora 1 0, 95 = quindi 0, 025
2

= e 1 0, 975
2

= .

Sulle tavole della t di Student con 24 g.d.l. troviamo il percentile
0,975
2, 06 t = . Allora gli estremi
dellintervallo sono

( )
1
1
2
6 6
10 2, 06 10 2, 06 10 2, 472 7, 528
5 25
i
S
h X X t
n

= = = = =

( )
2
2
10 2, 472 12,472
i
S
h X X t
n

= + = + =

e lampiezza dellintervallo 2 2, 472 4, 944 = .


Se avessimo calcolato la varianza campionaria distorta
2
36 24
34, 56
25
S

= = il risultato sarebbe
stato lo stesso, come si pu verificare

( )
1
1
2
34, 56
10 2, 06 10 2, 06 1, 44 10 2, 472 7, 528
24 1
i
S
h X X t
n

= = = = =












Inferenza_2 pagina 16
Intervallo di confidenza della varianza


Si vuole trovare lintervallo di confidenza per la varianza incognita di una variabile casuale X che in
popolazione si suppone distribuita secondo una Normale.

Ormai dovrebbe essere chiaro che il punto di partenza per il calcolo dellintervallo di confidenza
lo stimatore del parametro incognito.
Nel caso della varianza si pu utilizzare o la varianza campionaria distorta
2
S o la varianza
campionaria corretta
2
S .

Consideriamo
2
S , e partiamo sempre da un intervallo di confidenza dell 1 con al centro lo
stimatore del parametro incognito

( ) ( ) { }
2
1 2
Pr 1
i i
k X S k X =

Per il Teorema 3 vale
( )
( )
2 2
2
1 2 2
1

n
n S n S




=

quindi si applicher la medesima trasformazione agli estremi dellintervallo

( ) ( )
2
1 2
2 2 2
Pr 1
i i
n k X n k X n S



= `
)



dove
( )
1
2
2
i
n k X

= e
( )
2
2
1
2
i
n k X

= sono rispettivamente l
2
esimo

e l 1
2
esimo
| |

|
\

percentile della distribuzione Chi-quadro con 1 n g.d.l. .


2
2
1
2 2
Pr 1
n S



=
`
)



Poich la Chi-quadro non una distribuzione simmetrica, a differenza degli intervalli per la media,
gli intervalli per la varianza non sono simmetrici.


Nella figura che segue sono rappresentati i percentili della distribuzione Chi-quadro.
Inferenza_2 pagina 17




Come gi fatto per gli intervalli precedenti, consideriamo separatamente le due disequazioni

2
2
2

n S

e
2
2
1
2

n S



e risolviamole rispetto a
2
.

Basta moltiplicare ambo i membri per
2
, e dividerli per il percentile
2

e
1
2

a seconda che si
tratti della prima o seconda disequazione. Si otterr quindi

2
2
2

n S

e
2
2
1
2

n S


Inferenza_2 pagina 18
che rappresentano rispettivamente lestremo superiore e lestremo inferiore dellintervallo di
confidenza per la varianza

2 2
2
1
2 2
Pr 1
n S n S




=
`

)


Se, in luogo della varianza campionaria distorta, avessimo utilizzato la varianza campionaria
correta, si avrebbe la seguente formulazione dellintervallo

( ) ( )
2 2
2
1
2 2
1 1
Pr 1
n S n S




=
`

)


che dal punto di vista numerico del tutto coincidente con il precedente, in quanto vale

( )
( )
2
2 2
1
1
n
i
i
n S n S X X
=
= =

.

Si potrebbe quindi formulare in maniera univoca lintervallo di confidenza per la varianza
utilizzando la devianza

( ) ( )
2 2
2 1 1
1
2 2
Pr 1
n n
i i
i i
X X X X



= =




` =

)




Esempio

Immaginiamo di voler stimare la varianza
2
di una variabile casuale X che in popolazione si
distribuisce secondo una Normale. Si estrae un campione di 10 n = unit e su questo si calcola la
varianza campionaria distorta che, ipotizziamo, risulta essere
2
20 S = .

Calcolare lintervallo di confidenza per
2
al livello di confidenza del 95%.

Quindi 1 0, 95 = , 0, 025
2

= e 1 0, 975
2

= .

Sulle tavole della distribuzione Chi-quadro con 1 9 n = g.d.l. troviamo il valore dei due percentili
0,025
2, 70 = e
0,975
19 = , e i due estremi dellintervallo di confidenza

2
1
2
10 20
10, 53
19
n S


= = e
2
2
10 20
74, 07
2, 7
n S


= = .


Inferenza_2 pagina 19
Intervallo di confidenza della differenza tra due medie con varianze note


Si ipotizzano due popolazioni normali indipendenti fra di loro

( )
2
,
X X
X N e ( )
2
,
Y Y
Y N

Si ipotizza inoltre che le due varianze siano note.

Interessa stimare la differenza tra le due medie che sono incognite
X Y
.

Abbiamo gi visto (vedi appunti Inferenza_1 pag.13) che, estratti due campioni dalle due
popolazioni di numerosit, rispettivamente,
1
n e
2
n , lo stimatore della differenza tra due medie

( )
2 2
1 2
,
X Y
X Y
X Y N
n n


| |
+
|
\
.

Si vuole ora trovare un intervallo di confidenza per
X Y
.

Si fissa il livello di confidenza 1 , e al solito si parte da un intervallo con al centro lo stimatore
del parametro
( ) ( ) { }
1 2
Pr 1
i i
k X X Y k X =

e andiamo a standardizzare

( )
2 2 1
2 2
1 2
Pr 1
X Y
X Y
X Y
z z
n n




=

`
+

)



quindi, dopo qualche passaggio algebrico che non ripetiamo, perch tanto sono sempre gli stessi,
lintervallo di confidenza sar


2 2 2 2
1
1 2 1 2 2 2
Pr 1
X Y X Y
X Y
X Y z X Y z
n n n n




+ + =
`

)











Inferenza_2 pagina 20
Intervallo di confidenza della differenza tra due medie con varianze non note


Si ipotizzano ancora due popolazioni normali indipendenti fra di loro

( )
2
,
X X
X N e ( )
2
,
Y Y
Y N

Per ora le due varianze non sono note.
Allora non vale pi la distribuzione Normale. Come nel caso di una unica media ritroveremo la
distribuzione t di Student.

Sar necessario tuttavia fare una ulteriore ipotesi, che le varianze delle due popolazioni siano uguali
fra di loro
2 2 2

X Y
= =

Estratti due campioni dalle due popolazioni di numerosit, rispettivamente,
1
n e
2
n , se fosse
nota si avrebbe ancora una volta la distribuzione Normale Standard


( ) ( ) ( )
( )
2 2
2
1 2 1 2 1 2
0, 1
1 1 1 1
X Y X Y X Y
X Y X Y X Y
N
n n n n n n




= =
| |
+ + +
|
\




Ma poich non nota occorre stimarla, ed questo fatto che porta ad una distribuzione t di
Student.

Come stimare ?

Poich si suppone che le due popolazioni hanno la stessa varianza, e poich da ciascuna
popolazione stato estratto un campione, la stima della varianza sar una media aritmetica delle
due varianze campionarie,
2
X
S e
2
Y
S , ponderate con le numerosit dei due campioni


( ) ( )
( ) ( )
1 2
2 2
2 2 2 2
1 1 2 1 2 1 2
1 2 1 2 1 2
1 1

2 2 2
n n
i j
i j X Y X Y
X X Y Y
n S n S n S n S
S
n n n n n n
= =
+
+ +
= = =
+ + +




Dividendo per
1 2
2 n n + otteniamo uno stimatore corretto.




Inferenza_2 pagina 21
Sostituiamo con
2 2
1 2
1 2
2
X Y
n S n S
S
n n
+
=
+
nella scrittura
( )
1 2
1 1
X Y
X Y
n n


+
.

Allora si dimostra che

( )
( )
1 2
1 2
2

1 1
X Y
n n
X Y
S
n n
t

+

+



Dimostrazione

( )
1 2

1 1
X Y
X Y
S
n n

=
+
dividiamo e moltiplichiamo per , ottenendo
( )
1 2

1 1
X Y
X Y
S
n n


= =
+


che possiamo riscrivere nel modo seguente
( )
( )
2
2
1 2
0,1

1 1
X Y
Z N
X Y Z Z
S S
S
n n


=

= = = =
+


utilizzando la definizione data prima di
2
S


( ) ( )
2 2 2 2 2 2
1 2 1 2 1 2
2 2
1 2 1 2 1 2
2

1
2 2 2
X Y X Y X Y
Z Z Z
n S n S n S n S n S n S
n n n n n n

= = = =
+ + +

+ + +


( )
2 2
1 2
2 2
1 2

1
2
X Y
Z
n S n S
n n
= =
| |
+
|
+ \
ricordando che
( )
2
1
2
1
2
1

X
n
n S

e
( )
2
2
2
2
2
1

Y
n
n S



( ) ( )
( )
( )
( )
( )
( )
1 2
1 2
1 2
1 2
1 2
2
2
2 2
1
1 1

1
2
2
n n
n n
n n
Z Z
n n
n n
t

+
+


= =
+
+
+
come si voleva dimostrare


negli ultimi passaggi si utilizzato il Teorema 3 delle distribuzione della varianza campionaria ed
il Teorema 2 della distribuzione t di Student



Inferenza_2 pagina 22
Si fissa il livello di confidenza 1 , e al solito si parte da un intervallo con al centro lo stimatore
del parametro
( ) ( ) { }
1 2
Pr 1
i i
k X X Y k X =

applicando la trasformazione della t di Student si ottiene

( )
1
2 2
1 2
Pr 1
1 1
X Y
X Y
t t
S
n n


=

`
+

)


dopo i soliti passaggi algebrici si arriva allintervallo di confidenza


1
1 2 1 2 2 2
1 1 1 1
Pr 1
X Y
X Y t S X Y t
n n n n



+ + =
`

)



Esempio

Si vogliono confrontare le medie di due popolazioni indipendenti Normali, di cui non si conoscono
le varianze, ma lecito pensare che queste siano uguali fra di loro.

Si estrae allora un campione di numerosit
1
10 n = dalla prima popolazione sul quale si calcola la
media campionaria 20 X = e la varianza campionaria distorta
2
3, 60
X
S = .
Ed un campione di numerosit
2
16 n = dalla seconda popolazione sul quale si calcola la media
campionaria 20, 5 Y = e la varianza campionaria corretta
2
3, 75
Y
S = .

Si vuole trovare lintervallo di confidenza al livello di 1 0, 99 = .

Sulle tavole della distribuzione t di Student con
1 2
2 10 16 2 24 n n + = + = g.d.l. leggiamo il
valore del percentile
1
2
2, 80 t

= .
Calcoliamo il valore dello scostamento quadratico medio campionario

2 2
1 2
1 2
10 3, 6 16 3, 75 36 60 96
4 2
2 24 24 24
X Y
n S n S
S
n n
+ + +
= = = = = =
+


allora lestremo inferiore dellintervallo di confidenza sar

1
1 2 2
1 1 1 1 8 5
20 20, 5 2,8 2 0, 5 5, 6 0, 5 5, 6 0, 4 2, 74
10 16 80
X Y t S
n n

+
+ = + = = =

e quello superiore
1
1 2 2
1 1
0, 5 5, 6 0, 4 1, 74 X Y t S
n n

+ = + = .
Inferenza_2 pagina 23
Intervallo di confidenza di una percentuale


Nel caso la quantit incognita la percentuale con la quale si manifesta un certo fenomeno nella
popolzione, si gi visto che il suo stimatore corretto la frequenza campionaria, per la quale vale
lapprossimazione ad una normale quando la numerosit campionaria abbastanza grande

( ) 1
,
n
p p
f N p
n

| |

|
\



Se si vuole trovare lintervallo di confidenza per la percentuale, come al solito, partiremo da un
intervallo centrato sulla frequenza campionaria, fissato il livello di confidenza 1

( ) ( ) { }
1 2
Pr 1
i i
k X f k X =

e andremo a standardizzare

( )
( ) ( )
( )
( )
1 2
Pr 1
1 1 1
i i
k X p k X p f p
p p p p p p
n n n


=

`

)



Possiamo quindi risolvere le disequazioni rispetto a p , come abbiamo sempre fatto, arrivando al
seguente intervallo per la percentuale

( ) ( )
1
2 2
1 1
Pr 1
p p p p
f z p f z
n n



= `

)



Ma c un problema che dovrebbe essere ben evidente. Poich la varianza della frequenza
campionaria dipende dal valore della percentuale, che incognita, quellintervallo non
calcolabile.
Allora come si fa? Andremo a stimare la percentuale p con la frequenza campionaria f . Se
pensiamo a campioni sufficientemente grandi, vale sempre la distribuzione Normale.
Alla fine cio lintervallo di confidenza per la percentuale


( ) ( )
1
2 2
1 1
Pr 1
f f f f
f z p f z
n n



= `

)








Inferenza_2 pagina 24
Esempio

Si vuole stimare lintervallo di confidenza della percentuale di unit statistiche di una certa
popolazione nelle quali si manifesta una certa qualit.
Si sceglie un campione di 25 n = unit, e si calcola la frequenza campionaria, che supponiamo
essere 0, 2 f = .

Si vuole trovare lintervallo di confidenza al livello di 1 0, 99 = .
Quindi 0, 01 = e 1 0, 995
2

= .

Sulle tavole della distribuzione Normale Standard leggiamo il valore del percentile
0,995
2, 58 z = .

Lestremo inferiore dellintervallo di confidenza sar

( )
( )
1
1
2
1 0, 2 0, 8 0,16
0,2 2, 58 0,2 2, 58
25 25
0, 4
0,2 2, 58 0,2 0, 2064 0, 0064
5
i
f f
h X f z
n


= = = =
= = =


Poich una percentuale non pu essere negativa si pone ( )
1
0
i
h X = .

Lestremo inferiore dellintervallo di confidenza invece

( )
( )
2
2
1
0,2 0, 2064 0,4064
i
f f
h X f z
n


= = + =