Sei sulla pagina 1di 4

Cap 19: Gli intervalli di condenza.

In alcune situazioni pratiche non `e essenziale


ottenere una stima oltremodo precisa del
parametro ; pu`o essere suciente determinare
un insieme C di valori entro il quale
riteniamo, con un certo grado di ducia, ci sia
il vero valore di .
Tale atteggiamento `e anche giusticato dal
fatto che la pretesa di stimare esattamente il
parametro `e , dal punto di vista probabilistico,
del tutto irrealistica poiche, qualunque sia il
vero valore di , la probabilit`a che uno stimatore
puntuale T
n
(X) sia esattamente uguale a
`e , quasi sempre, pari a zero, ovvero, nella
maggioranza dei casi,
, P(T
n
(X) = |) = 0 (1)
E allora ragionevole puntare a qualcosa di meno
ambizioso. Ad esempio che il nostro stimatore
T
n
sia, con una certa probabilit`a suciente-
mente vicino a .
1
Prima di introdurre le nozioni essenziali
per costruire intervalli di condenza (I.C.),
discutiamo un esempio dove la determinazione
di un I.C. `e del tutto soddisfacente dal punto di
vista pratico.
Esempio 1
Il partito politico tedesco GGG, secondo la
legge elettorale vigente in quel paese, per essere
presente in parlamento deve ottenere almeno il
5% dei suragi nelle elezioni per il rinnovo del
parlamento.
Prima di scegliere se partecipare da soli alle
elezioni, oppure entrare a far parte di una
coalizione, i dirigenti del GGG commissionano
un sondaggio pre-elettorale con lobiettivo di
conoscere, almeno in via approssimata, la
percentuale di voti che il GGG otterr`a alle
elezioni. Sar`a utile allora produrre un intervallo
di condenza per , del tipo
_
,
_
(2)
cosicche
2
Se
5% GGG partecipa da solo alle
elezioni
5% GGG aderisce ad una coalizione
5% c`e una situazione di
incertezza
Solo nel terzo caso lanalisi statistica non `e in
grado di condurre ad una decisione nale e
ulteriori ranamenti sono necessari. Torneremo
su questo esempio.
3
Costruzione degli I.C.
Esistono diversi criteri per costruire intervalli
di condenza per un parametro . Qui ci
limiteremo ad un approccio intutitivo basato
sullutilizzo della distribuzione campionaria dello
stimatore puntuale T
n
relativo al parametro in
questione.
Tratteremo soltanto 4 casi specici, tra i
pi` u frequenti nelle applicazioni.
1. I.C. per la media di una distribuzione
Normale con varianza nota
In questo contesto, lesperimento `e basato su
X
1
, , X
n
N(,
2
0
)
e sappiamo che, per ogni valore di R
X

n N(0, 1)
4
Sia z

il quantile di ordine di una distribuzione


N(0, 1), ovvero quel valore z

che lascia alla


propria sinistra una probabilit`a pari a secondo
la densit`a normale standard.
Possiamo allora scrivere, per ogni abbastanza
piccolo (in genere, nelle applicazioni, .20),
R P(z
1

n z
1

2
| ) = 1
ovvero,
R, P(

n
z
1

2
X

0

n
z
1

2
| ) = 1.
Cambiando segno alle disuguaglianze,
R P(

n
z
1

2
X

0

n
z
1

2
| ) = 1.
ovvero,
5
R,
P(X

0

n
z
1

2
X +

0

n
z
1

2
| ) = 1 .
(3)
e lintervallo
(, ) = (X

0

n
z
1

2
, X +

0

n
z
1

2
)
si chiama I.C. per il parametro con livello
di condenza pari a 1. La relazione (3) va
letta nel modo seguente:
(x

0

n
z
1

2
, x +

0

n
z
1

2
)
che si ottengono, nel meta-esperimento,
al variare dei possibili campioni osservati,
contengono il vero valore di 100(1 ) volte
su 100.
In pratica, poi, si osserva un solo campione
che conterr`a o meno il valore . Si dice
allora che lintervallo ottenuto contiene, con una
condenza pari a 1 il parametro incognito .
6
Attenzione! Nella (3) la variabile aleatoria
in esame `e la media campionaria X e
non il parametro e tutte le aermazioni
probabilistiche vanno riferite a X.
Esempio 2.
Il tempo in minuti che un autobus di
linea impiega nel tragitto Latina-Roma Eur
pu` o essere considerato una v.a. N(,
2
0
) con

2
0
noto e pari a 9 minuti. Vogliamo costruire
un I.C. per sulla base di n = 16 osservazioni
campionarie. Supponiamo che i risultati del
campione siano
x = 76min.15sec.(in decimali76.25), s = 3.19
Lintervallo di condenza di livello 1 = 0.95
ha come estremi
= x 1.96

0

n
= 74.78
= x +1.96

0

n
= 77.72
Da notare che, essendo
0
noto, linformazione
campionaria s non viene utilizzata.
7
2. I.C. per la media di una
N(,
2
) quando
2
`e incognito
La logica di costruzione e la successiva
interpretazione degli I.C. sono identiche al
caso precedente. Lunica dierenza `e nella
distribuzione campionaria di X. Infatti in questo
caso, per ogni valore di R e R
+
,
X

n t
n1
,
dove

S =
_

(X
i
X)
2
n1
.
Detto t
n1,
il quantile di ordine di una
distribuzione t con n 1 gradi di libert`a , si ha,
per la simmetria delle ditribuzioni t,
R,
2
R
+
,
P
,
2
(t
n1,1

X
s

n t
n1,1

2
) = 1.
Con passaggi analoghi al caso precedente,
8
R,
2
R
+
,
P
,
2
(X t
n1,1

2
s

n
X +t
n1,1

2
s

n
)
= 1 .
e lI.C `e
(, ) = (X t
n1,1

2
s

n
, X +t
n1,1

2
s

n
)
Esempio 2 (cont.)
Riprendiamo lesempio precedente e assumiamo
stavolta di non conoscere
2
. Lintervallo che si
ottiene ha ora come estremi
= xt
15,0.975
s

n
== 76.252.131

10.2
4
= 74.55
= x +t
15,0.975
s

n
= = 77.95
Lintervallo risulta ora pi` u ampio che nel caso
precedente: ci` o `e dovuto a due motivi
1) La stima campionaria s
2
`e maggiore del
valore assunto noto in precedenza.
9
2) La distribuzione t
15
ha code pi` u pesanti del-
la N(0, 1) (per tener conto, appunto, dellin-
certezza ulteriore dovuta alla non conoscenza
di
2
.
3. I.C. per la varianza di una distribuzione
normale con media incognita
Il contesto formale `e identico al caso 2.
Si hanno n oseervazioni i.i.d. con distri-
buzione N(,
2
), entrambi incogniti e stavolta
il parametro di interesse `e
2
. Da un punto di
vista intuitivo, `e chiaro che una buona statistica
per ottenere informazioni su
2
`e la varianza
campionaria corretta

S
2
=

n
i=1
(X
i


X)
2
n 1
Sappiamo inoltre che, qualunque sia il valore dei
parametri,
(n 1)

S
2

2

2
n1
.
A questo punto la costruzione dell I.C. diventa
banale
Si ha, per ogni
2
> 0 e per ogni R,
P
,
2
(
2
n1,

(n 1)

S
2

2

2
n1,1

2
) = 1
e quindi
P
,
2
(
1

2
n1,1


2
(n 1)

S
2

1

2
n1,

2
)1 ,
ovvero
P
,
2
(
(n 1)

S
2

2
n1,1

2

2

(n 1)

S
2

2
n1,

2
) = 1
e dunque lintervallo
(
2
,
2
) =
_
_
_
(n 1)

s
2

2
n1,1

2
,
(n 1)

s
2

2
n1,

2
_
_
_
costituisce un I.C. di livello 1 per il parametro
dinteresse
2
10
4. Intervallo di condenza per il
parametro di una distribuzione Be()
Lesempio con cui si era iniziato a parlare di
I.C. faceva riferimento ad una situazione di
questo genere. Un certo partito politico vuole
determinare un I.C. della percentuale di voti
che otterr`a in una elezione sulla base di un
sondaggio pre-elettorale.
In questo caso la formalizzazione prevede:
X
1
, , X
n
Be(), , i = 1, , n
e lunica distribuzione campionaria che cono-
sciamo e che pu` o essere utile in questo caso
`e quella di
S
n
=
n

i=1
X
i
Bin(n, )
Rispetto agli esempi precedenti, la distribuzione
Binomiale ha il difetto di essere discreta e
non `e possibile costruire intervalli di condenza
arbitraria.
Si preferisce allora, soprattutto se il numero
11
di osservazioni e sufcientemente grande (n >
20), ricorrere alla approssimazione normale ed
utilizzare il fatto che, approssimativamente, per
ogni valore di ,
S
n
n
_
n(1 )
N(0, 1)
oppure,
S
n
/n
_
(1)
n
N(0, 1)
Riutilizzando gli stessi passaggi gi`a svolti nel
caso 1 si arriva cos` ad aermare che
P

(
Sn
n
z
1

2
_
(1)
n

Sn
n
+z
1

2
_
(1)
n
) = 1 .
Questa relazione non pu`o ancora essere utiliz-
zata per costruire un I.C. perche gli estremi
dellI.C dipendono ancora da . Si sostituisce
allora a la sua stima naturale

=
S
n
n
e si ottiene
P(

z
1

2
_

(1

)
n


+z
1

2
_

(1

)
n
) = 1 ,
e lintervallo di condenza di livello `e
_
,

_
=
_

z
1

2
_

(1

)
n
,

+z
1

2
_

(1

)
n
_
.