Sei sulla pagina 1di 5

INTERVALLI DI CONFIDENZA PER LA MEDIA

Il procedimento dei test d’ipotesi può essere applicato anche


alla costruzione di intervalli di confidenza per il parametro.
Gli intervalli di confidenza consentono di ottenere delle stime
per intervallo del parametro della popolazione.
La ragione per cui spesso è utile costruire intervalli di confi-
denza risiede nel fatto che la stima puntuale del parametro di
popolazione, che consiste nell’utilizzare le informazioni cam-
pionarie per ottenere una stima del parametro incognito di
popolazione tramite un singolo valore numerico, possiede un
punto di debolezza. Potrebbe succedere, infatti, che la stima
ottenuta sul campione potrebbe differire in modo significati-
vo dal valore del parametro incognito, ossia potremmo essere
in presenza di un campione molto difforme dalla popolazione
di riferimento. Può essere opportuno, quindi, affiancare alla
stima puntuale anche un intervallo di valori plausibili per il
parametro di popolazione all’interno del quale, con una certa
probabilità, si trova il valore vero del parametro.
Se guardiamo tale procedura dal punto di vista dei test d’ipote-
si, siamo interessati non più alle code della distribuzione del-
la statistica campionaria quanto, piuttosto, alla parte centrale
della distribuzione.

Supponiamo che in un campione casuale semplice di n unità


abbiamo osservato la media campionaria x̄ del carattere X di
media µ. Sappiamo che x̄ è la stima puntuale di µ. Per trovare
un intervallo di confidenza per il parametro µ seguiamo una
procedura analoga a quella dei test d’ipotesi.
Fissato un livello di significatività α = 0.05, con riferimento
alla distribuzione della variabile aleatoria X̄ , sappiamo che il
95% dei campioni ha media compresa nell’intervallo −x̄ α2 , x̄ α2 ,
mentre il 5% dei campioni cade nelle code.
Se ci riferiamo alla variabile aleatoria standardizzata
X̄−µ
Z= √
σ/ n

α
possiamo affermare che P (Z ≥ z α2 ) = 2 ed, equivalente-

1
mente, P (Z < −z α2 ) = α2 . Allo stesso modo
X̄−µ
P (−z α2 ≤ Z ≤ z α2 ) = 1 − α. Ora, sostituendo a Z = √
σ/ n
si
ottiene:
X̄ − µ
P (−z α2 ≤ Z ≤ z α2 ) = P (−z α2 ≤ √ ≤ z α2 ) =
σ/ n
σ σ
= P (X̄ − z α2 √ ≤ µ ≤ X̄ + z α2 √ ) =
n n
= 1−α
Abbiamo quindi trovato un intervallo per il parametro di popo-
lazione µ. Diremo che la probabilità che µ sia compreso tra
X̄ − z α2 √σn e X̄ + z α2 √σn è uguale a 1 − α.
Conoscendo la media campionaria, la varianza di popolazione
e la numerosità campionaria posso costruire un intervallo nel
quale, con un certo grado di probabilità o di confidenza, è
compreso il parametro di popolazione.

Esempio.
Sia x̄1 = 2.5 la media del carattere X nel campione casuale 1
di numerosità n = 10. Supponiamo che la varianza di popo-
lazione sia pari a σ 2 = 4.
Costruiamo l’intervallo di confidenza per µ per un livello di
significatività α = 0.05. Dalle tavole sappiamo che z α2 =
1.96 e −z α2 = −1.96.
L’intervallo di confidenza è allora:
σ σ
P (x̄ − z α2 √ ≤ µ ≤ x̄ + z α2 √ ) =
n n
2 2
= P (2.5 − 1.96 · √ ≤ µ ≤ 2.5 + 1.96 · √ ) =
10 10
= P (1.26 ≤ µ ≤ 3.74) = 0.95
Diremo quindi che, al 95%, la media di popolazione è com-
presa nell’intervallo (1.26, 3.74).
Se osserviamo, poi, un secondo campione di media x̄2 = 3.5

2
e stessa numerosità, l’intervallo di confidenza è pari a:
2 2
P (3.5 − 1.96 · √ ≤ µ ≤ 3.5 + 1.96 · √ ) =
10 10
= P (2.26 ≤ µ ≤ 4.74) = 0.95
Diremo quindi che, al 95%, la media di popolazione è com-
presa nell’intervallo (2.26, 4.74).
Infine supponiamo di osservare un terzo campione di media
x̄3 = 1.5 e stessa numerosità, l’intervallo di confidenza è pari
a:
2 2
P (1.5 − 1.96 · √ ≤ µ ≤ 1.5 + 1.96 · √ ) =
10 10
= P (0.26 ≤ µ ≤ 2.74) = 0.95
Al 95%, la media di popolazione è compresa nell’intervallo
(0.26, 2.74).
L’intervallo di confidenza ha sempre la stessa ampiezza, poiché
essa dipende da σ , da n e da z α2 che in questo caso sono costan-
ti. Evidentemente al variare del valore della media campionar-
ia osservata, varia anche l’intervallo. L’intervallo si restringe
se cresce n o se diminuisce σ , mentre invece diventa più am-
pio se si fissa un α più piccolo.
Nella figura successiva è riportato il grafico della distribuzione
di X̄ nell’universo dei campioni e gli intervalli di confidenza
calcolati nell’esempio.

3
Nel caso in cui la varianza di popolazioni non sia nota si ri-
corre, come nei test d’ipotesi, alla varianza campionaria cor-
retta. Pertanto l’intervallo di confidenza per la media diventa:
ŝ ŝ
P (X̄ − t α2 ,n−1 √ ≤ µ ≤ X̄ + t α2 ,n−1 √ ) = 1 − α
n n
Se n è piccolo, ci riferiremo non più alla statistica z bensı̀ alla
statistica t con n − 1 gradi di libertà.

Esempio.
Tornando all’esempio precedente, per cui n = 10 in tutti e 3 i
campioni, x̄1 = 2.5, x̄2 = 3.5 e x̄3 = 1.5 supponiamo di non
conoscere la varianza di popolazione ma di conoscere le vari-
anze campionarie corrette ŝ21 = 1.25, ŝ22 = 2.25, e ŝ21 = 1.50.
Gli intervalli di confidenza sono dunque per i tre campioni:
ŝ1 ŝ1
P (x¯1 − t α2 ,n−1 √ ≤ µ ≤ x¯1 + t α2 ,n−1 √ ) =
n n
√ √
1.25 1.25
= P (2.5 − 2.26 · √ ≤ µ ≤ 2.5 + 2.26 · √ ) =
10 10
= P (1.70 ≤ µ ≤ 3.29) = 0.95

4
ŝ2 ŝ2
P (x¯2 − t α2 ,n−1 √ ≤ µ ≤ x¯2 + t α2 ,n−1 √ ) =
n n
√ √
2.25 2.25
= P (3.5 − 2.26 · √ ≤ µ ≤ 3.5 + 2.26 · √ ) =
10 10
= P (2.43 ≤ µ ≤ 4.57) = 0.95

ŝ3 ŝ3
P (x¯3 − t α2 ,n−1 √ ≤ µ ≤ x¯3 + t α2 ,n−1 √ ) =
n n
√ √
1.50 1.50
= P (1.5 − 2.26 · √ ≤ µ ≤ 1.5 + 2.26 · √ ) =
10 10
= P (0.63 ≤ µ ≤ 2.38) = 0.95
Al 95%, la media di popolazione è compresa nell’intervallo
(1.70, 3.29) per il primo campione, nell’intervallo (2.43, 4.57)
per il secondo campione, (0.63, 2.38) per il terzo. In questo
caso, dato che ogni intervallo è costruito sulla varianza cam-
pionaria corretta, varia anche l’ampiezza dell’intervallo.