Sei sulla pagina 1di 22

INFERENZA:

INTERVALLI DI
CONFIDENZA

1
Intervalli di confidenza per µ
Supponiamo di voler stimare la durata media di un certo tipo di
lampadina. Poiché non posso esaminare (e dunque distruggere)
l’intera produzione, estraggo un campione di lampadine e le tengo
accese fino a che non si bruciano.

Supponiamo che la durata media delle n lampadine risulti:

x = 1920 ore (stima puntuale)

Cosa posso concludere riguardo a µ?

Di certo, non posso affermare che: µ = 1920 = x


Infatti, x = 1920 è soltanto una realizzazione della V.C X, la quale può
assumere tutto un insieme di valori nel campo di esistenza di X.

2
Intervalli di confidenza per µ
Dunque, in generale:

µ= x + errore campionario (che non si conosce)

In sostanza, vorremmo poter affermare che, scelto un e > 0 a


piacere,

µ Î ( x – e, x + e)
Ovvero: x –e<µ< x+e
Tuttavia, non potrò mai affermare ciò con certezza, a meno che e
non sia talmente grande che l’intervallo in questione copra l’intero
campo di esistenza di X
3
Intervalli di confidenza per µ

2e 2e
𝜇
𝑥̅ − 𝜖 𝜇
𝑥̅ 𝑥̅ + 𝜖 𝑋' 𝑥̅ − 𝜖 𝑥̅ 𝑥̅ + 𝜖 𝑋'

e è lo stesso nelle due figure

- Nella 1a figura x è sufficientemente vicino a µ.

- Nella 2a figura x è troppo lontano.

È evidente che, maggiore è e, maggiore è la probabilità che l’intervallo


comprenda µ.
4
Intervalli di confidenza per µ
È anche evidente che, più grande è e e meno precisa è la stima di µ.

Ciò che possiamo affermare è:

𝑃 𝑋" − 𝜖 < 𝜇 < 𝑋" + 𝜖 = 1 − 𝛼, 0 < 𝛼 < 1

Un tale intervallo viene detto di confidenza per µ, al 100(1-a)%

1– a à livello di confidenza

Il procedimento che si segue è quello di scegliere noi stessi 1-a,


(in genere si fa uso dei livelli: 1-a = 0,90 o 0,95 o 0,99)
Calcolando successivamente e, cioè gli estremi dell’intervallo.

5
Derivazione teorica dell’intervallo di
confidenza per µ
Si fa uso della distribuzione di probabilità di X .

Supponiamo innanzitutto che X ~ N(µ,s2), con µ incognita e s2 nota


Di conseguenza sappiamo che:
2
X ~ N(µ, )
σ
n
X -µ
Dunque: = Z ~ N(0,1)
s/ n

Riguardo a Z, possiamo scrivere che:


P{ - za/2 < Z < za/2 } = 1 - a
Dove za/2 corrisponde a Q1-a/2, ovvero il quantile (valore) della distribuzione di Z
che isola alla sua sinistra un’area di probabilità 1- a/2 e a destra un’area di
probabilità pari ad a/2
Ad esempio per 1-a = 0,95 si ha: P{ -1,96 < Z < 1,96} = 0,95 6
Derivazione teorica dell’intervallo di
confidenza per µ
La precedente proposizione probabilistica, può essere scritta come:
X -µ
P{ - za/2 < < za/2 } = 1 - a (*)
s/ n
che si può esplicitare rispetto a µ.

X X

7
Derivazione teorica dell’intervallo di
confidenza per µ
Dalla (*) si ha:
ì s s ü
P í- za / 2 < X - µ < za / 2 ý = 1 - a Þ
î n n þ
ì s s ü
P í- X - za / 2 < - µ < - X + za / 2 ý = 1 - a
î n n þ
Da cui, cambiando di segno e invertendo il senso della disuguaglianza:

ì s s ü
Pí X - za / 2 < µ < X + za / 2 ý = 1 - a (**)
î n n þ
e e
Che rappresenta l’intervallo di confidenza al livello di 1-a per µ.

L’ampiezza di tale intervallo è 2


s
za / 2
Essa dipende da:
n
• 1-aà aumenta al crescere di 1-a Nota: nella (**), µ è costante.
•sà aumenta al crescere di s Ciò che è casuale sono gli estremi
• nà diminuisce al crescere di n dell’intervallo, che dipendono da X
8
Esercizio
Un antropologo ha misurato la statura (in pollici) di un campione casuale di
100 maschi di una data popolazione, trovando X = 71.

Supponendo di sapere che X ~ N(µ = ? , s2 = 9),

determinare gli intervalli di confidenza per µ al 95% e al 99%.


SOLUZIONE:
s 3
Sappiamo che X ~ N(µ = ? , s
2
X = 9/100), sX = = = 0,3
n 100
Applichiamo la formula per trovare l’intervallo di confidenza al 95%
𝜎 𝜎
𝑃 𝑋" − 𝑧!.#$ "
< 𝜇 < 𝑋 + 𝑧!.#$ = 0.95
𝑛 𝑛
𝐼𝐶!.%$ : 71 − 1.96 ⋅ 0.3; 71 + 1.96 ⋅ 0.3
𝐼𝐶!.%$ : [70.41; 71.59]

9
Esercizio (segue)
L’intervallo di confidenza al 99% risulterà più ampio:

z0,005 lo trovo sulla tavola della Normale (sarebbe Q0.995)

z0,005 (= za/2 ) = 2,576


IC(0.99): [71 – 0.3 • 2.576 ; 71 + 0.3 • 2.576]

IC(0.99): [70.23 ; 71.77] (stima più sicura ma meno precisa!)

Attenzione: scrivere 70.23 < µ < 71.77 è sbagliato, poiché indica un evento
certo.
10
Esercizio
Nell’ambito di una ricerca sui consumi familiari, la spesa media per consumi in
un campione di n = 50 famiglie risulta X = 5,2 (migliaia di Euro)
Supponendo che, per questa tipologia di famiglie

X ~ N(µ = ? , s2 = 0,722),

costruire l’intervallo di confidenza per µ al 95%.

SOLUZIONE: possiamo trovare gli estremi dell’intervallo di confidenza così:


s 0,72
Estremo inferiore x- z a / 2 = 5,2 - × 1,96 = 5
n 50
s 0,72
Estremo superiore x + z a / 2 = 5,2 + × 1,96 = 5,4
n 50
Alla fine scrivo: IC(0.95): [5 ; 5,4]
Ovvero: la media per consumi nella popolazione è compresa tra 5 e 5,4
migliaia di euro con una fiducia del 95% 11
Intervalli di confidenza per µ con
varianza incognita
Sia X una v.c. che rappresenta un carattere osservato su
una popolazione. Supponiamo che la v.c. sia distribuita
come una Normale con media e varianza ignota.
Per stimare la varianza della popolazione si utilizza lo
stimatore varianza campionaria corretta:

n
1 2
s2 = ∑ ( xi − x )
n −1 i =1

12
Intervalli di confidenza per µ con
varianza incognita
Teorema: sia Z~N(0,1) e Y~c2(k) dove c2(k) è una variabile
casuale chi-quadrato, allora
Z
T =
Y /K
è una variabile casuale t-Student con k gradi di libertà.

Applicazione: sia X~N(µ,s2) e sia X1,…,Xn un campione


casuale estratto da X, risulta
X −µ
σ/ n X −µ
T = = ~ t ( n −1)
(n −1)s 2
s/ n
/ ( n −1)
σ2
13
Intervalli di confidenza per µ con
varianza incognita
La funzione di densità di una t(k) ha forma campanulare ed è
simmetrica intorno allo 0, come la N(0,1). Inoltre, dipende
dal parametro k chiamato “gradi di libertà”.
La distribuzione ha “code più pesanti” della N(0,1), ma
tende a diventare uguale alla N(0,1) al crescere dei gradi di
libertà (k ³ 30).
Con il medesimo ragionamento fatto per la v.c. Gaussiana,
fissato a possiamo leggere sulla tavola della t i valori ± tα /2
tali che:


14
Intervalli di confidenza per µ con
varianza incognita
Dato un campione casuale di dimensione n estratto da
una popolazione Normale con media μ e varianza σ2
entrambe ignote, l’intervallo di confidenza per la media a
livello 1-α è dato da:

" s s %
P #X − t n −1;α /2 < µ < X + t n −1;α /2 & = 1− α
$ n n '

15
Intervalli di confidenza per µ con
varianza incognita (piccoli campioni)
Esempio
Avendo somministrato ad un campione casuale di cavie una particolare
dieta, dalla nascita fino all’età di tre mesi, ed avendo riscontrato I seguenti
incrementi nel peso: 55, 62, 54, 57, 65, 64, 60, 63, 58, 67, 63 e 61 grammi;
si vuol determinare un intervallo di confidenza, al livello del 95%
relativamente all’incremento medio di peso.
Attribuendo al caso le differenze riscontrate negli aumenti di peso, si potrà
presumere Normale la popolazione teorica di tutte le cavie sottoponibili a
quella particolare dieta. In questo caso l’intervallo simmetrico di confidenza
può essere derivato dall’uguaglianza:

# s s &
P % x − t α /2;n −1 ≤ µ ≤ x + t α /2;n −1 ( = 1− α
$ n n'
16
Intervalli di confidenza per µ con
varianza incognita (piccoli campioni)
Esempio – continua
Sulle tavole della distribuzione t, in corrispondenza di 12-1=11 gradi di
libertà e per a=0,05 si trova ta/2=t0,025=2,20 (dove 2,20 è il valore che
soddisfa la relazione P(t ≤ 2,20) = F(2,20) = 0,975); si avrà allora:

16.38 16.38
𝐼𝐶).+, : 60.75 − 2.2 ⋅ ; 60.75 − 2.2 ⋅
12 12

dove 60.75 è naturalmente l’incremento medio di peso riscontrato nelle


dodici cavie e 16.38 è la stima corretta della varianza incognita s2 della
popolazione teorica.
Dall’ultima uguaglianza scritta risulta l’intervallo di confidenza

IC0.95: [58.17 ; 63.32] 17


Intervalli di confidenza per µ (popolazioni
non normali, grandi campioni)
Quando non è nota la distribuzione del carattere X nella
popolazione ma il campione ha una dimensione
sufficientemente grande, possiamo considerare
un’approssimazione dell’intervallo di confidenza per la media
ottenuta attraverso il teorema del limite centrale.

Per n sufficientemente grande possiamo utilizzare il seguente


intervallo di confidenza a livello 1-α:

" s s %
P #X − zα /2 < µ < X + zα /2 & = 1− α
$ n n '
18
Intervalli di confidenza per proporzioni
Quando la popolazione è riferita a un carattere che può
assumere solo due modalità (popolazione Bernoulliana),
siamo interessati all’intervallo di confidenza per una
proporzione π.
Come sappiamo un buon stimatore per π è la media
campionaria X che corrisponde alla proporzione
campionaria 𝒫.
Si ha: E (X ) = p V (X ) = p (1 - p ) n
Inoltre, dal teorema del limite centrale sappiamo che al
crescere della dimensione campionaria la distribuzione
della X tende alla Normale, pertanto
X −π
Z= ~N ( 0 , 1)
π (1− π ) n 19
Intervalli di confidenza per proporzioni
$ '
& X −π )
1− α ≅ P & −zα 2 ≤ ≤ +z α 2 )
&
% (
π 1− π n ) )
(
$ '
&
= P X − zα 2
π 1− π ( )
≤ π ≤ X + zα 2
π 1− π ( ) )
& n n )
% (
Tuttavia gli estremi dell’intervallo dipendono ancora dal
parametro incognito e dunque devono essere sostituiti con
degli stimatori, ottenendo il seguente intervallo di
confidenza al livello 1-α (𝒫 è la vc proporz. campionaria):

𝜋 1−𝜋 𝜋 1−𝜋
𝑃 𝒫 − 𝑧! < 𝜋 < 𝒫 − 𝑧! =1−𝛼
" 𝑛 " 𝑛
Regola pratica: np ≥ 5 e n (1− p ) ≥ 5 20
Esempio
Si vuole ottenere una stima intervallare, con una fiducia del 95%, della
proporzione di fumatori presenti in una certa regione. A tal fine viene
osservato un campione casuale di 120 persone, di cui 78 sono fumatori.
Quindi la stima puntuale della proporzione è data da:
p = 78 120 = 0,65
L’intervallo di confidenza al livello 1-α = 0,95 è:

𝜋 1−𝜋 𝜋 1−𝜋
𝑃 𝒫 − 𝑧! < 𝜋 < 𝒫 − 𝑧! =1−𝛼
" 𝑛 " 𝑛

IC0.95: [0.65-1.96(0.65•0.35/120)0.5 ; 0.65+1.96(0.65•0.35/120)0.5]


IC0.95: [0.5647; 0.7353]

In questo caso: np = 120 ⋅ 0,65 = 78 ≥ 5


n (1− p ) = 120 ⋅ 0,35 = 42 ≥ 5 21
Schema riassuntivo
Inferenza

µ π
Proporz.
Media pop pop.

X~ X ~ Altro o X
Normale ? dicotomica

s2=nπ(1-
s noto
2 s ignoto
2 s noto
2 s ignoto
2
π)à s2
ignoto

n piccolo
! σ2$ ! s2$
X ~ N # µ, & X ~ t # µ, & P~Bin (non
Th. Cebicev Th. Cebicev
" n % " n % si fa)

n grande ! σ2$ ! s2$ ! σ2$ " π (1− π ) %


X ~ N # µ, & X ~ t # µ, & X ~ N # µ, & Niente p ~ N $π ,
n &
'
" n % " n % " n %
#

22

Potrebbero piacerti anche