Lezione 21
Nei casi reali il parametro in questione è ovviamente ignoto, per cui non c’è
nessuna possibilità di quantificare l'errore commesso utilizzando una
particolare stima.
Per determinare la bontà di una funzione dei dati campionari rispetto ad altre
funzioni diverse ci si basa sulle proprietà degli stimatori. Si sceglierà quindi lo
stimatore con le proprietà migliori, anche se in una particolare occasione di
campionamento non si potrà mai sapere se la stima fornita dallo stimatore
scelto è effettivamente prossima al valore vero del parametro ignoto.
Nel caso della stima del parametro , per esempio, si giungerà alla conclusione
che lo stimatore migliore è la media campionaria, ma in una determinata
occasione di campionamento non si potrà mai essere sicuri che il calcolo della
mediana campionaria o della moda campionaria non avrebbe fornito un
risultato che sarebbe stato più vicino a .
1
Lezione 21
1) CORRETTEZZA
La funzione T=g(X) dei dati campionari è uno stimatore corretto del parametro
se il valore atteso dello stimatore è uguale al parametro da stimare, ossia se
E(T) =
B(T) = E(T) −
dove la lettera B é l’iniziale del termine inglese “bias” (che si legge bɑɪ·əs).
2
Lezione 21
Considerando gli stimatori analizzati nel corso di queste lezioni, risulta che la
media campionaria e la proporzione campionaria sono stimatori corretti. Si è
infatti dimostrato in precedenza che
𝐸(𝑋̅) = 𝜇
𝐸(𝑃̂) = 𝜋
ovvero
𝑙𝑖𝑚 𝐵(𝑇) = 0
𝑛→∞
3
Lezione 21
𝑛
𝑆𝑐2 = 𝑆2
𝑛−1
𝑛 𝑛 𝑛 𝑛−1 2
𝐸(𝑆𝑐2 ) = 𝐸 ( 𝑆2) = 𝐸(𝑆 2 ) = 𝜎 = 𝜎2
𝑛−1 𝑛−1 𝑛−1 𝑛
4
Lezione 21
variabilità così elevata da poter fornire stime molto distanti dal valore vero del
parametro.
2) EFFICIENZA
Una misura della variabilità delle stime fornite da uno stimatore è fornita dal
suo errore quadratico medio (o momento secondo dell’errore di stima) che
corrisponde a
dove l’acronimo MSE indica le iniziali del termine inglese “mean square error”.
Questo indice fornisce una misura della precisione dello stimatore, in quanto
calcola la media dei quadrati delle differenze fra i possibili valori dello
stimatore e il parametro da stimare.
Al crescere della precisione delle stime cresce anche l’efficienza dello stimatore,
nel senso che diminuisce il grado di incertezza sulle stime ottenute mediante
un’indagine campionaria.
Uno stimatore, anche se corretto, risulta quindi poco efficiente se presenta
un’elevata variabilità delle stime del parametro ignoto.
5
Lezione 21
per ogni possibile valore del parametro , si conclude dicendo cheT1 è più
efficiente di T2.
Nel caso del parametro , per esempio, risulta che la media campionaria è uno
stimatore più efficiente della mediana campionaria o della moda campionaria,
quale che sia il valore di .
Dimostrazione
𝑀𝑆𝐸(𝑇) = 𝐸(𝑇 − 𝜃)2 = 𝐸[𝑇 − 𝐸(𝑇) + 𝐸(𝑇) − 𝜃]2 =
= 𝐸{[𝑇 − 𝐸(𝑇)] + [𝐸(𝑇) − 𝜃]}2 =
= 𝐸{[𝑇 − 𝐸(𝑇)]2 + [𝐸(𝑇) − 𝜃]2 + 2[𝑇 − 𝐸(𝑇)][𝐸(𝑇) − 𝜃]} =
= 𝐸[𝑇 − 𝐸(𝑇)]2 + 𝐸[𝐸(𝑇) − 𝜃]2 + 2[𝐸(𝑇) − 𝜃] × 𝐸[𝑇 − 𝐸(𝑇)]
6
Lezione 21
Il rettangolo dai bordi azzurri corrisponde alla media di una variabile scarto, in
quanto considera la media della differenza fra lo stimatore T e il suo valore
atteso. Quindi la quantità racchiusa nel rettangolo azzurro è pari a zero.
L’errore quadratico medio corrisponde quindi a
MSE(T) = V(T)
𝑀𝑆𝐸(𝑇1 )
𝑒(𝑇1 , 𝑇1 ) =
𝑀𝑆𝐸(𝑇2 )
𝑉(𝑇1 )
𝑒(𝑇1 , 𝑇1 ) =
𝑉(𝑇2 )
7
Lezione 21
V min
e(T) =
V (T )
Se risulta
e(T) = 1,
per tutti i possibili valori del parametro , si conclude che T è uno stimatore che
ha varianza minima e si dice quindi che ha massima efficienza.
3) COERENZA (o CONSISTENZA)
Un’altra importante proprietà di uno stimatore esamina il suo comportamento
per un campione la cui numerosità tende ad infinito.
𝑙𝑖𝑚 𝑃(|𝑇 − 𝜃| ≥ 𝜀) = 0
𝑛→∞
8
Lezione 21
ESERCIZI
1. Data una popolazione di valore atteso e varianza unitaria, si estragga un
campione casuale di 4 elementi estratti con ripetizione e si considerino i
seguenti stimatori di
𝑋1 + 𝑋4
𝑇1 =
2
𝑋1 + 𝑋2 + 𝑋3 + 𝑋4
𝑇2 =
4
𝑋1 + 2𝑋2 + 2𝑋3 + 𝑋4
𝑇3 =
6
Si verifichi che sono tutti stimatori corretti e si individui quello più efficiente.
I valori attesi dei tre stimatori, combinazioni lineari delle 𝑋𝑖 , risultano quindi
𝐸(𝑋1 ) + 𝐸(𝑋4 ) 𝜇 + 𝜇
𝐸(𝑇1 ) = = =𝜇
2 2
𝐸(𝑋1 ) + 𝐸(𝑋2 ) + 𝐸(𝑋3 ) + 𝐸(𝑋4 ) 4𝜇
𝐸(𝑇2 ) = = =𝜇
4 4
𝐸(𝑋1 ) + 2𝐸(𝑋2 ) + 2𝐸(𝑋3 ) + 𝐸(𝑋4 ) 6𝜇
𝐸(𝑇3 ) = = =𝜇
6 6
9
Lezione 21
10
Lezione 21
11
𝑀𝑆𝐸(𝑇1 ) = 𝑉(𝑇1 ) =
32
2
1 1 1 1 2
𝑀𝑆𝐸(𝑇2 ) = 𝑉(𝑇2 ) + [𝐵(𝑇2 )]2 = + ( 𝜇 − 𝜇) = + 𝜇
16 2 16 4
Ponendo 𝜇 = 1 risulta
1 1 5 10
𝑀𝑆𝐸(𝑇2 ) = + = = < 𝑀𝑆𝐸(𝑇1 )
16 4 16 32
11
Lezione 21
∑𝑛−3
𝑖=1 𝑋𝑖 2
𝑇= + 𝑋𝑛
𝑛−3 𝑛
La varianza di T è
∑𝑛−3
𝑖=1 𝑉(𝑋𝑖 ) 4 (𝑛 − 3)𝜎 2 4 2 𝜎2 4𝜎 2
𝑉(𝑇) = + 2 𝑉(𝑋𝑛 ) = + 2𝜎 = +
(𝑛 − 3)2 𝑛 (𝑛 − 3)2 𝑛 𝑛 − 3 𝑛2
𝑙𝑖𝑚 𝑉(𝑇) = 0
𝑛→∞
12