Lezione 21 Proprietà Degli Stimatori

Lezione 21
Lezione 21
PROPRIETÀ DEGLI STIMATORI

Considerato un certo parametro , esistono diverse funzioni dei dati
campionari che possono essere considerate come possibili stimatori del
parametro, ma è evidente che la scelta di una determinata funzione oppure di
una funzione diversa porta a stime che sono generalmente diverse fra di loro.
Se è noto che Z ha una distribuzione normale, per esempio, il suo parametro 
potrebbe essere stimato dalla media, dalla moda o dalla mediana del campione.
Nei casi reali il parametro in questione è ovviamente ignoto, per cui non c’è
nessuna possibilità di quantificare l'errore commesso utilizzando una
particolare stima.
Per determinare la bontà di una funzione dei dati campionari rispetto ad altre
funzioni diverse ci si basa sulle proprietà degli stimatori. Si sceglierà quindi lo
stimatore con le proprietà migliori, anche se in una particolare occasione di
campionamento non si potrà mai sapere se la stima fornita dallo stimatore
scelto è effettivamente prossima al valore vero del parametro ignoto.
Nel caso della stima del parametro , per esempio, si giungerà alla conclusione
che lo stimatore migliore è la media campionaria, ma in una determinata
occasione di campionamento non si potrà mai essere sicuri che il calcolo della
mediana campionaria o della moda campionaria non avrebbe fornito un
risultato che sarebbe stato più vicino a .
1
Lezione 21
Semplificando al massimo il problema, si consideri una variabile Z che ha una

distribuzione di frequenza f(z,) di forma nota in cui compare un unico
parametro ignoto: . In maniera analoga, se la distribuzione di Z fosse invece
ben approssimata da un qualche modello teorico, si consideri un modello f(z,)
caratterizzato dal valore del parametro ignoto .
Partendo da questo presupposto, si studieranno 3 importanti proprietà degli
stimatori:
1) CORRETTEZZA
La funzione T=g(X) dei dati campionari è uno stimatore corretto del parametro
 se il valore atteso dello stimatore è uguale al parametro da stimare, ossia se
E(T) = 
per ogni possibile valore del parametro .
Questa proprietà fornisce garanzie contro il verificarsi di errori di stima

sistematici, ossia di sistematiche sovrastime o sottostime del parametro. Se uno
stimatore non è corretto, si parla infatti di stime “distorte in media”.
Se uno stimatore non è corretto, si dice distorto, e la sua distorsione è data dalla
differenza
B(T) = E(T) − 
dove la lettera B é l’iniziale del termine inglese “bias” (che si legge bɑɪ·əs).
2
Lezione 21
Considerando gli stimatori analizzati nel corso di queste lezioni, risulta che la
media campionaria e la proporzione campionaria sono stimatori corretti. Si è
infatti dimostrato in precedenza che
𝐸(𝑋̅) = 𝜇
𝐸(𝑃̂) = 𝜋
Non è invece corretta la varianza campionaria, in quanto

𝑛−1 2
𝐸(𝑆 2 ) = 𝜎
𝑛
Va però notato che al crescere della numerosità campionaria 𝑛 il valore atteso

della varianza campionaria tende a 𝜎 2 , per cui questo stimatore si dice
asintoticamente corretto. La sua distorsione tende quindi a zero per 𝑛 che tende
a +∞.
In generale, considerata una variabile Z che nella popolazione ha una

distribuzione caratterizzata da un parametro ignoto , uno stimatore T=g(X)
di  è asintoticamente corretto se, per ogni possibile valore del parametro ,
risulta
𝑙𝑖𝑚 𝐸(𝑇) = 𝜃
𝑛→∞
ovvero
𝑙𝑖𝑚 𝐵(𝑇) = 0
𝑛→∞
e cioè se il suo valore atteso dello stimatore tende al parametro da stimare al

crescere della numerosità del campione.
3
Lezione 21
Se uno stimatore è distorto è talvolta possibile correggere la sua distorsione,

come accade nel caso della varianza campionaria. Se infatti si moltiplica la
𝑛
varianza campionaria per la costante , si ottiene lo stimatore varianza
𝑛−1
campionaria corretta, spesso indicata mediante la notazione 𝑆𝑐2 .
In genere, quindi, la varianza 𝜎 2 della popolazione viene stimata utilizzando lo
stimatore
𝑛
𝑆𝑐2 = 𝑆2
𝑛−1
che sarà quello che verrà utilizzato nelle lezioni successive.

Per ottenere il valore di questa funzione dei dati campionari conviene
comunque calcolare la varianza campionaria nel modo usuale e poi
𝑛
moltiplicarla per la costante
𝑛−1
La dimostrazione che 𝑆𝑐2 è uno stimatore corretto della varianza della

popolazione è estremamente semplice, in quanto
𝑛 𝑛 𝑛 𝑛−1 2
𝐸(𝑆𝑐2 ) = 𝐸 ( 𝑆2) = 𝐸(𝑆 2 ) = 𝜎 = 𝜎2
𝑛−1 𝑛−1 𝑛−1 𝑛
Anche se la correttezza è una proprietà desiderabile per uno stimatore, va detto

che, in alcuni casi, uno stimatore distorto può essere preferibile a uno stimatore
corretto. Questo accade se lo stimatore corretto fornisce elevate sottostime e
sovrastime che si compensano fra loro, per cui lo stimatore presenta una
4
Lezione 21
variabilità così elevata da poter fornire stime molto distanti dal valore vero del
parametro.
2) EFFICIENZA
Una misura della variabilità delle stime fornite da uno stimatore è fornita dal
suo errore quadratico medio (o momento secondo dell’errore di stima) che
corrisponde a
𝑀𝑆𝐸(𝑇) = 𝐸(𝑇 − 𝜃)2
dove l’acronimo MSE indica le iniziali del termine inglese “mean square error”.
Questo indice fornisce una misura della precisione dello stimatore, in quanto
calcola la media dei quadrati delle differenze fra i possibili valori dello
stimatore e il parametro da stimare.
Al crescere della precisione delle stime cresce anche l’efficienza dello stimatore,
nel senso che diminuisce il grado di incertezza sulle stime ottenute mediante
un’indagine campionaria.
Uno stimatore, anche se corretto, risulta quindi poco efficiente se presenta
un’elevata variabilità delle stime del parametro ignoto.
In genere l’errore quadratico medio viene calcolato per confrontare l’efficienza

di due diversi stimatori del parametro. Considerati, per esempio, gli stimatori
T1 e T2 di , se risulta
MSE (T1) < MSE(T2)
5
Lezione 21
per ogni possibile valore del parametro , si conclude dicendo cheT1 è più
efficiente di T2.
Nel caso del parametro , per esempio, risulta che la media campionaria è uno
stimatore più efficiente della mediana campionaria o della moda campionaria,
quale che sia il valore di .
Proprietà dell’errore quadratico medio

L’errore quadratico medio corrisponde alla somma della varianza dello
stimatore più la sua distorsione al quadrato
Questa dimostrazione si effettua sommando e sottraendo il valore atteso 𝐸(𝑇)

dello stimatore all’interno della formula dell’errore quadratico medio, creando
un binomio e sviluppandone il quadrato
Dimostrazione
𝑀𝑆𝐸(𝑇) = 𝐸(𝑇 − 𝜃)2 = 𝐸[𝑇 − 𝐸(𝑇) + 𝐸(𝑇) − 𝜃]2 =
= 𝐸{[𝑇 − 𝐸(𝑇)] + [𝐸(𝑇) − 𝜃]}2 =
= 𝐸{[𝑇 − 𝐸(𝑇)]2 + [𝐸(𝑇) − 𝜃]2 + 2[𝑇 − 𝐸(𝑇)][𝐸(𝑇) − 𝜃]} =
= 𝐸[𝑇 − 𝐸(𝑇)]2 + 𝐸[𝐸(𝑇) − 𝜃]2 + 2[𝐸(𝑇) − 𝜃] × 𝐸[𝑇 − 𝐸(𝑇)]
Il rettangolo dai bordi gialli contiene un’espressione che corrisponde alla

varianza dello stimatore
Il rettangolo dai bordi rossi corrisponde alla media della differenza al quadrato
fra valore atteso dello stimatore e parametro, per cui corrisponde alla media
della distorsione al quadrato, che è una costante rispetto all’operatore “valore
medio”
6
Lezione 21
Il rettangolo dai bordi azzurri corrisponde alla media di una variabile scarto, in
quanto considera la media della differenza fra lo stimatore T e il suo valore
atteso. Quindi la quantità racchiusa nel rettangolo azzurro è pari a zero.
L’errore quadratico medio corrisponde quindi a
𝑀𝑆𝐸(𝑇) = 𝑉(𝑇) + [𝐵(𝑇)]2
Da questa dimostrazione risulta che se uno stimatore T è corretto il suo errore

quadratico medio corrisponde alla sua varianza
MSE(T) = V(T)
Spesso, dati due diversi stimatori T1 e T2 di uno stesso parametro , si calcola

l’efficienza relativa di T1 rispetto a T2 mediante il rapporto
𝑀𝑆𝐸(𝑇1 )
𝑒(𝑇1 , 𝑇1 ) =
𝑀𝑆𝐸(𝑇2 )
che, se entrambi gli stimatori risultano corretti, assume la forma
𝑉(𝑇1 )
𝑒(𝑇1 , 𝑇1 ) =
𝑉(𝑇2 )
Infine, considerata una variabile Z con distribuzione f(z, ) e uno stimatore

corretto T di  se sono soddisfatte alcune condizioni abbastanza generali, si
7
Lezione 21
dimostra mediante la disuguaglianza di Rao-Cramér che la varianza di T non

può mai essere inferiore a una quantità Vmin, che dipende da f(z, ) e da n.
Si ottiene quindi una misura dell’efficienza assoluta di T calcolando il rapporto
V min
e(T) =
V (T )
Se risulta
e(T) = 1,
per tutti i possibili valori del parametro , si conclude che T è uno stimatore che
ha varianza minima e si dice quindi che ha massima efficienza.
3) COERENZA (o CONSISTENZA)
Un’altra importante proprietà di uno stimatore esamina il suo comportamento
per un campione la cui numerosità tende ad infinito.
Uno stimatore si dice coerente (o consistente) se, considerato un qualsiasi

valore   0, risulta
𝑙𝑖𝑚 𝑃(|𝑇 − 𝜃| ≥ 𝜀) = 0
𝑛→∞
per ogni possibile valore del parametro .
Uno stimatore si dice quindi coerente se, al crescere di n, tende a zero la

probabilità che la differenza in valore assoluto tra stimatore e parametro risulti
maggiore di un  comunque piccolo.
8
Lezione 21
In altri termini, questo significa che lo stimatore T converge in probabilità a .

La coerenza, quindi comporta necessariamente che lo stimatore T sia corretto
o, almeno, asintoticamente corretto e che la sua varianza V(T) tenda a zero per
n che tende a infinito.
La statistica 𝑋 è uno stimatore coerente di  o di  (a seconda della
distribuzione della Z e, di conseguenza, delle Xi). Anche gli stimatori della
varianza, S2 e 𝑆𝑐2 , sono entrambi stimatori coerenti di 2.
ESERCIZI
1. Data una popolazione di valore atteso  e varianza unitaria, si estragga un
campione casuale di 4 elementi estratti con ripetizione e si considerino i
seguenti stimatori di 
𝑋1 + 𝑋4
𝑇1 =
2
𝑋1 + 𝑋2 + 𝑋3 + 𝑋4
𝑇2 =
4
𝑋1 + 2𝑋2 + 2𝑋3 + 𝑋4
𝑇3 =
6
Si verifichi che sono tutti stimatori corretti e si individui quello più efficiente.
La distribuzione di probabilità delle variabili 𝑋𝑖 corrisponde alla distribuzione

di frequenza della Z, per cui ciascuna 𝑋𝑖 ha un valore atteso pari a  e varianza
unitaria
I valori attesi dei tre stimatori, combinazioni lineari delle 𝑋𝑖 , risultano quindi
𝐸(𝑋1 ) + 𝐸(𝑋4 ) 𝜇 + 𝜇
𝐸(𝑇1 ) = = =𝜇
2 2
𝐸(𝑋1 ) + 𝐸(𝑋2 ) + 𝐸(𝑋3 ) + 𝐸(𝑋4 ) 4𝜇
𝐸(𝑇2 ) = = =𝜇
4 4
𝐸(𝑋1 ) + 2𝐸(𝑋2 ) + 2𝐸(𝑋3 ) + 𝐸(𝑋4 ) 6𝜇
𝐸(𝑇3 ) = = =𝜇
6 6
9
Lezione 21
mentre le loro varianze sono

𝑉(𝑋1 ) + 𝑉(𝑋4 ) 1 + 1 1
𝑉(𝑇1 ) = = = = 0.5
4 4 2
𝑉(𝑋1 ) + 𝑉(𝑋2 ) + 𝑉(𝑋3 ) + 𝑉(𝑋4 ) 1 + 1 + 1 + 1 1
𝑉(𝑇2 ) = = = = 0.25
16 16 4
𝑉(𝑋1 ) + 4𝑉(𝑋2 ) + 4𝑉(𝑋3 ) + 𝑉(𝑋4 ) 10
𝑉(𝑇3 ) = = = 0.27̄
36 36
Si conclude quindi che lo stimatore più efficiente è T2
2. Data una popolazione di valore atteso  e varianza unitaria, si estragga un

campione casuale di 4 elementi estratti con ripetizione e si considerino gli
stimatori di 
1 1 1 1
𝑇1 = 𝑋1 + 𝑋2 + 𝑋3 + 𝑋4
2 8 4 8
1
𝑇2 = 𝑋̄
2
Si verifichi se sono stimatori corretti e si calcoli la loro varianza e il valore
dell’errore quadratico medio per =1
I valori attesi dei due stimatori risultano

1 1 1 1 4+1+2+1
𝐸(𝑇1 ) = 𝐸(𝑋1 ) + 𝐸(𝑋2 ) + 𝐸(𝑋3 ) + 𝐸(𝑋4 ) = 𝜇=𝜇
2 8 4 8 8
1 1
𝐸(𝑇2 ) = 𝐸(𝑋̄) = 𝜇
2 2
Lo stimatore 𝑇1 è quindi corretto, mentre 𝑇2 è distorto
Le varianze dei due stimatori sono

1 1 1 1 16 + 1 + 4 + 1 2
𝑉(𝑇1 ) = 𝑉(𝑋1 ) + 𝑉(𝑋2 ) + 𝑉(𝑋3 ) + 𝑉(𝑋4 ) = 𝜎 =
4 64 16 64 64
22 2 11
= 𝜎 =
64 32
1 1 𝜎2 1
𝑉(𝑇2 ) = 𝑉(𝑋̄) = =
4 4 4 16
Di conseguenza i due errori quadratici medi sono
10
Lezione 21
11
𝑀𝑆𝐸(𝑇1 ) = 𝑉(𝑇1 ) =
32
2
1 1 1 1 2
𝑀𝑆𝐸(𝑇2 ) = 𝑉(𝑇2 ) + [𝐵(𝑇2 )]2 = + ( 𝜇 − 𝜇) = + 𝜇
16 2 16 4
Ponendo 𝜇 = 1 risulta
1 1 5 10
𝑀𝑆𝐸(𝑇2 ) = + = = < 𝑀𝑆𝐸(𝑇1 )
16 4 16 32
3. Data una popolazione di media  e varianza 2, si estragga un campione

bernoulliano di 2 elementi e si considerino i seguenti stimatori di 
1 2
𝑇1 = 𝑋1 + 𝑋2
3 3
3 1
𝑇2 = 𝑋1 + 𝑋2
4 4
Si individui quello più efficiente
I due valori attesi sono

1 2 1 2
𝐸(𝑇1 ) = 𝐸(𝑋1 ) + 𝐸(𝑋2 ) = ( + ) 𝜇 = 𝜇
3 3 3 3
3 1 3 1
𝐸(𝑇2 ) = 𝐸(𝑋1 ) + 𝐸(𝑋2 ) = ( + ) 𝜇 = 𝜇
4 4 4 4
pertanto entrambi gli stimatori sono corretti. Per valutarne l’efficienza basta
quindi confrontare le loro varianze, che risultano pari a
1 4 1 4 5
𝑉(𝑇1 ) = 𝑉(𝑋1 ) + 𝑉(𝑋2 ) = ( + ) 𝜎 2 = 𝜎 2 = 0. 5̄𝜎 2
9 9 9 9 9
9 1 9 1 10 2
𝑉(𝑇2 ) = 𝑉(𝑋1 ) + 𝑉(𝑋2 ) = ( + ) 𝜎 2 = 𝜎 = 0.625𝜎 2
16 16 16 16 16
Si può quindi concludere che lo stimatore T1 è più efficiente di T2
11
Lezione 21
4. Considerata la seguente funzione dei dati campionari
∑𝑛−3
𝑖=1 𝑋𝑖 2
𝑇= + 𝑋𝑛
𝑛−3 𝑛
si verifichi se si tratta di uno stimatore consistente del parametro 
Il valore atteso è dato da

∑𝑛−3
𝑖=1 𝐸(𝑋𝑖 ) 2 (𝑛 − 3)𝜇 2 𝑛+2
𝐸(𝑇) = + 𝐸(𝑋𝑛 ) = + 𝜇=( )𝜇
𝑛−3 𝑛 𝑛−3 𝑛 𝑛
per cui lo stimatore è asintoticamente corretto.
La varianza di T è
∑𝑛−3
𝑖=1 𝑉(𝑋𝑖 ) 4 (𝑛 − 3)𝜎 2 4 2 𝜎2 4𝜎 2
𝑉(𝑇) = + 2 𝑉(𝑋𝑛 ) = + 2𝜎 = +
(𝑛 − 3)2 𝑛 (𝑛 − 3)2 𝑛 𝑛 − 3 𝑛2
Dato che risulta

𝑙𝑖𝑚 𝐸(𝑇) = 𝜇
𝑛→∞
𝑙𝑖𝑚 𝑉(𝑇) = 0
𝑛→∞
si conclude cheT è uno stimatore consistente di 
12

Lezione 21 Proprietà Degli Stimatori

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Lezione 21 Proprietà Degli Stimatori

Caricato da

Copyright:

Formati disponibili

Lezione 21

PROPRIETÀ DEGLI STIMATORI

Semplificando al massimo il problema, si consideri una variabile Z che ha una

per ogni possibile valore del parametro .

Questa proprietà fornisce garanzie contro il verificarsi di errori di stima

Non è invece corretta la varianza campionaria, in quanto

Va però notato che al crescere della numerosità campionaria 𝑛 il valore atteso

In generale, considerata una variabile Z che nella popolazione ha una

e cioè se il suo valore atteso dello stimatore tende al parametro da stimare al

Se uno stimatore è distorto è talvolta possibile correggere la sua distorsione,

che sarà quello che verrà utilizzato nelle lezioni successive.

La dimostrazione che 𝑆𝑐2 è uno stimatore corretto della varianza della

Anche se la correttezza è una proprietà desiderabile per uno stimatore, va detto

𝑀𝑆𝐸(𝑇) = 𝐸(𝑇 − 𝜃)2

In genere l’errore quadratico medio viene calcolato per confrontare l’efficienza

Proprietà dell’errore quadratico medio

Questa dimostrazione si effettua sommando e sottraendo il valore atteso 𝐸(𝑇)

Il rettangolo dai bordi gialli contiene un’espressione che corrisponde alla

𝑀𝑆𝐸(𝑇) = 𝑉(𝑇) + [𝐵(𝑇)]2

Da questa dimostrazione risulta che se uno stimatore T è corretto il suo errore

Spesso, dati due diversi stimatori T1 e T2 di uno stesso parametro , si calcola

che, se entrambi gli stimatori risultano corretti, assume la forma

Infine, considerata una variabile Z con distribuzione f(z, ) e uno stimatore

dimostra mediante la disuguaglianza di Rao-Cramér che la varianza di T non

Uno stimatore si dice coerente (o consistente) se, considerato un qualsiasi

per ogni possibile valore del parametro .

Uno stimatore si dice quindi coerente se, al crescere di n, tende a zero la

In altri termini, questo significa che lo stimatore T converge in probabilità a .

La distribuzione di probabilità delle variabili 𝑋𝑖 corrisponde alla distribuzione

mentre le loro varianze sono

Si conclude quindi che lo stimatore più efficiente è T2

2. Data una popolazione di valore atteso  e varianza unitaria, si estragga un

I valori attesi dei due stimatori risultano

Le varianze dei due stimatori sono

Di conseguenza i due errori quadratici medi sono

3. Data una popolazione di media  e varianza 2, si estragga un campione

I due valori attesi sono

Si può quindi concludere che lo stimatore T1 è più efficiente di T2

4. Considerata la seguente funzione dei dati campionari

si verifichi se si tratta di uno stimatore consistente del parametro 

Il valore atteso è dato da

per cui lo stimatore è asintoticamente corretto.

Dato che risulta

si conclude cheT è uno stimatore consistente di 

Potrebbero piacerti anche