Sei sulla pagina 1di 12

Lezione 21

Lezione 21

PROPRIETÀ DEGLI STIMATORI


Considerato un certo parametro , esistono diverse funzioni dei dati
campionari che possono essere considerate come possibili stimatori del
parametro, ma è evidente che la scelta di una determinata funzione oppure di
una funzione diversa porta a stime che sono generalmente diverse fra di loro.
Se è noto che Z ha una distribuzione normale, per esempio, il suo parametro 
potrebbe essere stimato dalla media, dalla moda o dalla mediana del campione.

Nei casi reali il parametro in questione è ovviamente ignoto, per cui non c’è
nessuna possibilità di quantificare l'errore commesso utilizzando una
particolare stima.
Per determinare la bontà di una funzione dei dati campionari rispetto ad altre
funzioni diverse ci si basa sulle proprietà degli stimatori. Si sceglierà quindi lo
stimatore con le proprietà migliori, anche se in una particolare occasione di
campionamento non si potrà mai sapere se la stima fornita dallo stimatore
scelto è effettivamente prossima al valore vero del parametro ignoto.
Nel caso della stima del parametro , per esempio, si giungerà alla conclusione
che lo stimatore migliore è la media campionaria, ma in una determinata
occasione di campionamento non si potrà mai essere sicuri che il calcolo della
mediana campionaria o della moda campionaria non avrebbe fornito un
risultato che sarebbe stato più vicino a .

1
Lezione 21

Semplificando al massimo il problema, si consideri una variabile Z che ha una


distribuzione di frequenza f(z,) di forma nota in cui compare un unico
parametro ignoto: . In maniera analoga, se la distribuzione di Z fosse invece
ben approssimata da un qualche modello teorico, si consideri un modello f(z,)
caratterizzato dal valore del parametro ignoto .
Partendo da questo presupposto, si studieranno 3 importanti proprietà degli
stimatori:

1) CORRETTEZZA
La funzione T=g(X) dei dati campionari è uno stimatore corretto del parametro
 se il valore atteso dello stimatore è uguale al parametro da stimare, ossia se

E(T) = 

per ogni possibile valore del parametro .

Questa proprietà fornisce garanzie contro il verificarsi di errori di stima


sistematici, ossia di sistematiche sovrastime o sottostime del parametro. Se uno
stimatore non è corretto, si parla infatti di stime “distorte in media”.
Se uno stimatore non è corretto, si dice distorto, e la sua distorsione è data dalla
differenza

B(T) = E(T) − 

dove la lettera B é l’iniziale del termine inglese “bias” (che si legge bɑɪ·əs).

2
Lezione 21

Considerando gli stimatori analizzati nel corso di queste lezioni, risulta che la
media campionaria e la proporzione campionaria sono stimatori corretti. Si è
infatti dimostrato in precedenza che
𝐸(𝑋̅) = 𝜇
𝐸(𝑃̂) = 𝜋

Non è invece corretta la varianza campionaria, in quanto


𝑛−1 2
𝐸(𝑆 2 ) = 𝜎
𝑛

Va però notato che al crescere della numerosità campionaria 𝑛 il valore atteso


della varianza campionaria tende a 𝜎 2 , per cui questo stimatore si dice
asintoticamente corretto. La sua distorsione tende quindi a zero per 𝑛 che tende
a +∞.

In generale, considerata una variabile Z che nella popolazione ha una


distribuzione caratterizzata da un parametro ignoto , uno stimatore T=g(X)
di  è asintoticamente corretto se, per ogni possibile valore del parametro ,
risulta
𝑙𝑖𝑚 𝐸(𝑇) = 𝜃
𝑛→∞

ovvero
𝑙𝑖𝑚 𝐵(𝑇) = 0
𝑛→∞

e cioè se il suo valore atteso dello stimatore tende al parametro da stimare al


crescere della numerosità del campione.

3
Lezione 21

Se uno stimatore è distorto è talvolta possibile correggere la sua distorsione,


come accade nel caso della varianza campionaria. Se infatti si moltiplica la
𝑛
varianza campionaria per la costante , si ottiene lo stimatore varianza
𝑛−1
campionaria corretta, spesso indicata mediante la notazione 𝑆𝑐2 .
In genere, quindi, la varianza 𝜎 2 della popolazione viene stimata utilizzando lo
stimatore

𝑛
𝑆𝑐2 = 𝑆2
𝑛−1

che sarà quello che verrà utilizzato nelle lezioni successive.


Per ottenere il valore di questa funzione dei dati campionari conviene
comunque calcolare la varianza campionaria nel modo usuale e poi
𝑛
moltiplicarla per la costante
𝑛−1

La dimostrazione che 𝑆𝑐2 è uno stimatore corretto della varianza della


popolazione è estremamente semplice, in quanto

𝑛 𝑛 𝑛 𝑛−1 2
𝐸(𝑆𝑐2 ) = 𝐸 ( 𝑆2) = 𝐸(𝑆 2 ) = 𝜎 = 𝜎2
𝑛−1 𝑛−1 𝑛−1 𝑛

Anche se la correttezza è una proprietà desiderabile per uno stimatore, va detto


che, in alcuni casi, uno stimatore distorto può essere preferibile a uno stimatore
corretto. Questo accade se lo stimatore corretto fornisce elevate sottostime e
sovrastime che si compensano fra loro, per cui lo stimatore presenta una

4
Lezione 21

variabilità così elevata da poter fornire stime molto distanti dal valore vero del
parametro.

2) EFFICIENZA
Una misura della variabilità delle stime fornite da uno stimatore è fornita dal
suo errore quadratico medio (o momento secondo dell’errore di stima) che
corrisponde a

𝑀𝑆𝐸(𝑇) = 𝐸(𝑇 − 𝜃)2

dove l’acronimo MSE indica le iniziali del termine inglese “mean square error”.
Questo indice fornisce una misura della precisione dello stimatore, in quanto
calcola la media dei quadrati delle differenze fra i possibili valori dello
stimatore e il parametro da stimare.
Al crescere della precisione delle stime cresce anche l’efficienza dello stimatore,
nel senso che diminuisce il grado di incertezza sulle stime ottenute mediante
un’indagine campionaria.
Uno stimatore, anche se corretto, risulta quindi poco efficiente se presenta
un’elevata variabilità delle stime del parametro ignoto.

In genere l’errore quadratico medio viene calcolato per confrontare l’efficienza


di due diversi stimatori del parametro. Considerati, per esempio, gli stimatori
T1 e T2 di , se risulta
MSE (T1) < MSE(T2)

5
Lezione 21

per ogni possibile valore del parametro , si conclude dicendo cheT1 è più
efficiente di T2.
Nel caso del parametro , per esempio, risulta che la media campionaria è uno
stimatore più efficiente della mediana campionaria o della moda campionaria,
quale che sia il valore di .

Proprietà dell’errore quadratico medio


L’errore quadratico medio corrisponde alla somma della varianza dello
stimatore più la sua distorsione al quadrato

Questa dimostrazione si effettua sommando e sottraendo il valore atteso 𝐸(𝑇)


dello stimatore all’interno della formula dell’errore quadratico medio, creando
un binomio e sviluppandone il quadrato

Dimostrazione
𝑀𝑆𝐸(𝑇) = 𝐸(𝑇 − 𝜃)2 = 𝐸[𝑇 − 𝐸(𝑇) + 𝐸(𝑇) − 𝜃]2 =
= 𝐸{[𝑇 − 𝐸(𝑇)] + [𝐸(𝑇) − 𝜃]}2 =
= 𝐸{[𝑇 − 𝐸(𝑇)]2 + [𝐸(𝑇) − 𝜃]2 + 2[𝑇 − 𝐸(𝑇)][𝐸(𝑇) − 𝜃]} =
= 𝐸[𝑇 − 𝐸(𝑇)]2 + 𝐸[𝐸(𝑇) − 𝜃]2 + 2[𝐸(𝑇) − 𝜃] × 𝐸[𝑇 − 𝐸(𝑇)]

Il rettangolo dai bordi gialli contiene un’espressione che corrisponde alla


varianza dello stimatore
Il rettangolo dai bordi rossi corrisponde alla media della differenza al quadrato
fra valore atteso dello stimatore e parametro, per cui corrisponde alla media
della distorsione al quadrato, che è una costante rispetto all’operatore “valore
medio”

6
Lezione 21

Il rettangolo dai bordi azzurri corrisponde alla media di una variabile scarto, in
quanto considera la media della differenza fra lo stimatore T e il suo valore
atteso. Quindi la quantità racchiusa nel rettangolo azzurro è pari a zero.
L’errore quadratico medio corrisponde quindi a

𝑀𝑆𝐸(𝑇) = 𝑉(𝑇) + [𝐵(𝑇)]2

Da questa dimostrazione risulta che se uno stimatore T è corretto il suo errore


quadratico medio corrisponde alla sua varianza

MSE(T) = V(T)

Spesso, dati due diversi stimatori T1 e T2 di uno stesso parametro , si calcola


l’efficienza relativa di T1 rispetto a T2 mediante il rapporto

𝑀𝑆𝐸(𝑇1 )
𝑒(𝑇1 , 𝑇1 ) =
𝑀𝑆𝐸(𝑇2 )

che, se entrambi gli stimatori risultano corretti, assume la forma

𝑉(𝑇1 )
𝑒(𝑇1 , 𝑇1 ) =
𝑉(𝑇2 )

Infine, considerata una variabile Z con distribuzione f(z, ) e uno stimatore


corretto T di  se sono soddisfatte alcune condizioni abbastanza generali, si

7
Lezione 21

dimostra mediante la disuguaglianza di Rao-Cramér che la varianza di T non


può mai essere inferiore a una quantità Vmin, che dipende da f(z, ) e da n.
Si ottiene quindi una misura dell’efficienza assoluta di T calcolando il rapporto

V min
e(T) =
V (T )

Se risulta
e(T) = 1,
per tutti i possibili valori del parametro , si conclude che T è uno stimatore che
ha varianza minima e si dice quindi che ha massima efficienza.

3) COERENZA (o CONSISTENZA)
Un’altra importante proprietà di uno stimatore esamina il suo comportamento
per un campione la cui numerosità tende ad infinito.

Uno stimatore si dice coerente (o consistente) se, considerato un qualsiasi


valore   0, risulta

𝑙𝑖𝑚 𝑃(|𝑇 − 𝜃| ≥ 𝜀) = 0
𝑛→∞

per ogni possibile valore del parametro .

Uno stimatore si dice quindi coerente se, al crescere di n, tende a zero la


probabilità che la differenza in valore assoluto tra stimatore e parametro risulti
maggiore di un  comunque piccolo.

8
Lezione 21

In altri termini, questo significa che lo stimatore T converge in probabilità a .


La coerenza, quindi comporta necessariamente che lo stimatore T sia corretto
o, almeno, asintoticamente corretto e che la sua varianza V(T) tenda a zero per
n che tende a infinito.
La statistica 𝑋 è uno stimatore coerente di  o di  (a seconda della
distribuzione della Z e, di conseguenza, delle Xi). Anche gli stimatori della
varianza, S2 e 𝑆𝑐2 , sono entrambi stimatori coerenti di 2.

ESERCIZI
1. Data una popolazione di valore atteso  e varianza unitaria, si estragga un
campione casuale di 4 elementi estratti con ripetizione e si considerino i
seguenti stimatori di 
𝑋1 + 𝑋4
𝑇1 =
2
𝑋1 + 𝑋2 + 𝑋3 + 𝑋4
𝑇2 =
4
𝑋1 + 2𝑋2 + 2𝑋3 + 𝑋4
𝑇3 =
6
Si verifichi che sono tutti stimatori corretti e si individui quello più efficiente.

La distribuzione di probabilità delle variabili 𝑋𝑖 corrisponde alla distribuzione


di frequenza della Z, per cui ciascuna 𝑋𝑖 ha un valore atteso pari a  e varianza
unitaria

I valori attesi dei tre stimatori, combinazioni lineari delle 𝑋𝑖 , risultano quindi

𝐸(𝑋1 ) + 𝐸(𝑋4 ) 𝜇 + 𝜇
𝐸(𝑇1 ) = = =𝜇
2 2
𝐸(𝑋1 ) + 𝐸(𝑋2 ) + 𝐸(𝑋3 ) + 𝐸(𝑋4 ) 4𝜇
𝐸(𝑇2 ) = = =𝜇
4 4
𝐸(𝑋1 ) + 2𝐸(𝑋2 ) + 2𝐸(𝑋3 ) + 𝐸(𝑋4 ) 6𝜇
𝐸(𝑇3 ) = = =𝜇
6 6

9
Lezione 21

mentre le loro varianze sono


𝑉(𝑋1 ) + 𝑉(𝑋4 ) 1 + 1 1
𝑉(𝑇1 ) = = = = 0.5
4 4 2
𝑉(𝑋1 ) + 𝑉(𝑋2 ) + 𝑉(𝑋3 ) + 𝑉(𝑋4 ) 1 + 1 + 1 + 1 1
𝑉(𝑇2 ) = = = = 0.25
16 16 4
𝑉(𝑋1 ) + 4𝑉(𝑋2 ) + 4𝑉(𝑋3 ) + 𝑉(𝑋4 ) 10
𝑉(𝑇3 ) = = = 0.27̄
36 36

Si conclude quindi che lo stimatore più efficiente è T2

2. Data una popolazione di valore atteso  e varianza unitaria, si estragga un


campione casuale di 4 elementi estratti con ripetizione e si considerino gli
stimatori di 
1 1 1 1
𝑇1 = 𝑋1 + 𝑋2 + 𝑋3 + 𝑋4
2 8 4 8
1
𝑇2 = 𝑋̄
2
Si verifichi se sono stimatori corretti e si calcoli la loro varianza e il valore
dell’errore quadratico medio per =1

I valori attesi dei due stimatori risultano


1 1 1 1 4+1+2+1
𝐸(𝑇1 ) = 𝐸(𝑋1 ) + 𝐸(𝑋2 ) + 𝐸(𝑋3 ) + 𝐸(𝑋4 ) = 𝜇=𝜇
2 8 4 8 8
1 1
𝐸(𝑇2 ) = 𝐸(𝑋̄) = 𝜇
2 2
Lo stimatore 𝑇1 è quindi corretto, mentre 𝑇2 è distorto

Le varianze dei due stimatori sono


1 1 1 1 16 + 1 + 4 + 1 2
𝑉(𝑇1 ) = 𝑉(𝑋1 ) + 𝑉(𝑋2 ) + 𝑉(𝑋3 ) + 𝑉(𝑋4 ) = 𝜎 =
4 64 16 64 64
22 2 11
= 𝜎 =
64 32
1 1 𝜎2 1
𝑉(𝑇2 ) = 𝑉(𝑋̄) = =
4 4 4 16

Di conseguenza i due errori quadratici medi sono

10
Lezione 21

11
𝑀𝑆𝐸(𝑇1 ) = 𝑉(𝑇1 ) =
32
2
1 1 1 1 2
𝑀𝑆𝐸(𝑇2 ) = 𝑉(𝑇2 ) + [𝐵(𝑇2 )]2 = + ( 𝜇 − 𝜇) = + 𝜇
16 2 16 4

Ponendo 𝜇 = 1 risulta
1 1 5 10
𝑀𝑆𝐸(𝑇2 ) = + = = < 𝑀𝑆𝐸(𝑇1 )
16 4 16 32

3. Data una popolazione di media  e varianza 2, si estragga un campione


bernoulliano di 2 elementi e si considerino i seguenti stimatori di 
1 2
𝑇1 = 𝑋1 + 𝑋2
3 3
3 1
𝑇2 = 𝑋1 + 𝑋2
4 4
Si individui quello più efficiente

I due valori attesi sono


1 2 1 2
𝐸(𝑇1 ) = 𝐸(𝑋1 ) + 𝐸(𝑋2 ) = ( + ) 𝜇 = 𝜇
3 3 3 3
3 1 3 1
𝐸(𝑇2 ) = 𝐸(𝑋1 ) + 𝐸(𝑋2 ) = ( + ) 𝜇 = 𝜇
4 4 4 4
pertanto entrambi gli stimatori sono corretti. Per valutarne l’efficienza basta
quindi confrontare le loro varianze, che risultano pari a
1 4 1 4 5
𝑉(𝑇1 ) = 𝑉(𝑋1 ) + 𝑉(𝑋2 ) = ( + ) 𝜎 2 = 𝜎 2 = 0. 5̄𝜎 2
9 9 9 9 9
9 1 9 1 10 2
𝑉(𝑇2 ) = 𝑉(𝑋1 ) + 𝑉(𝑋2 ) = ( + ) 𝜎 2 = 𝜎 = 0.625𝜎 2
16 16 16 16 16

Si può quindi concludere che lo stimatore T1 è più efficiente di T2

11
Lezione 21

4. Considerata la seguente funzione dei dati campionari

∑𝑛−3
𝑖=1 𝑋𝑖 2
𝑇= + 𝑋𝑛
𝑛−3 𝑛

si verifichi se si tratta di uno stimatore consistente del parametro 

Il valore atteso è dato da


∑𝑛−3
𝑖=1 𝐸(𝑋𝑖 ) 2 (𝑛 − 3)𝜇 2 𝑛+2
𝐸(𝑇) = + 𝐸(𝑋𝑛 ) = + 𝜇=( )𝜇
𝑛−3 𝑛 𝑛−3 𝑛 𝑛

per cui lo stimatore è asintoticamente corretto.

La varianza di T è

∑𝑛−3
𝑖=1 𝑉(𝑋𝑖 ) 4 (𝑛 − 3)𝜎 2 4 2 𝜎2 4𝜎 2
𝑉(𝑇) = + 2 𝑉(𝑋𝑛 ) = + 2𝜎 = +
(𝑛 − 3)2 𝑛 (𝑛 − 3)2 𝑛 𝑛 − 3 𝑛2

Dato che risulta


𝑙𝑖𝑚 𝐸(𝑇) = 𝜇
𝑛→∞

𝑙𝑖𝑚 𝑉(𝑇) = 0
𝑛→∞

si conclude cheT è uno stimatore consistente di 

12

Potrebbero piacerti anche