Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
m. gherghi
Corso di
Statistica (A-K)
Marco Gherghi
Lezione:
L20
Argomento:
www.docenti.unina.it/marco.gherghi
gherghi@unina.it
Teoria della stima
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
Linferenza
Pop
Estrazione
casuale
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
Linferenza
m. gherghi
Pop
Linferenza statistica
induce le caratteristiche
della popolazione dallanalisi
del contenuto del campione osservato,
cio inferisce le propriet del modello
matematico a partire dallanalisi dei
dati campionari osservati.
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
Linferenza
Sebbene ogni esperimento sia unico e irripetibile, indispensabile
individuare, e provare a controllare, aspetti che possono essere
considerati come comuni. Pi precisamente, ogni inferenza si basa
sulla specificazione accurata dei seguenti elementi (Piccolo, pag. 493):
m. gherghi
Pop
Linferenza statistica
induce le caratteristiche
della popolazione dallanalisi
del contenuto del campione osservato,
cio inferisce le propriet del modello
matematico a partire dallanalisi dei
dati campionari osservati.
Popolazione di riferimento
Procedura di raccolta e selezione delle informazioni
Tecnica inferenziale per giungere dal risultato parziale alla popolazione
Validit statistica della procedura utilizzata
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
Lucido
della lezione zero
Questo risultato pu
essere considerato
Positivo
Negativo
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
Linferenza
Sebbene ogni esperimento sia unico e irripetibile, indispensabile
individuare, e provare a controllare, aspetti che possono essere
considerati come comuni. Pi precisamente, ogni inferenza si basa
sulla specificazione accurata dei seguenti elementi (Piccolo, pag. 493):
m. gherghi
Pop
Linferenza statistica
induce le caratteristiche
della popolazione dallanalisi
del contenuto del campione osservato,
cio inferisce le propriet del modello
matematico a partire dallanalisi dei
dati campionari osservati.
Popolazione di riferimento
Procedura di raccolta e selezione delle informazioni
Tecnica inferenziale per giungere dal risultato parziale alla popolazione
Validit statistica della procedura utilizzata
Linferenza comprende una serie di tecniche che possono essere raccolte nei suoi due
principali capitoli:
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
Stimatori e stime
Supporremo che sulla popolazione sia definita una variabile X la cui distribuzione,
seppure incognita, completamente caratterizzata da un parametro o da un insieme
di parametri .
Lobiettivo trovare, sulla base di un campione casuale X1, X2, , Xn, un valore, o un
insieme di valori, per (o per ) che siano la migliore approssimazione possibile del
valore incognito della popolazione.
Le n osservazioni campionarie X1,Xn sono altrettante variabili casuali la cui
distribuzione e i cui parametri sono uguali a quelli della variabile X.
Una funzione delle osservazioni campionarie essa stessa una variabile casuale che,
nel caso della stima di un parametro, viene definita stimatore.
Il valore che lo stimatore assume nello specifico campione estratto costituisce la
realizzazione campionaria della variabile casuale e costituisce la stima.
7
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
Stimatori e stime
C
Pop
C
C
C
Popolazione
C
C
C
C
C
1 n
X = Xi
n i =1
(Parametro)
(Stimatore)
Tn =
Campione estratto
1 n
x = xi
n i =1
(Stima)
t
8
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
Stimatori e stime
C
C
C
Pop
C
C
C
C
C
C
C
C
Popolazione
Campione estratto
()
()
E E
( Var () )
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
10
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
Dato uno stimatore Tn=T(X1, X2, , Xn) del parametro , diremo che Tn corretto
se:
E (Tn ) =
Se E(Tn), diremo che lo stimatore Tn uno stimatore distorto per , con fattore
di distorsione:
D (Tn ) = E (Tn )
11
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
Dato uno stimatore Tn=T(X1, X2, , Xn) del parametro , diremo che Tn corretto
se:
E (Tn ) =
Se E(Tn), diremo che lo stimatore Tn uno stimatore distorto per , con fattore
di distorsione:
D (Tn ) = E (Tn )
Tn = T X1,, X n
Tn
E (Tn ) =
12
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
Dato uno stimatore Tn=T(X1, X2, , Xn) del parametro , diremo che Tn corretto
se:
E (Tn ) =
Se E(Tn), diremo che lo stimatore Tn uno stimatore distorto per , con fattore
di distorsione:
D (Tn ) = E (Tn )
Tn = T X1,, X n
E (Tn )
Tn
Distorsione
13
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
1 n
X = Xi
n i =1
( )
E X
Media campionaria
1 n
1 n
1 n
1
= E X i = E X i = E (X i ) = n =
n i =1
n i =1
n
n i =1
14
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
1 n
S = Xi X
n i =1
2
Varianza
campionaria
1 n
S = Xi X
n i=1
2
( )
2
Var X = =
n
2
X
15
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
N=3
10
= 7,33 2 = 4,22
n=2
1 n
S = Xi X
n i =1
c ampione
X1
X2
Varianza
campionaria
X
5
5
5
7
7
7
10
10
10
5
7
10
5
7
10
5
7
10
5,0
6,0
7,5
6,0
7,0
8,5
7,5
8,5
10,0
Somma
66
Media
7,333
Var
4,222
Sqm
2,055
66
7,333
4,222
2,055
66
7,333
2,111
1,453
1
2
3
4
5
6
7
8
9
S2
16
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
N=3
10
= 7,33 2 = 4,22
n=2
1 n
S = Xi X
n i =1
c ampione
X1
X2
Varianza
campionaria
X
5
5
5
7
7
7
10
10
10
5
7
10
5
7
10
5
7
10
5,0
6,0
7,5
6,0
7,0
8,5
7,5
8,5
10,0
Somma
66
Media
7,333
Var
4,222
Sqm
2,055
66
7,333
4,222
2,055
66
7,333
2,111
1,453
1
2
3
4
5
6
7
8
9
S2
17
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
10
= 7,33 2 = 4,22
n=2
1 n
S = Xi X
n i =1
c ampione
X1
X2
Varianza
campionaria
X
5
5
5
7
7
7
10
10
10
5
7
10
5
7
10
5
7
10
5,0
6,0
7,5
6,0
7,0
8,5
7,5
8,5
10,0
Somma
66
Media
7,333
Var
4,222
Sqm
2,055
66
7,333
4,222
2,055
66
7,333
2,111
1,453
1
2
3
4
5
6
7
8
9
S
0,00
1,00
6,25
1,00
0,00
2,25
6,25
2,25
0,00
19
2,111
( )
E S
n 1
=
n
2
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
N=3
10
= 7,33 2 = 4,22
n=2
1 n
S = Xi X
n i =1
c ampione
X1
X2
Varianza
campionaria
X
5
5
5
7
7
7
10
10
10
5
7
10
5
7
10
5
7
10
5,0
6,0
7,5
6,0
7,0
8,5
7,5
8,5
10,0
Somma
66
Media
7,333
Var
4,222
Sqm
2,055
66
7,333
4,222
2,055
66
7,333
2,111
1,453
1
2
3
4
5
6
7
8
9
S2
0,00
1,00
6,25
1,00
0,00
2,25
6,25
2,25
0,00
19
2,111
n 1
E S2 = 2
( )
S2
n 1
2
n
n
n 1 2
n
E
S2 =
E (S ) =
= 2
n 1
n
n 1
n 1
2
1
( xi x ) , allora:
n i
2
1
2
n
n
1
( xi19
x)
S2 =
( xi x ) =
n 1 i
n 1
n 1 n i
Poich:
S2 =
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
N=3
10
= 7,33 2 = 4,22
n=2
S! 2 =
1 n
Xi X
n 1 i=1
c ampione
X1
X2
Varianza
campionaria corretta
X
5
5
5
7
7
7
10
10
10
5
7
10
5
7
10
5
7
10
5,0
6,0
7,5
6,0
7,0
8,5
7,5
8,5
10,0
Somma
66
Media
7,333
Var
4,222
Sqm
2,055
66
7,333
4,222
2,055
66
7,333
2,111
1,453
1
2
3
4
5
6
7
8
9
S2
0,00
1,00
6,25
1,00
0,00
2,25
6,25
2,25
0,00
19
2,111
X
2.
Dividendo la devianza
per (n-1) anzich per
i
n."
" E questo il metodo che in genere si utilizza quando si
dispone dei singoli dati campionari ."
20
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
10
= 7,33 2 = 4,22
N=3
n=2
S2 =
1
Xi X
n i =1
n
c ampione
X1
Varianza
campionaria
X2
5
5
5
7
7
7
10
10
10
5
7
10
5
7
10
5
7
10
5,0
6,0
7,5
6,0
7,0
8,5
7,5
8,5
10,0
Somma
66
Media
7,333
Var
4,222
Sqm
2,055
66
7,333
4,222
2,055
66
7,333
2,111
1,453
1
2
3
4
5
6
7
8
9
S2
0,00
1,00
6,25
1,00
0,00
2,25
6,25
2,25
0,00
19
2,111
S! 2 =
1
X X
n 1 i=1 i
Varianza
campionaria corretta
n 1
E S2 = 2
( )
( )
21
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
Media campionaria
( )
E X =
La media campionaria uno stimatore non distorto della media della popolazione
X(n+1)
Mediana campionaria
n dispari
2
Xn + Xn
2
+1
n pari
2
Per distribuzioni simmetriche:
E X (n +1) =
X n + X n +1
2
=
E 2
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
Var (T1 )
Var (T2 )
<1
T1 pi efficiente di T2
Var (T1 )
Var (T2 )
T3
T2
(efficienza relativa)
E (Tn ) =
<1
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
Var (T1 )
Var (T2 )
Esempio: La stima di
T1
Var (T1 )
Var (T2 )
2
n
n
2
n
T2
Mediana campionaria
Var (T2 ) =
2
=
T1 pi efficiente di T2
Media campionaria
Var (T1 ) =
<1
2
n
Media
campionaria
1
= 0, 6366
1,5707...
Mediana
campionaria
T24
n
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
Esempio:
Da una popolazione su cui definita una variabile X con media incognita, si estrae un
campione casuale di numerosit n.
Si definiscano le propriet dei seguenti stimatori per :
T1 =
1 n
Xi
n i =1
E (T1 )
T2 =
1
( X1 + X n )
2
T3 = X2
T4 =
1
( X2 + X 8 )
3
1 n
1
1
= E X i = E ( X i ) = n =
n i
n i =1
n
E (T2 ) =
1
E ( X1 ) + E ( X n )
2
1
+ =
2
1
2
+ =
3
3
E (T3 ) = E ( X2 ) =
E (T4 ) =
1
E ( X2 ) + E ( X8 )
3
25
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
Esempio:
Da una popolazione su cui definita una variabile X con media incognita, si estrae un
campione casuale di numerosit n.
Si definiscano le propriet dei seguenti stimatori per :
T1 =
1 n
Xi
n i =1
T2 =
1
( X1 + X n )
2
T3 = X2
T4 =
1
( X2 + X 8 )
3
1
2
2
= 2 n =
n
n
Var (T1 )
1
1
n
= 2 Var X i = 2
n
i =1 n
Var (T2 )
2
1 2
1
2
= Var ( X1 ) + Var ( X n ) = + =
2
4
4
Var ( Xi )
i =1
T1
T2
T3
E (Tn ) =
Tn
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
Teoria
della stima
Disuguaglianza di Cramer-Rao
E possibile dimostrare che, sotto condizioni molto generali, ad ogni parametro
possibile associare un valore minimo della varianza dello stimatore corretto Tn, al di sotto del
quale tale varianza non pu scendere, qualunque sia lo stimatore utilizzato.
Var (Tn )
n E log f ( X ; )
Lo stimatore che raggiunge tale limite verr definito stimatore a varianza minima.
Lesistenza di una varianza minima per ogni non implica necessariamente lesistenza di uno
stimatore a varianza minima. In altri termini, possibile che esista il limite ma che non esista
alcuno stimatore che lo raggiunga.
E possibile, comunque, ipotizzare che ad ogni parametro corrisponda, sotto condizioni molto
generali, almeno uno stimatore asintoticamente efficiente.
Per campioni di dimensione finita, sar il pi delle volte sufficiente fare riferimento a stimatori
27
che si avvicinano allestremo di Cramer-Rao.
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
T2
(distorto)
T1
(corretto)
28
Tn
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
T2
(distorto)
T3
(distorto)
T1
(corretto)
29
Tn
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
T2
(distorto)
T3
(distorto)
T4
(distorto)
(corretto)
30
Tn
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
( )
EQM Tn
2
2
T2
(distorto)
T3
(distorto)
T4
(distorto)
T1
(corretto)
31
Tn
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
( )
EQM Tn
2
2
T2
(distorto)
T3
(distorto)
T4
(distorto)
T1
(corretto)
32
Tn
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
33
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
La propriet della correttezza asintotica garantisce che, anche in uno stimatore distorto,
gli errori sistematici tendono a scomparire al crescere di n, ma non dice nulla sul
comportamento della varianza di Tn, cio sulla dispersione delle singole stime attorno al
parametro .
34
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
E (T1 ) =
E (T2 )
X ~N ,
1 n
T1 = X i
n i =1
1
1 n
T2 = X1 +
Xi
2
2n i =2
1 n 1 2n 1
1
1 n
1
1
=
= E ( X1 ) +
E
X
=
+
n
(
)
(
)
2 + 2n =
i 2 2n
2
2n i =2
2n
lim E (T2 ) =
n
(stimatore
distorto)
35
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
P { tn < } > 1
Condizione sufficiente (ma non necessaria) perch Tn sia uno stimatore consistente per ,
che Tn sia asintoticamente corretto e che la sua varianza tenda a zero allaumentare di
n:
lim E (Tn ) =
n
Questa caratteristica pu essere riassunta nella condizione che lEQM tenda a zero al
crescere di n.
36
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
Esempio:
Verificare se gli stimatori T1, T2 e T3 definiti di seguito soddisfano la propriet della consistenza.
1 n
T1 = X i
n i =1
T2 =
1
( X1 + X n )
2
( )
( )
T3 =
1
X + X8
3 2
( )
2
1
=
3
3
D T1 = 0
D T2 = 0
D T3 =
2
Var T1 =
n
2
Var T2 =
2
2 2
EQM T1 = 0 +
=
n
n
2 2
EQM T1 = 0 +
=
2
2
2
Var T3 = 2
9
1
2
EQM T3 = 2 + 2
9
9
( )
( )
( )
lim EQM T1 = 0
n
( )
( )
2
lim EQM T2 =
n
2
( )
( )
( )
( )
lim EQM T3 =
n
1 2 2 237
+
9
9
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
Esempio:
Verificare se gli stimatori T1, T2 e T3 definiti di seguito soddisfano la propriet della consistenza.
1 n
T1 = X i
n i =1
T2 =
1
( X1 + X n )
2
T3 =
1
X + X8
3 2
38
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
Esempio:
1
1 n
T = X1 +
Xi
2
2n i =2
2n 1
E (T ) =
2n
2n 1
2n
2n 1 2n
=
2n
1
=
2n
D (T ) =
1 n
1
Var (T ) = Var X1 +
Xi
2n i =2
2
1
1 n
= Var ( X1 ) +
Var ( X i )
4
4n2 i =2
1 2
1
+
n 1) 2
2 (
4
4n
n2 + n 1 2
1 2
1
= 1 + 2 ( n 1) =
39
4
n
4n2
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
Esempio:
1
1 n
T = X1 +
Xi
2
2n i =2
1
D (T ) =
2n
(n
EQM (T ) = Var (T ) + D (T ) =
2
n
(
= lim
lim EQM (T )
n
+ n 1
4n2
(n
Var (T ) =
+ n 1
2
4n
2
2
2
n
+
n
1
+
2 =
2
4n
4n2
+ n 1 2 + 2
4n2
n ( n + 1) 2
2 2
= lim
+
=
0
2
n
4n
4n2
4
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
La consistenza una propriet molto importante per gli stimatori poich assicura la
coerenza tra laumento della numerosit campionaria e lincremento delle
informazioni contenute nel campione stesso. (Orsi, pag. 301)
Tuttavia, tale propriet non dice nulla sulla grandezza degli errori di stima per ogni
valore finito di n, cio non d alcuna idea della velocit con cui uno stimatore tende
a concentrarsi intorno al valore del parametro della popolazione. (Orsi, pag. 301)
E ovvio, infatti, che tra diversi stimatori consistenti si preferir quello per il quale tale
concentrazione avviene pi rapidamente, ossia con campioni di dimensioni ridotte.
(Orsi, pag. 302)
41
Universit di Napoli Federico II, DISES, A.a. 2014-15, CLEC, Corso di Statistica (A-K)
Lezione L20 Teoria della stima
m. gherghi
Nellambito della famiglia degli stimatori consistenti, uno stimatore T(n) si definisce
asintoticamente efficiente se la varianza della sua distribuzione limite risulta
inferiore alla varianza della distribuzione limite di qualsiasi altro stimatore consistente.
1.
p lim (Tn ) =
n
2.
(( ) )
n
n
Tn*
( )
p lim Tn* =
n
42