Sei sulla pagina 1di 42

Stat 03 - 1 / 43

Lezione 5
Strumenti
statistici:
campioni e
stimatori
Stat 03 - 2 / 43
dalla caratteristica comune di una popolazione
al suo modello probabilistico


1,61m < h < 1,63m X = 162
1,59m < h < 1,61m X = 160
1,57m < h < 1,59m X = 158
una popolazione (distribuita in modo) normale
su cui viene definita una variabile casuale continua X
con media e varianza o
2
pu essere modellata mediante una
funzione di densit di probabilit f
X
( x ) espressa nella forma:
( )
(
(

|
.
|

\
|
o

o t
=
2
2
1
exp
2
1 x
x f
X
Stat 03 - 3 / 43
dalla caratteristica comune di una popolazione
al suo modello probabilistico


Stat 03 - 4 / 43
Nella parte 1 ...
gli stimatori
campionari
V = v ( X
1
, X
2
, , X
n
)
correttezza:
| | u = V E
consistenza:
| | | | 1 lim = c <

V - V
n
E P
efficienza:
( )
| | ( ) | |
| | ( ) | |
2
1 1
2
2 2
2 1
/
V - V
V - V
V V Eff
E
E
E
E
=
le strategie di
campionamento:
- sistematico,
- stratificato,
- per quote,
- a grappolo
Stat 03 - 5 / 43
Nella parte 2 ...
consistente:
| | | | 1 lim = <

c
n n
n
X - X E P
La media campionaria:

=
=
n
j
j n
X
n
X
1
1
corretto:
| | =
n
X E
) (x f
Stat 03 - 6 / 43
| |
2 2
< S E
Nella parte 2 ...
La varianza campionaria:
( )

=
=
n
j
n j
X X
n
S
1
2
2
1
corretto:
| |
2 2
=
n
S E
La varianza campionaria corretta:
( )

=
n
j
n j n
X X
n
S
1
2
2
1
1
Consistente: ? | | | | 1 lim
2 2
= <

c
n n
n
S - S E P ?
Stat 03 - 7 / 43
parte 3
gli stimatori:
varianza campionaria corretta
Stat 03 - 8 / 43
Principali stimatori:
varianza campionaria corretta S
n

2

definizione 5.8:
estraendo da una popolazione per cui definita la variabile
casuale X un campione di n elementi a cui corrisponde
linsieme di variabili casuali { X
1
, X
2
, , X
n
} si definisce
varianza campionaria corretta la quantit:





con numerosit n del campione maggiore di 1.

( )

=
n
j
n j n
X X
n
S
1
2
2
1
1
Stat 03 - 9 / 43
Principali stimatori:
varianza campionaria corretta S
n

2

la varianza campionaria corretta




di un campione proveniente da una popolazione su cui stata
definita la variabile casuale X uno stimatore corretto della
varianza o
2
della X per lintera popolazione dato che:

( )

=
n
j
n j n
X X
n
S
1
2
2
1
1
| | ( )
2
1
2
2
1
1
o =
(

=

=
n
j
n j n
X X
n
S E E
Stat 03 - 10 / 43
Principali stimatori:
varianza campionaria corretta S
n

2

Per verificare se la varianza campionaria corretta




possa essere considerata uno stimatore consistente della
varianza della X relativa allintera popolazione si dovr
individuare la sua distribuzione, in modo da poter individuare il
limite per n che tende allinfinito della sua varianza.

Ricordiamo infatti che si era scritto:
( ) 1
1
1
1
2
2
>

=

=
n X X
n
S
n
j
n j n
consistenza degli
stimatori campionari
| | | | 1 lim = c <

V - V
n
E P
Stat 03 - 11 / 43
Principali stimatori:
varianza campionaria corretta S
n

2

Per ricavare la distribuzione della varianza campionaria corretta




si dovranno introdurre tre nuove distribuzioni:

- la distribuzione Gamma,
- la distribuzione Chi - quadro,
- la distribuzione C
2
modificata.
( ) 1
1
1
1
2
2
>

=

=
n X X
n
S
n
j
n j n
Stat 03 - 13 / 43
la distribuzione
Gamma ( I )
Stat 03 - 14 / 43
Distribuzione Gamma ( I )
Costruiamo una funzione della variabile X in cui compaiono
due parametri p e a cui possibile assegnare arbitrariamente
valori reali positivi:

( ) ( )
( )
( )
+

<
>
I

= =
R , con
0 se 0
0 se exp
, ,
1
p
x
x x x
p
p x f x f
p
p
X X
( ) ( )
}

= I
0
1
exp dx x x p
p
in cui stata indicata con I( p) la funzione:
Stat 03 - 15 / 43
Distribuzione Gamma ( I )
Stat 03 - 16 / 43
Distribuzione Gamma ( I )
Stat 03 - 17 / 43
Distribuzione Gamma ( I )
La funzione :

( )
( )
( )
} } }


=
I

+ =
0
1
0
1 exp 0 , , x d x x
p
x d x d p x f
p
p
X
pu essere presa come funzione
di densit di probabilit dato che:
ha dominio in R e codominio in R
+
;
il suo integrale unitario;
rispetta gli assiomi di Kolmogoroff.
( ) ( )
( )
( )
+

<
>
I

= =
R , con
0 se 0
0 se exp
, ,
1
p
x
x x x
p
p x f x f
p
p
X X
Stat 03 - 18 / 43
Distribuzione Gamma ( I )
come funzione di densit di probabilit viene chiamata
distribuzione Gamma con parametri p e
( ) ( )
( )
( )
+

<
>
I

= =
R , con
0 se 0
0 se exp
, ,
1
p
x
x x x
p
p x f x f
p
p
X X
( ) ( )
}

= I
0
1
exp dx x x p
p
Una distribuzione per cui si possa adottare la
Stat 03 - 19 / 43
Media e varianza della distribuzione Gamma
Se X una variabile casuale che ha distribuzione Gamma con
parametri p e :
( ) ( )
( )
( )
+

<
>
I
= =
R

, con
0 se 0
0 se exp
, ,
1
p
x
x x x
p
p x f x f
p
p
X X
| | | |
2
var e

=
p
X
p
X E
si ha :
Stat 03 - 20 / 43
la distribuzione
chi-quadro

o

distribuzione
di Pearson
Karl Pearson (1857-1936)
Stat 03 - 21 / 43
( ) ( ) ( )
( )

= =

0
exp
, ,
1
x x
p p x f x f
p
p
X X
Distribuzione chi-quadro
La distribuzione Gamma con parametri p = n / 2 e = 1 / 2
assume un particolare interesse:

( ) ( )
( )
( )

|
.
|

\
|

I
= =

0
2
exp
2
2 1
, ,
1
2
2
x
x
n
p x f x f
n n
X X
( ) ( )
}

= I
0
1
2
exp 2 dx x x n
n
avendo indicato con I( n / 2 ) la funzione definita da:
+
e
<
>
R , con
0 se
0 se
p
x
x
Stat 03 - 22 / 43
Distribuzione chi-quadro
( )
( )
( )

<
>
|
.
|

\
|

I
=

0 se 0
0 se
2
exp
2
2 1
,
1
2
2
x
x
x
x
n
n x f
n n
X
( ) ( )
}

= I
0
1
2
exp 2 dx x x n
n
come funzione di densit di probabilit viene chiamata:
distribuzione chi - quadro con n gradi di libert

Una distribuzione per cui si possa adottare la
Stat 03 - 23 / 43
( )
( )
( )
0 se
2
exp
2
2 1
,
1
2
2
>
|
.
|

\
|

I
=

x
x
x
n
n x f
n n
X
Distribuzione chi-quadro

Stat 03 - 24 / 43
Media e varianza della
distribuzione chi-quadro
Dato che la distribuzione chi-quadro con n gradi di libert
un caso particolare della distribuzione Gamma con parametri
p = n / 2 e = 1 / 2 la sua media e la sua varianza possono
essere dedotte introducendo tali valori nella espressione di
media e varianza della generica Gamma :



ottenendo:

| | | |
2
var e

=
p
X
p
X E
| | | |
( )
n
n
X n
n
X 2
2 1
2
var e
2 1
2
2
= = = = E
Stat 03 - 25 / 43
Propriet della distribuzione chi-quadro


teorema 5.5:
Se le variabili casuali X
1
, X
2
, X
n
, sono indipendenti
e ciascuna ha distribuzione normale con media
j
e
varianza o
2
j
con j = 1, 2, , n, allora la variabile casuale:
2
1
2

=
|
|
.
|

\
|
o

=
n
j
j
j j
X
_
segue una distribuzione chi-quadro con n gradi di libert
Stat 03 - 26 / 43
2
2
1 1
2
_ =
|
|
.
|

\
|
o

=

= =
n
j
j
j j
n
j
j
X
Z
la somma dei quadrati di n variabili casuali indipendenti,
ciascuna distribuita in modo normale standard, segue una
distribuzione chi-quadro con n gradi di libert !
Propriet della distribuzione chi-quadro


corollario al teorema 5.5:
Se le variabili casuali X
1
, X
2
, X
n
, sono indipendenti
e ciascuna ha una distribuzione normale
con media
j
e varianza o
2
j
con j = 1, 2, , n,
allora le variabili casuali Z
1
, Z
2
, Z
n
definite come :
j
j j
j
X
Z
o

=
sono indipendenti e seguono una distribuzione normale standard.
Ma allora si pu anche affermare che:
Stat 03 - 27 / 43
la distribuzione
della variabile
C
2
modificata
Stat 03 - 28 / 43
Distribuzione chi-quadro

Stat 03 - 29 / 43
Media e varianza della
distribuzione chi-quadro
Dato che la distribuzione chi-quadro con n gradi di libert
un caso particolare della distribuzione Gamma con parametri
p = n / 2 e = 1 / 2 la sua media e la sua varianza possono
essere dedotte introducendo tali valori nella espressione di
media e varianza della generica Gamma :


ottenendo:

| | | |
2
var e

=
p
X
p
X E
| | | |
( )
n
n
X n
n
X 2
2 1
2
var e
2 1
2
2
= = = = E
La distribuzione chi-quadro ha
media e varianza che aumentano allaumentare di n
Stat 03 - 30 / 43
La variabile C
2

Partendo da una variabile casuale _
2
che segue una
distribuzione chi-quadro con n gradi di libert, definiamo
una nuova variabile che indichiamo C
2
:
n
C

2
2
=
che prende il nome di
variabile modificata di chi-quadro con n g.d.l.
La variabile modificata di chi-quadro quindi una
variabile casuale che si ottiene dividendo una variabile
casuale distribuita secondo una chi-quadro
per il numero dei suoi gradi di libert.
Stat 03 - 31 / 43
La distribuzione della variabile C
2
Dato che la C
2
,

variabile modificata di chi-quadro, si ottiene
dividendo una variabile distribuita secondo una chi-quadro per
il numero dei suoi gradi di libert, il suo valore medio e la sua
varianza si possono facilmente ricavare da quelli della
corrispondente _
2
:

ottenendo:

| | | | n n 2 var e
2 2
= = E
| | | | 1
1 1
2
2
2
= = =
(

= n
n n n
C

E E E
| | | |
n
n
n n n
C
2
2
1
var
1
var var
2
2
2
2
2
= = =
(

=
Stat 03 - 32 / 43
La distribuzione della variabile C
2

Stat 03 - 33 / 43
La distribuzione della variabile C
2

La distribuzione della
varianza campionaria corretta

Stat 03 - 34 / 43
Distribuzione della varianza campionaria corretta

Estraendo casualmente da una popolazione per cui definita la
variabile casuale X, distribuita in modo normale con media e
varianza o
2
, un campione di n elementi a cui corrisponde
linsieme di variabili casuali { X
1
, X
2
, , X
n
}
facile vedere che la variabile casuale:


segue una distribuzione normale con media nulla.

n j
X X
Se definiamo una nuova variabile Z :



possiamo affermare che essa segue una
distribuzione normale standard.
o

=
n j
j
X X
Z
Stat 03 - 35 / 43
possiamo affermare che W segue una distribuzione
chi-quadro con n - 1 gradi di libert in quanto
somma dei quadrati
di n -1 variabili indipendenti normali standard
( la media introduce un vincolo fra le n variabili X
i
)

= =
|
|
.
|

\
|
o

= =
n
j
n j
n
j
j
X X
Z W
1
2
1
2
Se ora sommiamo i quadrati delle Z
1
, Z
2
, , Z
n
:
Distribuzione della varianza campionaria corretta

Stat 03 - 36 / 43
( )
2
2
1
o
=
n
S
n V
Definiamo ora una nuova variabile V :
( )
( )

=
=
|
|
.
|

\
|
o

=
o

=
n
j
n j
n
j
n j
X X
X X
n
n V
1
2
2
1
2
1
1
1
che, esplicitando S
n
2
, possiamo anche scrivere come:
Distribuzione della varianza campionaria corretta

Stat 03 - 37 / 43
Se ricordiamo che :



possiamo notare che :



e, ricordando che W segue una distribuzione chi-quadro
possiamo affermare che anche
V segue una distribuzione chi-quadro con n - 1 gradi di libert.
( ) W
X X
S
n V
n
j
n j
n
=
|
|
.
|

\
|
o

=
o
=

=1
2
2
2
1

= =
|
|
.
|

\
|
o

= =
n
j
n j
n
j
j
X X
Z W
1
2
1
2
Distribuzione della varianza campionaria corretta

Stat 03 - 38 / 43
Definiamo infine una nuova variabile che indichiamo C
2
:
1
2

=
n
V
C
che risulta essere una
variabile modificata di chi-quadro con n - 1 gradi di libert
( )
( )
2
2
2
2
2
2
2
2
1
1
1
1
o
=

=
o
=
n
n
n
S
n
S
n
C
n
V
C
S
n V
Distribuzione della varianza campionaria corretta

Stat 03 - 39 / 43
La varianza campionaria corretta e la C
2

| |
| |
2
2
2
2
2
1
o =

=
(

o
=
n
n
S
S
C
E
E E
Stat 03 - 40 / 43
La varianza campionaria corretta e la C
2

| |
| |
| | 0 var lim
1
2
var
1
2
var var
2
4
2
2
2
2
=


=
(

o
=

n
n
n
n
S
n
S
n
S
C
Stat 03 - 41 / 43
Lo stimatore varianza campionaria corretta
Estraendo casualmente da una popolazione per cui definita la
variabile casuale X, distribuita in modo normale con media e
varianza o
2
, un campione di n elementi a cui corrisponde
linsieme di variabili casuali { X
1
, X
2
, , X
n
}
posto:




si ha che la varianza campionaria corretta:

uno stimatore corretto in quanto

uno stimatore consistente in quanto :




( ) 1
1
1
1
2
2
>

=

=
n X X
n
S
n
j
n j n
| |
| | 0 var lim
1
2
2
2
=
> o =

n
n
n
S
n S E
Stat 03 - 42 / 43
Lo stimatore varianza campionaria corretta
Estraendo casualmente da una popolazione per cui definita la
variabile casuale X, distribuita in modo normale con media e
varianza o
2
, un campione di n elementi a cui corrisponde
linsieme di variabili casuali { X
1
, X
2
, , X
n
}
posto:



si ha che :




segue una distribuzione C
2
con n-1 gradi di libert.

( ) 1
1
1
1
2
2
>

=

=
n X X
n
S
n
j
n j n
1
1
1
1
2
2
2
>
|
|
.
|

\
|
o

=
o

=
n
X X
n
S
n
j
n j
n
Stat 03 - 43 / 43
Lo stimatore varianza campionaria corretta
Il rapporto fra la varianza campionaria corretta dei
campioni estratti casualmente da una popolazione
per cui definita la variabile casuale X, distribuita in
modo normale con media e varianza o
2
, e la stessa
varianza o
2
della X una variabile casuale che
segue una distribuzione C
2
con n-1 gradi di libert.

| |
| |
2
2
2
2
2
1
o =

=
(

o
=
n
n
S
S
C
E
E E
| |
| |
4
2
2
2
2
1
2
var
1
2
var var
o
o


=
(

=
n
S
n
S
C
n
n