Sei sulla pagina 1di 15

INFERENZA PARAMETRICA

Parte prima


PROPRIET DEL VALORE ATTESO (MEDIA) E DELLA VARIANZA............................... 2
INFERENZA STATISTICA PARAMETRICA ............................................................................. 3
MEDIA CAMPIONARIA......................................................................................................................... 5
VARIANZA CAMPIONARIA.................................................................................................................... 7
CAMPIONAMENTO IN BLOCCO .......................................................................................................... 10
MEDIA CAMPIONARIA ......................................................................................................................... 10
VARIANZA CAMPIONARIA ................................................................................................................... 10
FREQUENZA CAMPIONARIA............................................................................................................... 11
CAMPIONAMENTO CON REINTRODUZIONE........................................................................................... 11
CAMPIONAMENTO IN BLOCCO............................................................................................................. 12
DIFFERENZA TRA DUE MEDIE............................................................................................................ 13
CAMPIONAMENTO CON REINTRODUZIONE........................................................................................... 13
CAMPIONAMENTO IN BLOCCO............................................................................................................. 14
TABELLA RIASSUNTIVA ..................................................................................................................... 15


















Appunti ad uso degli studenti

di

C. Romaniello


ITI Leonardo da Vinci Carpi (MO)

Inferenza_1 - 2 -
Propriet del valore atteso (media) e della varianza


Data una variabile casuale X e due costanti a e b, valgono le seguenti:

A1.
[ ] [ ]
E aX b a E X b + = +

A2.
[ ] [ ]
2
V aX b a V X + =


Date due variabili casuali
1
X e
2
X , valgono le seguenti:

B1. [ ] [ ] [ ]
1 2 1 2
E X X E X E X + = +

B2.a [ ] [ ] [ ] [ ]
1 2 1 2 1 2
2 V X X V X V X Cov X X + = + +

B2.b [ ] [ ] [ ] [ ]
1 2 1 2 1 2
2 V X X V X V X Cov X X = +


Se
1
X e
2
X sono indipendenti, la [ ]
1 2
0 Cov X X = e allora vale la seguente

B3. [ ] [ ] [ ] [ ]
1 2 1 2 1 2
V X X V X X V X V X + = = +



























Inferenza_1 - 3 -
Inferenza Statistica Parametrica

Si suppone di conoscere la distribuzione della variabile oggetto di studio, e si vuole vedere quanto
vale un parametro incognito della distribuzione.

Ad esempio nel caso della distribuzione di Poisson
( )
Pr
!
x
X x e
x


= =
il parametro .
Invece nel caso della distribuzione Normale
( )
( )
2
2
2
1
2
x
f x e

=

i parametri sono due: la media , e la varianza
2
.

Se si calcola direttamente il parametro utilizzando i dati di tutta la popolazione si sta facendo
statistica descrittiva e non inferenza.

Nel caso dellinferenza statistica non si pu o non si vuole calcolare direttamente il valore del
parametro sullintera popolazione statistica, per ragioni di tempo o di costo.
Allora si estrae dalla popolazione un campione di dati, e su questo si calcola il valore di uno
stimatore del parametro. Lo stimatore una funzione dei dati campionari. Quindi il suo valore varia
a seconda del campione che stato estratto. Lo stimatore quindi una variabile casuale.

Si chiama stima del parametro il valore assunto dallo stimatore in corrispondenza del campione
estratto. La stima quindi varia da campione a campione; uno dei possibili valori che pu assumere
la variabile casuale stimatore.



Alla base dellinferenza statistica parametrica vi sono alcune ipotesi fondamentali.

1. Normalit distributiva.
Si ipotizza che il carattere oggetto di studio nella popolazione statistica una variabile casuale
Normale X che ha una certa media e una certa varianza
2
:
( )
2
, X N .

2. Campionamento con reintroduzione.
Gli elementi del campione vengono estratti dalla popolazione con reintroduzione.


Ne deriva che gli elementi del campione
1 2
, , ,
n
X X X sono anchessi delle variabili casuali
distribuite secondo una Normale con media e varianza uguali a quelle della variabile X nellintera
popolazione:
( )
2
, 1, 2, ,
i
X N i n = .

Inoltre, poich le estrazioni sono con reintroduzione, gli elementi del campione sono indipendenti
fra di loro.

Inferenza_1 - 4 -
Facciamo un esempio che illustri come tutti gli elementi del campione sono variabili casuali che
hanno la stessa media e la stessa varianza della variabile in popolazione.

Consideriamo una popolazione di sole 4 unit si cui si vuole studiare una variabile X che assume i
seguenti valori in corrispondenza delle 4 unit { } 3, 5, 7, 9 .
La media della variabile in popolazione sar
3 5 7 9 24
6
4 4
+ + +
= = e la varianza in popolazione
9 1 1 9 20
5
4 4
+ + +
= = .

Immaginiamo di estrarre un campione di numerosit 2.

Il primo elemento del campione
1
X a sua volta una variabile casuale, perch non sappiamo prima
di avere effettuato lestrazione qual il valore che verr effettivamente estratto.
Quali sono i possibili valori che pu assumere la V.C.
1
X ?
Chiaramente potr assumere tutti i possibili valori che la variabile X assume in popolazione,
essendo
1
X estratta proprio da quella popolazione.
Inoltre ogni valore si potr presentare con probabilit pari a
1
4
essendo il campione casuale.
Avremo la seguente distribuzione di probabilit della V.C.
1
X

1
1
3
4
1
5
4
1
7
4
1
9
4
1
i
i
x p


Si pu verificare facilmente che la media e la varianza della V.C.
1
X sono proprio 6 e 5, come per
la variabile X in popolazione.

Un discorso analogo vale anche per il secondo elemento del campione
2
X , per il quale si perviene
alle medesime conclusioni.

Questo ragionamento pu essere esteso ad un qualunque elemento di un campione casuale estratto
da una popolazione qualsiasi.
Possiamo quindi accettare laffermazione fatta allinizio della pagina che tutti gli elementi del
campione sono variabili casuali che hanno la stessa media e la stessa varianza della variabile in
popolazione.






Inferenza_1 - 5 -

Media Campionaria

Solitamente il parametro su cui si vuole fare inferenza la media del carattere nella popolazione.
Data la variabile casuale ( )
2
, X N si vuole stimare .

Come stimatore della media si utilizza la media campionaria X , che la media aritmetica
semplice calcolata sugli elementi del campione:
1 2 1


n
i
n i
X
X X X
X
n n
=
+ + +
= =




Una volta estratto il campione dalla popolazione, le variabili
1 2
, , ,
n
X X X assumeranno un
certo valore
1 1 2 1
, , ,
n n
X x X x X x = = =

ed anche lo stimatore media campionaria assumer un certo valore che la stima del parametro

1 2 1


n
i
n i
x
x x x
x
n n
=
+ + +
= =




N.B. : formalmente il passaggio dallo stimatore alla stima viene rappresentato come passaggio
dalla lettera maiuscola, che indica una variabile casuale, alla lettera minuscola, che indica una
determinazione della variabile casuale.


Poich la media campionaria una variabile casuale, di essa possiamo calcolare il valore atteso e la
varianza.

Valore atteso della media campionaria

[ ]
[ ]
1
1 1
1
1 1
per la propriet A1 per la propriet B1
1 1
poich tutte le hanno la stessa media
n
i n n
i
i i
i i
n
i
i
X
E X E E X E X
n n n
X n
n n

=
= =
=
(
(
(
( = = = = = =
(


= = = =




Quando lo stimatore di un parametro ha valore atteso uguale proprio al valore che il parametro
assume in popolazione, si dice che uno stimatore corretto.

Quindi la media campionaria stimatore corretto per la media della popolazione.

Inferenza_1 - 6 -
Varianza della media campionaria

[ ]
[ ]
1
2 2
1 1
2
2 2 2
2 2
1
1 1
per la propriet A2 per la propriet B3
1 1
poich tutte le hanno la stessa media
n
i n n
i
i i
i i
n
i
i
X
V X V V X V X
n n n
X n
n n n


=
= =
=
(
(
(
( = = = = = =
(


= = = =



Distribuzione della media campionaria

Per lipotesi di normalit distributiva del carattere in popolazione, anche la media campionaria
una variabile casuale Normale, con media pari alla media della popolazione e varianza pari alla
varianza della popolazione diviso la numerosit del campione:

( )
2
, X N
2
, X N
n

| |
|
\




Esempio

Verifichiamo le propriet della media aritmetica con un esempio.
Immaginiamo di avere una popolazione di numerosit 4 N = . I valori che assume il carattere
oggetto dindagine nelle 4 unit statistiche che costituiscono la popolazione siano { } 2, 3, 7, 8 .
Allora la media in popolazione del carattere sar
2 3 7 8 20
5
4 4

+ + +
= = = .
E la varianza sar
( ) ( ) ( ) ( )
2 2 2 2
2
2 5 3 5 7 5 8 5 9 4 4 9 26
6, 5
4 4 4

+ + + + + +
= = = =

Calcoliamo ora tutti i possibili campioni ordinati di numerosit 2 n = estratti con reintroduzione, e
per ognuno di essi calcoliamoci la stima di utilizzando lo stimatore media campionaria:

2 3 7 8
2
{ }
1
2, 2
2 x =

{ }
2
2, 3
2, 5 x =

{ }
3
2, 7
4, 5 x =

{ }
4
2, 8
5 x =

3
{ }
5
3, 2
2, 5 x =

{ }
6
3, 3
3 x =

{ }
7
3, 7
5 x =

{ }
8
3, 8
5, 5 x =

7
{ }
9
7, 2
4, 5 x =

{ }
10
7, 3
5 x =

{ }
11
7, 7
7 x =

{ }
12
7, 8
7, 5 x =

8
{ }
13
8, 2
5 x =

{ }
14
8, 3
5, 5 x =

{ }
15
8, 7
7, 5 x =

{ }
16
8, 8
8 x =



Inferenza_1 - 7 -
Poich questi sono tutti i possibili campioni estraibili con reintroduzione possiamo calcolare la
distribuzione della media campionaria, la sua media e la sua varianza

i
X
i
n
i i
X n
[ ]
( )
i
X E X [ ]
( )
2
i
X E X
[ ]
( )
2
i i
X E X n
2 1 2 -3 9 9
2,5 2 5 -2,5 6,25 12,5
3 1 3 -2 4 4
4,5 2 9 -0,5 0,25 0,5
5 4 20 0 0 0
5,5 2 11 0,5 0,25 0,5
7 1 7 2 4 4
7,5 2 15 2,5 6,25 12,5
8 1 8 3 9 9
TOT 16 80 52

[ ]
80
5
16
E X = =
[ ]
52
3, 25
16
V X = =



Si pu cos verificare che la media della media campionaria proprio uguale alla media della
variabile oggetto di studio in popolazione
[ ]
5 E X = =

e la varianza della media campionaria proprio uguale alla varianza della variabile oggetto di
studio in popolazione divisa per la numerosit della popolazione

[ ]
2
6, 5
3, 25
2
V X
n

= = = .



Varianza campionaria

Come stimatore della varianza si utilizza la varianza campionaria
2
S , che la varianza calcolata
sugli elementi del campione, ovvero la media aritmetica semplice degli scarti dalla media
campionaria al quadrato

2
2 1
( )
n
i
i
X X
S
n
=




Come per la media campionaria, verifichiamo se la varianza campionaria stimatore corretto della
varianza della popolazione.


Inferenza_1 - 8 -
2
2
1
( )

n
i
i
X X
E S E
n
=
(

(
( = =

(

per la propriet A1 =
2
1
1
( )
n
i
i
E X X
n
=
(
=
(



adesso sottraiamo e sommiamo la media della popolazione nella parentesi tonda, ed applichiamo la
propriet associativa delladdizione

( ) ( )
2
2
1 1
1 1
( )
n n
i i
i i
E X X E X X
n n

= =
( (
(
= + = + =
( (




che possiamo riscrivere, notando che vale
( )
X X = , nel modo seguente

( ) ( )
2
1
1

n
i
i
E X X
n

=
(
(
= =
(



si pu sviluppare lespressione ( ) ( )
2
i
X X
(


come il quadrato di un binomio, dove i 2
termini sono ( )
i
X e
( )
X

2 2
1
1
( ) ( ) 2 ( ) ( )
n
i i
i
E X X X X
n

=
(
( = + =
(



applichiamo loperatore sommatoria ai tre termini

2 2
1 1 1
1
( ) ( ) 2 ( ) ( )
n n n
i i
i i i
E X X X X
n

= = =
(
= + =
(




ricordiamo ora che le costanti moltiplicative possono essere portate davanti al simbolo di
sommatorie e che sommare n volte una costante equivale a moltiplicare la costante stessa per n

2 2
1 1
1
( ) ( ) 2 ( ) ( )
n n
i i
i i
E X n X X X
n

= =
(
= + =
(




ora notiamo che ( )
1 1 1
( )
n n n
i i
i i i
X X n X n n X
= = =
= = =



che possiamo sostituire nellespressione ottenendo

( )
2 2
1
1
( ) ( ) 2 ( )
n
i
i
E X n X X n X
n

=
(
= + =
(



2 2 2
1
1
( ) ( ) 2 ( )
n
i
i
E X n X n X
n

=
(
= + =
(




Inferenza_1 - 9 -
e semplificando

2 2
1
1
( ) ( )
n
i
i
E X n X
n

=
(
= =
(



applichiamo loperatore valore atteso a tutti i termini della somma entro parentesi quadre

2 2
1
1
( ) ( )
n
i
i
E X E n X
n

=
(
( ( = =
(



2 2
1
1
( ) ( )
n
i
i
E X n E X
n

=
(
( ( = =
(



si ricordi che per definizione la varianza di una variabile casuale X la media (o valore atteso)
delle differenze dalla media al quadrato che simbolicamente si scrive
( )
( )
2
X
V X E X
(
=



allora ( )
2
( )
i i
E X V X ( =

poich [ ] 1, 2, ,
i
E X i n = =

e
( )
2
( ) E X V X ( =

avendo gi dimostrato che
[ ]
E X =

si perviene cos alla scrittura

( ) ( )
1
1

n
i
i
V X n V X
n
=
(
= =
(



poich ( )
2
1, 2, ,
i
V X i n = = e avendo gi dimostrato che
( )
2
V X
n

= si ha


[ ]
( )
2
2 2 2 2 2
1
1 1 1 1
1
n
i
n
n n n
n n n n n


=
(
= = = =
(




Siamo cos arrivati al risultato finale
2 2
1

n
E S
n

( =

.


Quindi la varianza campionaria stimatore non corretto (distorto) per la varianza della
popolazione.

Per possiamo costruire una stimatore corretto per
2
moltiplicando
2
S per
1
n
n
. Infatti si avr

[ ]
2 2 2 2
1

1 1 1
n n n n
E S E S
n n n n

(
= = =
(



Inferenza_1 - 10 -
La quantit
2 2
1
n
S S
n
=

chiamata varianza campionaria corretta.



Si noti che se
2
2 1
( )

n
i
i
X X
S
n
=

allora
2 2
2 1 1
( ) ( )

1 1
n n
i i
i i
X X X X
n
S
n n n
= =

= =


.

Quindi
2
S e
2
S differiscono solo per il denominatore: la quantit che compare al numeratore di
entrambe,
2
1
( )
n
i
i
X X
=

, prende il nome di devianza; nel caso della


2
S la devianza divisa per n,
mentre nel caso della
2
S il numeratore viene diviso per 1 n .

Ne discende anche che
2 2
S S < .



Campionamento in blocco

La differenza principale dal campionamento con reintroduzione, che nel campionamento in blocco
le osservazioni campionarie non sono pi indipendenti tra di loro.
Si avranno allora delle differenze rispetto al campionamento con reintroduzione in tutti i casi in cui
stata utilizzata lindipendenza delle variabili campionarie.

Media campionaria

La media campionaria anche nel campionamento in blocco stimatore corretto per la media di
popolazione
[ ]
E X = .

Invece la varianza della media campionaria nel campionamento in blocco uguale alla varianza del
campionamento con reintroduzione moltiplicata per il fattore di correzione per popolazioni finite

[ ]
2
1
N n
V X
n N

=

.

Inoltre non vale pi la normalit distributiva per la media campionaria, che si basa
sullindipendenza tra le unit campionarie.

Varianza campionaria

Per quanto riguarda la varianza campionaria, nel campionamento in blocco il suo valore atteso
uguale a quello del campionamento con reintroduzione moltiplicato per un certo fattore

[ ]
2 2
1
1
N n
E S
N n

.

Inferenza_1 - 11 -
Frequenza campionaria

Spesso capita di dover stimare la percentuale (frequenza) delle unit di una popolazione che hanno
una certa caratteristica (qualit) comune. Ad esempio la percentuale di lampadine difettose prodotte
da un macchinario.
Indichiamo con
K
p
N
= la percentuale che si vuole stimare, essendo K il numero di unit che hanno
la stessa caratteristica oggetto di studio, su una popolazione di N unit totali.

Per stimare p, lidea di prendere un campione di n unit dalla popolazione, e contare qual il
numero X di unit campionarie che presentano quella caratterisitica.
Si ottiene cos lo stimatore frequenza campionaria

X
f
n
=

Vediamo le propriet di f nei due tipi di campionamento, con reintroduzione e in blocco.


Campionamento con reintroduzione

In questo caso X il numero di successi in n prove indipendenti, dove:

la singola prova lestrazione di un elemento del campione dalla popolazione;

un successo il fatto che ununit campionaria presenta la caratteristica oggetto di studio;

la probabilit di successo nella singola prova proprio la percentuale di unit che
posseggono quella caratteristica nella popolazione, cio
K
p
N
= .

Questo vuol dire che X si distribuisce secondo un distribuzione Binomiale di parametri n e p

( ) , X Bin n p

con valore atteso
[ ]
E X np = e varianza
[ ]
( ) 1 V X np p =


Allora valgono i seguenti risultati:


la frequenza campionaria stimatore corretto per la percentuale di una popolazione

[ ]
[ ]
1 1

X
E f E E X np p
n n n
(
= = = =
(





Inferenza_1 - 12 -
la varianza della frequenza campionaria

[ ]
[ ]
( )
( )
2 2
1 1 1
1
p p X
V f V V X np p
n n n n

(
= = = =
(




per n , la binomiale si pu sempre approssimare con una Normale

( ) ( ) , 1
n
X N np np p


( ) 1
,
n
p p
f N p
n

| |

|
\



Campionamento in blocco

Ora X il numero di successi in n prove dipendenti, dove:

la singola prova lestrazione di un elemento del campione dalla popolazione;

un successo il fatto che ununit campionaria presenta la caratteristica oggetto di studio;


la probabilit di successo nella prima prova proprio la percentuale di unit che posseggono
quella caratteristica nella popolazione, cio
K
p
N
= .

Questo vuol dire che X si distribuisce secondo un distribuzione Ipergeometrica di parametri N, K ed
n
( ) , , X Iperg N K n

con valore atteso
[ ]
K
E X n np
N
= = e varianza
[ ]
( ) 1 1
1 1
K K N n N n
V X n np p
N N N N
| |
= =
|
\



Allora valgono i seguenti risultati:

la frequenza campionaria stimatore corretto per la percentuale di una popolazione

[ ]
[ ]
1 1

X
E f E E X np p
n n n
(
= = = =
(



la varianza della frequenza campionaria

[ ]
[ ]
( )
( )
2 2
1 1 1
1
1 1
p p X N n N n
V f V V X np p
n n n N n N
(
= = = =
(






Inferenza_1 - 13 -
Differenza tra due medie

Spesso nellinferenza statistica si effettuano confronti tra due o pi popolazioni. Solitamente si
vuole verificare se una certa caratteristica comune oppure no alle due popolazioni.
Se si vogliono confrontare due medie, lidea di prendere la loro differenza, che sar nulla in caso
di uguaglianza.

Vediamo come si distribuisce la differenza tra due medie.

Si ipotizzano due popolazioni normali indipendenti fra di loro

( )
2
,
X X
X N e ( )
2
,
Y Y
Y N

di numerosit
1
N e
2
N rispettivamente dalle quali si estrae un campione, di numerosit
1
n e
2
n .

Si vuole trovare uno stimatore per la differenza tra le medie
X Y
.

Campionamento con reintroduzione

Si stimano le due medie con le medie campionarie che godono delle solite propriet

2
1
,
X
X
X N
n

| |
|
\
e
2
2
,
Y
Y
Y N
n

| |
|
\


Quindi si considera come stimatore della differenza delle medie la variabile casuale differenza tra
le medie campionarie
X Y

Per le propriet B1 e B3 di pagina 2 si avr:


[ ] [ ] [ ]

X Y
E X Y E X E Y = =


[ ] [ ] [ ]
2 2
1 2
V
X Y
V X Y X V Y
n n

= + = +


( )
2 2
1 2
,
X Y
X Y
X Y N
n n


| |
+
|
\



ovvero la differenza tra le medie campionarie stimatore corretto per la differenza tra le medie di
popolazione ed normalmente distribuita.



Inferenza_1 - 14 -
Campionamento in blocco

Si stimano le due medie con le medie campionarie per le quali valgono le

[ ] [ ]
2
1 1
1 1

1
X
X
N n
E X V X
n N


= =

e
[ ] [ ]
2
2 2
2 2

1
Y
Y
N n
E Y V Y
n N


= =




Sempre per le propriet B1 e B3 di pagina 2 si avr


[ ] [ ] [ ]

X Y
E X Y E X E Y = =


[ ] [ ] [ ]
2 2
1 1 2 2
1 1 2 2
V
1 1
X Y
N n N n
V X Y X V Y
n N n N

= + = +





































Inferenza_1 - 15 -
Tabella riassuntiva

Campionamento con
reintroduzione
Campionamento in blocco
M
e
d
i
a

c
a
m
p
i
o
n
a
r
i
a

[ ]
E X =

[ ]
2
V X
n

=

2
, X N
n

| |
|
\

[ ]
E X =


[ ]
2 2

1
N n
V X
n N n

= <



V
a
r
i
a
n
z
a

c
a
m
p
i
o
n
a
r
i
a

[ ]
2 2
1 n
E S
n

=
[ ]
2 2
1
1
N n
E S
N n


V
a
r
i
a
n
z
a

c
a
m
p
i
o
n
a
r
i
a

c
o
r
r
e
t
t
a
2 2
1
n
S S
n
=



[ ]
2 2
E S =
2 2
1
1
n N
S S
n N



[ ]
2 2
E S =
F
r
e
q
u
e
n
z
a

c
a
m
p
i
o
n
a
r
i
a


[ ] E f p =

[ ]
( ) 1

p p
V f
n

=

( ) 1
,
n
p p
f N p
n

| |

|
\

[ ] E f p =

[ ]
( ) 1

1
p p N n
V f
n N

=




D
i
f
f
e
r
e
n
z
a

m
e
d
i
e

c
a
m
p
i
o
n
a
r
i
e

[ ]

X Y
E X Y =

[ ]
2 2
1 2

X Y
V X Y
n n

= +

( )
2 2
1 2
,
X Y
X Y
X Y N
n n


| |
+
|
\

[ ]

X Y
E X Y =


[ ]
2 2
1 1 2 2
1 1 2 2

1 1
X Y
N n N n
V X Y
n N n N

= +