Sei sulla pagina 1di 10

Lezione 20 - 19/04/2021

Abbiamo dato la scorsa volta la definizione di campione casuale.


Osservazione
X = (X1 ,........., Xn ) lo consideriamo un esperimento aleatorio ripetuto n volte.
Quindi io avrò:
• x 1 risultato del primo esperimento → deriva dalla V.A. X 1
• x 2 risultato del secondo esperimento → deriva dalla V.A. X 2
• …
• x n risultato dell'n-esimo esperimento → deriva dalla V.A. X n
Così abbiamo un vettore aleatorio.
Tutte queste V.A. sono I.I.D. tra di loro e alla V.A. genitrice.
Definizione modello statistico
Sia X una popolazione di un campione casuale caratterizzata da una densità f( ∙ ; �).
Le marginali sono tutte uguali ed indipendenti e quindi la congiunta sarà f n
Sia X il supporto di X = (X 1 ,........., X n ), naturalmente X ⊂ R n .
Allora la famiglia di densità di probabilità, parametrizzata dal vettore dei parametri �,
F = { f( ∙ ; �) , � ∈ � } , con � detto "spazio dei parametri", è detta "modello statistico".

Importante perché abbiamo la nostra genitrice, che può essere


X ∼ N(�, 1)
Quindi il mio parametro corrisponde solamente alla media della normale, la distribuzione
è
parametrizzata da �.
Se avessimo una genitrice uniforme
X ∼ Unif[a, a + 5] , A ∈ { 0, 1 }
Quindiin questo caso la mia famiglia avrà due elementi:
F = { Unif[1, 6] ; Unif[0, 5]}

Questo può essere utile nel senso che magari della nostra famiglia potrei voler scegliere
la
più verosimile che rappresenti meglio i miei dati.
Io ho un modello statistico che rappresenta la situazione di studio, al variare del
parametro
posso avere tantissime densità, io voglio scegliere il parametro che meglio rappresenta i
dati
raccolti.

n=5 d = |�| = 1
X = (X1 ,........., X5 )
X ∼ Be p


Allora il supporto
X = { 0, 1 } n
E il modello statistico è:

F= f(x; p) ; p ∈ [0, 1]
⏠⏣⏣ ⏡⏣⏣ ⏢
densità discreta
Il campione casuale in pratica corrisponde all'esperimento ripetuto prima che venga
condotto.
Definizione spazio dei campioni
Il supporto di X = (X 1 ,........., X n )
S X=(X1 ,.........,Xn ) = X = {(x 1 , … , x n ) / x i ∈ S X , ∀i ∈ { 1, … , n }}
Esso viene denominato spazio dei campioni.
Definizione statistica
Sia X = (X 1 ,........., X n ) un campione casuale e consideriamo una funzione
g(X = (X1 ,........., Xn ))
borel-misurabile. Se l'espressione funzionale di g(X) non dipende da � allora viene
denominata statistica.
Esempio

X = (X1 ,........., Xn )
Consideriamo:
S = g(X) = X1 + X2 +… Xn
Consideriamo
T = MAX(X1 , … Xn )
M = X1 + X2 +…+ Xn - n�
Allora S è una statistica, T è una statistica.
Invece M dipende da � nella sua espressione funzionale e quindi non è una statistica.
Quindi se io avessi la realizzazione
x = (x 1 , … , x n )
Allora è possibile calcolare S
s = S(x) = x 1 +…+ x n
Mentre invece per quanto riguarda M:
m = M(x) = x 1 + x 2 +…+ x n - n�
Esempio
n
1
⏨n =
X ∑ Xi
n i=1
Questa è chiaramente una statistica.
Altrimenti potremmo considerare:
1
(Min(X1 , … Xn ) + Max(X1 , … Xn ))
2
Che viene detto mid-range ed è una statistica.
Definizione momento campionario k-esimo
Sia X = (X 1 ,........., X n ) un campione casuale estratto da una popolazione X con densità
in
f( ∙ ; �).
Il "momento campionario k-esimo" è definito come:
n
1
Mk = ∑ Xik , k ∈ N*
n i=1
Osservazione

Abbiamo fissato un passo ulteriore alla media campionaria, in particolare, per n = 1: M 1 ≡ ⏨


Xn

Denotazione
Denotiamo con
� k = EX k
Il momentoi k-esimo della popolazione

Ricordiamo che il valore atteso della media empirica coincideva con il valore atteso delle
singole componenti.
Teorema
Sia X = (X 1 ,........., X n ) un campione di taglia n estratto da una popolazione
X ∼ f( ∙ ; �)
Allora:
EM k = � k
1
VarM k = � 2k - � k2
n
EM k = � k
n n
1 1
EM k = E ∑ Xik = ∑ EXik =
n i=1 n i=1

Ma ricordiamo che la V.A. X i è identicamente distribuita alle altre VV.AA., ma soprattutto


alla
popolazione.
n n
1
= ∑ EX k = 1 ∑ �k = 1 n�k = �k
n i=1 n i=1 n
1 2
n n
1 1
VarM k = Var ∑ Xik = 2
Var∑ Xik =
n i=1 n i=1

Sempre le VV.AA. sono I.I.D.


n n
1 1
= 2
Var∑ X = k
2
Var∑ � 2k - � k2 = (1)
n i=1 n i=1
Perché quando vado a calcolare VarXik di fatto la varianza di una V.A. è uguale al
momento secondo della variabile meno il momento primo al quadrato
2 2
VarXik = E Xik - EXik = EXik2 - (� k ) 2 = � 2k - � k2

Detto ciò ogni elemento della somma non dipende da i, quindi (1) diventa
1 1
= 2
n � 2k - � k2 = � 2k - � k2
n n
NB
1 VarX
VarM 1 = � 2k - � k2 =
n n
Definizione varianza campionaria
Sia X = (X 1 ,........., X n ) un campione casuale di taglia n estratto da una popolazione X
con
densità f( ∙ ; �).
Definiamo "varianza campionaria" la quantità (che è una statistica)
n
1
S = 2 ∑ (Xi - X⏨n ) 2
n - 1 i=1
Costruita in maniera simile alla varianza.
Teorema
Sia X = (X 1 ,........., X n ) un campione casuale di taglia n estratto da:
X ∼ f( ∙ ; �)
Allora,
ES 2 = � 2
1 n-3 4
VarS 2 = �4 - �
n n-1
Dove
� 2 = VarX
Dimostrazione (solo del primo punto)
n
1
2
ES = E ∑ (X i - ⏨
X n)2
n-1 i=1
(2)
⏠⏣⏣⏣ ⏡⏣⏣⏣
concentriamoci ⏢
su questo

n n �=� 1 =EX
2
∑ (Xi - X⏨n ) 2 = ∑ Xi - ⏜⏟⏟
⏝⏟⏟
� ⏞+�- X
⏨n =
i=1 i=1
n
= ∑ (Xi - �) 2 + (X
⏨n - �) 2 - 2(Xi - �)(X
⏨n - �) =
i=1
n n
= ∑ (Xi - �) + n(X ⏨n - �)∑ (Xi - �) =
⏨n - �) - 2(X
2 2

i=1 i=1
n
= ∑ (Xi - �) 2 + n(X
⏨n - �) 2 - 2(X
⏨n - �)n(X
⏨n - �) =
i=1
n
= ∑ (Xi - �) 2 - n(X
⏨n - �) 2
i=1

Continuiamo ora su (2)


n n
1 1
= E ∑ (Xi - �) 2 ⏨n - �)
- n(X 2
= ∑ E(Xi - �) 2 - �E(X⏨n - �) 2 =
n-1 i=1 n-1 i=1
ricordiamo che X i è identicamente distribuita con la popolazione, come vediamo nella parte rossa
⏨n = EX = �
Nella parte verde ci ricordiamo invece che: E X
1
= ⏨n =
n� 2 - nVar X
n-1
noi conosciamo Var ⏨
Xn
1 �2 1
= n� 2 - n = � 2 ( n - 1)
n-1 n n-1
Definizione varianza campionaria non corretta
La grandezza
n-1
S2
n
è detta varianza campionaria non corretta (o non distorta).

Potrebbero piacerti anche