Foglio 9

Probabilità e Statistica – Foglio 9
Prof. Claudio Durastanti

Statistica
Esercizi
1. Siamo interessati al peso medio di una popolazione di mele renelle, da cui possiamo estrarre un campione
di n mele. Sappiamo che il peso di ciascuna mela renella è data da una v.a. Gaussiana con media
µ = 180 grammi con varianza σ 2 = 49 e che le variabili aleatorie che compongono il campione sono
indipendenti e identicamente distribuite.
(a) Con un campione di dimensione n = 25, qual’è la probabilità che la media campionaria sia
compresa tra 179 e 184? E se n = 400?
(b) Calcolare la probabilità che la varianza campionaria sia maggiore di 98, se n = 25.
(c) Supponiamo ora di conoscere solo la varianza σ 2 ma di non conoscere la media µ. Dare la
definizione di intervallo di confidenza per la media al livello 1 − α, sapendo che la varianza è nota.
Supponiamo di ottenere delle realizzazioni del campione tali che x̄ = 181.4 se n = 25, e x̄ = 179.8
se n = 400
Calcolare esplicitamente il suddetto intervallo al livello 0.95 con n = 25 e n = 400. (NOTA: si
ricordi che z0.025 = 1.96.).
2. Si consideri un esperimento il cui successo è associato ad una variabile aleatoria di Bernoulli X che
assume valore 1 con probabilità p e 0 con probabilità 1 − p.
(a) Calcolare media e varianza di X.
(b) Abbiamo a disposizione un campione composto da variabili aleatorie X1 , . . . , Xn distribuite come
una Bernoulli con probabilità di successo p. Calcolare lo stimatore di massima verosimiglianza
p̂MLE di p.
(c) Sia Y la variabile aleatoria che indica il numero di successi che otteniamo se effettuiamo l’e-
sperimento n = 400. Calcolare la probabilità approssimata che Y sia maggiore di 250, qualora
p = 0.2.
3. Supponiamo di avere a disposizione un campione composto da variabili aleatorie X1 , . . . , Xn , i.i.d, con
la seguente distribuzione.
1 2 −x
f (x|ϑ) = x e ϑ,
2ϑ3
con ϑ > 0.
(a) Sia X una v.a. con densità f (x|ϑ). Calcolare E (X)) e Var (X)
(b) Calcolare ϑ̂MLE , lo stimatore di massima verosimiglianza di ϑ.
(c) Dare la definizione di distorsione e stabilire se lo stimatore calcolato al punto (b) è distorto.
4. Supponiamo di avere a disposizione un campione X1 , . . . , Xn che segue una distribuzione Gaussiana
con media nota (µ = 1) e varianza σ 2 ignota.
(a) Calcolare σˆ2 MLE , lo stimatore di massima verosimiglianza di σ 2 .

(b) Dare la definizione di correttezza asintotica. Dimostrare che lo stimatore calcolato al punto (b) è
asintoticamente corretto.
(c) Sia n = 5 e supponiamo di avere le seguenti realizzazioni: x1 = 0.89, x2 = 1.12, x3 = 1.06,
x4 = 0.99, x5 = 0.92. Dare la definizione di campo di variazione (range) campionario e di
mediana campionaria. Calcolare in questo caso entrambi i valori campionari delle statistiche.
Soluzioni. HAI PROVATO PRIMA A RISOLVERE DA SOLO/A?

Esercizio 1. Supponiamo di avere un campione X1 , . . . , Xn , laddove Xi ∼ N µ, σ 2 , con µ = 180 e
σ 2 = 49. Ne segue che
σ2

X̄ ∼ N µ, .
n
Posso dunque standardizzare la media campionaria per ottenere
√ X̄ − µ √ X̄ − 180
n = n = Z ∼ N (0, 1) .
σ 7
(a) Come immediata conseguenza, troviamo che
√ 179 − 180 √ X̄ − 180 √ 184 − 180

P 179 < X̄ < 184 = P n < n < n
7 7 7
√ √
n √ X̄ − 180 4 n
=P − < n <
7 7 7
√ √
n 4 n
=P − <Z<
7 7
√ √
4 n n
=Φ −Φ −
7 7
√ √
4 n n
=Φ −Φ −
7 7
√ √
4 n n
=Φ +Φ − 1.
7 7
Quindi, se n = 25,

20 5
P 179 < X̄ < 184 = Φ +Φ − 1 = 0.997 + 0.762 − 1 = 0.76,
7 7
Mentre, se n = 400,

80 20
P 179 < X̄ < 184 = Φ +Φ − 1 = 1 + 0.997 − 1 = 0.997.
7 7
Si noti che la probabilità aumenta al crescere di n. L’intervallo (179, 184) contiene infatti la media
teorica (il valore atteso) µ = 180. Poichè la varianza, che indica la dispersione attorno alla media
teorica, decresce al crescere di n, mi aspetto per n più grandi una dispersione ridotta e quindi
una probabilità più alta di trovare la media campionaria in un intervallo che contiene la media
teorica.
(b) Sappiamo che la varianza campionaria di una popolazione Gaussiana, moltiplicata per n − 1 e
divisa per σ 2 , si distribuisce come una distribuzione chi–quadro con n − 1 gradi di libertà, ossia
S2
(n − 1) ∼ χ2n−1 ,
σ2
ossia, nel nostro caso,
24 S 2 2
ξ .
49 ∼ n−1
Denotiamo con Fχ2n−1 la funzione di ripartizione di una distribuzione chi–quadro con n − 1 gradi
di libertà. Ne segue che

24 2 24 24 2
P S 2 > 98 = P

S > 98 = P S > 48 = 1 − Fχ2n−1 (48) = 0.002.
49 49 49
(c) Sappiamo che l’intervallo di confidenza di livello 1 − α per la media è dato da

σ σ
In = x̄ − z α2 √ , x̄ + z α2 √ .
n n
Nel nostro caso, con α = 0.05, otteniamo per n = 25

7 7
I25 = 181.4 − 1.98 · , 181.4 + 1.98 · = (178.63, 184.17) ,
5 5
mentre per n = 400, troviamo

7 7
I400 = 179.8 − 1.98 · , 179.8 + 1.98 · = (179.11, 180.49) .
20 20
Anche in questo caso, all’aumentare del numero di osservazioni, a parita di livello di confidenza,
la lunghezza dell’intervallo in cui mi aspetto di trovare µ è diminuito (la mia stima per intervallo
è più precisa).
Esercizio 2. Questo esercizio è un ottimo ripasso per quel che riguarda molti argomenti del corso.
Anzitutto ricordiamo che nel caso di v.a. di Bernoulli, abbiamo la seguente funzione di massa di
probabilità
p se X = 1
P (X = x) = .
1 − p se X = 0
(a) Come abbiamo già visto a lezione,
E (X) = 1 · P (X = 1) + 0 · P (X = 0) = p.
D’altra parte,
E X 2 = 1 · P (X = 1) + 0 · P (X = 0) = p.

quindi
Var (X) = E X 2 − E X 2 = p − p2 = p (1 − p) .

(b) Supponiamo di avere un campione X1 , . . . , Xn , composto da v.a. i.i.d ciascuna con la distribuzione
di Bernoulli sopra indicata. Per calcolare la funzione di verosimiglianza, devo prima calcolare la
funzione di massa congiunta in un insieme di realizzazioni del campione x1 , . . . , xn . In questo
caso, usando l’indipendenza e l’identità in distribuzione, trovo
n
Y Pn Pn
1−xi n− xi
` (p|x1 , . . . , xn ) = pxi (1 − p) =p i=1 xi
(1 − p) i=1
.
i=1
La log-verosimiglianza è quindi data da

n
! n
!
X X
L (p|x1 , . . . , xn ) = log ` (p|x1 , . . . , xn ) = xi log p + n− xi log (1 − p) .
i=1 i=1
Ora, per definizione, la stima di massima verosimiglianza è data dalla seguente formula:
p∗MLE = argminp∈(0,1) L (p|x1 , . . . , xn ) .
Nel nostro caso, calcoliamo la derivata della log-verosimiglianza rispetto a p, la uguagliamo a 0 e

troviamo Pn Pn
i=1 xi n − i=1 xi
− = 0,
p∗MLE 1 − p∗MLE
che possiamo riscrivere come
n
! n
!
1X 1X
(1 − p∗MLE ) xi − p∗MLE 1− xi = 0,
n i=1 n i=1
ossia
p∗MLE = x̄.
Quindi lo stimatore di massima verosimiglianza è dato da
p̂MLE = X̄.
Provate a verificare (è molto semplice) che questo è uno stimatore corretto di p.
(c) In questo caso, Y ∼ B (n, p), con n = 400 e p = 0.2. Notiamo anzitutto che E (Y ) = 80. Vediamo
che Var (Y ) = np (1 − p) = 64 è alta: possiamo usare l’approssimazione ad una Gaussiana. Non
scordiamoci la correzione di continuità, perchè stiamo approssimando una v.a. discreta con una
continua.
P (Y > 250) ' P (Y > 250.5) .
Uso l’approssimazione Gaussiana, sapendo che approssimativamente Y si comporta come X ∼
N (np, np (1 − p)). Opto per una standardizzazione, in modo da usare Z = √X−np ∼ N (0, 1) .
np(1−p)
Di conseguenza, abbiamo che
P (Y > 250) ' P (Y > 250.5)

' P (X > 250.5)
!
X − np 250.5 − 80
=P p >
np (1 − p) 8
= P (Z > 23)
= 1 − P (Z ≤ 23) ∼ 0.
Esercizio 3. Possiamo immediatamente notare che le variabili aleatorie che compongono il campione
sono delle Gamma (α, λ) con parametro α = 3 noto e λ = 1/ϑ incognito.
(a) Usiamo i nostri studi sulla distribuzione Gamma, per stabilire che
E (X) = 3ϑ; Var (X) = 3ϑ2 .
(b) Dapprima, calcoliamo la funzione di verosimiglianza, tramite la densità congiunta del campione
in una sua realizzazione e usando la sua indipendenza e la sua identità in distribuzione,
n
Y 1 2 − 1 xi
` (ϑ|x1 , . . . , xn ) = x e ϑ
i=1
2ϑ3 i
n
1 Y 2 − 1 Pni=1 xi
= x e ϑ .
2n ϑ3n i=1 i
Di conseguenza, possiamo calcolare la log-verosimiglianza
L (ϑ|x1 , . . . , xn ) = log ` (ϑ|x1 , . . . , xn )

n n
Y 1X
= −n log 2 − 3n log ϑ + log x2i − xi .
i=1
ϑ i=1
La stima di massima verosimiglianza è data dalla seguente formula:
ϑ∗MLE = argminϑ∈(0,∞) L (ϑ|x1 , . . . , xn ) .
Nel nostro caso, calcoliamo la derivata della log-verosimiglianza rispetto a ϑ, la uguagliamo a 0 e

troviamo
Pn
3n xi
− ∗ + i=1 .
ϑMLE ϑ∗,2
MLE
Ne segue che
n
1 X
ϑ∗MLE = xi .
3n i=1
e, di conseguenza, lo stimatore di massima verosimiglianza di ϑ è dato da
1
ϑ̄MLE = X̄.
3
(c) La distorsione di uno stimatore ϑ̂ di ϑ è data dalla seguente formula:

bϑ ϑ̂ = E ϑ̂ − ϑ.
Nel nostro caso,

1 1
E ϑ̄MLE = X̄ = 3ϑ = ϑ.
3 3

Otteniamo quindi che bϑ ϑ̄MLE = 0 e, quindi, lo stimatore è corretto.
Esercizio 4. Nel nostro caso, ciascun elemento del campione aleatorio segue la densità:
1 (x−1)2
f x|σ 2 = √ e− 2σ2 .

2πσ 2
(a) Calcoliamo la funzione di verosimiglianza, tramite la densità congiunta del campione in una sua
realizzazione e usando la sua indipendenza e la sua identità in distribuzione,
n
1 (x −1)2
− i2σ2
2
Y
` σ |x1 , . . . , xn = √ e
i=1 2πσ 2
1 − 12
Pn 2
i=1 (xi −1) .
= n e 2σ
2
(2πσ ) 2
Di conseguenza, possiamo calcolare la log-verosimiglianza
L σ 2 |x1 , . . . , xn = log ` σ 2 |x1 , . . . , xn

n
n n 1 X
=− log 2π − log σ 2 − 2 (xi − 1)2 .
2 2 2σ i=1
La stima di massima verosimiglianza è data dalla seguente formula:

∗
σ 2 MLE = argminσ2 ∈(0,∞) L σ 2 |x1 , . . . , xn .

Nel nostro caso, calcoliamo la derivata della log-verosimiglianza rispetto a σ 2 , la uguagliamo a 0

e troviamo
Pn
n (xi − 1)2
− 2∗ + i=1 ∗,2 .
2σ MLE 2σ 2 MLE
Ne segue che
n
∗ 1X
σ 2 MLE = (xi − 1)2 .
n i=1
e, di conseguenza, lo stimatore di massima verosimiglianza di ϑ è dato da
n
1X
σ¯2 MLE = (Xi − 1)2 .
n i=1
(b) Uno stimatore ϑ̂ di un parametro ϑ è asintoticamente corretto se

lim E ϑ̂ = ϑ.
n→∞
Nel nostro caso, abbiamo che

" n #
1
E σ¯2 MLE
X 2
= E (Xi − 1)
n i=1
" n #
1 X
2

= E Xi − 2Xi + 1
n i=1
1
n σ 2 + 1 − 2n + n

=
n
1
n σ 2 + 1 − 2n + n = σ 2

=
n
Lo stimatore è corretto e, quindi, anche asintoticamente corretto.
NOTA: ci ricordiamo che nel caso in cui la media µ è ignota lo stimatore della varianza non è
corretto, ma solo asintoticamente corretto! Come mai?

(c) Data una statistica ordinata X(1) , . . . , X(n) , il campo di variazione campionario è dato da R X(1) , . . . , X(n) =
X(n) − X(1) , mentre la mediana campionaria è data da

X(n+1/2) se n è dispari
med X(1) , . . . , X(n) = 1

2 X(n/2) + X(n/2)+1 se n è pari

Nel nostro caso R x(1) , . . . , x(n) = x(2) − x(1) = 0.23 e med x(1) , . . . , x(n) = x(4) = 0.99.

Foglio 9

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Foglio 9

Caricato da

Copyright:

Formati disponibili

Probabilità e Statistica – Foglio 9

Prof. Claudio Durastanti

(a) Calcolare σˆ2 MLE , lo stimatore di massima verosimiglianza di σ 2 .

Nel nostro caso, con α = 0.05, otteniamo per n = 25

mentre per n = 400, troviamo

(a) Come abbiamo già visto a lezione,

La log-verosimiglianza è quindi data da

p∗MLE = argminp∈(0,1) L (p|x1 , . . . , xn ) .

Nel nostro caso, calcoliamo la derivata della log-verosimiglianza rispetto a p, la uguagliamo a 0 e

P (Y > 250) ' P (Y > 250.5)

E (X) = 3ϑ; Var (X) = 3ϑ2 .

Di conseguenza, possiamo calcolare la log-verosimiglianza

L (ϑ|x1 , . . . , xn ) = log ` (ϑ|x1 , . . . , xn )

ϑ∗MLE = argminϑ∈(0,∞) L (ϑ|x1 , . . . , xn ) .

Nel nostro caso, calcoliamo la derivata della log-verosimiglianza rispetto a ϑ, la uguagliamo a 0 e

(c) La distorsione di uno stimatore ϑ̂ di ϑ è data dalla seguente formula:

Nel nostro caso,

L σ 2 |x1 , . . . , xn = log ` σ 2 |x1 , . . . , xn

La stima di massima verosimiglianza è data dalla seguente formula:

Nel nostro caso, calcoliamo la derivata della log-verosimiglianza rispetto a σ 2 , la uguagliamo a 0

(b) Uno stimatore ϑ̂ di un parametro ϑ è asintoticamente corretto se

Nel nostro caso, abbiamo che

Potrebbero piacerti anche