Sei sulla pagina 1di 3

Statistica I Prova scritta 161AA, a.a.

21/22

Prova scritta
Appello 08.06.2022
Tempo a disposizione: 120 minuti
La soluzione di ogni esercizio deve essere scritta in maniera pulita e leggibile sugli appositi fogli contrassegnati
forniti a inizio prova, spiegando dettagliatamente il ragionamento con argomenti matematicamente validi. I
risultati numerici devono essere dati con 4 cifre significative. Punti potranno essere sottratti per inadempienza
a questi criteri. Esercizi consegnati su fogli esterni non saranno ritenuti validi. Sono benvenute le frasi che
forniscono una spiegazione euristica della strategia che si intende seguire, ma non sono sufficienti, ci si aspetta
calcoli espliciti. È permesso l’uso di calcolatrici non programmabili, e di un foglio formato A4 (scritto
fronte-retro, anche al computer) contenente appunti/formule desiderati e tavole necessarie.
1. Si considerino tre variabili aleatorie di Bernoulli X, Y, Z con rispettivi parametri pX = 1/3, pY = 1/5,
pZ = 2/3 Si assuma che
(a) Calcolare il valore atteso e la varianza di 2X + Y e di X · Z
E(2X + Y ) = 2E(X) + E(Y ) = 2 13 + 15
E(X · Y ) = E(X) · E(Z) = 13 · 23
V ar(2X + Y ) = 4V ar(X) + V ar(Y ) = 4 13 23 + 23 31
V ar(X · Z) = E(X 2 Z 2 ) − E(XZ)2 = E(X 2 )E(Z 2 ) − E(X)2 E(Z)2
(b) Calcolare la probabilità che X = 0 se X + Y = 1
P(X = 0|X + Y = 1) = P(X = 0, X + Y = 1)/P(X + Y = 1) = P(X = 0, Y = 1)/(P(X = 0, Y =
1) + P(X = 1, Y = 0)) = 32 15 /( 23 15 + 13 45 )
(c) Calcolare la funzione di massa congiunta di X + Y e X · Z. Verificare se queste variabili aleatorie
sono indipendenti.
Troviamo l’insieme delle immagini range(X + Y ) = {0, 1, 2}, range(X · Z) = {0, 1}. Quindi la
funzione di massa congiunta si puo scrivere su una tabella di due colonne e tre righe. Notiamo che
l’elemento (X + Y, X · Z) = (0, 1) ha probabilita 0, che è diversa da P(X + Y = 0)P(X · Z = 1)
quindi le variabili aleatorie (X + Y, X · Z) non sono indipendenti.
2. Un produttore di pneumatici dice che i suoi prodotti durano almeno il 20% in più della media dei
pneumatici in commercio, che è di 50000 (cinquantamila) km. Per verificare questa ipotesi compriamo
10 dei suoi pneumatici e li usiamo finché si consumano. Otteniamo i seguenti risultati (in km)

60900 61500 64400 59500 59580 64265 63400 58500 58000 60200

Si assuma che la distribuzione della durata dei pneumatici del produttore sia normale, con media µ e
varianza σ 2 sconosciute.
(a) Si calcoli l’intervallo di confidenza bilaterale al 95% per µ.

Calcoliamo la media empirica e la deviazione standard campionaria X̄10 = 61024, σ10 = 732.26.
Siccome la varianza non è data, la distribuzione di referenza è la distribuzione t, con ν = n − 1 = 9
gradi di liberta. Guardando la tabella osserviamo tb5%,9 = 2.262 e quindi l’intervallo è

61024 ± 2.262 · 732.26/ 10

(b) Si definiscano l’ipotesi nulla H0 e l’ipotesi alternativa H1 per il test che ha come obbiettivo quello
di confermare il messaggio del produttore.

H0 : µ ≤ 1.2µ0 = 60000 H1 : µ > 1.2µ0 = 60000

1
Statistica I Prova scritta 161AA, a.a. 21/22

(c) Si testi l’ipotesi nulla formulata al punto precedente al livello di significatività del 5%. Che
conclusione ci permette di trarre il risultato del test?

Calcoliamo la statistica
X̄10 − 1.2 · µ0
√ = 1.3977
σ10 / 10
e vediamo che è inferiore di tu5%,9 = 1.833, quindi il test non rigetta H0 . Questo significa che non
ci sono informazioni necessarie per confermare il messaggio del produttore.
(d) Si calcoli approssimativamente il valore p per il test disucsso ai punti b) e c).

La statistica
X̄10 − 1.2 · µ0
√ = 1.3977
σ10 / 10
corrisponde a tu10%,9 , quindi il valore p è del 10%.

3. Si consideri una serie di variabili aleatorie IID (indipendenti e identicamente distribuite) X1 , . . . , X100
con distribuzione uniforme nell’intervallo (continuo) [−1, 5] ⊂ R.
(a) Si calcoli la probabilità che non ci siano valori negativi tra X1 , . . . , X10 .
per indipendenza P(X1 > 0, . . . , X10 > 0) = P(Xi > 0)1 0 = ( 65 )10
(b) Si calcoli la probabilità dell’evento “non ci sono valori negativi tra X1 , . . . , X10 e che non ci sono
valori maggiori di 3 tra X6 , . . . , X13 ”.
per indipendenza P(X1 > 0, . . . , X10 > 0, X6 < 3, . . . , X13 < 3) = P(Xi > 0)5 P(Xi ∈ (0, 3))5 P(Xi <
3)3 = ( 65 )5 ( 36 )5 ( 46 )3
P100
(c) Si calcoli il valore atteso e la varianza di Y = i=1 Xi
P100
E( i=1 Xi ) = 100E(Xi ) = 200
P100 1
V ar( i=1 Xi ) = 100V ar(Xi ) = 100 · 12 (62 ) = 300
(d) Calcolare approssimativamente il valore di P(Y < 170).
−E(Y ) √
Per il teorema del limite centrale P(Y < 170) = P( YSD(Y ) <
170−E(Y )
SD(Y ) ) ≈ Φ((170 − 200)/(10 3) e
il risultato si trova sulla tabella
4. Sia (X1 , X2 , . . . , Xn ) un campione estratto da una popolazione di densità

fθ (x) = cθ 1[θ,1] (x),

dove θ ∈ (0, 1) è un parametro e 1[θ,1] (x) rappresenta la funzione indicatrice sull’insieme [θ, 1].
(a) Determinare il valore di cθ e di E(X1 ) per ogni θ ∈ [0, 1).
R∞ R1 1
1 = cθ −∞ 1[θ,1] (x)dx = cθ θ dx quindi cθ = 1−θ .
E(Xi ) = (1 + θ)/2
(b) Determinare uno stimatore θ̂n di massima verosimiglianza
Q per θ.
1 1
Q
si osserva che la funzione di verosimiglianza L(x|θ) = i 1−θ 1[θ,1] (xi ) = (1−θ)n i 1[0,xi ] (θ) =
1
(1−θ)n 1[0,mini xi ] (θ) è crescente in θ ∈ (0, mini xi ) e 0 altrove, quindi il massimo si trova in θ̂ =
mini xi
(c) Verificare se lo stimatore
( n
! )
1X
θ̃(X1 , . . . , Xn ) = max −1 + 2 Xi ,0
n i=1

è corretto per n = 1
Per n = 1 abbiamo θ̃(X1 , . . . , Xn ) = max {(−1 + 2X1 ) , 0} ma
Z ∞
E(max {(−1 + 2X1 ) , 0}) = max {(−1 + 2x) , 0} cθ 1[θ,1] (x)
−∞

2
Statistica I Prova scritta 161AA, a.a. 21/22

e quindi per esempio per θ = 1/3


Z 1
E(max {(−1 + 2X1 ) , 0}) = max {(−1 + 2x) , 0} cθ dx
1/3
Z 1
1 1 3 1
= (−1 + 2x) dx = 4 ̸= = θ
1/2 1 − 1/3 / 2 3

quindi non è corretto


(d) Verificare se θ̃(X1 , . . . , Xn ) definito al punto precedente è consistente.
Per ogni θ ∈ (0, 1) abbiamo, per ogni ϵ > 0
n
1X
0 = lim P(| Xi − E(Xi )| > ϵ)
n→∞ n i=1

dove E(Xi ) = (1 + θ)/2 e quindi


n n
1X 2X
0 = lim P(| Xi − (1 + θ)/2| > ϵ) = lim P(| − 1 + Xi − θ| > ϵ′ )
n→∞ n i=1 n→∞ n i=1

per ϵ′ = 2ϵ. Di conseguenza, per ϵ′ sufficientemente piccolo


( n
)
2X
0 = lim P(| max −1 + Xi , 0 − θ| > ϵ′ ) = lim P(|θ̃ − θ| > ϵ′ )
n→∞ n i=1 n→∞

e lo stimatore è consistente

5. Consideriamo l’integrale

log(7 + ex )
Z
x2 −3
e− 2 √ dx
−∞ 2π(2 + sin(x))

(a) Discutere brevemente il metodo di integrazione di Monte Carlo e come può essere applicato per
l’approssimazione di questo integrale.
Per la discussione del metodo di MonteCarlo si vedano le note del corso. In questo caso si puo ap-
2
plicare il metodo di monte carlo scegliendo fX (x) = √12π e−x /2 (la distribuzione normale standard)
3 x
log(7+e )
e g(x) = e 2 √2π(2+sin(x))
(b) Scrivere i comandi in R la cui esecuzione restituisce, per il metodo discusso sopra, un valore
approssimativo di questo integrale.
Nota: potrebbero essere utili i comandi sin(·) (il seno), log(·) (il logaritmo naturale) e exp(·)
(la funzione esponenziale).
I comandi sono:
x < − rnorm(10000, mean=0, sd=1)
mean(exp(3/2)*log(7 + exp(x))/(2+sin(x)))

Potrebbero piacerti anche