Sei sulla pagina 1di 3

Statistica I Prova scritta 161AA, a.a.

21/22

Prova scritta (Appello 29.06.2022)


Tempo a disposizione: 120 minuti
La soluzione di ogni esercizio deve essere scritta in maniera pulita e leggibile sugli appositi fogli contrassegnati
forniti a inizio prova, spiegando dettagliatamente il ragionamento con argomenti matematicamente validi. I
risultati numerici devono essere dati con 4 cifre significative. Punti potranno essere sottratti per inadempienza
a questi criteri. Esercizi consegnati su fogli esterni non saranno ritenuti validi. Sono benvenute le frasi che
forniscono una spiegazione euristica della strategia che si intende seguire, ma non sono sufficienti, ci si aspetta
calcoli espliciti. È permesso l’uso di calcolatrici non programmabili, formulari e appunti cartacei, ma non di
soluzioni di esercizi svolti in classe, né di dispositivi elettronici.
1. Consideriamo un esperimento con tre scatole, la prima contenente 30 biglie rosse e 20 biglie blu, la
seconda contenente 40 biglie blu e 10 biglie rosse e una terza contenente 20 biglie rosse. Scegliamo una
scatola a caso, peschiamo una biglia e ne guardiamo il colore.
(a) Si definisca un insieme degli esiti adatto a descrivere il risultato di questo esperimento. Definire
la distribuzione di probabilità su questi esiti. Questa distribuzione è uniforme?
Possiamo definire l’insieme degli esiti Ω = {(1, b), (1, r), (2, b), (2, r), (3, b), (3, r)}, indicando il nu-
mero della scatola e il colore del pescaggio da quella scatola. La distribuzione non è uniforme,
siccome palline rosse e blu dalla scatola 1, ad esempio, non hanno la stessa probabilità di essere
pescate.
(b) Un amico esegue l’esperimento e sappiamo che ha pescato una biglia rossa. Quale è la probabilità
che l’abbia pescata dalla prima scatola?
Con Bayes P (1|r) = P (r|1)P (1)/P (r). Coninciamo a valutare P (r) = P (r|1)P (1) + P (r|2)P (2) +
P (r|3)P (3) = 31 ( 30 10 20
50 + 50 + 20 ). Inserendo il risultato nella formula sopra si ottiene la probabilità
desiderata.
(c) Assumiamo invece che dopo aver scelto una scatola si pescano 3 biglie (sempre dalla stessa scatola)
senza reinserimento. Calcolare la probabilità di pescare la sequenza “rossa,blu,rossa”.
Calcoliamo P (rbr) = P (rbr|1)P (1) + P (rbr|2)P (2) + P (rbr|3)P (3) = 13 ( 30 20 30 10 40 10
50 50 50 + 50 50 50 + 1 · 0 · 1)
(d) Ora mischiamo tutte le biglie in un’unica scatola e cominciamo a pescare con reinserimento. Sia
N numero di estrazioni necessarie a pescare la prima biglia rossa dopo aver pescato la prima biglia
blu1 . Calcolare E(N ).
Vediamo che N = N1 + N2 dove N1 rappresenta il numero di estrazioni necessarie a pescare la
prima biglia rossa e N2 quelle per la prima biglia blu. Queste variabili aleatorie hanno distribuzione
geometrica con rispettivi parametri p1 = P (r) e p2 = P (b). Quindi E(N1 +N2 ) = E(N1 )+E(N2 ) =
1 1
p1 + p2

2. Un dado a sei facce è truccato in modo da aumentare la probabilità di dare 1 o 5. Sia Xi la variabile
aleatoria che rappresenta il risultato dell’i-esimo lancio di tale dado. La distribuzione di Xi , per ogni
i, è data da
x 1 2 3 4 5 6

P(Xi = x) 1/3 1/12 1/12 1/12 1/3 1/12

Assumiamo che il dado è lanciato n volte e sia X̄n la media del risultato degli n lanci (Cioè, dopo aver
lanciato il dado n volte, X̄n è il numero ottenuto sommando il risultato di tutti i lanci e dividendo per
n).
(a) Il dado viene lanciato 6 volte. Calcolare la probabilità di ottenere almeno 5 volte un valore in {1, 5}
P ({1, 5}) = 2/3 quindi
P (almeno 5 volte {1, 5}) = P (esattamente 6 volte {1, 5}) + P (esattamente 5 volte {1, 5})
 
2 6 6 2 5 1
=( ) + ( ) ( )
3 5 3 3
1 per esempio, per la sequenza “rossa,blu,blu,rossa” abbiamo N = 4, mentre per “blu,blu,blu,blu,rossa” abbiamo N = 5.

1
Statistica I Prova scritta 161AA, a.a. 21/22

(b) Si calcoli E(X1 ), SD(X1 ), E(X̄n ) e SD(X̄n ). (Le risposte possono dipendere da n)

ˆ E(X) = 1/3 ∗ (1 + 5) + 1/12(2 + 3 + 4 + 6) = 7/2 = 3.25


ˆ E(X 2 ) = 1/3 ∗ (12 + 52 ) + 1/12(22 + 32 + 42 + 62 ) = 14.083 So V ar(X) = 14.083 − 3.252 = 3.52.
SD = 1.876
ˆ E(X̄n ) = 3.25
r
1.876
ˆ SD(X̄n ) =
n
(c) Si assuma ora che n = 100. Calcolare approssimativamente il valore di P(X̄n ∈ (3.1, 3.5)).
Teorema del limite centrale:

P(X̄n ∈ (3.1, 3.5)) = P(X̄n < 3.5) − P(X̄n < 3.1)


= P((X̄100 − E(X))/(SD(X̄100 )) < 0.25/(SD(X̄100 ))
− P((X̄100 − E(X))/(SD(X̄100 )) < −0.15/(SD(X̄100 ))
≈ Φ(0.25/(SD(X̄100 )) − Φ(−0.15/(SD(X̄100 ))

Calcolando la deviazione standard e leggendo il valore di Φ corrispondente dalla tabella della


distribuzione normale standard.
3. Consideriamo l’integrale
Z ∞
(x−4)2 cos(x)
e− 8 √ dx
−∞ π log(x4 + 2 + sin(x))

(a) Discutere brevemente il metodo di integrazione di Monte Carlo e come può essere applicato per
l’approssimazione di questo integrale.
(b) Scrivere i comandi in R la cui esecuzione restituisce, per il metodo discusso sopra, un valore
approssimativo di questo integrale.
x < −rnorm(10000,
p mean = 4, sd = p
2)
cos(x)/ (pi)/log(x4̂ + 2 + sin(x)) ∗ (2 ∗ pi ∗ 4)
Nota: potrebbero essere utili i comandi sin(·) (il seno), log(·) (il logaritmo naturale) e sqrt(·)
(la radice quadrata).

4. Una ditta vuole confrontare la performance di due dei suoi call center situati in due città diverse (Milano
e Roma) sulla base del numero di tickets risolti in un giorno. I dati ottenuti dalla ditta per i due call
center sull’arco di una settimana lavorativa sono i seguenti.

Milano : 745 754 766 751 742 756


Roma : 756 765 774 780 778 768

Si assuma che in entrambi i casi la distribuzione del numero di ticket risolti in un giorno sia normale
(Milano N (µ1 , σ12 ), Roma N (µ2 , σ22 )).
(a) Assumiamo che σ1 sia sconosciuta. Si calcoli l’intervallo di confidenza bilaterale al 99% per lo
stimatore di µ1 dato dalla media empirica.
(b) Si definiscano l’ipotesi nulla H0 e l’ipotesi alternativa H1 per il test che ha come obbiettivo quello
di dimostrare che il call center di Roma ha una performance migliore di quello di Milano.

H0 : µ1 ≥ µ2 H1 : µ1 < µ2

2
Statistica I Prova scritta 161AA, a.a. 21/22

(c) Assumiamo ora di conoscere σ1 = 20, σ2 = 25. Si testi l’ipotesi nulla formulata al punto precen-
dente al livello di significatività del 5%. Che tipo di conclusione ci permette di trarre il risultato
del test?
Si tratta di un test con statistica t (siccome la varianza non è nota) con due campioni.
(d) Calcolare il valore p per il test disucsso al punto b).
5. Definiamo la funzione di densità

fX (x|θ) = cθ x4 e−x/θ 1(0,∞) (x)

dove cθ > 0 e 1(0,∞) (x) rappresenta la funzione indicatrice sull’insieme (0, ∞).
(a) Per
R ogni θ > 0, calcolare il valore di 5cθ perché fX sia una densità di probabilità.
0
∞fX (x|θ)dx = 1 ⇒ cθ = 1/(24 · θ )
(b) Determinare lo stimatore di massima verosimiglianza θ̂ di θ per un campione {x1 , . . . , xn } con
densità fX (x|θ).
Scriviamo la funzione di verosimiglianza
Y 1 5 n Y 4 − Pi xi /θ 1 Y P
L({xi }|θ) = fX (xi |θ) = ( θ ) ( xi )e = ( )n ( x4i )e−5n log θ− i xi /θ
i
24 i
24 i

Deriviamo l’esponente (siccome il resto non dipende da θ) e uguagliamo a 0. Nota che questo
puo essere fatto solo in assenza di discontinuita della funzione di verosimiglianza (al contrario per
esepio del caso in cui c’è una funzione indicatrice che dipende da θ).
Derivando otteniamo
1 1 X 1 X
−5n + 2 xi = 0 quindi θ̂ = xi
θ θ i 5n i

(c) Discutere la correttezza e la consistenza dello stimatore trovato al punto precedente.


Correttezza: Z
1
E(Xi ) = x · x4 e−x/θ = 5θ
24θ5
quindi
11X
E(θ̂) = E(Xi ) = θ
5n i
lo stimatore è corretto.
Per la consistenza
1 X 1 1X
P(|θ̂ − θ| > ϵ) = P(| Xi − E(Xi )| > ϵ) = P(| Xi − E(Xi )| > 5ϵ) → 0
5n i 5 n i

per la legge dei grandi numeri

Formule utili:
Z ∞
Per ogni n ∈ N: xn e−x/θ dx = n! θn+1
0

Potrebbero piacerti anche