Sei sulla pagina 1di 5

Statistica e Calcolo delle Probabilità 06/02/2017

Giustificare adeguatamente tutte le risposte.


Esercizio 1. Teoria. Enunciare e dimostrare la fomula di Bayes (si può dare per nota la formula delle
probabilità totali, ma se viene usata va enunciata correttamente).
Esercizio 2. Teoria. Sia X1 , . . . , Xn un campione aleatorio estratto da una popolazione con varianza
σ 2 . Dare la definizione di varianza campionaria e dimostrare che essa è uno stimatore non distorto
della varianza della popolazione.
Se in aggiunta il campione è gaussiano, fornire una quantità pivotale a partire dalla varianza
campionaria, specificandone la distribuzione.
Esercizio 3. Teoria. Sia X1 , . . . , Xn un campione aleatorio di dimensione n estratto da una popola-
zione con distribuzione di probabilità nota a meno di un parametro incognito θ. Dare la definizione
di regione critica di un test di livello α per verificare un’ipotesi su θ H0 contro l’alternativa H1 .
Sia ora (X1 , . . . , X36 ) un campione estratto da una popolazione gaussiana di media µ incognita e
varianza σ 2 = 81. Consideriamo il problema di verifica d’ipotesi

H0 : µ = 5 contro H1 : µ < 5.

Verificare direttamente che il test di regione critica


 
x1 + · · · + x36
C = (x1 , . . . , x36 ) t.c. ≤ 2.06
36

ha effettivamente livello α = 0.025 per il problema di verifica d’ipotesi.


Esercizio 4. Sia X il tempo di attesa, in settimane, per la somministrazione di un vaccino, a partire
dall’istante in cui la prenotazione al numero telefonico verde viene registrata. Si sa che X è una
variabile aleatoria con funzione di ripartizione
( √
1 − e−α t per t ≥ 0,
FX (t) =
0 per t < 0,

dove α è un parametro positivo.

1. Trovare la densità di probabilità e la funzione di rischio di X; riconoscerene la distribuzione.

2. Determinare il parametro α affinché il valore atteso di X sia pari a 12.5 settimane. Con tale
valore di α, ricavare anche la varianza di X. (Suggerimento: Γ(n) = (n − 1)!, n = 1, 2, 3, . . .)

Si supponga che il numero di prenotazioni effettuate in un giorno sia pari a 200; inoltre, si assuma
che i tempi di attesa di quelle persone siano un campione aleatorio dalla distribuzione individuata da
FX , con α ricavato al punto 2.

3. Si consideri il tempo di attesa medio campionario, cioè la media campionaria dei 200 tempi
d’attesa; con un’opportuna approssimazione, calcolare la probabilità che tale tempo d’attesa
medio sia maggiore di 10 settimane.

1
Esercizio 5. Un produttore afferma che la durata media di funzionamento (in mesi) di un certo
componente elettronico da lui fabbricato è 2 e che la distribuzione è di tipo esponenziale. Un ispettore
preleva a caso 100 componenti da un lotto numeroso e ne misura la durata X di funzionamento,
ottenendo la seguente distribuzione empirica:

classe (i) 1 2 3 4 5
durata X<1 1≤X<2 2≤X<3 3≤X<4 X≥4
n◦ di componenti (ni ) 35 19 18 11 17

1. Trovare la stima della probabilità p = P (X ≥ 2) utilizzando uno stimatore non distorto.

2. Calcolare le probabilità p01 = P (X < 1), p02 = P (1 ≤ X < 2), p03 = P (2 ≤ X < 3),
p04 = P (3 ≤ X < 4), p05 = P (X ≥ 4) nell’ipotesi che il produttore abbia ragione.

3. Utilizzando il Test del chi-quadrato, dire se i dati raccolti dall’ispettore consentono di respingere
l’affermazione del produttore al livello di significatività del 5%. Specificare le ipotesi nulla e
alternativa e la regione critica.

Esercizio 6. Le scuole superiori vengono classificate sulla base dei voti riportati da ogni studente al
primo anno di università, per tutti quegli studenti che l’anno precedente frequentavano quella scuola.
In particolare, la scuola ZZZ, per farsi pubblicità, vorrebbe scrivere sul suo sito che il punteggio medio
riportato dai suoi ex-studenti, è maggiore della media nazionale. A tal fine, si estrae un campione di
numerosità n = 10 dal gruppo di ex-studenti della scuola ZZZ ; sia Xi il voto dello i-esimo studente
nel campione, con i = 1, . . . , n (tale voto viene determinato come indice riassuntivo del logaritmo dei
voti riportati, in una opportuna scala). Si può assumere che le Xi siano v.a. indipendenti, con stessa
distribuzione gaussiana, con media µ e varianza σ 2 .
Il campione osservato risulta: (4.35, 5.02, 5.57, 4.16, 5.51, 5.34, 5.40, 6.43, 4.09, 6.58).

1. Se la varianza della distribuzione è nota, ed è pari a 1, al livello di significatività del 5%, c’è
evidenza sperimentale perché la scuola possa scrivere sul sito che il punteggio medio dei suoi
studenti è maggiore della media nazionale pari a 4.6? Impostare un opportuno test, specificando
ipotesi nulla, ipotesi alternativa, statistica-test e regione critica. Con i dati a disposizione cosa
si può concludere?

2. Calcolare la probabilità di errore di seconda specie quando il vero valore di µ è pari a 5.

3. Come si modifica il test al punto 1 se la varianza è incognita? Scrivere ipotesi nulla e alternativa,
regione di rifiuto e le conclusioni del test.

Esercizio 7. Un prodotto semilavorato, prima di essere immesso nel ciclo produttivo, viene sottoposto
a tre test di qualità indipendenti e viene scartato se trovato difettoso anche da uno solo dei test.

1. Il test A ha probabilità pA = 0.95 di rilevare la difettosità di un pezzo difettoso, il test B


probabilità pB = 0.92 ed il test C probabilità pC = 0.90. Se un pezzo difettoso viene passato ai
3 test, qual è la probabilità di immetterlo nel ciclo produttivo?

2. Il test A ha anche una probabilità qA = 0.01 di identificare il pezzo come difettoso, quando non
lo è; il test B probabilità qB = 0.02 ed il test C probabilità qC = 0.05. Qual è la probabilità che
un pezzo buono venga scartato?

3. Se il 99% dei pezzi è buono, qual è la probabilità di corretta diagnosi? Suggerimento: si fa una
diagnosi corretta se si pesca un pezzo buono e, in base ai test, lo si accetta oppure se si pesca un
pezzo difettoso e lo si scarta sempre in base ai test.

2
SOLUZIONI 06/02/2017
Esercizio 1. Dispense [ELP] Proposizione 1.5.13 p. 19 ed Esercizio 1.5.16 p. 20.
Esercizio 2. [ROSS] Definizione 6.4.1, pp. 230-231, Eq.(6.5.3), Teorema 6.5.1
Lucidi [LAD1] pp. 30–32, 34; [LAD2] p. 34; [LAD3] pp. 10, 27.
Esercizio 3. Dato il campione casuale X ~ = (X1 , . . . , Xn ), un test di livello di significatività α, per
la verifica dell’ipotesi nulla H0 : θ ∈ Θ0 contro l’ipotesi alternativa H1 : θ ∈ Θ1 , è definito dalla sua
regione critica o regione di rifiuto C ⊂ Rn , che è tale che
~ ∈ C ≤ α,

Pθ X ∀θ ∈ Θ0 .

X−5
Nell’esempio concreto, sia X la media campionaria e Z = √ ;
σ/ 36
allora
 
 
~ ∈ C = Pµ=5
 2.06 − 5
Pµ=5 X X ≤ 2.06 = Pµ=5 Z ≤ = Φ(−5.88/3) = 1 − Φ(1.96) ' 0.025.
9/6

Esercizio 4.

1. Si ricava immediatamente
d α √
fX (t) = FX (t) = t1/2−1 e−α t 1(0,+∞) (t),
dt 2
che è la densità di Weibull di parametri (α, β = 12 ). Poi, per t > 0, la funzione di rischio è data
da
fX (t) α
λX (t) = = √ .
1 − FX (t) 2 t
2. Nel formulario troviamo le espressioni di media e varianza delle Weibull. Si ha dunque

Γ(1 + β1 )
r
Γ(3) 2 2 1
12.5 = E(X) = 1/β
= 2 = 2 , e quindi α = = = 0.4 .
α α α 12.5 2.5
Analogamente per la varianza otteniamo

Γ(1 + β2 ) − (Γ(1 + β1 ))2 Γ(5) − (Γ(3))2 4! − 4 20


Var(X) = = 4
= 4
= = 781.25 .
α2/β α 0.4 0.0256

3. Sia Xi , i = 1, 2, . . . , n, con n = 200, la v.a. che rappresenta il tempo di attesa della i-esima
prenotazione. Sappiamo, inoltre, che (X1 , . . . , Xn ) è un campione aleatorio dalla distribuzione
di
PnWeibull di parametri (α = 0.4, β = 0.5). Per il TCL, visto che n è grande, si ha che
i=1 Xi ∼ N (12.5n, 781.25n) Papprossimativamente. Si tratta di calcolare la probabilità che la
n
media campionaria X̄200 = ( i=1 Xi )/n sia maggiore di 10 settimane:
n Pn !
X 
i=1 Xi − nE(X1 ) 2000 − 2500
P (X̄200 > 10) = 1 − P Xi ≤ 2000 = 1 − P p ≤√
i=1
n Var(X1 ) 200 × 781.25
r !
200
' 1 − Φ −2.5 ' 1 − Φ(−1.264911) ' Φ(1.265) ' 0.8971.
781.25

3
Esercizio 5.

1. Siamo nel caso bernoulliano in cui il successo è identificato con l’evento {X ≥ 2} e la probabilità
di successo incognita è p. In questo caso uno stimatore non distorto (che è anche MLE e stimatore
dei momenti) è il numero dei successi sul numero di prove p̂ = n3 +nn4 +n5 , che nel nostro caso
fornisce la stima 0.46 per p.

2. Se il produttore ha ragione la funzione di ripartizione è data da


(
0 se x < 0
FX (x) = −x/2
1−e se x ≥ 0

Pertanto
p01 = P (X < 1) = 1 − e−1/2 ' 0.3935,
p02 = P (1 ≤ X < 2) = e−1/2 − e−1 ' 0.2387,
p03 = P (2 ≤ X < 3) = e−1 − e−3/2 ' 0.1447,
p04 = P (3 ≤ X < 4) = e−3/2 − e−2 ' 0.0878,
p05 = P (X ≥ 4) = e−2 ' 0.1353.

3. L’ipotesi nulla è che la distribuzione sia un’esponenziale di parametro 0.5, cioè che le probabilità
per le varie classi siano quelle calcolate sopra: H0 : pi = p0i per i = 1, . . . , 5. L’ipotesi alternativa
è che almeno una delle probabilità sia diversa: H1 : pi 6= p0i per almeno un valore di i. Dunque,
sotto l’ipotesi nulla, la statistica

5
X (ni − 100pi )2
U=
100pi
i=1

segue (asintoticamente) una legge χ2 (4). Il test può essere applicato perché si ha n = 100 e
np0i ≥ np04 = 8.78 > 5. La regione critica di livello α = 0.05 del test è

U > χ20.05,4 ' 9.488

Con i dati assegnati si trova u ' 3.787; quindi al 5% di significatività non si può rifiutare l’af-
fermazione del produttore che la durata media di un componente sia di 2 mesi con distribuzione
esponenziale. Si può verificare che il p-value del test vale 0.4365.

Esercizio 6. Abbiamo a disposizione una realizzazione del campione aleatorio (X1 , . . . , X10 ) da
una distribuzione N (µ, σ 2 ). La media campionaria risulta x̄10 = 5.245 e la varianza campionaria
s210 ' 0.7509 ' (0.8666)2 .

1. In questo caso, la varianza è nota e vale σ02 = 1. Si tratta di verificare le ipotesi

H0 : µ ≤ µ0 = 4.6 vs H1 : µ > µ0 = 4.6

e la statistica test è
X n − µ0 √ H 0
n ∼ N (0, 1)
σ0
Pertanto, la regione di rifiuto di un test di livello 5% è:
( √ )
(x̄10 − 4.6) 10
R = (x1 , . . . , x10 ) : ≥ z0.05 .
1

Il valore osservato della statistica è z0 := (x̄10 − 4.6) 10 ' 2.0397; essendo z0.05 ' 1.645, si
rifiuto l’ipotesi nulla al 5%, e quindi si accetta l’ipotesi H1 .

4
2. Si tratta di calcolare la probabilità dell’errore di seconda specie per µ1 = 5, cioè la probabilità
di accettare H0 quando H1 è vera (e µ = µ1 = 5). Pertanto


 
z0.05
Pµ1 (accetto H0 ) = Pµ1 ((X̄n − µ0 ) n < z0.05 ) = Pµ1 X̄10 < √ + µ0
10
 √   √ 
= Φ z0.05 + (µ0 − µ1 ) 10 = Φ 1.645 − 0.4 × 10 ' Φ(0.3801) ' 0.6481.

3. Nel caso in cui la varianza sia incognita, allora le ipotesi da verificare rimangono inalterate,

H0 : µ ≤ 4.6 vs H1 : µ > 4.6

ma la statistica test è
X n − µ0 √ H0
p n ∼ tn−1
s2n
Pertanto, la regione di rifiuto di un test di livello 5% è:
( √ )
(x̄10 − 4.6) 10
R = (x1 , . . . , x10 ) : ≥ t0.05,9 .
sn

10 −4.6
Il valore osservato della statistica è t0 := x̄0.8666 10 = 2.3536; essendo t0.05,9 = 1.8331, si
continua a rifiutare l’ipotesi nulla al 5%, e quindi si accetta l’ipotesi H1 .

Esercizio 7.

1. Per venire immesso nel ciclo produttivo, il pezzo difettoso deve passare i tre test e per l’in-
dipendenza la probabiltà è il prodotto P (immesso|difettoso) = (1 − pA )(1 − pB )(1 − pC ) =
0.05 × 0.08 × 0.1 = 0.0004.

2. Si sta chiedendo P (scartato|buono) e ragionando come prima si ha P (scartato|buono) = 1 −


P (immesso|buono) = 1−(1−qA )(1−qB )(1−qC ) = 1−0.99×0.98×0.95 = 1−0.921690 = 0.07831.

3. Dobbiamo valutare la probabilità dell’evento {buono ∩ immesso} oppure {difettoso ∩ scartato},


che è l’unione di due eventi incompatibili; dunque, la probabilità di corretta diagnosi è

P (immesso|buono)P (buono) + P (scartato|difettoso)P (difettoso)


= 0.92169 × 0.99 + (1 − 0.0004) × (1 − 0.99) = 0.9124731 + 0.009996 = 0.9224691.