Tema Esame Probabilità

Statistica e Calcolo delle Probabilità 06/02/2017
Giustificare adeguatamente tutte le risposte.

Esercizio 1. Teoria. Enunciare e dimostrare la fomula di Bayes (si può dare per nota la formula delle
probabilità totali, ma se viene usata va enunciata correttamente).
Esercizio 2. Teoria. Sia X1 , . . . , Xn un campione aleatorio estratto da una popolazione con varianza
σ 2 . Dare la definizione di varianza campionaria e dimostrare che essa è uno stimatore non distorto
della varianza della popolazione.
Se in aggiunta il campione è gaussiano, fornire una quantità pivotale a partire dalla varianza
campionaria, specificandone la distribuzione.
Esercizio 3. Teoria. Sia X1 , . . . , Xn un campione aleatorio di dimensione n estratto da una popola-
zione con distribuzione di probabilità nota a meno di un parametro incognito θ. Dare la definizione
di regione critica di un test di livello α per verificare un’ipotesi su θ H0 contro l’alternativa H1 .
Sia ora (X1 , . . . , X36 ) un campione estratto da una popolazione gaussiana di media µ incognita e
varianza σ 2 = 81. Consideriamo il problema di verifica d’ipotesi
H0 : µ = 5 contro H1 : µ < 5.
Verificare direttamente che il test di regione critica

x1 + · · · + x36
C = (x1 , . . . , x36 ) t.c. ≤ 2.06
36
ha effettivamente livello α = 0.025 per il problema di verifica d’ipotesi.

Esercizio 4. Sia X il tempo di attesa, in settimane, per la somministrazione di un vaccino, a partire
dall’istante in cui la prenotazione al numero telefonico verde viene registrata. Si sa che X è una
variabile aleatoria con funzione di ripartizione
( √
1 − e−α t per t ≥ 0,
FX (t) =
0 per t < 0,
dove α è un parametro positivo.
1. Trovare la densità di probabilità e la funzione di rischio di X; riconoscerene la distribuzione.
2. Determinare il parametro α affinché il valore atteso di X sia pari a 12.5 settimane. Con tale
valore di α, ricavare anche la varianza di X. (Suggerimento: Γ(n) = (n − 1)!, n = 1, 2, 3, . . .)
Si supponga che il numero di prenotazioni effettuate in un giorno sia pari a 200; inoltre, si assuma
che i tempi di attesa di quelle persone siano un campione aleatorio dalla distribuzione individuata da
FX , con α ricavato al punto 2.
3. Si consideri il tempo di attesa medio campionario, cioè la media campionaria dei 200 tempi
d’attesa; con un’opportuna approssimazione, calcolare la probabilità che tale tempo d’attesa
medio sia maggiore di 10 settimane.
1
Esercizio 5. Un produttore afferma che la durata media di funzionamento (in mesi) di un certo
componente elettronico da lui fabbricato è 2 e che la distribuzione è di tipo esponenziale. Un ispettore
preleva a caso 100 componenti da un lotto numeroso e ne misura la durata X di funzionamento,
ottenendo la seguente distribuzione empirica:
classe (i) 1 2 3 4 5
durata X<1 1≤X<2 2≤X<3 3≤X<4 X≥4
n◦ di componenti (ni ) 35 19 18 11 17
1. Trovare la stima della probabilità p = P (X ≥ 2) utilizzando uno stimatore non distorto.
2. Calcolare le probabilità p01 = P (X < 1), p02 = P (1 ≤ X < 2), p03 = P (2 ≤ X < 3),
p04 = P (3 ≤ X < 4), p05 = P (X ≥ 4) nell’ipotesi che il produttore abbia ragione.
3. Utilizzando il Test del chi-quadrato, dire se i dati raccolti dall’ispettore consentono di respingere
l’affermazione del produttore al livello di significatività del 5%. Specificare le ipotesi nulla e
alternativa e la regione critica.
Esercizio 6. Le scuole superiori vengono classificate sulla base dei voti riportati da ogni studente al
primo anno di università, per tutti quegli studenti che l’anno precedente frequentavano quella scuola.
In particolare, la scuola ZZZ, per farsi pubblicità, vorrebbe scrivere sul suo sito che il punteggio medio
riportato dai suoi ex-studenti, è maggiore della media nazionale. A tal fine, si estrae un campione di
numerosità n = 10 dal gruppo di ex-studenti della scuola ZZZ ; sia Xi il voto dello i-esimo studente
nel campione, con i = 1, . . . , n (tale voto viene determinato come indice riassuntivo del logaritmo dei
voti riportati, in una opportuna scala). Si può assumere che le Xi siano v.a. indipendenti, con stessa
distribuzione gaussiana, con media µ e varianza σ 2 .
Il campione osservato risulta: (4.35, 5.02, 5.57, 4.16, 5.51, 5.34, 5.40, 6.43, 4.09, 6.58).
1. Se la varianza della distribuzione è nota, ed è pari a 1, al livello di significatività del 5%, c’è
evidenza sperimentale perché la scuola possa scrivere sul sito che il punteggio medio dei suoi
studenti è maggiore della media nazionale pari a 4.6? Impostare un opportuno test, specificando
ipotesi nulla, ipotesi alternativa, statistica-test e regione critica. Con i dati a disposizione cosa
si può concludere?
2. Calcolare la probabilità di errore di seconda specie quando il vero valore di µ è pari a 5.
3. Come si modifica il test al punto 1 se la varianza è incognita? Scrivere ipotesi nulla e alternativa,
regione di rifiuto e le conclusioni del test.
Esercizio 7. Un prodotto semilavorato, prima di essere immesso nel ciclo produttivo, viene sottoposto
a tre test di qualità indipendenti e viene scartato se trovato difettoso anche da uno solo dei test.
1. Il test A ha probabilità pA = 0.95 di rilevare la difettosità di un pezzo difettoso, il test B

probabilità pB = 0.92 ed il test C probabilità pC = 0.90. Se un pezzo difettoso viene passato ai
3 test, qual è la probabilità di immetterlo nel ciclo produttivo?
2. Il test A ha anche una probabilità qA = 0.01 di identificare il pezzo come difettoso, quando non
lo è; il test B probabilità qB = 0.02 ed il test C probabilità qC = 0.05. Qual è la probabilità che
un pezzo buono venga scartato?
3. Se il 99% dei pezzi è buono, qual è la probabilità di corretta diagnosi? Suggerimento: si fa una
diagnosi corretta se si pesca un pezzo buono e, in base ai test, lo si accetta oppure se si pesca un
pezzo difettoso e lo si scarta sempre in base ai test.
2
SOLUZIONI 06/02/2017
Esercizio 1. Dispense [ELP] Proposizione 1.5.13 p. 19 ed Esercizio 1.5.16 p. 20.
Esercizio 2. [ROSS] Definizione 6.4.1, pp. 230-231, Eq.(6.5.3), Teorema 6.5.1
Lucidi [LAD1] pp. 30–32, 34; [LAD2] p. 34; [LAD3] pp. 10, 27.
Esercizio 3. Dato il campione casuale X ~ = (X1 , . . . , Xn ), un test di livello di significatività α, per
la verifica dell’ipotesi nulla H0 : θ ∈ Θ0 contro l’ipotesi alternativa H1 : θ ∈ Θ1 , è definito dalla sua
regione critica o regione di rifiuto C ⊂ Rn , che è tale che
~ ∈ C ≤ α,

Pθ X ∀θ ∈ Θ0 .
X−5
Nell’esempio concreto, sia X la media campionaria e Z = √ ;
σ/ 36
allora

~ ∈ C = Pµ=5
2.06 − 5
Pµ=5 X X ≤ 2.06 = Pµ=5 Z ≤ = Φ(−5.88/3) = 1 − Φ(1.96) ' 0.025.
9/6
Esercizio 4.
1. Si ricava immediatamente
d α √
fX (t) = FX (t) = t1/2−1 e−α t 1(0,+∞) (t),
dt 2
che è la densità di Weibull di parametri (α, β = 12 ). Poi, per t > 0, la funzione di rischio è data
da
fX (t) α
λX (t) = = √ .
1 − FX (t) 2 t
2. Nel formulario troviamo le espressioni di media e varianza delle Weibull. Si ha dunque
Γ(1 + β1 )
r
Γ(3) 2 2 1
12.5 = E(X) = 1/β
= 2 = 2 , e quindi α = = = 0.4 .
α α α 12.5 2.5
Analogamente per la varianza otteniamo
Γ(1 + β2 ) − (Γ(1 + β1 ))2 Γ(5) − (Γ(3))2 4! − 4 20

Var(X) = = 4
= 4
= = 781.25 .
α2/β α 0.4 0.0256
3. Sia Xi , i = 1, 2, . . . , n, con n = 200, la v.a. che rappresenta il tempo di attesa della i-esima
prenotazione. Sappiamo, inoltre, che (X1 , . . . , Xn ) è un campione aleatorio dalla distribuzione
di
PnWeibull di parametri (α = 0.4, β = 0.5). Per il TCL, visto che n è grande, si ha che
i=1 Xi ∼ N (12.5n, 781.25n) Papprossimativamente. Si tratta di calcolare la probabilità che la
n
media campionaria X̄200 = ( i=1 Xi )/n sia maggiore di 10 settimane:
n Pn !
X
i=1 Xi − nE(X1 ) 2000 − 2500
P (X̄200 > 10) = 1 − P Xi ≤ 2000 = 1 − P p ≤√
i=1
n Var(X1 ) 200 × 781.25
r !
200
' 1 − Φ −2.5 ' 1 − Φ(−1.264911) ' Φ(1.265) ' 0.8971.
781.25
3
Esercizio 5.
1. Siamo nel caso bernoulliano in cui il successo è identificato con l’evento {X ≥ 2} e la probabilità
di successo incognita è p. In questo caso uno stimatore non distorto (che è anche MLE e stimatore
dei momenti) è il numero dei successi sul numero di prove p̂ = n3 +nn4 +n5 , che nel nostro caso
fornisce la stima 0.46 per p.
2. Se il produttore ha ragione la funzione di ripartizione è data da

(
0 se x < 0
FX (x) = −x/2
1−e se x ≥ 0
Pertanto
p01 = P (X < 1) = 1 − e−1/2 ' 0.3935,
p02 = P (1 ≤ X < 2) = e−1/2 − e−1 ' 0.2387,
p03 = P (2 ≤ X < 3) = e−1 − e−3/2 ' 0.1447,
p04 = P (3 ≤ X < 4) = e−3/2 − e−2 ' 0.0878,
p05 = P (X ≥ 4) = e−2 ' 0.1353.
3. L’ipotesi nulla è che la distribuzione sia un’esponenziale di parametro 0.5, cioè che le probabilità
per le varie classi siano quelle calcolate sopra: H0 : pi = p0i per i = 1, . . . , 5. L’ipotesi alternativa
è che almeno una delle probabilità sia diversa: H1 : pi 6= p0i per almeno un valore di i. Dunque,
sotto l’ipotesi nulla, la statistica
5
X (ni − 100pi )2
U=
100pi
i=1
segue (asintoticamente) una legge χ2 (4). Il test può essere applicato perché si ha n = 100 e
np0i ≥ np04 = 8.78 > 5. La regione critica di livello α = 0.05 del test è
U > χ20.05,4 ' 9.488
Con i dati assegnati si trova u ' 3.787; quindi al 5% di significatività non si può rifiutare l’af-
fermazione del produttore che la durata media di un componente sia di 2 mesi con distribuzione
esponenziale. Si può verificare che il p-value del test vale 0.4365.
Esercizio 6. Abbiamo a disposizione una realizzazione del campione aleatorio (X1 , . . . , X10 ) da
una distribuzione N (µ, σ 2 ). La media campionaria risulta x̄10 = 5.245 e la varianza campionaria
s210 ' 0.7509 ' (0.8666)2 .
1. In questo caso, la varianza è nota e vale σ02 = 1. Si tratta di verificare le ipotesi
H0 : µ ≤ µ0 = 4.6 vs H1 : µ > µ0 = 4.6
e la statistica test è
X n − µ0 √ H 0
n ∼ N (0, 1)
σ0
Pertanto, la regione di rifiuto di un test di livello 5% è:
( √ )
(x̄10 − 4.6) 10
R = (x1 , . . . , x10 ) : ≥ z0.05 .
1
√
Il valore osservato della statistica è z0 := (x̄10 − 4.6) 10 ' 2.0397; essendo z0.05 ' 1.645, si
rifiuto l’ipotesi nulla al 5%, e quindi si accetta l’ipotesi H1 .
4
2. Si tratta di calcolare la probabilità dell’errore di seconda specie per µ1 = 5, cioè la probabilità
di accettare H0 quando H1 è vera (e µ = µ1 = 5). Pertanto
√

z0.05
Pµ1 (accetto H0 ) = Pµ1 ((X̄n − µ0 ) n < z0.05 ) = Pµ1 X̄10 < √ + µ0
10
√ √
= Φ z0.05 + (µ0 − µ1 ) 10 = Φ 1.645 − 0.4 × 10 ' Φ(0.3801) ' 0.6481.
3. Nel caso in cui la varianza sia incognita, allora le ipotesi da verificare rimangono inalterate,
H0 : µ ≤ 4.6 vs H1 : µ > 4.6
ma la statistica test è
X n − µ0 √ H0
p n ∼ tn−1
s2n
Pertanto, la regione di rifiuto di un test di livello 5% è:
( √ )
(x̄10 − 4.6) 10
R = (x1 , . . . , x10 ) : ≥ t0.05,9 .
sn
√
10 −4.6
Il valore osservato della statistica è t0 := x̄0.8666 10 = 2.3536; essendo t0.05,9 = 1.8331, si
continua a rifiutare l’ipotesi nulla al 5%, e quindi si accetta l’ipotesi H1 .
Esercizio 7.
1. Per venire immesso nel ciclo produttivo, il pezzo difettoso deve passare i tre test e per l’in-
dipendenza la probabiltà è il prodotto P (immesso|difettoso) = (1 − pA )(1 − pB )(1 − pC ) =
0.05 × 0.08 × 0.1 = 0.0004.
2. Si sta chiedendo P (scartato|buono) e ragionando come prima si ha P (scartato|buono) = 1 −

P (immesso|buono) = 1−(1−qA )(1−qB )(1−qC ) = 1−0.99×0.98×0.95 = 1−0.921690 = 0.07831.
3. Dobbiamo valutare la probabilità dell’evento {buono ∩ immesso} oppure {difettoso ∩ scartato},

che è l’unione di due eventi incompatibili; dunque, la probabilità di corretta diagnosi è
P (immesso|buono)P (buono) + P (scartato|difettoso)P (difettoso)

= 0.92169 × 0.99 + (1 − 0.0004) × (1 − 0.99) = 0.9124731 + 0.009996 = 0.9224691.

Tema Esame Probabilità

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Tema Esame Probabilità

Caricato da

Copyright:

Formati disponibili

Statistica e Calcolo delle Probabilità 06/02/2017

Giustificare adeguatamente tutte le risposte.

Verificare direttamente che il test di regione critica

ha effettivamente livello α = 0.025 per il problema di verifica d’ipotesi.

dove α è un parametro positivo.

1. Trovare la densità di probabilità e la funzione di rischio di X; riconoscerene la distribuzione.

1. Trovare la stima della probabilità p = P (X ≥ 2) utilizzando uno stimatore non distorto.

2. Calcolare la probabilità di errore di seconda specie quando il vero valore di µ è pari a 5.

1. Il test A ha probabilità pA = 0.95 di rilevare la difettosità di un pezzo difettoso, il test B

Γ(1 + β2 ) − (Γ(1 + β1 ))2 Γ(5) − (Γ(3))2 4! − 4 20

2. Se il produttore ha ragione la funzione di ripartizione è data da

U > χ20.05,4 ' 9.488

1. In questo caso, la varianza è nota e vale σ02 = 1. Si tratta di verificare le ipotesi

H0 : µ ≤ µ0 = 4.6 vs H1 : µ > µ0 = 4.6

H0 : µ ≤ 4.6 vs H1 : µ > 4.6

2. Si sta chiedendo P (scartato|buono) e ragionando come prima si ha P (scartato|buono) = 1 −

3. Dobbiamo valutare la probabilità dell’evento {buono ∩ immesso} oppure {difettoso ∩ scartato},

P (immesso|buono)P (buono) + P (scartato|difettoso)P (difettoso)

Potrebbero piacerti anche