Sei sulla pagina 1di 4

Statistica e Calcolo delle Probabilità 01/02/16

Giustificare adeguatamente tutte le risposte.


Esercizio 1 (SCP, Stat). Teoria. Enunciare correttamente il Teorema centrale del limite.
In base a questo teorema giustificare l’approssimazione normale per una distribuzione Bi(n; p), con n
“grande”.
Esercizio 2. Teoria. Sia X1 , X2 , X3 , X4 un campione di dimensione 4 estratto da una popolazione N (µ, 1).
Sulla base di questo campione si vuole verificare il sistema di ipotesi H0 : µ = 6 contro H1 : µ > 6. Si decide di
usare il test che rifiuta H0 se X 4 > 7, dove X 4 indica la media campionaria.
Calcolare l’ampiezza del test; calcolare, inoltre, la potenza del test quando µ = 7.5.
Esercizio 3. Teoria. Descrivere il procedimento per ottenere un intervallo di confidenza del tipo [0, c) di livello
1 − α per la varianza σ 2 di un campione casuale gaussiano X1 , . . . , Xn con media incognita. In particolare, si
provi che l’intervallo ottenuto ha effettivamente livello di confidenza 1 − α.
Esercizio 4.
1. Le v.a. X1 e X2 siano indipendenti e di legge esponenziale di parametri λ1 e λ2 rispettivamente. Calcolare
P[X1 < X2 ].
2. Supponiamo di avere un sistema stereo formato da due parti principali, una radio e un altoparlante. Se il
tempo di vita della radio è esponenziale di media 1000 ore e il tempo di vita dell’altoparlante è esponenziale
di media 500 ore ed è indipendente dal tempo di vita della radio, qual è la probabilità che la rottura del
sistema, quando capita, sia dovuta alla rottura della radio?

Esercizio 5. Sia X = (X1 , X2 ) un vettore gaussiano di media m e matrice di covarianza C, dove


   
4 1 1
m= , C= .
2 1 2

(a) Determinare il coefficiente di correlazione ρ fra X1 e X2 .


(b) Trovare i valori del parametro reale a per cui risultano indipendenti le componenti del vettore
      
Y1 1 a X1 1
= − .
Y2 a 1 X2 2

Scelto il maggiore fra i valori di a trovati al punto (b),


(c) si scriva la densità di probabilità di Y1 ;

(d) si calcoli P (Y1 = 5).

Esercizio 6. In uno studio sul glaucoma, vengono scelti a caso n = 12 pazienti e viene loro misurata la pressione
interoculare (IOP) in mmHg la mattina e la sera con l’obiettivo di stabilire se la pressione misurata al mattino
differisca da quella misurata alla sera. In scala logaritmica, i valori ottenuti sono i seguenti:
X = logIOP di mattina 2.8 2.5 2.5 3.5 3.4 2.2 2.7 2.9 2.8 3.0 2.9 3.4
Y = logIOP di sera 2.3 2.1 2.8 3.0 2.5 2.1 2.6 2.2 1.9 2.9 3.3 3.2
Inoltre, è ragionevole assumere che le differenze tra i logaritmi delle IOP costituiscano un campione di dati
gaussiani.

1. Scrivere ipotesi nulla, ipotesi alternativa e regione di rifiuto per un test statistico che stabilisca se c’è
evidenza sperimentale che la pressione media, in scala logaritmica, diminuisca nella giornata.
2. Ricavare un intervallo in cui cade il p-value del test al punto 1. Quali conclusioni si possono trarre agli
usuali livelli di significatività?
3. Trovare un intervallo di confidenza per la media di X − Y del tipo (c, +∞) di livello 1 − α = 99%; calcolare
la corrispondente stima intervallare con i dati forniti.

Esercizio 7. Sia X1 , X2 , . . . , Xn un campione casuale da una popolazione con densità


2 2
fθ (x) := 2
x e−(x/θ) 1(0,+∞) (x), θ > 0.
θ

1
1. Determinare lo stimatore di massima verosimiglianza Tn di θ basato sul campione. Ricordarsi di verificare
che l’unico punto stazionario della verosimiglianza sia effettivamente il punto di massimo.
Pn
2. Calcolare e riconoscere la distribuzione di Y1 = X12 . Inoltre, verificare che Qn = 2n 2
θ2 Y n = θ2 i=1 Yi ha
distribuzione χ2 (2n), dove Yi := Xi2 per ogni i = 1, . . . , n.

3. Dedurre una quantità pivotale e costruire a partire da essa un intervallo di confidenza bilatero per θ2 di
livello del 95% (indicando il procedimento usato). Sapendo che la stima di massima verosimiglianza di θ
ottenuta da un campione di ampiezza n = 10 (vedi punto 1) è pari a 3.5, ricavare la corrispondente stima
intervallare per θ2 .

SOLUZIONI 01/02/16
Esercizio 1. Dispense [LEP] pp. 108–110.
Esercizio 2.

1. L’ampiezza è l’estremo superiore delle probabilità di rifiutare H0 quando H0 è vera; nel nostro caso H0 è
semplice e si ha
 
  X −6 7−6
Pµ=6 X > 7 = Pµ=6 √ > √ = 1 − Φ(2) ' 1 − 0.97725 = 2.275% .
1/ 4 1/ 4

2. La potenza è la probabilità di rifiutare H0 in funzione di µ; nel nostro caso si ha


 
  X − 7.5
π(7.5) = Pµ=7.5 X > 7 = Pµ=7.5 √ > −1 = Φ(1) ' 0.84134 = 84.134% .
1/ 4

Esercizio 3. Dato che la varianza è sempre positiva, si tratta di trovare un limite di confidenza superiore per
la varianza. Usiamo la quantità pivotale (n − 1)Sn2 /σ 2 , che sappiamo avere distribuzione χ2 (n − 1); usando il
quantile χ21−α (n − 1) di ordine 1 − α (convenzione della coda destra) si ha

(n − 1)Sn2 (n − 1)Sn2
   
2 2
Pµ,σ ≥ χ1−α (n − 1) = 1 − α, ⇔ Pµ,σ σ ≤ 2 = 1 − α,
σ2 χ1−α (n − 1)

che ci dice che (n − 1)Sn2 χ21−α (n − 1) è un limite di confidenza superiore per σ 2 di livello 1 − α.
Esercizio 4.

1. Abbiamo fi (x) = λi e−λi x 1(0,+∞) (x); la probabilità richiesta è


ZZ Z +∞ Z +∞
P[X1 < X2 ] = f1 (x1 )f2 (x2 ) dx1 dx2 = λ1 λ2 dx1 e−λ1 x1 e−λ2 x2 dx2
x1 <x2 0 x1
Z +∞
λ1
= λ1 e−(λ1 +λ2 )x1 dx1 = .
0 λ1 + λ2

1 1
2. Dal risultato precedente con λ1 = 1000 e λ2 = 500 segue che la probabilità cercata è
1/1000 1
1/1000+1/500 = 3.

Esercizio 5.
Cov(X1 , X2 ) 1
(a) ρ = p =√ .
Var(X1 ) Var(X2 ) 2

(b) Il vettore Y = (Y1 , Y2 ) è trasformazione affine del vettore normale X; pertanto anche Y è normale e le
sue componenti sono indipendenti se e solo se sono scorrelate. Il parametro a deve quindi essere tale che

0 = Cov(X1 + aX2 , aX1 + X2 ) = a Var(X1 ) + Cov(X1 , X2 ) + a2 Cov(X1 , X2 ) + a Var(X2 ) = a2 + 3a + 1,



−3 ± 5
da cui a = .
2

2
(c) Y1 è una variabile aleatoria normale perché componente di un vettore normale e quindi
√ la sua legge è
−3 + 5
completamente determinata dal suo valore atteso e dalla sua varianza. Per a = si ha
2

E[Y1 ] = E[X1 + aX2 − 1] = 4 + 2a − 1 = 5,

Var[Y1 ] = Var[X1 + aX2 + 1] = Var[X1 ] + a2 Var[X2 ] + 2a Cov(X1 , X2 ) = 1 + 2a2 + 2a = 5 − 2 5,
e pertanto
√ ( )
1 (y − 5)2
fY1 (y) = q √ exp − 2(5 − 2√5) .
2π(5 − 2 5)

(d) Poiché Y1 è una variabile aleatoria continua, P (Y1 = 5) = 0.

Esercizio 6. Si tratta di confrontare le medie di un campione aleatorio gaussiano accoppiato (X1 , Y1 ), . . .,


(X12 , Y12 ), dove Xi e Yi rappresentano la pressione interoculare in scala logaritmica dell’i-esimo paziente, mi-
i.i.d. 2
surate di mattina e di sera, rispettivamente. Allora Wi := Xi − Yi ∼ N (µW , σW ), i = 1, . . . , 12, con
2
µW := µX − µY e σW incognita. Dai dati del problema si ricava:
Wi 0.5 0.4 −0.3 0.5 0.9 0.1 0.1 0.7 0.9 0.1 −0.4 0.2
e quindi si ha w12 = 0.3083, s2w = 0.1772.
1. Si tratta di verificare le ipotesi: H0 : µX ≤ µY contro H1 : µX > µY , cioè H0 : µW ≤ 0 contro H1 : µW > 0.
La statistica test è
W − 0 µW =0
T := q 2 ∼ t(n − 1).
SW
n
q
s2
Si rifiuta H0 a livello α se t = w/ nw ≥ tα,n−1 . Con i dati a disposizione, e visto che n = 12, si ricava
t = 2.5371.
2. Il valore esatto del p-value è 1 − Ft(n−1) (t) = 1 − Ft(11) (2.5371) = 0.0138. Dalle tavole si ricava p-value
= 1 − Ft(11) (2.5371) ∈ (0.01, 0.025). Quindi si rifiuta l’ipotesi H0 e si accetta l’ipotesi H1 che la pressione
media diminuisca nella giornata, ai livelli di significatività del 5% e 10%, mentre non si rifiuta l’ipotesi
H0 al livello dell’1%.
3. Per costruire un IC per µW := µX − µY la quantità pivotale da cui partire è
 
W − µW µW ,σW2
W − µ W
q 2 ∼ t(n − 1) ⇒ 1 − α = PµW ,σW2  q 2 < tα,n−1  .
SW SW
n n

In particolare, invertendo la disuguaglianza tra le parentesi qui sopra rispetto a µW si trova che l’IC
cercato è r !
2
SW
W − tα,n−1 , +∞ ,
n
q
s2
dove tα,n−1 = t0.01,11 = 2.718; sostituendo i valori osservati del campione troviamo tα,11 12w ' 0.3303 e
la stima intervallare risulta essere (−0.0220, +∞).

Esercizio 7.
1. Se (x1 , . . . , xn ) indica il campione osservato, la funzione di verosimiglianza del campione è
n n n
! n
Y Y 2 −(xi /θ)2 2n Y n 1 X
2
o
L(θ; x1 , . . . , xn ) = fθ (xi ) = x i e = x i exp − x
i=1 i=1
θ2 θ2n i=1 θ2 i=1 i

quando ogni xi > 0. Quindi il logaritmo della verosimiglianza è


n n
X 1 X 2
ln L(θ; x1 , . . . , xn ) = n ln 2 + ln xi − 2n ln θ − 2 x ; poi si ha
i=1
θ i=1 i
n n
r Pn
∂ 2n 2 X 2 X x2i
ln L(θ; x1 , . . . , xn ) = − + 3 xi ≥ 0 ⇒ nθ2 − x2i ≤ 0 ⇒ 0 < θ ≤ i=1
.
∂θ θ θ i=1 i=1
n

3
q Pn
x2i
Pertanto i=1
n è punto di massimo per L(θ; x1 , . . . , xn ) e lo stimatore di massima verosimiglianza Tn
di θ è r Pn
2
i=1 Xi
Tn = .
n

2. Sia X1 che Y1 sono v.a. positive q.c.; allora X1 = Y1 e

√ 1 1 2 √ ( y)2 1 y
fY1 (y) = fθ ( y) × √ 1(0,+∞) (y) = √ 2 y exp{− 2 } 1(0,+∞) (y), = 2 e− θ2 1(0,+∞) (y),
2 y 2 y θ θ θ

iid Pn
cioè Y1 ∼ Exp( θ12 ). Allora, visto che Y1 , . . . , Yn ∼ Exp( θ12 ), si ha i=1 Yi ∼ Γ(n, 1/θ2 ). Inoltre,
calcolando la funzione generatrice dei momenti di Qn :

 2t   1 n  1  2n
2
θ2 2
mQn (t) = mPn Yi = 1 2t = 1 .
1
θ2 θ2 − θ2 2 −t

In quest’ultima espressione si riconosce la f.g.m. di una distribuzione χ2 (2n).


2
Pn θ
3. Per ricavare un IC per θ2 , dal punto precedente sappiamo che una quantità pivotale è θ2 i=1 Yi ∼ χ2 (2n)
e dunque
n
 2 X 
0.95 = Pθ χ21−α/2,2n < 2 Yi < χ2α/2,2n ;
θ i=1
l’intervallo di confidenza è pertanto
n n
2 X 2 X
Yi < θ2 < Yi .
χ2α/2,2n i=1
χ21−α/2,2n i=1
q Pn
2
i=1 xi
P10
Sapendo che tn = n = 3.5, otteniamo i=1 yi = 10 × (3.5)2 = 122.5; avendo poi χ20.925,20 = 9.59
e χ20.025,20 = 34.17, si ricava che
Pn Pn !
2 1 yi 2 1 yi
, = (7.1700, 25.5475)
χ20.025,20 χ20.925,20

è la stima intervallare per θ2 .