Richiami di probabilità
Esercizi
2.1
Sia Y il numero di “teste” osservate nel lancio di due monete. Si assuma che la probabilità di ottenere “testa” sia di 0,4 per
entrambe le monete.
a. Si derivi la distribuzione di probabilità di Y.
b. Si derivi la distribuzione di probabilità cumulata di Y.
2.2
Si usi la distribuzione di probabilità fornita nella Tabella 2.2 per calcolare: (a) E(Y) ed E(X ); (b) s X2 e s Y2; e (c) sXY e
corr(X, Y).
Usando le variabili casuali X e Y della Tabella 2.2, si considerino due nuove variabili causali W = 4 + 8X e V = 11
2.3
− 2Y. Si calcolino: (a) E(W) e E(V); (b) s W2 e s V2; (c) sWV e corr(W, V).
Sia X una variabile casuale di Bernoulli con P(X = 1) = p.
2.4
a. Si mostri che E(X 3) = p.
b. Si mostri che E(X k) = p per k > 0.
c. Si supponga che p = 0,3. Si calcolino la media, la varianza, l’asimmetria e la curtosi di X. (Suggerimento: può essere
utile l’impiego delle formule date nell’Esercizio 2.21.)
2.5 In luglio, la temperatura massima giornaliera della città di Fairtown ha una media di 65°F e una deviazione standard di
5°F. Quali sono la media, la deviazione standard e la varianza in °C?
2.6
La tabella seguente fornisce la distribuzione di probabilità congiunta dello stato occupazionale e del livello scolare per
individui impiegati oppure in cerca di occupazione (disoccupati) appartenenti alla popolazione in età lavorativa del Paese
A.
a. Si calcoli E(Y).
b. Il tasso di disoccupazione è la frazione della forza lavoro che è disoccupata. Si mostri che il tasso di disoccupazione
è dato da 1 − E(Y).
c. Si calcoli E(YX = 1) e E(Y X = 0).
d. Si calcoli il tasso di disoccupazione per (i) i laureati e (ii) i non laureati.
e. Un membro di questa popolazione selezionato a caso dichiara di essere disoccupato. Qual è la probabilità che questo
lavoratore sia (i) laureato, (ii) non laureato?
f. Livello d’istruzione e stato occupazionale sono indipendenti? Si argomenti la risposta.
σ
c. Si mostri che E(W) = n. [Suggerimento: si usi la risposta alla domanda (a).]
∑ i=2 Y2i
n
2.25
(Ripasso sulla sommatoria). Si indichi con x1,...,xn una sequenza di numeri, con y1,...,yn un’altra sequenza di numeri e con
a, b e c tre costanti. Si mostri che:
n n
a. ∑ ax i = a ∑ x i
i=1 i=1
n n n
b. ∑ (x i + yi ) = ∑ x i + ∑ yi
i=1 i=1 i=1
n
c. ∑ a = na
i=1
n n n n n
d. ∑ (a + bx i + cyi ) = na 2 + b 2 ∑ x i2 + c 2 ∑ yi2 +2 ab ∑ x i +2 ac ∑ yi +
i=1 i=1 i=1 i=1 i=1
n
2 bc ∑ x i yi
i=1
quindi
𝑣𝑎𝑟(𝑌) = 𝐸(𝑌 2 ) − [𝐸(𝑌)]2 = 1,12 − 0,82 = 0,48
Pr(𝑋 = 1, 𝑌 = 0) 0,042
Pr(𝑋 = 1|𝑌 = 0) = = = 0,35
Pr(𝑌 = 0) 0,12
(f) Livello di istruzione e stato occupazionale non sono indipendenti perché non
soddisfano la condizione che, per tutti i valori di x e y,
Pr ( X = x |Y = y ) = Pr ( X = x).
Per esempio, dal punto (e) si ha Pr(X = 0|Y = 0) = 0,65, mentre dalla tabella si ha
Pr(X = 0) = 0,751.
2.7. Utilizzando una notazione ovvia, C = M + F ; quindi µC = µ M + µ F e
σ C2 = σ M2 + σ F2 + 2cov ( M , F ). Ciò implica
(a) 𝜇𝐶 = 50 + 48 = $98.000 per anno.
cov( M , F )
(b) corr ( M , F ) = , quindi cov( M , F ) = σ M σ F corr ( M , F ). Quindi
σ Mσ F
cov ( M , F ) = 15 × 13 × 0,9 = 175,50, dove le unità sono migliaia di dollari
l’anno al quadrato.
(c) σ C2 = σ M2 + σ F2 + 2cov ( M , F ), perciò 𝜎𝐶2 = 152 + 132 + 2(175,5) = 745, e
𝜎𝐶 = √745 = 27,295 migliaia di dollari l’anno.
(d) Per prima cosa occorre cercare il tasso di cambio euro/dollaro attuale sul Wall Street
Journal, sul sito web della Federal Reserve o consultando altre fonti di informazioni
finanziarie. Supponiamo che il tasso di cambio sia e (per esempio e = 0,75 euro per
dollaro); quindi 1 dollaro vale e euro. La media è quindi e × sC (in migliaia di euro
l’anno) e la deviazione standard è e × sC (in migliaia di euro l’anno). La correlazione è
indipendente dall’unità di misura ed è invariata.
1
2.8. 𝐸(𝑌) = 4; 𝑣𝑎𝑟(𝑌) = ; 𝑍 = 3(𝑌 − 4)
9
𝜇𝑍 = 𝐸�3(𝑌 − 4)� = 3(𝐸(𝑌) − 4) = 3(4 − 4) = 0
1
𝜎𝑍2 = 𝑣𝑎𝑟�3(𝑌 − 4)� = 9𝑣𝑎𝑟(𝑌) = 9 × =1
9
2.9.
Valore di Y Distribuzione
di
2 4 6 8 10 probabilità
di X
3 0,04 0,09 0,03 0,12 0,01 0,29
Valore
6 0,10 0,06 0,15 0,03 0,02 0,36
di X
9 0,13 0,11 0,04 0,06 0,01 0,35
Distribuzione di
0,27 0,26 0,22 0,21 0,04 1,00
probabilità di Y
(a) La distribuzione di probabilità è data nella tabella precedente.
Valore di Y
2 4 6 8 10
0,10/0,36 0,06/0,36 0,15/0,36 0,03/0,36 0,02/0,36
1 − 2 Y − 2 1 − 2
Pr (1 ≤ Y ≤ 4) = Pr ≤ ≤ = Φ (2) − Φ ( −1) = Φ (2) − (1 − Φ (1)) = 0,8185.
1 1 1
Y − 50 49 − 50 Y − 50
Pr (Y ≤ 49) = 1 − Pr (Y ≤ 49) = 1 − Pr ≤ = 1 − Pr ≤ −2,6726 = 0,9962
0,14 0,14 0,14
σ Y2 21
(c) Con n = 45 e σ Y2 = = = 0, 467 , e
n 45
50,5 − 50 Y − 50 51 − 50
Pr (50,5 ≤ Y ≤ 51) = Pr ≤ ≤ = Φ (1, 4633) − Φ (0,7317) = 0,9245 − 0,7647 = 0,1598
0, 467 0, 467 0, 467
9,6 − 10 Y − 10 10, 4 − 10
2.15. (a) Pr (9,6 ≤ Y ≤ 10, 4) = Pr ≤ ≤
4/n 4/n 4/n
9,6 − 10 10, 4 − 10
= Pr ≤Z≤
4/n 4/n
dove Z ~ N(0, 1). Quindi,
9,6 − 10 10, 4 − 10
(i) n = 20; Pr ≤Z≤ = Pr (−0,89 ≤ Z ≤ 0,89) = 0,63
4/n 4/n
9,6 − 10 10, 4 − 10
(ii) n = 100; Pr ≤Z≤ = Pr(−2,00 ≤ Z ≤ 2,00) = 0,954
4/n 4/n
9,6 − 10 10, 4 − 10
(iii) n = 1000; Pr ≤Z≤ = Pr(−6,32 ≤ Z ≤ 6,32) = 1,000
4/n 4/n
−c Y − 10 c
(b) Pr (10 − c ≤ Y ≤ 10 + c) = Pr ≤ ≤
4/n 4/n 4/n
−c c
= Pr ≤Z ≤ .
4/n 4/n
c
Al crescere di n cresce anche , e la probabilità converge a 1.
4/n
(c) Segue da (b) e dalla definizione di convergenza in probabilità fornita nel Concetto chiave
2.6.
2.16. Esistono diversi modi per farlo; uno è il seguente. Generare n estrazioni di Y, Y1, Y2, … Yn.
Sia Xi = 1 se Yi < 3,6, Xi = 0 altrimenti. Si noti che Xi sono variabili casuali di Bernoulli con
µX = Pr(X = 1) = Pr(Y < 3,6). Calcolare X .
Poiché X converge in probabilità a µX = Pr(X = 1) = Pr(Y < 3,6), X sarà
un’approssimazione accurata se n è grande.
2.17. µY = 0,6 e σ Y2 = 0, 4 × 0,6 = 0, 24
Y − 0,6 0,64 − 0,6
(a) (i) P( Y ≥ 0,64) = Pr ≤
0, 24 0, 24
n n
Y − 0,6 0,04 Y − 0,6
= Pr ≤ = ≤ 0,577 = 0, 2157
0, 24 0, 24 0, 24
n n n
Y − 0,6 0,56 − 0,6 Y − 0,6
(ii) P( Y ≤ 0,56) = Pr ≤ = Pr ≤ 1,157 = 0,12
0, 24 0, 24 0, 24
n n n
(b) È noto che Pr (–1,96 ≤ Z ≤ 1,96) = 0,95, quindi si vuole che n soddisfi
0,65 − 0,60 0,65 − 0,60
0,61 = > −1,96 e < −1,96. Risolvendo queste disuguaglianze
0, 24 0, 24
n n
si ottiene n ≥ 368.
σ Y2 107
(b) (i) σ Y2 = = 4, 27 ×= 355833.
n 120
(ii) Utilizzando il teorema limite centrale,
Pr (Y > 3000) = 1 − Pr (Y ≤ 3000)
Y − 1500 3000 − 1500
= 1 − Pr ≤
355833 355833
= 1 − Φ (2,5145) = 1 − 0,9939 = 0 (corretto a 4 cifre decimali)
l
2.19. (a) Pr (Y = y j ) = ∑ Pr ( X = xi , Y = y j )
i =1
l
= ∑ Pr (Y = y j | X = xi )Pr ( X = xi )
i =1
k k l
(b) E (Y ) = ∑ y j Pr (Y = yj ) = ∑ yj ∑ Pr (Y = yj |X = xi ) Pr ( X = xi )
j =1 j =1 i =1
l k
=∑
∑y j
Pr (Y = yj |X = xi ) Pr ( X = xi )
i =1 j =1
l
=∑ E (Y | X = xi )Pr ( X = xi ).
i =1
quindi
σ XY = E[( X − µ X )(Y − µY )]
l k
=∑ ∑ ( xi − µ X )( y j − µY ) Pr ( X = xi , Y = y j )
i =1 j =1
l k
=∑ ∑( xi − µ X )( y j − µY ) Pr ( X = xi ) Pr (Y = y j )
i =1 j =1
l k
= ∑ ( xi − µ X ) Pr ( X = xi ) ∑ ( yj − µY ) Pr (Y = yj
i =1 j =1
= E ( X − µ X ) E (Y − µY ) = 0 × 0 = 0,
σ XY 0
corr(X , Y ) = = = 0.
σ XσY σ XσY
l m
2.20. (a) Pr (Y = yi ) = ∑∑ Pr (Y = yi | X = xj , Z = zh ) Pr (X = xj , Z = zh )
j =1 h =1
k
(b) E (Y ) = ∑ yi Pr (Y = yi ) Pr (Y = yi )
i =1
k l m
= ∑ yi ∑∑ Pr (Y = yi | X = xj , Z = zh ) Pr (X = xj , Z = zh )
i =1 j =1 h =1
l m
k
= ∑∑ ∑ yi Pr (Y = yi | X = xj , Z = zh ) Pr (X = xj , Z = zh )
j =1 h =1 i =1
l m
= ∑∑ E (Y | X = xj , Z = zh ) Pr (X = xj , Z = zh )
j =1 h =1
dove la prima riga è la definizione della media, la seconda utilizza (a), la terza è una
riformulazione e l’ultima sfrutta la definizione di valore atteso condizionato.
dove 0,07 × 0,04 × 0,25 = Cov ( Rs , Rb ) segue dalla definizione della correlazione tra Rs e
Rb.
(a) µ = 0,065; σ = 0,044
(b) µ = 0,0725; σ = 0,056
(c) w = 1 massimizza µ ; σ = 0,07 per questo valore di w.
(d) La derivata di σ2 rispetto a w è
dσ 2
= 2 w × 0,07 2 − 2(1 − w) × 0,042 + (2 − 4 w) × [0,07 × 0,04 × 0, 25]
dw
= 0,0102 w − 0,0018
Risolvendo rispetto a w si ottiene w = 18 / 102 = 0,18 (si noti che la derivata seconda è
positiva e che perciò si tratta del minimo assoluto). Con w = 0,18, σ R = 0,038.
2.23. X e Z sono due variabili casuali normali standard distribuite in modi indipendenti, così che
µ X = µ Z = 0, σ X2 = σ Z2 = 1, σ XZ = 0.
(a) Data l'indipendenza tra X e Z , Pr ( Z = z| X = x) = Pr ( Z = z ), e E ( Z |X ) = E ( Z ) = 0.
Quindi E (Y | X ) = E ( X 2 + Z| X ) = E ( X 2| X ) + E ( Z |X ) = X 2 + 0 = X 2 .
(b) E ( X 2 ) = σ X2 + µ X2 = 1, e µY = E ( X 2 + Z ) = E ( X 2 ) + µ Z = 1 + 0 = 1.
(c) E ( XY ) = E ( X 3 + ZX ) = E ( X 3 ) + E ( ZX ). Poiché i momenti dispari di una variabile
casuale normale standard sono tutti zero, si ha E ( X 3 ) = 0. Per l’indipendenza tra X e
Z , si ha E ( ZX ) = µ Z µ X = 0. Quindi E ( XY ) = E ( X 3 ) + E ( ZX ) = 0.
(d) cov (XY ) = E[( X − µ X )(Y − µY )] = E[( X − 0)(Y − 1)]
= E ( XY − X ) = E ( XY ) − E ( X )
= 0 − 0 = 0.
σ XY 0
corr (X , Y ) = = = 0.
σ XσY σ XσY
2.24. (a) E (Yi 2 ) = σ 2 + µ 2 = σ 2 e il risultato segue direttamente.
(b) (Yi/σ) è i.i.d. N(0,1), W = ∑ i =1 (Yi /σ ) 2 , e il risultato discende dalla definizione di
n
variabile casuale χ n2 .
n
Yi 2 n
Yi 2
(c) E (W ) = E ∑ = ∑E = n.
i =1 σ2 i =1 σ2
(d) Si scriva
Y1 Y1 /σ
V= =
∑in=2 Yi2 ∑in=2 (Y /σ ) 2
n −1 n −1
n n
2.25. (a) ∑ axi = (ax1 + ax2 + ax3 + + axn ) = a( x1 + x2 + x3 + + xn ) = a∑ xi
i =1 i =1
n
(b) ∑ (x + y ) = (x
i =1
i i 1 + y1 + x2 + y2 + xn + yn )
= ( x1 + x2 + xn ) + ( y1 + y2 + yn )
n n
= ∑ xi + ∑ yi
i =1 i =1
n
(c) ∑ a = (a + a + a + + a) = na
i =1
n n
(d) ∑ (a + bxi + cyi )2 = ∑ (a 2 + b2 xi2 + c 2 yi2 + 2abxi + 2acyi + 2bcxi yi )
i =1 i =1
n n n n n
= na 2 + b 2 ∑ xi2 + c 2 ∑ yi2 + 2ab∑ xi + 2ac ∑ yi + 2bc ∑ xi yi
i =1 i =1 i =1 i =1 i =1
cov(Yi , Y j ) cov(Yi , Y j ) cov(Yi , Y j )
2.26. (a) corr(Yi,Yj) = = = = ρ ; nella prima uguaglianza si
σY σY
i j
σYσY σ Y2
utilizza la definizione di correlazione, nella seconda il fatto che Yi e Yj hanno uguale
varianza (e deviazione standard), nella terza la definizione di deviazione standard e
nella quarta la correlazione data nel problema. Risolvendo rispetto a cov(Yi, Yj)
dall'ultima uguaglianza, si ottiene il risultato desiderato.
1 1 1 1
(b) Y = Y1 + Y2 , perciò E( Y ) = E (Y )1 + E (Y2 ) = µY
2 2 2 2
1 1 2 σ 2 ρσ Y2
var(Y ) = var(Y1 ) + var(Y2 ) + cov(Y1 , Y2 ) = Y +
4 4 4 2 2
1 n 1 n 1 n
(c) Y = ∑
n i =1
Yi , perciò E (Y ) = ∑ E (Yi ) = ∑ µY = µY
n i =1 n i =1
1 n
var(Y ) = var ∑ Yi
n i =1
n −1
1 n 2 n
= 2 ∑ var(Yi ) + 2 ∑ ∑ cov(Y , Y ) i j
n i =1 n i =1 j = i +1
n n −1 n
1 2
=
n2
∑σ Y2 +
i =1 n2
∑ ∑ ρσ
i =1 j = i +1
2
Y
σ n(n − 1)
2
= Y
2
+ ρσ Y2
n n
σ 2
1
= Y + 1 − ρσ Y2
n n
n −1 n
an(n − 1)
Nella quarta riga si utilizza ∑ ∑ a = a(1 + 2 + 3 + + n − 1) =
i =1 j = i +1 2
per ogni
variabile a.
σ Y2 1
(d) Quando n è grande ≈0 e ≈ 0 , e il risultato segue da (c).
n n