Pr(µ − σ ≤ X ≤ µ + σ ) ≃ 0.68
Pr(µ − 2σ ≤ X ≤ µ + 2σ ) ≃ 0.95
Pr(µ − 3σ ≤ X ≤ µ + 3σ ) ≃ 0.99
In figura e in equazione:
Adesso dobbiamo considerare cosa succede quando sommiamo
due (o più) variabili aleatorie, per esempio, cosa significa questa
scrittura?
Y =X1 + X 2
Il modo più semplice di vederla è immaginare due scommesse:
Risultano le seguenti formule per valore atteso e deviazione
standard:
Cosa Conviene?
Y = X1 + X 2 + ... + X n
X Pr(X = xi)
E(X) =
Var(X) =
Se q = 1 – p, allora
E(X) = p
Var(X) = pq.
Indico con
Xk =
da cui:
Pr(Xk = 1) =
Pr(Xk = 0) =
Sn = X1 + X 2 + ... + X n;
Sn
ˆ =
p
n
ˆ) =
E(p
ˆ) =
Var(p
p(1 − p)
lim = 0
n→∞ n
Questa è la legge dei grandi numeri. All’aumentare delle estrazioni,
il valore osservato di p^ sarà sempre più concentrato attorno al valore
medio – incognito! – pari a p. E quindi p^ sarà una approssimazione
sempre più sicura di p.
Come stimare una percentuale ignota:
1
ˆ =
p Sn
n
p̂ = Stimatore di p
ˆ) = p
E(p
p(1 − p)
ˆ) =
DS(p
n
e che:
ˆ) = 0.
lim DS(p
n→∞
ˆ(1 − p
p ˆ)
ˆ) =
SE(p
n
Sn = X1 + X 2 + ... + X n
Quindi risulta:
p(1 − p)
ˆ : N(p,
p )
n
Ora poniamo:
p(1 − p)
σ = ;
n
ˆ − p
p
Z = ;
σ
Z = N(0,1).
Dalle tavole della normale risulta la seguente uguaglianza:
Dall’esempio precedente:
ˆ = 0.6;
p
ˆ) = 0.05.
SE(p
da cui:
Come migliorare la precisione delle stima:
ˆ − 2.58 σ ≤ p ≤ p
Pr(p ˆ + 2.58 σ ) = 0.99
Dall’esempio precedente:
ˆ = 0.6
p
ˆ) = 0.05
SE(p
Pr(0.6 − 2.58 (0.05) ≤ p ≤ 0.6 + 2.58 (0.05)) = 0.99;
Pr(0.47 ≤ p ≤ 0.73)
Aumentare la dimensione del campione: in questo modo si riduce
lo standard error per effetto della dimensione del campione.
ˆ) = 0.016 = ...
SE(p
Che porta alle stime intervallari:
Problema: voglio la stima di p con confidenza del 99%, con una variazione
di errore massima dell’1%.
ˆ − p |≤ 2.58 SE(p
| p ˆ) =
ˆ(1 − p
p ˆ)
= 2.58 ≤
n
p(1 − p)
≤ 2.58 max p =
n
0.5
= 2.58
n
0.5
(2.58) ≤ 0.01
n