Sei sulla pagina 1di 18

Lezione 10 - 15/03/21

Definizione V.A. Binomiale


La binomiale è "parente" della Bernoulli.
• E' una variabile aleatoria discreta.
• Consideriamo prove indipendenti ripetute di tipo Bernoulliano (legate al concetto di
esperimento dicotomico, con due soli esiti, la singola prova può avere successo o
fallire)
Lo spazio campionario sarà:

Ω = { � = � 1 , � 2 , … , � n , � i ∈ { successo = s, fallimento = f }
⏠⏣⏣⏣ ⏡moneta
lancio la ⏣⏣⏣ ⏢
n volte fissate
#Ω finita
� - algebra F = P(Ω)
La variabile aleatoria binomiale X è definita così:
Ω → R
"n° di successi n
X:
� ⇝ X(�) = ottenuti nelle = ∑ 1 { s } (� i )
n prove" i=1

Definizione funzione indicatrice


La funzione:
generico
insieme
⏜⏟⏟
⏝⏟⏟

1B : A → N
x∈B → 1
x∉B → 0
Viene detta funzione indicatrice.
La funzione indica se x appartiene a B o meno.
La variabile aleatoria binomiale funziona così: lancio la moneta n volte e conto il numero
di
successi.

In termin di spazi essa agisce fra gli spazi:


X
(�, F, P) ⏪⏫ R, B(R), �X
⏠⏣⏣
⏡⏣⏣

distribuzione di
probabilità di X
Quella che prima
abbiamo indicato
come PX

Osservazione
Il supporto S di X è:
S {0 1 2 }
E' evidente che su n prove io possa avere al minimo 0 successi ed al più n successi.
In ogni caso ha senso chiedersi quale sia la probabilità:

1
P X=
2
Ma siccome è impossibile avere mezzo successoi (lanciando la moneta ho ottenuto
mezza
volta testa) il risultato non potrà che essere:

1
P X= =0
2
1
Non foss'altro per definizione di supporto e per il farto che ∉S
2
Osservazione
La densità discreta è:
P(X = x) , x ∈ R
Siccome non è molto interessante porsi domande fuori dal supporto, spesso si scrive:
P(X = x i ) , x i ∈ S
Per esprimere lo stesso concetto possiamo riscriverlo come:
P(X = k) , k = 0, 1, 2, … , n
⏠⏣⏣⏣⏡⏣⏣⏣
� X ({ k }) ⏠⏣⏣⏣⏣
⏢ e qui elenco tutti gli ⏡⏣⏣⏣⏣
elementi del⏢
suppporto
La densità discreta la deriviamo come segue:
Considero un generico elemento del nostro spazio campionario Ω che sia favorevole al
{X = k}
verificarsi dell'evento ↓
{ � / X(�) = k }
Per esempio fissiamo k = 3 ed n = 5 conduciamo l'esperimento usando una moneta
bilanciata.
Mi serve una sequenza di 5 prove con 3 successi:
� = (s, f, s, s, f)
1 1 1 1 1 1
P({ � }) = ⋅ ⋅ ⋅ ⋅ = 5
2 2 2 2 2 2
Se avessi avuto una moneta non bilanciata avrei:
probabilità n° n°
probabilità
fallimento successi fallimenti
successo
⏞ ⋅ ⏜⏟⏟ ⏝⏟⏟⏞ ⏜⏟⏟
⏝⏟⏟
⏞ ⏜⏟⏟
⏝⏟⏟

P({ � }) = ⏜⏟⏟
p⏝⏟⏟ ( 1 - p) ⋅ p ⋅ p ⋅ ( 1 - p) = p 3 ( 1 - p) 2
In generale:
n° n°
successi fallimenti
⏜⏟⏟
⏝⏟⏟
k
⏞ ⏜⏟⏟
⏝⏟⏟
n-k

P({ � }) = p ⋅ ( 1 - p)
Queso è la probabilità di un singolo evento favorevole a x=k.
Però ci sono più di un evento favorevole.
Devo contare allora quanti di questi � favorevoli ci siano.
numero eventi
favorevoli
⏜⏟⏟⏟
⏝⏟⏟⏟
n ⏞
P(X = k) = p k ⋅ (1 - p) n-k ⋅ k
, k ∈ S = { 0, 1, … , n } (1)
⏠⏣⏣⏣ ⏡⏣⏣⏣
probabilità di ⏢
un evento
Perchè questo coefficiente binomiale dentro (1)?
Supponiamo di avere la seguente sequenza:

s f f
Vorrei sapere quante siano tutte le sequenze con un solo successo e due fallimenti,
elenchiamole tutte:

s f f
f s f
f f s
3 3! 3⋅2
= = =3
1 2!1! 2

In questo caso scriveremo che:


parametri

X ∼ BIN
⏜⏟⏟⏟
n ,
⏝⏟⏟⏟
p

n°⏦ ⏦
prove probabilità
successo

Osservazione
Th. binomiale
n di Newton

1 = ∑ P(X = k) = ∑
n k ⏜⏟⏟⏟
⏝⏟⏟⏟

p (1 - p) n-k = (p + (1 - p)) n = 1
k∈S k=0
k

Esercizio Disegnare la densità discreta di:

1
X ∼ BIN 5,
2
5 prove ripetute indipendenti fra loro in cui lanciamo una moneta bilanciata.

Per casa Svolgiamo l'esercizio sopra proposto:


Il supporto di X è:
S = { 0, 1, 2, 3, 4, 5 }
Calcoliamo la densità discreta nei punti del supporto:
0 5
1 1 5 1
P(X = 0) = ⋅ 1- ⋅ =
2 2 0 32
1 4
1 1 5 5
P(X = 1) = ⋅ 1- ⋅ =
2 2 1 32
2 3
1 1 5 5
P(X = 2) = ⋅ 1- ⋅ =
2 2 2 16
3 2
1 1 5 5
P(X = 3) = ⋅ 1- ⋅ =
2 2 3 16
4 1
1 1 5 5
P(X = 4) = ⋅ 1- ⋅ =
2 2 4 32
5 0
1 1 5 1
P(X = 5) = ⋅ 1- ⋅ =
2 2 5 32
Rappresentiamo questi valori su di un grafico:
1.2 P(X = x)
1.1
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1

-5 -4 -3 -2 -1 -0.10 1 2 3 4 5 6 7 8 9 10 11
-0.2
-0.3

Disegniamo ora la funzione di distribuzione:


Calcoliamola nei punti del supporto:
1
F X (0) = P(X = 0) =
32
3
F X (1) = P(X = 0) + P(X = 1) =
16
1
F X (2) = P(X = 0) + P(X = 1) + P(X = 2) =
2
13
F X (3) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) =
16
31
F X (4) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) =
32
F X (5) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5) = 1
Rappresentiamo questi valori su di un grafico:

1.2
1.1
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1

-3 -2 -1 0 1 2 3 4 5 6 7
-0.1
-0.2

Definizione Variabile aleatoria geometrica


• schema di prove ripetute indipendenti Bernoulliane
• le prove sono ripetute fino all'ottenimento del primo successo
Considero lo spazio campionario Ω, lo spazio Bernoulliano delle sequenze binarie di
lunghezza infinita.
Sia:
X → R
"n° di prove necessario
X:
� → X(�) = ad ottenre il primo
successo"
Sia p la probabilità di successo nella prima prova.
Diremo che X è una V.A. geometrica.
X ∼ GE(p)
Osservazione
Il supporto è:
supporto numerabile
⏜⏟⏟⏟
⏝⏟⏟⏟

S = { 1, 2, 3, … } = N *
Osservazione
La densità discreta si determina come segue:
il primo
successo
che pone fine
all'esperimento

P X=k = (1 - p)(1 - p) ⋅…⋅ (1 - p) ⋅ ⏜⏟⏟⏟


⏝⏟⏟⏟
p ⏞ = p(1 - p) k-1 , k = 1, 2, 3, (2)

⏠⏣⏣
⏡⏣⏣

n° di prove ⏠⏣⏣⏣⏣⏣ ⏡⏣⏣⏣⏣⏣
k-1 fallienti ⏢
ncessarie per
avre un successo
sia proprio k

Non ci sono coefficienti perché esiste una sola sequenza di questo tipo:(f, f, f, … , s)
Osservazione (è sufficinte fermarsi al primo successo)
Perché si potrebbe pensare di considerare una successione di infinite prove (che del
resto
definiscono lo spazio dei campioni).
Però quando valuto P(X = k) di fatto considero una sequenza di lunghezza k:
k = 3 → P(X = 3)
Lancio la moneta ripetutamente, vorrei sapere la probabilità di avere il primo successo
alla
terza prova.
La mia sequenza dovrà perciò essere:
(f, f, s)
Però noi stiamo dicendo che lo spazio campionario è formato da sequenza di infiniti lanci.
Quindi se immagino di aggiungere una quarta "inutile" prova:
f, f, s , s = �'

(f, f, s) 2 possibilità

f, f, s , f = �''
Queste due possibilità hanno in comune la parte quadrettata, che è poi la sequenza di 3
prove, che di fatto ci interessava.
Immaginiamo di voler valutare:
scritto così per
semplicità di fatto è
l'insieme di tutte le
sequenze che hanno
queste prime 4 coordinate

P
⏜⏟⏟⏟⏟
⏝⏟⏟⏟⏟
�'
⏞ = ( 1 - p) 2 p 2

P({ �'' }) = (1 - p) 3 p
P(� = (f, f, s)) = P � = (f, f, s, s) ∪ � = (f, f, s, s) = P({ �' }) + P({ �'' }) =
⏠⏣⏣⏣⏣⏣⏣⏣
quantità⏡⏣⏣⏣⏣⏣⏣⏣
disgiunte ⏢
2 2 3 2 2 (3)
Se no prendiamo (2) e poniamo k=3 otteniamo proprio:
p(1 - p) k-1 = p(1 - p) 3-1 = p(1 - p) 2
Che è proprio ciò che abbiamo ottenuto in (3)
Perciò va benissimo fermarsi al primo successo.
Osservazione
ci aspettiamo che essa serie geometrica
dia valore 1 perché
stiamo sommando su ⏜⏟⏟⏟
⏝⏟⏟⏟ ⏞
equivalgo
tutto il supporto cambiando
l'esponente
⏜⏟⏟⏟
∞ ⏝⏟⏟⏟
⏞ ∞ ∞
1
∑ P(X = k) = ∑ (1 - p) ∑
k-1 ⏜⏟⏟
⏝⏟⏟
k ⏞
p=p ( 1 - p) =p =1
k=1 k=1 k = 0 ⏠⏣⏣⏡⏣⏣ ⏢ 1 - ( 1 - p)
⏠⏣⏣ ⏡⏣⏣ ∈ (0,1)

sposto l'indice

Proprietà Assenza di memoria


Fissato m > 0 , sia X ∼ GE(p). Allora
condizionatamene
al fatto che il numero
delle prove necessarie
ad avere k+m eventi è
maggiore di k

P X = k + m|
⏜⏟⏟⏟ X>k
⏝⏟⏟⏟ ⏞ = P(X = m)
⏠⏣⏣⏣⏣⏣⏣ ⏡⏣⏣⏣⏣⏣⏣ ⏠⏣⏣⏣ ⏡⏣⏣⏣ ⏢
la probabilità che ci si fermi alla ⏢ probabilità di avere
prova k+m il primo successo
nella prova m
Io lancio la moneta e ottengo sempre fallimento, fallimento, fallimento, fallimento.....
Sono arrivato al lancio k.
La probabilità di avere il primo successo tra m lanci, considerato che ho già lanciato k
volte,
è uguale alla probabilità di avere il successo al lancio m-esimo partendo dall'inizio.
cioé io perdo la memoria.
Ciò che è successo nel passato non è più importante le probabilità non si modificano.
Dimostrazione
è evidente che X=k+m ⊂ X>k
perchè se X=k+m allora è anche
più grande di k, ma anziché parlare
di un solo valore prendo un qualunque
valore maggiore di k
⏜⏟⏟⏟⏟⏟ ⏝⏟⏟⏟⏟⏟
intersezione tra i due eventi ⏞

P
⏜⏟⏟⏟⏟ ⏝⏟⏟⏟⏟
X = k + m, X > k

P(X = k + m|X > k) = =
P(X > k)
⏠⏣⏣⏣⏣⏣⏣
definizione ⏡
di⏣⏣⏣⏣⏣⏣
probabilità ⏢
condizionata
densità discreta
GE(p)
⏜⏟⏟⏟
⏝⏟⏟⏟⏞
k+m-1
P(x = k + m) p( 1 - p) p(1 - p) k+m-1
= = ∞
= ∞ k
=
P(X > k)
∑ p( 1 - p) j-1 ∑ p( 1 - p) j-1
- ∑ p( 1 - p) j-1
j=k+1 j=1 j=1
⏠⏣⏣⏣ ⏡⏣⏣⏣
siccome guardo ⏢
X>k ⏠⏣⏣⏣ ⏡⏣⏣⏣
serie geometrica⏢ somma
⏠⏣⏣⏣ ⏡⏣⏣⏣
parziale ⏢
della
devo andare da k+1 fino ad ∞ serie geometrica
⏠⏣⏣⏣⏣⏣⏣
scriviamo⏡ci⏣⏣⏣⏣⏣⏣
la serie ⏢
completa e togliamo i termini
che abbiamo aggiunto
p(1 - p) k+m-1 p(1 - p) k+m-1
= = k
= p(1 - p) m-1 = P(X = m) QED ⊠
1 1-(1-p) k 1 - 1 + ( 1 - p)
p 1 - (1 - p ) - p 1 - (1 - p )

Definizione Variabile Aleatoria Binomiale Negativa


• Schema di prove ripetute indipendenti di tipo Bernoulliano
• Spazio campionario Bernoulliano con le sequenze infinite
Sia:
X → R
"n° di prove necessario
X:
� → X(�) = ad ottenere l'r-esimo
successo"
Fisso un numero r e mi chiedo quale sia il numero di prove necessarie ad ottenre l'r-
esimo
successo,
r = 1, 2, 3, …
Sia poi p la probabilità di successo nella singola prova:
Chiameremo X Binomiale Negativa e scriveremo:
X ∼ NBIN(r, p)
Osservazione supporto
Abbimo:

S= r , r + 1, r + 2, …

il n° di prove
per ottenere r successi
non può essere meno di r

Osservazione densità discreta


La densità discreta di X è la seguente:
k-r fallimenti
⏜⏟⏟⏟
⏝⏟⏟⏟ ⏞ k-1
P(X = k) = p r ⋅ (1 - p) k-r ⋅ r-1
, k∈S

r successi ⏠⏣⏣
⏡⏣⏣

contiamo il numero
di sequenze favorevoli
con r successi e
k-r fallimenti
k-1
Come mai ?
r-1
r=3
Per capire facciamo un esempio con
k=6
Una delle possibili sequenze favorevoli è:
6^ posizione
cioè la k-esima
è fissa
⏜⏟⏟⏟
⏝⏟⏟⏟

s, f, f, s, f , s
⏠⏣⏣⏣
mi ⏡⏣⏣⏣
rimangono ⏢
da
ruotare "solo" le
precedenti k-1 posizioni
in esse rimangono "solo"
più r-1 successi

Per tutte le sequenze favorevoli a { X = 6 } l'ultima posizione è occupata da successo = s.

Osservazione relazione con GE(p)


Se poniamo:
X ∼ NBIN(1, p) = GE(p)
Quindi la Geometrica è un caso particolare della binomiale negativa.

Inoltre, prendiamo una possibile sequenza:

f, f, s , f, s , f, f, f, s (4)

Mi fermo al terzo successo, la lunghezza della sequenza è 9.


Ho contato il numero di prove che mi sono servite per arrivare al terzo successo.
Ogni sottosequenza quadrettata in (4) è relativa a V.A. geometriche.
Perciò
X ∼ NBIN(r, p)
Può essere descritta così:
X = Y 1 + Y 2 +…+ Y r
Dove ognuna di queste V.A.
Y i ∼ GE(p)
e inoltre (Y i ) i è una collezione di V.A. indipendenti.
Abbiamo perciò decomposto la V.A. non negativa in una somma di V.A. geometriche.

Potrebbero piacerti anche