Sei sulla pagina 1di 35

G.

Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali


1
Le distribuzioni di
probabilit discrete
Giovanni Filatrella (filatrella@unisannio.it)
Elaborazione Statistica dei Dati Sperimentali
Facolt di Scienze MM FF e NN, Universit Sannio
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
2
Cos una distribuzione di
probabilit discreta
Abbiamo definito una variabile casuale X una
variabile che pu assumere diversi valori:
{x
1
, x
2
, , x
N
}
Ognuno di questi con probabilit:
{p
1
, p
2
, , p
N
}
La funzione che associa una probabilit p
i
al valore i-
esimo della variabile casuale x
i
la distribuzione
di probabilit.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
3
Attenzione a non confondere i
seguenti 4 concetti:

1. X il simbolo che denota la variabile casuale
che pu assumere i valori {x
i
}
2. Lindice i serve solo a numerare i possibili
risultati
3. Le x
i
sono i valori numerici che si ottengono per
li-esimo risultato
4. Le p
i
sono il rapporto fra i casi favorevoli alli-
esimo risultato e tutti i risultati possibili
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
4
Attenzione a non confondere i
seguenti 4 concetti:

1. X il simbolo che denota la variabile casuale
che pu assumere i valori {x
i
}
2. Lindice i serve solo a numerare i possibili
risultati
3. Le x
i
sono i valori numerici che si ottengono per
li-esimo risultato
4. Le p
i
sono il rapporto fra i casi favorevoli alli-
esimo risultato e tutti i risultati possibili
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
5
1.0 1.2 1.4 1.6 1.8 2.0 2.2 2.4
P
r
o
b
a
b
i
l
i
t


0.15
x
i
La funzione distribuzione
la legge che regola
le probabilit (le altezze
dei rettangoli).
Rappresentazione grafica:
Variabile casuale
0.10
0.05
0.20
0.25
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
6
Unimportante distinzione
Il concetto di distribuzione discreta vuol
dire che solo un numero intero di
differenti valori possibile, e si riferisce
allindice i;
Il valore della variabile x
i
non
necessariamente un intero.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
7
Esempio: la distribuzione di
probabilit uniforme:
Se supponiamo che tutti valori della
variabile casuale siano equiprobabili:
N i p p
i
,..., 1 = =
Allora la distribuzione detta uniforme.

D.: Quanto vale p?
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
8
Valore aspettato e varianza
Per le variabili discrete possibile definire un
valore aspettato E[x] ed una varianza Var[x] che
sono analoghe alle misure di posizione e
dispersione valore medio e scarto quadratico
medio:

=
= =
max
1
] [
i
i
i i
p x x E

=
= =
max
1
2 2
) ( ] [
i
i
i i
p x x Var o
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
9
Valore aspettato e varianza
non coincidono con media e scarto
quadratico medio

=
= =
max
1
] [
i
i
i i
p x x E

=
= =
max
1
2 2
) ( ] [
i
i
i i
p x x Var o

=
=
max
1
i
i
i i
f x x

=
=
max
1
2 2
) (
i
i
i i
f x x S
Per un numero di tentativi molto elevato
ragionevole che si identifichino le f
i
e le p
i
.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
10
Esercizio:
*Quanto vale il valore aspettato per la
distribuzione uniforme?
***Quanto vale la varianza per la
distribuzione uniforme?

Si provi prima con un intervallo specifico
(ex, 4) e poi con un N generico.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
11
Definizione formale di processo
binomiale o bernoulliano
1) Ciascuna prova ha solo due esiti, che
chiameremo successo e insuccesso
2) La probabilit p di un successo in ciascuna
prova resta costante per tutte le prove e
non influenzata dagli esiti precedenti
(le prove sono indipendenti). La
probabilit di un insuccesso q = 1 - p.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
12
Diagramma ad albero per la
distribuzione binomiale
Si pu derivare la
distribuzione
binomiale
immaginando che il
processo avvenga in
sequenza, e che ad
ogni scelta sia
associata una
probabilit
elementare
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
13
Calcolo esplicito delle
probabilit per lalbero
binomiale
La probabilit degli
eventi e pu
essere trovata
osservando che
ognuno dei risultati
la combinazione
di eventi
indipendenti non
necessariamente
equiprobabili,
ovvero p=q
S: un cliente sceglie soup, F: sceglie fish.
Prob. di
avere:
3S
2S
2S
1S
2S
1S
1S
0S
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
14
Probabilit non identiche fra le
pi scelte
Notare:
i diagrammi ad
albero possono
essere utilizzati
per il calcolo di
probabilit di
sequenze
generiche, ma non
sono distribuzioni
binomiali!
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
15
Distribuzione binomiale in
formule
Dato un esperimento che si pu verificare
solo in due modi (successo ed
insuccesso) mutuamente esclusivi e
complementari, quindi con probabilit p e 1-
p. Qual la probabilit di avere n successi
su N misure?
)! ( !
!
) 1 ( ) (
,
n N n
N
N
n
p p
N
n
n B
n N n
N p

|
|
.
|

\
|

|
|
.
|

\
|
=

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali


16
Definizione di fattoriale
Il fattoriale di un numero intero n si indica
con n! ed definito come:
1 ! 0
1 ! 1
,..., 3 2 1 !
=
=
= n n
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
17
Esempi di distribuzione
binomiale
1. Quante teste si ottengono lanciando 10 monete?
2. Se il 23% della popolazione della provincia di
Benevento risiede nel capoluogo, su 4 persone
quante risiederanno nel capoluogo?
3. Se una fabbrica produce l1% di pezzi difettosi,
in un lotto di 20 quanti sono difettosi?
D1.: Sono distribuzioni binomiali? Perch?
D2.: Trovare per ognuno degli esempi i parametri
della distribuzione binomiale.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
18
Propriet della distribuzione
binomiale: il valore aspettato

=

=
=
|
|
.
|

\
|
= = =
N
n
n N n
i
i
i
i
Np p p
N
n
n p x x E
0 1
) 1 ( ] [
max

Coincide, come intuibile, con il prodotto


del numero di tentativi per la probabilit
di successo.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
19
Propriet della distribuzione
binomiale: la varianza

=
=
|
|
.
|

\
|
=
= = =
N
n
n N n
i
i
i i
p Np p p
N
n
Np n
p x x Var
0
2
1
2 2
) 1 ( ) 1 ( ) (
) ( ] [
max
o
E proporzionale al numero di tentativi,
moltiplicata per la probabilit di
successo e per la probabilit di
insuccesso.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
20
Esempi di
distribuzioni
binomiali
Ci che conta e
il prodotto Np
Infatti:
0.5X160 = 80
0.3X270 = 80
p=0.5
p=0.3
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
21
Un esempio numerico
Se si lanciano dieci monete supposte
perfettamente simmetriche (o non truccate),
cosa si pu dire dei possibili esiti?
1) La probabilit di successo p=1/2
2) Il numero di tentativi N=10
3) Il valore aspettato Np=5
4) La varianza Np(1-p)=2.5
5) La deviazione standard (Np(1-p))=1.58
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
22
Risultati del calcolo della
formula binomiale per N=10,
p=0.5
Successi B
0.5,10
(n)
n
0 0.0010
1 0.0098
2 0.0439
3 0.1172
4 0.2051
5 0.2461
6 0.2051
7 0.1172
8 0.0439
9 0.0098
10 0.0010

Il valore aspettato (5)
il pi probabile

Attorno al valore aspettato
in un intervallo di semiampiezza
la deviazione standard (1.5) si
trovano circa il 70% dei casi.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
23
Unapplicazione
Le finali di alcuni tornei di calcio si decidono
calciando 6 rigori.
D.: il pareggio dopo sei rigori succeder pi spesso
se:
a) La probabilit di segnare per entrambe le
squadre alta (ex, p=0.8)
b) La probabilit di segnare per entrambe le
squadre media (ex, p=0.5)
c) La probabilit di segnare per entrambe le
squadre bassa (ex, p=0.2)


G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
24
Distribuzione di Poisson
Supponiamo di avere una variabile binomiale dove
1. Il numero molto elevato di tentativi (N)
2. La probabilit molto bassa (p0), ma in modo
tale che il valore aspettato sia finito: Np=.
Qual la distribuzione di probabilit?
In principio si potrebbe sempre calcolare la
Binomiale, ma i fattoriali rendono il calcolo
estremamente laborioso.
La distribuzione di Poisson il limite della
Binomiale nelle ipotesi 1) e 2).
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
25
Esempi di distribuzione di
Poisson
1. Quanti studenti iscritti in questa Facolt
hanno un altezza superiore al 95
mo

percentile?
2. Una malattia rara colpisce l1% della
popolazione. Quante persone sono colpite
in una citt come Benevento?
3. Quanti dei residenti in Benevento sono
nati il 29 febbraio?

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
26
Distribuzione di Poisson:
formulazione matematica
La distribuzione di Poisson ha un solo parametro: .
Ovviamente se il valore aspettato : Np=.
D.: Trovare le distribuzioni di probabilit per gli
esempi precedenti.

= e
n
n P
n
!
) (
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
27
Distribuzione di Poisson:
formulazione matematica
La distribuzione di Poisson ha un solo parametro:
Ovviamente se il valore aspettato : Np=:

= e
n
n P
n
!
) (

=
= = = =
0 1
!
] [
max
n
n
i
i
i
i
e
n
n p x x E

=
= = = =
0
2
1
2 2
!
) ( ) ( ] [
max
n
n i
i
i i
e
n
n p x x Var

La varianza anche vale :


G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
28
Confronto con la distribuzione
di Bernoulli
Bernoulli
= Np si ricava da
due parametri
indipendenti
o
2
= Np(1-p) si
potrebbe anche
scrivere come:
o
2
= (1-p)
Per p molto piccola
o
2
~
Poisson
lunico parametro
che caratterizza la
distribuzione
si trova che la
varianza dipende dal
parametro e
o
2
=
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
29
Osservazioni (1)
Un processo per essere poissoniano
dovrebbe ammettere un numero infinito di
tentativi e quindi ammettere un numero
infinito di successi.
In pratica si applica a casi in cui questo
solo approssimativamente vero.
D: negli esempi di distribuzione di Poisson
precedente c un limite al numero di
successi? Quale?
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
30
Osservazioni (2)
Anche se tutti i processi reali sono solo
approssimativamente poissoniani assai comodo
utilizzare questa distribuzione perch pi
semplice da valutare. Di fatto per N molto
grande i fattoriale della distribuzione di
Bernoulli sono enormi.
D: qual lintero pi grande di cui potete calcolare
il fattoriale con la calcolatrice da tasca?
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
31
Estensione della distribuzione
di Poisson
Supponete che per un evento non si conosca
davvero il numero di tentativi:
Es.: Supponiamo che una persona guardi
mezzora di una qualsiasi partita di un turno
di serie A. Se sono state segnate 22 reti
nelle 9 partite, qual la probabilit che
questa persona assista a 2 reti?
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
32
Perch si pu usare la
distribuzione di Poisson
Si pu immaginare che nellintervallo di tempo
considerato vi siano N tentativi di fare goal.
La probabilit p di fare goal per ogni tentativo
sconosciuta, ma bassa perch in tutto si sono
segnate solo 22 reti in 9 partite.
Se supponiamo che i tentativi siano molti (al
limite, infiniti) in principio possiamo usare la
distribuzione di Poisson, e per farlo basterebbe
conoscere il suo valore medio =Np.
D.: Come si pu stimare =Np?
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
33
Soluzione
In tutte le 9 partite vi sono 27 periodi di
mezzora.
Se sono stati segnati 22 goal in tutto, in
media in ogni periodo sono stati segnati:
( )
% 15 15 . 0
! 2
815 . 0
) 2 ( 815 . 0
27
22
815 . 0
2
815 . 0
= ~ = = =

e P
D.: ** Come verifichereste che il metodo
funziona? Provare a casa con i risultati di
un qualsiasi turno di serie A.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
34
Descrizione formale dei
processi di Poisson
Un processo di Poisson si pu quindi definire come un
processo caratterizzato da n eventi che in un intervallo
di tempo At :
1. Si possono verificare nellintervallo di tempo
indipendentemente da quanto avvenuto negli
intervalli precedenti;
2. La probabilit che si verifichi un evento
proporzionale alla durata dellintervallo At, con
costante di proporzionalit ;
Allora si avr un processo di Poisson con valore aspettato
=At:
t
n
e
n
t
t n P
A
A
= A

!
) (
) , (
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
35
Esercizi
1. * Nellesempio precedente dei goal segnati in
mezzora, identificare le varie quantit n, At, .
2. ** Supponiamo che in un lago artificiale senza
altro cibo vengono immesse trote, una ogni 10
minuti. Se ci sono 10 pescatori:
a) Quante trote prenderanno ogni ora?
b) Trovare i parametri del processo di Poisson.

Potrebbero piacerti anche