0.15
x
i
La funzione distribuzione
la legge che regola
le probabilit (le altezze
dei rettangoli).
Rappresentazione grafica:
Variabile casuale
0.10
0.05
0.20
0.25
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
6
Unimportante distinzione
Il concetto di distribuzione discreta vuol
dire che solo un numero intero di
differenti valori possibile, e si riferisce
allindice i;
Il valore della variabile x
i
non
necessariamente un intero.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
7
Esempio: la distribuzione di
probabilit uniforme:
Se supponiamo che tutti valori della
variabile casuale siano equiprobabili:
N i p p
i
,..., 1 = =
Allora la distribuzione detta uniforme.
D.: Quanto vale p?
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
8
Valore aspettato e varianza
Per le variabili discrete possibile definire un
valore aspettato E[x] ed una varianza Var[x] che
sono analoghe alle misure di posizione e
dispersione valore medio e scarto quadratico
medio:
=
= =
max
1
] [
i
i
i i
p x x E
=
= =
max
1
2 2
) ( ] [
i
i
i i
p x x Var o
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
9
Valore aspettato e varianza
non coincidono con media e scarto
quadratico medio
=
= =
max
1
] [
i
i
i i
p x x E
=
= =
max
1
2 2
) ( ] [
i
i
i i
p x x Var o
=
=
max
1
i
i
i i
f x x
=
=
max
1
2 2
) (
i
i
i i
f x x S
Per un numero di tentativi molto elevato
ragionevole che si identifichino le f
i
e le p
i
.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
10
Esercizio:
*Quanto vale il valore aspettato per la
distribuzione uniforme?
***Quanto vale la varianza per la
distribuzione uniforme?
Si provi prima con un intervallo specifico
(ex, 4) e poi con un N generico.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
11
Definizione formale di processo
binomiale o bernoulliano
1) Ciascuna prova ha solo due esiti, che
chiameremo successo e insuccesso
2) La probabilit p di un successo in ciascuna
prova resta costante per tutte le prove e
non influenzata dagli esiti precedenti
(le prove sono indipendenti). La
probabilit di un insuccesso q = 1 - p.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
12
Diagramma ad albero per la
distribuzione binomiale
Si pu derivare la
distribuzione
binomiale
immaginando che il
processo avvenga in
sequenza, e che ad
ogni scelta sia
associata una
probabilit
elementare
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
13
Calcolo esplicito delle
probabilit per lalbero
binomiale
La probabilit degli
eventi e pu
essere trovata
osservando che
ognuno dei risultati
la combinazione
di eventi
indipendenti non
necessariamente
equiprobabili,
ovvero p=q
S: un cliente sceglie soup, F: sceglie fish.
Prob. di
avere:
3S
2S
2S
1S
2S
1S
1S
0S
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
14
Probabilit non identiche fra le
pi scelte
Notare:
i diagrammi ad
albero possono
essere utilizzati
per il calcolo di
probabilit di
sequenze
generiche, ma non
sono distribuzioni
binomiali!
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
15
Distribuzione binomiale in
formule
Dato un esperimento che si pu verificare
solo in due modi (successo ed
insuccesso) mutuamente esclusivi e
complementari, quindi con probabilit p e 1-
p. Qual la probabilit di avere n successi
su N misure?
)! ( !
!
) 1 ( ) (
,
n N n
N
N
n
p p
N
n
n B
n N n
N p
|
|
.
|
\
|
|
|
.
|
\
|
=
=
=
|
|
.
|
\
|
= = =
N
n
n N n
i
i
i
i
Np p p
N
n
n p x x E
0 1
) 1 ( ] [
max
=
=
|
|
.
|
\
|
=
= = =
N
n
n N n
i
i
i i
p Np p p
N
n
Np n
p x x Var
0
2
1
2 2
) 1 ( ) 1 ( ) (
) ( ] [
max
o
E proporzionale al numero di tentativi,
moltiplicata per la probabilit di
successo e per la probabilit di
insuccesso.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
20
Esempi di
distribuzioni
binomiali
Ci che conta e
il prodotto Np
Infatti:
0.5X160 = 80
0.3X270 = 80
p=0.5
p=0.3
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
21
Un esempio numerico
Se si lanciano dieci monete supposte
perfettamente simmetriche (o non truccate),
cosa si pu dire dei possibili esiti?
1) La probabilit di successo p=1/2
2) Il numero di tentativi N=10
3) Il valore aspettato Np=5
4) La varianza Np(1-p)=2.5
5) La deviazione standard (Np(1-p))=1.58
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
22
Risultati del calcolo della
formula binomiale per N=10,
p=0.5
Successi B
0.5,10
(n)
n
0 0.0010
1 0.0098
2 0.0439
3 0.1172
4 0.2051
5 0.2461
6 0.2051
7 0.1172
8 0.0439
9 0.0098
10 0.0010
Il valore aspettato (5)
il pi probabile
Attorno al valore aspettato
in un intervallo di semiampiezza
la deviazione standard (1.5) si
trovano circa il 70% dei casi.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
23
Unapplicazione
Le finali di alcuni tornei di calcio si decidono
calciando 6 rigori.
D.: il pareggio dopo sei rigori succeder pi spesso
se:
a) La probabilit di segnare per entrambe le
squadre alta (ex, p=0.8)
b) La probabilit di segnare per entrambe le
squadre media (ex, p=0.5)
c) La probabilit di segnare per entrambe le
squadre bassa (ex, p=0.2)
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
24
Distribuzione di Poisson
Supponiamo di avere una variabile binomiale dove
1. Il numero molto elevato di tentativi (N)
2. La probabilit molto bassa (p0), ma in modo
tale che il valore aspettato sia finito: Np=.
Qual la distribuzione di probabilit?
In principio si potrebbe sempre calcolare la
Binomiale, ma i fattoriali rendono il calcolo
estremamente laborioso.
La distribuzione di Poisson il limite della
Binomiale nelle ipotesi 1) e 2).
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
25
Esempi di distribuzione di
Poisson
1. Quanti studenti iscritti in questa Facolt
hanno un altezza superiore al 95
mo
percentile?
2. Una malattia rara colpisce l1% della
popolazione. Quante persone sono colpite
in una citt come Benevento?
3. Quanti dei residenti in Benevento sono
nati il 29 febbraio?
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
26
Distribuzione di Poisson:
formulazione matematica
La distribuzione di Poisson ha un solo parametro: .
Ovviamente se il valore aspettato : Np=.
D.: Trovare le distribuzioni di probabilit per gli
esempi precedenti.
= e
n
n P
n
!
) (
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
27
Distribuzione di Poisson:
formulazione matematica
La distribuzione di Poisson ha un solo parametro:
Ovviamente se il valore aspettato : Np=:
= e
n
n P
n
!
) (
=
= = = =
0 1
!
] [
max
n
n
i
i
i
i
e
n
n p x x E
=
= = = =
0
2
1
2 2
!
) ( ) ( ] [
max
n
n i
i
i i
e
n
n p x x Var
e P
D.: ** Come verifichereste che il metodo
funziona? Provare a casa con i risultati di
un qualsiasi turno di serie A.
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
34
Descrizione formale dei
processi di Poisson
Un processo di Poisson si pu quindi definire come un
processo caratterizzato da n eventi che in un intervallo
di tempo At :
1. Si possono verificare nellintervallo di tempo
indipendentemente da quanto avvenuto negli
intervalli precedenti;
2. La probabilit che si verifichi un evento
proporzionale alla durata dellintervallo At, con
costante di proporzionalit ;
Allora si avr un processo di Poisson con valore aspettato
=At:
t
n
e
n
t
t n P
A
A
= A
!
) (
) , (
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
35
Esercizi
1. * Nellesempio precedente dei goal segnati in
mezzora, identificare le varie quantit n, At, .
2. ** Supponiamo che in un lago artificiale senza
altro cibo vengono immesse trote, una ogni 10
minuti. Se ci sono 10 pescatori:
a) Quante trote prenderanno ogni ora?
b) Trovare i parametri del processo di Poisson.