Sei sulla pagina 1di 57

MODELLI DI PROBABILITA NOTEVOLI

VARIABILI ALEATORIE DISCRETE

Modello di Bernoulli

Il più semplice ed anche il più antico modello di probabilità per variabili aleatorie discrete è il modello
di Bernoulli dal nome del matematico e fisico svizzero Jacob Bernoulli vissuto nella seconda metà
del XVII secolo.

Consideriamo un esperimento E il cui Spazio S è costituito da due soli eventi elementari A e A . Sia
X la variabile aleatoria discreta definita su S che, in corrispondenza di tali eventi, assume due
assegnati valori numerici, ad esempio 0 e 1.

Un semplice esempio di esperimento bernoulliano è rappresentato dal "lancio di una moneta" che
ammette i due classici risultati testa e croce.

Ma, in effetti, esistono molti altri contesti di maggiore interesse applicativo, a cui è associato uno
spazio di tipo bernoulliano. Ad esempio, situazioni in cui sono presenti le alternative: uomo/donna,
conforme/non conforme ad assegnate specifiche, funzionante/guasto, etc..
In base agli assiomi della TdP, il modello di probabilità bernoulliano è completamente definito
quando sia assegnata la probabilità di verificarsi di uno dei suoi due eventi ( X = 1) o ( X = 0) . Infatti,
posto
Pr( X = 1) = p Pr( X = 0) = q
essendo i due eventi elementari incompatibili per definizione ed esaustivi dell'intero spazio, come
conseguenza del I e III assioma della TdP si ha
Pr( S ) = Pr( X = 1) + Pr( X = 0) = p + q = 1
per cui, nota, ad esempio, la probabilità p si ha q = 1 − p (o viceversa).
La funzione massa di probabilità e la funzione di distribuzione della variabile aleatoria di Bernoulli
hanno, pertanto, la seguente forma grafica.
p(x) F(x)

1 1

0 1 x (1) 0 1 x (2)
Si osservi che i valori numerici assegnati alla variabile aleatoria X sono generalmente dei valori
convenzionali, in quanto gli eventi osservabili sono tipicamente delle grandezze di tipo nominale
(variabili qualitative) e, quindi, la scelta di tali valori (ad esempio, 0 e 1) è basata essenzialmente su
esigenze di semplicità.

Ovviamente, quantità come il valore atteso o la varianza della variabile aleatoria X dipenderanno
dai valori numerici scelti.

Ciò premesso, posto Pr( X = 1) = p , il valore atteso della variabile aleatoria discreta X è dato da

E( X ) = 0 (1 − p) + 1 p = p

mentre la varianza è data da

Var( X ) = (0 − p) 2 (1 − p) + (1 − p) 2 p = p(1 − p)
Modello Binomiale

Si abbia un esperimento bernoulliano i cui due eventi elementari A e A si verificano con probabilità
rispettivamente pari a p e q = 1 − p .

Si consideri, ora, l'esperimento composto generato dall'esecuzione di n esperimenti bernoulliani


indipendenti tra loro e caratterizzati da una identica probabilità del verificarsi degli eventi A e A .

Il generico evento elementare di questo esperimento composto sarà costituito da una sequenza di
n eventi di tipo A e di tipo A disposti in un certo ordine.

Definiamo, sullo spazio dell'esperimento composto, la variabile aleatoria X che conta il numero di
volte che l'evento A si presenta in ciascuna sequenza di n prove.

Ovviamente, X è una variabile aleatoria discreta che può assumere valori interi compresi tra 0 e n.
Se con X i indichiamo la variabile aleatoria associata all'i-esimo (i = 1,..., n) esperimento
bernoulliano, la quale assume i valori 1 e 0 in corrispondenza, rispettivamente, degli eventi A e A ,
è facile riconoscere che la variabile aleatoria X può anche essere vista come somma delle n variabili
aleatorie X i , cioè
n
X= X
i =1 i

ed è immediato dimostrare che la funzione di probabilità della variabile aleatoria X è data da


n x
Pr X = x = p (1 − p ) n− x
x

n n!
in cui = indica il numero di combinazioni di n elementi su x posti.
x x ! (n − x)!

Infatti, posto Pr( A) = p e Pr( A) = 1 − p , in virtù dell'indipendenza degli esperimenti, la probabilità di


osservare una specifica sequenza di n eventi in cui sono presenti x eventi di tipo A e (n − x) eventi
di tipo A , è pari a
p x (1 − p ) n− x
Ma, per fissati valori di n e x , esistono
n n!
=
x (n − x)! x !

sequenze che, pur contenendo lo stesso numero x di elementi di tipo A , differiscono tra loro per il
posto in esse occupato da tali eventi e, di conseguenza, anche per il posto occupato dagli n − x
eventi di tipo A . Ognuna di tali sequenze rappresenta un evento elementare dell'esperimento
composto.

L'evento x risultati di tipo A su n prove è, pertanto, costituito dall'unione dei suddetti eventi
elementari i quali, ovviamente, sono eventi mutuamente esclusivi tra loro.

Per il III assioma della TdP, pertanto, la probabilità di tale evento è la somma delle probabilità dei
singoli eventi elementari che lo compongono i quali, essendo equiprobabili, portano al seguente
risultato
n x
Pr X = x = p (1 − p ) n− x
x
che prende il nome di funzione di probabilità Binomiale.
Tale funzione dipende dai due parametri: n (numero di prove) e p (probabilità dell'evento A ). Tale
aspetto può essere esplicitamente evidenziato usando la notazione
Pr X = x = Bi( x | n, p )

La funzione di probabilità Binomiale è simmetrica se p = 0.5 , mentre è asimmetrica in tutti gli altri
casi, come esemplificativamente mostrato nelle figure seguenti nel caso di n = 5 .

0.4 0.6
Bi( x | n=5, p=0.5) Bi( x | n=5, p=0.1)

0.3
0.4

0.2

0.2

0.1

0 0
-1 0 1 2 3 4 5 6 x 7 (3) -1 0 1 2 3 4 5 6 x 7 (4)
Il massimo di tale funzione si ha in corrispondenza di (n + 1) p e di (n + 1) p − 1 se (n + 1) p è un numero
intero, mentre si ha in corrispondenza della parte intera della quantità (n + 1) p se tale valore non è
un intero.

Con riferimento ai grafici precedenti, risulta infatti

a) (n + 1) p = 6 0.5 = 3 max → x = 2
x=3

b) (n + 1) p = 6 0.1 = 0.6 max → x = 0

Esempio: In una linea di produzione si esegue una lavorazione all'esito della quale il componente
prodotto può risultare conforme o non conforme rispetto ad assegnate specifiche di progetto.
Assumendo che le singole lavorazioni si possano considerare degli esperimenti indipendenti e che,
in ogni singola lavorazione, la probabilità di produrre un componente non conforme sia pari a
p = 0.02 , determinare la probabilità che, su n = 100 componenti prodotti, si abbiano esattamente 5
elementi difettosi.
Le ipotesi alla base del quesito sono coerenti con l'applicazione di un modello Binomiale, pertanto,
la probabilità richiesta può essere calcolata mediante la relazione

100 5
Bi( x = 5 | n = 100, p = 0.02) = p (1 − p )95
5
100!
= 0.025 0.9895 = 0.035
5! 95!

Pertanto, si calcola una probabilità pari al 3.5% che su 100 componenti prodotti esattamente 5
risultino non conformi.

Valore Atteso e Varianza di una variabile aleatoria Binomiale

Si è visto come una variabili aleatoria Binomiale X sia generata dalla somma di n variabili aleatorie
Bernoulliane X i indipendenti, ciascuna delle quali assume i valori 1 e 0, rispettivamente con
probabilità p e (1 − p ) .

Pertanto, ricordando che E( X i ) = p e Var( X i ) = p(1 − p) , risulta

n n
E( X ) = E X
i =1 i
= i =1
E( X i )
n
= i =1
p = np

n n
Var( X ) = Var X
i =1 i
= i =1
Var( X i )
n
= i =1
p (1 − p ) = np (1 − p )
Esempio: In una linea di produzione la probabilità di produrre un componente non conforme in ogni
singola lavorazione è pari a p = 0.02 . Determinare il numero atteso di componenti non conformi in
lotti di n = 100 componenti prodotti, assumendo che le singole lavorazioni si possano considerare
degli esperimenti indipendenti.

In base alle precedenti considerazioni si ha

E( X ) = np = 100 0.02 = 2

Funzione di distribuzione di una variabile aleatoria Binomiale

Sia X una variabile aleatoria Binomiale, e sia x un numero intero compreso tra 0 e n . Sulla base
della funzione di probabilità Binomiale, Bi( x | n, p ) , precedentemente introdotta, segue che la
funzione di distribuzione della variabile aleatoria X ha la seguente forma analitica

x n i
F ( x | n, p ) = Pr X x = p (1 − p ) n−i
i =0 i
Esempio: In una linea di produzione la probabilità di produrre un componente non conforme in ogni
singola lavorazione è pari a p = 0.02 . Determinare la probabilità che, in un lotto di n = 100 componenti
prodotti, ci siano al più x = 5 componenti non conformi assumendo che le singole lavorazioni si
possano considerare degli esperimenti indipendenti.

In base alla definizione di funzione di distribuzione si ha

5 100
Pr X 5 = F (5 |100,0.02) = 0.02i 0.98100−i
i =0 i
100 100 100
= 0.020 0.98100 + 0.021 0.9899 + 0.022 0.9898
0 1 2
100 100 100
+ 0.023 0.9897 + 0.024 0.9896 + 0.025 0.9895
3 4 5
= 0.133 + 0.271 + 0.273 + 0.182 + 0.090 + 0.035
= 0.984
DISTRIBUZIONE GEOMETRICA E DISTRIBUZIONE BINOMIALE NEGATIVA

Distribuzione Geometrica

Come visto, la variabile aleatoria Binomiale conta il numero di "successi" che si osservano in un
numero fissato n di ripetizioni di un esperimento Bernoulliano.

Tuttavia, sempre rimanendo nell'ambito della medesima tipologia di esperimento composto, si può
pensare di definire la variabile aleatoria X che conta il numero di "ripetizioni" dell'esperimento
Bernoulliano necessarie per osservare il primo successo. Pertanto, X è una variabile aleatoria
discreta (non limitata) che assume i valori 1, 2,3,...

Ad esempio, in un processo produttivo la variabile aleatoria X conta il numero di componenti


esaminati prima di trovarne uno non conforme, oppure nel gioco del lotto conta il numero di
estrazioni effettuate prima di osservare un certo ambo, o ancora, relativamente ad un dato fiume,
conta il numero di anni trascorsi prima di osservare una piena critica.
Sotto l'ipotesi di indipendenza degli esperimenti componenti e della costanza del valore p della
probabilità di osservare l'evento di interesse nel singolo esperimento Bernoulliano, la funzione di
probabilità della variabile aleatoria X sopra definita si può determinare facilmente.

Infatti, il primo "successo" si verificherà alla x-esima prova se e solo se si verifica quanto segue

1) nelle prime ( x − 1) prove non si verifica alcun "successo", e tale evento, stante l'indipendenza
degli esperimenti, ha probabilità di verificarsi pari a (1 − p ) x −1
e contestualmente
2) si osserva un "successo" alla prova x, e tale evento, indipendente dal precedente, ha probabilità
di verificarsi pari a p.

Pertanto, la funzione di probabilità della variabile aleatoria X che conta il numero di "ripetizioni", x,
dell'esperimento Bernoulliano necessarie per osservare il primo successo è data da

Pr X = x = (1 − p ) x −1 p x = 1, 2,3,...

Questa legge di probabilità è nota come funzione di probabilità Geometrica di parametro p.


La funzione di distribuzione della variabile aleatoria X è data da

x x
FX ( x | p ) = Pr X x = i =1
(1 − p )i −1 p = p i =1
(1 − p )i −1

x
Ma, poiché (1 − p) 1, il termine i =1
(1 − p )i −1 rappresenta la somma dei primi x termini di una
successione geometrica che dà come risultato (1 − p ) x − 1 / (1 − p) − 1 , da cui segue

FX ( x | p ) = Pr X x = 1 − (1 − p ) x x = 1, 2,3,...

In effetti, tale risultato si può anche ottenere considerando che l'evento X x coincide con l'evento
A = "almeno un successo in x prove" che ha come suo complementare l'evento A = "nessun
successo in x prove" il quale ha probabilità di verificarsi (1 − p ) x e, pertanto,

Pr X x = Pr A = 1 − Pr A = 1 − (1 − p) x
Il valore atteso e la varianza della variabile aleatoria Geometrica sono dati da

1 1− p
E( X ) = Var( X ) =
p p2

Si osservi che il valore atteso della variabile aleatoria Geometrica coincide con il reciproco della
probabilità p del verificarsi dell'evento "successo" nel singolo esperimento Bernoulliano. Ad
esempio, se la probabilità di produrre un elemento non conforme è p = 0.10 , in media ogni 10
elementi prodotti se ne osserverà 1 non conforme.

Distribuzione Binomiale Negativa

Come visto, in presenza di una successione di esperimenti bernoulliani indipendenti, il modello


Geometrico fornisce la probabilità di osservare il primo evento "successo" in corrispondenza di un
fissato numero x di ripetizioni dell'esperimento.

Tale problematica può essere generalizzata, focalizzando l'attenzione sulla probabilità di osservare
il k-esimo evento "successo", con k fissato, in corrispondenza di un assegnato numero x di ripetizioni
dell'esperimento.
Indichiamo con X k la variabile aleatoria che conta il numero di ripetizioni x dell'esperimento fino al
raggiungimento del k-esimo evento "successo".

Osserviamo che l'evento X k = x implica il verificarsi dei seguenti eventi


1) (k − 1) "successi" nelle prime ( x − 1) ripetizioni dell'esperimento, evento che, in virtù
dell'indipendenza degli esperimenti, ha probabilità di verificarsi pari a

x − 1 k −1
p (1 − p ) x −k
k −1

2) 1 "successo" nella k-esima ripetizione, evento che ha probabilità di verificarsi pari a p ed è


indipendente dal precedente.

Si ha, pertanto
x − 1 k −1 x −1 k
Pr X k = x = p (1 − p ) x −k p = p (1 − p ) x −k
k −1 k −1

Tale funzione di probabilità è nota come legge di Pascal o legge Binomiale Negativa.
Il valore atteso e la varianza della variabile aleatoria X k sono dati da

k k (1 − p )
E( X k ) = Var( X k ) =
p p2

Si osservi che tali valori si ottengono moltiplicando per k i corrispondenti momenti della variabile
aleatoria Geometrica. Ciò deriva dal fatto che la variabile aleatoria X k si può interpretare come la
somma di k variabili aleatorie X Geometriche indipendenti di identico parametro p, ciascuna delle
quali rappresenta il numero di prove che intercorrono tra l' (i − 1) -esimo e l' i -esimo "successo" con
i = 1, 2,..., k .
DISTRIBUZIONE DI POISSON

Si è in precedenza visto che, dato un esperimento composto costituito dalla ripetizione di un identico
esperimento Bernoulliano, la legge di probabilità Binomiale consente di calcolare la probabilità che
l'evento "successo" si presenti un numero x di volte in un fissato numero n di ripetizioni
dell'esperimento Bernoulliano.

In molte situazioni pratiche, tuttavia, si è interessati a descrivere il numero di volte che un certo
evento aleatorio, tra due possibili, si presenti in un intervallo di tempo fissato, o in una lunghezza
fissata, cioè in un intervallo numerico continuo piuttosto che in un numero di prove ripetute.

Sia T l'intervallo continuo (di tempo, di lunghezza, etc.) nel quale si è interessati a contare il ripetuto
verificarsi dell'evento aleatorio di interesse. Ad esempio, il numero di autoveicoli che transitano per
un casello autostradale nel corso di T = 1 ore, o il numero di componenti non conformi alle specifiche
prodotti nel corso di T = 8 ore di produzione, etc.
Suddividiamo l'intervallo T in un numero n di sottointervalli di ampiezza piccola ed assumiamo
che siano verificate le seguenti ipotesi:

a) la probabilità che l'evento di interesse A si verifichi una volta in un intervallo di ampiezza è


proporzionale a attraverso la costante di proporzionalità , ovvero

Pr 1 evento in

b) la probabilità che l'evento di interesse A si verifichi più di una volta in uno stesso intervallo di
ampiezza è, al tendere di a zero, un infinitesimo di ordine superiore rispetto alla precedente
probabilità, ovvero

Pr 2 o più eventi in ) 0

c) la probabilità che l'evento di interesse A si verifichi in un certo intervallo di ampiezza non è


influenzata da quanto succede negli altri intervalli, cioè gli eventi di accadimento sono tra loro
indipendenti.
Indichiamo, ora, con X la variabile aleatoria che conta il numero di volte che l'evento A si presenta
nell'intervallo T, e valutiamo la probabilità di osservare esattamente x eventi A in T sotto le ipotesi
introdotte.

Innanzitutto osserviamo che, poiché la probabilità di osservare più di un evento A in uno stesso
intervallo è trascurabile per che tende a zero, si può assumere che ognuno degli x eventi A
che si verificano in T cada in un differente intervallo .

Ne consegue che, stante l'indipendenza degli eventi di accadimento, la probabilità di osservare una
specifica sequenza di x eventi di tipo A è data da

Pr x eventi in T in un ordine fissato ( ) x (1 − ) n− x

Ma, fissato x, il numero di modi diversi in cui gli x eventi A si possono disporre negli n intervalli a
disposizione è dato dal numero di combinazioni di n elementi su x posti, ovvero

n n!
=
x x ! (n − x)!
Ognuna di tali sequenze rappresenta un evento elementare dello spazio dell'esperimento composto
e, in quanto tale, è un evento incompatibile rispetto a tutti gli altri. Pertanto, in base al III assioma
della TdP, si ha
n
Pr X = x in T ( ) x (1 − ) n− x
x

Il valore esatto della probabilità di osservare x eventi di tipo A in T si ottiene effettuando il limite per
che tende a zero e, quindi per n che tende all'infinito, della precedente relazione

n!
lim Pr X = x in T = lim ( ) x (1 − ) n− x
→0 →0 x ! (n − x)!
n→ n→

Se in tale espressione si opera la sostituzione = T / n , si ha


n!
lim Pr X = x in T = lim ( T / n) x (1 − T / n) n− x
→0 n→ x ! (n − x)!
n→
n -x
( T )x T T n!
= lim 1− 1−
n→ x! n n n x (n − x)!
n -x
( T )x T T n!
= lim 1 − lim 1 − lim
x! n→ n n→ n n→ n x (n − x)!
Valgono i seguenti risultati
n
T
lim 1 − = exp(− T )
n→ n
-x
T
lim 1 − =1
n→ n
n! n(n − 1)(n − 2) (n − x + 1)
lim = lim
n→ n x (n − x)! n→ nx
(n − 1) (n − 2) n − x + 1
= lim =1
n→ n n n
Da cui segue
( T )x
lim Pr X = x in T = exp(− Tx)
→0 x!
n→

Questa relazione, che rappresenta la funzione di probabilità della variabile aleatoria X che conta il
numero di volte che l'evento di interesse si verifica nel dominio continuo T, sotto le ipotesi che tali
eventi siano rari e indipendenti, è nota come legge di Poisson.

Come si può notare tale funzione di probabilità è definita dall'unico parametro T . A titolo
esemplificativo, nelle seguenti figure, ne viene mostrato l'andamento in corrispondenza dei valori
T = 1 e T = 10 .
0.4 0.16
Po(x | ⚫T=10)
p(x) p(x)
Po(x | ⚫T=1)
0.3 0.12

0.2 0.08

0.1 0.04

0 0 x
0 2 4 6 x 8 (5) 0 2 4 6 8 10 12 14 16 18 20 22 24 (6)
DISTRIBUZIONE NORMALE (O DI GAUSS)

Si dice che una variabile aleatoria X ha una distribuzione Normale se la sua funzione densità di
probabilità è data da
1 ( x − )2
f ( x) = exp − 2
− x
2 2

in cui − e 0 . Pertanto la variabile aleatoria Normale ha come spazio di definizione


l'insieme dei numeri reali.

Tale modello riveste un ruolo centrale sia nella descrizione di fenomeni naturali, economici, sociali,
tecnologici etc., che nelle procedure di stima statistica di quantità incognite.

Esso venne formulato per la prima volta nella prima metà del XVIII secolo da de Moivre e
successivamente utilizzato da Gauss tra la fine del XVIII e l'inizio del XIX secolo come modello
interpretativo degli "errori di misura" associati alla rilevazione di alcune grandezze di tipo
astronomico. Per tale motivo il modello è spesso indicato come modello di Gauss o modello
Gaussiano.
La denominazione di modello Normale, dovuta a Galton, è invece intervenuta nella seconda metà
del XIX secolo per sottolineare il fatto che tale modello poteva essere applicato ad una grande
varietà di fenomeni anche di natura molto diversa tra loro e non soltanto agli errori di misura, tanto
da rappresentare quasi la "norma" per eventi di natura aleatoria.

In effetti tale caratteristica del modello può essere spiegata su base teorica in virtù del teorema del
limite centrale che in sostanza afferma che se la fluttuazione di una certa grandezza è imputabile al
sovrapporsi degli effetti di un numero elevato di cause diverse, che agiscono in maniera
indipendente tra loro senza che ciascuna di esse sia preponderante rispetto alla altre, allora la
distribuzione di frequenza della grandezza osservata tende ad assumere una forma prossima a
quella di una densità Normale.

Il modello Normale è caratterizzato dai due parametri e . In particolare, la funzione densità è


una funzione simmetrica rispetto al valore x = . Di conseguenza, il parametro rappresenta sia il
valore atteso che il valore mediano della variabile aleatoria X . Inoltre, poiché il valore massimo di
tale funzione si ha proprio in corrispondenza di x = , tale valore rappresenta anche la moda del
modello di probabilità Normale.
3

p(x)

0
-5 -4 -3 -2 -1 0 1 2 3 4 x 5
(7)

Si osservi, poi, che la funzione densità Normale presenta due punti di flesso in corrispondenza dei
valori x1 = − e x2 = + . Pertanto, quanto maggiore è tanto più i punti di flesso si allontanano
da e viceversa. In altri termini, il parametro è una misura di dispersione della variabile aleatoria
X ed è possibile dimostrare che tale parametro in effetti rappresenta la deviazione standard del
modello Normale e, di conseguenza, 2 ne rappresenta la varianza.
Pertanto, nel caso della variabile aleatoria Normale il valore atteso dipende esclusivamente dal
valore del parametro mentre la varianza dipende esclusivamente dal valore del parametro . In
particolare, il modello Normale è l'unico modello di probabilità bi-parametrico a godere di tale
proprietà.

Alla luce di tali caratteristiche spesso si dice che è il parametro di posizione (o di locazione) del
modello perché una sua variazione si traduce in una semplice traslazione della funzione densità
lungo l'asse delle x che ne lascia inalterata la forma.

Mentre si dice che è il parametro di forma (o di scala) del modello in quanto una sua variazione
determina una modifica della forma del modello, nel senso che una diminuzione del valore di tale
parametro determina il concentrasi della funzione densità intorno a mentre, al contrario, un
aumento del valore di tale parametro determina il disperdersi di tale funzione rispetto a .

Quanto qui sopra esposto è, a titolo di esempio, sintetizzato nelle seguenti figure.
3 3
p(x) ⬧ ⬧ p(x)

2 2

1 1

0 0
x x
-3 -2 -1 0 1 2 3 4 5 6 7 8 9 10 11 12 (8) -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 (9)

Come è noto, data la funzione densità di una variabile aleatoria, la funzione di distribuzione è data
dalla relazione
x 1 x (u − ) 2
F ( x) = f (u )du = exp − 2
du
− 2 − 2

Tuttavia, a tale funzione non è possibile dare una forma analitica, in quanto l'integrale non ammette
una soluzione in forma chiusa. Pertanto, nel caso del modello Normale, il calcolo delle probabilità
cumulate richiede una integrazione di tipo numerico.
Distribuzione Normale Standard

Nell'utilizzo pratico del modello Normale un ruolo importante è svolto dalla funzione di distribuzione
caratterizzata dal parametro = 0 e dal parametro = 1, detta distribuzione Normale standard
1 z u2
F ( z) = exp − du
2 − 2

Per tale particolare membro della famiglia di distribuzioni Normali è stato calcolato, per via numerica,
il valore della probabilità cumulata in corrispondenza di un certo numero di valori della variabile
aleatoria Z e ne sono state ricavate delle tabelle.

L'utilità pratica di tali tabelle risiede nel fatto che esse possono essere utilizzate per calcolare valori
di probabilità cumulata relativi ad una generica variabile aleatoria Normale X di assegnati parametri
e .
Questa proprietà si basa sul risultato che se X è una variabile aleatoria Normale di parametri e
, allora la variabile aleatoria Z definita attraverso la seguente trasformazione lineare

X−
Z=
è una Normale Standard.

Da ciò segue che


X− x− x−
Pr X x = Pr = Pr Z z=

cioè la probabilità che la variabile aleatoria X, Normale di parametri e , assuma un valore minore
o uguale del numero x coincide con la probabilità che la variabile aleatoria Normale Standard Z
assuma un valore minore o uguale del numero
x−
z=

che si ottiene mediante una semplice trasformazione lineare del numero x .


Esempio

L'operazione di misura di una grandezza di natura fisica, chimica, elettrica, etc., rientra nel novero
dei fenomeni il cui risultato è influenzato da un numero non piccolo di cause le quali non sono nel
pieno controllo dello sperimentatore. Pertanto, la "misura rilevata" può essere formalmente
interpretata come una variabile aleatoria la cui fluttuazione, che inevitabilmente si osserva nella
ripetizione dell'operazione di misura, può generalmente essere descritta da un modello Normale.

In particolare, se la procedura di misura adottata è accurata, ovvero se essa è priva di errori


sistematici, cioè di errori con caratteristiche direzionali che implicano misure osservate
prevalentemente in difetto o in eccesso rispetto al valore vero (ovviamente incognito) della
grandezza da misurare, allora la variabile aleatoria Normale avrà un valore atteso che coincide
con il valore vero.

È anche intuitivamente evidente che, nel caratterizzare una procedura di misura, oltre al concetto
di accuratezza, va anche preso in considerazione il concetto di precisione della procedura stessa,
cioè un indice quantitativo dell'entità della fluttuazione che si osserva nei valori rilevati
nell'applicazione ripetuta della procedura di misura. In particolare, sotto l'ipotesi di modello Normale,
il naturale indice di precisione è rappresentato dalla deviazione standard .
Ciò premesso, supponiamo che le "misure di tensione" effettuate in un certo laboratorio siano
caratterizzate da un elevato grado di accuratezza, il che implica che il valore atteso del modello
Normale coincide con il valore vero incognito della tensione da misurare, e da una precisione che
può essere quantificata in termini di un coefficiente di variazione CV = / = 0.02 , cioè la deviazione
standard della procedura di misura è pari al 2% del valore vero della tensione da misurare.

Sulla base di queste ipotesi, se la tensione vera è pari a 10 V, la tensione misurata è una variabile
aleatoria X distribuita come una Normale di parametri

= 10 V = CV = 0.02 10 = 0.20 V

A) Calcoliamo la probabilità che il risultato di una singola misura sia inferiore a 9.80 V.

Si deve, pertanto, calcolare la probabilità cumulata F (9.80) = Pr X 9.80 .


Introducendo la variabile aleatoria Normale Standard Z si ha
X− X − 10
Z= =
0.20
da cui segue
X − 10 9.80 − 10 9.80 − 10
F (9.80) = Pr X 9.80 = Pr = Pr Z = −1
0.2 0.2 0.2
Dalle tabelle della Normale Standard si legge Pr Z −1 = 0.15866 .
Probabilità cumulata della variabile Normale Standard

z 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0.00
-1.3 0.08226 0.08379 0.08534 0.08691 0.08851 0.09012 0.09176 0.09342 0.09510 0.09680
-1.2 0.09853 0.10027 0.10204 0.10383 0.10565 0.10749 0.10935 0.11123 0.11314 0.11507
-1.1 0.11702 0.11900 0.12100 0.12302 0.12507 0.12714 0.12924 0.13136 0.13350 0.13567

-1.0 0.13786 0.14007 0.14231 0.14457 0.14686 0.14917 0.15151 0.15386 0.15625 0.15866
-0.9 0.16109 0.16354 0.16602 0.16853 0.17106 0.17361 0.17619 0.17879 0.18141 0.18406
-0.8 0.18673 0.18943 0.19215 0.19489 0.19766 0.20045 0.20327 0.20611 0.20897 0.21186
-0.7 0.21476 0.21770 0.22065 0.22363 0.22663 0.22965 0.23270 0.23576 0.23885 0.24196
-0.6 0.24510 0.24825 0.25143 0.25463 0.25785 0.26109 0.26435 0.26763 0.27093 0.27425

-0.5 0.27760 0.28096 0.28434 0.28774 0.29116 0.29460 0.29806 0.30153 0.30503 0.30854
-0.4 0.31207 0.31561 0.31918 0.32276 0.32636 0.32997 0.33360 0.33724 0.34090 0.34458
-0.3 0.34827 0.35197 0.35569 0.35942 0.36317 0.36693 0.37070 0.37448 0.37828 0.38209
B) Calcoliamo la probabilità che il risultato di una singola misura sia superiore a 10.20 V.

Si deve, pertanto, calcolare la probabilità cumulata

10.20 − 10.0
Pr X 10.20 = 1 − Pr X 10.20 = 1 − Pr Z =1
0.2

Dalle tabelle della Normale Standard si legge Pr Z 1 = 0.84134 .

Probabilità cumulata della variabile Normale Standard

z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891
1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214

1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91309 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
Pertanto
Pr X 10.20 = 1 − 0.84134 = 0.15866
Si osservi che
Pr X 9.80 = Pr X 10.20

Ciò dipende dal fatto che i due valori 9.80 e 10.20 sono equidistanti da parti opposte al valore atteso
= 10.00 V e il modello Normale è simmetrico rispetto a .

C) Chiediamoci ora quale sia il valore di tensione cui corrisponde una probabilità pari a 0.90 di non
essere superato in una operazione di misura.

In altri termini, si vuole determinare il così detto p-esimo quantile (o percentile) della variabile
aleatoria X, cioè il numero x p tale che
Pr X x p = p

Introducendo la variabile aleatoria Normale Standard si ha


xp −
Pr X x p = Pr Z zp = =p
Il numero z p (p-esimo quantile della variabile aleatoria Normale Standard) può essere determinato
utilizzando le tabelle in maniera inversa, cioè partendo dalla probabilità cumulata e leggendo il
corrispondente valore di z.
Quantili zp della variabile Normale Standard

p = Prob(z < zp)


0.001 0.005 0.010 0.025 0.050 0.100 0.200 0.250
zp -3.090 -2.576 -2.326 -1.960 -1.645 -1.282 -0.842 -0.674

p = Prob(z < zp)


0.750 0.800 0.900 0.950 0.975 0.990 0.995 0.999
zp 0.674 0.842 1.282 1.645 1.960 2.326 2.576 3.090

In particolare, dalle tabelle per p = 0.90 si ricava z p = 1.282 e, di conseguenza

x p − 10.00
= 1.282
0.20
da cui
x p = 10.00 + 0.20 1.282 = 10.256
In effetti, c'è da dire che l'importanza applicativa delle tabelle della Normale Standard si è oggi molto
ridotta rispetto al passato, in quanto è oggi possibile calcolare immediatamente valori di probabilità
cumulata per una generica variabile aleatoria Normale disponendo di un comune foglio di calcolo
elettronico come Excell.
Somma di variabili aleatorie Normali

Siano X i (i = 1..., n) delle variabili aleatorie Normali indipendenti tra loro e caratterizzate da un valore
atteso i e da una varianza i2 .

È possibile dimostrare che la variabile aleatoria somma


n
X= Xi
i =1

è ancora una variabile aleatoria Normale caratterizzata da un valore atteso


n
= i
i =1
e da una varianza
n
2 2
= i
i =1
LA DISTRIBUZIONE LOGNORMALE

Genesi del modello

Si è visto come il modello Normale nasce dall'ipotesi che la variabile osservata risulti dalla somma
di un elevato numero di piccoli contributi indipendenti di natura aleatoria.

È tuttavia, anche possibile esaminare l'ipotesi in cui la variabile osservata risulti dal prodotto di un
elevato numero di piccoli contributi indipendenti di natura aleatoria.

Ad esempio, nel caso di alcuni fenomeni di accrescimento è ragionevole supporre che


l'accrescimento avvenga per successivi contributi proporzionali alla dimensione via via raggiunta.
Sulla base di tale ipotesi la dimensione Y essere vista come una variabile aleatoria generata dal
prodotto di successivi contributi Yi , a partire da un valore iniziale Y0

Y = Y0 Y1 Y2 Yn

Considerando il logaritmo di ambo i membri di tale eguaglianza, si ha

log Y = log Y0 + log Y1 + log Y2 + + log Yn


Posto X = log Y , in base al teorema del Limite Centrale si ha che, al divergere di n, la variabile
aleatoria X tende ad essere distribuita come una Normale.

Ciò considerato, risulta naturale introdurre la variabile aleatoria Y di tipo Log-normale caratterizzata
da una legge di probabilità tale che variabile aleatoria X = log Y è distribuita secondo il modello
Normale.

Utilizzando la procedura di trasformazione di una variabile aleatoria è facile verificare che la funzione
densità di probabilità di tipo Log-normale ha la seguente espressione analitica

1 (log y − ) 2
f ( y) = exp −
2 y 2 2

in cui
0 y − 0

pertanto, la variabile aleatoria Log-normale ha come spazio campionario l'insieme dei numeri reali
positivi ed è caratterizzata dai due parametri e .
In particolare, si osservi che tali parametri rappresentano il valore atteso e la deviazione standard
della variabile aleatoria Normale X = log Y .

Nella figura che segue sono mostrati alcuni andamenti della funzione densità al variare del valore
dei parametri
0.8
f (x)

0.6 = =

0.4
= =

= =
0.2
= =

0
0 2 4 6 x 8 (10)
Il valore atteso della variabile aleatoria Log-Normale Y è dato da

E(Y ) = exp ( + 2
/2 )
mentre la varianza è data da

(
Var(Y ) = exp 2 + 2
) exp( 2
) −1

Funzione di distribuzione

La funzione di distribuzione della variabile aleatoria Log-Normale è data dalla relazione

y
1 −1 (log u − ) 2
F ( y) = u exp − 2
du
2 0
2

A tale funzione non è possibile dare una forma esplicita in quanto l'integrale non ammette una
soluzione analitica.
Pertanto, anche nel caso del modello Log-Normale, le probabilità cumulate devono essere calcolate
per via numerica. Tuttavia, tenendo conto della relazione funzionale che lega la variabile aleatoria
Log-Normale Y alla variabile aleatoria Normale X, sulla base del principio che eventi equivalenti
hanno uguale probabilità di verificarsi, si ha
Pr Y y = Pr log Y log y = X log y

e, poiché X è una variabile aleatoria Normale di parametri e , si ha


X− log y − log y −
Pr X log y = Pr = Pr Z

in cui Z è la variabile aleatoria Normale Standard.

In definitiva, si ha
log y −
Pr Y y = Pr Z

e, pertanto, la probabilità cumulata associata alla variabile aleatoria Y può essere calcolata
utilizzando le tabelle della Normale Standard.
Esempio

Un produttore di lampadine a led vende il suo prodotto specificando che la durata di vita media di
una lampadina è di 15,000 ore con una deviazione standard di 1,500 ore. Inoltre, sulla base della
sua esperienza, afferma che la "durata di vita" di una lampadina è una variabile aleatoria distribuita
secondo il modello Log-Normale.

Sulla base di tali ipotesi, si vuole valutare la probabilità che la durata di vita di una lampadina sia
inferiore a y = 12,500 ore.

Sulla base di quanto precedentemente illustrato, per calcolare la probabilità richiesta si può ricorrere
alla relazione

log(12,500) −
Pr Y 12,500 = Pr Z

Tuttavia, in questa relazione compaiono i parametri e del modello Log-Normale mentre il


quesito fornisce i valori numerici dal "valore atteso" E(Y ) e della "deviazione standard"
Stdev(Y )= Var(Y ) della variabile aleatoria, che sono delle funzioni dei parametri incogniti.
È, pertanto, necessario invertire tali espressioni, in modo da esprimere i parametri e in termini
di "valore atteso" e "varianza" del modello Log-Normale. Ciò porta alle seguenti relazioni

1 E(Y ) 4 E(Y ) 2 + Var(Y )


= log = log
2 E(Y ) 2 + Var(Y ) E(Y ) 2

In particolare, se esprimiamo tali relazioni in termini di E(Y ) e del coefficiente di variazione

Var(Y )
CV =
E(Y )

le precedenti formule si possono scrivere in una forma più compatta

= log
E(Y )
1 + CV2
(
= log 1 + CV2 )
Ritornando all'esempio, si ha

Var(Y ) 1,500
CV = = = 0.10
E(Y ) 15,000

E(Y ) 15,000
= log = log = 9.6108
1 + CV2 1 + 0.10 2

( ) (
= log 1 + CV2 = log 1 + 0.12 = 0.09975 )
per cui
log(12,500) −
Pr Y 12,500 = Pr Z

9.4335 − 9.6108
= Pr Z
0.09975
= Pr Z −1.78 = 0.038

ovvero una probabilità di guasto inferiore al 4%.


Prodotto di variabili aleatorie Log-Normali

Siano Yi (i = 1..., n) delle variabili aleatorie Log-Normali indipendenti tra loro e caratterizzate dai
parametri i e i2 .
n
La variabile aleatoria prodotto Y = Yi è ancora una variabile aleatoria Log-Normale
i =1
caratterizzata dai parametri
n n
2 2
= i e = i
i =1 i =1

La dimostrazione di tale risultato si basa sulla considerazione che


log Y = log Y1 + log Y2 + + log Yn
2
è la somma di variabili aleatorie Normali di parametri i e i , il cui risultato è ancora una variabile
aleatoria Normale di parametri
n n
2 2
= i e = i
i =1 i =1
LA DISTRIBUZIONE UNIFORME

Si dice che una variabile aleatoria X è di tipo Uniforme se la sua funzione densità di probabilità è
costante in un fissato intervallo (a, b) dell'insieme dei numeri reali ed assume valore zero altrove

1/(b − a ) a x b
f ( x) =
0 altrove

f(x)

1/(b-a)

a b x D11
La funzione di distribuzione risulta

0 per x a
F ( x) = ( x − a ) /(b − a ) per a x b
1 per x b

1.2
F(x)
1

0.8

0.6

0.4

0.2

0
0 2 4
x 6D12
Il valore atteso e la varianza sono date da

a+b (b − a ) 2
E{X } = Var{ X } =
2 12

In alcune applicazioni è utile fare riferimento alla così detta variabile aleatoria Uniforme Standard U
definita sull'intervallo (0,1) . Per tale variabile si ha

1 0 x 1
f ( x) =
0 altrove

0 per x 0
F ( x) = x per 0 x 1
1 per x 1
e
1 1
E{X } = Var{ X } =
2 12
Si osservi che una variabile aleatoria Uniforme X, definita su di un generico intervallo (a, b) , può
essere trasformata nella variabile Uniforme Standard attraverso la trasformazione lineare
X −a
U=
b−a
In particolare, la variabile aleatoria Uniforme Standard svolge un ruolo determinante nella
generazione di determinazioni pseudo-casuali di una generica variabili aleatoria X.

Tale prerogativa si basa sul risultato che, data una qualsivoglia variabile aleatoria X caratterizzata
da una funzione di distribuzione FX ( x) , la variabile aleatoria U definita dalla trasformazione
U = FX ( X )
è una Uniforme Standard. Infatti, si osservi innanzitutto che U è una variabile aleatoria definita
nell'intervallo (0,1) . Inoltre, poiché FX ( ) è per definizione una funzione monotona crescente, per la
proprietà di equivalenza tra eventi, si ha

FU (u ) = FX x = FX−1 (u ) = u 0 u 1

in cui FX−1 ( ) indica la funzione inversa di FX ( x) .


Da ciò segue che, se u è una determinazione della variabile aleatoria U, allora x = FX−1 (u ) è la
corrispondente determinazione della variabile aleatoria X.

Ad esempio, se FX ( x) = 1 − exp(− x / ) con x 0 , il valore della variabile aleatoria X che corrisponde


al valore u della variabile aleatoria Uniforme Standard è dato da

1 − exp(− x / ) = u x = log 1/(1 − u )

Il problema diventa, pertanto, quello di individuare un algoritmo deterministico, ovvero un


"procedimento sistematico di calcolo" i cui risultati sono rappresentati da numeri compresi tra 0 e 1,
i quali hanno delle caratteristiche in termini di frequenza relativa di accadimento che si avvicinano
all'andamento di una funzione densità Uniforme Standard.

In effetti sono stati individuati diversi algoritmi implementabili su di un calcolatore elettronico i quali
generano dei numeri pseudo-casuali che hanno la proprietà di mimare, in termini frequentistici, le
proprietà matematiche del modello di probabilità Uniforme Standard.
LA DISTRIBUZIONE ESPONENZIALE

Si dice che una variabile aleatoria X è di tipo Esponenziale se ha la seguente funzione densità di
probabilità
−1
exp ( − x / ) per x 0
f ( x) =
0 altrove

Il modello Esponenziale è, pertanto, caratterizzato dall'unico parametro .

La funzione di distribuzione risulta

1 − exp ( − x / ) per x 0
F ( x) =
0 altrove

Il valore atteso e la varianza della variabile aleatoria X sono dati da


2
E( X ) = Var( X ) =
Il modello Esponenziale è spesso utilizzato per descrivere la "durata di vita" di un'unità tecnologica.
In particolare, tale modello ha la seguente caratteristica.

Si supponga di voler calcolare la probabilità che la durata di vita di una unità che ha funzionato fino
ad un certo istante x1 sia superiore ad un tempo x2 , con x2 x1 . Dalla definizione di probabilità
condizionata segue che
Pr X x2 1 − F ( x2 )
Pr X x2 | X x1 = =
Pr X x1 1 − F ( x1 )
exp(− x2 / )
= = exp -( x2 − x1 ) /
exp(− x1 / )
In altri termini, questa probabilità dipende dall'ampiezza dell'intervallo ( x2 − x1 ) ma non dalla sua
posizione rispetto al tempo 0.

Questa proprietà propria del solo modello Esponenziale ha un importante riflesso dal punto di vista
applicativo. Infatti tale proprietà implica che tale modello può essere utilizzato per descrivere la legge
di mortalità di una unità tecnologica solo nel caso in cui il fenomeno di guasto non dipenda dal tempo
di funzionamento già accumulato.
In altri termini, l'uso di tale modello implica che l'unità tecnologica interessata non sia soggetta a
fenomeni di degrado, quali ad esempio l'usura, la "fatica", la corrosione, etc.

Si noti che spesso nelle applicazioni il modello Esponenziale è formulato in termini del parametro
= −1 , per cui, ad esempio, la funzione densità di probabilità è espressa come

f ( x) = exp(− x) u(x)

Un'altra importante caratteristica del modello Esponenziale è il suo legame con il Processo di
Poisson Omogeneo, cioè un particolare tipo di "processo stocastico puntuale" che descrive in
termini probabilistici il verificarsi di un fissato numero di eventi in punti isolati di un dominio continuo,
tipicamente in istanti isolati del dominio tempo.

Infatti, è possibile dimostrare che se il numero di eventi che si osservano nell'intervallo temporale
(0, t ) è distribuito secondo il modello di Poisson di parametro allora gli intervalli temporali tra due
eventi consecutivi sono variabili aleatorie indipendenti distribuite secondo il modello Esponenziale
di parametro .

Potrebbero piacerti anche