Sei sulla pagina 1di 122

Calcolo delle Probabilità

Introduzione
Fenomeno deterministico: se Fenomeno non deterministico:
l’esperimento è condotto anche se gli esperimenti sono
nelle stesse condizioni si condotti nelle stesse condizioni
trova lo stesso risultato si trovano risultati diversi
Esempi:
Esempi:
•Risultato del lancio di una
•Moto di un grave moneta
•Traiettoria di 100 palline in un
•Traiettoria di una pallina in
biliardo
un biliardo •Vincita in una lotteria
•Numero di lanci di un dado per
ottenere un 6

La probabilità si occupa di fenomeni non deterministici


Esperimento aleatorio:
i singoli esiti dell’esperimento non sono predicibili con
esattezza.

Esempio. Se l'esperimento consiste nel lancio di una


moneta, non è possibile stabilire con certezza se l'esito di
un singolo lancio sarà testa o croce.
Eventi: chiamiamo evento l’insieme costituito da uno
o più dei possibili risultati o esiti di un esperimento
aleatorio.

Esempio. Nel caso dell’esperimento costituito dal lancio


di un dado possono essere osservati i seguenti eventi.

A: “si osserva un numero dispari”;

B: “si osserva un numero minore di 3”;

Ei: “si osserva il numero i, con i = 1, 2, …, 6”.


Spazio campione:
Insieme S di tutti i risultati dell’esperimento

Esempio:
•Nel caso del lancio di una moneta S={Testa, Croce}
•Nel caso dei numeri di lanci di un dado necessari per avere 6
S=N (numeri naturali)
S = {E1, E2, E3, E4, E5, E6}

E1 E5
E3

E2 E6

E4
Gli eventi possono essere divisi in due classi:
semplici e composti.

Gli eventi semplici sono costituiti da uno solo dei possibili


risultati di un esperimento aleatorio.

Gli eventi composti sono costituiti da da più di uno dei possibili


risultati di un esperimento aleatorio.

Un evento composto può sempre essere scomposto in eventi


semplici. Se un evento non risulta ulteriormente scomponibile
è per definizione un evento semplice.
Fenomeno casuale

Evento elementare

Spazio Campionario


Un qualsiasi sottoinsieme dello spazio
Evento campionario, ovvero un insieme di eventi
1 elementari
n
E  1 , n 
N
E
Si usa dire che l’evento E si è realizzato se il
fenomeno si manifesta con uno degli eventi
elementari che appartengono ad E
Lancio di un dado

E=  , 
E Si realizza se viene faccia 3 o faccia 6

Faccia “pari” A=  , , 
Modi di descrivere l’evento

Faccia “dispari” B=  , , 
Nel caso dell'esperimento consistente nel misurare, con
uno strumento infinitamente preciso, il livello di piovosità
in una certa area geografica, lo spazio campione è

S = {E1, E2, ...}

perché, all'interno di una certa gamma di valori, nessun


numero reale può essere escluso come risultato possibile
dell'esperimento.

In questo caso, lo spazio S contiene un insieme infinito


non numerabile di punti campione.
Si dice infinito non numerabile uno spazio campione i cui
eventi semplici sono tali per cui, fissati due di essi, è
sempre possibile determinarne almeno un terzo intermedio.

Esempio. Lo spazio costituito dagli eventi “esatto momento


della nascita” è uno spazio infinito non numerabile. Infatti, prese
due qualunque persone nate ognuna in un certo momento, è sempre
possibile individuarne una terza la cui nascita si colloca tra le due
precedenti.
Si possono distinguere tre tipi di spazio campione:

- spazio campione finito

- spazio campione infinito numerabile

- spazio campione infinito non numerabile


Lo spazio campione associato ad un esperimento si dice
discreto se è uno spazio finito o infinito numerabile.

Lo spazio campione si dice continuo se è uno spazio


infinito non numerabile.
Fenomeno casuale o prova Lancio di un dado


Spazio campionario
(campione)

Finito
1
Evento
n
elementare
Durata di una lampadina
N
i
Infinito
0 max
Quando un esperimento viene eseguito, uno e un solo
evento semplice può essere osservato. Gli eventi semplici,
dunque, sono mutuamente esclusivi.

Gli eventi mutuamente esclusivi possono essere rappresentati


da insiemi disgiunti.
Esempio. Se il lancio del dado produce l'esito 5, non è
possibile osservare allo stesso tempo l'esito 6.

Gli eventi E5 e E6, quindi, sono mutuamente esclusivi, così


come tutti gli altri eventi semplici.

Gli eventi composti non sono di necessità mutuamente


esclusivi, in quanto qualsiasi sottoinsieme dello spazio
campione può costituire un evento composto.
Esempio. L'evento A (esito dispari) ha luogo se si osserva
E1 o E3 o E5.

L’evento B (numero minore di 3) ha luogo se si osserva


E1 o E2.

Gli eventi A e B, quindi, non sono mutuamente esclusivi.


Eventi incompatibili

A B

Eventi incompatibili


A B  

A
A A A  

Partizione di uno spazio campionario

A B B
A
Eventi incompatibili
Partizione di 
 
A B   A  B  , A  B  

A A A  
A
A A  

Partizione di uno spazio campionario

B
A

Partizione di 

A  B  , A  B  

E1 a) Ei  E j  , i  j
Ei Ek k Partizione finita

b)
E i 
 i 1
Partizione infinita
Partizione
Partizionedello
delloSpazio
SpazioCampionario
Campionario

Si dice che gli eventi A1,…,Ak appartenenti ad  formano una partizione


dello spazio campionario se:

(1)
(1) A i  A j    i  j  1,..., k
k
(2)
(2) A i 
i 1

cioè se sono a due a due incompatibili e necessari.


Proprietà
Proprietà Unione
Unione Intersezione
Intersezione

Commutativa AB  BA AB  BA

Idempotenza AA  A AA  A

Associativa (A  B)  C  A  (B  C) ( A  B)  C  A  ( B  C )

Distributiva A  (B  C)  (A  B)  (A  C) A  (B  C)  (A  B)  (A  C)

Inoltre,
Inoltre,sisiha:
ha:

A  A A   AA  


A   A  A AA  
Leggi di De Morgan

A B  A  B
 k  k
 Ei   Ei
 i 1  i 1

A B  A  B
 k  k
 Ei   Ei
 i 1  i 1
Probabilità

Ogni tentativo di dare una definizione rigorosa dei concetti
probabilistici più elementari si trova di fronte ad un
problema; infatti, non solo esistono differenti
formalizzazioni e assiomatizzazioni della probabilità ma a
queste corrispondono, in generale, molteplici nozioni
intuitive di probabilità spesso assai diverse fra loro.


Al di là delle differenze di carattere formale un elemento
comune posseduto da tutte le forme di probabilità riguarda
il suo significato intuitivo di valutazione della possibilità che
un dato evento possa accadere o meno.
DEFINIZIONE DI PROBABILITA’
•A priori (o matematica, o classica, o di Pascal)

•A posteriori (o statistica, o frequentistica, o legge empirica del


caso)

•Soggettiva

Probabilità: regola che a ogni evento E associa un


numero reale compreso tra 0 e 1
p: E p(E)
Definizioni di probabilità:
Classica Se un evento si può verificare in N modi mutuamente
(Pascal) esclusivi ed ugualmente probabili, se m di questi
possiede una caratteristica E, la probabilità di E è il
rapporto tra il numero di casi favorevoli e il
totale dei casi possibili (tutti equiprobabili)
Esempi

•Nel caso del lancio di una moneta S={Testa, Croce}.


p(Testa)=1/2 (casi favorevoli 1, possibili 2)

•Lanciamo due dadi e calcoliamo la probabilità che la somma


dei punti sia 4
Per semplicità scriviamo i numeri estratti come coppie:
Le coppie di 6 numeri sono 6 * 6= 36 = numero di casi possibili;
I casi favorevoli sono dati dalle coppie (1,3), (2,2) e (3,1) e sono
quindi 3. Pertanto
p(somma 4 in 2 lanci)=3/36=1/12
Discussione

Problemi della definizione classica:


•non sempre posso dire che eventi sono equiprobabili
(asimmetrie - esempio: ho un dato truccato)
•il numero di casi deve essere finito

Aspetti positivi:
•è una definizione operativa

Determinazione
Definizione a della probabilità
ssiomatica
usando il
calcolo combinato
rio
Definizione frequentistica
(o a posteriori) Richard von Mises

Si ripete un esperimento N volte e se un evento con una


certa caratteristica E si verifica m volte, la frequenza
relativa di successo è

f(E) dà una stima per la probabilità di E


In base all’impostazione frequentista, per probabilità di un
evento si intende il limite a cui tende la frequenza relativa
delle prove in cui l’evento si verifica, quando il numero di
prove tende all’infinito:

s
lim  p
n  n

con s = numero di “successi” e n = numero di prove.


Problemi della definizione frequentistica:
•In situazioni concrete il passaggio al limite su cui si basa la
definizione non può essere effettuato
•È necessario ripetere l’esperimento un gran numero di volte
Definizione soggettiva
(o bayesiana) Bernoulli, De Finetti

Probabilità: grado di fiducia che una persona ha nel


verificarsi dell’evento.
Prezzo p che si è disposti a pagare per ricevere 1 se
l’evento si verifica e 0 se non si verifica.
Esempio: se lancio un dado il prezzo equo per la scommessa
“esce il 4” dipende dalle informazioni di cui si dispone; se il dado non
è truccato si può assumere p=1/6

Problemi della definizione soggettiva:


•Non è operativa
•Una valutazione soggettiva non è necessariamente obiettiva
Definizione
Definizionedi
diprobabilità.
probabilità.

Def.
Def.4.
4. Classica
Classica
La
Laprobabilità
probabilitàdidiun
unevento
eventoAAèèililrapporto
rapportotra
traililnumero
numerodidicasi
casifavorevoli
favorevoli
didiAAeeililnumero
numerodidicasi
casipossibili,
possibili,ammesso
ammessoche chequesti
questisiano
sianoequiprobabili.
equiprobabili.

Def.
Def.5..
5..Frequentista
Frequentista(o
(olegge
leggeempirica
empiricadel
delcaso).
caso).
In
Inuna
unaserie
seriedidiprove
provedidiun
undato
datoesperimento,
esperimento,ripetuto
ripetutounungran
grannumero
numerodidi
volte
volteinincircostanze
circostanzepiùpiùoomeno
menosimili,
simili,ciascuno
ciascunodegli
deglieventi
eventipossibili
possibilisisi
manifesta
manifestacon conuna
unafrequenza
frequenzache cheèècirca
circauguale
ugualealla
allasua
suaprobabilità.
probabilità.
L’approssimazione
L’approssimazionesisiriduceriducealalcrescere
cresceredel delnumero
numerodidiprove.
prove.

Def.
Def.6.
6.Soggettivista.
Soggettivista.
La
Laprobabilità
probabilitàèèlalavalutazione
valutazioneche
cheililsingolo
singoloindividuo
individuopuò
puòcoerentemente
coerentemente
formulare,
formulare,ininbase
basealle
alleproprie
proprieconoscenze,
conoscenze,del delgrado
gradodidiavverabilità
avverabilitàdidiun
un
evento.
evento.
Assiomi
Assiomi del
del Calcolo
Calcolodelle
delleProbabilità
Probabilità..

Ricordando
Ricordandoche cheun
unassioma
assioma(o (opostulato)
postulato)èèuna
unaproposizione
proposizioneche cheèè
considerata
consideratavera
veraeenon
nonviene
vienedimostrata
dimostratanel
nelcontesto
contestoinincui
cuièèsvolta
svoltalala
teoria
teoriaininquestione,
questione, IlIlC.P.
C.P.presenta
presentai iseguenti
seguentiassiomi:
assiomi:

1.
1. Pr  A  0  A  A
2.
2. Pr    1
Probabilità

L’interpretazione geometrica
PP(
() )11 L’area complessiva è uguale a 1

1   
PPn  PP 
  n n 

  n
n n11  n n11
L’area di un insieme di superfici che non si
sovrappongono è la somma delle aree delle singole
PP(
())00, , AA
superfici

3
L’area di ogni sottoinsieme è
sicuramente positiva

4
2
Operazioni sugli eventi (sugli insiemi)

Se un insieme E non


contiene nessun elemento
(evento elementare) viene
detto insieme vuoto e si
indica con
Unione di insiemi (o eventi)

B
A A

 
A  B   :   A oppure   B A A  A

A A

 
A   A  A
Lancio di un dado

E=  , 
A=  , , 
A E   , , ,

Unione
A B C   A  B  C 
B
A Associativa  A  B C

Commutativa
C
   AC  B Ecc.
K

E i  E1  E2   Ei   Ek
i 1

B  E1  E2   Ei  
A E i 1
i

K  K  K 
C
  Ei     
 i 1 
 Ei      Ei 
 i 1   i 1 
Intersezione

B
A A

 
A  B   :   A e   B
A A  A

A A

 
A  A A  
Lancio di un dado

E=
 , 
A=
 , , 
A E   
Intersezione
A B C   A  B  C 
B
Associativa  A  B C
A
Commutativa
C
   AC  B Ecc.

E i  E1  E2   Ei   Ek
i 1

B E i  E1  E2   Ei  
A i 1

 k   k   k 
C  Ei      Ei   Ei     
  i 1   i 1   i 1 
Negazione

A
 A A
A

A   :   A

 

A A  
Teoremi
Teoremifondamentali
fondamentalidel
delC.P.
C.P.

Siano
SianoAAeeBBdue
dueeventi
eventiincompatibili
incompatibili A B  

allora
allora Pr  A  B   Pr  A  Pr  B 

Teo.1.
Teo.1. Pr    0

Teo.2.
Teo.2.  
Pr A  1  Pr  A

Teo.3.
Teo.3. Pr  A  Pr  A  B   Pr  A  B 

Teo.4.
Teo.4. Pr  A  B   Pr  A  Pr  B   Pr  A  B 
ESERCIZI
A volte puo essere difficile, o almeno noioso, determinare per
elencazione diretta gli elementi di uno spazio campione
finito.

CALCOLO COMBINATORIO


Disposizioni semplici

Disposizioni con Ripetizione

Permutazioni semplici

Permutazioni con oggetti identici

Combinazioni Semplici

Combinazioni con Ripetizione
Calcolo Combinatorio
Problema: determinare il numero di
elementi di un insieme finito
elenco diretto (lungo!)

Esempio:in un menù ho 3 antipasti, 2 primi, 4 secondi.


Quanti sono i possibili pasti completi (includono tutte le 3
portate - scelte una sola volta)?

Diagramma ad albero
Diagramma ad albero S1
S2
P1
S3
A1
S4
P2
……….
A2 P1

P2 ……….
P1
………..
A3 P2

3 x 2 x 4 = 24
pasti completi
“Contare le scelte”
Se gli insiemi A1, A2, …, Ak contengono
n1, n2, …, nk elementi
Ho N= n1 n2 … nk
modi di scegliere
prima un elemento di A1 , poi un elemento di A2 …
... infine un elemento di Ak

In particolare: se n1 = n2 =…= nk =n allora


N=nk
= numero delle disposizioni con ripetizione
di n oggetti a gruppi di k
Disposizioni
= gruppi di oggetti che si possono formare
scegliendo k oggetti tra n oggetti
(I gruppi devono differire per qualche oggetto e per
l’ordine)

Disposizioni con ripetizione: si può ripetere lo stesso oggetto

Esempio:
Determinare il numero di schedine del totocalcio si
devono giocare per essere sicuri di fare 14

Le possibili schedine sono 314= 4.782.969


Disposizioni semplici (senza ripetizione)
di n oggetti tra k (≤n) D(n,k)
Non si può ripetere lo stesso oggetto

Esempio:
Ad un gran premio di formula 1 partecipano 20 piloti.
I primi tre classificati vanno sul podio..
Quante sono le possibili terne di piloti sul podio?
Il primo classificato può essere un qualunque pilota tra 20,
Il secondo uno qualunque tra i restanti 19, il terzo uno tra 18
Quindi: D(20,3)=20*19*18

In generale: D(n,k)=n*(n-1)*…*(n-k+1)
Permutazioni
= numero dei modi in cui si possono ordinare n oggetti
P(n) = D(n,n)=n*(n-1)*… 2*1=n!

Esempio:
Quanti anagrammi (non necessariamente di senso
compiuto) si possono formare della parola FOGLI

Ho 5 possibili scelte per la prima lettera, 4 per la seconda, …


1 per la quinta, quindi gli anagrammi sono
P(5)=5*4*3*2*1=5!=120
Combinazioni
= disposizioni a meno dell’ordine=
gruppi di oggetti che si possono formare scegliendo k
oggetti tra n oggetti
(I gruppi devono differire per qualche oggetto ma non per l’ordine)=

Esempio
Quante squadre di pallacanestro si possono formare con
8 giocatori
Sono le combinazioni di 5 persone scelte tra 8 =
Esercizi
• In quanti modi 10 persone possono sedersi su una panchina che ha solo 4
posti? (Si risolva l'esercizio due volte, una volta considerando importante l'ordine in
cui si siedono e una no).

• In quanti modi diversi si possono sedere 7 persone in un tavolo rotondo?

• Supponiamo di estrarre per 40 volte una pallina da un'urna contenente


palline numerate da 1 a 365 ( dopo ciascuna estrazione la pallina estratta
viene nuovamente messa nell'urna). Quanti sono i possibili risultati
diversi? Quanti sono i possibili risultati in cui i 40 numeri estratti risultano
tutti diversi tra loro?

• Si deve costituire un comitato di 3 membri, rappresentanti ciascuno gli


studenti, i docenti e il personale amministrativo. Se ci sono 4 candidati per
gli studenti, 3 per i docenti e 2 per il personale amministrativo, si determini
quanti comitati differenti si possono formare.
Esercizi
• Dovete preparare un dolce, disponete di una cesta con 10 uova di cui ve ne
serviranno solo 2 per l'impasto. Ma vi ricordate che il giorno prima avete
posto in quel cesto 4 uova vecchie di due settimane. Qual è la probabilità di
aver utilizzato almeno un uovo non fresco?

• Intorno ad un tavolo rotondo si dispongono a caso 5 uomini e 5 donne.


Qual è la probabilità che ogni donna sia seduta tra due uomini?

• Qual è la probabilità di fare tre volte 6 lanciando tre volte un dado non
truccato?
Probabilità condizionata e
indipendenza stocastica
Esempio: un’urna contiene 15 palline rosse e 5 nere.
Calcoliamo la probabilità di ottenere in 2 estrazioni consecutive senza
reimbussolamento una pallina rossa e poi una nera:
A:=estraggo una rossa B:=estraggo una nera
p(A)=15/20=3/4
La probabilità di estrarre una nera dopo aver estratto una rossa è 5/19.
La conoscenza dell’evento A ha ridotto lo spazio dei campioni

Dati due eventi A e B, si dice probabilità di B condizionata ad A


p(B|A) la probabilità di B calcolata sapendo che si è verificato A.
(E’ ovvio che si può definire una probabilità condizionata al verificarsi di A
soltanto se A è possibile.)
p(B|A) = 5/19

La probabilità di estrarre prima una rossa e poi una


nera è

p(AB)=p(A)p(B|A)=3/4*5/19=15/76

Regola di moltiplicazione:
p(B|A) in funzione di p(A) e p(AB)

se p(A)≠0

Esempio: trovare la probabilità che con un lancio di un dado si


ottenga un numero < 5, sapendo che il risultato del lancio è dispari

B:={ottengo un numero < 5} A:={ottengo un dispari}


p(B)=2/3, p(A)=1/2, A B={1,3}, p(A B)=1/3
p(B|A)=p(A B)/p(A)=(1/3)/(1/2)=2/3
Esercizio
La seguente tabella rappresenta la frequenza mensile in cui dei
ragazzi vedono il telefilm “Friends”
Numero di volte al mese  Maschi  Femmine  Totale 
0  4  5 9 
1 - 5  7  9  16 
6 - 10  21  23  44 
11 - 15  11  9  20 
>15  3  5  8 
Totale  46  51  97
Scelgo una persona a caso.
•Qual è la probabilità che non veda mai il telefilm?
p(0)=9/97
•Se è un maschio, qual è la probabilità che non veda mai il telefilm?
p(0|M)=4/46
Indipendenza stocastica
Se per due eventi A e B p(A|B)=p(A)
si dice: l’evento A è stocasticamente indipendente da B

Esempi:
•Nell’esercizio precedente: non vedere mai il telefilm “Friends” ed essere
maschio non sono stocasticamente indipendenti
•Siano A:={una persona è alta più di 1 metro e 75}
B:={una persona non mangia Nutella}
Supponiamo che p(A)=0.5, p(B)=0.3, p(AB)=0.15
Allora p(A|B)=p(AB)/p(B)=0.15/0.3=0.5=p(A)
Dunque A è stocasticamente indipendente da B.
Indipendenza stocastica

Nota: p(B|A)=p(AB)/p(A)=0.15/0.5=0.3=p(B)
anche B è stocasticamente indipendente da A.
Questo non è casuale:
A è stoc. indipendente da B B è stoc. indipendente da A
e diciamo “A e B sono indipendenti”
Esempio:
in un’urna ci sono 10 palline rosse e 12 nere. Estraiamo dall’urna una
pallina poi la rimettiamo nell’urna (estrazione con reimbussolamento).
Siano
A1={estraggo una pallina rossa alla prima estrazione}
A2={estraggo una pallina rossa alla seconda estrazione}
L’aver estratto una rossa alla prima estrazione non influenza la
probabilità che la seconda sia rossa
A1 e A2 sono indipendenti
Regola di moltiplicazione per eventi
indipendenti
Esempio: Nel caso dell’estrazione con reimbussolamento
dell’esempio precedente la probabilità di estrarre entrambe le
volte una pallina rossa è
p(A1A2)=p(A1)p(A2)=(10/22)2

Vale la seguente regola di moltiplicazione per eventi


indipendenti A e B:
p(AB)=p(A)p(B)

Nota: non confondere i concetti di “eventi disgiunti” ed “eventi


indipendenti”. Due eventi disgiunti non sono mai indipendenti (se cosi
fosse avrei p(AB)=p(ø)=0=p(A)p(B), quindi p(A) o p(B) sarebbe nulla).
In realtà due eventi disgiunti sono fortemente dipendenti: se un evento è
realizzato non può esserlo l’altro.
Esercizio
Si hanno tre urne.
U1 ha 2 palline bianche e 2 nere
U2 ha 1 pallina bianca e 3 nere
U3 ha 4 palline bianche e 2 nere
Si sceglie un’urna a caso e si estrae una pallina.
Qual è la probabilità di estrarre una pallina bianca?
U1 1/2
bianca
1/3
1/3 U2 1/4
bianca

1/3 U3 2/3
bianca

P(bianca)=1/2 * 1/3 + 1/4 * 1/3 + 2/3 * 1/3=17/36


Teorema delle probabilità totali

Dr. Daniela Morale


Se B è un evento che si verifica insieme ad n eventi incompatibili A 1,…,An,
che rappresentano una partizione dello spazio campionario
A1 ,..., An , , B  ,

P B   P B  A1   ....  P B  An  

 P( B | A1 ) P( A1 )  ...  P( B | An ) P( An )

effetto
cause

L’utilità del teorema sta nel fatto che talvolta P(A) è


difficile da calcolare direttamente, mentre è più facile
calcolare le probabilità P(A/Bi) e poi ricostruire P(A)
dalla formula
Esercizio
In un Gran Premio di Formula 1 la probabilità di
pioggia è del 30%.
La probabilità che il pilota Mazzacane vinca se piove è
dello 40%, e dello 10% se non piove.

• Qual è la probabilità che vinca Mazzacane?

Sia P={piove} M={vince Mazzacane}


0.3 P 0.4 M

0.7 Pc 0.1 M

p(M)=0.3*0.4+0.7*0.1=0.19
Teorema di Bayes

Se B è un evento che si verifica insieme ad n eventi incompatibili A1,…,An se


sappiamo che B si è verificato, ci si può porre il problema di calcolare la
probabilità che B venga da uno di tali eventi, un generico Ai

effetto
causa
Esercizio (continuazione)
In un Gran Premio di Formula 1 la probabilità di
pioggia è del 30%. La probabilità che il pilota
Mazzacane vinca se piove è dello 40% e dello 10%, se
non piove.
• Se vince Mazzacane qual è la probabilità che piova?
Sia P={piove} M={vince Mazzacane}
0.3 P 0.4 M

0.7 Pc 0.1 M
p( M | P) p( P)
p( P | M ) 
p( M | P) p( P)  p( M | P) p( P)
0.4  0.3
  0.63
0.4  0.3  0.1  0.7
Esercizio

Sia C l’evento: la nuova sede di scienze sarà pronta nel 2019


e sia E : l’impresa a cui è dato l’appalto fallirà prima del 2018.
Se la probabilità che la ditta fallisca prima del 2018 è del 60% e
la probabilità che la sede sia pronta è dello 0.15 o dello 0.75 a seconda
se la ditta fallisce o no prima del 2018, calcolare la probabilità che
se la sede è pronta in tempo, la ditta sia non fallita prima del 2018

p(C|E)=0.15
p(E)=0.60 E C

p(C| Ec)=0.75 C
p(Ec)=0.40 E c
Da trovare p(Ec | C)

Nella formula del teorema di Bayes

A numeratore: moltiplicare i numeri del ramo


relativo a S-E (quello in basso):
p(Ec) * p(C | Ec)=0.40 * 0.75 = 0.30
A denominatore: somma dei prodotti delle
probabilità di entrambi i rami
p(E)*p(C | E)+p(Ec) * p(C |  Ec)=
=0.60 * 0.15 + 0.40 * 0.75 = 0.39

Si trova allora p(Ec | C)=0.30/0.39=0.77


Esercizio di riepilogo
La seguente tabella mostra 1000 candidati di una scuola per infermieri
classificati secondo il punteggio riportato all’esame di ingresso
all’università e la qualità della scuola superiore da cui provenivano
Punteggio Scarsa Discreta Ottima Totale
Basso 105 60 55 220
Medio 70 175 145 390
Alto 25 65 300 390
Totale 200 300 500 1000

Dire qual è la probabilità che un candidato


1. Abbia avuto un punteggio basso all’esame.
2. Si sia diplomato in una scuola ottima
3. Abbia avuto un punteggio basso e si sia diplomato in una scuola
ottima.
4. Ammesso che si sia diplomato in una scuola ottima, abbia avuto un
punteggio basso
Una variabile aleatoria (o casuale) è una funzione
avente come dominio lo spazio campione associato ad
un esperimento e come codominio l’insieme dei numeri
reali.
XX ::


U navariabilealeatoriasi dicediscretasepuò
assumeresolounnum erodiscretodi valori;

si dicecontinuasepuòassum eretutti gli


infiniti valori di , odi unsuointervallo a,b .
Dunque,
Dunque,una
unav.c.
v.c.èèuna
unaregola
regola(una
(unafunzione)
funzione)che
chepermette
permettedidiassegnare
assegnare
un
unvalore
valorenumerico
numericoadadogni
ognirisultato
risultatodell’esperimento.
dell’esperimento.
Dalla
Dalladefinizione
definizioneèèevidente
evidentechechedato
datouno
unospazio campionarioèè
spaziocampionario
possibile
possibilecostruire
costruireinfinite
infinitev.c.
v.c.(si
(siosserva
osservache
chetale
talefunzione
funzionenon
nondeve
deve
essere
esserenecessariamente
necessariamentebiunivoca).
biunivoca).
COME SI ASSOCIANO LE PROBABILITA’ ALLE
VARIABILI ALEATORIE?

La probabilità che la variabile Y assuma il valore y,


P Y  y , è definita come la somma delle probabilità di
tutti i punti campione in S a cui viene assegnato il
valore y.

Generalmente, si denota P Y  y con p(y).


Si noti che p(y) non è altro che una funzione che assegna
una probabilità a ciascun valore y ed è chiamata funzione
(o distribuzione) di probabilità di Y.

La funzione di probabilità di una variabile aleatoria


discreta Y può essere rappresentata con una formula, una
tabella o un diagramma che associa la probabilità p(y) a
ciascun valore y.
Una funzione di probabilità p y  deve rispettare le
seguenti condizioni:

0  p y   1

 p y   1.0
y
Esempio Un esperimento consiste nel lancio di due
dadi. Sia Y la somma dei punti osservati quando i due dadi
sono stati tratti.

Si trovi la distribuzione di probabilità di Y.


L o s p a z io c a m p io n e a s so c ia to a q u e s to e s p e rim e n to è

S   i , j  : 1  i , j  6  , o v v e ro , l'in s ie m e d i tu tt e le co p p ie
o r d in a te ( i , j ) d i n u m e r i in te r i 1  i  6 e 1  j  6 ch e
r a p p r e s e n ta n o l’e s ito d e l la n c io d i c ia s cu n o d e i d u e d a d i.

In S ci s o n o 3 6 e v e n ti se m p lic i:
E 1  1 ,1 , E 2  1, 2  , E 3  1, 3  , E 4  1, 4  , E 5  1, 5  , E 6  1, 6  ,

E 7   2 ,1 , E 8   2 , 2  , E 9   2 , 3  , E 1 0   2 , 4  , E 1  2 , 5  , E 1 2   2 , 6  ,

E 1 3  3 ,1 , E 1 4   3 , 2  , E 1 5  3 , 3  , E 1 6  3 , 4  , E 1 7  3 , 5  , E 1 8  3 , 6  ,

E 1 9   4 ,1  , E 2 0  4 , 2  , E 2 1   4 , 3  , E 2 2   4 , 4  , E 2 3   4 , 5  , E 2 4   4 , 6  ,

E 2 5  5, 1 , E 2 6   5 , 2  , E 2 7  5, 3  , E 2 8  5, 4  , E 2 9  5 , 5  , E 3 0  5 , 6  ,


E 3 1  6 ,1  , E 3 2  6 , 2  , E 3 3   6 ,3  , E 3 4  6 , 4  , E 3 5   6 , 5 , E 3 6  6 , 6  .
Y  2   E 1 ,
Y  3   E 2 , E 7 ,
Y  4   E 3 , E 8 , E 13 ,
Y  5   E 4 , E 9 , E 14 ,E 19 ,
Y  6   E 5 , E 10 ,E 15 ,E 20 ,E 25 ,
Y  7    E 6 , E 11 , E 16 ,E 21 ,E 26 ,E 31 ,
Y  8   E 12 ,E 17 ,E 22 ,E 27 ,E 32 ,
Y  9   E 18 ,E 13 ,E 28 ,E 33 ,
Y  10   E 24 ,E 29 ,E 34 ,
Y  11    E 30 ,E 35 ,
Y  12    E 36  .
Una volta trovate le probabilità degli eventi semplici in S,
la probabilità da assegnare a ciascun valore y si calcola
facendo la somma delle probabilità di tutti i punti
campione in S a cui è associato il valore y.

P  Y  2   P  E 1   1 36

P  Y  3   P  E 1   P  E 7   2 36

P Y  4  P E1   P E7   P E13   3 36
In questo modo la distribuzione di probabilità di Y diventa:

Y 2 3 4 5 6 7 8 9 10 11 12
p(y) 1/ 36 2/ 36 3/ 36 4/ 36 5/ 36 6/ 36 5/ 36 4/ 36 3/ 36 2/ 36 1/ 36
La distribuzione di probabilità di una variabile aleatoria
discreta Y può essere rappresentata in maniera grafica
costruendo un istogramma che associa a ciascun valore
Y = y un rettangolo avente ampiezza 1/n (dove n è il
numero di valori che la variabile aleatoria può
assumere) e altezza p(y).
In questo modo, l’area di ciascun rettangolo sarà uguale
alla probabilità P(Y = y) e l’area totale di tutti i rettangoli
che formano l’istogramma sarà uguale a 1.

Ne segue che la probabilità P c  Y  d  , con a  c  d  b ,


sarà uguale alla somma delle aree dei rettangoli
dell'istogramma nell'intervallo [c, d ] .
Esempio Se l’esperimento descritto nell’esempio
precedente fosse effettivamente eseguito, un singolo
valore Y verrebbe osservato.

Il valore di Y potrebbe essere 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 o 12.

Se l’esperimento venisse ripetuto n volte, n valori y


verrebbero osservati.

Supponiamo che, dopo avere eseguito l’esperimento 100


volte, i seguenti risultati vengano osservati.
Y Frequenze Frequenze
osservate in relative
100 lanci
y1 = 2 3 .03
y2 = 3 4 .04
y3 = 4 7 .07
y4 = 5 11 .11
y5 = 6 17 .17
y6 = 7 21 .21
y7 = 8 13 .13
y8 = 9 12 .12
y9 = 10 8 .08
y10 = 11 3 .03
y11 = 12 1 .01
Si noti la somiglianza tra i due istogrammi.

In seguito verrà presentato un teorema in cui si


dimostra che, all’aumentare del numero delle
ripetizioni di un esperimento, la distribuzione delle
frequenze empiriche si approssima sempre più alla
distribuzione teorica di probabilità.
Costruiamo
Costruiamouna
unav.c.
v.c.eelelecorrispondenti
corrispondentiprobabilità
probabilitàinindue
duefasi:
fasi:

1.
1.Ad
Adogni eventodidisisiassocia
ognievento associauno
unoededun
unsolo
solonumero
numeroreale
realeX(e).
X(e).
Questa
Questaoperazione
operazionedefinisce
definisceuna
unav.c.
v.c.X.
X.

2.
2.Ad
Adogni
ognipossibile
possibilevalore
valoredidiX(.)
X(.)sisiassocia
associauna
unaprobabilità
probabilitàPPr[X].
r[X].
Questa
Questaoperazione
operazionedefinisce
definiscelaladistribuzione
distribuzionedidiprobabilità
probabilitàdella
dellav.c.
v.c.X.
X.

Si
Siosserva
osservachechementre
mentrelalaregola
regoladadaadottare
adottareèèarbitraria
arbitrariaininquanto
quanto
dipende
dipendeda daciò
ciòche
chevogliamo
vogliamochechelalav.c.
v.c.interpreti,
interpreti,lolostesso
stessonon
nonèèvero
vero
per
perlaladeterminazione
determinazionedella
delladistribuzione
distribuzionedidiprobabilità
probabilitàPPr[X] in quanto
r[X] in quanto
quest’ultima
quest’ultimaèèlegata
legataalle
alleprobabilità
probabilitàdegli
deglieventi
eventielementari
elementariPPr[e].
r[e].
Anziché
Anzichéspecificare
specificarelelesingole
singoleP[X]
P[X]sisicercherà,
cercherà,ove
ovepossibile,
possibile,didideterminare
determinare
lalarelazione
relazionefunzionale
funzionaleche
chelega
legaqueste
questeprobabilità,
probabilità,sintetizzata
sintetizzataininuna
una
funzione
funzionef(x).
f(x).Ciò
Ciòsarà
sarànecessario
necessarioquando
quandolalav.c.
v.c.XXèèdiditipo
tipocontinuo
continuooo
discreto
discretocon
conun unnumero
numeromolto
moltoelevato
elevatodidivalori.
valori.

In
Inalcuni
alcunicasi,
casi,sarà
sarànecessario
necessariocalcolare
calcolarelalaprobabilità
probabilitàche
cheXXassuma
assumaun
un
valore
valoreminore
minoreoouguale
ugualeaaxxk,k,cioè
cioè

Pr  X  xk   F ( xk )
Questa
Questafunzione
funzioneèèdetta
dettafunzione
funzionedi
diripartizione
ripartizione(f.r.)
(f.r.)ed
edèèuguale
ugualea:
a:

F ( xk )  f ( x1 )  f ( x2 )  ...  f ( xk )   f (x )
xi  xk
i
Proprietà
Proprietàdella
dellaf.r.
f.r.F(.):
F(.):

1.
1. F ()  0

2.
2. F ( xn )  F ()  1

3.
3. F ( xi )  F ( xi 1 )  f ( xi )

La
Larappresentazione
rappresentazionedidiF(x)
F(x)èèuna
una“funzione
“funzioneaagradini”.
gradini”.
Valore atteso e varianza
Per le variabili discrete è possibile definire un valore atteso E[x]
ed una varianza Var[x] che sono analoghe alle misure di
posizione e dispersione del valore medio e dello scarto
quadratico medio:

imax imax
  E[ x]   xi pi  2  Var [ x]   ( xi   ) 2 pi
i 1 i 1
Valore atteso e varianza
non coincidono con media e scarto
quadratico medio
imax imax
  E[ x]   xi pi  2  Var [ x]   ( xi   ) 2 pi
i 1 i 1

imax imax
x   xi f i S 2   ( xi  x ) 2 f i
i 1 i 1

Per un numero di tentativi molto elevato è ragionevole


che si identifichino le fi e le pi.
In precedenza abbiamo osservato che la distribuzione di
probabilità di una variabile aleatoria discreta Y può
essere generata assegnando una probabilità p(y)
maggiore o uguale a zero a ciascuno dei valori che Y può
assumere, in modo tale che  p y   1 .
y

La distribuzione di probabilità di una variabile aleatoria


continua, però, non può essere specificata nello stesso
modo.
Non è possibile, infatti, assegnare un valore non nullo a
ciascuno degli infiniti valori che una variabile aleatoria
continua può assumere e, allo stesso tempo, rispettare il
vincolo secondo cui la somma di tali probabilità deve
essere uguale ad 1.

Per assegnare i valori di probabilità ad una variabile


aleatoria continua dobbiamo dunque procedere in un
altro modo.
Distribuzioni di probabilità continue

y y

x a b x
Sono descritte da funzioni.

L’area sottesa dalla curva tra due valori (es. a-b) è la probabilità
che la variabile casuale assuma valori compresi tra a e b
Si presuppone l’esistenza di una funzione f(x) t.c.

Si definisce poi la probabilità che X sia compresa


fra a e b nel modo seguente:

Questa definizione soddisfa gli assiomi della teoria


della probabilità.
La funzione f(x) è detta densità di probabilità
f  y  0

 f  y dy  1


f(y), non è la probabilità, ma è proporzionale (a meno di un


infinitesimo) alla probabilità di un intervallo <<sufficientemente
piccolo>>
La probabilità che X prenda un valore nell’intervallo [a,b] è l’ area
sotto la pdf fra a e b.
 
La funzione di distribuzione (o ripartizione) F(x), di una variabile
aleatoria X, ed è definita per x da
xB

P( x A  x  x B )   f ( x)dx
xA

f(x)
L’integrale è la
probabilità che la
variabile casuale
assuma un valore
in un intervallo e
dipende dalla
densità di
probabilità f(x)

XA XB x
Probabilità diverse da zero possono quindi essere assegnate
ad intervalli di valori di una variabile aleatoria continua X.

A ciascuno dei singoli valori che la variabile aleatoria


continua può assumere, invece, è sempre associata una
probabilità uguale a zero, P(X = x) = 0.
Quest’ultima affermazione risulta più facilmente
comprensibile se interpretiamo la probabilità in termini
geometrici:

l’area sottesa alla funzione di densità f(x) nell’intervallo


corrispondente ad un punto è necessariamente uguale a
zero.
Cosa significa in pratica il fatto che una probabilità
uguale a 0 viene associata ad un evento perfettamente
legittimo e possibile (ovvero, l'evento corrispondente al
fatto che la variabile aleatoria continua assuma un
determinato valore)?
Esempio. Sia X la variabile aleatoria continua
corrispondente all'altezza in centimetri di uno studente
scelto a caso dalla popolazione studentesca universitaria.

Supponiamo di disporre di uno strumento infinitamente


preciso per misurare l'altezza e poniamo che l'altezza
degli studenti universitari vari tra 150 e 210 cm.

La variabile aleatoria X, quindi, potrà assumere qualsiasi


valore compreso in questo intervallo.
Consideriamo ora un particolare evento all'interno dello
spazio campione, ovvero l'evento X = 173.128735274 cm.

Pur essendo questo un valore che X può legittimamente


assumere, non sarà facile trovare uno studente che abbia
esattamente questa altezza.

Potremmo continuare a misurare l'altezza di moltissimi


studenti senza mai osservare l'evento in questione. Questo
ci porterebbe a concludere tale evento è talmente
improbabile che ad esso può essere assegnata una
probabilità uguale a 0.
La funzione f(x) non è una probabilità, è solo il suo
integrale su un intervallo (che ha il significato di
probabilità).

Nel caso discreto invece, la distribuzione di probabilità


f(xk) è per definizione la probabilità P(X=xk)
Distribuzioni discrete e densità continue sono oggetti
matematici di tipo diverso, non confrontabili fra loro.

Lo strumento che consente di confrontare variabili


aleatorie continue e discrete sono invece le rispettive
funzioni di distribuzione.
Variabili continue: limite
del caso discreto
f(x)
Valore atteso per variabili continue

Variabili xmax

continue   E[ x]   xf ( x)dx
x Min

prob
Somma
di avere
x

Variabili imax

discrete   E[ x]   xi pi
i 1
Varianza per variabili continue
Variabili xmax

 2  Var [ x]     2
continue ( x ) f ( x)dx
x Min

Scarto probabili
Somma
quadratico tà
di x

Variabili imax
  Var [ x]   ( xi   ) 2 pi
2

discrete i 1
Def.
Def.11.
11.Momenti
Momentisemplici
semplicididiordine
ordiner.r.
Se
SeXXèèuna
unav.c.
v.c.ililmomento
momentodidiordine
ordiner,r,con
conrrnaturale,
naturale,èèdefinito
definito
dalla
dallaseguente:
seguente:


  x
E Xr  r
f ( x)dx Nel
Nelcaso
casocontinuo.
continuo.


EX x
r r
j f (x j ) Nel
Nelcaso
casodiscreto
discreto
j

Si
Siosserva
osservache
cheper
perr=1
r=1sisiottiene
ottieneililvalore
valoreatteso
atteso(aspettativa)
(aspettativa)didiX.
X.
Def.
Def.12.
12.Momenti
Momenticentrali
centralididiordine
ordiner.r.
Se
SeXXèèuna
unav.c.
v.c.ililmomento
momentocentrale
centraledidiordine
ordiner,r,con
conrrnaturale,
naturale,èè
definito
definitodalla
dallaseguente:
seguente:

    x  E ( X )

E  X  E ( X ) 
r r
f ( x)dx Nel
Nelcaso
casocontinuo
continuo


 
E  X  E ( X )    x j  E ( X ) f ( x j )
r r
Nel
Nelcaso
casodiscreto
discreto
j

Si
Siosserva
osservache
cheper
perr=2
r=2sisiottiene
ottienelalavarianza
varianzadidi X.
X.
Il teorema di Bayes nel caso di variabili aleatorie
continue assume la seguente formulazione

p( A | B) p( B)
p( B | A)  

 p( A | B  b) f (b)db


Dove f è la fuzione di densità di probabilità della


variabile aleatoria B