Sei sulla pagina 1di 41

Calcolo delle probabilità e

ragionamento bayesiano

Unit 3 – Corso di Logica e Teoria


dell’Argomentazione
Sommario

• Nozioni probabilistiche
• Probabilità condizionata
• Ragionamento bayesiano
• Fallacie probabilistiche
Nozione di probabilità

• Dato un insieme di eventi, di cui un evento


A fa parte, con p(A) indichiamo la
probabilità che A accada (o che
l’asserzione A sia vera)
Interpretazioni per p

p(A) può essere interpretata in modo


– Soggettivo, se p(A) misura il grado di credenza
di un agente razionale sul fatto che A accada
– Logico, quando p(A) misura a priori il contenuto
informativo in modo inversamente proporzionale
(A debole ha probabilità alta)
– Frequentista, se p(A) misura la frequenza con cui
A accade in relazione ad una certa classe
– Classico, se p(A) misura a priori, ma solo in
contesti finiti equiprobabili, l’incidenza dei casi
favorevoli rispetto
a quelli possibili
Esempi – probabilità classica

Estrazione di una carta da un mazzo francese (52


carte: ♠♥♦♣ semi, valori 1,2,…,10,J,Q,K. E2=“esce un
2”, EC=“esce un cuori”, E2C=“esce il 2 di cuori”, ecc.
– p(E2C)= 1/52=0.019
– p(~E2C)= 51/52=.981
– p(EA)= 4/52=.076
– p(EACvEAQ)= 2/52=.038
– p(EC)= 13/52=.25
– p(E6vEK)= 8/52=.152
– p(~E6vEK)= 48/52=.924
– p(EAC&EAQ)= 0/52=0
– p(ECvEQvEFvEP)= 52/52=1
Calcolo delle probabilità

• È un sistema teorico che consiste di tre


assiomi e delle loro conseguenze deduttive
• Assiomi:
– p(A)≥0
– se A è un evento certo (ovvero una
tautologia), allora p(A)=1
– se A e B sono mutuamente esclusivi (ovvero il
presentarsi dell’uno esclude il presentarsi
dell’altro), allora p(AvB)=p(A)+p(B)
Prime conseguenze

• Se A è contraddittoria, p(A)=0
• Per qualunque A, 0≤p(A)≤1
• p(A)=1-p(~A)
• Se A e B sono verofunzionalmente
equivalenti, p(A)=p(B)
• Per qualunque A e B
p(AvB)=p(A)+p(B)-p(A&B)
A B

• p(A&B)≤p(A), p(A&B)≤p(B)
Altre conseguenze

• Se p(A)=p(B)=0 allora p(AvB)=0


• Se p(A)=1 allora p(A&B)=p(B)
• Se A è conseguenza logica di B
(cioè se p(B→A)=1)
allora p(A&B)=p(B)
Probabilità condizionale

• Con probabilità condizionale di A dato


B si intende la probabilità dell’asserzione A
data la verità dell’asserzione B, e si indica
con p(A|B)

• È anche (banalmente) il rapporto tra casi


favorevoli per A&B e casi favorevoli per B
Esempi – prob. condizionali

• Estrazione di una carta da un mazzo francese


(52 carte: ♠♥♦♣ semi; 1,2,…,10,J,Q,K per ogni seme)
– E2=“esce un due”, EC=“esce un cuori”,
E2C=“esce il due di cuori”, ecc.
– p(E2C|E2)= 1/4=.25
– p(E7C|EC)= 1/13=.076
– p(EAQ|~E2C)= 1/51=.001
– p(E7C|EQ)= 0/13=0
– p(EA|EAC)= 1/1=1
– p(EACvE2C|(ECvEF)&E<6)=2/10=.2
Alcune conseguenze

• p(A|A)=1
• p(~A|A)=0
• Se B è certa (tautologica), p(A|B)=p(A)
• Se A e B sono verofunzionalmente equivalenti,
allora p(A|C)=p(B|C) e p(C|A)=p(C|B)
• Se A e B sono indipendenti, allora
p(A&B)=p(A)p(B)
– In quanto p(A|B)=p(A)
• p(~A|B)=1-p(A|B)
• E molte altre ancora…
Teorema di Bayes

Permette di calcolare una probabilità


condizionale a partire dalla conversa

Se A1,A2,… An sono mutualmente esclusive


Esempio 1

“In Italia il 50% delle auto è una Fiat, ed il 25%


delle Fiat è di colore bianco. In generale, il 20%
delle auto è di colore bianco. Io stesso ho
un’auto bianca.”
“Be’, allora anche tu hai una Fiat”
L’argomento è forte?
A=“è una Fiat”, B=“è di colore bianco”
Perché?

• il 50% delle auto è una Fiat,


il 20% delle auto è di colore bianco,
ed il 25% delle Fiat è di colore bianco.
• Supponiamo che le auto siano
complessivamente 200, allora:
– Le Fiat sono il 50%, ovvero 100
– Le Fiat bianche sono il 25% di 100, cioè 25
– Le auto bianche sono il 20% di 200, cioè 40
– Dunque, data un’auto bianca (in totale sono
40), la probabilità che sia una Fiat è data da
25/40=0.625
Esempio 2

“Abbiamo una lampadina difettosa. Le lampadine


sono prodotte da tre macchine A, B e C, che
producono il 25%, il 35%, ed il 40% delle lampadine
totali. Le lampadine difettose prodotte sono, in
percentuale: il 5% per A, il 15% per B, il 12% per C.
Quale macchina l’ha prodotta?”
“Be’, penso sia stata prodotta da A.”
• Com’è l’argomento?
• A=“prodotta da A”, B=“prodotta da B”,
C=“prodotta da C”, D=“difettosa”
– Noi dobbiamo calcolare p(A|D)
– p(A)=.25; p(B)=.35; p(C)=.4
– p(D|A)=.05; p(D|B)=.15; p(D|C)=.12
Esempio 2 (cont.) - calcolo

p(A)=.25; p(B)=.35; p(C)=.4


p(D|A)=.05; p(D|B)=.15; p(D|C)=.12

p(A)p(D | A)
p(A | D) = =
p(A)p(D | A) + p(B)p(D | B) + p(C)p(D | C)
.25⋅.05
= = .11
.25⋅.05 +.35⋅.15 +.4 ⋅.12
• Dunque abbiamo l’11% che sia sta prodotta da A:
l’argomento è debole.
• Ugualmente possiamo calcolare p(B|D)=...=.46
e p(C|D)=...=.42
Esempio 3

Il medico al paziente: “Vediamo… le avevo chiesto


di effettuare il test diagnostico. Si tratta di una
malattia che colpisce l’1% della popolazione.
Questo test dà risultato positivo nel 90% dei malati
e nel 5% dei non malati. A lei ha dato esito
positivo. Dunque i miei sospetti erano fondati: è
molto probabile, circa al 90%, che lei abbia
contratto questa malattia.”
Com’è l’argomento?
Esempio 3 (cont.) - calcolo

Siano M=”malato”,
P=“positivo al test”
Voglio conoscere p(M|P)

Dunque l’argomento è debole, perché la probabilità


di aver contratto la malattia è solo del 15.38%
Esempio 3 (cont.) - perché?
Supponiamo la popolazione sia composta da 100000
individui.

Malati: 1000
Malati positivi al test: 900
Non Malati: 99000
Non Malati positivi al test: 4950

Quanti sono i malati positivi rispetto a tutti i positivi?


900/(900+4950)=15.4%
Esempio 3 (cont.) - conclusioni

Valutiamo invece l’argomento:


“[…] Il test diagnostico ha dato esito negativo:
dunque è molto probabile che lei non abbia
contratto la malattia”
• Dobbiamo calcolare p(~M|~P)

L’argomento è forte! (dunque, occorre fare


attenzione a cosa si sa e cosa si conclude!)
FALLACIE PROBABILISTICHE
Esempio

“Da un paio di settimane ho iniziato a giocarmi il


24 in tutte le estrazioni. Tieni presente che non
esce da 135 settimane: non può ritardare
ancora molto.” Com’è l’argomento?
L’argomento è debole perché gli eventi sono
indipendenti
L’idea intuitiva che i numeri sono equiprobabili,
per cui le frequenze devono riallinearsi non
funziona
Per la “legge dei grandi numeri”: le frequenze di
uscita dei numeri tendono al valore teorico se le
estrazioni sono infinite (non se sono finite)
Che fallacia è?

• E’ una fallacia Montecarlo (o dello


scommettitore): si commette quando dal
verificarsi (o dal non verificarsi) di una serie di
eventi di un tipo si inferisce come più probabile
che si presentino eventi di tipo opposto e
indipendenti
– È da tanto che x non si verifica
:. x si verificherà presto
• Una variante meno diffusa è:
– È da tanto che x non si verifica
:. x non si verificherà più
Esempio

“La maggior parte degli extracomunitari è


delinquente. Infatti la maggior parte dei reati è
commessa da extracomunitari.”
Com’è l’argomento?
(premessa) La maggior parte dei reati commessi in
Italia è commessa da extracomunitari.
(conclusione) La maggior parte degli
extracomunitari è delinquente.
E=“atto compiuto da extracomunitari”,
D=“atto delinquenziale”
(premessa) p(E|D) è superiore al 50%
(conclusione) p(D|E) è superiore al 50%
È un argomento debole e fallace
Che fallacia è?

È una fallacia della probabilità


condizionale: si commette quando
nell’inferenza si scambia la probabilità
condizionata pertinente con la sua conversa
(cioè p(A|B) al posto di p(B|A), o viceversa)
Esempio

“Bill ha 34 anni. E’ intelligente ma senza


immaginazione, ossessivo e senza vita sociale. A
scuola era bravo in matematica ma non era portato
negli studi umanistici e sociali.”
Assegnare un ordine, dal più probabile al meno
probabile.
1. Bill è un ragioniere.
2. Bill suona il jazz per hobby.
3. Bill è un ragioniere che suona il jazz per hobby.
Fallacia di congiunzione
Bill è un ragioniere = R Bill suona il jazz
per hobby = J

Dunque p(R&J)≤p(R), p(R&J)≤p(J),


Quando si conclude l’opposto, assumendo che una
congiunzione è più probabile di uno dei suoi
congiunti, si commette una fallacia di
congiunzione
Il Dilemma Monty Hall
In un gioco a premi ci sono 3 scatole chiuse: 2 vuote
e 1 contenente monete d’oro.
Scegliamo una scatola.
Il conduttore del gioco, che sa cosa si nasconde
dentro ciascuna scatola, apre una delle due rimaste
mostrando che è vuota. Poi offre: ”Se vuoi, puoi
cambiare scatola.”
Cosa scegliete?
Com’è il seguente argomento?
Premesse: tutto ciò che è noto nel gioco
Dunque, la probabilità che le monete d’oro siano nella mia
scatola è del 50%, per cui ho la stessa probabilità di vincere.
Il Dilemma Monty Hall (cont.)
S1M=“scatola 1 ha monete”, S1V=“scatola 1 è vuota”, …
Scelgo la scatola 1. Le 1 2
probabilità iniziali sono
p(S1M ) = = .33 p(S1V ) = = .67
3 3
Viene aperta la scatola 2 che è vuota. Per voi le
probabilità da considerare adesso sono
p(S1M | S2V ) = 1 2 = .5 p(S1V | S2V ) = 1 2 = .5
Dunque
Ma …
p(S1M | S2V ) = .5 > p(S1M ) = .33
l’apertura non è a caso: l’azione del presentatore non
deve alterare le probabilità iniziali, che rimangono

p(S1M | S2V ) = .33 p(S1V | S2V ) = .67


Il Dilemma Monty Hall (cont.)
Ma se le probabilità devono rimanere identiche,
p(S1M | S2V ) = .33 p(S1V | S2V ) = .67
allora conviene sempre cambiare scatola
L’argomento è debole (possiamo considerarlo una
fallacia dell’evidenza soppressa)
Non vi ho convinto? Simuliamo…
Scelta

Eliminazione

Cambio
Altro gioco

Adesso siamo ad un gioco a premi con dieci scatole. Dentro una


scatola ci sono monete d’oro, le altre sono vuote.
Prendiamo 2 scatole, su invito del conduttore.
Il conduttore del gioco, che conosce il contenuto di ciascuna
scatola, ne apre sette mostrando che sono vuote. Rimangono 3
scatole: 1 al conduttore, 2 a noi.
Poi ci domanda: "Vorresti cambiare le tue due scatole con la
scatola che rimane?”
Per prendere una decisione valutiamo:
(P) Abbiamo due scatole sulle tre rimaste.
:. La probabilità che le monete d’oro siano nella mia scatola è
del 67% circa (2 su 3).
:. Non mi conviene cambiare
Fate il vostro gioco… (cont.)

• È una variante del Monty Hall.


• Con le prime due scelte (supponiamo le scatole 1 e
2) abbiamo probabilità di vincere p(E1MvE2M)=.2
• Dopo aver eliminato 7 scatole vuote (ad es. dalla 4
alla 10) abbiamo p(E1MvE2M|E4V&E5V&…&E10V)=.67
• Sembra che lo scambio sia sconveniente
considerando le 3 scatole rimanenti, ma così
stiamo eliminando informazioni fondamentali
• Invece conviene cambiare: aumentiamo la
probabilità di vincere, passando dal 20% all’80%
Esempio
Il medico al paziente: “Vediamo… sospettavo che lei avesse
contratto questa malattia e le avevo chiesto di effettuare il
test diagnostico. Si tratta di una malattia che colpisce l’1%
della popolazione. Questo test dà risultato positivo nel 90%
dei malati e nel 5% dei non malati. A lei ha dato esito
positivo. Dunque i miei sospetti erano fondati: è molto
probabile, circa al 90%, che lei abbia contratto questa
malattia.”
Argomento debole: p(M|P)=15.38%
È una fallacia del tasso di base: commessa
quando si trascura il dato statistico assoluto
considerando solo il dato relativo, oppure
interpretandolo in modo isolato inferendo
conclusioni più ampie
CONFERMA BAYESIANA
Ipotesi ed evidenze

Formuliamo un’ipotesi H
Quanto è probabile?
Se non sappiamo nulla sul verificarsi di H,
stiamo valutando la probabilità a priori di H, cioè
p(H)
Abbiamo un’evidenza E
Adesso quanto è probabile H?
Stiamo valutando in che modo il verificarsi di E
cambia la probabilità di H, dunque è una
probabilità a posteriori di H: p(H|E)
E conferma l’ipotesi H o la disconferma?
Conferma bayesiana

Definizioni:
E conferma H SSE p(H|E)>p(H),
E disconferma H SSE p(H|E)<p(H),
E è neutrale rispetto ad H SSE p(H|E)=p(H)
Holmes e Barbaglio d’argento
Argomentazione di Sherlock Holmes:
Un cavallo è stato rapito e un fantino è stato ucciso.
Uno sconosciuto aveva litigato la sera prima col boss.
Il cane a guardia quella notte non ha abbaiato.
:. Non è stato uno sconosciuto.
H=“è stato uno sconosciuto” (ipotesi)
E=“il cane non ha abbaiato” (evidenza)
Per Holmes: p(H|E)<p(H)
– Dunque E disconferma l’ipotesi H
Invece sarebbe p(H|~E)>p(H)
– Cioè ~E confermerebbe l’ipotesi H.
E rende meno probabile H, dunque aumenta la
probabilità di ~H [visto che p(H)+p(~H)=1].
Il nome della rosa

Video

Cimitero innevato. C’è della terra rimossa vicino ad


una croce. Frate Guglielmo: “E’ morto qualcuno di
recente?”
R=“terra rimossa vicino alla croce”, M=“c’è un morto”
Secondo Fr. Guglielmo p(M|R)>p(M). R conferma M?
Ora p(M|R)>p(M) dunque R conferma M
Invece p(M|~R)<p(M) dunque
~R disconfermerebbe M
Perciò, con l’evidenza R, la nostra credenza in M
aumenta. Ma se fosse stato ~R, la credenza in M
sarebbe diminuita (anche se di poco)
Modelli di conferma

Modello fondamentale (o sillogismo


euristico) La divisione per un numero
p(E|H)=1 compreso tra 0 e 1 produce
H→E
un numero più grande
E Bayes
:. H è più credibile

Quindi E conferma H: H è più credibile


Se crediamo alla certezza di H allora è un
argomento fallace, ma se ragioniamo
induttivamente (non deduttivamente!) allora è un
argomento plausibile
Altri modelli

Se H→E allora
Se p(E) è molto piccolo allora p(H)/p(E) cresce molto
Modello della conseguenza improbabile
H→E
E è poco probabile (per suo conto) e si è verificata
:. H è molto più credibile
Se p(E) è molto grande allora p(H)/p(E) cresce poco
Modello della conseguenza probabile
H→E
E è molto probabile (per suo conto) e si è verificata
:. H è poco più credibile

Potrebbero piacerti anche