Sei sulla pagina 1di 11

Politecnico di Milano - Scuola di Ingegneria Industriale e dellInformazione

Probabilit`
a e Statistica - prof. Maurizio Verri

(01) - Appunti di lezione

Probabilit`
a e Statistica

1.1

Esperimenti deterministici

Nello studio di vari fenomeni relativi alle scienze o allingegneria si incontrano


sistemi in cui una certa propriet`a o caratteristica obbedisce a una legge
deterministica: ogni volta che un dato insieme di condizioni si realizza,
inevitabilmente la caratteristica in esame assume un ben determinato valore.
Si dice allora che lesperimento `e deterministico perche il suo risultato `e certo.
Noti esempi di esperimenti deterministici sono i seguenti:
Esempio. Lacqua, riscaldata oltre i 100
trasforma in vapore.

C alla pressione di 1 atm, si

Esempio. In un lo conduttore di resistenza R una forza elettromotrice V


genera una corrente di intensit`a I = V /R (legge di Ohm).
Lo schema generale di un esperimento deterministico `e il seguente: losservatore sottopone il sistema a una sollecitazione (ingresso) e ne misura una
caratteristica in condizioni sperimentali note (variabili sotto controllo); la
lettura della caratteristica in esame (uscita) `e allora certa, cio`e `e la stessa in
tutte le eventuali repliche (prove) dellesperimento.
variabili sotto controllo
ingresso

sistema deterministico uscita certa

Aggiornamento: 5 marzo 2014

M. Verri - Probabilit`a e Statistica - Appunti

1.2

Esperimenti casuali

` facile convincersi con esempi che i sistemi (e quindi gli esperimenti) reali
E
non obbediscono quasi mai a leggi deterministiche: infatti, per quanto ben
progettato e realizzato possa essere un esperimento, in generale losservatore
non pu`o avere il controllo completo e sicuro di tutte le condizioni sperimentali e anche piccole variazioni di queste (rumore) possono produrre risultati
diversi. Si dice in questo caso che lesperimento `e condotto in condizioni di
incertezza e ad esso si d`a il nome di esperimento casuale.
variabili sotto controllo
ingresso

sistema casuale

uscita variabile

rumore

Esempio. Riprendiamo lesempio della legge di Ohm: a causa di piccole


variazioni nella temperatura esterna o nel campo elettrico, oppure per
la presenza di impurit`a nella composizione chimica del lo, ecc., in
ciascuna di tante repliche identiche dellesperimento la corrente misurata non sar`a mai esattamente V /R, ma un valore vicino a questo e
sempre diverso da prova a prova. Di conseguenza una legge pi`
u realistica per descrivere la corrente che attraversa il lo potrebbe essere
I = V /R + , dove il termine rappresenta gli eetti del rumore dovuto alle molteplici sorgenti di variabilit`a che agiscono sul sistema. La
legge di Ohm fornisce solo unapprossimazione del comportamento del
sistema perche non tiene conto della presenza di rumore e come tale `e
da ritenersi valida solo in condizioni ideali, che per`o non si realizzano
nella pratica.
Esempio. Una situazione concettualmente simile a quella precedente si ha
nel semplice esperimento del lancio di una moneta: qui i possibili risultati sono due (Testa o Croce) e il sistema `e deterministico perche
il moto della moneta obbedisce alle leggi della Meccanica e quindi, a
parit`a di condizioni, due lanci danno sempre la stessa uscita. Nella
realt`a questo non succede perche `e praticamente impossibile replicare
nelle medesime condizioni i successivi lanci della moneta.
Esempio. Si supponga di avere un lotto di pezzi di cui interessa una certa
qualit`a e che i pezzi siano classicati in due categorie a seconda che
abbiano tale qualit`a (pezzo buono) oppure non labbiano (pezzo difettoso). Lesperimento che consiste nellestrarre a caso un pezzo dal

M. Verri - Probabilit`a e Statistica - Appunti

lotto e nel controllare se esso `e buono oppure difettoso non `e evidentemente governato da alcuna legge deterministica; si noti per`o che tale
esperimento ammette due soli risultati (buono o difettoso) come il
lancio della moneta (Testa o Croce) e che ogni prova d`a luogo a
un esito che non `e certo. Entrambi gli esperimenti rientrano in una tipologia generale di esperimenti casuali nota in Probabilit`a e Statistica
come prove di Bernoulli. Con tale schema possono essere descritti numerosi altri sistemi di interesse per le applicazioni (i sondaggi a
due possibili risposte, favorevole o contrario; i test diagnostici per
evidenziare la presenza o meno di una malattia; ecc.). Le prove di Bernoulli possono naturalmente essere generalizzate al caso di esperimenti
casuali i cui possibili risultati siano pi`
u di due: si pensi, ad esempio,
ad un controllo di qualit`a in cui i pezzi sono classicati in tre categorie
(buoni, difettosi o recuperabili).
Esempio. Consideriamo un certa quantit`a di sostanza radioattiva e immaginiamo di registrare con un contatore il numero di disintegrazioni atomiche che si vericano in un dato intervallo di tempo. Applicando le
leggi della Meccanica Quantistica si pu`o dimostrare che, anche a parit`a di condizioni, prove diverse danno luogo in generale a conteggi
diversi. In questo caso il sistema `e, per cos` dire, intrinsecamente non
deterministico e lesperimento descritto `e casuale.

1.3

Il ruolo della Probabilit`


a e della Statistica

La Probabilit`a e la Statistica studiano i sistemi che presentano variabilit`a,


ovvero gli esperimenti in cui osservazioni della stessa caratteristica eseguite
in prove successive non producono lo stesso risultato. Gli scopi dello studio sono molteplici: migliorare la comprensione dei fenomeni, stimare quantit`a che interessano (parametri, funzioni,...), prendere decisioni, comunicare
informazioni, ecc.
Esempio. Quando si progetta un sistema di comunicazione (call center,
computer network, ecc.), uno degli aspetti peculiari del problema `e che
sia il numero che la durata dei collegamenti al sistema da parte degli
utenti sono casuali. Questo comporta che, se le linee predisposte sono
troppo poche, il gestore del servizio rischia di perdere clienti a causa del
blocco dei collegamenti, mentre, se le linee sono troppe, molte di esse
rimarranno spesso inutilizzate e di conseguenza i costi saliranno. Per
decidere come dimensionare correttamente il sistema di comunicazione
mediando tra le due opposte esigenze, il progettista deve simulare il

M. Verri - Probabilit`a e Statistica - Appunti

sistema con un opportuno esperimento casuale. La branca della Probabilit`a e Statistica che si occupa di questo genere di problemi `e detta
Teoria delle Code.
Molto schematicamente, la tipica analisi di un esperimento casuale avviene secondo i passi seguenti:
si fa una modellizzazione teorica dellesperimento: il modello `e una
semplicazione soggettiva e idealizzata del fenomeno reale, ma deve
comunque incorporarne i fattori di variabilit`a ritenuti pi`
u importanti;
si studia il modello con le tecniche matematiche del Calcolo delle
Probabilit`
a e si deducono previsioni relative a vari eventi connessi
con lesperimento;
si eseguono una o pi`
u prove dellesperimento; i dati osservati vengono organizzati, presentati e analizzati con i metodi della Statistica Descrittiva: se ne ricavano dei valori di sintesi detti statistiche
campionarie;
le statistiche campionarie vengono messe a confronto con le previsioni
teoriche per arrivare alla validazione del modello; si chiama Statistica Matematica linsieme delle tecniche statistiche e delle procedure
atte a stabilire se i dati sperimentali sono compatibili o meno con il
modello ipotizzato.

esperimento casuale

modello

osservazione

Calcolo delle Probabilit`a

Statistica Descrittiva

previsioni

analisi dati

Statistica Matematica

validazione

conclusioni

M. Verri - Probabilit`a e Statistica - Appunti

La modellizzazione

La costruzione del modello di un esperimento casuale avviene essenzialmente


in due fasi:
1. si associa allesperimento un insieme (detto spazio dei casi possibili
o anche spazio campionario), che `e linsieme di tutti i possibili risultati
(esiti, casi) dellesperimento;
2. ad ogni risultato o, pi`
u generalmente, ad ogni collezione di risultati
(evento) si assegna un peso (detto probabilit`
a dellevento).

2.1

Lo spazio campionario

I possibili esiti di un esperimento possono essere espressi da valori numerici


oppure essere classicati secondo categorie. La prima situazione si presenta
tipicamente quando il risultato `e la misura di una grandezza (massa, tempo,
temperatura, corrente elettrica, ...) o un conteggio (numero di disintegrazioni
che si vericano in un intervallo di tempo; numero di Teste uscite in n lanci
di una moneta; ...). La seconda si ha invece quando lesperimento serve a
classicare un oggetto o una persona secondo una pressata scala qualitativa
(pezzo buono, difettoso o recuperabile; persona sana o malata; ...). Uno
spazio campionario si dice finito se contiene un numero nito di punti
(esempi 1, 2 e 6), discreto se contiene al pi`
u uninnit`a numerabile di punti
(esempi 1, 2, 3 e 6), continuo se `e un intervallo di numeri reali (esempi 4 e
5) o, pi`
u in generale, una regione di Rd .
Esempi di spazi campionari.
1. Nel lancio di un dado i casi possibili sono le uscite delle varie facce
numerate, quindi = {1, 2, 3, 4, 5, 6}.
2. In due lanci di un dado i casi possibili sono le uscite delle facce numerate nel primo e nel secondo lancio, rispettivamente, quindi `e =
{(x, y) : x, y = 1, 2, 3, 4, 5, 6}.
3. Si lancia una moneta nche esce la prima Testa. Allora `e (con ovvia
notazione) = {T, CT, CCT, CCCT, ...}. Equivalentemente, si pu`o
contare il numero di lanci occorrenti perche esca la prima Testa: in tal
caso `e = {1, 2, 3, 4, ...}. I due spazi campionari sono in corrispondenza biunivoca e la descrizione dei casi possibili con luno o con laltro `e
del tutto equivalente.

M. Verri - Probabilit`a e Statistica - Appunti

4. Si misura la durata di funzionamento (ad esempio, in ore) di una data


apparecchiatura: si ha = [0, +).
5. Si traccia a caso una corda in una circonferenza di raggio r e se ne
misura la lunghezza. Allora `e = [0, 2r].
6. Da una scatola contenente due palline bianche e una nera si estraggono
a sorte due palline e si prende nota del loro colore. Per elencare i casi
possibili bisogna completare la descrizione dellesperimento assegnando
il meccanismo di estrazione:
(a) (estrazione in blocco) si estraggono le due palline insieme: i casi
possibili sono solo due, la combinazione due bianche oppure la
combinazione una bianca e una nera;
(b) (estrazioni successive senza reimmissione) si estrae la prima pallina e poi la seconda dalle rimanenti: i casi possibili sono (b, b),
(b, n), (n, b);
(c) (estrazioni successive con reimmissione) si estrae la prima pallina
e la si rimette nella scatola, poi si estrae la seconda pallina: i casi
possibili sono (b, b), (b, n), (n, b), (n, n).
Si noti che lestrazione in blocco non distingue tra primo e secondo
estratto, mentre le estrazioni successive tengono conto dellordine di
estrazione. I tre meccanismi descritti danno luogo a spazi campionari
non equivalenti: la modalit`a dellestrazione fa parte integrante dellesperimento casuale e viene incorporata nel modello attraverso la scelta
del corretto .

2.2

Eventi e loro algebra

Un evento `e una parte (sottoinsieme1 ) dello spazio campionario ; gli eventi


sono indicati con lettere maiuscole come A, B, ... . Si dice che levento A
si verifica se lesito dellesperimento `e un punto di A. Lo spazio `e detto
evento certo perche si verica sempre (per denizione esso contiene tutti e
soli gli esiti possibili), mentre linsieme vuoto `e detto evento impossibile
perche, non contenendo alcun esito, non si verica mai.
1

Nel caso discreto tutti i sottoinsiemi di sono eventi, mentre nel caso continuo ci`o non
`e possibile per evitare linsorgere di contraddizioni interne alla Teoria della Probabilit`a.
Intuitivamente, nel caso continuo si possono considerare eventi solo quei sottoinsiemi che
ammettono lunghezza (o area, o volume,...). Non tutti i sottoinsiemi di Rd hanno questa
propriet`a, ma quelli che non ce lhanno sono cos` strani e complicati che non si incontrano
praticamente mai nelle applicazioni.

M. Verri - Probabilit`a e Statistica - Appunti


Esempi di eventi.

1. A = {1, 3, 5} = esce una faccia dispari; B = {3, 6} = esce un


multiplo di 3.
2. A = {(x, 5 x) : x = 1, 2, 3, 4} = il punteggio totale `e 5;
B = {(x, x) : x = 1, 2, 3, 4, 5, 6} = nei due lanci escono facce uguali.
3. A = {1, 3, 5, ...} = la prima Testa esce in un lancio dispari; B =
{3} = la prima Testa esce al terzo lancio.
4. A = [0, 5] = lapparecchio funziona al massimo per 5 ore; B =
[3, +) = lapparecchio funziona almeno per 3 ore.
Ex. Denire qualche evento per gli esempi 5 e 6.
Ex. Per lesperimento dei due lanci di una moneta scrivere lo spazio campionario e gli eventi: esce Testa al primo lancio, esce Testa al secondo
lancio, escono facce dierenti nei due lanci.
La rappresentazione degli eventi come insiemi consente di manipolare gli
eventi usando le tecniche della Teoria degli Insiemi:
A `e un sottoevento di B se A `e un sottoinsieme di B, cio`e A B: se
si verifica A, allora si verifica anche B (ma non viceversa);
levento contrario di A (indicato con A) `e il complementare di A
rispetto ad , cio`e A = \ A: se si verifica A, allora non si verifica
A, e viceversa;
la somma dei due eventi A e B `e levento unione dei due, cio`e AB:
levento somma di A e B si verifica se si verifica almeno uno dei due;
il prodotto dei due eventi A e B `e levento intersezione dei due, cio`e
A B: levento prodotto di A e B si verifica se si verificano entrambi ;
A e B sono eventi incompatibili se il loro prodotto `e levento impossibile, cio`e A B = : se si verifica luno non pu`o verificarsi laltro; gli
eventi A1 , A2 , A3 , ... si dicono eventi mutuamente esclusivi se sono
a due a due incompatibili, cio`e Ai Aj = per i = j.
2

La numerazione corrisponde a quella degli esempi di spazi campionari del paragrafo


precedente.

M. Verri - Probabilit`a e Statistica - Appunti

Le denizioni di somma e di prodotto si possono estendere al caso di un


numero qualsiasi di eventi (anche uninnit`a numerabile) e inoltre valgono
tutte le regole formali di calcolo note dallinsiemistica (leggi di De Morgan,
ecc.).
Esempio. Riprendiamo lesempio del lancio di un dado e poniamo: A =
{1, 3, 5} = esce una faccia dispari, B = {3, 6} = esce un multiplo
di 3, C = {3} = esce la faccia 3. Allora: A = {2, 4, 6} = esce una
faccia pari, C = A B, C B, A B = {1, 3, 5, 6}, A B = A B =
{2, 4}, ecc.

2.3

La probabilit`
a

La probabilit`a `e il concetto che serve a quanticare le aspettative circa i


possibili risultati dellesperimento casuale.
Esempio. Si consideri il lancio di una moneta: se io ritengo che la moneta
sia perfettamente bilanciata e che le modalit`a del lancio non favoriscano
luscita di una delle due facce, le mie aspettative che lesito del lancio sia
Testa o Croce saranno le stesse e, prima di eettuare il lancio, assegner`o
un peso uguale ai due possibili risultati; si dir`a in questo caso che gli
esiti Testa o Croce hanno la stessa probabilit`a di vericarsi. Se invece
ho la fondata opinione che una delle due facce abbia pi`
u possibilit`a di
uscire dellaltra, assegner`o ad esse pesi diversi: in tale caso si dir`a che
la probabilit`a che esca Testa `e maggiore (o minore) della probabilit`a
che esca Croce.
Pi`
u in generale, si pu`o pensare di attribuire valori quantitativi alle aspettative che nellesperimento si verichi ciascuno dei vari eventi possibili (qual `e la
probabilit`a che nel lancio di un dado esca una faccia pari? o un multiplo di 3?
...). Si arriva cos` a denire matematicamente la funzione di probabilit`
a
come una corrispondenza che assegna ad ogni evento A di uno spazio campionario un numero reale P (A) (da leggersi probabilit`a di A o probabilit`a
che si verichi A). La scelta del valore di probabilit`a da assegnare a un
evento `e soggettiva: due persone possono dare probabilit`a diverse allo stesso
evento perche hanno opinioni o informazioni dierenti circa le possibilit`a di
realizzazione di quellevento nellesperimento. Tralasciando per il momento
la questione di come si possano scegliere i valori numerici della probabilit`a
anche il modello rappresenti il pi`
u fedelmente possibile la realt`a, esistono
tuttavia alcune propriet`a generali (dette propriet`
a di coerenza) che ogni
funzione di probabilit`a deve rispettare:

M. Verri - Probabilit`a e Statistica - Appunti

1. levento impossibile ha probabilit`a nulla e levento certo ha probabilit`a


uguale ad uno
P () = 0,
P () = 1
2. un sottoevento A di un evento B ha una probabilit`a che non pu`o essere
superiore a quella di B
A

A B = P (A) P (B)

3. la probabilit`a della somma di due eventi incompatibili `e la somma delle


loro probabilit`a
A

A B = = P (A B) = P (A) + P (B)

Dalle prime due propriet`a e dal fatto che `e A per ogni


evento A, si deduce che la scala dei valori assunti da ogni funzione di
probabilit`a `e sempre costituita dallintervallo [0, 1]:
A

0 P (A) 1

per cui un valore di probabilit`a pu`o essere espresso anche da una percentuale compresa tra 0% e 100%. Il fatto che la scala dei valori sia
[0, 1] e non un altro intervallo `e convenzionale: tuttavia, siccome levento impossibile non si verica mai, `e abbastanza naturale attribuirgli
il peso zero, mentre lattribuzione di un peso unitario allevento certo (detta condizione di normalizzazione) `e dettata essenzialmente da
ragioni di semplicit`a.
La terza propriet`a `e detta additivit`a e deve essere soddisfatta pi`
u in
generale per ogni famiglia nita o numerabile di eventi mutuamente
esclusivi. Ad es., per tre eventi si ha
A

B
C
AB =AC =BC =
= P (A B C) = P (A) + P (B) + P (C)

Dalle propriet`a di coerenza si possono dedurre le seguenti regole del


Calcolo delle Probabilit`
a
( )
A
P A = 1 P (A)
e
A

P (A B) = P (A) + P (B) P (A B)

M. Verri - Probabilit`a e Statistica - Appunti

10

Questultima pu`o essere estesa al caso di tre o pi`


u eventi qualsiasi: ad
esempio, per tre eventi si ha
P (A B C) = P (A) + P (B) + P (C)
P (A B) P (A C) P (B C)
+P (A B C)
Ex. Dimostrare le regole precedenti.
Accenniamo subito a un importante risultato di Calcolo delle Probabilit`a, detto Legge dei Grandi Numeri, su cui si basa la cosiddetta interpretazione frequentista della probabilit`a: la probabilit`
a dellevento
A `e la proporzione di volte in cui levento si verifica in una serie di
infinite prove dellesperimento casuale. In pratica, se si ripete lesperimento un numero N molto grande di volte e si conta il numero n (A)
di volte in cui A si verica nelle N prove, la proporzione (o frequenza
relativa empirica) n (A) /N varr`a allincirca P (A). Per questa ragione
la probabilit`a di un evento viene talvolta chiamata la frequenza relativa
teorica con cui esso si verica. Ad esempio, lanciando ripetutamente
una moneta regolare, la percentuale di Teste che si vericano tende
ad avvicinarsi al valore teorico 0.5 al crescere del numero dei lanci.
Le frequenze relative empiriche soddisfano evidentemente a propriet`a
analoghe alle tre propriet`a di coerenza della probabilit`a, e questo fatto
costituisce unulteriore giusticazione di tali propriet`a.

Esperimenti simulati3

1. Urna2colori.xls
Descrizione: estrazione di una pallina da unurna contenente palline di
2 colori
Parametri liberi: numero di prove; composizione dellurna
Calcolo automatico: probabilit`a, frequenze e istogramma di confronto
2. Urna3colori.xls
Descrizione: estrazione di una pallina da unurna contenente palline di
3 colori
Parametri liberi: numero di prove; composizione dellurna
Calcolo automatico: probabilit`a, frequenze e istogramma di confronto
3

Il materiale per il download `e disponibile sul portale BeeP del Politecnico di Milano.

M. Verri - Probabilit`a e Statistica - Appunti

11

3. Dado.xls
Descrizione: lancio di un dado equilibrato
Parametri liberi: numero di prove
Calcolo automatico: probabilit`a, frequenze e istogramma di confronto