Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Ilenia Epifani
8 marzo 2006
1
Il contenuto di queste dispense è protetto dalle leggi sul copyright e dalle disposizioni dei trattati
internazionali. Il materiale qui contenuto può essere copiato (o comunque riprodotto) ed utilizzato libera-
mente dagli studenti, dagli istituti di ricerca, scolastici ed universitari afferenti ai Ministeri della Pubblica
Istruzione e dell’Università e della Ricerca Scientifica e Tecnologica per scopi istituzionali, non a fine di
lucro. Ogni altro utilizzo o riproduzione (ivi incluse, ma non limitatamente a, le riproduzioni a mezzo
stampa, su supporti magnetici o su reti di calcolatori) in toto o in parte è vietata, se non esplicitamen-
te autorizzata per iscritto, a priori, da parte dall’autore. L’informazione contenuta in queste pagine è
ritenuta essere accurata alla data della pubblicazione. Essa è fornita per scopi meramente didattici. L’in-
formazione contenuta in queste pagine è soggetta a cambiamenti senza preavviso. L’autore non si assume
alcuna responsabilità per il contenuto di queste pagine (ivi incluse, ma non limitatamente a, la correttezza,
completezza, applicabilità ed aggiornamento dell’informazione). In ogni caso non può essere dichiarata
conformità all’informazione contenuta in queste pagine. In ogni caso questa nota di copyright non deve
mai essere rimossa e deve essere riportata anche in utilizzi parziali. Copyright 2006 Ilenia Epifani.
2
Questo materiale è stato elaborato durante gli Anni Accademici 2000-2005 per le esercitazioni
ai corsi di Calcolo delle Probabilità per allievi di Ingegneria Elettronica, Informatica e delle Tele-
comunicazioni, tenuti dai docenti A. Guglielmi, L. Ladelli e I. Epifani. Alcuni degli esercizi sono
inoltre tratti dai temi d’esame di Calcolo delle Probabilità sempre di quegli anni. Gli esercizi sono
organizzati seguendo gli “Appunti per il corso di Calcolo delle Probabilità”, edizione 2005/2006,
di I. Epifani, L. Ladelli e G. Posta disponibili alla pagina
http://www1.mate.polimi.it/∼ileepi/dispense/0506CP/.
Per gli esercizi tratti da un libro sono forniti pagina, titolo, autore, casa editrice.
Per gli esercizi tratti da prove d’esame sono forniti data e nome del corso.
Milano, marzo 2006 Ilenia Epifani
Indice
1 Probabilità 1
1.1 Spazi di probabilità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 Operazioni su eventi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Proprietà della probabilità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Spazi finiti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3.1 Spazi di probabilità uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4 Probabilità condizionata e indipendenza . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4.1 Alcune formule importanti . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4.2 Indipendenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4.3 Affidabilità di un sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.5 Soluzioni di alcuni esercizi del Capitolo 1 . . . . . . . . . . . . . . . . . . . . . . . 10
2 Variabili aleatorie 21
2.1 Variabili aleatorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2 Variabili aleatorie discrete . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3 Esempi di densità discrete notevoli . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.3.1 Densità bernoulliana, binomiale, geometrica . . . . . . . . . . . . . . . . . . 22
2.3.2 Densità di Poisson come limite di densità binomiale . . . . . . . . . . . . . 23
2.3.3 Densità ipergeometrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.4 Variabili aleatorie assolutamente continue . . . . . . . . . . . . . . . . . . . . . . . 24
2.5 Funzioni di variabili aleatorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.5.1 Funzioni di variabili aleatorie discrete . . . . . . . . . . . . . . . . . . . . . 26
2.5.2 Funzioni di variabili aleatorie assolutamente continue . . . . . . . . . . . . . 27
2.6 Soluzioni di alcuni esercizi del Capitolo 2 . . . . . . . . . . . . . . . . . . . . . . . 28
4 Vettori aleatori 47
4.1 Vettori aleatori discreti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.2 Vettori aleatori assolutamente continui . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.3 Minimo e Massimo di variabili aleatorie i. i. d. . . . . . . . . . . . . . . . . . . . . 51
4.4 Vettori gaussiani . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.5 Teorema centrale del limite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.6 Soluzioni di alcuni esercizi del Capitolo 4 . . . . . . . . . . . . . . . . . . . . . . . 55
5 Miscellanea 65
5.1 Esercizi di ricapitolazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
i
ii INDICE
Capitolo 1
Probabilità
1. (A ∪ B) \ C = A ∪ (B \ C)
2. A ∩ B ∩ C = A ∩ B ∩ (C ∪ B)
3. A ∪ B ∪ C = A ∪ (B \ (A ∩ B)) ∪ (C \ (A ∩ C))
4. A ∪ B = (A \ (A ∩ B)) ∪ B
5. (A ∩ B) ∪ (B ∩ C) ∪ (C ∩ A) ⊃ A ∩ B ∩ C
6. (A ∩ B) ∪ (B ∩ C) ∪ (C ∩ A) ⊂ (A ∪ B ∪ C)
7. (A ∪ B) \ A = B
8. A ∩ B c ∩ C ⊂ A ∪ B
9. (A ∪ B ∪ C)c = Ac ∩ B c ∩ C c
11. (A ∪ B)c ∩ C = Ac ∩ B c ∩ C
Esercizio 1.1.2 Siano A, B e C tre eventi. Esprimete i seguenti eventi mediante operazioni
logiche su A, B e C:
(1) almeno un evento si verifica
(2) nessun evento si verifica
(3) si verifica soltanto un evento
(4) al più un evento si verifica
(5) tutti gli eventi si verificano
(6) due eventi su tre si verificano
(7) si verifica soltanto A
(8) si verifica A
(9) si verificano almeno due eventi
1
2 CAPITOLO 1. PROBABILITÀ
Esercizio 1.1.3 Una moneta regolare viene lanciata due volte. Antonio vince se esce testa al
primo lancio; Benedetto vince se la moneta esibisce croce al secondo.
a) Descrivete lo spazio campionario.
b) Descrivete in termini di sottoinsiemi dello spazio campionario i seguenti eventi:
(1) Antonio vince
(2) Benedetto vince
(3) Antonio non vince
(4) Benedetto non vince
(5) Antonio e Benedetto vincono entrambi
(6) Vince Antonio ma non Benedetto
(7) Vince Benedetto ma non Antonio
(8) Almeno uno dei due vince
(9) Nessuno dei due vince
(10) Vince soltanto uno dei due
(11) Esce cuori
(12) Esce testa o croce
Esercizio 1.2.2 Relativamente alla prima sessione d’esame del primo anno del corso di laurea
XXX è noto che la probabilità che uno studente superi:
• l’esame A è 0.4,
• l’esame B è 0.5,
• l’esame C è 0.3,
• l’esame A e l’esame B è 0.35,
• l’esame A e l’esame C è 0.2,
• l’esame B e l’esame C è 0.25,
• tutti e tre gli esami è 0.15,
Determinare la probabilità che nella prima sessione uno studente scelto a caso
1. non superi l’esame A;
2. superi A ma non superi B;
3. superi almeno un esame;
4. non superi alcun esame.
P (A ∩ B) ≥ P (A) + P (B) − 1
Esercizio 1.3.2 Se una moneta è truccata in modo tale che la probabilità che esca croce risulti
quattro volte la probabilità che esca testa, quanto vale la probabilità che esca testa?
Esercizio 1.3.3 Si vuole assegnare la probabilità che una persona scelta a caso (in una certa
popolazione) possegga k appartamenti a partire dai pesi
c/4 se k = 0
qk = c/2k se k = 1, . . . , 5
0 altrove
(1) Per quali valori di c i pesi assegnati definiscono una funzione di probabilità?
(2) Quanto vale la probabilità che una persona scelta a caso possegga almeno due appartamenti?
Esercizio 1.3.5 (tratto da [4], pag. 55) A lancia un dado 6 volte e vince se totalizza almeno
un uno, B lancia un dado 12 volte e vince se totalizza almeno 2 volte un uno. Chi ha maggiore
probabilità di vincere? [Risp: A]
Esercizio 1.3.6 (Esempio 1.4.7 pag. 14 in [5]) Un’associazione è formata da 25 iscritti. Tra
questi devono essere scelti un presidente ed un segretario.
(1) Quanti sono i modi possibili per ricoprire le due cariche?
(2) Se gli individui vengono scelti a caso per ricoprire le cariche, qual è la probabilità che un
assegnato membro dell’associazione ne ricopra una?
Esercizio 1.3.7 Ordinando a caso i primi 7 numeri naturali, quanto vale la probabilità che i
numeri 1 e 2 siano adiacenti (con 2 successivo ad 1)? [Risp: 0.14285]
4 CAPITOLO 1. PROBABILITÀ
Esercizio 1.3.8 1. Estraendo a caso senza reimmissione sette lettere dall’alfabeto italiano (com-
posto da 21), quante parole diverse (anche di senso non compiuto) si possono comporre? Qual è
la probabilità di comporre una parola che inizia e finisce per vocale?
2. Come cambiano le risposte alle domande precedenti se le lettere sono estratte con reimmis-
sione?
3. Se le lettere vengono estratte con reimmissione, quanto vale la probabilità di comporre una
parola di sette lettere non ripetute?
Esercizio 1.3.10 Quanti sono i possibili anagrammi (anche di senso non compiuto) della parola
“PROVENZALI”? Se una scimmia ordina a caso le lettere della parola PROVENZALI, quanto vale
la probabilità che la quinta lettera della parola composta sia una vocale e l’ultima una consonante?
[Risp: 10!; 4/15]
Esercizio 1.3.11 (Esame, CP INF 06/09/02) Consideriamo una ruota della roulette con 37
possibili diversi risultati: 0,1, . . . ,36. Il croupier lancia 10 volte la pallina.
2. Qual è la probabilità di ottenere sui 10 lanci della pallina i seguenti risultati: sui primi due
lanci 0, sui successivi cinque lanci un multiplo di 3 diverso da 0, e sugli ultimi tre lanci un
multiplo di 14 diverso da 0? [Risp: 125 · 23 /3710 ]
3. Qual è la probabilità di ottenere sui 10 lanci della pallina due volte zero, cinque volte
un multiplo
5 di 3 diverso da 0 e tre volte un multiplo di 14, sempre diverso da 0? [Risp:
10 5 3 10
5 3 12 · 2 /37 ]
Esercizio 1.3.12 (Esempio (b) pag. 35 in [4]) Ciascuno dei 50 fra gli Stati Uniti d’America
hanno due senatori. In una commissione di 50 senatori scelti a caso, qual è la probabilità che
(1) un assegnato stato sia rappresentato [Risp: 149/198]
(2) tutti gli stati siano rappresentati [Risp: 250 / 100
50 ]
Esercizio 1.3.13 (Esempio 1.4.8 in [5]) (1) Se una persona gioca a poker con un mazzo di 32
carte, in quanti modi può essere servito?
(2) Qual è la probabilità che il giocatore abbia un tris “servito” (e non un gioco migliore)?
Esercizio 1.3.14 Nell’Università xxx, il docente del corso yyy ha distribuito 16 domande fra cui
ne pescherà 4 per la prova d’esame. Se uno studente prepara soltanto 4 domande,
(1) qual è la probabilità che proprio queste 4 domande costituiscano la prova d’esame? [Risp:
1/1820]
(2) Qual è la probabilità che almeno una delle domande preparate dallo studente sia estratta alla
prova d’esame? [Risp: 265/364]
1.4. PROBABILITÀ CONDIZIONATA E INDIPENDENZA 5
Esercizio 1.3.15 (Esempio 1.4.9 pag. 15 in [5]) Estraendo con reimmissione n palline da un’ur-
na che ne contiene M numerate da 1 a M e tenendo conto dell’ordine, quanto vale la probabilità
che ciascuna delle n palline estratte sia diversa dalle altre?
Esercizio 1.3.16 Allocando a caso 40 palline in 50 celle, quanto vale la probabilità che una
assegnata cella contenga esattamente 30 palline? Quanto vale la probabilità che una assegnata
cella contenga esattamente k palline, per k = 0, . . . , 40?
Esercizio 1.3.17 Due carte vengono estratte “a caso” da un mazzo di 52 carte francesi. Calcolare
la probabilità che 52
(a) siano entrambe di picche; [Risp: 13 / ]
252
2
4 13
(b) siano dello stesso seme; [Risp: 1 2 / 2 ]
4 52
(c) abbiano lo stesso numero; [Risp: 13 2 / 2 ]
1 52
(d) una sia di picche e l’altra di cuori; [Risp: 13 1
13
1 / 2 ]
(e) la prima sia di picche e la seconda di cuori. [Risp: (13 × 13)/(52 × 51) ]
Esercizio 1.3.18 In un gioco del poker con un mazzo di 32 carte (“variante Teresina”),
(1) qual è la probabilità che un giocatore riceva poker d’assi servito?
(2) qual è la probabilità che un giocatore riceva un poker servito?
Esercizio 1.3.19 Un mazzo di 52 carte contenente esattamente 26 carte rosse e 26 nere viene
diviso a metà. Si determini la probabilità che ognuna delle due parti contenga carte rosse e nere
in egual numero.
Esercizio 1.3.20 Bianchi scommette con Rossi che estrarrà 4 carte di 4 semi diversi da un mazzo
di carte napoletane (che ne contiene 10 per ognuno dei quattro semi). Qual è la probabilità che
Bianchi vinca?
Esercizio 1.3.21 (Esame CP TEL 21/11/02) Un’urna contiene 25 palline di cui 5 palline
rosse, 5 gialle, 5 blu, 5 nere e 5 bianche. Vengono estratte in blocco 3 palline.
(1) Calcolare la probabilità che le tre palline estratte siano tutte rosse.
(2) Calcolare la probabilità che le tre palline estratte siano tutte dello stesso colore.
(3) Calcolate la probabilità che le tre palline estratte siano tutte di colori diversi.
Esercizio 1.3.22 (a) Si determini la probabilità che i 160 allievi di una classe festeggino il
compleanno in 160 giorni diversi.
(b) In un gruppo di cinque amici quanto vale la probabilità che
(b.1) almeno 2 persone scelte a caso siano nate nello stesso giorno della settimana?
(b.2) Esattamente 2 siano nate di domenica?
Esercizio 1.4.2 Cinque biglietti di una lotteria sono rimasti invenduti. Fra questi c’è il biglietto
vincente. Due amici A e B decidono di comprarne uno a testa. A sceglie per primo il biglietto.
(a) Qual è la probabilità che A acquisti il biglietto vincente?
(b) Qual è la probabilità che B acquisti il biglietto vincente?
(c) Qual è la probabilità che B acquisti il biglietto vincente, se non è stato acquistato da A?
(d) Qual è la probabilità che uno dei due vinca?
Esercizio 1.4.3 (Esempio 1.13 in [11]) Un canale di comunicazione trasporta segnali di due
tipi denominati 0 e 1. A causa del rumore alcune volte viene trasmesso 0, ma è ricevuto 1; altre
volte è trasmesso 1 e ricevuto 0. Assumiamo che sia 0.94 la probabilità che un segnale trasmesso
come 0 sia ricevuto correttamente e che sia 0.91 la probabilità che un segnale trasmesso come 1
sia ricevuto correttamente. Assumiamo che la probabilità di trasmettere 0 sia 0.45. Viene spedito
un segnale. Trovare:
1) la probabilità di ricevere 1,
2) la probabilità di ricevere 0,
3) la probabilità che sia trasmesso 1, dato che è ricevuto 1,
4) la probabilità che sia trasmesso 0, dato che è ricevuto 0,
5) la probabilità di un errore.
Esercizio 1.4.4 (Urne di Polya) Un’urna contiene 3 palline bianche e 5 nere. Si estrae una
pallina a caso. Se la pallina estratta è nera, la pallina viene riposta nell’urna insieme ad altre tre
palline nere. Se, invece, la pallina estratta è bianca, nessuna pallina è riposta nell’urna. Si procede
quindi a successive due estrazioni seguendo lo schema appena descritto.
(a) Qual è la probabilità di estrarre tre palline nere?
(b) Qual è la probabilità di estrarre tre palline dello stesso colore?
Esercizio 1.4.5 (Esercizio 1.11 pag. 8 in [1]) Un’urna contiene 2 palline rosse e quattro nere.
Due giocatori A e B giocano nel modo seguente: le palline vengono estratte ad una ad una e messe
da parte. A vince se l’ultima pallina è rossa, altrimenti vince B.
a) Qual è la probabilità che A vinca?
b) Qual è la probabilità che A vinca sapendo che la prima pallina estratta è rossa?
c) Qual è la probabilità che A vinca e che la prima pallina estratta sia rossa?
Esercizio 1.4.6 In un gioco televisivo viene messo in palio un 1 milione di euro. Per vincerlo il
concorrente dovrà indovinare fra tre buste qual è quella che contiene la promessa di pagamento.
Il concorrente sceglie a caso una busta; a questo punto il conduttore mostra una busta vuota
offrendo al concorrente la possibilità di cambiare la propria busta con quella rimanente.
Qual è la probabilità di vincere il premio conservando la prima busta scelta?
Qual è la probabilità di vincere cambiando la busta?
Qual è la strategia migliore fra le due?
Esercizio 1.4.7 (Esame MPSPS 07/02/01 (VO)) È noto che i gemelli possono essere dei
veri gemelli, e in questo caso sono dello stesso sesso, o degli pseudo-gemelli, e in tal caso è 1/2 la
probabilità che siano dello stesso sesso. Sia p la probabilità che due gemelli siano veri gemelli.
(1) Determinare la probabilità che due gemelli siano veri gemelli sapendo che sono dello stesso
sesso.
(2) Qual è la probabilità che due gemelli siano di sesso diverso?
Esercizio 1.4.8 Abbiamo due urne U1 , U2 . U1 contiene 2 palline bianche e 3 palline nere. U2
contiene 6 palline bianche e 4 nere. Si estrae a caso una pallina da un’urna. L’urna è scelta
seguendo un procedimento di casualizzazione che attribuisce probabilità p a U1 ed (1 − p) a U2 .
Per quale valore di p la probabilità di estrarre pallina nera risulta uguale alla probabilità di estrarre
a caso una pallina nera da un’urna con 7 palline nere ed 8 bianche?
1.4. PROBABILITÀ CONDIZIONATA E INDIPENDENZA 7
Esercizio 1.4.9 Una prima urna contiene 4 palline bianche e 3 palline nere e una seconda urna
contiene 3 palline bianche e 5 palline nere. Estraggo una pallina dalla prima urna e senza guardarla
la ripongo nella seconda; quindi estraggo una pallina dalla seconda urna.
(1) Calcolare la probabilità che la pallina estratta dalla seconda urna sia nera.
(2) Se la pallina estratta dalla seconda urna è nera, è più probabile che la pallina estratta dalla
prima urna fosse bianca o nera?
Esercizio 1.4.12 (Esame CP TEL; II recupero 18/09/03) Partendo dalla piazzetta del pae-
se, Camillo può raggiungere il porto, scegliendo fra sei diversi percorsi numerati da 1 a 6. Camillo
sceglie il percorso lanciando un dado regolare. Per i = 1, . . . , 6, sia 1/(i + 1) la probabilità di
raggiungere il porto in meno di 10 minuti, attraverso il percorso i.
(1) Calcolate la probabilità che Camillo impieghi meno di 10 minuti per raggiungere il porto dalla
piazzetta.
(2) Calcolate la probabilità che Camillo non abbia scelto il percorso 1, sapendo che ha impiegato
almeno 10 minuti per andare dalla piazzetta al porto.
Esercizio 1.4.13 (Esame MPSPS 20/09/01 (VO)) Siano date due urne, urna A ed urna B.
Nell’urna A ci sono 2 biglie bianche ed 1 biglia nera, nell’urna B c’è 1 biglia bianca e 2 nere. Si
lancia un dado; se esce un numero minore od uguale a 4 si pesca una biglia dall’urna A, altrimenti
si pesca una biglia dall’urna B.
(1) Calcolare la probabilità che la biglia estratta sia nera. [Risp: 4/9]
(2) Calcolare la probabilità che sul dado sia uscito un numero minore od uguale a 4 sapendo che
si è estratta una biglia nera. [Risp: 1/2]
(3) Calcolare la probabilità che sul dado sia uscito il numero 1 sapendo che si è estratta una biglia
nera. [Risp: 1/8]
Esercizio 1.4.14 (CP INF 16/09/02 Esercizio 1.1) Un’urna contiene 6 palline di cui 3 bian-
che, 2 rosse ed 1 nera. Si estraggono senza reimmissione tre palline e si vince se una delle tre è
nera.
1. Si calcoli la probabilità di vincere.
2. Si calcoli la probabilità di vincere sapendo che la pallina nera non è uscita nelle prime due
estrazioni.
3. Sapendo di aver vinto, qual è la probabilità che la pallina nera non sia uscita nelle prime due
estrazioni?
Esercizio 1.4.15 (CP INF 02/05/02 Esercizio 2) La ditta XYZ produce transistor per la
realizzazione di circuiti elettronici. I transistor prodotti dalla ditta sono di due classi: classe A e
classe B. Per testarne la durata, i transistor vengono sottoposti ad un “test di vita accelerata”. La
probabilità che un transistor di classe A bruci dopo 5 minuti di test di vita accelerata è pari a 0.2,
8 CAPITOLO 1. PROBABILITÀ
mentre la probabilità che un transistor di classe B bruci dopo 5 minuti di test di vita accelerata è
pari a 0.6.
La ditta UVW utilizza i transistor prodotti da XYZ per assemblare circuiti elettronici dei quali
garantisce la durata. A tal fine acquista solo transistor di classe A. Un giorno l’ufficio consegne
della XYZ telefona alla UVW avvertendo che c’è una piccola probabilità, pari al 10%, che l’ultimo
lotto di transistor acquistato dalla UVW, a causa di un errore di consegne, sia costituito da
transistor di classe B. La UVW sottopone un transistor proveniente dall’ultimo lotto acquistato
ad un test di vita accelerato.
1.4.2 Indipendenza
Esercizio 1.4.16 (Esercizio 173 pag. 44 in [3]) Si effettuano due estrazioni con reimmissione
da un’urna che contiene 100 palline numerate da 1 a 100. Siano A1 “la prima pallina estratta è
pari”, A2 := “la seconda pallina estratta è pari” e B := “una sola pallina estratta è pari”.
Gli eventi A1 , A2 sono indipendenti? E A2 , B? E A1 , B?
I tre eventi A, A2 , B sono indipendenti?
Esercizio 1.4.17 (Esempio 1.9 pag. 28 in [11]) Si lanciano due dadi regolari. Siano A=“Il
primo dado esibisce la faccia 1,2 o 3”, B=“Il primo dado esibisce la faccia 3,4 o 5”, C=“La
somma dei due dadi è 9”. Verificare che P (A ∩ B ∩ C) = P (A)P (B)P (C). Gli eventi A, B, C sono
indipendenti? Perché?
Esercizio 1.4.18 La distribuzione dei dipendenti di una nuova compagnia telefonica è la seguente:
il 70% sono uomini e il 30% sono donne. Fra gli uomini, il 25% è laureato, il 60% ha un diploma
di scuola media superiore e il restante 15% ha la licenza media inferiore. Per le donne le tre
percentuali sono rispettivamente, 35%, 60% e 5%.
(1) Scelto un dipendente a caso, qual è la probabilità che non sia laureato?
(2) Scelto un dipendente a caso, qual è la probabilità che sia donna e non laureata?
(3) Scelto a caso un dipendente che è laureato, qual è la probabilità che sia uomo?
(4) Sesso e livello di istruzione sono indipendenti?
(5) La risposta al punto precedente cambia se la ripartizione delle dipendenti per livello di
istruzione coincide con la ripartizione dei dipendenti per livello di istruzione?
Esercizio 1.4.19 (Esame CPSMA, bio II recupero 17/09/02) Siano A =“il libro di pro-
babilità XYZ della biblioteca del dipartimento in questo momento è in prestito” e B =“il libro di
probabilità ZWT della biblioteca del dipartimento in questo momento è in prestito”.
(1) Se P (A) = 0.5, P (B) = 0.4 e P (A ∪ B) = 0.65, calcolare la probabilità che entrambi i libri
siano in prestito e la probabilità che esattamente uno dei due libri sia in prestito.
(2) Se invece P (A ∪ B) = 0.7 e ciascuno dei due libri viene preso in prestito indipendentemente
dall’altro ma con uguale probabilità, calcolare P (A).
(3) Se invece so che P (A ∪ B) = 0.7 e la probabilità che esattamente un libro sia in prestito è 0.5,
posso determinare P (A) e P (B)? (Giustificare adeguatamente la risposta).
Esercizio 1.4.20 (Esame MPSPS 21/06/01 (VO)) Filiberto possiede 5 monete di cui 3 eque
e 2 truccate in modo tale che se lanciate diano sempre testa. Filiberto sceglie a caso una delle 5
monete e la lancia 3 volte.
(1) Calcolare la probabilità di ottenere 3 teste.
(2) Supponiamo che dopo aver lanciato 3 volte la moneta Filiberto abbia ottenuto 3 teste. Ora
Filiberto è (erroneamente!) convinto che lanciando la stessa moneta una quarta volta otterrà croce
con grande probabilità. Calcolare la probabilità di ottenere croce al quarto lancio sapendo che nei
primi tre si è ottenuto testa.
1.4. PROBABILITÀ CONDIZIONATA E INDIPENDENZA 9
(3) Supponendo che al quarto lancio Filiberto abbia ottenuto ancora testa, calcolare la probabilità
che la moneta che Filiberto ha lanciato quattro volte sia una di quelle truccate.
Esercizio 1.4.21 (Esame MPSPS 19/04/01 (VO)) Tacito è appassionato di pesca, in par-
ticolare ama pescare trote. Per questo si reca nella “Valle della Trota”. La valle è famosa per i
suoi due laghi, il “Lago d’Oro” ed il “Lago d’Argento”, entrambi pescosissimi, ma mentre il primo
è popolato interamente da trote per il secondo si stima che solo il 60% dei pesci in esso presenti
siano trote (le uniche prede di interesse per Tacito). Tacito arriva al bivio tra i due laghi ma non
ricorda quale dei due sia quello con più trote, cosı̀ rimette la scelta del lago al caso lanciando
una moneta (equilibrata). Tacito è un ottimo pescatore e sicuramente pescherà almeno un pesce,
inoltre essendo uno sportivo quando pesca un pesce smette di pescare per l’intera giornata. Prima
di sera ha catturato un pesce.
(1) Calcolare la probabilità che il pesce pescato da Tacito sia una trota.
(2) Sapendo che Tacito ha pescato una trota, calcolare la probabilità che l’abbia pescata dal “Lago
d’Oro”.
(3) Il giorno seguente, rincuorato dal risultato della giornata precedente torna al lago del giorno
precedente. Calcolare la probabilità che peschi una trota (sapendo che il giorno prima ne ha
pescata una e che i risultati della pesca in uno stesso lago in giorni differenti possono essere
considerati indipendenti).
Esercizio 1.4.22 (Esempio 1.5.34 pag. 23 in [5]) Un tribunale sta investigando sulla possi-
bilità che sia accaduto un evento E molto raro e a tal fine interroga due testimoni, Arturo e
Bianca. L’affidabilità dei due testimoni è nota alla corte: Arturo dice la verità con probabilità α e
Bianca con probabilità β, e i loro comportamenti sono indipendenti. Siano A e B gli eventi Arturo
e Bianca rispettivamente affermano che E è accaduto, e sia p = P (E). Qual è la probabilità che
E sia accaduto sapendo che Arturo e Bianca hanno dichiarato che E è accaduto? Assumendo
α = β = 0.9 e p = 10−3 , quale conclusione ne traete?
Esercizio 1.4.23 Si determini l’affidabilità del sistema in Figura 1.1, posto che i componenti
funzionino in modo indipendente e con la stessa affidabilità p = 0.8.
1 2
3 4 5
A1 A2 A3
B1 B2 B3
Esercizio 1.4.25 (Esempio 1.11 in [11]) Calcolate l’affidabilità del sistema S4 in figura 1.4,
costituito da una copia del componente R1 , una del componente R2 , tre del componete R3 , 2
del componente R4 e una del componente R5 , sapendo che i componenti R1 , R2 , R3 , R4 , R5 sono
indipendenti e hanno affidabilità 0.95, 0.99, 0.7, 0.75, 0.9 rispettivamente.
A2 A3
A1 B2 B3
C2 C3
R3
R4
R1 R2 R3 R5
R4
R3
b) P (C c ∪ U c )
c) P (U \ C) = P (U ∩ C c )
conoscendo le probabilità dei seguenti eventi:
i)P (C c ) = 0.4
ii) P (U ) = 0.3.
iii) P (C \ U ) = P (U c ∩ C) = 0.4.
Osservando che C ∩ U = C \ (C \ U ) e che (C \ U ) ⊂ C, deduciamo che:
a) P (C ∩ U ) = P (C \ (C \ U )) = P (C) − P (C \ U ) = (1 − P (C c )) − P (C \ U ) = 1 − 0.4 − 0.4 = 0.2;
b) P (C c ∪ U c ) = 1 − P ((C c ∪ U c )c ) = 1 − P ((C c )c ∩ (U c )c ) = 1 − P (C ∩ U ) = 1 − 0.2 = 0.8.
Infine, poiché U \ C = U \ (C ∩ U ) e (C ∩ U ) ⊂ U , allora
c) P (U \ C) = P (U ) − P (C ∩ U ) = 0.3 − 0.2 = 0.1
Esercizio 1.2.2 Indichiamo con A l’evento “lo studente supera l’esame A”, con B l’evento “lo
studente supera l’esame B” e con C l’evento “lo studente supera l’esame C”. Allora le probabilità
richieste sono:
Esercizio 1.2.3
1. No. Ragioniamo per assurdo: A ∩ B = ∅ ⇒ A ⊂ B c ⇒ P (A) ≤ P (B c ). Ossia, 1/3 ≤ 1/4:
assurdo!
2. Se A e B sono incompatibili, allora P (B) = P (A ∪ B) − P (A) = 3/4 − 1/4 = 1/2.
3. Nessuna delle due affermazioni è vera. Infatti,
12 CAPITOLO 1. PROBABILITÀ
Esercizio 1.3.2 Lo spazio campionario relativo all’esperimento aleatorio del lancio della moneta
è Ω = {T, C}. Poniamo P (T ) = x: allora deve essere P (C) = 4x. I due eventi sono incompatibili
ed esauriscono Ω, quindi P (T ) + P (C) = x + 4x = 1 = P (Ω) da cui 5x = 1 e P (T ) = 0.2.
Esercizio 1.3.3 I pesi assegnati suggeriscono che, scelta una persona a caso in una certa popo-
lazione, i possibili risultati elementari sono riassunti nello spazio campionario Ω = {0, 1, . . . , n}.
Essendo lo spazio finito, la funzione di probabilità (dipendente dai pesi dati) sarà una funzione
definita sull’insieme potenza P(Ω) –costituito da 2n elementi– nel seguente modo:
(
cp(1 − p) se k = 0
(1.1) P ({k}) =
cpk se k = 1, . . . , n (p ∈ (0, 1)).
i) cp(1 − p) ≥ 0
ii) cpk ≥ 0 ∀k = 1, . . . , n
Pn
iii) cp(1 − p) + k=1 cpk = 1.
n
X n
X 1 − pn+1 1 − pn+1 − 1 + p 1 − pn
pk = pk − 1 = −1= =p
1−p 1−p 1−p
k=1 k=0
1 1−p 1
c= 1−pn = .
p[(1 − p) + 1−p ]
p (1 − p) + 1 − pn
2
Se n = 5 e p = 1/2, allora c = 32/39, A= “una persona scelta a caso possiede almeno due
appartamenti” ={2, 3, 4, 5} e P (A) = 1 − P ({0, 1}) = 1 − 32/39 ∗ 1/4 − 32/39 ∗ 1/2 = 15
39 .
Esercizio 1.3.8 Se estraiamo a caso senza reimmissione 7 lettere da un insieme di 21, ogni
possibile parola componibile è una stringa (ordinata) di 7 elementi tutti diversi tra di loro, e
quindi il numero dei casi elementari corrispondenti a questo eserimento coincide con il numero di
disposizioni semplici di 21 elementi in 7 classi, cioè 21 · 20 · · · 15 = 586051200.
Sia A l’evento:“Compongo una parola che inizia e finisce per vocale”. Il numero di parole di sette
lettere che cominciano e finiscono per vocale, quando le lettere non si possono ripetere, può essere
calcolato nel seguente modo: il primo posto posso riempirlo usando una delle 5 vocali dell’alfabeto
e il settimo usando una delle 4 rimanenti. A questo punto, le lettere dell’alfabeto rimaste sono 19
e quindi la stringa interna di 5 posti posso riempirla in 19 · 18 · 17 · 16 · 15 modi diversi. Segue
1.5. SOLUZIONI DI ALCUNI ESERCIZI DEL CAPITOLO 1 13
Esercizio 1.3.18 Le 32 carte del mazzo sono cosı̀ ripartite: quattro semi, per ognuno dei quali
si hanno le 8 carte distinte: A, K, Q, J, 10, 9, 8, 7. Ogni mano è un insieme di 5 carte scelte dal
mazzo. Allora: il numero di mani possibile è 32 5 = 201376: Ciascuna mano ha probabilità (32)
1
5
di essere servita.
1. Sia A l’evento: “il giocatore riceve un poker d’assi servito”. Allora |A| = 44 32−4
1 = 28 e
28
P (A) = 32 = 0.0001390434
5
2. Sia B l’evento: “il giocatore riceve un poker servito”. In un mazzo di 32 carte il poker
servito può essere di 8 valori diversi e la probabilità di ottenere un poker servito d’assi è
uguale alla probabilità di ricevere un poker servito di un altro valore. Inoltre, gli eventi
“il giocatore riceve poker servito d’assi”, di K, . . . sono incompatibili tra di loro. Quindi
P (B) = 8 · P (A) = 0.001112347.
Esercizio 1.3.19 Ci sono 52 26 (= # di combinazioni semplici di 52 oggetti di classe 26) modi di
scegliere 26 carte tra 52, quindi 5226 modi di dividere il mazzo (casi possibili). Ci sono esattamente
26 carte rosse tra le 52 carte; se ognuna delle due parti del mazzo deve contenere carte rosse e
nere in egual numero, ognuna dovrà contenere 13 carte rosse. Scelgo quindi le 13 carte rosse di
una prima metà in 26 13 modi e le rimanenti 13 carte tra le 26 nere in 26
13 modi. Dunque
26
26
13 13
P (“ciascuna parte contiene carte rosse in egual numero”) = 52
' 0.218126.
26
Esercizio 1.3.20 L’esperimento è del tipo estrazione senza reimmissione di un campione non
ordinato di ampiezza 4 da un insieme di 40 elementi di cui 10 del tipo bastoni, 10del tipo coppe,
10 del tipo denari e 10 del tipo spade. Lo spazio campionario ha cardinalità 40 4 , mentre i casi
favorevoli all’evento E =“estrarre 4 carte di 4 semi diversi da un mazzo di carte napoletane” sono
10 4
4 40
1 , da cui P (E) = 10
1 / 4 ' 0.11.
Esercizio 1.3.22
(a) Sia A l’evento “i 160 allievi festeggiano il compleanno in giorni diversi” e pensiamo l’anno
formato (sempre) da 365 giorni. Immaginando di avere etichettato i 160 allievi con un numero da
1 a 160, lo spazio campionario Ω è costituito dalle 160-uple (ordinate) dei giorni di compleanno
dei 160 allievi:
Ω = {(s1 , . . . , s160 ) : sj = 1, . . . , 365; j = 1, . . . , 160}
14 CAPITOLO 1. PROBABILITÀ
[dove sj = 1 significa che il j-esimo allievo è nato il primo gennaio, . . ., sj = 365 significa che il
j-esimo allievo è nato il 31 dicembre] e
A = {(s1 , . . . , s160 ) ∈ Ω : si 6= sj ∀i 6= j}.
Se supponiamo ogni caso elementare di Ω egualmente probabile allora P (A) = |A| |Ω| . I casi possibili
160
sono 365 (= numero di disposizioni con ripetizione di 365 oggetti di ordine 160) mentre i
casi favorevoli sono 365 · 364 · · · (365 − 159) = 365!/(365 − 160)! (= numero di disposizioni senza
ripetizione di 365 elementi di ordine 160). Dunque
(365)160
P (A) = ' 10−19
365160
Nota 1 Sostituiamo ora a 160, un generico n ≤ 365. Allora P (Ac ) = 1 − P (A) è la probabilità
che 2 o più allievi fra i 160 festeggino il compleanno lo stesso giorno. Si può calcolare che per
n = 22 P (Ac ) > 50%, per n = 50 P (Ac ) ' 97% e per n = 100 P (A) ' 1.
Esercizio 1.4.2 Siano A e B gli eventi A=“Il signor A compra il biglietto vincente” e B=“Il
signor B compra il biglietto vincente”. Se A compra per primo il biglietto e B per secondo, allora
l’insieme dei possibili risultati associati a tale acquisto è
Ω = {A ∩ B c , Ac ∩ B, Ac ∩ B c }
1.5. SOLUZIONI DI ALCUNI ESERCIZI DEL CAPITOLO 1 15
con
1·4 1 4·1 1 4·3 3
P (A ∩ B c ) = = ; P (Ac ∩ B) = = ; P (Ac ∩ B c )= = .
5·4 5 5·4 5 5·4 5
Pertanto:
(a) P (A) = P (A ∩ B c ) = 51
(b) P (B) = P (B ∩ Ac ) = 51 .
c
(c) P (B|Ac ) = P P(B∩A
(Ac )
)
= 1/5 1
4/5 = 4 =(Probabilità di estrarre un biglietto vincente dall’insieme
dei quattro biglietti rimasti di cui uno è vincente)
(d) P (A ∪ B) = P (A) + P (B) = 25 .
Nota 3 Si osservi che A e B hanno la stessa probabilità di vincere; ma la probabilità che B vinca
cambia se abbiamo l’ulteriore informazione che A non ha acquistato il biglietto vincente!!!
Esercizio 1.4.3 Siano Ti , Ri gli eventi Ti =“È trasmesso i” ed Ri =“È ricevuto i”, per i = 0, 1.
Dobbiamo calcolare
1)P (R1 ), 2) P (R0 ), 3) P (T1 |R1 ), 4) P (T0 |R0 ) e 5) P ([R0 ∩ T1 ] ∪ [R1 ∩ T0 ]), a partire dalle
seguenti probabilità assegnate:
0.94 = P (R0 |T0 )
0.91 = P (R1 |T1 )
0.45 = P (T0 ).
Applicando la formula delle probabilità totali otteniamo:
(1) P (R1 ) = P (R1 |T1 )P (T1 ) + P (R1 |T0 )P (T0 ) = 0.91(1 − 0.45) + (1 − 0.94)0.45 = 0.5275
(2) P (R0 ) = 1 − P (R1 ) = 1 − 0.5275 = 0.4725.
Esercizio 1.4.4 Siano Ni =“La i-esima pallina estratta è nera” e Bi =“La i-esima pallina estratta
è bianca” per i = 1, 2, 3.
(a) Per la formula di moltiplicazione:
5 8 11 5
P (N1 ∩ N2 ∩ N3 ) = P (N1 )P (N2 |N1 )P (N3 |N1 ∩ N2 ) = · · = ≈ 0.3571429,
8 11 14 14
poiché
5 5
P (N1 ) = =
5+3 8
5+3 8
P (N2 |N1 ) = P (“estrarre una pallina nera da un’urna con 3 bianche e (5+3) nere”) = =
8+3 11
11
P (N3 |N1 ∩ N2 ) = P (“estrarre una pallina nera da un’urna con 3 bianche e (8+3) nere”) =
14
16 CAPITOLO 1. PROBABILITÀ
V := “i due gemelli sono veri gemelli”, S := “i due gemelli sono dello stesso sesso”.
1. La probabilità richiesta è
P (S|V )P (V ) p 2p
P (V |S) = = 1 = .
P (S|V )P (V ) + P (S|V c )P (V c ) p + 2 (1 − p) p +1
2. P (S c ) = 1 − p − 21 (1 − p) = 21 (1 − p).
Esercizio 1.4.8 Calcoliamo prima la probabilità di estrarre una pallina nera (N ) scegliendo
l’urna fra U1 e U2 in modo tale che P (U1 ) = p. Allora, per la formula delle probabilità totali:
3 4 2 1
P (N ) = P (N |U1 )p + P (N |U2 )(1 − p) = p+ (1 − p) = + p
2+3 6+4 5 5
Se invece, ora calcolo la probabilità di estrarre pallina nera dall’urna U = U1 ∪ U2 , ottengo
3+4 7 2 1 7 1
7+8 = 15 . Quindi, le due probabilità sono uguali se 5 + p 5 = 15 , da cui ottengo p̂ = 3 .
Nota 4 Si osservi che se p = 0.5 (praticamente lancio una moneta equa per decidere l’urna da
cui estrarre), allora la probabilità di estrarre nera da una delle due urne distinte è 12 > 15
7
. In
generale, per valori di p 6= p̂, i due procedimenti di estrazione sono diversi.
Esercizio 1.4.9
6 3 5 4 38
1. P (N2 ) = P (N2 |N1 )P (N1 ) + P (N2 |B1 )P (B1 ) = 3+5+1 4+3 + 3+5+1 4+3 = 63
1.5. SOLUZIONI DI ALCUNI ESERCIZI DEL CAPITOLO 1 17
Esercizio 1.4.11 Siano S =“lo sciopero è messo in atto e T =“la trattativa ha successo”. Allora,
P (S c |T ) = 0.8, P (S|T c) = 0.99 e P (T c ) = 0.4 e
(a) P (S) = P (S | T )P (T ) + P (S|T c )P (T c ) = (1 − 0.8) · (1 − 0.4) + 0.99 · 0.4 = 0.516.
(b) Si cerca P (T |S c ). Si ricava P (S c ) = 1 − P (S) = 1 − 0.516 = 0.484 e quindi, per il teorema di
Bayes,
P (S c |T )P (T ) 0.8 · 0.6
P (T |S c ) = c
= = 0.9917.
P (S ) 0.484
quindi, la probabilià cercata vale P (C1c |T c ) = 1 − P (C1 |T c ) = 1 − 70/617 = 547/617 ' 0.8865
Esercizio 1.4.16 Le possibili coppie di risultati delle due estrazioni dall’urna sono
Poichè le estrazioni sono effettuate con reimmissione e nell’urna vi è un egual numero di pari e
dispari (50), allora tutte le coppie hanno eguale probabilità pari a 1/4. Inoltre,
P (A1 ) = P {(p1, p2), (p1, d2)} = 1/2;
P (A2 ) = P {(p1, p2), (d1, p2)} = 1/2;
P (B) = P {(p1, d2), (d1, p2)} = 1/2;
P (A1 ∩ A2 ) = P {(p1, p2)} = 1/4 = P (A1 )P (A2 );
P (A1 ∩ B) = P {(p1, d2)} = 1/4 = P (A1 )P (B);
P (A2 ∩ B) = P {(d1, p2)} = 1/4 = P (A2 )P (B);
ma,
P (A1 ∩ A2 ∩ B) = 0 < P (A1 )P (A2 )P (B). Pertanto gli eventi A1 , A2 e B sono indipendenti a
coppie ma non indipendenti
Nota 5 Dati tre eventi, l’indipendenza a coppie non implica l’indipendenza dei tre eventi.
Esercizio 1.4.18 Siano D : “il dipendente è donna”, U : “il dipendente è uomo” , M : “il dipen-
dente ha la licenza media inferiore”, S : “il dipendente ha un diploma di scuola media superiore”
e L : “il dipendente è laureato”. Allora
P (D) = 0.30 e P (U ) = 0.70;
P (M | D) = 0.05, P (S | D) = 0.60 e P (L | D) = 0.35;
P (M | U ) = 0.15, P (S | U ) = 0.60 e P (L | U ) = 0.25.
18 CAPITOLO 1. PROBABILITÀ
1 Per la regola delle probabilità totali, P (L) = P (L | D)P (D) + P (L | U )P (U ) = 0.35 · 0.30 + 0.25 ·
0.70 = 0.28. Quindi, P (Lc ) = 1 − P (L) = 0.72;
2 P (D ∩ Lc ) = P (Lc | D)P (D) = (1 − 0.35)0.30 = 0.195;
3 Per il Teorema di Bayes: P (U | L) = P (L | U )P (U )/P (L) = 0.25 · 0.70/0.28 = 0.625;
4 Poichè P (L | D) = 0.35 > 0.28 = P (L), sesso e livello di istruzione non sono indipendenti.
Possiamo dire che c’è una concordanza positiva fra essere donna e laureato: sapendo che un
dipendente è donna è più probabile che sia laureato.
5 Diversamente da prima, se P (M | D) = 0.15, P (S | D) = 0.60 e P (L | D) = 0.25, allora
Possiamo concludere che con la nuova assegnazione di probabilità sesso e livello di istruzione sono
indipendenti.
Nota 6 Notate quindi che l’indipendenza è una proprietà della probabilità: se gli eventi sono
indipendenti rispetto a una funzione di probabilità P , non è detto che cambiando P gli eventi
restino indipendenti.
Per quanto riguarda invece la relazione fra indipendenza e incompatibilità, notate che ovvia-
mente gli eventi D e U di questo esercizio sono incompatibili, ma non indipendenti. Infatti:
P (D)P (U ) = 0.3 · 0.7 = 0.21 6= 0 = P (D ∩ U ).
Infine: l’evento impossibile ∅ è incompatibile e indipendente da qualunque altro evento. Verifica-
telo...
Esercizio 1.4.19
dove abbiamo utilizzato la formula delle probabilità totali ed il fatto che A e C sono indipendenti
condizionatamente a B (Filiberto è deluso).
3. Sia Q = {Filiberto ottiene 4 teste in 4 lanci}, allora la formula di Bayes afferma che
P (Q|B c )P (B c ) 1 · 25 32
P (B c |Q) = = 1 = ' 0.914.
P (Q) 16 · 35 + 1 · 2
5
35
Esercizio 1.4.21 Definiamo gli eventi T1 : “Tacito il primo giorno pesca una trota”, T2 : “Tacito
il secondo giorno pesca una trota”, O: “Tacito sceglie il Lago d’Oro” e A: “Tacito sceglie il Lago
d’Argento”. Dal testo si ha che P (O) = P (A) = 1/2, P (T1 |O) = 1, P (T1 |A) = 0.6 = 3/5.
1. Per la formula delle probabilità totali
1 3 1 4
P (T1 ) = P (T1 |O)P (O) + P (T1 |A)P (A) = 1 · + · = = 0.8.
2 5 2 5
Esercizio 1.4.22 Dobbiamo calcolare P (E|A ∩ B). Per la formula di Bayes si ha che:
P (A ∩ B|E)P (E)
P (E|A ∩ B) =
P (A ∩ B)
Notiamo che P (A ∩ B|E) corrisponde alla probabilità che Arturo e Bianca dicano la verità.
Dal momento che i comportamenti di Arturo e Bianca sono indipendenti, essi dicono la verità
indipendentemente l’uno dall’altra, perciò si ha che: P (A∩B|E) = P (A|E)P (B|E) = αβ. Quindi:
Infine:
αβp
P (E|A ∩ B) = .
αβp + (1 − α)(1 − β)(1 − p)
Sostituendo i valori numerici otteniamo:
(0.9)2 ∗ 10−3
P (E|A ∩ B) = = 0.075 :
(0.9)2 ∗ 10−3 + (0.1)2 ∗ (1 − 10−3 )
Nonostante Arturo e Bianca siano molto affidabili e affermino che E sia accaduto, la corte resta
scettica riguardo al fatto che E sia veramente accaduto: infatti 0.075 > 0.001 ma è ancora un
valore molto lontano da 1.
S = (1 ∩ 2 ∩ 5) ∪ (3 ∩ 4 ∩ 5) ∪ (6 ∩ 5) = [(1 ∩ 2) ∪ (3 ∩ 4) ∪ 6] ∩ 5
P (S) = P ((1 ∩ 2) ∪ (3 ∩ 4) ∪ 6)p
= p(p · p + p · p + p − p · p · p − p · p · p − p · p · p · p + p · p · p · p · p)
= p2 (1 + 2p − 2p2 − p3 + p4 ) = 0.779264.
A1 A2 A3
funzioni è
P (“S1 funzioni”) = P (A1 ∩ A2 ∩ A3 ) = P (A1 )P (A2 )P (A3 ) = 0.8 · 0.7 · 0.6 = 0.336
Per il sistema S3 vale quanto segue: sia D1 il sottosistema formato dai componenti in serie A2 , A3
e siano D2 , D3 due copie indipendenti di D1 . Allora, la probabilità di funzionamento di D1 , D2 , D3
è 0.7 · 0.6 = 0.42. Pertanto il sottosistema ottenuto mettendo in parallelo D1 , D2 , D3 funziona con
probabilità pari a
Segue che P (S3 ) = P (A1 ∩ (D1 ∪ D2 ∪ D3 )) = P (A1 )P (D1 ∪ D2 ∪ D3 ) = 0.8 · 0.804888 = 0.6439104:
la soluzione S3 è preferibile alla S2 .
Capitolo 2
Variabili aleatorie
Esercizio 2.2.2 (II recupero CP Ing. Mat. aa. 2002-03) La funzione di ripartizione della
variabile aleatoria X è definita come segue:
0 x<0
0≤x<1
1/2
F (x) = 2/3 1≤x<2
11/12 2 ≤ x < 3
1 3≤x
(1) Quanto vale P (X > 1/2)?
(2) Quanto vale P (2 < X ≤ 4)?
(3) Quanto vale P (2 ≤ X ≤ 4)?
(4) Quanto vale P (X < 3)?
(5) Determinare la densità di X.
Esercizio 2.2.3 Una sorgente di informazioni genera casualmente i simboli ♥, ♦, ♣, ♠ con pro-
babilità: P (♥) = 1/2, P (♦) = 1/4, P (♣) = P (♠) = 1/8. Uno schema di codifica trasforma i
simboli in codici binari nel modo seguente:
♥ 7−→ 0 ♦ 7−→ 10 ♣ 7−→ 110 ♠ 7−→ 111.
Sia X = “bit del codice”. Calcolare:
1) la densità di X; 2) la funzione di ripartizione FX (x); 3) P (X ≤ 1); 4) P (1 < X ≤ 2);
5) P (X > 1); 6) P (1 ≤ X ≤ 2)
Esercizio 2.2.4 Lanciamo contemporaneamente due dadi regolari. Sia X il punteggio minimo
che si ottiene fra i due.
(1) Qual è la densità di X?
(2) Qual è la f.d.r. di X?
21
22 CAPITOLO 2. VARIABILI ALEATORIE
Esercizio 2.3.3 Un test a risposta multipla è costituito da 10 domande, a ognuna delle quali
sono abbinate 4 possibili risposte di cui soltanto 1 corretta. Uno studente impreparato sceglie a
caso una risposta per domanda.
(1) Determinare la densità di probabilità della variabile aleatoria indicante il numero di risposte
corrette.
(2) Per superare il test uno studente deve rispondere correttamente ad almeno 5 domande su
10. Qual è la probabilità che uno studente impreparato superi il test?
Esercizio 2.3.4 (Esame CP INF 02/05/02) Armando vuole giocare alla roulette puntando
sul rosso 1 a puntata. Sapendo che la probabilità di vincere puntando sul rosso in una roulette
non truccata è pari a 18/37,
(1) calcolare la probabilità che Armando vinca per la prima volta alla quinta partita.
(2) Se Armando gioca 10 partite, calcolare la probabilità che ne abbia vinte almeno due.
(3) Osservando che ogni volta che vince, vince 1 ed ogni volta che perde, perde 1 , qual è
la probabilità che alla fine delle 10 partite il capitale di Armando sia aumentato di 2 ?
Esercizio 2.3.5 Due urne A e B sono inizialmente vuote. Esse vengono poi riempite con 12
palline che vengono messe, una dopo l’altra, in una delle urne, scelta a caso ogni volta.
(1) Qual è la probabilità che l’urna B sia vuota?
(2) Qual è la probabilità che le due urne posseggano lo stesso numero di palline?
(3) Qual è la probabilità che nessuna delle due urne sia vuota?
Esercizio 2.3.7 Una moneta irregolare con probabilità di testa p = 1/6 viene lanciata tante volte
finché non compare testa. Dato che testa non appare al primo lancio, qual è la probabilità che
siano necessari più di 4 lanci?
Esercizio 2.3.8 (Esame CP INF; Recupero del 06/09/02) Un’indagine statistica ha rive-
lato che il 15% degli abitanti di una certa città fa l’elemosina ai mendicanti che vede sul marcia-
piede. Passano 20 persone davanti ad un mendicante.
1. Qual è la probabilità che il mendicante riceva elemosina da almeno 3 di esse? [risp: 0.595]
2.3. ESEMPI DI DENSITÀ DISCRETE NOTEVOLI 23
2. Quante persone al minimo devono passare davanti al mendicante perchè con probabilità
superiore a 0.5 gli venga fatta almeno un’elemosina?[risp: almeno 5]
3. Supposto che ogni persona che fa l’elemosina dia 50 centesimi di euro, quante persone devono
passare perché il mendicante ottenga, in media, 3 euro di elemosina prima di andarsene?
[risp: 40]
Esercizio 2.3.9 In una sala da gioco ci sono due slot machine A e B. Se gioco alla slot machine
A, ad ogni giocata la probabilità di vincere è 0.45.
1. Se gioco alla slot machine A finchè non vinco, quanto vale la probabilità di non vincere nelle
prime 9 giocate? [risp: 0.559 ]
2. Se gioco alla slot machine A finchè non vinco, quanto vale la probabilità di dover giocare
almeno 12 volte per registrare la prima vittoria, sapendo che nelle prime due giocate non ho vinto?
[risp: 0.559 ]
Se invece gioco alla slot machine B, ad ogni giocata la probabilità di vincere è 0.55. Inoltre,
all’inizio del gioco, scelgo a caso fra A e B e poi gioco sempre con la stessa slot machine.
3. Quanto vale la probabilità di non vincere nelle prime 9 giocate? [(0.559 + 0.459)/2 ' 0.0027]
4. Quanto vale la probabilità di dover giocare almeno 12 volte per registrare la prima vittoria,
sapendo che nelle prime due giocate non ho vinto? [(0.5511 + 0.4511 )/(0.552 + 0.452 ) 6= (0.559 +
0.459 )/2 (RIFLETTETE!!!)]
Esercizio 2.3.11 Se partecipo a 180 concorsi diversi (e indipendenti), in ciascuno dei quali si
vince un solo premio e per ciascuno dei quali la probabilità di vincere il premio è 0.008, quanto
vale (approssimativamente) la probabilità
(1) di vincere il premio di un solo concorso,
(2) di vincere almeno un premio,
(3) di vincere 30 premi?
Esercizio 2.3.12 Il numero di automobili che un concessionario vende giornalmente si può mo-
delizzare mediante una variabile aleatoria di Poisson di parametro λ = 1.
(1) Quanto vale la probabilità che il concessionario venda al giorno almeno una macchina?
[1 − e−1 ]
(2) Se il numero di automobili vendute in giorni diversi sono indipendenti, quanto vale la
probabilità che trascorrano 7 giorni consecutivi senza che il venditore venda automobili e che poi
all’ottavo giorno venda almeno una macchina? [e−7 (1 − e−1 ) ' 0.0005764]
Esercizio 2.3.13 (II Recupero CP TEL 18/09/03) Nel gioco del lotto, ad ogni estrazione,
per ogni ruota, si estraggono senza reimmissione 5 palline da un pallottoliere che ne contiene 90
numerate da 1 a 90.
(1) Dimostrate che ad ogni estrazione la probabilità di fare ambo giocando i numeri 80,90 sulla
ruota di Bari è pari a 2/801.
(2) Quanto vale la probabilità che sia necessario giocare esattamente 600 giornate per fare
ambo (per la prima volta) puntando sui numeri 80,90 sulla ruota di Bari?
(3) Dall’inizio dell’anno Marco sta puntando sull’ambo 80,90 sulla ruota di Bari, ogni mercoledı̀
e sabato, per un totale ad oggi di 72 giornate. Sapendo che dall’inizio dell’anno l’ambo non è ancora
uscito, quanto vale la probabilità che esca per la prima volta alla 672-esima giornata?
24 CAPITOLO 2. VARIABILI ALEATORIE
(4) Diversamente, Matteo ha deciso di giocare per 1000 giornate puntando sempre sullo stesso
ambo 80,90 sulla ruota di Bari. Quanto vale approssimativamente la probabilità che Matteo faccia
ambo almeno 2 volte?
Esercizio 2.3.15 Al buio cerco la chiave del mio ufficio in un mazzo di 10 chiavi tutte della stessa
fattura. Ovviamente metto da parte le chiavi provate. Sia X il numero di chiavi che devo provare
per trovare la chiave giusta.
(1) Quanto vale la probabilità di controllare almeno 8 chiavi?
(2) Qual è la f.d.r. di X?
(3) Qual è la densità di probabilità di X?
(4) Se anche il secondo tentativo è fallito, quanto vale la probabilità di trovare la chiave giusta
al quarto tentativo? [Risp:1/8]
(5) Come cambiano le risposte ai punti precedenti se, stupidamente non metto da parte le
chiavi già provate prima di procedere a provarne una nuova?
Esercizio 2.4.2 Sia X una variabile aleatoria assolutamente continua con densità di probabilità
x
25 0<x<5
x
fX (x) = − 25 + 25 5 < x < 10
0 altrove
Esercizio 2.4.3 (CP, INF I prova in itinere, 02/05/02) Sia X una variabile aleatoria asso-
lutamente continua con densità
(
4x3 se x ∈ (0, 1)
fX (x) :=
0 se x 6∈ (0, 1).
Esercizio 2.4.5 (Esercizio 3 pag. 92 in [7]) Trovate la costante k tale che la funzione che
segue sia una funzione di densità:
Esercizio 2.4.7 In base all’orario ufficiale delle Ferrovie dello Stato il treno Lecco-Milano delle
ore 14.45 arriva nella stazione di Milano Centrale alle ore 15.30. Ma qualche volta subisce ritardi. Il
ritardo espresso in ore può essere modellato come una variabile aleatoria X assolutamente continua
con densità uniforme sull’intervallo [0, 1].
1. Qual è la probabilità che il treno arrivi dopo le ore 15.33?
2. Qual è la probabilità che il treno abbia al più 5 minuti di ritardo sull’orario previsto?
3. Qual è la probabilità che il treno subisca un ritardo fra i 6 e gli 11 minuti sull’orario previsto?
Esercizio 2.4.8 Sia Y una variabile aleatoria assolutamente continua con densità fY (y) = 2y1(0,1) (y).
Qual è la probabilità che l’equazione (in x) x2 + 40Y x + 360Y − 32 = 0 non ammetta soluzioni
reali?
26 CAPITOLO 2. VARIABILI ALEATORIE
Esercizio 2.4.9 Il tempo (in ore) impiegato dal tecnico A del centro di assistenza xxx per riparare
una certa apparecchiatura ha densità esponenziale di parametro λ = 0.5.
(1) Qual è la probabilità che siano necessarie ad A più di 2 ore per riparare l’apparecchiatura?
(2) Qual è la probabilità che A abbia bisogno di almeno 11 ore per effettuare la riparazione,
dato che ci lavora già da almeno 9?
In realtà al centro di assistenza xxx c’è anche un secondo tecnico B e il tempo (in ore) che B
impiega per la riparazione ha densità esponenziale di parametro λ = 0.6. Inoltre, quando arriva
un’apparecchiatura da riparare, si sceglie a caso fra A e B.
(3) Qual è la probabilità che in quel centro di assistenza siano necessarie più di 2 ore per
riparare l’apparecchiatura?
(4) Qual è la probabilità che nel centro di assistenza xxx si impieghino almeno 11 ore per la
riparazione, dato che la durata della riparazione supera le 9 ore?
Esercizio 2.4.10 (Esercizio 5 pag. 222 in [9]) Un benzinaio è rifornito di gasolio una volta
la settimana. Se la sua vendita settimanale in migliaia di litri è una variabile aleatoria con densità
quale deve essere la capacità del serbatoio affinché la probabilità che il gasolio sia esaurito in una
settimana sia pari a 0.01? [risp: k t.c. P (X > k) = 0.01 =⇒ k = 1 − 0.011/5 ]
Esercizio 2.4.11 (CP TEL 06/09/05 Esercizio 3) Una cisterna d’acqua viene riempita una
volta alla settimana con k ettolitri d’acqua. La quantita d’acqua prelevata dalla cisterna (sempre
misurata in ettolitri) in una settimana può essere modellata mediante una variabile aleatoria X
assolutamente continua con densità
(
a a−1
a (1000 − x) se 0 < x < 1000
f (x) = 1000
0 altrimenti, a > 0
1. Determinare a in modo tale che la richiesta media in una settimana sia di 750 ettolitri.
Esercizio 2.4.12 (Esempio pag. in [9]) Il tempo di vita di un dato tipo di pile per radio è
100
una variabile aleatoria assolutamente continua con densità fX (x) = 2 1(100,+∞) (x).
x
1. Calcolate la probabilità che una pila della radio debba essere sostituita entro le 150 ore di
attività. [risp: 1/3]
2. Determinate FX
3. Una radio per funzionare ha bisogno di cinque pile. Se le pile funzionano in modo indipen-
dente, qual è la probabilità che esattamente due pile su cinque debbano essere sostituite entro le
150 ore di attività? [risp: 80/243]
Esercizio 2.5.2
1. Lanciando n = 10 volte una moneta equilibrata, qual è la probabilità che la differenza in
valore assoluto tra numero di teste e numero di croci ottenute sia 4?
Sia X la variabile aleatoria che indica la differenza in valore assoluto tra numero di teste e
numero di croci (sempre ottenute lanciando n = 10 volte la moneta equilibrata).
2. determinate la densità di X.
Esercizio 2.5.4 Se X è una variabile aleatoria assolutamente continua con densità uniforme su
(−π/2, π/2), qual è la funzione di ripartizione di Y = tan X. Qual è la sua densità? La variabile
aleatoria Y ammette media?
Esercizio 2.5.6 Sia U ∼ U(0, 1). Determinate le funzioni di densità delle seguenti variabili
aleatorie:
1. Y1 = U − 1/2
2. Y2 = |U − 1/2|
3. Y3 = (U − 1/2)2
4. Y4 = 1/(U + 1/2)
log(U )
5. Y5 = − dove λ > 0.
λ
Esercizio 2.5.7 Sia X ∼ E(λ) e Y = [X] + 1, dove g(x) = [x] rappresenta la parte intera di x.
Determinate la densità di Y . [Risp: Y è va discreta geometrica di parametro (1 − e−λ )]
Esercizio 2.5.8 Sia X ∼ U (0, 1) e Y = [nX] + 1, dove g(x) = [x] rappresenta la parte intera di
x. Determinate la densità di Y . [Risp: Y è va discreta uniforme su {1, . . . , n}]
Esercizio 2.5.9 (CP ELN INF 12/07/04 Esercizio 2.4) Il tempo di vita (espresso in ore) di
un motore elettrico, ancora in rodaggio, può essere rappresentato dalla variabile aleatoria T = X 4 ,
con X variabile aleatoria esponenziale di parametro 0.25.
1. Determinare la densità di T .
2. Sapendo che il motore è ancora funzionante dopo 192 ore, calcolare la probabilità che funzioni
nelle successive 50 ore.
28 CAPITOLO 2. VARIABILI ALEATORIE
Esercizio 2.2.3
1. X assume solo tre valori: {1, 2, 3}. Si ha:
1
P (X = 1) = P (♥) =
2
1
P (X = 2) = P (♦) =
4
1 1 1
P (X = 3) = P (♣ oppure ♠) = P (♣) + P (♠) = + =
8 8 4
P (X = k) = 0 se x 6∈ {1, 2, 3}.
2.
0
x<1
P (X = 1) = 1 1≤x<2
FX (x) = P (X ≤ x) = 2
P (X = 1) + P (X = 2) = 3
4 2≤x<3
1 x ≥ 3.
3. P (X ≤ 1) = FX (1) = 1/2.
4. P (1 < X ≤ 2) = FX (2) − FX (1) = 3/4 − 1/2 = 1/4.
5. P (X > 1) = 1 − FX (1) = 1 − 1/2 = 1/2
6. P (1 ≤ X ≤ 2) = FX (2) − FX (1) + P (X = 1) = 3/4 − 1/2 + 1/2 = 3/4.
Segue che
0 x<1
1
P (X = 6) = 36 k =6
11
1≤x<2
3
36
P (X = 5) = 36 k =5
20
P (X = 4) = 5
36 2≤x<3
k =4
pX (k) = 36
7
e FX (x) = 27
36 3≤x<4
P (X = 3) = k =3
36
32
4≤x<5
9
P (X = 2) = 36 k =2
36
P5
35
5≤x<6
11
1 − j=1 pX (j) = 36 k =1 36
1 x≥6
2.6. SOLUZIONI DI ALCUNI ESERCIZI DEL CAPITOLO 2 29
Esercizio 2.3.1 Indicata con X la variabile aleatoria che conta il numero di componenti funzio-
nanti su 10, allora X ha densità binomiale di parametri p = 0.05 e n = 10. Pertanto,
Esercizio 2.3.2 Siano Ti = “la cifra trasmessa è i” i = 0, 1 e Ri = “la cifra ricevuta è i”. Allora,
e P (T1 ) = 0.8.
(1) P (“errata ricezione”) = P (R0 ∩ T1 ) + P (R1 ∩ T0 ) = P (R0 |T1 )P (T1 ) + P (R1 |T0 )P (T0 )
= 0.05 · 0.8 + 0.01 · 0.2 = 42/1000 = 0.042(:= p).
Introduciamo ora la variabile aleatoria X che descrive il numero di errori su 30 cifre trasmesse con
la probabilità di errore ad ogni trasmissione pari a 0.042. Allora X ∼ Bi(30, 0.042) e
Esercizio 2.3.3 Posto Ω = {0, 1}10, (cioè caso elementare=ω = (a1 , . . . , a10 )), allora X = #
risposte corrette su 10 è la seguente funzione: X(ω) = a1 + . . . + a10 ; ∀ω ∈ {0, 1}10, X(ω) ∈
{0, 1, . . . , 10} e p(k) := P (X = k) = P {(a1 , . . . , a10 ) : a1 + . . . + a10 = k}. Poiché lo studente
10−k
sceglie a caso, abbiamo P ({(1, . . . , 1, 0, . . . , 0 )} = 3 410 = P {(a1 , . . . , a10 )} ∀(a1 , . . . , a10 ) avente
| {z } | {z }
k volte 10−k volte
1 k 3 10−k
k componenti = 1 e le rimanenti =0. Quindi, p(k) = 10 k 4 4 , cioè X è una variabile
aleatoria binomiale (X ∼ Bi(10, 1/4)).
P10 1 k 3 10−k
P (“uno studente impreparato supera il test”) = P (X ≥ 5) = k=5 10 k 4 4 ≈ 0.07813 ≈
7.8%.
Esercizio 2.3.4
(1) Sia X il numero di partite, inclusa l’ultima, necessarie per osservare una vittoria. Allora
X è una variabile geometrica di parametro 18/37 e si ha
5−1
18 18 2345778
P (X = 5) = 1− = ' 0.034.
37 37 69343957
(2) Sia Y il numero di partite vinte da Armando in una sequenza di 10 partite. Allora Y ∼
Bi(10, 18/37), quindi
1
X k
10−k
10 18
18
P (Y ≥ 2) = 1 − P (Y < 2) = 1 − 1− =
k 37 37
k=0
10 9
19 18 19 4744369520559828
=1− − 10 · = ' 0.9866.
37 37 37 4808584372417849
(3) Il capitale viene incrementato di 2 se il numero di vincite è 6, cioè supera di 2 il numero
delle perdite. Quindi la probabilità richiesta è
6 4
10 18 18
P (Y = 6) = 1− = 0.1936
6 37 37
30 CAPITOLO 2. VARIABILI ALEATORIE
Esercizio 2.3.5 Detta X la variabile aleatoria che conta il numero di palline poste in B, poichè
per ogni pallina scelgoa a caso l’urna, dove riporla, allora X ∼ Bi(12, 1/2) e
1. P (B vuota) = P (X = 0) = 0.512 ; 12
2.P (“due urne posseggano lo stesso numero di palline”) = P (X = 6) = 10 6 0.5 ;
3. P (“nessuna delle due urne sia vuota”) = P (1 ≤ X ≤ 11) = 1 − P (X ∈ {0, 12}) =
1 − 0.52 − 0.52 = 1 − 0.511 .
Esercizio 2.3.6 Se la slot machine non è truccata, possiamo assumere che le 10 prove –consistenti
in 10 giocate distinte– si svolgano indipendentemente le une dalle altre; ciascuna prova è dicotomica
(si vince o si perde) e la probabilità di successo è la stessa in entrambe le prove e pari a p = 0.1.
1. Quindi, la variabile aleatoria X che conta il numero di vittorie su 10 giocate ha densità
binomiale di parametri n = 10 e p = 0.1. La risposta al punto 1. è P (X = 6) = 10 6 0.1 6
× 0.94 ≈
0.00014.
2. La variabile aleatoria T che rappresenta il numero di giocate necessarie per riportare la
prima vittoria ha densità geometrica di parametro p = 0.1: P (T = 10) = 0.1 × 0.99 = 0.03874.
3. La probabilità da calcolare è P (T = 6|T > 5) = P (“alla sesta giocata vinco”) = 0.1.
P ({(1, . . . , 1, 0, . . . , 0)} ∩ A6 )
| {z }
6 volte p6 (1 − p)10−6 1
(4) P ({(1, . . . , 1, 0, . . . , 0)} | A6 ) = =
10 6 = 10
,
| {z } P (A6 ) 10−6
6 p (1 − p) 6
6 volte
dove A6 := “Un giocatore vince 6 volte su 10” = {(x1 , . . . , x10 ) ∈ Ω : x1 + . . . + x10 = 6}. Il
risultato non sarebbe cambiato se la domanda fosse stata: “Se si riportano 6 vittorie su 10, qual
è la probabilità di vincere alle giocate s1 -esima, ..., s6 -esima?”.
Esercizio 2.3.7 Se lanciamo la moneta irregolare finchè non compare testa per la prima volta,
stiamo eseguendo una successione di prove bernoulliane, con probabilità di successo nella singola
prova pari a p = 1/6. Quindi la variabile aleatoria X che conta il numero di prove necessarie per
ottenere per la prima volta testa ha densità geometrica di parametro 1/6, ovvero:
5 k−1 1
6 6 k = 1, . . . .
pX (k) =
0 altrove
quindi
k
X
FX (k) = P (X ≤ k) = p(1 − p)x−1 = 1 − (1 − p)k ∀k = 1, . . .
x=1
da cui
P (X > k) = (1 − p)k ∀k = 1, . . .
Dalla proprietà di assenza di memoria della densità geometrica (cioè P (X > k + r|X > k) =
P (X > r), ∀k = 1, 2 . . . , ∀r = 1, 2, . . . otteniamo P (“Sono necessari più di 4 lanci“ posto che “il
6 non appare al primo lancio”) = P (X > 4 | X > 1) = P (X > 1 + 3 | X > 1) = P (X > 3) =
3
5
6 ' 0.5787
Esercizio 2.3.10
1. P (X ≥ 2) = 1 − P (X = 0) − P (X = 1) = 1 − e−λ − λe−λ = 0.6691.
2. Ora, il parametro λ è incognito e devo determinarlo in modo tale che risulti:
1 1
P (X = 0) = e−λ > ⇐⇒ −λ > log = − log(2) ⇐⇒ λ < log 2 = 0.6931.
2 2
2.6. SOLUZIONI DI ALCUNI ESERCIZI DEL CAPITOLO 2 31
Esercizio 2.3.11 Posso ipotizzare i concorsi indipendenti, cosı̀ che, detta X la variabile aleatoria
che conta il numero di premi vinti su 180 concorsi, allora X ∼ Bi(180, 0.008). Essendo la proba-
bilità di successo piccola e il numero dei concorsi a cui partecipo grande, allora, nei calcoli posso
approssimare la densità Bi(180, 0.008) con la densità di Poisson P(180 · 0.008) = P(1.44). Quindi
1. P (di vincere il premio di un solo concorso) = P (X = 1) = 180 · 0.008 · 0.992179 =
0.3419415 ≈ 0.341176 = e−1.44 · 1.44.
2. P (di vincere almeno un premio) = P (X ≥ 1) = 1 − P (X = 0) = 1 − 0.008180 = 0.7644403
30
3. P (di vincere 30 premi) = P (X = 30) = 180 30
· 0.992150 ≈ e 30!1.44
−1.44
30 0.008
Esercizio 2.3.13 Siamo interessati all’evento A=“Esce l’ambo 80, 90 sulla ruota di Bari”.
(1) Ad ogni estrazione abbiamo
2 88
2 2
P (A) = 90
3 = ' 0.002497
5
801
poichè ad ogni estrazione e per ogni ruota si procede ad estrarre 5 palline senza reimmmissione.
Poichè ad ogni estrazione si usa la stezza urna con 90 palline numerate da 1 a 90 e per ogni
ruota si procede ad estrarre 5 palline senza reimmmissione, allora la successione delle estrazioni
del lotto sulla ruota di Bari costituiscono una successione di prove bernoulliane, con probabilità
di successo nella singola prova data da P (A) = 2/801.
(2) Sia ora X la variabile aleatoria che conta il numero di estrazioni necessarie per ottenere
l’ambo 80,90 per la prima volta sulla ruota di Bari. X ha densità geometrica di parametro 2/801
e quindi
P (“esattamente 600 giornate per fare ambo (per la prima volta) puntando sui numeri 80,90
sulla ruota di Bari”)=P (X = 600) = (2/801) (1 − 2/801)599 ' 0.00056.
(3) Per la proprietà di assenza di memoria della densità geometrica
P (X = 672|X > 72) = P (X = 672 − 72) = P (X = 600) ' 0.00056
(4) Sia ora Y la variabile aleatoria che conta il numero di volte in cui esce l’ambo 80,90 sulla
ruota di Bari, su 1000 estrazioni. Allora Y ∼ Bin(1000, 2/801) e
Segue che
90
2. P (Y > 1) = 100 = 0.9.
3. Dobbiamo calcolare P (Y > 2 | Y > 1):
90
90
P (Y > 2 ∩ Y > 1) P (Y > 2) 2 1 89
P (Y > 2 | Y > 1) = = = 100 / 100
=
P (Y > 1) P (Y > 1) 2 1
99
Nota 7 In questo esercizio, non vale la proprietà di assenza di memoria. Infatti: P (Y > 1) >
P (Y > 1 + 1 | Y > 1). D’altro canto, lo schema di estrazione dei fusibili è senza reimmissione.
Quindi
7
1. P (controllare almeno 8 chiavi) = P (X ≥ 8) = P (X > 7) = 1 − 10 = 0.3.
2. Per quanto riguarda la funzione di ripartizione di X vale che ∀k = 1, . . . , 10:
k
FX (k) = P (X ≤ k) = 1 − P (X > k) =
10
da cui:
0 x≤0
k
FX (x) = k ≤x<k+1
10
1 x ≥ 10
3. Infine, ∀k = 1, . . . , 10:
k k−1 1
pX (k) = FX (k) − FX (k − 1) = − =
10 10 10
Nota 8 X è la variabile aleatoria uniforme discreta sui primi 10 numeri naturali. Se il mazzo fosse
stato formato da n chiavi avremmo ottenuto per X la densità discreta uniforme sui primi n numeri
naturali, cioè X assume i valori in S := {1, . . . , n} con probabilità data da pX (k) = 1/n, ∀k ∈ S.
4. Se prima di provare una nuova chiave, rimetto la chiave nel mazzo allora lo schema di
riferimento è di estrazioni con reimmissione e la variabile aleatoria, diciamo Z, che indica il numero
di chiavi da provare per trovare quella dell’ufficio ha densità geometrica di parametro 1/10. Quindi:
1. P (Z ≥ 8) = P (Z > 7) = (9/10)7 .
Esercizio 2.3.16 Per la prima parte dell’esercizio, possiamo modellare le scelte dell’automobilista
tramite uno schema di Bernoulli di cinque prove indipendenti. Il successo corrisponde alla scelta
del self-service e quindi ogni prova avrà probabilità di successo p = 3/8 = 0.375. In particolare,
se definiamo E2 = “L’automobilista sceglie il self-service il secondo giorno” allora P (E2 ) = 83 .
Sia ora X = numero di successi. Allora X ∼ B(n, p) = B(5, 3/8) e
2 3
5 3 5
(2) P (X = 2) = = 0.3433.
2 8 8
Se l’automobilista non fa mai rifornimento due volte nella stessa stazione, allora l’automobilista
sceglie senza ripetizione n = 5 stazioni da un insieme di N = 8 stazioni di cui K = 3 self-service:
è come se estraesse senza reimmissione n = 5 palline da un’urna di N = 8 palline di cui K = 3
rosse e le rimanenti bianche.
2.6. SOLUZIONI DI ALCUNI ESERCIZI DEL CAPITOLO 2 33
Esercizio 2.4.3 R Rx
x
1. FX (x) = −∞ fX (s) ds = −∞ 4s3 1(0,1) (s) ds. Quindi FX (x) = 0 se x < 0 e FX (x) =
Rx 3 x
0
4s ds = s4 0 = x4 se 0 ≤ x < 1, e FX (x) = 1 se x ≥ 1. In definitiva:
0 se x < 0
FX (x) := x4 se 0 ≤ x < 1
1 se x ≥ 1.
R1 R1 2 R1
2 1
d −x2
2. P (X ≤ 1) = P (X < 1) = −∞
f (x) dx = 2 0
xe−x dx = − 0 dx
e dx = − e−x =
0
1 − e−1
Esercizio 2.4.7 X ha funzione di densità data da
1 0≤x≤1
fX (x) =
0 altrove
P (T ≤ t) = P (T ≤ t|A)P (A) + P (T ≤ t|B)P (B) = P (TA ≤ t)P (A) + P (TB ≤ t)P (B)
(
0 se t ≤ 0
=
1 − (e−0.5∗t + e−0.6∗t )/2 se t > 0
se e solo se
k
= 1 − 0.11/a
1000
se e solo se
1000
k = 1000 − 1000 × 0.11/a = 1000 − = 999.
1000
2.6. SOLUZIONI DI ALCUNI ESERCIZI DEL CAPITOLO 2 35
Esercizio 2.5.1
Esercizio 2.5.2 Sia T la variabile aleatoria che indica il numero di teste su 10 lanci indipendenti
di una moneta equilibrata. Allora T ∼ Bi(10, 1/2). Ovviamente il numero di croci è dato da
10 − T e la variabile aleatoria X = |T − (10 − T )| = |2T − 10| è la differenza in valore assoluto
tra numero di teste e numero di croci. Per rispondere alle varie domande dobbiamo calcolare la
densità di X:
1. X = 4 se e solo se |T − (10 − T )| = |2T − 10| = 4. Quindi
Esercizio 2.5.3
( (
y 0 se ey < 1 0 se y < 0
FY (y) = P (log X ≤ y) = P (X ≤ e ) = =
1 − e−λy se ey ≥ 1 1 − e−λy se y ≥ 0
Quindi Y è una variabile aleatoria continua con funzione di densità fY (y) = λe−λy 1(0,+∞ (y),
λ > 0, cioè Y ∼ E(λ).
Esercizio 2.5.4
arctan y + π/2
FY (y) = P (tan X ≤ y) = P (X ≤ arctan y) = ∀y ∈ R
π
Pertanto
∂ ∂ arctan y + π/2 1
(2.1) fY (y) = FY (y) = = ∀y ∈ R
∂y ∂y π π(1 + y 2 )
Z 0 Z ∞
1 1
x dx + x dx = 0!!!
−∞ π(1 + y 2 ) 0 π(1 + y 2 )
36 CAPITOLO 2. VARIABILI ALEATORIE
Esercizio 2.5.5
1. Poichè X è una variabile aleatoria continua e g(x) = x1/α è funzione derivabile e strettamente
crescente su (0, +∞) con inversa g −1 (x) = xα derivabile, allora Y = X 1/α è una variabile aleatoria
continua con densità
α
fY (y) = fX [g −1 (y)](g −1 )0 (y)1g((0,+∞)) (y) = fX (y α )αy α−1 1(0,+∞) (y) = λαy α−1 e−λy 1(0,+∞) (y).
2. Y ha funzione di ripartizione
( ( (
0 y≤0 0 y≤0 0 y≤0
FY (y) = R y α−1 −λtα
= R yα −λz = α
0 λαt e dt y > 0 0
λe dz y>0 1 − e−λy y>0
1 1/α−1
(z = tα , dt = z dz)
α
Quindi,
α
P (Y > t + s) 1 − FY (t + s) e−λ(t+s) α α
P (Y > t + s | Y > s) = = = = e−λ(t+s) +λs ;
P (Y > s) 1 − FY (s) e−λsα
Poiché
d
P (Y > t + s | Y > s) = P (Y > t + s | Y > s)λα(−(t + s)α−1 + sα−1 ) ≥ 0
ds
se e solo se sα−1 ≥ (s + t)α−1 e, ∀s ≥ 0, vale che sα−1 ≥ (s + t)α−1 se e solo se α ≤ 1, allora
concludiamo che
- se α = 1 allora P (Y > t + s | Y > s) è funzione costante in s;
- se α < 1 allora P (Y > t + s | Y > s) è funzione crescente in s;
- se α > 1 allora P (Y > t + s | T > s) è funzione decrescente in s.
3. Sulla base dei risultati illustrati al punto precedente, visto che l’andamento in s di P (Y > t + s |
T > s) non dipende da λ, per modellare tempi di vita di apparecchiature potremmo procedere
nella scelta si α secondo le seguenti regole:
- sceglieremo α = 1, cioè useremo la densità esponenziale, per modellare tempi di vita di
apparecchiature non soggette ad usura;
- sceglieremo α < 1 per modellare il tempo di vita di apparecchiature in rodaggio: sapendo che
l’apparecchiatura funziona da un tempo superiore ad s, è più probabile che sia in vita per un
ulteriore periodo di lunghezza almeno pari a t.
- sceglieremo α > 1 per modellare il tempo di vita di apparecchiature soggette ad usura.
R t+s
per cui, fissato t, P (X > t + s | X > s) è funzione crescente in s se e solo se s rX (u)du è
funzione decrescente in s. L’ultima condizione è equivalente a rX (s + t) < rX (s) ∀s, cioè rX (u)
è funzione decrescente. Infine, X si dice IFR (incresing failure rate) se u 7→ rX (u) è crescente,
mentre si dice DFR (decresing failure rate) se u 7→ rX (u) è decrescente. Quindi per una variabile
aleatoria X con densità di Weibull di parametri (α, λ) abbiamo che X è IFR se e solo se α > 1.
2.6. SOLUZIONI DI ALCUNI ESERCIZI DEL CAPITOLO 2 37
Esercizio 2.5.6 1. Y1 = U − 1/2 ∼ U(−1/2, 1/2). Cfr. Dispense, Esempio 2.6.6 pagina 54-55.
2. Poichè Y1 = U − 1/2 ∼ U(−1/2, 1/2) allora, la funzione di ripartizione di Y2 = |Y1 | è
0 y≤0
FY2 (y) = P (−y ≤ Y1 ≤ y) = 2y 0 < y < 1/2
1 y ≥ 1/2
4. Poichè g(x) = 1/(x + 1/2) è invertibile su (0, 1) e g −1 (y) = 1/y − 1/2 è derivabile su (0, +∞)
con (g −1 (y))0 = −1/y 2, allora
1 1 1 1 1 1 1
fY4 (y) = fU − = 2 1(0,1) − = 2 1(2/3,2) (y).
y 2 y2 y y 2 y
5. Poichè g(x) = − log(x)/λ è invertibile su (0, 1) e g −1 (y) = e−λy è derivabile su (0, +∞) con
(g −1 (y))0 = −λe−λy , allora
fY5 (y) = fU e−λy 1(0,1) e−λy λe−λy = λe−λy 1(0,+∞) (y)
38 CAPITOLO 2. VARIABILI ALEATORIE
Capitolo 3
Esercizio 3.1.2 Se una moneta regolare viene lanciata quattro volte, mediamente, quante volte
succede che croce segua immediatamente testa?
Esercizio 3.1.3 Sia U ∼ U(0, 1). Determinate media e varianza delle seguenti variabili aleatorie:
1. Y = U − 1/2 [Risp. E(Y ) = 0, Var(Y ) = 1/12]
2. Y = (U − 1/2)2 [Risp. E(Y ) = 1/12, Var(Y ) = 1/180]
3. Y = 1/(U + 1/2) [Risp. E(Y ) = log(3), Var(Y ) = 4/3 − log(3)2 ' 0.1264]
4. Y = − log(U ) [Risp. E(Y ) = Var(Y ) = 1]
1. Determinare il valore di c.
2. Calcolare media e varianza di X.
3. Qual è la probabilità che una particella selezionata a caso abbia diametro compreso tra 1.3
e 2 micron?
4. Calcolare la funzione di ripartizione di X.
Esercizio 3.1.5 Il numero di vestiti confezionati settimanalmente da una sartoria è una variabile
aleatoria con momento primo 5 e momento secondo 30.
1. Fornite una stima della probabilità che la prossima settimana il numero di vestiti confezio-
nati sia compreso fra 2 e 8.
2. Nei periodi di maggiore richiesta nella sartoria vengono assunti alcuni lavoranti stagionali
per aumentare la produzione settimanale. Si sa che con i nuovi lavoranti, comunque la produzione
media settimanale rimane invariata, mentre la varianza diminuisce all’aumentare dei lavoranti
secondo la seguente regola: Var(X) = 5/(n + 1), dove n rappresenta il numero di lavoranti
39
40 CAPITOLO 3. MEDIA VARIANZA E MOMENTI
Esercizio 3.2.2 Le bilance da cucina prodotte dalla casa xxx sono tarate in modo tale da non
aver errori sistematici. In realtà, l’errore effettivo di misurazione, espresso in grammi, non è
sempre nullo, ma si può modellare come una variabile aleatoria N (0, 1). Prima di esse immesse
sul mercato, le bilance sono controllate ad una ad una (per sempio pesando un oggetto di cui già
si conosce esattamente il peso) e passano il controllo quelle per cui l’errore di misurazione (sia per
eccesso sia per difetto) non supera i 2 grammi.
1. Si determini la percentuale di bilance che superano il controllo.
2. Di quanto è necessario aumentare il tetto dei 2 grammi, affinché la percentuale delle bilance
che non superano il controllo si riduca all’1%?
Esercizio 3.2.3 Sia X una variabile aleatoria assolutamente continua con densità gaussiana di
parametri µ = 4 e σ 2 = 25.
1. Qual è il valore di P (X ≤ 5), P (X > 3), P (3 < X < 5)?
2. Determinate il quantile di ordine 0.95 di X, cioè, indicata con FX la f.d.r. di X, determinate
il valore di k tale che FX (k) = 0.95.
3. Determinate il quantile di ordine 0.05 di X.
4. Per quale valore di k, P (2 − k < X < 6 + k) = 0.95?
Esercizio 3.2.4 Sia X ∼ N (µ, 36) con µ incognito. Determinate µ sapendo che P (X ≤ 5) = 0.40.
Esercizio 3.2.5 Le sferette di acciaio prodotte da una certa linea di produzione devono avere una
lunghezza nominale di 5 mm; sono accettabili sferette aventi lunghezza entro i limiti di tolleranza
[4, 6]. Le lunghezze reali dei pezzi prodotti sono in realtà variabili aleatorie con densità gaussiana
di media 5mm e varianza (0.5)2 mm2 .
1. Quale percentuale dei pezzi prodotti non rispetta i limiti di tolleranza dati?
2. Potendo ricalibrare la linea di produzione, a quale valore dobbiamo ridurre la varianza
affinchè la percentuale di pezzi che non rispettano i limiti di tolleranza si riduca al 1%?
Esercizio 3.2.6 Il peso (in Kg) degli uomini di 48 anni di una certa città può essere modellato
come una variabile aleatoria gaussiana X. Si sa inoltre che il 12.3% degli uomini pesano più di 70
Kg e il 6.3% pesa meno di 58 Kg. Determinate media e varianza di X.
Esercizio 3.2.7 L’altezza degli uomini di una determinata città si può modellare come una varia-
bille aleatoria gaussiana di parametri µ = 178cm e deviazione standard σ = 10cm. Mentre, quella
delle donne è una variabile aleatoria gaussiana di parametri µ = 168cm e deviazione standard
σ = 15cm. Inoltre, le donne costituiscono il 58% della popolazione della città oggetto di indagine.
1. Qual è la probabilità che l’altezza di un abitante della città mascherato fermato a caso ad
un angolo di una strada (un giorno di carnevale) sia compresa fra 164 e 180 cm?a
2. Se l’altezza della persona mascherata fermata è compresa fra 165 e 180 cm, qual è la
probabilità che la persona scelta a caso sia un uomo?
3.3. APPROSSIMAZIONE GAUSSIANA DELLA FUNZIONE DI RIPARTIZIONE BINOMIALE41
Esercizio 3.2.8 (CP TEL 12/11/02 Esercizio 1.3) Il tempo giornaliero, che uno studente
scelto a caso della Sezione [D − HZ] dedica allo studio di Calcolo delle Probabilità (CP) du-
rante la preparazione dell’esame, è una variabile aleatoria gaussiana con media 5 ore e varianza 4
(ore2 ).
1. Determinate la percentuale di studenti della Sezione [D − HZ] che dedica giornalmente a
CP meno di 6 ore.
Da un’indagine sulla Sezione [I − QZ], risulta che il 60% degli studenti della Sezione [I − QZ]
dedica allo studio di CP durante la preparazione dell’esame più di 3 ore al giorno.
2 Ipotizzando che il tempo giornaliero dedicato da uno studente della Sezione [I − QZ] a CP
durante la preparazione dell’esame sia sempre una variabile aleatoria gaussiana di varianza
4 (ore2 ), quanto vale la media di questa densità?
3 Calcolate ora anche per la Sezione [I −QZ] la percentuale di studenti che dedica giornalmente
a CP meno di 6 ore.
Supponiamo che la Sezione [D − HZ] sia formata da 162 studenti e quella [I − QZ] da 138.
4 Se uno studente viene estratto a caso dall’elenco di tutti gli studenti appartenenti alle due
Sezioni, quanto vale la probabilità che dedichi allo studio di CP un tempo inferiore a 6?
Esercizio 3.2.9 (CP ELN INF 11/11/03 Esercizio 2.3) Per trasmettere un messaggio bi-
nario (“0” o “1”) da una sorgente A a una ricevente B tramite un canale (per esempio un filo
elettrico), si decide di mandare un segnale elettrico di +2 Volt se il messaggio è “1” e di −2 Volt
se il messaggio è “0”. A causa di disturbi nel canale, se A invia il segnale µ = ±2, B riceve un
segnale X = µ + Z, dove Z rappresenta il rumore del canale. Alla ricezione di un qualunque
segnale X si decodifica il messaggio con la seguente regola:
se X ≥ 0.5 si decodifica “1”
se X < 0.5 si decodifica “0”.
Si supponga inoltre che Z sia una variabile aleatoria assolutamente continua con densità gaussiana
standard e che la probabilità di trasmettere “0” sia uguale alla probabilità di trasmettere “1”.
1. Qual è la probabilità di decodificare “1”, avendo inviato “0”?
2. Qual è la probabilità di decodificare “0”, avendo inviato “1”?
3. Qual è la probabilità di decodificare “1”?
4. Avendo decodificato “1”, qual è la probabilità che la decodifica sia esatta?
Esercizio 3.3.2 (I recupero CP Ing. Mat. aa. 2002-2003) Il 35% di tutto l’elettorato è a
favore del candidato Tizio. In una sezione elettorale votano 200 persone (scelte a caso) e sia X il
numero di quelle che sono a favore di Tizio.
42 CAPITOLO 3. MEDIA VARIANZA E MOMENTI
Esercizio 3.3.3 (CP ELN INF 08/09/04 esercizio 2) Il tempo di esecuzione del programma
xxx sul calcolatore yyy è compreso fra 60 e 120 minuti primi. Idealmente, esso può essere modellato
come una variabile aleatoria X assolutamente continua con densità
(
x−60
60 ≤ x ≤ 120
fX (x) = 1800
0 altrove.
1. Calcolate la probabilità che il calcolatore impieghi più di 90 minuti per eseguire il program-
ma.
Su ciascuno di 50 calcolatori, tutti del tipo yyy, i cui tempi di esecuzione sono variabili aleatorie
indipendenti lanciamo il programma xxx e, allo scadere dei 90 minuti, controlliamo se il programma
è stato eseguito oppure no. Indichiamo con S il numero di programmi (su 50) eseguiti nei primi
90 minuti.
2. Determinate media, varianza e densità di probabilità di S.
3. Calcolate approssimativamente la probabilità che almeno il 40% dei programmi siano stati
eseguiti nei primi 90 minuti.
R2
3. P (1.3 < X < 2) = 1.3
5x−6 dx = (1.3)−5 − 2−5 ' 0.2381.
Esercizio 3.1.5
1. Sia X la variabile aleatoria che indica il numero di vestiti confenzionati settimanalmente.
Allora X ha media E(X) = 5 e momento secondo E(X 2 ) = 30. Per rispondere alla domanda, dob-
biamo stimare P (2 ≤ X ≤ 8). Avendo informazioni su media e varianza, usiamo la diseguaglianza
di Chebychev:
Var(X) 5
P (2 ≤ X ≤ 8) ≥ 1 − =1−
32 9(n + 1)
2. Imponendo
1 1 1
0.99 = P (4 ≤ X ≤ 6) = P − ≤ Z ≤ = 2Φ −1;
σ σ σ
1 1 1
Φ = 0.995 = z0.995 ' 2.57583 , σ≈ ≈ 0.3882;
σ σ 2.57583
2
otteniamo che la varianza richiesta è = 0.1507mm2 .
Esercizio 3.2.6 I dati a nostra disposizione si possono cosı̀ sintetizzare:
( (
P (X > 70) = 1 − Φ 70−µ
σ = 12.3% Φ 70−µ
σ = 1 − 12.3%
= =
P (X < 58) = Φ 58−µ
σ = 6.3% Φ 58−µ
σ = 6.3%
( (
70−µ
σ = z1−12.3% = z0.877 = 1.1601 µ = 64.83
= 58−µ ⇒
σ = z6.3% = z0.063 = −1.5301 σ 2 = (4.46)2 ' 19.897
Esercizio 3.2.7 Sia X ∼ N (178, 100) l’altezza degli uomini e Y ∼ N (168, 225) l’altezza delle
donne, E l’evento=“l’altezza di una persona fermata a caso ad un angolo di una strada il giorno
di carnevale con una maschera sul viso è compresa fra 165 e 180 cm” e U l’evento=“Una persona
scelta a caso nella città è uomo” .
1. Per il teorema delle probabilità totali, P (E) = P (E | U )P (U ) + P (E | U c )P (U c ). Dai dati
del problema
abbiamo P (U ) = 0.42. Inoltre, P (E | U ) = P (X ∈ [165, 180]) = Φ 180−178 10 −
Φ 165−178
10 = Φ(0.2) − Φ(−1.3) = 0.5793
− 0.0968 = 0.4825 e P (E | U c
) = P (Y ∈
[165, 180]) = Φ 180−168
15 − Φ 165−168
15 = Φ(0.8) − Φ(−0.2) = 0.7881 − 0.4207 = 0.3674.
Quindi, P (E) = 0.4825 ∗ 0.42 + 0.3674 ∗ 0.58 = 0.4157.
P (E|U)P (U)
2. Per il teorema di Bayes, P (U | E) = P (E) = 0.4825 ∗ 0.42/0.4157 = 0.4875.
3.4. SOLUZIONI DI ALCUNI ESERCIZI DEL CAPITOLO 3 45
Esercizio 3.3.1
1. Per ogni allievo della classe posso pensare pari a 0.75 la probabilità che superi l’esame. Allo-
ra X che indica il numero di studenti che superano la prova su 10, tenuto conto anche dell’indipen-
denza dei risultati dei singoli studenti, ha densità binomiale di parametri (10,0.75).
Essendo 70% di
P10
10 uguale a 7, allora per rispondere a 1. calcoliamo P (X ≥ 7) = k=7 10 k 0.75 k
0.25 10−k
' 0.7759.
2. Valgono ancora le ipotesi del punto 1., ma ora gli allievi in classe sono 140. Quindi
Y =numero di studenti che superano la prova su 140 ha densità binomiale di parametri (140,0.75).
Essendo 70% di 14=98, allora per rispondere a 2. calcoliamo approssimativamente P (Y ≥ 98),
usando il teorema centale del limite. Con la correzione di continuità abbiamo:
Esercizio 3.3.2
1. E(X) = 200 × 0.35 = 70.
P200 200
2. X ∼ Bin(200, 0.35). Quindi P (X > 75) = k=76 k 0.35k 0.65200−k
3. Usando un’approssimazione gaussiana, basata sul Teorema di De Moivre-Laplace si ottiene
X − 70 75 − 70
P (X > 75) = P √ > √ '
200 × 0.35 × 0.65 200 × 0.35 × 0.65
75.5 − 70
'1−Φ √ ' 1 − Φ(0.815) ' 1 − Φ(0.82) ' 1 − 0.7938 = 0.2162
200 × 0.35 × 0.65
Vettori aleatori
Esercizio 4.1.2 (I recupero 19/07/02 CP, INF) Un’urna contiene 3 biglie rosse, due biglie
bianche ed una verde. Si estraggono due biglie senza reinserimento. Siano R il numero di biglie
rosse estratte e B il numero di biglie bianche estratte.
(1) Qual è la densità congiunta del vettore (R, B)?
(2) Qual è la densità marginale di B? Quale quella di R?
(3) Calcolate media e varianza di B.
(4) Calcolare la covarianza di R e B e il coefficiente di correlazione lineare. B e R sono variabili
aleatorie non correlate?
(5) Calcolare Var(R − B).
Esercizio 4.1.3 Sia (X, Y ) un vettore aleatorio con densità congiunta data da:
X \Y -1 0 2 6
-2 1/9 1/27 1/27 1/9
1 2/9 0 1/9 1/9
3 0 0 1/9 4/27
Calcolare la probabilità:
1. che Y sia pari. (si consideri 0 un numero pari);
2. che XY sia dispari;
3. P (X > 0, Y ≥ 0) e P (|XY | ≥ 2);
4. P (X ≥ Y );
5. cov(X, Y ).
6. X, Y sono indipendenti?
47
48 CAPITOLO 4. VETTORI ALEATORI
Esercizio 4.1.4 Si lanciano in successione tre monete equilibrate. Sia X il numero di esiti “testa”
per le prime due monete e Y il numero di esiti “croce” per le ultime due.
1. Si determini la densità congiunta del vettore (X, Y ).
2. Si determinino E(X), E(Y ), Var(X), Var(Y ) e ρ(X, Y ).
3. X e Y sono indipendenti? Perché?
4. Quanto vale P (X < Y )?
5.1 Le tre monete equilibrate sono ora lanciate in successione 100 volte. Quanto vale la
probabilità che sia almeno pari a 35 il numero di lanci in cui si ottiene un numero di teste per le
prime due minore del numero di croci per le ultime due?
Esercizio 4.1.5 Sia (X, Y ) un vettore aleatorio discreto la cui densità congiunta è la seguente:
X \Y 0 1
0 1/3 1/3
1 1/12 1/12
2 1/12 1/12
X, Y sono indipendenti?
Esercizio 4.1.6 (I recupero Ing. Matematica a. 2002-03) Da un’urna contenente tre pal-
line numerate da 1 a 3 vengono effettuate due estrazioni in successione e senza rimpiazzo. Sia X
il numero della prima pallina estratta ed Y il più grande dei due numeri estratti.
1. Trovare la densità del vettore (X, Y ).
2. Trovare la densità di (X, Y − X).
3. Trovare la densità di Y − X.
4. Calcolare cov(X, Y ).
X \Y 0 1 2
0 1/3 0 1/3
1 0 1/3 0
Esercizio 4.1.8 (CP ELN-INF 11/11/03 Esercizio 2.2) Da un gruppo di 7 batterie, di cui 3
nuove, 2 usate ma funzionanti e 2 difettose, ne vengono scelte 3 a caso. Siano X e Y rispettivamente
il numero di batterie nuove e usate tra quelle scelte.
3. Le tre batterie scelte sono montate su di un apparecchio che funziona se nessuna di esse è
difettosa. Determinare la probabilità che l’apparecchio funzioni.
1 Svolgere nell’ultima esercitazione dopo i teoremi limite
4.2. VETTORI ALEATORI ASSOLUTAMENTE CONTINUI 49
Esercizio 4.1.9 (CP 02/07/04 CP INF Esercizio 4) Siano X, Y due variabili aleatorie di
Bernoulli di parametro p e indipendenti. Posto
Z = X(1 − Y ) e W = 1 − XY
Esercizio 4.1.10 (08/09/04 CP, ELN, INF, esercizio 3) Un dado che ha una faccia blu,
due rosse e tre verdi viene lanciato due volte. Siano R il numero di volte in cui il dado esi-
bisce la faccia superiore rossa e V il numero di volte in cui il dado esibisce la faccia superiore
verde.
3. Determinate quali sono i valori che Z = max{R, V } può assumere con probabilità stretta-
mente positiva e calcolate E(Z) e Var(Z).
Esercizio 4.1.11 (CP TEL Seconda prova in itinere del 02/02/2005) Siano X, Y due va-
riabili aleatorie indipendenti entrambe geometriche di parametro p = 0.2. Siano poi U = 0.5X +
0.1Y e V = bX + Y + c. Usando le proprietà di varianza e covarianza:
2. determinate cov(U, V );
3. stabilite per quali valori dei parametri b, c le variabili aleatorie U, V non sono correlate,
quindi calcolate Var(U − V ) in questo caso.
Esercizio 4.2.2 Sia (X, Y ) un vettore aleatorio assolutamente continuo con densità
( y2
e− 2 0<x< √1 ey∈R
fX,Y (x, y) = 2π
0 altrove
Esercizio 4.2.3 Sia (X, Y ) un vettore aleatorio assolutamente continuo con funzione di riparti-
zione FX,Y data da
0 se x ≤ 0 o y ≤ 0
FX,Y (x, y) = 1 − λxe−λy − e−λx se 0 < x < y
1 − e−λy − λye−λy se 0 < y < x
Esercizio 4.2.5 Se le variabili aleatorie X, Y hanno funzione di densità congiunta f della forma
X, Y sono indipendenti?
Esercizio 4.2.6 Sia (X, Y ) un vettore aleatorio con densità uniforme sul triangolo di vertici
(0, 0), (0, 1), (2, 0).
1. Calcolate la densità marginale di X.
2. Quanto vale E(X)?
3. Quanto vale P (X > 2Y )?
4. Quanto vale P (X > 1, Y ≤ 1/2)?
Esercizio 4.2.7 (I recupero 19/07/02 CP, INF) Sia (X, Y ) un vettore aleatorio continuo
con densità data da (
1
(x + y)e−(x+y) se x, y > 0
fXY (x, y) = 2
0 altrove.
1. Determinare la densità di X + Y .
2. Calcolare le densità marginali di X e di Y . X e Y sono variabili aleatorie indipendenti?
3. Calcolare cov(X, Y ).
4. Calcolare la media di X + Y .
1
5. Calcolare la media di .
X +Y
Esercizio 4.2.9 (II prova in itinere 04/07/02 CP, INF, Esercizio 1) Sia (X, Y ) un vetto-
re aleatorio continuo con densità data da
(
6
(x2 + y) se 0 < x < 1 e 0 < y < 1
fXY (x, y) = 5
0 altrove.
Esercizio 4.2.10 (CP INF 06/09/03 Esercizio 1.3) Sia (X, Y ) un vettore aleatorio continuo
con densità data da
(
(x + y) se 0 < x < 1 e 0 < y < 1
fXY (x, y) =
0 altrove.
Esercizio 4.2.11 (CP ELN-INF 10/02/04 Esercizio 2.4) Sia (X, Y ) un vettore aleatorio bi-
dimensionale assolutamente continuo con densità
1
fX,Y (x, y) = (6 − x − y)I(0,2) (x)I(2,4) (y).
8
1. Determinare le densità marginali di X e di Y .
2. Determinare E(X + Y ).
3. Determinare E(XY ).
4. Le variabili aleatorie sono indipendenti? Giustificare rigorosamente la risposta.
Esercizio 4.3.2 Un sistema in parallelo è costituito da due componenti indipendenti i cui tempi
di guasto espressi in minuti, chiamiamoli S e T , sono entrambi variabili aleatorie assolutamente
continue con densità esponenziale di parametro λ = 0.2.
1. Qual è la probabilità che il sistema funzioni ancora dopo 10 minuti dall’attivazione?
2. Come cambia la risposta al punto 2. se i componenti sono collegati in serie?
52 CAPITOLO 4. VETTORI ALEATORI
Esercizio 4.3.3 Due giocatori A e B lanciano ciascuno un dado equilibrato finchè non ottengono
6. Se i giocatori impiegano lo stesso numero di lanci, il gioco finisce in parità, altrimenti vince chi
ha effettuato meno lanci.
1. Qual è la probabilità che il gioco finisca con k lanci?
2. Qual è la probabilità che il gioco finisca in parità?
3. Qual è la probabilità che vinca il giocatore A?
Esercizio 4.3.4 Si lanciano due dadi equi e si osservano i numeri che escono. Sia U il valore
minimo fra i due numeri usciti e W il massimo. Si determini la densità congiunta del vettore
aleatorio (U, W ).
)T un vettore
Esercizio 4.4.4 Sia (X, Y T
aleatorio gaussiano con vettore delle medie (0, 0) e
4 3/2
matrice di covarianza C = . X + 2Y e X − 2Y sono indipendenti? Qual è la densità
3/2 1
di X − 2Y ? E quella di X + 2Y ?
Esercizio 4.4.5 (II recupero CP, Inf, 16 /09/02) Il peso e l’altezza delle donne americane
in età giovanile (misurato rispettivamente in chilogrammi e centimetri) si può modellizzare
con
Xp
un vettore aleatorio gaussiano (che in seguito supporremo per semplicità adimensionale) di
Xa
57 6 7
media m = e matrice di covarianza C = .
165 7 12
La regola più semplice per calcolare il peso forma, che in questo modello è rappresentato dalla
variabile aleatoria Xi , è la seguente:
Xi = Xa − 110
1. Si calcoli il coefficiente di correlazione fra Xp e Xi .
2. Si determini la densità di Xi − Xp .
3. Si determini la percentuale di donne americane in età giovanile che supera il peso forma.
4.5. TEOREMA CENTRALE DEL LIMITE 53
Esercizio 4.4.6 (III recupero 08/09/04 CP, ELN, INF) Siano X, Y due variabili aleatorie
indipendenti
√ √ in particolare X ∼ N (0, λ) (λ > 0) e Y ∼ N (0, 1). Definiamo U =
e gaussiane;
X + λY e V = X − λY .
1. Determinate le densità marginali di U e V .
2. Determinate cov(U, V ). U e V sono indipendenti?
3
3. Determinate per quali valori di λ la seguente disuguaglianza è vera: P (U ≤ 0, V ≤ 1) ≤ .
8
Esercizio 4.4.7 (II Appello CP per ING INF 01/03/06) Sia X una variabile aleatoria nor-
male di media 1 e varianza 2; sia Y una variabile aleatoria indipendente da X, normale di media
4 e varianza 4. Si introduca la variabile aleatoria W = X − Y2 . Si calcoli P [−2.5 ≤ W ≤ 0.5].
Esercizio 4.5.3 Il primo di settembre di ogni anno un cartolaio prepara un ordine di biro gialle
con cui far fronte alle vendite dell’intero anno (=365 giorni). Si sa che il cartolaio vende X biro
gialle al giorno, dove X è una variabile aleatoria di Poisson di parametro λ = 2.5 e che il numero
di biro gialle vendute in giorni diversi sono indipendenti.
1. Se Y indica il numero totale di biro gialle vendute in un anno, qual è la densità di Y ?
[Risp: In quanto somma di v.a. di Poisson i. i. d. Y è ancora di Poisson con parametro la
somma dei parametri, cioè, Y ∼ P(365 · 2.5 = 912.5).]
2. Quanto vale approssimativamente la probabilità che in un anno si vendano al più 960 biro?
[Risp: Dobbiamo calcolare approssimativamente
P (Y ≤ 960) usando il il teorema centrale
960.5−912.5
del limite: P (Y ≤ 960) = FY (960.5) ' Φ √
912.5
= Φ(1.59) ' 0.9440]
Esercizio 4.5.4 (II Appello CP per ING INF 01/03/06) La variabile aleatoria X che con-
ta il numero giornaliero di outlink dalla pagina web xxx alla pagina web bbb si può modellare come
una variabile aleatoria di Poisson di parametro θ > 0, cioè
( −θ k
e θ
k! k = 0, 1, 2, . . .
pX (k) =
0 altrove.
Invece, la variabile aleatoria Y che conta il numero giornaliero di outlink dalla pagina web yyy
alla pagina web bbb ha densità binomiale di parametri n = 10 e p = 0.2. Assumiamo che X e Y
siano indipendenti.
1. Determinare il valore di θ tale che la probabilità che in un giorno non ci sia nessun outlink
da xxx a bbb sia pari a 0.1
2. Determinare media e varianza di X + Y (si usi il valore di θ trovato al punto 1.)
3. Supponendo che gli outlink alla pagina bbb in giorni diversi siano tutti indipendenti, calcolare
un valore approssimato per la probabilità che in 49 giorni ci siano almeno 200 outlink alla
pagina bbb provenienti da xxx o yyy (si usi il valore di θ trovato al punto 1.)
Esercizio 4.5.5 (Esempio 3b pag. 400 da Ross (2004)) Il numero di studenti che si iscrivo-
no a un corso di laurea specialistica è rappresentato da una variabile aleatoria di Poisson di media
100. Se si iscrivono più di 120 unità i corsi saranno sdoppiati. Se invece si iscrivono al più 120
unità, si farà un unico canale.
Qual è la probabilità che i corsi di base vengano sdoppiati? [Risp: ' 0.0202]
Esercizio 4.5.6 Ho un vecchio walkman che funziona con una sola pila. Uso sempre pile aaa non
ricaricabili e con una pila del tipo aaa, il mio walkman suona per un tempo modellabile come una
2
variabile aleatoria assolutamente continua con densità f (x) = x1(0,5) (x).
25
1. Calcolate media e varianza della durata del mio walkman con la pila aaa. [Risp: E(X) = 10/3
e Var(X) = 25/18]
Siano X1 la durata della prima pila aaa, X2 la durata della seconda pila aaa, . . ., Xn la durata
dell’ n-esima pila aaa sostituita, . . ..
2. Scrivete in termini di X1 , . . . , Xn la probabilità che all’ora t io avrò sostituito almeno n
batterie. [Risp: P (X1 + · · · + Xn ≤ t) ]
3. Calcolate il valore approssimato della probabilità che dopo 250 ore io avrò sostituito almeno
72 batterie. Quale ipotesi state facendo sulla successione X1 , . . . , Xn , . . .? [Risp: 0.8413,
X1 , . . . , Xn , . . . , i. i. d.]
Siano ora X1 , . . . , X200 200 variabili aleatorie iid con comune funzione di densità di probabilità
f (x; k) dove k assume il valore determinato al punto 1.. Sia inoltre S200 = X1 + · · · + X200 .
R\B 0 1 2
0 0 2/15 1/15
1 1/5 2/5 0
2 1/5 0 0
R\B 0 1 2 pR
0 0 2/15 1/15 2/15 + 1/15 = 1/5
2. 1 1/5 2/5 0 2/15 + 1/5 = 3/5
2 1/5 0 0 1/5
pB 1/5 + 1/5 = 2/5 2/15 + 2/5 = 8/15 1/15
3. Quindi E(B) = 8/15 + 2 · 1/15 = 2/3. Inoltre, E(B 2 ) = 8/15 + 4 · 1/15 = 4/5. Ne segue che
Var(B) = 4/5 − (2/3)2 = 16/45.
4. E(R) = 1 e E(RB) = 1 · 1 · 2/5 = 2/5 quindi cov(R, B) = E(RB) − 2/3 = 2/5 − 2/3 = −4/15.
√
Inoltre E(R2 ) = 3/5 + 4/5 = 7/5, da cui Var(R) = 2/5. Infine ρ(R, B) = √ −4/15 = −1/ 2, da
16/45·2/5
cui evinciamo che R e B non sono scorrelate.
5. Var(R − B) = Var(R) + Var(B) − 2cov(R, B) = 2/5 + 16/45 + 8/15 = 58/45
Esercizio 4.1.3
X \Y -1 0 2 6 pX
-2 1/9 1/27 1/27 1/9 8/27 = pX (−2)
1 2/9 0 1/9 1/9 4/9
3 0 0 1/9 4/27 7/27
pY 1/3 1/27 7/27 10/27 1
4. P (X > Y ) = P ((X, Y ) ∈ {(1, −1), (3, 2)}) = pX,Y (1, −1) + pX,Y (3, 2) = 2/9 + 1/9 = 1/3
5. cov(X, Y ) = E(XY
) − E(X)E(Y ) = 74/27
− (17/27) · (65/27) ' 1.225, poiché
1
E(XY ) = −2 −1 × 1/9 + 2 27 + 6 × 1/9 +1 [−1 × 2/9 + 2 × 1/9 + 6 × 1/9]+3 [2 × 1/9 + 6 × 4/27] =
74/27 e E(X) = −2 × 8/27 + 4/9 + 3 × 7/27 = 17/27, E(Y ) = −1/3 + 2 × 7/27 + 6 × 10/27 =
65/27 ' 0.1139.
e \ Ye
X -1 0 2 6 pX
-2 8/81 8/(27)2 56/(27)2 80/(27)2 8/27
1 4/27 4/243 28/243 40/243 4/9
3 7/81 7/(27)2 49/(27)2 70/(27)2 7/27
pY 1/3 1/27 7/27 10/27 1
Esercizio 4.1.4 L’insieme dei possibili risultati dei lanci delle tre monete è
X Y 0 1 2 pX (x)
pX,Y (0, 0)+
0 pX,Y (0, 0) = 0 pX,Y (0, 1) = 1/8 pX,Y (0, 2) = 1/8 pX,Y (0, 1)+
pX,Y (0, 2) = 2/8
1 1/8 2/8 1/8 4/8
2 1/8 1/8 0 2/8
pX,Y (0, 0)+
pY (y) pX,Y (1, 0)+ 4/8 2/8 1
pX,Y (2, 0) = 2/8
34) = 1 − FS (34). Per il Teorema Centrale del Limite, applicando la correzione di continuità, e
avendo in mente che E(S) = 100 · 83 = 37.5 e Var(X) = 100 · 38 · 85 = 23.4375 abbiamo:
34 + 0.5 − 37.5 37.5 − 34 − 0.5
1 − FS (34) ' 1 − Φ √ =Φ √ ' Φ(0.62) ' 0.7324
23.4375 23.4375
Poiché per ogni coppia (x, y) ∈ {(0, 0), (0, 1), (1, 0), (1, 1), (2, 0), (2, 1)}, la densità congiunta fatto-
rizza nel prodotto delle marginali [pX,Y (x, y) = pX (x)pY (y)], allora X, Y sono indipendenti.
Esercizio 4.1.6
1. I possibili risultati dell’esperimento in questione sono rappresentabili dalle coppie {(a, b) :
a 6= b, a, b : 1, 2, 3}, pertanto scegliamo come spazio campionario Ω = {(a, b) : a 6= b, a, b : 1, 2, 3},
i.e. le disposizioni senza ripetizione di ordine 2 di 3 elementi. Allora |Ω| = 3 · 2 = 6 e assegnamo
allo spazio probabilizzabile (Ω, P(Ω)) la probabilità uniforme. Abbiamo che X((a, b)) = a ed
Y ((a, b)) = max(a, b) per ogni (a, b) ∈ Ω. Pertanto: SY = {2, 3}, SX = {1, 2, 3} e
X/Y 2 3
1 (1, 2) (1, 3)
2 (2, 1) (2, 3)
3 ∅ (3, 1), (3, 2)
X/Y − X 0 1 2 pX
1 0 1/6 1/6 1/3
2 1/6 1/6 0 1/3
3 1/3 0 0 1/3
pY −X 1/2 1/3 1/6
Esercizio 4.2.3 Se y > 0 allora: FY (y) = limx→+∞ FX,Y (x, y) = limx→+∞ (1 − e−λy − λye−λy ) =
1 − e−λy − λye−λy altrimenti FY (y) = 0. Se x > 0 allora: FX (x) = limy→+∞ F(X,Y ) (x, y) =
limy→+∞ 1 − λxe−λy − e−λx = 1 − e−λx , altrimenti FX (x) = 0. Quindi:
Il fatto che f(X,Y ) (x, y) = 0 6= fX (x)fY (y), ∀(x, y) ∈ {(x, y) ∈ R2 : x > y > 0} è sufficiente per
concludere che X ed Y non sono indipendenti.
2
g(x, y) = f(X, e ) (x, y) = fX (x)fY (y), (x, y) ∈ R è una densità congiunta con marginali fX , fY . g
e Y
è diversa da fX,Y come si evince dal punto 5..
Esercizio 4.2.5 Poichè f è della forma f (x, y) = f1 (x)f2 (y), ∀(x, y) ∈ R2 dove f1 (x) = 1(−1,1) (x)
e f2 (y) = e−2y 1(0,+∞) (y), allora X e Y sono indipendenti. Inoltre X ha densità uniforme
sull’intervallo (−1, 1) e Y ha densità esponenziale di parametro 2.
Esercizio 4.2.6
(R (
1−x/2
R 1 dy x ∈ (0, 2) 1 − x/2 x ∈ (0, 2)
1. fX (x) = fX,Y (x, y) dy = 0 = .
0 altrove 0 altrove
R2
2. E(X) = 0
x(− x2 + 1) dx = 32 .
3. Poiché (X, Y ) è uniforme sul triangolo R di vertici (0, 0), (0, 1), (2, 0), allora P (X > 2Y ) =
area{(x, y) ∈ R : x > 2y} 1
= .
area R 2
4. P (X > 1, Y ≤ 1/2) = Area del triangolo di vertici (1, 0), (2, 0), (1, 1/2)/area(R) = 1/4.
Esercizio 4.2.7 R Rz Rz
+∞
1. fX+Y (z) = −∞ fXY (z − y, y) dy = 0 21 ze−z du1(0,+∞) (z) = z −z
2e 1(0,+∞) (z) 0 du =
z 2 −z
2 e 1(0,+∞) (z),cioè Z ∼ gamma(3, 1).
R∞ R +∞ 1
2. fX (x) = −∞ fXY (xy) dy = 0 2 (x + y)e
−(x+y)
dy = 21 (x + 1)e−x 1(0,+∞) (x). Analoga-
mente fY (y) = 12 (y + 1)e−y 1(0,+∞) (y): X e Y non sono indipendenti, perché la densià congiunta
non fattorizza nel prodotto delle marginali. nR o
R +∞ +∞ R +∞
3. E(Y ) = E(X) = 0 x 12 (x + 1)e−x dx = 0 x2 e−x dx + 0 xe−x dx /2 = (2 + 1)/2 =
3/2;
R +∞ R +∞ 1 −(x+y)
R +∞ −y nR +∞ 2 −x R
y +∞ −x
o
E(XY ) = 0 0 xy 2 (x + y)e dxdy = 0 ye 0 x e /2 dx + 2 0 xe dx dy = 2
cov(X, Y ) = E(XY ) − E(X)E(Y ) = 2 − ( 23 )2 = − 14 .
4. Siano X1 , X2 , X3 i.i.d. ∼ E(1). Poichè X + Y è gamma(3,1), allora la densità di X + Y
coincide con la densità di X1 + X2 + X3 . Pertanto E(X + Y ) = E(X1 + X2 + X3 ) = 3EX1 = 3.
Alternativamente, procediamo nel seguente modo:
Z ∞Z ∞ Z ∞Z ∞
1
E(X + Y ) = (x + y)fXY (x, y)dxdy = (x + y)2 ex+y dxdy = . . . = 3
−∞ −∞ 0 0 2
1
2. cov(X, Y ) = E(XY ) − E(X)E(Y ) = − 100 ; Infatti,
Z Z 1
3 6 x4 1 3 x2 1 3
E(X) = xfX (x) dx = x(2x2 + 1) dx = + =
R 5 0 5 4 0 5 2 0 5
Z Z 1
2 3
E(Y ) = yfy (y) dy = y (3y + 1) dy =
0 5 5
ZR Z Z
6 6
E(XY ) = xyfX,Y (x, y) = xy(x2 + y) dxdy = (x3 y + xy 2 ) dxdy
R 2 5 [0,1] 2 5 [0,1] 2
Z Z
6 3 6 2
= x y dxdy + xy dxdy
5 [0,1]2 5 [0,1]2
Z Z Z Z
6 3 6 2
= y( x dx)dy + y ( x dx) dy
5 [0,1] [0,1] 5 [0,1] [0,1]
Z Z
6 x4 1 6 x2 1
= y dy + y2 dy
5 [0,1] 4 0 5 [0,1] 2 0
3 2 1 2 1 7
= y + y3 =
20 0 10 0 20
1
3. X e Y non sono indipendenti, perché cov(X, Y ) = − 100 6= 0:se sono correlate allora non
sono indipendenti. R
R 1
4. fX (x) = R fXY (x, y)dy = 0 65 (x2 + y)dy 1(0,1) (x) = 35 (2x2 + 1)1(0,1) (x);
R R
1
fY (y) = R fXY (x, y)dx = 0 65 (x2 + y)dx 1(0,1) (y) = 25 (3y + 1)1(0,1) (y);
5. fe(x, y) = fX (x)fY (y) = 256
(2x2 + 1)(3y + 1)1(0,1) (y)1(0,1) (x)
R1
6. Var(X) = E(X 2 ) − E2 (X) = 0 35 x2 (2x2 + 1)dx − 25 9
= 11 9
25 − 25 = 25 .
2
R 1 9
Var(Y ) = E(Y 2 ) − E2 (Y ) = 0 52 y 2 (3y + 1)dy − 25 = 13 9
30 − 25 = 50 .
3
2 3 1 3
7. Var(X + Y ) = Var(X) + Var(Y ) + 2cov(X, Y ) = 25 + 50 − 50 = 25
Esercizio 4.3.1
(1) FW (x) = P (W ≤ x) = 1 − P (W > x) = 1 − (1 − F (x))n
[dove F (x) indica la f.d.r. della geometrica di parametro 1/6, data da F (k) = 1 − (5/6)k ]
11 k−1 11
= (1 − p)2(k−1) − [(1 − p)2 ]k = [(1 − p)2 ]k−1 (1 − (1 − p)2 ) = (1 − ) ·
36 36
Osservazione 1 Se X e Y sono indipendenti e geometriche di parametro p, q, rispettivamente,
allora W = min{X, Y } ha densità geometrica di parametro 1 − (1 − p)(1 − q) = p + q − pq.
[
∞
2. P (“Il gioco finisce in parità”) = P (X = Y ) = P {X = k, Y = k}
k=1
∞
X ∞
X ∞
X
= P (X = k, Y = k) = P (X = k)P (Y = k) = [p(1 − p)k−1 ]2
k=1 k=1 k=1
∞
X
2 p 1
=p (1 − p)2k = = ' 0.091.
2−p 11
k=0
[
∞ X∞
3. P (“vince A”) = P (X < Y ) = P {X = k, Y > k} = P (X = k, Y > k)
k=1 k=1
∞
X ∞
X ∞
X 1−p 5
= P (X = k)P (Y > k) = p(1 − p)k−1 (1 − p)k = p(1 − p) (1 − p)2k = =
2−p 11
k=1 k=1 k=0
Esercizio 4.4.3
1. Essendo ciascun Yj somma di variabili a medie nulle allora E(Y1 ) = E(Y2 ) = E(Y3 ) = 0.
2. Poiché
Y1 1 2 3 X1
Y := Y2 = 2 3 1 X2 := X,
Y3 3 1 2 X3
1 2 3 Y1
e A := 2 3 1 è matrice simmetrica e invertibile (infatti det(A) = −18) allora Y2 ha
3 1 2 Y3
matrice di covarianza:
1 2 3 1 2 3 14 11 11
C := 2 3 1 I 2 3 1 = 11 14 11
3 1 2 3 1 2 11 11 14
62 CAPITOLO 4. VETTORI ALEATORI
3. Infine, sempre considerando che Y = AX, con A matrice invertibile, deriva che Y ∼
N (0, C).
Esercizio 4.4.4
X + 2Y X 1 2
1. =A con A := che ha det(A) = −2 − 2 = −4.
X − 2Y Y 1 −2
Allora A ha rango pieno e (X + 2Y, X − 2Y )T ∼ N con vettore delle medie: A(0, 0)T = (0, 0)T e
matrice di covarianza
1 2 4 3/2 1 1 14 0
ACAT = =
1 −2 3/2 1 2 −2 0 2
Esercizio 4.5.1
1. Poichè X rappresenta il numero di successo su 300 prove bernoulliane con probabilità di suc-
cesso pari alla probabilità di ottenere la coppia (1, 1), lanciando due dadi regolari simultaneamente,
1
allora, tale probabilità è p = 36 e X ∼Bi(300, 1/36). In conseguenza di ciò E(X) = 300/36 = 25/3
e Var(X) = 300/36 · 35/36 = 875/108.
4.6. SOLUZIONI DI ALCUNI ESERCIZI DEL CAPITOLO 4 63
2. P (X > 10) = 1−P (X ≤ 10) = 1−P (X ≤ 10.5) = 1−P √X−EX ≤ 0.76 ' 1−Φ(0.76) '
Var(X)
0.22363.
10.5−n/36
3. 1 − Φ √ > 0.5 ⇔ Φ( 378−n
√
35n
) < 0.5 ⇔ 378−n
√
35n
< 0 ⇔ n > 378.
35n/362
4. la probabilità che si verifichi un triplo 1 è p = 613 = 0.0046, quindi Y ∼ Bi(300, 0.0046). Dal
momento che 300∗0.0046 = 1.39 < 5 approssiamo la densità binomiale tramite la densità di Poisson
∗(1.39)2
di parametro 0.0046 ∗ 300 = 1.39, si ha quindi P (Y ≤ 2) ∼ e−1.39 + e ∗(1.39)
+e
−1.39 −1.39
1! 2! ∼
0.8359.
Esercizio 4.5.2
1. In quanto somma di v.a. di Poisson i. i. d. S è ancora di Poisson con parametro la somma
dei parametri, cioè, S ∼ P(100 · 4) = P(400).
2. Per il teorema centrale del limite, P (S ≤ 390) vale approssimativamente
390.5 − 400
P (S ≤ 390) = P (S ≤ 390+0.5) ' Φ √ = Φ(−0.475) = 1−Φ(0.475) ' 1−0.6826 = 0.3174
400
390.5 − 4n
(3) 0.5 < P (X1 + · · · + Xn > 390) = 1 − P (X1 + · · · + Xn ≤ 390) ' 1 − Φ √ ,
2 n
se e solo se
390.5 − 4n 390.5 − 4n
Φ √ < 0.5 sse √ < q0.5 = 0 sse 390.5 − 4n < 0 sse n > 97.625 cioè n ≥ 98.
2 n 2 n
4. Siano Y1 , . . . , Y256 256 variabili aleatorie discrete i.i.d. con densità di Poisson di parametro 1.
Allora X ha la stessa densità di S = Y1 + . . . + Y256 . Quindi, applicando il Teorema centrale del
limite: P (X > 270) = P (S > 270) = 1 − FS (270) = 1 − FS (270 + 0.5) ' 1 − Φ( 270+0.5−256 √
256
)=
1 − Φ(0.90625) ' 1 − 0.818588 = 0.181412.
Esercizio 4.5.4
1. Deve essere P (X = 0) = e−θ = 0.1, quindi θ = ln 10 ' 2.3026.
2. E(X + Y ) = E(X) + E(Y ) = ln 10 + 2 ' 4.3026. Inoltre dal momento che si tratta di variabili
aleatorie indipendenti, si ha
Esercizio 4.5.7
1. E(X) = E(2U ) = 2E(U ) = 2/2 = 1, Var(X) = Var(2U ) = 4Var(U ) = 4/12 = 1/3 dove
U ∼ U (0, 1);
2. Sia S = X1 + · · · + X147 . In quanto somma di variabili aleatorie i. i. d. assolutamente
continue, anche S è assolutamente continua da cui P (S < 161) = P (S ≤ 161). Inoltre E(S) = 147
e Var(S) = 147 · 31 = 49. Per il teorema centrale del limite, la f.d.r. di S−E(S)
√
VarS
converge alla f.d.r
N (0, 1). Quindi, P (S < 161) = FS (161) ' Φ 161−147
√
49
= Φ(2) ' 0.9772.
Capitolo 5
Miscellanea
Esercizio 5.1.2 Sia X una variabile aleatoria assolutamente continua con densità fX (x) = |x|1(−1,1) (x)
ed Y una variabile aleatoria esponenziale di parametro 1 indipendente da X.
(1) Determinate E(X 2 ) e E(X 3 ).
(2) Calcolate P (X < 0.3).
(3) Posto Z = X 2 determinate la densità di Z.
(4) Calcolate media e varianza di W = Z + Y .
(5) Siano ora W1 , . . . , W161 161 variabili aleatorie iid con media E(W ) e varianza Var(W )
individuate al punto (4). Calcolate approssimativamente la probabilità che W1 + · · · + W161 ∈
[230, 250].
(6) Quante variabili aleatorie i.i.d. aventi la stessa densità di W è necessario sommare affinchè
la probabilità che W1 + · · · + Wn ≤ 250 sia inferiore a 0.5?
Soluzione
R1 R1 R1
(1) E(X 2 ) = −1 x2 |x| dx = 2 0 x3 dx = 1/2. Mentre E(X 3 ) = −1 x3 |x| dx = 0, essendo
l’integranda una funzione dispari.
(2) Si ha:
Z 0 Z 0.3
P (X < 0.3) = − x dx + x dx = 1/2 + 0.09/2
−1 0
√ √ (
fX ( x) + fX (− x) 1 se x ∈ (0, 1)
(3) fZ (x) = √ = =⇒ Z ∼ U (0, 1).
2 x 0 se x ∈
/ (0, 1)
(4) E(W ) = E(Z)+E(Y ) = E(X 2 )+1 = 1/2+1 = 3/2. Var(Z) = E(X 4 )−(E(X 2 ))2 = 1/3−1/4 =
1/12, quindi per l’indipendenza di Z e Y : Var(W ) = Var(Z) + Var(Y ) = 1/12 + 1 = 13/12.
65
66 CAPITOLO 5. MISCELLANEA
(5) W1 , . . . W161 son v.a. i.i.d con E(W1 +· · ·+W161 ) = 241.5 e Var(W1 +· · ·+W161 ) = 161∗13/12 '
174.4167. Per il Teorema centrale del limite:
!
230 − 241.5 W1 + · · · + W161 − 241.5 250 − 241.5
P (230 ≤ W1 + · · · + W161 ≤ 250) = P p ≤ p ≤ p
161 ∗ 13/12 161 ∗ 13/12 161 ∗ 13/12
' Φ(0.6436) − Φ(−0.8708) = 0.7401 − 0.1919 = 0.5482
Quindi: 250−3n/2
√ < 0, da cui n > 250 ∗ 2/3 = 166.6667, ovvero n ≥ 167.
13n/12
Esercizio 5.1.3 Due urne contengono 50 dadi ciascuna. In una i dadi sono regolari, nell’altra i
dadi sono truccati in modo che la probabilità di ottenere 1 sia 12 e la probabilità di ottenere ogni
1
altro risultato è 10 .
(1) Un dado viene estratto a caso (probabilità uniforme) da una delle due urne e lanciato, sia X
la v.a. che indica il risultato del lancio. Si calcoli la probabilità di ottenere un 3 e la media di X.
(2) Calcolare la probabilità di aver lanciato un dado truccato, sapendo che si è ottenuto un tre.
(3) Consideriamo il seguente esperimento: un dado viene estratto a caso e viene lanciato due volte.
Siano A l’evento “al primo lancio ottengo 2” e B = “al secondo lancio ottengo 3”. A e B sono
indipendenti?
Soluzione
(1) Sia T = “il dado scelto è truccato”. Allora:
1 1 1 1 2
P (X = 3) = P (X = 3|T )P (T ) + P (X = 3|T c)P (T c ) = ∗ + ∗ = .
10 2 6 2 15
1/10 ∗ 1/2 3
P (T |X = 3) = = .
2/15 8
Esercizio 5.1.4 (CP INF 16/09/02 Esercizio 1.2) Sia X una variabile aleatoria continua
con densità uniforme sull’intervallo (0, 1) ed Y una variabile aleatoria esponenziale di parametro
1 indipendente da X.
5.1. ESERCIZI DI RICAPITOLAZIONE 67
Esercizio 5.1.5 (CP ELN INF 10/02/04 Esercizio 2.3) Un commerciante sa che il numero
di computer portatili che può vendere in un qualsiasi giorno di apertura (dal lunedı̀ al venerdı̀
di ogni settimana) ha densità di Poisson di parametro 0.4 e che il numero di portatili venduti nei
singoli giorni sono indipendenti.
1. Sia Y il numero di computer venduti in una settimana. Qual è la densità di Y ? Qual è la
media di Y ?
2. Qual è la probabilità che il commerciante non venda nessun portatile in una settimana?
Sia X il numero di settimane consecutive che passano a partire da lunedı̀ 16 febbraio 2004 fino a
quando il commerciante non vende il primo portatile (compresa la settimana in cui si verifica la
prima vendita).
3. Qual è la densità di X? Qual è la probabilità che si debbano attendere almeno tre settimane
per vendere il primo portatile?
68 CAPITOLO 5. MISCELLANEA
Bibliografia
[1] Baldi, P. Giuliano R., Ladelli, L. (1995) Laboratorio di Statistica e Probabilità, problemi svolti,
Mc Graw Hill Italia.
[2] Bramanti, M. (1998) Calcolo delle probabilità e statistica, Progetto Leonardo Bologna.
[3] Cacoullos, T. (1989) Exercises in probability Springer New York.
[4] Feller, W. (1950) An Introduction to Probability Theory and Its Applications, volume 1. John
Wiley & Sons.
[5] Epifani, I., Ladelli, L.M. e Posta, G. (2006) Appunti per il corso di Calcolo delle Probabilità,
AA 2005/2006 http://www1.mate.polimi.it/∼ileepi/dispense/0506CP/
[6] Hsu, H. (1998) Probabilità, variabili casuali e processi stocastici, Schaum’s n. 93. Mc Graw
Hill Italia.
[7] Mood, A. M., Graybill, F. A., Boes, D.C. (1988) Introduzione alla statistica, Mc Graw Hill
Italia.
[8] Ross, S.M. (1987) Introduction to Probability And Statistics for Engineers and Scientists,
J.Wiley.
[9] Ross, S.M. (2004) Calcolo delle probabilità, Apogeo.
[10] Temi d’esame degli AA 2000-2004: http://www1.mate.polimi.it/∼ileepi/temi-esame
[11] Trivedi, K S. (2002) Probability and statistics with reliability, queuing, and computer science
applications, 2. ed. Wiley New York.
69
Politecnico di Milano
Appunti per il corso
di
calcolo delle probabilità
Anno Accademico 2005/20061
Ilenia Epifani
Lucia Ladelli
Gustavo Posta
1 Ilcontenuto di queste dispense è protetto dalle leggi sul copyright e dalle disposizioni dei
trattati internazionali. Il materiale qui contenuto può essere copiato (o comunque riprodotto) ed
utilizzato liberamente dagli studenti, dagli istituti di ricerca, scolastici ed universitari afferenti
ai Ministeri della Pubblica Istruzione e dell’Università e della Ricerca Scientifica e Tecnologica
per scopi istituzionali, non a fine di lucro. Ogni altro utilizzo o riproduzione (ivi incluse, ma
non limitatamente a, le riproduzioni a mezzo stampa, su supporti magnetici o su reti di calco-
latori) in toto o in parte è vietata, se non esplicitamente autorizzata per iscritto, a priori, da
parte degli autori. L’informazione contenuta in queste pagine è ritenuta essere accurata alla da-
ta della pubblicazione. Essa è fornita per scopi meramente didattici. L’informazione contenuta
in queste pagine è soggetta a cambiamenti senza preavviso. Gli autori non si assumono alcuna
responsabilità per il contenuto di queste pagine (ivi incluse, ma non limitatamente a, la correttez-
za, completezza, applicabilità ed aggiornamento dell’informazione). In ogni caso non può essere
dichiarata conformità all’informazione contenuta in queste pagine. In ogni caso questa nota di
copyright non deve mai essere rimossa e deve essere riportata anche in utilizzi parziali. Copyright
2005 Ilenia Epifani, Lucia Ladelli e Gustavo Posta.
2
Indice
1 Probabilità 1
1.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Spazi di probabilità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.1 Spazio campionario . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.2 Eventi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.3 Spazio di probabilità . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3 Proprietà della probabilità . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4 Spazi finiti o numerabili . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.5 Probabilità condizionata ed indipendenza . . . . . . . . . . . . . . . . . . . 15
1.5.1 Alcune formule importanti . . . . . . . . . . . . . . . . . . . . . . . 17
1.5.2 Indipendenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.5.3 Prove di Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2 Variabili aleatorie 27
2.1 Variabili aleatorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.1.1 Funzione di ripartizione . . . . . . . . . . . . . . . . . . . . . . . . 29
2.2 Variabili aleatorie discrete . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.3 Esempi di densità discrete notevoli . . . . . . . . . . . . . . . . . . . . . . 36
2.3.1 Densità binomiale e bernoulliana . . . . . . . . . . . . . . . . . . . 36
2.3.2 Densità Geometrica . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.3.3 Densità di Poisson come limite di densità binomiale . . . . . . . . . 39
2.3.4 Densità ipergeometrica . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.4 Variabili aleatorie assolutamente continue . . . . . . . . . . . . . . . . . . . 44
2.5 Esempi di densità continue notevoli . . . . . . . . . . . . . . . . . . . . . . 47
2.5.1 Densità uniforme continua . . . . . . . . . . . . . . . . . . . . . . . 47
2.5.2 Densità esponenziale . . . . . . . . . . . . . . . . . . . . . . . . . . 48
2.5.3 Densità gaussiana standard . . . . . . . . . . . . . . . . . . . . . . 50
2.6 Funzioni di variabili aleatorie . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.6.1 *Cenno alla simulazione di variabili aleatorie . . . . . . . . . . . . . 56
i
ii INDICE
4 Vettori Aleatori 77
4.1 Variabili aleatorie indipendenti . . . . . . . . . . . . . . . . . . . . . . . . 77
4.2 Vettori aleatori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.3 Vettori aleatori discreti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.4 Vettori aleatori assolutamente continui . . . . . . . . . . . . . . . . . . . . 84
4.5 Funzioni di vettori aleatori . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.5.1 Funzioni di vettori aleatori discreti . . . . . . . . . . . . . . . . . . 87
4.5.2 Funzioni di vettori aleatori assolutamente continui . . . . . . . . . . 89
4.6 *Vettori aleatori indipendenti . . . . . . . . . . . . . . . . . . . . . . . . . 92
4.7 Valore atteso di funzioni di vettori aleatori . . . . . . . . . . . . . . . . . . 93
4.8 Covarianza, Coefficiente di correlazione . . . . . . . . . . . . . . . . . . . . 95
4.8.1 Matrice di covarianza . . . . . . . . . . . . . . . . . . . . . . . . . . 99
4.9 *Funzione generatrice dei momenti . . . . . . . . . . . . . . . . . . . . . . 100
4.10 Vettori gaussiani . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4.11 Teoremi limite per somme di variabili aleatorie . . . . . . . . . . . . . . . . 106
4.11.1 Legge dei grandi numeri . . . . . . . . . . . . . . . . . . . . . . . . 106
4.11.2 Teorema centrale del limite . . . . . . . . . . . . . . . . . . . . . . 108
Probabilità
1.1 Introduzione
Lo scopo di questi appunti è quello di introdurre il lettore ai concetti base della teoria e
del calcolo delle probabilità. Il calcolo delle probabilità si occupa dello studio e della for-
malizzazione matematica di fenomeni “casuali”, cioè di fenomeni per i quali non possiamo
predire a priori l’esito. I motivi per i quali può accadere che per un certo fenomeno non
sia possibile dare una descrizione deterministica sono molteplici: può accadere che le infor-
mazioni riguardanti il fenomeno sul quale vogliamo fare previsioni siano incomplete, può
accadere che non esista una teoria che permetta di arrivare a dedurre delle conseguenze
per il fenomeno in osservazione, o che magari la teoria esista ma risulti di difficile applica-
zione, oppure può accadere semplicemente che il fenomeno sia veramente “casuale”. Come
esempio pensiamo al lancio di una moneta. Il moto di un corpo rigido nello spazio, come
è la moneta, è ben descritto dalle equazioni della meccanica newtoniana, quindi in linea di
principio, se riusciamo a tenere conto della velocità iniziale con la quale viene lanciata la
moneta, dell’attrito effettuato dall’aria e degli urti anelastici che la moneta subisce quan-
do ricade a terra, potremmo calcolare se alla fine la moneta esibirà sulla faccia superiore
testa o croce. Tuttavia un conto reale di questo genere risulta infattibile, sia perché non
è possibile in generale misurare sperimentalmente le grandezze fisiche coinvolte, sia perché
il sistema in esame esibisce una dipendenza sensibile dalle condizioni iniziali: una piccola
(infinitesima) variazione delle condizioni iniziali (ad esempio la forza applicata nel lancio
o posizione dalla quale si lancia) porta ad un effetto macroscopico notevole (ad esempio
esce testa piuttosto che croce). Risulta invece chiaro che se la moneta è sufficientemente
simmetrica ci attendiamo che la “possibilità” che dopo un lancio si presenti testa sia la
stessa che si presenti croce. Da qui l’esigenza di modellizzare questo fenomeno attraverso
una teoria diversa dalla meccanica newtoniana.
Dall’esempio precedente può sembrare che mentre una teoria deterministica come la
meccanica newtoniana ci potrebbe dire, almeno in linea di principio, se alla fine osservere-
mo una testa o una croce, una descrizione probabilistica del fenomeno si limita a constatare
che se lanciamo una moneta la “possibilità” di ottenere testa è la stessa di quella di ot-
1
2 CAPITOLO 1. PROBABILITÀ
tenere croce, non aiutandoci affatto nel fare previsioni quantitative. Questo, per quanto
riguarda l’esempio precedente è almeno parzialmente vero. Per capire quali siano i punti
di forza della teoria della probabilità bisogna fare un esempio più complesso. Supponiamo
di rovesciare un sacchetto contenente 1000 monete da 1 su un tavolo e supponiamo di
voler sapere quante sono le monete che esibiscono una testa sulla parte superiore. Que-
sto è un problema totalmente intrattabile dal punto di vista della meccanica classica (lo
sarebbe anche nel caso potessimo supporre le monete perfettamente identiche e gli urti
perfettamente elastici). Da un punto di vista intuitivo possiamo aspettarci che circa la
metà delle monete esibirà una testa mentre l’altra metà esibirà una croce. Tuttavia non
sarebbe corretto affermare che osserveremo esattamente 500 teste e 500 croci. La teoria
della probabilità ci fornirà invece gli strumenti per dare un significato quantitativo a frasi
del tipo “circa la metà delle monete esibirà una testa mentre l’altra metà esibirà una cro-
ce”. Ad esempio vedremo che la probabilità di osservare un numero compreso tra 440 e
560 teste vale approssimativamente
Z 3.82636
1 x2
√ e− 2 dx ' 0.99987
2π −3.82636
che indicherà che quasi sicuramente il numero di teste che osserveremo sarà un numero
compreso tra 440 e 560.
Come abbiamo detto la nostra sarà solamente una introduzione alle tecniche del calcolo
delle probabilità, per questo le applicazioni che vedremo saranno sempre molto semplici e
avranno scopo essenzialmente didattico. Non vedremo praticamente mai un’applicazione
che risolve un vero problema tecnico–ingegneristico. Piuttosto svilupperemo le tecniche
matematiche che potranno poi essere utilizzate per veri problemi applicativi in corsi più
avanzati. Il taglio di questo corso sarà quindi di carattere modellistico–matematico, nel
senso che il corso svilupperà delle tecniche matematiche, ma terremo sempre d’occhio cosa
queste tecniche significhino da un punto di vista pratico–applicativo. Per poter apprendere
le tecniche base del calcolo delle probabilità è necessaria una certa familiarità con alcuni
concetti matematici elementari, come il calcolo combinatorio e il calcolo differenziale ed
integrale di più variabili.
Nel testo sono contenuti anche degli esercizi. Gli esercizi sono tutti molto semplici
e vanno svolti tutti, esclusi quelli segnalati da un asterisco “ * ” che sono di carattere
più matematico–teorico. Cercare di studiare il testo senza tentare di confrontarsi con gli
esercizi è quasi totalmente inutile: lo scopo dell’esercizio è forzare lo studente a pensare in
modo non superficiale a quanto ha letto e pensa di aver capito.
Il materiale è organizzato nel modo seguente.
Nel primo capitolo vengono introdotte le nozioni base della teoria delle probabilità quali
spazio campionario, eventi e spazio di probabilità; viene poi sviluppato il concetto basilare
di indipendenza. Questo capitolo non contiene materiale particolarmente avanzato da un
punto di vista tecnico, tuttavia contiene alcuni concetti (come quello di spazio degli eventi
elementari e di famiglia di eventi) che vanno letti con attenzione.
Nel secondo capitolo vengono introdotte le variabili aleatorie monodimensionali e le
caratteristiche deterministiche ad esse associate. Per comprendere questo capitolo è ne-
1.2. SPAZI DI PROBABILITÀ 3
cessario avere una certa familiarità con il calcolo differenziale e integrale unidimensiona-
le. Inoltre anche qui alcuni concetti elementari ma profondi come quello di preimmagine
richiedono una certa attenzione.
Nel capitolo terzo vengono trattate le variabili aleatorie multidimensionali. Per poter
leggere questo capitolo è necesssario che il lettore conosca il calcolo integrale e differenziale
a più variabili.
Nel capitolo quarto vengono discusse le leggi limite del calcolo delle probabilità; una
certa conoscenza del concetto di successione di funzioni è utile anche se non necessaria.
Esempio 1.2.3 Si consideri l’esperimento aleatorio consistente nel lanciare una moneta
equilibrata fino a quando non si presenta testa. Il risultato dell’esperimento casuale può
essere un qualunque numero naturale 1, 2, . . .; quindi per spazio campionario si può scegliere
Ω = N ∪ {∞}.
4 CAPITOLO 1. PROBABILITÀ
Esempio 1.2.5 Si consideri l’esperimento aleatorio: “Giuseppe lancia due dadi, uno rosso
l’altro blu, ed osserva i numeri che compaiono sulle facce superiori”. In questo caso i
risultati possibili sono tutte le coppie ordinate di numeri interi tra uno e sei. Uno spazio
degli eventi elementari è
Ω := {(1, 1), (1, 2), . . . , (1, 6), (2, 1), (2, 2), . . . , (2, 6), . . . , (6, 1), (6, 2), . . . , (6, 6)} =
= {(i, j) : i = 1, 2, . . . , 6; j = 1, 2, . . . , 6}
dove il generico evento elementare (i, j) in Ω rappresenta il risultato “è uscito i sul dado
rosso e j sul dado blu”.
Esercizio 1.2.6 Tre palline sono estratte una dopo l’altra senza reimbussolamento da
un’urna che ne contiene dieci numerate da 1 a 10 e per il resto identiche. Trovare lo spazio
campionario.
1.2.2 Eventi
Abbiamo detto che lo spazio campionario Ω è un insieme che rappresenta tutti i possibili esi-
ti di un dato esperimento aleatorio. Torniamo ora all’Esempio 1.2.1 dove Ω = {1, 2, . . . , 6};
ciascun punto di Ω rappresenta il numero che Giuseppe osserva sulla faccia superiore del
dado che ha lanciato. Ci piacerebbe ora poter rappresentare eventi del tipo “Giuseppe
osserva un numero pari”, oppure “Giuseppe osserva un numero più grande di 4” etc. Que-
sti sono sempre eventi relativi all’esperimento aleatorio ma non sono più elementari, nel
senso che, ad esempio, l’evento “Giuseppe osserva un numero pari” può essere descritto
in termini di eventi elementari nel modo seguente: “Giuseppe osserva un 2” oppure “Giu-
seppe osserva un 4” oppure “Giuseppe osserva un 6”. La scelta che si opera nel calcolo
delle probabilità è quella di rappresentare gli eventi relativi ad un esperimento aleatorio
mediante sottoinsiemi dello spazio campionario Ω. In questo modo ad esempio l’evento
“Giuseppe osserva un numero pari” è rappresentato dal sottoinsieme {2, 4, 6} ⊂ Ω mentre
l’evento “Giuseppe osserva un numero più grande di 4” è rappresentato dal sottoinsieme
{5, 6} ⊂ Ω. Segue che gli eventi elementari vengono rappresentati da insiemi contenenti
un solo elemento: l’evento “Giuseppe osserva un 2” è rappresentato dall’insieme {2} ⊂ Ω.
Esercizio 1.2.10 Sia Ω un insieme qualsiasi, verificare che l’algebra banale F1 := {∅, Ω} e l’insieme delle
parti F2 := P(Ω) = {tutti i sottoinsiemi di Ω} sono algebre di sottoinsiemi di Ω.
Esercizio 1.2.13 Verificare che una σ-algebra di sottoinsiemi è anche un’algebra di insiemi di Ω.
Esercizio 1.2.14 Risolvere l’Esercizio 1.2.10 sostituendo alla parola “algebra” la parola “σ-algebra”.
Definizione 1.2.16 Sia (Ω, F ) uno spazio probabilizzabile. Una probabilità su (Ω, F ) è
una funzione su F tale che:
1. P (E) ≥ 0 per ogni E ∈ F ;
2. P (Ω) = 1;
· · · ∈ F sono
3. se E1 , E2 ,S P+∞ eventi a due a due disgiunti, cioè Eh ∩ Ek = ∅ se h 6= k,
+∞
allora P k=1 Ek = k=1 P (Ek ).
+∞
! +∞
[ X
P (∅) = P Ek = P (∅)
k=1 k=1
3
Questa formulazione matematica è detta impostazione assiomatica della probabilità ed è dovuta al
matematico sovietico A.N. Kolmogorov (1933)
8 CAPITOLO 1. PROBABILITÀ
Esempio 1.2.19 Se lanciamo tre monete distinguibili e non truccate, lo spazio campio-
nario è
Ω := {T T T, T T C, T CT, T CC, CT T, CT C, CCT, CCC}
e come famiglia di eventi possiamo scegliere F := P(Ω). Infine, scelta la funzione P (E) :=
|E|/|Ω|, dove |E| indica la cardinalità di E, si può verificare direttamente che con questa
definizione (Ω, F , P ) costituisce uno spazio di probabilità.
La maggior generalità dell’assioma 3 è necessaria nel caso di spazi campionari infiniti.
2. se E ∈ F allora P (E) ≤ 1;
3. se E, F ∈ F e F ⊂ E allora P (E \ F ) = P (E) − P (F );
P (E ∪ F ∪ G) = P ((E ∪ F ) ∪ G)
= [P (E) + P (F ) + P (G)] − [P (E ∩ F ) + P (E ∩ G) + P (F ∩ G)] + P (E ∩ F ∩ G)
Dimostrazione La dimostrazione è per induzione. La (1.3.1) è vera per n = 2 per il punto 5. della
Proposizione 1.3.1. Supponiamo ora che (1.3.1) sia verificata per tutti gli interi ≤ n e per ogni famiglia di
n eventi in F e proviamola per n + 1. Dall’ipotesi induttiva deriva:
n+1
! n
! ! n
! n
!
[ [ [ [
P Ek = P Ek ∪ En+1 = P Ek + P (En+1 ) − P (Ek ∩ En+1 ) =
k=1 k=1 k=1 k=1
n
X X
= (−1)r+1 P (Ek1 ∩ Ek2 ∩ · · · ∩ Ekr )+
r=1 {k1 ,k2 ,...,kr }⊂{1,2,...,n}
n
X X
+ P (En+1 ) − (−1)r+1 P (Ek1 ∩ Ek2 ∩ · · · ∩ Ekr ∩ En+1 ) =
r=1 {k1 ,k2 ,...,kr }⊂{1,2,...,n}
n+1
X X
= (−1)r+1 P (Ek1 ∩ Ek2 ∩ · · · ∩ Ekr )+
r=1 {k1 ,k2 ,...,kr }⊂{1,2,...,n+1}
{k1 ,k2 ,...,kr }63(n+1)
n+1
X X
+ (−1)r+1 P (Ek1 ∩ Ek2 ∩ · · · ∩ Ekr ) =
r=1 {k1 ,k2 ,...,kr }⊂{1,2,...,n+1}
{k1 ,k2 ,...,kr }3(n+1)
n+1
X X
= (−1)r+1 P (Ek1 ∩ Ek2 ∩ · · · ∩ Ekr ).
r=1 {k1 ,k2 ,...,kr }⊂{1,2,...,n+1}
10 CAPITOLO 1. PROBABILITÀ
Esercizio 1.3.3 Relativamente alla prima sessione d’esame del primo anno del corso di
laurea XXX è noto che la probabilità che uno studente superi:
• l’esame A è 0.4,
• l’esame B è 0.5,
• l’esame C è 0.3,
• l’esame A e l’esame B è 0.35,
• l’esame A e l’esame C è 0.2,
• l’esame B e l’esame C è 0.25,
• tutti e tre gli esami è 0.15,
Determinare la probabilità che nella prima sessione uno studente scelto a caso
1. non superi l’esame A;
2. superi A ma non superi B;
3. superi almeno un esame;
4. non superi alcun esame.
Soluzione Indichiamo con A l’evento “lo studente supera l’esame A”, con B l’evento
“lo studente supera l’esame B” e con C l’evento “lo studente supera l’esame C”. Allora le
probabilità richieste sono:
1. P (Ac ) = 1 − P (A) = 0.6;
2. P (A ∩ B c ) = P (A \ (A ∩ B)) = P (A) − P (A ∩ B) = 0.4 − 0.35 = 0.05;
3. P (A∪B∪C) = P (A)+P (B)+P (C)−[P (A∩B)+P (A∩C)+P (B∩C)]+P (A∩B∩C) =
0.4 + 0.5 + 0.3 − 0.35 − 0.2 − 0.25 + 0.15 = 0.55;
4. P (Ac ∩ B c ∩ C c ) = P ((A ∪ B ∪ C)c ) = 1 − 0.55 = 0.45.
e
∞
X
pk = 1 (1.4.1)
k=1
1.4. SPAZI FINITI O NUMERABILI 11
È immediato P+∞ verificare che la P cosı̀ definita è una probabilità su P(Ω). Infatti P (∅) = 0
e P (Ω) = k=1 pk = P 1. Inoltre la proprietà di σ-additività segue dalla Definizione 1.4.2 e
dal fatto che, poiché +∞ k=1 pk è una serie a termini positivi convergente, allora si possono
sommare somme parziali disgiunte ed ottenere sempre il medesimo risultato come somma
totale.
Viceversa, P una qualunque misura di probabilità su P(Ω) soddisfa P ({ωk }) ≥ 0 per
k = 1, 2, . . . e +∞k=1 P ({ωk }) = P (Ω) = 1. Abbiamo dimostrato la seguente proposizione.
Proposizione 1.4.1 Sia Ω un insieme numerabile e sia {ω1 , ω2 , . . . } una numerazione dei
punti di Ω. Sia F = P(Ω).
2. Data una successione p1 , p2 , . . . che soddisfa (1.4.1), esiste un’unica misura di pro-
babilità su (Ω, F ) tale che P ({ωk }) = pk per ogni k. Tale probabilità è data
da X
P (E) = pk ∀E ⊂ Ω
k: ωk ∈E
Notiamo che quanto detto sopra per spazi numerabile può essere ripetuto per Ω finito.
Esercizio 1.4.2 Enunciare e dimostrare la proposizione precedente nel caso di spazi cam-
pionari finiti.
Esempio 1.4.3 Ogni successione [sequenza] di termini positivi per la quale la somma dei
termini è uno fornisce un esempio di modello probabilistico su uno spazio numerabile [fini-
to]. Tuttavia alcune di queste si impongono come modelli naturali per certi tipi di fenomeni
aleatori. Ricordiamo qui i principali modelli utili nelle applicazioni. Una trattazione più
approfondita viene rimandata al capitolo dedicato alle variabili aleatorie.
e−λ λk
pk = k = 0, 1, . . .
k!
12 CAPITOLO 1. PROBABILITÀ
pk = p(1 − p)k−1 k = 1, 2, . . .
n k
pk = p (1 − p)n−k k = 0, 1. . . . , n
k
Esercizio 1.4.4 Verificare che i pk assegnati nei punti 1., 2. e 3. dell’Esempio 1.4.3
verificano (1.4.1) e quindi definiscono una probabilità.
X X 1 |E|
P (E) = P ({ωk }) = =
|Ω| |Ω|
k: ωk ∈E k: ωk ∈E
Esempio 1.4.5 (segue Esempio 1.2.5) Consideriamo ancora l’esempio del lancio di due
dadi. In questo caso lo spazio degli eventi elementari è Ω = {(i, j) : i, j = 1, 2, . . . , 6} e
come famiglia (σ-algebra) degli eventi possiamo scegliere F := P(Ω). Per quanto riguarda
l’assegnazione di una probabilità P su (Ω, F ) osserviamo che se assumiamo che i due
dadi non siano truccati e vogliamo che il nostro spazio di probabilità (Ω, F , P ) modellizzi
questo fatto fisico, dobbiamo ammettere che tutti gli eventi elementari di Ω abbiano la
stessa probabilità p = 1/|Ω| = 1/36. Sia Ek l’evento “la somma dei due dadi è k” per
1.4. SPAZI FINITI O NUMERABILI 13
k = 2, 3, . . . , 12. Allora,
E2 = {(1, 1)}
E3 = {(1, 2), (2, 1)}
E4 = {(1, 3), (2, 2), (3, 1)}
E5 = {(1, 4), (2, 3), (3, 2), (4, 1)}
E6 = {(1, 5), (2, 4), (3, 3), (4, 2), (5, 1)}
E7 = {(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)}
E8 = {(2, 6), (3, 5), (4, 4), (5, 3), (6, 2)}
E9 = {(3, 6), (4, 5), (5, 4), (6, 3)}
E10 = {(4, 6), (5, 5), (6, 4)}
E11 = {(5, 6), (6, 5)}
E12 = {(6, 6)}
Esempio 1.4.6 Consideriamo l’esempio del lancio di due dadi, ma assumiamo di essere
interessati solamente alla somma dei risultati dei due dadi. In questo caso lo spazio degli
eventi elementari è dato da Ω = {2, 3, . . . , 12} e come famiglia degli eventi possiamo sceglie-
re F := P(Ω). Per quanto riguarda l’assegnazione di una probabilità P su (Ω, F ) osservia-
mo che se assumiamo che i due dadi non siano truccati, per l’esempio precedente, dobbiamo
porre P ({2}) = P ({12}) = 1/36, P ({3}) = P ({11}) = 1/18, P ({4}) = P ({10}) = 1/12,
P ({5}) = P ({9}) = 1/9, P ({6}) = P ({8}) = 5/36, P ({7}) = 1/6. Se invece assu-
miamo che i possibili risultati della somma dei due dadi siano equiprobabili, dobbiamo
porre P ({k}) = 1/11 per ogni k = 2, 3, . . . , 12: lo spazio di probabilità cosı̀ costruito è
matematicamente corretto, ma non ha nulla a che vedere con la realtà fisica e sperimentale.
Campionamento da urne
Esempi classici di probabilità uniforme sono quelli associati agli esperimenti aleatori di
campionamento da un’urna contenente M palline numerate da 1 a M e per il resto in-
distinguibili. L’esperimento consiste nell’estrarre un numero n di palline. A seconda
delle modalità secondo cui vengono effettuate le estrazioni si ottengono differenti spazi
campionari.
Ω1 := {(a1 , . . . , an ) : ai = 1, . . . , M e ai 6= aj ∀i 6= j}
14 CAPITOLO 1. PROBABILITÀ
dove la i-esima componente del caso elementare (a1 , . . . , an ) rappresenta il numero della
i−esima pallina estratta. Se non vi è reimmissione, la prima coordinata a1 può essere
scelta in M modi e per ciascuno di questi abbiamo M − 1 possibilità per scegliere a2
... e M − n + 1 per l’n-esima. Detto diversamente, lo spazio campionario è l’insieme di
tutte le disposizioni senza ripetizione di ordine n delle M palline. La cardinalità di Ω1 è
|Ω1 | = (M)n = M(M − 1) · · · (M − n + 1).
Se n = M allora |Ω1 | = M! = numero delle permutazioni (senza ripetizione) di M
oggetti.
Esempio 1.4.7 Un’associazione è formata da 25 iscritti. Tra questi devono essere scelti
un presidente ed un segretario. Quanti sono i modi possibili per ricoprire le due cariche?
Considerando che la prima carica può essere ricoperta da 25 persone diverse e che per
ciascuna di queste si hanno 24 scelte possibili della seconda carica, allora
Se gli individui vengono scelti a caso per ricoprire le cariche, qual è la probabilità che un
assegnato membro dell’associazione ne ricopra una?
Sia A: “Un assegnato membro dell’associazione ricopre una carica”. Per fissare le idee, e
senza perdere in generalità, il membro in questione sia il numero 1. Allora, A = {(a1 , a2 ) ∈
Ω1 : a1 = 1 o a2 = 1} e |A| = |{(a1 , a2 ) ∈ Ω1 : a1 = 1}| + |{(a1 , a2 ) ∈ Ω1 : a2 = 1}| =
24 + 24, da cui
|A| 48 2
P (A) = = = = 0.08
|Ω1 | 25 × 24 25
Se non interessa l’ordine con cui le palline sono estratte, si può scegliere come spazio
campionario4
Esempio 1.4.8 Se una persona gioca a poker con un mazzo di 32 carte, in quanti modi
può essere servito?
Le 32 carte del mazzo sono cosı̀ ripartite: quattro semi ♥, ♦, ♣ e ♠, per ognuno dei quali
si hanno le 8 carte distinte: A, K, Q, J, 10, 9, 8, 7. Ogni mano è un insieme di 5 carte scelte
dal mazzo. Allora: Ω2 = {E : E ⊂ {1, . . . , 32}, |E| = 5} e il numero di mani possibili è
|Ω2 | = 32
5
= 201376.
Qual è la probabilità che il giocatore abbia un tris “servito”?
Sia A l’evento: “il giocatore ha un tris servito (e non un gioco migliore)”. Allora P (A) =
|A|/|Ω2 |. Per calcolare |A| scegliamo
il valore del tris (Es. tris di K) tra gli 8 disponibili,
4
per ciascuna scelta abbiamo 3 modi di scegliere i semi delle carte che compongono il tris
4
Ω2 è l’insieme delle combinazioni di classe n di {1, . . . , M }, cfr. Appendice B.
1.5. PROBABILITÀ CONDIZIONATA ED INDIPENDENZA 15
(Es. ♥, ♦ e ♣): in totale abbiamo 8 × 43 modi di scegliere il tris. Ora dobbiamo prendere
le rimanenti 2 carte. I valori di queste carte devono necessariamente essere differenti tra
di loro (altrimenti avremmo un “full”) e differenti dal valore precedentemente scelto per il
7
tris (altrimenti avremmo un “poker”), abbiamo quindi 2 modi di scegliere i valori delle
rimanenti 2 carte5 . Rimangono da decidere i semi delle 2 carte: per ciascuna carta abbiamo
4 semi possibili. In definitiva |A| = 8 × 43 × 72 × 4 × 4 e la probabilità del tris servito è
8 × 43 × 72 × 4 × 4 48
32
= ' 0.0534 ' 5.3%
5
899
Campionamento con reimmissione Estraiamo ora una pallina dalla solita urna, regi-
striamo il numero della pallina e prima di procedere alla successiva estrazione rimettiamo
la pallina nell’urna. Quindi ripetiamo n volte le estrazioni secondo questo schema (cam-
pionamento con reimmissione o con rimpiazzo). In questo caso n può essere un numero
naturale qualunque. Possiamo scegliere il seguente spazio campionario:
Ω3 := {(a1 , . . . , an ) : ai = 1, . . . , M}
Cioè lo spazio campionario è l’insieme di tutte le disposizioni con ripetizione di M elementi
di ordine n e |Ω3 | = M n . Infine, assegniamo a ogni ω uguale probabilità: P ({ω}) = 1/M n .
Esempio 1.4.9 Quanto vale la probabilità che ciascuna delle n palline estratte sia diversa
dalle altre. Detto A tale evento, è evidente che se n > M allora P (A) = 0. Invece, se
n ≤ M vale quanto segue:
|A| M(M − 1) · · · (M − n + 1) M!
P (A) = n
= n
=
M M (M − n)!M n
Esempio 1.5.1 (segue Esempio 1.4.6) Supponiamo vengano lanciati due dadi e sup-
poniamo che ci venga chiesto di calcolare la probabilità che la somma dei due dadi sia 12.
Per l’Esempio 1.4.6 risponderemmo 1/36. Rispondiamo ora alla stessa domanda ma sapen-
do che sul primo dado è uscito un 6. Questa ulteriore informazione cambia radicalmente
le nostre valutazioni. Infatti, se sappiamo che sul primo dado è uscito un 6, la probabilità
che la somma dei due dadi faccia 12 è uguale alla probabilità che sia uscito un 6 anche
sull’altro dado, cioè 1/6.
5
7 sono i valori disponibili e ne scegliamo 2 senza ripetizione e senza tenere conto dell’ordine
16 CAPITOLO 1. PROBABILITÀ
Questo esempio mostra la necessità di dare una definizione per situazioni in cui si vuole
calcolare le probabilità di un evento E sapendo che si è verificato un altro evento F . La
definizione che segue va in questa direzione.
Esercizio 1.5.4 Quanto vale la probabilità che la somma delle facce di due dadi regolari
sia 12, se si è verificato che su uno dei due dadi è uscito 6?
Soluzione Siano E=“la somma dei due dadi è 12” e G=“su uno dei due dadi esce 6”
. Se calcoliamo la probabilità condizionata che si verifichi E sapendo che si è verificato
G usando la nozione intuitiva di probabilità condizionata, sbagliamo. Infatti, la nozione
intuitiva di probabilità condizionata ci porta a ripetere erroneamente un ragionamento
analogo a prima (se sappiamo che su un dado è uscito un 6, la probabilità che la somma
dei due dadi faccia 12 è uguale alla probabilità che sia uscito un 6 anche sull’altro dado)
cosı̀ ottenendo per P (E|G) il valore 1/6. Ma questo ragionamento è falso: applicando la
formula per il calcolo della probabilità condizionata otteniamo
P (E ∩ G) P ({(6, 6)}) 1/36 1 1
P (E|G) = = = = <
P (G) P ({(1, 6), (2, 6), . . . , (6, 6), (6, 5), . . . , (6, 1)}) 11/36 11 6
Esercizio 1.5.6 Sia (Ω, F , P ) uno spazio di probabilità e sia F ∈ F un evento tale che
P (F ) > 0. Poniamo PF (E) := P (E|F ) per ogni E ∈ F .
2. verificare che PF (F ) = 1;
Nota 1.5.7 Dal punto 1. dell’esercizio precedente segue che PF = P (·|F ) gode di tutte le
proprietà generali di cui godono S
le probabilità.
Ad esempio: se E1 , E2 , . . . , En ∈ F , con
P
n n
Eh ∩ Ek = ∅ ∀h 6= k, allora P k=1 Ek F = k=1 P (Ek |F ), oppure: se E ∈ F allora
c
P (E |F ) = 1 − P (E|F ).
Esempio 1.5.8 Ci sono due urne dette “urna A” ed “urna B”. La prima contiene 1000
biglie bianche ed 1 nera mentre la seconda ne contiene 2 nere. Si lancia una moneta equa
e se viene testa si pesca una biglia dall’urna A mentre se viene croce si pesca una biglia
dall’urna B. Qual è la probabilità che la biglia pescata sia nera?
Un errore tipico in queste situazioni è di pensare che la probabilità di pescare una
biglia nera, seguendo la procedura sopra descritta, sia la stessa che pescare una biglia nera
da un’urna C in cui siano stati spostati i contenuti delle urne A e B, cioè che contiene
1000 biglie bianche e 3 biglie nere. Questo è evidentemente un errore grossolano, infatti la
probabilità di pescare una biglia nera dall’urna C è di 3/1003 cioè prossima a 0, mentre
la probabilità di pescare una biglia nera seguendo la procedura di cui sopra è maggiore di
1/2, in quanto è maggiore della probabilità di ottenere croce su una moneta equa (se si
ottiene croce allora si sceglie l’urna B e quindi necessariamente si estrae una biglia nera).
La formula delle probabilità totali fornisce la risposta su come gestire situazioni di questo
genere.
Esempio 1.5.10 Riprendiamo l’Esempio 1.5.8. In questo caso poniamo F1 “esce testa”,
F2 := F1c “esce croce”, E “viene pescata una biglia nera”. F1 ed F2 costituiscono ovvia-
mente una partizione di Ω. Inoltre si ha P (F1 ) = P (F2 ) = 1/2, P (E|F1 ) = 1/1001 mentre
P (E|F2 ) = 1. Dalla formula delle probabilità totali deriva che
1 1 1
P (E) = P (E|F1 )P (F1) + P (E|F2)P (F2 ) = × + 1 × ' 0.5
1001 2 2
Nota 1.5.11 Si noti che nell’esempio precedente non abbiamo detto nulla sullo spazio
di probabilità (Ω, F , P ) in cui tutto avviene, abbiamo solamente assunto che tale spazio
esista. Inoltre per calcolare le probabilità condizionate non abbiamo utilizzato la Defini-
zione 1.5.2, che si sarebbe rivelata inutile senza una conoscenza esplicita di (Ω, F , P ), ma
abbiamo utilizzato il significato euristico di probabilità condizionata, cioè la “probabilità
che venga presa una biglia nera sapendo da quale urna si sta pescando”. Questo modo di
procedere, tralasciando i dettagli formali e utilizzando nozioni intuitive, è tipico del cal-
colo delle probabilità e verrà utilizzato ancora in seguito. Lasciamo al lettore più pignolo
il compito di verificare che effettivamente esiste uno spazio (Ω, F , P ) in cui è possibile
immergere rigorosamente la nostra discussione.
Esercizio 1.5.12 Dimostrare la formula delle probabilità totali per una partizione nume-
rabile F1 , F2 , . . . di eventi.
Formula di Bayes
Torniamo ancora all’Esempio 1.5.8. Supponiamo che qualcuno, non visto da noi, abbia
lanciato la moneta, abbia di conseguenza scelto l’urna ed ora ci mostri una biglia nera.
Se ci viene chiesto di scommettere se sia uscito testa o croce sulla moneta, dopo qualche
ragionamento quasi tutti scommetterebbero su croce. Infatti è assai improbabile che la
biglia che è stata pescata provenga dall’urna A, costituita quasi interamente da biglie
bianche. La formula di Bayes è utile in situazioni di questo tipo, in cui cioè ci viene data
un’informazione a posteriori su un evento aleatorio e ci viene chiesto in che modo si sia
realizzato tale evento.
1.5. PROBABILITÀ CONDIZIONATA ED INDIPENDENZA 19
Esempio 1.5.14 (Test clinici) 6 In un test clinico un individuo di una certa popolazione
viene sottoposto ad un’analisi di laboratorio (test) per sapere se ha o meno una certa
malattia. Il risultato del test può essere negativo, ad indicare che l’individuo è sano [rispetto
a quella malattia], oppure positivo, ad indicare che l’individuo è malato. Tuttavia tutti i
test utilizzati in pratica non sono completamente affidabili, nel senso che può accadere che
a sottoponendo un individuo sano al test, il test fornisce un risultato positivo (falso
positivo)
b sottoponendo un individuo malato al test, il test dà un risultato negativo (falso
negativo).
Ovviamente un test è “buono” se rende minime le probabilità di osservare falsi positivi o
negativi. Cosı̀, per valutare la bontà di un test, prima di applicarlo su larga scala, lo si ve-
rifica su individui di cui si conosce lo stato di salute. Supponiamo di sottoporre ad un test
clinico un individuo, e siano M l’evento “l’individuo è malato”, S l’evento “l’individuo è
sano”, I l’evento “il test è positivo” e O l’evento “il test è negativo”. Le grandezze P (I|M)
e P (O|S) sono note nella letteratura epidemiologica rispettivamente come sensibilità e spe-
cificità del test e possono essere calcolate, o meglio stimate, utilizzando il test su individui
dei quali si conosce lo stato di salute. In un buon test queste grandezze devono essere
quanto più possibile prossime ad 1. Se il test viene utilizzato per capire se un individuo è
malato o meno la grandezza che interessa è P (M|I) detta valore predittivo del test. Per la
formula di Bayes si ha che:
P (I|M)P (M) P (I|M)P (M)
P (M|I) = =
P (I|M)P (M) + P (I|S)P (S) P (I|M)P (M) + [1 − P (O|S)][1 − P (M)]
quindi per conoscere il valore predittivo del test non basta conoscere la specificità e la
sensibilità del test ma bisogna conoscere anche P (M). In definitiva bisogna avere informa-
zioni a priori sulla frequenza relativa della malattia nella popolazione. Si noti inoltre che
6
Si veda [3]
20 CAPITOLO 1. PROBABILITÀ
se P (M) → 0, anche P (M|I) è piccolo, cosicchè il test usato su una popolazione sana dà
quasi sempre falsi positivi. Tanto per fare un esempio pratico consideriamo la metodica
“ELISA” per la rilevazione degli anticorpi relativi al retrovirus HIV. Nel ’95 si stimava che
gli individui che avevano sviluppato anticorpi relativi all’HIV in Italia fossero lo 0.0025%
della popolazione totale. La sensibilità del test è 0.993 mentre la sua specificità è 0.9999.
Ne segue che il valore predittivo del test è dato da:
0.993 × 0.000025
P (M|I) = ' 0.2 = 20%
0.993 × 0.000025 + (1 − 0.9999) × (1 − 0.000025)
questo significa che se si effettuasse il test ELISA per l’HIV “a tappeto” su tutta la po-
polazione italiana l’80% circa dei positivi sarebbero falsi positivi! Per ovviare a questo
inconveniente nella pratica si restringe la popolazione da esaminare alla cosiddetta “popo-
lazione a rischio”, elevando in questo modo P (M), e si consiglia a chi è risultato positivo
alla metodica ELISA di sottoporsi ad un altro test, più costoso, ma anche più accurato.
Regola di moltiplicazione
Consideriamo ora l’esperimento di estrarre in sequenza e senza rimpiazzo delle biglie da
un’urna che inizialmente ne contiene r rosse e b bianche. Per calcolare la probabilità che la
prima biglia estratta sia rossa e la seconda bianca possiamo procedere come segue. Siano
Bk l’evento “la k-esima biglia estratta è bianca” ed Rk l’evento “la k-esima biglia estratta
è rossa”. La probabilità richiesta è
r b
P (R1 ∩ B2 ) = P (B2|R1 )P (R1 ) = ·
r+b r+b−1
Vogliamo ora calcolare la probabilità che la prima biglia estratta sia rossa, la seconda
bianca, la terza rossa e la quarta ancora bianca, cioè P (R1 ∩ B2 ∩ R3 ∩ B4 ). Come possiamo
estendere a questo caso il ragionamento precedente? In casi come questo risulta utile la
seguente formula.
P (E1 ∩ E2 ∩ · · · ∩ En ) =
P (E1 ∩ E2 ) P (E1 ∩ E2 ∩ E3 ) P (E1 ∩ E2 ∩ · · · ∩ En )
= P (E1 ) · · ····· =
P (E1 ) P (E1 ∩ E2 ) P (E1 ∩ E2 ∩ · · · ∩ En−1 )
= P (E1 )P (E2 |E1 )P (E3 |E1 ∩ E2 ) · · · · · P (En |E1 ∩ E2 ∩ · · · ∩ En−1 )
1.5.2 Indipendenza
L’indipendenza di eventi gioca un ruolo fondamentale nel calcolo delle probabilità. In-
tuitivamente due eventi sono indipendenti se il realizzarsi di uno dei due non influenza il
verificarsi dell’altro. Analogamente un numero finito e qualunque di eventi sono indipen-
denti se il realizzarsi di un numero finito di essi non influenza il verificarsi dei rimanenti.
Diamo ora le definizioni rigorose che si usano per formalizzare questi concetti.
Definizione 1.5.18 Sia (Ω, F , P ) uno spazio di probabilità. Gli eventi E, F ∈ F sono
indipendenti se
P (E ∩ F ) = P (E)P (F )
Si noti che se E ed F sono eventi indipendenti tali che P (E), P (F ) > 0 allora P (E|F ) =
P (E) e P (F |E) = P (F ), in accordo con l’idea intuitiva di indipendenza e probabilità
condizionata.
Esercizio* 1.5.22 Verificare che sono 2n − n − 1 le relazioni del tipo (1.5.3) necessarie e
sufficienti per l’indipendenza di n eventi E1 , E2 , . . . , En .
Nota 1.5.23 Si noti che la Definizione 1.5.19 cattura il senso intuitivo di indipenden-
za secondo quanto detto all’inizio della sezione. Infatti se E1 , E2 , . . . , En sono eventi
indipendenti si ha ad esempio
per ogni sottoinsieme {h1 , h2 , . . . , hk } ⊂ {1, 2, . . . , n} tale che 1 6∈ {h1 , h2 , . . . , hk } e P (Ehj ) >
0 per ogni j = 1, . . . , k: cioè il realizzarsi di qualsivoglia scelta di eventi tra E2 , . . . , En non
influenza il realizzarsi di E1 . Un discorso analogo si può fare sostituendo E2 ad E1 etc.
P (E1 |Eh11 ∩ Eh12 ∩ · · · ∩ Eh1k ) = P (E1 ) per ogni {h11 , h12 , . . . , h1k } ⊂ {1, 2, . . . , n} \ {1}
P (E2 |Eh21 ∩ Eh22 ∩ · · · ∩ Eh2k ) = P (E2 ) per ogni {h21 , h22 , . . . , h2k } ⊂ {1, 2, . . . , n} \ {2}
...
P (En |Ehn1 ∩ Ehn2 ∩ · · · ∩ Ehnk ) = P (En ) per ogni {hn1 , hn2 , . . . , hnk } ⊂ {1, 2, . . . , n} \ {n}
Nota 1.5.25 La Definizione 1.5.19 va letta e compresa con attenzione. Un errore tipico
consiste nel non capirne il significato, tentando quindi di ricostruirla mnemonicamente a
partire dal suo caso particolare e più facile da ricordare dato nella Definizione 1.5.18. In
questo modo si arriva spesso al seguente errore: “gli eventi E1 , E2 , . . . , En sono indipendenti
se P (E1 ∩ E2 ∩ · · · ∩ En ) = P (E1 )P (E2) · · · · · P (En )” oppure “gli eventi E1 , E2 , . . . , En sono
indipendenti se P (Eh ∩ Ek ) = P (Eh )P (Ek ) per ogni h 6= k”. Un altro errore tipico, in un
certo senso più grave dei precedenti, è il seguente: “due eventi E ed F sono indipendenti
se E ∩ F = ∅.
Esercizio 1.5.26 Provare che se E ed F sono due eventi non impossibili, cioè tali che
P (E) > 0 e P (F ) > 0, e se E ∩ F = ∅, allora E ed F non sono indipendenti.
La nozione di indipendenza si estende naturalmente a successioni di eventi nel modo
seguente:
Definizione 1.5.27 Sia (Ω, F , P ) uno spazio di probabilità. Si dice che gli eventi E1 , E2 , . . .
sono indipendenti se preso comunque un sottoinsieme finito di eventi della successione esso
è costituito da eventi indipendenti.
Cioè una successione di eventi è costituita da eventi indipendenti se preso comunque un
sottoinsieme finito di eventi della successione esso è costituito da eventi indipendenti.
1.5. PROBABILITÀ CONDIZIONATA ED INDIPENDENZA 23
Esercizio 1.5.28 Sia (Ω, F , P ) uno spazio di probabilità, mostrare che gli eventi ∅, Ω
sono indipendenti da qualsiasi evento o famiglia o successione di eventi in F . Qual è il
significato euristico di questa proprietà?
Esercizio 1.5.29 Sia (Ω, F , P ) uno spazio di probabilità, mostrare che se E, F ∈ F sono
eventi indipendenti, allora lo sono anche E ed F c , E c ed F , E c ed F c . Quale è il significato
euristico di questa proprietà?
Abbiamo già messo in evidenza che, se F ∈ F con P (F ) > 0, allora la funzione
PF (·) = P (· | F ) è una probabilità su (Ω, F ). Possiamo quindi considerare la nozione di
indipendenza rispetto a questa probabilità.
Nota 1.5.31 Attenzione! L’indipendenza di due eventi non implica la loro indipendenza
condizionatamente ad un terzo evento come mostra il seguente semplice esempio.
Esempio 1.5.32 Si lanciano due dadi regolari. Sia A l’evento: “il punteggio dei due
dadi è uguale”, B l’evento: “il punteggio del secondo dado è 2” e C l’evento: “il punteg-
gio del primo dado è pari”. Mostriamo che gli eventi A e B sono indipendenti ma non
condizionatamente indipendenti, dato C. Lo spazio campionario relativo all’esperimento
“lancio di due dadi è quello introdotto nell’Esempio 1.2.5 e gli eventi i A, B e C corri-
spondono ai sottoinsiemi di Ω, A = {(i, i) : i = 1, . . . , 6}, B = {(i, 2) : i = 1, . . . , 6},
C = {(2i, j) : i = 1, . . . , 3 j = 1, . . . , 6} e A∩B = {(2, 2)}. Quindi P (A) = |A|/|Ω| = 1/6,
P (B) = |B|/|Ω| = 1/6 e P (A ∩ B) = |A ∩ B|/|Ω| = 1/36. Poichè P (A)P (B) = 1/36 =
P (A ∩ B), A e B sono indipendenti. Se invece calcoliamo le probabilità degli stessi even-
ti, ma condizionatamente all’evento C, otteniamo P (A|C) = |A ∩ C|/|C| = 3/18 = 1/6,
P (B|C) = |B ∩ C|/|C| = 3/18 = 1/6 e P (A ∩ B|C) = |A ∩ B ∩ C|/|C| = 1/18 6= 1/36 =
P (A|C)P (B|C).
Esercizio 1.5.34 Un tribunale sta investigando sulla possibilità che sia accaduto un even-
to E molto raro e a tal fine interroga due testimoni, Arturo e Bianca. L’affidabilità dei due
testimoni è nota alla corte: Arturo dice la verità con probabilità α e Bianca con probabi-
lità β, e i loro comportamenti sono indipendenti. Siano A e B gli eventi Arturo e Bianca
rispettivamente affermano che E è accaduto, e sia p = P (E). Qual è la probabilità che E
sia accaduto sapendo che Arturo e Bianca hanno dichiarato che E è accaduto? Assumendo
α = β = 0.9 e p = 10−3 , quale conclusione ne traete?
24 CAPITOLO 1. PROBABILITÀ
allora
Y Y
P ({ω}) = P (Eh ) P (Ekc )
h tali che ah =1 k tali che ak =0
7
Supponiamo ad esempio n = 4 ed ω = (1, 0, 0, 1), il corrispondente evento è allora: “successo al-
la prima prova, fallimento alla seconda e terza prova, successo alla quarta prova”, che è l’intersezione
E1 ∩ E2c ∩ E3c ∩ E4 .
1.5. PROBABILITÀ CONDIZIONATA ED INDIPENDENZA 25
[per l’indipendenza di E1 , E2 , . . . , En ]
Y Y Pn Pn
ai
= p (1 − p) = p i=1 (1 − p)n− i=1 ai
,
h tali che ah =1 k tali che ak =0
Quindi per ogni ω ∈ Ω, P ({ω}) è determinata una volta che sia noto il numero di cifre uguali
ad 1 di ω, cioè il numero di successi ottenuti nelle n prove; cioè, P ({ω}) = pk (1 − p)n−k se
il numero di successi è k e p è la probabilità di ottenere un successo in una singola prova.
Risulta cosı̀ giustificata la seguente definizione
allora X X
P (Bk ) = P ({ω}) = pk (1 − p)n−k = |Bk |pk (1 − p)n−k
ω∈Bk ω∈Bk
n
ma |Bk | = k , infatti per elencare tutte le stringhe lunghe n in cui k cifre sono uguali ad
1 ed n − k sono uguali a 0, basta fissare i k posti degli 1 e questo può essere fatto in nk
modi.
26 CAPITOLO 1. PROBABILITÀ
Nota 1.5.37 Si noti che gli eventi Bk , k = 0, 1, . . . n, che fissano il numero di successi in n
prove di Bernoulli, hanno probabilità che corrispondono ai valori pk del modello binomiale
(vedi Esempio 1.4.3). Quindi uno spazio di probabilità di Bernoulli induce sullo spazio
campionario Ωe = {0, 1, . . . , n} dell’esperimento che considera il numero dei successi nelle
n prove, un modello binomiale di parametri n e p.
Capitolo 2
Variabili aleatorie
27
28 CAPITOLO 2. VARIABILI ALEATORIE
Esempio 2.1.1 Viene lanciata tre volte una moneta non truccata e sia X il numero di teste
che si presentano. Chiaramente X è un numero casuale che può assumere i valori 0, 1, 2, 3.
L’esperimento che stiamo considerando rappresenta tre prove di Bernoulli con probabilità
di successo in ogni singola prova pari ad 1/2. Il modello probabilistico adeguato è quindi
lo spazio di Bernoulli (Ω, F , P ), dove Ω = {(a1 , a2 , a3 ) : ai = 0, 1 i = 1, 2, 3} con ai = 1 se
all’i-esimo lancio esce testa e 0 altrimenti, F = P(Ω) e P (E) = |E|/|Ω|. Questo spazio,
fatta eccezione per la diversa rappresentazione degli eventi elementari, coincide con quello
dell’Esempio 1.2.19. Ora possiamo pensare alla variabile aleatoria X come ad una regola
che ad ogni (a1 , a2 , a3 ) ∈ Ω associa il numero di teste che sono uscite se accade l’evento
elementare rappresentato da (a1 , a2 , a3 ). Questo numero verrà denotato con X((a1 , a2 , a3 ))
e vale X((a1 , a2 , a3 )) = a1 + a2 + a3 . Notiamo come in questo caso possiamo calcolare la
probabilità che X assuma un certo valore. Ad esempio
Definizione 2.1.2 (Variabile aleatoria) Sia (Ω, F , P ) uno spazio di probabilità. Una
variabile aleatoria X è una funzione da Ω in R tale che per ogni x ∈ R, l’insieme {X ≤
x} := {ω ∈ Ω : X(ω) ≤ x} ∈ F .
Esempio 2.1.4 (Segue Esempio 1.2.4) Torniamo all’Esempio 1.2.4 del tempo di vita
di un componente elettronico. Ricordiamo che Ω := R+ dove il punto t ∈ R+ significa
che il componente si è guastato all’istante t. Un esempio di scelta per la probabilità P è
P ((s, t]) = e−µs − e−µt , se 0 ≤ s ≤ t, dove µ > 0 è un parametro che dipende dal modello.
Vedremo in seguito che questa scelta modellizza il guasto accidentale di un componente
monitorato nel tempo continuo e non soggetto ad usura. L’istante di guasto T è una
funzione T : Ω → R definita come la funzione identità cioè T (ω) := ω per ogni ω ∈ Ω.
Allora, se 0 ≤ s < t abbiamo che
{ω ∈ Ω : s < T (ω) ≤ t} = {ω ∈ Ω : s < ω ≤ t} = (s, t]
da cui
P (s < T ≤ t) = P ((s, t]) = e−µs − e−µt se 0 ≤ s ≤ t
Si noti che “fraudolentemente” non abbiamo detto chi è F in questo caso. Il motivo non
è una semplice dimenticanza, il problema è che in questo caso F è un oggetto piuttosto
complicato. Ci accontenteremo di dire che è possibile costruire F in modo che contenga
tutti gli intervalli di R+ (compreso lo stesso R+ ), i loro complementari e le loro unioni.
Se (Ω, F , P ) è uno spazio di probabilità ed X una variabile aleatoria su questo spazio,
allora, per definizione, {X ≤ x} ∈ F per ogni x ∈ R. A partire da questa richiesta, si
ottiene la seguente proposizione.
Proposizione 2.1.5 Se X è una variabile aleatoria allora {X < x}, {X ≥ x}, {X >
x}, {x < X < y}, {x ≤ X < y}, {x < X ≤ y}, {x ≤ X ≤ y}, {X = x}, {X 6= x} sono
eventi (cioè sottoinsiemi di Ω che appartengono a F ).
Esercizio* 2.1.6 Si dimostri la Proposizione 2.1.5
Aiuto Si usi nella dimostrazione il fatto che F è una σ-algebra (quindi valgono le proprietà
della Definizione 1.2.12). Per cominciare, si osservi che
+∞
[
{X < x} = {ω ∈ Ω : X(ω) < x} = {ω ∈ Ω : X(ω) ≤ x − 1/n}
n=1
Se invece x, y ∈ R con x < y, dal punto 3. della Proposizione 1.3.1 deriva che
Esempio 2.1.8 (Segue Esempio 2.1.1) Sia X la variabile aleatoria che indica il numero
di teste ottenute in un lancio di tre monete non truccate dell’Esempio 2.1.1. Calcoliamo
e rappresentiamo graficamente FX (x) = P (X ≤ x). Innanzi tutto notiamo che X assume
solo i valori 0, 1, 2 e 3. Quindi se x < 0 allora FX (x) = P (X ≤ x) = 0. Se x = 0
abbiamo che FX (0) = P (X = 0) = P ({(0, 0, 0)}) = 1/8, mentre se 0 < x < 1 abbiamo
che FX (x) = P (X ≤ x) = P (X ≤ 0) = 1/8, perché la variabile aleatoria X è più piccola
o uguale ad un numero in (0, 1) se e solo se è più piccola o uguale a 0. Se x = 1 abbiamo
che FX (1) = P (X ≤ 1) = P (X = 0) + P (X = 1) = (1/8) + (3/8) = 1/2, mentre se
1 < x < 2 abbiamo che FX (x) = P (X ≤ x) = P (X ≤ 1) = 1/2. Analogamente, otteniamo
FX (x) = 7/8 se 2 ≤ x < 3. Infine, se x ≥ 3 allora FX (x) = P (X ≤ x) = 1 semplicemente
perché certamente X ≤ 3. In definitiva:
0 se x < 0
1
8 se 0 ≤ x < 1
FX (x) = 12 se 1 ≤ x < 2
7
se 2 ≤ x < 3
8
1 se x ≥ 3
Esempio 2.1.9 (Segue Esempio 2.1.4) Sia T la variabile aleatoria che indica il tempo
di rottura di un certo componente elettronico che abbiamo visto nell’Esempio 2.1.4. Allora
FT (t) = P (T ≤ t) = 0 se t < 0 mentre FT (t) = 1 − e−µt se t ≥ 0. In definitiva
(
0 se t < 0
FT (t) = −µt
1−e se t ≥ 0
(a) (b)
1.0
1.0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0.0
0.0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 0 2 4 6 8 10
Figura 2.1: (a) f.d.r. FX dell’Esempio 2.1.8, (b) f.d.r. FT dell’Esempio 2.1.9
Proposizione 2.1.10 Sia X una variabile aleatoria definita su di uno spazio di probabilità
(Ω, F , P ) e sia FX (x) = P (X ≤ x) la sua funzione di ripartizione. Allora
Nota* 2.1.11 Le proprietà 1., 2. e 3. della Proposizione 2.1.10 sono importanti perché
si può dimostrare (cosa che noi non faremo) che data una funzione F che le soddisfa,
è possibile costruire uno spazio di probabilità (Ω, F , P ) e una variabile aleatoria X su
(Ω, F , P ) che ha F come funzione di ripartizione. (Vedere Esempio 2.1.9). Potremo quindi
parlare di “variabile aleatoria X con funzione di ripartizione F ” senza dover esplicitamente
costruire lo spazio di probabilità dove X è definita.
La precedente osservazione giustifica la seguente
Esercizio 2.1.13 Sia X una variabile aleatoria definita su di uno spazio di probabilità
(Ω, F , P ) e sia FX la sua funzione di ripartizione. Mostrare che:
Per quanto riguarda la teoria, le variabili aleatorie possono essere classificate a seconda
di alcune proprietà delle loro funzioni di ripartizione. In generale la classificazione com-
pleta è piuttosto complessa e richiede strumenti matematici sofisticati. Noi introdurremo
solamente le due classi di variabili aleatorie più importanti per le applicazioni a questo
livello elementare, cioè le variabili aleatorie discrete e quelle assolutamente continue.
Esempi di variabili aleatorie discrete sono: il numero di volte che bisogna lanciare una
moneta prima di ottenere testa, il numero di successi in una sequenza di prove di Bernoulli,
il numero di teste che si ottengono lanciando tre monete (cfr. Esempio 2.1.1). Per una
variabile discreta è possibile definire una densità discreta nel modo seguente:
Definizione 2.2.2 Sia X una variabile aleatoria discreta su uno spazio di probabilità
(Ω, F , P ). Allora la funzione pX (x) := P (X = x) si chiama densità discreta della variabile
aleatoria X.
Si noti che, se pX è la densità di una variabile aleatoria discreta X, allora pX (x) = 0 tranne
che per una quantità al più numerabile di x ∈ R.
Esempio 2.2.3 (Segue Esempio 2.1.1) Sia X il numero di teste che si ottengono lan-
ciando tre volte una moneta equa. Sappiamo quindi che X può assumere solo i valori 0, 1, 2
e 3. Inoltre P (X = 0) = P ({(0, 0, 0)} = 1/8, P (X = 1) = P ({(1, 0, 0), (0, 1, 0), (0, 0, 1)}) =
2.2. VARIABILI ALEATORIE DISCRETE 33
3/8, P (X = 2) = P ({(1, 1, 0), (1, 0, 1), (0, 1, 1)}) = 3/8 e P (X = 3) = P ({(1, 1, 1)}) = 1/8.
Quindi
1
8 se x ∈ {0, 3}
pX (x) = P (X = x) = 83 se x ∈ {1, 2}
0 se x ∈/ {0, 1, 2, 3}
Per rappresentare graficamente l’andamento di questa densità usiamo un diagramma a
barre. Un diagramma a barre è costruito disegnando in corrispondenza di ogni valore xk in
S una barra perpendicolare all’asse delle ascisse di lunghezza uguale alla densità pX (xk ),
come in Figura 2.2. 0.375
0.125
Proposizione 2.2.4 Sia pX la densità di una variabile aleatoria discreta X che assume,
con probabilità uno, valori in S = {xk : k ∈ I} (I ⊂ Z). Allora
1. 0 ≤ pX (x) ≤ 1 per ogni x ∈ R e pX (x) = 0 per ogni x 6∈ S;
P
2. k∈I pX (xk ) = 1;
4. Se i punti di S possono essere numerati in modo tale che xh < xk se h < k, allora
pX (xk ) = FX (xk ) − FX (xk−1 ), ∀k ∈ I;
5. se B ⊂ R allora X
P (X ∈ B) = pX (xk )
k: xk ∈B
34 CAPITOLO 2. VARIABILI ALEATORIE
Dimostrazione
4. Ricordiamo che dal punto 2. dell’Esercizio 2.1.13 segue che FX (xk ) − FX (xk−1 ) =
P (xk−1 < X ≤ xk ). Ma, se i punti di S sono numerati in modo tale che xh < xk se
h < k allora P (xk−1 < X ≤ xk ) = P (X = xk ), da cui: FX (xk ) − FX (xk−1 ) = P (X =
xk ) = pX (xk ).
5. Poiché P (X ∈ S) = 1, allora
!
[ X
P (X ∈ B) = P (X ∈ B ∩ S) = P {X = xk } = P (X = xk ) =
k: xk ∈B∩S k: xk ∈capS
X
= p(xk )
k: xk ∈B
I punti 3. e 4. della precedente proposizione mostrano come sia possibile ottenere dalla
densità di una variabile aleatoria discreta la sua funzione di ripartizione e viceversa. In
particolare ci dicono che se i punti di S possono essere numerati in modo tale che xh < xk
se h < k, allora la funzione di ripartizione di una variabile aleatoria discreta è una funzione
“a gradini”, che i gradini sono situati nei punti dell’insieme S e che l’altezza del gradino
corrispondente al punto xk ∈ S è proprio pX (xk ).
Esercizio 2.2.5 Capire il significato della Proposizione 2.2.4 verificandola per la variabile
aleatoria dell’Esempio 2.1.1.
Il punto 5. della Proposizione 2.2.4 ci fa capire a cosa serve la densità discreta: ci permette
di calcolare la probabilità che l’evento {X ∈ B} si verifichi effettuando una semplice
operazione algebrica e senza sapere altro sulla variabile aleatoria X.
2.2. VARIABILI ALEATORIE DISCRETE 35
Nota* 2.2.6 In realtà, nel seguito considereremo solamente variabili aleatorie discrete
che assumono, con probabilità uno, valori in un insieme S che può essere rappresentato nel
seguente modo: S = {xk : k ∈ I} con xh < xk se h < k e I ⊂ Z. Per esempio, questa
rappresentazione di S non è data se S è l’insieme Q dei numeri razionali, mentre vale se
S non ha punti di accumulazione. Se S ammette questa forma, sarà facile rappresentare
graficamente la densità (mediante un diagramma a barre) e la funzione di ripartizione.
Nota 2.2.7 Un punto che ci interessa evidenziare è la motivazione euristica della parola
“densità” utilizzata nel contesto delle variabili aleatorie discrete. Supponiamo che pX sia la
densità di una variabile aleatoria discreta X: questo significa che pX attribuisce un numero
pX (x) ≥ 0 ad ogni x ∈ R; in particolare questo numero sarà non nullo solo per una quantità
al più numerabile di punti S := {xk : k ∈ I} ⊂ R con I ⊂ Z. Un modo interessante di
visualizzare questa situazione è immaginare i punti di S come punti materiali su una retta
attribuendo al generico punto xk la massa mk := pX (xk ). In questo modo otteniamo una
distribuzione di masse discrete sulla retta e pX è proprio la densità di massa. Questa
osservazione sarà particolarmente utile in seguito.
Esempio 2.2.8 Consideriamo i lanci successivi di una moneta equilibrata fino a quando
non otteniamo testa. Sia X il numero di volte, inclusa l’ultima, che la moneta viene
lanciata. Calcoliamo P (X = k) per k ∈ N. A tal fine consideriamo per k = 1, 2, . . . gli
eventi Ek = “al k–esimo lancio otteniamo una testa” e osserviamo che questi eventi sono
indipendenti con P (Ek ) = 1/2 per k = 1, 2, . . . essendo la moneta lanciata equilibrata. Per
calcolare P (X = 1) osserviamo che X = 1 se e solo se al primo lancio otteniamo una testa,
da cui segue che P (X = 1) = P (E1 ) = 1/2. Per P (X = 2) osserviamo che X = 2 se e solo
se al primo lancio ottengo una croce ed al secondo lancio otteniamo una testa, quindi {X =
2} = E1c ∩ E2 , da cui P (X = 2) = P (E1c ∩ E2 ) = P (E1c )P (E2 ) = 1/4. Il ragionamento fatto
sopra per k = 2 si estende facilmente a ogni k ≥ 2 nel modo seguente: X = k se e solo se
abbiamo lanciato k volte la moneta ottenendo croce nei primi k −1 lanci e testa nel k–esimo
lancio. Pertanto, P (X = k) = P (E1c ∩· · ·∩Ek−1
c
∩Ek ) = P (E1c )·· · ··P (Ek−1
c
)P (Ek ) = 1/2k .
Inoltre,
+∞
X +∞
X 1
P (X ∈ N) = P (X = k) = =1
2k
k=1 k=1
Se vogliamo ora ad esempio calcolare la probabilità che siano necessari più di 3 lanci per
ottenere la prima testa basta utilizzare il punto 5. della Proposizione 2.2.4:
X +∞
X +∞ +∞
1 1 X 1 1 X 1 1
P (X > 3) = pX (k) = k
= 3 k−3
= 3 k
= 3
k>3 k=4
2 2 k=4 2 2 k=1 2 2
36 CAPITOLO 2. VARIABILI ALEATORIE
Nota* 2.2.9 Prima di vedere alcuni esempi importanti di densità discrete, torniamo un
momento ai punti 1. e 2. della Proposizione 2.2.4. Una domanda naturale è la seguente:
una funzione reale p(·), diversa da zero su un insieme al più numerabile S = {xk : k ∈ I}
(I ⊂ Z), che verifica le proprietà 1. e 2 della Proposizione 2.2.4, può essere sempre vista
come densità di una variabile aleatoria discreta? Più precisamente, è sempre possibile
costruire uno spazio di probabilità (Ω, F , P ) ed una variabile aleatoria X su di esso che
ha p(·) come densità, cioè tale che pX (x) = p(x)? La risposta è affermativa. Infatti basta
prendere Ω = S, F = P(S) e P l’unica misura di probabilità su S tale che P ({xk }) =
p(xk ) con k ∈ I, come mostrato nella Sezione 1.4. È immediato, quindi, verificare che la
variabile aleatoria discreta X(ω) = ω, per ogni ω ∈ Ω, ha densità p(·).
La precedente osservazione ci permetterà di parlare di variabili aleatorie assegnandone la
densità, senza costruire esplicitamente lo spazio di probabilità dove X è definita e giustifica
la seguente definizione.
0.25
1.0
0.20
0.8
0.15
0.6
0.10
0.4
0.05
0.2
0.00
0.0
0 2 4 6 8 10 0 2 4 6 8 10
fornisce il diagramma a barre della densità ed il grafico della funzione di ripartizione di una
variabile aleatoria X ∼ Bi(10, 0.5), mentre la Figura 2.4 mostra, mediante un diagramma
a barre, l’andamento delle densità Bi(10, 0.2) e Bi(10, 0.8).
Sia X ∼ Bi(n, p); se n = 1 questa variabile rappresenta il numero di successi in una sola
prova con probabilità di successo p, cioè X assume solo i valori 0 e 1, e la densità di X è
pX (k) = pk (1 − p)1−k se k ∈ {0, 1} e pX (k) = 0 se k 6∈ {0, 1}, cioè
1 − p se k = 0
pX (k) = p se k = 1
0 se k 6∈ {0, 1}
Esempio 2.3.1 Riempiendo a caso una schedina di totocalcio, qual è la probabilità di fare
almeno 12?
Su una schedina del totocalcio sono elencate 14 partite e ogni partita può avere tre
risultati “1”, “2” o “X”, ad indicare rispettivamente la vittoria della squadra ospitante,
della squadra ospite o la parità. La probabilità di azzeccare una singola partita, scrivendo
a caso uno dei simboli 1, 2 o X, è -almeno in prima approssimazione- uguale ad 1/3.
Inoltre l’aver azzeccato o meno il risultato di una certa partita non influenza la capacità di
azzeccare le altre. Possiamo quindi schematizzare il nostro esperimento aleatorio con una
38 CAPITOLO 2. VARIABILI ALEATORIE
(a) (b)
0.30
0.30
0.25
0.25
0.20
0.20
0.15
0.15
0.10
0.10
0.05
0.05
0.00
0.00
0 2 4 6 8 10 0 2 4 6 8 10
14
X 14 k 14−k
X 14 1 2 393
P (Y ≥ 12) = pY (k) = = ' 0.00008
k=12 k=12
k 3 3 4782969
Esercizio 2.3.2 Supponiamo che da un’urna contenente r biglie rosse e b biglie bianche
estraiamo a caso una biglia, prendiamo nota del suo colore e la reinseriamo nell’urna.
Quindi, ripetiamo questa procedura n ≥ 1 volte e sia X il numero di biglie rosse estratte
nelle n estrazioni. Verificare che X ∼ Bi(n, r/(r + b)).
P (X > 2) = qP (X > 1) = q 2
P (X > 3) = qP (X > 2) = q 3
..
.
P (X > k + 1) = qP (X > k) = q k+1
P (X = k) = p(1 − p)k−1 , k = 1, 2, . . .
Notiamo che
+∞
X +∞
X +∞
X 1
P (X ∈ N) = P (X = k) = p(1 − p)k−1 = p (1 − p)k = p =1
k=1 k=1 k=0
1 − (1 − p)
Questa densità prende il nome di densità geometrica di parametro p. Una variabile aleatoria
con questa densità è detta variabile geometrica di parametro p e si scrive X ∼ Geom(p).
Esempio 2.3.3 Supponiamo di eseguire una successione di prove di Bernoulli, con proba-
bilità di successo nella singola prova pari a p ∈ (0, 1). Sia X il numero di prove necessarie
per osservare il primo successo, inclusa l’ultima. Verificare che X ha densità geometrica di
parametro p.
possiamo pensare ad un grande numero n di utenti ognuno dei quali ha una probabilità
molto piccola p ∈ (0, 1) di chiamare il numero verde in questione per mettersi in contatto
con l’operatore. Se assumiamo che i singoli utenti si mettono in contatto con l’operatore
indipendentemente uno dall’altro otteniamo che X ∼ Bi(n, p), dove n è un numero molto
grande e p un numero molto piccolo. Se il numero verde è organizzato razionalmente il
numero delle linee è commisurato al bacino di utenza, in modo tale che vi sia un’alta
probabilità di trovare il numero verde libero. Una condizione perché ciò accada è che
λ := np sia un numero fissato e non eccessivamente grande. In questo caso possiamo
scrivere X ∼ Bi(n, λ/n), cioè
k n−k
n λ λ
P (X = k) = 1−
k n n
Per capire cosa succede a P (X = k) se n è grande osserviamo che
k n−k k n−k
n λ λ n! λ λ
1− = 1−
k n n (n − k)!k! n n
−k k n
n! λ λ λ
= 1− 1−
(n − k)!nk n k! n
ma
n!
lim =1
n→+∞ (n − k)!nk
che prende il nome di densità di Poisson di parametro λ. Una variabile aleatoria con questa
densità è detta variabile di Poisson di parametro λ e si scrive X ∼ P(λ).
Esercizio 2.3.4 Verificare che la densità di Poisson di parametro λ è una densità, cioè
che verifica la Definizione 2.2.10.
2.3. ESEMPI DI DENSITÀ DISCRETE NOTEVOLI 41
r(r + b − 1)(r + b − 2) · · · · · (r + b − n + 1) r
P (Ek ) = =
(r + b)(r + b − 1) · · · · · (r + b − n + 1) r+b
Dichiariamo ora di ottenere un “successo” quando viene estratta una biglia rossa e un
“fallimento” quando viene estratta una biglia bianca. In questo modo, analogamente a
quanto fatto per le prove di Bernoulli, possiamo pensare all’estrazione sequenziale dall’urna
come ad una successione di prove, in cui la probabilità di ottenere un successo nella k-esima
prova è p = r/(r + b). La differenza sostanziale tra queste prove e quelle di Bernoulli è che
questa volta le prove non sono indipendenti. Infatti la probabilità di ottenere un successo
alla seconda prova se abbiamo ottenuto un successo alla prima è differente dalla probabilità
2.3. ESEMPI DI DENSITÀ DISCRETE NOTEVOLI 43
di ottenere un successo alla seconda prova se non abbiamo ottenuto un successo alla prima.
Questo perché nel primo caso stiamo estraendo da un’urna contenente r + b − 1 biglie di cui
r − 1 rosse e b bianche, mentre nel secondo caso stiamo estraendo da un’urna contenente
r + b − 1 biglie di cui r rosse e b − 1 bianche. Comunque, la dipendenza tra prove si attenua
se il numero delle biglie presenti nell’urna r + b è grande. Infatti ad esempio:
se r + b tende opportunamente a +∞ (per esempio in modo tale che r/(r + b) → θ ∈ (0, 1)).
Quindi, se r + b è grande, allora P (E2 |E1 ) ' P (E2 ). In altri termini, se vi sono molte biglie
nell’urna, rimpiazzare o non rimpiazzare le biglie ad ogni successiva estrazione non modi-
fica in modo significativo il risultato. Quanto fin qui detto in parte spiega euristicamente
il fatto che per r + b grande, qualche volta, potremo approssimare la densità ipergeome-
trica Iperg(b + r, r, n) con la densità binomiale Bi(n, r/(r + b)). Un’esemplificazione di
questo fatto è in Figura 2.52 che rappresenta l’andamento della densità ipergeometrica
all’aumentare di r + b rispetto alla densità Bi(10, r/(r + b)).
Esercizio* 2.3.10 C’è qualche legame fra la soluzione dell’Esercizio 2.3.2 e la scelta della
densità Bi(n, r/(r + b)) nell’approssimazione della legge ipergeometrica di parametri (b +
r, r, n)?
0.4
Bi(10,0.75)
Ipg(40,30,10)
Ipg(20,15,10)
0.3
0.2
0.1
0
0 2 4 6 8 10
2
In Figura 2.5 gli 11 valori (isolati) in ordinata delle densità sono stati congiunti mediante spezzate
44 CAPITOLO 2. VARIABILI ALEATORIE
Nota 2.3.12 Il lettore avrà già rilevato che le densità delle variabili aleatorie sopra pre-
sentate coincidono con alcuni degli esempi di modelli di probabilità su spazi finiti o nume-
rabili presentate nell’Esempio 1.4.3 della Sezione 1.4. Quanto presentato in questa sezione
è quindi rivolto anche a mostrare in quali situazioni tali modelli probabilistici vengono
adottati.
P (X < x) = FX (x) ∀x ∈ R
Esempio 2.4.3 (Segue Esempio 2.1.4) Sia T la variabile aleatoria che rappresenta il
tempo di rottura dell’Esempio 2.1.4. Poiché avevamo visto nell’Esempio 2.1.9 che la
funzione di ripartizione di T è
(
0 se t < 0
FT (t) = −µt
1−e se t ≥ 0
Infatti si ha che
Z (
t
0 se t < 0
fT (s) ds = Rt −µs −µt
−∞ 0
µe ds = 1 − e se t ≥ 0
Per le variabili aleatorie assolutamente continue e le loro densità valgono proprietà analoghe
a quelle delle variabili aleatorie discrete elencate nella Proposizione 2.2.4:
2. se FX è la funzione di ripartizione di X allora fX (x) = FX0 (x) per tutti gli x ∈ R tali
che esiste FX0 (x);
Dimostrazione
1. Abbiamo che
Z x Z
1 = lim FX (x) = lim fX (s) ds = fX (s) ds
x→+∞ x→+∞ −∞ R
P (X ∈ (a, b]) = P ({X ∈ (a, b)}∪{X = b}) = P (X ∈ (a, b))+P (X = b) = P (X ∈ (a, b))
Il punto 2. della Proposizione 2.4.4 può essere rafforzato opportunamente nel modo
seguente:
Nota* 2.4.6 Si noti che la Proposizione 2.4.5 ci dice di calcolare fX (x) come FX0 (x) per
ogni x ∈ R eccetto un numero finito di punti B e di assegnarla in modo arbitrario sull’in-
sieme B. Infatti il valore di fX (x) se x ∈ B non è importante: possiamo definire fX (x)
come vogliamo oppure non definirla affatto. Infatti nella Definizione
Rx 2.4.12 abbiamo visto
che f è la densità di X assolutamente continua se FX (x) = −∞ f (s) ds. Ma se g è un’altra
funzione tale che g(x) = f (x) per ogni x ∈ R eccetto che in un numero finito di punti, è
chiaro che Z x Z x
FX (x) = f (s) ds = g(s) ds
−∞ −∞
quindi sia f che g sono densità di X! Questa non univocità può sorprendere in un pri-
mo momento, ma è assolutamente inoffensiva dal punto di vista delle applicazioni. Essa
può essere risolta matematicamente, cosa che noi non faremo, dando una definizione più
generale del concetto di funzione.
Il punto 3. della Proposizione 2.4.4 può essere opportunamente rafforzato nel seguente:
Corollario 2.4.7 Sia X una variabile aleatoria assolutamente continua con densità fX e
B ⊂ R tale che B = B1 ∪ B2 ∪ . . . dove i Bk , k = 1, 2, . . . sono intervalli disgiunti. Allora
Z +∞ Z
X
P (X ∈ B) = fX (x) dx = fX (x) dx
B k=1 Bk
Nota* 2.4.9 Al lettore più attento verrà naturale chiedersi se il Corollario 2.4.7 possa
essere generalizzato ad un insieme arbitrario B, se cioè è vero che
Z
P (X ∈ B) = fX (x) dx
B
per ogni B ⊂ R. La risposta a questa domanda è non banale3 e fuori dalla portata di
questo corso. D’altro canto, chi ci garantisce che per un insieme arbitrario B, {X ∈ B}
sia un evento?
3
Dipende dalla teoria degli insiemi che stiamo usando!
2.5. ESEMPI DI DENSITÀ CONTINUE NOTEVOLI 47
Nota 2.4.10 Come abbiamo fatto nella Nota 2.2.7 ci interessa evidenziare la motivazione
euristica della parola “densità”. Supponiamo che fX sia la densità di una variabile aleatoria
assolutamente continua X, questo significa che fX attribuisce un numero fX (x) ad ogni x ∈
R. Analogamente a quanto fatto per le variabili aleatorie discrete, possiamo immaginare
l’asse reale come un materiale inomogeneo, in cui la densità di massa è fX , cioè la massa
del segmento infinitesimo (x, x + dx) è fX (x)dx.
Nota* 2.4.11 Anche in questo caso, prima di vedere alcuni esempi importanti di densità
di variabili aleatorie assolutamente continue, torniamo al punto 1. della Proposizione 2.4.4.
Analogamente al caso discreto, data una funzione integrabile f (x) ≥ 0 che verifica la pro-
prietà 1. della Proposizione 2.4.4 è possibile costruire uno spazio di probabilità (Ω, F , P )
ed una variabile aleatoria X su di esso che ha f (x) come densità, cioè tale che fX (x) = f (x).
Questo, come già osservato per le variabili aleatorie discrete, ci permetterà di parlare di
variabili aleatorie assegnandone la densità.
La precedente osservazione giustifica la seguente definizione.
Possiamo ripetere il precedente ragionamento dividendo (0, 1] nei quattro intervalli (0, 1/4],
(1/4, 1/2], (1/2, 3/4], (3/4, 1] e affermare che la probabilità che X appartenga ad uno fissato
48 CAPITOLO 2. VARIABILI ALEATORIE
Pertanto fX = 1(0,1) o anche fX = 1(0,1] . Tale densità è detta densità uniforme con-
tinua sull’intervallo (0, 1], la variabile aleatoria X è detta uniforme su (0, 1] e si scrive
X ∼ U(0, 1).
e quindi P (T > t + s) = P (T > t)P (T > s). Se definiamo F̄ (t) := P (T > t), per ogni
t ≥ 0, abbiamo che
F̄ (t + s) = F̄ (t)F̄ (s) ∀ t, s > 0
Una funzione4 che verifica questa equazione funzionale è eαt , dove α ∈ R. Quindi P (T >
t) = eαt e P (T ≤ t) = 1 − eαt per t ≥ 0. Inoltre, poiché P (T ≤ t) ≤ 1, allora necessaria-
mente α ≤ 0 e, per evitare situazioni banali, α < 0. Quindi la funzione di ripartizione di
T è data da: (
0 se t < 0
FT (t) = −µt
1−e se t ≥ 0, µ>0
Sempre per la Proposizione 2.4.5 sappiamo che T è una variabile aleatoria assolutamente
continua e la sua densità si ottiene derivando la funzione di ripartizione:
(
0 se t < 0
FT0 (t) =
µe−µt se t > 0
Pertanto fT (t) = µe−µt 1[0,+∞) (t) è una densità per T . Questa densità è detta densità
esponenziale di parametro µ e la variabile aleatoria T è detta variabile esponenziale di
parametro µ. Si scrive anche T ∼ E(µ).
La Figura 2.6 mostra l’andamento di densità e funzione di ripartizione E(µ) al variare di
µ: al diminuire di µ aumenta la probabilità che la variabile aleatoria esponenziale assuma
valori grandi.
0.8
0.2
0
0 2 4 6 8 10
4
In realtà l’unica funzione continua.
50 CAPITOLO 2. VARIABILI ALEATORIE
Tale funzione fornisce i valori di probabilità legate ad una particolare variabile aleatoria
assolutamente continua detta gaussiana standard. La variabile gaussiana fornisce un utile
modello probabilistico per gli errori che si commettono per esempio nei procedimenti di
misurazione. Il ruolo fondamentale in probabilità della densità gaussiana standard sarà
più chiaro quando verrà presentato il “Teorema centrale del limite”. Per ora limitiamoci a
definirla e a descriverne qualche proprietà.
Definizione 2.5.1 Una variabile aleatoria assolutamente continua Z definita su uno spa-
zio di probabilità (Ω, F , P ) è detta avere densità gaussiana standard (e scriveremo Z ∼
N (0, 1)) se ha densità
1 2
ϕ(x) = √ e−x /2 ∀x∈R
2π
Esercizio* 2.5.2 Dimostrare che ϕ è una densità di probabilità continua, cioè soddisfa le
proprietà 1. e 2. della Definizione 2.4.12.
Trovate in Figura 2.7 (a) il grafico della funzione ϕ che ha andamento a campana con punto
(a) (b)
0.4
1.0
0.8
0.3
0.6
0.2
0.2
0.4
0.1
0.2
0.0
0.0
-3 -2 -1 0 1 2 3 -3 -1 0 1 3
Quindi la funzione erf fornisce la probabilità che una variabile aleatoria gaussiana standard
assuma valori in un intervallo simmetrico rispetto all’origine. Dal significato dell’operazione
di integrazione, segue che graficamente P (−z < Z < z) è rappresentata dall’area tra le
due linee tratteggiate in Figura 2.8.
-3 −z 0 z 3
La funzione di ripartizione di una variabile aleatoria N (0, 1) rappresentata in Figura 2.7 (b)
viene indica di solito con Φ(z):
Z z
1 2
Φ(z) = √ e−x /2 dx
2π −∞
Non è possibile calcolare Φ analiticamente, ma troverete Φ tabulata in quasi tutti i libri di
probabilità. Tipicamente sono tabulati i valori di Φ(z) per z ≥ 0. Se z < 0, Φ(z) si può
ottenere usando la seguente formula
In particolare, per z = 3,
Quindi
P
P1 − k≥c pX (k) se h = 0
pY (h) = k≥c pX (k) se h = 1
0 se h ∈
6 {0, 1}
cioè la densità di Y è calcolabile a partire dalla densità di X.
Esempio 2.6.2 Sia T la variabile aleatoria che denota la temperatura in una stanza clima-
tizzata. Se T < a l’impianto di condizionamento riscalda. Se T > b refrigera. Altrimenti,
si spegne. Quindi lo stato dell’impianto di condizionamento, in funzione della temperatura,
può essere descritto mediante una variabile aleatoria S che assume valore 1 se l’impianto
2.6. FUNZIONI DI VARIABILI ALEATORIE 53
In definitiva
Proposizione 2.6.3 Sia X una variabile aleatoria discreta, con densità pX (x) e P (X ∈
S) = 1, dove S = {xk : k ∈ I}, I ⊂ Z. Sia g : S → R e sia g(S) = {g(x) : x ∈ S}.
Se definiamo Y := g(X), allora Y è una variabile aleatoria discreta a valori in g(S), cioè
P (Y ∈ g(S)) = 1, e la sua densità è
(P
k: g(xk )=y pX (xk ) se y ∈ g(S)
pY (y) =
0 se y 6∈ g(S)
Esempio 2.6.4 La probabilità di vincere giocando a una slot machine è p = 0.2 e per
partecipare a n giocate si paga una posta iniziale di n . Se si effettuano 10 giocate e ad
ogni giocata o si totalizza 0 o si vincono 2 , qual è la probabilità di vincere 4 (al netto
della posta iniziale)?
Siano X la variabile aleatoria che indica il numero di vittorie su 10 giocate e Y quella che
indica la vincita accumulata dopo 10 giocate. Allora X ∼ Bi(10, 0.2) e Y = 2X − 10.
Inoltre, la densità di probabilità di Y è
( 10 10+k 10−k
10+k 0.2 2 0.8 2 k = 0, ±2, ±4, ±6, ±8, ±10
pY (k) = 2
0 altrove
54 CAPITOLO 2. VARIABILI ALEATORIE
In particolare:
10 10+4 10−4 10
P (“vincere 4 ”) = P (Y = 4) = 10+4 0.2
2 × 0.8 2 = 0.27 × 0.83 ' 0.0008.
2
7
La Proposizione 2.6.3 afferma che, se X è una variabile aleatoria discreta, allora g(X) è
una variabile aleatoria discreta e la sua densità è univocamente determinata dalla densità
di X. Questo fatto implica, tra l’altro, che se X e W sono due variabili aleatorie discrete
che hanno la stessa densità, lo stesso vale per g(X) e g(W ). Inoltre la proposizione mostra
un metodo per calcolare la densità di g(X) a partire dalla densità di X.
Nel caso di variabili aleatorie assolutamente continue vale un risultato analogo, questa
volta però sotto ipotesi restrittive su g:
Proposizione 2.6.5 Sia Y = g(X), con X variabile aleatoria assolutamente continua con
densità fX . Supponiamo che esista un intervallo aperto S ⊂ R tale che: P (X ∈ S) = 1,
g sia differenziabile con continuità su S e g 0(x) 6= 0 per ogni x ∈ S. Sia g −1 la funzione
inversa di g e g(S) = {g(x) : x ∈ S}. Allora Y è una variabile aleatoria assolutamente
continua con densità data da
(
fX (g −1 (y))|(g −1)0 (y)| se y ∈ g(S)
fY (y) = (2.6.1)
0 se y 6∈ g(S)
Non vedremo la dimostrazione di questa proposizione in generale, ma osserviamo che nel
caso particolare in cui S = R = g(S) e g è crescente si ha:
Z g−1 (y) Z y
−1
FY (y) = P (g(X) ≤ y) = P (X ≤ g (y)) = fX (s) ds = fX (g −1(t))(g −1 )0 (t) dt
−∞ −∞
1
Quindi, fY (y) = 1(β,α+β) (y).
α
Osservando la definizione di Y si vede che Y si ottiene da X mediante una dilatazione di
fattore α seguita da una traslazione di ragione β. Questa trasformazione fa corrispondere
all’intervallo (0, 1) l’intervallo (β, α + β), quindi risulta intuitivo che se X è un numero
scelto a caso in (0, 1) allora Y è un numero scelto a caso in (β, α + β). Se ora a, b ∈ R con
a < b e poniamo β = a e α = b − a otteniamo che un numero scelto a caso in (a, b) è una
variabile aleatoria Y con densità
1
fY (y) = 1(a,b) (y) (2.6.2)
b−a
1
Se α < 0, analoghi ragionamenti portano a dire che fY (y) = −α 1(β+α,β) (y).
L’esempio precedente ci porta ad una generalizzazione della densità uniforme vista nel
Paragrafo 2.5.1. Una variabile aleatoria Y assolutamente continua è detta uniforme su
(a, b) se la sua densità è data da (2.6.2). La densità fY è detta densità uniforme su (a, b)
e si può scrivere Y ∼ U(a, b).
X −a
Esercizio 2.6.7 Mostrare che se X ∼ U(a, b), allora ∼ U(0, 1).
b−a
Esercizio* 2.6.8 Verificare che fY definita dalla (2.6.2) è una densità, cioè valgono 1. e
2. della Definizione 2.4.12.
d √ d √ √ 1 √ 1
fY (y) = FY0 (y) = FX ( y) − FX (− y) = FX0 ( y) √ + FX0 (− y) √ =
dy dy 2 y 2 y
1 √ √ 1 √ √
= √ [FX0 ( y) + FX0 (− y)] = √ [fX ( y) + fX (− y)]
2 y 2 y
e−y/2
fY (y) = √ .
y2π
In definitiva
e−y/2
fY (y) = √ 1(0,+∞) (y).
y2π
Una variabile aleatoria Y con questa densità è detta variabile aleatoria chi-quadrato con 1
grado di libertà e si scrive X ∼ χ2 (1).
Nota 2.6.13 Si noti che quanto visto sopra ci dice che per ogni variabile aleatoria X
assolutamente continua e con densità fX , allora Y := X 2 è assolutamente continua e si ha
1 √ √
fY (y) = √ [fX ( y) + fX (− y)]1(0,+∞) (y) (2.6.3)
2 y
Esempio 2.6.14 Siano X ∼ U(0, 1) e F (y) = (1 − e−µy )1(0,+∞) (y) con µ > 0 (F è
la funzione di ripartizione esponenziale di parametro µ). Introduciamo la funzione g :
(0, 1) → R definita da
− log(1 − x)
g(x) := ∀x ∈ (0, 1)
µ
Allora g è una funzione iniettiva tale che
linguaggi di programmazione esistono routine che generano valori di variabili “pseudo-aleatorie” e uniformi
in (0, 1). Il risultato di rappresentare una variabile aleatoria come una trasformazione di una U(0, 1) non
riguarda soltanto le variabili aleatorie esponenziali, ma anche tutte le altre, siano esse discrete o continue.
Qui accenniamo soltanto al risultato per il caso delle variabili aleatorie che hanno funzione di ripartizione
F (x) strettamente crescente sull’insieme {x : 0 < F (x) < 1}. In tal caso, l’equazione F (x) = u ammette
un’unica soluzione per ogni u ∈ (0, 1), cioè x = F −1 (u).
Proposizione 2.6.15 (della trasformata integrale) Sia F una funzione di ripartizione strettamente
crescente sull’insieme {x : 0 < F (x) < 1} e F −1 la funzione definita da F (F −1 (u)) = u per ogni u ∈ (0, 1).
Se U ∼ U(0, 1) allora X = F −1 (U ) ha funzione di ripartizione F .
Dimostrazione Poiché F è funzione strettamente crescente su {x : 0 < F (x) < 1} e per ogni u ∈ (0, 1)
F (F −1 (u)) = u allora, per ogni u ∈ (0, 1) e per ogni x ∈ F −1 ((0, 1)) vale che F −1 (u) ≤ x se e solo se
u = F (F −1 (u)) ≤ F (x) e quindi
Il precedente lemma dà una prima idea del perché la densità U(0, 1) giochi un ruolo chiave nelle simulazioni:
teoricamente, per generare una qualunque variabile aleatoria continua X avente funzione di ripartizione F
invertibile, potremmo procedere a generare U ∼ U(0, 1) e fare la trasformazione F −1 (U ). Praticamente,
questo metodo si applica soltanto nei casi in cui siamo in grado di determinare esplicitamente F −1 . Ma
questi casi sono pochi. Ad esempio, rimane fuori la variabile aleatoria gaussiana standard. Nei casi non
coperti dall’uso della trasformata integrale potremo procedere o con metodi generali alternativi e validi per
diverse famiglie di variabili aleatorie, o con metodi ad hoc che usano in modo pesante proprietà specifiche
delle variabili aleatorie da simulare. Il lettore interessato veda ad esempio [11].
Esercizio 2.6.16 Scrivete un programma in un linguaggio a voi noto per ottenere n = 100 simulazioni
dalla densità U(−2, 2).
58 CAPITOLO 2. VARIABILI ALEATORIE
Capitolo 3
Abbiamo visto nel Capitolo 2 che nella teoria assiomatica della probabilità i numeri causali
vengono modellizzati dalle variabili aleatorie. In questo capitolo vedremo come sia possibile
associare ad una variabile aleatoria alcune grandezze deterministiche, cioè alcuni numeri,
che ci daranno informazioni qualitative e quantitative sulla variabile aleatoria. Per chiarire
meglio la situazione facciamo subito un esempio.
Esempio 3.0.17 Supponiamo di giocare alla roulette puntando sul rosso1 . Sia X il gua-
dagno netto che otteniamo puntando 1 . Si vede subito che X è una variabile discreta,
che assume solo i due valori −1 (cioè abbiamo perso 1 ) e 1 (cioè abbiamo vinto 1 ), con
probabilità 19/37 e 18/37 rispettivamente. In particolare si vede che il gioco della roulette
è favorevole al banco, infatti la probabilità di vincere 1 è più piccola di quella perdere
1 . Supponiamo ora invece di giocare a testa e croce con un amico. Se Y è il guadagno
netto che otteniamo puntando 1 , allora anche in questo caso Y è una variabile discreta,
che assume solo i due valori −1 e 1, ma con probabilità 1/2 questa volta. In questo caso
la probabilità di vincere 1 è uguale alla probabilità di perderlo, quindi questo gioco è
in un certo senso più “giusto” della roulette, o come si dice è un gioco equo. Vedremo
che è possibile associare a ciascuna delle variabili aleatorie X e Y un numero, chiamato
media. Vedremo che la media di X è negativa (ad indicare che il guadagno netto medio al
gioco della roulette è un numero negativo) mentre quella di Y è nulla (ad indicare che il
guadagno netto medio a testa e croce è nullo).
59
60 CAPITOLO 3. MEDIA VARIANZA E MOMENTI
Definizione 3.1.1 Sia X una variabile aleatoria discreta a valori in S = {xk : k ∈ I} con
I ⊂ Z e sia pX la sua densità. Se
X
|xk |pX (xk ) < +∞
k∈I
E(X) = 1 × p + 0 × (1 − p) = p
3.1. VALORE ATTESO (O MEDIA) 61
Per le variabili aleatorie assolutamente continue vale una definizione di valore atteso ana-
loga alla Definizione 3.1.1:
Definizione 3.1.6 Sia X una variabile aleatoria assolutamente continua e sia fX la sua
densità. Se Z
|x|fX (x) dx < +∞
R
Anche in questo caso valgono osservazioni analoghe a quelle fatte dopo la Definizione 3.1.1,
che ometteremo.
per la proprietà telescopica. Se quindi X è una variabile aleatoria di densità pX (x) = p(x),
allora
X+∞ +∞
X +∞
X
x 1
|x|pX (x) = = = +∞
x=1 x=1
x(x + 1) x=1 x + 1
P in S = {xk : k ∈
Proposizione 3.1.12 Siano X una variabile aleatoria discreta a valori
I} con I ⊂ Z e densità pX , g una funzione reale e Y := g(X). Se k∈I |g(xk )|pX (xk ) <
+∞, allora Y ammette valore atteso e
X
E(Y ) = g(xk )pX (xk ). (3.1.1)
k∈I
Siano X una variabile aleatoria assolutamente continuaR con densità fX e g una funzione
reale tale che Y := g(X) è una variabile aleatoria. Se R |g(x)|fX (x) dx < +∞, allora Y
ammette valore atteso e Z
E(Y ) = g(x)fX (x) dx. (3.1.2)
R
Non dimostriamo questa proposizione, ma illustriamone il suo senso con qualche esempio.
√
Esempio 3.1.13 Siano X ∼ U(−1, 1) e Y = X 2 . Allora fY (y) = 1/(2 y)1(0,1) (y) (per
ottenerla si applichi la formula in (2.6.3)) e quindi
Z 1
1 1
E(Y ) = y √ dy = .
0 2 y 3
3.1. VALORE ATTESO (O MEDIA) 63
Con maggior economia di calcoli possiamo arrivare allo stesso risultato applicando la
Proposizione 3.1.12: Z 1 Z
21 2 1 2 1
E(Y ) = x dx = x dx = .
−1 2 2 0 3
Proposizione 3.1.14 Sia X una variabile aleatoria definita sullo spazio di probabilità
(Ω, F , P ).
1. Se P (X = c) = 1 allora E(X) = c.
2. Se X è una variabile aleatoria e B ⊂ R tale che {X ∈ B} ∈ F allora E(1B (X)) =
P (X ∈ B).
3. Se X è una variabile aleatoria tale che E(X) esiste e α è una costante, allora
E(αX) = α E(X).
4. Se X è una variabile aleatoria, g e h sono funzioni tali che E(g(X)) ed E(h(X))
esistono, allora E(g(X) + h(X)) = E(g(X)) + E(h(X)).
5. Se X è una variabile aleatoria tale che P (X ≥ 0) = 1 e E(X) esiste, allora E(X) ≥ 0.
Se in aggiunta E(X) = 0 allora P (X = 0) = 1.
6. Se a, b ∈ R sono tali che P (a ≤ X ≤ b) = 1, allora a ≤ E(X) ≤ b.
7. Siano g e h funzioni tali che E(g(X)) ed E(h(X)) esistono. Se P (h(X) ≥ g(X)) = 1,
allora E(h(X)) ≥ E(g(X)).
Dimostrazione
1. Se P (X = c) = 1, allora E(X) = c · P (X = c) = c.
2. Sia Y := 1B (X). Allora Y ∼ Be(p) con p = P (Y = 1) = P (X ∈ B) e quindi
E(Y ) = P (X ∈ B).
3. Supponiamo ad esempio che X sia assolutamente continua. Allora per la Proposizio-
ne 3.1.12 vale che:
Z Z
E(αX) = αxfX (x) dx = α xfX (x) dx = α E(X).
R R
La proprietà 1. della Proposizione 3.1.14 ci dice che il valore atteso di una costante è la
costante stessa; questa proprietà è talvolta chiamata proprietà di coerenza del valore atteso.
La proprietà 2. sottolinea un ovvio legame tra valore atteso e probabilità. Le proprietà
3. e 4. ci dicono come si comporta il valore atteso quando si effettuano operazioni lineari
sulla variabile aleatoria sottostante, queste proprietà sono dette proprietà di linearità del
valore atteso. La proprietà 5. è detta positività del valore atteso. La proprietà 6. prende
il nome di internalità del valore atteso.
Nota 3.1.15 Tutte le proprietà del valore atteso enunciate nella Proposizione 3.1.14 val-
gono sia nel caso discreto che nel caso assolutamente continuo, cioè in tutti i casi per cui
in questo corso abbiamo definito il valore atteso. Questo ci autorizzerà nel seguito ad ap-
plicarle a tutte le variabili aleatorie che prenderemo in considerazione senza ulteriormente
specificare di quale natura sia la loro funzione di ripartizione.
3.2 Varianza
Abbiamo visto nella sezione precedente che, in alcuni casi, è possibile associare a una varia-
bile aleatoria una grandezza deterministica che abbiamo chiamato valore atteso. Tuttavia
la media della variabile aleatoria non riassume tutte le proprietà qualitative di una varia-
bile aleatoria, nel senso che ci sono variabili aleatorie che hanno la stessa media ma che
sono qualitativamente molto differenti.
Esempio 3.2.1 (Segue Esempio 3.0.17) Supponiamo ancora di giocare a testa e croce
con un amico. Sia ora Z il guadagno netto che otteniamo puntando 1000 : Z è una
variabile discreta che assume solo i due valori −1000 e 1000 con probabilità 1/2. Anche in
questo caso il gioco è equo, cioè E(Z) = 0. Ma questo gioco è molto più rischioso rispetto
a puntare 1 come nell’Esempio 3.0.17. Eppure E(Y ) = E(Z) = 0.
3.2. VARIANZA 65
Definizione 3.2.2 Sia X una variabile aleatoria discreta o assolutamente continua, tale
che esista E(X). Se inoltre esiste E((X − E(X))2 ), allora si pone
Esempio 3.2.3 (Seguono Esempi 3.0.17 e 3.2.1) Sia Y il guadagno netto che si ha
giocando a testa e croce puntando 1 e Z quello che si ha puntando 1000 . Allora
P (Y = −1) = P (Y = 1) = P (Z = 1000) = P (Z = −1000) = 1/2 ed E(Y ) = E(Z) = 0.
Per quanto riguarda la varianza di Y si ha
X 1 1
Var(Y ) = E((Y − E(Y ))2 ) = E(Y 2 ) = k 2 pY (k) = (−1)2 × + 12 × = 1,
2 2
k∈{−1,1}
Come già anticipato, Var(Z) è (molto) più grande di Var(Y ) ad indicare che Z si discosta
da E(Z) (molto) più di quanto non faccia Y da E(Y ).
3. Osserviamo che per la linearità del valore atteso E(X + β) = E(X) + β, quindi
Esercizio 3.3.2 Dimostrare che se X è una variabile aleatoria positiva tale che la k-esima
potenza X k ammette media per un intero positivo k, allora vale che
E(X k )
P (X > ) ≤ ∀ > 0.
k
Questa disuguaglianza è nota con il nome di Disuguaglianza di Markov.
3.4. STANDARDIZZAZIONE DI UNA VARIABILE ALEATORIA 69
X −m
Y := (3.4.1)
σ
dove σ è la deviazione standard di X. Segue dalle Proposizioni 3.1.14 e 3.2.5 che Y ammette
media e varianza finite. Inoltre segue dalla linearità della media che
X −m E(X) − m
E(Y ) = E = = 0,
σ σ
E(X) = σ E(Z) + µ = µ
e
Var(X) = σ 2 Var(Z) = σ 2 .
70 CAPITOLO 3. MEDIA VARIANZA E MOMENTI
Inoltre, grazie alla Proposizione 2.6.5, X è una variabile aleatoria assolutamente continua
con densità
( 2 )
x−µ 1 1 1 x−µ
fX (x) = ϕ =√ exp − , ∀x ∈ R (3.5.1)
σ σ 2πσ 2 2 σ
dove ϕ rappresenta la densità gaussiana standard.
Definizione 3.5.1 Una variabile aleatoria assolutamente continua X con densità (3.5.1)
è detta gaussiana di parametri µ e σ 2 e si indica X ∼ N (µ, σ 2).
Deduciamo dagli ultimi calcoli fatti che i due parametri di una variabile aleatoria N (µ, σ 2)
hanno una precisa interpretazione: µ è la media e σ 2 la varianza. Quindi, come messo in
evidenza nella Figura 3.1, µ è un polo di riferimento e σ un indice della concentrazione (o
dispersione) della densità N (µ, σ 2) intorno a µ.
0.5
N (−1, 0.5)
N (0, 1)
0.4
N (0, 2)
0.3
0.2
0.1
0.0
−4 −2 0 2 4
Figura 3.1: Grafico delle densità di probabilità N (0, 1), N (0, 2) e N (−1, 0.5)
Esercizio 3.5.2 Sia X ∼ N (µ, σ 2). Mostrare che Y = (X − µ)/σ ∼ N (0, 1). Cioè
la standardizzata di una variabile aleatoria gaussiana è una variabile aleatoria gaussiana
standard.
Esercizio 3.5.3 Sia X ∼ N (µ, σ 2 ) e sia FX la sua funzione di ripartizione. Mostrare che
FX (x) = Φ((x − µ)/σ), ∀x ∈ R
dove Φ è la funzione di ripartizione della densità gaussiana standard.
Nota 3.6.3 Si noti che abbiamo due possibili approssimazioni per le probabilità collegate
ad una densità binomiale. Possiamo utilizzare una approssimazione di Poisson se n è
“grande” e p è “piccolo”, mentre si può vedere che vale un’approssimazione gaussiana se
n è “grande” e p è “lontano” dai valori estremi 0 e 1. Esistono varie “ricette” per stabilire
quanto n deve essere grande e p lontano da 0 e da 1. Per esempio, l’approssimazione
gaussiana è buona se np > 5 e n(1 − p) > 5, oppure per np(1 − p) ≥ 10.
D’altra parte, poiché S100 è variabile aleatoria discreta con funzione di ripartizione costante
a tratti sull’intervallo [k, k + 1), per k = 0, . . . , 100, allora:
per ogni r = 0, 1, . . . .
Supponiamo ora di lanciare 100 monete con trucco p = 1/5 e sia S100 il numero di teste
su 100 lanci. Allora E(S100 ) = 100/5 = 20 e Var(S100 ) = 100 × (4 × 5 × 5) = 16 e
S100 − 20
P (16 ≤ S100 ≤ 24) = P (15 < S100 ≤ 24) = P −1.25 ≤ ≤1
4
' Φ(1) + Φ(1.25) − 1 ' 0.841345 + 0.894350 − 1 ' 0.735695.
Si noti che P (16 ≤ S100 ≤ 24) vale esattamente 0.7401413. In questo caso, l’errore in
percentuale è pari a (0.7401413 − 0.735695)/0.7401413 ' 0.6% senza la correzione di conti-
nuità e (0.7401413 − 0.739411)/0.7401413 ' 0.1% con la correzione di continuità. Notiamo
3.7. *MOMENTI E FUNZIONE GENERATRICE DEI MOMENTI 73
1.0
Φ(x)
Sn −n/2
fdr di p
n/4
0.8
0.6
0.4
0.2
0.0
−4 −2 0 2 4
p
Figura 3.2: Fdr di (Sn − np)/ np(1 − p) e Φ a confronto per n = 20 e p = 0.5
Definizione 3.7.1 Sia X una variabile aleatoria assolutamente continua o discreta tale
che |X|k ammetta valore atteso. Allora il numero E(X k ) è detto momento k-esimo o
momento di ordine k della variabile aleatoria X.
Secondo questa definizione la media di una variabile aleatoria è il suo momento primo,
mentre la varianza è la differenza tra il suo momento secondo ed il suo momento primo al
quadrato.
Proposizione 3.7.2 Sia X una variabile aleatoria che ammette momento k-esimo, per
qualche k ≥ 2. Allora X ammette momento h-esimo per ogni 1 ≤ h < k.
74 CAPITOLO 3. MEDIA VARIANZA E MOMENTI
Esercizio 3.7.3 Mostrare che una variabile aleatoria gaussiana standard ammette mo-
menti di ogni ordine; quindi verificare che quelli di ordine dispari sono nulli.
Più in generale, mostrare che se X è una variabile aleatoria simmetrica (cioè X e −X
hanno la stessa funzione di ripartizione) ed ammette momento di ordine n, allora tutti i
momenti di ordine dispari E(X 2k+1 ) con 2k + 1 ≤ n sono nulli.
Esercizio 3.7.4 Sia X una variabile aleatoria assolutamente continua con densità
(
0 x<1
fX (x) = −4
3x x≥1
Mostrare che X ammette momenti primo e secondo ma non ammette momento terzo.
Uno strumento molto utile nel calcolo dei momenti di una variabile aleatoria, quindi anche
nel calcolo di media e varianza, è la funzione generatrice dei momenti :
Definizione 3.7.5 Sia X una variabile aleatoria per la quale esiste un intervallo aperto
O contenente lo 0 tale che etX ammette media per ogni t in O. Allora la funzione
mX (t) := E(etX )
definita (almeno) per ogni t ∈ O è detta funzione generatrice dei momenti di X.
Nota 3.7.6 La funzione generatrice dei momenti di una variabile aleatoria X coincide con
la trasformata di Laplace della densità di probabilità di X.
Esercizio 3.7.7 Sia X ∼ N (µ, σ 2). Mostrare che la funzione generatrice dei momenti di
X è
2 2
mX (t) = eµt+σ t /2 .
per ogni t ∈ R.
Il nome di funzione generatrice dei momenti è dovuto alla seguente proprietà di mX .
Proposizione 3.7.8 Sia X una variabile aleatoria che ammette funzione generatrice dei
momenti mX . Allora esistono tutti i momenti di X e
E(X) = m0X (0), E(X 2 ) = m00X (0), . . . .
3.7. *MOMENTI E FUNZIONE GENERATRICE DEI MOMENTI 75
Non dimostreremo questa proposizione, ma per ricordarla meglio conviene tenere presente
la seguente dimostrazione formale:
0 d tX d tX
mX (t) = E(e ) = E e = E(XetX )
dt dt
quindi m0X (0) = E(X). Lo stesso ragionamento si può ripetere per i momenti successivi.
Esercizio 3.7.9 Calcolare il momento quarto di una variabile aleatoria X avente densità
gaussiana standard.
76 CAPITOLO 3. MEDIA VARIANZA E MOMENTI
Capitolo 4
Vettori Aleatori
Esempio 4.1.1 Consideriamo l’esperimento aleatorio consistente nel lanciare dieci volte
due monete equilibrate. Sia X il numero di teste nei dieci lanci della prima moneta e
Y quello nella seconda. L’evento {X = 5} è costituito da tutte le possibili sequenze dei
dieci lanci delle due monete compatibili con il fatto che la prima moneta abbia mostrato
esattamente cinque volte testa. Analogamente, {Y ≤ 8} è l’evento che si verifica se la
seconda moneta ha mostrato testa al più otto volte. Considerare contemporaneamente il
verificarsi di questi due eventi (cioè l’intersezione) riguarda il comportamento congiunto
delle due variabili aleatorie e scriveremo:
D’ora in avanti si userà questa notazione per indicare intersezione di eventi espressi in
termini di variabili aleatorie. In questo caso è chiaro che gli eventi {X = 5} e {Y ≤ 8}
sono indipendenti secondo la Definizione 1.5.18 e quindi
P (X = 5, Y ≤ 8) = P (X = 5)P (Y ≤ 8).
Il conto procede considerando che X ∼ Bi(10, 1/2) e Y ∼ Bi(10, 1/2). Allo stesso modo
si prova che
P (X ∈ A, Y ∈ B) = P (X ∈ A)P (Y ∈ B)
77
78 CAPITOLO 4. VETTORI ALEATORI
per ogni A, B ⊂ {0, 1, . . . , 10} e le due probabilità a secondo membro si calcolano facilmente
ricorrendo alla densità binomiale.
Sia ora Z la v.a. che indica il numero totale di teste nei lanci di entrambe le monete.
Allora Z ∼ Bi(20, 1/2) ma, evidentemente, gli eventi {Z ≤ 8} e {X = 5} non sono
indipendenti: ad esempio sull’insieme {ω : X(ω) = 5} Z non può assumere valori inferiori
a 5. Questo fatto implica che per calcolare P (X = 5, Z ≤ 8) non è sufficiente conoscere
le densità di X e di Z, ma è necessario analizzare più a fondo il loro comportamento
congiunto. Comunque, in questo caso il calcolo è facile:
Diversamente, per la coppia (X, Z), la sola conoscenza di pX e pZ non porta direttamente
a quella di P (X = x, Z = z).
La seguente definizione di indipendenza fra variabili aleatorie formalizza ed estende i con-
cetti introdotti con l’Esempio 4.1.1. Come nel caso bidimensionale, anche nel caso di un
numero qualunque n di variabili aleatorie X1 , . . . , Xn definite sullo stesso spazio di proba-
bilità (Ω, F , P ), useremo la scrittura {X1 ∈ B1 , . . . , Xn ∈ Bn } per indicare l’intersezione
degli eventi {ω ∈ Ω : X1 (ω) ∈ B1 }, . . . , {ω ∈ Ω : Xn (ω) ∈ Bn }:
Si può verificare che le variabili aleatorie X, Y dell’Esempio 4.1.1 sono indipendenti secondo
la Definizione 4.1.2.
In altri termini, se le variabili aleatorie sono indipendenti, allora vale (4.1.2). In realtà,
vale anche il viceversa, cioè
Nota 4.1.5 Siano X1 , . . . , Xn variabili aleatorie discrete indipendenti con densità rispet-
tivamente pX1 , . . . , pXn . Allora, prendendo B1 = {x1 }, . . . , Bn = {xn } in (4.1.1) risulta
che
Esempio 4.1.8 Siano S e T due variabili aleatorie che descrivono i tempi di guasto, in
minuti secondi, di due componenti elettronici. Supponiamo che il modello probabilistico
assegnato sia il seguente: la probabilità che il primo componente funzioni nei primi s
secondi e il secondo nei primi t secondi (per ogni s ≥ 0 e t ≥ 0) sia
Z +∞ Z +∞
P (S > s, T > t) = µ2 e−µ(u+v) du dv.
s t
80 CAPITOLO 4. VETTORI ALEATORI
cioè, gli eventi {S > s} e {T > t} sono indipendenti. Ma allora anche gli eventi comple-
mentari {S ≤ s} e {T ≤ t} sono indipendenti, da cui:
Definizione 4.2.1 (Vettore aleatorio) Sia (Ω, F , P ) uno spazio di probabilità. Un vet-
tore aleatorio n–dimensionale è una funzione vettoriale X := (X1 , . . . , Xn ), X : Ω → Rn
tale che ogni Xi (per i = 1, . . . , n) è una variabile aleatoria.
Esempio 4.2.2 (Continuazione degli Esempi 4.1.1 e 4.1.8) Le coppie (X, Y ), (X, Z)
considerate nell’Esempio 4.1.1 e (S, T ) nell’Esempio 4.1.8 sono vettori aleatori bidimensio-
nali.
Discutendo della nozione di indipendenza, nell’equazione (4.1.2), abbiamo considerato
probabilità della forma:
Quindi dalla funzione di ripartizione congiunta siamo in grado di calcolare tutte le funzioni
di ripartizione marginali. Ma il viceversa è falso, come mostra il seguente esempio.
Definizione 4.3.2 Sia X una vettore aleatorio discreto su di uno spazio di probabilità
(Ω, F , P ). La funzione pX (x) := P (X1 = x1 , . . . , Xn = xn ), dove x = (x1 , . . . , xn ), si
chiama densità discreta del vettore aleatorio X (o densità congiunta di X1 , . . . Xn ).
Si noti che se pX è la densità di un vettore aleatorio discreto X allora pX (x) = 0 tranne
che per una quantità al più numerabile di x ∈ Rn .
Esempio 4.3.3 (Densità multinomiale) Supponiamo che una popolazione contenga og-
getti di k ≥ 2 tipi diversi e cheP la proporzione degli oggetti di tipo i nella popolazione sia
pi per i = 1, . . . , k (pi > 0, ki=1 pi = 1). Inoltre, supponiamo che n oggetti siano scelti
a caso dalla popolazione con reimmissione. Sia Xi il numero di oggetti di tipo i estratti,
per i = 1, . . . , k e sia X il vettore aleatorio che ha componenti X1 , . . . , Xk . Allora il vet-
tore aleatorio X è discreto, la somma delle sue componenti è pari al numero di estrazioni
(X1 + · · · + Xk = n) e la sua densità è detta multinomiale di parametri n, p1 , . . . , pk .
4.3. VETTORI ALEATORI DISCRETI 83
Per scrivere esplicitamente la densità, possiamo pensare di estrarre gli elementi dalla
popolazione uno alla volta. Poiché le n scelte sono indipendenti, la probabilità che la
sequenza delle n estrazioni contenga n1 elementi di tipo 1,. . . , nk elementi di tipo k (in un
ordine prefissato) è pn1 1 · · · pnk k . Inoltre, il numero di modi differenti in cui l’ordine degli n
oggetti può essere specificato è pari al numero di partizioni ordinate di classe (n1 , . . . , nk ),
cioè
n n!
:= .
n1 . . . nk n1 ! × n2 ! × · · · × nk !
Segue che la probabilità di ottenere esattamente n1 elementi di tipo 1, . . . , nk elementi di
tipo k è
n
P (X1 = n1 , . . . , Xk = nk ) = pn1 · · · pnk k , n1 , . . . , nk = 0, . . . , n e n1 +· · ·+nk = n
n1 . . . nk 1
Si osservi che per k = 2 X si riduce al vettore (X1 , n − X1 ) e X1 ∼ Bi(n, p1 ).
Se pX è la densità di X allora valgono proprietà analoghe a quelle della densità discreta
unidimensionale (cfr. Proposizione 2.2.4). Per definire queste proprietà penseremo Rn
dotato delle consuete operazioni di somma e prodotto per uno scalare e della seguente
relazione di ordine parziale “≤”: se x, y ∈ Rn , allora x ≤ y se e solo se xk ≤ yk per ogni
k = 1, . . . , n.
4. se B ⊂ Rn allora X
P (X ∈ B) = pX (x).
x∈B∩S
Esercizio 4.3.5 Fornire l’espressione della densità marginale della generica componente
Xi del vettore X.
Esercizio 4.3.6 Fornire l’espressione della densità congiunta delle prime due componenti
X1 e X2 del vettore X.
Alla luce delle definizioni ora introdotte, rienunciamo la Proposizione 4.1.6 nei seguenti
termini:
1. Z
fX (x1 , . . . , xn ) dx1 · · · dxn = 1.
Rn
che è vero in quanto, se B := (−∞, x]×Rn−1 , allora per il punto 3. della Proposizione 4.4.2
abbiamo:
Z x Z
fX (s1 , · · · , sn ) ds2 . . . dsn ds1 = P (X ∈ B) =
−∞ Rn−1
= P (X1 ≤ x, X2 ∈ R, . . . , Xn ∈ R) = P (X1 ≤ x) = FX1 (x)
Esempio 4.4.4 (Densità uniforme sul cerchio) [Tratto da [1] ] Siano (X, Y ) le coor-
dinate di un punto “scelto a caso” nel cerchio C di raggio r: C = {(x, y) ∈ R2 : x2 + y 2 ≤
r 2 }. Questo significa che il vettore aleatorio (X, Y ) è assolutamente continuo con densità
costante su C e nulla al di fuori di C:
(
a (x, y) ∈ C
fX,Y (x, y) =
0 altrove.
86 CAPITOLO 4. VETTORI ALEATORI
Dalla proprietà 1. della Proposizione 4.4.2 segue che il valore della costante a deve essere
tale che Z
a dx dy = 1
C
cioè a è il reciproco dell’area del cerchio C: a = 1/(πr 2). Pertanto, se (X, Y ) è un punto
“scelto a caso” nel cerchio C, allora (X, Y ) è un vettore aleatorio assolutamente continuo
con densità
1
fX,Y (x, y) = 2 1C (x, y) .
πr
Calcoliamo ora le densità marginali fX , fY . Sia x ∈ (−r, r). Allora
q
r 2 − x2
−r 0 x r
q
− r 2 − x2
Z Z √
r 2 −x2
1 1 2 √ 2
fX (x) = 1C (x, y)dy = √
dy = r − x2 .
R πr 2 − r 2 −x2 πr 2 r2π
2 √
fX (x) = r 2 − x2 1(−r,r) (x) .
r2π
Per motivi di simmetria vale anche che
2 p 2
fY (y) = r − y 2 1(−r,r) (y) .
r2 π
Esercizio 4.4.5 (Continuazione dell’Esempio 4.1.8) Siano S, T i tempi di guasto ri-
spettivamente del primo e del secondo componente introdotti nell’Esempio 4.1.8. Calcolare
la probabilità che il primo componente si guasti prima del secondo.
(S, T ) è un vettore aleatorio bidimensionale a componenti indipendenti e continuo di
densità
fS,T (s, t) = µ2 eµ(s+t) 1(0,+∞)×(0,+∞) (s, t) .
4.5. FUNZIONI DI VETTORI ALEATORI 87
La probabilità richiesta è
P (S < T ) = P ((S, T ) ∈ A)
dove A = {(s, t) ∈ (0, +∞) × (0, +∞) : s < t}. Quindi:
Z Z +∞ Z +∞ Z +∞
2 −µs −µt 1
P (S < T ) = fS,T (s, t) ds dt = µ e e dt ds = µ e−2µs ds = .
A 0 s 0 2
Notiamo che la funzione di densità congiunta del vettore (S, T ) verifica la condizione:
fS,T (s, t) = fS (s)fT (t) per ogni s, t > 0. Questo fatto è comune a tutti i vettori aleatori
assolutamente continui a componenti indipendenti. Si può infatti dimostrare la seguente
proposizione.
Si noti che se y 6∈ g(S), la somma non contiene termini e si intende pY (y) = 0. Rimane
cosı̀ dimostrata la seguente proposizione.
Proposizione 4.5.1 Sia X un vettore aleatorio discreto con densità pX (x) e P (X ∈
S) = 1 e sia g : S → Rm . Allora Y := g(X) è un vettore aleatorio discreto tale che
P (Y ∈ g(S)) = 1 e la densità di Y è
X
pY (y) = pX (x) (4.5.1)
x∈S: g(x)=y
Quindi X1 + X2 ∼ P(λ1 + λ2 ).
Iterando il procedimento ora visto otteniamo che se X1 , . . . , Xn sono variabili aleatorie
indipendenti con X1 ∼ P(λ1 ), . . . , Xn ∼ P(λn ), allora X1 + · · · + Xn ∼ P(λ1 + · · · + λn ).
Nel prossimo paragrafo useremo l’equazione (4.5.2) per studiare la somma di variabili
aleatorie.
2
Ricordate che “≤” è la seguente relazione di ordine parziale: se x, y ∈ Rm , allora x ≤ y se e solo se
xk ≤ yk per ogni k = 1, . . . , m
90 CAPITOLO 4. VETTORI ALEATORI
Calcoliamo ora le densità delle somme di alcune variabili aleatorie indipendenti assolu-
tamente continue.
−∞ 2πσ σ
1 2
y2
Z +∞
1 −
2(σ 2 +σ 2 )
1 (x−ν)2
− 2τ
=p e 1 2 √ e dx
2π(σ12 + σ22 ) −∞ 2πτ
dove
Esempio 4.5.6 Siano X1 , X2 due variabili aleatorie indipendenti entrambe con densità
esponenziale di parametro µ > 0. Calcoliamo la densità di X1 + X2 .
Applicando (4.5.3) abbiamo:
(R y
0
µe−µu µe−µ(y−u) du = µ2 e−µy y se y > 0
fX1 +X2 (y) =
0 se y ≤ 0 .
∂y1 ∂y2
... ∂yn
92 CAPITOLO 4. VETTORI ALEATORI
Esercizio 4.5.10 Il lettore scriva la formula (4.5.5) per n = 1 e la confronti con la formula
(2.6.1) fornita nel caso di variabili aleatorie assolutamente continue.
P (W ∈ A, Z ∈ B) = P (W ∈ A)P (Z ∈ B)
Definizione 4.6.1 Siano X1 , . . . , Xn n vettori aleatori definiti sullo stesso spazio di probabilità (Ω, F , P )
di dimensione rispettivamente m1 , . . . , mn . Diciamo che sono indipendenti se
Per funzioni vettoriali di vettori aleatori indipendenti, si può inoltre dimostrare la seguente proposizione.
Nota 4.7.3 È importante osservare che la media di X1 +X2 dipende soltanto dalle densità
marginali del vettore aleatorio (X1 , X2 ). In generale, la media della somma di n ≥ 2
variabili aleatorie X1 , . . . , Xn è data dalla somma delle n medie:
e E(X1 X2 ) esiste per la Proposizione 4.7.1 applicata alla funzione g(x, y) = xy. Inoltre,
dalla Proposizione 4.7.1 discende che:
Z Z Z Z
E(X1 X2 ) = xyfX1 (x)fX2 (y) dx dy = xfX1 (x) dx · yfX2 (y) dy = E(X1 ) E(X2 ).
R R R R
Nota 4.7.5 Iterando il procedimento nella dimostrazione del Corollario 4.7.4 è immediato
verificare cheQse X1 , . . . , Xn sono n variabili
Qnaleatorie Q
indipendenti che ammettono media
n
allora anche i=1 Xi ammette media e E( i=1 Xi ) = ni=1 E(Xi ).
Occupiamoci ora del problema del calcolo della varianza della somma di variabili aleatorie.
Dimostrazione Poiché ((X1 + X2 ) − E(X1 + X2 ))2 = [(X1 − E(X1 )) + (X2 − E(X2 ))]2 ≤
2[(X1 − E(X1 ))2 + (X2 − E(X2 ))2 ], allora Var(X1 + X2 ) = E[((X1 + X2 ) − E(X1 + X2 ))2 ] =
E[((X1 − E(X1 )) + (X2 − E(X2 )))2 ] ≤ 2[E(X1 − E(X1 ))2 + E(X2 − E(X2 ))2 ] = 2(Var(X1 ) +
Var(X2 )). Quindi se X1 e X2 ammettono varianza, anche X1 + X2 la ammette.
[dove l’ultima eguaglianza deriva dal Corollario 4.7.2 applicato alla somma delle variabili
(X1 − E(X1 ))2 , (X2 − E(X2 ))2 e (X1 − E(X1 ))(X2 − E(X2 ))]
Esempio 4.7.8 Sia X ∼ Bi(n, p). Sappiamo dall’Esercizio 4.5.4 che la variabile aleatoria
X ha la stessa densità della somma di n variabili aleatorie –chiamiamole X1 , . . . , Xn –
indipendenti con densità di Bernoulli di parametro p. Allora ritroviamo
n
! n n
X X X
E(X) = E Xi = E(Xi ) = p = np [per il Corollario 4.7.2]
i=1 i=1 i=1
n
! n n
X X X
Var(X) = Var Xi = Var(Xi ) = p(1 − p) = np(1 − p),
i=1 i=1 i=1
Gli addendi nell’ultima sommatoria sono di per sè rilevanti in probabilità. Quindi intro-
duciamo la seguente
Definizione 4.8.1 Siano X1 , X2 due variabili aleatorie definite sul medesimo spazio di
probabilità e che ammettono varianza. Si definisce covarianza di X1 , X2 il numero
Cov(X1 , X2 ) = E[(X1 − E(X1 ))(X2 − E(X2 ))] .
Se 0 < Var(X1 ), 0 < Var(X2 ), si definisce coefficiente di correlazione di X1 , X2 il numero:
Cov(X1 , X2 )
ρX1 ,X2 = p .
Var(X1 ) Var(X2 )
96 CAPITOLO 4. VETTORI ALEATORI
2. Cov(aX1 , X2 ) = a Cov(X1 , X2 );
6. |ρX1 ,X2 | ≤ 1 e |ρX1 ,X2 | = 1 se e solo se esistono a, b ∈ R tali che P (X2 = aX1 +b) = 1.
Inoltre in tal caso:
Cov(X1 , X2 ) E(X1 ) Cov(X1 , X2 )
a= e b = E(X2 ) − .
Var(X1 ) Var(X1 )
da cui otteniamo
ρX1 ,X2 ≥ −1 .
Inoltre,
X1 X2 Var(X1 ) Var(X2 ) Cov (X1 , X2 )
0 ≤ Var − = 2
+ 2
−2 = 2(1 − ρX1 ,X2 )
σ1 σ2 σ1 σ2 σ1 σ2
4.8. COVARIANZA, COEFFICIENTE DI CORRELAZIONE 97
e quindi
ρX1 ,X2 ≤ 1 .
Per dimostrare la seconda parte della proprietà 6., osserviamo che ρX1 ,X2 = 1 se e solo se
Var (X1 /σ1 − X2 /σ2 ) = 0. Segue quindi dalle proprietà della varianza che
X1 X2 E(X1 ) E(X2 )
ρX1 ,X2 = 1 se e solo se P − = − = 1.
σ1 σ2 σ1 σ2
Cov(X1 , X2 )
X2 = E(X2 ) + (X1 − E(X1 ))
σ12
Invece, per ρX1 ,X2 = −1 valgono le seguenti equivalenze che compleano la dimostrazione:
ρX1 ,X2 = −1 se e solo se Cov(X1 , X2 ) = −σ1 σ2 se e solo se Var (X1 /σ1 + X2 /σ2 ) = 0 se e
solo se P (X1 /σ1 + X2 /σ2 = E(X1 )/σ1 + E(X2 )/σ2 ) = 1 se e solo se
Cov(X1 , X2 )
X2 = E(X2 ) + (X1 − E(X1 )) .
σ12
Nota 4.8.3 Il punto 6. della proposizione precedente illustra un noto risultato della teoria
della regressione lineare: esiste un legame di tipo lineare fra le variabili aleatorie X1 e
X2 (cioè X2 = aX1 + b) se e solo se ρ(X1 , X2 ) = ±1, inoltre ρ(X1 , X2 ) = −1 implica
Cov(X1 , X2 ) < 0 e a < 0 mentre ρ(X1 , X2 ) = 1 implica Cov(X1 , X2 ) > 0 e a > 0.
Nota 4.8.4 La proprietà 5. non può essere invertita come mostra il seguente controesem-
pio:
Esempio 4.8.5 Sia X1 una variabile aleatoria discreta con densità uniforme su {−1, 0, 1}
e sia X2 = X12 . Allora E(X1 ) = 0 in quanto X1 è una variabile aleatoria simmetrica e
E(X1 X2 ) = E(X13 ) = (−1)3 /3 + 13 /3 = 0, da cui Cov(X1 , X2 ) = 0. Ma, chiaramente, X1 e
X2 non sono indipendenti.
Esempio* 4.8.8 Da un’urna contenente b biglie bianche e r rosse, si estraggono n biglie senza rimpiazzo
e X rappresenta il numero di biglie bianche pescate. Allora X ha densità ipergeometrica X ∼ Iperg(b +
r, r, n): b r
(k)(n−k) k = 0 ∨ (n − r), . . . , b ∧ n
pX (k) = (b+r
n )
0 altrove.
Per calcolare media e varianza di X possiamo procedere analiticamente, calcolando esplicitamente
b∧n b
r
b∧n b
r
X k k n−k 2
X k2 k n−k
E(X) = b+r
e E(X ) = b+r
.
k=0∨(n−r) n k=0∨(n−r) n
Il conto è fattibile, e il lettore appassionato di proprietà dei coefficienti binomiali è invitato ad eseguirlo
come esercizio. Noi daremo qui un procedimento più “probabilistico”.
Supponiamo che le biglie siano estratte sequenzialmente e definiamo le variabili X1 , . . . , Xn come
(
1 se la i–esima biglia è bianca
Xi =
0 se la i–sima biglia è rossa,
quindi ci basterà calcolare E(X1 ), . . . , E(Xn ). Poiché ognuna delle variabili Xi assume solo i valori 0 e 1
(le Xi sono cioè variabili di Bernoulli) abbiamo che E(Xk ) = P (Xk = 1), e ci siamo ricondotti a calcolare
P (Xk = 1). A tal fine pensiamo di numerare le b + r biglie contenute nell’urna in modo tale che le biglie
numerate con i numeri 1, . . . , b siano bianche e quelle numerate con i numeri b + 1, . . . , b + r siano rosse. In
questo senso possiamo pensare ad ogni risultato del nostro esperimento aleatorio di n estrazioni di biglie
dall’urna, come a un punto nello spazio degli eventi elementari
Ω := {(x1 , x2 , . . . , xn ) : xi = 1, . . . , b + r, ∀i = 1, . . . , n, e xi 6= xj se i 6= j} .
Chiaramente ogni sequenza di biglie ha la stessa probabilità di essere estratta, cioè Ω è uno spazio equi-
probabile finito, e le probabilità possono essere calcolate come casi favorevoli su casi possibili. Per i casi
possibili si ha
|Ω| = (b + r)(b + r − 1) · · · · · (b + r − n + 1)
in quanto la prima biglia può essere scelta in b + r modi e, per ogni scelta della prima, la seconda seconda
può essere scelta in b + r − 1 modi etc. Per i casi favorevoli all’evento Xi = 1, osserviamo che questo
si verifica se e solo se l’i–esima biglia pescata è bianca. Quindi fissiamo l’i–esima biglia in b modi, e poi
fissiamo le rimanenti n − 1 biglie in (b + r − 1) · · · · · (b + r − n + 1) modi. In definitiva:
b(b + r − 1)(b + r − 2) · · · · · (b + r − n + 1) b
P (Xi = 1) = = .
(b + r)(b + r − 1) · · · · · (b + r − n + 1) b+r
Segue che E(Xi ) = b/(b + r) per ogni i = 1, . . . , n da cui E(X) = nb/(b + r).
Il risultato P (X1 = 1) = P (X2 = 1) = · · · = P (Xn = 1) è in un certo senso stupefacente; si
potrebbe infatti pensare che poiché l’estrazione dall’urna della prima biglia modifica il contenuto dell’urna,
la probabilità che alla seconda estrazione venga estratta una biglia bianca debba essere necessariamente
differente dalla probabilità di ottenere bianca alla prima estrazione. Cosı̀ non è e il lettore che non si
fidasse della precedente deduzione è invitato a calcolare P (X2 = 1) mediante la formula delle probabilità
totali:
P (X2 = 1) = P (X2 = 1|X1 = 0)P (X1 = 0) + P (X2 = 1|X1 = 1)P (X1 = 1).
4.8. COVARIANZA, COEFFICIENTE DI CORRELAZIONE 99
b(b − 1) b2
Cov(Xi , Xj ) = − .
(b + r)(b + r − 1) (b + r)2
Quindi
nb b b(b − 1) b2
Var(X) = 1− + (n2 − n) −
b+r b+r (b + r)(b + r − 1) (b + r)2
nbr n−1
= 1− .
(b + r)2 b+r−1
CY = ACX AT (4.8.1)
3
Una matrice B n × n è semidefinita positiva se ∀ x ∈ Rn non identicamente nullo xT Bx ≥ 0.
100 CAPITOLO 4. VETTORI ALEATORI
Dimostrazione
1. CX è una matrice simmetrica in quanto cij = Cov(Xi , Xj ) = Cov(Xj , Xi ) = cji.
Sia λ = (λ1 , . . . , λn )T un vettore di Rn . Allora, per i = 1, . . . , m e j = 1, . . . , n:
n Xn n X n
!
X X
λT CX λ = λi λj cij = E λi λj (Xi − E(Xi ))(Xj − E(Xj ))
i=1 j=1 i=1 j=1
n
!
X
=E λi (Xi − E(Xi ))2 ≥0.
i=1
Esempio* 4.8.11 (Continuazione dell’Esempio 4.8.8) Sia (X1 , . . . , Xn ) il vettore introdotto nell’E-
sempio 4.8.8. Allora, la matrice di covarianza di (X1 , . . . , Xn ) è
1 1 1
1 − b+r−1 − b+r−1 · · · − b+r−1
br − 1 1 1
− b+r−1 1
· · · − b+r−1
b+r−1
C= · .
(b + r)2 ..
1 1 1
− b+r−1 − b+r−1 − b+r−1 ··· 1
La matrice di covarianza sarà particolarmente utile nella Sezione 4.10 dedicata ai vettori
gaussiani.
Definizione 4.9.1 Sia X = (X1 , . . . , Xn ) un vettore aleatorio per il quale esiste un “rettangolo” aperto
di Rn J = J1 × · · · × Jn contenente 0 = (0, . . . , 0) tale che et1 X1 +···+tn Xn ammette media per ogni t =
(t1 , . . . , tn ) in J. Allora la funzione
mX (t) := E(et1 X1 +···+tn Xn )
definita (almeno) per ogni t ∈ I è detta funzione generatrice dei momenti di X.
Proposizione 4.9.2 Siano X e Y due vettori aleatori che ammettono funzione generatrice dei momenti
mX , mY , rispettivamente e siano FX la funzione di ripartizione di X e FY quella di Y . Allora FX = FY
se e solo se mX = mY .
Proposizione 4.9.3 Sia X = (X1 , . . . , Xn ) un vettore aleatorio che ammette funzione generatrice dei
momenti mX e siano mXi le funzioni generatrici dei momenti marginali. Allora le componenti di X sono
indipendenti se e solo se mX = mX1 . . . mXn .
Esercizio 4.9.4 Siano X, Y due variabili aleatorie indipendenti che hanno funzione generatrice dei mo-
menti mX , mY , rispettivamente. Dimostrate che la somma X +Y ammette anche essa funzione generatrice
dei momenti ed è data da mX+Y (s) = mX (s)mY (s).
102 CAPITOLO 4. VETTORI ALEATORI
2π 2π (2π) 2
X1 = a1 1 Z1 + a1 2 Z2 + · · · + a1 m Zm + µ1
X2 = a2 1 Z1 + a2 2 Z2 + · · · + a2 m Zm + µ2
..
.
Xn = an 1 Z1 + an 2 Z2 + · · · + an m Zm + µn
Nota 4.10.5 Osserviamo che nella definizione di vettore aleatorio gaussiano n-dimensionale
nessuna restrizione è posta nella scelta della matrice A e del vettore µ. Per esempio la
matrice A potrebbe avere prima riga nulla, cioè a1 k = 0 ∀k, e seconda riga con componenti
tutte diverse da zero. Se questo è il caso, allora la prima componente X1 è una costante
cioè X1 = µ1 , mentre X2 = a2 1 Z1 + a2 2 Z2 + · · · + a2 m Zm + µ2 è una variabile aleato-
ria assolutamente continua e gaussiana in quanto somma di variabili aleatorie gaussiane
indipendenti (cfr. Esempio 4.5.5).
È quindi chiaro che non sempre un vettore gaussiano n-dimesionale ha densità di pro-
babilità fX su Rn . Altrimenti tutte le sue componenti sarebbero assolutamente continue
come stabilito nella Proposizione 4.4.3.
Tuttavia, in alcuni casi, un vettore gaussiano n-dimensionale X ha densità in Rn .
Consideriamo, per esempio, il caso di una matrice A quadrata, n × n invertibile, Z
gaussiano standard n-dimensionale e X = AZ + µ. Se A è invertibile, il vettore aleatorio
gaussiano X è una trasformazione affine di Rn in sé e segue dall’Esempio 4.5.11 che X è
assolutamente continuo con densità
1 1 1 T
fX (x) = fZ (A−1x − A−1 µ) e− 2 [A (x−µ)] [A (x−µ)] =
−1 −1
= n
| det(A)| (2π) 2 | det(A)|
1 1 T T −1 −1 1 1 T T −1
= n e− 2 (x−µ) (A ) A (x−µ) = n e− 2 (x−µ) (AA ) (x−µ) .
(2π) 2 | det(A)| (2π) 2 | det(A)|
Osservando che det(AAT ) = det(A)2 , otteniamo che la densità di X ∼ N (µ, AAT ) è
1 1 T (AAT )−1 (x−µ)
fX (x) = p n
e− 2 (x−µ) (4.10.1)
(2π) det(AAT )
Notate che la densità (4.10.1) dipende soltanto dal vettore delle medie µ e dalla matrice
di covarianza C := AAT che in questo caso è simmetrica e definita positiva. 4
4
Cioè tale che ∀ x ∈ Rn non identicamente nullo xT Cx > 0.
104 CAPITOLO 4. VETTORI ALEATORI
In realtà questo non è l’unico caso in cui c’è una densità su Rn . Infatti si può dimostrare
il seguente risultato per A non necessariamente quadrata:
(x − µ)T C −1 (x − µ) =
2
1 σ2 −σ1 2 x1 − µ1
= 2 2 (x1 − µ1 , x2 − µ2 ) =
σ1 σ2 (1 − ρ21 2 ) −σ1 2 σ12 x2 − µ2
" 2 2 #
1 x1 − µ1 x1 − µ1 x2 − µ2 x2 − µ2
= − 2ρ1 2 + .
1 − ρ21 2 σ1 σ1 σ2 σ2
4.10. VETTORI GAUSSIANI 105
Concludiamo la sezione fornendo alcune delle principali proprietà dei vettori aleatori
gaussiani.
3. Dimostriamo questo punto nel caso in cui la matrice di covarianza sia invertibile
e quindi X abbia densità su Rn . Se X1 , . . . , Xn sono scorrelate la matrice di covarianza
C di X è una matrice diagonale e la diagonale è costituita dalle varianze σ12 , . . . , σn2 di
X1 , . . . , Xn . Allora la densità di X è
1 1 T C −1 (x−µ)
fX (x) = p n
e− 2 (x−µ)
(2π) det(C)
1 − 12
Pn
i=1 (
xi −µi 2
)
=p e σi
i=1 2πσ i
Yn
= fXi (xi ),
i=1
Esercizio 4.10.10 Sia X = (X1 , . . . , Xn )T un vettore gaussiano con vettore delle medie
µ e matrice di covarianza C. Mostrare che, per ogni scelta di a1 , . . . an numeri reali di
cui almeno uno diverso da 0, a1 X1 + · · · + an Xn è una variabile aleatoria assolutamente
continua gaussiana e determinarne i parametri.
Esercizio 4.10.11 Sia X = (X1 , . . . , Xn )T un vettore gaussiano con vettore delle medie µ
e matrice di covarianza C. Usando la proprietà 2. della Proposizione 4.10.9, mostrare che
ogni vettore aleatorio (Xi , Xj ) (i 6= j) estratto da X è un vettore gaussiano bidimensionale
e determinarne i parametri.
Esercizio 4.10.12 Sia X = (X1 , . . . , Xn )T un vettore gaussiano con vettore delle medie
µ e matrice di covarianza C. Mostrare che se Xi , Xj sono scorrelate, allora sono anche
indipendenti.
Proposizione 4.11.1 (Legge debole dei grandi numeri) Sia X1 , X2 , . . . una succes-
sione di variabili aleatorie indipendenti ed identicamente distribuite (i.i.d.) con media µ e
varianza σ 2 finite. Sia Sn = X1 + · · · + Xn . Allora, per ogni > 0
Sn
lim P − µ > = 0.
n→∞ n
Dimostrazione Poiché le Xi sono i.i.d. allora
Var(Sn ) = n Var(X1 ) = nσ 2
da cui
Sn 1 2 σ2
Var( ) = 2 nσ =
n n n
4.11. TEOREMI LIMITE PER SOMME DI VARIABILI ALEATORIE 107
Sn
E( ) = µ.
n
Segue dalla diseguaglianza di Chebychev che per ogni > 0
Sn σ2
P
− µ > ≤ 2 → 0 (n → +∞)
n n
Proposizione 4.11.2 Sia X1 , X2 , . . . una successione di variabili aleatorie i.i.d. con media
finita µ. Allora
Sn (ω)
P ({ω : lim = µ}) = 1.
n→+∞ n
In pratica la legge forte applicata all’esempio dei lanci di una moneta dice che per “quasi
tutte” le successioni di risultati X1 , X2 , . . . la frequenza relativa di testa Sn /n converge al
trucco p della moneta.
Esempio 4.11.3 (Metodo di integrazione Monte Carlo) Sia h una funzione conti-
R1
nua su [0, 1]. Vogliamo calcolare in modo approssimato 0 h(x) dx. Esistono molte formule
di quadratura, ma la tecnica Monte Carlo è una delle più semplici. Inoltre, anche se può
non risultare il miglior metodo per funzioni su [0, 1], si estende facilmente e diventa com-
petitiva nel caso di integrali multidimensionali. Infatti, nei metodi numerici “tradizionali”,
l’errore di approssimazione dipende dalla dimensione, mentre ciò non accade nel caso del
metodo Monte Carlo. I generatori di numeri casuali in ogni libreria di sistema producono
valori le cui proprietà si avvicinano alle realizzazioni di variabili aleatorie i.i.d. con densità
uniforme su (0,1) e rendono implementabile il metodo Monte Carlo basato sul seguente
corollario alla Legge forte dei grandi numeri:
R1
Corollario 4.11.4 Sia h una funzione su [0, 1] con 0 |h(x)| dx < +∞. Siano U1 , U2 , . . .
variabili aleatorie i.i.d. con densità uniforme su [0, 1]. Allora
n Z 1 !
1X
P I1n := h(Uj ) → h(x) dx, n → +∞ = 1
n j=1 0
108 CAPITOLO 4. VETTORI ALEATORI
Dimostrazione È sufficiente osservare che le variabili aleatorie h(U1 ), h(U2 ), . . . sono i.i.d.
R1
con media finita 0 h(x) dx ed applicare la Legge forte dei grandi numeri.
R1
Il metodo Monte Carlo consiste nell’approssimare 0 h(x) dx con I1n per n “grande”.. Per
ogni n fissato, la bontà dell’approssimazione può essere valutata tramite
n
! R1 R1
1X h 2
(x) dx − ( h(x) dx)2
Var(I1n ) = Var h(Uj ) = 0 0
.
n j=1 n
2. Calcolare Var(I2n ).
3. Dedurre che Var(I2n ) ≤ Var(I1n ).
Teorema 4.11.6 Sia X1 , X2 , . . . una successione di variabili aleatorie i.i.d. con media µ
e varianza σ 2 , con 0 < σ 2 < +∞. Allora per ogni x ∈ R:
√ Z x
n(X̄n − µ) 1 −u2
lim P ≤x = √ e 2 du = Φ(x). (4.11.1)
n→+∞ σ −∞ 2π
Il teorema può essere interpretato nel modo seguente: pur √ di prendere un numero elevato
di variabili nella successione, la funzione di ripartizione di n(X̄n − µ)/σ, cioè della stan-
dardizzata della media campionaria X̄n , è approssimabile con quella gaussiana standard.
Quindi, per quanto visto sulle standardizzate di variabili aleatorie gaussiane, approssima-
tivamente X̄n ha funzione di ripartizione gaussiana di media µ e varianza σ 2 /n. La bontà
dell’approssimazione dipende dal numero di variabili aleatorie sommate e dalla forma della
funzione di ripartizione delle variabili aleatorie di cui si fa la media.
Equivalentemente, l’enunciato del teorema centrale del limite può essere dato in termini
di somme di variabili aleatorie i.i.d.. Infatti
√ √
√ n( n(X̄n − µ)) Sn − nµ
n(X̄n − µ)/σ = √ = √
nσ nσ
cioè la stardardizzata di X̄n coincide con quella di Sn . Quindi, sotto le ipotesi del teorema
centrale del limite:
Z x
Sn − nµ 1 −u2
lim P √ ≤x = √ e 2 du = Φ(x).
n→+∞ nσ −∞ 2π
Poiché diverse variabili aleatorie di uso comune si possono rappresentare come somma di
numerose variabili i.i.d., allora il teorema centrale del limite può essere usato per appros-
simare le vere funzioni di ripartizione di queste variabili. Ad esempio, gli errori di misura
si possono rappresentare come somma di un numero elevato di singoli termini (errori ele-
mentari), ciascuno dei quali è dovuto ad una causa, non dipendente dalle altre. Quali
che siano le funzioni di ripartizione degli errori elementari, le peculiarità di queste non si
manifestano nella somma di un gran numero di termini e la funzione di ripartizione della
somma è vicina alla funzione di ripartizione gaussiana.
Seguono alcuni esempi di applicazione del teorema centrale del limite.
Esempio 4.11.8 Sia X una variabile aleatoria di Poisson di parametro λ = 100. Calcolare
un valore approssimato di P (X < 110).
La variabile aleatoria X ∼ P(100) ha la stessa densità della somma di 100 variabili
aleatorie Y1 , . . . , Y100 i.i.d.∼ P(1); queste variabili aleatorie sono discrete a valori interi e
hanno media e varianza pari a 1. Quindi, per il teorema centrale del limite, la fdr P(100)
si può approssimare con la fdr N (100, 100). Inoltre, l’approssimazione è migliore con la
correzione di continuità. In particolare:
100
!
X
P (X < 110) = P (X ≤ 109) = P Yj ≤ 109 =
j=1
100
!
X
=P Yj ≤ 109.5 =
j=1
P100 !
j=1 Yj − 100 109.5 − 100 109.5 − 100
P ≤ 'Φ ' 0.8289
10 10 10
La presente appendice ha il solo scopo di richiamare alcune nozioni di teoria degli insiemi,
algebra lineare e analisi. Per le dimostrazioni si rimanda a [10, Volumi 1 e 2].
A 4 B = (A \ B) ∪ (B \ A) = (A ∪ B) \ (A ∩ B) : La differenza simmetrica di A e B è
l’insieme costituito dagli elementi di A che non appartengono a B e da quelli di B
che non appartengono ad A. Cioè l’insieme degli elementi che appartengono ad A o
a B ma non ad entrambi.
Le operazioni insiemistiche di unione, intersezione e complemento godono delle proprietà
elencate in Tabella A.1:
A-1
A-2 APPENDICE A. RICHIAMI DI ANALISI MATEMATICA
5. Se Rf (x) è una funzione dispari (f (x) = −f (−x) ∀x ≥ 0) integrabile su [−a, a], allora
a
−a
f (x)dx = 0;
Rb
6. Se a = b allora a
f (x)dx = 0.
f è detto fattore finito e g 0(x)dx fattore differenziale. Per brevità spesso si usa f (x)g(x)]ba =
f (b)g(b) − f (a)g(a)
Integrazione per sostituzione Se f (x) è una funzione continua su [a, b] e ϕ(x) è una
funzione continua, derivabile con continuità e invertibile, allora
Z d Z ϕ−1 (d)
f (x)dx = f (ϕ(x))ϕ0 (x)dx
c ϕ−1 (c)
Z +∞
1 −x2
√ xe 2 dx = 0 (NB: la funzione integranda è dispari)
−∞ 2π
(A.3.6)
Z +∞ Z +∞
1 x2 1 x2
√ x2 e− 2 dx = 2 √ x2 e− 2 dx = 1 (A.3.7)
−∞ 2π 0 2π
Dimostriamo ora che Z +∞
1 x2
√ e− 2 dx = 1 (A.3.8)
−∞ 2π
A-4 APPENDICE A. RICHIAMI DI ANALISI MATEMATICA
Serie geometrica Si ha
n
X 1 − q n+1
qj q 6= 1
j=0
1−q
Serie esponenziale
+∞ n
X x
= ex ∀x∈R
n=0
n!
Derivazione e serie
P+∞
Teorema A.4.1 Consideriamo la serie di funzioni n=1 fn (x) e supponiamo che per
ogni
P+∞ n ≥ 1 la funzione fn sia derivabile sull’intervallo
P+∞ 0 aperto (a, b), con derivata f 0 . Se
Pf+∞
n=1 n (x) converge in (a, b) e la serie n=1 fn (x) converge uniformemente su (a, b), al-
lora n=1 fn (x) e derivabile su (a, b) e la derivata della serie coincide con la serie delle
derivate.
P
Esempio A.4.2 Calcoliamo il valore delle serie +∞ x=1 x(1 − p)
x−1
per p ∈ (0, 1)
∞
X X∞ X∞
x−1 d x d
x(1 − p) = (−1)(1 − p) = (−1) (1 − p)x
x=1 x=1
dp dp x=1
d 1 1
=− −1 = 2
dp 1 − (1 − p) p
A-6 APPENDICE A. RICHIAMI DI ANALISI MATEMATICA
Appendice B
Calcolo combinatorio
B.1 Introduzione
Il calcolo combinatorio è costituito da una serie di tecniche che consentono di contare il
numero di elementi di un dato insieme senza enumerarli esplicitamente. L’importanza che
le tecniche di calcolo combinatorio hanno per il calcolo delle probabilità risiede nel fatto
che nel caso di spazi equiprobabili finiti, il problema di calcolare la probabilità di un dato
evento viene ridotto al conteggio dei modi in cui si può verificare l’evento.
{(a1 , . . . , ar ) : ak ∈ E, ah 6= ak ∀ h 6= k, h, k = 1, . . . , r} ,
{(a1 , . . . , ar ) : ak ∈ E, k = 1, . . . , r} .
1. le disposizioni senza ripetizione di classe 2 di E sono (a, b), (a, c), (b, a), (b, c), (c, a),
(c, b);
B-7
B-8 APPENDICE B. CALCOLO COMBINATORIO
2. le disposizioni con ripetizione di classe 2 di E sono (a, a), (a, b), (a, c), (b, a), (b, b),
(b, c), (c, a), (c, b), (c, c);
3. le permutazioni (o disposizioni senza ripetizione di classe 3) di E sono (a, b, c), (a, c, b),
(b, a, c), (b, c, a), (c, a, b) e (c, b, a).
Esempio B.2.3 Elencare tutte le disposizioni con o senza ripetizione di ordine 4 e tutte
le permutazioni di E = {a, b, c, d, e}.
Da qui la necessità di contare senza elencare. Per le disposizioni semplici vale la seguente
proposizione:
P (n) = n(n − 1) · · · 2 · 1.
n! := n(n − 1) · · · 2 · 1;
poniamo inoltre 0! := 1.
1
È ovvio che se il primo elemento può essere scelto in n modi ed il secondo può essere scelto in n − 1
modi per ciascuno dei modi con il quale scelgo il primo, ottengo n(n − 1) modi di scegliere primo e secondo
elemento.
B.3. COMBINAZIONI B-9
B.3 Combinazioni
Definizione B.3.1 Sia E un insieme finito. Ogni sottoinsieme di E di cardinalità r ≤ |E|
è detto combinazione di classe r di E.
La definzione afferma che le combinazioni di un insieme E sono
{F : F ⊂ E}.
Esempio B.3.2 Se E = {a, b, c}, allora
1. le combinazioni di E di classe 2 sono {a, b}, {a, c}, {b, c};
2. la combinazione di E di classe 3 è {a, b, c} = E.
Per contare il numero di combinazioni di classe r di n elementi, basta osservare che ogni
fissata combinazione dà luogo a r! disposizioni semplici di classe r. Quindi se C(n, r) indica
il numero di combinazioni di classe r di un insieme di n elementi, allora
n! n
(n)r = r!C(n, r) da cui C(n, r) = =
r!(n − r)! r
Il simbolo nr è detto coefficiente binomiale e si legge n sopra r. Abbiamo dimostrato che:
B.4 Esercizi
Esercizio B.4.1 Dimostrare che n
X n
= 2n
k=0
k
senza usare la formula del binomio di Newton.
Soluzione
(b) Se consideriamo i posti intorno al tavolo numerati, allora si hanno 7! modi di seder-
si. Se però consideriamo che la posizione relativa delle persone rispetto al tavolo è
ininfluente, cioè consideriamo due configurazioni equivalenti se si ottengono median-
te una rotazione “rigida” attorno al tavolo, si vede che il numero di configurazioni
possibili diventano: 7!/7 = 6!.
Esercizio B.4.5 Le tessere del domino sono marcate con 2 numeri. Le tessere sono sim-
metriche (cioè le coppie non sono ordinate). Quante sono le tessere che si ottengono
utilizzando i numeri 1, . . . , n?
Soluzione Le tessere del domino con i due numeri differenti sono n2 ; quelle in cui i due
numeri sono uguali sono n, in totale sono n2 + n.
Bibliografia
[1] Baldi, P. (1998) Calcolo delle probabilità e statistica, Mc Graw Hill Italia.
[2] Baldi, P. Giuliano R., Ladelli, L. (1995) Laboratorio di Statistica e Probabilità, problemi
svolti, Mc Graw Hill Italia.
[3] Bramanti, M. (1998) Calcolo delle probabilità e statistica, Progetto Leonardo Bologna.
[6] Feller, W. (1950) An Introduction to Probability Theory and Its Applications, volume 1.
John Wiley & Sons.
[7] de Finetti, B. (1970). Teoria delle probabilità. Vol. 1. Einaudi, Torino. (Disponibile
nella versione inglese Theory of probability, Wiley, New York.)
[9] Hsu, H. Probabilità, variabili casuali e processi stocastici, Schaum’s n. 93. Mc Graw
Hill Italia, 1998.
[10] Pagani, C.D. e Salsa, S. (1992) Analisi Matematica Vol. 1 e 2 Masson, Milano.
[11] Robert, C.P. e Casella, G. (1999) Monte Carlo Statistical Methods Springer, New
York.
105