Sei sulla pagina 1di 18

Probabilit` a e Statistica Appunti 2009 Marco Boella

4 Variabili aleatorie
1 Introduzione

A seconda del fenomeno che studiamo, lo spazio campionario e gli eventi di cui ci interessa calcolare la probabilit` a possono essere molto complicati da esprimere con il linguaggio della probabilit` a elementare. Esiste un meccanismo standard, per riconvertire in un linguaggio pi` u spiccatamente matematico alcuni aspetti della suddivisione dello spazio campionario in eventi. In questo capitolo studieremo tale meccanismo, osservando (e si tratta di una cosa molto importante) che questa modellizzazione matematica ha il pregio di astrarre dal fenomeno particolare, per studiarne il comportamento probabilistico da un punto di vista pi` u generale. Esempio 1. Non ci facciamo caso, ma quando lanciamo un dado immediatamente convertiamo lo spazio campionario = , , , , ,

nel pi` u comodo = {1, 2, 3, 4, 5, 6}, che tuttavia gi` a ne rappresenta una traduzione nel campo dei numeri. Esempio 2. Alcuni esempi immediati: Supponiamo di lanciare in aria per quattro volte una moneta, e di essere interessati a calcolare la probabilit` a che sui quattro lanci escano tre teste ed una croce; se volessimo descrivere questo esperimento solo con gli eventi esce testa ed esce croce, correremmo il rischio di inlarci dritti in un ginepraio di casi, sottocasi, eccetera, ` e molto meglio allora, disporre di un meccanismo che idealmente conti le teste uscite, con il quale quindi sia facile esprimere la frase sono uscite esattamente tre teste. Siamo ad un centralino e, misurando il tempo che intercorre tra una telefonata e la successiva, dobbiamo calcolare la probabilit` a che non trascorra pi` u di un minuto, evidentemente ` e comodo trasferire direttamente le relazioni tra le durate a delle relazioni tra numeri. Stiamo giocando a Monopoli, ci interessa che, al prossimo lancio dei dadi, il punteggio ottenuto sia 8, se volessimo di nuovo occuparci di questo con eventi qualsiasi, dovremmo prendere in considerazione gli eventi sul primo dado sono usciti due pallini, sul secondo dado ne sono usciti sei, sul primo dado sono usciti tre pallini, sul secondo dado ne sono usciti cinque, e cos` via no a sul primo dado sono usciti sei pallini, sul secondo dado ne sono usciti due. La trasformazione che ci permette di tradurre gli eventi della realt` a in numeri si chiama variabile aleatoria, vediamo come si costruisce e come funziona. Partiamo dallo spazio di probabilit` a (, F , P), immaginiamo di suddividere in tutti gli eventi elementari i , non ci interessa se gli i sono in numero nito o innito, una variabile aletoria X ` e una funzione da in R che fa corrispondere a ciascun i un numero reale: X ( ) = r, questa corrispondenza deve avvenire in modo che r R linsieme Ar cos` denito Ar = { |X ( ) r}, sia un evento. Evidenziamo tutto ci` o in una denizione. Denizione 1 (Variabile aleatoria). Dato uno spazio di probabilit` a (, F , P), si dice variabile aleatoria una corrispondenza tra gli elementi di ed i numeri (reali). Per poter essere una variabile aleatoria, tale corrispondenza deve soddisfare la seguente propriet` a Ar = { | X ( ) r } F r R

Chiameremo supporto linsieme dei valori che la variabile aleatoria pu` o assumere.

Probabilit` a e Statistica Appunti 2009 Marco Boella Esempio 3. Riprendiamo i tre esempi (la moneta, le telefonate e i dadi).

Nellesempio della moneta, ` e formato da tutte le quaterne con gli esiti dei lanci, con ovvia simbologia: = {T1 T2 T3 T4 , T1 T2 T3 C4 , . . . , C1 C2 C3 T4 , . . . C1 C2 C3 C4 } ciascun i ` e allora una di queste quaterne (quante sono?) e levento sono uscite tre teste ed una croce corrisponde allevento E = {T1 T2 T3 C4 , T1 T2 C3 T4 , T1 C2 T3 T4 , C1 T2 T3 T4 } se adesso introduciamo la variabile aleatoria X =numero di teste uscite su quattro lanci, possiamo scrivere (X = 3) = E = {T1 T2 T3 C4 , T1 T2 C3 T4 , T1 C2 T3 T4 , C1 T2 T3 T4 }. Nellesempio del centralino, supponiamo che il tempo intercorso tra una telefonata e la successiva venga misurato in secondi, possiamo pensare che lo spazio campionario sia composto da tutti i numeri positivi, deniamo allora la variabile aleatoria X = Tempo (in secondi) intercorso tra la terza e la quarta telefonata, la probabilit` a che il tempo intercorso tra la terza e la quarta telefonata sia al massimo un minuto pu` o scriversi allora come P [Al massimo un minuto tra terza e quarta telefonata] = P [X 60] . Per quanto riguarda i dadi, sappiamo che =

, , , , ... ,    
(X = 8) = S8 .

levento che corrisponde a la somma vale 8, chiamiamolo S8 , ` e dato da tutte e sole le coppie sottoelencate: S8 = , , , , , se allora X ` e la variabile aleatoria somma dei risultati, allora

Anche dagli esempi, appare evidente lesistenza di due dierenti tipi di variabili aleatorie: quelle che possono assumere certi valori ben precisi (pensiamo alla moneta o ai dadi, ma pensiamo anche alla variabile aleatoria che descrive il numero di stelle presenti nelluniverso: questultima a priori pu` o assumere anche valori innitamente grandi, tuttavia ` e vincolata ad assumere valori interi), e quelle che assumono a priori qualsiasi valore di un intervallo, limitato o illimitato che sia (ad esempio, il tempo che intercorre tra le due telefonate). Le variabili aleatorie del primo tipo si dicono variabili aleatorie discrete, quelle del secondo tipo variabili aleatorie continue. In eetti, vi ` e un terzo tipo di variabili aleatorie, le cosiddette variabili aleatorie miste, costituite come suggerisce il nome dalla combinazione di una componente discreta e di una continua. Delle variabili miste parleremo pi` u avanti, per ora limitiamoci a considerare le variabili aleatorie discrete e continue: le denizioni e le propriet` a che regolano limpiego delle prime e delle seconde sono leggermente dierenti; deniremo separatamente i due tipi, dopodich e esporremo in parallelo le propriet` a e le applicazioni di entrambe.

Probabilit` a e Statistica Appunti 2009 Marco Boella

2
2.1

Denizioni
Densit` a di variabili aleatorie discrete

Abbiamo visto che una variabile aleatoria X discreta pu` o assumere solo certi valori, siano essi xi (se sono in numero nito, i {1, 2, ..., n}, altrimenti i {1, 2, ...}); per ciascuno di essi, potremo denire la probabilit` a che X assuma proprio quel valore: P [X = xi ] = pX (xi ); ovviamente, avremo pX (xi ) = 1;
i

loggetto pX che abbiamo ricavato ` e fondamentale, mettiamolo in evidenza attribuendogli un nome. Denizione 2 (Densit` a di probabilit` a di una variabile aleatoria discreta). Linsieme delle quantit` a pX (xi ) (= P [X = xi ]) ` e detto densit` a (discreta) della variabile X . Possiamo a questo punto denire in maniera univoca la probabilit` a che X assuma certi valori: supponiamo di dover calcolare P [a < X b], innanzitutto stabiliamo quali dei possibili valori di X stanno eettivamente tra a e b, questi formeranno un sottoinsieme (chiamiamolo A) di tutti gli xi : A = {xi |a < xi b}, ora, P [a < X b] altro non ` e che la somma delle probabilit` a relative agli xi che appartengono ad A: P [ a < X b] =
xi A

P [X = xi ] ;

analogamente, possiamo elencare per maggior chiarezza alcuni dei casi possibili P [ X c] P [X > d] =
xi A

P [X = xi ] P [X = xi ]
xi A

ove A = {xi |xi c}, ove A = {xi |xi > d}.

Osserviamo poi che pu` o sussistere una dierenza sostanziale tra P [a < X b] e P [a < X < b], infatti P [a < X b] = P [a < X < b] + P [X = b] , e, se uno degli xi coincide con b, P [X = b] ` e un numero diverso da zero. Inoltre, visto che si tratta di eventi complementari, abbiamo la seguente relazione: P [X > d] = 1 P [X d] . Esempio 4. Sia X la variabile aleatoria Numero di Teste uscite dopo due lanci duna moneta equilibrata. Possiamo elencare cos` gli elementi dello spazio : = {(T, T ); (T, C ); (C, T ); (C, C )} ; si tratta chiaramente di uno spazio equiprobabile, il che signica che ciascuna delle quattro coppie ha probabilit` a 1/4 di accadere. Evidentemente, X pu` o assumere i valori 0 (due croci), 1 (una testa ed una croce) e 2 (due teste). Scriviamo allora esplicitamente la corrispondenza denita da X : X (T, T ) = 2 X (C, T ) = X (T, C ) = 1 X (C, C ) = 0,

Probabilit` a e Statistica Appunti 2009 Marco Boella o anche (T, T ) (X = 2); quindi P [X = 2] = A titolo di esempio: P [2 < X < 0.5] = P [X = 0] 0` e lunico valore tra -2 e 0.5. P [2 < X < 0.5] = P [2 < X 0.5] 0.5 non ` e tra i valori di X . P [0 < X 2] = P [X = 1] + P [X = 2] P [0 < X < 2] = P [X = 1] 1 ; 4 P [X = 1] = 2 ; 4 P [X = 0] = 1 . 4 (T, C ) (C, T ) (X = 1); (C, C ) (X = 0);

La densit` a pX non ` e una funzione, possiamo comunque rappresentarla gracamente, evidenziando con barre verticali i valori che assume: p X ( x) 0.5

0.25

2.2

Densit` a di variabili aleatorie continue

Se X ` e una variabile aleatoria continua, cambia completamente lambiente nel quale ci muoviamo: ora il supporto (ossia i valori che X pu` o assumere) costituisce un insieme I R, che ha la potenza del continuo; questo impone che la probabilit` a che X assuma un preciso valore di I debba per forza essere 0. In altre parole, se X ` e continua, qualsiasi sia a, P [X = a] = 0. A molte variabili aleatorie continue ` e possibile associare una funzione di densit` a di probabilit` a fX tale per cui, a, b R,
b

P [a < X b] =
a

fX (x) dx

per distinguerle, queste vengono chiamate variabili aleatorie assolutamente continue Notiamo che possiamo prolungare la funzione di densit` a a tutti i valori reali, con la semplice relazione x I fX ( x) = 0 . Riordiniamo quanto abbiamo detto in una denizione: Denizione 3 (Funzione densit` a di probabilit` a di una variabile aleatoria continua). Sia X una variabile aleatoria continua, se esiste una funzione fX tale per cui, a, b R,
b

P [a < X b] =
a

fX (x) dx,

allora fX (x) ` e detta funzione densit` a di probabilit` a di X .


Ci` o signica che esistono variabili aleatorie continue cui non ` e possibile associare una densit` a, di queste non ci occuperemo, e pertanto useremo senza pericolo di equivoco la dicitura variabile aleatoria continua intendendo in realt` a variabile aleatoria assolutamente continua.

Probabilit` a e Statistica Appunti 2009 Marco Boella Osserviamo alcune cose:

altro non ` e che una somma dei valori di fX (x), fatta per tutti i valori della x tra a e b, tale denizione si ricollega a quella analoga per le variabili aleatorie discrete.

b a

Sia per la denizione di integrale, sia per quanto dicevamo pi` u sopra, se X ` e una variabile aleatoria continua luguaglianza P [a < X b] = P [a < X < b] ` e sempre vera, contrariamente a quanto pu` o accadere con le variabili aleatorie discrete. Ovviamente, fX (x) 0 per ogni x R; e fX (x) > 0 solo se x I . Per denizione di probabilit` a,
+

fX (x) dx = 1.

Esaminiamo brevemente, adattandole al caso continuo, le probabilit` a elencate pi` u sopra riguardo alle variabili aleatorie discrete:
c

P [X c] P [X c]

= =

P [X < c] = P [X > c] =
c

fX (x) dx,
+

fX (x) dx.

Esempio 5. Supponiamo che sia possibile estrarre un numero reale a caso nellintervallo [1, 3], in modo ` chiaro che nessuna zona dellintervallo sia privilegiata. Sia Y la variabile aleatoria numero estratto. E che il supporto di Y ` e dato dallo stesso intervallo [1, 3], e che su questo intervallo la funzione densit` a avr` a un valore costante k (equivalente probabilistico di una sbarretta omogenea), la fY sar` a allora denita nel modo seguente: 0 x < 1 fY (x) = k 1 x 3 , 0 x>3 quanto vale k ? Sfruttiamo il fatto che per ogni densit` a
+ 3

fY (x) dx = 1: k dx = 2k = 1,
1

fY (x) dx = 1
1 pertanto k = 2 . Il graco di fY ` e indicato in gura

fY (x) 1

0.5

2.3

Funzioni di ripartizione

Sia nel caso di una variabile aleatoria discreta, sia nel caso di una variabile aleatoria continua, possiamo denire la funzione di ripartizione, o funzione cumulativa:

Probabilit` a e Statistica Appunti 2009 Marco Boella Denizione 4 (Funzione di ripartizione). Data una variabile aleatoria X , la funzione FX (t) = P [X t] prende il nome di funzione di ripartizione di X .

Ovviamente, le modalit` a eettive di calcolo della FX dieriscono per le variabili aleatorie discrete e continue:
t

FX (t) =
xi t

P [X = xi ]

oppure

FX (t) =

fX (x) dx.

Esempio 6. Le funzioni di ripartizione delle due variabili aleatorie X e Y degli esempi 4 e 5 hanno le seguenti espressioni: 0 1 4 3 4 1 x<0 0x<1 , 1x<2 x2 0 x1 FY (x) = 2 1 x<1 1x<3. x3

FX (x) =

I graci delle due F sono riportati qui di seguito FX ( x ) 1 0.75 0.5 0.25 1 2 x 1 3 x 0.5 FY (x) 1

Possiamo subito fare alcune osservazioni. Se X ` e discreta, la FX sar` a fatta a scalini, come nella prima gura: in corrispondenza di ogni scalino, la F ` e continua a destra; nella gura, evidentemente tutti gli xi sono rappresentati, dato che F raggiunge il valore 1. Se X ` e continua, allora la sua F dovr` a essere continua (essendo lintegrale di una funzione f che, perlomeno, ` e continua a tratti. Riassumendo, le principali propriet` a della F sono le seguenti: F ` e compresa tra 0 e 1. F ` e crescente (meglio: non decrescente). limt FX (t) = 0 e limt+ FX (t) = 1. F ` e limitata a sinistra e continua a destra. F ` e una funzione continua se X ` e continua, F ` e fatta a scalini se X ` e discreta. Il ruolo di F ` e fondamentale per calcolare le probabilit` a, esse possono essere sempre scritte in funzione di F ; se X ` e discreta: P [a < X b] = FX (b) FX (a) P [X > a] = (1 P [X a]) = 1 FX (a)

Probabilit` a e Statistica Appunti 2009 Marco Boella (ricordando che in questo caso pu` o capitare che P [X < b] = P [X b]); se X ` e continua P [a < X < b] = P [a X b] = FX (b) FX (a) P [X < b] = P [X b] = FX (b) P [X > a] = P [X a] = 1 FX (a).

3
3.1

Indici di posizione di una varabile aleatoria


Valore atteso di una variabile aleatoria
+

Denizione 5 (Valore atteso). Data una variabile aleatoria X , il suo valore atteso, se esiste, ` e dato da: E [X ] =
i

xi P [X = xi ]

E [X ] =

xfX (x) dx.

Osserviamo che si tratta di una media pesata dei valori che X pu` o assumere. Come ` e accaduto per la funzione di ripartizione, anche in questo caso la denizione matematica cambia a seconda che si tratti di variabile aleatoria discreta o continua. Esempio 7. Supponiamo che X possa assumere unicamente i valori -2, 0 e 1, con la seguente legge: P [X = 2] = il valore atteso di X sar` a allora E [X ] = 2 1 1 1 3 +0 +1 = . 10 5 2 10 3 , 10 P [X = 0] = 1 , 5 P [X = 1] = 1 ; 2

Esempio 8. Prendiamo adesso la variabile aleatoria continua Y denita dalla funzione di densit` a 1 y 2 1 < y < 2 fY (y ) = 3 , 0 altrove calcoliamo E [Y ]:
+ 2

E [Y ] =

yfY (y ) dy =
1

1 2 y 3

dy =

1 y4 3 4

=
1

5 . 4

Il valore atteso gode delle seguenti propriet` a, la prima ` e immediata, la seconda costituisce una formula alternativa per il calcolo di E [X ]. Propriet` a 1. Siano a e b due numeri reali, allora: E [a] = a, E [aX + b] = aE [X ] + b. Propriet` a 2. Sia X una qualsiasi variabile aleatoria, e sia FX la sua funzione di ripartizone, allora
0 +

E [X ] =

FX (x) dx +
0

[1 FX (x)] dx.

Probabilit` a e Statistica Appunti 2009 Marco Boella Dimostrazione: Dimostriamo questa propriet` a nel caso in cui X sia continua, per denizione di FX si ha che
+ x

[1 FX (x)] =
x

fX (t) dt

FX ( x ) =

fX (t) dt

quindi
+ + t=+

[1 FX (x)] dx =
0 + x=t 0

dx
t=x +

fX (t) dt = tfX (t) dt,


0

=
0

dt
x=0

fX (t) dx =

allo stesso modo


0 t=0 x

FX (x) dx =
0 t= x=0

dx

fX (t) dt =
0

dt
x=t

fX (t) dx =

tfX (t) dt,

e pertanto, unendo le due formule:


+ 0

[1 FX (x)] dx +
0 + 0

FX (x) dx =
+

=
0

tfX (t) dt +

tfX (t) dt =

tfX (t) dt = E [X ] .

3.2

Moda, Quantili e Mediana

Denizione 6 (Moda). Sia X una variabile aleatoria discreta o continua, si chiama moda di X il valore, se esiste, per cui ` e massima la densit` a. Se X ` e discreta, la moda esiste sempre (ma potrebbe non essere unica: due o pi` u valori potrebbero avere lo stesso valore della densit` a pX ), se X ` e continua, pu` o anche capitare che la moda non esista. Esempio 9. ) Sia X la variabile aleatoria dellesempio 4, la moda di X ` e 1. ) Sia Y la variabile aleatoria esito del lancio di un dado, ciascuno dei 6 valori di Y ` e la sua moda. ) Siano U , V e W le variabili aleatorie con densit` a rispettivamente fU (x) = 6x(1 x) 0 x 1 0 altrove 1 x 1 altrove 0<x<1 altrove

3 x2 fV ( x) = 2 0 1 fW (x) = 2 x 0

la moda di U ` e 1 2 , V ha come mode 1 e 1, W non ha moda.


Ricordiamo

che negli integrali doppi, sotto ipotesi per noi sempre vericate, ` e possibile scambiare lordine di

integrazione.

Probabilit` a e Statistica Appunti 2009 Marco Boella

Denizione 7 (Quantile). Dato (0, 1), si dice quantile di ordine della variabile aleatoria X il pi` u piccolo numero x tale che P [X < x ] P [X x ] . Osserviamo che, se X ` e una variabile aleatoria continua e ha come supporto un intervallo, il quantile x ` e lunica soluzione dellequazione FX (x ) = : 1 FX (x) x x

mentre in tutti gli altri casi lequazione FX (x ) = pu` o non avere soluzione (in presenza di un punto di discontinuit` a di F ) o averne innite (quando FX (x) = per ogni x [a, b)): 1 FX (x) 1 FX ( x )

x x

nel primo caso si sceglie come quantile lascissa del punto di discontinuit` a, nel secondo caso lascissa dellestremo sinistro dellintervallo: 1 FX (x) 1 FX ( x )

x Un particolare quantile ` e la mediana: Denizione 8 (Mediana). Si dice mediana della variabile aleatoria X il quantile di ordine 0.5: x0.5 . Esempio 10. Calcoliamo il generico quantile di ordine della variabile aleatoria dellesempio 7. Ricaviamo immediatamente che x x x

Probabilit` a e Statistica Appunti 2009 Marco Boella

10

1 0 x < 2 0.3 2 x < 0 FX (x) = , 0.5 0 x < 1 1 x1

0.5 0.3 2 1 x

Pertanto

0 < 0.3 0.3 < 0.5 > 0.5

x = 2, x = 0, x = 1.

Esempio 11. Calcoliamo il generico quantile y di ordine della variabile aleatoria dellesempio 8. Poich e y 1 2 1 t dt = (y 3 + 1), 3 9 1 allora

1 0 1 3 FY (y ) = (y + 1) 9 1 y < 1 1 y < 2 , y2

in un caso come questo ` e suciente, posto 0 < < 1, osservare che y ` e lunica soluzione dellequazione FY (y ) = , poich e senzaltro 1 < y < 2 possiamo scrivere: 1 3 (y + 1) = , 9 y = 3 9 1.

Variabile aleatoria funzione di unaltra variabile aleatoria

In generale, se X ` e una variabile aleatoria e g ` e una funzione reale di variabile reale, allora anche g (X ) ` e una variabile aleatoria. A partire da FX ` e allora possibile calcolare le probabilit` a relativamente alla nuova variabile aleatoria g (X ), illustreremo tale metodo con due esempi. Esempio 12. Sia X la variabile aleatoria il cui supporto ` e lintervallo [0, 2], avente la seguente funzione di ripartizione: x<0 0 x 0x<2 FX (x) = 2 1 x 2

Probabilit` a e Statistica Appunti 2009 Marco Boella

11

Deniamo le seguenti variabili aleatorie: V = X 2 , W = eX ; calcoliamo FV e FW . Consideriamo dapprima V , ovviamente il supporto di V sar` a lintervallo [0, 4], pertanto FV (v ) = 0 v 0 mentre, se v [0, 4]: FV (v ) = P [V v ] = P X 2 v = P quindi, poich` e v [0, 4] v [0, 2]: 0 v FV (v ) = FX ( v ) = 2 1 X v = FX ( v ), e FV (v ) = 1 v 4;

v<0 0v<4. v4

Consideriamo ora W , il cui supporto sar` a [e0 , e2 ] = [1, e2 ], di nuovo: FW (w) = 0 mentre, se w [1, e2 ]: FW (w) = P [W w] = P eX w = P [X log w] = FX (log w), quindi, poich` e w [1, e2 ] log w [0, 2]: 0 log w FW (w) = FX (log w) = 2 1 w 1 e FW (w) = 1 w e2 ;

w<1 1 w < e2 . w e2

Questo metodo si pu` o applicare (con la dovuta attenzione) a variabili aleatorie di ogni tipo. Inoltre, solo nel caso che X sia continua, vale il seguente teorema: Teorema 1. Sia X una variabile aleatoria continua e sia Y = g (X ). Se g ` e una funzione invertibile nel supporto di X , e h ` e la sua inversa , allora: fY (y ) = fX (h(y ))|h (y )|. Dimostrazione: Supponiamo che g sia crescente, allora FY (y ) = P [Y y ] = P [g (X ) y ] =
g (x)y

f (x)dx

adesso sfruttiamo le regole dellintegrazione per sostituzione (se x = h(t), e h > 0): f (x)dx =
g (x)y ty

f (h(t))h (t)dt.

Da questo caso generale ne discende in particolare, se il legame tra X e Y ` e lineare (Y = aX + b), che fY (y ) = fX
Cio` e

yb a

1 . |a|

h(g (x)) = x, x I .

Probabilit` a e Statistica Appunti 2009 Marco Boella

12

4.1

Un importante esempio Simulazione


0 FX (x) = x 1

Sia X una variabile aleatoria tale che 1 0x1 0 altrove x<0 0x<1 x1

fX (x) =

e sia G una funzione di distribuzione continua e strettamente crescente. Mostriamo che, se Y = G1 (X ), allora FY (y ) = G(y ), infatti FY (y ) = P [Y y ] = P G1 (X ) y = P [X G(y )] = G(y ). Questo risultato ` e molto utile qualora sia necessario simulare una variabile aleatoria continua Y , infatti X rappresenta un numero estratto in maniera casuale nellintervallo [0, 1] (cio` e, loutput di una routine random) e, note che siano G e G1 , ` e possibile trasformare X in Y .

4.2

Valore atteso di una funzione di una variabile aleatoria

Il nostro scopo sar` a ora il seguente: abbiamo una certa variabile aleatoria X , della quale conosciamo densit` a eccetera, abbiamo poi una variabile aleatoria Y che ` e funzione di X (cio` e Y = g (X )), dobbiamo calcolare E [g (X )]. Ovviamente ` e possibile farlo a patto di ricavare la densit` a della g (X ), ma abbiamo appena visto che ci` o non ` e sempre agevole. Il prossimo teorema fornisce una scorciatoia. Teorema 2. Sia X una variabile aleatoria e Y = g (X ) una sua funzione, allora, se E [g (X )] esiste, si ha
+

E [g (X )] =
i

g ( xi ) P [X = xi ] ,

E [g (X )] =

g (x)fX (x) dx.

Dimostrazione: Lo dimostriamo nel caso discreto. Ogni yj ` e immagine di uno o pi` u xi , chiamiamoli xj,i , cio` e g (xj,i ) = yj i, questo signica che P [Y = yj ] =
i

P [X = xj,i ] .

Calcoliamo il valore atteso di g (X ): E [g (X )] = E [Y ] =


j

yj P [Y = yj ] =
j

yj
i

P [X = xj,i ] ,

e quindi E [g (X )] = E [Y ] =
j i

yj P [X = xj,i ] ,

ma proprio poich e yj = g (xj,i ) possiamo scrivere che yj P [X = xj,i ] =


j i j i

g (xj,i )P [X = xj,i ] ,

osserviamo che lultima somma viene eettuata (anche se in ordine sparso) su tutti gli xi , quindi altro non ` e che i g (xi )P [X = xi ].

Probabilit` a e Statistica Appunti 2009 Marco Boella

13

Esempio 13. Riprendiamo le variabili aleatorie X e Y degli esempi 7 e 8, e proviamo a calcolare E X 2 , E Y 2 e E eY : 1 1 17 3 + (0)2 + (1)2 = ; E X 2 = (2)2 10 5 2 10
+

E Y e

1 y5 y fY (y ) dy = y y dy = 3 3 5 1
2 21 2 + 2

=
1

31 15

E eY

= =

1 ey y 2 dy = 3 1 2 5 1 y 2 2 e (y 2y + 2) 1 = e2 . 3 3 3e ey fY (y ) dy =

Momenti di una variabile aleatoria

Denizione 9 (Momenti di una variabile aleatoria). Si dice momento k -esimo di una variabile aleatoria X , e si indica con k , la seguente quantit` a:
+

k = E X k =
i

xk i p X ( xi ) ,

k = E X k =

xk fX (x) dx.

Osserviamo che il momento primo di una variabile aleatoria ` e lo stesso valore atteso, ci` o spiega perch e useremo sovente (quando sar` a chiaro dal contesto) il simbolo per la media di X .

5.1

Varianza di una variabile aleatoria

Denizione 10 (Varianza). Data una variabile aleatoria X , il cui valore atteso vale E [X ] = , si chiama Varianza di X , e si indica con Var [X ] il seguente valore atteso: Var [X ] = E (X )2 . Possiamo dimostrare la seguente formula Proposizione 1. Var [X ] = E X 2 2 . Dimostrazione: Var [X ] = E (X )2 = E X 2 2X + 2 = = E X 2 2E [X ] + 2 = = E X 2 2 = E X 2 (E [X ])2 . Osserviamo quindi che, a partire dai momenti di X , possiamo scrivere Var [X ] = 2 (1 )2 . Come per il valore atteso, anche per la varianza valgono alcune semplici propriet` a: Propriet` a 3. Siano a e b due numeri reali, allora: Var [a] = 0.

Probabilit` a e Statistica Appunti 2009 Marco Boella Var [aX + b] = a2 Var [X ].

14

Esempio 14. Possiamo calcolare le varianze delle due variabili aleatorie X e Y denite negli esempi 7 e 8, sappiamo gi` a (esempio 13) che E [X ] = 1 , 10 E X2 = 17 , 10 E [Y ] = 5 , 4 E Y2 = 31 ; 15

e ricaviamo velocemente, usando la proposizione sopra dimostrata: Var [X ] = 17 1 10 10


2

169 , 100

Var [Y ] =

31 15

5 4

121 . 240

Esempio 15. Qual ` e il signicato della varianza? Vediamo di calcolare la varianza delle quattro variabili aleatorie cos` denite: P [X1 = 1] = 0.5 P [X2 = 10] = 0.5 P [X1 = 1] = 0.5 P [X2 = 10] = 0.5 P [Y1 = 61] = 0.5 P [Y1 = 59] = 0.5 si vede subito che E [X1 ] = E [X2 ] = 0 facendo poi i conti
2 E X1 = (1)2 0.5 + (1)2 0.5 = 1 2 E X2 = (10)2 0.5 + (10)2 0.5 = 100

P [Y2 = 70] = 0.5 ; P [Y2 = 50] = 0.5 E [Y1 ] = E [Y2 ] = 60,

E Y12 = (59)2 0.5 + (61)2 0.5 = 3601 E Y22 = (50)2 0.5 + (70)2 0.5 = 3700 pertanto Var [X1 ] = 1 (0)2 = 1 Var [Y1 ] = 3601 (60)2 = 1 Var [X2 ] = 100 (0)2 = 100 Var [Y2 ] = 3700 (60)2 = 100.

A conferma di quanto enunciato sopra tra le due propriet` a della varianza, vediamo in eetti che, in accordo con le relazioni X1 + 60 = Y1 e X2 + 60 = Y2 , si ha ovviamente Var [X1 ] = Var [Y1 ] e Var [X2 ] = Var [Y2 ]; e, in accordo con X2 = 10 X1 , si ha Var [X2 ] = (10)2 Var [X1 ]; possiamo quindi vedere come la varianza sia tanto pi` u elevata quanto pi` u i valori della variabile aleatoria si discostano dalla loro media. Lultimo esempio mostra che, almeno a livello qualitativo, ` e possibile interpretare la varianza come un numero che misura la dispersione dei valori di una variabile aleatoria rispetto alla sua media. Questo aspetto potr` a essere meglio precisato, e soprattutto reso quantitativo, con la disuguaglianza di Cebicev, argomento dellultimo paragrafo.

Variabili aleatorie miste

Vi sono variabili aleatorie che non sono n e continue n e discrete. Possono essere molto complesse. Noi, come nellesempio seguente, ci limiteremo a qualche cenno a variabili aleatorie date dalla combinazione di una parte discreta e di una parte continua. Esempio 16. La casa di Aldo si trova in una strada a senso unico, in fondo ad essa si trova un semaforo, che alterna 10 secondi di rosso a 15 secondi di verde. Quando Aldo esce di casa, lo fa senza badare al colore del semaforo: alcune volte lo trover` a rosso, altre volte lo trover` a verde; sia X la variabile aleatoria tempo che Aldo resta fermo al semaforo, determiniamo la distribuzione di X .

Probabilit` a e Statistica Appunti 2009 Marco Boella

15

Osserviamo innanzitutto che, nellipotesi che il momento in cui Aldo arriva al semaforo sia casuale (cio` e: nessun istante ha pi` u o meno probabilit` a di qualsiasi altro), con probabilit` a 3/5 Aldo trover` a il semaforo verde, e quindi P [X = 0] = 3/5; viceversa, con probabilit` a 2/5 trover` a il semaforo rosso, e dovr` a attendere il ritorno del verde, quindi condizionatamente al fatto che Aldo trovi il semaforo rosso, egli dovr` a attendere un tempo (misurato in secondi) X distribuito in maniera casuale tra 0 e 10, cio` e, se 0 x 10 x ; P [X x|il semaforo ` e rosso] = 10 allora, usando il teorema delle probabilit` a totali (il semaforo o ` e rosso, evento R, oppure ` e verde, evento V , quindi si tratta di una partizione): FX (x) = P [X x] = P [X x|V ] P [V ] + P [X x|R] P [R] ; ora, per quanto abbiamo detto 0 1 x<0 , x0 0x P [X x|R] = 10 1 x<0 0 x < 10 , x 10

P [X x|V ] =

e quindi 2 3 0 +0 5 5 x 2 3 FX ( x ) = +1 10 5 5 3 2 1 + 1 5 5 eccone il graco FX (x) 1 0.6 0 15 + x 0 x < 10 = 25 1 x 10 x<0 x<0 0 x < 10 x 10

10

Si vede allora che il comportamento di una variabile aleatoria mista ` e esprimibile mediante la sua funzione di ripartizione, mentre non ` e possibile scriverne n e la densit` a discreta, n e la densit` a continua. Ci` o porta con s e limpossibilit` a di calcolare il valore atteso di una variabile aleatoria mista con le formule che usano la densit` a, lunica via attualmente percorribile ` e data dalla propriet` a 2, quindi ricordiamo che
0 +

E [X ] =

FX (x) dx +
0

[1 FX (x)] dx.

Esempio 17. Continuiamo lesempio del semaforo, a conti fatti si ha che in media Aldo aspetta al semaforo E [X ] = 2 secondi. Per quanto riguarda la varianza, sappiamo di dover calcolare E X 2 , lunico sistema per il momento a nostra disposizione consiste nel ricavare la funzione di ripartizione della variabile X 2 , ma vedremo pi` u avanti che esiste unaltra strada pi` u ragionevole di eettuare tali conti.

Probabilit` a e Statistica Appunti 2009 Marco Boella

16

Unosservazione e due disuguaglianze importanti

` una cosa cui nora non abbiamo badato, ma, in linea generale, non ` E e detto che sia sempre possibile calcolare il valore atteso o la varianza di una variabile aleatoria. Se ad esempio X ha la seguente funzione di densit` a (densit` a di Cauchy): 1 x R, fX (x) = (1 + x2 ) calcolarne il valore atteso signica calcolare lintegrale (improprio)
+

E [X ] =

1 dx, (1 + x2 )

che non converge. Tale situazione non ` e prerogativa esclusiva delle variabili aleatorie continue: supponiamo che Y abbia la seguente densit` a (discreta): P [Y = n] = pY (n) = 6 ; n2 2
+

n = 1, 2, 3, . . . ;

il suo valore atteso ` e pertanto la somma della seguente serie:


+

E [Y ] =
n=1

n pY (n) =
n=1

6 6 = 2 n2 2

1 , n n=1

che non converge. Per quanto ci riguarda, notiamo che tutte le variabili aleatorie che incontreremo saranno dotate di valore atteso e varianza; ` e tuttavia importante sapere che tale (frequentissima) propriet` a pu` o anche non sussistere.

7.1

Disuguaglianze di Markov e Cebicev

Teorema 3 (Disuguaglianza di Markov). Sia X una variabile aleatoria, sia g : R R una funzione tale che g (x) 0 per qualsiasi x R. Allora, se esiste E [g (X )], si ha: P [g (X ) K ] E [g (X )] K K > 0.

Dimostrazione: Dimostriamo la disuguaglianza nel caso in cui X sia continua (il caso discreto pu` o costituire un ottimo esercizio!):
+

E [g (X )]

g (x)fX (x) dx g (x)fX (x) dx


{x|g (x)K }


{x|g (x)K }

KfX (x) dx K
{x|g (x)K }

fX (x) dx = K P [g (X ) K ]

basta dividere il primo e lultimo termine della catena di disuguaglianze per K e si ottiene la tesi. Teorema 4 (Disuguaglianza di Cebicev). Sia X una variabile aleatoria qualsiasi, dotata di media e di varianza. Allora Var [X ] > 0. P [|X E [X ] | ] 2

Probabilit` a e Statistica Appunti 2009 Marco Boella ` la disuguaglianza di Markov, con Dimostrazione: E g (X ) = (X E [X ])
2

17

K = 2 .

Esempio 18. Sia X la variabile aleatoria con la seguente funzione di densit` a: 3 (1 x2 ) 1 x 1 fX ( x) = 4 . 0 altrove con pochi conti, grazie alla simmetria di fX , si trova P |X | > 1 =2 2
1

fX (x) dx =
1 /2

5 = 0.3125; 16

1 , se valutiamo la stessa probabilit` a attraverso la disugaglianza di Cebicev, poich e E [X ] = 0 e Var [X ] = 5 otteniamo 4 1 Var [X ] 1 = = 0.8. = P |X 0| > P |X | > 2 2 (1/2)2 5

Da un primo confronto, potrebbe sembrare che la disuguaglianza di Cebicev fornisca un limite abbastanza grossolano, in eetti, come si vede dal seguente esempio, tale limite non ` e migliorabile. Esempio 19. Sia X la variabile aleatoria discreta P [X = 1] = P [X = 1] = 0.2 P [X = 0] = 0.6,

si vede subito che E [X ] = 0 e Var [X ] = 0.4, e la disuguaglianza di Cebicev diventa P [|X | t] 0.4 , t2

se poniamo t = 1, si trova P [|X | 1] 0.4, ma facendo direttamente i conti, si trova che P [|X | 1] = P [{X = 1} {X = 1}] = P [X = 1] + P [X = 1] = 0.4, e quindi in questo caso la disuguaglianza ` e valida con il segno =.

Esercizi
1. Lanciamo due dadi equilibrati, calcolare la densit` a, il valore atteso e la varianza delle seguenti variabili aleatorie: a) X =somma dei punteggi; b) Y =valore assoluto della dierenza tra i punteggi; c) V =massimo tra i due punteggi; d) W =minimo tra i due punteggi. 2. Le due variabili aleatorie X e Y hanno densit` a data rispettivamente da: x2 0 1 < x < 2 altrove 4 y fY (y ) = 0 y>1 altrove

fX (x) =

determinare , , valore atteso e varianza di entrambe.

Probabilit` a e Statistica Appunti 2009 Marco Boella

18

3. I dischi di metallo prodotti dalla ditta XYZ hanno un raggio R compreso tra 9.5 e 10 cm (supponiamo che tutti i valori di tale intervallo siano equiprobabili). Scrivere la funzione fR di densit` a della variabile aleatoria R, calcolare il raggio medio, calcolare larea media di uno di tali dischetti, calcolare la probabilit` a che larea A di uno di tali dischetti sia inferiore a 95 cm2 , trovare unespressione per il quantile di ordine della variabile aleatoria A, quanto vale la mediana di A? 4. La varibile aleatoria L ha funzione di densit` a data da x2 1 < x < 3 2 fL (x) = 0 altrove determinare in modo che la fL sia eettivamente la densit` a di una variabile aleatoria; se adesso L rappresenta il lato di un cubo, calcolare la densit` a, il valore atteso e la varianza della variabile aleatoria V =volume del cubo. 5. Aldo e Bruno giocano a testa o croce con una moneta equilibrata: se esce testa al primo lancio Aldo d` a a Bruno 2$, se esce al secondo Aldo d` a a Bruno 8$, se esce al terzo Aldo d` a a Bruno 16$, se in tutti e tre i lanci esce croce, allora Bruno d` a ad Aldo una certa somma. Determinare tale somma, in modo che il gioco sia equo. 6. Sia X una variabile aleatoria tale che E [X ] = Var [X ] = 1, cosa si pu` o dire di P [|X 1| 2]? E cosa si pu` o dire di P [X 1 2]? 7. Tagliamo unassicella di legno lunga 2 metri in un punto preso a caso in maniera uniforme lungo essa, ricavando due assicelle. Trovare la densit` a della variabile aleatoria area del rettangolo avente come lati le due assicelle, trovarne media, varianza ed il generico quantile di ordine . 8. Un arciere scocca una freccia contro un bersaglio circolare. Questo bersaglio ` e formato da tre regioni concentriche: un disco centrale di 10cm di raggio e due anelli circolari, il primo tra 10cm e 20cm ed il secondo tra 20cm e 30cm. Larciere ha una probabilit` a pari a 0.1 di mancare il bersaglio, se invece il bersaglio viene colpito, allora la freccia colpisce con la stessa probabilit` a qualsiasi punto del bersaglio. Larciere segna 0, 1, 3 o 5 punti a seconda che non colpisca il bersaglio, o che colpisca lanello pi` u esterno, quello mediano o il disco centrale. Determinare la densit` a della variabile aleatoria X =punteggio sul singolo lancio, calcolarne la media e la varianza. 9.

 Come lesercizio precedente, ma ora il punteggio ottenuto ` e uguale alla distanza (in cm) dal

bordo del bersaglio del punto in cui la freccia si ` e conccata. Determinare il punteggio medio. (Suggerimento: trovare prima la funzione di distribuzione del punteggio.)

Potrebbero piacerti anche