Sei sulla pagina 1di 46

DISTRIBUZIONI DI PROBABILIT

A tutte le variabili casuali, discrete e continue, associata una distribuzione che permette di calcolare le probabilit degli eventi possibili. possibili Nel caso discreto, tale distribuzione discreto soddisfa le due condizioni:

1. 0 p ( xi ) 1 2.

p( xi ) = 1
f (x) 0

Nel caso continuo, si tratta di una continuo funzione che soddisfa le due condizioni:

1. 2.

f ( x )dx = 1
2

distribuzione binomiale
Si utilizza per eventi che possono assumere solo due valori, tipo giusto-sbagliato, testa-croce, vero-falso. Si indichi con p la probabilit che si presenti un determinato evento in una prova, e con q = 1-p la probabilit che levento non si presenti; allora, la probabilit che in n prove levento si presenti esattamente k volte data da:

n k nk Pk = p q k
3

distribuzione binomiale
La formula permette di calcolare la probabilit che in n prove levento con probabilit p si verifichi k volte:

n k nk Pk = p q k
dove:

Pk probabilit di k successi in n prove numero delle prove n numero dei successi k probabilit del successo p q = 1 p probabilit dellinsuccesso
4

p k q n k calcola la probabilit La quantit


di ottenere in maniera ordinata k successi (eventi con probabilit p) e n-k insuccessi (eventi con probabilit q). Ovviamente non siamo interessati allordine con cui questi successi appaiono, quindi necessario moltiplicare questa probabilit per il numero di successioni ordinate di n eventi in cui il numero di successi k (ogni successione di k successi su n tentativi/eventi ha uguale probabilit). Questo numero facilmente calcolabile con la formula per calcolare le combinazioni di n su k: n n!
= k k!(n k )!

esempio 1(1)
Calcolare la probabilit di ottenere 4 teste lanciando una moneta non truccata 10 volte. Levento che consideriamo, esito del lancio di una moneta, ha due risultati possibili, pertanto utilizziamo la distribuzione binomiale con: numero delle prove = 10 n numero dei successi (teste) = 4 k probabilit del successo (testa) = 0,5 p q = 1 p probabilit dellinsuccesso = 0,5

esempio 1(2)
Calcolare la probabilit di ottenere 4 volte testa lanciando una moneta non truccata.

10 4 10 4 P4 = (0,5) (0,5) = 0,205 4


Allo stesso modo possiamo calcolare le probabilit di ottenere un qualunque numero di teste (compreso tra 0 e 10) in 10 prove.

esempio 1(3)
Rappresentazione grafica della distribuzione di probabilit della v.c. X = numero di teste in 10 lanci di una moneta
0,25 0,2 probabilit 0,15 0,1 0,05 0 0 1 2 3 4 5 6 7 8 9 10 numero di teste in 10 lanci

propriet (1)
La distribuzione binomiale gode delle seguenti propriet: 1. una distribuzione discreta in quanto k assume solo valori interi (compresi tra 0 e n); 2. Pk 0 per qualunque valore di k; 3.

k =0

Pk = 1

Queste propriet, in particolare la 2 e la 3 consentono di dire che la distribuzione binomiale una distribuzione di probabilit.

propriet (2)
4. se p = q = 0,5 si tratta di una distribuzione simmetrica, in tutti gli altri simmetrica casi asimmetrica (basti pensare che se la moneta sbilanciata ed ha unalta probabilit di produrre testa ad ogni tiro, un numero alto di teste nel totale dei tiri pi probabile di un numero basso di teste) 5. la media della distribuzione data da

= np
6. la varianza della distribuzione data da

2 = npq
7. la deviazione standard data da

= npq
10

distribuzione ipergeometrica
Si utilizza quando si eseguono estrazioni senza reinserimento. In generale, volendo estrarre, da un insieme di N elementi, N1 dei quali aventi una certa caratteristica ed N2 unaltra caratteristica (con N1 + N2 = N), un campione di n elementi distinti mediante unestrazione senza reinserimento; ci si chiede quale sia la probabilit che, di questi n elementi, k siano di un tipo e gli altri (n - k) dellaltro tipo. Per determinare tale probabilit necessario individuare quali siano i casi possibili nello spazio campionario relativo allesperimento: numero di campioni di n elementi che si possono ottenere dallinsieme.
11

distribuzione ipergeometrica
Alla fine, si giunge alla formula:

dove:

N1 N 2 k n k Pk = N n
numero di elementi dellinsieme numero di elementi del campione numero di elementi dellinsieme con la prima caratteristica numero di elementi dellinsieme con la seconda caratteristica numero di elementi del campione con la prima caratteristica
12

N n N1
N2

esempio 2(1)
Unurna contiene 10 palline di cui 4 sono rosse e 6 bianche. Si estraggono in blocco (senza reinserimento) 3 palline; calcolare la probabilit di estrarre 2 palline rosse. La variabile casuale che consideriamo X = numero di palline rosse estratte, in particolare ci interessa determinare la probabilit che [X =2] con:

N n N1
N2

numero di elementi dellinsieme = 10 numero di elementi del campione = 3 numero di elementi dellinsieme con la prima caratteristica = 4 (rosso) numero di elementi dellinsieme con la seconda caratteristica = 6 (bianco) numero di elementi del campione con la prima caratteristica = 2
13

esempio 2(2)
Applicando la formula avremo:

4 6 2 1 36 = = 0,3 P2 = 120 10 3
Allo stesso modo possiamo calcolare le probabilit di ottenere un qualunque numero di palline rosse (compreso tra 0 e 3) in un campione di 3 palline estratte senza reinserimento.

14

esempio 2(3)
Rappresentazione grafica della distribuzione di probabilit della v.c. X = numero di palline rosse estratte
0,6 0,5 0,4 0,3 0,2 0,1 0 0 1 2 3 numero di palline rosse estratte

probabilit

15

propriet
1. la distribuzione ipergeometrica una distribuzione discreta; 2. la media della distribuzione data da

n( N1 ) = = np N
3. la varianza della distribuzione data da

N1 N 2 ( N n ) npq( N n ) = =n ( N 1) N N ( N 1)
2

16

distribuzione normale
Si tratta della pi importante distribuzione di variabili continue, in quanto: 1. si pu assumere come comportamento di molti fenomeni casuali, tra cui gli errori accidentali; 2. la forma limite di molte altre distribuzioni di probabilit; 3. trasformando opportunamente delle v.c. non normali, si possono ottenere nuove variabili distribuite normalmente; 4. sotto determinate condizioni, delle somme di v.c. possono essere approssimate da una distribuzione normale (teorema del limite centrale).
17

distribuzione normale
Una v.c. con media e varianza 2 (parametri della distribuzione) ha una distribuzione normale se la sua densit data da

1 f (x) = e 2
dove:

1 x 2

deviazione standard costante = 3,146... base di logaritmi naturali = 2,183...


2

(x )

scarto dalla media elevato al quadrato

18

distribuzione normale
Rappresentazione grafica della distribuzione normale con media = 3 e varianza 2 = 4

19

propriet
1. la distribuzione normale una distribuzione continua, con valori compresi tra - e +; 2. la curva da essa descritta simmetrica rispetto alla media (punto di ordinata massima): f ( ) 3. per valori di X che vanno a - oppure a + la curva tende a zero senza mai toccare lasse delle ascisse (la probabilit di ottenere valori molto lontani dalla media molto bassa); 4. crescente per valori di X che vanno da - a , decrescente per i valori da a + 5. presenta due punti di flesso in corrispondenza a - e +, punti in cui la curva da convessa diventa concava.
20

ruolo dei parametri e (1/2)


la media della normale (la punta della campana) un indicatore di posizione. Il suo variare sposta la campana sulla retta dei valori 2 la varianza un indicatore di dispersione, legata allapertura della campana (valori pi alti indicano distribuzioni pi disperse).
21

ruolo dei parametri e (2/2)


Variazioni di
0.4 0.4 0.3 0.3

0.2

0.2

Variazioni di

0.1

0.1

0 -10 -8

=0,
-6

-4

2=1
-2 0

10

0 -10 -8

=2,
-6 -4

2=1
-2 0

10

0.2

0.2

0.15

0.15

0.1

0.1

0.05

0.05

0 -10 -8

=0, 2=9
-6 -4 -2 0

10

0 -10 -8

=2, 2=9
-6 -4 -2 0

10

22

distribuzione normale standardizzata


Si tratta di una distribuzione semplificata, e che consente di tabulare i valori di probabilit in apposite tavole; si ottiene mediante una trasformazione dei dati con la formula

(X ) z=

di conseguenza la funzione di densit diventa:

1 f (x) = 2
con = 0 e = 1.

1 2 z e 2

23

propriet
1. la distribuzione normale standardizzata una distribuzione continua, con valori compresi tra - e +, con media zero e deviazione standard 1; 2. la curva da essa descritta perfettamente simmetrica rispetto al punto di ordinata massima: 3. per valori di X che vanno a - oppure a + la curva tende a zero senza mai toccare lasse delle ascisse; 4. crescente per valori di X che vanno da - a 0, decrescente per i valori da 0 a + 5. presenta due punti di flesso in corrispondenza a -1 e +1, punti in cui la curva da convessa diventa concava.
24

tavole della normale


I valori delle aree della distribuzione normale standardizzata sono tabulati in apposite tavole; tali tavole vengono utilizzate per due scopi: a) per calcolare larea compresa tra due determinati valori della variabile studiata; b) per determinare la proporzione di punteggi compresi tra due valori di una variabile casuale (distribuita normalmente)

25

la tavola della normale

26

esempio 3
Supponiamo di voler calcolare larea compresa tra le ordinate z = 0 e z = 1,96. 1,96

27

la tavola della normale

Larea compresa tra z = 0 e z = 1,96 0,475


28

esempio 4
Supponiamo di voler calcolare larea compresa tra le ordinate z = -1 e z = +1

29

esempio 4(2)
Dalla lettura della tavola rileviamo che larea compresa tra z = 0 e z = +1 pari a 0,3413; dal momento che la curva simmetrica e centrata sullo zero, larea compresa tra z = -1 e z = 0 sar identica e pari anchessa a 0,3413; per ottenere larea cercata sar sufficiente sommare le due aree: 0,3413 + 0,3413 = 0,6826

0,6826

30

esempio 5
Data una serie di 500 punteggi distribuiti normalmente con media 100 e deviazione standard 15, si stimi quanti possano essere i punteggi compresi tra 88 e 130. calcoliamo i punti zeta corrispondenti a 88 e 130, che saranno:

88 100 z (88) = = 0,8 15 130 100 z (130 ) = = +2 15

31

esempio 5(2)
dalla lettura delle tavole ricaviamo che larea compresa tra z = -0,8 e z = 0 pari a 0,2881; larea compresa tra z = 0 e z = +2 0,4772; larea complessiva tra z = -0,8 e z = +2 sar 0,2881 + 0,4772 = 0,7653; tale valore 0,7653 pu essere letto sia come proporzione dei casi compresi tra i valori 88 e 130, sia come la probabilit che il punteggio di un soggetto cada allinterno di tale intervallo; in conclusione, per ottenere il numero di punteggi che ci si attende nellintervallo compreso tra 88 e 130 si calcola:

0,7653 500 = 382,65 383


32

distribuzione chi-quadrato
Si tratta di una distribuzione continua con densit data dalla relazione:

f 2 = C( )
dove:

( )

( )

2 2

2 2

C( )

gradi di libert della distribuzione costante tale da assicurare che larea delimitata sotto la curva sia pari a 1

33

distribuzione chi-quadrato
Quando = 1 il grafico della curva

34

distribuzione chi-quadrato
Quando = 2 il grafico della curva

35

distribuzione chi-quadrato
Quando = 3 il grafico della curva

36

propriet
1. la distribuzione 2 una distribuzione continua, con valori compresi tra 0 e +; 2. al crescere dei gradi di libert la curva tende ad assumere la forma della normale; 3. dato che la v.c. 2 generata da una somma dei quadrati di n valori indipendenti di una v.c. normale standardizzata, quando tali valori non sono indipendenti necessario stabilire le condizioni che li vincolano; sottraendo ad n tali vincoli, si ottiene il numero di gradi di libert, cio il numero di valori, tra loro indipendenti, della v.c. normale standardizzata.

37

distribuzione t di Student
Si tratta di una distribuzione continua con densit data dalla relazione:

t2 f (t ) = C 1 +
dove:

+1 2

gradi di libert della distribuzione costante tale da assicurare che larea delimitata sotto la curva sia pari a 1

38

distribuzione t di Student
Quando = 1 il grafico della curva

39

distribuzione t di Student
Quando = 10 il grafico della curva

40

propriet
1. la distribuzione t una distribuzione continua, con valori compresi tra - e +; 2. si rivela particolarmente utile nello studio di fenomeni casuali relativi a campioni piccoli (n < 30); 3. il valore dei gradi di libert dato da =n-1 4. con la distribuzione tende alla distribuzione normale

41

distribuzione F di Snedecor
Si tratta di una distribuzione continua con densit data dalla relazione:

f (F ) = C( , )
1 2

1 2

1 1 + F 2

1 + 2
2

dove:

1, 2
C( , )
1 2

gradi di libert della distribuzione costante tale da assicurare che larea delimitata sotto la curva sia pari a 1

42

distribuzione F di Snedecor
Quando 1 = 2 e 2 = 4 il grafico della curva

43

distribuzione F di Snedecor
Quando 1 = 4 e 2 = 4 il grafico della curva

44

distribuzione F di Snedecor
Quando 1 = 12 e 2 = 12 il grafico della curva

45

propriet
1. la distribuzione F una distribuzione continua, con valori compresi tra 0 e +; 2. si dimostra che il rapporto tra due varianze campionarie si distribuisce con questa forma; 3. con 1 = 1 e 2 la distribuzione tende alla normale standardizzata 4. con 1 = 1 e 2 = la distribuzione uguale alla distribuzione t di Student 5. con 1 = e 2 la distribuzione tende a quella del 2

46