Sei sulla pagina 1di 39

LA DISTRIBUZIONE NORMALE

Andrea Pavan

http://vision.psy.unipd.it/pavan.htm


08/10/2007
2
La Distribuzione Normale
La Distribuzione Normale riveste un ruolo
importante nella teoria della probabilit e in
statistica.

Per la ricerca psicologica limportanza di questa distribuzione
sta nel fatto che i dati di molte variabili psicologiche si
distribuiscono secondo una funzione che per la forma viene
detta a campana, gaussiana (Gauss, 1777-1855) o normale.

La distribuzione normale gode di propriet che rendono
facile la sua utilizzazione; nella pratica si ricorre a queste
propriet quando una variabile casuale continua distribuita
normalmente o quasi.
3
Le variabili casuali continue
Definizione: se la variabile casuale X assume tutti gli
infiniti valori di R, o di un suo intervallo [a, b],
chiamata variabile casuale continua.

Nel caso di una variabile casuale discreta la distribuzione di
probabilit pu sempre essere definita assegnando, ad ogni
valore che la variabile pu assumere, una probabilit
positiva tale che la somma delle probabilit sia sempre 1.

La distribuzione di probabilit di una variabile casuale
continua non pu essere specificata nello stesso modo.
impossibile, infatti, assegnare probabilit non nulle a tutti i
punti di un intervallo e soddisfare la richiesta che la somma
delle probabilit dei distinti valori possibili sia 1.
4
Esempio: consideriamo la piovosit
giornaliera. Qual la probabilit di
avere una misura di piovosit
esattamente di 5.57 cm ossia P(X =
5.57)? Non potremmo mai osservare
lesatto valore anche se misurassimo la
piovosit per tutta la durata della vita,
nonostante si potrebbero avere per
molti giorni misure di piovosit fra i 5 e
i 6 cm.
Le variabili casuali continue
5
Per assegnare quindi dei valori di
probabilit ad una variabile aleatoria
continua necessario definire una
funzione ripartizione (o funzione di
distribuzione cumulativa).
Le variabili casuali continue
6
Le variabili casuali continue
Definizione: la funzione di ripartizione di una variabile
casuale X a valori reali la funzione che associa a ciascun
valore x la probabilit dellevento la variabile casuale X assume
valori minori o uguali ad x.
In altre parole la funzione con dominio la retta reale e
immagine l'intervallo [0,1] definita da:
) ( ) ( x X P x F s =
, per - < x < +
ed caratterizzata dalle seguenti propriet:
F(x) una funzione non decrescente di x
7
Le variabili casuali continue
Una volta definita la funzione ripartizione, importante definire pure
la funzione di densit di probabilit di una variabile continua.

Se F(x) la funzione ripartizione di una variabile casuale continua,
allora la funzione f(x) definita da
) ( '
) (
) ( x F
dx
x dF
x f = =
costituisce la funzione di densit di probabilit di X.
La funzione di densit di probabilit caratterizzata dalle seguenti
propriet:
1. Associa sempre un valore non negativo a ciascun valore di X
2. Larea sottesa al grafico della funzione f(x) uguale a 1
8
Le variabili casuali continue
Definite la funzione di ripartizione e la funzione di densit di
probabilit possibile illustrare la procedura che consente di
associare i valori di probabilit ad una variabile casuale
continua.

Per una variabile casuale continua X la probabilit P(c X
d) uguale allarea sottesa dalla funzione di densit f(x)
nellintervallo [c,d].

Se la variabile casuale X ha una funzione di densit f(x) e
cd, allora la probabilit che X assuma un valore compreso
nellintervallo [c,d] :
}
= s s
d
c
dx x f d X c P ) ( ) (
9
La Distribuzione Normale
La distribuzione normale o gaussiana la pi
importante distribuzione di probabilit di variabili
continue, in quanto permette di ottenere delle
approssimazioni di probabilit per molte altre
distribuzioni, quali:

Trasformazioni di variabili continue non normali che danno
luogo a nuove variabili continue che sono distribuite in modo
normale esatto o approssimativamente normale.

Somme di variabili continue che, sotto certe condizioni,
possono essere approssimate da una distribuzione normale.
10
La Distribuzione Normale
Una v.c. X ha una distribuzione normale,
con media e varianza
2
, se:
la sua funzione di densit di probabilit
data da:
2
2
1
2
1
) (
|
.
|

\
|

=
o

t o
X
e X f
( ) + < < X
11
La Distribuzione Normale
Rappresentazione grafica di una distribuzione normale
2
2
1
2
1
) (
|
.
|

\
|

=
o

t o
X
e X f
12
La Distribuzione Normale
.. e se la sua funzione di ripartizione data da:
( ) + < < X
2
2
1
2
1
) (
|
.
|

\
|


}
=
o

t o
X
X
e X F
13
La Distribuzione Normale
dove:
e
t
( )
2
X
o
= deviazione standard della popolazione dei dati,
= nota costante 3,14,
= base dei logaritmi naturali (2,7183),
= scarto dalla media della distribuzione
elevato al quadrato;
2
2
1
2
1
) (
|
.
|

\
|

=
o

t o
X
e X f
14
La Distribuzione Normale
La v.c. normale di tipo continuo, che assume
valori compresi tra - e +, descrive una
curva di tipo simmetrico e campanulare,
dotata delle seguenti caratteristiche:

la curva perfettamente simmetrica allordinata massima Y,
cio dove la funzione f(X) raggiunge il suo punto pi alto,
che in corrispondenza di X
i
= ; questo fatto comporta che
media, mediana e moda coincidano;


15
La Distribuzione Normale
la sua funzione di distribuzione f(X) asintotica di X verso -
e + (la curva si avvicina allasse delle ascisse senza mai
toccarla); tuttavia per X
i
che dista pi di 3 dalla media, la
distanza tra la curva e lasse delle X estremamente piccola;

crescente per valori della X che vanno da - a ed
decrescente per valori che vanno da a +;

completamente caratterizzata dai due parametri e
2
e
dalle tre costanti 2, p, e;

presenta due punti di flesso in corrispondenza di + e -;
cio i punti in cui la curva da convessa diventa concava si
trovano in corrispondenza a 1 deviazione standard dalla
media;
16
La Distribuzione Normale
Rappresentazione grafica di una distribuzione normale
17
La Distribuzione Normale
La probabilit relativa ad intervalli di valori della
funzione normale cos definita: per un valore di
X
i
= a, la probabilit dellintervallo di valori: -
< X < a corrisponde alla integrale:
i
X
a
dX e a P
2
2
1
2
1
) (
|
.
|

\
|


}
=
o

t o
P(a) = probabilit dellintervallo di valori tra - ed a
18
La Distribuzione Normale
La distribuzione rappresentata dalla relazione
mostrata precedentemente si chiama anche
curva degli errori; ci dovuto al fatto che
questa curva serve a rappresentare la legge
con cui si distribuiscono gli errori di natura
accidentale.

Il calcolo dellintegrale dipende dai valori e

2
; pertanto si pu dire che la probabilit
associata ad un intervallo di valori X
funzione dei due parametri e
2.

19
Valori attesi della Distribuzione
Normale
I due parametri della variabile casuale normale,
detti pure valori attesi, cio e
2
, corrispondono
alla media E(X) e varianza Var(X) della
distribuzione. Si dimostra infatti che, per mezzo del
calcolo integrale:
dX e X X Var
dX e X X E
X
X
2
2
2
1
2 2
2
1
2
1
) ( ) (
2
1
) (
|
.
|

\
|

+

|
.
|

\
|

+

}
}
= =
= =
o

o

t o
o
t o

20
Valori attesi della Distribuzione
Normale
Dalle precedenti formule consegue che
ogni distribuzione normale
univocamente definita dalla media e
dalla varianza.
Le distribuzioni normali possono
differire, pertanto, per la media e
varianza, nonostante mantengano
costanti le caratteristiche.
21
Valori attesi della Distribuzione
Normale
Si pu osservare come al variare della media e della varianza la curva
subisca sia uno spostamento sullasse dellascissa, sia un appiattimento;
mentre se si fa variare solo la varianza e si tiene costante la media, la
curva si appiattisce quando la varianza cresce e diventa pi appuntita
quando la varianza cala, mentre il centro di gravitazione rimane lo stesso.
22
La Distribuzione Normale
standardizzata
La distribuzione normale contiene due
parametri, e
2
, che ne rendono
difficile il calcolo. Il ricorso alla cosidetta
distribuzione standardizzata o
ridotta consente invece di individuare
le probabilit relative ai diversi intervalli
di valori mediante le tavole di
probabilit.
23
La Distribuzione Normale
standardizzata
La distribuzione normale standardizzata si
ottiene con la trasformazione lineare dei punti
grezzi in punti z:
o
) ( z X
z

=
e quindi
2
2
2
) (
o

=
X
z
24
La Distribuzione Normale
standardizzata
La funzione di densit di probabilit della
distribuzione normale standardizzata f(z)
diventa:
2
2
1
2
1
) (
z
e z f

=
t
( ) + < < z
25
La Distribuzione Normale
standardizzata
La distribuzione normale
standardizzata presenta le
stesse caratteristiche della
distribuzione normale NON
standardizzata. Ci che
distingue le due distribuzioni
che la normale
standardizzata ha MEDIA=0
e
DEVIAZIONE STANDARD=1,
per cui rappresentata da
UNA SOLA CURVA, mentre
la distribuzione normale
generale costituita da
infinite curve a seconda dei
valori di e .
26
Probabilit della curva normale
standardizzata e relative tavole
Limportanza della distribuzione normale
standardizzata sta nel fatto che le probabilit
corrispondenti alle superfici racchiuse dalla
curva normale possono essere calcolate.
Queste probabilit sono state tabulate e
vengono riportate in apposite tabelle.

Ci evita il calcolo di integrali per trovare le
probabilit che una v.c. X assuma valori compresi
allinterno di intervalli della retta reale.
27
noto che il 68.26% dellarea totale
compreso tra 1 deviazione standard
attorno alla media, cio a 1 punto z
dalla media; mentre il 95.44%
racchiuso tra 2 deviazioni standard
attorno alla media: quindi a 2 punti z
dalla media.
Probabilit della curva normale
standardizzata e relative tavole
28
Probabilit della curva normale
standardizzata e relative tavole
Le tavole di probabilit della
distribuzione normale vengono
utilizzate per due scopi:
1. Per calcolare larea compresa tra due
determinati valori della variabile
oggetto di studio;
2. Per conoscere la quantit dei punteggi
compresi tra due valori di una variabile
casuale.
29
Ne troviamo di due tipi:
1. Quelle relative alla probabilit dei singoli
valori di Y(altezze della curva). Questo tipo
di tavola ha scarse applicazioni.
2. Quelle relative alla probabilit totale
compresa tra due limiti qualunque X
1
e X
2
di
una variabile normale standardizzata.
Questo tipo di tavola invece viene utilizzato
maggiormente.
Probabilit della curva normale
standardizzata e relative tavole
30
Nello specifico tratteremo il secondo
tipo di tavole.
A causa della simmetria della
distribuzione queste tavole riportano
soltanto i valori delle probabilit
comprese fra lo zero e lascissa +X,
essendo quelle dellaltra met della
curva del tutto uguali.
Probabilit della curva normale
standardizzata e relative tavole
31
Osservando la tavola si troveranno i
punti z nella colonna di sinistra con una
cifra decimale; la seconda cifra
decimale posta nella prima riga in alto
della stessa tavola.
Probabilit della curva normale
standardizzata e relative tavole
32
In termini pratici
Supponiamo di voler conoscere larea
compresa tra le ordinate corrispondenti
a z=0 e z=1,96.

33
In termini pratici
Osservando la colonna dei punti z, si deve
scendere fino a trovare z=1,9 e, rimanendo
nella stessa riga fino a trovarsi in quella
indicata con 6. Il punteggio che troverete in
quel punto indica la porzione di area
compresa tra le due ordinate: 0,4750. Poich
larea totale sotto la curva alla destra
dellordinata corrispondente a z=0,00
0,5000,larea alla destra dellordinata di z
=1,96 sar : 0,5000-0,4750=0,0250.
34
In termini pratici
Supponiamo di voler conoscere la porzione di
area sotto la curva tra le ordinate
corrispondenti a z=-1,00 e z=+1,00.
35
In termini pratici
Cercando nella tabella troverete che la
porzione di area sotto la curva compresa
z=0,00 e z=1,00 0,3413. Dalla
porzione opposta della curva si trover
ovviamente lo stesso valore, quindi la
proporzione di area si otterr sommando
i due valori: 0.3413+0,3413=0,6826.
36
Supponiamo ora di voler trovare larea
sotto la curva compresa tra z=0,50 e
z=2,50.

In termini pratici
37
Poich le tavole danno solo le aree a partire dal
punto z=0,00, il calcolo richiede il seguente
passaggio:
larea tra le ordinate corrispondenti a z=0,00 e z=0,50
0,1915; mentre larea tra z=0,00 e z=2,50 0,4938. allora
necessario togliere la porzione di area che va da z=0,00 a
z=0,50.

Basta allora sottrarre le due precedenti aree: 0,4938-
0,1915=0,3023. Il punteggio ottenuto la proporzione di
area ricercata.

se si vuole esprimere le proporzioni di area in
percentuale,basta moltiplicare le aree per 100.

In termini pratici
39
Bibliografia
Vidotto, G., Elisabetta, X., e Pedon, A.
Statistica per psicologi. Edizioni il
Mulino.
Caudek, C. e Luccio, R. Statistica per
psicologi. Edizioni Laterza