Sei sulla pagina 1di 37

1

Lez. 3 - Gli Indici di VARIABILITA


- Campo di variazione
-
Scarto dalla media
-
Varianza
-
Scarto quadratico medio
-
Coefficiente di variazione
Elementi di Statistica descrittiva
Elementi di Statistica descrittiva
2
Indici di Variabilit
I valori medi sono indici importanti per la
descrizione sintetica di un fenomeno
statistico
Hanno per il limite di non darci alcuna
informazione sulla distribuzione dei dati
3
Esempio
In tre differenti prove di matematica 4 studenti hanno
riportato le seguenti valutazioni
a Prova 1 a Prova 1 a Prova 1
studente 1 1 1 1
studente 1 1 1 1
studente 1 1 1 1
studente 1 1 1 1
media , 111 , 111 , 111
In tutte e tre le prove la media 6,25
ma i dati sono chiaramente distribuiti in modo diverso
4
Diagramma di distribuzione delle tre prove
Diagramma dis pers ione dati
1
1
1
1
1
1
1
1
1
1
11
1 1 1 1 1
num prova
v
a
l
u
t
a
z
i
o
n
i
studente 1
sttudente 1
studente 1
studente 1
media
5
nel caso della 1
a

prova e 2
a
prova sar opportuno
fare un recupero per alcuni studenti

nel caso della 3


a
prova linsegnante pu ritenere che
gli obiettivi siano stati raggiunti dalla classe, anche
se ad un livello solo sufficiente
Diagramma dis pers ione dati
1
1
1
1
1
1
1
1
1
1
11
1 1 1 1 1
num prova
v
a
l
u
t
a
z
i
o
n
i
studente 1
sttudente 1
studente 1
studente 1
media
6

Campo di variazione (Range)

Scarto medio dalla media

Varianza e scarto quadratico medio

Coefficiente di variazione
In statistica possibile valutare in modo sintetico
la distribuzione dei dati mediante gli indici di
variabilit (o dispersione)
Vedremo i seguenti indici
7
Campo variazione = x
max
x
min

Campo di variazione
E il pi semplice degli indici di variazione:
Si calcola facendo la differenza tra il dato pi
grande e il dato pi piccolo
Rappresenta lampiezza dellintervallo dei dati
8
Esempio
Consideriamo le valutazioni della prima prova
a Prova 1
studente 1 1
studente 1 1
studente 1 1
studente 1 1
media , 111
Xmax = 9;
Xmin = 3 Range = 9 3 = 6
9
Calcoliamo il Range per tutte le tre prove
1
a
Prova 1
a
Prova 1
a
Prova
studente 1 1 1 1
studente 1 1 1 1
studente 1 1 1 1
studente 1 1 1 1
media , 111 , 111 , 111
range 1 1 1
Range 1
a
prova = 6 dati pi dispersi,
risultati pi eterogenei
Range 3
a
prova = 1 dati pi concentrati,
risultati pi omogenei
Range 2
a
prova = Range 1
a
prova = 6 Stessa Distribuzione?
10
Ca m po di vari azi one d el l e tre prove
1
1
1
1
1
1
1
1
1
1
11
1 1 1 1 1
num pr ov a
v
a
l
u
t
a
z
i
o
n
i
s tudente 1
s ttudente 1
s tudente 1
s tudente 1
r ange
Vediamo graficamente
11
Osservazioni:
1. Il campo di variazione d informazioni sulla
distribuzione dei dati:

pi R piccolo pi i dati sono concentrati;

pi R grande pi i dati sono dispersi.


2. R espresso nella stessa unit di misura dei dati
3. Tuttavia R tiene conto solo dei dati estremi della
distribuzione e non di tutti i dati, pertanto distribuzioni
diverse ma con gli stessi valori estremi hanno range
uguali
Es. Range 1
a
prova = Range 2
a
prova.
ma distribuzione 1
a
prova Distribuzione 2
a
prova
12
Scarto medio dalla media aritmetica
Un altro modo per calcolare la variabilit dei dati
(tenendo conto di tutti i dati) consiste nel
calcolare la distanza di tutti i dati dalla media e
fare la media aritmetica di tali distanze
Scarto medio = Distanza media dei dati dalla media
n
x x x x x x
n
+ + +

.....
S medio Scarto
1 1
m
13
Esempio
Consideriamo le valutazioni della prima prova
a Prova 1
studente 1 1
studente 1 1
studente 1 1
studente 1 1
media , 111
|x
1
|= |3 6,25 |= 3,25; |x
2
|= |5 6,25 |= 1,25;
|x
3
|= |8 6,25 |= 1,75; |x
4
|= |9 6,25 |= 2,75;
Sm = 3,25 + 1,25 + 1,75 + 2,75 = 2,25
4
14
Calcoliamo lo Scarto medio per tutte le tre prove
Scarto 1
a
prova = 2,25 dati pi dispersi,
risultati pi eterogenei
Scarto 3
a
prova = 0,38 dati pi concentrati,
risultati pi omogenei
Scarto 2
a
pr. Scarto 1
a
pr. Le Distribuzioni Differiscono
a Prova 1 a Prova 1 a Prova 1
studente 1 1 1 1
studente 1 1 1 1
studente 1 1 1 1
studente 1 1 1 1
media , 111 , 111 , 111
scarto medio , 111 , 111 , 111
15
Diagramma degli scarti dalla media
Diagramma degli scarti dalla media
- , 111
- , 111
- , 111
- , 111
- , 111
, 111
, 111
, 111
, 111
, 111
1 1 1
num. prova
S
c
a
r
t
o

d
a
l
l
a

m
e
d
i
a
stud.1
stud.1
stud.1
stud.1
16
Osservazioni:
1. Lo scarto medio dalla media d informazioni sulla
distribuzione dei dati:
pi S
M
piccolo pi i dati sono concentrati;
pi S
M
grande pi i dati sono dispersi.
2. S
M
espresso nella stessa unit di misura dei dati
3. Non ha l'inconveniente del Campo di variazione in
quanto S
M
tiene conto di tutti i dati della distribuzione
17
Varianza e Scarto quadratico medio
Sono gli indici di variabilit pi utilizzati, e
tengono conto della distribuzione di tutti i dati.
Varianza
Rappresenta la media aritmetica dei quadrati delle
distanze dei dati dalla media M
( ) ( ) ( )
n
x x x x x x
n
1 1
1
1
1 1
.....
Varianza
+ + +

18
( ) ( )
n
x
n
x x
n
i
n
i

1
1
1
1
Varianza
19
Esempio - Varianza
Consideriamo le valutazioni della prima prova
a Prova 1
studente 1 1
studente 1 1
studente 1 1
studente 1 1
media , 111
(x
1
)
2
= (3 6,25 )
2
= 10,5625; (x
2
)
2
= (5 6,25 )
2
= 1,5625;
(x
3
)
2
= (8 6,25 )
2
= 3,0625; (x
4
)
2
= (9 6,25 )
2
= 7,5625;

2
= 10,5625+1,5625+3,0625+7,5625 = 5,6875
4
20
Calcoliamo la Varianza per tutte le tre prove
Varianza 1
a
prova = 5,69 dati pi dispersi,
risultati pi eterogenei
Varianza 3
a
prova = 0,19 dati pi concentrati,
risultati pi omogenei
Varianza 2
a
pr. Varianza 1
a
pr Le Distribuzioni Differiscono
1
a
Prova 1
a
Prova 1
a
Prova
studente 1 1 1 1
studente 1 1 1 1
studente 1 1 1 1
studente 1 1 1 1
media , 111 , 111 , 111
varianza , 111 , 111 , 111
21
Scarto quadratico medio o
Deviazione standard
uguale alla radice quadrata della varianza
( ) ( )
n
x
n
x x
n
i
n
i

1
1
1
1
medio quadr Scarto
( ) ( ) ( )
n
x x x x x x
n
1 1
1
1
1
.....
medio quadr. Scarto
+ + +

22
Esempio - Scarto quadratico medio
Riprendiamo le valutazioni della prima prova
1
a
Prova scarti da M scarti
1
studente 1 1 - , 333 , 111111
studente 1 1 - , 111 , 11111
studente 1 1 , 333 , 11111
studente 1 1 , 111 , 11111
media , 111 , 111 , 33333

( )
1111 , 1 1111 , 1
1
1
1


n
x
n
i
23
Calcoliamo lo Scarto quadratico medio per tutte le prove
Scarto q. 1
a
prova = 2,38 dati pi dispersi,
risultati pi eterogenei
Scarto q. 3
a
prova = 0,43 dati pi concentrati,
risultati pi omogenei
Scarto q. 2
a
pr. Scarto q. 1
a
pr Le Distribuzioni Differiscono
1
a
Prova 1
a
Prova 1
a
Prova
studente 1 1 1 1
studente 1 1 1 1
studente 1 1 1 1
studente 1 1 1 1
media , 111 , 111 , 111
scarto quadratico , 111 , 111 , 111
24
Osservazioni:
1. La varianza
2
e lo scarto quadratico medio danno
informazioni sulla distribuzione dei dati:

pi
2
e sono piccoli pi i dati sono concentrati;

pi
2
e sono grandi pi i dati sono dispersi.
2. Entrambi gli indici tengono conto di tutti i dati della
distribuzione
25
3. Entrambi si basano sulla propriet della media per cui
la somma dei quadrati degli scarti dalla media minima
4. La varianza espressa mediante il quadrato dellunit
di misura dei dati
5. Lo scarto quadratico nella stessa unit di misura dei
dati e pertanto viene preferito alla varianza
26
Il coefficiente di variazione CV
Il CV una misura relativa di dispersione (le precedenti
sono misure assolute) ed una grandezza adimensionale.
E particolarmente utile quando si devono confrontare le
distribuzioni di due gruppi con medie molto diverse o con
dati espressi in scale differenti (es. confronto tra
variazione del peso e variazione dellaltezza).
% 111

,
_


x
CV

27
Se i valori di CV sono esterni a quelli indicati o si in
presenza di errori di rilevazione, oppure il fenomeno presenta
aspetti particolari.

se CV molto basso (2 3 %) bisogna sospettare


lesistenza di fattori limitanti la variabilit,

se CV molto alto (intorno al 40% o pi) molto probabile


lesistenza di fattori che aumentano la variabilit
In natura il coeff. di variazione tende a rimanere costante per ogni
fenomeno:
i valori normalmente variano dal 5% al 15%
28
Calcoliamo il Coeff. di variazione delle tre prove
CV 1
a
prova = 38,16% dati pi dispersi,
risultati pi eterogenei
CV 3
a
prova = 6,93% dati pi concentrati,
risultati pi omogenei
CV 2
a
pr. CV 1
a
pr Le Distribuzioni Differiscono
1
a
Prova 1
a
Prova 1
a
Prova
studente 1 1 1 1
studente 1 1 1 1
studente 1 1 1 1
studente 1 1 1 1
media , 111 , 111 , 111
scarto quadratico , 111 , 111 , 111
coeff. variazione , % 1111 , % 1111 , % 111
29
Le misure di Forma
Sono indici sintetici utilizzati per evidenziare
particolarit nella forma della distribuzione.
Noi esamineremo:
Noi esamineremo:



lasimmetria
lasimmetria



la curtosi
la curtosi
30
Asimmetria
Una distribuzione simmetrica quando la sua curva
di frequenza presenta un asse di simmetria
In una distribuzione simmetrica media, mediana e
moda sono coincidenti.
Confronto di distrib. normali
1
, 333
, 33
, 111
, 33
, 111
1 1 1 1 1 11 11 11 11
valori della variabile
f
r
e
q
u
e
n
z
a
distrib. normale 1
media = mediana
= moda
In una distribuzione
asimmetrica media, mediana e
moda non sono pi coincidenti
e proprio la differenza
(distanza) tra la media e la
moda pu essere considerata
una misura della asimmetria
31
( )
1
1
1
]
1

i
i
i
i
i
f
f x x
a
1
1
1

Un altro coeff di asimmetria il Coeff.


di asimmetria (di Fisher)

= scarto quadratico medio


Se a = 0 distribuzione simmetrica
Se a > 0 asimmetria destra
Se a < 0 asimmetria sinistra
Sono state proposte diverse misure dell asimmetria, per
esempio le pi semplici sono:

moda x
medio quadratico scarto
moda etica mediaaritm
asimmetria

mediana) x
medio quadratico scarto
ediana m tmetica (mediaari 1
asimmetria

( 1 )
Dette rispettivamente: primo e secondo coeff. di asimmetria di Pearson
32
moda < mediana < media moda < mediana < media
Asimmetria positiva (as. Destra)
La distribuzione asimmetrica quando non presenta
nessun asse di simmetria.
Si ha unasimmetria positiva o destra quando il ramo
destro della curva pi lungo di quello sinistro
In questo caso si ha:
Asimmetria positiva o destra
1
1
1
1
1
11
11
1 11 11 11 11 111 111 111 111
valori
f
r
e
q
u
e
n
z
a
media=63,65
moda = 48
mediana =58
33
media < mediana < moda media < mediana < moda
Asimmetria negativa (as. Sinistra)
Si ha unasimmetria negativa o sinistra quando il ramo
sinistro della curva pi lungo di quello destro
In questo caso si ha:
Asimmetria negativa o as. sinistra
1
1
1
1
1
11
11
11
1 11 11 11 11 111 111 111
valori
f
r
e
q
u
e
n
z
a
media = 85,24
moda = 100
mediana = 90
34
Curtosi
Se una distribuzione simmetrica o quasi
simmetrica allora pu esser pi o meno appuntita o
pi o meno appiattita rispetto alla distribuzione
normale (o di Gauss)
Se la curva

pi appuntita si dice
curva Leptocurtica
curva Leptocurtica

pi appiattita si dice
curva Platicurtica
curva Platicurtica
( )
1
1
1
]
1

i
i
i
i
i
f
f x x
K
1
1
1

Coeff. di curtosi di Pearson

= scarto quadratico medio


0 K < + inf
Se K = 3 distribuzione normale
se K > 3 curva leptocurtica
Se K < 3 curva platicurtica.
35
Curtosi
Confronto delle Curtosi
- , 111
1
, 111
, 33
, 111
, 33
, 111
, 33
, 111
, 33
, 111
1 1 1 1 1 11 11 11 11
valori della variabile
f
r
e
q
u
e
n
z
a
leptocurtosi
K = 8,57
platicurtosi
K = 2,8
curva normale
K = 3
36
Curtosi
Spesso il coeff. di curtosi viene indicato con b
2

che, come visto, nel caso della distribuzione
normale = 3
pertanto, talvolta, la curtosi viene indicata con
(b
2
3)
Allora:
se la distribuzione normale (b
2
3 ) = 0
se la distribuzione leptocurtica (b
2
3 ) > 0
se la distribuzione platicurtica (b
2
3 ) < 0
37
Fine Lezione