Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Coefficiente di variazione
In statistica possibile valutare in modo sintetico
la distribuzione dei dati mediante gli indici di
variabilit (o dispersione)
Vedremo i seguenti indici
7
Campo variazione = x
max
x
min
Campo di variazione
E il pi semplice degli indici di variazione:
Si calcola facendo la differenza tra il dato pi
grande e il dato pi piccolo
Rappresenta lampiezza dellintervallo dei dati
8
Esempio
Consideriamo le valutazioni della prima prova
a Prova 1
studente 1 1
studente 1 1
studente 1 1
studente 1 1
media , 111
Xmax = 9;
Xmin = 3 Range = 9 3 = 6
9
Calcoliamo il Range per tutte le tre prove
1
a
Prova 1
a
Prova 1
a
Prova
studente 1 1 1 1
studente 1 1 1 1
studente 1 1 1 1
studente 1 1 1 1
media , 111 , 111 , 111
range 1 1 1
Range 1
a
prova = 6 dati pi dispersi,
risultati pi eterogenei
Range 3
a
prova = 1 dati pi concentrati,
risultati pi omogenei
Range 2
a
prova = Range 1
a
prova = 6 Stessa Distribuzione?
10
Ca m po di vari azi one d el l e tre prove
1
1
1
1
1
1
1
1
1
1
11
1 1 1 1 1
num pr ov a
v
a
l
u
t
a
z
i
o
n
i
s tudente 1
s ttudente 1
s tudente 1
s tudente 1
r ange
Vediamo graficamente
11
Osservazioni:
1. Il campo di variazione d informazioni sulla
distribuzione dei dati:
1
1
1
1
Varianza
19
Esempio - Varianza
Consideriamo le valutazioni della prima prova
a Prova 1
studente 1 1
studente 1 1
studente 1 1
studente 1 1
media , 111
(x
1
)
2
= (3 6,25 )
2
= 10,5625; (x
2
)
2
= (5 6,25 )
2
= 1,5625;
(x
3
)
2
= (8 6,25 )
2
= 3,0625; (x
4
)
2
= (9 6,25 )
2
= 7,5625;
2
= 10,5625+1,5625+3,0625+7,5625 = 5,6875
4
20
Calcoliamo la Varianza per tutte le tre prove
Varianza 1
a
prova = 5,69 dati pi dispersi,
risultati pi eterogenei
Varianza 3
a
prova = 0,19 dati pi concentrati,
risultati pi omogenei
Varianza 2
a
pr. Varianza 1
a
pr Le Distribuzioni Differiscono
1
a
Prova 1
a
Prova 1
a
Prova
studente 1 1 1 1
studente 1 1 1 1
studente 1 1 1 1
studente 1 1 1 1
media , 111 , 111 , 111
varianza , 111 , 111 , 111
21
Scarto quadratico medio o
Deviazione standard
uguale alla radice quadrata della varianza
( ) ( )
n
x
n
x x
n
i
n
i
1
1
1
1
medio quadr Scarto
( ) ( ) ( )
n
x x x x x x
n
1 1
1
1
1
.....
medio quadr. Scarto
+ + +
22
Esempio - Scarto quadratico medio
Riprendiamo le valutazioni della prima prova
1
a
Prova scarti da M scarti
1
studente 1 1 - , 333 , 111111
studente 1 1 - , 111 , 11111
studente 1 1 , 333 , 11111
studente 1 1 , 111 , 11111
media , 111 , 111 , 33333
( )
1111 , 1 1111 , 1
1
1
1
n
x
n
i
23
Calcoliamo lo Scarto quadratico medio per tutte le prove
Scarto q. 1
a
prova = 2,38 dati pi dispersi,
risultati pi eterogenei
Scarto q. 3
a
prova = 0,43 dati pi concentrati,
risultati pi omogenei
Scarto q. 2
a
pr. Scarto q. 1
a
pr Le Distribuzioni Differiscono
1
a
Prova 1
a
Prova 1
a
Prova
studente 1 1 1 1
studente 1 1 1 1
studente 1 1 1 1
studente 1 1 1 1
media , 111 , 111 , 111
scarto quadratico , 111 , 111 , 111
24
Osservazioni:
1. La varianza
2
e lo scarto quadratico medio danno
informazioni sulla distribuzione dei dati:
pi
2
e sono piccoli pi i dati sono concentrati;
pi
2
e sono grandi pi i dati sono dispersi.
2. Entrambi gli indici tengono conto di tutti i dati della
distribuzione
25
3. Entrambi si basano sulla propriet della media per cui
la somma dei quadrati degli scarti dalla media minima
4. La varianza espressa mediante il quadrato dellunit
di misura dei dati
5. Lo scarto quadratico nella stessa unit di misura dei
dati e pertanto viene preferito alla varianza
26
Il coefficiente di variazione CV
Il CV una misura relativa di dispersione (le precedenti
sono misure assolute) ed una grandezza adimensionale.
E particolarmente utile quando si devono confrontare le
distribuzioni di due gruppi con medie molto diverse o con
dati espressi in scale differenti (es. confronto tra
variazione del peso e variazione dellaltezza).
% 111
,
_
x
CV
27
Se i valori di CV sono esterni a quelli indicati o si in
presenza di errori di rilevazione, oppure il fenomeno presenta
aspetti particolari.
lasimmetria
lasimmetria
la curtosi
la curtosi
30
Asimmetria
Una distribuzione simmetrica quando la sua curva
di frequenza presenta un asse di simmetria
In una distribuzione simmetrica media, mediana e
moda sono coincidenti.
Confronto di distrib. normali
1
, 333
, 33
, 111
, 33
, 111
1 1 1 1 1 11 11 11 11
valori della variabile
f
r
e
q
u
e
n
z
a
distrib. normale 1
media = mediana
= moda
In una distribuzione
asimmetrica media, mediana e
moda non sono pi coincidenti
e proprio la differenza
(distanza) tra la media e la
moda pu essere considerata
una misura della asimmetria
31
( )
1
1
1
]
1
i
i
i
i
i
f
f x x
a
1
1
1
moda x
medio quadratico scarto
moda etica mediaaritm
asimmetria
mediana) x
medio quadratico scarto
ediana m tmetica (mediaari 1
asimmetria
( 1 )
Dette rispettivamente: primo e secondo coeff. di asimmetria di Pearson
32
moda < mediana < media moda < mediana < media
Asimmetria positiva (as. Destra)
La distribuzione asimmetrica quando non presenta
nessun asse di simmetria.
Si ha unasimmetria positiva o destra quando il ramo
destro della curva pi lungo di quello sinistro
In questo caso si ha:
Asimmetria positiva o destra
1
1
1
1
1
11
11
1 11 11 11 11 111 111 111 111
valori
f
r
e
q
u
e
n
z
a
media=63,65
moda = 48
mediana =58
33
media < mediana < moda media < mediana < moda
Asimmetria negativa (as. Sinistra)
Si ha unasimmetria negativa o sinistra quando il ramo
sinistro della curva pi lungo di quello destro
In questo caso si ha:
Asimmetria negativa o as. sinistra
1
1
1
1
1
11
11
11
1 11 11 11 11 111 111 111
valori
f
r
e
q
u
e
n
z
a
media = 85,24
moda = 100
mediana = 90
34
Curtosi
Se una distribuzione simmetrica o quasi
simmetrica allora pu esser pi o meno appuntita o
pi o meno appiattita rispetto alla distribuzione
normale (o di Gauss)
Se la curva
pi appuntita si dice
curva Leptocurtica
curva Leptocurtica
pi appiattita si dice
curva Platicurtica
curva Platicurtica
( )
1
1
1
]
1
i
i
i
i
i
f
f x x
K
1
1
1