Sei sulla pagina 1di 13

Seconda Università degli studi Napoli

Facoltà di Economia

Gli Indici di Variabilità e di Forma

Prof. R. Lombardo
Dipartimento di Strategie
Aziendali e
Metodologie Quantitative

Indici di Variabilità
Attitudine di una carattere statistico ad assumere diversi valori
 Valori non negativi
 È nulla se e solo se tutti i valori della distribuzione sono uguali

Indici di variabilità assoluta


Indici di variabilità relativi

1. Indici di dispersione 1. Coefficiente di


2. Indici di disuguaglianza Variazione
2. Rapporto di
concentrazione

1
Indici di Variabilità assoluta
Sono espressi nella stessa unità di misura della variabile
Statistica osservata

Dispersione dei valori rilevata


Indici di Dispersione
attorno ad un centro

1. Devianza
2. Varianza
3. Scostamento quadratico medio
4. Scostamento semplice medio

Devianza
Considerata la successione dei valori x1…..xn
del carattere X, si definisce Devianza la somma dei
quadrati degli scostamenti di xi dalla media
Per successioni di valori del carattere
n
Dev( X )   x i  M 
2 Per variabili statistiche
i 1 k
Dev( X )   x i  M  n i
2
Per variabili statistiche in
i 1
classi
k
Dev( X )   ci  M  n i
2 ci valore
centrale della
i 1 classe

2
Proprietà della Devianza
Setutti i valori della distribuzione sono uguali
VAR(X)=0 e DEV(X)=0
Se si aggiunge una costante a tutti i valori della
distribuzione la VAR(X) e la DEV(X) non sono
influenzate
Se si moltiplica una costante a tutti i valori della
distribuzione allora:
VAR(Xc)=a2VAR(X) e DEV(X)= a2DEV(X)

Proprietà della Devianza


Considerata una variabile statistica doppia la
Devianza totale si può scomporre in
Devianza interna ai gruppi + Devianza tra i gruppi
r r c
Dev( X )   ( xi  M ) 2 ni    ( xi  M ) 2 nij
i 1 i 1 j 1

x  M  x j  x j  nij 
r c
 
2
i
i 1 j 1

  x 
 x j   x j  M  nij 
r c
2
i
i 1 j 1

  x  x j  nij   x  M  n. j
r c c
2 2
i j
i 1 j 1 j 1

Dev(T)  Dev( W)  Dev( B)

3
Varianza
Considerata la successione dei valori x1…..xn
del carattere X, si definisce Varianza la media dei
quadrati degli scostamenti di xi dalla media
Per successioni di valori del carattere
1 n
Var ( X )   x i  M 
2 Per variabili statistiche
n i 1 1 k
Var ( X )   x i  M  n i
2
Per variabili statistiche in n i 1
classi

1 k
Var ( X )   ci  M 2 n i ci valore
centrale della
n i 1
classe

Scostamento quadratico medio


Considerata la successione dei valori x1…..xn
del carattere X, si definisce SQM la radice quadrata
della media dei quadrati degli scostamenti di xi dalla media

Per successioni di valori del carattere


1 n
SQM ( X )   x i  M 2 Per variabili statistiche
n i 1
1 k
SQM ( X )   x i  M 2 n i
Per variabili statistiche in n i 1
classi
1 k
SQM ( X )   ci  M 2 n i
n i 1 ci valore centrale della
classe

4
Scostamento semplice medio

Considerata la successione dei valori x1…..xn


del carattere X, si definisce SSM la media dei valori assoluti
degli scostamenti di xi dalla media

Per successioni di valori del carattere

1 n
| xi  M |
Per variabili statistiche
SSM ( X ) 
n i 1
1 k
Per variabili statistiche in classi
SSM ( X )  | xi  M | ni
n i 1

1 k
SSM ( X )   | ci  M | n i
n i 1 ci valore centrale
della classe
R. Lombardo

Indici di Variabilità assoluta

Indici di Diseguaglianza

Diseguaglianza tra i valori rilevati

1. Campo di variazione
2. Differenza interquartile
3. Differenza semplice media

5
Campo di Variazione
Misura di variabilità tra le più semplici
Risente della presenza di valori anomali

Considerata una distribuzione di valori del carattere X

x1  ....  x n
Si definisce Campo di variazione C

C  x n  x1

Differenza Interquartile

Considerata una distribuzione di valori del carattere X

x1  ....  x n
Calcolati i Quartili, si definisce la Differenza Interquartile

Dq  Q3  Q1
La Dq può assumere valore nullo anche quando non tutti i
valori del carattere sono uguali tra loro

X  1,2,2,2,2,2,3 Dq  2  2  0

Q1 Q3

6
Indici di variabilità relativi
Per il confronto della variabilità tra due distribuzioni
Ricavabili dagli indici di variabilità assoluta:
si rapporta l’indice assoluto al valor medio o al valore
massimo della distribuzione

Coefficiente di Variazione
CV misura la variazione media del fenomeno in rapporto
alla media


CV  non è definito per M=0
|M|

R. Lombardo

Esempio:
Coefficiente di variazione

Voto in
Statistica Frequentato Non frequentato Totale
18 2 5 7
22 3 4 7
24 3 6 9
25 4 2 6
28 7 1 8
30 10 1 11
29 19 48

M1 M2
26,551 22,63 CV1= 0,13
M I°gruppo M II° gruppo M CV2= 0,15

R. Lombardo
1  3,5826,62  3,22,6
36 25

7
Variabilità relativa: Concentrazione
Considerata la successione ordinata dei valori x1…..xn
del carattere X, trasferibile ed additivo.
Sia T= x1+..+xn l’ammontare complessivo. Calcoliamo le
frazioni per le modalità:
1 per le unità statistiche: x1
p1  q1  valori cumulati
n frequenze relative cumulate T
2 x  x2
p2  q2  1
n T
 
x  ...  xi
pi 
i qi  1
n T
 


n
n xi
pn   1 qn  i 1
1
n T

Indice di variabilità relativa


Rapporto di Concentrazione
La concentrazione è un aspetto della variabilità :
più alta è la concentrazione più le unità sono diverse le une dalle
altre , più elevata é la variabilità del carattere
Equidistribuzione=concentrazione nulla=variabilità nulla
q1  p1,...., qi  pi ,...., qn  pn
Maggiore è la concentrazione maggiori saranno le differenze tra
pi e qi
Si calcola come misura della concentrazione il rapporto del Gini:
massima concentrazione= il totale
n 1 delle intensità T del carattere è
( p i  qi )
0  R 1
concentrato in una sola unità
R i 1
n 1
statistica,
p
i 1
i
concentrazione nulla=l’intensità
totale è ripartita ugualmente tra le
unità statistiche del collettivo

8
Spezzata di concentrazione o Curva di Lorenz
1,2

0,8
Area di concentrazione
0,6

0,4

0,2

0
0 0,2 0,4 0,6 0,8 1 1,2

massima concentrazione = il totale delle intensità T del carattere è


concentrato in una sola unità statistica,
concentrazione nulla=l’intensità totale è ripartita ugualmente tra
le unità statistiche del collettivo
R. Lombardo

Indice di variabilità relativa


Rapporto di Concentrazione

Formula alternative:
formula dei trapezi Curva di Lorenz

area concentraz ione


R1 
area di massima concentraz ione

Formula con l’indice differenza semplice media


n n
1
X  | x i  x i' |
n( n  1) i 1 i'1
Rc  
max( X ) 2M

R. Lombardo

9
Esempio :Rapporto di Concentrazione
Introiti pi qi n 1
emittente1
emittente2
339
461
0,00
0,11
0,00
0,03 ( p i  qi )
emittente3
emittente4
697
1320
0,22
0,33
0,07
0,13
R i 1
n 1
 0.288
emittente5
emittente6
1524
1798
0,44
0,56
0,24
0,37 p
i 1
i
emittente7 1857 0,67 0,52
emittente8 1889 0,78 0,67
emittente9 1994 0,89 0,83
11879 1,00 1,00
1,2
1
0,8
Area di concentrazione
0,6
0,4
0,2
0
0 0,2 0,4 0,6 0,8 1 1,2

Indici di mutabilità per caratteri qualitativi

Mutabilità: Attitudine di una carattere qualitativo ad


assumere diverse modalità

Indici che misurano l’omogeneità e per negazione


l’eterogeneità
Omogeneità: tutte le unità statistiche presentano la stessa
modalità di un carattere
Indice di eterogeneità del Gini:
2
n 
IE  1  i 1  i 
k Si annulla quando il collettivo è
 n  omogeneo
2
1
ax( IE)  1  i 1 f i 
1 1
 1  i 1    1  k 2  1 
k 2 k
M Lombardo
R. k k k

10
Indici di forma

Una distribuzione è simmetrica se le modalità che sono


equidistanti dalla mediana hanno la stessa frequenza
| x1  Me || x2  Me |
n1  n2
Asimmetria positiva: maggiore addensamento in
corrispondenza con i valori più bassi, il ramo destro è
più allungato di quello sinistro
Mo  Me  M
Asimmetria negativa: maggiore addensamento in
corrispondenza con i valori più alti, il ramo sinistro è
più allungato di quello destro
M  Me  Mo
R. Lombardo

Indici di forma

Misure di asimmetria

Asimmetria positiva: Me  Q1  Q3  Me

Asimmetria negativa: Me  Q1  Q3  Me
Q1  Q3  2M e
Indice di Asimmetria AS 
Q3  Q1

Assume valori positivi in caso di Asimmetria positiva


Assume valori negativi in caso di Asimmetria negativa

R. Lombardo

11
Indici di forma

Indici di asimmetria noti

Indice skewness di Pearson: M  Mo




1 n
Indice di Fisher-Pearson

n i 1
( xi  M ) 3
3
1   3
3 
Assume valori positivi in caso di Asimmetria positiva

Assume valori negativi in caso di Asimmetria negativa

R. Lombardo

Indici di forma
Coefficiente di Curtosi
1 n
Per la curva Normale
 ( xi  M ) 4  4
n i 1
1   4
1  3 Iponormale: forma appiattita 4 
1  3 Normale
Ipernormale: forma allungata
1  3
Normal Distribution
0,4 Mean,Std. dev.
0,1
0,3
density

0,2

0,1

0
-5 -3 -1 1 3 5
R. Lombardo x

12
Chi-Square Distribution
0,25 Deg. of freedom esempio
3
0,2
density
0,15

0,1

0,05

0
0 4 8 12 16
x
Asimmetria
F (variance ratio) Distribution positiva
0,8 Numerator d.f,Denominator d.f.
3,10
0,6
density

0,4

0,2

0
0 1 2 3 4 5
R. Lombardo
x

13