Sei sulla pagina 1di 18

3.

INDICI DI POSIZIONE

3.1 Introduzione
Nello studio delle caratteristiche di una variabile gli indici di posizione risultano di fondamentale
importanza perché consentono di descrivere sinteticamente l’insieme dei dati osservati mediante una sola
modalità o un unico valore numerico, a seconda che la variabile considerata sia qualitativa o quantitativa.
Gli indici che saranno esaminati nei paragrafi seguenti si suddividono in medie di posizione, determinabili
per una variabile di qualsiasi natura, e medie analitiche, che possono essere invece calcolate solo per
variabili quantitative, dato che richiedono l’esecuzione di operazioni algebriche.
L’obiettivo che si vuole conseguire con il calcolo degli indici di posizione è la sintesi di tutte le informazioni
contenute nei dati originali attraverso una sola determinazione che sia in qualche modo rappresentativa di
tutte le rilevazioni effettuate, per cui è evidente che la media di una variabile qualitativa dovrà
necessariamente coincidere con una delle modalità assunte dalla variabile, mentre nel caso di una variabile
quantitativa la media sarà sempre interna al suo campo di variazione.

3.2 Moda
La prima caratteristica che si nota esaminando una distribuzione di frequenza relativa a una variabile
qualitativa o quantitativa discreta è la determinazione (o le determinazioni) a cui è associata la frequenza
(assoluta o relativa) più elevata.
Questa determinazione è detta determinazione modale o, più semplicemente, moda. Se esistono più
determinazioni a cui è associata la stessa frequenza massima, tutte queste determinazioni sono mode della
distribuzione.

Considerata una variabile qualitativa o quantitativa discreta X che assume k determinazioni diverse e
indicata con nj la frequenza assoluta associata alla j-esima determinazione (con j = 1,2, …, k), la moda Mx
della variabile X è quella determinazione della variabile per la quale risulta

𝑀𝑥 = arg max 𝑛𝑗 3.2.1


1≤𝑗≤𝑘

ovvero Mx è la determinazione della variabile a cui è associata la frequenza massima.

30
Se la distribuzione è espressa mediante le frequenze relative, anziché mediante le frequenze assolute, la
moda coincide ovviamente con la determinazione della X per la quale risulta

𝑀𝑥 = arg max 𝑓𝑗 3.2.2


1≤𝑗≤𝑘

Dato che l’individuazione della moda si basa solo sui valori assunti dalle frequenze (assolute o relative),
risulta evidente che questo indice può essere determinato per una variabile di qualunque tipo.
Per esempio, la moda della variabile considerata nella tabella nella 2.1.1 è "altre attività", nella tabella 2.1.2
è il "diploma di scuola secondaria superiore", nella tabella 2.1.3 è "2 componenti" e nella 2.1.8 è "prime
edizioni".
Le mode appena individuate sulle distribuzioni di frequenza delle variabili considerate sarebbero potute
essere individuate anche attraverso l’analisi del grafico corrispondente, dato che in tutti i casi la moda
corrisponde alla determinazione a cui è associato il rettangolo o il segmento con l’altezza maggiore (per
grafici a colonna o per i diagrammi ad asta) oppure al rettangolo con la base maggiore (per grafici a nastro).
Così, per esempio, la moda della distribuzione rappresentata nelle figure 2.3.2 o 2.3.3 è "industria", la moda
della distribuzione rappresentata nella figura 2.3.4 è "sufficiente", la moda della distribuzione rappresentata
nella figura 2.3.5 è il valore "2" e nella figura 2.3.6 la moda è “1”.
Ovviamente se in una distribuzione ci sono più determinazioni a cui è associata la stessa frequenza massima,
la variabile presenta più mode, mentre non c'è alcuna moda se tutte le frequenze sono uguali fra loro.
Una distribuzione che presenta una sola moda è detta unimodale, mentre è detta plurimodale se presenta
più mode. In particolare, se esistono due mode, la distribuzione è detta “bimodale”, se ne esistono tre è
detta “trimodale” e così via.
Nel caso di una distribuzione di una variabile continua mediante classi di valori, l’individuazione della
moda non può essere effettuata in base ai valori delle frequenze associate a ciascuna classe in quanto, come
si è già detto in precedenza, all’aumentare dell’ampiezza della classe tende ad aumentare anche la frequenza
associata. Per determinare la moda occorre quindi individuare l’intervallo che, a parità di ampiezza,
contiene la frazione maggiore delle osservazioni.

Quando la variabile di interesse è continua e si dispone di una distribuzione in classi, si definisce la classe
modale, che è la classe a cui è associata la massima densità di frequenza. Anche in questo caso possono
esistere più classi modali, se a più classi è associata la stessa densità di frequenza massima.

31
Nel caso della tabella 2.4.1, per esempio, la classe modale della distribuzione è la classe (160, 165] in
corrispondenza della quale si ha il massimo valore del rapporto fra frequenza e ampiezza.
Anche in questo caso la determinazione della classe modale può avvenire graficamente, in quanto
corrisponde al rettangolo dell’istogramma che presenta la massima altezza. Per esempio, la figura 2.4.1
mostra chiaramente che la moda corrisponde alla classe (160, 165], così come si era rilevato anche dai
valori riportati nella tabella 2.4.1.
Se la determinazione della moda è estremamente semplice, va però notato che il suo utilizzo è abbastanza
limitato. Dato che la moda non fornisce alcuna informazione ulteriore sulla distribuzione della variabile, la
sua conoscenza non è particolarmente utile se le determinazioni assunte dalla variabile sono piuttosto
numerose, specie se la massima frequenza non è sensibilmente più elevata delle frequenze associate alle
altre determinazioni.
È inoltre evidente che la determinazione della classe modale per una variabile quantitativa continua risente
di tutte le arbitrarietà della suddivisione in classi che è stata effettuata.
Un pregio della moda è invece la sua “robustezza”, nel senso che questo indice non risente della eventuale
presenza di determinazioni molto grandi o molto piccole che potrebbero corrispondere a valori anomali (in
inglese, outlier), ossia a determinazioni che si discostano molto dalle restanti determinazioni assunte dalla
variabile.

3.3 Quantili
Date n osservazioni relative alla variabile quantitativa X si definisce quantile di ordine p (con 0 < p < 1),
e si indica con xp, quel particolare valore della variabile per cui la proporzione di osservazioni inferiori o
uguali a xp è almeno p (e quindi la proporzione di osservazioni maggiore o uguale a xp è almeno 1-p).

Se, per esempio, per una distribuzione di redditi annui è noto che il quantile di ordine 0.25 è pari a 5 mila
euro, questo vuol dire che almeno un quarto delle unità considerate ha un reddito annuo inferiore o uguale
a 5 mila euro (e che almeno il 75% delle unità ha un reddito superiore o uguale a 5 mila euro); se in una
distribuzione di stature x0,8 vale 178 centimetri, significa che almeno l’80% delle unità ha una statura
inferiore o uguale a 178 centimetri ( e almeno il 20% delle unità ha una statura superiore o uguale a 178).

Data una sequenza di n osservazioni relative a una variabile quantitativa X, il quantile xp di ordine p è
l’osservazione che nella sequenza ordinata occupa il posto corrispondente alla parte intera superiore di np,
indicato con np 

32
Il simbolo np  rappresenta quindi la parte intera superiore di np per cui

np  np  < np  1 .

Esempio 3.3.1
Considerata la seguente sequenza di osservazioni rilevate su 5 piantine di cui si è misurata l’altezza ottenendo i
seguenti valori in centimetri
23.4 18.2 21.0 22.7 19.1
si determini il quantile di ordine p = 0.5 della variabile.

In questo caso n = 5, per cui


np  5  0.5  2.5  3 .
Il quantile di ordine 0.5, x0.5, occupa quindi il terzo posto nella sequenza ordinata
18.2 19.1 21.0 22.7 23.4
per cui risulta
x0.5 = x(3 )= 21.

Esempio 3.3.2
Si supponga ora che alle unità dell’esempio precedente si sia aggiunta una nuova piantina, la cui altezza in centimetri
è pari a 21.5. Si vuole determinare il quantile di ordine p = 0.5 delle 6 unità.
In questo caso la sequenza ordinata è la seguente
18.2 19.1 21.0 21.5 22.7 23.4
per cui, dato che n = 6,
np  6  0.5  3  3 .
Il quantile di ordine 0.5 occupa quindi il terzo posto nella sequenza ordinata per cui risulta ancora
x0.5 = x(3 ) = 21.

Considerata una generica sequenza, tutti i suoi termini sono evidentemente quantili di un certo ordine della
variabile X, ma fra questi alcuni sembrano più indicativi di altri perché fanno riferimento a quei valori di p
che corrispondono a quelli di uso più comune e sono considerati come valori caratteristici della X.

Sono frequentemente utilizzati i quantili x0.25, x0.5 e x0.75 che, per la loro importanza nella descrizione delle
caratteristiche della variabile X, hanno un nome particolare e vengono detti quartili.
Il quartile più importante è il secondo, x0.5, comunemente chiamato mediana, perché indica quel particolare
valore della variabile tale che almeno la metà delle unità presenta un valore minore o uguale a x0.5 e almeno
la metà delle unità presenta un valore maggiore o uguale a x0.5.

Per esempio l’ISTAT fa espressamente riferimento al “reddito mediano” in numerosi studi volti a
confrontare la distribuzione del reddito in Italia rispetto a quella di altri Paesi europei, oppure per analizzare
condizioni di vita e livello di povertà delle famiglie italiane nei diversi anni.

33
Altri quantili di uso frequente sono i nove decili x0.1, x0.2, ..., x0.9 e i novantanove centili x0.01, x0.02, ..., x0.99.
In questi casi la mediana corrisponde al quinto decile o al cinquantesimo centile.

Esempio 3.3.3
Considerata la seguente sequenza di n=10 valori di una variabile quantitativa continua X
3.20 3.25 2.80 2.96 3.00 3.18 3.12 1.87 1.99 2.02
si determinino i suoi tre quartili.

La sequenza ordinata è
1.87 1.99 2.02 2.80 2.96 3.00 3.12 3.18 3.20 3.25
per cui il primo quartile occupa il posto np  10  0.25  2.5  3 , la mediana il posto np  10  0.5  5  5
e il terzo quartile il posto np  10  0.75  7.5  8 .
Risulta quindi
x0.25 = 2.02
x0.5 = 2.96
x0.75 = 3.18

Esempio 3.3.4
Considerata la seguente sequenza di n=14 valori di una variabile quantitativa discreta X
3 1 5 -2 -3 -5 0 10 -9 20 12 6 -21 8
si determinino i suoi tre quartili.

La sequenza ordinata è
-21 -9 -5 -3 -2 0 1 3 5 6 8 10 12 20
per cui il primo quartile occupa il posto np  14  0.25  3.5  4 , la mediana il posto np  14  0.5  7  7
e il terzo quartile il posto np  14  0.75  10.5  11 . Risulta quindi
x0.25 = -3
x0.5 = 1
x0.75 = 8

Se nella sequenza degli n valori alcuni di questi si presentano più di una volta, l’addensamento delle
frequenze in corrispondenza di alcune determinazioni fa sì che uno stesso valore della variabile possa
corrispondere a più quantili di ordine diverso.
Se, per esempio, si considera la seguente sequenza ordinata dei voti in statistica ottenuti da 20 studenti

18 18 18 20 20 22 22 23 23 23 23 24 24 24 25 26 27 27 28 30

i tre quartili occupano rispettivamente i posti 20  0.25   5 , 20  0.5  10 e 20  0.75   15 e sono
quindi dati da x0.25 = 20, x0.5 = 23 e x0.75 = 25. Il valore 20 corrisponde però anche al secondo decile, così
come il valore 23 è sia mediana, sia quarto e sesto decile.
Alle medesime conclusioni si giunge ovviamente se si fa riferimento, invece che alla sequenza, alla
distribuzione di frequenza corrispondente, per cui il calcolo dei quantili si effettua sempre nello stesso

34
modo. Nel caso di una distribuzione di frequenza si può utilizzare i valori delle frequenze assolute cumulate
per individuare il quantile.

In una distribuzione di frequenza il quantile di ordine p della variabile quantitativa X corrisponde al valore
cj a cui è associata la prima frequenza assoluta cumulata Nj maggiore o uguale a np  .

Data per esempio la distribuzione dei voti considerati in precedenza

Distribuzione dei voti


x Frequenza assoluta Frequenza assoluta cumulata
18 3 3
20 2 5
22 2 7
23 4 11
24 3 14
25 1 15
26 1 16
27 2 18
28 1 19
30 1 20
20

dalle frequenze assolute cumulate contenute nell’ultima colonna della tabella precedente si ottengono gli
stessi quartili ottenuti sulla sequenza dei voti.

Esempio 3.3.5
Data la seguente distribuzione di frequenza relativa a una variabile quantitativa discreta X

Distribuzione di una variabile X


x Frequenza assoluta
-2 4
-1 6
0 10
1 10
2 12
3 8
50

si determini il valore del secondo, del quinto e del settimo decile.

Le unità esaminate sono 50, per cui i posti occupati dai tre decili richiesti sono rispettivamente il decimo, il
venticinquesimo e il trentacinquesimo. Dalle frequenze assolute cumulate riportate nella tabella seguente

Distribuzione di una variabile X


x Frequenza assoluta Frequenza assoluta cumulata
-2 4 4

35
-1 6 10
0 10 20
1 10 30
2 12 42
3 8 50
50

risulta x0.2 = -1, x0.5 = 1 e x0.7 = 2.

Per quanto riguarda la determinazione dei quantili per variabili quantitative continue la cui distribuzione è
stata sintetizzata in classi di valori e per variabili qualitative ordinabili ci limiteremo a fare alcune
considerazioni sull’individuazione della mediana. Per le variabili qualitative ordinabili la modalità mediana
(quantile di ordine 0.5) può essere determinata come per le variabili quantitative ovvero individuando la
𝑛
modalità che occupa posizione ⌈ ⌉ nella sequenza ordinata mentre nel caso di variabili quantitative continue
2

si può determinare la classe mediana, ovvero la classe al cui interno è contenuta la mediana. È invece chiaro
che non è mai possibile determinare i quantili di variabili qualitative sconnesse, dato che non esiste un
ordinamento naturale delle sue modalità.

3.4 Media aritmetica


La media aritmetica (o semplicemente media) è una media di tipo analitico, in quanto la sua determinazione
richiede operazioni di tipo algebrico sui valori assunti dalla variabile, per cui può essere calcolata
esclusivamente per variabili di tipo quantitativo (sia discrete, sia continue).

Date n osservazioni di una variabile quantitativa X, la media 𝑥̅ è uguale alla somma di tutti i valori divisa
per n.

Utilizzando l’operatore sommatoria, la formula di calcolo della media risulta


n

x
i 1
i
x 3.4.1
n
n
dove la somma di tutti gli n valori,  xi , rappresenta l’ammontare della variabile.
i 1

Per esempio, la media della sequenza dei voti in statistica considerata nell’esempio 2.1.3 è uguale a 20.392.

Esempio 3.4.1

36
Su di 10 aziende cooperative è stato rilevato il numero di dipendenti di un gruppo e sono stati ottenuti i seguenti dati

1 2 3 4 6 8 15 18 20 23

La media risulta
1  2  3  ...  23 100
x   10 .
10 10

Se si dispone, anziché della sequenza originaria di valori, di una distribuzione di frequenza, la media viene
calcolata in modo diverso a seconda che nella prima colonna compaiano i singoli valori della variabile
oppure le classi. Se la variabile è discreta e a ogni valore cj è associata la frequenza assoluta nj, la media
corrisponde a
k k


j 1
cj nj c
j 1
j nj
x k
 , j = 1, 2, ..., k  n, 3.4.2
n
n
j
j 1

che è equivalente alla 3.4.1, perché l'ammontare complessivo della variabile corrisponde alla somma dei
prodotti fra ciascun valore e la frequenza corrispondente (ogni valore cj compare infatti nj volte).

Se nella distribuzione compaiono le frequenze relative, la media aritmetica è definita dall'espressione


k
x c
j 1
j fj j = 1, 2, ..., k  n 3.4.3

che equivale sia alla 3.4.2, dato che


k
c j n j k nj k
c j c j f j ,
j 1
x  
n j 1
n j 1

sia alla 3.4.1, dove a ciascuna xi è associata una frequenza relativa costante, uguale a 1/n.
Infine, se i dati disponibili sono raggruppati in k classi, la media aritmetica può essere calcolata solo in
modo approssimato dato che non sono noti con esattezza tutti gli n valori rilevati (e quindi non si conosce
l’ammontare esatto della variabile all’interno di ogni singola classe). In questa situazione si adotta l'ipotesi
che i valori contenuti all'interno della j-esima classe siano tutti uguali al valore centrale, pari alla
semisomma dei suoi estremi. Considerata la j-esima classe, il valore centrale, indicato con il simbolo c j ,

risulta

37
c j 1  c j
cj  .
2
La media di una distribuzione in classi si approssima quindi mediante l’espressione
k

c j nj
k
x
j 1

n
 c
j 1
j fj,

È chiaro che, se si disponesse delle osservazioni sulla base delle quali è stata costruita la distribuzione per
classi la media andrebbe sempre calcolata utilizzando i dati originali e non la distribuzione in classi.
In alcuni casi, pur non avendo a disposizione i singoli valori della variabile rilevati sulle singole unità
statistiche, si può conoscere l’esatto ammontare della variabile per ciascuna delle classi che compongono
la distribuzione (l’ISTAT fornisce spesso questa informazione). In questo caso, ovviamente, il calcolo della
media dovrà essere effettuato considerando questa informazione, piuttosto che calcolare una sua
approssimazione.
Se invece si dispone dei soli dati in classi, va sottolineato che il valore medio approssimato risulterà più
preciso al diminuire dell'ampiezza delle diverse classi, mentre se nella distribuzione compaiono una o più
classi aperte, per il calcolo della media sarà necessario approssimare in qualche modo i valori degli estremi,
utilizzando altre eventuali informazioni disponibili sulla variabile in esame.

Esempio 3.4.2
Una approssimazione della media della distribuzione riportata nella tabella successiva

Classi di valori Frequenza relativa Valore centrale


0– 5 0.20 2.5
5 – 10 0.16 7.5
10 – 20 0.24 15.0
20 – 50 0.32 35.0
50 – 100 0.08 75.0
1.00

si ottiene dalla somma dei prodotti dei valori centrali per le frequenze relative corrispondenti, ed è uguale a 22.5.

In alcuni casi il calcolo della media di una variabile viene effettuato in modo diverso, attribuendo ai valori
distinti assunti dalla variabile un “peso” che serve per misurare l’importanza che si vuole attribuire a
ciascuno di essi.
Si supponga, per esempio, che in due diverse occasioni si siano acquistate due diverse quantità (p1 e p2) di
uno stesso bene pagando rispettivamente i prezzi x1 e x2. In questo caso l'ammontare complessivo della
spesa sostenuta è pari alla somma dei prodotti fra prezzi e quantità

38
x1  p1  x 2  p 2 .

Per calcolare il prezzo medio che, se fosse risultato identico nelle due occasioni, avrebbe fatto spendere la
stessa somma complessiva, non si può fare semplicemente la semisomma dei due prezzi x1 e x2, ma i due
prezzi vanno pesati (ossia ponderati) con le quantità corrispondenti (p1 e p2).

Il prezzo medio 𝑥̅ è pari quindi al rapporto fra l’ammontare della spesa complessiva e la quantità totale del
bene acquistata, per cui
x1  p1  x 2  p 2
x . 3.4.4
p1  p 2
Il valore così ottenuto è quel prezzo medio che lascia inalterato l’ammontare complessivo della spesa, come
risulta subito dall’uguaglianza

x  p1  p 2   x1  p1  x 2  p 2 .

La 3.4.4 è un esempio di media aritmetica ponderata, ossia di una media dove ogni singolo valore
contribuisce alla determinazione dell'ammontare complessivo in maniera proporzionale a un qualche "peso"
associato al valore stesso.

In generale, considerati gli n valori xi della variabile X a cui sono attribuiti rispettivamente i pesi pi, la media
ponderata della variabile risulta
n
 xi  pi
i 1
x n
. 3.4.5
 pi
i 1

Un esempio tipico di media ponderata si presenta quando si vuole calcolare il voto medio ottenuto negli
esami di profitto di un corso universitario quando ai diversi esami è attribuito un numero di crediti (CFU)
variabile. In questo caso la media dei voti deve tenere conto di questa informazione che “pesa” l’importanza
di ciascuno degli esami superati.
Supponiamo per esempio che uno studente abbia ottenuto le votazioni riportate nella prima riga della tabella
successiva, mentre nella seconda riga sono riportati i valori dei crediti corrispondenti.

Tabella 3.4.1
Voto e crediti degli esami universitari superati da uno studente

39
Voto 24 26 18 30 27 26
CFU 4 8 12 4 8 4

24  4  26  8  18  12  30  4  27  8  26  4 960
Il voto medio risulta x    24 .
4  6  12  4  8  8  4 40

3.5 Proprietà della media aritmetica


La media aritmetica verifica alcune importanti proprietà che verranno utilizzate anche nei capitoli
successivi.

- Prima proprietà (anche detta proprietà di internalità)


La media risulta sempre compresa all’interno del campo di variazione: x1  x  xn  .

Dimostrazione
Data una variabile quantitativa X rilevata su n unità statistiche, si considerino le osservazioni ordinate in
modo non decrescente x1 , x2  , ..., xn  . Per ogni i = 1, 2, ..., n vale la disuguaglianza xi  xn  per cui
n n
  x n   x n  .
1 1
x xi 
n i 1
n i 1

In modo analogo, dato che xi  x1 per ogni i = 1, 2, ..., n risulta

n n
  x1  x1
1 1
x xi 
n i 1
n i 1

per cui la media è sempre compresa nel campo di variazione [𝑥(1) , 𝑥(𝑛) ] della variabile X, ovvero

x1  x  xn  .

- Seconda proprietà
L’ammontare complessivo di una variabile quantitativa X rilevata su n unità corrisponde a n volte il valore
della media, ossia
n
 xi  nx .
i 1

Una conseguenza immediata della precedente relazione è che la somma degli scarti dalla media è zero,
ovvero ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ ) = 0

40
In base all’uguaglianza precedente, che non necessita di alcuna dimostrazione perché deriva direttamente
dalla definizione 3.4.1, la media aritmetica risulta essere quel particolare valore che, sostituito a ciascuno
dei valori effettivamente rilevati, lascia inalterato l'ammontare della variabile. Questa proprietà evidenzia
che la media aritmetica è quel particolare valore che “equiripartisce” l’ammontare della variabile fra le n
unità.
Per esempio, dato un gruppo di n individui su cui è stata rilevata la variabile reddito, la sua media aritmetica
rappresenta quel particolare valore teorico del reddito, uguale per ciascun individuo, che lascia inalterato il
reddito complessivo del gruppo.

- Terza proprietà (anche detta proprietà di linearità)


Sia Y = a+bX. La media delle osservazioni trasformate 𝑦1 , … 𝑦𝑛 , con yi = a+bxi (i =1,…,n), coincide con la
trasformazione lineare della media calcolata sulle osservazioni originali.

Dimostrazione
Sia x la media calcolata sulle n osservazioni relative alla variabile X e si consideri una sua trasformazione
lineare del tipo
Y = a + bX. 3.5.1
La media della osservazioni relative alla variabile Y risulta
n

y
1
y i
n i 1

e può essere scritta nella forma seguente


n
 a  bxi 
1
y
n i 1

per cui risulta


n n n
   xi  a  b x .
1 1 n 1
y a  bxi  ab 3.5.2
n i 1
n i 1
n n i 1

Quindi, se di una variabile quantitativa X è nota la media calcolata su n osservazioni, per ottenere la media
delle osservazioni relative alla variabile Y, trasformata lineare della X, non è necessario calcolare le
osservazioni trasformate e poi calcolarne la media ma è sufficiente effettuare la trasformazione lineare della
media delle osservazioni originali.
Riprendendo l’esempio 1.4.1 considerato nel primo capitolo, si indichi con X la temperatura espressa in
gradi Fahrenheit e con Y la temperatura espressa in gradi Celsius. La media della X risulta

41
23  32  50  59
x  41
4
da cui, tenuta presente la relazione esistente fra gradi Fahrenheit e gradi Celsius, la temperatura media in
gradi centigradi è

y
5
x  32   5 .
9

Esempio 3.5.1
La media su n osservazioni della variabile X è -2. Si determini la media delle osservazioni relative alle seguenti
variabili trasformate: Y=-2-4X, W=8-3X, Z=5+6X.

Applicando la 3.5.2 si ottiene


y  2  4 x  2  4   2  6
w  8  3x  8  3   2  14
z  5  6x  5  6   2  7

Come caso particolare di trasformazione lineare si consideri la variabile


Y = X−𝑥̅ , 3.5.3
che si ottiene dalla 3.5.1 ponendo a = −𝑥̅ e b = 1. La Y, detta variabile scarto, assumerà valori
yi = xi−𝑥̅
che risultano positivi o negativi a seconda che la i-esima osservazione sia rispettivamente maggiore o
minore della media. Dalla 3.5.2, tenendo presenti le uguaglianze a = −𝑥̅ e b = 1, risulta immediatamente
che la media aritmetica 𝑦̅ della variabile scarto Y è sempre pari a zero e, quindi, è pari a zero anche la
somma dei suoi n valori.

- Quarta proprietà
La somma dei quadrati degli scarti delle osservazioni dalla media è un minimo.

Dimostrazione
Dato un valore c diverso dalla media, si deve dimostrare che vale la seguente disuguaglianza
𝑛 𝑛

∑(𝑥𝑖 − 𝑥̅ )2 ≤ ∑(𝑥𝑖 − 𝑐)2 per ogni 𝑐 ≠ 𝑥̅


𝑖=1 𝑖=1

Se nel termine a destra della disuguaglianza precedente si aggiunge e si toglie 𝑥̅ si ottiene


𝑛 𝑛

∑(𝑥𝑖 − 𝑥̅ + 𝑥̅ − 𝑐)2 = ∑[(𝑥𝑖 − 𝑥̅ ) + (𝑥̅ − 𝑐)]2


𝑖=1 𝑖=1

42
Sviluppando il quadrato del binomio, risulta
𝑛 𝑛 𝑛 𝑛

∑[(𝑥𝑖 − 𝑥̅ )2 2
+ (𝑥̅ − 𝑐) + 2(𝑥𝑖 − 𝑥̅ )(𝑥̅ − 𝑐)] = ∑(𝑥𝑖 − 𝑥̅ )2 2
+ ∑(𝑥̅ − 𝑐) + 2(𝑥̅ − 𝑐) ∑(𝑥𝑖 − 𝑥̅ )
𝑖=1 𝑖=1 𝑖=0 𝑖=0

da cui, essendo la somma degli scarti dalla media uguale a zero, si ottiene
𝑛 𝑛 𝑛 𝑛
2 )2
∑(𝑥𝑖 − 𝑐) = ∑(𝑥𝑖 − 𝑥̅ + ∑(𝑥̅ − 𝑐) = ∑(𝑥𝑖 − 𝑥̅ )2 + 𝑛(𝑥̅ − 𝑐)2
2

𝑖=1 𝑖=1 𝑖=0 𝑖=1

La somma dei quadrati degli scarti da c si ottiene sommando alla somma dei quadrati degli scarti dalla
media una quantità maggiore di zero (nulla se e solo se 𝑐 = 𝑥̅ ).
La proprietà appena dimostrata sottolinea ancora una volta il ruolo di “centralità” della media aritmetica,
in quanto 𝑥̅ minimizza la somma dei quadrati degli scarti e può essere quindi considerata come il valore
“più vicino” alle n osservazioni originali.

Nota
Anche la mediana verifica una proprietà analoga a questa, ma riferita alla somma dei valori assoluti degli scarti,
anziché ai loro quadrati. La mediana x0.5 di una variabile quantitativa X è infatti quel valore che rende minima la
somma dei valori assoluti degli scarti
n
 xi  x 0.5  min .
i 1

In alcune situazioni le n unità statistiche esaminate sono naturalmente suddivise in gruppi (per esempio, le
persone esaminate in un’indagine possono essere naturalmente suddivise in maschi e femmine oppure in
occupati e disoccupati) e può accadere di conoscere il valore medio della variabile di interesse nei singoli
gruppi (per esempio, si potrebbe conoscere il reddito medio per i maschi e per le femmine o l’età media
degli occupati e dei disoccupati). In queste situazioni, se è noto il numero delle unità appartenenti ai singoli
gruppi, la media della variabile sulle n unità coincide con la media delle medie nei gruppi, ponderate con
le numerosità corrispondenti.

- Quinta proprietà (anche detta proprietà associativa)


Supponiamo che le n unità statistiche siano suddivise in g gruppi, di numerosità rispettivamente 𝑛1 , … , 𝑛𝑔 ,
con 𝑛1 + ⋯ + 𝑛𝑔 = 𝑛. Sia 𝑥̅ℎ la media delle osservazioni sulle unità del h-esimo gruppo (h = 1, 2, …, g),
la media delle osservazioni su tutte le n unità coincide con la media delle medie di gruppo 𝑥̅ℎ ponderate con
le numerosità corrispondenti nh.

43
Dimostrazione
Tenendo presente che le n osservazioni relative alla variabile X sono suddivise in g gruppi disgiunti,
conviene identificare ogni singola osservazione con due indici, il primo dei quali indica la posizione
occupata da ciascuna osservazione nel gruppo di appartenenza, mentre il secondo è l’identificativo del
gruppo. In questo modo il simbolo xih indica l’i-esima osservazione del h-esimo gruppo (con i =1, 2, …, nh,

h = 1, 2, …, g).
Utilizzando questa notazione, la media complessiva risulta
𝑔 𝑛
ℎ 𝑥
∑ℎ=1 ∑𝑖=1 𝑖ℎ
𝑥̅ = 𝑛
3.5.4
𝑛ℎ
Osservato che ∑𝑖=1 𝑥𝑖ℎ = 𝑥̅ℎ 𝑛ℎ per h = 1,…,g, la media può essere scritta mediante le medie di gruppo,
ovvero
g

1
x xh nh 3.5.5
n h1

Quindi la media complessiva coincide con la media delle medie dei singoli gruppi ponderate per la
numerosità dei gruppi stessi.

Esempio 3.5.4
Si consideri un gruppo di 100 laureati di cui 45 di sesso femminile e 55 di sesso maschile. Sapendo che il voto medio
di laurea delle studentesse è risultato pari a 103.3 mentre il voto medio degli studenti è risultato pari a 101.1,
determinare il voto medio di laurea per l’intero gruppo di laureati.

103.3  45  101.1  55
Il voto medio di laurea è 𝑥̅ =  102.09
100

3.6 Momenti
Il concetto di media aritmetica è alla base della definizione di un’altra famiglia di indici, frequentemente
utilizzati in statistica, che vengono detti momenti.

Data la sequenza delle n osservazioni di una variabile quantitativa X, si definisce momento dall’origine
(o momento) di ordine r (e viene indicato di solito mediante il simbolo mrx o mediante il più semplice
simbolo mr, se è evidente che si sta analizzando la variabile X) la media aritmetica delle potenze r-esime

delle osservazioni
n
 xir ,
1
m rx  m r  r = 0, 1, 2, ... 3.6.1
n i 1

44
Dalla formula precedente si vede subito che il momento di ordine zero è sempre uguale a 1, mentre ponendo
r = 1 si ottiene la media aritmetica 𝑥̅ = 𝑚1 .

Esempio 3.6.1
Data la seguente sequenza di valori,
0 1 1 3 3 4
il terzo momento dall’origine risulta
0  1  1  33  33  4 3
m3   20
6

Nel caso di una distribuzione di frequenza il momento di ordine r risulta


k k
 c rj n j   c rj
1
mr  f j, r = 0, 1, 2, ... 3.6.2
n j 1 j 1

Esempio 3.6.2
Data la distribuzione riportata nella tabella seguente

xi fi
0 0.4
1 0.2
2 0.3
3 0.1
1.0

il secondo momento dall’origine corrisponde a


m2 = 0×0.4+1×0.2+4×0.3+9×0.1=2.3

Per una distribuzione in classi, il valore approssimato del momento di ordine r risulta
k k
 c rj n j   c rj
1
mr  fj, r = 0, 1, 2, ... 3.6.3
n j 1 j 1

Oltre ai momenti dall’origine, in statistica spesso si utilizzano anche i momenti centrali. Il momento
centrale di ordine r, indicato con il simbolo 𝑚
̅ 𝑟𝑥 o più brevemente 𝑚
̅ 𝑟 se è chiaro che è relativo alla
variabile X, è la media delle potenze r-esime degli scarti dalla media, ovvero

1 n
m rx  m r   xi  x r , r = 0, 1, 2, ... 3.6.4
n i 1
Si osserva immediatamente che 𝑚
̅ 0 = 1, mentre per 𝑚
̅ 1 = 0. Nel caso di una distribuzione di frequenza il
momento centrale di ordine r è

45
 c j  x r n j   c j  x r
k k
1
mr  fj, r = 0, 1, 2, ... 3.6.5
n j 1 j 1

ed infine, per una distribuzione in classi, il valore approssimato del momento centrale di ordine r è dato da

 c j  x r n j   c j  x r
k k
1
mr  fj, r = 0, 1, 2, ... 3.6.6
n j 1 j 1

Il momento centrale di ordine r è la media aritmetica delle potenze r-esime degli scarti dalla media
aritmetica.

Esempio 3.6.3
Data la distribuzione riportata nella tabella dell’esempio 3.6.2, se ne calcoli il secondo momento centrale.

La media aritmetica è pari a


x  0  0.4  1  0.2  2  0.3  3  0.1  1.1
per cui il secondo momento centrale è
̅ 2 = (0 − 1.1)2 × 0.4 + (1 − 1.1)2 × 0.2 + (2 − 1.1)2 × 0.3 + (3 − 1.1)2 × 0.1 = 1.09
𝑚

Proprietà
Sia m rx il momento centrale calcolato su n osservazioni della variabile X e sia Y = a + bX. Il momento

centrale di ordine r sulle osservazioni relative alla variabile Y è mry  b r mrx .

Dimostrazione
Siano rispettivamente 𝑥̅ e 𝑚
̅ 𝑟𝑥 la media e il momento centrale r-esimo delle osservazioni relative alla
variabile X. Considerando la variabile Y = a + bX, ricordando che yi = a+bxi e 𝑦̅ = 𝑎 + 𝑏𝑥̅ , il momento
centrale r-esimo delle osservazione relative alla variabile Y, può essere scritto nella forma seguente
n n n
  yi  y r   a  bxi  a  bx r   bxi  x r 
1 1 1
mry 
n i 1
n i 1
n i 1
3.6.7
n
 xi  x 
1
b r r
 b mrx r
n i 1

Questo risultato indica che i momenti centrali di ordine r sono invarianti per cambiamenti dell’origine della
scala di misura, ma variano al variare dell’unità di misura.

I valori dei momenti centrali possono essere ricavati da quelli dei momenti dall'origine utilizzando la
formula del binomio di Newton

46
𝑛 𝑛 𝑟 𝑟 𝑛 𝑟
1 1 𝑟 𝑟 1 𝑟
̅ 𝑟 = ∑(𝑥𝑖 − 𝑥̅ )𝑟 = ∑ ∑ ( ) 𝑥𝑖𝑙 (−𝑥̅ )𝑟−𝑙 = ∑ ( ) ( ∑ 𝑥𝑖𝑙 )(−𝑥̅ )𝑟−𝑙 = ∑ ( ) 𝑚𝑙 (−𝑚1 )𝑟−𝑙
𝑚
𝑛 𝑛 𝑙 𝑙 𝑛 𝑙
𝑖=1 𝑖=1 𝑙=0 𝑙=0 𝑖=1 𝑙=0

Applicando la precedente formula per r = 2, 3, 4 si ottengono le seguenti relazioni tra i momenti centrali e
i momenti:
̅ 2 = 𝑚2 − 𝑚12
𝑚
̅ 3 = 𝑚3 − 3𝑚2 𝑚1 + 2𝑚13
𝑚
̅ 4 = 𝑚4 − 4𝑚3 𝑚1 + 6𝑚2 𝑚12 − 3𝑚14
𝑚

La relazione tra il momento centrale di ordine 2 e il momento di ordine 2 può essere ottenuta sviluppando
il quadrato del binomio, ovvero

 xi  x 2   xi2  2 xxi  x 2    xi2  2 x  xi   x 2  


1 n
1 n
1  n n n 
m2 
n i 1
n i 1
n  i 1 i 1 i 1 
3.6.8
n n n
   x 2  m2  2 x 2  x 2  m2  x 2  m2  m12
1 1 1
 xi2  2 x xi 
n i 1
n i 1
n i 1

cioè il secondo momento centrale coincide con la differenza fra il secondo momento e la media al quadrato
o, in altri termini, con la differenza tra la media dei quadrati e il quadrato della media.
Esempio 3.6.4
Data la distribuzione riportata nella tabella dell’esempio 3.6.2, se ne calcoli il secondo momento centrale mediante il
calcolo dei primi due momenti dall’origine.

Risulta
𝑥̅ = 0 × 0.4 + 1 × 0.2 + 2 × 0.3 + 3 × 0.1 = 1.1
𝑚2 = 0 × 0.4 + 1 × 0.2 + 4 × 0.3 + 9 × 0.1 = 2.3

da cui si ottiene

̅ 2 = 𝑚2 − 𝑥̅ 2 = 2.3 − (1.1)2 = 1.09


𝑚

47

Potrebbero piacerti anche