Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
2022-2023)
5 Indici di variabilità
Calcolare la deviazione standard della durata delle pellicole cinematografiche
dell’esercitazione 2:
durata ni
70 ⊣ 90 34
90 ⊣ 100 32
100 ⊣ 120 36
120 ⊣ 180 18
6 Indici di variabilità
Per una certa variabile quantitativa X, sono stati osservati su un campione di
n = 10 unità i seguenti valori:
0, 2, 4, 5, 5, 5, 5, 6, 8, 10
2
Soluzioni
1
1. Ricordando che è z̄ = 1.8, si verifica facilmente (per i calcoli si veda la
tabella) che è
k
X
ni (zi − z̄) = 5 · (0 − 1.8) + · · · + 4 · (4 − 1.8) = 0
i=1
3
e quindi ki=1 ni (zi −z̄)2 ≤ ki=1 ni (zi −z0.5 )2 come ci aspettavamo ricordando
P P
la proprietà di minimo della media aritmetica.
2
La media aritmetica delle temperature espresse in gradi Celsius è data da
1
t̄ = (12 + 13 + 19 + 16 + 15 + 16 + 14) = 105/7 = 15
7
La relazione (lineare!) che permette di convertire temperature in gradi C in
temperature in gradi F è
9
f = t + 32
5
e quindi si ottiene la seguente serie di temperature espresse in gradi F:
F : 53.6 55.4 66.2 60.8 59 60.8 57.2
da cui
1
f¯ = (53.6 + · · · + 60.8) = 413/7 = 59
7
Tale valore della media aritmetica per F si poteva calcolare anche come
9 9
f¯ = t̄ + 32 = · 15 + 32 = 59
5 5
e si è cosı̀ verificata con un esempio la proprietà di linearità della media aritmetica.
3
Risulta
12
1 X 1
x̄M = xiM = (180 + · · · + 170) = 178
12 i=1 12
e
8
1X 1
x̄F = xiF = (170 + · · · + 164) = 171
8 i=1 8
dove M e F a pedice identificano i due gruppi di maschi e femmine. La media per
l’intero collettivo è data da
20
1 X 1 3504
x̄ = xi = (180 + · · · + 170 + 170 + · · · + 164) = = 175.2
20 i=1 20 20
Ma si può calcolare - grazie alla proprietà associativa - anche come
nM · x̄M + nF · x̄F 12 · 178 + 8 · 171
x̄ = = = 175.2
n 20
4
4
La varianza, utilizzando la formula della definizione, vale:
k
1X
s̃2z = (zi − z̄)2 · ni
n i=1
1
(0 − 1.8)2 · 5 + (1 − 1.8)2 · 5 + (2 − 1.8)2 · 3 + (3 − 1.8)2 · 3 + (4 − 1.8)2 · 4
=
20
43.2
= = 2.16
20
Utilizzando la formula alternativa:
k
1X 2
s̃2z = zi · ni − z̄n2
n i=1
1 2
= (0 · 5 + 12 · 5 + 22 · 3 + 32 · 3 + 42 · 4) − 1.82
20
108
= − 3.24 = 2.16
20
e dunque lo scarto quadratico medio è pari a:
p
s̃z = s̃2z = 1.47
5
Risulta, dalla formula alternativa per il calcolo della varianza,
k
1X 2
s̃2X = x̄ · ni − x̄2
n i=1 i
1
= (802 · 34 + 952 · 32 + 1102 · 36 + 1502 · 18) − 103.52
120
1347000
= − 103.52
120
= 512.75
√
e quindi la deviazione standard della durata delle pellicole risulta s̃X = 512.75 =
22.6 (min).
5
6
• Risulta che
M o = 5 (5 è il valore più frequente)
M e = 5 (5 è il valore assunto dalle due unità statistiche nelle posizioni centrali)
10
1 X
x̄ = xi = 5
10 i=1
(Notiamo che la distribuzione della X è simmetrica rispetto al valore 5;
assumendo che si tratti di un fenomeno quantitativo discreto, la sua rappre-
sentazione grafica è quella di Figura 1, da cui la simmetria appare evidente).
• Risulta
range = x(10) − x(1) = 10 − 0 = 10
DI = Q3 − Q1 = 6 − 4 = 2
v
u n r r
u1 X (0 − 5)2 + (2 − 5)2 + · · · + (10 − 5)2 70
s̃X = t (xi − x̄)2 = = = 2.65
n i=1 10 10
• Se l’ultimo valore osservato fosse 100 e non 10, é facile verificare che moda
e mediana rimarrebbero inalterate uguali a 5, la media invece diventerebbe
pari a 14.
Il range da 10 passerebbe a 100; la differenza interquartile rimarrebbe inal-
terata perchè i valori di Q1 e Q3 non cambierebbero. La deviazione standard
diverrebbe s̃X = 28.74.
In conclusione, media, range e deviazione standard risentirebbero molto della
presenza di questo valore “anomalo” (o “outlier”, valore cioè che si discosta di
molto dal resto delle osservazioni); mediana e differenza interquartile invece
no: per questo, si dice che sono due indici “robusti” rispetto alla presenza di
valori anomali.
6
Figura 1: Rappresentazione grafica della distribuzione di frequenza della X
(assumendo sia una variabile discreta)
4
3
ni
2
1
0
0 2 4 5 6 8 10