Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Svolgimento
Al fine di valutare l’importanza numerica relativa dei diversi corsi di laurea presso
la facoltà di statistica di Roma, è opportuno utilizzare dei rapporti di composizione
(o di parte al tutto). Per il calcolo di quest’ultimi è necessario disporre del numero
totale di iscritti ai corsi di laurea della facoltà di statistica di Roma. Dalla tabella
fornita dal testo dell’esercizio otteniamo:
Corso Roma
S. Stat. Dem. 802
S. Stat. Att. 443
S. Stat. Econ. 1194
Tot. 2439
I rapporti di composizione desiderati risultano quindi essere:
802
• = 0.3288 per quanto riguarda il corso in Scienze Statistiche e Demogra-
2439
fiche;
443
• = 0.1816 per quanto riguarda il corso in Scienze Statistiche ed Attuariali;
2439
1194
• = 0.4895 per quanto riguarda il corso in Scienze Statistiche ed Economiche
2493
I risultati ottenuti ci dicono che presso la facoltà di statistica di Roma, il 32.88% degli
studenti è iscritto al corso di laurea in Scienze Statistiche e Demografiche, il 18.16%
degli studenti è iscritto al corso di laurea in Scienze Statistiche ed Attuariali mentre
il restante 48.95% è iscritto al corso di laurea in Scienze Statistiche ed Economiche.
Procedendo nello stesso modo anche per la facoltà di statistica di Trieste si ottiene:
Corso Trieste
S. Stat. Dem. 228
S. Stat. Att. 189
S. Stat. Econ. 534
Tot. 951
2. La seguente tabella riporta il numero di esami sostenuti nell’anno 2002 per il con-
seguimento delle patenti di guida (A-B-C-D-E-Speciali) nelle province di Milano e di
Roma e il numero di esaminandi risultati idonei (Fonte Ministero delle Infrastrutture
e dei Trasporti):
Provincia Esami Idonei
Milano 124398 93820
Roma 166641 130300
Si valuti in quale delle due province l’esito degli esami è stato migliore.
Si riconosca la natura del rapporto 124398/166641 e se ne interpreti il risultato.
Svolgimento
Per valutare in quale delle due provincie si è avuto il miglior esito degli esami, è
opportuno calcolare i seguenti rapporti di composizione:
n◦ di idonei in provincia di Milano n◦ di idonei in provincia di Roma
.
n◦ di esami svolti in provincia di Milano n◦ di esami svolti in provincia di Roma
Sulla base delle informazioni contenute nella tabella fornita dal testo dell’esercizio i
rapporti di composizione desiderati risultano essere:
93820
• = 0.7542 per quanto riguarda la provincia di Milano;
124398
130300
• = 0.7819 per quanto riguarda per quanto riguarda la provincia di Roma.
166641
Downloaded by Megi Ceka (megiceka@gmail.com)
lOMoARcPSD|3060872
I risultati ottenuti ci dicono che, nella provincia di Milano, il 75.42% degli esaminati
sono risultati idonei. Nella provincia di Roma tale percentuale sale invece al 78.19%.
Possiamo quindi concludere che l’esito degli esami è stato migliore nella provincia di
Roma.
Il rapporto statistico
n◦ di esami svolti in provincia di Milano 124398
= = 0.7465
n di esami svolti in provincia di Roma
◦
166641
è un rapporto di coesistenza e ci informa che per ogni 100 esami sostenuti a in provin-
cia di Roma, ne sono stati sostenuti circa 75 in provincia di Milano.
3. La seguente tabella riporta per alcune regioni il numero di incidenti stradali verifi-
catesi in un anno e la lunghezza della rete stradale in chilometri:
Calcolare in quale regione si è avuta una maggiore densità di incidenti stradali e con-
frontarlo con l’analogo indice per la nazione, sapendo che in Italia si sono verificati
nell’anno considerato 292762 incidenti e che la lunghezza della rete stradale è pari a
303365 Km.
Svolgimento
Al fine di individuare la regione in cui si è avuta una maggiore densità di incidenti
stradali, è opportuno calcolare, relativamente ad ogni regione, il rapporto di densità:
n◦ di incidenti
.
lunghezza della rete stradale
Ad esempio, nel caso della regione Piemonte, tale rapporto è dato da
18840
= 0.6096
30907
e ci indica che in Piemonte, in un anno, si sono verificati 0.6096 incidenti stradali per
km di strada. Nel caso della regione Friuli Venezia Giulia il rapporto è dato da
10268
= 1.7448
5885
e ci indica che in Friuli Venezia Giulia, in un anno, si sono verificati 1.7448 incidenti
per km di strada. Procedendo analogamente per le restanti regioni si ottiene:
Osservando i risultati riportati nella tabella concludiamo che la regione nella quale
si è avuta una maggiore densità di incidenti stradali è il Lazio. In tale regione, in un
anno, si sono verificati 2.7871 incidenti stradali per km di strada.
Per quanto riguarda l’Italia, il rapporto di densità è dato da
292762
= 0.9650
303365
e ci indica che in Italia, in un anno, si sono verificati 0.9650 incidenti per km di
strada. Questo risultato mostra che la densità di incidenti stradali in Lazio è circa
tre volte più alta di quella dell’Italia.
4. La seguente tabella riporta il numero di nati vivi nel 2004 ripartiti per sesso:
a) Sapendo che nel 2004 la popolazione in Italia era di 57888300 unità calcolare il
quoziente di natalità;
b) calcolare quanti maschi e femmine nascono ogni cento nati in Italia;
c) calcolare quanti maschi sono nati nel 2004 per ogni 100 femmine (indice di mas-
colinità); calcolare quante femmine sono nate nel 2004 per ogni 100 maschi (indice
di femminilità).
Svolgimento
Svolgimento punto a). Ricordiamo che il quoziente di natalità è un rapporto di
derivazione dato da:
n◦ di nati vivi (avvenuti nell’anno)
Totale popolazione (rilevata nell’anno)
Sulla base dei dati forniti dal testo dell’esecizio, il quoziente di natalità per l’Italia
nel 2004 è pari a
562599
= 0.009719 .
57888300
Solitamente questo indice viene moltiplicato per 1000. In tal caso esso assume valore
pari a 9.719. Concludendo: in Italia, nel 2004, si sono avuti 9.719 nati vivi ogni mille
abitanti.
Svolgimento punto b). Al fine di calcolare quanti maschi e quante femmine nascono
ogni 100 nati vivi in Italia, è opportuno calcolare i seguenti rapporti di composizione
percentuali:
maschi nati vivi 288850
· 100 = = 51.34
totale nati vivi 562599
femmine nate vive 273749
· 100 = = 48.66
totale nati vivi 562599
Tali rapporti ci dicono che in Italia, nel 2004, sono nati circa 51 maschi ogni 100 nati
vivi e circa 49 femmine ogni 100 nati vivi.
Svolgimento punto c). Gli indici di mascolinità e di femminilità sono dei rapporti
di coesistenza percentuali rispettivamente dati da:
n◦ di maschi nati vivi 288850
· 100 = · 100 = 105.52
n di femmine nate vive
◦
273749
n◦ di femmine nate vive 273749
· 100 = · 100 = 94.77
n di maschi nati vivi
◦
288850
L’indice di mascolinità ci dice che in Italia, nel 2004, sono nati circa 106 maschi ogni
100 nate femmine. L’indice di femminilità ci dice invece che in Italia, nel 2004, sono
nate circa 95 femmine ogni 100 nati maschi.
5. La popolazione residente (in migliaia) nel comune di Milano dal 1991 al 1996 ha
avuto il seguente andamento:
Si costruiscano le serie dei numeri indici a base fissa (1991=100), base fissa (1999=100)
e base mobile. Si commentino i risultati ottenuti.
Svolgimento
Si indichino con P91 , P92 , ..., P96 rispettivamente la popolazione residente nel comune
di Milano negli anni 1991, 1992, ..., 1996. Secondo questa notazione, la serie dei nu-
meri indici percentuali a base fissa (1991=100) e a base fissa (1993=100) sono date
rispettivamente da:
Pj
Ij,91 · 100 = · 100 j = (91, 92, .., 96)
P91
Pj
Ij,93 · 100 = · 100 j = (91, 92, .., 96)
P93
Utilizzando i dati riportati nel testo dell’esercizio abbiamo ad esempio che:
1359
I92,91 · 100 = · 100 = 99.3421
1368
1334
I93,91 · 100 = · 100 = 97.5146
1368
L’indice I92,91 · 100 ci dice che la popolazione residente a Milano nel 1992 è diminuita
dello 0, 65% rispetto all’anno 1991. L’indice I93,91 · 100 ci dice che la popolazione
residente a Milano nel 1993 è diminuita del 2.48% rispetto all’anno 1991.
Per quanto riguarda i numeri indici a base fissa (1993=100) abbiamo ad esempio che:
1368
I91,93 · 100 = · 100 = 102.5487
1334
1359
I92,93 · 100 = · 100 = 101.8741
1334
L’indice I91,93 · 100 ci dice che la popolazione residente a Milano nel 1991 è più alta
del 2.5487% rispetto all’anno 1993. L’indice I92,93 · 100 ci dice che la popolazione
residente a Milano nel 1992 è più alta dell’1.8741% rispetto all’anno 1991.
Secondo la notazione introdotta in precedenza, la serie dei numeri indici a base mobile
è data da:
Pj
Ij,j−1 · 100 = · 100 j = (91, 92, .., 96)
Pj−1
Sulla base dei dati a nostra disposizione abbiamo ad esempio che:
1359
I92,91 · 100 = · 100 = 99.3421
1368
1334
I93,92 · 100 = · 100 = 98.1604
1359
Il commento relativo a I92,91 · 100 è già stato riportato in precendenza. L’indice
I93,92 · 100 ci dice che la popolazione residente a Milano nel 1993 è diminuita dell’1.8396%
rispetto all’anno precedente.
Nella tabella seguente riportiamo tutti gli indici di cui era richiesto il calcolo.
6. La seguente tabella riporta i numeri indici dei prezzi al consumo per l’intera collet-
tività (fonte ISTAT 2005).
2000 2001 2002 2003 2004
112.8 115,9 118.8 122.0 124.7
Sapendo che la base degli indici è il 1995, commentare la serie dei numeri indici.
Svolgimento
a) 112.8: i prezzi al consumo per l’intera collettività del 2000 sono più alti del
12.8% rispetto a quelli del 1995.
b) 115.9: i prezzi al consumo per l’intera collettività del 2001 sono più alti del
15.9% rispetto a quelli del 1995.
c) 118.8: i prezzi al consumo per l’intera collettività del 2002 sono più alti del
18.8% rispetto a quelli del 1995.
d) 122.0: i prezzi al consumo per l’intera collettività del 2003 sono più alti del
22.0% rispetto a quelli del 1995.
e) 124.7: i prezzi al consumo per l’intera collettività del 2004 sono più alti del
24.7% rispetto a quelli del 1995.
7. I numeri indici a base mobile della popolazione censita dal 1861 al 1981 sono riportati
nella seguente tabella:
1861 1871 1881 1901 1911 1921 1931 1936 1951 1961 1971 1981
— 106.9 105.8 113.3 109.3 102.5 108.4 103.3 112.0 106.5 106.9 103.8
Commentare i numeri indici e calcolare i numeri indici a base fissa 1861 = 100 e
1981 = 100.
Svolgimento
Commentiamo i numeri indici a base mobile forniti dal testo dell’esercizio:
• la popolazione censita nel 1871 è più alta del 6.9% rispetto a quella censita nel
1861;
• la popolazione censita nel 1881 è più alta del 5.8% rispetto a quella censita nel
1871;
• la popolazione censita nel 1901 è più alta del 13.3% rispetto a quella censita nel
1881;
• la popolazione censita nel 1911 è più alta del 9.3% rispetto a quella censita nel
1901;
• la popolazione censita nel 1921 è più alta del 2.5% rispetto a quella censita nel
1911;
• la popolazione censita nel 1931 è più alta dell’8.4% rispetto a quella censita nel
1921;
• la popolazione censita nel 1936 è più alta del 3.3% rispetto a quella censita nel
1931;
• la popolazione censita nel 1951 è più alta del 12% rispetto a quella censita nel
1936;
• la popolazione censita nel 1961 è più alta del 6.5% rispetto a quella censita nel
1951;
• la popolazione censita nel 1971 è più alta del 6.9% rispetto a quella censita nel
1961;
• la popolazione censita nel 1981 è più alta del 3.8% rispetto a quella censita nel
1971.
• I1871.1861 = 1.069: la popolazione censita nel 1871 è più alta del 6.9% rispetto a
quella censita nel 1861;
• I1881.1861 = I1881.1871 · I1871.1861 = 1.058 · 1.069 = 1.131:
la popolazione censita nel 1881 è più alta del 13.3% rispetto a quella censita nel
1861;
• I1901.1861 = I1901.1881 · I1881.1861 = 1.133 · 1.131 = 1.281:
la popolazione censita nel 1901 è più alta del 28.1% rispetto a quella censita nel
1861;
• I1911.1861 = I1911.1901 · I1901.1861 = 1.093 · 1.281 = 1.400:
la popolazione censita nel 1911 è più alta del 40% rispetto a quella censita nel
1861;
• I1921.1861 = I1921.1911 · I1911.1861 = 1.025 · 1.400 = 1.436:
la popolazione censita nel 1921 è più alta del 43.6% rispetto a quella censita nel
1861;
Ricaviamo ora i numeri indici a base fissa 1861 = 100, tralasciando, per brevità, i
relativi commenti.
x1971
x1971 x I1971.1861 2.05
• I1971.1981 = = x1861 = = = 0.963 .
x1861 1981 I1981.1861 2.128
x1861
I1881.1861 1.131
• I1881.1981 = = = 0.531;
I1981.1861 2.128
I1871.1861 1.069
• I1871.1981 = = = 0.502;
I1981.1861 2.128
I1861.1861 1
• I1861.1981 = = = 0.470.
I1981.1861 2.128
1.1 Esercizi
Svolgimento
La popolazione di riferimento è l’insieme delle famiglie prese in esame e ciascuna di
esse rappresenta quindi una unità statistica.
Svolgimento
É possibile riassumere il tutto nella seguente tabella:
Tipo Scala di
Carattere Modalità di misurazione
carattere delle modalità
Settore di Industria
attività del Agricoltura Qualitativo Nominale
capofamiglia Altra Attività
Titolo di Affitto
godimento Proprietà Qualitativo Nominale
dell’abitazione Altro titolo
Senza Titolo
Titolo Licenza elementare
di studio Licenza media Qualitativo Ordinale
del capofamiglia Diploma
Laurea
Numero di Quantitativo Scala di
figli 0, 1, 2, 3, 4, 5 Discreto rapporti
Reddito annuo Quantitativo Scala di
lordo (in euro) (25000, 31000) Continuo rapporti
Età del Quantitativo Scala di
capofamiglia (in anni) {25, ..., 70} Discreto rapporti
Svolgimento
Analizziamo ora ciascun carattere individuato.
Settore di
nj
attività del nj = freq. assolute = freq. relative
N
capofamiglia
Agricoltura 4 0.2
Industria 11 0.55
Altra Attività 5 0.25
Totale 20 1
11
4 5
A. I. A. A.
Fig. 1: Grafico delle frequenze assolute del carattere “Settore di attività del capofamiglia”.
0.55
0.2 0.25
A. I. A. A.
Fig. 2: Grafico delle frequenze relative del carattere “Settore di attività del capofamiglia”.
0.25
A. A.
0.55 I.
A.
0.2
Fig. 3: Aerogramma delle frequenze relative del carattere “Settore di attività del capofamiglia”.
Titolo di
nj
godimento nj = freq. assolute = freq. relative
N
dell’abitazione
Affitto 8 0.4
Proprietà 10 0.5
Altro Titolo 2 0.1
Totale 20 1
10
8
2
A. P. A. T.
Fig. 4: Grafico delle frequenze assolute del carattere “Titolo di godimento dell’abitazione”.
0.5
0.4
0.1
A. P. A. T.
Fig. 5: Grafico delle frequenze relative del carattere “Titolo di godimento dell’abitazione”.
0.4
0.5 P. A.
A. T.
0.1
Fig. 6: Aerogramma delle frequenze relative del carattere “Titolo di godimento dell’abitazione”.
Titolo di
nj
studio del nj = freq. assolute = freq. relative
N
capofamiglia
Senza Titolo 1 0.05
Licenza elementare 1 0.05
Licenza media 6 0.3
Diploma 5 0.25
Laurea 7 0.35
Totale 20 1
7
1 1 6 5
0.35
0.05 0.05 0.3 0.25
Titolo di
studio del Cj = freq. cumulate Rj = freq. retrocumulate
capofamiglia
Senza Titolo 1 20
Licenza elementare 2 19
Licenza media 8 18
Diploma 13 12
Laurea 20 7
• “Numero di figli”
Numero
nj
di nj = freq. assolute = freq. relative
N
figli
0 3 0.15
1 5 0.25
2 5 0.25
3 4 0.20
4 1 0.05
5 2 0.10
Totale 20 1
nj
5
4
3
2
1
0 1 2 3 4 5 figli
fj
0.25
0.20
0.15
0.10
0.05
0 1 2 3 4 5 figli
Fig. 10: Grafico delle frequenze relative del carattere “Numero di figli”.
Numero
di Cj = freq. cumulate Rj = freq. retrocumulate
figli
0 3 20
1 8 17
2 13 12
3 17 7
4 18 3
5 20 2
Reddito
nj
annuo nj = freq. assolute = freq. relative
N
lordo
fino a 17000 3 0.15
17000 ⊣ 18500 5 0.25
18500 ⊣ 20000 4 0.20
20000 ⊣ 26000 4 0.20
oltre 26000 4 0.20
Totale 20 1
Reddito
annuo Ampiezza della classe fs = freq. specifiche
lordo
15000 ⊣ 17000 2000 0.0015
17000 ⊣ 18500 1500 0.003̄
18500 ⊣ 20000 1500 0.0026̄
20000 ⊣ 26000 6000 0.0006̄
26000 ⊣ 33000 7000 0.00057
fs
0.003
0.0026
0.0015
0.0006
0.00057
Fig. 11: Grafico delle frequenze assolute del carattere “Reddito annuo lordo”.
Reddito
annuo Cj = freq. cumulate Rj = freq. retrocumulate
lordo
15000 ⊣ 17000 3 20
17000 ⊣ 18500 8 17
18500 ⊣ 20000 12 12
20000 ⊣ 26000 16 8
26000 ⊣ 33000 20 4
Età
nj
del nj = freq. assolute = freq. relative
N
capofamiglia
fino a 30 5 0.25
31|−|49 5 0.25
50|−|55 3 0.15
56|−|60 5 0.25
oltre 60 2 0.1
Totale 20 1
Età
del Ampiezza della classe fs = freq. specifiche
capofamiglia
26|−|30 5 1
31|−|49 19 0.263
50|−|55 6 0.5
56|−|60 5 1
61|−|70 10 0.2
Possiamo ora disegnare il grafico del carattere “Età del capofamiglia”: lo ripor-
tiamo in Figura (12).
fs
0.5
0.26
0.2
0 25 30 35 40 45 50 55 60 65 70 anni
Fig. 12: Grafico delle frequenze assolute del carattere “Età del capofamiglia”.
Età
del Cj = freq. cumulate Rj = freq. retrocumulate
capofamiglia
26|−|30 5 20
31|−|49 10 15
50|−|55 13 10
56|−|60 18 7
61|−|70 20 2
4. Costruire le tabelle a doppia entrata delle frequenze assolute e relative della coppia
di caratteri “settore di attività” e “numero di figli” e della coppia “età” e “reddito”.
Svolgimento
La tabella a doppia entrata delle frequenze assolute dei caratteri “settore di attività”
e “numero di figli” è la seguente:
Sett.attività A I AA
TOTALE
Figli
0 0 2 1 3
1 1 3 1 5
2 1 2 2 5
3 1 2 1 4
4 0 1 0 1
5 1 1 0 2
TOTALE 4 11 5 20
Sett.attività A I AA
TOTALE
Figli
0 0 0.1 0.05 0.15
1 0.05 0.15 0.05 0.25
2 0.05 0.1 0.1 0.25
3 0.05 0.1 0.05 0.2
4 0 0.05 0 0.05
5 0.05 0.05 0 0.1
TOTALE 0.2 0.55 0.25 1
La tabella a doppia entrata delle frequenze assolute dei caratteri “età” e “reddito” è
la seguente:
Svolgimento
Numero
nj
di nj = freq. assolute = freq. relative
N
figli
fino a 1 8 0.4
2|−|4 10 0.5
5 e oltre 2 0.1
Totale 20 1
Numero
di Ampiezza della classe fs = freq. specifiche frs = freq. specifiche
figli assolute relative
0|−|1 2 4 0.2
2|−|4 3 3.3̄ 0.16̄
5|−|6 2 1 0.05
fS
4
3
2
1
0 1 2 3 4 5 6 figli
Fig. 13: Grafico delle frequenze assolute del carattere “Numero di figli” raggruppato in classi.
frs
0.2
0.16
0.05
0 1 2 3 4 5 6 figli
Fig. 14: Grafico delle frequenze relative del carattere “Numero di figli” raggruppato in classi.
Per calcolare invece la percentuale di famiglie con al più 3 figli, dovremo sommare
le lunghezze delle aste in corrispondenza dei valori minori o uguali a 3 e poi
moltiplicare per 100. Quindi, considerando il carattere raggruppato in classi,
(vedi Figura (14)):
numero di stanze 1 2 3 4 5 6 7 8
nj 5 22 32 35 16 7 2 1
Svolgimento
La popolazione statistica è composta dalle 120 abitazioni della provincia di Belluno
prese in esame e quindi le unità statistiche sono proprio tali abitazioni.
Il carattere “numero di stanze” è un carattere quantitativo discreto e la scala di mi-
surazione delle sue modalità è una scala di rapporti.
Le frequenze relative, cumulate (relative e assolute) e retrocumulate (relative e as-
solute) sono riassunte nella seguente tabella:
nj
numero nj fj = Cj Fj Rj F̄j
N
di freq. freq. freq.cumul. freq.cumulate freq.retrocumul. freq.retrocumul.
stanze assolute relative assolute relative assolute relative
1 5 0.0416 5 0.0416 120 1
2 22 0.183̄ 27 0.225 115 0.9583̄
3 32 0.26̄ 59 0.4916̄ 93 0.775
4 35 0.2916̄ 94 0.783̄ 61 0.5083̄
5 16 0.13̄ 110 0.916̄ 26 0.216̄
6 7 0.0583̄ 117 0.975 10 0.083̄
7 2 0.016̄ 119 0.9916̄ 3 0.025
8 1 0.0083̄ 120 1 1 0.083̄
nj
35
22
16
7
2
0 1 2 3 4 5 6 7 8 Stanze
Fig. 15: Grafico delle frequenze assolute del carattere “numero di stanze”.
Svolgimento
La popolazione statistica è composta dai 1240 calzaturifici italiani presi in esame e
quindi le unità statistiche sono proprio tali calzaturifici.
Il carattere “fatturato” è un carattere quantitativo continuo e la scala di misurazione
delle sue modalità è una scala di rapporti.
Le frequenze relative, cumulate (relative e assolute) e retrocumulate (relative e as-
solute) sono riassunte nella seguente tabella:
nj
classi nj fj = Cj Fj Rj F̄j
N
di freq. freq. freq. cumul. freq.cumulate freq.retrocumul. freq.retrocumul.
fatturato assolute relative assolute relative assolute relative
fino a 0.5 340 0.274 340 0.274 1240 1
0.5 ⊣ 1 368 0.297 708 0.571 900 0.726
1⊣5 480 0.387 1188 0.958 532 0.429
5 ⊣ 10 37 0.030 1225 0.988 52 0.041
oltre 10 15 0.012 1240 1 15 0.012
fs
736
680
120
7.4
3
0 1 5 10 15 fatturato
Fig. 16: Grafico delle frequenze assolute del carattere “fatturato”.
8. Gli esercizi alberghieri della provincia di Belluno sono stati classificati in base al
numero di camere per esercizio. I risultati dell’indagine sono riportati nella seguente
tabella:
numero di camere fino a 5 6|−|9 10|−|13 14|−|17 18|−|22 23|−|30 totale
numero esercizi 20 20 20 24 25 16 125
Svolgimento
La popolazione statistica è composta dai 125 esercizi alberghieri della provincia di Bel-
luno presi in esame e quindi le unità statistiche sono proprio tali esercizi alberghieri.
Il carattere “numero di camere” è un carattere quantitativo discreto e la scala di mi-
surazione delle sue modalità è una scala di rapporti.
Le frequenze relative, cumulate (relative e assolute) e retrocumulate (relative e as-
solute) sono riassunte nella seguente tabella:
nj
numero nj fj = Cj Fj Rj F̄j
N
di freq. freq. freq.cumul. freq.cumulate freq.retrocumul. freq.retrocumul.
camere assolute relative assolute relative assolute relative
fino a 5 20 0.16 20 0.16 125 1
6|−|9 20 0.16 40 0.32 105 0.84
10|−|13 20 0.16 60 0.48 85 0.68
14|−|17 24 0.192 84 0.672 65 0.52
18|−|22 25 0.2 109 0.872 41 0.328
23|−|30 16 0.128 125 1 16 0.128
numero Ampiezza fs
di nj della frequenze
camere classe specifiche
0|−|5 20 6 3.3̄
6|−|9 20 4 5
10|−|13 20 4 5
14|−|17 24 4 6
18|−|22 25 5 5
23|−|30 16 8 2
fs
6
5
3.3
2
0 5 10 15 20 25 30 camere
Fig. 17: Grafico delle frequenze assolute del carattere “numero di camere”.
9. I correntisti di una banca in possesso di titoli e senza titoli sono stati classificati in
base al loro saldo finale in migliaia di euro al 31/03/04 ottenendo la seguente tabella:
Dopo aver indicato la tipologia del carattere saldo finale e la relativa scala di mis-
urazione, si confrontino in un unico grafico le due distribuzioni di frequenze.
Svolgimento
Il carattere “saldo finale” è un carattere quantitativo continuo e la scala di misurazione
delle sue modalità è una scala di rapporti.
Per rappresentare in un unico grafico le distribuzioni di frequenze, dato che le nu-
merosità dei due gruppi (clienti con un conto titoli e clienti senza un conto titoli) sono
differenti, è necessario calcolare le frequenze relative, rapportando ciascuna frequenza
con il suo totale di colonna.
A questo punto possiamo calcolare le frequenze specifiche relative per le due distri-
buzioni.
f rs
0.1
= Clienti con un conto titoli
= Clienti senza un conto titoli
0.04
0.026
0.005
0 5 10 15 20 25 30 35 40 45 50 55 60
migliaia di €
Procedura A B C D E F
Tempo (X) 33,6 34,2 35,0 30,6 30,2 31,4
x(1) = 30, 2; x(2) = 30, 6; x(3) = 31, 4; x(4) = 33, 6; x(5) = 34, 2; x(6) = 35.
Il valore assunto dal primo quartile ci dice che nel 25% dei casi circa, il tempo
necessario per l’esecuzione di una procedura è inferiore a 30.5 secondi. Dunque nel
75% dei casi il tempo di esecuzione è superiore a 30.5 secondi.
Numero giorni 1 ⊢⊣ 3 4 ⊢⊣ 5 6 ⊢⊣ 8
Frequenza 4 6 10
Il numero di abitazioni con al più due camere ci viene fornito dalla seconda frequenza
cumulata che è pari a 27. Esse rappresentano una quota delle abitazioni pari a
27
= 0, 225
120
che coincide con il 22, 5% delle abitazioni. Il numero di abitazioni con almeno tre
camere ci viene fornito dalla terza frequenza retrocumulata che è pari a 93. Esse
rappresentano una quota delle abitazioni pari a
93
= 0, 775
120
che coincide con il 77, 5% delle abitazioni.
Passiamo al calcolo dei quartili.
Q1 = x( 120+1 ) = x(30,25)
4
Q2 = Me = x( 120+1 ) = x(60,5)
2
di stanze almeno pari a 3. Il valore assunto da Q2 ci informa che circa il 50% delle
abitazioni considerate ha un numero di stanze al più pari a 4 e dunque circa il 75%
delle abitazini considerate ha un numero di stanze almeno pari a 4. Tale informazione
è la medesima che ci viene fornita dalla mediana. Il valore assunto da Q3 ci informa
che circa il 75% delle abitazioni considerate ha un numero di stanze al più pari a 4 e
dunque circa il 25% delle abitazioni ha un numero di stanze almeno pari a 4.
Il secondo ed il settimo decile della distribuzione sono dati da:
D2 = x( 120+1 ) = x(24,2)
5
Il valore assunto da C59 ci informa che circa il 59% delle abitazioni considerate ha un
numero di stanze al più pari a 4 e dunque circa il 41% delle abitazioni ha un numero
di stanze pari almeno pari a 4.
Svolgimento
Osserviano innanzi tutto che la distribuzione di frequenze in considerazione riguarda
un carattere quantitativo continuo con modalità raggruppate in classi.
Riportiamo di seguito alcuni calcoli che ci saranno utili nello svolgimento dell’eser-
cizio.
ni
Fatturato ni N
Fr. Cum. Fr. Retrocum. Ampiezza Fr. Spec.
fino a 0, 5 340 0,2741 340 1240 0,5 680
0, 5 ⊣ 1 368 0,2967 708 900 0,5 736
1⊣5 480 0,387 1188 532 4 120
5 ⊣ 10 37 0,029 1225 52 5 7,4
oltre 10 15 0,012 1240 15 10 1,5
Tale risultato si basa sull’ipotesi che, all’interno di ogni classe di reddito, le frequenze
si distribuiscano in modo uniforme. Graficamente, il numero di cazaturifici che hanno
avuto un fatturato compreso tra 3 e 6, 5 miliardi coincide con l’area evidenziata nel
grafico:
fs
736
680
120
7.4
3
0 1 3 5 6.5 10 15 fatturato
Per quanto riguarda il calcolo dei quartili, determiniamo innanzi tutto le loro po-
sizioni:
1241 1241
P os(Q1 ) = = 310, 25 P os(Q2 ) = 2 · = 620, 5
4 4
1241
P os(Q3 ) = 3 · = 930, 75.
4
In base alle frequenze cumulate, le classi del primo, secondo e terzo quartile risultano
essere rispettivamente: fino a 0, 5; 0, 5 ⊣ 1; 1 ⊣ 5.
Nel caso della prima classe, sembra opportuno fissare a 0 il suo estremo inferiore. I
quartili risultano dunque essere:
0, 5
Q1 = 0 + [310, 25 − 0 − 0, 5] · = 0, 46
340
Q2 = Me = 0, 88
4
Q3 = 1 + [930, 75 − 708 − 0, 5] · = 2, 852
480
Il valore assunto da Q1 ci informa che all’incirca il 25% dei calzaturifici ha avuto nel
1996 un fatturato minore o uguale a 0, 46 miliardi di lire. Il rimanente 75% circa
ha avuto un fatturato maggiore o uguale a 0, 46 miliardi di lire. Q2 coincide con la
mediana ed ha dunque il suo stesso significato. Il valore assunto da Q3 ci informa
che il 75% dei calzaturifici ha avuto nel 1996 un fatturato minore o uguale a 2, 852
miliardi di lire. Il rimanente 25% circa ha avuto un fatturato maggiore o uguale a
2, 852 miliardi di lire.
Per quanto rigiarda il calcolo dei primi cinque decili, determiniamo innanzi tutto le
loro posizioni:
1241 1241
P os(D1 ) = = 124, 1 P os(D2) = 2 · = 248, 2
10 10
1241 1241
P os(D3) = 3 · = 372, 3 P os(D4 ) = 4 · = 496, 4
10 10
1241
P os(D5 ) = 5 · = 620, 5
10
Osservando le frequenze cumulate, le classi associate a tali posizioni sono rispettiva-
mente: fino a 0, 5; fino a 0, 5; 0, 5 ⊣ 1; 0, 5 ⊣ 1; 0, 5 ⊣ 1. Utilizzando 0 come estremo
inferiore della prima classe, i primi cinque decili risultano essere:
0.5
D1 = 0 + [124, 1 − 0 − 0, 5] = 0, 182
340
0.5
D2 = 0 + [248, 2 − 0 − 0, 5] = 0, 36
340
0.5
D3 = 0, 5 + [372, 3 − 340 − 0, 5] = 0, 543
368
0.5
D1 = 0, 5 + [496, 4 − 340 − 0, 5] = 0, 712
368
D1 = Me = 0, 88
Il valore assunto da D1 ci informa che il 10% dei calzaturifici ha avuto nel 1996 un
fatturato minore o uguale a 0, 182 miliardi di lire. Il restante 90% circa ha avuto
un fatturato maggiore o uguale a 0, 182 miliardi di lire. Il valore assunto da D2 ci
informa che il 20% dei calzaturifici ha avuto nel 1996 un fatturato minore o uguale a
0, 36 miliardi di lire. Il restante 80% circa ha avuto un fatturato maggiore o uguale
a 0, 36 miliardi di lire. Il valore assunto da D3 ci informa che il 30% dei calzaturifici
ha avuto nel 1996 un fatturato minore o uguale a 0, 543 miliardi di lire. Il restante
70% circa ha avuto un fatturato maggiore o uguale a 0, 543 miliardi di lire. Il valore
assunto da D4 ci informa che il 40% dei calzaturifici ha avuto nel 1996 un fatturato
minore o uguale a 0, 712 miliardi di lire. Il restante 90% circa ha avuto un fatturato
maggiore o uguale a 0, 712 miliardi di lire. D5 coincide con la mediana ed ha dunque
il suo stesso significato.
Per quanto riguarda il calcolo dei primi tre centili, determiniamo innanzitutto le loro
posizioni:
1241 1241
P os(C1 ) = = 12, 41 P os(C2) = 2 · = 24, 82
100 100
1241
P os(C3) = 3 · = 37, 23
100
6. La seguente tabella riporta le distribuzioni degli impiegati civili dello stato secondo
la qualifica funzionale:
Svolgimento
La distribuzione di frequenze in considerazione riguarda un carattere qualitativo rile-
vato su scala ordinale. Al fine di calcolare i percentili richiesti dal testo dell’esercizio,
ricaviamo le frequenze cumulate.
Q1 = III; Q2 = Me = IV ; Q3 = IV.
• All’incirca il 25% degli impiegati civili dello stato ha una qualifica al più pari a
III. Pertanto il rimanente 75% circa ha una qualifica almeno pari a III.
• All’incirca il 50% degli impiegati civili dello stato ha una qualifica al più pari a
IV . Pertanto il rimanente 50% circa ha una qualifica almeno pari a IV .
• All’incirca il 75% degli impiegati civili dello stato ha una qualifica al più pari a
IV . Pertanto il rimanente 25% circa ha una qualifica almeno pari a IV .
D6 = IV D7 = IV D8 = V D9 = V I
Tali valori ci dicono che:
• All’incirca il 10% degli impiegati civili dello stato ha una qualifica al più pari a
III. Il rimanente 90% circa ha una qualifica almeno pari a III.
• All’incirca il 20% degli impiegati civili dello stato ha una qualifica al più pari a
III. Il rimanente 80% circa ha una qualifica almeno pari a III.
• All’incirca il 30% degli impiegati civili dello stato ha una qualifica al più pari a
III. Il rimanente 70% circa ha una qualifica almeno pari a III.
• All’incirca il 40% degli impiegati civili dello stato ha una qualifica al più pari a
III. Il rimanente 60% circa ha una qualifica almeno pari a III.
• All’incirca il 50% degli impiegati civili dello stato ha una qualifica al più pari a
IV . Il rimanente 50% circa ha una qualifica almeno pari a IV .
• All’incirca il 60% degli impiegati civili dello stato ha una qualifica al più pari a
IV . Il rimanente 40% circa ha una qualifica almeno pari a IV .
• All’incirca il 70% degli impiegati civili dello stato ha una qualifica al più pari a
IV . Il rimanente 30% circa ha una qualifica almeno pari a IV .
• All’incirca il 80% degli impiegati civili dello stato ha una qualifica al più pari a
V . Il rimanente 20% circa ha una qualifica almeno pari a V .
• All’incirca il 90% degli impiegati civili dello stato ha una qualifica al più pari a
V I. Il rimanente 10% circa ha una qualifica almeno pari a V I.
Numero di stanze 1 2 3 4 5 6 7 8 9
ni 10 35 40 21 10 6 4 2 1
Numero incidenti fino a 2 3⊢⊣4 5⊢⊣8 9⊢⊣11 12⊢⊣16 17⊢⊣19 20⊢⊣24 totale
Frequenze 380 305 285 84 67 24 5 1150
Calcolare:
i) la percentuale di entrate minori di 5000$;
ii) la percentuale delle entrate maggiori di 12000$;
iii) i quartili;
iv) l’entrata di reddito che è superata solo dal 10% delle entrate.
Svolgimento
Al fine dello svolgimento dell’esercizio saranno utili i risultati riportati nella seguente
tabella.
Entrate Frequenze Freq. Cumulate Freq. Retrocum. Freq. Spec.
0⊣2 250 250 8080 125
2⊣4 1589 1839 7830 794.5
4⊣6 1768 3607 6241 884
6⊣8 1473 5080 4473 736.5
8⊣10 1172 6252 3000 586
10⊣15 1298 7550 1828 259.6
15⊣20 306 7856 530 61.2
20⊣50 200 8056 224 6.6̄
50⊣100 21 8077 24 0.42
100⊣200 3 8080 3 0.03
totale 8080 – –
3 · 259, 6 = 778, 8.
2
Q2 = x(4040,5) = 6 + (4040, 5 − 3607 − 0, 5) · = 6, 5879.
1473
2
Q3 = x(6060,75) = 8 + (6060, 75 − 5080 − 0, 5) · = 9, 6728.
1172
iv) L’entrata del reddito che è superata solo dal 10% delle entrate coincide con D9 .
La posizione del nono decile è data da:
8081
P os(D9 ) = 9 · = 7272, 9.
10
5
D9 = x(7272,9) = 10 + (7272, 9 − 6252 − 0, 5) = 13, 9366.
1298
1 MEDIA ARITMETICA 2
1 MEDIA ARITMETICA
1. La seguente tabella riporta il numero di persone divise per sesso che si sono presentate
durante l’anno 1997 presso un laboratorio d’analisi mediche per rilevare il livello di
colesterolemia nel sangue.
Gen Feb Mar Apr Mag Giu Lug Ago Set Ott Nov Dic
maschi 180 168 160 160 158 120 80 23 132 102 156 96
femmine 150 146 150 149 143 104 40 21 122 104 147 98
Si calcoli la media mensile dei pazienti maschi e dei pazienti femmine che si sono
presentati al laboratorio.
Svolgimento
Il numero totale di pazienti maschi presentatisi nel 1997 per la rilevazione del livello
di colesterolemia è dato da:
180 + 168 + 160 + 158 + 120 + 80 + 23 + 132 + 102 + 156 + 96 = 1535.
La media mensile del numero di maschi presentatisi al laboratorio per l’esame in
questione è quindi data da:
1535
M1 (maschi) = = 127.92
12
In media, nell’anno 1997, si sono presentati al laboratorio, per la rilevazione del livello
di colesterolemia, 127.92 pazienti maschi ogni mese. Più precisamente 127.92 indica
il numero ipotetico di pazienti maschi che si sarebbero presentati al laboratorio in
un mese, nell’ipotesi in cui il numero di pazienti maschi fosse stato uguale per tutti
i mesi.
Il numero totale di pazienti di sesso femminile presentatisi nel 1997 per la rilevazione
del livello di colesterolemia è dato da:
150 + 146 + 150 + 149 + 143 + 104 + 40 + 21 + 122 + 104 + 147 + 98 = 1374.
La media mensile del numero di femmine presentatisi al laboratorio per l’esame in
questione è quindi data da:
1374
M1 (f emmine) = = 114.5
12
In media, nell’anno 1997, si sono presentati al laboratorio, per la rilevazione del livello
di colesterolemia, 114.5 pazienti femmine ogni mese. Più precisamente 114.5 indica
il numero ipotetico di pazienti di sesso femminile che si sarebbero presentati al labo-
ratorio in un mese, nell’ipotesi in cui il numero di pazienti di sesso femminile fosse
stato uguale per tutti i mesi.
Dal confronto tra le due medie osserviamo che, relativamente alla rilevazione del li-
vello di colesterolemia, nel 1997, mediamente presso il laboratorio d’analisi si sono
presentati ogni mese più maschi che femmine.
1 MEDIA ARITMETICA 3
2. Le temperature della neve in gradi Celsius di una nota località sciistica nel mese di
gennaio sono state le seguenti:
tj -4 -3 -2 -1 0 1
gj 6 5 8 6 4 2
Svolgimento
La seguente tabella riporta alcuni conti che ci saranno utili per lo svolgimento dell’e-
sercizio.
tj gj tj · gj
-4 6 -24
-3 5 -15
-2 8 -16
-1 6 -6
0 4 0
1 2 2
tot 31 -59
La temperatura media in gradi Celsius è data da:
P6
j=1 tj · gj
M1 (TCelsius ) = P6
j=1 gj
−59
= = −1.903
31
Nel periodo di osservazione, la temperatura media della neve nella nota località sciis-
tica è stata pari −1.903 C ◦ . Più precisamente, −1.903 C ◦ indica la temperatura che
si sarebbe dovuta osservare nell’intero mese di gennaio nel caso in cui si fosse avuta
la stessa temperatura in ogni giorno.
Si osservi che le relazioni che ci permettono di passare dalle temperature in gradi
Celsius a quelle in gradi Fahrenheit e assoluti, sono lineari. In forza della proprietà
di linearità della media aritmetica1 le medie ricercate risultano:
Nel periodo di osservazione, la temperatura media della neve nella nota località sci-
istica è stata pari a 28.574 gradi Fahrenheit. Più precisamente, 28.574 indica la
temperatura in gradi Fahrenheit che si sarebbe dovuta osservare nell’intero mese di
1
Zenga M., Lezioni di statistica descrittiva, pag. 122 (Quarta proprietà di M1 ).
1 MEDIA ARITMETICA 4
gennaio nel caso in cui si fosse avuta la stessa temperatura in ogni giorno.
Svolgimento
Si tratta di calcolare la media aritmetica per una distribuzione di frequenza con dati
raggruppati in classi. In questo caso la media aritmetica viene calcolata ipotizzando
che la frequenza di ogni classe si concentri nel valore centrale della classe stessa.
classi di reddito redditieri (nj ) Val. Centrale (xj ) nj · xj
1000 ⊢ 5000 100 3000 300000
5000 ⊢ 15000 400 10000 4000000
15000 ⊢ 35000 300 25000 7500000
35000 ⊢ 75000 200 55000 11000000
tot 1000 – 22800000
1 MEDIA ARITMETICA 5
4. Le 500 imprese di un settore sono state classificate in base al numero di addetti come
segue:
Calcolare il numero medio di addetti del settore, sia ricorrendo all’informazione for-
nita dalla terza riga della tabella, sia non ricorrendovi.
Svolgimento
Supponiamo dapprima di essere in possesso dell’informazione fornita dalla terza riga
della tabella. In tal caso possiamo risalire al numero complessivo di addetti all’interno
del settore industriale allo studio:
Alla luce di ciò, il numero medio di addetti per azienda impegnata nel settore risulta
pari a:
47439
M1 = = 94.878 .
500
M1 = 94.878 indica il numero di addetti che sarebbero impiegati in ciascuna azienda
nell’ipotesi in cui il numero totale di addetti venisse ripartito in parti uguali tra tutte
le aziende del settore in considerazione, ossia nell’ipotesi in cui ciascuna azienda abbia
lo stesso numero di addetti.
In alternativa, saremmo potuti giungere al medesimo risultato calcolando in primo
luogo le medie del numero di addetti nelle aziende appartenenti a ciascuna delle
classi considerate ed in secondo luogo sfruttando la proprietà associativa 2 della media
aritmetica. A tal fine costruiamo la seguente tabella:
Nella tabella sopra riportata, ad esempio, M1 (1) = 7 ci indica che, in media, all’in-
terno delle 25 aziende con un numero di addetti tra 1 e 9, si hanno 7 addetti. Più
precisamente, 7 indica il numero di addetti che sarebbero impiegati all’interno delle
aziende appartenenti alla classe 1⊢⊣9 , nell’ipotesi in cui il numero totale di addetti
relativi a questa categoria di imprese fosse ripartito in parti uguali tra le imprese
2
Zenga M., Lezioni di statistica descrittiva, pag. 120 (Terza proprietà di M1 ).
1 MEDIA ARITMETICA 6
stesse, ossia nell’ipotesi in cui tutte le aziende appartenenti alla categoria in consid-
erazione avessero lo stesso numero di addetti. Analogamente, M1 (4) = 121 ci indica
che mediamente, le 168 aziende aventi un numero di addetti compreso tra 50 e 199,
hanno 121 addetti. Più precisamente, 121 indica il numero di addetti che sarebbero
impiegati all’interno delle aziende con un numero di addetti tra 50 e 199, nell’ipotesi
in cui il numero totale di addetti relativi a questa categoria di imprese fosse ripartito
in parti uguali tra le imprese stesse, ossia nell’ipotesi in cui tutte le aziende apparte-
nenti alla categoria in considerazione avessero lo stesso numero di addetti.
In forza della proprietà associativa della media aritmetica abbiamo che:
(7 · 25) + (15.893 · 56) + (37.963 · 189) + (121 · 168) + (222.688 · 51) + (683.091 · 11)
M1 =
500
47439
= = 94.878
500
che coincide con quanto ricavato in precedenza. Si osservi che le medie aritmetiche di
ogni classe, xj , possono costituire un valore rappresentativo delle classi, come avviene
per i valori centrali (utilizzati ad esempio nell’esercizio precedente e utili nei contesti
in cui non si dispone di ulteriori informazioni sulle classi).
Come sopra precisato, se si suppone di non disporre dell’informazione fornita dalla
terza riga della tabella riportata dal testo dell’esercizio, dobbiamo calcolare la media
aritmetica per una distribuzione di frequenza con dati raggruppati in classi utilizzan-
do i valori centrali delle classi stesse. In questo caso ipotizziamo cioè che le aziende
appartenenti alla medesima classe abbiano un’ugual numero di addetti, pari al valore
centrale della classe. E’ dunque necessario calcolare tali valori centrali e a tal fine
scegliamo di chiudere l’ultima classe con il valore 1000.
(5 · 25) + (14.5 · 56) + (34.5 · 189) + (124.5 · 168) + (349.5 · 51) + (750 · 11)
M1 =
500
54448
= = 108.896
500
Si osservi che l’ipotesi che le aziende di ogni classe abbiano un’ugual numero di addet-
ti, pari al valore centrale della classe a cui appartengono, ci ha portato ad individuare
un numero teorico complessivo di addetti pari a 54448, tale valore non coincide con
il totale effettivo 47439. Ignorando l’informazione contenuta nella terza riga della
1 MEDIA ARITMETICA 7
5. Le medie aritmetiche dei voti riportati agli esami di maturità (in sessantesimi) in
quattro classi di un istituto superiore sono le seguenti
sezioni A B C D Totale
voto medio 54 46 40 52
n. studenti 30 27 20 18 95
Svolgimento
Sfruttando la proprietà associativa delle media aritmetica, la media dei voti di ma-
turità per l’intero istituto risulta essere:
6. La seguente tabella riporta la distribuzione del numero di alberghi delle due località
turistiche A e B di un comprensorio, secondo le classi di fatturato annuale X (in
milioni di Euro):
1 MEDIA ARITMETICA 8
chiudere la prima classe con il valore 0. Nella seguente tabella riportiamo dei calcoli
che ci saranno utili in seguito.
Classi nAj nBj Val. Centr. nj = nA B
j + nj xcj · nj xcj · nA
j xcj · nB
j
di fatturato xcj
0⊢1 15 25 0.5 40 20 7.5 12.5
1⊢3 24 51 2 75 150 48 102
3⊢5 85 67 4 152 608 340 268
5⊢10 48 59 7.5 107 802.5 360 442.5
10⊢20 40 31 15 71 1065 600 465
20⊢40 29 31 30 60 1080 870 930
tot 241 264 – 505 4445.5 2225.5 2220
1 MEDIA ARITMETICA 9
Svolgimento
Svolgimento punto a) Per la proprietà di internalità della media artimentica abbiamo
che
x(1) ≤ M1 ≤ x(n) .
Nel nostro caso si dovrebbe avere che
3 ≤ M1X ≤ 30 (1)
M1Y − 0.7
3≤ ≤ 30.
5
Isolando M1Y nell’espressione appena riportata, otteniamo che la media del carattere
Y deve soddifare le seguenti disuguaglianze:
Svolgimento
Per calcolare la media aritmetica dei logaritmi dei valori indicati dal testo del-
l’esercizio, predisponiamo la seguente tabella (in cui si è fatto uso dei logaritmi
naturali):
xi log(xi )
2 0.6931
4 1.3863
8 2.0794
16 2.7725
32 3.4657
64 4.1589
128 4.8520
tot 19.4081
Di conseguenza:
M0 (X) = eM1 (log X) .
Grazie a quest’ultima espressione abbiamo che:
La media geometrica dei valori riportati dal testo dell’esercizio è di conseguenza pari
a 16. Quale verifica della correttezza dei calcoli appena svolti, ricaviamo il valore di
M0 (X) utilizzando anche il procedimento diretto.
v
u 7
uY
7
M0 (X) = t xi
i=1
1
Zenga M., Lezioni di statistica descrittiva, pag 131: prima proprietà della media geometrica.
√7
= 2 · 4 · 8 · 16 · 32 · 64 · 128
√7
= 2 · 22 · 23 · 24 · 25 · 26 · 27
√7
= 228
28
= 2 7 = 24 = 16.
2. Le temperature della neve in gradi centigradi di una nota località sciistica nel mese
di agosto sono state le seguenti:
xj 6 5 4 3 2 1
nj 2 4 6 5 8 6
Svolgimento
Il numero totale di giorni in cui è stata rilevata la temperatura della neve nella località
sciistica è dato da:
N = 2 + 4 + 6 + 5 + 8 + 6 = 31.
Indicando con k il numero delle modalità del carattere “temperatura in gradi centi-
gradi” che si sono effettivamente osservate, la media geometrica della distribuzione è
data da:
v
u k
uY nj
M0 = t N
xj
j=1
√
31
= 62 · 54 · 46 · 35 · 28 · 16
= 2.5796
Possiamo dunque concludere dicendo che la media geometrica delle temperature della
neve rilevate durante mese d’agosto nella nota località sciistica è pari a 2.5796 C ◦ .
3. Una classe di studenti che hanno frequentato il liceo insieme si trova alla cena di
classe ad un paio d’anni dalla maturità. Sia X il numero di esami sostenuti durante
i primi due anni di iscrizione all’università:
X 0 ⊢⊣ 1 2 ⊢⊣ 4 5 ⊢⊣ 7 8 ⊢⊣ 9
n studenti
◦
6 10 8 4
T otale esami sostenuti 4 27 52 33
Svolgimento
Si supponga in primo luogo di essere in possesso dell’informazione fornita dalla terza
riga della tabella riportata nel testo dell’esercizio. In tal caso è ragionevole sinte-
tizzare ciascuna classe in cui è raggruppato il carattere “numero di esami sostenuti”
mediante la media aritmetica degli esami sostenuti dagli studenti che appartengono a
ciascuna delle classi stesse. Queste medie (xj ), insieme ad altri calcoli che ci saranno
utili nel seguito, sono riportate nella seguente tabella:
La media geometrica calcolata sfruttando le informazioni della terza riga della tabella
è data da:
v
u 4
′ uY nj
M0 = 28 t x
j
j=1
p
= (0.6667)6 · (2.7)10 · (6.5)8 · (8.25)4
28
= 3.0165
Supponendo invece di non essere in possesso delle informazioni contenute nella terza
riga della tabella, è ragionevole sintetizzare ciascuna classe mediante i loro valori
centrali cj . In questo caso la media geometrica risulta essere data da:
v
u 4
′′ uY nj
M0 = 28 t c
j
j=1
p
= (0.5)6 · (3)10 · (6)8 · (8.5)4
28
= 2.8907 .
Svolgimento
Le variazioni relative annuali della quantità di grano importata sono date da:
qj − qj−1 qj
Vj.j−1 = = − 1 = Ij.j−1 − 1 j = 1991, 1992, ..., 1997.
qj−1 qj−1
Il loro calcolo è riportato nella seguente tabella:
Anno (j) quantità (qi ) Ij.j−1 Vj.j−1
1991 1534 – –
1992 2323 1.5143 0.5143
1993 2340 1.0073 0.0073
1994 2150 0.9188 -0.0812
1995 2460 1.1442 0.1442
1996 2470 1.0041 0.0041
1997 2510 1.0162 0.0162
Ad esempio, la variazione relativa V1992.1991 , dice che le importazioni di grano del
1992 sono state maggiori del 51.43% rispetto a quelle del 1991. V1994.1993 dice che
le importazioni di grano del 1994 sono state minori dell’8.12% rispetto a quelle del
1993. In modo analogo si commentano le altre variazioni relative annuali.
La variazione relativa media annua (o tasso di variazione medio annuo) della quantità
di grano importata, è data da:
( 1997 ) 16
Y
V̄ = (1 + Vj.j−1 ) −1
j=1991
( 1997
) 16
Y
= Ij.j−1 −1
j=1991
= I¯ − 1
dove, come è possibile osservare, si è indicato con I¯ la media geometrica dei numeri
indici a base mobile Ij.j−1 .
Osserviamo inoltre che:
1997
Y q1997
Ij.j−1 = I1997.1991 = .
j=1991
q1991
La media geometrica I¯ dei numeri indici a base mobile, di conseguenza, è data da:
16
1 2510
I¯ = (I1997.1991 ) 6 = = 1.0855
1534
Abbiamo dunque che:
61
2510
V̄ = − 1 = 1.0855 − 1 = 0.0855 .
1534
Downloaded by Megi Ceka (megiceka@gmail.com)
lOMoARcPSD|3060872
La variazione relativa media annua della quantità di grano importata, risulta essere
pari a 0.0855. Essa ci indica che, mediamente, negli anni dal 91 al 97, si è osservata
una crescita annuale delle importazioni di grano pari all’ 8.55%.
Svolgimento
La variazione relativa media mensile è data da
V̄ = I¯ − 1
dove con I¯ si è indicata la media geometrica dei numeri indici a base mobile la quale
risulta essere pari a:
1
¯ 186759 8
I= = 0.9839 .
212568
La variazione relativa media mensile risulta quindi:
81
186759
V̄ = − 1 = 0.9839 − 1 = −0.0161 .
212568
Svolgimento
E’ necessario, partendo dai dati forniti dal testo dell’esercizio, calcolare il numero
La media geometrica del numero di pezzi prodotti in un’ora è data dunque da:
p
M0 (Z) = 5 (6.78) · (6.59) · (6.67) · (7.25) · (6.67)
= 6.79
In alternativa avremmo potuto ricavare il valore di M0 (Z) sfruttando la seguente
proprietà2 della media geometrica:
Y M0 (Y )
M0 = .
X M0 (X)
Nel nostro caso abbiamo:
p
M0 (Y ) = 5 (1506) · (1602) · (1501) · (1493) · (1655) = 1550.048
p
M0 (X) = 5 (222) · (243) · (225) · (206) · (248) = 228.293.
Concludendo, abbiamo che
Y 1550.048
M0 (Z) = M0 ( )= = 6.79
X 228.293
che coincide con il risultato ottenuto in precedenza.
Svolgimento
Nella seguente tabella sono riportati alcuni calcoli utili per lo svolgimento dell’eser-
cizio.
xi 1\xi x2i
13 0.0769 169
5 0.2 25
7 0.1428 49
26 0.0385 676
19 0.0526 361
tot 0.5109 1280
2
Zenga M., Lezioni di statistica descrittiva, pag. 134: seconda proprietà della media geometrica.
Svolgimento
Nella seguente tabella sono riportati alcuni calcoli utili per lo svolgimento dell’eser-
cizio.
xj nj xj · nj log(xj ) log(xj ) · nj x−1
j j · nj
x−1 x2j x2j · nj
5 20 100 1.6094 32.1887 0.2 4 25 500
20 40 800 2.9957 119.8293 0.05 2 400 16000
40 60 2400 3.6889 221.3328 0.025 1.5 1600 96000
60 50 3000 4.0943 204.7172 0.01667 0.8333 3600 180000
90 30 2700 4.4998 134.9943 0.0111 0.3333 8100 243000
Tot 200 9000 – 713.0623 – 8.6667 – 535500
La media aritmetica del carattere rilevato è data da:
5
1 X 9000
M1 = xj · nj = = 45.
200 j=1 200
200
= = 23.0769.
8.6667
La media quadratica del carattere rilevato è data da:
v
u 5
u 1 X
M2 = t x2 · nj
200 j=1 j
r
535500
= = 51.7446.
200
E’ facile osservare che i valori medi appena ricavati soddifano la relazione d’ordine
riportata dal testo dell’esercizio. Infatti:
1.1 Esercizi
1. Una banca ha applicato negli ultimi 12 anni ad un deposito vincolato i seguenti tassi
di interesse composto: 8.2% per 1 anno, 12.5% per 3 anni, 10.7% per 4 anni, 11.4%
per 2 anni e 9% per 2 anni. Determinare il tasso medio annuo che lascia inalterato il
valore del deposito al termine dei 12 anni.
Svolgimento
Calcolare il tasso medio annuo che lascia inalterato il valore del deposito al termine
dei 12 anni significa trovare il tasso che, se fosse stato applicato per tutti i 12 anni,
avrebbe portato ad ottenere lo stesso capitale (montante) finale.
Il fattore di capitalizzazione medio annuo (1+ x̄) che lascia inalterato il capitale finale
devi quindi soddisfare la relazione
N
Y N
Y
C0 · (1 + xi ) = C0 · (1 + x̄)
i=1 i=1
cioè
N
Y
(1 + x̄)N = (1 + xi )
i=1
" N
# N1
Y
1 + x̄ = (1 + xi )
i=1
N
" # N1
Y
Dalla relazione 1 + x̄ = (1 + xi ) è facile riconoscere che il fattore di capitaliz-
i=1
zazione medio annuo è la media geometrica dei fattori di capitalizzazione annui.
Nel nostro caso, abbiamo tassi di interesse (e quindi fattori di capitalizzazione) appli-
cati per più anni: mostreremo dunque che è necessario considerare la media geome-
trica ponderata dei fattori di capitalizzazione, con pesi pari agli anni di applicazione.
Si completa perciò la seguente tabella, calcolando i fattori di capitalizzazione annui
e il numero di anni nei quali sono stati applicati.
X = fattore di ni = anni
capitalizzazione annuo di applicazione
1+0.082=1.082 1
1+0.125=1.125 3
1+0.107=1.107 4
1+0.114=1.114 2
1+0.09=1.09 2
TOTALE 12
cioè
5
Y
(1 + xi )ni = (1 + x̄)12
i=1
da cui si ricava v
u 5
uY
12
1 + x̄ = t (1 + xi )ni
i=1
vale a dire la media geometrica ponderata dei fattori di capitalizzazione, con pesi
pari agli anni di applicazione.
Nel nostro caso, quindi
√
12
1 + x̄ = 3.412
e quindi
1 + x̄ = 1.10768.
A questo punto possiamo ricavare il tasso di interesse medio annuo:
x̄ = 1.10768 − 1 = 0.10768 (= 10.768%).
Svolgimento
a) Calcoliamo per prima cosa, l’espressione generale del numero di pedaggi
dell’i-esimo casello, ovvero
xi
1.5
e di conseguenza, il numero di pedaggi complessivi dei 5 caselli, è dato da
5
X xi
.
i=1
1.5
cioè
5
X 5
X
xi = x̄
i=1 i=1
da cui
5
X
xi = 5 · x̄.
i=1
ed è possibile quindi affermare che la media aritmetica degli incassi dei 5 caselli
è il tipo di media cercato.
M−1 ≤ M0 ≤ M1 ≤ M2
M2 ≥ 150,
ragion per cui non è possibile che la media quadratica degli incassi dei 5 caselli
sia pari a 136 euro.
3. Un’auto percorre 5 tratti di strada, ciascuno dei quali lungo 150 km con velocità
rispettivamente pari a
Svolgimento
Il tempo totale impiegato per percorrere tutti e 5 i tratti sarà quindi dato da
5 5 5
X X 150 X 1
ttot = ti = = 150 · .
i=1 i=1
vi v
i=1 i
La velocità media v̄ che lascia inalterato il tempo utilizzato per percorrere tutti
i tratti di strada, deve pertanto soddisfare la seguente relazione
5 5
X 1 X 1
150 · = 150 ·
v
i=1 i i=1
v̄
cioè
5
X 1 1
=5· .
v
i=1 i
v̄
Dalla precedente relazione si ricava
5
v̄ = 5
.
X 1
i=1
vi
Si può quindi affermare che la velocità media v̄ che lascia inalterato il tempo
utilizzato per percorrere tutti i tratti di strada è la media armonica delle velocità.
ci = 150 k vi2 .
La velocità media (v̄) che lascia inalterato il consumo totale deve soddisfare la
relazione
X 5 X5
2
150 k · vi = 150 k · v̄ 2
i=1 i=1
cioè
5
X
vi2 = 5 · v̄ 2 .
i=1
Supponendo che il negoziante paghi, per ogni transazione, una commissione bancaria
pari al 3% dell’importo, si determini l’espressione e il valore numerico della media
di x1 , ..., x5 che lascia invariato il totale delle commissioni pagate dal negoziante. Si
indichi inoltre il tipo di media ottenuta.
Svolgimento
La commissione pagata dal negoziante per l’i-esimo pagamento tramite carta di
credito è data da
3
c i = xi ·
100
e quindi il totale delle commissioni pagate dal negoziante è
5 5 5
X X 3 3 X
ctot = ci = xi · = · xi .
i=1 i=1
100 100 i=1
Il valor medio x̄ di x1 , ..., x5 che lascia inalterato il totale delle commissioni pagate
dal negoziante deve soddisfare la relazione
5 5
3 X 3 X
· xi = · x̄
100 i=1 100 i=1
cioè
5
X
xi = 5 · x̄.
i=1
Il valor medio x̄ di x1 , ..., x5 che lascia inalterato il totale delle commissioni pagate
dal negoziante è quindi la media aritmetica dei valori x1 , ..., x5 .
qi 2 3 5 6
gi 15 5 10 20
Svolgimento
Il numero di azioni acquistate dal risparmiatore in un giorno in cui è valida la
quotazione qi è
C
.
qi
Pertanto il numero di azioni acquistate in totale nei 50 giorni è
4
X C
· gi .
i=1
qi
Dobbiamo quindi trovare la quotazione media q̄ che lascia inalterato il totale delle
azioni acquistate:
4 4
X C X C
· gi = · gi
q
i=1 i i=1
q̄
cioè
4 4
X C C X
· gi = · gi
i=1
qi q̄ i=1
da cui si ottiene
4
X 1 C
C· · gi = · 50
q
i=1 i
q̄
50
q̄ = 4
X 1
· gi
i=1
qi
ovvero q̄ è la media armonica ponderata delle quotazioni dell’azione con pesi pari ai
giorni.
Perciò:
50
q̄ =
1 1 1 1
· 15 + · 5 + · 10 + · 20
2 3 5 6
= 3.448.
1 VARIABILITA’ 2
1 VARIABILITA’
1.1 Esercizi
1. La seguente tabella riporta il tempo (in giorni) impiegato da sei individui per il
consumo di una confezione di pasta da 250 grammi:
1 3 5 6 15 30 .
Svolgimento
Per prima cosa, notiamo che i valori forniti dal testo sono già ordinati: per maggiore
chiarezza, comunque li riportiamo di seguito:
Dato che il loro numero è pari (N = 6), si hanno due posizioni centrali:
N N
=3 , + 1 = 4.
2 2
La mediana è pertanto:
x(3) + x(4) 5+6
= = 5.5.
2 2
Il valore assunto dalla mediana dice che nel 50% dei casi circa, la durata di un pac-
chetto di pasta è minore di 5.5 giorni. Analogamente, nel 50% dei casi circa, la durata
di un pacchetto di pasta è superiore a 5.5 giorni.
Per calcolare lo scostamento medio dalla mediana e dalla media aritmetica e lo scarto
quadratico medio, è necessario completare la seguente tabella:
1 VARIABILITA’ 3
e indica che mediamente le durate del pacchetto di pasta differiscono (si discostano)
dalla durata mediana di 7 giorni.
e indica che mediamente le durate del pacchetto di pasta differiscono (si discostano)
dalla durata media di 8.3̄ giorni.
e indica che mediamente le durate del pacchetto di pasta differiscono dalla durata
media di 9.967 giorni.
Dato che il loro numero è dispari (N = 7), la posizione mediana è data da:
N +1 8
= = 4.
2 2
La mediana è pertanto:
x(4) = 18.
Il valore assunto dalla mediana dice che circa il 50% dei redditi (dei 7 individui presi
in esame) è minore di 18 (migliaia di euro). Analogamente, circa il 50% dei redditi
1 VARIABILITA’ 4
e indica che mediamente i redditi (dei 7 individui presi in esame) differiscono (si di-
scostano) dal reddito mediano di 6.857 migliaia di euro.
e indica che mediamente i redditi (dei 7 individui presi in esame) differiscono (si di-
scostano) dal reddito medio di 7.143 migliaia di euro.
e indica che mediamente i redditi (dei 7 individui presi in esame) differiscono dal
reddito medio di 8.6023 migliaia di euro.
1 VARIABILITA’ 5
Svolgimento
Come prima cosa, conviene riscrivere la tabella fornita dal testo nel seguente modo,
calcolando anche le frequenze cumulate:
1 VARIABILITA’ 6
b) La differenza interquartile
Q3 − Q1 = x(3· N +1 ) − x( N +1 ) = x(75.75) − x(25.25) = 3 − 0 = 3.
4 4
Tale valore indica che il 50% delle famiglie analizzate hanno un numero di figli
compreso in un intervallo di ampiezza 3.
La seguente tabella
xj nj x j nj x2j x2j nj
0 30 0 0 0
1 15 15 1 15
2 20 40 4 80
3 12 36 9 108
4 10 40 16 160
5 9 45 25 225
6 4 24 36 144
TOT 100 200 732
permette di calcolare:
7
1 X 200
M1 = x j nj = =2
100 j=1 100
e
7
1 X 2 732
M22 = x j nj = = 7.32.
100 j=1 100
Quindi
σ 2 = 7.32 − (2)2 = 3.32
d) Lo scostamento medio dalla media aritmetica.
La seguente tabella
xj nj |xj − M1 | |xj − M1 | · nj
0 30 2 60
1 15 1 15
2 20 0 0
3 12 1 12
4 10 2 20
5 9 3 27
6 4 4 16
TOT 100 150
1 VARIABILITA’ 7
Tale valore indica che mediamente il numero di figli (delle 100 famiglie prese in
esame) differisce (si discosta) dal loro valore medio di 1.5 figli.
M e = x( N +1 ) = x(50.5) = 2.
2
SM e = SM1 = 1.5.
É possibile quindi affermare che mediamente il numero di figli (delle 100 famiglie
prese in esame) differisce (si discosta) dal loro valore mediano di 1.5 figli.
Svolgimento
Come prima cosa, conviene riscrivere la tabella fornita dal testo nel seguente modo,
calcolando anche le frequenze cumulate:
xj nj Cj
1 5 5
2 22 27
3 32 59
4 35 94
5 16 110
6 7 117
7 2 119
8 1 120
TOTALE 120
1 VARIABILITA’ 8
b) La differenza interquartile
Q3 − Q1 = x(3· N +1 ) − x( N +1 ) = x(90.75) − x(30.25) = 4 − 3 = 1.
4 4
Tale valore indica che il 50% delle abitazioni prese in esame hanno un numero
di stanze compreso in un intervallo di ampiezza pari a 1.
1 VARIABILITA’ 9
Svolgimento
Per prima cosa, è necessario calcolare la media aritmetica, completando la seguente
lj− + lj+
tabella, dove xj = indica il valore centrale della j-esima classe:
2
classi di reddito xj nj x j · nj
1000|–5000 3000 100 300000
5000|–15000 10000 400 4000000
15000|– 35000 25000 300 7500000
35000 |– 75000 55000 200 11000000
TOTALE 1000 22800000
Si ha quindi che:
4
1 X 22800000
M1 = x j · nj = = 22800.
N j=1 1000
1 VARIABILITA’ 10
e tale valore indica che mediamente i redditi dei 1000 abitanti si discostano dal loro
valore medio di 14200 euro.
La varianza è pari a
4
2 1 X 313560000000
σ = (xj − M1 )2 · nj = = 313560000
1000 j=1 1000
e tale valore indica che mediamente i redditi dei 1000 abitanti si discostano dal loro
valore medio di 17707.625 euro.
classi d’importo 0–|50 50–|100 100–|150 150–|200 200–|250 250–|300 300–|350 tot
n. fatture 8 70 71 62 27 7 3 248
importo totale di classe 304 5600 8946 10540 6210 1960 960
.
1 VARIABILITA’ 11
Svolgimento
Per prima cosa, è necessario calcolare la mediana e la media aritmetica della distri-
buzione. Completiamo perciò la seguente tabella.
1 VARIABILITA’ 12
e tale valore indica che mediamente gli importi delle fatture si discostano dal loro
valore mediano di 46.127 (migliaia di euro).
e tale valore indica che mediamente gli importi delle fatture si discostano dal loro
valore medio di 47.498 (migliaia di euro).
e possiamo interpretare tale valore dicendo che mediamente gli importi delle fatture
differiscono dal loro valore medio di 58.815 (migliaia di euro).
1 VARIABILITA’ 13
Svolgimento
Dalla proprietà di linearità della media aritmetica, segue immediatamente che
σ 2 (Y ) = b2 · σ 2 (X).
8. In un reparto produttivo, vengono impiegate tre macchine alle quali lavorano, rispet-
tivamente, 4, 5 e 3 operai. La seguente tabella riporta i dati relativi alla produzione
oraria (per operaio e per macchina):
produzione oraria macchina 1 48 49 48 47
produzione oraria macchina 2 56 56 57 57 55
produzione oraria macchina 3 52 51 51
Determinare la varianza della produzione oraria dell’intero sistema col metodo in-
diretto; determinare inoltre la varianza fra e nei gruppi e verificare la proprietà di
scomposizione della varianza totale.
Svolgimento
Come prima cosa, dividiamo i 12 operai in K = 3 gruppi, a seconda della macchina
a cui lavorano: si avrà quindi il primo gruppo (di numerosità N1 pari a 4) composto
dagli operai che lavorano alla prima macchina, il secondo gruppo (di numerosità N2
pari a 5) formato dagli operai che lavorano alla seconda macchina e infine il terzo
gruppo (di numerosità N3 pari a 3) a cui appartengono gli operai che lavorano alla
terza macchina. A ciascun operaio è associato un numero che rappresenta la sua
produzione oraria.
1 VARIABILITA’ 14
É possibile a questo punto calcolare, per ciascun gruppo, la produzione oraria media
(ovvero le medie parziali):
48 + 49 + 48 + 47 192
X̄1 = M1 (1a macchina) = = = 48
4 4
59 + 59 + 57 + 57 + 55 281
X̄2 = M1 (2a macchina) = = = 56.2
5 5
52 + 51 + 51 154
X̄3 = M1 (3a macchina) = = = 51.3̄.
3 3
La proprietà associativa della media aritmetica permette di calcolare la media arit-
metica totale (ovvero la produzione media oraria complessiva):
Per determinare la varianza della produzione oraria complessiva con il metodo indi-
retto è necessario applicare la formula:
N
2 1 X 2
σtot = x − M12 = M22 − M12 .
N i=1 i
Numero
xi x2i
macchina
48 2304
1 49 2401
48 2304
47 2209
56 3136
56 3136
2 57 3249
57 3249
55 3025
52 2704
3 51 2601
51 2601
TOT 628 32919
Quindi:
12
1 X 2 32919
M22 = x = = 2743.25.
12 i=1 i 12
1 VARIABILITA’ 15
Calcoliamo ora la varianza fra le produzioni medie delle singole macchine (ovvero la
varianza fra i gruppi).
Si ha quindi:
K
1 X
σF2 = [X̄j − X̄]2 · Nj
N j=1
3
1 X 2
= X̄j − X̄ · Nj
12 j=1
(48 − 52.25)2 · 4 + (56.2 − 52.25)2 · 5 + (51.3̄ − 52.25)2 · 3
=
12
152.7833
= = 12.732.
12
Il calcolo della media aritmetica ponderata delle varianze parziali (varianza nei
gruppi), è pertanto:
K 3
2 1 X 2 1 X 2 0.5 · 4 + 0.56 · 5 + 0.2̄ · 3
σN = σj · Nj = σj · Nj = = 0.4556.
N j=1 N j=1 12
1 VARIABILITA’ 16
2
σN + σF2 = 2
σtot
è possibile notare che la varianza nei gruppi è il 3.45% della varianza totale e che la
varianza fra i gruppi è il 96.55% della varianza totale.
9. La seguente tabella riporta la distribuzione del numero di alberghi delle due località
turistiche A e B di un comprensorio, secondo le classi di fatturato annuale (in milioni
di Euro):
Si verifichi la scomposizione della varianza del fatturato annuo degli alberghi del com-
prensorio, commentando il risultato ottenuto.
Svolgimento
Per prima cosa, dividiamo in K = 2 gruppi gli alberghi del comprensorio: ovviamente
avremo un primo gruppo (di numerosità N1 pari a 241) formato dagli alberghi della
località A e un secondo gruppo (di numerosità N2 pari a 264) composto dagli alberghi
della località B.
1 VARIABILITA’ 17
Classi di
xj x2j nA
j nB
j nA B
j + nj
fatturato
0 |– 1 0.5 0.25 15 25 40
1 |– 3 2 4 24 51 75
3 |– 5 4 16 85 67 152
5 |– 10 7.5 56.25 48 59 107
10 |– 20 15 225 40 31 71
20 |– 40 30 900 29 31 60
Totale 241 264 505
A questo punto è possibile calcolare la media aritmetica del fatturato per gli alberghi
della località A:
6
1 X 0.5 · 15 + 2 · 24 + 4 · 85 + 7.5 · 48 + 15 · 40 + 30 · 29
X̄1 = x j · nA
j = = 9.234
N1 j=1 241
6
2 1 X 2 2
σtot = x · [nA B
j + nj ] − X̄
N j=1 j
0.25 · 40 + 4 · 75 + 16 · 152 + 56.25 · 107 + 225 · 71 + 900 · 60
= − (8.803)2
505
= 78.422.
Calcoliamo ora:
• la varianza nei gruppi
1 VARIABILITA’ 18
6
1 X 2 B
σ22 = x · n − X̄22
N2 j=1 j j
0.25 · 25 + 4 · 51 + 16 · 67 + 56.25 · 59 + 225 · 31 + 900 · 31
= − (8.409)2
264
39475
= − 70.711 = 78.81
264
2
e quindi la varianza nei gruppi (σN ):
è possibile notare che la varianza nei gruppi è il 99.78% della varianza totale e che
la varianza fra i gruppi è solo lo 0.22% della varianza totale.
1 VARIABILITA’ 19
10. Nel 1981 gli ospedali in Italia erano 1826 ripartiti per tipo come segue: ospedali
generali 1345, ospedali specialistici 295, ospedali psichiatrici 186. Per ogni ospedale
è stato rilevato il numero di posti letto ottenendo le informazioni seguenti:
osp. generali osp. specialist. osp. psichiatr.
n. medio di posti letto 318,51 215,58 407,22 .
scarto quadratico medio dei posti letto 445,96 259,54 477,84
Svolgimento
In questo caso, riconosciamo K = 3 gruppi di numerosità N1 = 1345, N2 = 295 e
N3 = 186, formati rispettivamente dagli ospedali generali, dagli ospedali specialistici
e dagli ospedali psichiatrici.
Avendo le medie della variabile “numeri di posti letto” per ciascun gruppo, è possibile
calcolare la media aritmetica totale, utilizzando la proprietà associativa della media
aritmetica:
3
1 X 318.51 · 1345 + 215.58 · 295 + 407.22 · 186 567734.97
X̄ = X̄j ·Nj = = = 310.917.
N j=1 1345 + 295 + 186 1826
1 VARIABILITA’ 20
2 2
σtot = σN + σF2
è possibile notare che la varianza nei gruppi è il 98.66% della varianza totale e che
la varianza fra i gruppi è l’1.34% della varianza totale.
11. Il reddito annuo (in migliaia di euro) di sette individui è rispettivamente pari a 15,
20, 12, 10, 18, 30, 35. Determinare e interpretare la differenza media e con ripetizione
del reddito.
Svolgimento
Per agevolare i conti, completiamo la seguente tabella scrivendo nella cella (i, j), la
quantità |xi − xj |:
xj
15 20 12 10 18 30 35
xi
15 0 5 3 5 3 15 20
20 5 0 8 10 2 10 15
12 3 8 0 2 6 18 23
10 5 10 2 0 8 20 25
18 3 2 6 8 0 12 17
30 15 10 18 20 12 0 5
35 20 15 23 25 17 5 0
464
1 VARIABILITA’ 21
e tale valore indica che mediamente i redditi dei sette individui differiscono tra loro
per 11.048 migliaia di euro.
Inoltre
N N
S 1 XX 1
∆R = 2 = 2 · |xi − xj | = 2 · 464 = 9.469.
N N i=1 j=1 7
e tale valore indica che mediamente i redditi dei sette individui differiscono tra loro
(e con loro stessi) per 9.469 migliaia di euro.
Un ulteriore modo per calcolare il numeratore S delle differenze medie è dato da:
N X
X i
S =2· |x(i) − x(j) |.
i=1 j=1
Si ha pertanto che
N X
X i
S =2· |x(i) − x(j) | = 2 · 232 = 464
i=1 j=1
1 VARIABILITA’ 22
S 464
∆R = = = 9.469.
N2 72
Giusto per completezza, viene riportato un ulteriore metodo di calcolo per il nume-
ratore S.
Completando la seguente tabella:
12. La distribuzione del prezzo del pane al chilogrammo nei capoluoghi di 27 province
nel 1970 e nel 1989 è riportata nella seguente tabella:
prezzo lire al kg. 1970 700 800 900 950 1000 1200 tot
frequenze 1 4 2 3 7 10 27
.
prezzo lire al kg. 1989 2100 2500 2600 2950 3000 3600 tot
frequenze 2 3 2 4 6 10 27
a) Determinare la differenza media semplice e con ripetizione del prezzo del pane nel
1970;
b) Si può dire che dal 1970 al 1989 ci sia stato un aumento della variabilità del feno-
meno?
Svolgimento
1 VARIABILITA’ 23
Tale valore indica che i prezzi del pane nei 27 capoluoghi nel 1970 differiscono
mediamente tra loro di 179.77 lire.
La differenza media con ripetizione è data da:
6
S 2 X 2
∆R = = · x j n j (2Cj − N − n j ) = · 63100 = 173.11.
N2 N 2 j=1 (27)2
Tale valore indica che i prezzi del pane nei 27 capoluoghi nel 1970 differiscono
mediamente tra loro (e con loro stessi) di 173.11 lire.
b) Osservando i valori del prezzo del pane nei due anni presi in esame, è facile ren-
dersi conto che l’ordine di grandezza è differente, ragion per cui per confrontare
le variabilità dei prezzi del pane nei due anni (1970 e 1989) è necessario ricorrere
a indici relativi di variabilità.
Poichè al punto precedente abbiamo calcolato sulla distribuzione dei prezzi del
1970 gli indici ∆ e ∆R , la scelta più ovvia è quella di confrontare la variabilità
dei prezzi del 1970 e del 1989 con gli indici relativi:
∆ ∆R
o .
M1 M1
Per completezza, tuttavia, calcoliamo anche gli altri indici relativi noti:
SM 1 SM e σ
, e .
M1 M 1 M1
1 VARIABILITA’ 24
6
(1970) 1 X (1970) 3592.59
SM 1 = |xj − M1 | · nj = = 133.059
N j=1 27
v
u 6 r
u1 X (1970) 2 666296.34
σ (1970) =t (xj − M1 ) · nj = = 159.07.
N j=1 27
6
(1989) 1 X (1989) 10740.72
SM 1 = |xj − M1 | · nj = = 397.8
N j=1 27
1 VARIABILITA’ 25
v
u 6 r
u1 X (1989) 6192962.92
σ (1989) =t (xj − M1 )2 · nj = = 478.92.
N j=1 27
∆(1970) = 179.77
e
(1970)
∆R = 173.11.
Completiamo l’analoga tabella (relativa all’anno 1989):
xj nj Cj 2Cj − N − nj xj nj · (2Cj − N − nj )
2100 2 2 -25 -105000
2500 3 5 -20 -150000
2600 2 7 -15 -78000
2950 4 11 -9 -106200
3000 6 17 1 18000
3600 10 27 17 612000
190800
grazie alla quale possiamo calcolare
6
S 1 X 2 · 190800
∆(1989) = = ·2 xj nj ·(2Cj −N −nj ) = = 543.59
N (N − 1) N (N − 1) j=1 27 · 26
e
6
(1989) S 1 X 2 · 190800
∆R = 2 = 2 ·2 xj nj · (2Cj − N − nj ) = = 523.45.
N N j=1
272
Riassumiamo nella seguente tabella i valori calcolati sia per l’anno 1970 che per
l’anno 1989:
Anno 1970 Anno 1989
Me 1000 3000
M1 1020.37 3062.96
SM e 127.7̄ 381.48
SM 1 133.059 397.805
σ 157.09 478.92
∆ 179.77 543.59
∆R 173.11 523.45
1 VARIABILITA’ 26
SM e 127.7̄ 381.48
: = 0.1252 > = 0.1245
M1 1020.37 3062.96
SM 1 133.059 397.805
: = 0.1304 > = 0.1299
M1 1020.37 3062.96
σ 157.09 478.92
CV = : = 0.1540 < = 0.1564
M1 1020.37 3062.96
∆ 179.77 543.59
: = 0.1762 < = 0.1774
M1 1020.37 3062.96
∆R 173.11 523.45
: = 0.1696 < = 0.1708
M1 1020.37 3062.96
Il valore 0.1252 indica che lo scostamento dalla mediana del prezzo del pane nel
1970 è pari al 12.52% della media aritmetica.
Il valore 0.1245 indica che lo scostamento dalla mediana del prezzo del pane nel
1989 è pari al 12.45% della media aritmetica.
Il valore 0.1304 indica che lo scostamento dalla media aritmetica del prezzo del
pane nel 1970 è pari al 13.04% della media aritmetica.
Il valore 0.1299 indica che lo scostamento dalla media aritmetica del prezzo del
pane nel 1989 è pari al 12.99% della media aritmetica.
Il valore 0.1540 indica che lo scarto quadratico medio del prezzo del pane nel
1970 è pari al 15.40% della media aritmetica.
Il valore 0.1564 indica che lo scarto quadratico medio del prezzo del pane nel
1989 è pari al 15.64% della media aritmetica.
Il valore 0.1762 indica che la differenza media semplice del prezzo del pane nel
1970 è pari al 17.62% della media aritmetica.
Il valore 0.1774 indica che la differenza media semplice del prezzo del pane nel
1989 è pari al 17.74% della media aritmetica.
Il valore 0.1696 indica che la differenza media con ripetizione del prezzo del pane
nel 1970 è pari al 16.96% della media aritmetica.
Il valore 0.1708 indica che la differenza media con ripetizione del prezzo del pane
nel 1989 è pari al 17.08% della media aritmetica.
Attraverso il confronto dei valori assunti dagli indici relativi di variabilità cal-
colati, si può concludere che la variabilità del prezzo del pane dei 27 capoluoghi
1 VARIABILITA’ 27
13. La classificazione di due gruppi di ditte produttrici di olio d’oliva, che vendono rispet-
tivamente il proprio prodotto a peso (gruppo A) e a volume (gruppo B), ha dato luogo
alle seguenti distribuzioni di frequenze:
Svolgimento
Per prima cosa, completiamo la seguente tabella per agevolare il calcolo della media-
na e della media aritmetica per ciascuno dei due gruppi (si indicano con nA j e nj le
B
1 VARIABILITA’ 28
5
1 X 995
M1B = B x j nB
j = = 3.316̄.
N j=1 300
da cui ricaviamo
5
A 1 X 218
SM e = A |xj − M eA | · nA
j = = 0.436
N j=1 500
5
A 1 X A A 216.4
SM = |x j − M 1 | · n j = = 0.4328
1
N A j=1 500
v
5
√
u r
u 1 X 7353.75
σA = t A x2j · nA
j − [M A 2
1 ] = − (3.79)2 = 0.3434 = 0.586.
N j=1 500
1 VARIABILITA’ 29
da cui ricaviamo
5
B 1 X 173.9
SM e = B |xj − M eB | · nB
j = = 0.579
N j=1 300
5
B 1 X 174
SM = B |xj − M1B | · nB
j = = 0.58
1
N j=1 300
v
5
√
u r
u 1 X 3447.5
σB = t B x2j · nB
j − [M B 2
1 ] = − (3.316̄)2 = 0.4914 = 0.701.
N j=1 300
1 VARIABILITA’ 30
Gruppo A Gruppo B
SM e 0.436 0.579
: = 0.115 < = 0.1746
M1 3.79 3.316̄
SM 1 0.4328 0.58
: = 0.1142 < = 0.1749
M1 3.79 3.316̄
σ 0.586 0.701
CV = : = 0.1546 < = 0.2114
M1 3.79 3.316̄
∆ 0.6341 0.777
: = 0.1673 < = 0.2343
M1 3.79 3.316̄
Confrontando i valori degli indici relativi di variabilità, si può concludere che presenta
maggiore variabilità la distribuzione delle ditte del gruppo B.
14. Nella seguente tabella sono riportate le distribuzioni per destinazione dei viaggi di
vacanza (V ) e dei viaggi di lavoro (W ) effettuati dagli italiani nel 1998 (dati in
migliaia):
Destinazione V W
Italia 67682 10944
Paesi UE 7238 1984 .
Resto d’Europa 1989 378
Resto del mondo 2236 501
Si valuti, con un opportuno indice basato sulle differenze medie, quale delle due di-
stribuzioni V e W presenta la variabilità più elevata. Si interpretino i valori assunti
dall’indice per le due distribuzioni.
Svolgimento
Riconosciamo innanzitutto che abbiamo a che fare con una distribuzione di unità e
che la popolazione statistica è costituita da 4 unità (N = 4).
Per calcolare la differenza media per i viaggi di vacanza (V ), completiamo la seguente
tabella, in cui le osservazioni sono state ordinate in modo crescente secondo i valori
del carattere.
1 VARIABILITA’ 31
che indica che la differenza media semplice del numero di viaggi di vacanza è il 170.2%
della corrispondente media aritmetica.
1 VARIABILITA’ 32
15. Una fabbrica produce tubi catodici televisivi di due tipi. Per il tipo A si ha una
durata media di 1495 ore e uno scarto quadratico medio di 280 ore. Per il tipo B si
ha una durata media di 1875 ore ed uno scarto quadratico medio di 310 ore. Fornire
una misura della variabilità relativa e commentare il risultato.
Svolgimento
Un indice di variabilità relativa per i tubi di tipo A è dato da:
σA 280
A
= = 0.19
M1 1495
e tale valore indica che lo scarto quadratico medio della durata dei tubi del tipo A è
il 19% della corrispondente durata media.
σB 310
B
= = 0.17.
M1 1875
e tale valore indica che lo scarto quadratico medio della durata dei tubi del tipo B è
il 17% della corrispondente durata media.
Riconoscendo che
σA σB
= 0.19 > 0.17 =
M1A M1B
si può concludere che la distribuzione delle durate dei tubi catodici del gruppo A
presenta maggiore variabilità rispetto a quella del gruppo B.
1 CONCENTRAZIONE 2
1 CONCENTRAZIONE
1.1 Esercizi
1. Il reddito annuo (in migliaia di euro) di 7 fratelli è il seguente:
individui A B C D E F G
.
reddito (in migliaia di euro) 15 20 12 10 18 30 35
Svolgimento
Per determinare le coordinate della spezzata di Lorenz, è necessario completare la
seguente tabella, in cui sono stati ordinati i valori xi in ordine non decrescente ed è
stata aggiunta la prima riga corrispondente al punto fittizio (0; 0). Per facilitare il
completamento della tabella, conviene anche calcolare:
X
7
T = xj = 10 + 12 + 15 + 18 + 20 + 30 + 35 = 140.
i=1
i xi Pi Qi pi = PNi qi = QTi
0 0 0 0 0 0
1 10 1 10 0.143 0.071
2 12 2 22 0.286 0.157
3 15 3 37 0.429 0.264
4 18 4 55 0.571 0.393
5 20 5 75 0.714 0.536
6 30 6 105 0.851 0.750
7 35 7 140 1 1
140 3.171
2 X
N −1
2 X
N −1
R= · (pi − qi ) = 1 − · qi .
N − 1 i=1 N − 1 i=1
1 CONCENTRAZIONE 3
q
1
0.5
(p3 ;q 3)
0 0.5 1 p
Fig. 1: Diagramma di Lorenz per la distribuzione dei redditi dei 7 fratelli.
X
N
Dalla precedente tabella si ricava che qi = 3.171, pertanto
i=1
X
N −1
qi = 3.171 − 1 = 2.171,
i=1
e quindi
2 X
N −1
2
R=1− · qi = 1 − · 2.171 = 0.2763̄.
N − 1 i=1 7−1
Tale valore indica che la concentrazione è pari al 27.63̄% del valore massimo teorico.
Svolgimento
É necessario completare la seguente tabella, in cui sono stati ordinati (in ordine non
1 CONCENTRAZIONE 4
decrescente) i valori xi ed è stata aggiunta la prima riga per il punto fittizio (0, 0).
Per facilitare il completamento della tabella, conviene anche calcolare:
X
12
T = xi = 81 + 66 + 53 + 120 + 78 + 60 + 45 + 30 + 10 + 45 + 104 + 108 = 800
i=1
Pi Qi
mm pioggia Pi = i Qi pi = qi =
N T
0 0 0 0 0
10 1 10 0.083 0.013
30 2 40 0.167 0.050
45 3 85 0.250 0.106
45 4 130 0.333 0.163
53 5 183 0.417 0.229
60 6 243 0.500 0.304
66 7 309 0.583 0.386
78 8 387 0.667 0.484
81 9 468 0.750 0.585
104 10 572 0.833 0.715
108 11 680 0.917 0.850
120 12 800 1 1
800 6.5 4.885
2 X
N −1
2 X
N −1
R= · (pi − qi ) = 1 − · qi .
N − 1 i=1 N − 1 i=1
X
N
Dalla precedente tabella si ricava che qi = 4.885, pertanto
i=1
X
N −1
qi = 4.885 − 1 = 3.885,
i=1
e quindi
2 X
N −1
2
R=1− · qi = 1 − · 3.885 = 0.2936.
N − 1 i=1 12 − 1
Tale valore indica che la concentrazione è pari al 29.36% del valore massimo teorico.
1 CONCENTRAZIONE 5
q
1
0.5
0 0.5 1 p
Fig. 2: Diagramma di Lorenz per il carattere “mm di pioggia”.
Svolgimento
Innanzitutto completiamo la seguente tabella per poter calcolare il rapporto di con-
centrazione di Gini prima della tassazione. Come di consueto i valori xi sono stati
1 CONCENTRAZIONE 6
X
7
(prima)
T = xi = 20 + 25 + 41 + 46 + 60 + 85 + 120 = 397.
i=1
Pi Qi
xi Pi = i Qi pi = qi = p i − qi
N T
0 0 0 0 0 0
20 1 20 0.143 0.050 0.093
25 2 45 0.286 0.113 0.173
41 3 86 0.429 0.217 0.212
46 4 132 0.571 0.332 0.239
60 5 192 0.714 0.484 0.23
85 6 277 0.857 0.698 0.159
120 7 397 1 1 0
397 4 2.894 1.106
2 X
N −1
(prima)
R = · (pi − qi ).
N − 1 i=1
X
N −1 X
N
Dalla precedente tabella si ricava che (pi − qi ) = (pi − qi ) = 1.106, pertanto
i=1 i=1
2 X
N −1
2
(prima)
R = · (pi − qi ) = · 1.106 = 0.369.
N − 1 i=1 7−1
Tale valore indica che prima della tassazione, la concentrazione è pari al 36.9% del
valore massimo teorico.
2
y(1) = 20 − 20 · = 19.6
100
2
y(2) = 25 − 25 · = 24.5
100
15
y(3) = 41 − 41 · = 34.85
100
15
y(4) = 46 − 46 · = 39.1
100
1 CONCENTRAZIONE 7
15
y(5) = 60 − 60 · = 51
100
28
y(6) = 85 − 85 · = 61.2
100
28
y(7) = 120 − 120 · = 86.4
100
Completiamo quindi la seguente tabella, dopo aver calcolato il reddito totale dopo la
tassazione:
X
7
(dopo)
T = yi = 19.6 + 24.5 + 34.85 + 39.1 + 51 + 61.2 + 86.4 = 316.65.
i=1
Pi Qi
yi Pi = i Qi pi = qi = p i − qi
N T
0 0 0 0 0 0
19.6 1 19.6 0.143 0.062 0.081
24.5 2 44.1 0.286 0.139 0.147
34.85 3 78.95 0.429 0.249 0.18
39.1 4 118.05 0.571 0.373 0.198
51 5 169.05 0.714 0.534 0.18
61.2 6 230.25 0.857 0.727 0.13
86.4 7 316.65 1 1 0
316.65 4 3.084 0.916
X
N −1 X
N
Dalla precedente tabella si ricava che (pi − qi ) = (pi − qi ) = 0.916, pertanto il
i=1 i=1
rapporto di concentrazione, dopo la tassazione è dato da
2 X
N −1
2
(dopo)
R = · (pi − qi ) = · 0.916 = 0.3053̄.
N − 1 i=1 7−1
Tale valore indica che dopo la tassazione, la concentrazione è pari al 30.53̄% del valore
massimo teorico.
1 CONCENTRAZIONE 8
a) se lo stato introduce un’imposta pari al 15% del reddito, i redditi dopo tale
tassazione sono equivalenti all’85% dei redditi prima della tassazione. In al-
tre parole, per determinare i redditi dopo tale tassazione, bisogna moltiplicare
i redditi iniziali (cioè prima della tassazione) per 0.85. Tale trasformazione è
chiaramente una trasformazione di scala. Ricordando ora che un requisito di un
indice di concentrazione è l’invarianza per trasformazioni di scala, si può quindi
concludere che la concentrazione prima e dopo la tassazione resta invariata.
b) Se invece lo stato impone una tassa fissa di 5 mila euro, i redditi dopo la tas-
sazione si ricavano sottraendo a ciascun reddito iniziale (cioè prima della tas-
sazione) una quantità costante pari a 5 mila euro. Ricordando il requisito di un
indice di concentrazione che afferma che se tutti i valori xi vengono aumentati di
una stessa quantità h > 0, l’indice di concentrazione diminuisce (e di converso se
tutti i valori vengono diminuiti di un valore costante h > 0, l’indice aumenta),
possiamo affermare che l’applicazione di una tassa del genere porterebbe ad un
aumento della concentrazione dei redditi.
4. La rilevazione di un carattere trasferibile X ha dato luogo alla seguente distribuzione
di frequenze:
xi 1 2 3 5 6 8 9 10 13 15 22 24 26
.
ni 1 1 1 2 3 1 2 4 1 1 1 1 1
Supponendo di riclassificare il carattere X nelle classi:
0 ⊣ 3 3 ⊣ 6 6 ⊣ 10 10 ⊣ 20 20 ⊣ 30
Svolgimento
Per prima cosa, analizziamo la situazione originaria.
Completiamo perciò la seguente tabella, dopo aver calcolato:
X
13
N= nj = 20
j=1
e
X
13
T = xj · nj = 200.
j=1
1 CONCENTRAZIONE 9
Pj Qj
xj nj x j · nj Pj Qj pj = qj =
N T
1 1 1 1 1 0.05 0.005
2 1 2 2 3 0.1 0.015
3 1 3 3 6 0.15 0.03
5 2 10 5 16 0.25 0.08
6 3 18 8 34 0.4 0.17
8 1 8 9 42 0.45 0.21
9 2 18 11 60 0.55 0.3
10 4 40 15 100 0.75 0.5
13 1 13 16 113 0.80 0.565
15 1 15 17 128 0.85 0.64
22 1 22 18 150 0.90 0.75
24 1 24 19 174 0.95 0.87
26 1 26 20 200 1 1
Totale 20 200
1 CONCENTRAZIONE 10
q
1
0.5
0 0.5 1 p
1 X
s
R = · [(pj−1 − qj−1 ) + (pj − qj )]nj
N − 1 j=1
1 X
13
= · [(pj−1 − qj−1 ) + (pj − qj )]nj
20 − 1 j=1
1
= · 7.21 = 0.3795.
20 − 1
Tale valore indica che la concentrazione nella situazione originaria è pari al 37.95%
del valore massimo teorico.
1 CONCENTRAZIONE 11
Ammontare Pj Qj
Classi nj Pj Qj pj = qj =
di classe N T
0–| 3 3 6 3 6 0.15 0.03
3–| 6 5 28 8 34 0.4 0.17
6–| 10 7 66 15 100 0.75 0.5
10–| 20 2 28 17 128 0.85 0.64
20–| 30 3 72 20 200 1 1
Totale 20 200
q
1
0.5
0 0.5 1 p
Fig. 4: Diagramma di Lorenz della distribuzione raggruppata in classi, considerando noti i totali
di classe.
1 CONCENTRAZIONE 12
l− + l+
Completiamo la seguente tabella, in cui xj = è il valore centrale della j-esima
2
classe.
Pj Qj
Classi xj nj x j · nj Pj Qj pj = qj =
N T
0–| 3 1.5 3 4.5 3 4.5 0.15 0.0239
3–| 6 4.5 5 22.5 8 27 0.4 0.1436
6–| 10 8 7 56 15 83 0.75 0.4415
10–| 20 15 2 30 17 113 0.85 0.6011
20–| 30 25 3 75 20 188 1 1
Totale 20 188
1 X
5
1
R= · [(pj−1 − qj−1 ) + (pj − qj )]nj = · 8.1061 = 0.4266.
N − 1 j=1 20 − 1
1 CONCENTRAZIONE 13
q
1
0.5
0 0.5 1 p
Fig. 5: Diagramma di Lorenz della distribuzione raggruppata in classi, considerando NON noti i
totali di classe.
q
1
0 0.5 1 p
Fig. 6: Confronto dei diagrammi di Lorenz, considerando noti e considerando non noti i totali di
classe.
In Figura (6) è possibile confrontare i diagrammi di Lorenz per i due casi preceden-
temente trattati (totali di classe noti e totali di classe non noti). Il grafico sotto-
linea il risultato già riscontrato: la situazione che presenta maggiore concentrazione
corrisponde a quella in cui si considerano non noti i totali di classe.
1 CONCENTRAZIONE 14
5. I clienti di un negozio alimentare sono stati classificati nelle seguenti classi di spesa:
Svolgimento
l− + l+
Completiamo la seguente tabella, in cui xj = è il valore centrale della j-esima
2
classe.
Pj Qj
Classi xj nj x j · nj Pj Qj pj = qj =
N T
0–| 20 10 198 1980 198 1980 0.5183 0.1924
20–| 40 30 106 3180 304 5160 0.7958 0.5015
40–| 70 55 57 3135 361 8295 0.9450 0.8061
70–| 120 95 21 1995 382 10290 1 1
Totale 382 10290
1 X
5
= · [(pj−1 − qj−1 ) + (pj − qj )]nj
20 − 1 j=1
1
= · 8.1061
20 − 1
= 0.4266.
1 CONCENTRAZIONE 15
q
1
0.5
0 0.5 1 p
Fig. 7: Diagramma di Lorenz.
Tale valore indica che la concentrazione è pari al 42.66% del valore massimo teorico.
6. La spesa per l’abbigliamento X, espressa in euro, di 260 famiglie, registrata nel primo
semestre 2003 è stata la seguente:
classi di spesa 0 ⊣ 200 200 ⊣ 400 400 ⊣ 500 500 ⊣ 600 600 ⊣ 700 700 ⊣ 800
numero di famiglie 20 30 40 50 70 50 .
totale spesa per classe 2200 8400 17600 28000 44800 36500
Svolgimento
Completiamo la seguente tabella, utilizzando l’informazione relativa ai totali di classe.
1 CONCENTRAZIONE 16
Pj Qj
Classi di spesa nj T otali di classe Pj Qj pj = qj =
N T
0 ⊣ 200 20 2200 20 2200 0.077 0.016
200 ⊣ 400 30 8400 50 10600 0.192 0.077
400 ⊣ 500 40 17600 90 28200 0.346 0.205
500 ⊣ 600 50 28000 140 56200 0.538 0.409
600 ⊣ 700 70 44800 210 101000 0.808 0.735
700 ⊣ 800 50 36500 260 137500 1 1
260 137500
q
1
0.5
0 0.5 1 p
Fig. 8: Diagramma di Lorenz per il carattere X.
1 CONCENTRAZIONE 17
2 X
s
∆ = · xj nj · (2Cj − N − nj )
N (N − 1) j=1
2 X
6
= · xj nj · (2Cj − N − nj )
260 · 259 j=1
2
= · 6621000
260 · 259
= 196.643.
1 ASIMMETRIA 2
1 ASIMMETRIA
1. Il reddito annuo (in migliaia di euro) di sette individui è rispettivamente pari a 15,
20, 12, 10, 18, 30, 35. Stabilire se la distribuzione è simmetrica. In caso contrario
calcolare le asimmetrie puntuali rispetto alla mediana, fornire un indice del verso di
asimmetria.
Svolgimento
Si ricorda innanzitutto che condizione necessaria (ma non sufficiente) affinché un
insieme di valori x1 , x2 , ..., xN sia simmetrico rispetto a M è che:
M = M1 = Me .
Nel nostro caso, ordinando in senso crescente i valori dei redditi dei sette individui si
ha:
x(1) = 10; x(2) = 12; x(3) = 15; x(4) = 18; x(5) = 20; x(6) = 30; x(7) = 35 .
Me = x( N+1 ) = x(4) = 18 .
2
1 ASIMMETRIA 3
Quale indice del verso di asimmetria, utilizziamo la media aritmetica delle asimmetrie
puntuali:
7
1X 28
M1 {A(Me)} = Aj (Me) = = 4 = 2 · (M1 − Me) .
7 j=1 7
Il valore assunto dall’indice informa che le asimmetrie puntuali sono in media pari a
4. In tal caso, le asimmetrie puntuali positive prevalgono su quelle negative e di con-
seguenza possiamo asserire che la distribuzione dei sette redditi presenta asimmetria
positiva.
Per indagare ulteriormente sull’entità di tale asimmetria, è utile calcolare l’indice
normalizzato di asimmetria:
M1 − Me
1≤ ≤1 .
SM e
Al fine di calcolare SM e , predisponiamo la seguente tabella:
xj |xj − Me|
15 3
20 2
12 6
10 8
18 0
30 12
35 17
tot 46
Si ha dunque che:
7
1X 46
SM e = |xj − Me| = = 6.5714 .
7 j=1 7
M1 − Me 20 − 18
= = 0.3043 .
SM e 6.5714
Il valore dell’indice segnala una modesta asimmetria positiva, pari al 30.43% del suo
massimo valore (positivo).
1 ASIMMETRIA 4
x(1) = 8; x(2) = x(3) = 9; x(4) = 10; x(5) = 12; x(6) = 13; x(7) = 15; x(8) = 20 .
1 10 + 12
= x(4) + x(5) = = 11 .
2 2
Si ha inoltre che:
8
1X 96
M1 = xj = = 12 .
8 j=1 8
1 ASIMMETRIA 5
Si ha dunque che:
Il valore assunto dall’indice informa che le asimmetrie puntuali sono in media pari a
2 e di conseguenza, come mostrato in precedenza, la distribuzione della durata delle
8 degenze presenta asimmetria positiva.
Per indagare ulteriormente sull’entità di tale asimmetria, è utile ricorrere all’indice
normalizzato di asimmetria:
M1 − Me
1≤ ≤1 .
SM e
Al fine di calcolare SM e , predisponiamo la seguente tabella:
xj |xj − Me|
12 1
9 2
10 1
15 4
8 3
13 2
20 9
9 2
tot 24
Si ha dunque che:
8
1X 24
SM e = |xj − Me| = =3 .
8 j=1 8
M1 − Me 12 − 11
= = 0.3̄ .
SM e 3
1
Il valore dell’indice segnala una modesta asimmetria positiva, pari ad 3
del suo
massimo valore (positivo).
1 ASIMMETRIA 6
c) si confrontino gli indici del verso di asimmetria per le distribuzioni dei due
caratteri X e Y .
Svolgimento
Svolgimento punto a) Ordinando in senso crescente le modalità del carattere X si
ottiene:
Me = x( 7+1 ) = x(4) = 2 .
2
Si osservi che le asimmetrie puntuali risultano essere tutte positive o nulle e di con-
seguenza la distribuzione del carattere X presenta asimmetria positiva. In particolare:
6
M1 {A(Me)} = = 0.8571
7
I valori assunti da tali indici informano che, le asimmetrie puntuali sono in media
pari a 0.8571.
Svolgimento punto b) Ordinando in senso crescente le modalità osservate del carattere
Y si ottiene:
y(1) = 40; y(2) = 65; y(3) = 80; y(4) = 97; y(5) = 98; y(6) = 102; y(7) = 110.
Me = y( 7+1 ) = y(4) = 97 .
2
1 ASIMMETRIA 7
xj |xj − Me(X)|
2 0
3 1
1 1
5 3
4 2
0 2
2 0
tot 9
Si ha dunque che:
7
1X 9
SM e (X) = |xj − Me(X)| = .
7 j=1 7
2+3+1+5+4+0+2 17
M1 (X) = = .
7 7
1 ASIMMETRIA 8
17
M1 (X) − Me(X) −2 3 1
= 7 = = .
SM e(X) 9 9 3
7
Il valore dell’indice segnala una modesta asimmetria positiva, pari ad 13 del suo mas-
simo valore.
Si procede ora al calcolo dell’indice normalizzato di asimmetria nel caso della dis-
tribuzione del carattere Y :
M1 (Y ) − Me(Y )
1≤ ≤1 .
SM e(Y )
yj |yj − Me(Y )|
97 0
110 13
102 5
98 1
65 32
40 57
80 17
tot 125
Si ha dunque che:
7
1X 125
SM e(Y ) = |yj − Me(Y )| = .
7 j=1 7
592
M1 (Y ) = .
7
592
M1 (Y ) − Me(Y ) − 97 592 − 679
= 7 = = 0.696 .
SM e (Y ) 125 125
7
Il valore dell’indice segnala una buona asimmetria negativa, pari al 69.6% del suo
massimo valore (negativo).
Concludendo, la distribuzione del numero dei figli presenta asimmetria positiva men-
tre la distribuzione della superficie dell’abitazione presenta asimmetria negativa. Il
valore degli indici normalizzati appena ricavati infoma inoltre che la distribuzione del
numero di figli presenta un’asimmetria meno spiccata rispetto a quella che caratte-
rizza la distribuzione della superficie dell’abitazione.
1 ASIMMETRIA 9
x(1) = 1; x(2) = 7; x(3) = 9; x(4) = 15; x(5) = 16; x(6) = 22; x(7) = 35.
Un primo indizio sulla simmetria della distribuzione del carattere X, può essere
ottenuto confrontando i valori di media aritmetica e mediana di X. La mediana del
carattere X è data da:
Me = x( 7+1 ) = x(4) = 15 .
2
Come si osserva dalla tabella sopra riportata, le asimmetrie puntuali non sono tutte
nulle e di conseguenza la distribuzione del carattere X non presenta simmetria. Il
fatto che, nonostante ciò, si abbia l’uguaglianza tra media aritmetica e mediana di
X, deriva dal fatto che le asimmetrie positive bilanciano quelle negative. In questo
caso si ha:
M1 {A(Me)} = 0 .
Per avere comunque informazioni sul verso di asimmetria è necessario utilizzare
l’indice M1 {(X − Me)3 }. Al fine del calcolo di questo ultimo indice, predisponiamo
1 ASIMMETRIA 10
la seguente tabella:
x(j) x(j) − Me (x(j) − Me)3
1 −14 −2744
7 −8 −512
9 −6 −216
15 0 0
16 1 1
22 7 343
35 20 8000
tot 0 4872
Si ha dunque che:
7
3 1X 4872
(x(j) − Me)3 =
M1 (X − Me) = = 696 .
7 j=1 7
Il valore assunto dall’indice informa che la distribuzione del carattere X presenta una
tendenza all’asimmetria positiva.
Dato che M1 = Me, non è possibile ricorrere all’indice di asimmetria normalizzato
per ricavare ulteriori informazioni.
xi 3 5 7 9 11 Totale
,
ni 2 7 4 3 1 17
1 ASIMMETRIA 11
n ni
2
1
3 5 7 9 11 xi
Il valore assunto dall’indice informa che le asimmetrie puntuali sono in media pari
a 2.2882 e di conseguenza la distribuzione di frequenze in considerazione presenta
asimmetria positiva. Per indagare ulteriormente sull’entità di tale asimmetria, è
utile ricorrere all’indice normalizzato di asimmetria:
M1 − Me
1≤ ≤1 .
SM e
1 ASIMMETRIA 12
1 ASIMMETRIA 13
fs (Me + 2) = fs (10.2857) = 4 ;
1 ASIMMETRIA 14
fs
4,5
4
3
2
1.5
1
2 4 6 8 9 10 12 14 x
1 ASIMMETRIA 15
classi 0 ⊣ 6 6 ⊣ 8 8 ⊣ 10 10 ⊣ 12 12 ⊣ 14 14 ⊣ 16 16 ⊣ 22 Totale
,
freq. 4 15 26 40 32 6 7 130
1 ASIMMETRIA 16
fs (11 − 2) = fs (9) = 13 ;
fs (11 + 2) = fs (13) = 16 .
Dato che fs (Me − 2) 6= fs (Me + 2), si ha che la distribuzione fornita dal testo
dell’esercizio non è simmetrica. L’asimmetria della distribuzione in considerazione è
osservabile anche guardando il grafico della distribuzione di frequenza che di seguito
riportiamo.
fs
20
16
13
7,5
3
1,166
0.66
6 8 10 12 14 16 22 x
1 ASIMMETRIA 17
8. I clienti di un negozio alimentare sono stati classificati secondo la spesa (in euro)
ottenendo i seguenti dati:
Di conseguenza la distribuzione della spesa dei clienti del negozio di alimentari pre-
senta asimmetria positiva. Per indagare ulteriormente sull’entità di tale asimmetria,
è utile calcolare l’indice normalizzato di asimmetria:
M1 − Me
1≤ ≤1 .
SM e
1 ASIMMETRIA 18
ti
classi ni tot. classe (ti ) xi = |xi − Me| |xi − Me| · ni
ni
Si ha dunque che:
4
1 X 4432.102
SM e = |xi − Me| · ni = = 11.6024
382 i=1 382
M1 − Me 29.555 − 19.293
= = 0.8845.
SM e 11.6024
Il valore dell’indice segnala una elevata asimmetria positiva, pari all’88.45% del suo
massimo valore (positivo).