Sei sulla pagina 1di 53

Statistica (corso E)

Anno accademico 2021-’22

Distribuzioni statistiche e rappresentazioni


grafiche

Lucio Masserini
Le distribuzioni statistiche

La distribuzione unitaria
► La distribuzione unitaria di uno o più caratteri è l’elenco delle modalità osservate, unità per unità,
nel collettivo.
• Distribuzione unitaria semplice: un solo carattere
• Distribuzione unitaria doppia: due caratteri
• Distribuzione unitaria multipla: più di due caratteri
Unità Età Genere Metodo di Spesa Numero di Titolo di studio
statistica pagamento acquisti
𝑢1 27 Maschio Carta di credito 522,50 3 Diploma
𝑢2 22 Femmina Carta prepagata 687,00 4 Licenza media
𝑢3 66 Femmina Paypol 187,25 1 Elementare
… … … … … … …
𝑢𝑖 21 Femmina Contrassegno 25,50 1 Diploma
… … … … … … …
𝑢𝑁 37 Maschio Carta di credito 387,00 2 Laurea

Distribuzione unitaria doppia Distribuzione unitaria semplice


Le distribuzioni statistiche

La distribuzione unitaria semplice


► In un collettivo formato da 𝑁 unità, la distribuzione unitaria semplice di un carattere 𝑋 si indica nel
modo seguente:
𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑖 , … , 𝑥𝑁

Unità
𝑿
statistica
𝑢1 𝑥1 Unità
Titolo di studio
𝑢2 𝑥2 statistica

𝑢3 𝑥3 𝑢1 Media sup
… … 𝑢2 Media inf
𝑢𝑖 𝑥𝑖 modalità assunta dalla 𝑢3 Elementare
𝑖 − 𝑒𝑠𝑖𝑚𝑎 𝑢𝑛𝑖𝑡à … …
… …
𝑢𝑁 𝑥𝑁 𝑢𝑖 Media sup
… …
𝑁 = numerosità
del collettivo 𝑢𝑁 Laurea
Le distribuzioni statistiche

La frequenza assoluta
► L’informazione contenuta in una distribuzione unitaria non consente di cogliere in maniera sintetica
le caratteristiche del fenomeno oggetto di studio.
► Per ottenere una sintesi delle distribuzioni unitarie è possibile considerare per ogni carattere (o
variabile) la frequenza con cui le diverse modalità sono state osservate.
► La frequenza assoluta è il numero di volte in cui una generica modalità j di un carattere (o di una
variabile) viene osservata nel collettivo:

𝑛𝑗
Esempio: frequenza assoluta della «modalità laurea» della variabile «Titolo di studio»

numero di laureati nel collettivo


Le distribuzioni statistiche

La frequenza assoluta: lo spoglio dei dati


► Lo spoglio dei dati non è altro che il conteggio di quante volte si presenta ciascuna delle
𝑥1 , 𝑥2 ,… , 𝑥𝑗 , … , 𝑥𝐾 modalità del carattere nel collettivo.

Unità Titolo di studio


1 Diploma
2 Licenza media
3 Elementare
Modalità Spoglio
… Laurea
… Laurea Elementare |
… Laurea Licenza media ||
… Diploma
Diploma |||
Laurea |||||||||
… Laurea
… Laurea
… Licenza media
15 Laurea
Le distribuzioni statistiche

La distribuzione di frequenze
► Una distribuzione di frequenze assolute è una tabella in cui alle modalità di un carattere
(quantitativo o qualitativo) sono associate le corrispondenti frequenze assolute → numero di volte
in cui ciascuna modalità è stata osservata nel collettivo.

Frequenze
Titolo di studio assolute
(𝑛𝑗 )
Elementare 1
Licenza media 2
Diploma 3
Laurea 9
Totale 𝟏𝟓

𝑵
Le distribuzioni statistiche

La distribuzione di frequenze: notazione


► In termini generali, dato un carattere 𝑋 con 𝐾 modalità distinte (𝑥1 , 𝑥2 , … , 𝑥𝑗 , … , 𝑥𝐾 ), osservato in
un collettivo di 𝑁 unità, la distribuzione di frequenze semplice si rappresenta nel modo seguente:

Frequenze
𝑋 assolute
(𝑛𝑗 )
𝑥1 𝑛1
𝑥2 𝑛2
… …
𝑥𝑗 𝑛𝑗
… …
𝑥𝐾 𝑛𝐾 𝐾
Totale 𝑵 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑗 + ⋯ + 𝑛𝐾 = ෍ 𝑛𝑗 = 𝑁
𝑗=1
Le distribuzioni statistiche

La sommatoria
► La sommatoria, indicata con la lettera greca maiuscola Σ, è un simbolo matematico che abbrevia
in una notazione sintetica la somma di un certo numero di addendi. I termini da sommare si
ricavano dagli indici della sommatoria, costituiti dalle lettere sopra e sotto il simbolo:

si legge “la sommatoria di 𝑛𝑗 per 𝒋 che va da 𝟏 a 𝑲”


ultimo termine della somma 𝐾

෍ 𝑛𝑗 = 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑗 + ⋯ + 𝑛𝐾
𝑗=1
primo termine della somma
Le distribuzioni statistiche

La sommatoria: alcuni esempi


► Ad esempio, data la seguente distribuzione unitaria, calcolare la sommatoria nei casi indicati:

𝑛1 = 2, 𝑛2 = 5, 𝑛3 = 6, 𝑛4 = 3, 𝑛5 = 1

• Calcolare la somma di tutti i valori, cioè la sommatoria di 𝑛𝑗 per 𝑗 che va da 1 a 5:


5

෍ 𝑛𝑗 = 𝑛1 + 𝑛2 + 𝑛3 + 𝑛4 + 𝑛5 = 2 + 5 + 6 + 3 + 1 = 17
𝑗=1

• Calcolare la somma dei primi due, cioè la sommatoria di 𝑛𝑗 per 𝑗 che va da 1 a 2:


2

෍ 𝑛𝑗 = 𝑛1 + 𝑛2 = 2 + 5 = 7
𝑗=1

• Calcolare la somma degli ultimi tre, cioè la sommatoria di 𝑛𝑗 per 𝑗 che va da 3 a 5:


5

෍ 𝑛𝑗 = 𝑛3 + 𝑛4 + 𝑛5 = 6 + 3 + 1 = 10
𝑗=3
Le distribuzioni statistiche

La distribuzione di frequenze: esempio 1


► Possiamo costruire la distribuzione di frequenze anche per il carattere 𝑋 = 𝑀𝑒𝑡𝑜𝑑𝑜 𝑑𝑖 𝑝𝑎𝑔𝑎𝑚𝑒𝑛𝑡𝑜,
con 𝐾 = 4 modalità:

Frequenze
Metodo di
assolute
pagamento
(𝑛𝑗 )
𝑥1 Carta di credito 6 𝑛1
𝑥2 Contrassegno 1 𝑛2
𝑥3 Carta prepagata 3 𝑛3
𝑥4 Paypol 5 𝑛4
Totale 𝟏𝟓

෍ 𝑛𝑗 = 𝑛1 + 𝑛2 + 𝑛3 + 𝑛4 = 6 + 1 + 3 + 5 = 15
𝑗=1
Le distribuzioni statistiche

La frequenza relativa
► Le frequenze assolute non sono di facile interpretazione. Per cogliere l’incidenza della frequenza di
ogni modalità rispetto al totale e rispetto alle altre modalità, si ricorre alle frequenze relative.
► La frequenza relativa (𝑓𝑗 ) si ottiene dividendo la frequenza assoluta di una modalità per il totale delle
unità del collettivo (𝑁) e corrisponde alla frazione di unità che presenta tale modalità:

𝑛𝑗
𝑓𝑗 =
𝑁

► Naturalmente, valgono le proprietà:

0 ≤ 𝑓𝑗 ≤ 1

𝑓1 + 𝑓2 + ⋯ + 𝑓𝑗 + ⋯ + 𝑓𝐾 = ෍ 𝑓𝑗 = 1
𝑗=1
Le distribuzioni statistiche

La frequenza percentuale
► In pratica, si utilizzano più spesso le frequenze percentuali, poiché forniscono un’informazione più
intuitiva e di più semplice lettura rispetto alle frequenze relative.
► La frequenza percentuale (𝑝𝑗 ) si ottiene moltiplicando la frequenza relativa per 100 e indica
quante unità ogni cento del collettivo presentano una certa modalità (𝑗):

𝑝𝑗 = 𝑓𝑗 × 100

► In questo caso, valgono le proprietà:

0 ≤ 𝑝𝑗 ≤ 100

𝑝1 + 𝑝2 + ⋯ + 𝑝𝑗 + ⋯ + 𝑝𝐾 = ෍ 𝑝𝑗 = 100
𝑗=1
Le distribuzioni statistiche

Le distribuzioni di frequenze: assolute, relative e percentuali


► Possiamo rappresentare la distribuzione di frequenze assolute, relative e percentuali del carattere 𝑋
come segue:

Frequenza Frequenza Frequenza


𝑿
assoluta relativa percentuale
𝑥1 𝑛1 𝑓1 𝑝1
𝑥2 𝑛2 𝑓2 𝑝2
… … … …
𝑥𝑗 𝑛𝑗 𝑓𝑗 𝑝𝑗
… … … …
𝑥𝐾 𝑛𝐾 𝑓𝐾 𝑝𝐾
Totale 𝑵 𝟏 𝟏𝟎𝟎
Le distribuzioni statistiche

Le distribuzioni di frequenze relative e percentuali: esempio 1


► Ad esempio, per il carattere 𝑋 = 𝑇𝑖𝑡𝑜𝑙𝑜 𝑑𝑖 𝑠𝑡𝑢𝑑𝑖𝑜, abbiamo:

Frequenza assoluta Frequenza relativa Frequenza percentuale


Titolo di studio
𝑛𝑗 𝑓𝑗 𝑝𝑗
Elementare 1 0,067 6,7
Licenza media 2 0,133 13,3
Diploma 3 0,200 20,0
Laurea 9 0,600 60,0
Totale 𝟏𝟓 𝟏, 𝟎𝟎𝟎 𝟏𝟎𝟎, 𝟎

𝑛1 1
𝑓1 = = = 0,067
𝑁 15

𝑝1 = 𝑓1 × 100 = 0,067 × 100 = 6,7


Le distribuzioni statistiche

Le distribuzioni di frequenze relative e percentuali: esempio 2


► Invece, per il carattere 𝑋 = 𝑀𝑒𝑡𝑜𝑑𝑜 𝑑𝑖 𝑝𝑎𝑔𝑎𝑚𝑒𝑛𝑡𝑜, abbiamo:

Metodo di Frequenza assoluta Frequenza relativa Frequenza percentuale


pagamento 𝑛𝑗 𝑓𝑗 𝑝𝑗
Carta di credito 6 0,400 40,0
Contrassegno 1 0,067 6,7
Carta prepagata 3 0,200 20,0
Paypol 5 0,333 33,3
Totale 𝟏𝟓 𝟏, 𝟎𝟎𝟎 𝟏𝟎𝟎, 𝟎
4

෍ 𝑓𝑗 = 0,400 + 0,067 + 0,200 + 0,333 = 1


𝑗=1
4

෍ 𝑝𝑗 = 40,0 + 6,7 + 20,0 + 33,3 = 100


𝑗=1
Le distribuzioni statistiche

Le distribuzioni di frequenze relative e percentuali: esempio 3


► L’utilizzo delle distribuzioni di frequenze relative o percentuali permette di confrontare agevolmente
due o più collettivi di numerosità diversa:

Località A Località B
Motivo del viaggio 𝑛𝑗 % Motivo del viaggio 𝑛𝑗 %
Piacere, svago 400 44,4 Piacere, svago 20 10,0
Visita a parenti/amici 50 5,6 Visita a parenti/amici 10 5,0
Motivi religiosi 80 8,9 Motivi religiosi 15 7,5
Trattamenti di salute 140 15,6 Trattamenti di salute 25 12,5
Lavoro 𝟏𝟎𝟎 𝟏𝟏, 𝟏 Lavoro 𝟏𝟎𝟎 𝟓𝟎, 𝟎
Altro 130 14,4 Altro 30 15,0
Totale 𝟗𝟎𝟎 𝟏𝟎𝟎, 𝟎 Totale 𝟐𝟎𝟎 𝟏𝟎𝟎, 𝟎

► Il valore assunto dalle frequenze assolute dipende dal totale. Calcolando le percentuali si riporta la
numerosità dei due collettivi a 100.
Le distribuzioni statistiche

Le frequenze cumulate
► Quando le modalità di un carattere sono almeno ordinate, ovvero per i caratteri qualitativi ordinati
o quantitativi, si possono calcolare anche le frequenze cumulate, che ci indicano quante unità di un
collettivo presentano una certa modalità o una modalità precedente.

Esempio
• Quanti sono gli individui con un titolo di studio di livello inferiore o uguale a licenza media?
• E quelli che hanno fatto non più di due acquisti?

Titolo di studio 𝑛𝑗 Numero di acquisti 𝑛𝑗


Elementare 1 1 3
Licenza media 2 2 7
Diploma 3 3 4
Laurea 9 4 1
Totale 𝟏𝟓 Totale 𝟏𝟓
Le distribuzioni statistiche

Le frequenze cumulate
► La frequenza cumulata (assoluta, relativa o percentuale) associata a una modalità 𝑗 è data dalla
somma della frequenza (assoluta, relativa o percentuale) riferita a quella stessa modalità con le
frequenze delle modalità precedenti → indica quante unità del collettivo presentano una modalità
inferiore o uguale a 𝑗.

• Frequenza assoluta cumulata: 𝑁𝑗 = 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑗

• Frequenza relativa cumulata: 𝐹𝑗 = 𝑓1 + 𝑓2 + ⋯ + 𝑓𝑗

• Frequenza percentuale cumulata: 𝑃𝑗 = 𝑝1 + 𝑝2 + ⋯ + 𝑝𝑗


Le distribuzioni statistiche

Le distribuzioni di frequenze cumulate


► Possiamo rappresentare le distribuzioni di frequenze cumulate (assolute, relative e percentuali) nel
modo seguente:

Frequenza assoluta Frequenza relativa Frequenza percentuale


𝑿 cumulata cumulata cumulata
𝑁𝑗 𝐹𝑗 𝑃𝑗
𝑥1 𝑁1 = 𝑛1 𝐹1 𝑃1
𝑥2 𝑁2 = 𝑛1 + 𝑛2 𝐹2 𝑃2
… … … …
𝑥𝑗 𝑁𝑗 = 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑗 𝐹𝑗 𝑃𝑗
… … … …
𝑥𝐾 𝑁𝐾 = 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑗 + ⋯ + 𝑛𝐾 = 𝑁 𝐹𝐾 = 1 𝑃𝐾 = 100
Totale 𝑵 𝟏 𝟏𝟎𝟎
Le distribuzioni statistiche

Le distribuzioni di frequenze cumulate: esempio


► Ad esempio, per il carattere «Titolo di studio» abbiamo:

Titolo di studio 𝑛𝑗 𝑁𝑗 𝑓𝑗 𝐹𝑗 𝑃𝑗
Elementare 1 1 0,067 0,067 6,7
Licenza media 2 3 0,133 0,200 20,0
Diploma 3 6 0,200 0,400 40,0
Laurea 9 15 0,600 1,000 100,0
Totale 𝟏𝟓 𝟏

𝑁2 = 𝑛1 + 𝑛2 = 1 + 2 = 3
𝐹2 = 𝑓1 + 𝑓2 = 0,067 + 0,133 = 0,200

Commento
• 3 persone hanno un titolo di studio minore o uguale (o non superiore) alla licenza media
• tali persone corrispondono al 20% del totale
Le distribuzioni statistiche

La suddivisione in classi
► Quando il carattere che si vuole analizzare presenta un numero molto elevato di modalità, la
distribuzione di frequenze può risultare incomprensibile o inutile → modalità con frequenza nulla,
tabella troppo estesa.
► Se il carattere è qualitativo (es., province, imprese per settore di attività economica, … )
• si ricorre ad un accorpamento delle modalità Età 𝑛𝑗
► Se il carattere è quantitativo (età, spesa, peso, altezza, etc. ) 15 1
• si ricorre alla suddivisione in classi 16 2
… …
24 2
… …
46 1
… …
72 0
… …
Totale 900
Le distribuzioni statistiche

La suddivisione in classi di un carattere quantitativo


► Nel caso di caratteri quantitativi, la costruzione della distribuzione di frequenze si può fare
raggruppando le modalità contigue in classi → intervalli numerici, tra loro disgiunti,
comprendenti più modalità.
► Ad ogni classe si fa corrispondere una Età 𝑛𝑗
frequenza assoluta, relativa o 15 1
percentuale, sommando le frequenze Età 𝑛𝑗
16 2
associate alle modalità che
… … 15 – 24 12
compongono le classi.
24 2 25 – 34 179
… … 35 – 44 100
46 1 45 – 64 422
… …
65 𝑒 𝑜𝑙𝑡𝑟𝑒 187
72 0
Totale 𝟗𝟎𝟎
… …
Totale 900
Le distribuzioni statistiche

La suddivisione in classi di un carattere quantitativo


► In generale non esiste una regola precisa per determinare numero e ampiezza delle classi. Tuttavia
può essere opportuno definire le classi in modo tale che:
• il loro numero sia abbastanza piccolo da fornire una sintesi adeguata ma sufficientemente grande
da mantenere un livello di dettaglio accettabile
• siano disgiunte
• siano esaustive, cioè devono comprendere tutte le possibili modalità del carattere
• abbiano, se possibile, la stessa ampiezza; in tal caso, una volta stabilito il numero di classi, la
dimensione della classe si ottiene nel modo seguente:

𝑉𝑎𝑙𝑜𝑟𝑒 𝑚𝑎𝑠𝑠𝑖𝑚𝑜 − 𝑉𝑎𝑙𝑜𝑟𝑒 𝑚𝑖𝑛𝑖𝑚𝑜


𝐷𝑖𝑚𝑒𝑛𝑠𝑖𝑜𝑛𝑒 𝑐𝑙𝑎𝑠𝑠𝑒 ≈
𝑁𝑢𝑚𝑒𝑟𝑜 𝑑𝑖 𝑐𝑙𝑎𝑠𝑠𝑖
Le distribuzioni statistiche

La suddivisione in classi di un carattere quantitativo


► Le classi sono caratterizzate da:
• estremo inferiore: il più piccolo valore della classe → 𝑥𝑗−1

• estremo superiore: il valore più grande della classe → 𝑥𝑗

• ampiezza: differenza tra i due estremi della classe → 𝑎𝑗 = 𝑥𝑗 − 𝑥𝑗−1

• valore centrale: valore rappresentativo della classe, si ottiene come semisomma degli estremi
della classe
Età
𝑥𝑗−1 + 𝑥𝑗 𝑛𝑗 𝑎𝑗 𝑐𝑗
𝑐𝑗 = (anni compiuti)
2
15 – 24 12 9 19,5
25 – 34 179 9 29,5
35 – 44 100 9 39,5
45 – 64 422 19 54,5
65 – 84 187 19 74,5
Totale 900
Le distribuzioni statistiche

La suddivisione in classi di un carattere quantitativo: definire le classi


► Le classi si possono rappresentare in maniera diversa a seconda di quale sia l’estremo incluso. Ad
esempio, considerando la distribuzione dell’altezza in classi:

La barra verticale indica la classe in


cui è incluso l’estremo
Altezza (cm) 𝑛𝑗
156 |– 165 187
156 |– 165
165 |– 175 391
156 ≤ 𝑥 < 165 175 |– 185 284
185 |– 195 28
ሾ156, 165)
195 𝑒 𝑜𝑙𝑡𝑟𝑒 10
classe chiusa a sinistra Totale 𝟗𝟎𝟎

classe aperta
Le distribuzioni statistiche

La suddivisione in classi di un carattere quantitativo continuo


► Nel caso di caratteri continui le classi contigue devono avere estremo superiore uguale
all’estremo inferiore della classe successiva (altrimenti si perderebbero le modalità intermedie a
queste); inoltre, è necessario includere uno dei due estremi della classe altrimenti si perderebbero i
valori corrispondenti.

Altezza
𝑛𝑗
(cm)
156 |– 𝟏𝟔𝟓 187
𝟏𝟔𝟓 |– 175 391
175 |– 185 284
185 |– 195 28
195 𝑒 𝑜𝑙𝑡𝑟𝑒 10
Totale 𝟗𝟎𝟎
Le distribuzioni statistiche

La suddivisione in classi di un carattere quantitativo discreto


► Nel caso di caratteri discreti non è necessario includere uno dei due estremi della classe, in
quanto tra le due modalità che definiscono gli estremi di due classi contigue non esistono modalità
intermedie. In questo caso gli estremi delle due classi contigue non devono essere uguali altrimenti le
classi non sarebbero disgiunte, a meno che non venga specificato l’estremo da includere.

Età
𝑛𝑗
(anni compiuti)
Versione alternativa
15 – 24 12
Età
25 – 44 279 𝑛𝑗
(anni compiuti)
45 – 64 422 15 |– 25 12
65 𝑒 𝑜𝑙𝑡𝑟𝑒 187 25 |– 45 279
Totale 𝟗𝟎𝟎 45 |– 65 422
65 𝑒 𝑜𝑙𝑡𝑟𝑒 187
Totale 900
Le distribuzioni statistiche

La distribuzione di quantità
► La distribuzione di quantità è una tabella in cui ad ogni modalità di un carattere (o variabile) si fa
corrispondere una quantità, dello stesso o di un altro carattere (o variabile). Tale distribuzione
consente di esplicitare come l’ammontare complessivo di un carattere si distribuisce tra le varie
modalità.
► Una distribuzione di quantità è il risultato di due operazioni:
• classificazione → suddivisione di un collettivo in
base alle modalità di un carattere Redditi da lavoro dipendente (milioni di €)

• misurazione → quantificazione, per ogni Settore economico Quantità


modalità, dell’ammontare di un carattere, Agricoltura 15.043
idealmente trasferibile tra le unità della Industria 227.765
popolazione (N.B.: il totale che viene ripartito non Servizi 235.016
riguarda il numero delle unità statistiche in ciascun
Pubblico impiego 209.339
settore, bensì la somma dei redditi)
Totale 687.163
Le distribuzioni statistiche

Le serie storiche
► Le serie storiche (o temporali) sono successioni di valori di una grandezza (𝑌) ordinati rispetto ad un
indice temporale, 𝑌1 , 𝑌2 , … , 𝑌𝑇 , osservati in 𝑇 istanti o intervalli temporali generalmente equidistanti
tra loro → consentono di esprimere la dinamica di un fenomeno nel periodo di tempo considerato.
► L’indice temporale definisce la periodicità di
osservazione dei valori della serie e può riferirsi ad Anno PIL
ore, giorni, settimane, mesi, trimestri, 2012 𝑌2012
quadrimestri, anni, etc. 2013 …
2014 …
2015 …
2016 …
2017 …
2018 …
2019 𝑌2019
Le distribuzioni statistiche

Le serie territoriali
► Le serie territoriali (o spaziali) sono costituite da una successione di valori assunti da una grandezza
(𝑌) in uno stesso momento in unità territoriali differenti → esprimono la distribuzione geografica
(o territoriale) di un fenomeno.
► Le unità territoriali possono essere nazioni,
regioni, province, città, o altre località Regione Numero
ancora. di turisti
Toscana 𝑌𝑇𝑜𝑠𝑐𝑎𝑛𝑎
Sardegna …
Lombardia …
Lazio …
Veneto 𝑌𝑉𝑒𝑛𝑒𝑡𝑜
Le rappresentazioni grafiche

Introduzione
► Le rappresentazioni grafiche hanno lo scopo di illustrare le distribuzioni di frequenze o di
quantità con linee o segmenti, aree, volumi, figure o simboli convenzionali. Esse non forniscono
informazioni aggiuntive rispetto a quelle tabulari ma possono essere di grande efficacia
comunicativa, se realizzate correttamente.

Anno Benzina Gasolio


2011 927 1.306 Iscrizioni di vetture (migliaia) in Italia per tipo
2012 977 1.373 di alimentazione
benzina
2013 1.111 1.403 1.500 gasolio
1.250
2014 1.065 1.119
1.000
2015 1.256 914
750
500
250
0
2011 2012 2013 2014 2015
Fonte: ISTAT Anno
Le rappresentazioni grafiche

Utilità
► I grafici presentano diversi vantaggi rispetto alle tabelle, poiché consentono di:
• visualizzare immediatamente le caratteristiche principali della distribuzione → forma
• favorire il confronto fra più distribuzioni
• agevolare l’analisi dei fenomeni, evidenziando andamenti, relazioni ed eventuali dati anomali
(picchi grafici) che possono essere dovuti a errori nei dati o alla presenza di valori
sostanzialmente diversi da quelli delle altre osservazioni
• divulgare i risultati in maniera efficace
Le rappresentazioni grafiche

Le caratteristiche di un grafico
► Affinché un grafico sia utile ed efficace dovrebbe contenere tutte le informazioni necessarie alla
comprensione dei dati rappresentati.
• Titolo: descrive il carattere al quale si riferisce la distribuzione, il collettivo e quando è stata fatta
la rilevazione.
• Etichette: descrive le modalità del carattere sull’asse.
• Legenda: quando sono rappresentate più Iscrizioni di vetture (migliaia) in Italia per tipo
distribuzioni occorre riportare una legenda di alimentazione
benzina
che faccia corrispondere ad ogni colore o 1.500 gasolio
simbolo una particolare distribuzione. 1.250
1.000
• Note: per citare la fonte dei dati, da riportare
750
alla base del grafico.
500
250
0
2011 2012 2013 2014 2015
Anno
Fonte: Istat
Le rappresentazioni grafiche

Le principali rappresentazioni grafiche


► Le rappresentazioni grafiche più utilizzate sono:
• Grafico torta → caratteri qualitativi sconnessi
• Grafico a nastri → caratteri qualitativi sconnessi

• Grafico a barre → caratteri qualitativi sconnessi, ordinati e quantitativi discreti

• Istogramma → caratteri quantitativi continui

• Diagramma cartesiano a linee → serie temporali

• Cartogramma → serie territoriali

• Grafico radar → caratteri ciclici

• …
Le rappresentazioni grafiche

Il grafico a torta
► Il grafico a torta (diagramma a torta o diagramma circolare) mostra le frequenze di una distribuzione
sotto forma di settori circolari (o spicchi di un cerchio) → caratteri qualitativi sconnessi.
► E’ particolarmente utile:
• per rappresentare la composizione di un aggregato
• quando il numero di modalità non è troppo elevato, altrimenti si riduce la dimensione dei settori
circolari rendendo più difficile il confronto
► L’ampiezza dei settori circolari (angoli al centro) è proporzionale
alla frequenza relativa:

𝑛𝑗
𝛼𝑗 = 360° ∙
𝑁
Le rappresentazioni grafiche

Il grafico a torta: esempio


► Costruire il grafico a torta della seguente distribuzione degli occupati (in migliaia) per settore di
attività.

Settore 𝒏𝒋 𝒑𝒋
Agricoltura 843 3,8
Industria 5976 26,6
Servizi 15646 69,9
Occupati per settore di attività anno 2013
Totale 𝟐𝟐𝟒𝟔𝟓 𝟏𝟎𝟎, 𝟎 (% sul totale)
3,8
3.8%
843 26,6
26.6%
𝛼𝐴𝑔𝑟𝑖𝑐𝑜𝑙𝑡𝑢𝑟𝑎 = 360 ∙ = 13,51° Agricoltura
22465
Industria
Servizi
5976
𝛼𝐼𝑛𝑑𝑢𝑠𝑡𝑟𝑖𝑎 = 360 ∙ = 95,76°
22465 69.6%
69,6

15646
𝛼𝑆𝑒𝑟𝑣𝑖𝑧𝑖 = 360 ∙ = 250,73°
22465
Le rappresentazioni grafiche

Il grafico a barre o a nastri


► Nei grafici a barre o a nastri le modalità del carattere sono rappresentate da rettangoli equidistanti
la cui altezza è proporzionale alla frequenza (assoluta, relativa o percentuale) mentre le basi sono
uguali.

Grafico a barre

Grafico a nastri
Le rappresentazioni grafiche

Il grafico a barre: esempio 1


► Il grafico a barre (verticali) è particolarmente adatto per caratteri (o variabili) ordinali, in quanto
consente di evidenziare l’ordinamento tra le modalità.

Grado di
𝒏𝒋 𝒑𝒋
soddisfazione
Per niente 21 10,0
Poco 46 21,9
Abbastanza 79 37,6 Grado di soddisfazione mensa universitaria
40
Molto 64 30,5
35
Totale 𝟐𝟏𝟎 𝟏𝟎𝟎, 𝟎 30
25
20

%
15
10
5
0
Per niente Poco Abbastanza Molto
Le rappresentazioni grafiche

Il grafico a barre: esempio 2


► Il grafico a barre verticali è adatto anche per caratteri (o variabili) quantitativi discreti.

Numero di
prodotti 𝒏𝒋 𝒑𝒋
acquistati
0 12 4,1
1 137 46,4
2 86 29,2 Prodotti acquistati in e-commerce nell'utlimo mese
3 31 10,5 50

4 15 5,1 40

5 11 3,7 30

%
6 3 1,0 20

Totale 𝟐𝟗𝟓 𝟏𝟎𝟎, 𝟎 10

0
0 1 2 3 4 5 6
Numero
Le rappresentazioni grafiche

Il grafico a nastri
► Il grafico a nastri (o a barre orizzontali) è più adatto per i caratteri qualitativi sconnessi.

Modello di
𝒏𝒋 𝒑𝒋
smartphone
Galaxy S8 97 30,9
Modello di smartphone posseduto
iPhone 8 74 23,6
Altro
Xperia Z6 36 11,5
Mate 10 38 12,1 Mate 10

Altro 69 22,0 Xperia Z6

Totale 314 100,0 iPhone 8

Galaxy S8

0.0 5.0 10.0 15.0 20.0 25.0 30.0 35.0


%
Le rappresentazioni grafiche

Quale grafico scegliere: a torta o a nastri?


► La scelta tra uno dei due tipi di grafico si può fare in base agli obiettivi.
• Grafico a torta → migliore percezione della composizione
• Grafico a nastri → migliore percezione delle differenze

Modello di smartphone posseduto Modello di smartphone posseduto

Altro

Mate 10

Xperia Z6

iPhone 8

Galaxy S8

0.0 5.0 10.0 15.0 20.0 25.0 30.0 35.0


% Galaxy S8 iPhone 8 Xperia Z6 Mate 10 Altro
Le rappresentazioni grafiche

Istogramma
► In un istogramma le modalità del carattere sono rappresentate da rettangoli non distanziati, con
basi uguali o diverse, in cui ogni rettangolo ha un’area proporzionale alle frequenze → caratteri
continui raggruppati in classi.
Le rappresentazioni grafiche

Istogramma a basi regolari o uguali


► L’istogramma a basi regolari o uguali è adatto per caratteri quantitativi suddivisi in classi della
stessa ampiezza → l’altezza del rettangolo è proporzionale alla frequenza della classe.

Km percorsi 𝒏𝒋
10 |– 20 3
20 |– 30 6 6
30 |– 40 5 5

Frequenze assolute
40 |– 50 4 4
3
50 |– 60 2 𝟔
2
Totale 𝟐𝟎
1
0
10 20 30 40 50 60

Classi di età
Le rappresentazioni grafiche

Istogramma a basi diverse


► L’istogramma con basi diverse è adatto per i caratteri quantitativi suddivisi in classi di ampiezza
diversa → l’altezza del rettangolo è proporzionale alla densità di frequenza della classe.

𝑛𝑗
ℎ𝑗 =
𝑎𝑗
• ℎ𝑗 = densità di frequenza

• 𝑛𝑗 = frequenza assoluta modalità 𝑗

• 𝑎𝑗 = ampiezza della classe

► La densità di frequenza consente di tenere in considerazione che la frequenza maggiore osservata in


una classe potrebbe dipendere dalla maggiore ampiezza di quella classe. In tal modo la densità di
frequenza rappresenta la frequenza che compete alla classe unitaria posta in ascissa.
Le rappresentazioni grafiche

Istogramma a basi diverse: esempio


► Rappresentare graficamente i valori della tabella seguente che si riferiscono alla spesa settimanale (in
classi) per l’acquisto di prodotti biologici da parte di 190 consumatori.

Ampiezza Densità
Spesa 𝑛𝑗
𝑎𝑗 ℎ𝑗
10
0 |– 5 21 5 4,2 9
8
5 |– 15 46 10 4,6
7
15 |– 30 79 15 5,3

Densità
6
30 |– 35 44 5 8,8 5
4
Totale 𝟏𝟗𝟎 3
𝟓, 𝟑
2
1
0
0 5 15 30 35
Classi di spesa
Le rappresentazioni grafiche

Il diagramma cartesiano a linee


► Il diagramma cartesiano a linee è una rappresentazione grafica costituita da una successione di
punti su un piano cartesiano, in cui l’asse delle ascisse è il tempo e l’asse delle ordinate è dato dal
valore del carattere osservato → serie storica.
► I punti vengono uniti da segmenti (linee) e costituiscono una spezzata che rappresenta
l’andamento del fenomeno nel tempo.
Tasso di disoccupazione in Italia
► Tale grafico può far risaltare aspetti caratteristici
del fenomeno, quali:

% sulle forze di lavoro


• una tendenza (o traiettoria) di fondo
• eventuali cambiamenti nella struttura
• valori anomali

1999 2002 2005 2008 2011 2014 2017


Anno
Le rappresentazioni grafiche

Il cartogramma
► Un cartogramma è una carta geografica sulla quale sono rappresentati dati statistici, mediante
colori di intensità diversa in base ai valori che il carattere assume in una certa area geografica (o in
un certo territorio) → serie territoriale.
0,0 ; 9,5
Cartogramma: Tasso di disoccupazione 9,5 ; 16,0
per provincia (% sulle forze di lavoro), 16,0 ; 22,5
Italia, 2017 (Fonte, Istat). 22,5; 29,0
Le rappresentazioni grafiche

Il grafico radar
► Il grafico radar (grafico a stella, a ragnatela o polare) mostra le frequenze o le quantità di una
distribuzione sotto forma di una sequenza di raggi che hanno origine da un centro e formano
angoli uguali tra loro → caratteri ordinati ciclici.
► Si suddivide l’angolo di 360° con tanti raggi per quante sono le modalità del carattere e agli
angoli compresi tra coppie di raggi si attribuisce la stessa ampiezza.
Numero di turisti stranieri arrivati per mese
► Infine, su ogni raggio, si calcola un segmento di (migliaia di unità). Italia, 2018 (Fonte, Istat).
lunghezza uguale o proporzionale alla
corrispondente frequenza o quantità.
► Può essere utile ed efficace da un punto di vista grafico
unire con una spezzata gli estremi dei segmenti e
colorare l’area interna al poligono che si viene a
formare.
Le rappresentazioni grafiche

Grafici ingannevoli
► Come insegna il classico libro di D. Huff «Mentire con la statistica», i grafici possono essere disegnati
in modo da trarre in inganno. I due trucchi più frequenti sono:
• compressione o espansione degli assi del diagramma cartesiano → (esempio a)
• l’asse verticale che non parte da zero → (esempio b)
• inoltre, in alcuni grafici vengono aggiunti elementi inutili, come la tridimensionalità, la
prospettiva o altri elementi non necessari alla comprensione dei dati rappresentati (immagini,
figure, etc.). Tali elementi spesso hanno solo il fine di catturare l’attenzione del lettore ma il più
delle volte rendono il grafico più difficile da leggere → (esempio c).
Le rappresentazioni grafiche

Grafici ingannevoli: esempio a


► La compressione o espansione degli assi del diagramma cartesiano:

Iscrizioni di vetture a gasolio


2000 Iscrizioni di vetture a gasolio
1000 1600
0
1400
2011 2012 2013 2014 2015

1200

1000

800

600

400

200

0
2011 2012 2013 2014 2015
Le rappresentazioni grafiche

Grafici ingannevoli: esempio b


► L’asse verticale che non parte da zero:

Reati denunciati su 100 mila abitanti

Torino

Milano

Reati denunciati su 100 mila abitanti


Bologna

Torino
Bari

Milano
180 190 200 210 220 230

Bologna

Bari

0 50 100 150 200 250


Le rappresentazioni grafiche

Grafici ingannevoli: esempio c


► L’aggiunta di elementi inutili, come la tridimensionalità e la prospettiva:

Smartphone preferito

20,4
20.4

9,9
9.9 39,3
39.3 Smartphone preferito
13,6
13.6
20,4
20.4
16,8
16.8
39,3
39.3

Galaxy S8 iPhone 8 Xperia Z6 Mate 10 Altro 9,99.9

13,6
13.6
16,8
16.8
Galaxy S8 iPhone 8 Xperia Z6 Mate 10 Altro
Le rappresentazioni grafiche

L’infografica statistica
► Un’infografica statistica identifica un insieme di disegni e grafici (statici o dinamici), icone o
immagini accattivanti per rappresentare sinteticamente le informazioni o i dati statistici in forma
visuale invece che in forma testuale o tabellare → non sono rappresentazioni grafiche.
► E’ una tecnica nata dall’incontro della grafica con il giornalismo, che richiede competenze trasversali,
anche statistiche.
► E’ uno strumento spesso utilizzato anche
dall’Istat per la diffusione dei risultati delle
indagini statistiche, proprio per la sua capacità di
«raccontare una storia» dietro i dati →
narrazione.

Potrebbero piacerti anche