Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Lezione 3
RAPPRESENTAZIONI GRAFICHE
Le forme che possono assumere i grafici sono molto diverse fra loro e variano a
seconda della natura della variabile considerata, nel senso che alcune
rappresentazioni grafiche sono idonee per certi tipi di variabile ma non per altri.
1
Lezione 3
In questo caso le diverse “fette” della torta hanno un’ampiezza che dipende dalla
frequenza associata alle modalità. Questo tipo di rappresentazione è usata in
numerose circostanze ed è di facile facile costruzione con i più comuni software,
ma a mano libera è un po’ laboriosa.
Per questo motivo si esamineranno in dettaglio grafici diversi, descritti qui di
seguito, distinti a seconda del tipo di variabile.
2
Lezione 3
Esempio
La seguente distribuzione riporta la distribuzione della materia meno gradita da
300 studenti di un liceo classico
100
frequenza assoluta
90
80
70
60
50
40
30
20
10
0
Ed.fisica Geografia Storia Inglese Italiano Matematica
materia
3
Lezione 3
Come si vede, i confronti fra le diverse materie sono possibili, ma sarebbero resi
più semplici se si ordinassero le materie a seconda del valore assunto dalla
frequenza corrispondente (in senso crescente o decrescente).
Questa è in effetti la convenzione che viene utilizzata quando la variabile risulta
sconnessa.
Per l’esempio appena considerato una rappresentazione grafica corretta è quindi
la seguente
100
frequenza assoluta
90
80
70
60
50
40
30
20
10
0
Ed.fisica Italiano Storia Geografia Inglese Matematica
materia
Va notato che questo tipo di grafico assume una stessa forma se sull’asse delle
ordinate si riportano le frequenze assolute oppure le frequenze relative, per cui
la rappresentazione può essere fatta indifferentemente con un tipo di frequenza
o con l’altro (si ha solo un cambio di scala sull’asse delle ordinate).
Considerata, per esempio, la seguente distribuzione del numero totale dei casi di
coronavirus per regione in Italia, aggiornata alle ore 17:00 del 9 marzo 2020,
5
Lezione 3
Basilicata
Calabria
Molise
Valle d'Aosta
Sardegna
Umbria
Abruzzo
Trentino A.A.
Puglia
Sicilia
R Friuli V.G.
e Lazio
g Liguria
i Campania
o Toscana
n Marche
e Piemonte
Veneto
Emilia Romagna
Lombardia
0,00 500,00 1000,00 1500,00 2000,00 2500,00 3000,00 3500,00 4000,00 4500,00 5000,00 5500,00 6000,00
casi totali
6
Lezione 3
Esempio
La seguente distribuzione riporta i dati di un’indagine effettuata da Almalaurea
sui laureati in economia e commercio in Italia aggiornata all’aprile 2019.
La distribuzione delle risposte alla domanda circa l’adeguatezza del carico di
studio alla durata del corso è riportata nella tabella seguente
7
Lezione 3
0,6
frequenza relativa
0,5
0,4
0,3
0,2
0,1
0
Decisamente no Più no che sì Più sì che no Decisamente sì
valutazione
8
Lezione 3
Esempio
La seguente distribuzione indica il numero di esami superati dagli iscritti al primo
anno di un certo corso di laurea nel momento dell’iscrizione all’anno successivo
Esami Frequenza
superati relativa
0 0.20
1 0.09
2 0.13
3 0.22
4 0.22
5 0.11
6 0.03
1.00
9
Lezione 3
0,3
0,25
frequenza relativa
0,2
0,15
0,1
0,05
0
0 1 2 3 4 5 6 7
esami superati
10
Lezione 3
Esempio
Se la frequenza relativa associata a un intervallo (0, 2] è 0.3, la frazione di
frequenza associata agli intervalli (0, 1] e (1, 2] è 0.15, mentre all’intervallo
(0, 0.5] è associata una frequenza pari a 0.075.
11
Lezione 3
𝑓𝑗 𝑓𝑗
ℎ𝑗 = =
𝑐𝑗 − 𝑐𝑗−1 ∆𝑗
ℎ𝑗 × (𝑏 − 𝑎)
Esempio
Considerata la seguente distribuzione
X Frequenza
2− 3 4
3− 5 6
5 − 10 6
16
Di conseguenza la frazione di frequenza per (a, b), a, b, (a, b o a, b) è sempre la
stessa.
13
Lezione 3
0,3
0,25
0,2
densità
0,15
0,1
0,05
0
0 1 2 3 4 5 6 7 8 9 10 11 12
Si deve notare che l’area di ciascun rettangolo (ottenuta come prodotto della base
per l’altezza) corrisponde alla frequenza relativa associata alla classe.
Dalla formula della densità di frequenza risulta infatti che la frequenza
complessiva associata al j-esimo intervallo è data dal prodotto fra la densità della
classe e la sua ampiezza
𝑓𝑗 = ℎ𝑗 × ∆𝑗
Per la j-esima classe (cj-1, cj], quindi, il rettangolo corrispondente avrà una base
14
Lezione 3
INDICI DI POSIZIONE
In statistica si utilizzano svariati indici per evidenziare le caratteristiche
principali della variabile rilevata sull’insieme delle unità statistiche esaminate. Le
cosiddette medie (o indici di posizione) descrivono sinteticamente l’insieme delle
osservazioni mediante una sola modalità o un unico valore numerico, a seconda
che la variabile considerata sia qualitativa o quantitativa.
Si distinguono in
- Medie di posizione, che possono essere determinate per variabili qualsiasi
- Medie analitiche, che possono essere determinate solo per variabili quantitative,
in quanto richiedono l’esecuzione di operazioni algebriche
Una qualsiasi media effettua la sintesi di tutte le informazioni contenute nei dati
originali attraverso una sola determinazione, per cui la media di una variabile
qualitativa coincide con una delle k modalità osservate, mentre la media di una
variabile quantitativa risulta sempre interna al suo intervallo di variazione.
15
Lezione 3
16
Lezione 3
ESERCIZI
1) Data la seguente serie di voti
21 24 30 24 26 25 24 28
il voto modale è 24
18
Lezione 3
QUANTILI
Altri indici di posizione che vengono frequentemente calcolati se la variabile è
almeno ordinabile sono i cosiddetti quantili.
Per semplicità in questa lezione si considerano solo i casi relativi a una variabile
quantitativa discreta o alla sequenza di una variabile continua, ma i quantili
possono essere determinati anche per variabili qualitative ordinabili e per
distribuzioni in classi, mentre non possono essere determinati per variabili
qualitative sconnesse (o non ordinabili)
Fra tutti i possibili quantili che possono essere considerati, alcuni sono di uso più
comune. In particolare si usano spesso
- i tre quartili (x0.25, x0.5, x0.75)
- i nove decili (x0.1, x0.2, …, x0.9)
- i novantanove centili (x0.01, x0.02, …, x0.99)
19
Lezione 3
L’uso della mediana è molto comune. Per esempio, nel report dell’Istat
“CONDIZIONI DI VITA, REDDITO E CARICO FISCALE DELLE FAMIGLIE” del 6
dicembre 2018 si legge “Metà delle famiglie residenti in Italia percepisce un
reddito netto non superiore a 25.091 euro l’anno (circa 2.090 euro al mese;
+2,3% rispetto al 2015). Il reddito mediano cresce in tutte le ripartizioni: da
+0,6% del Nord-ovest a +3,9% del Nord-est.”
20
Lezione 3
1) SEQUENZA DI n OSSERVAZIONI
ESEMPI
1) Considerata la seguente sequenza di voti ottenuti da uno studente
24 18 27 22 30
si determini il quantile di ordine p = 0.5 della variabile.
La sequenza ordinata è
18 22 24 25 27 30
e il quantile cercato risulta x0.5 = x(3 )= 24.
ESERCIZI
1) Considerata la seguente sequenza di osservazioni relative a una variabile
continua, si determini il valore dei tre quartili
2.0 1.8 1.9 2.8 2.9 3.0 3.1 4.8 5.5 3.1
Si osservi che uno stesso valore della variabile può corrispondere a più quantili di
ordine diverso.
22
Lezione 3
2) DISTRIBUZIONI DI FREQUENZA
Il procedimento di calcolo dei quantili per una distribuzione di frequenza è lo
stesso utilizzato al caso precedente, anche se può sembrare diverso.
Data la distribuzione riportata nella tabella successiva
X Frequenza assoluta
-2 3
-1 5
0 2
10
Dato che il primo quartile occupa il posto ⌈10 × 0.25⌉ = 3, x0.25 = -2, in quanto la
frequenza assoluta cumulata associata a tale valore è esattamente uguale a 3.
23
Lezione 3
La mediana, invece, occupa il posto ⌈10 × 0.5⌉ = 5 per cui x0.5 = -1, dato che il
valore della frequenza assoluta cumulata associata a tale valore è pari a 8.
La determinazione -1 è infatti quel valore della variabile in corrispondenza del
quale la frequenza assoluta cumulata assume per la prima volta un valore
maggiore di 5 (in corrispondenza dell’intensità precedente era uguale a 3).
Il terzo quartile, infine, occupa il posto ⌈10 × 0.75⌉ = 8 per cui x0.75 = -1.
Esercizio
Data la seguente distribuzione dei risultati sufficienti ottenuti in una prova
intermedia espressa in quindicesimi, si determinino i quantili di ordine 0.25, 0.3
e 0.5.
X Frequenza assoluta
8 17
9 25
10 40
11 35
12 27
13 18
14 10
15 8
180
24
Lezione 3
Il posto occupato dal primo quartile è ⌈180 × 0.25⌉ = 45, per cui x0.25 = 10.
Il posto occupato dal terzo decile è ⌈180 × 0.3⌉ = 54, per cui x0.3 = 10.
Il posto occupato dalla mediana è ⌈180 × 0.5⌉ = 90, per cui x0.5 = 11.
25