Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Tema D
13
1. Introduzione alla statistica
STRUMENTI DIGITALI Che cos’è la statistica?
APPROFONDIMENTI I giornali e la televisione ci sommergono quotidianamente di grafici, tabelle, numeri
e percentuali. È ormai una prassi diffusa che le grandi imprese commerciali o gli enti
VIDEOLEZIONI che erogano servizi raccolgano direttamente fra i propri clienti dati e opinioni. I poli-
tici e gli amministratori pubblici hanno sempre più bisogno di conoscere in tempo
reale in che misura le loro decisioni sono sostenute dai cittadini. Per studiare scientifi-
ESERCIZI INTERATTIVI
camente situazioni come queste e altre simili è necessario utilizzare gli strumenti con-
GLOSSARIO cettuali forniti da una disciplina oggi in fase di grande sviluppo: la statistica.
MULTIMEDIALE L’oggetto della statistica è lo studio quantitativo (cioè tramite gli strumenti della mate-
MATEMATICA matica) di fenomeni collettivi (ossia riguardanti più individui), osservabili nella realtà
IN LABORATORIO sociale, in natura o in laboratorio.
SCHEDA
Nella società dell’informazione in cui viviamo non è difficile accedere a ogni sorta di
PER IL RECUPERO dati, ma solo disponendo di adeguate competenze in statistica è possibile riuscire a
«far parlare» i dati e a riconoscere eventuali improprie interpretazioni che altri ne
hanno potuto dare.
CARATTERE
Si chiama carattere la proprietà che è oggetto di studio in un’indagine statistica.
Per esempio, il peso o il colore degli occhi delle persone sono possibili caratteri di un’in-
dagine.
In corrispondenza di ogni individuo della popolazione, il carattere oggetto di studio
assume una determinata modalità; per esempio, il carattere «peso» può assumere, in
corrispondenza di un dato individuo, la modalità 72 kg, in corrispondenza di un altro
la modalità 80 kg, e cosı̀ via; il carattere «colore degli occhi» può assumere per un da-
to individuo la modalità «azzurri», per un altro la modalità «marroni» ecc.
MODALITÀ
Si chiama modalità ciascuna delle varianti con cui un carattere può presentarsi;
le modalità osservate si chiamano dati.
560
Unità 13 Statistica
ESEMPI
Le variabili (ovvero i caratteri quantitativi) si classificano ulteriormente a seconda del Modi di dire
tipo di valori che possono assumere. Talvolta si usa parlare
di valori di una variabile,
anziché di modalità
VARIABILI CONTINUE E DISCRETE di una variabile. Un altro
Una variabile si dice discreta quando può assumere soltanto un numero finito sinonimo di «modalità»,
di valori (o un insieme di valori che può essere posto in corrispondenza biunivo- nel caso di un carattere
quantitativo, è intensità.
ca con l’insieme dei numeri naturali); si dice continua quando può assumere (al-
meno teoricamente) tutti i valori reali di un determinato intervallo.
Tipicamente, le variabili discrete sono quelle che si rilevano contando (per esempio il
numero dei figli in una famiglia o il numero dei dipendenti di un’azienda), mentre le popolazione
variabili continue sono quelle che si rilevano mediante misurazioni (per esempio il pe- unità statistiche
so di un bambino a una certa età o la temperatura massima giornaliera registrata a Mi-
lano in un dato giorno).
ESEMPI RIASSUNTIVI
su di esse
viene
Fenomeno Il colore degli occhi Altezza L’anno di nascita rilevato il
studiato degli italiani (misurata in metri) degli iscritti carattere
degli studenti a una palestra che può essere
di una classe
Popolazione Tutti gli italiani Gli studenti Tutti gli iscritti quantitativo qualitativo
della classe alla palestra
discreto continuo
Carattere Il colore degli occhi La misura L’anno di nascita
dell’altezza
Un’indagine statistica si articola nelle seguenti fasi: pianificazione dell’indagine, rile- Approfondimento
vazione dei dati, elaborazione dei dati, presentazione dei risultati e interpretazione di Le fasi di un’indagine
questi ultimi (vedi l’approfondimento). Nel prosieguo ci occuperemo prevalentemen- statistica
te della fase dell’elaborazione dei dati.
Esercizi p. 580
561
Tema D Dati e previsioni
2. Distribuzioni di frequenze
In questo paragrafo vogliamo introdurre le più elementari tecniche di elaborazione
dei dati.
Tabella 13.1
Studente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Una prima forma di elaborazione dei dati, volta a ottenere una maggiore sintesi, con-
siste nel costruire una tabella in cui riportare, per ciascuna delle modalità osservate
(N, M, A, V), il numero di individui su cui è stata rilevata.
FREQUENZA ASSOLUTA
Si definisce frequenza assoluta (o semplicemente frequenza) di una modalità il
numero di volte in cui la modalità è stata osservata.
Associando a ogni modalità la sua frequenza, la tab. 13.1 si sintetizza nella seguente,
in cui i dati sono più organizzati e meglio leggibili.
Tabella 13.2
Colore degli occhi Numero di studenti
Nero 7
Marrone 5
Azzurro 2
Verde 4
Attenzione!
X Frequenza
Se il carattere X
è quantitativo, le modalità x1 f1
x1 , x2 , ..., xk vanno ordinate
in senso crescente x2 f2
o decrescente.
..... .....
Nell’ultima riga, per comodità,
xk fk si è soliti riportare la somma
delle frequenze, che è uguale
Totale n al numero di individui del collettivo.
562
Unità 13 Statistica
Tabella 13.3
Studente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Altezza 173 164 174 180 182 176 184 185 170 172 186 167 188 183 168 176 184 178
(in cm)
Rispetto al caso precedente, il carattere oggetto di studio (la statura degli studenti)
presenta ora molte più modalità, tutte con frequenza 1 o al massimo 2.
Se costruissimo subito la distribuzione delle frequenze non otterremmo una sintesi si-
gnificativa, perché otterremo una tabella che semplificherebbe di poco la tab. 13.3.
Per ovviare a questo inconveniente è utile accorpare preliminarmente le modalità in
intervalli tra loro disgiunti, detti classi, quindi costruire la distribuzione di frequenze
delle classi. Per esempio, possiamo suddividere le possibili altezze degli studenti (mi-
surate in centimetri) nei seguenti intervalli:
(160, 165] (165, 170] (170, 175] (175,180] (180, 185] (185,190]
A questo punto possiamo costruire una tabella in cui associamo a ogni classe la sua
frequenza, cioè il numero di modalità che vi appartengono. Otteniamo cosı̀ la distri-
buzione di frequenze rappresentata in tab. 13.4.
Tabella 13.4
Altezza degli studenti
Numero di studenti
(in cm)
(160, 165] 1
(165, 170] 3
(170, 175] 3
(175, 180] 4
Rifletti
(180, 185] 5
Le distribuzioni di
(185, 190] 2 frequenze per classi sono
molto utilizzate sia nel caso
di caratteri quantitativi
Data una classe definita da un intervallo di estremi a e b, con a < b, si definisce am- discreti che presentano
aþb numerose modalità distinte
piezza della classe il numero b ÿ a e valore centrale della classe il numero . Le tra loro, sia nel caso di
2
classi in cui vengono suddivisi i dati possono avere tutte la stessa ampiezza (come nel- caratteri quantitativi
continui.
l’esempio precedente) o ampiezza diversa tra loro.
a. Nel caso della tab. 13.4, tutte le classi hanno la stessa ampiezza, uguale a 5:
165 ÿ 160 ¼ 170 ÿ 165 ¼ ::: ¼ 190 ÿ 185 ¼ 5
Il valore centrale, per esempio della classe (160, 165], è:
160 þ 165
¼ 162,5
2
b. Ai fini di un’indagine statistica che ha come popolazione gli studenti, può essere
utile suddividere la popolazione nelle seguenti classi: da 6 a 10 anni (scuola pri-
maria); da 11 a 14 anni (scuola secondaria di primo grado); da 15 a 19 anni
(scuola secondaria di secondo grado); da 20 a 25 anni (università). In questo ca-
so abbiamo una suddivisione in classi aventi ampiezze differenti.
563
Tema D Dati e previsioni
FREQUENZA RELATIVA
Si definisce frequenza relativa di una modalità il rapporto fra la sua frequenza
assoluta e il numero complessivo di individui del collettivo.
564
Unità 13 Statistica
FREQUENZA CUMULATA
Consideriamo un carattere quantitativo; si chiama frequenza cumulata relativa
a una data modalità la somma delle frequenze di tutte le modalità minori o
uguali a essa.
Costruiamo, a fianco della colonna delle frequenze assolute, una nuova colonna
dove andremo a calcolare le frequenze cumulate.
In modo del tutto analogo a quanto visto per le frequenze assolute, si possono cumu-
lare le frequenze relative o percentuali e rappresentare le corrispondenti distribuzioni
di frequenza. In assenza di altre indicazioni, quando parleremo di frequenze cumulate
intenderemo riferirci alle frequenze assolute cumulate; in caso contrario specifichere-
Esercizi p. 581
mo frequenze relative cumulate (o frequenze percentuali cumulate).
3. Rappresentazioni grafiche
Principali rappresentazioni grafiche
Esiste una grande varietà di grafici utilizzati in statistica, ma i più importanti si posso-
no ricondurre alle quattro categorie di cui puoi vedere alcuni esempi nella seguente
tabella: diagrammi a barre, diagrammi circolari, diagrammi cartesiani e istogrammi.
565
Tema D Dati e previsioni
Voti in un compito in classe Colore degli occhi Andamento del prezzo Stipendi in un’azienda
in un insieme di persone di un prodotto per fasce d’età
Stipendi medi
Frequenza Prezzo
8% 3000
4 2600
8 7 2500 2200
12% 3
6 5 2000 1800
4 4 2 1500
3
2 80% 1 1000
2
0 0 500
2002
2004
2006
2008
2010
4 5 6 7 8 0
Voto [20,35) [35,50) [50,65)
marroni azzurri verdi Anni Fasce d’età
17 2,0
[20, 30) 17 10 ¼ 1,7
10
1,5
[30, 50) 24 20
24
20
¼ 1,2 ¢ 1,0
22 0,5
[50, 60) 22 10 ¼ 2,2
10
0
6 20 30 50 60 65
[60, 65) 6 5 ¼ 1,2 Classi di età
5
566
Unità 13 Statistica
>586 (2)
da 329,1 a 585,9 (3)
da 283,6 a 329 (4)
da 257,8 a 283,5 (2)
da 211,5 a 257,7 (5)
da 64,3 a 211,4 (4)
Figura 13.1 Rappresentazione, per regione, del numero di pensioni INPS per 1000 abitanti al
primo gennaio 2003. Si tratta di un esempio di cartogramma: sulla cartina sono visualizzati i
dati relativi alle varie regioni, variando l’intensità dei colori.
100% 84
75 77 78
55 50 44
0%
Europa dei 15
Belgio
Danimarca
Germania
Grecia
Spagna
Francia
Irlanda
Italia
Lussemburgo
Paesi Bassi
Austria
Portogallo
Finlandia
Svezia
Regno Unito
Figura 13.2 Rappresentazione delle percentuali di vetro riciclato nel 1999 in alcuni paesi
europei. Si tratta di un esempio di ideogramma, ossia un grafico costruito con figure che
illustrano il carattere studiato; l’area di ciascuna figura è proporzionale alla modalità o alla
frequenza che rappresenta.
La media aritmetica
La media aritmetica, che certamente conosci già, è il più noto fra i valori medi.
2. La somma delle differenze tra ciascuno degli n numeri x1 , x2 , ..., xn e la loro media
aritmetica x è uguale a zero:
ðx1 ÿ xÞ þ ðx2 ÿ xÞ þ ::: þ ðxn ÿ xÞ ¼ 0
3. Supponiamo che un insieme X di numeri venga suddiviso in due sottoinsiemi di-
sgiunti A e B, formati rispettivamente da n ed m elementi, tali che A [ B ¼ X. Se gli
elementi di A hanno media aritmetica a e gli elementi di B hanno media aritmetica
b, allora la media aritmetica x degli elementi di X è data dalla formula:
a n þ b m
x ¼
nþm
4. Sia k un numero reale. Se x è la media aritmetica dei numeri x1 , x2 , ..., xn , allora:
la media aritmetica dei numeri x1 þ k, x2 þ k, ...., xn þ k è x þ k;
la media aritmetica dei numeri kx1 , kx2 , ...., kxn è k x.
Tutte le proprietà sopra elencate seguono facilmente dalla definizione di media aritme-
tica e ti invitiamo a dimostrarle per esercizio. Ci limitiamo a illustrare alcune loro pos-
sibili applicazioni tramite i seguenti esempi.
568
Unità 13 Statistica
In una classe di 20 alunni, il voto medio dei 12 ragazzi all’ultimo compito in classe
di matematica è stato 6,5; il voto medio delle ragazze è stato invece 7. Qual è il vo-
to medio degli studenti della classe?
Dobbiamo calcolare la media dei voti della classe a partire dalle medie di due suoi
sottoinsiemi disgiunti, l’insieme dei ragazzi e l’insieme delle ragazze. Possiamo al-
lora applicare la proprietà 3 del teorema 13.1. In questo caso X è l’insieme degli
studenti della classe, A è l’insieme dei ragazzi e B è quello delle ragazze; inoltre
n ¼ 12, m ¼ 8, a ¼ 6,5 e b ¼ 7. Il voto medio degli studenti della classe è allora:
6,5 12 þ 7 8 134
x ¼ ¼ ¼ 6,7
20 20
Osserva che il risultato trovato è diverso dalla media aritmetica tra il voto medio
delle ragazze e il voto medio dei ragazzi, che è uguale a:
6,5 þ 7
¼ 6,75
2
Da un sito web americano vengono acquistati 8 libri. Si calcola che il prezzo medio
dei libri acquistati è 34,5 dollari. Quale sarà il prezzo medio in euro, se il tasso di
cambio tra dollaro ed euro, al momento dell’acquisto, era di 0,7345?
In base alla proprietà 4, per calcolare il prezzo medio in euro non è necessario tra-
sformare i prezzi dei singoli libri in euro (moltiplicando i prezzi in dollari per il tas-
so di cambio) e poi calcolare la media dei prezzi ottenuti: si può moltiplicare diret-
tamente il prezzo medio in dollari per il tasso di cambio. Poiché
34,5 0,7345 ¼ 25,34025, concludiamo che il prezzo medio dei libri acquistati è di
circa 25,34 euro.
La mediana
Introduciamo ora il secondo dei valori medi che abbiamo anticipato, la mediana. An-
che la mediana, come la media aritmetica, è applicabile solo a caratteri di tipo quanti-
tativo.
MEDIANA
Dati n numeri, ordinati in senso crescente o decrescente, si definisce loro me-
diana:
il numero che occupa la posizione centrale, se n è dispari;
la media aritmetica dei due numeri che occupano le posizioni centrali, se n è
pari.
b. Anche in questo caso i numeri sono già ordinati in senso crescente, ma il loro
numero è pari; per determinare la mediana dobbiamo anzitutto mettere in evi-
569
Tema D Dati e previsioni
denza i due numeri che occupano le posizioni centrali, quindi calcolare la loro
media aritmetica.
I numeri che occupano le posizioni centrali sono quelli colorati in rosso:
3, 3, 4, 6, 7, 10
4þ6
Pertanto, la mediana è ¼ 5.
2
c. I numeri non sono ordinati in senso crescente, quindi come prima cosa dobbia-
mo ordinarli:
1, 2, 3, 6, 8, 9, 11, 13
I due numeri che occupano le posizioni centrali sono quelli colorati in rosso:
1, 2, 3, 6, 8, 9, 11, 13
n dispari n pari
mediana mediana
x1 x2 … x n +1 … xn–1 xn x1 x2 … xn xn … xn–1 xn
2 +1
2 2
n+1 termini (più della metà) n+1 termini (più della metà) n n
2 2 termini (la metà) termini (la metà)
2 2
hanno valori minori hanno valori maggiori hanno valori minori hanno valori maggiori
o uguali alla mediana o uguali alla mediana della mediana (o, al più, della mediana (o, al più,
uguali ad essa nel caso uguali ad essa nel caso
in cui risulti x n = x n ) in cui risulti x n = x n )
+1 +1
2 2 2 2
Come puoi notare dalle figg. 13.3 e 13.4, sia nel caso che n sia pari, sia nel caso che n
sia dispari, risulta che almeno la metà dei numeri x1 , x2 , ..., xn sono minori o uguali
alla mediana e almeno la metà sono maggiori o uguali a essa. È proprio questa l’infor-
mazione che la mediana ci dà a proposito del fenomeno oggetto dell’indagine statisti-
ca: almeno il 50% della popolazione presenta modalità minori o uguali alla mediana e al-
meno il 50% della popolazione presenta modalità maggiori o uguali alla mediana.
La moda
Abbiamo visto che la media aritmetica e la mediana sono due indici che si applicano
limitatamente a caratteri quantitativi. L’ultimo valore medio che introduciamo, la mo-
da, si può applicare invece anche nel caso di caratteri qualitativi.
MODA
In un’indagine statistica, si chiama moda la modalità che si presenta con la mas-
sima frequenza (assoluta, relativa o percentuale).
570
Unità 13 Statistica
a. Supponiamo che i dati grezzi ottenuti in seguito a una rilevazione statistica sia-
no i seguenti numeri: 2, 3, 4, 5, 5, 6, 6, 6. Poiché la modalità che si presenta con
maggiore frequenza è 6, questa è la moda dei dati raccolti.
b. Supponiamo che i dati grezzi ottenuti in seguito a una rilevazione statistica siano
i seguenti numeri: 2, 2, 3, 3, 4, 5. Ci sono due modalità (2 e 3) che presentano la
massima frequenza, dunque i dati raccolti presentano due mode: 2 e 3.
20 þ 20 þ 30 þ 30 þ 30
età media ¼
2þ3
Il numero 20 va scritto 2 volte, cioè tante quante la sua frequenza, e analogamente il
numero 30 va scritto 3 volte, anch’esso tante volte quante la sua frequenza. Avrem-
mo allora potuto scrivere:
Negli addendi al numeratore ciascuna età
osservata è moltiplicata per la sua frequenza
20 2 þ 30 3
età media ¼
2þ3 Al denominatore compare la somma delle frequenze
Generalizzando queste osservazioni, possiamo dire che, nel caso in cui sono rilevate Attenzione!
x1 , x2 ,..., xk differenti modalità di un carattere, con frequenze rispettivamente uguali
1. La formula per il calcolo
a f1 , f2 ,..., fk , per il calcolo della media si può utilizzare la formula: della media qui a fianco è
detta anche media
x1 f1 þ x2 f2 þ ::: þ xk fk ponderata di x1 , x2 ,..., xk
x¼ con pesi:
f1 þ f2 þ ::: þ fk
f1 , f2 ,..., fk
Per quanto riguarda invece il calcolo della mediana e della moda nel caso di una distri- 2. Nel caso siano note le
frequenze relative, fr1 ,..., frk ,
buzione di frequenze, si può osservare che il calcolo della moda è ovvio (basta sceglie-
invece delle frequenze
re la modalità cui corrisponde la frequenza maggiore), mentre per il calcolo della me- assolute, la formula della
diana conviene ricorrere al calcolo delle frequenze cumulate, come spiegato nel prossi- media aritmetica ponderata
mo esempio. diviene semplicemente:
x ¼ x1 fr1 þ ::::: þ xk frk
ESEMPIO Valori medi nel caso di una distribuzione di frequenze
0 9
1 27
2 40
3 20
4 3
5 1
571
Tema D Dati e previsioni
0 9 þ 1 27 þ 2 40 þ 3 20 þ 4 3 þ 5 1 184
x¼ ¼ ¼ 1,84
9 þ 27 þ 40 þ 20 þ 3 þ 1 100
0 9 9
1 27 36
2 40 76
3 20 96
4 3 99
5 1 100
a. come valore approssimato della media della distribuzione, il valore che si ottiene
sostituendo ciascuna classe con il suo valore centrale (cioè con la semisomma degli
estremi della classe) e calcolando la media delle distribuzione di frequenze cosı̀ ot-
tenuta;
b. come valore approssimato della mediana, il valore centrale della classe che contie-
ne il valore esatto della mediana;
40 p < 50 16
50 p < 60 48
60 p < 70 45
70 p < 80 8
80 p < 90 3
a. Sostituendo ogni classe con il suo valore centrale, otteniamo la seguente distri-
buzione di frequenze:
40 þ 50 55 48
¼ 45
2
65 45
75 8
Attenzione!
85 3 Il metodo di calcolo
approssimato della
A questo punto il peso medio p può essere ricavato con una media aritmetica pon- mediana per un carattere
derata: suddiviso in classi esposto
qui a fianco si basa
45 16 þ 55 48 þ 65 45 þ 75 8 þ 85 3 119 implicitamente sull’assun-
p¼ ¼ ’ 59,5 kg
16 þ 48 þ 45 þ 8 þ 3 2 zione che tutti i valori
osservati (ignoti) che
b. Per individuare la classe che contiene la mediana della distribuzione, è utile cal- cadono all’interno della
classe mediana siano uguali
colare le frequenze cumulate:
al valore centrale della
classe.
Peso (in kg) Frequenza Frequenza cumulata Questa ipotesi non è
tuttavia l’unica possibile.
40 p < 50 16 16 Per esempio, un’altra
ipotesi è quella della
50 p < 60 48 64 distribuzione uniforme: in
mancanza di informazioni
60 p < 70 45 109 su dove cadono i valori
osservati all’interno di una
70 p < 80 8 117 classe, si suppone che essi
siano distribuiti in modo
80 p < 90 3 120 uniforme ed equidistante
lungo tutto l’intervallo.
Il collettivo è composto complessivamente da 120 individui (pari); la mediana è da- Noi abbiamo scelto l’ipotesi
del valore centrale (che
ta perciò dalla media fra il sessantesimo e il sessantunesimo peso osservato. Dalla peraltro è quella adottata
colonna delle frequenze cumulate si deduce che i pesi osservati dal numero 17 al dalla maggior parte dei
numero 64 appartengono alla classe 50 p < 60. Pertanto anche la mediana ap- software statistici) per la
sua semplicità, ma è bene
partiene a tale classe. Come approssimazione della mediana prendiamo il valore sapere che, adottando
50 þ 60 ipotesi diverse, si può
centrale di tale classe: ¼ 55. Il peso mediano è quindi 55 kg.
2 giungere a valori della
c. Dal momento che le classi hanno la stessa ampiezza (uguale a 10), la classe mo- mediana leggermente
differenti.
dale è quella che ha maggiore frequenza, ossia 50 p < 60.
573
Tema D Dati e previsioni
COLLEGHIAMO I CONCETTI
Quale valore medio è più opportuno?
u Abbiamo introdotto tre valori medi: la media aritmetica, la mediana e la moda. In ge-
nerale è buona pratica calcolare tutti e tre questi valori: infatti essi forniscono in-
formazioni complementari, che descrivono aspetti differenti. Per esempio, in riferi-
mento alla retribuzione annua netta dei dipendenti di una data azienda:
3 sapere che la media dei salari è 22 500 euro significa che, se il denaro complessi-
vamente speso per gli stipendi venisse distribuito in modo che il salario sia
uguale per tutti, allora ciascuno riceverebbe 22 500 euro all’anno;
Approfondimento
3 sapere che la mediana dei salari è 20 500 euro, significa che circa la metà dei di-
La media armonica pendenti percepisce uno stipendio superiore (o uguale) a 20 500 euro, e circa la
e la media geometrica metà uno stipendio inferiore (o uguale) a 20 500 euro;
3 sapere che la moda dei salari è 18 000 euro, significa questo è il salario più fre-
quente, ovvero più comune.
u Sebbene la media aritmetica sia certamente il valore medio più noto e utilizzato, a
seconda del particolare fenomeno in esame la mediana o la moda possono talvolta
rivelarsi valori medi più idonei. Per esempio, se calcoliamo la media aritmetica dei
numeri:
3, 4, 4, 6, 7, 8, 9, 100
troviamo come risultato x ’ 17,6 e possiamo notare che ben sette degli otto nume-
ri sono più piccoli della media aritmetica. In questo caso la media aritmetica è poco
rappresentativa dei dati, perché è eccessivamente influenzata dal valore anomalo
100; è più rappresentativa dei dati la mediana, che vale 6,5. Una situazione analoga
si verifica, per esempio, nelle rilevazioni dei redditi o dei consumi, in cui i dati pos-
sono presentare valori «anomali» molto grandi o molto piccoli: in tali casi la me-
Matematica in laboratorio
diana tende di solito a fornire un valore più rappresentativo della media aritmetica
Calcolo di valori di sintesi (troppo sensibile ai valori «anomali»).
Algoritmi Se invece consideriamo, per esempio, il caso di un negoziante che deve scegliere la
taglia di pantaloni di cui ordinare il maggiore numero di capi, allora è chiaro che il
valore di sintesi più rappresentativo risulta la moda: il negoziante sceglierà la taglia
Esercizi p. 588 più comune, ovvero quella acquistata più di frequente.
5. La variabilità
Introduzione
Nel paragrafo precedente abbiamo visto come sia possibile sintetizzare un’indagine
statistica tramite alcuni valori medi è facile convincersi che non sempre tali indici so-
no sufficienti a dare, da soli, una corretta visione d’insieme di un fenomeno.
Consideriamo, a questo proposito, un semplice esempio. In un gruppo, A, di dieci in-
dividui le retribuzioni nette annue pro capite sono (in euro):
2000; 2000; 2000; 3000; 4000; 4000; 5000; 5000; 5000; 168 000
In un gruppo B, sempre di dieci individui, le retribuzioni sono invece:
18 000; 18 000; 19 000; 19 000; 20 000; 20 000; 21 000; 21 000; 22 000; 22 000
La media aritmetica nei due gruppi è la stessa: 20 000 euro, ma le situazioni sono com-
pletamente diverse! Il gruppo B presenta una situazione piuttosto omogenea, mentre
nel gruppo A ci sono molti «poveri» e un solo «ricco». L’aspetto che la media aritmeti-
ca non riesce a cogliere è la cosiddetta variabilità, che si può definire come segue.
VARIABILITÀ
Chiamiamo variabilità l’attitudine di un fenomeno a manifestarsi sulle varie
unità statistiche con modalità diverse e distanti tra loro.
574
Unità 13 Statistica
A questo punto, per ottenere un unico numero che esprima una misura della variabi-
lità dei dati osservati, si potrebbe essere tentati di calcolare la media aritmetica degli
scarti. Ma cosı̀ facendo, in base alla proprietà 2 del teorema 13.1, si otterrebbe sempre
0! Il motivo di ciò sta nel fatto che gli scarti negativi si compensano esattamente con
quelli positivi. Occorre dunque introdurre qualche modifica per eliminare l’influenza
del segno degli scarti. Una possibilità consiste nel rimpiazzare gli scarti con i loro valori
assoluti; un’altra nel considerare i quadrati degli scarti. Poiché i quadrati sono più sem-
plici da trattare dal punto di vista matematico, si preferisce ricorrere alla seconda pos-
sibilità. In definitiva, si assume come misura della variabilità dei dati la media aritme-
tica dei quadrati degli scarti, cui si dà un nome particolare.
VARIANZA
Dati n numeri x1 , x2 , ..., xn , di media aritmetica x, si chiama loro varianza, e si
indica con il simbolo 2 , la media aritmetica dei quadrati degli scarti da x:
Quando non si utilizza il computer, per trovare la varianza bisogna accollarsi una
quantità di calcoli di solito non brevi. Per questo motivo si ricorre spesso alla seguen-
te formula abbreviata, che si può dimostrare essere equivalente alla precedente.
Se è data una distribuzione di frequenze, nel calcolo della varianza occorre tenerne
conto, calcolando la media aritmetica ponderata dei quadrati degli scarti, con pesi
uguali alle rispettive frequenze.
575
Tema D Dati e previsioni
Le formule [13.1] e [13.2] diventano perciò le seguenti, dove abbiamo indicato con
f1 , ..., fk rispettivamente le frequenze delle modalità x1 , ..., xk :
Osserva che sia la varianza, sia la deviazione standard possiedono tutte le caratteristi-
che che ragionevolmente deve soddisfare un indice di variabilità:
assumono valore minimo, uguale a 0, se tutti i dati osservati sono uguali;
assumono valori positivi, via via crescenti all’aumentare della variabilità, in caso
contrario.
Nella classe 1A di una scuola tutti i 20 studenti hanno meritato 6 nel compito in
classe; nella classe 1B, anch’essa di 20 studenti, la metà degli studenti ha meritato
4 e l’altra metà ha meritato 8. Calcoliamo la varianza e la deviazione standard dei
voti nelle due classi.
Nella classe 1A gli studenti hanno preso tutti lo stesso voto: non c’è quindi va-
riabilità. Pertanto sia la varianza, sia la deviazione standard sono uguali a 0.
Rappresentiamo la distribuzione di frequenze dei voti nella classe 1B (vedi la ta-
Voti Frequenza bella a fianco). Per il calcolo della varianza utilizziamo la formula «abbreviata»,
ossia la [13.4]. A tal fine dobbiamo anzitutto calcolare la media dei voti della
4 10
classe:
8 10
4 10 þ 8 10 120
x¼ ¼ ¼6
20 20
Ora possiamo applicare la formula [13.4]; otteniamo che la varianza è:
42 10 þ 82 10
2 ¼ ÿ 62 ¼ 4
20
pffiffiffi
La deviazione standard è perciò ¼ 4 ¼ 2.
576
Unità 13 Statistica
ESEMPI
a. La varianza e la deviazione standard dei numeri 105, 101, 102, 103 sono rispetti-
vamente uguali alla varianza e alla deviazione standard dei numeri 5, 1, 2, 3 (es-
sendo questi ultimi ottenuti sottraendo 100 da ciascuno dei precedenti).
b. Sapendo che la varianza e la deviazione standard dei due numeri 4 e 8 valgono
2 ¼ 4 e ¼ 2, possiamo immediatamente concludere che la varianza e la devia-
zione standard dei numeri 12 e 24 (ottenuti moltiplicando per 3 i numeri origi-
nari) sono:
ð0 Þ2 ¼ 32 4 ¼ 36 0 ¼ 3 2 ¼ 6
COEFFICIENTE DI VARIAZIONE
Si chiama coefficiente di variazione CV di un insieme di dati la cui media arit-
metica è x e la cui deviazione standard è , il rapporto tra la deviazione standard
e la media aritmetica stessa:
CV ¼
x
Tutte le volte che saremo interessati a confrontare la variabilità di due fenomeni, in ba-
se a quanto detto sopra, non sarà opportuno confrontare le loro deviazioni standard,
bensı̀ i loro coefficienti di variazione. Esercizi p. 594
577
Tema D Dati e previsioni
I metodi e i concetti su cui si fonda il moderno ragionamento statistico sono recenti e ap-
paiono solo nel secolo scorso; alcuni dei contributi più importanti sono dovuti a Karl
Pearson (1857-1936), Ronald A. Fisher (1890-1962) e agli italiani Corrado Gini (1884-
1965), Oscar Chisini (1889-1967) e Bruno de Finetti (1906-1985).
Il fondatore del moderno approccio statistico ai sondaggi d’opinione è considerato l’ameri-
cano George Horace Gallup (1901-1984). Gallup divenne celebre quando riuscı̀ a preve-
dere, nel 1936, le elezioni del presidente Roosevelt (dato come sconfitto da potenti socie-
tà d’indagine che operavano già nel settore) sulla base di una previsione effettuata su un
campione di 50000 elettori, un numero considerato esiguo rispetto alle conoscenze stati-
stiche del tempo.
L’avvento dei calcolatori e la loro crescente potenza di calcolo stanno attualmente rivolu-
zionando il modo di fare statistica, consentendo di effettuare quantità di calcoli inimma-
ginabili fino a qualche decina di anni fa ed espandendo ulteriormente, cosı̀, i possibili
campi di applicazione di questa disciplina.
In libreria e in rete
Kramer Walter, Le bugie della statistica, Mimesis
578
Sintesi Statistica
Parole chiave
Coefficiente di variazione
È il rapporto tra la deviazione standard e la media aritmetica x di un insieme di dati:
6
CV ¼
x
579
Unità Esercizi
Tema D
13
1. Introduzione alla statistica Teoria p. 560
3 Quale dei seguenti caratteri, possibili oggetto di un’analisi statistica, non è quantitativo?
A Il numero dei figli C Il livello di glicemia nel sangue
B Il peso D Il sesso
6 Si osservano tutte le automobili che transitano dal 10 Indica alcune delle modalità che possono assumere
casello autostradale di Firenze Sud in un dato periodo di i seguenti caratteri:
tempo e si registra la marca dell’automobile. Individua il a. voto finale all’esame di Stato;
collettivo, le unità statistiche, il carattere e alcune possibi- b. colore dei capelli;
li modalità di questa indagine statistica. c. genere di un romanzo;
d. numero di giorni di malattia di un lavoratore in un
7 Nello stabilimento Fiat di Mirafiori si rilevano gli mese.
stipendi mensili dei dipendenti. Individua il collettivo, le Stabilisci inoltre quali caratteri sono quantitativi e quali
unità statistiche, il carattere e alcune possibili modalità di sono qualitativi.
questa indagine statistica.
11 Stabilisci quali fra i seguenti caratteri quantitativi
8 Si rilevano i generi dei libri presenti in una bibliote- sono continui e quali discreti:
ca. Individua il collettivo, le unità statistiche, il carattere a. peso delle foglie dello stesso tipo in un giardino in
e alcune possibili modalità di questa indagine statistica. un pomeriggio;
b. numero di automobili per famiglia;
9 Si rilevano le età dei dipendenti di un’azienda. Indi- c. famiglie per condominio;
vidua il collettivo, le unità statistiche, il carattere e alcune d. passeggeri per giorno all’aeroporto di Malpensa;
possibili modalità di questa indagine statistica. e. lunghezza di un capello.
580
Unità 13 Statistica
12 ESERCIZIO SVOLTO
Nel 2000, in Italia (dati ISTAT), sono morte 91 063 persone di età compresa fra i 75 e i 79 anni e 77 179 di età com-
presa fra gli 80 e gli 84 anni. Possiamo concludere che è più facile morire nella fascia di età inferiore rispetto a
quella successiva?
Ovviamente no: bisogna tener conto che la popolazione degli ottantenni è più esigua di quella dei settantacinquenni.
Infatti, facendo il rapporto fra i decessi e la popolazione dell’età in esame, si trova che i decessi fra i 75 e i 79 anni colpi-
scono il 2,39% delle persone di quella fascia di età, mentre i decessi fra gli 80 e gli 84 anni riguardano il 4,05% delle per-
ESERCIZI
sone di quella fascia.
Nota L’analisi dei dati statistici è spesso oggetto di interpretazioni errate. La causa più frequente di errore nasce (come nell’esempio appena
svolto) nel non considerare che in molti casi un confronto corretto deve essere fatto fra rapporti (in definitiva fra percentuali) e non fra numeri
assoluti.
13 Delle persone di età fra i 70 e i 74, decedute nel 2000, 41 970 erano coniugate e 6911 erano non sposate. Si può con-
cludere che le persone in coppia muoiono più facilmente dei single? Quali dati mancano per rispondere alla domanda?
14 ESERCIZIO SVOLTO
Nel 2003, in Italia, si sono celebrati 258 580 matrimoni. Nello stesso anno, fra separazioni e divorzi, si sono regi-
125 600
strati 125 600 casi. Osservando che ’ 48,57%, l’affrettato titolo di un articolo di commento a questi dati,
258 580
sulla prima pagina di un quotidiano del 25 luglio 2005, era: «Una crisi ogni due matrimoni». Questa conclusione
ti sembra condivisibile?
Anche nel fare i rapporti ci vuole attenzione; se si riflette correttamente il rapporto non rappresenta niente di significativo:
i divorzi e le separazioni concessi in un certo anno si riferiscono a matrimoni celebrati in anni precedenti, anche lontani;
solo in qualche raro caso ci si separa nello stesso anno del matrimonio (per fortuna!). Quindi quel 48,57% non ha alcun
significato statistico e la conclusione riportata nel titolo dell’articolo non è deducibile dai dati in esame.
15 Le famiglie di operai spendono circa il 25% del proprio reddito per l’alimentazione; per le famiglie di professionisti
le spese alimentari costituiscono il 20% del reddito; da ciò segue che nelle famiglie di operai si mangia di più che in quel-
le dei professionisti? [Chi guadagna di più, in genere, fra un operaio e un professionista?]
16 Qualcuno sostiene che l’aereo è un mezzo di trasporto più sicuro dell’automobile perché in un anno le vittime per
incidenti stradali sono molte di più delle vittime per incidenti aerei. Cosı̀ presentato, il ragionamento è corretto? Quali
altri dati servono per poter fare un ragionamento statisticamente motivato?
[Per fare un ragionamento corretto bisogna calcolare il rapporto, a parità di km percorsi, fra ...]
Esercizi preliminari
17 Vero o falso?
A un concorso fotografico è stato assegnato un voto da 1 a 5 a ciascuna foto partecipante. La tabella che rappresenta la
distribuzione delle frequenze dei voti è la seguente.
Voto 1 2 3 4 5
Frequenza assoluta 6 2 8 3 1
Stabilisci quali affermazioni sono vere e quali sono false: c. la frequenza assoluta del voto 2 è maggiore
a. le foto complessivamente in concorso della frequenza assoluta del voto 4 V F
sono 20 V F d. la frequenza cumulata del voto 4 è 11 V F
b. la frequenza relativa del voto 3 è 0,4 V F e. la frequenza cumulata del voto 5 è 20 V F
[3 affermazioni vere e 2 false]
581
Tema D Dati e previsioni
18 Vero o falso?
a. la somma delle frequenze relative di tutte modalità osservate di un carattere è sempre uguale a 1 V F
b. la frequenza relativa di una modalità è direttamente proporzionale alla sua frequenza assoluta V F
c. se la frequenza assoluta di una modalità è 40 e il collettivo è costituito da 200 unità, allora la frequenza
percentuale di quella modalità è 25% V F
d. la frequenza cumulata di una modalità è sempre minore o uguale della sua frequenza assoluta V F
e. frequenze relative e frequenze percentuali forniscono informazioni equivalenti V F
f. la somma delle frequenze assolute di tutte le modalità osservate di un carattere può essere diversa
dal numero complessivo di unità della popolazione V F
[3 affermazioni vere e 3 false]
ESERCIZI
Distribuzioni di frequenze
19 Completa la seguente tabella (arrotonda le frequenze relative a meno di un decimo).
Modalità 1 2 3 4 Totale
21 Videolezione Si sono rilevati gli stipendi mensili (in euro) degli impiegati di una piccola azienda e si sono ottenu-
ti i seguenti dati grezzi:
1200 1100 1000 1400 1200 1500 2000 1800 2200 3200 2000 1200 1000
Costruisci la tabella che rappresenta la distribuzione delle frequenze assolute, relative e percentuali degli stipendi rilevati.
22 Una gelateria ha rilevato le vendite giornaliere di cinque gusti di gelato alla frutta:
L ¼ limone F ¼ fragola M ¼ melone P ¼ pompelmo A ¼ amarena
I dati grezzi rilevati in una giornata sono riportati nella seguente tabella.
L P F F L A A P M M
F P M M M L L F P M
F A L F F A A A P F
A L L F L F F L M M
P L M P P F F L A L
Supposto che ogni cliente abbia ordinato esattamente un gusto alla frutta, determina la percentuale dei clienti:
b. che in quel giorno hanno acquistato gelato al limone;
c. che in quel giorno hanno acquistato gelato all’amarena;
d. che in quel giorno hanno acquistato gelato al limone o all’amarena. [b. 24%; c. 16%; d. 40%]
582
Unità 13 Statistica
23 Uno studente registra il tempo che impiega per svolgere quindici esercizi di matematica, simili a quelli che deve af-
frontare nel compito in classe il giorno successivo. I tempi di svolgimento degli esercizi, espressi in minuti, sono i se-
guenti:
4 5 6 12 10 8 3 4 7 14 18 15 19 13 8
ESERCIZI
(t indica il tempo, espresso in minuti, impiegato per risolvere un esercizio) e completa la seguente tabella, che rappresen-
ta la distribuzione delle frequenze assolute, relative e percentuali delle classi.
24 In una classe di 20 alunni sono state rilevate le altezze. Le altezze osservate (espresse in metri) sono riportate nella
seguente tabella.
1,68 1,72 1,76 1,80 1,85 1,65 1,87 1,77 1,74 1,78
1,70 1,78 1,82 1,72 1,81 1,73 1,84 1,72 1,76 1,85
Suddividi i dati in cinque classi di uguale ampiezza e determina la distribuzione delle frequenze assolute, relative e per-
centuali delle classi.
25 A un gruppo di 600 persone è stato chiesto qual è il colore preferito, tra 5 possibili, di un determinato modello di
autovettura. Si sono ottenuti i risultati nella seguente tabella.
Completa la tabella.
26 A un gruppo di consumatori è stato chiesto di indicare il tipo di prodotto preferito, tra quattro possibili, che indi-
chiamo con A, B, C, D. Si sono ottenuti i risultati riportati, in parte, nella seguente tabella.
Completa la tabella.
A .... 20%
B 48 ....
C .... 8%
D .... 40%
583
Tema D Dati e previsioni
Taglia 44 46 48 50 52 54 56
Frequenza 2 7 6 12 10 2 1
Completa la tabella con tre righe, in cui riporterai le frequenze relative, le frequenze percentuali e le frequenze percentua-
li cumulate, quindi rispondi alle seguenti domande.
ESERCIZI
«Lettura» di grafici
29 Considera il seguente grafico, che rappresenta il numero di abbonati a una rete di telefonia mobile nel 2002.
106
100 94
90 87 89
83 85 82 83 83
79 79
80 76 74
72
70 65 64
60
49
50
40
30
20
10
0
an lgio
Ge arca
ia
Sp ia
Fr a
Irl ia
da
em lia
es o
Au si
r t ia
Fi allo
a
at o
ap i
ne
Gi nit
n
di
gn ezi
Pa urg
St nit
as
an
ec
Po str
ss Ita
po
ag
an
an
an
iU
Be
iB
og
Re Sv
Gr
U
im
rm
nl
o
D
Lu
a. In quale paese, all’epoca, il numero di abbonati era minimo? In quale era massimo?
b. Come si collocava l’Italia rispetto agli altri paesi?
c. Considerando i dati del grafico e stimando il numero dei residenti in Italia, all’epoca, in 58 000 000, quanti erano
gli abbonamenti alle reti mobili in Italia nel 2002? [c. 54 520 000]
584
Unità 13 Statistica
30 Considera il seguente grafico, che rappresenta la spesa relativa alla Ricerca e Sviluppo per ciascun settore, intesa co-
me percentuale del PIL, nel 2001.
%
3,5
Settore economico
3,0
Settore governativo
Settore dell’istruzione superiore
2,5
ESERCIZI
2,0
1,5
1,0
0,5
0
15
Au i
an io
na
Ge ca
ia
ito
ia
em ia
cia
ia
da
Po tria
a
Pa rgo
llo
s
di
as
ez
ec
l
an
lg
ar
Ita
ag
ga
an
Un
an
i
an
bu
s
de
iB
Be
Sv
Gr
im
rm
Sp
rto
Irl
Fr
nl
es
o
pa
Fi
gn
ss
ro
Re
Lu
Eu
a. Qual era il paese che aveva investito maggiormente nel settore economico? E nel settore governativo? Quali erano i
paesi che avevano investito di più nel settore scolastico?
b. Complessivamente, nel 2001 ha investito di più in Ricerca e Sviluppo la Finlandia o la Svezia?
c. Sapendo che il PIL della Svezia nel 2001 è stato di 244,9 miliardi di euro, determina quanto ha investito complessi-
vamente la Svezia nel 2001 per Ricerca e Sviluppo. [Circa 10,286 miliardi di euro]
31 Considera il seguente grafico che rappresenta l’uso di cinque sistemi di trasporto di passeggeri nell’UE nel 1980 e
nel 2000, in percentuale rispetto al trasporto totale di passeggeri (quest’ultimo misurato in passeggeri al km).
2,5
Trasporto 1980
aereo 2000 5,8
1980 8,2
Ferrovia
2000 6,3
1980
Vettura 76,4
privata
2000
78,3
a. Quale mezzo di trasporto ha subito il maggior incremento di utilizzo dal 1980 al 2000?
b. Quale mezzo di trasporto ha subito il maggior decremento di utilizzo dal 1980 al 2000?
585
Tema D Dati e previsioni
32 Il seguente diagramma a torta rappresenta la suddivisione per età dei 240 allievi di una scuola.
a. Quanti allievi hanno 17 anni?
b. Qual è la frequenza relativa degli allievi che hanno 16 anni?
c. Quanti allievi hanno meno di 16 anni? 15%
20%
d. Quanti allievi hanno più di 15 anni?
14 anni
15 anni
25% 16 anni
17 anni
40%
ESERCIZI
33 Il diagramma cartesiano in fig. a mostra il numero totale di clienti di una filiale di un gruppo bancario che si dichia-
rano soddisfatti dei servizi offerti negli anni 2009-2012; il diagramma in fig. b mostra invece la percentuale di clienti del-
la filiale che si dichiarano soddisfatti.
338 80%
300 75%
250 70%
65%
200
175 60%
150
120 55%
100
50%
50 45%
0 40%
2009 2010 2011 2012 2009 2010 2011 2012
Anni Anni
Figura a Figura b
a. Puoi osservare che tra il 2009 e il 2010, cosı̀ come tra il 2011 e il 2012, sebbene il numero di clienti soddisfatti sia
cresciuto, la corrispondente percentuale è diminuita. Spiega perché ciò non costituisce una contraddizione.
b. Determina il numero complessivo di clienti della filiale in ciascuno degli anni dal 2009 al 2012.
[b. 200, 350, 400, 520]
a. Quanti sono gli impiegati dell’ufficio aventi età maggiore o uguale a 30 anni ma minore di 50 anni?
b. Quanti sono gli impiegati dell’ufficio che hanno 50 anni o più di 50 anni?
c. Quanti sono complessivamente gli impiegati dell’ufficio?
(Suggerimento: ricorda che in un istogramma con classi di ampiezza diversa l’area di ciascun rettangolo è uguale alla fre-
quenza della classe) [a. 24; b. 28; c. 62]
586
Unità 13 Statistica
ESERCIZI
37 La tabella seguente indica il numero di leggi emanate in Italia negli anni indicati.
Anno 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002
Numero di leggi 596 743 582 691 509 511 541 444 483 311
38 Nella seguente tabella è rappresentata la distribuzione di frequenze degli stipendi (in euro), suddivisi in classi, rile-
vati su un campione di 100 persone.
39 Si è rilevato il numero di automobili possedute da un campione di 20 famiglie italiane e si sono ottenuti i dati grezzi
riportati nella seguente tabella.
Famiglia 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Numero 0 1 2 0 1 1 2 2 4 2 0 3 1 2 0 2 3 2 2 1
di automobili
possedute
a. Costruisci la distribuzione delle frequenze assolute e relative del numero di automobili possedute dalle famiglie.
b. Rappresenta la distribuzione delle frequenze assolute tramite il diagramma che ritieni opportuno.
40 Nella seconda riga della seguente tabella sono riportate le valutazioni di un titolo azionario il primo giorno dell’an-
no, per cinque anni consecutivi.
Valore titolo 10,50 euro 11,50 euro 13 euro 12 euro 10,50 euro
a. Completa la seguente tabella, determinando le variazioni assolute del prezzo del titolo e quelle percentuali (queste
ultime arrotondate con una cifra dopo la virgola).
b. Rappresenta l’andamento del valore del titolo negli anni in esame (2008-2012) e le corrispondenti variazioni per-
centuali rispetto all’anno precedente (a partire dal 2009) tramite opportuni diagrammi cartesiani.
587
Tema D Dati e previsioni
41 Nella tabella sottostante sono riportate le aree delle superfici degli oceani. Rappresenta questi dati con il grafico che
ritieni più opportuno.
42 Secondo i dati forniti dall’Associazione Italiana Editori, in Italia si pubblicano circa 53 000 titoli all’anno. In Svezia,
ESERCIZI
43 Su un certo grafico a torta non sono state riportate le percentuali corrispondenti a ogni parte. Il grafico è costituito
complessivamente da 4 «fette» che, se disposte in ordine crescente, sono tali che ognuna di esse, a partire dalla seconda, ha
ampiezza doppia rispetto alla precedente. Qual è l’ampiezza in gradi di ciascuna «fetta» del grafico? [24 , 48 , 96 , 192 ]
Esercizi preliminari
44 Vero o falso?
a. la media aritmetica può essere calcolata qualsiasi sia il tipo di carattere V F
b. la modalità che ha frequenza maggiore si chiama moda e può non essere unica V F
c. la media aritmetica di un insieme di numeri è sempre un numero positivo o nullo V F
d. per distribuzioni suddivise in classi non è possibile individuare il valore esatto della media, ma è possibile
determinarne un valore approssimato V F
e. la classe mediana è la classe che ha frequenza relativa più elevata V F
f. media, moda e mediana non possono mai assumere lo stesso valore V F
[Solo 2 affermazioni sono vere]
45 Vero o falso?
a. media e mediana di una sequenza di numeri possono coincidere V F
b. se x1 , x2 , ..., xn sono numeri tutti distinti, allora non hanno mediana V F
c. una distribuzione può avere al massimo due mode V F
d. se m è la media aritmetica di a e b, allora ða þ bÞ2 ¼ 4m2 V F
e. la media aritmetica di due numeri pari è un numero pari V F
f. la media aritmetica di due numeri dispari è un numero dispari V F
g. se x1 , x2 , ..., xn , sono n numeri pari la loro media aritmetica è un numero pari V F
h. la mediana di una sequenza di numeri pari può essere un numero dispari V F
i. se x1 , x2 , x3 , x4 , x5 , sono cinque numeri pari la loro mediana è un numero pari V F
[Solo 3 affermazioni sono vere]
La media
46 ESERCIZIO SVOLTO
588
Unità 13 Statistica
ESERCIZI
3
56 Calcolo rapido. Considera i seguenti numeri:
4
52 2 10ÿ4 , 4 10ÿ4 , ÿ20 10ÿ5 10ÿ4
3 18, 45, 81, 54, 90
53 Determina la media aritmetica dei tre numeri a, 2a,
5a, dove a è un numero reale qualsiasi.
a. Dividi ciascuno di essi per 9 e calcola la media dei
8
a nuovi numeri ottenuti.
3
b. Ricordando le proprietà della media aritmetica, de-
54 Determina per quale valore di a la media aritmetica
duci dalla media calcolata al punto a la media dei nu-
1 1
dei tre numeri a, a, a è uguale a 22. [36] meri originari. [a. 6,4; b. 57,6]
2 3
La mediana
57 ESERCIZIO SVOLTO
1, 2, 4, 5, 6, 7
Poiché il numero dei termini è pari, la loro mediana è la media aritmetica dei due numeri evidenziati, che occupano le
posizioni centrali. La loro media è 4,5: essa è la mediana.
ÿ4, ÿ3, 2, 6, 7
Poiché il numero dei termini è dispari, c’è un solo valore centrale, 2, che è la loro mediana.
La moda
64 ESERCIZIO SVOLTO
Esaminando la frequenza dei singoli termini, si vede che 1 ha la massima frequenza, uguale a 2. Quindi 1 è la moda cer-
cata.
589
Tema D Dati e previsioni
66 10, 15, 14, 14, 12, 15, 16 [14 e 15] 68 2, 4, 3, 6, 7, 1 [Tutti i numeri dati]
3 2 1 2 2
69 Trova la moda dei numeri ÿa, a, a, a, a, a, dove a è un numero positivo. a
4 3 2 3 3
70 Si è rilevata, su un campione di bottiglie da 1 litro di acqua minerale, la quantità di acqua effettivamente contenuta
in esse. I risultati ottenuti sono riassunti nel seguente diagramma a torta. Calcola la quantità di acqua media contenuta
in una bottiglia. [0,99 litri]
5%
0,98 litri
30% 40% 0,99 litri
1 litro
1,01 litri
25%
71 Videolezione Un ristorante propone 10 diversi primi piatti, i cui prezzi presentano la seguente distribuzione di
frequenze.
Prezzo (euro) 10 12 16 18
Frequenza 4 3 2 1
72 In uno scaffale di una libreria ci sono 20 libri; i primi 10 hanno un numero medio di 300 pagine; i 4 successivi han-
no mediamente 360 pagine e la media delle pagine degli ultimi sei è 420. Qual è il numero medio di pagine dei 20 li-
bri? [348]
74 Nel 1997, in Italia, sono state rubate più di 280 000 automobili. Il dato peggiore è stato registrato a Foggia, con tre
auto rubate su 100 circolanti; il dato migliore a Bolzano, con 1 macchina rubata su 1000 circolanti. Sulla base unicamen-
te di questi dati, è possibile calcolare il numero medio di furti relativo alle due città nel loro complesso? [No: perché?]
75 Una famiglia spende per il riscaldamento in due anni consecutivi rispettivamente 1425 euro e 2730 euro. Se la spe-
sa per il combustibile è di 0,57 euro/m3 il primo anno e 0,65 euro/m3 il secondo anno, calcola il costo medio sostenuto
dalla famiglia nei due anni per un metro cubo di combustibile. Fornisci il risultato arrotondato ai centesimi.
[0,62 euro/m3 ]
76 Una famiglia spende per il riscaldamento in due anni consecutivi rispettivamente 1800 euro e 2400 euro. Il primo
anno la spesa per il combustibile è di 0,58 euro/m3 . Se il costo medio sostenuto dalla famiglia nei due anni per un metro
cubo di combustibile è di 0,62 euro, quanto costava il combustibile il secondo anno? Fornisci il risultato arrotondato ai
centesimi. [0,65 euro/m3 ]
590
Unità 13 Statistica
77 Viene effettuato un controllo sulla velocità delle auto in un tratto autostradale in cui, a causa di alcuni lavori in cor-
so, il limite consentito è di 110 km/h. Le frequenze delle velocità rilevate (raggruppate in classi) sono rappresentate nel
seguente istogramma.
250
204
200
Vetture (numero)
150
100 82
ESERCIZI
50
22
10 6
0
(70, 90] (90, 110] (110, 130] (130, 150] (150, 170]
Velocità (km/h)
a. Qual è la velocità media degli automobilisti che sono stati oggetti del controllo (arrotonda il risultato a meno di
una unità)?
b. Per uno sforamento del limite di velocità superiore ai 40 km/h è previsto il ritiro e la sospensione della patente.
Qual è la percentuale di automobilisti che incorre in questa sanzione (arrotonda il risultato a meno di un centesimo)?
[a. 106 km/h; b. 1,85%]
78 ESERCIZIO SVOLTO
La media dei voti di Barbara nei primi quattro compiti in classe di matematica è stata del 6,5. Il voto del quinto
compito in classe è stato 7,5. Qual è il voto medio dei cinque compiti in classe?
La somma dei voti presi da Barbara nei primi quattro compiti in classi è 6,5 4, quindi la somma dei voti presi nei primi
cinque compiti è uguale a 6,5 4 þ 7,5 e il voto medio dei cinque compiti è uguale a:
6,5 4 þ 7,5
¼ 6,7
5
6,5 þ 7,5
Nota Attenzione a non commettere l’errore di considerare come voto medio . Cosı̀ facendo si otterrebbe erroneamente come voto
2
medio il valore 7.
79 ESERCIZIO GUIDATO
Una comitiva di 24 persone ha età media di 20 anni. Tenendo conto anche dell’accompagnatore della comitiva,
l’età media diventa di 21 anni. Qual è l’età dell’accompagnatore?
Poiché l’età media delle 24 persone della comitiva è 20 anni, la somma delle loro età è 20 24.
Indica con x l’età dell’accompagnatore. La somma delle età dei membri della comitiva e dell’accompagnatore è allora
20 24 þ x
20 24 þ x, quindi la media delle età, comprendendo anche l’accompagnatore, è . Ma quest’ultima media
:::::
deve essere uguale a 21, da cui l’equazione:
20 24 þ x
¼ 21
:::::
Risolvi questa equazione e concludi. [45 anni]
80 In una classe di 27 alunni, la media dei voti nell’ul- 81 La media di cento numeri è 5. La media di cinque
timo compito in classe di matematica è stata 6,5. La me- dei cento numeri considerati è 2; quale è la media degli
dia dei voti delle 12 ragazze è stata 7. altri novantacinque numeri?
98
a. Qual è la somma dei voti di tutti gli alunni? 19
b. Qual è la somma dei voti di tutte le ragazze? 82 In una classe formata da 16 ragazze e 9 ragazzi, l’al-
c. Qual è la media dei voti dei ragazzi? tezza media delle ragazze è 160 cm e l’altezza media dei
ragazzi è 170 cm. Qual è l’altezza media degli studenti
[a. 175,5; b. 84; c. 6,1] della classe? [163,6 cm]
591
Tema D Dati e previsioni
83 I dipendenti di un’azienda sono per il 40% donne e 85 In un’azienda ci sono 10 dirigenti con un’anzianità
per il 60% uomini. Il salario medio mensile delle donne è media di 18,5 anni e 50 impiegati con un’anzianità me-
di 1400 euro, quello medio degli uomini è di 1600 euro. dia di 6,5 anni. Qual è l’anzianità media di tutto il perso-
Qual è il salario medio mensile dei dipendenti dell’azien- nale dell’azienda? [8,5 anni]
da? [1520 euro] 86 Barbara, nei primi tre compiti in classe del quadri-
84 I tempi di percorrenza da parte di un ciclista in tre mestre, ha ottenuto la media del 6. Il suo professore ha
tappe ciclistiche sono stati: 6h 360 4000 , 4h 400 5000 , 5h programmato altri due compiti in classe.
100 5800 . Qual è il tempo medio di percorrenza sulle tre a. Barbara può ancora sperare di avere la media dell’8
tappe? nei voti dei compiti in classe del primo quadrimestre?
b. Se nel quarto compito in classe Barbara prende 7,
ESERCIZI
87 Sono stati effettuati tre diversi esperimenti consistenti nel lancio successivo di un dado per un certo numero di vol-
te (non uguale nei tre esperimenti) e nella registrazione del punteggio ottenuto. Le distribuzioni di frequenze dei punteg-
gi ottenuti nei tre esperimenti sono rappresentate nei seguenti tre diagrammi.
Frequenza
Frequenza
3 3 3
2 2 2
1 1 1
0 0 0
1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6
Punteggio Punteggio Punteggio
a. Calcola quante volte è stato lanciato il dado in ciascuno dei tre esperimenti.
b. Calcola media, mediana e moda di ciascuna delle tre distribuzioni di frequenze rappresentate.
c. Calcola il punteggio medio corrispondente ai lanci eseguiti complessivamente in tutti e tre gli esperimenti.
a. 12, 10, 10; b. 1 esperimento: media ¼ mediana ¼ 3,5, moda ¼ 3 e 4; 2 esperimento: media ¼ 4,2,
121
mediana ¼ moda ¼ 4; 3 esperimento: media ¼ 3,7, mediana ¼ 3,5, moda ¼ 5; c. ’ 3,8
32
88 Tutti gli studenti delle classi quinte di una scuola superiore hanno svolto un test di matematica costituito da 5 que-
siti. Il diagramma a barre e il diagramma circolare seguenti rappresentano rispettivamente la distribuzione delle frequen-
ze assolute e la distribuzione delle frequenze percentuali del numero di quesiti cui gli studenti hanno risposto corretta-
mente. Entrambi i diagrammi sono però incompleti.
60 5 1
54 5% 5%
48 2 Numero di quesiti
42 risolti correttamente
Frequenza
36 4 15% 1
30 ?
24 2
18 3
12
6 4
? ? ? 45%
0 5
1 2 3 4 5
Numero di quesiti risolti correttamente 3
592
Unità 13 Statistica
a. Rappresenta tramite una tabella la distribuzione delle frequenze dei voti del compito.
b. Determina la media, la mediana e la moda della distribuzione.
c. Nel giorno dello svolgimento del compito in classe c’era un assente, che ha recuperato il compito in classe la setti-
mana successiva. Considerando anche il voto dell’assente, la media dei voti nel compito in classe è stata di 6,5. Quale
voto ha avuto l’alunno assente nel compito?
281
b. Media ¼ ’ 6,4; mediana ¼ 6,5; moda ¼ 7; c. 9
44
ESERCIZI
90 Si è lanciato 20 volte un dado. La seguente tabella riporta i risultati ottenuti.
Frequenza 6 2 4 3 4 1
Determina:
a. il valore medio della distribuzione;
b. il valore mediano;
c. la moda. [a. 3; b. 3; c. 1]
91 In una scuola il numero di ritardi giornalieri degli studenti, registrati per quindici giorni, è stato il seguente.
a. Trova la media dei ritardi nella prima settimana (ovvero nei primi sei giorni) e nel periodo complessivo di 15 giorni
preso in esame.
b. Trova la mediana del numero di ritardi nella prima settimana e nel periodo complessivo preso in esame.
c. Trova la moda del numero di ritardi nella prima settimana e nel periodo complessivo preso in esame.
[a. 8,5 e 7,6; b. 8 e 7; c. 7 e 11]
92 La ripartizione degli stipendi in un’azienda è rappresentata nella tabella qui sotto. Determina:
a. lo stipendio medio;
Stipendio S in euro Frequenza
b. lo stipendio mediano;
c. la classe modale. 1000 S < 1400 6
1400 S < 1800 10
1800 S < 2200 4
93 Nella seguente tabella è riportata una suddivisione in classi di età dei cardinali che hanno eletto papa Benedetto XVI.
Età da 50 a 54 da 55 a 59 da 60 a 64 da 65 a 69 da 70 a 74 da 75 a 79
N. cardinali 2 3 12 21 42 37
Trova:
a. l’età media dei cardinali;
b. l’età mediana dei cardinali;
c. la classe modale delle età dei cardinali. [a. 70,93 (arrotondando ai centesimi); b. 72; c. 70-74]
593
Tema D Dati e previsioni
94 La distribuzione delle frequenze di un carattere quantitativo è riportata, in parte, nella tabella qui sotto. Completa
la tabella in modo che la mediana della distribuzione sia 4 e la media sia 5. Il modo di completare è unico?
Modalità 1 2 3 4 .....
Frequenza 3 4 2 ..... 5
Esercizi preliminari
95 Vero o falso?
a. la varianza è la media dei quadrati degli scarti dei valori osservati dalla loro media aritmetica V F
b. la varianza è il quadrato della deviazione standard V F
c. la deviazione standard di n numeri è sempre minore della loro varianza V F
d. se x1 , x2 , ..., xn sono le n modalità osservate di un carattere quantitativo, la loro deviazione standard ha la
stessa unità di misura delle modalità V F
e. il campo di variazione di un insieme di dati non può mai essere nullo V F
[3 affermazioni vere e 2 false]
96 Se la deviazione standard di n numeri è nulla, che cosa si può dire degli n numeri? La deviazione standard di n nu-
meri può essere uguale a 1?
97 Che cosa accade alla deviazione standard dei numeri x1 , x2 , ..., xn se si aumentano tutti i numeri di 1? Che cosa ac-
cade alla deviazione standard se si quadruplicano tutti i numeri? E se si dividono tutti i numeri per 4?
98 ESERCIZIO SVOLTO
ÿ3 ÿ1 2 4 8
ðÿ3Þ2 þ ðÿ1Þ2 þ 22 þ 42 þ 82 94 74
2 ¼ ÿ 22 ¼ ÿ4¼ ¼ 14,8
5 5 5
quadrato della media
media dei quadrati
dei numeri assegnati
dei numeri assegnati
Trova la varianza e la deviazione standard dei seguenti gruppi di numeri. Arrotonda i risultati alla seconda cifra
decimale.
99 ÿ2, 2, ÿ4, 4, 5, ÿ5 [2 ¼ 15, ¼ 3,87]
104 Trova varianza e deviazione standard dei numeri a; 2a; 4a; 5a, dove a è un numero positivo.
pffiffiffiffiffiffi
2 5 2 a 10
¼ a ;¼
2 2
105 Determina per quale valore di a la varianza dei numeri a; 2a; 3a; 4a, dove a > 0, è uguale a 45. [a ¼ 6]
106 La media dei quadrati di una sequenza di numeri è 100 e la media dei numeri è 8. Qual è la deviazione standard di
tali numeri? [6]
107 La varianza dei numeri appartenenti a un insieme X è 25, la somma dei quadrati di tali numeri è 1000 e la media
aritmetica dei numeri è 5. Determina il numero di elementi dell’insieme X. [20]
ESERCIZI
108 La media dei quadrati dei numeri di un insieme è 100 e il loro scarto quadratico medio è 6. Qual è la media dei nu-
meri dell’insieme, sapendo che tali numeri sono tutti positivi? [8]
Problemi
109 Videolezione Andrea ha ottenuto, in quattro compiti in classe, i seguenti voti: 5, 7, 6, 8.
a. Calcola la media e la deviazione standard dei voti di Andrea.
b. Se il professore di Andrea decidesse di aumentare i voti di tutti i compiti in classe di 1 punto, quali diventerebbero
pffiffiffi
la media e la deviazione standard dei voti di Andrea?
5
a. Media ¼ 6,5, ¼ ’ 1,2; b. media ¼ 7,5; invariata
2
110 Una piccola azienda effettua un’indagine circa il numero dei figli dei propri dipendenti. I risultati sono riassunti
nella seguente tabella. Determina la media, la varianza e la deviazione standard del numero di figli dei dipendenti di
quell’azienda.
Numero di figli 0 1 2 3 4
Numero di dipendenti 10 18 16 4 2
111 Si sono registrati i tempi di attesa a un call center, considerando un campione di 100 clienti, e si sono ottenuti i dati
riportati nella seguente tabella. Determina la media, la varianza e la deviazione standard dei tempi di attesa.
112 Nella classe I A oggi c’è un solo studente assente, Marco. Il peso medio dei 24 studenti presenti è 68 kg ed è ugua-
le al peso medio di tutti gli studenti della classe (incluso Marco). La varianza dei pesi degli studenti presenti è uguale a
15 kg2 . Determina:
a. qual è il peso di Marco;
b. qual è la varianza dei pesi di tutti gli studenti della classe (incluso Marco). [a. 68 kg; b. 14,4 kg2 ]
113 Nella classe I B oggi ci sono due soli studenti assenti: Paolo e Barbara. La statura media dei 18 studenti presenti è
170 cm ed è uguale alla statura media di tutti gli studenti della classe (inclusi Paolo e Barbara). La varianza delle stature
degli studenti presenti è uguale a 40 cm2 . Sapendo che Paolo è alto 10 cm più di Barbara, determina:
a. quali sono le stature di Barbara e Paolo;
b. qual è la varianza delle stature di tutti gli studenti della classe (inclusi Paolo e Barbara).
[a. Barbara: 165 cm, Paolo: 175 cm; b. 38,5 cm2 ]
595
Tema D Dati e previsioni
114 Controllo di qualità. Una ditta di integratori alimentari produce delle compresse le quali dichiarano di contenere
0,9 g di principio attivo. Per assicurarsi che quanto dichiarato sia rispettato, entro margini di errore tollerabili, vengono
effettuati periodicamente dei controlli su campioni di 1000 compresse. La distribuzione della quantità di principio attivo
rilevato su un campione è rappresenta nella seguente tabella.
Quantità di principio attivo (in g) 0,87 0,88 0,89 0,90 0,91 0,92 0,93 0,94
Numero di compresse 20 60 160 500 140 90 20 10
a. Calcola la quantità media m di principio attivo contenuta nelle compresse del campione esaminato e la relativa de-
ESERCIZI
116 A tre tavoli di un ristorante sono seduti tre gruppi di commensali, le cui età (in anni compiuti) sono riportate nella
seguente tabella:
1 gruppo 12 22 32 42 52
2 gruppo 12 17 22 47 62
3 gruppo 15 37 30 23 45
a. È vero che l’età media delle persone appartenenti a ciascuno dei tre gruppi è la stessa?
b. Qual è il gruppo in cui l’età è meno variabile?
[a. L’età media del primo gruppo è uguale a quella del secondo: 32, mentre l’età media del terzo gruppo è 30;
b. i coefficienti di variazione (arrotondati alla seconda cifra decimale) sono: 0,44 (per ll 1 gruppo),
0,60 (per il 2 gruppo) e 0,35 (per il 3 gruppo) quindi il terzo gruppo è quello in cui l’età è meno variabile]
117 In due ospedali, che indichiamo con A e B, si è registrato il numero delle nascite mensili nel primo semestre del
2009. Si sono ottenuti i dati riportati nella tabella qui sotto.
a. Calcola la media, la varianza e il coefficiente di variazione delle nascite mensili relative al primo semestre del 2009
nell’ospedale A.
b. Calcola la media, la varianza e il coefficiente di variazione delle nascite mensili relative al primo semestre del 2009
nell’ospedale B.
c. Nel primo semestre del 2009 c’è stata più variabilità del numero di nascite mensili nell’ospedale A o nell’ospe-
dale B? [a. Media ’ 20,7, 2 ’ 24,9, coefficiente di variazione ’ 0,2;
b. media ’ 53,3, 2 ’ 36,9, coefficiente di variazione ’ 0,1]
596
Unità 13 Statistica
ESERCIZI DI RIEPILOGO
Esercizi interattivi
ESERCIZI
b. se due sequenze di numeri hanno la stessa mediana, allora hanno anche la stessa media V F
c. esistono sequenze di numeri per cui la moda, la media e la mediana coincidono V F
d. la moda di una sequenza di numeri può non essere unica V F
e. sia la varianza sia la deviazione standard presentano la stessa unità di misura dei dati V F
[2 affermazioni vere e 3 false]
successivi lo stipendio mensile è aumentato di 400 euro. B può essere uguale a zero
Qual è lo stipendio medio nell’anno di quell’impiegato? C non cambia se a tutti i dati si aggiunge uno stesso
numero
A 1250 euro C 1350 euro
D non cambia se tutti i dati vengono moltiplicati per
B 1300 euro D 1400 euro
uno stesso numero
120 La media aritmetica di 11 numeri è 4850. Se ciascu-
125 I voti in matematica di 10 studenti in un compito
no degli undici numeri viene diminuito di 10, quanto di-
in classe sono stati: 9, 8, 7, 6, 5, 7, 8, 8, 5, 4. Il voto mini-
venta la loro media aritmetica?
mo della metà degli studenti più bravi è:
A 4830 B 4840 C 4850 A la media dei voti
A I dati forniti non sono sufficienti per determinarla. B la moda dei voti
C la mediana dei voti
121 Mario, Luigi e Giacomo pesano complessivamente
D nessuna delle altre risposte
210 kg. Sapendo che Mario e Luigi pesano rispettivamen-
te 3 kg in meno e 4 kg in più della media aritmetica fra i 126 Uno studente ha avuto 5 e mezzo ai primi due com-
pesi di tutti e tre, quanto pesa Giacomo? piti. Quale voto dovrà raggiungere al terzo compito per
A 68 kg B 69 kg C 70 kg D 71 kg ottenere la media del 6?
A 7 B 5 e mezzo C 6
122 Stabilisci quale delle seguenti affermazioni è vera.
D 6 e mezzo E Non ce la può fare
A La media di un insieme di dati non può mai essere (Prova di ammissione, corso di laurea in Medicina 2009)
uguale a zero.
127 L’età media dei partecipanti a una festa è di 24 anni.
B La mediana di un insieme di dati può essere uguale
alla media aritmetica. Se l’età media degli uomini è 28 anni e quella delle donne
è 18 anni, qual è il rapporto tra il numero degli uomini e
C La deviazione standard di un insieme di dati non
quello delle donne?
può mai essere uguale a zero.
14 9 3 4
D La moda di un insieme di dati non può essere ugua- A B C D
9 14 2 3
le alla mediana.
(Prova di ammissione, corso di laurea in Ingegneria 2006)
123 La media dei voti ottenuti in un compito in classe è 128 Uno studente universitario, dopo aver superato tre
stata 6 e la mediana 5,5. Il professore decide di alzare tutti esami, ha la media di 28. Nell’esame successivo lo studen-
i voti di mezzo punto. Allora: te prende 20. Qual è la sua media dopo il quarto esame?
A la media resta invariata e la mediana aumenta di 0,5
A 26 B 24 C 22
B la media aumenta di 0,5 e la mediana resta invariata
D I dati non sono sufficienti per determinare la rispo-
C sia la media sia la mediana restano invariate sta.
D sia la media sia la mediana aumentano di 0,5 (Test di ingresso per i corsi di laurea scientifici 2008)
597
Tema D Dati e previsioni
129 Per arrivare a una cima S si deve percorrere un ripido sentiero FR, S
con pendenza dell’80%, e poi un sentiero RS, che ha pendenza del 30%. 30%
Con riferimento alle misure indicate in figura, determina la pendenza R
media dell’intero percorso. %
80
F
A 49% D 44%
B 55% E 52%
C 40%
(Prova di ammissione, Facoltà di Scienze 2010) 70 m 180 m
ESERCIZI
130 Al fine di svolgere un’indagine sull’utilizzo di Internet da parte dei propri studenti, una scuola media rileva il tempo
di connessione giornaliero (in minuti) degli studenti delle sezioni A e B dell’ultimo anno. Sapendo che per le due sezioni
il numero di studenti, la media e la varianza del tempo di connessione sono rispettivamente:
131 Il diagramma a barre qui proposto rappresenta la distribuzione di frequenze delle età dei giocatori partecipanti a un
torneo.
24
Numero dei partecipanti
20
16
12
0
19 20 21 22 23
Età
132 In una classe si è rilevato il mezzo di trasporto tramite cui gli allievi si recano a scuola. I dati grezzi ottenuti sono i
seguenti:
133 Sono dati i numeri: a, a þ 1, a þ 2, a þ 4, essendo a 2 R. Determina a in modo che la media di questa sequenza di
numeri sia uguale al triplo della mediana.
11
a¼ÿ
8
134 Sono dati i numeri a þ 1, a, a ÿ 1, a þ 2, a þ 4, essendo a 2 R. Determina a in modo che la media di questa sequen-
za di numeri sia uguale a una volta e mezza la mediana.
3
a¼ÿ
5
135 Sono dati i numeri: a, 2a, 3a, essendo a > 0. Determina a in modo che la varianza di questi numeri sia 24. [a ¼ 6]
ESERCIZI
136 Si svolge un’indagine sull’importo della «paghetta» che i ragazzi di 16 anni ricevono dai genitori. Il 75% degli inter-
vistati riceve una media di 100 euro al mese; il 15% una media mensile di 80 euro e il restante 10% una media di 160 eu-
ro. Qual è la paghetta media mensile dei ragazzi nel campione esaminato? [103 euro]
137 Si è rilevato su un campione di persone il numero di riviste acquistate in una data settimana. La tabella seguente
rappresenta la distribuzione delle frequenze ottenuta:
Numero di riviste 0 1 2 3 4
Frequenza assoluta 12 13 15 6 4
Determina il numero medio e il numero mediano di riviste acquistate. [Media ¼ 1,54; mediana ¼ 1,5]
138 Un grande magazzino ha rilevato le taglie di pantaloni vendute in una settimana. La seguente tabella riporta la di-
stribuzione delle frequenze relative dei dati raccolti.
Taglia 44 46 48 50 52 54
a. Qual è il carattere oggetto di questa indagine statistica? Quali modalità può assumere il carattere?
b. Qual è la frequenza relativa della taglia 50? Quale taglia rappresenta la moda della distribuzione?
Supposto che nella settimana in cui sono stati rilevati i dati siano stati venduti complessivamente 200 pantaloni, rispon-
di ai seguenti ulteriori quesiti:
c. Determina quanti pantaloni della taglia 50 sono stati venduti.
d. Calcola la taglia media e la taglia mediana.
e. Calcola la deviazione standard delle taglie dei pantaloni. Esprimi il risultato arrotondato alla seconda cifra decima-
le. [b. 0,33, taglia modale ¼ 50; c. 66; d. taglia media ¼ 49,18, taglia mediana ¼ 50; e. 2,73]
139 La prova d’esame di un concorso cui hanno partecipato 50 candidati è costituita da 8 esercizi. La seguente tabella ri-
porta i dati relativi a quanti esercizi ha svolto ciascun candidato.
Frequenza 2 1 3 20 12 3 5 4
a. Qual è il carattere oggetto di questa indagine statistica? Quali modalità può assumere il carattere?
b. Costruisci la tabella delle frequenze percentuali e rappresentala con il grafico che ritieni più opportuno.
c. Completa la tabella delle frequenze percentuali, calcolando anche le frequenze percentuali cumulate.
d. Quanti sono, in percentuale, i candidati che hanno svolto un numero di esercizi minore o uguale a 4?
e. Quanti sono, in percentuale, i candidati che hanno svolto più di 6 esercizi?
f. Calcola il numero medio e il numero mediano di esercizi svolti da un candidato.
[d. 52%; e. 18%; f. numero medio ¼ 4,76, numero mediano ¼ 4]
599
Tema D Dati e previsioni
140 Si è rilevato il tasso di colesterolo nel sangue di 100 persone e si sono ottenuti i seguenti risultati:
Tasso colesterolo (in mg/dl) [80, 120) [120, 160) [160, 200) [200, 240) [240, 280) [280, 320) [320, 360)
Frequenza 2 18 40 24 12 3 1
141 La seguente tabella riporta (per classi di età) il numero di persone seguite dalla ASL di Pavia, nel 2002, per tossicodi-
pendenza (fonte: annuario statistico regionale).
Classi di età [0, 14] [15, 19] [20, 24] [25, 29] [30, 34] [35, 39] Oltre 39
Trova l’età media, l’età mediana e la classe modale della distribuzione rappresentata nella tabella, chiudendo l’ultima
classe a 50. [Media ’ 34,5; mediana ¼ 32; classe modale ¼ 30-34]
3
142 In una scuola con diversi indirizzi operano tre commissioni d’esame. I candidati della prima commissione sono i
4
5
dei candidati della seconda e hanno avuto un voto medio di 72; i candidati della seconda commissione, che sono i dei
3
candidati della terza, hanno avuto un voto medio di 76, e gli allievi della terza commissione hanno avuto un voto medio
di 70. Qual è il voto medio degli alunni di tutta la scuola? [Circa 73,19]
143 In una classe di 25 alunni ci sono due alunni assenti nel giorno della correzione e riconsegna del compito in clas-
se di matematica. L’insegnante non dice il voto degli assenti, ma dice che sia il voto medio dei 23 presenti, sia il voto
medio di tutti e 25 gli alunni è 6,5 e che, dei due assenti, uno ha preso tre punti in più dell’altro. Quali sono i voti dei
due assenti? [5 e 8]
144 Fra i partecipanti a un viaggio, l’età media delle donne è inferiore di 3 a quella degli uomini. Sapendo che gli uomi-
1
ni sono delle donne e che la media delle età di tutti i partecipanti è 43 anni, determina l’età media delle donne e l’età
3
media degli uomini. [Età media degli uomini ¼ 45,25, delle donne ¼ 42,25]
145 Un gruppo assicurativo ha 10 agenti. In un mese otto agenti hanno stipulato 6 polizze ognuno, il nono agente ha
stipulato 5 polizze e il decimo agente ha stipulato una polizza in più del numero medio di polizze che un agente del
gruppo ha stipulato in quel mese. Qual è il numero complessivo di polizze stipulate in quel mese da tutti gli agenti? [60]
146 Mariolina invita i visitatori del suo blog a dare i loro suggerimenti e a esprimere con un voto il gradimento del sito. La
media attuale dei voti dei visitatori è visibile sul sito. Giuliano, cui piace molto il sito della sua amica, decide di dare come
voto la media visibile sul sito più 1. In seguito al voto di Giuliano, la media dei voti del sito aumenta di 0,02 punti. Quanti
visitatori del sito hanno votato prima di Giuliano sul blog di Mariolina?
(Mathématiques sans frontières, febbraio 2008) [49]
147 Michele si prepara all’ultimo compito in classe di matematica dell’anno; lo affronta con tranquillità, sapendo che
se prenderà 10 avrà la media del 9, mentre prendendo 5 la media diverrà 8. Quanti compiti ha già fatto quest’anno Mi-
chele?
A 2 B 3 C 4 D 5 E I dati non sono sufficienti per dare la risposta.
(Giochi di Archimede 2004) [C]
600
Prova di autoverifica
Statistica
1 La seguente tabella rappresenta le temperature massime registrate in una certa località durante una settimana.
ESERCIZI
3 10
4 8
5 6
6 10
7 10
Determina:
a. la tabella che rappresenta la distribuzione delle frequenze delle temperature;
b. la temperatura massima media;
c. la temperatura massima mediana;
d. la temperatura massima modale;
e. la deviazione standard delle temperature massime.
2 Si è registrato il numero n di SMS ricevuti in un giorno dagli studenti di una classe e si sono ottenuti i dati riportati
in tabella.
Determina:
a. da quanti alunni è composta la classe;
b. la percentuale degli studenti della classe che in quel giorno hanno ricevuto almeno 5 SMS;
c. il numero medio di SMS ricevuti dagli studenti della classe in quel giorno;
d. il numero mediano di SMS ricevuti dagli studenti della classe in quel giorno.
3 Si è effettuato un sondaggio sul numero di telefoni cellulari posseduti da un campione di persone.
Il 4% del campione ha dichiarato di non possedere telefoni cellulari, il 60% di possederne 1, il 30% di possederne 2 e il
6% di possederne 3. Qual è il numero medio di telefoni cellulari posseduti dalle persone del campione intervistato?
4 L’altezza media degli studenti di una classe di 24 persone è 180 cm. Se si aggiunge un nuovo studente, alto 190 cm,
quale diviene l’altezza media degli studenti della classe?
5 La media dei voti di un compito in classe è stata 6,5, la mediana 6 e la deviazione standard 1,5.
a. Se il professore decide di aumentare tutti i voti di 1 punto, come variano la media, la mediana e la deviazione stan-
dard dei voti del compito?
b. Se il professore decide di aumentare tutti i voti del 10%, come variano la media, la mediana e la deviazione stan-
dard dei voti del compito?
Valutazione
Esercizio 1 2 3 4 5 Totale
Punteggio
ottenuto
601
Tema E Verso le competenze
Risolvere problemi
1 I docenti di tre diverse commissioni d’esame hanno attribuito rispettivamente i seguenti voti medi: 28, 26 e 25. De-
termina il voto medio di tutti gli esaminati, sapendo che ciascuna commissione aveva rispettivamente 50, 30 e 80 stu-
denti. [26,125]
Verso le competenze
2 Per un anno si sono monitorati i prezzi al mercato di un particolare tipo di mele. I dati sono stati cosı̀ sintetizzati:
per 90 giorni 1,50 euro al kg
per 60 giorni 1,70 euro al kg
per 70 giorni 1,75 euro al kg
per 50 giorni 2,00 euro al kg
per 95 giorni 1,60 euro al kg
Qual è stato il prezzo medio annuo del tipo di mela preso in considerazione? [Circa 1,68 euro]
3 La media aritmetica di quattro numeri naturali consecutivi è uguale a 12,5. Qual è il più piccolo di essi? [11]
4 La media dei voti in un compito in classe di matematica è stata 7. Le ragazze della classe, in tutto 18, hanno ottenu-
to una media del 7,5, mentre la media dei voti dei ragazzi è stata 6.
a. Da quanti alunni è composta la classe?
b. Al compito in classe successivo, la media dei voti della classe resta invariata, ma questa volta è la media dei voti dei
ragazzi a essere uguale a 7,5. Qual è stata la media dei voti delle ragazze? [a. 27; b. 6,75]
5 Si è effettuata un’indagine su un campione di persone, chiedendo loro quante volte mangiano fuori casa in una set-
timana. Dai risultati dell’indagine si è calcolato che in media gli intervistati mangiano fuori casa 3,3 volte alla settimana.
Inoltre, il 20% ha risposto che non mangia mai fuori casa, il 30% che mangia fuori casa 3 volte la settimana, il 25% che
mangia fuori casa 5 volte la settimana, il 5% che mangia fuori casa 7 volte la settimana; i restanti hanno affermato che
mangiano fuori casa n volte la settimana. Quanto vale n? [4]
1D 22 3 Latina 11 343
1E 25 4 Rieti 13 399
1F 28 3
Roma 16 017
1G 22 1
Viterbo 13 300
1H 26 2
1I 30 5 L’articolo concludeva, calcolando la media aritmetica
1L 24 2 semplice dei redditi pro capite per provincia, che il
reddito pro capite degli abitanti del Lazio nel 2001
Qual è il tasso percentuale medio di bocciati relativo a era di 13 295 euro. Sei d’accordo con questa conclu-
tutte le classi prime? [11,25%] sione?
602
Tema E
8 Il diagramma a torta qui sotto rappresenta i voti 9 Un commerciante ha rilevato le taglie di pantaloni
conseguiti nella verifica scritta di Matematica dagli alun- venduti in un mese e ha ottenuto i risultati rappresentati
ni della classe III C. nel seguente diagramma a barre.
voto 9 (4%)
voto 8 (8%)
Verso le competenze
14 12
12
10 8 9
8 6
6 4
voto 5 (28%) 4 2
voto 6 2
0
44 46 48 50 52 54 56
Voti di matematica della classe III C Taglie
10 Il tasso di disoccupati rispetto alla forza lavoro, nel 2004, era del 6% al Centro, del 4% al Nord e del 15% al Sud. Sta-
bilisci se questi dati sono sufficienti per calcolare il tasso medio nazionale di disoccupazione nel 2004. In caso negativo,
spiega come si dovrebbe procedere per effettuare il calcolo correttamente.
11 Commenta i seguenti ragionamenti, stabilendo se sono corretti e, nel caso non lo fossero, quale errore è stato com-
messo.
a. Ogni anno il numero di persone che muore tra i 70 e gli 80 anni è maggiore del numero di persone che muore tra
gli 80 e i 90 anni. Quindi più si invecchia e più diminuisce il rischio di morire!
b. Si è valutato che il 90% degli incidenti avvengono a meno di 10 km da casa. Quindi allontanandosi il più velocemente
possibile da casa, diminuisce il rischio di incorrere in un incidente.
c. Nella ditta A il salario medio è il doppio di quello della ditta B. Quindi conviene presentare domanda di assunzione nella
ditta A.
d. Un medico del pronto soccorso osserva che egli cura più fratture in seguito a cadute in casa che lesioni di agricoltori
procurate sul lavoro. Conclude che è più pericoloso stare a casa che lavorare nei campi.
e. Il numero dei delitti che avvengono nell’ambito familiare supera quello degli omicidi nelle bische clandestine.
Quindi è più pericoloso vivere in famiglia che frequentare bische clandestine.
12 In una certa popolazione i fumatori costituiscono il 33% del totale. In quella stessa popolazione si svolge un’indagi-
ne per stabilire il numero di sigarette fumate in un giorno da ciascun individuo. Spiega se i dati sono sufficienti per stabi-
lire la moda della distribuzione che si ottiene.
13 Logica La media delle età di un insieme di 100 persone è 28. L’età mediana delle 100 persone può essere superiore a
56? Se sı̀, esibisci un esempio; altrimenti dimostra che è impossibile.
(Suggerimento: calcola anzitutto qual è la somma delle età di tutte le persone dell’insieme considerato, quindi ragiona per
assurdo)
14 Logica In una classe di 20 studenti, la media dei voti in un compito in classe è stata 6,5.
a. È possibile che 15 studenti abbiano preso 9?
b. È possibile che 14 studenti abbiano preso voti minori o uguali a 4?
In caso affermativo, esibisci un esempio; altrimenti dimostra che è impossibile.
603
Tema E Verso le prove INVALSI
1 Un gruppo di boyscout è formato da ragazzi di età compresa tra i 10 e i 14 anni. La distribuzione delle frequenze
percentuali delle età è riportata nel seguente diagramma.
50%
40%
Frequenza
30%
20%
10%
0%
10 11 12 13 14
Anni
Sulla base dei dati riportati nel diagramma, indica se ciascuna delle seguenti affermazioni è vera o falsa.
a. più dell’80% dei ragazzi ha meno di 13 anni V F
b. meno del 70% dei ragazzi ha più di 11 anni V F
c. la percentuale di ragazzi che hanno 12 o 14 anni è uguale alla percentuale di ragazzi che hanno
10 o 11 o 13 anni V F
(Prova INVALSI 2012)
2 La seguente tabella riporta il numero di occupati, in migliaia, in Italia in ciascuno degli anni dal 1995 al 2005.
Anni 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
Occupati 20 240 20 326 20 384 20 591 20 847 21 210 21 604 21 913 22 241 22 404 22 563
(in migliaia)
a. Quale tra le seguenti espressioni dà come risultato l’aumento percentuale del numero di occupati nel 2001 rispetto
al numero di occupati nel 2000?
21 604 394 21 210 394
A 100 B 100 C 100 D 100
21 210 21 210 21 604 21 604
b. Di quanto sono aumentati gli occupati dal 1995 al 2005?
Risposta: ......................... migliaia
c. Qual è stato l’aumento medio annuo di occupati nei dieci anni dal 1995 al 2005?
Risposta: ......................... migliaia
(Prova INVALSI 2012)
3 La seguente tabella raccoglie la composizione di una classe relativamente al mese di nascita dei singoli alunni.
A B C D
604
Tema E
4 Lo sfruttamento medio della capacità ricettiva di un albergo è uguale all’88% durante i tre mesi estivi e al 44% du-
rante i rimanenti mesi dell’anno. Qual è lo sfruttamento medio relativo all’intero anno?
A 55% B 50% C 46% D 80%
5 Antonio, Carlo, Giovanni, Filippo e Matteo fanno una gara di tiro a segno. Antonio e Filippo totalizzano ciascuno
16 punti. Carlo totalizza 18 punti, Giovanni ne totalizza 14 e Matteo 10. Qual è il punteggio medio realizzato dai cinque
6 Osserva i seguenti grafici relativi alle operazioni effettuate con carte di credito dal 2004 al 2008.
(Fonte: Osservatorio sulle carte di credito. Assofin-Crif Decision Solutions-Gfk Eurisko)
600 20%
503,9 522,6
500 463,5 485,9 15,90%
433,6 15%
400
300 10%
8,20%
6,90%
200 3,70%
5%
100
0 0%
2004 2005 2006 2007 2008 2004 2005 2006 2007 2008
Anni Anni
7 La media degli studenti promossi da una certa scuola, nei quattro anni 1999-2002, è stata di 325 studenti all’anno,
mentre nei cinque anni 1999-2003 la media è stata superiore del 20% rispetto al precedente intervallo temporale. Quanti
studenti sono stati promossi dalla scuola nel 2003?
8 Le temperature massime giornaliere registrate in una data città nei giorni di una settimana, a partire dal lunedı̀, so-
no le seguenti:
A 6 B 7 C 8 D 9
605
Tema E
10 La professoressa Rossi vuole verificare il livello delle conoscenze in scienze nelle classi I A e I B. Decide di sommini-
strare lo stesso test nelle due classi. Elaborando i punteggi dei test ottiene i seguenti risultati:
Classe 1A Classe 1B
La professoressa chiede a Martina, una sua alunna di I B, di commentare i risultati ottenuti dagli alunni delle due classi.
Martina afferma che i risultati indicano che gli alunni delle due classi hanno lo stesso livello medio di conoscenze, ma
gli studenti della I A hanno ottenuto complessivamente punteggi più vicini alla media. Martina ha ragione? Scegli una
delle due risposte e completa la frase.
Sı̀, perché .........................
11 Un automobilista percorre i primi 120 km di un certo percorso alla velocità media di 60 km/h e i successivi 120 km
alla velocità media di 120 km/h. Qual è la sua velocità media durante l’intero percorso?
A 90 km/h
B 100 km/h
C 70 km/h
D 80 km/h
(Prova INVALSI 2013)
12 Tra gli studenti di una scuola si è condotta un’indagine circa la distanza tra la loro abitazione e la scuola stessa. La
distribuzione delle frequenze è rappresentata nel seguente istogramma:
120
100 98
Frequenza
80
62
60
41
40 33
12
20
0
[0,5) [5,10) [10,15) [15,20) [20,25)
Distanza scuola-abitazione
In base a ciò che puoi dedurre dall’istogramma, stabilisci se le seguenti affermazioni sono vere, false o se le informazioni
non sono sufficienti per stabilirlo.
Non ci sono alunni che distano più di 40 km da scuola. V F Non si può stabilire
Gli alunni della scuola sono complessivamente 120. V F Non si può stabilire
Gli alunni che abitano a meno di 10 km dalla scuola sono circa il 65%. V F Non si può stabilire
La distanza mediana tra l’abitazione di un alunno e la scuola è circa 7,5 km. V F Non si può stabilire
La distanza media tra l’abitazione di un alunno e la scuola è circa 8,4 km. V F Non si può stabilire
606
Tema E
13 Uno studio statistico sulle altezze, misurate in metri, dei componenti di una classe di 20 studenti ha condotto ai se-
guenti risultati:
moda: 1,87 m media: 1,76 m mediana: 1,74 m
In base a queste informazioni, stabilisci se le seguenti affermazioni sono vere, false o se i dati non sono sufficienti per sta-
bilirlo.
La somma delle altezze degli studenti della classe è 35,2 m. V F Non si può stabilire
La metà degli allievi ha altezza minore o uguale a 1,74 m e l’altra metà ha V F Non si può stabilire
altezza maggiore o uguale a 1,74 m.
Almeno uno studente della classe ha altezza uguale a 1,76 m. V F Non si può stabilire
Gli studenti della classe aventi altezza superiore a 1,72 m sono meno di 8. V F Non si può stabilire
1,9
1,6
1,3
1,0
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
15 In una classe, i voti presi dalle ragazze a un compito in classe di matematica sono:
6 7 6 6 5 8 4 9
La media dei voti presi dai ragazzi, che sono in tutto 12, è stata del 6.
a. Qual è la media dei voti della classe? Risposta: ...............................................................................................................................................................
b. Scrivi i calcoli che ti hanno consentito di arrivare alla risposta: .........................................................................................................................
607
Prova di competenza
1 Uno stesso articolo viene venduto, presso grandi magazzini differenti, a prezzi diversi; si sono rilevati i prezzi di
una unità dell’articolo presso diversi punti vendita. I risultati ottenuti sono quelli rappresentati nel diagramma.
a. Qual è la percentuale di grandi magazzini che vendono l’articolo a un prezzo superiore a 11 euro?
b. Per ciascuna delle seguenti domande, individua il valore medio (scelto tra media, moda e mediana) che consente di
Verso le prove INVALSI
frequenza
dere l’articolo allo stesso prezzo; quale dovrebbe essere questo
50
prezzo per fare sı̀ che il ricavo complessivo derivante dalla vendita
40
di una unità dell’articolo in ciascun grande magazzino sia lo stes-
30
so che si otterrebbe con i prezzi attuali?
20
c. Determina la varianza e la deviazione standard del prezzo di vendita 10
dell’articolo. 0
d. Se tutti i grandi magazzini aumentano il prezzo dell’articolo del 10%, 10 11 12 13 14
prezzo (in €)
quale diviene il prezzo medio di vendita? E quale diviene la varianza?
2 In una scuola ci sono due classi prime, la I A e la I B. Nella seguente tabella sono riportati i dati relativi al tempo im-
piegato dai 25 studenti della I A per recarsi a scuola.
Frequenza 6 8 4 2 3 2
a. Determina la percentuale di studenti della classe I A che per recarsi a scuola impiegano un tempo inferiore a 30 mi-
nuti.
b. Determina il tempo medio e il tempo mediano impiegato dagli studenti della classe I A per recarsi a scuola.
c. Considerando complessivamente tutti gli studenti delle classi prime, si è trovato che il tempo medio per recarsi a
scuola è risultato di 15 minuti. Sapendo che la classe I B è composta da 20 studenti, determina il tempo medio impie-
gato per recarsi a scuola dagli studenti della classe I B.
3 In un’azienda, il 20% dei dipendenti (gruppo A) percepisce uno stipendio annuo medio di 16000 euro, il 45%
(gruppo B) percepisce uno stipendio annuo medio di 18000 euro e il restante 35% (gruppo C) percepisce uno stipendio
annuo medio di 20000 euro.
a. Determina lo stipendio annuo medio di tutti dipendenti dell’azienda.
b. Se lo stipendio annuo di ciascun dipendente dell’azienda aumenta del 5%, quale diviene lo stipendio annuo medio
di tutti i dipendenti dell’azienda?
c. Supponi che ciascun dipendente del gruppo A abbia un aumento dello stipendio annuo del 10%, mentre ciascun
dipendente del gruppo C subisca una diminuzione dello stipendio annuo del 10% (ai dipendenti del gruppo B lo sti-
pendio annuo viene lasciato invece invariato). In questa nuova situazione, quale diviene lo stipendio annuo medio di
tutti i dipendenti dell’azienda?
Esercizio 1 2 3
Competenze Analizzare dati e interpretarli. Analizzare dati e interpretarli. Analizzare dati e interpretarli.
prevalenti Individuare strategie per risol- Individuare strategie per risol- Individuare strategie per risol-
vere problemi vere problemi vere problemi
Livello Base: 1a, 1b Base: 2a Base: 3a
Medio: 1c Medio: 2b Medio: 3b, 3c
Avanzato: 1d Avanzato: 2c Avanzato: 3d
Risposte p. 612
608