Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
qxd
13-02-2009
9:26
Pagina VII
Indice
capitolo
ESERCIZI
.........................
...................................................
......................................................
Distribuzioni statistiche
Rappresentazioni grafiche
Distribuzioni statistiche
................................................
39
...................................................
40
Rappresentazioni grafiche
.............................................
43
Medie statistiche
.................................................................
16
Medie statistiche
.................................................................
47
Indici di variabilit
...............................................................
24
Indici di variabilit
...............................................................
54
........................................
29
................................................................................................
33
Test di autoverifica
....................................................
34
......................................................
63
ESERCIZI
in sintesi
Applicazioni informatiche
capitolo
................................................
........................................
57
..................................................................
60
..........................................
62
Calcolo combinatorio
1
Disposizioni
65
Disposizioni
Permutazioni
..........................................................................
68
Permutazioni
..........................................................................
82
Combinazioni
.........................................................................
70
Combinazioni
.........................................................................
84
................................................................................................
74
Test di autoverifica
75
91
ESERCIZI
in sintesi
............................................................................
Applicazioni informatiche
capitolo
....................................................
...............................................
............................................................................
..................................................................
..........................................
80
88
90
92
................
93
................................
96
.....
103
........................................
106
La probabilit condizionata
La probabilit condizionata
in sintesi
.....
124
.............................
129
.....
133
........................................
136
144
...............................................................
146
115
.............................................................................................
118
Test di autoverifica
119
.................................................
123
............
............
Applicazioni informatiche
..
.............
.......................................
148
VII
capitolo
0060.capitolo1.qxd
13-02-2009
10:03
Pagina 1
Elementi
di statistica
descrittiva
prerequisiti
Avere buona padronanza del calcolo algebrico
Conoscere i primi elementi della geometria analitica
conoscenze
Essere in grado di analizzare una tabella
di dati rilevati
abilit
percorso
STATISTICA
DESCRITTIVA
Rappresentazioni
grafiche
Medie statistiche
di calcolo
di posizione
Indici di variabilit
0060.capitolo1.qxd
13-02-2009
capitolo 1
Vedere esercizi
a pag. 39
10:03
Pagina 2
nota storica
La statistica come raccolta di dati su popolazioni,
beni posseduti dagli individui, quantit di prodotti agricoli ecc. era gi presente in Cina sotto limperatore Yu (circa 2000 a.C.).
In Egitto, per censire terreni e case si invent il
catasto.
Nellantica Roma, Servio Tullio istitu il census, che
consisteva in una rilevazione ogni 5 anni per conoscere il numero dei cittadini, lammontare dei loro beni, landamento delle nascite e delle morti.
Nellantichit si raccolsero dati, non solo per la
rilevazione del numero di individui e dei loro beni ai fini della riscossione delle tasse, ma anche
per lo studio dei moti del Sole e dei pianeti, utilizzando molte osservazioni e misurazioni, effettuate in particolare dagli astronomi babilonesi (circa
2500 a.C.) e da quelli greci (circa 200 a.C.).
Il termine statistica, come descrizione della situazione geografica e sociale degli stati, si fa risa-
0060.capitolo1.qxd
13-02-2009
paragrafo 2
10:03
Pagina 3
Distribuzioni statistiche
esempio 1
a La produzione di unazienda agricola un fenomeno singolo, mentre la produzione delle aziende
agricole di una regione un fenomeno collettivo.
b La causa della morte del signor Rossi un fenomeno singolo, invece lanalisi della mortalit di una
popolazione secondo le varie cause riguarda un fenomeno collettivo.
esempio 2
a Se consideriamo il reddito dei cittadini italiani, i valori assunti possono essere molto variabili. Mediante un valore medio si sintetizza tutta una serie di dati.
b Se rileviamo il numero annuo di nascite nelle varie regioni italiane otteniamo dati molto variabili.
Mediante il rapporto fra il numero dei nati e la popolazione (detto tasso di natalit) si pu analizzare meglio il fenomeno.
esempio 3
Vedere esercizi
a pag. 40
2 Distribuzioni statistiche
Le fasi fondamentali di unindagine statistica sono essenzialmente due:
rilevazione dei dati;
elaborazione dei dati.
La rilevazione dei dati statistici consiste nel raccogliere le informazioni da una popolazione statistica secondo certi caratteri, ossia certi aspetti del fenomeno, e quindi nel
raggrupparli.
esempio 1
a Nella popolazione costituita dalle famiglie di una citt si possono rilevare i seguenti caratteri: numero dei componenti, reddito del capo famiglia, possesso dellabitazione, utilizzo dei mezzi di trasporto, provincia di nascita del capo famiglia, titolo di studio ecc.
b Nella popolazione costituita dalle autovetture di nuova immatricolazione nellanno 2008 da residenti in Italia si possono rilevare i seguenti caratteri: cilindrata, potenza del motore, casa costruttrice, tipo di alimentazione, velocit massima, numero di airbag installati, numero posti ecc.
a Linsieme degli allievi di una scuola rappresenta una popolazione statistica di cui gli allievi sono
le unit statistiche.
b Linsieme delle autovetture immatricolate in Italia nel 2008 una popolazione statistica di cui
ogni autovettura una unit statistica.
c Linsieme dei libri venduti in una libreria in un dato mese una popolazione statistica di cui i libri
sono le unit statistiche.
d Linsieme dei voti espressi dagli elettori in una consultazione elettorale una popolazione statistica di cui ogni voto una unit statistica.
0060.capitolo1.qxd
13-02-2009
capitolo 1
10:03
Pagina 4
Quantitativi
Continui
Qualitativi
Discreti
prima di continuare
Esaminare se sono caratteri quantitativi o qualitativi i seguenti caratteri relativi a una indagine statistica fra gli allievi di una scuola secondaria di primo grado:
numero dei fratelli degli allievi, sesso degli allievi, peso degli allievi, comune di nascita,
mese di nascita, voto finale in una disciplina, tipo di sport praticato
Vedere
Algebra 1,
capitolo 1
Da un punto di vista matematico, una rilevazione statistica secondo un carattere opera una partizione della popolazione statistica in sottoinsiemi, ciascuno formato dalle
unit statistiche aventi la stessa modalit; inoltre, i sottoinsiemi non vuoti sono disgiunti a due a due e la loro unione la popolazione statistica stessa.
Effettuata una rilevazione statistica, i dati rilevati vengono presentati in tabelle che
possono essere a semplice entrata, a doppia entrata e composte, secondo che, rispettivamente, nella stessa popolazione statistica vengano rilevati un solo carattere, due caratteri collegati fra loro, pi caratteri.
Una tabella a semplice entrata costituita da due colonne: nella prima sono riportate
le modalit del carattere qualitativo o le intensit del carattere quantitativo, nella seconda i valori rilevati o il numero di unit statistiche corrispondenti.
Se il carattere qualitativo, la successione dei dati rilevati detta serie statistica; se il
carattere quantitativo, la successione detta seriazione statistica.
Per alcune tabelle statistiche si parla di distribuzione statistica proprio per indicare che la popolazione statistica stata suddivisa fra le varie modalit sia qualitative, sia quantitative.
Fra le distribuzioni statistiche hanno particolare rilevanza le distribuzioni di frequenze.
In statistica, con il termine frequenza assoluta si intende il numero delle unit statistiche aventi una data modalit.
0060.capitolo1.qxd
13-02-2009
paragrafo 2
10:03
Pagina 5
Distribuzioni statistiche
Altre distribuzioni statistiche in cui i valori rilevati sono quantit misurabili, come pesi, lunghezze ecc., sono dette distribuzioni di intensit.
Vediamo alcuni esempi di tabelle a semplice entrata sia per caratteri qualitativi, sia per
caratteri quantitativi.
Tabella 1
Distribuzione degli studenti italiani per tipo di scuola, anno scolastico 2005-2006
(ISTAT, Italia in cifre 2007)
Tipo di scuola
N alunni
Dellinfanzia
Primarie
Secondarie di 1 grado
Secondarie di 2 grado
1.662.139
2.790.254
1.764.230
2.691.713
Totale
8.908.336
Si tratta di una serie statistica poich il carattere qualitativo, espresso dai tipi di scuola.
La distribuzione una distribuzione di frequenze.
A ogni modalit (tipo di scuola) associato il numero degli allievi che frequentano quel
tipo di scuola. I numeri degli allievi sono detti frequenze assolute del carattere.
Tabella 2
Aree geografiche
Produzione frumento
Nord
Centro
Mezzogiorno
25.508
18.873
32.790
Italia
77.171
una serie geografica o territoriale, in quanto le modalit del carattere sono le aree geografiche in cui suddivisa lItalia. una distribuzione di intensit.
La totalit della produzione ripartita in tre sottoinsiemi.
Tabella 3
Rilevazione degli investimenti delle imprese per la protezione dellambiente negli anni 1997-2006
(in milioni di euro a prezzi correnti)
(ISTAT, Conti nazionali 2008)
Attenzione! Si tratta di
una serie, non di una
seriazione, in quanto i numeri
(anni) non sono dovuti a
enumerazioni o misurazioni,
ma sono contrassegni.
Anni
Investimenti
Anni
Investimenti
1997
1998
1999
2000
2001
1.061
1.364
1.489
1.700
4.163
2002
2003
2004
2005
2006
2.683
1.621
1.157
2.316
2.362
Si tratta di una serie storica o temporale, in quanto i dati rilevati sono riferiti a intervalli di tempo (mesi, anni ecc.).
Le serie storiche sono molto importanti perch permettono di analizzare
come un fenomeno si modifica al passare del tempo.
0060.capitolo1.qxd
13-02-2009
capitolo 1
10:03
Pagina 6
Tabella 4
N componenti
N famiglie
1
2
3
4
5
6 o pi
5.427.621
5.905.411
4.706.206
4.136.206
1.265.826
369.406
Totale
21.810.676
Distribuzione del parco autovetture per classi di cilindrata (con alimentazione a benzina) nellanno 2006
(ACI, Annuario statistico 2007 - Tab. III, 24)
800
1.200
1.600
2.000
2.500
N autovetture
1.735.610
9.090.133
9.509.631
2.156.710
119.753
301.812
Totale
22.913.649
x1
f1
x2 ......... xn
f2 ......... fn
0060.capitolo1.qxd
13-02-2009
paragrafo 2
10:03
Pagina 7
Distribuzioni statistiche
esempio 2
Nella Tabella 1 , che una serie statistica della distribuzione degli studenti secondo il tipo di scuola, si pu associare alla colonna delle frequenze assolute la colonna delle frequenze relative.
Tabella 1 bis
Nella terza colonna calcoliamo le frequenze relative e nella quarta le frequenze relative percentuali:
Tipo di scuola
N alunni
Frequenze relative
Frequenze rel. in %
Dellinfanzia
Primarie
Secondarie di 1 grado
Secondarie di 2 grado
1.662.139
2.790.254
1.764.230
2.691.713
0,1866
0,3132
0,1980
0,3022
18,66
31,32
19,80
30,22
Totale
8.908.336
1,0000
100,00
Per ricavare le frequenze relative si divide ciascuna delle frequenze assolute per la loro somma, arrotondando i quozienti ai centesimi, ai millesimi, ai decimillesimi secondo la precisione richiesta.
Si ottengono cos le frequenze relative:
f1 =
1.662.139
0,1866 arrotondato ai decimillesimi
8.908.336
f2 =
2.790.254
0,3132 arrotondato ai decimillesimi
8.908.336
f3 =
1.764.230
0,1980 arrotondato ai decimillesimi
8.908.336
f4 =
2.691.713
0,3022 arrotondato ai decimillesimi
8.908.336
Dalla colonna delle frequenze relative in percentuale si ricava che gli allievi delle scuole dellinfanzia
sono il 18,66% del totale degli studenti italiani, quelli delle scuole primarie sono il 31,32% del totale
degli studenti italiani ecc.
esempio 3
Consideriamo la distribuzione di frequenze della Tabella 5 , che riporta la distribuzione del parco autovetture per classi di cilindrata (con alimentazione a benzina) nellanno 2006.
Tabella 5 bis
Nella terza colonna calcoliamo le frequenze relative e nella quarta le frequenze relative percentuali:
Classi di cilindrata (cm3)
0
800
1.200
1.600
2.000
oltre 2.500
Totale
800
1.200
1.600
2.000
2.500
N autovetture
Frequenze relative
Frequenze rel. in %
1.735.610
9.090.133
9.509.631
2.156.710
119.753
301.812
0,0757
0,3967
0,4150
0,0941
0,0052
0,0132
7,57
39,67
41,50
9,41
0,52
1,32
22.913.649
0,9999
99,99
0060.capitolo1.qxd
1-06-2009
capitolo 1
6:29
Pagina 8
1.735.610
0, 0757
22.913.649
f2 =
9.090.133
0, 3967
22.913.649
Notiamo che la somma delle frequenze relative non 1, ma 0,9999; ci dovuto ai vari arrotondamenti: se si arrotondasse a un numero maggiore di cifre decimali si migliorerebbe la precisione.
Dallesame delle frequenze relative in percentuali si osserva che il 39,67% delle autovetture ha una
cilindrata compresa fra 800 e 1200 cm3, il 48,50% ha una cilindrata compresa fra 1200 e 1600 cm3,
e solo l1,32% delle autovetture ha una cilindrata superiore a 2500 cm3.
esempio 4
La seguente tabella composta riporta la distribuzione delle famiglie italiane secondo il numero dei
componenti rilevanti in due censimenti: 12 Censimento del 1981 e 14 Censimento del 2001 (vedere anche tabella 4) (Fonte ISTAT):
Tabella 6
N componenti
12 Censimento
N famiglie
14 Censimento
N famiglie
1
2
3
4
5
6 o pi
3.323.456
4.402.980
4.117.217
4.008.008
1.773.621
1.007.055
5.427.621
5.905.411
4.706.206
4.136.206
1.265.826
369.406
18.632.337
21.810.676
Totale
Calcoliamo le frequenze relative percentuali per le due distribuzioni; da esse possibile effettuare
confronti, meglio che con i dati grezzi (ossia i dati come sono stati rilevati nei censimenti), per esaminare come in 20 anni si modificata la composizione delle famiglie italiane.
Tabella 6 bis
N componenti
1
2
3
4
5
6 o pi
Totale
12 Censimento
Frequenze relative
percentuali
14 Censimento
Frequenze relative
percentuali
17,84
23,63
22,10
21,51
9,52
5,40
24,89
27,08
21,58
18,96
5,80
1,69
100,00
100,00
Confrontando i valori percentuali si rileva che la percentuale delle famiglie con un solo componente
aumentata dal 17,84% al 24,89%, mentre la percentuale delle famiglie con 6 o pi componenti diminuita dal 5,40% all1,69%.
0060.capitolo1.qxd
13-02-2009
paragrafo 3
10:03
Pagina 9
Rappresentazioni grafiche
Le frequenze relative, soprattutto in percentuale, sono molto utilizzate nello studio delle distribuzioni statistiche, in particolare nella presentazione e nellanalisi dei dati.
Sono noti a tutti i dati forniti da televisione, radio, giornali, riviste, internet ecc. sugli
avvenimenti di attualit.
Ad esempio, nel caso di uno sciopero di una categoria di lavoratori, i media parlano di
una partecipazione del 70%, o del 35%, dei lavoratori di quella categoria, senza indicare il numero degli aderenti allo sciopero e il totale dei lavoratori appartenenti a quella
categoria.
prima di continuare
Data la seguente tabella della distribuzione per aree geografiche della popolazione residente in Italia
al 1 gennaio 2006 (ISTAT, Italia in cifre 2007), determinare le frequenze relative e le frequenze relative percentuali.
Popolazione residente
Frequenze relative
Frequenze relative
percentuali
Nord
Centro
Mezzogiorno
26.670.323
11.321.337
20.760.051
........................
........................
........................
........................
........................
........................
Totale
58.751.711
1,0000
100,00
Aree geografiche
Vedere esercizi
a pag. 43
3 Rappresentazioni grafiche
Un primo modo per analizzare le tabelle statistiche la rappresentazione grafica che permette un esame complessivo del fenomeno oggetto di studio e consente il confronto
con rilevazioni effettuate in altri luoghi o in altri tempi.
Le rappresentazioni grafiche hanno anche uno scopo divulgativo e per questo sono presenti non solo in pubblicazioni specializzate, ma in giornali, riviste di varia natura ecc.
Si possono rappresentare graficamente sia tabelle di dati grezzi, sia tabelle di frequenze assolute o relative.
Nella rappresentazione grafica molto importante la scelta delle unit di misura, che
deve tener conto dei valori minimi e massimi dei dati da rappresentare, anche perch
una scelta non opportuna pu dare unimmagine distorta del fenomeno.
In statistica si utilizzano diversi tipi di rappresentazioni grafiche secondo il carattere qualitativo o quantitativo e si possono utilizzare vari programmi gi predisposti per il computer.
Esaminiamo le rappresentazioni grafiche pi importanti.
Diagrammi cartesiani
I diagrammi cartesiani sono utilizzati soprattutto per rappresentare serie storiche e seriazioni nel discreto.
Le unit di misura sugli assi sono generalmente diverse.
Per rappresentare serie storiche si riportano sullasse delle ascisse gli anni (o in generale i tempi di rilevazione) e sullasse delle ordinate i valori corrispondenti.
Si soliti collegare i punti rappresentativi con una spezzata per evidenziare landamento del fenomeno nel tempo, oppure si utilizzano altri modi che indicheremo negli
esempi.
0060.capitolo1.qxd
13-02-2009
capitolo 1
10:03
Pagina 10
esempio 1
a Rappresentiamo graficamente la Tabella 3 , che riporta gli investimenti delle imprese per la protezione dellambiente negli anni 1997-2006.
grafico 1
Investimenti
Milioni di euro
5.000
4.000
3.000
2.000
1.000
2006
2005
2004
2003
2002
2001
2000
1999
1998
1997
Anni
Dallesame del grafico si rileva che gli investimenti in questi 10 anni sono stati molto variabili con
un massimo notevole nel 2001 e due minimi nel 1997 e nel 2004.
b Esaminiamo mediante la rappresentazione grafica la seguente tabella.
Tabella 8
Produzione di olivo e di agrumi (in migliaia di quintali) in Italia (ISTAT, Annuari statistici italiani 2001-2007)
Anni
Olivo
Agrumi
Anni
Olivo
Agrumi
1996
1997
1998
1999
2000
2001
21.951
35.911
25.485
37.651
28.103
30.162
28.477
28.997
21.748
28.748
31.001
28.954
2002
2003
2004
2005
2006
32.313
35.461
45.342
37.748
35.181
27.891
27.813
32.286
35.180
35.289
Migliaia di quintali
40.000
30.000
Olivo
Agrumi
20.000
10.000
Anni
10
2008
2006
2004
2002
2000
1998
1996
13-02-2009
paragrafo 3
10:03
Pagina 11
Rappresentazioni grafiche
Dalla rappresentazione grafica possiamo rilevare landamento delle produzioni di olivo e di agrumi.
Entrambe le produzioni sono variabili, nei vari anni; in particolare, la produzione di olivo subisce
forti aumenti e altrettante diminuzioni.
c Rappresentiamo ora graficamente, mediante un diagramma cartesiano a barre, la seriazione con
valori nel discreto della distribuzione delle famiglie italiane secondo il numero dei componenti data dalla Tabella 4 .
Sullasse delle ascisse poniamo il numero dei componenti, sullasse delle ordinate le corrispondenti frequenze assolute:
grafico 3
0060.capitolo1.qxd
4.000.000
3.000.000
2.000.000
1.000.000
0
1
6 o pi
Numero componenti
Per evidenziare meglio la distribuzione delle famiglie, i valori corrispondenti sono tracciati con tratto pi marcato (meno bene sarebbe collegare i punti con una spezzata, perch i valori sono discreti e non esistono valori intermedi fra due successivi).
prima di continuare
Seguendo il procedimento utilizzato per rappresentare la distribuzione delle famiglie italiane nel 14 Censimento del 2001, dare la rappresentazione grafica della distribuzione delle famiglie italiane nel 12
Censimento del 1981.
Istogrammi
Per rappresentare seriazioni con i dati raggruppati in classi, cio con intervalli consecutivi, si utilizzano particolari diagrammi detti istogrammi.
Fissato un sistema di assi cartesiani ortogonali, si riportano sullasse delle ascisse tanti intervalli consecutivi che individuano le classi e su ognuno di essi si costruisce un
rettangolo in modo che larea sia proporzionale alla relativa frequenza.
Per calcolare laltezza dei rettangoli si possono presentare due casi:
le classi hanno la stessa ampiezza, perci i rettangoli hanno uguale base e quindi le altezze risultano proporzionali alle frequenze;
le classi hanno ampiezza diversa, allora le altezze si ottengono dividendo la frequenza per lampiezza della relativa classe.
esempio 2
a Rappresentiamo mediante un istogramma la tabella della rilevazione dei ragazzi presenti a uno spettacolo teatrale secondo le classi di et.
11
0060.capitolo1.qxd
13-02-2009
capitolo 1
10:03
Pagina 12
Tabella 9
Classi di et
6
8
10
12
14
16
N ragazzi
8
10
12
14
16
18
Totale
20
25
40
32
23
10
150
Le classi di questa distribuzione sono intervalli che contengono lestremo sinistro e non il destro:
sono dette classi chiuse a sinistra e aperte a destra.
Lampiezza delle classi costante, perci, dopo aver riportato gli intervalli di et, costruiamo i rettangoli aventi altezza proporzionale alle rispettive frequenze.
grafico 4
Presenze a spettacolo
Numero di ragazzi
40
35
30
25
20
15
10
5
0
0
10
Et
12
14
16
18
20
b Rappresentiamo graficamente la Tabella 5 , che riporta la distribuzione del parco autovetture alimentate a benzina secondo classi di cilindrata (cm3). Lultima classe contiene le autovetture di cilindrata superiore a 2500 cm3 e per rappresentarla si deve fissare lestremo destro dellultimo intervallo (abbiamo scelto 3000 cm3).
Avendo alcune classi ampiezze diverse e quindi i rettangoli basi diverse, dobbiamo determinare le altezze dividendo ogni frequenza per lampiezza della relativa classe (arrotondando i
valori ai centesimi) secondo lo schema seguente:
Classi di cilindrata
0
800
1200
1600
2000
2500
12
800
1200
1600
2000
2500
3000
N autovetture
1.735.610
9.090.133
9.509.631
2.156.710
119.753
301.812
800
400
400
400
500
500
= 2.169,51
= 22.725,33
= 23.774,08
= 5.391,78
=
239,51
=
603,62
13-02-2009
Pagina 13
Rappresentazioni grafiche
grafico 5
3.000
2.800
2.600
2.400
2.200
2.000
1.800
1.600
1.400
1.200
1.000
800
600
400
0
200
paragrafo 3
10:03
0060.capitolo1.qxd
Dallesame della rappresentazione grafica risulta evidente che la maggior parte delle autovetture
ha cilindrata compresa fra 800 cm3 e 1600 cm3. Questo risultato confermato dalla Tabella 5 bis
delle frequenze in %, da cui si poteva dedurre che oltre l81% delle autovetture ha cilindrata compresa fra quei valori.
prima di continuare
data la tabella seguente, che riporta la distribuzione di 120 famiglie secondo la spesa sostenuta (in
euro) per spettacoli cinematografici in un mese:
Classi di spesa
0
50
100
150
200
50
100
150
200
250
N famiglie
10
22
30
40
18
........................ .
esempio 3
a Rappresentiamo con un ortogramma la seguente tabella sulla rilevazione della superficie (in migliaia di ettari) secondo le principali coltivazioni nellanno 2005 (ISTAT, Italia in cifre 2007).
Tabella 10
Prodotti agricoli
Agrumi e fruttiferi
Barbabietola da zucchero
Olivo
Ortive
Foraggiere
Frumento
Mais
13
13-02-2009
Pagina 14
grafico 6
Migliaia di ettari
2.500
2.000
1.500
1.000
mais
frumento
foraggiere
barbabietola
agrumi e fruttiferi
500
0
ortive
capitolo 1
10:03
olivo
0060.capitolo1.qxd
Coltivazioni
Nord
Centro
Mezzogiorno
Italia
25.875
21.437
12.316
11.986
12.021
4.704
50.212
38.127
grafico 7
Arrivi clienti
N clienti
60.000
Italiani
Stranieri
50.000
40.000
30.000
20.000
10.000
0
Nord
Centro
Sud
Italia
Zone geografiche
I rettangoli possono anche essere posti orizzontalmente. Si parla allora di diagramma a nastro, come indicato nel seguente diagramma della precedente Tabella 11 .
grafico 8
Arrivi clienti
Stranieri
Nord
Centro
Sud
60.000
50.000
40.000
30.000
20.000
10.000
Italiani
N clienti
14
0060.capitolo1.qxd
13-02-2009
paragrafo 3
10:03
Pagina 15
Rappresentazioni grafiche
esempio 4
Tabella 12
Distribuzione degli istituti di cura del Servizio Sanitario Nazionale per area geografica nellanno 2003
(ISTAT, Italia in cifre 2007)
Aree geografiche
N istituti
Frequenze (%)
436
300
545
34,04
23,42
42,54
1.281
100,00
Nord
Centro
Mezzogiorno
Italia
grafico 9
Mezzogiorno
42,54%
122 33
84 19
153 08
Centro
23,42%
Cartogrammi
I cartogrammi servono per rappresentare lintensit di un fenomeno in diverse zone geografiche.
Su una carta geografica si contrassegnano le varie parti in cui
suddiviso il fenomeno mediante simboli convenzionali e colori di diversa gradazione.
Riportiamo il cartogramma sulla densit della popolazione residente in Italia (numero di abitanti per km2; ISTAT, Italia in cifre 2007).
grafico 10
72
38
394
153
Fino a 100
Da 101 a 200
Da 201 a 300
Oltre 300
255
170
294
188
156
157
102
121
306
73
416
210
60
68
133
195
15
0060.capitolo1.qxd
13-02-2009
capitolo 1
10:03
Pagina 16
Ideogrammi
Sono rappresentazioni mediante figure di grandezza dipendente dallintensit del fenomeno, oppure figure uguali accostate (o parti di figura) secondo la frequenza assoluta del fenomeno.
Si utilizzano soprattutto a scopo divulgativo.
Diamo lideogramma degli immigrati residenti in Italia negli anni dal 2001 al 2005 (da
Il Sole-24 Ore dell11 marzo 2007).
grafico 11
Vedere esercizi
a pag. 47
2001
1.334
2002
1.549
2003
1.990
2004
2.402
2005
2.670
4 Medie statistiche
Dopo aver rilevato i dati di unindagine statistica e dopo aver effettuato una o pi rappresentazioni grafiche per visualizzare il fenomeno, si cerca di sintetizzare i dati mediante uno o pi valori, detti medie statistiche, per poter confrontare fra loro dati riguardanti fenomeni analoghi in tempi diversi o in luoghi differenti.
Secondo la definizione classica di A.L. Cauchy (1789-1857), si considera media di un
insieme di numeri un qualsiasi valore compreso fra il minimo e il massimo dellinsieme.
Si possono avere varie medie in relazione al fenomeno oggetto della rilevazione e al
metodo della loro determinazione.
Si soliti distinguere due tipi di medie:
medie di calcolo, che si ottengono tenendo conto di tutti i dati rilevati;
medie di posizione, che si ricavano tenendo conto solo di particolari valori.
Esaminiamo ora le seguenti medie elementari che danno informazioni importanti nello studio di una rilevazione statistica: la media aritmetica, la mediana e la moda.
Media aritmetica
Fra le medie di calcolo, quella pi nota e pi utilizzata la media aritmetica.
Si definisce media aritmetica di n valori x1, x2, ..., xn il numero che si ottiene dividendo per n la somma dei valori:
x + x +...+ xn
M= 1 2
n
16
0060.capitolo1.qxd
13-02-2009
paragrafo 4
10:03
Pagina 17
Medie statistiche
La propriet di questo valore medio che, sostituito ai dati, mantiene invariata la loro somma; infatti si ha:
x1 + x2 + ... + xn = M + M + ... + M = nM
da cui si ricava il valore di M.
esempio 1
Le votazioni riportate da un allievo nelle verifiche scritte di matematica nel primo quadrimestre sono
state:
6
6,5
7
4,5
5
Calcoliamo il voto medio con la media aritmetica:
M=
6 + 6,5 + 7 + 4,5 + 5 29
=
= 5,8
5
5
Il valore 5,8 una votazione non attribuita ad alcuna verifica, ma sintetizza il complesso delle votazioni.
esempio 2
Con i dati della Tabella 3 , determinare limporto annuo medio degli investimenti (in milioni di euro)
delle imprese per la protezione dellambiente nel periodo 1997-2006.
Si ricava:
M=
Pertanto, nel decennio sono stati investiti in media annualmente 1.991,6 milioni di euro.
Anche in questo caso osserviamo che tale valore non stato investito in nessun anno, per sintetizza tutti i dati mantenendo costante la loro somma.
esempio 3
Nella Tabella 8 riportata la produzione annua di olivo e di agrumi (in migliaia di quintali) in Italia.
Sintetizziamo i dati calcolando la produzione media annua.
Per lolivo si ricava:
M1 =
Per la produzione media di olivo si pu dire che il valore medio trovato 33.209, 81 compreso fra la
minima produzione 21.951 e la massima 45.342 nel periodo rilevato.
Allo stesso modo, per la produzione media di agrumi si pu dire che il valore medio trovato 29.671, 27
compreso fra la minima produzione 21.748 e la massima 35.289 nel periodo rilevato.
Finora abbiamo esaminato il calcolo della media aritmetica di valori che si presentano
una sola volta nella rilevazione. La media aritmetica cos determinata viene detta media aritmetica semplice e si applica per le serie statistiche (ad esempio, temporali, territoriali ecc.)
Vi sono altre distribuzioni statistiche in cui i valori si presentano con frequenze diverse, e nella media si deve tenere conto non solo dei valori, ma anche delle frequenze assolute, che vengono dette pesi, in quanto i rispettivi valori contribuiscono diversamente al calcolo della media.
17
0060.capitolo1.qxd
13-02-2009
capitolo 1
10:03
Pagina 18
esempio 4
In una scuola secondaria di primo grado stata fatta una rilevazione sul numero di libri della biblioteca letti in un mese dagli alunni e si ricavata la seguente tabella.
Tabella 13
Rilevazione del numero dei libri letti dagli allievi di una scuola secondaria di primo grado
N libri letti
N allievi
0
1
2
3
4
5
12
26
44
28
23
17
Totale
150
Per calcolare il numero medio di libri letti non si deve fare la media aritmetica semplice tra i valori 0,
1, 2, 3, 4, 5, ma si deve tenere conto del numero degli allievi che hanno letto i libri.
Infatti 12 allievi hanno letto zero libri, quindi 0 12 = 0 sono i libri letti da quegli allievi, 26 allievi hanno letto 1 libro, quindi 1 26 = 26 sono i libri letti da quegli allievi, 44 allievi hanno letto 2 libri, perci 2 44 = 88 sono i libri letti da quegli allievi; ecc.
Pertanto si ha:
M=
(0 + 0 + ... + 0)12 volte + (1 + 1 + ... + 1)26 volte + ..... + (5 + 5 + ... + 5)17 volte
150
0 12 + 1 26 + ... + 5 17
=
= 2,5
150
In pratica, per tener conto delle diverse frequenze si aggiunge alla precedente tabella una colonna
con i prodotti di ciascun valore (numero libri letti) per la rispettiva frequenza (numero lettori):
N libri letti xi
N allievi yi
Prodotti xi yi
0
1
2
3
4
5
12
26
44
28
23
17
0
26
88
84
92
85
150
375
Totali
Il valore 375 rappresenta la totalit dei libri letti dai 150 allievi, pertanto si ricava:
M=
375
= 2,5
150
Si pu dire che in media ogni allievo ha letto, nel mese considerato, due libri e mezzo.
In generale, dati n valori x1, x2, ..., xn, con pesi y1, y2, ..., yn, si definisce media aritmetica ponderata il rapporto fra la somma dei prodotti di ogni valore per il rispettivo peso e la somma dei pesi:
x y + x y + ... + xn yn
M= 1 1 2 2
y1 + y2 +...+ yn
18
0060.capitolo1.qxd
13-02-2009
capitolo 1
10:03
Pagina 33
Medie statistiche
Media aritmetica
semplice: uguale alla somma dei dati divisa per n:
Rappresentazioni statistiche
M=
x1 + x2 + ... + xn
n
33
0060.capitolo1.qxd
13-02-2009
10:03
Pagina 34
Applicazioni informatiche
Proposte di laboratorio
a) un foglio elettronico con il calcolo delle frequenze
b) lalgoritmo per il calcolo della media aritmetica
c) un foglio elettronico per il calcolo delle medie semplici, della moda e della mediana
d) un foglio elettronico per il calcolo della media ponderata
e) un foglio elettronico per il calcolo dei vari tipi di medie
f) un foglio elettronico con il calcolo degli indici di variabilit
34
0060.capitolo1.qxd
13-02-2009
10:03
Pagina 35
APPLICAZIONI INFORMATICHE
s:=0
i da 1 a n
12
12
LEGGERE a
25
37
17
54
33
87
42
129
51
180
s:=s+a
m:=s/n
STAMPARE s,m
30
FINE
35
0060.capitolo1.qxd
capitolo
13-02-2009
10:03
Pagina 36
Come esempio, impostiamo una tabella con le misure dellaltezza e del peso di un gruppo
di persone.
Il foglio contiene:
la zona A3:A26 per inserire le lettere identificative delle persone;
la zona B3:B26 che contiene le misure dellaltezza e la zona C3:C26 per le misure di
peso;
la riproduzione grafica a istogramma delle due misure; la zona A28:C33 per calcolare alcuni indici statistici con le formule di libreria.
36
0070.capitolo1eser.qxd
13-02-2009
10:38
Pagina 39
ESERCIZI
c apitolo
Elementi
di statistica descrittiva
zione.
b Per unit statistica si intende ogni valore di un insieme di dati.
V F
V F
V F
V F
V F
39
0070.capitolo1eser.qxd
capitolo
13-02-2009
10:38
Pagina 40
Sviluppare le abilit
Esercizi di primo livello
1
2 Distribuzioni statistiche
Verificare le conoscenze
A
zione.
b Per carattere statistico si intende un modo di presentare una rilevazione.
lazione statistica.
b Un carattere quantitativo si esprime mediante numeri o intervalli di numeri reali ottenuti con enumerazioni o con misurazioni.
4) Che cosa si intende per serie statistica?
a Per serie statistica si intende una successione di dati rilevati secondo un carattere
qualitativo.
b Per serie statistica si intende un insieme di numeri in successione.
tere quantitativo.
b Per seriazione statistica si intende un insieme di numeri legati da una legge matematica.
40
ESERCIZI
0070.capitolo1eser.qxd
paragrafo
13-02-2009
10:38
Pagina 41
Distribuzioni statistiche
ESERCIZI
modalit.
7) Che cosa si intende per frequenza relativa?
a Per frequenza relativa si intende il rapporto fra una modalit del carattere quantita-
V F
V F
V F
V F
V F
V F
V F
Sviluppare le abilit
Esercizi di primo livello
Analizzare le seguenti tabelle statistiche distinguendo le serie dalle
seriazioni e, in caso di distribuzione di frequenze, calcolare le frequenze
relative e le frequenze percentuali.
3
Tabella 1 Rilevazione delle forze di lavoro (in migliaia) nellanno 2006 secondo le zone geo-
Nord
Centro
Mezzogiorno
Totale
12.266
4.971
7.425
24.662
41