Sei sulla pagina 1di 22

Cap.

4
Distribuzioni di frequenza,
tabelle e grafici
Cio come si sfruttano i dati grezzi, perch da qui che
inizia lanalisi statistica

I dati grezzi

Il risultato della rilevazione del fenomeno X sulla


popolazione U di numerosit N un insieme di N
osservazioni
Ciascuna osservazione coincide con una (e una sola) delle k
modalit xi previste dalla scala utilizzata.

Esempio: il numero di partner degli studenti universitari:


fenomeno X quantitativo e discreto, che si rileva contando;
le sue modalit xi sono i numeri interi 0,1,...; la scala delle
modalit quantitativa rapporto.

Distribuzioni di frequenza

L'analisi statistica procede per sintesi successive: l'obiettivo di fare emergere


dai dati, ad ogni livello di sintesi, informazioni utili a
descrivere e spiegare il comportamento di X su U.

Il numero di volte in cui una modalit xi stata rilevata in U si chiama frequenza


(assoluta). La somma delle frequenze assolute riproduce la numerosit N di U
La colonna di destra costituisce la distribuzione di frequenza. La distribuzione
delle frequenze assolute si costruisce per conteggio e consente di organizzare i
dati in tabella

x1
x4

f4

x9

f9

Variabili statistiche

Le modalit xi , a seconda della natura del fenomeno X e della


tipologia di scala utilizzata, possono essere attributi, categorie,
numeri, intervalli
Le frequenze fi sono sempre numeri interi non negativi

Una variabile statistica (v.s.) un insieme di k coppie {xi, fi},

v.s. xi , f i , i 1 k , f i N
i 1

X indica sia il fenomeno di interesse (prima di essere rilevato), sia la


corrispondente variabile statistica (dopo la rilevazione e la
strutturazione dei dati grezzi)
Il passaggio dai dati grezzi alla v.s. ha fatto ordine, nel senso di
rendere i dati pi organizzati e leggibili, ma ha perso l'ordine, nel
senso che non abbiamo pi l'informazione sull'ordine con il quale i
dati sono stati rilevati
5

Frequenze relative e percentuali

Se l'obiettivo il confronto delle distribuzioni di frequenza


di X su pi popolazioni con numerosit diversa, occorre
depurare le frequenze assolute dall'influenza di N
costruendo le frequenze relative
i
f i : N pi : 1
i

f
p
N

Le percentuali sono le frequenze relative moltiplicate


per
f

100
100f i : N perci : 100
perci i
pi 100

v.s. xi , f i , i 1 k , f i N

i 1

fi
pi
N

v.s. xi , pi , i 1 k , pi 1
i 1

f i 100
perci
pi 100
N

v.s. xi , pi 100 , i 1 k , pi 100

i 1

Frequenze cumulate
Quando X ordinale o cardinale buona pratica costruire la v.s. ordinando
in senso crescente le modalit osservate
Le frequenze cumulate ci dicono quante sono le unit statistiche che manifestano
una modalit non superiore di una certa
i ..ovvero minore o uguale a tale

Fi f1 f 2 f i f j
j 1

xi

Fi
i p1 p2 pi p j
N
j 1
46 studenti hanno non pi di 5
partners (ovvero un num. di
partners minore o uguale a 5)

Il 50% degli studenti ha non pi di 2


partners
(il 50% degli studenti ha pi di 2
partners)
8

Distribuzioni di frequenza per variabili statistiche


con modalit raggruppate in classi
Carattere continuo o con un numero di modalit molto elevato

Fenomeni quantitativi continui: classi di modalit

classi di modalit

10

X 10

10

20

10 X 20
Scala delle modalit

20

X 20

Fenomeni quantitativi continui: classi di modalit

Estremo inferiore
classi di modalit

10

X 10

xl

xL

10

20

10 X 20
Scala delle modalit

Estremo superiore

20

X 20

Classe
aperta

Fenomeni quantitativi continui: classi di modalit


Estremi delle classi di modalit

xl xL
x
2
*
i

E.inferiore

xl

x1 x2

E.superiore

xL

xL xl

xk 1

xk
Scala o insieme
delle modalit di X

Ampiezza della classe


Classi di modalit

xl

xL

Estremi esclusi

xl

xL

Estremi inclusi

xl

xL

Estremo sup.
incluso

xl

xL

Estremo inferiore
incluso

xL

xl

Estremo inferiore
incluso

fi

16

x1
32

25

x2
45

39

89

xl

xL

xk 1

xk

55

60

70

82

Ipotesi del
valore
centrale

xl xL
x
2
*
i

xL xl

fi

x1
32

38.5

50

57.5

65

76

13

10

10

12

16

25

39

89

x2
45

xl

xL

xk 1

xk

55

60

70

82

Le densit
di frequenza

fi
i
xL xl

x1
32

Quante u.s. si osservano nellintervallo per ogni


unit di misura della v.s. (in questo caso lanno)
nellipotesi di equi-ripartizione
Indicano laddensamento delle osservazioni nelle
diverse classi, al netto della diversa ampiezza

x2
45

xl

xL

xk 1

xk

55

60

70

82

Le densit
di frequenza

f i i x L xl

fi
i
xL xl
Istogrammi
(rappresentazione grafica
delle frequenze)

89
25

16

x1
32

x2
45

39
8

1.6

xl
55

xL

xk 1

xk

60

70

82

Rappresentazioni grafiche
Dalle distribuzioni di frequenza (assolute, relative,
% e cumulate) si possono costruire grafici
I grafici sono alternativi alle tabelle: non si tratta di
una ulteriore forma di sintesi, ma solo di una
diversa presentazione
I grafici sono preferibili alle tabelle soprattutto se k
grande
Per i fenomeni qualitativi il grafico un semplice
disegno (barre, torte...), in cui l'altezza/lunghezza
delle barre o la dimensione dello spicchio della
torta danno un'idea della frequenza associata a
ciascuna categoria xi osservata

17

Esempio

18

Rappresentazioni grafiche
di fenomeni quantitativi
Per i fenomeni quantitativi, dove anche le xi, oltre alle fi , sono
dei numeri, si costruiscono dei diagrammi cartesiani: sull'asse
delle ascisse si mettono le xi, su quello delle ordinate le fi o le pi
Fenomeni discreti: il diagramma pi efficace quello a
bastoncini : in corrispondenza di ogni modalit xi, identificata
con un singolo punto sulle ascisse, si innalza un bastoncini
alto quanto la corrispondente frequenza posta sulle ordinate
Fenomeni continui: se si fa l'ipotesi del valore centrale
questo equivale ad una discretizzazione (vedi sopra); se si fa
invece l'ipotesi della distribuzione uniforme, la frequenza
viene rappresentata da un'area, con un istogramma.
L'istogramma l'unica rappresentazione sensata quando le
classi hanno un'ampiezza diversa.

19

Esempio

20

Sintesi del capitolo


La prima forma di sintesi dei dati data dalla distribuzione di
frequenza assoluta che, per ogni modalit del carattere, ci dice
quante u.s. presentano quella modalit: la loro somma da la
numerosit totale della popolazione
Per favorire il confronto si ricorre alle frequenze relative e
percentuali che ci dicono quale quota di u.s. su 1 (o su 100)
presentano una certa modalit: la loro somma da 1 (o 100)
Un informazione ulteriore costituita dalle frequenze cumulate
che, per ogni modalit, ci dice quante u.s. presentano un valore
minore o uguale a quella data modalit: hanno senso solo se il
carattere almeno ordinabile
Quando il carattere continuo o misurato con una scala che
prevede un elevato numero di modalit (generalmente
quantitativa), si ricorre a distribuzioni di frequenza per modalit
raggruppate in classi, caratterizzate da una certa ampiezza e da un
certo valore centrale
La densit rappresenta laddensamento della frequenza in ogni
classe e consente di svincolar e il giudizio sulla frequenza
dallampiezza della classe

Ancora sulle densit di frequenza


Densit di popolazione: Numero di abitanti per kmq

Popolazione
Superficie( Km 2 )

fi
Unit stat.

xL xl Ampiezza