Sei sulla pagina 1di 5

Statistica IV canale - Roma Tre - a.a.2010/11 - Prof. M.

Barbieri

Distribuzioni in classi
Quando il carattere rilevato ` di tipo quantitativo continuo si costruisce la distribuzione per e classi di frequenza in cui le modalit` vengono raggruppate in classi (intervalli di valori); a a ciascuna classe si associa la frequenza delle unit` statistiche che presentano una modalit` a a compresa tra gli estremi della classe. Linterpretazione delle frequenze (assolute, relative e percentuali) per distribuzioni in classi non cambia, anche se, in tal caso, le frequenze sono riferite alle classi e non pi` alle singole modalit`. u a Spesso, anche se non necessariamente, si considerano classi della stessa ampiezza. In ogni caso le classi devono essere contigue (senza spazi tra luna e laltra, per evitare di perdere alcuni valori), disgiunte (senza elementi in comune, per evitare ambiguit` ) ed esaustive a (devono essere considerati tutti i valori del campo di variazione della variabile). Esempio: Reddito disponibile netto annuo in un campione di 14031 individui nel 2001 (Banca dItalia, Indagine sui bilanci delle famiglie italiane, 2002) Classi di reddito [0, 5000) [5000, 15000) [15000, 30000) [30000, 50000) [50000, 100000) [100000, 200000] Totale frequenze assolute frequenze relative 1394 0.099 3219 0.299 3708 0.264 4495 0.320 886 0.063 329 0.023 14031 1 frequenze percentuali 9.9 29.9 26.4 32.0 6.3 2.3 100

La classe i-esima (i = 1, 2, . . . , k) del carattere X viene rappresentata come (xi1 , xi ] oppure xi1 xi in questo caso si dice chiusa a destra e aperta a sinistra ed indica che stiamo considerando tutte le modalit` x tali che a xi1 < x xi in alternativa [xi1 , xi ) oppure xi1 xi

Statistica IV canale - Roma Tre - a.a.2010/11 - Prof. M. Barbieri

in questo caso si dice aperta a destra e chiusa a sinistra ed indica che stiamo considerando tutte le modalit` x tali che a xi1 x < xi Quindi se suddividiamo in k classi lintervallo dei valori assumibili dalla variabile X, che supponiamo vadano da un minimo pari a x0 ad un massimo pari a xk , le distribuzioni di frequenze assolute, relative e percentuali del carattere hanno la forma classi di modalit` frequenze a di X assolute [x0 , x1 ] n1 (x1 , x2 ] n2 . . . . . . (xi1 , xi ] ni . . . . . . (xk1 , xk ] totale nk n frequenze relative f1 = n1 /n f2 = n2 /n . . . fi = ni /n . . . fk = nk /n 1 frequenze percentuali f1 100 f2 100 . . . fi 100 . . . fk 100 100

La suddivisione in classi pu` essere conveniente anche per i caratteri quantitativi discreti, o allorch il numero di osservazioni sia elevato e il campo di variazione del carattere sia ampio. e Esempio: Consideriamo la distribuzione di 50 studenti rispetto al carattere numero di esami sostenuti numero di esami sostenuti [0, 2] (2, 5] (5, 11] totale numero di studenti 9 18 23 50

Si tenga conto che, ad esempio, la seconda classe di modalit` , ovvero (2, 5], vista la natura a discreta del carattere, corrisponde, di fatto ai valori {3, 4, 5}.

Istogrammi
Un istogramma ` una rappresentazione graca per distribuzioni di caratteri quantitativi in e classi. E costituito da rettangoli aancati, ciascuno di base una classe ed area pari alla frequenza corrispondente. Un istogramma viene disegnato in un sistema di riferimento cartesiano in cui lasse delle ascisse corrisponde alla variabile rilevata. Per ogni classe (xi1 , xi ] (i = 1, 2, . . . , k) disegniamo un rettangolo di base (xi1 , xi ] ed area pari alla frequenza della classe, cio` a ni o a fi . La base misura, nel caso di caratteri continui, e (xi xi1 ),

Statistica IV canale - Roma Tre - a.a.2010/11 - Prof. M. Barbieri quindi laltezza, nel caso si utilizzino le frequenze assolute, deve misurare hi = ni . (xi xi1 ) fi . (xi xi1 )

Se invece si fa riferimento alle frequenze relative, hi =

Si noti che, nei due casi, cambia solo la scala dellasse delle ordinate e non la forma del graco. Considerazioni analoghe valgono qualora si utilizzino le frequenze percentuali. La misura dellaltezza di ciascun rettangolo, hi , ` il rapporto tra la frequenza e lampiezza della e classe: interpretabile come il grado di addensamento delle frequenze nella corrispondente classe. Per questa ragione hi ` detta densit` di frequenza della classe i-esima. e a Esempio: Consideriamo la seguente distribuzione per et` a

classi det` frequenze assolute a (xi1 , xi ] ni [0, 15] 2 (15, 64] 2 (64, 100] 2 totale 6

Le classi non hanno tutte la stessa ampiezza. Come possiamo rappresentare gracamente la distribuzione in modo che si comprenda la diversa importanza delle classi, in termini di frequenza? Vediamo il problema da un altro punto di vista: abbiamo tre brocche che contengono rispettivamente 15, 49, 36 dl di succo di frutta. In ciascuna aggiungiamo 2 dl di spumante. Quale dei tre cocktails ha il pi` elevato grado alcoolico? Quello con la maggiore densit` di u a spumante! Le informazioni da utilizzare per rappresentare gracamente la distribuzione di frequenze assolute delle et` sono contenute nella seguente tabella: a classi det` fr. assolute a (xi1 , xi ] ni [0, 15] (15, 64] (64, 100] Listogramma corrispondente ` e 2 2 2 ampiezze xi xi1 15 49 36 densit` a
2 15 2 49 2 36 ni xi xi1

= 0.13 = 0.04 = 0.06

Statistica IV canale - Roma Tre - a.a.2010/11 - Prof. M. Barbieri

0.13

densita di frequenza

0.04

0 0 15 eta 64 100

Esempio: Riprendiamo lEsempio sul Reddito disponibile netto annuo nel campione della Banca dItalia: Classe di reddito (migliaia di euro) [0, 5) [5, 15) [15, 30) [30, 50) [50, 100) [100, 200] Totale Frequenze relative fi 0.099 0.229 0.264 0.320 0.063 0.023 1 Ampiezza classi 5 10 15 20 50 100 densit` di frequenza a hi 0.0199 0.0229 0.0176 0.0160 0.0012 0.0002

Listogramma corrispondente ` il seguente e

densita di frequenza

0.000
0

0.005

0.010

0.015

0.020

50

100 reddito (in migliaia di euro)

150

200

Statistica IV canale - Roma Tre - a.a.2010/11 - Prof. M. Barbieri

Esempio: Consideriamo la distribuzione per et` (in anni compiuti) della popolazione residente a in Italia al primo gennaio 2001: let` , anche se indicata da un carattere a valori interi, ` a e comunque un carattere continuo.

frequenze assolute ni . [0, 15) 8 303. 904 [15, 65) 38. 984. 178 [65, 100) 10. 555. 935 totale 57. 844. 017

classi di et` a

frequenze relative fi 0.144 0.674 0.182 1

ampiezza delle classi 15 50 36

densit` a hi 0.0096 0.0135 0.0051

Listogramma che la rappresenta ` e


distribuzione per eta della popolazione residente in Italia (1/1/2001)
0.014 densita di frequenza 0.0
0

0.002

0.004

0.006

0.008

0.010

0.012

15 eta (in anni compiuti)

65

100

Listogramma ` una rappresentazione intuitivamente coerente con il graco a barre per variabili e quantitative discrete. Infatti in questultimo caso si pu` pensare che ogni classe sia ridotta ad o un solo punto e quindi larea si riduca allaltezza ni (o fi ). Solo nel caso in cui le classi abbiano tutte la stessa ampiezza, per costruire listogramma possiamo far riferimento direttamente alle frequenze. Infatti se le classi hanno tutte la stessa ampiezza non ` necessario calcolare le densit` di e a frequenza delle classi, poich le densit` risultano proporzionali alle frequenze (le basi dei e a rettangoli sono tutte della stessa lunghezza e i denominatori delle densit` sono tutti uguali a tra di loro e pari alla dimensione di ciascuna classe).