Sei sulla pagina 1di 25

1/2

Istogramma delle frequenze

Per campioni di grandi dimensioni, è utile l’istogramma delle


frequenze (invece dei dati)
Esempio: altezze in cm di un campione di 120 studenti

Il diagramma di punti è poco utile in questo caso


Statistica. Metodologie per le scienze economiche e sociali 3e Copyright © 2014 McGraw-Hill Education Italy srl
S. Borra, A. Di Ciaccio
2/2 Divisione in classi

Raggruppo i valori della variabile X in sottoinsiemi e valuto la


frequenza per ogni sottoinsieme

Devo decidere:

§il numero di classi (né troppo elevato, né troppo piccolo):


in generale compreso tra 5 e 20;

§ l’ampiezza delle classi (per esempio uguale ampiezza)

L’Istogramma è un grafico costituito da barre con basi uguali o


diverse, dove ogni barra possiede un’area proporzionale alla
corrispondente frequenza.

Statistica. Metodologie per le scienze economiche e sociali 3e Copyright © 2014 McGraw-Hill Education Italy srl
S. Borra, A. Di Ciaccio
3/2

ü I dati in tabella sono compresi tra 150 e 184 (range di variazione);


ü Raggruppiamo i dati in 7 intervalli di uguale ampiezza (4 cm):

I1 = [150,154] , I 2 = [155,159] , I 3 = [160,164] , I 4 = [165,169] , I 5 = [170,174] ,


I 6 = [175,179], I 7 = [180,184]

üConsidero il punto medio delle classi e valuto le frequenze assolute;


Statistica. Metodologie per le scienze economiche e sociali 3e Copyright © 2014 McGraw-Hill Education Italy srl
S. Borra, A. Di Ciaccio
4/2

Statistica. Metodologie per le scienze economiche e sociali 3e Copyright © 2014 McGraw-Hill Education Italy srl
S. Borra, A. Di Ciaccio
5/2
Osservazioni

La scelta del numero di classi (e ampiezza di ogni classe)


è importante:

ü Troppe classi (troppe informazioni


poco rilevanti)

ü Poche classi (poche informazioni)

ü N.B.: Ordinata (h) x Ampiezza=Freq. Assoluta!

Statistica. Metodologie per le scienze economiche e sociali 3e Copyright © 2014 McGraw-Hill Education Italy srl
S. Borra, A. Di Ciaccio
6/2
Esempi di grafico ad aree
4.000

3.500

3.000
Grafico ad aree
2.500

2.000

1. 5 0 0

1. 0 0 0

500

1995 1996 1997 1998 1999 2000 2001

ü Evidenzia l’andamento del fenomeno rispetto alle modalità di un


carattere continuo (per es. il tempo).

ü Si ha una spezzata che unisce i punti aventi come coordinate i


i valori delle frequenze corrispondenti ai valori di ascissa osservati.

ü Posso aggiungere colori e tridimensionalità.


Statistica. Metodologie per le scienze economiche e sociali 3e Copyright © 2014 McGraw-Hill Education Italy srl
S. Borra, A. Di Ciaccio
7/2
100
90
80
70
60 Servizi

Grafico ad aree 50
40 Industria

sovrapposte 30
20
A grico ltura
10
0
1971 1981 1991 2001

ü Distribuzione degli occupati per settore di attività economica


in vari censimenti.

Statistica. Metodologie per le scienze economiche e sociali 3e Copyright © 2014 McGraw-Hill Education Italy srl
S. Borra, A. Di Ciaccio
8/2
Grafici a torta
ü Sono utili quando si vuole rappresentare la composizione di un
aggregato (in termini di valori relativi o percentuali).

ü La generica fetta corrispondente alla j-esima modalità è definita


dal corrispondente angolo al centro, a sua volta ottenuto con una
proporzione:
p j : 100 = g j : 360
Da cui ottengo:
p j × 360
gj =
100

Statistica. Metodologie per le scienze economiche e sociali 3e Copyright © 2014 McGraw-Hill Education Italy srl
S. Borra, A. Di Ciaccio
9/2
Esempio di grafico a torta
Distribuzione di frequenze percentuali del carattere
"provincia di residenza"
RI
FR 10%
20% RM
45%

LT
25%
RM LT FR VT RI

ü Questa rappresentazione è utile con distribuzioni con un numero di


modalità non troppo elevato (aumentando i settori circolari la dimensione
diminuisce ed è più difficile da confrontare)
Statistica. Metodologie per le scienze economiche e sociali 3e Copyright © 2014 McGraw-Hill Education Italy srl
S. Borra, A. Di Ciaccio
10/2 Esempio di grafico radar
Gen.
50
Dic. Feb.
40

30 N. di matrimoni in Italia per mese


Nov. Mar.
20 di celebrazione (in migliaia),
10
anno 1998.

Ott. 0 Apr.

Set. Mag.

Ago. Giu.

Lug.

ü È utile quando il carattere è ciclico (nascite per mese, matrimoni per mese,
vendita di un prodotto per mese);

Statistica. Metodologie per le scienze economiche e sociali 3e Copyright © 2014 McGraw-Hill Education Italy srl
S. Borra, A. Di Ciaccio
11/2
Come costruisco un grafico radar
ü Suddivido l’angolo di 360° in parti uguali quante sono le modalità
del carattere ciclico cioè avremo tanti raggi quante sono le modalità;

ü gli angoli compresi tra coppie di raggi avranno stessa ampiezza;

ü su ogni raggio, si calcola un segmento di lunghezza proporzionale


(o uguale) alla corrispondente frequenza.

ü unire con una spezzata gli estremi dei segmenti e colorare l’area
interna al poligono che si viene a formare. Gen.
50
Dic. Feb.
40

30
Nov. Mar.
20

10

Ott. 0 Apr.

Set. Mag.

Ago. Giu.

Lug.

Statistica. Metodologie per le scienze economiche e sociali 3e Copyright © 2014 McGraw-Hill Education Italy srl
S. Borra, A. Di Ciaccio
12/2
Cartogramma
Cartogramma: Tasso di disoccupazione per regione, Italia,
luglio 2003.

ü Utile per rappresentare serie


Tasso di disoccupazione per regione territoriali;
luglio 2003

% forza lavoro. ü utilizzo una mappa con contorni


2-3 delle aree geografiche rispetto
3-6
6 - 15 alle quali si riportano le frequenze
15 - 22 di un carattere (popolazione
residente, nascite, età media,
reddito medio);

ü ripartizioni colorate: ogni area della


carta è colorata in base alla
distribuzione in frequenza.

Statistica. Metodologie per le scienze economiche e sociali 3e Copyright © 2014 McGraw-Hill Education Italy srl
S. Borra, A. Di Ciaccio
Diagramma cartesiano
13/2

Serie storica dei Tassi di attività per ripartizione geografica,


1995-2001, Italia.
69,0
67,0
65,0 NORD
CENTRO
63,0
SUD
61,0
59,0
57,0
1995 1996 1997 1998 1999 2000 2001

ü Utile quando si hanno serie storiche (anche più serie congiunte);

ü ho una successione di punti su un piano cartesiano, con ascisse il tempo


e ordinate il carattere osservato;

ü i punti sul piano vengono uniti con segmenti rappresentati una spezzata
che schematizza l’andamento nel tempo del fenomeno.
Statistica. Metodologie per le scienze economiche e sociali 3e Copyright © 2014 McGraw-Hill Education Italy srl
S. Borra, A. Di Ciaccio
Capitolo 3
Sintesi
della
distribuzione di
un carattere:
le medie

Statistica. Metodologie per le scienze economiche e sociali 3e Copyright © 2014 McGraw-Hill Education Italy srl
S. Borra, A. Di Ciaccio
15/3
Capitolo 3

LE MEDIE

La media aritmetica
La trimmed mean
La mediana
La moda
I percentili

Statistica. Metodologie per le scienze economiche e sociali 3e Copyright © 2014 McGraw-Hill Education Italy srl
S. Borra, A. Di Ciaccio
16/3
Introduzione
v Descrizione delle modalità osservate di un carattere su di un collettivo:
distribuzione delle frequenze o rappresentazione grafica opportuna;

v Può essere utile riportare il valore di uno o più indici che forniscono le
caratteristiche essenziali della distribuzione del carattere:
medie analitiche e medie di posizione.

v Le medie analitiche e di posizione sintetizzano con un sol valore o modalità


la distribuzione. Esse sono anche detti indici di tendenza centrale.

v Le medie analitiche sono calcolate per mezzo di operazioni algebriche sui


valori di un carattere (quantitativo); le medie di posizione sono definite anche
su caratteri di tipo qualitativo.

v Medie analitiche: media aritmetica, trimmed mean;


Medie di posizione: mediana, moda.

Statistica. Metodologie per le scienze economiche e sociali 3e Copyright © 2014 McGraw-Hill Education Italy srl
S. Borra, A. Di Ciaccio
17/3
Introduzione
calcolate con operazioni
Medie algebriche sulle modalità,
analitiche richiedono dei caratteri
quantitativi

Medie di non richiedono operazioni


posizione algebriche sulle modalità

Statistica. Metodologie per le scienze economiche e sociali 3e Copyright © 2014 McGraw-Hill Education Italy srl
S. Borra, A. Di Ciaccio
18/3 La Media Aritmetica

Tempo impiegato per raggiungere il


posto di lavoro
tempo impiegato (min.) tempo impiegato (min.)
giorno auto metro giorno auto metro
1 23 22 7 28 24
2 32 24 8 33 28
3 44 22 9 45 32
4 21 33 10 34 31
5 36 26 11 29 37
6 30 31 12 31 24

(23+32+44+21+36+30+28+33+45+34+29+31)/12 =
x a ( auto ) =
=386/12 = 32,17

(22+24+22+33+26+31+24+28+32+31+37+24)/12
x a ( metro ) = = 334/12 = 27,83
Statistica. Metodologie per le scienze economiche e sociali 3e Copyright © 2014 McGraw-Hill Education Italy srl
S. Borra, A. Di Ciaccio
Media aritmetica
19/3

La media aritmetica di un insieme di n valori


x1, x2, … xn di un carattere quantitativo X è
data da:
1 1n
xa = (x1 + x2 + ... + xn ) = å xi
n n i =1

Se il carattere X è quantitativo discreto e


conosciamo la sua distribuzione di frequenza:

1K K
xa = å x j n j xa = å x j f j
n j =1 j =1
Statistica. Metodologie per le scienze economiche e sociali 3e Copyright © 2014 McGraw-Hill Education Italy srl
S. Borra, A. Di Ciaccio
20/3 Valore centrale della classe

Nel caso di una distribuzione di frequenze per un


carattere X suddiviso in classi, possiamo approssimare
la media utilizzando il valore centrale della classe cj

1 K
xa @ å c jn j
n j =1

Statistica. Metodologie per le scienze economiche e sociali 3e Copyright © 2014 McGraw-Hill Education Italy srl
S. Borra, A. Di Ciaccio
21/3
Esempio
Prezzi di farmaci e quantità acquistate da un ospedale

Valore Prezzo a Numero Ammontare


Centrale confezione Confezioni carattere
Della (€) (migliaia) (costo) ml. (€)
classe
25 20 – 30 11 25*11= 275.0
32.5 30 – 35 5 32.5*5= 162.5
37.5 35 – 40 15 37.5*15= 562.5
45 40 – 50 9 45*9 = 405.0
Totale 40 1405

xa= 1405/40 = 35.72 € (a confezione) (approssimato)


Statistica. Metodologie per le scienze economiche e sociali 3e Copyright © 2014 McGraw-Hill Education Italy srl
S. Borra, A. Di Ciaccio
22/3
Media aritmetica ponderata

La media aritmetica ponderata di un insieme di n


valori osservati di un carattere quantitativo X
con pesi non negativi, è data da:

∑x p j j
x1 p1 + x2 p2 + ⋅⋅⋅ + xn pn j=1
xa = = n
p1 + p2 + ⋅⋅⋅ + pn
∑p j
j=1

Statistica. Metodologie per le scienze economiche e sociali 3e Copyright © 2014 McGraw-Hill Education Italy srl
S. Borra, A. Di Ciaccio
Esempio: industria di pneumatici

Tipo Tempo(minuti) Pezzi Prodotti

A 45 400

B 15 2500

C 18 1500

o il tempo medio come x = (45 +15 +18) / 3 = 26


Posso calcolare una media più realistica, ponderando i tempi
con il numero dei prezzi prodotti:

x = (45* 400 +15* 2500 +18*1500) / 4400 = 18.75

Statistica. Metodologie per le scienze economiche e sociali 3e Copyright © 2014 McGraw-Hill Education Italy srl
S. Borra, A. Di Ciaccio
24/3
Considerazioni

La Media aritmetica dipende da tutti i valori osservati


e quindi risente dei valori estremi (valori anomali);

La Media aritmetica sintetizza la distribuzione di un


carattere con un solo valore;

Statistica. Metodologie per le scienze economiche e sociali 3e Copyright © 2014 McGraw-Hill Education Italy srl
S. Borra, A. Di Ciaccio
25/3
Proprietà della media aritmetica

1) La somma dei valori osservati è uguale al valore medio


moltiplicato per il numero di unità;

n
∑ i=1
xi = n ⋅ x a

2) La somma delle differenze tra i valori e la loro media


aritmetica, è pari a zero;

n
∑ i=1
(xi −xa ) = 0
Statistica. Metodologie per le scienze economiche e sociali 3e Copyright © 2014 McGraw-Hill Education Italy srl
S. Borra, A. Di Ciaccio

Potrebbero piacerti anche