Sei sulla pagina 1di 37

Corso di Statistica

Presentazione dati (1)


Tabelle
Distribuzioni di frequenza
Distribuzioni di quantità
Distribuzioni congiunte
Serie storiche e serie territoriali

Proff. Matilde Bini e Andrea Cutillo


a.a. 2017-2018
1
La rappresentazione dei dati

• La statistica descrittiva è usata come strumento


per conoscere le caratteristiche di un fenomeno
collettivo (ad esempio lo stato di salute di una
intera azienda a partire dalle informazioni sui
singoli punti vendita)

• Presentare le informazioni raccolte in forma di


matrice dei dati non consente di capire molto e
spesso non ha molto senso (quando le unità del
collettivo sono molte)

2
Matrice dei dati (teorica)
Unità Car. A Car. B Car. C
Rilev. Modal. Modal. modal-.

1 mod. mod. mod.

2 mod. mod. mod.

3 mod. mod. mod.

. mod. mod. mod.

. mod. mod. mod.

. mod. mod. mod.

. mod. mod. mod.

n-1 mod. mod. mod.

n mod. mod. mod.

Ad esempio k
modalità
Numero di unità
rilevate nel collettivo 3
Matrice dei dati (esempio)
Punti Ricavi Costi Num. Ubicazione Genere Vendita R.O
vendita Addetti respons. On-line
1 350 205 6 centro maschio si 145

2 200 100 6 periferia maschio si 100

3 600 350 10 semicentro femmina no 250

4 500 270 10 periferia femmina no 230

5 270 200 7 centro maschio no 70

6 180 120 3 centro maschio no 60

7 205 105 3 periferia maschio no 100

8 340 210 6 semicentro femmina no 120

9 280 140 4 centro femmina si 140

4
o La rappresentazione dei dati

 È utile invece rappresentarli in forma


organizzata e sintetica allo scopo di:
• evidenziarne le caratteristiche principali
(sintetizzarle)
• facilitarne la lettura e l’interpretazione

o Rappresentazione tabellare
o Rappresentazione grafica
o Rappresentazione con indici di posizione
o Rappresentazione con indici di variabilità

5
Rappresentazioni tabellari

 Distribuzione di frequenze

 Distribuzione di quantità(caratteri
quantitativi)

 Distribuzione congiunta (relazione tra


due caratteri)

 Serie storica
 Serie territoriale

6
Distribuzione di frequenze
 Problema: distribuzione dei dati delle n
unità tra le varie modalità
 Organizzazione dei dati mediante una
tabella risultante dalle operazioni di:
• Classificazione (delle modalita´)
• Conteggio

Ad ogni modalità di un carattere (qualitativo


o quantitativo) si fa corrispondere il
numero di volte che esso si presenta nel
collettivo (la sua frequenza assoluta)
7
Distribuzione semplice di frequenze

M Freq. m1, m2,…,mK n1, n2,…,nK sono


m1 n1 sono le modalità le freq.
distinte che assolute
m2 n2
assume il associate a
… … carattere A nel ciascuna
mi ni collettivo di n modalità
unità esaminato n1 indica
… …
quante unità
mk nk presentano la
modalità m1 del
Totale n
carattere A
La somma delle frequenze
K
assolute è uguale al numero n  n i
totale di unità del collettivo i 1
8
Distribuzione di frequenze
(esempio)

Punti Addetti Addetti Numero punti


vendita (valori vendita
1 6 distinti) (frequenze)
3 2
2 6
4 1
3 10
6 3
4 10
7 1
5 7 10 2
6 3 Quanti sono i punti vendita con 3 addetti? 2
7 3 Quanti sono i punti vendita con 4 addetti? 1
Quanti sono i punti vendita con 6 addetti? 3
8 6 Quanti sono i punti vendita con 7 addetti? 1
9 4 Quanti sono i punti vendita con 10 addetti? 2

9
Frequenze relative e frequenze
relative percentuali
Frequenze assolute: confronti tra Popolazioni?
La frequenza relativa è data dal rapporto tra
frequenza assoluta e numero totale di unità del
collettivo
n
per la i-esima modalità f 
n
i
i

Vale che
K

 f 1
i 1
i

La frequenza relativa percentuale altro non


è che la frequenza relativa moltiplicata per 100
n K

 p  100
p  f  100   100
i
i 1
i

n
i i

10
Calcolo delle frequenze relative e
percentuali
Addetti Frequenze Frequenze Frequenze
assolute relative rel. perc.

3 2 2/9=0,22 22,2
4 1 1/9=0,11 11,1 La somma delle freq.
6 3 3/9=0,34 33,3 rel. perc. è pari a
7 1 1/9=0,11 11,1 100 (in questo caso
è stata arrotondata
10 2 2/9=0,22 22,2 perché risultava pari
Tot n=9 1,00 100,0 a 99,9)

I punti vendita con 3 addetti sono 2 (freq. ass.)


Rappresentano il 22% del totale dei punti vendita

11
Perché si calcolano le frequenze relative e
percentuali?

Le frequenze assolute dipendono da n


Quindi non possono essere utilizzate per
effettuare confronti tra collettivi con
diversa numerosità

Al contrario, le frequenze relative e quelle


percentuali sono numeri puri
Si utilizzano per confrontare distribuzioni di
frequenza riferite a collettivi di diversa
numerosità

12
Esempio di utilizzo
delle frequenze. rel. perc.

Supponiamo che il manager dell’azienda


debba valutare se la distribuzione dei punti
vendita per numero di addetti nel Lazio è
diversa da quella di una regione spagnola, la
Catalogna

Verifica da fare: si ritiene che nel Lazio ci


siano più punti vendita con pochi addetti
rispetto alla Catalogna

13
Confronto tra distrib. di frequenze
Lazio Catalogna
Addetti Freq Addetti Freq.
ass. ass.
3 2 3 4
4 1 4 4
6 3 5 11
7 1 6 15
10 2 8 8
Tot n=9 10 6
Tot n=48

Confrontando le freq. ass., si conclude che il numero dei punti


vendita con 3 addetti è minore nel Lazio rispetto alla Catalogna (2
contro 4) e lo stesso vale per i p.v. con 4 addetti (1 contro 4)
Questo risultato sembra ribaltare le supposizioni iniziali
Ma il confronto fatto in questo modo non è corretto!
14
Confronto tra distrib. di frequenze
Lazio Catalogna
Addetti Freq Freq. rel. Addetti Freq. Freq. rel.
ass. perc. ass. perc.

3 2 22,2 3 4 8,3
4 1 11,1 4 4 8,3
6 3 33,3 5 11 22,9
7 1 11,1 6 15 31,3
10 2 22,2 8 8 16,7
Tot n=9 100 10 6 12,5
Tot n=48 100,0

In termini di freq. rel. perc., i 2 p.v. con 3 addetti costuituiscono


il 22,2 % del totale dei p.v. nel Lazio e solo l’8,3% del totale dei
p.v. in Catalogna
L’incidenza dei p.v. con pochi addetti è maggiore nel Lazio, come
si supponeva prima di conoscere i dati
15
Confronto tra distrib. di frequenze (2)
Imprese registrate in Italia secondo l’attività economica
Grandi settori 2002 2006
tradizionali
ni fi pi ni fi pi

Commercio 1.514.514 0,268 26,8 1.592.726 0,260 26,0

Agricoltura 1.057.817 0,187 18,7 945.300 0,154 15,4

Costruzioni 662.424 0,117 11,7 828.468 0,135 13,5

Manifattura 742.867 0,131 13,1 747.482 0,122 12,2

Servizi alle imprese 1.310.296 0,232 23,2 1.546.681 0,252 25,2


e alle persone
Altri settori 369.083 0,065 6,5 464.857 0,076 7,6

Totale 5.657.001 1,000 100,0 6.125.514 1,000 100,0

Fonte: Unioncamere-InfoCamere, Movimprese


Frequenze cumulate

Addetti Numero punti frequenze Le freq. cum.


(valori vendita cumulate
si definiscono
distinti) (frequenze)
solo se le
3 2 2
modalità del
4 1 3
carattere sono
6 3 6
ordinate
7 1 7
10 2 9

Quanti sono i punti vendita con al max 3 addetti? 2


Quanti sono i punti vendita con al max 4 addetti? 2+1
Quanti sono i punti vendita con al max 6 addetti? 2+1+3
Quanti sono i punti vendita con al max 7 addetti? 2+1+3+1
Quanti sono i punti vendita con al max 10 addetti? 2+1+3+1+2
17
Frequenze cumulate
Addetti Freq. Freq. ass. Freq. rel. Freq. perc.
ass. ni cum. Ni cum. Fi cum. Pi

3 2 2 0,22 22,2
4 1 3 0,33 33,3
6 3 6 0,67 66,6
7 1 7 0,78 77,7
10 2 9 1,00 100,0

Dalla lettura delle freq. perc. cum. Pi,


si ricava che il 66,6% dei punti vendita (cioè i 2/3)
ha un numero di addetti inferiore o uguale a 6

18
Frequenze cumulate (esempio)

Livello di
ni fi pi Ni Fi Pi
inquadramento
Apprendisti 28 0,07 7 28 0,07 7
Operai 152 0,38 38 180 0,45 45
Operai specializzati 176 0,44 44 356 0,89 89
Quadri 32 0,08 8 388 0,97 97
Dirigenti 12 0,03 3 400 1,00 100
I totali non hanno
Totale 400 1,00 100 senso
Distribuzione in classi (di valori)

Una variabile quantitativa continua


usualmente viene rappresentata mediante
una tabella di frequenze associate a classi
di valori (modalita´)
• Le classi (intervalli) sono formate da gruppi
contigui di modalità
• Le classi non devono sovrapporsi
(disgiunte)
• Una modalità deve appartenere ad una sola
classe
• Le classi devono essere esaustive
• Valore centrale rappresentativo
20
Distribuzione di frequenza in classi

Una variabile quantitativa continua usualmente


viene rappresentata mediante una tabella di
frequenze associate a classi di valori (modalita´)

 Caratteri continui (si devono fare le classi)


 Caratteri discreti (si deve quando molte modalita´)

• Le classi (intervalli) sono formate da gruppi contigui


di modalità
• Le classi non devono sovrapporsi (disgiunte)
• Una modalità deve appartenere ad una sola classe
• Le classi devono essere esaustive
• Valore centrale rappresentativo

21
Il raggruppamento in classi dei caratteri
quantitativi continui
Le classi (a,b) possono essere:
a sinistra axb
Chiuse a destra axb
a sinistra e a destra axb

inferiormente x  a, x  a
Aperte
superiormente x  a, x  a
Problemi:
Numero di classi (o di modalità per variabili qualitative) e loro
ampiezza
Limiti (ampiezza) delle classi:
- definizione soggettiva
- definizione automatica (sconsigliata)
Distribuzione di frequenze in classi della
variabile Ricavi

Ricavi (valori Per ricavare la corrispondente


ordinati) distribuzione in classi di valori, potremmo
180 pensare di definire classi tali che:
200
• abbiano più o meno la stessa frequenza
205
270
• abbiano più o meno la stessa ampiezza
280 • corrispondano a livelli del fenomeno che
340 possiamo individuare come (basso,
350 medio, alto) oppure (basso, alto) avendo
500 in mente specifiche soglie
600

23
Distribuzione di frequenze in classi della
variabile Ricavi

Scelgo di formare 3 classi di ricavi:


Ricavi (valori
ordinati)
-Fino a 250 (incluso)
180 
-Da 250 (escluso) a 350 (incluso)
200 
-Oltre 350
205  Classi di Freq.
ricavo ass.
270 
(0 –l 250] 3
280 
(250 –l 350] 4
340 
Oltre 350 2
350 
500  Qual è la frequenza associata alla
600  prima classe?
Quanti sono i p.v. i cui ricavi sono
al massimo 250?
24
25
Distribuzione di quantità
Organizzazione dei dati mediante una tabella
risultante dalle operazioni di:
• Classificazione (della modalita´)
• Misurazione di un fenomeno

Ad ogni modalità di un carattere si fa


corrispondere una misurazione (per es. una
somma o una media) di un carattere
quantitativo

26
Esempio distribuzione di quantità
Classifico in base agli addetti
Per ogni modalità del carattere “Addetti”
calcolo la somma e la media dei ricavi
Punti Addetti Ricavi
vendita
In questo caso il carattere in base al quale viene
1 6 350 fatta la classificazione non coincide con quello
che viene misurato all’interno della classe.
2 6 200
3 10 600 Addetti Ricavo Ricavo
4 10 500 totale medio
5 7 270 3 385 192,5
6 3 180  4 280 280
7 3 205  6 890 296,7
8 6 340 7 270 270
9 4 280 10 1100 550
Come si ricava la quantità 385 (ricavo totale) in
corrispondenza del numero di addetti pari a 3?
Dalla somma di 180 e 205, i ricavi dei p.v. che hanno 3 addetti
27
Distribuzioni di frequenza congiunta

28
29
30
31
32
Serie storica

Tabella che ad ogni riferimento temporale


(ad esempio, l’anno, il mese, il giorno)
associa l’ammontare del carattere X in esame
Evidenzia la dinamica di un certo fenomeno
nel tempo
Esempi:
il valore aggiunto di un’azienda negli ultimi
cinque anni
l’indice S&P/Mib alla Borsa di Milano
nell’ultima settimana

33
Serie storica (esempio)

Facendo riferimento anni R.O.


al nostro esempio (migliaia euro)
base, la banca può 2004 85
richiedere il R.O.
(risultato operativo) 2005 120
di ogni punto vendita 2006 215
degli ultimi quattro
anni 2007 161

Per ogni punto


vendita si ha una
serie storica del tipo:

34
Serie territoriale

Tabella che ad ogni unità territoriale


(ad esempio paese, regione, distretto industriale)
fa corrispondere l’ammontare del carattere X in
esame
Mostra la distribuzione del fenomeno con
riguardo al territorio
Esempi:
il tasso di inflazione nei paesi UE
le emissioni di CO2 nei capoluoghi di regione
italiani

35
Serie territoriale (esempio)
Valori del PIL pro-capite in alcuni Paesi
(Dati del Fondo Monetario Internazionale 2007)

Paese PIL nominale


(in dollari USA)

Italia 31.802
Spagna 27.951
Regno Unito 39.681
Svezia 43.190

36
Serie storica esempi
Andamento delle cessazioni delle imprese italiane
ANNO CESSAZIONI
2003 304.728
2004 320.536
2005 324.603
2006 350.238
Fonte: Unioncamere-InfoCamere, Movimprese

serie territoriale
Distribuzione territoriale delle imprese registrate
Valori
percentuali
Nord-ovest 26,4
Nord-est 20,6
Centro 20,2
Sud e Isole 33,2
ITALIA 100,0

Fonte: Unioncamere-InfoCamere, Movimprese