Sei sulla pagina 1di 50

Statistica

Capitolo 2

Descrizione grafica dei dati

Cap. 2-1
Obiettivi del capitolo
D
Dopo aver completato
l t t il capitolo,
it l sarete
t in
i grado
d di:
di
 Identificare il tipo di dati e il livello di misurazione
 Creare ed interpretare grafici per descrivere variabili categoriche:
 distribuzione di frequenze, diagramma a barre, diagramma a torta,
diagramma di Pareto
 Creare un grafico per descrivere serie storiche
 Creare ed interpretare
p g
grafici p
per descrivere variabili numeriche:
 distribuzione di frequenze, istogramma, ogiva, diagramma ramo-foglia
 Costruire ed interpretare grafici per descrivere relazioni tra variabili:
 diagrammi di dispersione, tabelle a doppia entrata
 Descrivere grafici appropriati e non appropriati per rappresentare i dati

Cap. 2-2
Tipi di Dati

Dati

Categorici Numerici

Esempi:
 Stato civile
 Hai il diritto di voto? Discreti Continui
 C l
Colore degli
d li occhihi
(Specifiche categorie o Esempi: Esempi:
gruppi)  Numero di figli  Peso
 Difetti in un’ora  Voltaggio
(Elementi conteggiati) (Caratteristiche misurate)

Cap. 2-3
Livelli di Misurazione
Differenze fra
misurazioni, esiste lo Scala di Rapporto
zero assoluto
Dati Quantitativi

Differenze fra
misurazioni ma non
misurazioni, Scala ad Intervallo
esiste lo zero assoluto

Categorie ordinate
(ranghi, ordine, o scala) Dati Ordinali
Dati Qualitativi

Categorie (no ordine o


direzione) Dati Nominali
Cap. 2-4
Rappresentazione
G fi dei
Grafica d iD
Datiti

 I dati in forma grezza non sono generalmente


facili da usare nel processo decisionale
 Una qualche organizzazione si rende
necessaria:
 Tabelle

 Grafici

 Il tipo di grafico da usare dipende dalla


variabile che vogliamo sintetizzare

Cap. 2-5
Rappresentazione
G fi dei
Grafica d iD
Datiti
(continuazione)
 Tecniche presentate in questo capitolo:

Variabili Variabili
Categoriche Numeriche

• Distribuzione di frequenze • Grafico per serie storiche


• Diagramma a barre • Distribuzione di frequenze
• Diagramma a torta • Istogramma e ogiva
• Diagramma
g di Pareto • Diagramma
g ramo-foglia
g
• Diagramma di dispersione

Cap. 2-6
Tabelle e Grafici per
V i bili C
Variabili Categoriche
t i h
Dati
catego c
categorici

Tabulazione Grafici

Tabella della
distribuzione Diagramma Diagramma Diagramma
di frequenze a barre
b a torta
t t di P
Pareto
t

Cap. 2-7
La Tabella della Distribuzione
di F
Frequenze
Ri
Riassume i dati
d ti per categoria
t i

Esempio: Pazienti per Unità Ospedaliera


Unità Osped. Numero di Pazienti

Cardiologia 1,052
Emergenza 2 245
2,245
Cura Intensiva 340
Maternità 552
Chirurgia 4,630
(La variabile è
Frequenza Assoluta
categorica)
Cap. 2-8
Diagrammi a barre e a torta

 Diagrammi a barre e Diagrammi a torta


sono spesso usati per dati qualitativi
(categorici)

 L’altezza delle barre o l’area dei settori


circolari rappresentano la frequenza o
percentuale di ciascuna categoria

Cap. 2-9
Esempio diagramma a barre

Unità Numero
Osped. di Pazienti

Cardiologia 1,052
Emergenza 2,245
Cure Intensive 340 Pazienti per Unità Ospedaliera

5,000
Maternità 552
4,000

anno
Chirurgia 4,630 di
pazienti per a
Numero d
3,000

2,000

1,000

Emergenza

Intensive
Cardiologia

Chirurgia
Maternità
Cure
E
C

Cap. 2-10
Esempio Diagramma a Torta

Unità Numero % del



Osped.
= di Pazienti Totale
Pazienti per Unità Ospedaliera

Cardiologia 1,052 11.93


Cardiologia
Emergenza 2,245 25.46 12%

Cure Intensive 340 3.86


Maternità 552 6.26
Chirurgia 4,630 52.50
Emergenza
Chirurgia 25%
53%

(Le percentuali sono


arrotondate ) C
Cure Intensive
4%
Maternità
6%

Cap. 2-11
Diagramma di Pareto

E’ usato per rappresentare dati categorici. E’


f
formato
t da:
d
 Un diagramma
g a barre,, in cui le categorie
g sono
rappresentate in ordine decrescente di
frequenza
 Un poligono della frequenza cumulata che
viene spesso rappresentato nello stesso grafico
E’ usato per separare “poche
E poche cause rilevanti”
rilevanti
dalle “numerose cause insignificanti” Cap. 2-12
Esempio Diagramma di Pareto

Esempio: 400 prodotti difettosi vengono


p
esaminati rispetto al tipo
p di difetto:
Fonte dell’Errore
di Produzione Numero di difetti
Saldatura Difettosa 34
Cattivo Allineamento 223
Parte Mancante 25
Difetto di Colore 78
C
Cortocircuito
i i El Elettrico
i 19
Cassa Incrinata 21
Totale 400

Cap. 2-13
Esempio del Diagramma di Pareto
(continuazione)
Passo 1: Ordinare
O di lle categorie
t i rispetto
i tt alla
ll causa
del difetto, in ordine decrescente
Passo 2: Determinare
D t i % per ciascuna
i categoria
t i
Fonte dell’Errore
di Produzione Numero di difetti % sul Totale di Difetti
Cattivo Allineamento 223 55.75
Dif tt di C
Difetto Colore
l 78 19 50
19.50
Saldatura Difettosa 34 8.50
Parte Mancante 25 6 25
6.25
Cassa Incrinata 21 5.25
Cortocircuito Elettrico 19 4.75
Totale 400 100%
Cap. 2-14
Esempio Diagramma di Pareto
(continuazione)
Passo 3: Mostra i risultati graficamente
Diagramma di Pareto: Fonte dell
dell'Errore
Errore di Produzione
egoria

100 100
% difetti in ciascuna cate
ma a barre)

80 80

(Grafico pe
% Cum ulata
60 60
(diagramm

er linee)
40 40

20 20

0 0

Mancante
amento

Incrinata
Diffetto di

Salldatura

circuito
Diffettosa
Colore

Cassa
Parte

Eletttrico
Catttivo

Cortoc
P
C
Allinea

Cap. 2-15
Grafici per Serie Storiche

 Un grafico per serie storiche viene usato per


rappresentare i valori di una variabile nel tempo

 Il tempo viene rappresentato sull’asse


orizzontale

 La variabile di interesse viene rappresentata


sull’asse verticale

Cap. 2-16
Esempio Grafico per Serie Storiche

Sottoscrizioni alla rivista per anno

350

300
sottoscrittori

250

200
Migliaia di s

150

100

50

0
199

199

199

199

199

199

199

199

199

199

200

200

200

200

200

200

200
90

91

92

93

94

95

96

97

98

99

00

01

02

03

04

05

06
Cap. 2-17
Grafici per Descrivere
V i bili N
Variabili Numeriche
i h
Dati Numerici

Distribuzione di Frequenze Diagramma


e Distribuzioni Cumulate Ramo-Foglia

Istogramma Ogiva

Cap. 2-18
Distribuzione di Frequenze

Cosa è una Distribuzione di Frequenze?


 Una distribuzione di frequenze è una lista o una
tabella …
 contenente classi di intervallo (categorie o
i t
intervalli
lli a cuii i d
dati
ti appartengono)
t ) ...
 e le corrispondenti frequenze con cui i dati
appartengono alle classi o categorie

Cap. 2-19
P hè usare Distribuzioni
Perchè Di t ib i i di F
Frequenze?
?

 La distribuzione di frequenze è un modo


per riassumere i dati
 La distribuzione condensa i dati grezzi in
forma più utile ...
 e consente una veloce interpretazione
grafica dei dati

Cap. 2-20
Classi di Intervallo
ed
dEEstremi
t iddelle
ll Cl
Classii
 Ciascuna classe
Ci l di iintervallo
t ll ddovrebbe
bb avere lla stessa
t
ampiezza
 Determinare l’ampiezza
l ampiezza di ciascuna classe nel
seguente modo:
Valore massimo  Valore minimo
w  Ampiezza dell' intervallo 
Numero di classi
 Usare almeno 5 ma non più di 15 15-20
20 intervalli
 E’ bene che gli intervalli non si sovrappongono mai
 Arrotondare eventualmente per eccesso (mai per
difetto) l’ampiezza dell’intervallo per ottenere i
desiderati estremi della classe

Cap. 2-21
Esempio Distribuzione delle Frequenze

Esempio: Un produttore di isolante seleziona a caso


20 osservazioni relative alle temperature registrate
dalle componenti elettroniche dei macchinari di un
cliente

24, 35, 17, 21, 24, 37, 26, 46, 58, 30,
32, 13, 12, 38, 41, 43, 44, 27, 53, 27

Cap. 2-22
Esempio Distribuzione delle Frequenze
(continuazione)

 Ordina i dati grezzi in ordine crescente:


12,, 13,, 17,, 21,, 24,, 24,, 26,, 27,, 27,, 30,, 32,, 35,, 37,, 38,, 41,, 43,, 44,, 46,, 53,, 58

 Trova il campo di variazione: 58 - 12 = 46


 Sele iona il numero
Seleziona n mero di classi
classi: 5 (solitamente
( lit t ffra 5 e 15)
 Calcola l’ampiezza dell’intervallo: 10 (46/5 poi
arrotonda per eccesso)
 Determinare i limiti dell’intervallo: 10 ma meno di 20,,
20 ma meno di 30, . . . , 50 ma meno di 60
 Conta le osservazioni & le assegnale alle classi
Cap. 2-23
Esempio Distribuzione delle Frequenze
(continuazione)
Dati in sequenza ordinata:
12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58

Frequenza
Intervallo Frequenza Percentuale
Relativa
10 ma meno di 20 3 .15 15
20 ma meno di 30 6 .30 30
30 ma meno di 40 5 .25 25
40 ma meno di 50 4 .20 20
50 ma meno di 60 2 .10 10
Totale 20 1.00 100
Cap. 2-24
Istogramma

 Un grafico dei dati contenuti in una distribuzione


di frequenze è chiamato istogramma
 Gli estremi degli intervalli sono rappresentati
sull’asse
ll’ orizzontale
i t l
 L’ asse verticale rappresenta le frequenze solo
se le classi hanno pari ampiezza
 Barre di altezza appropriata sono usate per
rappresentare la numerosità di ciascuna classe

Cap. 2-25
Esempio Istogramma

Intervallo Frequenza
Is t o gra m m a : T e m pe ra t ura M a s s im a
10 ma meno di 20 3
G io rna lie ra
20 ma meno di 30 6
7 6
30 ma meno di 40 5 6 5
40 ma meno di 50 4
5
uenza
50 ma meno di 60 2 4
4 3
Frequ

3 2
2
1 0 0
(No spazio 0
f le
fra l barre)
b ) 0 0 10 10 2020 30 30 40 40 50 50 60 60 70
Temperatura in Gradi
Cap. 2-26
Istogramma in Excel

1
Selezionare
St
Strumenti/Analisi
ti/A li i D
Dati
ti

Cap. 2-27
Istogramma in Excel
(continuazine)

2
Scegliere Istogramma

(
Inserire le celle contenenti
i dati e i bins (celle contenenti i
p
limiti superiori delle classi))
3
Selezionare Grafico in
Output e cliccare su “OK”

Cap. 2-28
Domande per Raggruppare
iD
Datiti iin IIntervalli
t lli
 1 Q
1. Quale
l dovrebbe
d bb essere l’l’ampiezza
i di
ciascun intervallo?
(Quante classi dovrebbero essere usate?)

 2 Come dovrebbero essere determinati gli


2.
estremi degli intervalli?
 Spesso
p la risposta
p si trova p
per tentativi,, ed è
soggettiva
 L’obiettivo è di creare una distribuzione che non è
t
troppo “frastagliata"
“f t li t " ma nemmeno troppo t “a
“ blocchi”
bl hi”
 L’obiettivo è di mostrare appropriatamente
ll’andamento
andamento della variazione nei dati

Cap. 2-29
Quante classi di intervallo?

 Troppe (classi di intervallo piccole) 3.5


3
 può produrre una distribuzione molto 25
2.5

Frequenza
frastagliata con spazi dovuti a classi 2
1.5

vuote 1
0.5

 puòò dare
d una cattiva
tti iindicazione
di i di 0

12

20

28

36

44

52

60
4
come la frequenza cambia nelle classi Temperatura

12

 Poche (classi di intervallo ampie) 10

quenza
8

 può comprimere troppo la variazione 6

Freq
4
e produrre una distribuzione a blocchi 2
0
 può oscurare importanti andamenti 0 30 60 More

nella
ll variazione.
i i Temperatura

(etichette sull’asse delle X sono i limiti


superiori delle classi)

Cap. 2-30
La Distribuzione di
F
Frequenze Cumulate
C l t
Dati in sequenza ordinata:
12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58

Frequenza Percentuale
Classi Frequenza Percentuale Cumulata
Cumulata

10 ma meno di 20 3 15 3 15
20 ma meno di 30 6 30 9 45
30 ma meno di 40 5 25 14 70
40 ma meno di 50 4 20 18 90
50 ma meno di 60 2 10 20 100
Totale 20 100

Cap. 2-31
Le Ogive
G fi i per Frequenze
Grafici F Cumulate
C l t
Limite Percentuale
Superiore Cumulata
Intervallo Intervallo
Meno di 10 10 0
10 ma meno di 20 20 15
20 ma meno di 30 30 45 Ogiva: Temperatura Massima Giornaliera
30 ma meno di 40 40 70
40 ma meno di 50 50 90

Percen tuale Cu m ulata


100
50 ma meno di 60 60 100
80
60
40
20
0
10 20 30 40 50 60
Limiti Intervallo
Cap. 2-32
Forma della Distribuzione
 La forma della distribuzione si dice simmetrica se le
osservazioni sono bilanciate, o distribuite in modo
approssimativamente regolare attorno al centro.

Distribuzione Simmetrica

10
9
8
7
Frequenza

6
5
4
3
2
1
0
1 2 3 4 5 6 7 8 9

Cap. 2-33
Forma della Distribuzione
(continuazione)
 La forma della distribuzione è detta
asimmetrica se le osservazioni non sono
distribuite in modo simmetrico rispetto al centro
centro.
Distribuzione con Asimmetria Positiva

Una distribuzione con asimmetria 12

10
positiva
iti (obliqua
( bli ad destra)
t )h ha una 8

Frequenza
coda che si estende a destra, nella 6

4
direzione dei valori superiori. 2

0
1 2 3 4 5 6 7 8 9

Una distribuzione con asimmetria Distribuzione con Asimmetria Negativa

negativa (obliqua a sinistra) ha una 12

10
coda che si estende a sinistra, nella equenza 8

direzione dei valori inferiori. 6


Fre

0
1 2 3 4 5 6 7 8 9
Cap. 2-34
Diagramma Ramo-Foglia
Ramo Foglia

 Si tratta di un modo semplice per vedere i


dettagli della distribuzione di un set di dati,
abbinando il dettaglio della distribuzione di
frequenze e la sintesi grafica propria
dell’istogramma

METODO: Separare la serie di dati ordinata


in cifre più significative (i rami) e
cifre meno significative (le foglie)
Cap. 2-35
Esempio
D ti ordinati:
Dati di ti
21, 24, 24, 26, 27, 27, 30, 32, 38, 41

 Qui usiamo le decine come unità per i rami:


Ramo Foglia
 21 è mostrato come 2 1
 38 è mostrato come 3 8

Cap. 2-36
Esempio
(continuazione)
D ti ordinati:
Dati di ti
21, 24, 24, 26, 27, 27, 30, 32, 38, 41

 Diagramma ramo-foglia
ramo foglia completato:
Ramo Foglia
2 1 4 4 6 7 7
3 0 2 8
4 1

Cap. 2-37
Usando altre unità per i rami
 Usando le centinaia come unità per i rami:
 Arrotondiamo alla decina per formare le foglie

Ramo Foglia
 613 diventerebbe 6 1
 776 diventerebbe 7 8
 ...
 1224 diventa 12 2

Cap. 2-38
Usando altre unità per i rami
(continuazione)

 Usando le centinaia come unità per i rami:


 Il diagramma ramo-foglia completato:

Dati:
Ramo Foglia
613, 632, 658, 717, 6 136
722 750
722, 750, 776
776, 827
827, 7 2258
841, 859, 863, 891, 8 346699
894, 906, 928, 933,
9 13368
955, 982, 1034,
1047,1056, 1140, 10 356
1169,, 1224 11 47
12 2
Cap. 2-39
Relazioni fra Variabili

 I grafici illustrati finora si riferiscono ad una sola


variabile
 Quando consideriamo due variabili vengono
usate altre tecniche:

Variabili Variabili
Categoriche Numeriche
(Qualitative) (Quantitative)

Tabelle a Diagramma di
d
doppia
i entrata
t t di
dispersione
i
Cap. 2-40
Diagramma di Dispersione

 Diagrammi di dispersione sono usati


per osservazioni accoppiate relative
a due variabili numeriche

 Il diagramma di dispersione:
 Una variabile viene rappresentata

sull’asse
sull asse verticale e ll’altra
altra variabile
viene rappresentata sull’asse
orizzontale
o o ae

Cap. 2-41
Esempio Diagramma di Dispersione

Volume Costo Costo Giornaliero vs. Volume di Produzione


Produzione Giornaliero
23 125 250
26 140 o G iorna lie ro
200
29 146
150
33 160
38 167 100
C os to

42 170 50
50 188 0
55 195 0 10 20 30 40 50 60 70
60 200
Volume Giornaliero

Cap. 2-42
Diagramma di Dispersione in Excel

1
Selezionare Creazione
Guidata Grafico
2
Selezionare l’opzione
Dispers. (XY) , e quindi
cliccare su “Avanti”
3
Quando
Q d richiesto,
i hi t per
completare il diagramma di
dispersione, inserire le celle
contenenti i dati, le
etichette, e la destinazione
Cap. 2-43
Tabelle a Doppia Entrata

 Tabelle a doppia entrata (o tabelle di contingenza)


elencano il numero di osservazioni pper ogni
g
combinazione di valori per le due variabili
categoriche o ordinali.

 Se ci sono r categorie
g p
per la p
prima variabile
(righe) e c categorie per la seconda variabile
(colonne), la tabella viene chiamata tabella a
doppia entrata r x c.

Cap. 2-44
Esempio Tabella a Doppia Entrata

 Tabella a doppia entrata 4 x 3 per Scelta di Investimento


per Investitore (valori in migliaia di dollari)
Categoria Investitore A Investitore B Investitore C Totale
Investimento
Azioni 46.5 55 27.5 129
Obbligazioni 32.0
32 0 44 19.0
19 0 95
CD 15.5 20 13.5 49
Risparmio 16 0
16.0 28 7
7.0
0 51
Totale 110.0 147 67.0 324

Cap. 2-45
Rappresentazione Grafica di
Dati Categorici Multivariati

 Diagramma a barre accostate


Confronto fra Investitori

Risparmio

CD

Obbligazioni

Azioni

0 10 20 30 40 50 60

Investitore A Investitore B Investitore C

Cap. 2-46
Esempio Grafico Accostato

 Vendite quadrimestrali per tre zone di vendita:

Quad. 1 Quad. 2 Quad. 3 Quad. 4


Est 20.4 27.4 59 20.4
Ovest 30.6 38.6 34.6 31.6
Nord 45.9 46.9 45 43.9

60

50

40
Est
30 Ovest
Nord
20

10

0
Quad. 1 Quad. 2 Quad. 3 Quad. 4
Cap. 2-47
Errori nella Presentazione dei Dati

Obiettivi per una presentazione efficace dei dati:


 Presentare i dati in modo da mostrare le informazioni
essenziali
 Comunicare idee complesse chiaramente ed in modo
accurato
 Evitare distorsioni che possono comunicare il
messaggio sbagliato

Cap. 2-48
Errori nella Presentazione dei Dati
(continuazione)

 Diversa ampiezza delle classi di


intervallo in un istogramma
 Compressione o distorsione dell’asse
verticale
 Omissione dello zero sull’asse verticale
 Non fornire una base di riferimento per il
confronto di dati di diversi gruppi

Cap. 2-49
Riepilogo del Capitolo
 Abbiamo discusso tipi di dati e livelli di misurazione
 Dati in forma grezza di solito non sono facili da usare nel
processo decisionale – Qualche
Q tipo di organizzazione è
necessaria:
 Tabelle
T b ll  Grafici
G fi i

 Tecniche viste in q
questo capitolo
p :
 Plot per serie storiche
 Distribuzione di frequenze  Distribuzione di frequenze
 Diagramma a barre  Istogramma and ogiva
 Diagramma a torta  Diagramma ramo-foglia
 Diagramma
g di Pareto  Diagramma di dispersione
 Tabelle a doppia entrata e
diagrammi a barre accostate
Cap. 2-50

Potrebbero piacerti anche