Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Parte 2
Chap 2-1
Contenuti
Distribuzioni di frequenza assoluta e relativa
Distribuzioni di frequenza cumulata e retrocumulata
Densità di frequenza
Grafici per distribuzioni di frequenza
Confronti grafici tra distribuzioni di frequenza
Chap 2-2
Esempio:
La corrosione dei materiali è uno dei processi che provoca più danni materiali ed
indirettamente anche economici. I dati seguenti sono stati ottenuti sottoponendo
a prova di corrosione un campione di 55 pezzi di diverse leghe metalliche allo
scopo di valutarne la resistenza all all’ossidazione
ossidazione, tramite la misurazione della
perdita in peso su unità di superficie e la velocità di corrosione.
Esempio:
Superficie
pezzo (cm2)
Distribuzione
Distribuzione
26.05 unitaria della
Metodo di Tempo Perdita in Materiale Superficie 30.07
Temperatura Velocità di
variabile
Perdita di peso/unità di
ID prova (h) peso (g) dichiarato pezzo (cm2) (°C) corrosione
29.09 “Superficie” 2
superficie (g/cm )
Inconel®
1 G28 24 0.0296 625 26.05 126 31.10
0.49 0.00114
Inconel®
27 76
27.76
2 G28 24 0.3005 625 30.07 126 4.34 0.00999
Inconel® 26.59
3 G28 24 0.1428 625 29.09 126 2.13 0.00491
Inconel® 21 90
21.90
4 G28 24 0.0575 625 31.10 126 0.80 0.00185
Inconel® …
5 G28 24 0.0874 625 27.76 126 1.37 0.00315
Inconel® 23 00
23.00
6 G28 24 0.6349 625 26.59 126 10.40 0.02388
ASTM A494
7 G28 120 0.0145 CU5MCuC 21.90 126 0.06 0.00066
… … … … … … … … …
ASTM A494
55 Huey 240 0.2366 CU5MCuC 23.00 121 0.46 0.01029
Chap 2-4
Distribuzioni di frequenza
Per poter procedere
d nell’analisi
ll’ li i di un dato
d f
fenomeno di interesse
i neii
suo vari aspetti rilevanti, è necessario sintetizzare le distribuzioni
unitarie delle variabili. Una p prima forma di sintesi è data dal calcolo
delle distribuzioni di frequenza.
q
La distribuzione di frequenza descrive il modo in cui una o p
più variabili
(caratteristiche) si manifestano (distribuiscono) in un dato collettivo
(campione o popolazione).
una singola variabile ‐> distribuzioni semplici
due variabili ‐> distribuzioni doppie
più di due variabili ‐> distribuzioni multiple
Distribuzione unitaria della Distribuzione di frequenza della
variabile variabile “Materiale dichiarato”
“Materiale
Materiale dichiarato
dichiarato”
Materiale Materiale
dichiarato dichiarato N
Inconel®
625 ASTM A494 CU5MCuC 17
Inconel® Inconel® 625 9
625
Inconel® M d lità
Modalità SA‐182 F53 3 Frequenze
Frequenze
625 UNS N 10276 6 assolute
Inconel®
625 Altro 20
Inconel® Totale 55
625
Inconel®
625
ASTM A494
CU5MCuC Numerosità del collettivo
…
ASTM A494 (numero totale di unità
CU5MCuC statistiche o di osservazioni)
Chap 2-6
Nella distribuzioni di frequenza possiamo associare ad ogni modalità di
una certa variabile (qualitativa o quantitativa) anche la frequenza
relativa, calcolata dividendo la frequenza assoluta per la numerosità
totale del collettivo. Moltiplicando le frequenze relative (semplici) x 100
otteniamo le frequenze relative percentuali.
percentuali
Esempio:
Materiale dichiarato N Frequenze relative %
ASTM A494 CU5MCuC 17 17 / 55 = 0.309 0.309 × 100 = 30.9
Inconel® 625 9 9 / 55 = 0.164 0.164 × 100 = 16.4
SA‐182 F53 3 3 / 55 = 0.054 0.054 × 100 = 5.4
UNS N 10276 6 6 / 55 = 0.109 0.109 × 100 = 10.9
Altro 20 20 / 55 = 0 364
20 / 55 = 0.364 0 364 × 100 = 36.4
0.364 × 100 = 36 4
Totale 55 1 100
Nell campione
N i i studio
in di 44 pezzii di lega
l (80%) presentano una superficie
fi i
inferiore o uguale a 40 cm2.
Chap 2-11
Analogamente, possiamo associare ad ogni modalità o classe di modalità
della variabile anche la frequenza retrocumulata assoluta o relativa,
calcolata
l l retrocumulando
l d progressivamente
i l frequenze
le f assolute
l o
relative. Le frequenze retrocumulate danno informazioni sul numero o
peso relativo di unità statistiche che hanno un valore della variabile
p
superiore o uguale ad una certa soglia di interesse.
Esempio:
p
Distribuzione di frequenza della Distribuzione di frequenza retrocumulata
variabile “Superficie” della variabile “Superficie”
Superficie pezzo Frequenze Superficie Freq. assolute
Freq. relative % retrocumulate
(cm2) N relative % pezzo (cm2) retrocumulate
10.01 – 20.00 3 5.5 ≥ 10.01 3+8+14+27+3 = 55 5.5+14.5+25.4+49.1+5.5 = 100
20.01 – 30.00 27 49.1 ≥ 20.01 3+8+14+27 = 52 5.5+14.5+25.4+49.1 = 94.5
30.01 – 40.00 14 25.4 ≥ 30.01 3+8+14 = 25 5.5+14.5+25.4 = 45.4
40.01 – 50.01 8 14.5 ≥ 40.01 3+8= 11 5.5+14.5 = 20.0
50.01 – 60.00 3 5.5 ≥ 50.01 3 5.5
Totale 55 100
Nell campione
N i i studio
in di 25 pezzii di lega
l (45 4%) presentano una superficie
(45.4%) fi i
superiore o uguale a 30.01 cm2.
Chap 2-12
Distribuzioni di frequenza: notazione formale
Modalità della Frequenze Frequenze relative Frequenze relative Frequenze relative
variabile X assolute semplici % semplici cumulate
x1 n1 n1 / n = f1 f1 × 100 f1 = F(x1)
… … … … …
xi ni ni / n = c fi × 100 f1 + … + fi = F(xi)
… … … … …
xk nk nk / n = fk fk × 100 f1 + … + fi + … +fk = 1
Totale n 1 100
Classi della Frequenze Frequenze relative Frequenze relative Frequenze relative
variabile X assolute semplici % semplici cumulate
(x0, x1] n1 n1 / n = f1 f1 × 100 f1 = F(x1)
… … … … …
(xi-1, xi] ni ni / n = fi fi × 100 f1 + … + fi = F(xi)
… … … … …
(xk-1, xk] nk nk / n = fk fk × 100 f1 + … + fi + … +fk = 1
Totale n 1 100
n1 ... n i ... n k i 1 n i n ; 0 n i n
k
f 1 ... f i ... f k i 1 f i 1; 0 f i 1
k
Esempio:
Superficie pezzo N Ampiezza della Densità di
(cm2) classe frequenza
10.01 – 30.00 30 20 30 / 20 = 1.5
30.01 – 40.00 14 10 14 / 10 = 1.4
40.01 – 60.00 11 20 11 / 20 = 0.6
Totale 55
Chap 2-14
Rappresentazione grafica delle distribuzioni di frequenza
E’ possibile affiancare alle distribuzioni riportate in forma tabellare, grafici che
per immediatezza visiva riescono ad evidenziare con più efficacia le
informazioni raccolte.
raccolte
La scelta del metodo grafico dipende da:
le finalità conoscitive;
il tipo di variabile da rappresentare.
Chap 2-15
Il Diagramma a barre
Il diagramma
g a barre è un g grafico costituito da una serie di barre
(orizzontali o verticali). Ciascuna barra rappresenta una modalità della
variabile, e la lunghezza della barra è proporzionale alla frequenza
assoluta, relativa semplice o percentuale della modalità considerata.
considerata
Il diagramma a barre permette di confrontare il peso delle diverse
modalità.
Esempio:
Distribuzione
Distribuzione di frequenza della
di frequenza della Diagramma
Diagramma a barre della variabile
a barre della variabile
variabile “Materiale dichiarato” “Materiale dichiarato”
Materiale dichiarato
Materiale dichiarato N % SA-182
SA 182 F53 54
5.4
Esempio:
Distribuzione di frequenza della Diagramma a torta della variabile
variabile “Materiale dichiarato” “Materiale dichiarato”
5
5.4%
4%
Materiale dichiarato N % Altro
ASTM A494 CU5MCuC 17 30.9 10.9%
ASTM A494 CU5MCuC
Inconel® 625 9 16.4 36 4%
36.4%
16.4% Inconel® 625
SA‐182 F53 3 5.4
UNS N 10276 6 10.9 UNS N 10276
Il diagramma
g di Pareto diventa p
particolarmente utile q
quando le modalità
della variabile di interesse sono molte. Infatti il vantaggio di questo
grafico consiste nella sua capacità di separare le poche modalità cui è
associata una frequenza più alta da quelle meno rappresentate nei
dati permettendo al lettore di concentrarsi sulle modalità più importanti.
dati, importanti
Chap 2-18
Esempio:
Produzione di circuiti stampati
Produzione di circuiti stampati
n. Pezzi controllati: 200
n. Pezzi difettosi: 56
Tipo di difetto N. %
Planarità 4 7.1
Microinterruzioni 6 10 7
10.7
%
Altro 2 3.6
Fori minorati 15 26.8
Difetti incisione
Difetti incisione 29 51.8
Totale pezzi difettosi 56 100.0
Fori Planarità
Difetti minorati Micro Altro
incisione interruzioni
Nel campione in studio,
studio seguendo la linea spezzata si osserva che le
prime due modalità (difetti di incisione e fori minorati) assommano quasi
all’80% dei difetti. Il diagramma consente ai responsabili del processo
produttivo di individuare dove concentrare l’attenzione per migliorare il
processo.
Chap 2-19
L’Istogramma
L’Istogramma
g è un ggrafico p
per variabili continue suddivise in classi,,
costituito da una serie di rettangoli affiancati, la cui base rappresenta
l’ampiezza delle classi e l’altezza rappresenta la frequenza assoluta,
relativa semplice o percentuale corrispondente alle varie classi.
classi
Esempio:
Distribuzione di frequenza della Istogramma della variabile
variabile “Superficie” “Superficie”
%
60
Superficie pezzo Frequenze 49.1
50
(cm2) N relative %
40
10.01 – 20.00 3 5.5
20.01 – 30.00 27 49.1 30 25.4
30 01 – 40.00
30.01 40 00 14 25.4 20 14 5
14.5
40.01 – 50.01 8 14.5
10 5.5 5.5
50.01 – 60.00 3 5.5
Totale 55 100 0
10.00 20.00 30.00 40.00 50.00 60.00
Superficie
Chap 2-20
Se la variabile è suddivisa in classi di diversa ampiezza, l’Istogramma è
costituito da una serie di rettangoli
g affiancati,, la cui base rappresenta
pp
l’ampiezza delle classi e l’altezza rappresenta la densità di frequenza
corrispondente alle varie classi. L’area di ciascun rettangolo è quindi la
frequenza corrispondente alla classe.
classe
Densità di frequenza
Densità di frequenza
E
Esempio:
i
2
Esempio:
Distribuzione di frequenza della Poligono della variabile “Superficie”
variabile “Superficie”
60
Superficie pezzo Frequenze
50 49.1
(cm2) N relative %
10.01 – 20.00 3 5.5 40
20.01 – 30.00 27 49.1 30
30 01 – 40.00
30.01 40 00 14 25.4 25.4
20
40.01 – 50.01 8 14.5 14.5
10
50.01 – 60.00 3 5.5 5.5 5.5
Totale 55 100 0
15.00 25.00 35.00 45.00 55.00
Superficie
Chap 2-22
Il poligono cumulativo (ogiva)
Il p
poligono
g cumulativo o ogivag è un g grafico p
per variabili continue
suddivise in classi, costituito da una linea spezzata che unisce i punti con
ascissa pari all’estremo superiore di ciascuna classe e ordinata pari alla
frequenza cumulata assoluta, relativa semplice o percentuale
corrispondente alle varie classi.
Esempio:
p
Distribuzione di frequenza della Ogiva della variabile “Superficie”
variabile “Superficie” Freq Cumulate %
Freq. Cumulate %
Superficie
pezzo (cm2) N % % cumulate
10.01 – 20.00 3 5.5 5.5
20.01 – 30.00 27 49.1 54.6
30.01
30 01 – 40.00
40 00 14 25.4 80.0
40.01 – 50.01 8 14.5 94.5
50.01 – 60.00 3 5.5 100
Totale 55 100
Rendimento annuo
Chap 2-23
Diagramma a barre o Poligono per il confronto tra gruppi
Quando si confrontano le distribuzione di frequenza tra due o più gruppi di unità
statistiche è consigliabile considerare le frequenze relative semplici o percentuali
per eliminare la possibile distorsione dovuta all’eventuale diversa numerosità dei
gruppi a confronto.
confronto Per la rappresentazione grafica è consigliabile utilizzare un
diagramma a barre affiancate o i poligoni.
E i
Esempio:
È stato osservato un campione di fondi di
investimento costituito da 59 fondi a
capitalizzazione integrale e 135 fondi
misti. Di questi si considera la variabile
“rendimento netto annuale in %”.
Nota: negli intervalli è incluso l’estremo superiore
Chap 2-24
Diagramma a barre o Ogiva per il confronto tra gruppi
Il confronto delle distribuzione di frequenza tra due o più gruppi di unità
statistiche può essere condotto anche considerando le frequenze relative
cumulate semplici o percentuali. Per la rappresentazione grafica è consigliabile
utilizzare un diagramma a barre affiancate o le ogive.
ogive
Esempio:
Riprendiamo l’esempio del campione
di fondi di investimento costituito da
59 fondi a capitalizzazione integrale e
135 fondi misti.
≤
≤
≤
≤
≤
≤
≤
≤
Nota: negli intervalli è incluso l’estremo superiore
Chap 2-25
Principi di correttezza grafica
IlIl grafico
fi non deve
d d
dare una visione
ii
distorta dei dati.
IlIl grafico
fi non deve
d contenere inutili
i ili
abbellimenti
LLa scala
l lungo
l l’
l’asse verticale
i l deve
d
iniziare da zero.
Gli assii devono
d essere chiaramente
hi
etichettati.
È necessario
È i scegliere
li l
correttamente la
scala in modo da non comprimere il
grafico
Il grafico deve avere un titolo.
ÈÈ consigliabile
i li bil usare il grafico
fi più
iù
semplice per rappresentare I dati.
Chap 2-26