Sei sulla pagina 1di 60

Lezione n.

 6 ‐ La gestione statistica 
dei dati sperimentali
Statistica Sperimentale e Misure 
Meccaniche

G. Barbato ‐ A. Germak ‐ G. Genta 1


INTRODUZIONE
La descrizione dei complessi di misura ha evidenziato due
caratteristiche metrologiche: la riproducibilità e l’accuratezza
(collegate, rispettivamente, agli effetti accidentali e sistematici).

L’utente di un complesso di misura ha la necessità di estrarre dalla


nuvola di valori sperimentali un valore da assegnare al misurando e
l’incertezza ad esso collegato. Il risultato di misura è da considerarsi
distorto, per la presenza di effetti sistematici, e confuso, per la
presenza di quelli accidentali; inoltre è possibile che vi siano stati
incidenti di misura.

Pertanto, l’analisi stastica dei risultati sperimentali deve tendere ad


individuare un valore centrale ed un indice di dispersione, oltre a porre
in atto accorgimenti per evidenziare la presenza di fattori sistematici e
di eventuali incidenti.

G. Barbato ‐ A. Germak ‐ G. Genta 2


INTRODUZIONE
Quando viene evidenziata la presenza di fattori di disturbo, occorre
riesaminare le condizioni di funzionamento ed i concetti base secondo
i quali è stata organizzata la procedura di misura.

Tuttavia, lo sviluppo dei principi generali che portano ad evidenziare la


presenza di fattori indesiderati e (dopo la loro eliminazione) a
determinare il valore centrale e l’indice di dispersione, consente di
gestire i dati sperimentali in modo adeguato alle richieste di norma.

La gestione dei dati sperimentali dovrebbe essere differenziata da


caso a caso, perché ogni caso dovrebbe portare ad una specifica
pianificazione dell’esperimento. Tuttavia una condizione molto diffusa
consiste nell’affrontare le misurazioni in un modo completamente
casualizzato di rilevazione del misurando e di andamento delle
condizioni al contorno.

G. Barbato ‐ A. Germak ‐ G. Genta 3


INTRODUZIONE

Per spiegare i metodi di gestione dei dati sperimentali si procederà


passo passo con un esempio. Si ipotizza l’esecuzione indipendente di
prove da parte di operatori diversi, tale fattore non viene casualizzato,
in modo da poter valutare la sua eventuale influenza.

Lo schema proposto dei dati è rappresentativo di una modalità che


consiste nell’ipotizzare l’effetto di fattori noti, tenuti sotto controlllo, e
nel casualizzare il più possibile gli altri fattori, in modo che il loro effetto
sia distribuito e venga reso poco significativo con l’operazione di
media.

G. Barbato ‐ A. Germak ‐ G. Genta 4


LA DESCRIZIONE DEI DATI SPERIMENTALI
Si seguirà una procedura rigorosa (implementata in Excel®) per
comprendere e studiare il comportamento dei dati raccolti.

Dati sperimentali, ottenuti dalle misurazioni di lunghezza di un


manufatto fatte da cinque diversi operatori, espressi in millimetri.
G. Barbato ‐ A. Germak ‐ G. Genta 5
LA DESCRIZIONE DEI DATI SPERIMENTALI
La forma tabellare è utile per la raccolta dei dati, ma non
permette né di individuare possibili fattori di influenza né di
determinare la dispersione dei dati.
È pertanto opportuno adottare una rappresentazione grafica,
che consente di rendersi conto visivamente della situazione.

G. Barbato ‐ A. Germak ‐ G. Genta 6


LA DESCRIZIONE DEI DATI SPERIMENTALI
Passo 1: 
Calcolare le principali statistiche descrittive per l’intero set di
dati.
n

∑x i
mx = i =1

Numero dei dati 50 n
Media 8.0063
Scarto tipo 0.0029
Valore massimo 8.0140
n
Valore minimo 8.0017 ∑ ( xi − mx )
2

sx2 = i =1
n −1

G. Barbato ‐ A. Germak ‐ G. Genta 7


LA DESCRIZIONE DEI DATI SPERIMENTALI
Calcolare le principali statistiche descrittive per ogni singolo
operatore.

Oper. 1 Oper. 2 Oper. 3 Oper. 4 Oper. 5


Max 8.0140 8.0093 8.0073 8.0113 8.0114
Q3 8.0075 8.0054 8.0065 8.0101 8.0103
Q2 8.0045 8.0043 8.0055 8.0090 8.0066
Q1 8.0033 8.0028 8.0033 8.0070 8.0064
Min 8.0017 8.0020 8.0025 8.0047 8.0053

G. Barbato ‐ A. Germak ‐ G. Genta 8


LA DESCRIZIONE DEI DATI SPERIMENTALI
Passo 2: 
Le statistiche descrittive, calcolate per ogni singolo operatore,
permettono di disegnare dei boxplot.
Max
8.0150
8.0120
8.0090
Q3= 3° quartile = 
8.0060
75° percentile
8.0030
Q1= 1° quartile = 
8.0000
Oper. 1
25° percentile

Min
G. Barbato ‐ A. Germak ‐ G. Genta 9
LA DESCRIZIONE DEI DATI SPERIMENTALI
Confrontare graficamente tramite boxplot i risultati relativi ad
ogni singolo operatore .

8.015

8.012

8.009

8.006

8.003

8.000
Oper. 1 Oper. 2 Oper. 3 Oper. 4 Oper. 5

G. Barbato ‐ A. Germak ‐ G. Genta 10


LA DESCRIZIONE DEI DATI SPERIMENTALI
Passo 3: 
Rappresentare graficamente la distribuzione dell’intero set di
dati sperimentali.

Grafico della spunta dei dati sperimentali.

G. Barbato ‐ A. Germak ‐ G. Genta 11


LA DESCRIZIONE DEI DATI SPERIMENTALI

Per fare lo spoglio manuale dei dati e per metterli in ordine


crescente, in modo da individuare il massimo ed il minimo, è utile
disporli uno dopo l’altro su un asse.

Per comodità, la scala dell’asse rappresenta solo la parte variabile


dei dati. Nel caso in esame, viene rappresentata la differenza Δx
rispetto al valore di 8 mm, quindi per il primo dato 3,8 µm, per il
secondo 5,1 µm e così via. La divisione elementare viene presa
uguale alla risoluzione di misura.

Si prendono in successione i dati ponendo per ognuno di essi un


segno (ad esempio una x) in corrispondenza del valore indicato
sull’asse. Se in corrispondenza ad un certo valore vi siano già uno o
più segni, si sovrappone l’ultimo ai precedenti.

G. Barbato ‐ A. Germak ‐ G. Genta 12


LA DESCRIZIONE DEI DATI SPERIMENTALI

Per rappresentare in modo più chiaro il comportamento dell’intero


set di dati sperimentali si può utilizzare un istogramma.

Occorre suddividere la lunghezza totale dell’asse in un certo numero


di zone, dette classi. Non esiste un criterio rigoroso, ma come
indicazione sul numero di classi nc da utilizzare per rappresentare n
dati sperimentali, si può prendere

nc = n
È utile definire un valore di partenza che non corrisponde a nessun
dato (ad esempio 8.00145 mm) e un’ampiezza di classe con la stessa
risoluzione dei dati sperimentali (ad esempio 1.5 μm); si eviteranno
così ambiguità relative a dati sul confine tra due classi.
G. Barbato ‐ A. Germak ‐ G. Genta 13
LA DESCRIZIONE DEI DATI SPERIMENTALI
Pertanto, nell’esempio si avrà:
• valore minimo dell’intervallo: 8.00145
• ampiezza di classe: 0.0015
• numero di classi: 9
• valore massimo dell’intervallo: 8.01495

Dallo spoglio (contando il numero dei dati compresi tra il valore


inferiore di classe 8.00145 ed il valore superiore di classe 8.00295) si
vede che nella prima classe sono contenuti 7 dati, analogamente si
trovano 7 dati nella seconda classe e così via.

Il numero di dati che cade in una certa classe è detto frequenza


assoluta. Una rappresentazione grafica preliminare è fatta con un
diagramma a colonne le cui altezze rappresentano le frequenze
assolute.

G. Barbato ‐ A. Germak ‐ G. Genta 14


LA DESCRIZIONE DEI DATI SPERIMENTALI

Distribuzione di frequenza sperimentale: frequenza assoluta fa

G. Barbato ‐ A. Germak ‐ G. Genta 15


LA DESCRIZIONE DEI DATI SPERIMENTALI
Andamento delle frequenze assolute

G. Barbato ‐ A. Germak ‐ G. Genta 16


LA DESCRIZIONE DEI DATI SPERIMENTALI
Distribuzione di frequenza sperimentale: frequenza relativa fr
(probabilità corrispondente ad ogni classe), data dal rapporto tra il
numero di dati che cadono in una certa classe ed il numero totale
dei dati.

G. Barbato ‐ A. Germak ‐ G. Genta 17


LA DESCRIZIONE DEI DATI SPERIMENTALI
Distribuzione di frequenza sperimentale: densità di frequenza ρf
(altezza delle colonne dell’istogramma), data dal rapporto tra
frequenza relativa (area delle colonne) e ampiezza di classe (base delle
colonne). È pertanto possibile confrontare l’istogramma con una
distribuzione di probabilità.

G. Barbato ‐ A. Germak ‐ G. Genta 18


LA DESCRIZIONE DEI DATI SPERIMENTALI
Istogramma delle frequenze relative (la densità di frequenza ρf è una
variabile accessoria per rendere l’istogramma confrontabile con una
distribuzione di probabilità).

La forma della normale dipende dalla stima sperimentale del valore


medio e della varianza.
G. Barbato ‐ A. Germak ‐ G. Genta 19
PROCEDURA COMPLETA DI ANALISI DEI DATI 
SPERIMENTALI
L’obiettivo iniziale consiste nell’individuare la presenza di effetti
sistematici e di eventuali incidenti di misura, seguendo una logica
iterativa.

Si considera come termine di confronto la stima della distribuzione


normale basata su m ed s. Tali valori risentono della presenza di
effetti sistematici ed incidenti, per cui, all’inizio, il confronto è poco
chiaro. Se si individuano e si eliminano iterativamente gli effetti più
grossolani, la sensibilità migliora.

Nell’applicazione conviene avere un calcolo automatico, che


consenta di riproporre all’inizio i dati originali e poi via via corretti e
fornisca le elaborazioni con immediatezza. Nell’ambito di tale logica,
occorre valutare prima di tutto la presenza di incidenti di misura.

G. Barbato ‐ A. Germak ‐ G. Genta 20


PROCEDURA COMPLETA DI ANALISI DEI DATI 
SPERIMENTALI
Outlier

Un outlier rappresenta un’osservazione che sembra discostarsi


nettamente dagli altri valori in un campione casuale di una
popolazione. Tuttavia, gli outlier devono essere studiati con
attenzione: spesso contengono preziose informazioni sul processo di
misura, sulla raccolta dei dati, o sul metodo di registrazione.
Prima di considerare la possibile eliminazione degli outlier dai dati
sperimentali, occore cercare di capire il motivo della loro comparsa
e valutare la possibilità che valori simili continuino a presentarsi.

G. Barbato ‐ A. Germak ‐ G. Genta 21


PROCEDURA COMPLETA DI ANALISI DEI DATI SPERIMENTALI
I principi di esclusione

Passo 4:
Si è visto che i dati sperimentali possono contenere errori
sistematici, errori accidentali grossi e rari ed errori accidentali
piccoli e numerosi. Cerchiamo, innanzitutto di individuare eventuali
incidenti di misura (errori accidentali grossi e rari), e di escluderli
mediante il principio di esclusione di Chauvenet.
Tale principio stabilisce che si possano escludere i dati che hanno
probabilità di accadere P inferiore al 50%. Nell’ambito di n dati ciò
viene ricondotto a una probabilità per il singolo dato p
rappresentata da:

P 50%
p< p<
n n

G. Barbato ‐ A. Germak ‐ G. Genta 22


PROCEDURA COMPLETA DI ANALISI DEI DATI SPERIMENTALI
I principi di esclusione
Calcolata la media m e lo scarto tipo s dei dati sperimentali, si
utilizza l’ipotesi che essi siano distribuiti normalmente.
 
Chauvenet.
160

140

120

100

P ( x < xli ) = P ( x > xls ) =


50%
-1
f /mm

80
2n
60

P(x<x li ) P(x>x ls )
40

20 x li x ls

0
7,9977 8,0007 8,0037 8,0067 8,0097 8,0127 8,0157

x /mm

Date P(x<xli) e P(x>xls), si ricavano i confini di esclusione xli e xls.


G. Barbato ‐ A. Germak ‐ G. Genta 23
PROCEDURA COMPLETA DI ANALISI DEI DATI SPERIMENTALI
I principi di esclusione

Nel caso esaminato, i confini di esclusione si ottengono da:


50%
p<
50

ovvero da:

50%
P ( x < xli ) = P ( x > xls ) =
100

G. Barbato ‐ A. Germak ‐ G. Genta 24


PROCEDURA COMPLETA DI ANALISI DEI DATI SPERIMENTALI
I principi di esclusione

Si utlizzano le tabelle delle probabilità cumulata della distribuzione


normale.

Si osservi che
50% 50%
Pli = = 0,5% ⇒ zli = −2,58 Pls = 1 − = 99,5% ⇒ zls = 2,58
100 100

da cui

xli − m
z li ≈ ⇒ xli ≈ m + z li s = 8,0063 − 2,58 ⋅ 0,0029 = 7,9988
s
x −m
z ls ≈ ls ⇒ xls ≈ m + z ls s = 8,0063 + 2,58 ⋅ 0,0029 = 8,0139
s

G. Barbato ‐ A. Germak ‐ G. Genta 25


PROCEDURA COMPLETA DI ANALISI DEI DATI SPERIMENTALI
I principi di esclusione
Confrontando i valori di confine con i dati sperimentali si vede che un 
dato dovrebbe essere escluso.

G. Barbato ‐ A. Germak ‐ G. Genta 26


PROCEDURA COMPLETA DI ANALISI DEI DATI SPERIMENTALI
I principi di esclusione

Per l’esclusione ci si deve comportare in uno dei modi seguenti, con 
preferenza in ordine da a) a c):
a) se si può utilizzare l’impianto sperimentale si fa una nuova 
misura, o meglio un nuovo ciclo di misure, parziale rispetto a 
quello iniziale, ma tale da far riprendere allo strumento il ritmo 
di crescita – decrescita dei valori analogo alla situazione della 
misura originale
b) se non si possono rifare le misure si esclude semplicemente il 
dato. Ciò non è sempre possibile, perché alcune operazioni di 
valutazione o anche semplicemente funzioni di calcolo 
preimpostate richiedono una tabella completa.
c) se non si possono lasciare vuote le caselle dei dati eliminati, al 
loro posto si mette il valore medio ottenuto dopo l’eliminazione
dei dati da escludere. 
G. Barbato ‐ A. Germak ‐ G. Genta 27
PROCEDURA COMPLETA DI ANALISI DEI DATI SPERIMENTALI
I principi di esclusione
Sostituzione dell’incidente di misura individuato con il valore medio
ottenuto dopo la sua esclusione.

Il nuovo valore medio è pari a 8.0062 mm, mentre il nuovo scarto


tipo è 0.0027 mm.
G. Barbato ‐ A. Germak ‐ G. Genta 28
PROCEDURA COMPLETA DI ANALISI DEI DATI SPERIMENTALI
I principi di esclusione
Distribuzione di frequenza sperimentale dopo correzione

G. Barbato ‐ A. Germak ‐ G. Genta 29


PROCEDURA COMPLETA DI ANALISI DEI DATI SPERIMENTALI
I principi di esclusione
Istogramma delle frequenze relative dopo correzione

160

140

120

100
ρf/mm-1

Dens. fr.
80
Normale

60

40

20

x/mm

G. Barbato ‐ A. Germak ‐ G. Genta 30


PROCEDURA COMPLETA DI ANALISI DEI DATI SPERIMENTALI
Controllo della normalità di una distribuzione sperimentale
Se le variazioni dei risultati sono legate solo ad effetti aleatori, la
distribuzione sperimentale attesa è normale; invece, se la distribuzione
non risulta normale, si può ritenere che siano presenti fattori
sistematici.

Metodi per controllare l’ipotesi di normalità della distribuzione


sperimentale
• Test del χ2: metodo numerico rigoroso, che consente, se il caso
ricorre, di rifiutare l’ipotesi di normalità ad un ben definito livello di
fiducia P.
• Grafico di Probabilità Normale: non consente di esprimere il rifiuto
dell’ipotesi di normalità in modo rigoroso, ma ha il vantaggio della
forma grafica, che fornisce preziose informazioni sulle eventuali
cause di non normalità.
G. Barbato ‐ A. Germak ‐ G. Genta 31
CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il test del χ2
Si può valutare la differenza tra la distribuzione sperimentale e la 
distribuzione normale teorica sulla base delle differenze nelle varie 
classi. 

N ( fa − ft j )
2

W =∑
j
Distribuzione del χ2
j =1 ft j

Le frequenze assolute teoriche fat possono essere ottenute dalle 
frequenze relative teoriche frt, calcolabili come i valori di probabilità 
teorici negli stessi intervalli di classe per la distribuzione normale.
È opportuno esaminare alcune classi prima e dopo rispetto a quelle 
che contengono dati sperimentali, in modo da ricoprire l’intervallo in 
cui la distribuzione normale assimilata assume valori significativi.

G. Barbato ‐ A. Germak ‐ G. Genta 32


CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il test del χ2

G. Barbato ‐ A. Germak ‐ G. Genta 33


CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il test del χ2
• La frequenza relativa teorica frt  è calcolata come differenza della 
distribuzione cumulata agli estremi di classe zs e zi.

• La frequenza assoluta teorica fat è calcolata come prodotto della 


frequenza relativa per il numero di dati (nell’esempio n = 50).

• Nell’ultima colonna si calcolano i contributi (fa ‐ fat)²/ fat delle 


diverse classi a W. La somma dei contributi fornisce il valore 
sperimentale di W, che deve essere confrontato con i limiti 
teorici di χ² per il livello di fiducia P richiesto.

G. Barbato ‐ A. Germak ‐ G. Genta 34


CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il test del χ2
Scelta del livello di fiducia P
Occorre valutare le conseguenze del rifiuto di un’ipotesi nulla vera. 
Nel nostro caso, l’ipotesi nulla è che la distribuzione sperimentale 
sia normale, ovvero che i dati non siano affetti da errori sistematici 
variabili o da incidenti di misura di tale entità da deformare 
sensibilmente la distribuzione. 

Se accettiamo un rischio di errore alto, rischiamo di avere 
un’indicazione della presenza di effetti di disturbo anche se non ci 
sono. La conseguenza sarà una maggior attenzione nell’analisi del 
metodo di misura, tuttavia tale analisi deve essere sempre fatta. 
Usiamo, quindi, un livello di fiducia P = 85%.

G. Barbato ‐ A. Germak ‐ G. Genta 35


CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il test del χ2
La forma della distribuzione teorica di χ² dipende dal numero di 
gradi di libertà, che sono dati dal numero di possibili differenze 
(numero di classi esaminate), a cui deve essere tolto il numero dei 
vincoli imposti.

Nel confronto tra distribuzione normale e istogramma della 


distribuzione sperimentale sono stati imposti tre vincoli: 
l’uguaglianza della media, l’uguaglianza dello scarto tipo e 
l’uguaglianza dell’area totale (unitaria). 

I gradi di libertà sono, quindi, uguali al numero delle classi 
confrontate meno 3.

G. Barbato ‐ A. Germak ‐ G. Genta 36


CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il test del χ2

Il valore W del χ² sperimentale cade all’interno dei limiti 


corrispondenti al livello di fiducia P. Pertanto, il test non è riuscito a 
vedere nulla di strano, ma potrebbero essere presenti disturbi tanto 
piccoli da non poter essere evidenziati.  Non vi sono ragioni per 
rifiutare l’ipotesi nulla che la distribuzione sperimentale sia assimilabile 
ad una normale.

Nel caso W sia esterno, invece, l’ipotesi nulla viene rifiutata al livello di 
fiducia P (cioè vi è una probabilità 1 ‐ P che non vi sia un’effettiva 
differenza della distribuzione sperimentale dalla normale).
G. Barbato ‐ A. Germak ‐ G. Genta 37
CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il test del χ2
Il test del χ² è di solito bilaterale, cioè il rifiuto viene fatto sia per 
valori di W troppo grandi (distribuzione sperimentale troppo diversa 
dalla normale), sia per valori di W troppo piccoli (distribuzione 
sperimentale troppo simile alla normale).
Quest’ultima condizione, che potrebbe sembrare auspicabile, è 
molto improbabile e quindi oggetto di sospetto.

G. Barbato ‐ A. Germak ‐ G. Genta 38


CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il Grafico di Probabilità Normale
L’idea che sta alla base del metodo del Grafico di Probabilità
Normale (GPN) è la ricerca di una presentazione immediatamente
riconoscibile di una forma associata alla distribuzione normale.

Né la forma a campana (densità di probabilità) né la forma ad S


(distribuzione cumulativa) hanno caratteristiche intrinseche che
consentano un riconoscimento, se non generico.

Per avere una forma riconoscibile è stato preparato un opportuno


grafico, detto Grafico di Probabilità Normale, con la scala delle
ordinate deformata in modo che la curva ad S della distribuzione
normale cumulata venga rappresentata con una retta.

G. Barbato ‐ A. Germak ‐ G. Genta 39


CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il Grafico di Probabilità Normale

1,2

1,0

0,8

0,6

0,4

0,2
0,20
0,15
0,0 0,10

-0,2
-20 -15 -10 -5 0 5 10 15 20

Creazione della scala deformata del GPN (a destra), tramite la quale la 
forma ad S della distribuzione normale cumulata viene rappresentata 
da una retta.
G. Barbato ‐ A. Germak ‐ G. Genta 40
CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il Grafico di Probabilità Normale
Esempio: Tabella di dati ordinati distribuiti normalmente con la 
corrispondente frequenza relativa cumulata frc.

G. Barbato ‐ A. Germak ‐ G. Genta 41


CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il Grafico di Probabilità Normale
Le frequenze relative cumulate frc  sono state calcolate sulla base del 
numero d’ordine di ogni singolo dato, posto in ordine crescente. 

Si può pensare che sul primo di n dati si commuta dalla zona di 


frequenza relativa cumulata di 0/n, alla zona di frequenza relativa 
cumulata di 1/n, per cui sul valore del dato si può prendere la media 
di 0,5/n. Analogamente al secondo dato il passaggio è da 1/n a 2/n, 
per cui si può prendere 1,5/n. 

In generale, all’i‐esimo dato si può assegnare la frequenza relativa 
cumulata frc = (i ‐ 0,5)/n.

G. Barbato ‐ A. Germak ‐ G. Genta 42


CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il Grafico di Probabilità Normale

Le ordinate del Grafico di Probabilità Normale sono i valori della 


variabile normalizzata z corrispondenti alle frequenze relative 
cumulate sperimentali.  Se tali frequenze cumulate 
corrispondessero a quelle della distribuzione normale, l’andamento 
risulterebbe rettilineo. 

È possibile  valutare a colpo d’occhio se l’andamento del GPN 
ottenuto si avvicina alla forma rettilinea, oppure si discosta da essa 
in modo significativo. In quest’ultimo caso, si può anche trarre 
qualche informazione sulle cause di non‐normalità.

G. Barbato ‐ A. Germak ‐ G. Genta 43


CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il Grafico di Probabilità Normale
Esempio: GPN per i dati distribuiti normalmente . 
3,0

2,0

1,0

0,0
z

-1,0

-2,0

-3,0
9,296 9,298 9,300 9,302 9,304 9,306
x/mm

Gli errori accidentali portano ad irregolarità locali rispetto ad un 
andamento rettilineo esatto. Si esamina, pertanto, una fascia rettilinea, 
la cui larghezza corrisponde alla dimensione dei difetti localizzati. 
G. Barbato ‐ A. Germak ‐ G. Genta 44
CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il Grafico di Probabilità Normale
Si può osservare che l’andamento dei dati sperimentali è 
assimilabile ad una retta. In tal caso, non si può rifiutare l’ipotesi di 
distribuzione normale. 

Tuttavia, il giudizio se i dati si dispongano adeguatamente su un 
andamento rettilineo è arbitrario, quindi non è possibile assegnare 
un determinato livello di fiducia.

G. Barbato ‐ A. Germak ‐ G. Genta 45


CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il Grafico di Probabilità Normale
Distribuzione ipernormale: curva a campana più alta al centro 
rispetto a quella della distribuzione normale e, di conseguenza, con 
le parti estreme più basse.

Il GPN ha una forma leggermente deformata rispetto all’andamento 
dell’integrale della curva a campana. Se quest’ultima per 
l’ipernormale è più alta al centro e più bassa agli estremi della 
curva della normale, la sua curva integrale avrà una pendenza 
maggiore al centro e minore agli estremi.

Dal punto di vista sperimentale, tale condizione può essere legata ad 
una forma di “filtraggio” che ha eliminato in modo preferenziale i 
dati più discosti dal valore medio.

G. Barbato ‐ A. Germak ‐ G. Genta 46


CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il Grafico di Probabilità Normale

Esempio: GPN per una distribuzione ipernormale

4,0
3,0
2,0
1,0
0,0
z

-1,0
-2,0
-3,0
-4,0
9,296 9,298 9,300 9,302 9,304 9,306
x/mm

G. Barbato ‐ A. Germak ‐ G. Genta 47


CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il Grafico di Probabilità Normale
Tale situazione è presente sia in campo metrologico, sia nel settore 
della produzione. 

• In ambito metrologico, la distribuzione ipernormale corrisponde 
ad una riduzione del numero dei dati più lontani dal valore 
medio, e ciò accade, in generale, perché l’operatore tende a 
escludere sulla base del giudizio personale i dati più discosti dal 
valore che egli attende. Tale pratica deve essere scoraggiata, 
perché falsa la distribuzione dei risultati.

• Nel caso dei risultati di una produzione, l’ipernormale indica che 
la parte di produzione esaminata è già stata sottoposta ad un 
processo di selezione. 

G. Barbato ‐ A. Germak ‐ G. Genta 48


CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il Grafico di Probabilità Normale
Distribuzione iponormale: curva a campana più bassa della normale 
nella zona centrale e più alta agli estremi. Pertanto, i risultati
prossimi al valore medio risultano meno frequenti di quanto 
previsto dalla distribuzione normale.

Tale condizione può essere dovuta genericamente a una sottrazione
dei dati più vicini al valore medio. Nel settore della produzione, ciò 
potrebbe essere dovuto ad una selezione che sposta alcuni dei 
prodotti migliori in una classe commercialmente più redditizia.

La condizione di iponormalità può anche essere dovuta ad altri due
fattori, tipici del campo metrologico, ma che possono essere 
presenti anche nel settore della produzione.

G. Barbato ‐ A. Germak ‐ G. Genta 49


CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il Grafico di Probabilità Normale
Distribuzione bimodale
Si riscontra la presenza di due condizioni distinte e discoste. 

Si considerino, ad esempio, misure di durezza in presenza di due 
strutture metallurgiche di durezza sensibilmente differente e di 
dimensioni prossime a quelle dell’impronta, oppure misure 
dimensionali in presenza di giochi nel sistema di misura che 
spostano la condizione di misura in due posizioni preferenziali 
discoste. 

In tali situazioni, la distribuzione presenta due massimi di frequenza 
relativa distinti, quindi due mode, per cui viene detta bimodale. 

G. Barbato ‐ A. Germak ‐ G. Genta 50


CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il Grafico di Probabilità Normale
Esempio: GPN per una distribuzione iponormale. Si tratta di una
distribuzione bimodale; le parti estreme tendono ad una forma
rettilinea.

G. Barbato ‐ A. Germak ‐ G. Genta 51


CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il Grafico di Probabilità Normale
Distribuzione affetta da deriva
Il risultato di misura appartiene a una normale che si sposta con 
continuità nel tempo.

Se ciò avviene per un tempo sufficientemente lungo, la distribuzione 
globale, corrispondente alla convoluzione delle diverse normali 
successive, è nettamente appiattita nella sua parte centrale. 

G. Barbato ‐ A. Germak ‐ G. Genta 52


CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il Grafico di Probabilità Normale
Esempio: GPN per una distribuzione iponormale. Si tratta di una
distribuzione affetta da una leggera deriva.

3,0
2,0
1,0
0,0
z

-1,0
-2,0
-3,0
9,294 9,296 9,298 9,300 9,302 9,304 9,306
x/mm

G. Barbato ‐ A. Germak ‐ G. Genta 53


CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il Grafico di Probabilità Normale
Queste condizioni di iponormalità sono rappresentate da forme del
GPN molto simili, tuttavia esse sono nella sostanza molto diverse.

Quindi, l’indicazione di iponormalità è solo un indizio che deve essere


analizzato per vedere a quale caso corrispondano le reali condizioni di
misura.

G. Barbato ‐ A. Germak ‐ G. Genta 54


CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il Grafico di Probabilità Normale
Caso studio : Tabella dati per la preparazione del GPN.

G. Barbato ‐ A. Germak ‐ G. Genta 55


CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il Grafico di Probabilità Normale
Caso studio : L’andamento del GPN si presenta nella forma iponormale.

3,0
2,0
1,0
0,0
z

-1,0
-2,0
-3,0
8,000 8,002 8,004 8,006 8,008 8,010 8,012
x/mm

G. Barbato ‐ A. Germak ‐ G. Genta 56


CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il Grafico di Probabilità Normale
La forma iponormale riscontrata consente di approfondire il 
problema e di individuare la presenza di fattori sistematici, che non 
erano stati denunciati dal metodo del χ2, pur avendo adottato un 
livello di fiducia dello 85%.

G. Barbato ‐ A. Germak ‐ G. Genta 57


CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Commenti
Le due alternative di valutazione della normalità presentano una 
differente sensibilità , quindi possono dare risultati diversi, ma non 
incompatibili. 

Infatti, la risposta del test del χ2 può essere:
• una dichiarazione di incapacità: “Il test non è in grado di 
evidenziare discrepanze significative dalla normale”, oppure, 
“Non vi sono ragioni per rifiutare l’ipotesi di distribuzione 
normale”;
• un rifiuto dell’ipotesi: “Si rifiuta, con il rischio d’errore assunto, 
l’ipotesi di distribuzione normale”.
La risposta, invece, non può mai essere: “La distribuzione esaminata 
è normale”.

G. Barbato ‐ A. Germak ‐ G. Genta 58


CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Commenti
Il GPN non consente di trarre conclusioni con un livello di fiducia
definito, ma risulta essere più sensibile. Ad esempio, nel caso 
studio, il GPN evidenzia un andamento iponormale abbastanza ben 
definito. 

Quando i test di normalità evidenziano la presenza di fattori 
sistematici, si deve iniziare l’indagine per identificarli; il GPN, con il 
suo andamento, permette di connotare il fattore “colpevole”. 

Infatti ad una forma iponormale, come quella riscontrata nel caso 
studio, potrebbe essere associata una deriva o una condizione 
bimodale. 

G. Barbato ‐ A. Germak ‐ G. Genta 59


CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Commenti
Nello specifico dei dati esaminati, si utilizzerà la regressione lineare
per verificare la presenza di una deriva nel tempo. 

Se si può identificare una funzione tra i valori misurati xi ed il tempo 
t, la deriva è confermata.

G. Barbato ‐ A. Germak ‐ G. Genta 60