l04 - La Gestione Statistica Dei Dati Sperimentali PDF

Lezione n.
6 ‐ La gestione statistica
dei dati sperimentali
Statistica Sperimentale e Misure
Meccaniche
G. Barbato ‐ A. Germak ‐ G. Genta 1

INTRODUZIONE
La descrizione dei complessi di misura ha evidenziato due
caratteristiche metrologiche: la riproducibilità e l’accuratezza
(collegate, rispettivamente, agli effetti accidentali e sistematici).
L’utente di un complesso di misura ha la necessità di estrarre dalla

nuvola di valori sperimentali un valore da assegnare al misurando e
l’incertezza ad esso collegato. Il risultato di misura è da considerarsi
distorto, per la presenza di effetti sistematici, e confuso, per la
presenza di quelli accidentali; inoltre è possibile che vi siano stati
incidenti di misura.
Pertanto, l’analisi stastica dei risultati sperimentali deve tendere ad

individuare un valore centrale ed un indice di dispersione, oltre a porre
in atto accorgimenti per evidenziare la presenza di fattori sistematici e
di eventuali incidenti.

INTRODUZIONE
Quando viene evidenziata la presenza di fattori di disturbo, occorre
riesaminare le condizioni di funzionamento ed i concetti base secondo
i quali è stata organizzata la procedura di misura.
Tuttavia, lo sviluppo dei principi generali che portano ad evidenziare la

presenza di fattori indesiderati e (dopo la loro eliminazione) a
determinare il valore centrale e l’indice di dispersione, consente di
gestire i dati sperimentali in modo adeguato alle richieste di norma.
La gestione dei dati sperimentali dovrebbe essere differenziata da

caso a caso, perché ogni caso dovrebbe portare ad una specifica
pianificazione dell’esperimento. Tuttavia una condizione molto diffusa
consiste nell’affrontare le misurazioni in un modo completamente
casualizzato di rilevazione del misurando e di andamento delle
condizioni al contorno.

INTRODUZIONE
Per spiegare i metodi di gestione dei dati sperimentali si procederà

passo passo con un esempio. Si ipotizza l’esecuzione indipendente di
prove da parte di operatori diversi, tale fattore non viene casualizzato,
in modo da poter valutare la sua eventuale influenza.
Lo schema proposto dei dati è rappresentativo di una modalità che

consiste nell’ipotizzare l’effetto di fattori noti, tenuti sotto controlllo, e
nel casualizzare il più possibile gli altri fattori, in modo che il loro effetto
sia distribuito e venga reso poco significativo con l’operazione di
media.

LA DESCRIZIONE DEI DATI SPERIMENTALI
Si seguirà una procedura rigorosa (implementata in Excel®) per
comprendere e studiare il comportamento dei dati raccolti.
Dati sperimentali, ottenuti dalle misurazioni di lunghezza di un

manufatto fatte da cinque diversi operatori, espressi in millimetri.
La forma tabellare è utile per la raccolta dei dati, ma non
permette né di individuare possibili fattori di influenza né di
determinare la dispersione dei dati.
È pertanto opportuno adottare una rappresentazione grafica,
che consente di rendersi conto visivamente della situazione.

Passo 1:
Calcolare le principali statistiche descrittive per l’intero set di
dati.
n
∑x i
mx = i =1
Numero dei dati 50 n
Media 8.0063
Scarto tipo 0.0029
Valore massimo 8.0140
n
Valore minimo 8.0017 ∑ ( xi − mx )
2
sx2 = i =1
n −1

Calcolare le principali statistiche descrittive per ogni singolo
operatore.
Oper. 1 Oper. 2 Oper. 3 Oper. 4 Oper. 5

Max 8.0140 8.0093 8.0073 8.0113 8.0114
Q3 8.0075 8.0054 8.0065 8.0101 8.0103
Q2 8.0045 8.0043 8.0055 8.0090 8.0066
Q1 8.0033 8.0028 8.0033 8.0070 8.0064
Min 8.0017 8.0020 8.0025 8.0047 8.0053

Passo 2:
Le statistiche descrittive, calcolate per ogni singolo operatore,
permettono di disegnare dei boxplot.
Max
8.0150
8.0120
8.0090
Q3= 3° quartile =
8.0060
75° percentile
8.0030
Q1= 1° quartile =
8.0000
Oper. 1
25° percentile
Min
Confrontare graficamente tramite boxplot i risultati relativi ad
ogni singolo operatore .
8.015
8.012
8.009
8.006
8.003
8.000
Oper. 1 Oper. 2 Oper. 3 Oper. 4 Oper. 5

Passo 3:
Rappresentare graficamente la distribuzione dell’intero set di
dati sperimentali.
Grafico della spunta dei dati sperimentali.

Per fare lo spoglio manuale dei dati e per metterli in ordine

crescente, in modo da individuare il massimo ed il minimo, è utile
disporli uno dopo l’altro su un asse.
Per comodità, la scala dell’asse rappresenta solo la parte variabile

dei dati. Nel caso in esame, viene rappresentata la differenza Δx
rispetto al valore di 8 mm, quindi per il primo dato 3,8 µm, per il
secondo 5,1 µm e così via. La divisione elementare viene presa
uguale alla risoluzione di misura.
Si prendono in successione i dati ponendo per ognuno di essi un

segno (ad esempio una x) in corrispondenza del valore indicato
sull’asse. Se in corrispondenza ad un certo valore vi siano già uno o
più segni, si sovrappone l’ultimo ai precedenti.

Per rappresentare in modo più chiaro il comportamento dell’intero

set di dati sperimentali si può utilizzare un istogramma.
Occorre suddividere la lunghezza totale dell’asse in un certo numero

di zone, dette classi. Non esiste un criterio rigoroso, ma come
indicazione sul numero di classi nc da utilizzare per rappresentare n
dati sperimentali, si può prendere
nc = n
È utile definire un valore di partenza che non corrisponde a nessun
dato (ad esempio 8.00145 mm) e un’ampiezza di classe con la stessa
risoluzione dei dati sperimentali (ad esempio 1.5 μm); si eviteranno
così ambiguità relative a dati sul confine tra due classi.
Pertanto, nell’esempio si avrà:
• valore minimo dell’intervallo: 8.00145
• ampiezza di classe: 0.0015
• numero di classi: 9
• valore massimo dell’intervallo: 8.01495
Dallo spoglio (contando il numero dei dati compresi tra il valore

inferiore di classe 8.00145 ed il valore superiore di classe 8.00295) si
vede che nella prima classe sono contenuti 7 dati, analogamente si
trovano 7 dati nella seconda classe e così via.
Il numero di dati che cade in una certa classe è detto frequenza

assoluta. Una rappresentazione grafica preliminare è fatta con un
diagramma a colonne le cui altezze rappresentano le frequenze
assolute.

Distribuzione di frequenza sperimentale: frequenza assoluta fa

Andamento delle frequenze assolute

Distribuzione di frequenza sperimentale: frequenza relativa fr
(probabilità corrispondente ad ogni classe), data dal rapporto tra il
numero di dati che cadono in una certa classe ed il numero totale
dei dati.

Distribuzione di frequenza sperimentale: densità di frequenza ρf
(altezza delle colonne dell’istogramma), data dal rapporto tra
frequenza relativa (area delle colonne) e ampiezza di classe (base delle
colonne). È pertanto possibile confrontare l’istogramma con una
distribuzione di probabilità.

Istogramma delle frequenze relative (la densità di frequenza ρf è una
variabile accessoria per rendere l’istogramma confrontabile con una
distribuzione di probabilità).
La forma della normale dipende dalla stima sperimentale del valore

medio e della varianza.
PROCEDURA COMPLETA DI ANALISI DEI DATI
SPERIMENTALI
L’obiettivo iniziale consiste nell’individuare la presenza di effetti
sistematici e di eventuali incidenti di misura, seguendo una logica
iterativa.
Si considera come termine di confronto la stima della distribuzione

normale basata su m ed s. Tali valori risentono della presenza di
effetti sistematici ed incidenti, per cui, all’inizio, il confronto è poco
chiaro. Se si individuano e si eliminano iterativamente gli effetti più
grossolani, la sensibilità migliora.
Nell’applicazione conviene avere un calcolo automatico, che

consenta di riproporre all’inizio i dati originali e poi via via corretti e
fornisca le elaborazioni con immediatezza. Nell’ambito di tale logica,
occorre valutare prima di tutto la presenza di incidenti di misura.

PROCEDURA COMPLETA DI ANALISI DEI DATI
SPERIMENTALI
Outlier
Un outlier rappresenta un’osservazione che sembra discostarsi

nettamente dagli altri valori in un campione casuale di una
popolazione. Tuttavia, gli outlier devono essere studiati con
attenzione: spesso contengono preziose informazioni sul processo di
misura, sulla raccolta dei dati, o sul metodo di registrazione.
Prima di considerare la possibile eliminazione degli outlier dai dati
sperimentali, occore cercare di capire il motivo della loro comparsa
e valutare la possibilità che valori simili continuino a presentarsi.

PROCEDURA COMPLETA DI ANALISI DEI DATI SPERIMENTALI
I principi di esclusione
Passo 4:
Si è visto che i dati sperimentali possono contenere errori
sistematici, errori accidentali grossi e rari ed errori accidentali
piccoli e numerosi. Cerchiamo, innanzitutto di individuare eventuali
incidenti di misura (errori accidentali grossi e rari), e di escluderli
mediante il principio di esclusione di Chauvenet.
Tale principio stabilisce che si possano escludere i dati che hanno
probabilità di accadere P inferiore al 50%. Nell’ambito di n dati ciò
viene ricondotto a una probabilità per il singolo dato p
rappresentata da:
P 50%
p< p<
n n

Calcolata la media m e lo scarto tipo s dei dati sperimentali, si
utilizza l’ipotesi che essi siano distribuiti normalmente.

Chauvenet.
160
140
120
100
P ( x < xli ) = P ( x > xls ) =

50%
-1
f /mm
80
2n
60
P(x<x li ) P(x>x ls )
40
20 x li x ls
0
7,9977 8,0007 8,0037 8,0067 8,0097 8,0127 8,0157
x /mm
Date P(x<xli) e P(x>xls), si ricavano i confini di esclusione xli e xls.

Nel caso esaminato, i confini di esclusione si ottengono da:

50%
p<
50
ovvero da:
50%
P ( x < xli ) = P ( x > xls ) =
100

Si utlizzano le tabelle delle probabilità cumulata della distribuzione

normale.
Si osservi che
50% 50%
Pli = = 0,5% ⇒ zli = −2,58 Pls = 1 − = 99,5% ⇒ zls = 2,58
100 100
da cui
xli − m
z li ≈ ⇒ xli ≈ m + z li s = 8,0063 − 2,58 ⋅ 0,0029 = 7,9988
s
x −m
z ls ≈ ls ⇒ xls ≈ m + z ls s = 8,0063 + 2,58 ⋅ 0,0029 = 8,0139
s

Confrontando i valori di confine con i dati sperimentali si vede che un
dato dovrebbe essere escluso.

Per l’esclusione ci si deve comportare in uno dei modi seguenti, con
preferenza in ordine da a) a c):
a) se si può utilizzare l’impianto sperimentale si fa una nuova
misura, o meglio un nuovo ciclo di misure, parziale rispetto a
quello iniziale, ma tale da far riprendere allo strumento il ritmo
di crescita – decrescita dei valori analogo alla situazione della
misura originale
b) se non si possono rifare le misure si esclude semplicemente il
dato. Ciò non è sempre possibile, perché alcune operazioni di
valutazione o anche semplicemente funzioni di calcolo
preimpostate richiedono una tabella completa.
c) se non si possono lasciare vuote le caselle dei dati eliminati, al
loro posto si mette il valore medio ottenuto dopo l’eliminazione
dei dati da escludere.
Sostituzione dell’incidente di misura individuato con il valore medio
ottenuto dopo la sua esclusione.
Il nuovo valore medio è pari a 8.0062 mm, mentre il nuovo scarto

tipo è 0.0027 mm.
Distribuzione di frequenza sperimentale dopo correzione

Istogramma delle frequenze relative dopo correzione
160
140
120
100
ρf/mm-1
Dens. fr.
80
Normale
60
40
20
x/mm

Controllo della normalità di una distribuzione sperimentale
Se le variazioni dei risultati sono legate solo ad effetti aleatori, la
distribuzione sperimentale attesa è normale; invece, se la distribuzione
non risulta normale, si può ritenere che siano presenti fattori
sistematici.
Metodi per controllare l’ipotesi di normalità della distribuzione

sperimentale
• Test del χ2: metodo numerico rigoroso, che consente, se il caso
ricorre, di rifiutare l’ipotesi di normalità ad un ben definito livello di
fiducia P.
• Grafico di Probabilità Normale: non consente di esprimere il rifiuto
dell’ipotesi di normalità in modo rigoroso, ma ha il vantaggio della
forma grafica, che fornisce preziose informazioni sulle eventuali
cause di non normalità.
CONTROLLO DELLA NORMALITÀ DI UNA DISTRIBUZIONE SPERIMENTALE
Il test del χ2
Si può valutare la differenza tra la distribuzione sperimentale e la
distribuzione normale teorica sulla base delle differenze nelle varie
classi.
N ( fa − ft j )
2
W =∑
j
Distribuzione del χ2
j =1 ft j
Le frequenze assolute teoriche fat possono essere ottenute dalle
frequenze relative teoriche frt, calcolabili come i valori di probabilità
teorici negli stessi intervalli di classe per la distribuzione normale.
È opportuno esaminare alcune classi prima e dopo rispetto a quelle
che contengono dati sperimentali, in modo da ricoprire l’intervallo in
cui la distribuzione normale assimilata assume valori significativi.

Il test del χ2

Il test del χ2
• La frequenza relativa teorica frt è calcolata come differenza della
distribuzione cumulata agli estremi di classe zs e zi.
• La frequenza assoluta teorica fat è calcolata come prodotto della

frequenza relativa per il numero di dati (nell’esempio n = 50).
• Nell’ultima colonna si calcolano i contributi (fa ‐ fat)²/ fat delle

diverse classi a W. La somma dei contributi fornisce il valore
sperimentale di W, che deve essere confrontato con i limiti
teorici di χ² per il livello di fiducia P richiesto.

Il test del χ2
Scelta del livello di fiducia P
Occorre valutare le conseguenze del rifiuto di un’ipotesi nulla vera.
Nel nostro caso, l’ipotesi nulla è che la distribuzione sperimentale
sia normale, ovvero che i dati non siano affetti da errori sistematici
variabili o da incidenti di misura di tale entità da deformare
sensibilmente la distribuzione.
Se accettiamo un rischio di errore alto, rischiamo di avere
un’indicazione della presenza di effetti di disturbo anche se non ci
sono. La conseguenza sarà una maggior attenzione nell’analisi del
metodo di misura, tuttavia tale analisi deve essere sempre fatta.
Usiamo, quindi, un livello di fiducia P = 85%.

Il test del χ2
La forma della distribuzione teorica di χ² dipende dal numero di
gradi di libertà, che sono dati dal numero di possibili differenze
(numero di classi esaminate), a cui deve essere tolto il numero dei
vincoli imposti.
Nel confronto tra distribuzione normale e istogramma della

distribuzione sperimentale sono stati imposti tre vincoli:
l’uguaglianza della media, l’uguaglianza dello scarto tipo e
l’uguaglianza dell’area totale (unitaria).
I gradi di libertà sono, quindi, uguali al numero delle classi
confrontate meno 3.

Il test del χ2
Il valore W del χ² sperimentale cade all’interno dei limiti

corrispondenti al livello di fiducia P. Pertanto, il test non è riuscito a
vedere nulla di strano, ma potrebbero essere presenti disturbi tanto
piccoli da non poter essere evidenziati. Non vi sono ragioni per
rifiutare l’ipotesi nulla che la distribuzione sperimentale sia assimilabile
ad una normale.
Nel caso W sia esterno, invece, l’ipotesi nulla viene rifiutata al livello di
fiducia P (cioè vi è una probabilità 1 ‐ P che non vi sia un’effettiva
differenza della distribuzione sperimentale dalla normale).
Il test del χ2
Il test del χ² è di solito bilaterale, cioè il rifiuto viene fatto sia per
valori di W troppo grandi (distribuzione sperimentale troppo diversa
dalla normale), sia per valori di W troppo piccoli (distribuzione
sperimentale troppo simile alla normale).
Quest’ultima condizione, che potrebbe sembrare auspicabile, è
molto improbabile e quindi oggetto di sospetto.

Il Grafico di Probabilità Normale
L’idea che sta alla base del metodo del Grafico di Probabilità
Normale (GPN) è la ricerca di una presentazione immediatamente
riconoscibile di una forma associata alla distribuzione normale.
Né la forma a campana (densità di probabilità) né la forma ad S

(distribuzione cumulativa) hanno caratteristiche intrinseche che
consentano un riconoscimento, se non generico.
Per avere una forma riconoscibile è stato preparato un opportuno

grafico, detto Grafico di Probabilità Normale, con la scala delle
ordinate deformata in modo che la curva ad S della distribuzione
normale cumulata venga rappresentata con una retta.

1,2
1,0
0,8
0,6
0,4
0,2
0,20
0,15
0,0 0,10
-0,2
-20 -15 -10 -5 0 5 10 15 20
Creazione della scala deformata del GPN (a destra), tramite la quale la
forma ad S della distribuzione normale cumulata viene rappresentata
da una retta.
Esempio: Tabella di dati ordinati distribuiti normalmente con la
corrispondente frequenza relativa cumulata frc.

Le frequenze relative cumulate frc sono state calcolate sulla base del
numero d’ordine di ogni singolo dato, posto in ordine crescente.
Si può pensare che sul primo di n dati si commuta dalla zona di

frequenza relativa cumulata di 0/n, alla zona di frequenza relativa
cumulata di 1/n, per cui sul valore del dato si può prendere la media
di 0,5/n. Analogamente al secondo dato il passaggio è da 1/n a 2/n,
per cui si può prendere 1,5/n.
In generale, all’i‐esimo dato si può assegnare la frequenza relativa
cumulata frc = (i ‐ 0,5)/n.

Le ordinate del Grafico di Probabilità Normale sono i valori della

variabile normalizzata z corrispondenti alle frequenze relative
cumulate sperimentali. Se tali frequenze cumulate
corrispondessero a quelle della distribuzione normale, l’andamento
risulterebbe rettilineo.
È possibile valutare a colpo d’occhio se l’andamento del GPN
ottenuto si avvicina alla forma rettilinea, oppure si discosta da essa
in modo significativo. In quest’ultimo caso, si può anche trarre
qualche informazione sulle cause di non‐normalità.

Esempio: GPN per i dati distribuiti normalmente .
3,0
2,0
1,0
0,0
z
-1,0
-2,0
-3,0
9,296 9,298 9,300 9,302 9,304 9,306
x/mm
Gli errori accidentali portano ad irregolarità locali rispetto ad un
andamento rettilineo esatto. Si esamina, pertanto, una fascia rettilinea,
la cui larghezza corrisponde alla dimensione dei difetti localizzati.
Si può osservare che l’andamento dei dati sperimentali è
assimilabile ad una retta. In tal caso, non si può rifiutare l’ipotesi di
distribuzione normale.
Tuttavia, il giudizio se i dati si dispongano adeguatamente su un
andamento rettilineo è arbitrario, quindi non è possibile assegnare
un determinato livello di fiducia.

Distribuzione ipernormale: curva a campana più alta al centro
rispetto a quella della distribuzione normale e, di conseguenza, con
le parti estreme più basse.
Il GPN ha una forma leggermente deformata rispetto all’andamento
dell’integrale della curva a campana. Se quest’ultima per
l’ipernormale è più alta al centro e più bassa agli estremi della
curva della normale, la sua curva integrale avrà una pendenza
maggiore al centro e minore agli estremi.
Dal punto di vista sperimentale, tale condizione può essere legata ad
una forma di “filtraggio” che ha eliminato in modo preferenziale i
dati più discosti dal valore medio.

Esempio: GPN per una distribuzione ipernormale
4,0
3,0
2,0
1,0
0,0
z
-1,0
-2,0
-3,0
-4,0
9,296 9,298 9,300 9,302 9,304 9,306
x/mm

Tale situazione è presente sia in campo metrologico, sia nel settore
della produzione.
• In ambito metrologico, la distribuzione ipernormale corrisponde
ad una riduzione del numero dei dati più lontani dal valore
medio, e ciò accade, in generale, perché l’operatore tende a
escludere sulla base del giudizio personale i dati più discosti dal
valore che egli attende. Tale pratica deve essere scoraggiata,
perché falsa la distribuzione dei risultati.
• Nel caso dei risultati di una produzione, l’ipernormale indica che
la parte di produzione esaminata è già stata sottoposta ad un
processo di selezione.

Distribuzione iponormale: curva a campana più bassa della normale
nella zona centrale e più alta agli estremi. Pertanto, i risultati
prossimi al valore medio risultano meno frequenti di quanto
previsto dalla distribuzione normale.
Tale condizione può essere dovuta genericamente a una sottrazione
dei dati più vicini al valore medio. Nel settore della produzione, ciò
potrebbe essere dovuto ad una selezione che sposta alcuni dei
prodotti migliori in una classe commercialmente più redditizia.
La condizione di iponormalità può anche essere dovuta ad altri due
fattori, tipici del campo metrologico, ma che possono essere
presenti anche nel settore della produzione.

Distribuzione bimodale
Si riscontra la presenza di due condizioni distinte e discoste.
Si considerino, ad esempio, misure di durezza in presenza di due
strutture metallurgiche di durezza sensibilmente differente e di
dimensioni prossime a quelle dell’impronta, oppure misure
dimensionali in presenza di giochi nel sistema di misura che
spostano la condizione di misura in due posizioni preferenziali
discoste.
In tali situazioni, la distribuzione presenta due massimi di frequenza
relativa distinti, quindi due mode, per cui viene detta bimodale.

Esempio: GPN per una distribuzione iponormale. Si tratta di una
distribuzione bimodale; le parti estreme tendono ad una forma
rettilinea.

Distribuzione affetta da deriva
Il risultato di misura appartiene a una normale che si sposta con
continuità nel tempo.
Se ciò avviene per un tempo sufficientemente lungo, la distribuzione
globale, corrispondente alla convoluzione delle diverse normali
successive, è nettamente appiattita nella sua parte centrale.

Esempio: GPN per una distribuzione iponormale. Si tratta di una
distribuzione affetta da una leggera deriva.
3,0
2,0
1,0
0,0
z
-1,0
-2,0
-3,0
9,294 9,296 9,298 9,300 9,302 9,304 9,306
x/mm

Queste condizioni di iponormalità sono rappresentate da forme del
GPN molto simili, tuttavia esse sono nella sostanza molto diverse.
Quindi, l’indicazione di iponormalità è solo un indizio che deve essere

analizzato per vedere a quale caso corrispondano le reali condizioni di
misura.

Caso studio : Tabella dati per la preparazione del GPN.

Caso studio : L’andamento del GPN si presenta nella forma iponormale.
3,0
2,0
1,0
0,0
z
-1,0
-2,0
-3,0
8,000 8,002 8,004 8,006 8,008 8,010 8,012
x/mm

La forma iponormale riscontrata consente di approfondire il
problema e di individuare la presenza di fattori sistematici, che non
erano stati denunciati dal metodo del χ2, pur avendo adottato un
livello di fiducia dello 85%.

Commenti
Le due alternative di valutazione della normalità presentano una
differente sensibilità , quindi possono dare risultati diversi, ma non
incompatibili.
Infatti, la risposta del test del χ2 può essere:
• una dichiarazione di incapacità: “Il test non è in grado di
evidenziare discrepanze significative dalla normale”, oppure,
“Non vi sono ragioni per rifiutare l’ipotesi di distribuzione
normale”;
• un rifiuto dell’ipotesi: “Si rifiuta, con il rischio d’errore assunto,
l’ipotesi di distribuzione normale”.
La risposta, invece, non può mai essere: “La distribuzione esaminata
è normale”.

Commenti
Il GPN non consente di trarre conclusioni con un livello di fiducia
definito, ma risulta essere più sensibile. Ad esempio, nel caso
studio, il GPN evidenzia un andamento iponormale abbastanza ben
definito.
Quando i test di normalità evidenziano la presenza di fattori
sistematici, si deve iniziare l’indagine per identificarli; il GPN, con il
suo andamento, permette di connotare il fattore “colpevole”.
Infatti ad una forma iponormale, come quella riscontrata nel caso
studio, potrebbe essere associata una deriva o una condizione
bimodale.

Commenti
Nello specifico dei dati esaminati, si utilizzerà la regressione lineare
per verificare la presenza di una deriva nel tempo.
Se si può identificare una funzione tra i valori misurati xi ed il tempo
t, la deriva è confermata.

l04 - La Gestione Statistica Dei Dati Sperimentali PDF

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

l04 - La Gestione Statistica Dei Dati Sperimentali PDF

Caricato da

Copyright:

Formati disponibili

Lezione n.

G. Barbato ‐ A. Germak ‐ G. Genta 1

L’utente di un complesso di misura ha la necessità di estrarre dalla

Pertanto, l’analisi stastica dei risultati sperimentali deve tendere ad

G. Barbato ‐ A. Germak ‐ G. Genta 2

Tuttavia, lo sviluppo dei principi generali che portano ad evidenziare la

La gestione dei dati sperimentali dovrebbe essere differenziata da

G. Barbato ‐ A. Germak ‐ G. Genta 3

Per spiegare i metodi di gestione dei dati sperimentali si procederà

Lo schema proposto dei dati è rappresentativo di una modalità che

G. Barbato ‐ A. Germak ‐ G. Genta 4

Dati sperimentali, ottenuti dalle misurazioni di lunghezza di un

G. Barbato ‐ A. Germak ‐ G. Genta 6

G. Barbato ‐ A. Germak ‐ G. Genta 7

Oper. 1 Oper. 2 Oper. 3 Oper. 4 Oper. 5

G. Barbato ‐ A. Germak ‐ G. Genta 8

G. Barbato ‐ A. Germak ‐ G. Genta 10

G. Barbato ‐ A. Germak ‐ G. Genta 11

Per fare lo spoglio manuale dei dati e per metterli in ordine

Per comodità, la scala dell’asse rappresenta solo la parte variabile

Si prendono in successione i dati ponendo per ognuno di essi un

G. Barbato ‐ A. Germak ‐ G. Genta 12

Per rappresentare in modo più chiaro il comportamento dell’intero

Occorre suddividere la lunghezza totale dell’asse in un certo numero

Dallo spoglio (contando il numero dei dati compresi tra il valore

Il numero di dati che cade in una certa classe è detto frequenza

G. Barbato ‐ A. Germak ‐ G. Genta 14

G. Barbato ‐ A. Germak ‐ G. Genta 15

G. Barbato ‐ A. Germak ‐ G. Genta 16

G. Barbato ‐ A. Germak ‐ G. Genta 17

G. Barbato ‐ A. Germak ‐ G. Genta 18

La forma della normale dipende dalla stima sperimentale del valore

Si considera come termine di confronto la stima della distribuzione

Nell’applicazione conviene avere un calcolo automatico, che

G. Barbato ‐ A. Germak ‐ G. Genta 20

Un outlier rappresenta un’osservazione che sembra discostarsi

G. Barbato ‐ A. Germak ‐ G. Genta 21

G. Barbato ‐ A. Germak ‐ G. Genta 22

P ( x < xli ) = P ( x > xls ) =

Date P(x<xli) e P(x>xls), si ricavano i confini di esclusione xli e xls.

Nel caso esaminato, i confini di esclusione si ottengono da:

G. Barbato ‐ A. Germak ‐ G. Genta 24

Si utlizzano le tabelle delle probabilità cumulata della distribuzione

G. Barbato ‐ A. Germak ‐ G. Genta 25

G. Barbato ‐ A. Germak ‐ G. Genta 26

Il nuovo valore medio è pari a 8.0062 mm, mentre il nuovo scarto

G. Barbato ‐ A. Germak ‐ G. Genta 29

G. Barbato ‐ A. Germak ‐ G. Genta 30

Metodi per controllare l’ipotesi di normalità della distribuzione

G. Barbato ‐ A. Germak ‐ G. Genta 32

G. Barbato ‐ A. Germak ‐ G. Genta 33

• La frequenza assoluta teorica fat è calcolata come prodotto della

• Nell’ultima colonna si calcolano i contributi (fa ‐ fat)²/ fat delle

G. Barbato ‐ A. Germak ‐ G. Genta 34

G. Barbato ‐ A. Germak ‐ G. Genta 35

Nel confronto tra distribuzione normale e istogramma della

G. Barbato ‐ A. Germak ‐ G. Genta 36

Il valore W del χ² sperimentale cade all’interno dei limiti

G. Barbato ‐ A. Germak ‐ G. Genta 38

Né la forma a campana (densità di probabilità) né la forma ad S

Per avere una forma riconoscibile è stato preparato un opportuno

G. Barbato ‐ A. Germak ‐ G. Genta 39

G. Barbato ‐ A. Germak ‐ G. Genta 41