Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
6 ‐ Identificazione dei fattori
sistematici. La regressione lineare.
Statistica Sperimentale e Misure
Meccaniche
3,0
2,0
1,0
0,0
z
-1,0
-2,0
-3,0
8,000 8,002 8,004 8,006 8,008 8,010 8,012
x/mm
Non avendo registrato i tempi di presa dei vari dati, si può, tuttavia,
valutare la presenza di una deriva dall’andamento dei risultati posti in
ordine di presa, cioè nella loro successione temporale.
8,012
8,010
8,008
x
8,006
regr.
8,004
8,002
8,000
0 10 20 30 40 50
t
Per il caso studio assumiamo come variabile indipendente il tempo t e
come variabile dipendente la distanza x misurata. Si noti che per il
tempo t (dato solo dalla successione delle prove) non è espressa l’unità
di misura, ciò è tuttavia accettabile allo scopo di vedere se è presente
una deriva, quindi solo un andamento.
Mentre la fase 2 è descritta compiutamente da un procedimento
matematico, la fase 1, in parte, la fase 3 sono affidate all’esperienza di
chi analizza i dati sperimentali.
È anche bene utilizzare tutte le informazioni sul fenomeno descritto
dai dati sperimentali, in modo da scegliere, ove possibile, un
modello matematico corrispondente alle leggi fisiche coinvolte.
Se si decide che la retta rappresenta bene i nostri dati sperimentali, si
utilizzerà il modello x = a0 + a1 t.
Nel modello si individuano la variabile dipendente, nell’esempio x, la
variabile indipendente (o più variabili indipendenti), nell’esempio t, ed i
parametri del modello a0 e a1.
Y a 0 a1 X a 2 X 2
Y a 0 a1 e X
poiché, di nuovo, è lineare nei parametri.
Se si volesse, invece, utilizzare una funzione esponenziale del tipo
Y a 0 e a1 X
si tratterebbe di regressione non lineare, molto più complessa.
Y G X 1 , ... , X j , ... , X q
in cui le variabili indipendenti Xj sono i vari contributi della funzione
scelta. Per la parabola si pone:
Y a0 a1 X a 2 X 2 X1 X X2 X 2
G X 1 , X 2 a0 a1 X 1 a2 X 2
invece, per l’esponenziale si pone:
Y a0 a1e X X1 e X
G X 1 a0 a1 X 1
y G x1 , ... , x j , ... , x q
in cui l’errore sperimentale ε è attribuito tutto alla variabile
dipendente Y (condizione rigorosa dal punto di vista matematico).
Solo quando il contributo dovuto all’incertezza sulla variabile
dipendente Y è predominante, si può applicare formalmente la
regressione lineare. Tuttavia, anche quando ci si discosti, in maniera
non eccessiva, da tale condizione si ottengono risultati che indicano
bene l’andamento della variabile Y.
Pertanto il metodo è spesso usato per ottenere un’interpolazione
statistica dei dati sperimentali.
G. Barbato ‐ A. Germak ‐ G. Genta 16
LA REGRESSIONE LINEARE
Il metodo dei minimi quadrati
Per determinare i valori dei coefficienti, esaminiamo il caso in cui
esista una relazione funzionale:
Y G X 1 , ... , X j , ... , X q
e, quindi, una relazione tra i dati rappresentata da:
y G x1 , ... , x j , ... , x q
che possa essere linearizzata.
Tale equazione linearizzata deve valere per tutti i punti sperimentali,
per cui si può scrivere un sistema di equazioni in cui i valori
sperimentali xj ed yj sono noti, invece i parametri aj sono incogniti.
Si noti che il numero di equazioni risulta maggiore del numero di
incognite. Tale sistema può essere risolto con il metodo dei minimi
quadrati.
Scriviamo il sistema in forma matriciale:
a 0
y1 1 x11 ... x1 j ... x1q 1
. ... ... ... ... ... ... 1 .
a
...
y i 1 x i1 ... x ij ... x iq i
. ... ... ... ... ...
aj
... .
...
y n 1 x n1 ... x nj ... x nq n
a q
cioè:
y 1, xa
1, x T
è nulla.
Si osservi che si tratta di una matrice colonna in cui il primo elemento
è dato dalla somma degli ε, il secondo dalla somma dei prodotti degli
ε per i valori assunti dalla prima variabile, ecc.
Si dimostra che la somma dei valori assunti dalla variabile casuale ε e
la somma dei prodotti delle variabili casuali ε ed x sono nulle.
oppure mediante le funzioni di regressione lineare implementate nei
fogli elettronici.
8,002
8,000
0 10 20 30 40 50
t
Residui
0.005
0.000
x/mm
-0.005
0 10 20 30 40 50
t
Se è presente un fattore sistematico, e tale fattore viene individuato e
corretto, i residui mantengono gli effetti accidentali presenti, per cui si
dispongono con andamento aleatorio. Se, invece, il fattore
sistematico non è stato completamente corretto, la sua presenza viene
denunciata da un certo contenuto di “regolarità” nell’andamento dei
residui.
Nel caso di uso di regressione di secondo grado, invece, i residui
mostrano un’adeguata alternanza dei segni.
0.0001
0.0000
-0.0001 2° Grado
-0.0002
-0.0003
0 200 400 600 800 1000
Forza [N]
L’obiettivo è quello di separare la parte sistematica da quella
accidentale. L’eliminazione artificiosa della parte accidentale
impedisce di conoscere il campo di variabilità dei dati e quindi di
valutare correttamente l’incertezza associata.
È opportuno ribadire due avvertimenti:
• bisogna tener conto del comportamento fisico di quanto si vuole
descrivere, cioè il modello matematico deve essere adatto al
fenomeno fisico descritto.
• il grado del polinomio utilizzato deve essere fatto aumentare solo
fino ad ottenere un comportamento dei residui privo di
“regolarità”.
Queste osservazioni, che sottolineano la reale difficoltà
dell’applicazione del metodo, sono collegate alle difficoltà di scelta
del modello matematico da adottare e di valutazione a posteriori
della sua bontà.
In un’operazione di taratura la variabile nota con l’incertezza inferiore
è quella che descrive i valori dei campioni di riferimento, nell’esempio
le forze applicate dalla macchina campione di forza. Assumendo tale
variabile indipendente e, di conseguenza l’uscita come variabile
dipendente, si trova come equazione di regressione una relazione con
la quale, nota la forza, mi posso calcolare l’uscita corretta dagli effetti
sistematici. Tuttavia, di solito, non è ciò che serve.
Per distinguere le due situazioni chiameremo la prima “Equazione di
taratura” e la seconda “Equazione d’uso”.
Nota: Avendo gli scostamenti sulla forza calcolati con l’equazione
d’uso, si possono trovare (moltiplicando per la pendenza cambiata di
segno) gli scostamenti equivalenti sull’uscita.
G. Barbato ‐ A. Germak ‐ G. Genta 36
IL METODO DEI MINIMI QUADRATI
Esempio
Il metodo grafico non è abbastanza sensibile per valutare differenze
dell’ordine dei residui ottenuti (poche parti su diecimila. ).
Si vede che, dal punto di vista pratico, con i valori tipici d’incertezza
degli strumenti di misura, è possibile utilizzare le più comode
equazioni d’uso . Tuttavia, per completezza, in molti casi i certificati
ACCREDIA presentano sia le equazioni di taratura, sia le equazioni
d’uso.
I residui rispetto alla regressione possono essere trattati come una
qualsiasi variabile casuale, ed analizzati con il test del χ2 o con il
grafico di probabilità normale.
Nel primo caso l’andamento curvo è ben delineato. Si giunge a
questa conclusione se si cerca di rappresentare la forma con una
banda che ha la larghezza indicata dalle condizioni di irregolarità più
evidenti. Anche tracciando una zona rettilinea con tale larghezza non
è possibile contenere tutti i dati.
Nel secondo caso, invece, le irregolarità locali sono nettamente
maggiori, per cui tutti i punti risultano pressoché compatibili.
0.0001
0.0000
-0.0001 2° Grado
-0.0002
-0.0003
0 200 400 600 800 1000
Forza [N]