Esplora E-book
Categorie
Esplora Audiolibri
Categorie
Esplora Riviste
Categorie
Esplora Documenti
Categorie
I minimi quadrati
Il problema con cui abbiamo a che fare adesso consiste nel determinare con
buona approssimazione una curva (funzione) che descriva il fenomeno a cui i
dati appartengono. Lo scopo `e quello di conoscere landamento del fenomeno
anche negli intervalli fra i punti di osservazione.
Consideriamo due tipi fondamentali di approssimazione:
Interpolazione
Approssimazione ai minimi quadrati
interpolazione
11.1
minimi quadrati
124
11.1.1
Caso lineare
y = A + Bx
125
126
xi )
1 s2i
1 (yi AB
2 2
i
P (yi) e 2i e
i
i
i
i=1
N
X
(yi A B xi )2
i=1
i2
127
i
i=1
N
X
(yi A Bxi )
2
xi = 0
= 2
B
i2
i=1
1
xi
A
B
=0
2
2
i=1
N
X
i=1
i=1 i
N
X
xi yi
A
i2
i=1
xi
i2
i=1 i
N
X
x2i
B
2
i=1 i
=0
Sxy =
N
X
yi
Sy =
;
2
i=1 i
N
X
xi yi
i=1
i2
S=
Sxx =
N
X
x2
i
i=1
N
X
1
2
i=1 i
i2
128
A=
Sxx Sy Sx Sxy
S Sxx Sx Sx
S Sxy Sx Sy
S Sxx Sx Sx
B=
Nell ipotesi che le N misure della variabile y siano descrivibili dalla distribuzione di Gauss con errore quadratico medio y (cio`e i = y i =
1, 2, N), le equazioni si semplificano in quanto:
Sx =
N
1 X
xi ;
y2 i=1
Sxy =
N
1 X
yi ;
y2 i=1
Sy =
N
1 X
xi yi ;
y2 i=1
S=
Sxx =
N
1 X 2
x
y2 i=1 i
N
X
1
N
= 2
2
y
i=1 y
A=
N
X
x2i
i=1
N
X
yi
i=1
N
X
N
X
i=1
N
X
x2i
i=1
N
B=
N
X
N
X
i=1
xi
xi
i=1
N
X
x2i
N
X
i=1
xi yi
i=1
!2
i=1
xi yi
i=1
xi
N
X
N
X
yi
i=1
!2
xi
x2 y x xy
x2 x2
B=
xy x y
x2 x2
x =
N
X
xi
2
i=1 i
N
X
1
2
i=1 i
y =
129
N
X
yi
2
i=1 i
N
X
1
2
i=1 i
11.1.2
130
11.1.3
I parametri A e B risultano affetti da incertezza poiche lo sono i valori yi . Utilizzando le formule di propagazione degli errori statistici `e possibile stimare
A e B in termini di i :
A2
2
N
X
A
yi
i=1
i2
B2
2
N
X
B
i=1
yi
i2
A2
N
X
x2i
i=1
y2
N
N
X
x2i
i=1
N
X
xi
!2 =
xi
!2 =
i=1
B2 = y2
N
N
X
x2i
i=1
N
X
i=1
y2 x2
N(x2 x2 )
y2
N(x2 x2 )
A=
N
N
X
X
yi
xi yi
Sxx
Sx
2
i2
i=1 i
i=1
S Sxx Sx Sx
S
B=
Le derivate parziali sono:
N
X
xi yi
i=1
i2
Sx
N
X
yi
2
i=1 i
S Sxx Sx Sx
131
A
=
yi
xi
1
Sx 2
2
i
i
2
Sxx S Sx
Sxx
B
=
yi
xi
1
Sx 2
2
i
i
2
Sxx S Sx
Sxx
Sxx S Sx2
B2 =
S
Sxx S Sx2
Abbiamo in questo modo determinato la miglior linea retta che approssima un certo insieme di dati sperimentali, rendendo minima la somma dei
quadrati delle distanze, misurate nella direzione dellasse delle y, dei punti
dalla retta. Tali distanze sono comunemente denominate residui. La retta
cos` determinata `e denominata retta di regressione di x su y.
Avremmo anche potuto, in modo analogo, minimizzare la somma dei
residui misurati nella direzione dellasse delle x. In altre parole, rappresentata
la retta come:
x=A+By
minimizzare la quantit`a
2
N
X
(xi A B yi)2
i=1
i2
132
11.2
N
X
[yi f (x, c1 , c2 , cp )]2
i2
i=1
N
X
[yi f (x, c1 , c2 , cp )]2
i2
i=1
avendo posto
i2
y2i
f
x
2
x2i
x=xi
y2i
f
x
2
x2i
In altre parole tutto avviene come se non ci fossero errori sulla variabile
indipendente x a patto di sostituire allerrore yi , lerrore efficace i , che
ha il significato di errore quadratico medio dello scarto si .
Daltra parte si vede che per xi 0, si ha che i yi .
Riportandoci al caso di partenza, e cio`e che la relazione y = f (x, c1 , c2 , cp )
sia lineare:
y = A + Bx
134
N
X
(yi A Bxi )2
y2i + B 2 x2i
i=1
Poiche il parametro B compare anche al denominatore le formule precedenti per calcolare i valori di A e B diventano molto pi`
u complicate. In questi
casi in genere si usa per la derivata di f (x, c1 , c2 , , cp ), (ovvero per B se la
funzione `e lineare) un valore approssimato, per esempio derivato graficamente, oppure ricavato da una prima stima provvisoria dei parametri effettuata
senza tener conto delle xi .
11.3
Supponiamo di aver misurato N coppie di valori (x1 ,y1 ), ..., (xN ,yN ) che
pensiamo siano legate da una relazione lineare y = A + Bx. Abbiamo visto
che possiamo calcolare A e B e avere anche una stima delle incertezze sulle
misure. Per`o non sempre `e possibile avere una stima delle incertezze in
anticipo per poter capire se due grandezze sono legate o meno dalla relazione
lineare. Abbiamo quindi bisogno di una quantit`a che ci dica quanto le due
grandezze sono legate o correlate.
Definiamo quindi il coefficiente di correlazione lineare:
r=
xy
x y
dove:
x =
v
u N
uX
u
(xi x)2
u
t i=1
N
y =
v
u N
uX
u
(yi y)2
u
t i=1
N
xy =
N
X
(xi x)(yi y)
i=1
135
`e il termine di covarianza.
Si tenga ben presente che x e y hanno un significato un po diverso dal
solito: se facciamo N misure della stessa quantit`a x, ci aspettiamo che x
sia piccolo. In questo caso invece poiche abbiamo N misure diverse, non `e
affatto detto che x o y siano piccoli.
Quindi sostituendo si ottiene:
N
X
(xi x)(yi y)
r = v i=1
u N
N
X
uX
t (xi x)2
(yi y)2
i=1
i=1
N
X
(xi x)2
B
i=1
= 1
=
r=v
u N
|B|
N
X
uX
t (xi x)2 B 2
(xi x)2
i=1
i=1
136
(xi x)(yi y)
i=1
137
N
3
6
10
20
50
0 0.1 0.2
100
100
100
100
100
94
85
78
67
49
87
70
58
40
16
r0
0.3 0.4 0.5 0.6
81 74
56 43
40 25
20
8
3 0.4
67 59
31 21
14
7
2 0.5
29
1
0
0
0
0
0
138