Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
𝐴𝑥 = 𝑏
dove 𝐴 ∈ 𝑅𝑚×𝑛 , 𝑥 ∈ 𝑅 𝑛 𝑒 𝑏 ∈ 𝑅𝑚 , 𝑚 > 𝑛
1
Risoluzione di sistemi lineari sovradeterminati nel senso dei minimi quadrati
(Least Squares) .
Queste ultime equazioni sono note come equazioni normali e la loro risoluzione
porta alla risoluzione del problema dei minimi quadrati.
2
Mediante abbiamo trasferito il problema della risoluzione di un sistema sovra
determinato in quello della risoluzione di un sistema quadrato con matrice G = ATA
di dimensione n x n. .
3
TEOREMA
Dato il sistema lineare sovradeterminato
𝐴𝑥 = 𝑏
dove 𝐴 ∈ 𝑅𝑚×𝑛 , 𝑥 ∈ 𝑅 𝑛 𝑒 𝑏 ∈ 𝑅𝑚 , 𝑚 > 𝑛
𝑥 ∗ = 𝑎𝑟𝑔𝑚𝑖𝑛 ||𝑏 − 𝐴𝑥||22 ⇔ è la soluzione di 𝐴𝑇 𝐴𝑥 = 𝐴𝑇 𝑏
𝑥∈𝑅 𝑛
La soluzione del problema dei minimi quadrati mediante equazioni normali richiede
solo che la matrice A del sistema sovradeterminato Ax=b abbia rango massimo.
Se questa condizione è verificata il vettore x* tale che
𝑥 ∗ = 𝑎𝑟𝑔𝑚𝑖𝑛‖𝑏 − 𝐴𝑥‖22
𝑥∈𝑅 𝑛
può essere sempre calcolato, teoricamente, come soluzione delle equazioni normali
𝐴𝑇 𝐴𝑥 = 𝐴𝑇 𝑏.
La matrice G = ATA è simmetrica e definita positiva e quindi il sistema può essere
risolto utilizzando il metodo di Cholesky.
ATTENZIONE AL MALCONDIZIONAMENTO
Poiché
𝐾2 (𝐴𝑇 𝐴) = ( 𝐾2 (𝐴))2
Questo implica che il sistema delle equazioni normali può risultare mal condizionato
anche quando il problema nella sua forma originale non lo è.
Se quindi A è ben condizionata il metodo delle equazioni normali è un ottimo
metodo per calcolare la soluzione del problema dei minimi quadrati. Se A è
4
‘mediamente mal condizionata’ il metodo delle equazioni normali è numericamente
pericoloso perché può fornire risultati non affidabili.
Per ovviare a questo problema, nei prossimi paragrafi considereremo, per risolvere il
problema dei minimi quadrati, un altro metodo, che si basa su un principio diverso:
poiché sappiamo che le trasformazioni ortogonali lasciano inalterata la norma 2 di un
vettore l’idea è di individuare una trasformazione ortogonale che, applicata al
residuo r = b-Ax, lo trasformi in modo tale da rendere più facile la soluzione del
problema di minimizzarne la norma.
Abbiamo già detto che il Metodo dei Minimi quadrati, applicato per trovare una
soluzione del sistema sovradeterminato
Ax=b con A m x n,
xRn e bRm
consiste nel trovare quel valore di x* tale che
𝑥 ∗ = 𝑎𝑟𝑔𝑚𝑖𝑛‖𝑏 − 𝐴𝑥‖22
𝑥∈𝑅 𝑛
5
Proprietà: Una matrice ortogonale 𝑄 ∈ 𝑅𝑚×𝑚 applicata ad un vettore 𝑦 ∈ 𝑅𝑚 , ne
mantiene inalterata la norma 2 al quadrato, cioè:
2 2
||𝑄𝑦||2 = ||𝑦||2
Dim.
Ricordiamo che una matrice ortogonale è tale che 𝑄𝑇 𝑄 = 𝑄𝑄𝑇 = 𝐼
2 𝑇 2
||𝑦||2 = 𝑦 𝑇 𝑦 = 𝑦 𝑇 𝑄𝑇 𝑄𝑦 = (𝑄 𝑦) (𝑄 𝑦) = ||𝑄𝑦||2
Vale anche
2 2
||𝑦||2 = 𝑦 𝑇 𝑦 = 𝑦 𝑇 𝑄𝑄𝑇 𝑦 = (𝑄𝑇 𝑦)𝑇 (𝑄𝑇 𝑦) = ||𝑄𝑇 𝑦||2
Abbiamo visto che assegnata una matrice rettangolare 𝐴 ∈ 𝑅𝑚×𝑛 , con rango n, essa
può essere sempre fattorizzata, mediante successive trasformazioni di Householder
nella forma
𝑛
⏞⋱ 𝑅1
⋱ }𝑛
𝐴 = 𝑄𝑅 = [𝑄] ⋅ 0 ⋱
⋯ ⋯ ⋯
[ 0 ]𝑚 − 𝑛
dove Q è ortogonale mxm e 𝑅1 è una matrice triangolare superiore nxn con elementi
rii tutti diversi da 0.
Una volta calcolata la fattorizzazione QR di A, poiché Q è ortogonale e quindi
anche QT è ortogonale, consideriamo
‖𝑄𝑇 (𝑏 − 𝐴𝑥)‖22 = ‖𝑄𝑇 𝑏 − 𝑄𝑇 𝐴𝑥‖22 = ‖𝑄𝑇 𝑏 − 𝑅1 𝑥‖22 .
(infatti premoltiplicando ambo i membri di 𝐴 = 𝑄𝑅 per 𝑄𝑇 , si ottiene
𝑄𝑇 𝐴 = 𝑄𝑇 𝑄𝑅 = 𝑅 ( essendo Q ortogonale e quindi 𝑄𝑇 𝑄 = 𝐼)
Posto
6
ℎ1 }𝑛
𝑇
ℎ = 𝑄 𝑏 = [⋯ ]
ℎ2 }𝑚 − 𝑛
si ha
𝑛 2
2
ℎ1 ⏞⋱ 𝑅1
‖ ‖ (ℎ − 𝑅1 𝑥)
}𝑛 ⋱ ‖ 1 ‖
− 0 ⋱ 𝑥 =
‖ ⋯ 𝑚−𝑛 ⋯ ⋯ ⋯ ‖ ‖ ‖
[ℎ 2 ] [ ] ℎ2
0
2 2
𝑚𝑖𝑛 ‖𝐴𝑥 − 𝑏‖22 = 𝑚𝑖𝑛𝑛 {‖ℎ1 − 𝑅1 𝑥‖22 + ‖ℎ2 ‖22 } = 𝑚𝑖𝑛𝑛 ‖ℎ1 − 𝑅1 𝑥‖22 + ‖ℎ2 ‖22 .
𝑥∈ℜ𝑛 𝑥∈ℜ 𝑥∈ℜ
7
con a =1 e b = n .
Questo ci dice che gli elementi di R possono crescere al massimo come n e quindi
la stabilità della fattorizzazione è abbastanza buona.
Se quindi la matrice A mxn ha rango n ed è ‘mediamente mal condizionata’ la
soluzione del problema dei minimi quadrati con il metodo QR produce in genere
risultati sufficientemente accurati.
8
Approssimazione nel senso dei minimi quadrati di un insieme di dati
sperimentali
Siano assegnate m coppie di valori sperimentali (xi,yi) i=0,…,m-1 , (in cui tutte le
ascisse siano distinte tra loro) , che descrivono in modo discreto l’andamento di un
fenomeno reale(es. l’andamento della quotazione di un titolo azionario nel mese di
marzo, o le misure di piovosità in una certa stazione di misura nei primi mesi
dell’anno).
Sia m>n, si vuole determinare il polinomio di grado n
𝑃𝑛 (𝑥) = ∑𝑛𝑗=0 𝛼𝑗 𝑥 𝑗
9
dove 𝐵 ∈ 𝑅(𝑚)×(𝑛+1) , rank(B)=n+1, m>n
𝐵𝛼 = 𝑦 .
Problema che può essere risolto con uno dei due metodi precedentemente illustrati.
10