Sei sulla pagina 1di 70

Matrici

Basilio Bona
DAUIN-Politecnico di Torino

2007 2008

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

1 / 70

Definizione
Definizione
La matrice `e un insieme di N numeri reali o complessi organizzata in m
righe e n colonne, con m n = N

a11 a12 a1n


a21 a22 a2n  

i = 1, . . . , m j = 1, . . . , n
A=
aij
am1 am2 amn
Una matrice viene sempre indicata con lettera maiuscola in grassetto, ad
es. A
Per indicarne le dimensioni si usa una delle seguenti notazioni
Amn

Amn

A Fmn

A Fmn

dove F = R per elementi reali e F = C per elementi complessi


Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

2 / 70

Matrice trasposta

Data una matrice Amn si definisce matrice trasposta la matrice ottenuta


scambiando le righe con le colonne

a11 a21 am1


a12 a22 am2

AT
.. . .
..
nm = ..
.
.
.
.
a1n a2n amn
Vale la propriet`
a che (AT )T = A

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

3 / 70

Matrice quadrata
Una matrice si dice quadrata se m = n
Una matrice quadrata n n si dice triangolare superiore se aij = 0 per i > j

a11 a12 a1n


0 a22 a2n

Ann = .
.. . .
..
.
.
. .
.
0
0 ann

Se una matrice quadrata `e triangolare superiore, la sua trasposta `e


triangolare inferiore e viceversa

a11 0 0
a12 a22 0

=
AT
..
.. . .
..
nn
.
.
.
.
a1n a2n

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

ann

2007 2008

4 / 70

Matrice simmetrica
Una matrice reale quadrata si dice simmetrica se A = AT , ossia
A AT = O
n(n + 1)
In una matrice reale simmetrica vi sono al pi`
u
elementi
2
indipendenti

Se una matrice K ha elementi complessi kij = aij + jbij , (dove j = 1) si


indica con K la matrice coniugata, che ha elementi k ij = aij jbij
Data una matrice complessa K, si definisce matrice aggiunta K la matrice
T
trasposta coniugata, K = K = KT
Una matrice complessa si dice autoaggiunta o hermitiana se K = K .
Alcuni testi indicano questa matrice con K oppure con KH

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

5 / 70

Matrice diagonale

Una matrice quadrata si dice diagonale se

a1
0

Ann = diag(ai ) = ..
.
0

aij = 0 per i =
6 j

0 0
a2 0

.. . .
..
.
.
.
0

an

Una matrice diagonale `e sempre simmetrica

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

6 / 70

Matrice antisimmetrica
Matrice antisimmetrica
Una matrice quadrata A si dice antisimmetrica se
A + AT = 0

A = AT

Dati i vincoli imposti da questa relazione, la matrice antisimmetrica ha la


seguente struttura

0
a12 a1n
a12
0
a2n

Ann = .
..
..
..
..
. .
.
a1n a2n 0

n(n 1)
In una matrice antisimmetrica vi sono al pi`
u
elementi
2
indipendenti e non nulli. Vedremo in seguito alcune importanti propriet`
a
delle matrici antisimmetriche 3 3.

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

7 / 70

Matrice a blocchi
` possibile una rappresentazione a blocchi
E

A11 A1n
A = Aij
Am1 Amn
dove i blocchi Aij
Date le matrici

A11
A1 = O Aij
O
O

sono di dimensioni opportune

A1n
A11 O
; A2 = Aij
Amn
Am1

O
A11 O
O ; A3 = O Aij
Amn
O
O

A1 `e triangolare (superiore) a blocchi, A2 `e triangolare (inferiore) a


blocchi; infine A3 `e diagonale a blocchi

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

O
O
Amn

8 / 70

Operazioni su matrici
Le matrici formano unalgebra, cio`e uno spazio vettoriale con laggiunta
delloperatore prodotto. Le principali operazioni sono: prodotto per
scalare, somma, prodotto di matrici
Prodotto per scalare

a11 a12
a21 a22

A = ..
..
.
.

..
.

am1 am2


a1n
a11
a21
a2n

.. = ..
. .

amn

a12
a22
..
.

..
.

am1 am2

a1n
a2n

..
.

amn

Somma

a11 + b11
a21 + b21

A+B =
..

a12 + b12
a22 + b22
..
.

..
.

am1 + bm1 am2 + bm2

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

a1n + b1n
a2n + b2n

..

amn + bmn

2007 2008

9 / 70

Somma

Propriet`
a della somma
Valgono le seguenti propriet`
a:
A+O = A
A+B = B+A
(A + B) + C = A + (B + C)
(A + B)T = AT + BT
Lelemento neutro o nullo O prende il nome di matrice nulla. Loperazione
differenza viene definita con lausilio dello scalare = 1:
A B = A + (1)B.

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

10 / 70

Prodotto

Prodotto di matrici
Loperazione si effettua con la regola riga per colonna: il generico
elemento cij della matrice prodotto Cmp = Amn Bnp vale
n

cij =

aik bkj

k=1

La propriet`a di bilinearit`
a del prodotto di matrici `e garantita, in quanto si
verifica immediatamente che, dato uno scalare generico , vale la seguente
identit`
a:
(A B) = ( A) B = A ( B)

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

11 / 70

Prodotto
Propriet`
a del prodotto
A B C = (A B) C = A (B C)
A (B + C) = A B + A C
(A + B) C = A C + B C
(A B)T = BT AT
In generale:
il prodotto di matrici non `e commutativo: A B 6= B A, salvo in casi
particolari;
A B = A C non implica B = C, salvo in casi particolari;

A B = O non implica che sia A = O oppure B = O, salvo in casi


particolari.

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

12 / 70

Matrice identit`
a
Esiste un elemento neutro rispetto al prodotto, che prende il nome di
matrice identit`
a e viene indicata con In oppure semplicemente I quando
non ci sono ambiguit`
a sulla dimensione; data una matrice rettangolare
Amn si ha
Amn = Im Amn = Amn In

Matrice identit`
a

1 0
0

I = . .
.. ..
0 0

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

0
0

. . ..
. .
1

2007 2008

13 / 70

Matrice idempotente

Data una matrice quadrata A Rnn , la potenza k-esima di matrice vale


k

Ak = A
=1

Una matrice si dice idempotente se


A2 = A.

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

14 / 70

Traccia

Traccia
La traccia di una matrice quadrata Ann `e la somma dei suoi elementi
diagonali
n

tr (A) =

akk

k=1

La traccia di una matrice soddisfa le seguenti propriet`


a
tr ( A + B) = tr (A) + tr (B)
tr (AB) = tr (BA)
tr (A) = tr (AT )
tr (A) = tr (T1 AT) per T non singolare (vedi oltre)

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

15 / 70

Minore

Si definisce minore di ordine p di una matrice Amn il determinante Dp di


una sottomatrice quadrata ottenuta selezionando p righe e p colonne
qualsiasi di Amn
La definizione formale di determinante verr`
a data tra poco
Esistono tanti minori quante sono le scelte possibili di p su m righe e p su
n colonne
Si definiscono minori principali di ordine k di una matrice Amn i
determinanti Dk , con k = 1, , min{m, n}, ottenuti selezionando le prime
k righe e k colonne della matrice Amn

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

16 / 70

Esempio
Sia data la matrice 3 3

1 3 5
A= 7
2 4
1 3 2

Calcoliamo un generico minore D1 , ad esempio quello ottenuto cancellando


una riga e una colonna, e in particolare la seconda riga e la terza
colonna. Quindi la matrice di cui dobbiamo calcolare i determinante risulta
la seguente


1 3
A23 =
1 3
da cui possiamo calcolare il determinante
D1 = det(A23 ) = 3 1 (3 1) = 0
Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

17 / 70

Minore complementare - cofattore


Data la matrice A Rnn , indichiamo con A(ij) R(n1)(n1) la matrice
ottenuta cancellando la i -esima riga e la j-esima colonna di A.
Si definisce minore complementare Drc di un generico elemento arc di una
matrice quadrata Ann il determinante della matrice ottenuta cancellando
la r -esima riga e la c-esima colonna, ossia det A(rc)
Drc = det A(rc) .
Si definisce complemento algebrico o cofattore (in inglese cofactor ) di un
elemento arc di una matrice quadrata Ann il prodotto
Arc = (1)r +c Drc

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

18 / 70

Determinante
Una volta definito il cofattore si pu`
o finalmente definire il determinante di
A
Fissata una qualsiasi riga i , si ha la definizione per riga:
n

det (A) =

aik (1)i +k det (A(ik) ) =

k=1

aik Aik

k=1

oppure, fissata una qualsiasi colonna j, si ha la definizione per colonna:


n

k=1

k=1

det (A) =

akj (1)k+j det (A(kj) ) = akj Akj

Poiche queste definizioni sono ricorsive e coinvolgono i determinanti di


minori via via sempre pi`
u piccoli, occorre definire il determinante della
matrice 1 1, che vale semplicemente det (aij ) = aij .
Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

19 / 70

Propriet`
a del determinante
Il determinante ha le seguenti propriet`
a:
det(A B) = det(A) det(B)
det(AT ) = det(A)

det(kA) = k n det(A)
se si effettua un numero s di scambi tra righe o tra colonne della
matrice A ottenendo la matrice As , si ha det(As ) = (1)s det(A)
se la matrice A ha due righe o due colonne uguali o proporzionali, si
ha det(A) = 0
se la matrice A ha una riga o una colonna ottenibile da una
combinazione lineare di altre righe o colonne, si ha det(A) = 0
se la matrice A `e triangolare superiore o inferiore, si ha
det(A) = ni=1 aii
se la matrice A `e triangolare a blocchi, con p blocchi Aii sulla
diagonale, si ha det(A) = pi=1 det Aii
Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

20 / 70

Matrice singolare e rango


Una matrice A si dice singolare se det(A) = 0.
Si definisce rango (o caratteristica) della matrice Amn il numero
(Amn ) definito come il massimo intero p per cui esiste almeno un
minore Dp non nullo
Valgono le seguenti propriet`
a:

(A) min{m, n}
se (A) = min{m, n}, la matrice A si dice a rango pieno
se (A) < min{m, n}, la matrice non ha rango pieno e si dice che
cade di rango
(A B) min{ (A), (B)}
(A) = (AT )
(A AT ) = (AT A) = (A)
se Ann e det A < n la matrice non ha rango pieno
Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

21 / 70

Matrice invertibile
Data una matrice quadrata A Rnn si dice invertibile o non singolare se
esiste la matrice inversa A1
nn tale che
AA1 = A1 A = In
La matrice `e invertibile se e solo se (A) = n, ossia `e di rango pieno; ci`
o
equivale ad avere det(A) 6= 0.
Linversa si ottiene come:
1
A1 =
Adj(A)
det(A)
Valgono le seguenti propriet`
a: (A1 )1 = A; (AT )1 = (A1 )T .
La matrice inversa, quando esiste, permette risolvere lequazione matriciale
seguente
y = Ax
in funzione dellincognita x, come
x = A1 y.
Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

22 / 70

Matrice ortonormale
Si definisce matrice ortonormale la matrice quadrata per cui A1 = AT .
Per queste matrici vale quindi lidentit`
a
AT A = AAT = I
Date due matrici quadrate di pari dimensioni A e B, vale la seguente
identit`
a
(AB)1 = B1 A1
Esiste un importante risultato, chiamato Lemma dinversione, che
stabilisce quanto segue: se A e C sono matrici quadrate invertibili e B e D
sono matrici di dimensioni opportune, allora
(A + BCD)1 = A1 A1 B(DA1 B + C1 )1 DA1
La matrice (DA1 B + C1 ) deve essere anchessa invertibile. Il lemma di
inversione `e utile per calcolare linversa di una somma di matrici A1 + A2 ,
quando A2 `e decomponibile nel prodotto BCD, in cui la matrice C `e
facilmente invertibile, ad esempio diagonale o triangolare.
Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

23 / 70

Derivata di matrice
Se la matrice quadrata A(t) `e composta da elementi aij (t) tutti derivabili
nel tempo t, allora la derivata della matrice vale


d
d

A(t) = A(t)
=
aij (t) = [a ij (t)]
dt
dt
Se la matrice quadrata A(t) ha rango (A(t)) = n per ogni valore del
tempo t, allora la derivata della sua inversa vale
d
1

A(t)1 = A1 (t)A(t)A(t)
dt
Ricordiamo che, poiche linversione di matrice non `e un operatore lineare,
risulta in generale



dA(t) 1
d 
6=
A(t)1
dt
dt
Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

24 / 70

Decomposizione in simmetrica e antisimmetrica


Data una matrice reale di dimensioni qualsiasi A Rmn , risultano
simmetriche entrambe le matrici seguenti
AT A Rnn
AAT Rmm
Data una matrice quadrata A, `e sempre possibile decomporla in una
somma di due matrici, come segue:
A = As + Aa
dove

1
As = (A + AT ) matrice simmetrica
2
1
Aa = (A AT ) matrice antisimmetrica
2

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

25 / 70

Trasformazione di similarit`
a

Trasformazioni di similarit`
a
Data una matrice quadrata A Rnn e una matrice quadrata non
singolare T Rnn , la matrice B Rnn ottenuta come
B = T1 AT

oppure

B = TAT1

si dice similare ad A e la trasformazione T si dice di similarit`


a.

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

26 / 70

Autovalori e autovettori
Se si trova una matrice U per cui la matrice A sia similare alla matrice
diagonale = diag(i )
A = UU1
postmoltiplicando per U si pu`
o scrivere
AU = U
e se indichiamo con ui la i -esima colonna di U, ossia


U = u1 u2 un
avremo

Aui = i ui

Questa relazione `e la ben nota formula che lega autovalori e autovettori;


quindi possiamo dire che le costanti i sono gli autovalori di A e i vettori
ui sono gli autovettori di A, in generale non normalizzati.
Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

27 / 70

Autovalori e autovettori

Data una matrice quadrata Ann , si chiamano autovalori della matrice (in
inglese eigenvalues) le soluzioni i (reali o complesse) dellequazione
caratteristica
det( I A) = 0

det( I A) `e un polinomio in , detto polinomio caratteristico.


Se gli autovalori sono tutti distinti, si chiamano autovettori (in inglese
eigenvectors) i vettori ui che soddisfano lidentit`
a
Aui = i ui

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

28 / 70

Autovettori generalizzati
Se gli autovalori non sono tutti distinti, si ottengono autovettori
generalizzati, la cui determinazione va oltre gli scopi di questi appunti.
Da un punto di vista geometrico, gli autovettori rappresentano quelle
particolari direzioni nello spazio Rn (dominio della trasformazione lineare
rappresentata da A), che si trasformano in se stesse; sono quindi le
direzioni invarianti rispetto alla trasformazione A, mentre gli autovalori
forniscono le rispettive costanti di scalamento lungo queste direzioni.
Linsieme degli autovalori di una matrice A sar`
a indicato con (A) oppure
con {i (A)}; linsieme degli autovettori di A sar`
a indicato con {ui (A)}. In
generale, poiche gli autovettori sono rappresentazioni di direzioni invarianti
rispetto alla trasformazione data, essi sono definiti a meno di una
costante, ossia possono o meno essere normalizzati; tuttavia `e convenzione
tacita che essi abbiano norma unitaria, salvo quando altrimenti dichiarato.

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

29 / 70

Autovalori
Propriet`
a degli autovalori
Data una matrice A e i suoi autovalori {i (A)}, vale
{i (A + cI)} = {(i (A) + c)}
Data una matrice A e i suoi autovalori {i (A)}, vale
{i (cA)} = {(c i (A)}
Data una matrice triangolare (superiore o inferiore)

a11 a12 a1n


a11 0 0
0 a22 a2n a21 a22 0

..
.. . .
.. , ..
.. . .
..
.
. . .
.
.
.
.
0
0 ann
an1 an2 ann

i suoi autovalori sono gli elementi sulla diagonale {i (A)} = {aii }; lo


stesso vale per una matrice diagonale.
Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

30 / 70

Invarianza degli autovalori


Data una matrice Ann e i suoi autovalori {i (A)}, vale
n

det(A) = i
i =1

tr (A) =

i =1

Data una qualunque trasformazione invertibile, rappresentata dalla matrice


T, gli autovalori di A sono invarianti alle trasformazioni di similarit`
a
B = T1 AT
ossia

Basilio Bona (DAUIN-Politecnico di Torino)

{i (B)} = {i (A)}
Matrici

2007 2008

31 / 70

Matrice modale
Se costruiamo una matrice M ordinando per colonne gli autovettori
normalizzati ui (A)


M = u1 un

allora la trasformazione di similarit`


a rispetto a M fornisce una matrice
diagonale

1 0 0
0 2 0

1
= .
.. . .
.. = M AM
.
.
. .
.
0

La matrice M prende il nome di matrice modale.


Se la matrice A `e simmetrica, i suoi autovalori sono tutti reali e si ha
lidentit`
a
= MT AM
In questo caso la matrice M `e ortonormale.
Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

32 / 70

Decomposizione ai valori singolari


Data una matrice A Rmn qualsiasi, di rango r = (A) s con
s = min{m, n}, essa si pu`o fattorizzare secondo la
Decomposizione ai Valori Singolari
(Singular value decomposition)
nel modo seguente:
A = UVT =

i ui vTi

(1)

i =1

elementi caratterizzanti della decomposizione sono:

i
ui
vi
come vedremo ora
Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

33 / 70

Decomposizione ai valori singolari


i (A) 0 sono detti valori singolari e coincidono con le radici
quadrate non negative degli autovalori della matrice simmetrica AT A:
q
{i (A)} = { i (AT A)}
i 0

ordinati in ordine decrescente

1 2 s 0
se r < s vi sono r valori singolari positivi; i restanti sono nulli

1 2 r > 0;

r +1 = = s = 0

U `e una matrice (m m) ortonormale



U = u1 u2

um

contenente per colonne gli autovettori ui della matrice AAT


Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

34 / 70

Decomposizione ai valori singolari


V `e una matrice (n n) ortonormale

V = v 1 v2

vn

contenente per colonne gli autovettori vi della matrice AT A

`e una matrice (m n) con la seguente struttura




se m < n = s O
se m = n = s
 
s
se m > n =
.
O

La matrice s = diag(i ) `e diagonale di dimensioni s s e contiene


sulla diagonale i valori singolari:
Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

35 / 70

Decomposizione ai valori singolari


Alternativamente, possiamo decomporre la matrice A nel modo seguente,
che `e del tutto analogo a quello descritto in (1), ma mette in evidenza i
soli valori singolari positivi:

" #

 r O QT

= Pr QT
(2)
A= P P
T
| {z } O O Q
| {z } | {z }
U

VT

dove

`e una matrice ortonormale


P `e una matrice ortonormale m r , P
m (m r );
T `e una matrice ortonormale
Q `e una matrice ortonormale n r , Q
n (n r );

r `e una matrice diagonale r r che contiene sulla diagonale i valori


singolari positivi i , i = 1, , r .

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

36 / 70

Decomposizione ai valori singolari e rango

Il rango r della matrice A `e pari al numero r s di valori singolari non


nulli.
Data una matrice A Rmn qualsiasi, le due matrici AT A e AAT sono
simmetriche, hanno gli stessi valori singolari positivi e differiscono soltanto
per il numero di valori singolari nulli.

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

37 / 70

Matrici come rappresentazione di operatori lineari


Dati due spazi vettoriali X Rn e Y Rm , aventi rispettivamente
dimensioni n e m, e dati due generici vettori x X e y Y , la pi`
u
generica trasformazione lineare tra gli spazi si pu`
o rappresentare attraverso
loperatore matriciale A Rmn , come segue:
y = Ax; x Rn ; y Rm .
Quindi una matrice pu`
o essere sempre interpretata come un operatore che
prende un vettore dello spazio di partenza X e lo trasforma in un
vettore dello spazio di arrivo Y .
Perci`
o qualunque trasformazione lineare ha (almeno) una matrice che la
rappresenta e, di converso, qualunque matrice `e la rappresentazione di una
qualche trasformazione lineare.

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

38 / 70

Spazio immagine e spazio nullo


Si definisce spazio immagine (in inglese range) della trasformazione A il
sottospazio di Y definito dalla seguente propriet`
a:
R(A) = {y | y = Ax, x X }; R(A) Y
Si definisce spazio nullo (in inglese kernel o null-space) della
trasformazione A il sottospazio di X definito dalla seguente propriet`
a:
N (A) = {x | 0 = Ax, x X }; N (A) X
Lo spazio nullo rappresenta perci`
o tutti quei vettori di X che vengono
trasformati nel vettore nullo (lorigine) di Y .
Le dimensioni dello spazio immagine e dello spazio nullo si chiamano,
rispettivamente, rango (A) (che abbiamo gi`
a definito precedentemente e
nullit`
a (A):

(A) = dim(R(A)); (A) = dim(N (A)).


Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

39 / 70

Relazioni tra spazio immagine e spazio nullo


Se X e Y hanno dimensioni finite, e questo `e il nostro caso in quanto
X Rn e Y Rm , allora valgono le seguenti relazioni:
N (A) = R(AT )
R(A) = N (AT )
N (A) = R(AT )
R(A) = N (AT )
dove il simbolo indica il complemento ortogonale al (sotto-)spazio
corrispondente. Ricordiamo che {0} = R.
Vale anche la seguente decomposizione ortogonale degli spazi X e Y
X = N (A) N (A) = N (A) R(AT )
Y = R(A) R(A) = R(A) N (AT )
dove il simbolo indica la somma diretta tra due sottospazi.
Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

40 / 70

Inversa generalizzata
Data una matrice reale qualsiasi A Rmn , con m 6= n, la matrice inversa
non risulta definita. Tuttavia, `e possibile definire una classe di matrici,
dette pseudo-inverse, inverse generalizzate o 1-inverse A , che soddisfano
la seguente relazione:
AA A = A
Se la matrice A ha rango pieno, ossia (A) = min{m, n}, `e possibile
definire due classi di matrici inverse generalizzate particolari
se m < n (ossia (A) = m), linversa destra di A `e quella matrice
Ad Rnm per cui
AAd = Imm
se n < m (ossia (A) = n), linversa sinistra di A `e quella matrice
As Rnm per cui
As A = Inn

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

41 / 70

Matrici pseudo-inverse
Tra le molte inverse destre e sinistre concepibili, due sono particolarmente
importanti:
pseudo-inversa destra (m < n):
T
T 1
A+
d = A (AA )

rappresenta una particolare inversa destra. Si pu`


o dimostrare che
T 1
quando (A) = m allora (AA ) esiste.
pseudo-inversa sinistra (n < m):
T
1 T
A+
s = (A A) A

rappresenta una particolare inversa sinistra.

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

42 / 70

Pseudo-inversa di Moore-Penrose
Si pu`
o dimostrare che quando (A) = n allora (AT A)1 esiste.
Questa particolare pseudo-inversa sinistra
(AT A)1 AT
prende anche il nome di pseudo-inversa di Moore-Penrose.
o sempre definire una
In generale, anche se AT A non `e invertibile, si pu`
pseudo-inversa di Moore-Penrose A+ che soddisfa le seguenti relazioni:
AA+ A
A+ AA+
(AA+ )T
(A+ A)T

Basilio Bona (DAUIN-Politecnico di Torino)

=
=
=
=

Matrici

A
A+
AA+
A+ A

(3)

2007 2008

43 / 70

Pseudo-inversa destra e sinistra


+
Le due pseudo-inverse A+
d e As coincidono con la matrice inversa
tradizionale A1 quando A `e quadrata e ha rango pieno:
+
+
A1 = A+
d = As = A

La trasformazione lineare associata alla matrice A Rmn


y = Ax,

(4)

con x Rn e y Rm , `e equivalente ad un sistema di m equazioni lineari in


n incognite, i cui coefficienti sono dati dagli elementi di A; questo sistema
lineare pu`
o non ammettere soluzioni, ammetterne una sola o ammetterne
un numero infinito.
Se vogliamo utilizzare le pseudo-inverse per risolvere il sistema lineare in
(4), dobbiamo distinguere due casi, sempre nellipotesi che il rango di A
sia pieno:
Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

44 / 70

Soluzione di sistemi lineari - 1


Caso m < n: abbiamo pi`
u incognite che equazioni; tra le infinite soluzioni
n
possibili x R , scegliamo quella che ha norma kxk minima, individuata da
T
T 1

x = A+
d y = A (AA ) y

Tutte le altre possibili soluzioni di y = Ax si ottengono come

x=
x + v = A+
d y+v
dove v N (A) `e un vettore appartenente allo spazio nullo di A, che ha
dimensioni n m. Queste possibili soluzioni si possono anche esprimere in
una forma alternativa
+

x = A+
d y + (I Ad A)w

(5)

dove w Rn `e un vettore n 1 qualsiasi. La matrice I A+


d A proietta w
nello spazio nullo di A, trasformando w in v N (A); essa prende il nome
di matrice di proiezione.
Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

45 / 70

Soluzione di sistemi lineari - 2


caso n < m: abbiamo pi`
u equazioni che incognite; allora non esistono
soluzioni esatte alla y = Ax, ma solo soluzioni approssimate, con un errore
e = y Ax 6= 0. Tra queste possibili soluzioni approssimate si sceglie
convenzionalmente quella che minimizza la norma dellerrore, ossia

x = arg minn ky Axk


xR

La soluzione risulta essere


T
1 T

x = A+
s y = (A A) A y

e geometricamente consiste nella proiezione ortogonale di y sul


complemento ortogonale di N (A), ovvero sul sottospazio
N (A) = R(AT ).
Lerrore di approssimazione, detto anche errore di proiezione, vale
= (I AA+
e
s )y

(6)

e la sua norma `e minima, come detto sopra.


Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

46 / 70

Soluzione di sistemi lineari - 3

La somiglianza tra la matrice di proiezione I A+


d A in (5) e la matrice che
fornisce lerrore di proiezione I AA+
in
(6)
non
`e casuale e verr`
a
s
approfondita quando tratteremo le matrici di proiezione.
Per calcolare le inverse generalizzate, si pu`
o utilizzare la decomposizione ai
valori singolari che abbiamo introdotto sopra.
In particolare, ricordando la (2), la pseudo-inversa vale
 1

r
O T
+
T
U = Q1
A =V
r P .
O O

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

47 / 70

Proiezioni e matrici di proiezione


Il concetto geometrico di proiezione di un segmento su un piano pu`
o
venire esteso e generalizzato agli elementi di uno spazio vettoriale. Tale
concetto `e utile a risolvere un gran numero di problemi, tra cui i problemi
di approssimazione, di stima, di predizione e di filtraggio di segnali.
Dato uno spazio vettoriale reale V(Rn ) di dimensioni n, dotato di prodotto
scalare, ed un suo sottospazio W(Rk ) di dimensioni k n, `e possibile
definire loperatore proiezione dei vettori v V sul sottospazio W.
Loperatore proiezione `e definito dalla matrice quadrata di proiezione
P Rnn , le cui colonne sono le proiezioni degli elementi della base di V
in W. Una matrice `e di proiezione se e solo se P2 = P ossia se essa `e
idempotente.
La proiezione pu`
o essere ortogonale, oppure non ortogonale; nel primo
caso la matrice P `e simmetrica, nel secondo caso no. Se P `e una matrice
di proiezione, anche I P lo `e.
Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

48 / 70

Matrici di proiezione

Classici esempi di matrici di proiezione ortogonale sono le matrici associate


alla pseudo-inversa sinistra
P1 = AA+
s

e P2 = I AA+
s

e alla pseudo-inversa destra


P3 = A +
dA

e P4 = I A+
dA

(vedi le slide sulle inverse generalizzate).


Dal punto di vista geometrico, P1 proietta ogni vettore v V nel spazio
immagine R(A), mentre P2 proietta v nel suo complemento ortogonale
R(A) = N (AT ).

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

49 / 70

Norma di matrice - 1

Analogamente a quanto avviene per un vettore, `e possibile fornire una


misura della matrice ossia indicarne la grandezza, definendo la norma
della matrice.
Poiche una matrice rappresenta una trasformazione lineare tra vettori, la
norma misura quando grande sia questa trasformazione, ma deve in
qualche modo normalizzare il risultato perche questo non sia influenzato
dalla grandezza del vettore che viene trasformato; ci`
o viene fatto
definendo la norma nel modo seguente:
kAk := sup
kxk

Basilio Bona (DAUIN-Politecnico di Torino)

kAxk
= sup kAxk .
kxk
kxk=1

Matrici

2007 2008

50 / 70

Norma di matrice - 2

Data una matrice quadrata A Rnn , la sua norma deve soddisfare i


seguenti assiomi generali (detti assiomi della norma):
1
2
3
4

kAk > 0 per ogni A 6= O, kAk = 0 se e solo se A = O;


kA + Bk kAk + kBk (diseguaglianza triangolare);
k Ak = | | kAk per ogni scalare e ogni A;
kABk kAk kBk.

Data A Rnn e i suoi autovalori {i (A)}, vale la seguente diseguaglianza


1
1 |i | kAk
A

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

i = 1, . . . , n

2007 2008

51 / 70

Norme di matrice - 1
Elenchiamo le norme di matrice pi`
u comunemente adottate, considerando
solo matrici reali.
Norma spettrale:
kAk2 =

max{i (AT A)}


i

Norma di Frobenius:
kAkF =

aij2 =
i

tr AT A

Massimo valore singolare:


kAk =

Basilio Bona (DAUIN-Politecnico di Torino)

max{i (A)}

Matrici

2007 2008

52 / 70

Norme di matrice - 2

Norma 1 o max-norma:
n

kAk1 = max |aij |


j

Norma :

i =1
n

kAk = max |aij |


i

j=1

In generale kAk2 = kAk e kAk22 kAk1 kAk

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

53 / 70

Matrici antisimmetriche - 1
Le matrici antisimmetriche sono utili nello studio della cinematica del
corpo rigido, oltre che per definire il prodotto esterno in uno spazio
tridimensionale, come abbiamo visto precedentemente.
Una matrice S si dice antisimmetrica quando soddisfa la seguente
propriet`
a:
(7)
S + ST = O ossia S = ST
Una matrice antisimmetrica ha perci`
o sulla diagonale principale elementi
tutti nulli, mentre gli elementi fuori dalla diagonale soddisfano la relazione
sij = sji , come nel seguente esempio di matrice 4 4

0
1 3 1
1 0
4
5

S=
3 4 0 8
1 5 8
0
Ne segue che una matrice antisimmetrica `e definita da soli
elementi.
Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

n(n 1)
2

2007 2008

54 / 70

Matrici antisimmetriche - 2
n(n 1)
Per n = 3 risulta
= 3, per cui la matrice antisimmetrica ha tanti
2
elementi indipendenti quante sono le componenti di un generico vettore
tridimensionale v; la matrice viene allora ad essere in relazione biunivoca
con un vettore ed `e indicata come S(v).
Nel seguito studieremo le propriet`
a delle matrici antisimmetriche per
n = 3, in quanto sono di fondamentale importanza per definire la
cinematica delle rotazioni di corpi rigidi in spazi tridimensionali.

T
Se v = v1 v2 v3 `e un vettore qualsiasi, possiamo definire S(v) come
loperatore che trasforma v in una matrice antisimmetrica:

0
v3 v2
S(v) = v3
0
v1
(8)
v2 v1
0
e viceversa, data una matrice antisimmetrica qualsiasi, `e sempre possibile
estrarre da essa un vettore v.

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

55 / 70

Matrici antisimmetriche - 3
La matrice S(v) si indica semplicemente con S quando non si vuole
evidenziare la dipendenza dal vettore v. La propriet`
a di antisimmetria
comporta la seguente identit`
a:
ST (v) = S(v) = S(v)

(9)

Le matrici antisimmetriche soddisfano la propriet`


a di linearit`
a; dati due
scalari i R, vale la propriet`
a
S(1 u + 2 v) = 1 S(u) + 2 S(v)

(10)

Inoltre, dati due vettori qualsiasi v e u, si ha la seguente importante


propriet`
a:
S(u)v = u v = v u = S(v)u = ST (v)u
(11)
e quindi S(u) pu`
o essere interpretata come loperatore (u) e viceversa.
Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

56 / 70

Matrici antisimmetriche - 4

Da questa propriet`
a e dalla anti-commutativit`
a del prodotto esterno segue
che
(12)
S(u)v = ST (v)u
Infatti
S(u)v = u v = v u = S(v)u = S(v)u = ST (v)u
` semplice verificare che la matrice S(u)S(u) = S2 (u) `e simmetrica e
E
verifica la relazione
S2 (u) = uuT kuk2 I
(13)

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

57 / 70

Autovalori e autovettori di matrici antisimmetriche

Data la matrice antisimmetrica S(v) i suoi autovalori sono immaginari o


nulli:
1 = 0,
2,3 = j kvk
Lautovettore relativo allautovalore 1 = 0 vale v; gli altri due sono
complessi coniugati.
Linsieme delle matrici antisimmetriche forma uno spazio vettoriale.
Inoltre, date due matrici antisimmetriche S1 e S2 , si definisce
commutatore loperatore seguente
[S1 , S2 ] := S1 S2 S2 S1
che risulta anchesso antisimmetrico

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

58 / 70

Matrici ortogonali

Viene chiamata ortogonale una generica


vale la seguente propriet`
a

1 0
0 2

UT U = ..
..
.
.
0

con ii 6= 0.

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

matrice quadrata U Rn per cui

..
.

0
0
..
.

2007 2008

59 / 70

Matrici ortonormali - 1
Una generica matrice quadrata U Rn `e detta invece ortonormale quando
le costanti ii sono tutte unitarie. In questo caso valgono le seguenti
propriet`
a:
linversa di U coincide con la trasposta
UUT = UT U = I

(14)

U1 = UT

(15)

ovvero
Le colonne di U sono tra loro ortogonali e a norma unitaria, come
pure le righe.
kUk = 1;
Il determinante di U ha modulo unitario:
|det(U)| = 1

(16)

perci`
o esso pu`
o valere +1 oppure 1.
Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

60 / 70

Matrici ortonormali - 2

Il prodotto scalare `e invariante a trasformazioni ortonormali, ossia


(Ux) (Uy) = (Ux)T (Uy) = xT UT Uy = xT Iy = xT y = x y

(17)

Se U `e una matrice ortonormale,1 di dimensioni opportune, allora


kAUk = kUAk = kAk.
Limitandoci al caso di matrici U33 , solo 3 dei 9 elementi che
compongono la matrice sono indipendenti, in quanto le condizioni di
ortonormalit`
a tra le righe o tra le colonne definiscono 6 vincoli.

1 La regola vale anche nel caso pi`


u generale in cui U sia una matrice unitaria, definita
da U U = I.
Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

61 / 70

Matrici ortonormali - 3
Le matrici ortonormali U33 sono la rappresentazione di una particolare
classe di trasformazioni geometriche applicabili a corpi rigidi nello spazio
Euclideo; infatti la relazione (17) assicura che il prodotto scalare tra due
generici vettori si conservi anche tra i rispettivi vettori trasformati.
Tuttavia occorre distinguere tra le trasformazioni per cui det U = +1, da
quelle per cui det U = 1.
Quando det(U) = +1, la matrice U rappresenta una rotazione propria,
fisicamente ammissibile e realizzabile, mentre quando det(U) = 1, U
rappresenta una roto-riflessione ovvero una rotazione impropria, che non `e
fisicamente realizzabile su corpi rigidi.
Inoltre esiste unimportante differenza tra le rotazioni e le roto-riflessioni:
le prime formano un gruppo commutativo continuo; intuitivamente questo
equivale a dire che esiste una rotazione infinitesima. Le seconde invece
non formano un gruppo continuo; le riflessioni non possiedono la qualit`
a
di poter essere infinitesime.
Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

62 / 70

Matrici ortonormali - 4
Se U `e una matrice ortonormale, vale la propriet`
a distributiva2 rispetto al
prodotto esterno:
U(x y) = (Ux) (Uy)
(18)
Per ogni matrice di rotazione propria U e ogni vettore x si dimostra che


US(x)UT y = U x (UT y)
= (Ux) (UUT y)
(19)
= (Ux) y
= S(Ux)y
dove S(x) `e la matrice antisimmetrica associata a x; si ricavano pertanto
le relazioni seguenti:
US(x)UT = S(Ux)
US(x) = S(Ux)U

(20)

che saranno utilizzate nello studio delle matrici dinerzia.


2

Questa propriet`
a non `e generalmente vera, salvo appunto quando U `e ortonormale.

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

63 / 70

Forme bilineari e forme quadratiche


Si definisce forma bilineare associata alla matrice A Rmn la variabile
scalare
b(x, y) := xT Ay = yT AT x
Si definisce forma quadratica associata alla matrice quadrata A Rnn la
variabile scalare
q(x) := xT Ax = xT AT x
Qualsiasi forma quadratica associata ad una matrice antisimmetrica S(y) `e
identicamente nulla, ossia
xT S(y)x 0

(21)

La dimostrazione di questa propriet`


a `e semplice: definendo
T
w = S(y)x = y x, avremo x S(y)x = xT w, ma essendo per definizione w
ortogonale sia a y sia a x, il prodotto scalare xT w sar`a sempre nullo, e
quindi pure la forma quadratica al primo termine della (21).
Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

64 / 70

Matrici definite positive - 1


Ricordando la decomposizione di una generica matrice A in una parte
simmetrica As e in una antisimmetrica Aa , si conclude che la forma
quadratica dipende solo dalla parte simmetrica della matrice:
q(x) = xT Ax = xT (As + Aa )x = xT As x
Una matrice quadrata A si dice definita positiva se la forma quadratica
associata xT Ax soddisfa le condizioni
xT Ax > 0 x 6= 0
xT Ax = 0 x = 0
Una matrice quadrata A si dice semidefinita positiva se la forma
quadratica associata xT Ax soddisfa la condizione
xT Ax 0 x
Una matrice quadrata A si dice definita negativa se A `e definita positiva;
analogamente una matrice quadrata A si dice semidefinita negativa se A
`e semidefinita positiva.
Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

65 / 70

Matrici definite positive - 2

Spesso, per indicare queste matrici si usano le notazioni seguenti:


matrice
matrice
matrice
matrice

definita positiva:
semidefinita positiva:
definita negativa:
semidefinita negativa:

A0
A0
A0
A0

Condizione necessaria, ma non sufficiente, affinche una matrice quadrata


A sia definita positiva `e che gli elementi sulla diagonale siano strettamente
positivi.
Condizione necessaria e sufficiente affinche una matrice quadrata A sia
definita positiva `e che tutti gli autovalori siano strettamente positivi.

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

66 / 70

Criterio di Sylvester

Il criterio di Sylvester afferma che condizione necessaria e sufficiente


affinche la matrice quadrata A sia definita positiva `e che tutti i suoi minori
principali siano strettamente positivi.
Una matrice definita positiva ha rango pieno ed `e sempre invertibile.
Inoltre la forma quadratica xT Ax soddisfa la relazione seguente

min (A) kxk2 xT Ax max (A) kxk2


dove min (A) e max (A) sono, rispettivamente, lautovalore minimo e
massimo di A.

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

67 / 70

Matrice semidefinita e rango


Una matrice Ann semidefinita positiva ha rango (A) = r < n, ovvero
possiede r autovalori strettamente positivi e n r autovalori nulli.
La forma quadratica si annulla per ogni x N (A).
Data una matrice reale di dimensioni qualsiasi Amn , abbiamo visto che
sia AT A, sia AAT sono simmetriche; inoltre sappiamo che
(AT A) = (AAT ) = (A).
Si pu`
o dimostrare che esse hanno sempre autovalori reali non negativi, e
quindi sono definite o semi-definite positive: in particolare, se la matrice
Amn ha rango pieno,
se m < n, AT A  0 e AAT 0,
se m = n, AT A 0 e AAT 0,
se m > n, AT A 0 e AAT  0.

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

68 / 70

Gradiente
Data la forma bilineare b(x, y) = xT Ay, si definiscono gradienti le seguenti
espressioni:



b(x, y) T
gradiente rispetto a x: gradx b(x, y) :=
= Ay
x

T
b(x, y)
gradiente rispetto a y: grady b(x, y) :=
= AT x
y
Data la forma quadratica q(x) = xT Ax, si definisce gradiente rispetto a x
la seguente espressione:
gradx q(x) :=

Basilio Bona (DAUIN-Politecnico di Torino)

q(x)
x

Matrici

T

= 2Ax.

2007 2008

69 / 70

Derivata di matrice
Se la matrice A ha elementi funzione di una variabile x, si pu`
o definire la
derivata di matrice rispetto a x


d
daij
A(x) =
dx
dx
Se la variabile x `e il tempo t, si scrive


 
d
da
(t)
ij

A(t) A(t)
=
a ij
dt
dt

Se la matrice A `e funzione del tempo attraverso la variabile x(t), allora



 

d
aij (x) dx(t)
aij (x)

A(x(t)) A(x(t))
=

x(t)

dt
x
dt
x

Basilio Bona (DAUIN-Politecnico di Torino)

Matrici

2007 2008

70 / 70