Sei sulla pagina 1di 710

Algebra Lineare e Geometria Analitica

Volume I

E. Abbena, A.M. Fino, G.M. Gianella

12 marzo 2011
2
3

Prefazione
Con l’attivazione delle lauree triennali, i corsi universitari hanno subı̀to una notevole ri-
duzione del numero di ore a disposizione per le lezioni ed esercitazioni. Questo libro, che
trae origine dalle lezioni di “Geometria e Algebra Lineare I” che gli Autori hanno tenuto
al primo anno del Corso di Laurea in Fisica presso l’Università di Torino, costituisce ora
un testo completo che può essere anche utilizzato nelle Facoltà di Ingegneria, come pure
nel Corso di Laurea in Matematica per lo studio della Geometria Analitica nel Piano e
nello Spazio e per tutte quelle parti di Algebra Lineare di base trattate in campo reale.
Esso si presenta in due volumi di agevole consultazione: il primo dedicato alla parte
teorica ed il secondo formato da una raccolta di esercizi, proposti con le relative soluzioni,
per lo più tratti dai testi d’esame. La suddivisione in capitoli del secondo volume si
riferisce agli argomenti trattati nei corrispondenti capitoli del primo volume.
Il testo è di facile lettura e con spiegazioni chiare e ampiamente dettagliate, un po’ di-
verso per stile ed impostazione dagli usuali testi universitari del settore, al fine di soste-
nere ed incoraggiare gli Studenti nel delicato passaggio dalla scuola secondaria superiore
all’Università.
In quasi tutti i capitoli del primo volume è stato inserito un paragrafo dal titolo “Per
saperne di più” non solo per soddisfare la curiosità del Lettore ma con il preciso obiettivo
di offrire degli orientamenti verso ulteriori sviluppi della materia che gli Studenti avranno
occasione di incontrare sia in altri corsi di base sia nei numerosi corsi a scelta delle Lauree
Triennali e Magistrali.
Gli Autori avranno pienamente raggiunto il loro scopo se, attraverso la lettura del libro,
saranno riusciti a trasmettere il proprio entusiasmo per lo studio di una materia di base
per la maggior parte delle discipline scientifiche, rendendola appassionante.
La figure inserite nel testo sono tutte realizzate con il programma di calcolo simbolico
Mathematica, versione 7. Alcuni esercizi proposti sono particolarmente adatti ad essere
risolti con Mathematica o con Maple.
Per suggerimenti, osservazioni e chiarimenti si invita a contattare gli Autori agli indirizzi
e-mail: elsa.abbena@unito.it, annamaria.fino@unito.it, gianmario.gianella@unito.it.
4

II di copertina: Ringraziamenti

Grazie ai Colleghi di Geometria del Dipartimento di Matematica dell’Università di Torino


per il loro prezioso contributo.
Grazie al Prof. S.M. Salamon per tanti utili suggerimenti e per la realizzazione di molti
grafici. Grazie ai Proff. Sergio Console, Federica Galluzzi, Sergio Garbiero e Mario
Valenzano per aver letto il manoscritto.
Un ringraziamento particolare agli Studenti del Corso di Studi in Fisica dell’Univer-
sità di Torino, la loro partecipazione attiva e il loro entusiasmo hanno motivato questa
esperienza.
5

IV di copertina

Gli autori
Elsa Abbena, professore associato di Geometria presso la Facoltà di Scienze Matematiche
Fisiche e Naturali dell’Università di Torino, svolge la sua attività di ricerca su argomenti
di geometria differenziale. Ha tenuto innumerevoli corsi di algebra e di geometria dei
primi anni della Laurea Triennale presso vari corsi di Laurea.
Anna Fino, professore associato di Geometria presso la Facoltà di Scienze Matematiche
Fisiche e Naturali dell’Università di Torino, svolge la sua attività di ricerca su argomenti
di geometria differenziale e complessa. Ha tenuto per vari anni un corso di geometria e
algebra lineare presso il corso di Laurea in Fisica.
Gian Mario Gianella, professore associato di Geometria presso la Facoltà di Scienze
Matematiche Fisiche e Naturali dell’Università di Torino, svolge la sua attività di ricerca
su argomenti di topologia generale ed algebrica. Si occupa inoltre della teoria dei grafi e
più recentemente della teoria dei numeri. Ha tenuto innumerevoli corsi di geometria dei
primi anni della Laurea Triennale presso vari corsi di Laurea.

L’opera
Con l’attivazione delle lauree triennali, i corsi universitari hanno subı̀to una notevole ri-
duzione del numero di ore a disposizione per le lezioni ed esercitazioni. Questo libro, che
trae origine dalle lezioni di “Geometria e Algebra Lineare I” che gli Autori hanno tenuto
al primo anno del Corso di Laurea in Fisica presso l’Università di Torino, costituisce ora
un testo completo che può essere anche utilizzato nelle Facoltà di Ingegneria, come pure
nel Corso di Laurea in Matematica per lo studio della Geometria Analitica nel Piano e
nello Spazio e per tutte quelle parti di Algebra Lineare di base trattate in campo reale.
Esso si presenta in due volumi di agevole consultazione: il primo dedicato alla parte
teorica ed il secondo formato da una raccolta di esercizi, proposti con le relative soluzioni,
per lo più tratti dai testi d’esame. La suddivisione in capitoli del secondo volume si
riferisce agli argomenti trattati nei corrispondenti capitoli del primo volume.
6
Indice

1 Sistemi Lineari 15
1.1 Equazioni lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.2 Sistemi lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2.1 Sistemi lineari omogenei . . . . . . . . . . . . . . . . . . . . . 29

2 Matrici e Determinanti 33
2.1 Somma di matrici e prodotto di un numero reale per una matrice . . . . 33
2.2 Il prodotto di matrici . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.2.1 I sistemi lineari in notazione matriciale . . . . . . . . . . . . . . 40
2.3 La matrice inversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.4 La trasposta di una matrice . . . . . . . . . . . . . . . . . . . . . . . . 42
2.5 Matrici quadrate di tipo particolare . . . . . . . . . . . . . . . . . . . . 44
2.6 Le equazioni matriciali . . . . . . . . . . . . . . . . . . . . . . . . . . 46
2.6.1 Calcolo della matrice inversa, primo metodo . . . . . . . . . . . 50
2.7 La traccia di una matrice quadrata . . . . . . . . . . . . . . . . . . . . 55
2.8 Il determinante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.8.1 I Teoremi di Laplace
Un’altra definizione di rango di una matrice . . . . . . . . . . . 64
2.8.2 Calcolo della matrice inversa, secondo metodo . . . . . . . . . . 67
2.8.3 Il Teorema di Cramer . . . . . . . . . . . . . . . . . . . . . . . 69
2.9 Per saperne di più . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

3 Calcolo Vettoriale 75
3.1 Definizione di vettore . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.2 Somma di vettori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.3 Il prodotto di un numero reale per un vettore . . . . . . . . . . . . . . . 82
3.4 Dipendenza lineare e basi . . . . . . . . . . . . . . . . . . . . . . . . . 84

7
8 INDICE

3.5 Il cambiamento di base in V3 . . . . . . . . . . . . . . . . . . . . . . . 97


3.6 Angolo tra due vettori . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
3.7 Operazioni non lineari tra vettori . . . . . . . . . . . . . . . . . . . . . 101
3.7.1 Il prodotto scalare di due vettori . . . . . . . . . . . . . . . . . 101
3.7.2 Il prodotto vettoriale di due vettori . . . . . . . . . . . . . . . . 113
3.7.3 Il prodotto misto di tre vettori . . . . . . . . . . . . . . . . . . . 120
3.8 Cambiamenti di basi ortonormali in V3 e in V2 . . . . . . . . . . . . . . 124
3.9 Esercizi di riepilogo svolti . . . . . . . . . . . . . . . . . . . . . . . . . 129
3.10 Per saperne di più . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
3.10.1 Un’altra definizione di vettore . . . . . . . . . . . . . . . . . . 131
3.10.2 Ulteriori proprietà delle operazioni tra vettori . . . . . . . . . . 132

4 Spazi Vettoriali e Sottospazi Vettoriali 135


4.1 Spazi vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
4.2 Sottospazi vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
4.2.1 Definizione ed esempi . . . . . . . . . . . . . . . . . . . . . . . 139
4.2.2 Intersezione e somma di sottospazi vettoriali . . . . . . . . . . . 143
4.3 Generatori, basi e dimensione . . . . . . . . . . . . . . . . . . . . . . . 149
4.3.1 Base di uno spazio vettoriale . . . . . . . . . . . . . . . . . . . 149
4.3.2 Basi e somma diretta . . . . . . . . . . . . . . . . . . . . . . . 162
4.3.3 Rango di una matrice . . . . . . . . . . . . . . . . . . . . . . . 166
4.3.4 Il cambiamento di base . . . . . . . . . . . . . . . . . . . . . . 176
4.3.5 Iperpiani vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . 178
4.4 Esercizi di riepilogo svolti . . . . . . . . . . . . . . . . . . . . . . . . . 180
4.5 Per saperne di più . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
4.5.1 Equazioni vettoriali e teorema del rango . . . . . . . . . . . . . 188
4.5.2 Equivalenza tra due definizioni di rango di una matrice . . . . . 193
4.5.3 Spazi vettoriali complessi,
matrici hermitiane e anti-hermitiane . . . . . . . . . . . . . . . 195

5 Spazi Vettoriali Euclidei 201


5.1 Definizione di prodotto scalare . . . . . . . . . . . . . . . . . . . . . . 201
5.2 Norma di un vettore . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204
5.3 Basi ortonormali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208
5.4 Il complemento ortogonale . . . . . . . . . . . . . . . . . . . . . . . . 218
5.5 Esercizi di riepilogo svolti . . . . . . . . . . . . . . . . . . . . . . . . . 223
INDICE 9

5.5.1 Per saperne di più . . . . . . . . . . . . . . . . . . . . . . . . . 226


5.5.2 Spazi vettoriali hermitiani . . . . . . . . . . . . . . . . . . . . . 226

6 Applicazioni Lineari 235


6.1 Matrice associata ad un’applicazione lineare
Equazioni di un’applicazione lineare . . . . . . . . . . . . . . . . . . . 238
6.2 Cambiamenti di base e applicazioni lineari . . . . . . . . . . . . . . . . 246
6.3 Immagine e controimmagine di sottospazi vettoriali . . . . . . . . . . . 248
6.4 Operazioni tra applicazioni lineari . . . . . . . . . . . . . . . . . . . . 260
6.5 Sottospazi vettoriali invarianti . . . . . . . . . . . . . . . . . . . . . . . 265
6.6 Applicazione lineare aggiunta
Endomorfismi autoaggiunti . . . . . . . . . . . . . . . . . . . . . . . . 268
6.7 Esercizi di riepilogo svolti . . . . . . . . . . . . . . . . . . . . . . . . . 271
6.8 Per saperne di più . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276
6.8.1 Forme lineari – dualità . . . . . . . . . . . . . . . . . . . . . . 276
6.8.2 Cambiamento di base in V ∗ . . . . . . . . . . . . . . . . . . . . 279
6.8.3 Spazio vettoriale biduale . . . . . . . . . . . . . . . . . . . . . 281
6.8.4 Dualità nel caso degli spazi vettoriali euclidei . . . . . . . . . . 285
6.8.5 Trasposta di un’applicazione lineare . . . . . . . . . . . . . . . 286
6.8.6 Endomorfismi autoaggiunti e matrici hermitiane . . . . . . . . . 290
6.8.7 Isometrie, similitudini, trasformazioni unitarie . . . . . . . . . . 291

7 Diagonalizzazione 301
7.1 Autovalori e autovettori di un endomorfismo . . . . . . . . . . . . . . . 301
7.2 Determinazione degli autovalori e degli autospazi . . . . . . . . . . . . 305
7.3 Endomorfismi diagonalizzabili
Matrici diagonalizzabili . . . . . . . . . . . . . . . . . . . . . . . . . . 312
7.4 Il teorema spettrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314
7.5 Esercizi di riepilogo svolti . . . . . . . . . . . . . . . . . . . . . . . . . 321
7.6 Per saperne di più . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325
7.6.1 Diagonalizzazione simultanea . . . . . . . . . . . . . . . . . . . 326
7.6.2 Il Teorema di Cayley–Hamilton . . . . . . . . . . . . . . . . . . 331
7.6.3 Teorema spettrale e endomorfismi autoaggiunti
Caso complesso . . . . . . . . . . . . . . . . . . . . . . . . . . 334
7.6.4 Autovalori delle isometrie, similitudini,
trasformazioni unitarie . . . . . . . . . . . . . . . . . . . . . . 338
10 INDICE

8 Forme Bilineari e Forme Quadratiche 341


8.1 Forme bilineari simmetriche . . . . . . . . . . . . . . . . . . . . . . . 341
8.1.1 Matrice associata ad una forma bilineare simmetrica . . . . . . . 344
8.2 Forme quadratiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 350
8.3 Nucleo e vettori isotropi . . . . . . . . . . . . . . . . . . . . . . . . . . 353
8.4 Classificazione di una forma quadratica . . . . . . . . . . . . . . . . . . 364
8.5 Forme canoniche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 370
8.6 La segnatura di una forma quadratica . . . . . . . . . . . . . . . . . . . 376
8.7 Esercizi di riepilogo svolti . . . . . . . . . . . . . . . . . . . . . . . . . 381
8.8 Per saperne di più . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 389
8.8.1 Forme bilineari simmetriche ed endomorfismi autoaggiunti . . . 389
8.8.2 Forme bilineari simmetriche e spazio vettoriale duale . . . . . . 392
8.8.3 Altri metodi di classificazione di una forma quadratica . . . . . 393
8.8.4 Il determinante come forma p-lineare . . . . . . . . . . . . . . 398

9 Geometria Analitica nel Piano 405


9.1 Il riferimento cartesiano, generalità . . . . . . . . . . . . . . . . . . . . 405
9.1.1 Distanza tra due punti . . . . . . . . . . . . . . . . . . . . . . . 408
9.1.2 Punto medio di un segmento . . . . . . . . . . . . . . . . . . . 408
9.1.3 Baricentro di un triangolo . . . . . . . . . . . . . . . . . . . . . 408
9.2 Luoghi geometrici del piano . . . . . . . . . . . . . . . . . . . . . . . . 409
9.3 Riferimento polare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412
9.4 Traslazione degli assi . . . . . . . . . . . . . . . . . . . . . . . . . . . 414
9.5 Simmetrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 417
9.5.1 Curva simmetrica rispetto all’asse delle ordinate . . . . . . . . . 417
9.5.2 Curva simmetrica rispetto all’asse delle ascisse . . . . . . . . . 418
9.5.3 Curva simmetrica rispetto all’origine . . . . . . . . . . . . . . . 418
9.6 Retta nel piano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420
9.6.1 Retta per un punto parallela ad un vettore . . . . . . . . . . . . 421
9.6.2 Retta per un punto ortogonale ad un vettore . . . . . . . . . . . 422
9.6.3 Retta per due punti distinti . . . . . . . . . . . . . . . . . . . . 424
9.6.4 Rette particolari . . . . . . . . . . . . . . . . . . . . . . . . . . 426
9.6.5 Il coefficiente angolare ed il suo legame con a, b, c . . . . . . . . 426
9.7 Parallelismo, ortogonalità, angoli e distanze . . . . . . . . . . . . . . . 428
9.7.1 Condizione di parallelismo tra rette . . . . . . . . . . . . . . . . 428
INDICE 11

9.7.2 Condizione di perpendicolarità tra rette . . . . . . . . . . . . . . 429


9.7.3 Angolo tra due rette . . . . . . . . . . . . . . . . . . . . . . . . 431
9.7.4 Posizione reciproca di due rette nel piano . . . . . . . . . . . . 431
9.7.5 Distanza di un punto da una retta . . . . . . . . . . . . . . . . . 434
9.8 Fasci di rette . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 435
9.9 Esercizi di riepilogo svolti . . . . . . . . . . . . . . . . . . . . . . . . . 438
9.10 Per saperne di più . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441
9.10.1 Rette immaginarie . . . . . . . . . . . . . . . . . . . . . . . . . 441

10 Riduzione a Forma Canonica delle Coniche 445


10.1 La circonferenza nel piano . . . . . . . . . . . . . . . . . . . . . . . . 445
10.1.1 Posizione reciproca tra una retta e una circonferenza . . . . . . . 447
10.1.2 Retta tangente ad una circonferenza in un suo punto . . . . . . . 449
10.1.3 Posizione reciproca di due circonferenze
Circonferenza per tre punti . . . . . . . . . . . . . . . . . . . . 452
10.1.4 Fasci di circonferenze . . . . . . . . . . . . . . . . . . . . . . . 453
10.2 Le coniche: definizione e proprietà focali . . . . . . . . . . . . . . . . . 459
10.2.1 L’ellisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 459
10.2.2 L’iperbole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 465
10.2.3 Iperbole equilatera riferita agli asintoti . . . . . . . . . . . . . . 474
10.2.4 La parabola . . . . . . . . . . . . . . . . . . . . . . . . . . . . 476
10.2.5 Coniche e traslazioni . . . . . . . . . . . . . . . . . . . . . . . 481
10.3 Le coniche: luoghi geometrici di punti . . . . . . . . . . . . . . . . . . 485
10.4 Le coniche: equazioni di secondo grado,
riduzione delle coniche in forma canonica . . . . . . . . . . . . . . . . 492
10.5 Esercizi di riepilogo svolti . . . . . . . . . . . . . . . . . . . . . . . . . 508
10.6 Per saperne di più . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 512
10.6.1 Potenza di un punto rispetto ad una circonferenza . . . . . . . . 512
10.6.2 Equazioni parametriche delle coniche . . . . . . . . . . . . . . 514
10.6.3 Le coniche in forma polare . . . . . . . . . . . . . . . . . . . . 516
10.6.4 Retta tangente ad una conica in un suo punto . . . . . . . . . . . 517

11 Geometria Analitica nello Spazio 521


11.1 Il riferimento cartesiano nello spazio . . . . . . . . . . . . . . . . . . . 521
11.1.1 Distanza tra due punti . . . . . . . . . . . . . . . . . . . . . . . 522
11.1.2 Punto medio di un segmento . . . . . . . . . . . . . . . . . . . 523
12 INDICE

11.1.3 Baricentro di un triangolo e di un tetraedro . . . . . . . . . . . . 523


11.1.4 Area di un triangolo e volume di un tetraedro . . . . . . . . . . 523
11.2 Rappresentazione di un piano nello spazio . . . . . . . . . . . . . . . . 524
11.2.1 Piano per un punto ortogonale ad un vettore . . . . . . . . . . . 524
11.2.2 Piano per un punto parallelo a due vettori . . . . . . . . . . . . 526
11.2.3 Piano per tre punti non allineati . . . . . . . . . . . . . . . . . . 529
11.3 Rappresentazione della retta nello spazio . . . . . . . . . . . . . . . . . 531
11.3.1 Retta per un punto parallela ad un vettore . . . . . . . . . . . . 531
11.3.2 Retta per due punti distinti . . . . . . . . . . . . . . . . . . . . 534
11.3.3 Posizione reciproca di due piani
Retta come intersezione di due piani . . . . . . . . . . . . . . . 536
11.4 Posizioni reciproche tra rette e piani . . . . . . . . . . . . . . . . . . . 538
11.4.1 Posizione reciproca di tre piani . . . . . . . . . . . . . . . . . . 539
11.4.2 Posizione reciproca tra retta e piano . . . . . . . . . . . . . . . 541
11.4.3 Posizione reciproca di due rette nello spazio . . . . . . . . . . . 543
11.5 Fasci di piani . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 545
11.6 Distanze e angoli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 548
11.6.1 Distanza di un punto da un piano . . . . . . . . . . . . . . . . . 549
11.6.2 Distanza di un punto da una retta . . . . . . . . . . . . . . . . . 551
11.6.3 Minima distanza tra due rette sghembe.
Perpendicolare comune a due rette sghembe . . . . . . . . . . . 551
11.6.4 Angolo tra due rette . . . . . . . . . . . . . . . . . . . . . . . . 556
11.6.5 Angolo tra retta e piano . . . . . . . . . . . . . . . . . . . . . . 556
11.6.6 Angolo tra due piani . . . . . . . . . . . . . . . . . . . . . . . . 556
11.7 Sfera e posizione reciproca con rette e piani . . . . . . . . . . . . . . . 559
11.7.1 Sfera . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 559
11.7.2 Posizione reciproca tra piano e sfera . . . . . . . . . . . . . . . 560
11.7.3 Posizione reciproca tra retta e sfera . . . . . . . . . . . . . . . . 563
11.8 La circonferenza nello spazio . . . . . . . . . . . . . . . . . . . . . . . 565
11.9 Posizione reciproca tra due sfere
Fasci di sfere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 570
11.10 Coordinate polari sferiche . . . . . . . . . . . . . . . . . . . . . . . . . 579
11.11 Esercizi di riepilogo svolti . . . . . . . . . . . . . . . . . . . . . . . . . 583
11.12 Per saperne di più . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 592
11.12.1 Baricentro geometrico di punti . . . . . . . . . . . . . . . . . . 592
INDICE 13

11.12.2 Potenza di un punto rispetto ad una sfera . . . . . . . . . . . . . 594


11.12.3 Sfere in dimensione quattro . . . . . . . . . . . . . . . . . . . . 598

12 Coni, Cilindri, Superfici di Rotazione e Quadriche 601


12.1 Cenni sulla rappresentazione di curve e superfici . . . . . . . . . . . . . 601
12.2 Il cono . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 603
12.2.1 Cono tangente ad una sfera . . . . . . . . . . . . . . . . . . . . 614
12.2.2 Proiezione di una curva da un punto su un piano . . . . . . . . . 616
12.3 Il cilindro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 618
12.3.1 Cilindri con assi paralleli agli assi coordinati . . . . . . . . . . . 622
12.3.2 Cilindro circoscritto ad una sfera . . . . . . . . . . . . . . . . . 628
12.3.3 Proiezione di una curva su un piano secondo una direzione
assegnata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 632
12.3.4 Coordinate cilindriche . . . . . . . . . . . . . . . . . . . . . . . 634
12.4 Superfici di rotazione . . . . . . . . . . . . . . . . . . . . . . . . . . . 636
12.5 Cenni su superfici rigate . . . . . . . . . . . . . . . . . . . . . . . . . . 649
12.6 Quadriche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 652
12.6.1 Quadriche rigate . . . . . . . . . . . . . . . . . . . . . . . . . . 668
12.6.2 L’iperboloide ad una falda . . . . . . . . . . . . . . . . . . . . 668
12.6.3 Il paraboloide iperbolico . . . . . . . . . . . . . . . . . . . . . 676
12.7 Esercizi di riepilogo svolti . . . . . . . . . . . . . . . . . . . . . . . . . 680
12.8 Per saperne di più . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 690
12.8.1 Piano tangente ad una quadrica in un suo punto . . . . . . . . . 690

Bibliografia 697

Indice dei Simboli 699

Indice Analitico 702


14 INDICE
Capitolo 1

Sistemi Lineari

In questo capitolo si introducono le nozioni di sistema lineare, di matrici associate ad un


sistema lineare e si enuncia il Teorema di Rouché–Capelli i cui dettagli e la dimostrazione
sono rimandate al Paragrafo 4.3. In tutto il testo, salvo indicazione contraria, il campo dei
numeri su cui sono introdotte le definizioni, su cui sono dimostrati i teoremi e risolti gli
esercizi è il campo dei numeri reali R.

1.1 Equazioni lineari


Definizione 1.1 Un’equazione lineare nelle incognite x1 , x2 , . . . , xn è un’espressione del
tipo:

a1 x1 + a2 x2 + . . . + an xn = b, (1.1)

dove i numeri reali ai , i = 1, 2, . . . , n, sono detti coefficienti e il numero reale b prende


il nome di termine noto. L’equazione si dice lineare in quanto ogni incognita xi compare
a primo grado.

Definizione 1.2 Una soluzione dell’equazione lineare (1.1) è una n-upla di numeri reali:

(x01 , x02 , . . . , x0n )


che, sostituita alle incognite x1 , x2 , . . . , xn , verifica l’equazione, cioè:

a1 x01 + a2 x02 + . . . + an x0n = b.

Risolvere un’equazione significa determinarne tutte le soluzioni.

15
16 Sistemi Lineari

Esempio 1.1 L’equazione lineare nelle incognite x1 , x2 , x3 , x4 :


2x1 + 3x2 − x3 + 4x4 = 5
ammette infinite soluzioni, che dipendono da 3 parametri reali, date da:


 x1 = t1
x2 = t2


 x3 = −5 + 2t1 + 3t2 + 4t3
x4 = t3 , t1 , t2 , t3 ∈ R;

oppure, equivalentemente, l’insieme delle soluzioni S è dato da:

S = {(x1 , x2 , x3 , x4 ) = (t1 , t2 , −5 + 2t1 + 3t2 + 4t3 , t3 ) | t1 , t2 , t3 ∈ R}.

Si osservi che, risolvendo l’equazione rispetto ad un’altra incognita, si ottiene lo stesso


insieme di soluzioni (solo rappresentato in modo diverso).
Definizione 1.3 L’equazione lineare (1.1) si dice omogenea se il termine noto b è nullo.
È chiaro che un’equazione lineare è omogenea se e solo se ammette la soluzione nulla,
cioè la soluzione formata da tutti zeri (0, 0, . . . , 0) ma, in generale, un’equazione lineare
omogenea può ammettere anche soluzioni non nulle, come nell’esempio seguente.
Esempio 1.2 L’equazione lineare omogenea nelle incognite x, y :
2x − 3y = 0
ammette infinite soluzioni che dipendono da un’incognita libera, date da:
 
2
(x, y) = t, t , t ∈ R.
3
Si osservi che la soluzione nulla (0, 0) si ottiene ponendo t = 0.

1.2 Sistemi lineari


Un sistema lineare di m equazioni in n incognite x1 , x2 , . . . , xn è un insieme di equazioni
lineari del tipo:


 a11 x1 + a12 x2 + . . . . . . + a1n xn = b1
 a21 x1 + a22 x2 + . . . . . . + a2n xn = b2

.. (1.2)


 .
 a x + a x + . . . . . . + a x = b , a ∈ R, b ∈ R.
m1 1 m2 2 mn n m ij i
Capitolo 1 17

I coefficienti aij , i = 1, 2, . . . , m, j = 1, 2, . . . , n, sono dotati di due indici per agevolare


il riconoscimento della loro posizione nel sistema lineare. Il primo indice (indice di riga),
in questo caso i, indica il numero dell’equazione in cui il coefficiente compare, il secondo
indice (indice di colonna), in questo caso j , stabilisce il numero dell’incognita di cui aij
è il coefficiente. Per esempio a23 è il coefficiente della terza incognita nella seconda
equazione. I termini noti bi , i = 1, 2, . . . , m, hanno solo un’indice essendo unicamente
riferiti al numero dell’equazione in cui compaiono. Il sistema considerato è lineare in
quanto ogni equazione che lo compone è lineare. Analogamente al caso delle equazioni,
un sistema lineare si dice omogeneo se tutte le sue equazioni hanno termine noto nullo,
cioè se bi = 0, per ogni i = 1, 2, . . . , m.

Anche in questo caso vale la seguente definizione.

Definizione 1.4 Una soluzione di un sistema lineare di m equazioni in n incognite è una


n-upla di numeri reali:
(x01 , x02 , . . . , x0n )
che, sostituita ordinatamente alle incognite, verifica tutte le equazioni del sistema, cioè:


 a11 x01 + a12 x02 + . . . . . . + a1n x0n = b1


 a21 x01 + a22 x02 + . . . . . . + a2n x0n = b2

..



 .
 a x 0 + a x0 + . . . . . . + a x0 = b .

m1 1 m2 2 mn n m

Risolvere un sistema lineare significa determinarne tutte le soluzioni.

È chiaro che ogni sistema lineare è omogeneo se e solo se ammette la soluzione nulla
(0, 0, . . . , 0), formata da tutti zeri.

Definizione 1.5 Un sistema lineare si dice compatibile se ammette soluzioni, altrimenti


è incompatibile.

Vi sono metodi diversi per risolvere i sistemi lineari, in questo testo si darà ampio spazio
al metodo di riduzione di Gauss in quanto più veloce (anche dal punto di vista computa-
zionale). L’idea di base del metodo di Gauss è quella di trasformare il sistema lineare di
partenza in un altro sistema lineare ad esso equivalente ma molto più semplice, tenendo
conto della seguente definizione.

Definizione 1.6 Due sistemi lineari si dicono equivalenti se hanno le stesse soluzioni.
18 Sistemi Lineari

Prima di iniziare la trattazione teorica si consideri il seguente esempio.

Esempio 1.3 Risolvere il seguente sistema lineare di due equazioni in due incognite
usando il metodo di riduzione: 
x+y =4
2x − 3y = 7.

Il sistema lineare dato è equivalente a:



x+y =4
2(x + y) − (2x − 3y) = 2 · 4 − 7,

ossia: 
x+y =4
5y = 1
che ammette come unica soluzione (19/5, 1/5).

Il metodo usato per risolvere l’esempio precedente è conseguenza del seguente teorema.

Teorema 1.1 Eseguendo un numero finito di volte le tre operazioni sotto elencate:
1. scambiare tra loro due equazioni,
2. moltiplicare un’equazione per un numero reale diverso da zero,
3. sostituire ad un’equazione la somma di se stessa con un’altra equazione moltipli-
cata per un qualsiasi numero reale
si ottiene un sistema lineare equivalente a quello di partenza.

Dimostrazione È ovvio che scambiando tra loro due equazioni si ottiene un sistema
lineare equivalente a (1.2).
Per la seconda operazione, si dimostra che il sistema lineare (1.2) è equivalente al siste-
ma lineare che si ottiene sostituendo alla prima equazione se stessa moltiplicata per un
numero reale λ 6= 0. Si osservi che se tale sostituzione avviene per la i-esima equazione
è sufficiente operare con la prima operazione per ricondursi al caso in esame. In altri
termini si prova che (1.2) è equivalente al sistema lineare:


 λ(a11 x1 + a12 x2 + . . . . . . + a1n xn ) = λb1
 a21 x1 + a22 x2 + . . . . . . + a2n xn = b2

.. (1.3)


 .
 a x + a x + . . . . . . + a x = b , λ 6= 0.
m1 1 m2 2 mn n m

Per la dimostrazione si deve procedere in due passi.


Capitolo 1 19

1. Ipotesi: (x01 , x02 , . . . , x0n ) è soluzione di (1.2).


Tesi: (x01 , x02 , . . . , x0n ) è soluzione di (1.3).

2. Ipotesi: (x01 , x02 , . . . , x0n ) è soluzione di (1.3).


Tesi: (x01 , x02 , . . . , x0n ) è soluzione di (1.2).

1. La dimostrazione è ovvia e vale per ogni numero reale λ 6= 0.

2. È sufficiente dimostrare la tesi per la prima equazione di (1.2). Per ipotesi si ha:

λ(a11 x01 + a12 x02 + . . . . . . + a1n x0n ) = λb1 ,

essendo λ 6= 0 si possono dividere ambo i membri dell’identità precedente per λ,


da cui segue la tesi.

Per dimostrare l’equivalenza nel caso dell’operazione 3. si procede allo stesso modo.

Esempio 1.4 I due sistemi lineari seguenti non sono equivalenti:


 
x+y =4 x+y =4
2x − 3y = 7, 0(2x − 3y) + 2(x + y) = 0 · 7 + 2 · 4.

Infatti non è consentito sostituire alla seconda equazione il prodotto di se stessa per il
numero 0, anche se si mantiene inalterata la prima equazione.

Si osservi che le operazioni descritte nel Teorema 1.1 agiscono linearmente solo sui coef-
ficienti del sistema lineare e non sulle incognite. Ciò suggerisce di sostituire ad un sistema
lineare una “tabella” dei coefficienti e dei temini noti ed operare solo su questa. Viene
illustrato ora questo procedimento mediante l’Esempio 1.3.
Al sistema lineare:

x+y =4
2x − 3y = 7
si associa la tabella:
 
1 1 4
(1.4)
2 −3 7
con le due righe:
 
R1 = 1 1 | 4 , R2 = 2 −3 | 7
20 Sistemi Lineari

e le tre colonne:
     
1 1 4
C1 = , C2 = , C3 = .
2 −3 7
Successivamente si opera su di essa sostituendo alla seconda riga R2 se stessa a cui si
sottrae il prodotto di due volte la prima, cioè R2 −→ R2 − 2R1 , ottenendo cosı̀:
 
1 1 4
,
0 −5 −1
che corrisponde al sistema lineare ridotto:

x+y =4
−5y = −1.
Benché la definizione intuitiva di sistema lineare ridotto sia evidente, si enuncerà la
definizione formale più avanti.

La tabella (1.4) prende il nome di matrice completa del sistema lineare, o matrice dei
coefficienti e termini noti. Il tratto verticale prima dell’ultima sua colonna intende solo
distinguere i coefficienti del sistema lineare dai termini noti. Il termine matrice indica, in
generale, una tabella di numeri, a prescindere dall’uso relativo ai sistemi lineari. La trat-
tazione generale delle matrici è rimandata al capitolo successivo, introducendo ora solo
alcune nozioni elementari. È evidente che il numero delle righe della matrice completa
associata ad un sistema lineare coincide con il numero delle equazioni del sistema lineare,
il numero delle colonne è pari al numero delle incognite aumentato di una unità, che corri-
sponde alla colonna formata dai termini noti. Le operazioni di riduzione che permettono
di trasformare un sistema lineare in un sistema lineare ridotto ad esso equivalente (cfr.
Teor. 1.1) si traducono sulle righe della matrice in modo ovvio e si possono riassumere,
rispettivamente con le seguenti notazioni:
1. Ri ←→ Rj ,
2. Ri −→ λRi , λ ∈ R, λ 6= 0,
3. Ri −→ Ri + λRj , λ ∈ R, i 6= j,
dove Ri e Rj indicano rispettivamente la i–esima riga e la j –esima riga.

In generale, al sistema lineare (1.2) si associano due matrici, una matrice A di m righe e
n colonne:  
a11 a12 . . . a1n
 a21 a22 . . . a2n 
A =  .. (1.5)
 
.. .. 
 . . . 
am1 am2 · · · amn
Capitolo 1 21

detta matrice dei coefficienti, e una matrice (A | B) di m righe e n + 1 colonne:


 
a11 a12 . . . a1n b1
 a21 a22 . . . a2n b2 
(A | B) =  ..
 
.. .. .. 
 . . . . 

am1 am2 · · · amn bm
detta matrice completa.

Esempio 1.5 Nel sistema lineare seguente formato da tre equazioni in tre incognite:

 x + y + 2z = 9
2x + 4y − 3z = 1
3x + 6y − 5z = 0

la matrice completa (formata da tre righe e quattro colonne) è:


 
1 1 2 9
 2 4 −3 1 .

3 6 −5 0

Procedendo alla sua riduzione mediante le tre operazioni consentite si ottiene:


   
−→ 1 1 2 9 1 1 2 9
−→
R2 → R2 − 2R1  0 2 −7 −17   0 2 −7 −17 ,
R3 → 2R3 − 3R2
R3 → R3 − 3R1 0 3 −11 −27 0 0 −1 −3

da cui si perviene al sistema lineare:



 x + y + 2z = 9
2y − 7z = −17
−z = −3,

che ammette una sola soluzione: 


 x=1
y=2
z = 3.

Esempio 1.6 Nel sistema lineare seguente formato da tre equazioni in tre incognite:

 x1 + x2 − x3 = 1
2x1 + 2x2 + x3 = 0
x1 + x2 + 2x3 = −1

22 Sistemi Lineari

la matrice completa è:  


1 1 −1 1
 2 2 1 0 .
1 1 2 −1
Procedendo alla sua riduzione mediante le tre operazioni consentite si ottiene:
   
−→ 1 1 −1 1 1 1 −1 1
−→
R2 → R2 − 2R1  0 0 3 −2   0 0 3 −2 ,
R 3 → R3 − R2
R3 → R3 − R1 0 0 3 −2 0 0 0 0
da cui si perviene al sistema lineare:

x1 + x 2 − x3 = 1
3x3 = −2,

che ammette infinite soluzioni che dipendono da un’incognita libera x2 , per maggiore
chiarezza si pone x2 uguale ad un parametro t che quindi può assumere ogni valore reale:

1
x1 = − t


3






x2 = t





 2
 x3 = − , t ∈ R.

3

Esempio 1.7 Nel sistema lineare seguente formato da tre equazioni in tre incognite:

 x1 + x2 = −1
−2x1 + x2 + 3x3 = 2
−x1 + 2x2 + 3x3 = −1

la matrice completa è:  


1 1 0 −1

 −2 1 3 2 .

−1 2 3 −1

Procedendo alla sua riduzione mediante le tre operazioni consentite si ottiene:


   
−→ 1 1 0 −1 −→ 1 1 0 −1
R2 → R2 + 2R1  0 3 3 0  R2 → (1/3)R2  0 1 1 0 
R3 → R3 + R1 0 3 3 −2 R3 → R3 − R2 0 0 0 −2
Capitolo 1 23

da cui si perviene al sistema lineare:



 x1 + x2 = −1
x2 + x3 = 0
0 = −2

che è chiaramente incompatibile.

Gli esempi studiati impongono la definizione formale della matrice associata all’ultimo
sistema lineare che si ottiene, ossia della matrice associata ad un sistema lineare ridotto
equivalente a quello di partenza.

Definizione 1.7 Una matrice si dice ridotta per righe se in ogni sua riga non nulla esiste
un elemento non nullo al di sotto del quale vi sono tutti zeri.

Esempio 1.8 La matrice:  


1 2 0
 −1 0 1 
1 0 0
è ridotta per righe, mentre la matrice:
 
1 2 1
 −1 0 0 
1 1 −1

non lo è.

Segue, in modo naturale, la definizione annunciata di sistema lineare ridotto.

Definizione 1.8 Un sistema lineare si dice ridotto se la matrice dei coefficienti ad esso
associata è ridotta per righe.

Osservazione 1.1 Se la matrice dei coefficienti associata ad un sistema lineare è ridotta


per righe ma non lo è la matrice completa, è sufficiente operare sulla colonna dei termini
noti per pervenire ad una matrice completa ridotta per righe, per esempio:
   
1 2 3 1 1 2 3 1
 0 1 −2 2  −→  0 1 −2 2 
(A | B) =    .
 0 0 0 3  R4 → 4R3 − 3R4  0 0 0 3 
0 0 0 4 0 0 0 0
24 Sistemi Lineari

Invece, la matrice completa di un sistema lineare può essere ridotta per righe senza che
necessariamente il sistema lineare associato sia ridotto; per esempio la matrice completa:
 
1 2 3 4
(A | B) =  7 6 5 0 
9 8 0 0

è una matrice ridotta per righe, ma il sistema lineare associato non è ridotto perché la
matrice dei coefficienti non è ridotta per righe.

Risolvere un sistema lineare con il metodo di riduzione consiste nel pervenire, mediante
le operazioni consentite, ad una matrice dei coefficienti ridotta per righe. Dai teoremi che
seguono e anche dall’Osservazione 1.1, sarà chiaro che tra tutte le matrici complete ridotte
per righe, si dovranno considerare solo quelle in cui anche la matrice dei coefficienti è
ridotta per righe. Si possono allora presentare queste possibilità:

a. quella illustrata nell’Esempio 1.5, ovvero il numero delle righe non nulle della ma-
trice completa ridotta per righe è uguale al numero delle righe non nulle della ma-
trice dei coefficienti ridotta per righe ed è uguale al numero delle incognite, quindi
l’ultima riga non nulla della matrice dei coefficienti contiene soltanto un numero
non nullo, allora il sistema lineare ridotto associato è compatibile e ha una sola
soluzione.

b. Quella illustrata nell’Esempio 1.6, ovvero il numero delle righe non nulle della
matrice completa ridotta per righe è uguale al numero delle righe non nulle della
matrice dei coefficienti ed è minore del numero delle incognite; l’ultima riga non
nulla della matrice dei coefficienti contiene almeno un numero non nullo; allora il
sistema lineare ridotto è compatibile e ammette infinite soluzioni che dipendono da
almeno un’incognita libera.

c. Quella illustrata nell’Esempio 1.7, ovvero il numero delle righe non nulle della
matrice completa ridotta per righe è maggiore (di una unità) del numero delle righe
non nulle della matrice dei coefficienti ridotta per righe e pertanto il sistema lineare
ridotto associato è incompatibile.

Le definizioni seguenti (che avranno un ruolo cruciale in tutto il testo) permettono, in


modo elementare, di distinguere le situazioni prima esposte.

Definizione 1.9 Si dice rango di una matrice ridotta per righe il numero delle righe non
nulle.
Capitolo 1 25

Definizione 1.10 Si dice rango di una matrice il rango di una qualsiasi matrice ridotta
per righe da essa ottenuta.

Osservazione 1.2 In base alla precedente definizione il rango della matrice formata da
tutti zeri è 0.

In letteratura, le notazioni più comuni per indicare il rango di una matrice sono rank(A) =
rg(A) = r(A) = rk(A) = ρ(A). Si userà la notazione rank(A).

Osservazione 1.3 È evidente che affinchè la Definizione 1.10 abbia senso è necessario
dimostrare che, qualunque sia il processo di riduzione per righe usato, le varie matrici
ridotte ottenute hanno lo stesso rango. In realtà, la Definizione 1.10 esprime il metodo di
calcolo del rango di una matrice. Per dimostrare l’affermazione appena citata è necessario
enunciare un’altra definizione di rango di una matrice e ciò sarà fatto nel Paragrafo 4.3
dopo aver introdotto nozioni adesso premature.

I tre esempi prima elencati possono essere riscritti, in termini della nozione di rango, nel
modo seguente:

a. rank(A) = rank(A | B) = 3; il rango delle due matrici è uguale e coincide con il


numero delle incognite;

b. rank(A) = rank(A | B) = 2; il rango delle due matrici è uguale ma è inferiore di


una unità al numero delle incognite;

c. rank(A) = 3, rank(A | B) = 4; i due ranghi sono diversi, il sistema lineare è


incompatibile.

Si è cosı̀ “quasi” dimostrato il seguente teorema.

Teorema 1.2 – Teorema di Rouché–Capelli – Un sistema lineare in n incognite è com-


patibile se e solo se il rango della matrice dei coefficienti A coincide con il rango della
matrice completa (A | B). In particolare, se rank(A) = rank(A | B) = n, il sistema
lineare ha un’unica soluzione. Se rank(A) = rank(A | B) = k < n, il sistema lineare
ammette infinite soluzioni che dipendono da n − k incognite libere.

Si osservi, infatti, che il Teorema di Rouché–Capelli è banalmente dimostrato solo nel


caso dei sistemi lineari ridotti; per completare la dimostrazione è necessario, come già os-
servato, enunciare un’altra definizione di rango di una matrice e provare che le operazioni
di riduzione per righe di una matrice non ne alterano il rango (cfr. Teor. 4.21).
26 Sistemi Lineari

Osservazione 1.4 Un sistema lineare omogeneo è sempre compatibile, perciò è solo in-
teressante capire se ammetta una sola soluzione (quella nulla) o infinite soluzioni e ciò
dipende interamente dal rango della matrice dei coefficienti. Per la risoluzione di un si-
stema lineare omogeneo è sufficiente ridurre per righe la matrice dei coefficienti (questo
caso sarà esaminato in dettaglio nel Paragrafo 1.2.1).
Osservazione 1.5 Mentre segue dalla Definizione 1.10 che, per una matrice A con m
righe e n colonne, rank(A) ≤ m, si dimostrerà formalmente che il rango della matrice
dei coefficienti di un sistema lineare è un numero inferiore o uguale al minore tra il numero
delle equazioni e il numero delle incognite, cioè rank(A) ≤ m e rank(A) ≤ n.
Osservazione 1.6 Al più il rango della matrice completa differisce di una unità dal rango
della matrice dei coefficienti, cioè rank(A | B) ≤ rank(A) + 1.
Esempio 1.9 – Metodo di riduzione di Gauss–Jordan – Per determinare le soluzioni
di un sistema lineare si può procedere in modo leggermente diverso da quando si è visto
finora. Quando si perviene alla matrice completa ridotta per righe, anziché scrivere il si-
stema lineare ridotto associato si può, in modo equivalente, procedere allo stesso calcolo
mediante un’ulteriore riduzione della matrice completa allo scopo di pervenire alla lettura
nell’ultima colonna (quella dei termini noti) delle soluzioni del sistema lineare. Questo
metodo, detto anche metodo di riduzione di Gauss–Jordan, per differenziarlo dal metodo
di riduzione di Gauss introdotto in precedenza, è molto efficace quando si ha una sola so-
luzione, ma può presentare alcune difficoltà di calcolo negli altri casi. Viene ora illustrato
con un esempio e precisamente partendo dall’ultimo passaggio di riduzione nell’Esempio
1.5. La matrice dei coefficienti ha, in questo caso, lo stesso numero di righe e di colon-
ne. Pertanto ha senso considerare la sua diagonale principale, cioè l’insieme formato da
tutti gli elementi aii , i = 1, 2, 3 (tale nozione sarà ripresa e riformulata con maggiore
proprietà di linguaggio nell’Esempio 2.6). Quando la matrice dei coefficienti è ridotta
per righe si inizia con il far comparire 1 sulla sua diagonale principale e poi, partendo
dall’ultima riga e risalendo verso la prima, si annullano i termini della matrice sopra la
diagonale principale.
   
1 1 2 9 1 1 2 9
  −→  
 0 2 −7 −17  R2 → (1/2)R2  0 1 − 7 − 17 
   





 R3 → −R3

 2 2 

0 0 −1 −3 0 0 1 3
   
1 1 0 3 1 0 0 1
−→
−→
   
R2 → R2 + (7/2)R3  0 1 0 2  0 1 0 2 .
   
 R1 → R1 − R2

R1 → R1 − 2R3
  

0 0 1 3 0 0 1 3
Capitolo 1 27

Si osservi che sull’ultima colonna, si legge, in ordine, proprio la soluzione del sistema li-
neare dato. Si presti molta attenzione all’ordine con cui compaiono i valori delle incognite
nell’ultima colonna, che dipende dal metodo di riduzione seguito.

Esercizio 1.1 Discutere e risolvere, al variare del parametro a ∈ R, il seguente sistema


lineare di tre equazioni in tre incognite:

 x + 2y − 3z = 4
3x − y + 5z = 2
4x + y + (−14 + a2 )z = 2 + a.

Soluzione Si procede con la riduzione per righe della matrice completa (A | B), ripor-
tando solo i passaggi essenziali.

 
1 2 −3
4 −→
(A | B) =  3 −1 5
2  R2 → R2 − 3R1
4 1 −14 + a2 2 + a R3 → R3 − 4R1
   
1 2 −3 4 1 2 −3 4
 0 −7 −→
14 −10   0 −7 14 −10 .

2 R3 → R3 − R2
0 −7 −2 + a −14 + a 0 0 −16 + a2 −4 + a

La matrice dei coefficienti A è ridotta per righe, quindi si presentano i seguenti casi:

1. rank(A) = 3 se e solo se a2 − 16 6= 0 ossia se e solo se a ∈


/ {−4, 4};

2. rank(A) = 2 se e solo se a = −4 oppure a = 4.

Per determinare le soluzioni del sistema lineare si devono considerare tre casi:

1. a ∈/ {−4, 4}, poiché rank(A) = 3 anche rank(A | B) = 3. Il sistema lineare è


compatibile e ammette una sola soluzione, che si determina o a partire dal sistema
lineare ridotto associato, oppure procedendo all’ulteriore riduzione della matrice
completa prima ottenuta nel modo seguente:

1 2 −3 4
 

−→
 
  −→
1
 0 7 −14 10 
1
R3 → R3  R2 → R2
 
−16 + a2

 −4 + a  7
0 0 1
(4 + a)(−4 + a)
28 Sistemi Lineari

19 + 4a
 
2 −3
 
1 4 1 2 0
   4+a 
−→
 
10
 
54 + 10a 
 
 0 1 −2
 
 R2 → R2 + 2R3  0

1 0

 7 
 R1 → R1 + 3R3 

7(4 + a) 
 
 1   1 
0 0 1 0 0 1
4+a 4+a

25 + 8a
 
1 0 0

 7(4 + a) 

−→ 54 + 10a 
 
 0 1 0 .

R1 → R1 − 2R2  7(4 + a) 
 
 1 
0 0 1
4+a

In questo modo si leggono, ordinatamente in colonna, i valori delle tre incognite.

2. a = −4, sostituendo tale valore di a nell’ultimo passaggio di riduzione della


matrice completa (A | B) si ha:
 
1 2 −3 4
 0 7 −14 10 
0 0 0 −8

da cui segue che rank(A) = 2 mentre rank(A | B) = 3, il sistema lineare è quindi


incompatibile.

3. a = 4, sostituendo tale valore di a nell’ultimo passaggio di riduzione della matrice


completa (A | B) si ha:

 

1 2 −3 4
 1 2 −3 4
  −→ 
 10


 0 7 −14 10  1  0 1 −2 ,
 
  R2 → R2  7 
7  
0 0 0 0 0 0 0 0

da cui segue che rank(A) = rank(A | B) = 2 (2 < 3, con 3 numero delle


Capitolo 1 29

incognite) il sistema lineare è, quindi, compatibile e ammette infinite soluzioni:



8
x = −t


7






10
y= + 2t
7







 z = t, t ∈ R.

Osservazione 1.7 Le soluzioni del sistema lineare precedente possono essere riscritte nel
modo seguente:
   
8 10 8 10
(x, y, z) = − t, + 2t, t = , , 0 + t(−1, 2, 1), t ∈ R,
7 7 7 7

mettendo cosı̀ meglio in evidenza la dipendenza dall’incognita libera z = t. Si osservi


inoltre che sostituendo a t un particolare valore si ottiene una soluzione particolare del
sistema lineare.

1.2.1 Sistemi lineari omogenei


Si ricordi che un sistema lineare omogeneo è un sistema lineare avente tutti i termini noti
uguali a zero, cioè del tipo:


 a11 x1 + a12 x2 + . . . . . . + a1n xn = 0
 a21 x1 + a22 x2 + . . . . . . + a2n xn = 0

.. (1.6)


 .
 a x + a x + . . . . . . + a x = 0, a ∈ R,
m1 1 m2 2 mn n ij

la cui matrice dei coefficienti A coincide con (1.5) e quella completa (A |B) è:
 
a11 a12 . . . a1n 0
 a21 a22 . . . a2n 0 
(A | B) =  .. .. .. ;
 
..
 . . . . 
am1 am2 · · · amn 0
quindi il rango della matrice dei coefficienti A coincide con il rango della matrice com-
pleta (A | B). Infatti, come si è già osservato, un sistema lineare omogeneo ammette
sempre almeno la soluzione nulla. È molto interessante distinguere il caso in cui si ha una
sola soluzione da quello con infinite soluzioni:
30 Sistemi Lineari

1. se il rango di A coincide con il numero delle incognite, allora esiste solo la solu-
zione (0, 0, . . . , 0);
2. se il rango di A è un numero k strettamente minore del numero delle incognite n,
allora esistono infinite soluzioni che dipendono da n − k incognite libere.

Esempio 1.10 Il seguente sistema lineare omogeneo di quattro equazioni in cinque inco-
gnite: 

 x3 + x4 + x5 = 0
−x1 − x2 + 2x3 − 3x4 + x5 = 0


 x1 + x2 − 2x3 − x5 = 0
2x1 + 2x2 − x3 + x5 = 0

ha come matrice dei coefficienti:


 
0 0 1 1 1
 −1 −1 2 −3 1 
A= .
 1 1 −2 0 −1 
2 2 −1 0 1

Procedendo alla sua riduzione per righe (si osservi che è inutile ridurre per righe la matrice
completa) si ha:
   
1 1 −2 0 −1 1 1 −2 0 −1
−→  0 −→
0 1 1 1 
 R3 → R3 + R1  0 0
 1 1 1 
R3 ↔ R1   −1 −1

2 −3 1   0 0 0 −3 0 
R2 ↔ R3 R4 → R4 − 2R1
2 2 −1 0 1 0 0 3 0 3
 
1 1 −2 0 −1
−→  0 0 1 1 1 
R3 → −(1/3)R3   0 0

0 1 0 
R4 → (1/3)R4
0 0 1 0 1
 
1 1 −2 0 −1
−→  0 0
 1 1 1 
.
R4 → R4 − R2  0 0 0 1 0 
0 0 0 −1 0

Si deduce che rank(A) = 3, esistono, quindi, infinite soluzioni che dipendono da 5−3 = 2
incognite libere. Il sistema lineare ridotto associato è:

 x1 + x2 − 2x3 − x5 = 0
x3 + x4 + x5 = 0 (1.7)
x4 = 0

Capitolo 1 31

le cui soluzioni sono: 



 x1 = −t1 − t2
 x2 = t2


x3 = −t1
x 4 = 0




x5 = t1 , t1 , t2 ∈ R.

Osservazione 1.8 L’insieme delle soluzioni del sistema lineare precedente si può scrivere
come:
n
(x1 , x2 , x3 , x4 , x5 ) = (−t1 − t2 , t2 , −t1 , 0, t1 )
o
= t1 (−1, 0, −1, 0, 1) + t2 (−1, 1, 0, 0, 0) | t1 , t2 ∈ R .

Il seguente teorema mette in relazione le soluzioni di un sistema lineare compatibile qual-


siasi (1.2) con il sistema lineare omogeneo (1.6), che ha la stessa matrice dei coefficienti.
Tale sistema lineare (1.6) è anche detto il sistema lineare omogeneo associato a (1.2).

Teorema 1.3 Una generica soluzione di un sistema lineare compatibile (1.2) si ottiene
aggiungendo una (qualsiasi) soluzione particolare di (1.2) ad una generica soluzione del
sistema lineare omogeneo associato (1.6).

Dimostrazione Sia (x∗1 , x∗2 , . . . , x∗n ) una soluzione particolare di (1.2) e (x1 , x2 , . . . , xn )
una soluzione generica del sistema lineare omogeneo associato (1.6), allora si verifica
immediatamente che (x1 + x∗1 , x2 + x∗2 , . . . , xn + x∗n ) è ancora una soluzione di (1.2).
Viceversa, se (x01 , x02 , . . . , x0n ) e (x001 , x002 , . . . , x00n ) sono due soluzioni qualsiasi di (1.2),
delle quali (x01 , x02 , . . . , x0n ) è quella generale e (x001 , x002 , . . . , x00n ) è una soluzione partico-
lare, allora è facile verificare che (x01 − x001 , x02 − x002 , . . . , x0n − x00n ) è soluzione del sistema
lineare omogeneo associato (1.6).

Esempio 1.11 Si consideri il sistema lineare:



 x1 + x2 − 2x3 − x5 = 5
x3 + x4 + x5 = 4 (1.8)
x4 = 3

che ha come sistema lineare omogeneo associato (1.7). L’insieme delle sue soluzioni è:
n
(x1 , x2 , x3 , x4 , x5 ) = (7 − t1 − t2 , t2 , 1 − t1 , 3, t1 )
o
= (7, 0, 1, 3, 0) + t1 (−1, 0, −1, 0, 1) + t2 (−1, 1, 0, 0, 0) | t1 , t2 ∈ R .
32 Sistemi Lineari

Si osservi che (7, 0, 1, 3, 0) è una soluzione particolare del sistema lineare dato, mentre:

t1 (−1, 0, −1, 0, 1) + t2 (−1, 1, 0, 0, 0),

al variare di t1 e t2 in R, è la generica soluzione del sistema lineare omogeneo (1.7)


associato.
Analogamente, si verifichi per esercizio che il sistema lineare seguente:

 x1 + x2 − 2x3 − x5 = 1
x3 + x4 + x 5 = 2
x4 = −1,

che ha la stessa matrice dei coefficienti di (1.8) ma diversa matrice completa, ha come
insieme di soluzioni:
n
(x1 , x2 , x3 , x4 , x5 ) = (7 − t1 − t2 , t2 , 3 − t1 , −1, t1 )
o
= (7, 0, 3, −1, 0) + t1 (−1, 0, −1, 0, 1) + t2 (−1, 1, 0, 0, 0) | t1 , t2 ∈ R .
Capitolo 2

Matrici e Determinanti

Scopo di questo capitolo è quello di formalizzare il concetto di matrice già introdotto


nel capitolo precedente e studiare le proprietà essenziali dell’insieme delle matrici che
costituisce un valido esempio di spazio vettoriale, struttura algebrica che sarà definita nel
Capitolo 4.

2.1 Somma di matrici e prodotto di un numero reale per


una matrice
Definizione 2.1 Una matrice di m righe e di n colonne, ad elementi reali, è una tabella
del tipo:
 
a11 a12 . . . a1n
 a21 a22 . . . a2n 
A= , (2.1)
 
.. .. ..
 . . . 
am1 am2 · · · amn

con aij ∈ R, i = 1, 2, . . . , m, j = 1, 2, . . . , n.

Per convenzione le matrici vengono indicate con le lettere maiuscole dell’alfabeto e l’in-
sieme della matrici di m righe ed n colonne sarà indicato con Rm,n o, talvolta, con
MR (m, n). In forma sintetica la matrice (2.1) si può anche scrivere come:

A = (aij ), 1 ≤ i ≤ m, 1 ≤ j ≤ n,

e aij è l’elemento della matrice A di posto (i, j).

33
34 Matrici e Determinanti

Esempio 2.1 I numeri reali possono essere considerati come matrici di una riga ed una
colonna, cioè come elementi di R1,1 . Quindi R è effettivamente uguale a R1,1 .

Esempio 2.2 Le matrici che hanno lo stesso numero di righe e di colonne si dicono
quadrate e tale numero si dice ordine della matrice. Per esempio:
 
1 2
A=
3 4

è una matrice quadrata di ordine 2.

Esempio 2.3 Le matrici con una riga e n colonne si dicono matrici riga. Per esempio:

A = 1 2 3 4 ∈ R1,4


è una matrice riga.

Esempio 2.4 Le matrici con m righe e una colonna si dicono matrici colonna. Per
esempio:  
1
 2  4,1
A=  3 ∈R

4
è una matrice colonna.

Osservazione 2.1 Si osservi che, alla luce dei due esempi precedenti, gli elementi del
prodotto cartesiano:

Rn = {(x1 , x2 , . . . , xn ) | xi ∈ R, i = 1, 2, . . . , n}

possono essere visti come matrici riga o colonna. Quindi Rn può essere identificato sia
con R1,n sia con Rn,1 .

Esempio 2.5 La matrice (aij ) ∈ Rm,n , con tutti gli elementi aij = 0, si dice matrice
nulla e si indica con O, da non confondersi con il numero 0 ∈ R. È evidente che la
matrice nulla è l’unica matrice ad avere rango zero (cfr. Oss. 1.2).

Esempio 2.6 Nel caso di una matrice quadrata A = (aij ) di ordine n, tutti gli elementi
del tipo aii , al variare di i da 1 a n, costituiscono la diagonale principale. Rivestiranno
in seguito molta importanza le matrici diagonali, vale a dire le matrici quadrate aventi
Capitolo 2 35

elementi tutti nulli al di fuori della diagonale principale cioè aij = 0 se i 6= j . L’insieme
delle matrici diagonali di ordine n sarà indicato con:
  

 a 11 0 . . . 0 

 0 a22 . . . 0 
 

n,n
D(R ) =  .. | a ∈ i = 1, 2, . . . , n . (2.2)
 
.. . . ..  ii R,

  . . . .  

 
 0 0 . . . ann 

Esempio 2.7 Casi particolari dell’esempio precedente sono la matrice unità I ∈ Rn,n ,
ossia la matrice diagonale avente tutti 1 sulla diagonale principale:
 
1 0 ... 0
 0 1 ... 0 
I =  .. .. . . .. 
 
 . . . . 
0 0 ... 1

e la matrice quadrata nulla O ∈ Rn,n , intendendosi come tale la matrice quadrata avente
tutti gli elementi uguali a 0.

La definizione che segue stabilisce la relazione di uguaglianza tra matrici.

Definizione 2.2 Due matrici A = (aij ) e B = (bij ) sono uguali se:

1. hanno lo stesso numero di righe e di colonne, cioè A e B appartengono entrambe


allo stesso insieme Rm,n ,

2. gli elementi di posto uguale coincidono, cioè:

aij = bij , i = 1, 2, . . . , m, j = 1, 2, . . . , n.

Si introducono ora le definizioni di somma di matrici e di prodotto di un numero reale per


una matrice sull’insieme Rm,n .

Definizione 2.3 Si definisce somma delle due matrici A = (aij ), B = (bij ), entrambe
appartenenti a Rm,n , la matrice A + B ∈ Rm,n data da:

A + B = (aij + bij ).

Esempio 2.8 Date le matrici:


   
1 2 0 5
A= , B=
3 4 −2 7
36 Matrici e Determinanti

la loro somma è la matrice:  


1 7
A+B = .
1 11

Se A e B non appartengono allo stesso insieme Rm,n , non è possibile definire la loro
somma. Ad esempio non è definita la somma della matrice A con la matrice:
 
0 3 2
C= .
−1 5 6

Teorema 2.1 Per l’operazione di somma di matrici definita sull’insieme Rm,n valgono
le proprietà di seguito elencate:

1. A + B = B + A, A, B ∈ Rm,n (proprietà commutativa).

2. A + (B + C) = (A + B) + C, A, B, C ∈ Rm,n (proprietà associativa).

3. O + A = A + O = A, A ∈ Rm,n (esistenza dell’elemento neutro).

4. A + (−A) = O, A ∈ Rm,n (esistenza dell’opposto).

Dimostrazione È lasciata per esercizio ed è la naturale conseguenza del fatto che la


somma di numeri reali soddisfa le stesse proprietà. L’elemento neutro per la somma di
matrici è la matrice nulla O ∈ Rm,n introdotta nell’Esempio 2.5, l’opposto della matrice
A = (aij ) ∈ Rm,n è la matrice −A ∈ Rm,n cosı̀ definita −A = (−aij ).

Osservazione 2.2 Un insieme con un’operazione che verifichi le proprietà del teorema
precedente si dice gruppo commutativo o semplicemente gruppo se soddisfa solo le pro-
prietà 2., 3., 4. Pertanto (Rm,n , +) con l’operazione di somma di matrici ha la struttura di
gruppo commutativo.

Definizione 2.4 Si definisce prodotto di un numero reale λ per una matrice A = (aij ) di
Rm,n la matrice che si ottiene moltiplicando ogni elemento di A per il numero reale λ,
ossia:
λA = (λaij ),

quindi λA è ancora una matrice di Rm,n .

A volte si usa il termine scalare per indicare il numero reale λ e il prodotto di un numero
reale per una matrice è anche detto quindi prodotto di uno scalare per una matrice.
Capitolo 2 37

Esempio 2.9 Se:


 
1 2
A= ,
3 4

il prodotto 3A è la matrice:
 
3 6
3A = .
9 12

L’opposto della matrice A è dunque −A = (−1)A. Inoltre 0A = O, dove O indica la


matrice nulla.

Teorema 2.2 Per il prodotto di un numero reale per una matrice valgono le seguenti
proprietà che mettono in relazione la somma di matrici con la somma e il prodotto di
numeri reali:

1. λ(A + B) = λA + λB, λ ∈ R, A, B ∈ Rm,n ;

2. (λ + µ)A = λA + µA, λ, µ ∈ R, A ∈ Rm,n ;

3. (λµ)A = λ(µA), λ, µ ∈ R, A ∈ Rm,n ;

4. 1A = A, A ∈ Rm,n .

Dimostrazione Si tratta di un semplice esercizio.

Osservazione 2.3 L’insieme delle matrici Rm,n , considerato congiuntamente con le ope-
razioni di somma e di prodotto per numeri reali, ciascuna delle quali dotate delle quattro
proprietà prima enunciate, dà luogo ad una struttura algebrica che è un esempio di spazio
vettoriale.

Gli spazi vettoriali, che costituiscono la base dell’algebra lineare, saranno studiati in mo-
do intensivo a partire dal Capitolo 4. Si è preferito, per ragioni didattiche, anteporre la
descrizione degli esempi più facili di spazi vettoriali alla loro stessa definizione. Que-
sto è il caso di Rm,n e nel prossimo capitolo la stessa idea sarà applicata all’insieme dei
vettori ordinari dello spazio in modo da permettere al Lettore di prendere confidenza con
nozioni, a volte troppo teoriche rispetto alle conoscenze acquisite nella scuola seconda-
ria superiore e di dare la possibilità di affrontare più agevolmente lo studio dei capitoli
successivi.
38 Matrici e Determinanti

2.2 Il prodotto di matrici


La definizione di prodotto di matrici, oggetto di questo paragrafo, trova una sua giustifica-
zione, per esempio, nella rappresentazione mediante matrici dei movimenti in uno spazio
vettoriale e nella loro composizione, problematiche che saranno trattate diffusamente nel
Capitolo 6.

A prescindere da argomenti più sofisticati, si introduce questa nuova operazione tra ma-
trici che, anche se a prima vista appare singolare, è comunque dotata di interessanti
proprietà, che rendono plausibile la seguente definizione.

Definizione 2.5 Il prodotto della matrice A = (aij ) di Rm,n con la matrice B = (bij ) di
Rn,p è la matrice C = AB = (cij ) di Rm,p i cui elementi sono dati da:
n
X
cij = ai1 b1j + ai2 b2j + . . . + ain bnj = aik bkj . (2.3)
k=1

Si possono quindi solo moltiplicare matrici di tipo particolare, ossia il primo fattore deve
avere il numero di colonne pari al numero delle righe del secondo fattore. La matrice
prodotto avrà il numero di righe del primo fattore e il numero di colonne del secondo
fattore. Da questa definizione segue che il prodotto di due matrici non è commutativo. A
titolo di esempio, si calcoli il prodotto delle matrici:
 
  1 −1 2 3
1 2 3
A= , B=  0 1 2 4 ,
4 5 6
3 5 7 9

e si ricavino i primi due elementi della matrice C = (cij ) = AB ∈ R2,4 :

c11 si ottiene sommando i prodotti degli elementi della prima riga di A con gli elementi
della prima colonna di B : c11 = 1 · 1 + 2 · 0 + 3 · 3 = 10.

c12 si ottiene sommando i prodotti degli elementi della prima riga di A con gli elementi
della seconda colonna di B : c12 = 1 · (−1) + 2 · 1 + 3 · 5 = 16 e cosı̀ via.

La matrice C è dunque:  
10 16 27 38
C= .
22 31 60 86

Per la sua particolare definizione, questo tipo di prodotto di matrici prende il nome di
prodotto righe per colonne.
Capitolo 2 39

Osservazione 2.4 È chiaro che il prodotto di due matrici quadrate dello stesso ordine è
ancora una matrice quadrata dello stesso ordine, ma anche in questo caso non vale in
generale la proprietà commutativa, per esempio date:
   
1 2 0 1
A= , B=
3 4 2 3
si ha:  
4 7
AB =
8 15
mentre:  
3 4
BA = .
11 16
Nel caso delle matrici quadrate di ordine 1 il prodotto è ovviamente commutativo perché
coincide con il prodotto di numeri reali. Anche nel caso delle matrici diagonali il prodotto
è commutativo, come si osserverà nel Paragrafo 2.5.

Osservazione 2.5 Il prodotto di matrici ha singolari particolarità. Per esempio:


    
1 −2 2 2 0 0
AB = = = O ∈ R2,2 ,
1 −2 1 1 0 0

in assoluto contrasto con il solito prodotto di numeri reali in cui se ab = 0 allora ne-
cessariamente o a = 0 o b = 0. Ovviamente se O ∈ Rm,n è la matrice nulla e
A ∈ Rn,p , B ∈ Rk,m allora:

OA = O ∈ Rm,p e BO = O ∈ Rk,n .

Esempio 2.10 Si osservi che, date:




1
 2 
∈ R1,4 , 4,1

A= 1 2 3 4  3 ∈R ,
B= 

4
allora:
AB = (30) ∈ R1,1 ,
mentre:  
1 2 3 4
 2 4 6 8 
BA =   ∈ R4,4 .
 3 6 9 12 
4 8 12 16
40 Matrici e Determinanti

Teorema 2.3 Per il prodotto di matrici valgono le seguenti proprietà:


1. (AB)C = A(BC), A ∈ Rm,n , B ∈ Rn,k , C ∈ Rk,p (proprietà associativa);
2. A(B + C) = AB + AC, A ∈ Rp,m , B, C ∈ Rm,n e
(X + Y )Z = XZ + Y Z, X, Y ∈ Rm,n , Z ∈ Rn,k (proprietà distributive del
prodotto rispetto alla somma. Si osservi la necessità di enunciare entrambe le
proprietà per la mancanza della proprietà commutativa del prodotto);
3. (λA)B = λ(AB) = A(λB), λ ∈ R, A ∈ Rm,n , B ∈ Rn,k ;
4. AI = IA = A, A ∈ Rn,n (le due uguaglianze occorrono solo nel caso del-
le matrici quadrate; la matrice unità I ∈ Rn,n è l’elemento neutro rispetto al
prodotto).
Dimostrazione È lasciata per esercizio nei casi più semplici, per gli altri si rimanda al
Paragrafo 2.9.

È valido il seguente teorema che permette di confrontare il rango del prodotto di n matrici
moltiplicabili tra di loro con il rango di ciascuna di esse, per la dimostrazione si rimanda
al Paragrafo 4.5.
Teorema 2.4 Siano A1 , A2 , . . . , An matrici moltiplicabili tra di loro, allora:
rank(A1 A2 · · · An ) ≤ min{rank(A1 ), rank(A2 ), . . . , rank(An )}, (2.4)
quindi, in particolare, il rango del prodotto di matrici è minore o uguale del rango di
ciascun fattore.
Osservazione 2.6 È chiaro, anche se può sorprendere, che è necessario porre il segno di
disuguaglianza in (2.4), come si può per esempio notare dal fatto che:
    
0 1 0 1 0 0
= ,
0 0 0 0 0 0
infatti anche se i due fattori hanno rango 1 il loro prodotto ha rango 0.

2.2.1 I sistemi lineari in notazione matriciale


Usando la definizione di prodotto di matrici, si può scrivere in modo compatto un generico
sistema lineare di m equazioni in n incognite del tipo (1.2). Siano:
 
a11 a12 . . . a1n
 a21 a22 . . . a2n 
m,n
A =  .. ..  ∈ R
 
..
 . . . 
am1 am2 · · · amn
Capitolo 2 41

la matrice dei coefficienti,


 
x1
 x2 
X=  ∈ Rn,1
 
..
 . 
xn
la matrice colonna delle incognite e:
 
b1
 b2 
B=  ∈ Rm,1
 
..
 . 
bm

la matrice colonna dei termini noti, allora il sistema lineare (1.2) si può scrivere, in
notazione matriciale, come:

AX = B.

2.3 La matrice inversa


Avendo introdotto il prodotto di matrici (che generalizza il prodotto di numeri reali) ap-
pare naturale introdurre il concetto di inversa di una matrice quadrata; a differenza del
caso dei numeri è necessario prestare particolare attenzione alla definizione in quanto il
prodotto di matrici non è commutativo.

Definizione 2.6 Sia A ∈ Rn,n una matrice quadrata di ordine n. A si dice invertibile se
esiste una matrice X ∈ Rn,n tale che:

AX = XA = I, (2.5)

dove I indica la matrice unità di ordine n.

Teorema 2.5 Se A ∈ Rn,n è invertibile, allora la matrice X, definita in (2.5), è unica.

Dimostrazione Si supponga per assurdo che esistano due matrici diverse X, X 0 ∈ Rn,n
che verificano la (2.5). Allora:

X 0 = IX 0 = (XA)X 0 = X(AX 0 ) = XI = X
42 Matrici e Determinanti

che è assurdo. Si osservi che, nella dimostrazione, si è usata la proprietà associativa del
prodotto di matrici.

La matrice X cosı̀ definita si dice matrice inversa di A e si indica con A−1 .

Per la matrice inversa valgono le seguenti proprietà la cui dimostrazione è lasciata per
esercizio.

Teorema 2.6 1. (AB)−1 = B −1 A−1 , con A, B ∈ Rn,n matrici invertibili.


2. (A−1 )−1 = A, con A ∈ Rn,n matrice invertibile.

Osservazione 2.7 Segue dal punto 1. e dalle proprietà del prodotto di matrici che l’in-
sieme:
GL(n, R) = {A ∈ Rn,n | A è invertibile}
è un gruppo rispetto al prodotto di matrici (cfr. Oss. 2.2), noto come gruppo lineare
generale reale.

Nei paragrafi successivi si affronterà il problema di calcolare l’inversa di una matrice, di


conseguenza, si tratterà di capire, innanzi tutto, quando una matrice quadrata è invertibile.
Si consiglia, prima di continuare la lettura, di svolgere il seguente esercizio.

Esercizio 2.1 Determinare le condizioni affinché la matrice:


 
a11 a12
A=
a21 a22

sia invertibile e, in questi casi, calcolare A−1 .

Si osservi che per risolvere l’esercizio si deve discutere e risolvere il sistema lineare
AX = I :     
a11 a12 x11 x12 1 0
=
a21 a22 x21 x22 0 1
di quattro equazioni nelle quattro incognite x11 , x12 , x21 , x22 , che sono gli elementi della
matrice X.

2.4 La trasposta di una matrice


Definizione 2.7 Data una matrice A ∈ Rm,n si definisce trasposta di A, e la si indica con
t
A la matrice di Rn,m che si ottiene scambiando le righe con le colonne della matrice A,
in simboli se A = (aij ) allora tA = (bij ) con bij = aji , i = 1, 2, . . . , m, j = 1, 2, . . . , n.
Capitolo 2 43

Esempio 2.11 Se:


 
1 2 3
A=
4 5 6

allora:
 
1 4
t
A =  2 5 .
3 6

Se:

A= 1 2 3 4

allora:
 
1
t
 2 
A=
 3 .

Osservazione 2.8 1. Si osservi che se una matrice è quadrata, allora anche la sua
trasposta è una matrice quadrata dello stesso ordine, ma, in generale, diversa dalla
matrice di partenza, per esempio:
   
1 2 t 1 −1
A= , A= .
−1 0 2 0

2. Se una matrice è diagonale (cfr. Es. 2.6) allora la sua trasposta coincide con la
matrice stessa.

Per la trasposta di una matrice valgono le seguenti proprietà la cui dimostrazione è lasciata
per esercizio e si può leggere nel Paragrafo 2.9.

t
Teorema 2.7 1. (A + B) = tA + tB, A, B ∈ Rm,n .

2. t (λA) = λ tA, A ∈ Rm,n , λ ∈ R.

3. t (AB) = tB tA, A ∈ Rm,n , B ∈ Rn,k .

4. Se A ∈ Rn,n è una matrice invertibile, allora (tA)−1 = t (A−1 ).


44 Matrici e Determinanti

2.5 Matrici quadrate di tipo particolare


1. L’insieme delle matrici matrici triangolari superiori di Rn,n definito da:
  
 a11 a12 . . . . . . . . . a1n 
 


  0 a22 . . . . . . . . . a2n  


 
 .
 . .
. ... .
.
 

. . .
 
n,n n,n
T (R ) =   ∈ R | aij ∈ R ; (2.6)
 
  0 0 . . . akk . . . akn  

  . . . . .  



  .
. .
. .
. . . .
.  



 

0 0 . . . 0 . . . ann

si tratta delle matrici quadrate che hanno tutti gli elementi nulli al di sotto della
diagonale principale, vale a dire se A = (aij ) con i, j = 1, 2, . . . , n, allora aij = 0
se i > j . È facile osservare che la somma di due matrici triangolari superiori è
ancora una matrice triangolare superiore, lo stesso vale per il prodotto di un numero
reale per una matrice triangolare superiore. Molto più sorprendente è il fatto che il
prodotto di due matrici triangolari superiori, entrambe dello stesso ordine, è ancora
una matrice triangolare superiore. Si supponga, infatti, di determinare la matrice
C = (cij ) ∈ Rn,n prodotto delle matrici triangolari superiori A = (aij ) ∈ T (Rn,n )
e B = (bij ) ∈ T (Rn,n ). Per semplicità si calcola ora solo l’elemento c21 della
matrice prodotto C = AB , lasciando il calcolo in generale per esercizio. Da (2.3)
si ha:

c21 = a21 b11 + a22 b21 + . . . a2n bn1 = 0b11 + a22 0 + . . . + a2n 0 = 0,

in quanto aij = 0 e bij = 0 se i > j .


Si possono definire in modo analogo le matrici triangolari inferiori, con proprietà
simili a quelle descritte nel caso delle matrici triangolari superiori. Come è già stato
osservato nel Capitolo 1, il calcolo del rango di una matrice triangolare superiore è
molto semplice.

2. L’insieme delle matrici diagonali D(Rn,n ) introdotte nell’Esempio 2.6. La carat-


teristica principale di tali matrici è la loro analogia con il campo dei numeri reali,
infatti il prodotto di due matrici diagonali è ancora una matrice diagonale, avente
ordinatamente sulla diagonale principale il prodotto degli elementi corrispondenti
delle due matrici date. Le matrici diagonali sono, ovviamente, sia matrici triangola-
ri superiori sia matrici triangolari inferiori. Quindi una matrice diagonale è ridotta
per righe, di conseguenza, il suo rango è pari al numero degli elementi non nulli
della diagonale principale. Nel caso di rango massimo, la matrice diagonale è in-
vertibile e la sua inversa ha sulla diagonale principale ordinatamente gli inversi dei
Capitolo 2 45

corrispettivi elementi della matrice data, ossia se:


   −1 
a11 0 −1 a11 0
A= , con a11 6= 0, a22 6= 0, allora A = ,
0 a22 0 a−1
22

la verifica di queste affermazioni è lasciata per esercizio.

3. L’insieme delle matrici simmetriche di Rn,n definito da:

S(Rn,n ) = {A ∈ Rn,n | A = tA}; (2.7)

scrivendo esplicitamente la definizione si ottiene che una matrice simmetrica è del


tipo:  
a11 a12 . . . a1n
 a12 a22 . . . a2n 
A =  .. .. ;
 
.. . .
 . . . . 
a1n a2n . . . ann

in altri termini, una matrice A = (aij ) ∈ Rn,n è simmetrica se e solo se:

aij = aji , i, j = 1, 2, . . . , n,

e ciò giustifica la sua denominazione.


Per esercizio si calcoli la somma di due matrici simmetriche, il prodotto di una
matrice simmetrica per un numero reale e la trasposta di una matrice simmetrica e si
stabilisca se si ottiene ancora una matrice simmetrica. Si osservi, in particolare, che
il prodotto di due matrici simmetriche non è, in generale, una matrice simmetrica.
Per esempio:
     
1 −1 3 1 2 2
A= , B= , AB = .
−1 2 1 −1 −1 −3

Per esercizio si individuino le condizioni necessarie e sufficienti affinché il prodotto


di due matrici simmetriche sia ancora una matrice simmetrica. Invece, se A è
una matrice simmetrica invertibile, la sua inversa è ancora una matrice simmetrica,
(cfr. Teor. 2.7, punto 4.). Le matrici diagonali sono ovviamente simmetriche e
una matrice triangolare superiore o inferiore è simmetrica se e solo se è diagonale.
Le matrici simmetriche saranno di importanza fondamentale sia nella teoria della
diagonalizzazione di una matrice (cfr. Cap. 7) sia nella teoria delle forme bilineari
simmetriche (cfr. Cap. 8).
46 Matrici e Determinanti

4. L’insieme delle matrici antisimmetriche di Rn,n definito da:

A(Rn,n ) = {A ∈ Rn,n | A = − tA}; (2.8)

scrivendo esplicitamente la definizione si ottiene che una matrice antisimmetrica è


del tipo:  
0 a12 . . . a1n
 −a12 0 . . . a2n 
A =  .. .. ;
 
.. . .
 . . . . 
−a1n −a2n . . . 0

in altri termini, una matrice A = (aij ) ∈ Rn,n è antisimmetrica se e solo se:

aij = −aji , i, j = 1, 2, . . . , n,

quindi, in particolare, aii = 0, i = 1, 2, . . . , n. Per esercizio si calcoli la somma


di due matrici antisimmetriche, il prodotto di una matrice antisimmetrica per un
numero reale, il prodotto di due matrici antisimmetriche, la trasposta di una matrice
antisimmetrica e si stabilisca se si ottiene ancora una matrice antisimmetrica.

5. L’insieme delle matrici ortogonali di Rn,n definito da:

O(n) = {A ∈ Rn,n | tA A = I}, (2.9)

con I matrice unità di ordine n. Usando il fatto che, in modo equivalente alla de-
finizione, A è ortogonale se A tA = I , si verifichi per esercizio che ogni matrice
ortogonale A è invertibile con inversa A−1 = tA. Si verifichi inoltre che la traspo-
sta e l’inversa di una matrice ortogonale sono matrici ortogonali e che il prodotto
di due matrici ortogonali è ortogonale. Si stabilisca se la somma di due matrici
ortogonali è una matrice ortogonale e se il prodotto di una matrice ortogonale per
un numero reale è una matrice ortogonale. Le matrici ortogonali saranno di impor-
tanza fondamentale nella trattazione degli spazi vettoriali euclidei (cfr. Cap. 5) e le
loro proprietà saranno dimostrate nel Teorema 5.7.

2.6 Le equazioni matriciali


Per equazione matriciale si intende un’equazione la cui incognita è una matrice. Se si
escludono gli esempi banali di equazioni lineari (ogni numero reale può essere considerato
come una matrice), come già studiato nel Paragrafo 2.2.1, risolvendo un generico sistema
lineare, si ha un esempio di equazione matriciale AX = B con A in Rm,n , X in Rn,1 ,
Capitolo 2 47

B in Rm,1 , dove X è la matrice incognita e A e B sono note. In questo paragrafo verrà


preso in esame lo studio di un’equazione del tipo:

AX = B (2.10)

con A ∈ Rm,n , X ∈ Rn,p , B ∈ Rm,p . L’incognita X = (xij ) dell’equazione matriciale


è, quindi, una matrice con n righe e p colonne. In totale, si devono determinare gli np
elementi xij di X.
Si osservi che, se si è in grado di risolvere l’equazione (2.10), si è anche in grado di
risolvere un’equazione matriciale del tipo:

YC =D (2.11)

con incognita Y, infatti operando con la trasposta su ambo i membri di (2.11) si ha:
t
C t Y = tD,

cioè ci si riconduce ad un’equazione matriciale del tipo (2.10), avendo cura di notare che
l’incognita della nuova equazione sarà t Y.
Scrivendo esplicitamente (2.10) si ottiene un sistema lineare di mp equazioni con np
incognite. Infatti posto:

   
a11 a12 . . . a1n x11 x12 . . . x1p
 a21 a22 . . . a2n   x21 x22 . . . x2p 
A=  ∈ Rm,n , X=  ∈ Rn,p ,
   
.. .. .. .. .. ..
 . . .   . . . 
am1 am2 . . . amn xn1 xn2 . . . xnp

 
b11 b12 . . . b1p
 b21 b22 . . . b2p 
B=  ∈ Rm,p ,
 
.. .. ..
 . . . 
bm1 bm2 . . . bmp

la prima riga del prodotto AX = B corrisponde al seguente sistema lineare di p righe e


np incognite xij : 

 a11 x11 + a12 x21 + . . . + a1n xn1 = b11
 a11 x12 + a12 x22 + . . . + a1n xn2 = b12

.. (2.12)


 .
 a x + a x + ... + a x = b .
11 1p 12 2p 1n np 1p
48 Matrici e Determinanti

In totale, da AX = B si hanno, quindi, mp equazioni in quanto A ha m righe. Mettendo


in evidenza le righe di X e di B nel modo seguente:
       
x11 x12 . . . x1p X1 b11 b12 . . . b1p B1
 x21 x22 . . . x2p   X2   b21 b22 . . . b2p   B2 
X =  .. = , B = ..  =  .. ,
       
.. ..   ..   .. ..
 . . .   .   . . .   . 
xn1 xn2 . . . xnp Xn bm1 bm2 . . . bmp Bm

il sistema lineare (2.12) si può scrivere come:

a11 X1 + a12 X2 + . . . + a1n Xn = B1 .

Ripetendo lo stesso calcolo per le altre righe di AX = B si ottiene che l’equazione


matriciale (2.10) equivale al sistema lineare di equazioni matriciali:


 a11 X1 + a12 X2 + . . . + a1n Xn = B1
 a21 X1 + a22 X2 + . . . + a2n Xn = B2

..


 .
 a X + a X + ... + a X = B ,
m1 1 m2 2 mn n m

con incognite le righe X1 , X2 , . . . , Xn della matrice X e termini noti le righe B1 , B2 , . . . ,


Bm della matrice B. Si noti, quindi, che il sistema lineare ottenuto è dello stesso tipo dei
sistemi lineari trattati nel Capitolo 1, con la differenza che le incognite sono le righe della
matrice, ossia sono elementi di Rp al posto di essere numeri reali.
Per il Teorema di Rouché–Capelli (cfr. Teor. 1.2), essendo tale sistema equivalente ad
un sistema lineare di mp equazioni in np incognite, esso ammette soluzioni se e solo
se il rango della matrice dei coefficienti A e il rango della matrice completa (A | B)
coincidono. Si procede, pertanto, alla riduzione per righe della matrice completa:
 
a11 a12 . . . a1n b11 b12 . . . b1p
 a21 a22 . . . a2n b21 b22 . . . b2p 
(A | B) =  .. .. .
 
.. .. .. ..
 . . . .
. . 
am1 am2 . . . amn bm1 bm2 . . . bmp

Si distinguono tre casi:

1. rank(A) 6= rank(A | B): non esistono soluzioni;


2. rank(A) = rank(A | B) = n numero delle incognite: esiste una sola soluzione;
3. rank(A) = rank(A | B) = k < n: esistono infinite soluzioni che dipendono da
n − k elementi di Rp .
Capitolo 2 49

Esempio 2.12 Per determinare le soluzioni dell’equazione matriciale AX = B , con:


   
2 3 1 1 2 2
A= 1 0 1 , B =  0 1 −1 ,
0 3 −1 1 0 4

si procede con la riduzione per righe della matrice completa (A | B), per esempio nel
modo seguente:
   
2 3 1 1 2 2 2 3 1 1 2 2
−→
(A | B) =  1 0 1 0 1 −1   0 −3 1 −1 0 −4 ,
R2 → 2R2 − R1
0 3 −1 1 0 4 0 3 −1 1 0 4

da cui si deduce che rank(A) = rank(A | B) = 2, si ottengono cosı̀ infinite soluzioni che
dipendono da un elemento qualsiasi (a, b, c) di R3 . Ponendo:
 
X1
X =  X2  ∈ R3,3
X3

la matrice (A | B) ridotta per righe dà luogo al sistema lineare ridotto:



2X1 + 3X2 + X3 = (1, 2, 2)
−3X2 + X3 = (−1, 0, −4)

le cui soluzioni sono:



 X1 = (1 − 3a, 1 − 3b, 3 − 3c)
X2 = (a, b, c)
X3 = (−1 + 3a, 3b, −4 + 3c), (a, b, c) ∈ R3

e, quindi:  
1 − 3a 1 − 3b 3 − 3c
X= a b c , (a, b, c) ∈ R3 .
−1 + 3a 3b −4 + 3c

Esempio 2.13 Per determinare le soluzioni dell’equazione matriciale XA = B, con:


 
1 0 −1  
1 −1 0
A=  1 1 0 , B=
 ,
0 1 1
1 0 0
si osserva che da XA = B , calcolando la trasposta delle matrici del primo e del secondo
membro, si ha tA tX = tB , pertanto ci si riconduce ad un’equazione matriciale dello
stesso tipo di quella studiata nell’esempio precedente. Ponendo:
50 Matrici e Determinanti

 
Y1
t
X = Y =  Y2  ∈ R3,2
Y3
segue che l’equazione tAY = tB è equivalente al sistema lineare:

 Y1 + Y2 + Y3 = (1, 0)
Y2 = (−1, 1)
−Y1 = (0, 1),

che ha come unica soluzione:

Y1 = (0, −1), Y2 = (−1, 1), Y3 = (2, 0)

e, quindi:  
0 −1 2
X= .
−1 1 0

2.6.1 Calcolo della matrice inversa, primo metodo


Come immediata conseguenza del paragrafo precedente si procede al calcolo dell’even-
tuale matrice inversa di una matrice quadrata A = (aij ) ∈ Rn,n risolvendo l’equazione
matriciale:
AX = I.
Si deve, quindi, ridurre per righe la matrice completa:
 
a11 a12 . . . a1n 1 0 ... 0
 a21 a22 . . . a2n 0 1 ... 0 
(A | I) =  .. .
 
.. . . .. .. .. . . ..
 . . . . . . . . 
an1 an2 . . . ann 0 0 ... 1

È evidente che rank(A | I) = n perché la matrice (A | I) è ridotta per righe in quanto


I è ridotta per righe e rank(I) = n, quindi si ottiene l’importante teorema di seguito
enunciato.

Teorema 2.8 Una matrice quadrata A ∈ Rn,n è invertibile se e solo se rank(A) = n.

Dimostrazione Se esiste l’inversa A−1 di A allora l’equazione matriciale AX = I ha


un’unica soluzione e, quindi, dal Teorema di Rouché–Capelli segue rank(A) = n.
Capitolo 2 51

Il viceversa non può essere dimostrato a questo punto del corso, si rimanda al Paragrafo
4.3 per la dimostrazione. Infatti se rank(A) = n allora esiste una sola matrice X ∈ Rn,n
tale che AX = I (per il Teorema di Rouché–Capelli, cfr. Teor. 1.2), ma per dimostrare
che anche XA = I e dedurre quindi che X = A−1 si deve risolvere l’equazione ma-
triciale tA tX = I . Pertanto è necessario dimostrare che anche tA ha lo stesso rango di
A, e ciò sarà oggetto del Teorema 4.19. D’altro canto, se esistono due matrici X e Y,
entrambe appartenti a Rn,n , tali che AX = I e Y A = I allora segue X = Y infatti:

Y = Y I = Y (AX) = (Y A)X = IX = X.

Da rank(A) = n si ha che esiste una sola matrice X tale che AX = I . Da rank(tA) = n


segue che esiste una sola matrice Z ∈ Rn,n tale che tA Z = I. Considerando la trasposta
delle matrici a primo e a secondo membro dell’ultima uguaglianza si ha tZA = I, quindi,
dall’osservazione precedente si ottiene tZ = X = A−1 .

Segue un esempio di calcolo della matrice inversa di una matrice invertibile A mediante
la risoluzione dell’equazione matriciale AX = I. Un secondo metodo sarà spiegato nel
Paragrafo 2.8.2.

Esercizio 2.2 Supponendo che esista, determinare l’inversa della matrice:

 
0 0 2 0
 1 0 0 1 
A=
 0 −1
.
3 0 
2 1 5 −3

Soluzione Si procede alla riduzione per righe della matrice (A | I), il calcolo del rango
di A è contenuto in questo procedimento:

   
0 0 2 0 1 0 0 0 1 0 0 1 0 1 0 0
   
   
 1 0 0 1 0 1 0 0  −→  0 −1 3 0 0 0 1 0 
   
  R1 ↔ R3  
   
 R2 ↔ R1
 0 −1 3 0 0 0 1 0   0 0 2 0 1 0 0 0 
  
   
2 1 5 −3 0 0 0 1 2 1 5 −3 0 0 0 1
52 Matrici e Determinanti

 
1 0 0 1 0 1 0 0
 
−→  
 0 1 −3 0 0 0 −1 0 
R2 → −R2 



R3 → (1/2)R3 
 0 1 
0 1 0 0 0 0 
R4 → R4 − 2R1 
 2 

0 1 5 −5 0 −2 0 1

 
1 0 0 1 0 1 0 0
 
 
 0 1 −3 0 0 0 −1 0 
−→ 



R4 → R4 − R2 
 0 1 
0 1 0 0 0 0 

 2 

0 0 8 −5 0 −2 1 1

 
1 0 0 1 0 1 0 0
 
 
 0 1 −3 0 0 0 −1 0 
−→ 


.
R4 → R4 − 8R3 
 0 1 
0 1 0 0 0 0 

 2 

0 0 0 −5 −4 −2 1 1

A questo punto dell’esercizio si deduce che rank(A) = 4, pertanto la matrice A è inver-


tibile. Per calcolare direttamente l’inversa conviene procedere riducendo ulteriormente
l’ultima matrice ottenuta, come descritto nell’Esempio 1.9 del Capitolo 1. Dall’ultimo
passaggio segue:
 
1 0 0 1 0 1 0 0
 
 0
 1 −3 0 0 0 −10 

−→
 
1
 
R4 → (−1/5)R4  0 0 1 0 0 0 0 
 
 2 
 
 4 2 1 1 
0 0 0 1 − −
5 5 5 5
Capitolo 2 53

4 3 1 1
 
 1 0 0 0 −
 5 5 5 5 

 3 
−→  0 1 0 0 0 −1 0 
R1 → R1 − R4

 2 
.
 1 
R2 → R2 + 3R3  0 0 1 0 0 0 0 

 2 

 4 2 1 1 
0 0 0 1 − −
5 5 5 5

Si legge cosı̀ nell’ultimo passaggio, a destra, l’espressione di A−1 , infatti le operazioni di


riduzione che iniziano dalla matrice completa (A | I), essendo rank(A) = rank(A | I) = n,
non possono far altro che portare a (I | A−1 ). In altri termini, moltiplicando a sinistra per
A−1 l’equazione matriciale AX = I si ottiene IX = A−1 .

Esercizio 2.3 Data la matrice:


 
1 −3 1 2
 h 0 0 0 
A=
 1 −1
, h ∈ R,
0 0 
0 0 0 h

stabilire per quali valori di h esiste la sua inversa. Determinare esplicitamente A−1
quando possibile.

Soluzione Si procede, come nell’esercizio precedente, alla riduzione per righe della
matrice completa (A | I).
 
1 −3 1 2 1 0 0 0
 h −→
 0 0 0 0 1 0 0 
 R2 → R2 − hR1
 1 −1 0 0 0 0 1 0 
R3 → R3 − R1
0 0 0 h 0 0 0 1
 
1 −3 1 2 1 0 0 0
 0 3h −h −2h −h 1 0 0  −→
 
 0 2 −1 −2 −1 0 1 0  R2 ↔ R3

0 0 0 h 0 0 0 1
 
1 −3 1 2 1 0 0 0
 0 2 −1 −2 −1 0 1 0  −→
 
 0 3h −h −2h −h 1 0 0  R3 → 2R3 − 3hR2

0 0 0 h 0 0 0 1
54 Matrici e Determinanti

 
1 −3 1 2 1 0 0 0
 0
 2 −1 −2 −1 0 1 0 
,
 0 0 h 2h h 2 −3h 0 
0 0 0 h 0 0 0 1

a questo punto si deduce che rank(A) = 4 se e solo se h 6= 0, quindi solo in questo caso
esiste A−1 . Si assume perciò h 6= 0 e si procede con la riduzione per ottenere la matrice
inversa:
 
1 −3 1 2 1 0 0 0
 
−→ 
 1 1 1


R2 → (1/2)R2  0 1 − 2 −1 − 2
 0
2
0 

 
R3 → (1/h)R3  2
 
 0 0 1 2 1 −3 0 

 h 
R4 → (1/h)R4  
 1 
0 0 0 1 0 0 0
h

2
 
 1 −3 1 0 1 0 0 − 
h 

−→ 
1 1 1 1 

0 1 − 0 − 0

R3 → R3 − 2R4  

 2 2 2 h 
R2 → R2 + R4 
2 2 

 0 0 1 0 1 −3 − 
R1 → R1 − 2R4  h h 
 
 1 
0 0 0 1 0 0 0
h

2
 
 1 −3 0 0 0 −
h
3 0 
 
1
 
 0 1 0 0 0 −1 0 
 
−→  h 
R2 → R2 + (1/2)R3  ,
2 2 
 
R1 → R1 − R3  0 0

1 0 1 −3 − 
 h h 
 
 1 
0 0 0 1 0 0 0
h
Capitolo 2 55

1
 
 1 0 0 0 0
h
0 0 
 
1
 
 0 1 0 0 0 −1 0 
 
−→ 
 h 
,
R1 → R1 + 3R2 
2 2 

 0 0 1 0 1 −3 − 

 h h 
 
 1 
0 0 0 1 0 0 0
h

A−1 si legge a destra nell’ultimo passaggio di riduzione.

Il teorema che segue è un corollario del Teorema 2.4, lo stesso risultato si otterrà, con
metodi diversi, nel Capitolo 7.

Teorema 2.9 1. Se A ∈ Rm,n e Q ∈ Rn,n è una matrice invertibile, allora:


rank(AQ) = rank(A).

2. Se A ∈ Rm,n e P ∈ Rm,m è una matrice invertibile, allora:


rank(P A) = rank(A).

3. Se A una matrice quadrata di ordine n e P una matrice invertibile di ordine n,


allora:
rank(A) = rank(P −1AP ).

Dimostrazione È sufficiente dimostrare 1., lo stesso metodo si può applicare a 2. e da


1. e 2. segue immediatamente 3. Il primo punto segue dal Teorema 2.4 e da:
rank(AQ) ≤ rank(A) = rank(A(QQ−1 )) = rank((AQ)Q−1 ) ≤ rank(AQ),
da cui la tesi.

2.7 La traccia di una matrice quadrata


Definizione 2.8 Sia A una matrice quadrata, di ordine n, ad elementi reali. Si definisce
traccia di A, e si indica con tr(A) la somma degli elementi della sua diagonale principale.
Se A = (aij ) allora:
n
X
tr(A) = a11 + a22 + . . . + ann = aii .
i=1
56 Matrici e Determinanti

Le proprietà della traccia di una matrice quadrata sono elencate nel seguente teorema.

Teorema 2.10 La traccia di una matrice quadrata gode delle seguenti proprietà:

1. tr(A + B) = tr(A) + tr(B),

2. tr(λA) = λ tr(A),

3. tr(A B) = tr(B A),

4. tr( tA) = tr(A),

per ogni A, B ∈ Rn,n , per ogni λ ∈ R.

Dimostrazione È quasi un esercizio ed è riportata nel Paragrafo 2.9.

Come immediata conseguenza del punto 3. del teorema precedente, si ottiene:

tr(P −1A P ) = tr(A), (2.13)

per ogni A ∈ Rn,n e per ogni matrice invertibile P di Rn,n , proprietà che sarà molto
importante nel Capitolo 7.

Osservazione 2.9 Ovviamente la traccia della matrice quadrata nulla è uguale a zero,
cosı̀ come è uguale a zero la traccia di una matrice antisimmetrica.

2.8 Il determinante
Scopo di questo paragrafo è quello di associare ad ogni matrice quadrata un particolare
numero reale detto determinante della matrice in modo da dimostrare il seguente teorema.

Teorema 2.11 Una matrice quadrata A è invertibile se e solo se il suo determinante non
è uguale a zero.

Si introdurrà la definizione di determinante in modo “sperimentale” senza troppo rigore


matematico; per una discussione precisa e per la dimostrazione di tutte le proprietà si
rimanda al Paragrafo 8.8.

Il determinante di una matrice quadrata è una funzione:

det : Rn,n −→ R, A 7−→ det(A)

che verifica queste prime proprietà.


Capitolo 2 57

1. Se a è un numero reale, quindi identificabile con la matrice quadrata A = (a) di


ordine 1, allora det(A) = a.
 
a11 a12
2. Se A = , allora det(A) = a11 a22 − a12 a21 .
a21 a22

Il determinante di una matrice quadrata è anche spesso indicato con due tratti verticali che
sostituiscono le parentesi tonde della matrice. Nel caso della matrice A di ordine 2 si ha:

a11 a12
a21 a22 = a11 a22 − a12 a21 .

Osservando con attenzione lo sviluppo del determinante nel caso della matrice quadrata
di ordine 2, si nota che compaiono due addendi, ciascuno dei quali è il prodotto di due
fattori il cui primo indice corrisponde alla sequenza (1, 2) e il secondo indice corrisponde
alle due permutazioni di (1, 2): (1, 2) e (2, 1). La prima permutazione (pari) impone
il segno positivo all’addendo a11 a22 , la seconda permutazione (dispari) impone il segno
negativo all’addendo a12 a21 .

Si può cosı̀ indovinare la regola per calcolare il determinante di una matrice quadrata
qualsiasi. A questo scopo, si controlli ancora lo sviluppo del determinante nel caso delle
matrici di ordine 3. L’esempio che segue riassume, nel caso particolare dell’ordine 3,
la teoria dei determinanti delle matrici di ordine n che verrà successivamente esposta. Si
consiglia di studiarlo con grande attenzione e farne riferimento per dimostrare le proprietà
generali dei determinanti che verranno man mano elencate.

Esempio 2.14 È noto dal calcolo combinatorio che le permutazioni dei numeri 1, 2, 3
sono 3! = 6, tre di esse sono pari e sono dette permutazioni circolari, ossia: (1, 2, 3),
(3, 1, 2), (2, 3, 1) e tre sono dispari: (1, 3, 2), (3, 2, 1), (2, 1, 3). Più precisamente, se a
partire dalla terna (1, 2, 3) si perviene alla terna (2, 1, 3) si è effettuato uno scambio che
comporta un segno negativo associato alla permutazione (2, 1, 3), effettuati due scambi si
ha segno positivo e cosı̀ via. Per meglio visualizzare le permutazioni e contare il numero
degli scambi intermedi in modo da ottenere il segno della permutazione finale è utile la
classica notazione del calcolo combinatorio:

1 2 3
↓ ↓ ↓
σ(1) = 2 σ(2) = 1 σ(3) = 3,

dove σ indica una permutazione di 1, 2, 3 e non è altro che una funzione biiettiva dall’in-
sieme {1, 2, 3} in sé.
58 Matrici e Determinanti

Parafrasando lo sviluppo del determinante di una matrice quadrata di ordine 2, “si indo-
vina” lo sviluppo del determinante di una matrice quadrata di ordine 3, ponendo:

a11 a12 a13

a21 a22 a23 = a11 a22 a33 + a13 a21 a32 + a12 a23 a31

a31 a32 a33
−a11 a23 a32 − a13 a22 a31 − a12 a21 a33
X
= (σ)a1σ(1) a2σ(2) a3σ(3) ,
σ

dove σ indica una qualsiasi permutazione dei numeri 1, 2, 3 e (σ) è il suo segno. Si
osserva che, per costruzione, ogni addendo a1σ(1) a2σ(2) a3σ(3) contiene un elemento ap-
partenente a ciascuna riga e a ciascuna colonna della matrice A. In altri termini in ogni
addendo non esistono due elementi appartenenti ad una stessa riga o ad una stessa colonna
di A, perché σ è una biiezione.

Si può cosı̀ enunciare la definizione di determinante di una matrice quadrata di ordine n.

Definizione 2.9 Il determinante di una matrice quadrata A = (aij ) di ordine n è dato


da: X
det(A) = (σ)a1σ(1) a2σ(2) . . . anσ(n) , (2.14)
σ

dove σ indica una qualsiasi permutazione dei numeri 1, 2, . . . , n e (σ) è il suo segno.

Osservazione 2.10 Come già osservato nell’Esempio 2.14, in ogni addendo della som-
ma (2.14) non esistono due elementi appartenenti o alla stessa riga o alla stessa colonna
della matrice A, inoltre ogni addendo di (2.14) è il prodotto di n elementi della matrice
quadrata A appartenenti ad ogni riga e ad ogni colonna di A.

Dalla Definizione 2.9 si deducono le seguenti proprietà.

Teorema 2.12 1. Sia A una matrice quadrata di ordine n avente una riga (oppure
una colonna) formata da tutti 0, allora det(A) = 0.

2. Per ogni matrice quadrata A, det(A) = det(tA).

3. Se A = (aij ) ∈ Rn,n è una matrice triangolare superiore allora:

det(A) = a11 a22 . . . ann ,

la stessa proprietà vale nel caso di una matrice triangolare inferiore.


Capitolo 2 59

Dimostrazione 1. È ovvia conseguenza della Definizione 2.9 e anche dell’Osserva-


zione 2.10.

2. Si consideri il caso del determinante di una matrice quadrata A di ordine 2, il caso


generale è una generalizzazione di questo ragionamento. Come già osservato:

det(A) = a11 a22 − a12 a21 ,

mentre:

a a
det( A) = 11 21
t

= a11 a22 − a21 a12 = a11 a22 − a12 a21 = det(A);
a12 a22

infatti il determinante della matrice trasposta si ottiene semplicemente applicando


la proprietà commutativa del prodotto ad ogni addendo della somma precedente.

3. Si dimostra per semplicità la proprietà solo nel caso di A ∈ R4,4 , lasciando al


Lettore per esercizio la dimostrazione nel caso generale. Sia:
 
a11 a12 a13 a14
 0 a22 a23 a24 
A=  0
,
0 a33 a34 
0 0 0 a44

dalla definizione di determinante (2.14) si ha:


X
det(A) = (σ)a1σ(1) a2σ(2) a3σ(3) a4σ(4) .
σ

Se a44 = 0 l’ultima riga è formata da tutti zeri e pertanto det(A) = 0, da cui la tesi.
Se a44 6= 0, l’unico elemento non nullo dell’ultima riga è a44 , quindi la formula
precedente si riduce a:
X
det(A) = (σ)a1σ(1) a2σ(2) a3σ(3) a44 , (2.15)
σ

con σ permutazione dei numeri 1, 2, 3. Di nuovo, l’unico elemento non nullo di


tale somma, appartenente alla terza riga, è a33 , quindi (2.15) si riduce a:
X
det(A) = (σ)a1σ(1) a2σ(2) a33 a44
σ

con σ permutazione dei numeri 1, 2. Procedendo allo stesso modo si perviene alla
tesi.
60 Matrici e Determinanti

È di importanza fondamentale il teorema che segue.

Teorema 2.13 Sia A una matrice quadrata di ordine n ridotta per righe, allora:
rank(A) = n ⇐⇒ det(A) 6= 0
e, in modo equivalente:
rank(A) < n ⇐⇒ det(A) = 0.

Dimostrazione La dimostrazione è ovvia se la matrice ridotta per righe è triangolare


superiore. In questo caso il determinante è dato dal prodotto degli elementi della diagona-
le principale, come osservato nel Teorema 2.12. Rimane da dimostrare che ogni matrice
ridotta per righe può essere trasformata in una matrice triangolare superiore mediante
l’applicazione delle tre operazioni di riduzione sulle righe (senza variarne il rango). An-
che questo fatto è ovvio, ma per maggiore chiarezza sul tipo di procedimento da seguire
si rimanda all’esercizio seguente che illustra, in un caso particolare, la procedura.

Esercizio 2.4 Si riconduca a forma triangolare superiore la matrice:


 
1 2 3 4
 1 2 0 3 
A=  5 0 0 2 

1 0 0 0
ridotta per righe e il cui rango è 4.

Soluzione Si procede con l’applicazione delle tre operazioni di riduzione alla matrice
A nel modo seguente:
   
1 2 3 4 −→ 1 2 3 4
 1 2 0 3  R2 → R2 − R1  0 0 −3 −1 
   
 5 0 0 2  R3 → R3 − 5R1  0 −19 −15 −18 
1 0 0 0 R4 → R4 − R1 0 −2 −3 −4

−→    
1 2 3 4 1 2 3 4
R2 → −R2  0 19 15 18  −→  0 19 15 18 
R3 → −R3  
 0 0 3 1  R4 → 19R4 − 2R2

 0 0 3 1 

R4 → −R4
0 2 3 4 0 0 27 40
R2 ↔ R3
 
1 2 3 4
−→  0 19 15 18 
 ,
R4 → 3R4 − 27R3  0 0 3 1 
0 0 0 93
Capitolo 2 61

ottenendo cosı̀ una matrice triangolare superiore che ha, ovviamente, ancora rango 4.

Osservazione 2.11 Dal punto 2. del Teorema 2.12 segue che ogni proprietà relativa al
calcolo del determinante dimostrata per le righe di una matrice quadrata è anche valida
per le colonne.

Il teorema che segue permette di estendere il risultato precedente ad una matrice quadrata
qualsiasi.

Teorema 2.14 1. Se si moltiplicano tutti gli elementi di una riga (o colonna) di una
matrice quadrata A per un numero reale λ, allora il determinante di A viene
moltiplicato per λ.

2. Se si scambiano tra di loro due righe (o due colonne) di una matrice quadrata A,
allora il determinante di A cambia di segno.

3. Una matrice quadrata con due righe (o due colonne) uguali ha determinante nullo.

4. Una matrice quadrata con due righe (o due colonne) proporzionali ha determinante
nullo.

5. Se alla riga Ri di una matrice quadrata A si sostituisce la particolare combinazio-


ne lineare Ri +λRj (dove Rj indica una riga parallela a Ri , i 6= j ) il determinante
di A non cambia, analoga proprietà vale per le colonne.

Dimostrazione 1. È ovvio dalla definizione di determinante.

2. È conseguenza della definizione di determinante e del fatto che lo scambio di due


righe comporta il cambiamento di segno di ciascuna permutazione. Per esempio,
nel caso della matrice quadrata di ordine 2 si ha:

a11 a12
a21 a22 = a11 a22 − a12 a21 ,

invece:
a21 a22
= a21 a12 − a22 a11 = −a11 a22 + a12 a21 .
a11 a12

3. Segue dalla proprietà precedente, infatti scambiando due righe (colonne) uguali
di una matrice quadrata A si ottiene la stessa matrice, se prima dello scambio
det(A) = a, dopo lo scambio det(A) = −a (per la proprietà precedente), ma
poiché la matrice non cambia allora a = −a, da cui la tesi.
62 Matrici e Determinanti

4. Segue da 1. e da 3.

5. Si calcoli il determinante di una matrice quadrata di ordine n mettendo in evidenza


le sue righe e l’operazione richiesta Ri → Ri + λRj , i 6= j :

R1 R1 R1
.. .. ..

. . .


Ri + λRj Ri Rj


..
= ..
+ λ ..
.

. . .

R j

Rj


Rj

.. .. ..

.
.


.

Rn Rn Rn

L’uguaglianza precedente è una evidente conseguenza della definizione di determi-


nante, quindi la tesi segue dalla terza proprietà.

Come ovvia conseguenza dei Teoremi 2.13 e 2.14 si ha il teorema che segue.

Teorema 2.15 Sia A una matrice quadrata di ordine n allora:

rank(A) = n ⇐⇒ det(A) 6= 0

e, in modo equivalente:

rank(A) < n ⇐⇒ det(A) = 0.

Esercizio 2.5 Calcolare il determinante della seguente matrice, riducendola a forma trian-
golare superiore:
 
1 −1 2 1
 3 1 1 2 
A= .
 2 2 −2 1 
1 0 1 −1

Soluzione Per esempio si può procedere come segue:


Capitolo 2 63


1 −1 2 1 −1 1 2 1
−→
3 1 1 2 −→ 1 3 1 2
R2 → R2 + R1


2 2 −2 1 C1 ↔ C2
2 2 −2 1
R3 → R3 + 2R1
1 0 1 −1 0 1 1 −1


−1
−1 1 2 1
1 2 1
−→ −→


0
0 4 3 3
4 3 3
R3 → R3 − R2
0 0 −1 0 R3 → −R3

0 4 2 3
R4 → R4 − (1/4)R2
1 7 R4 → 4R4

0 1 1 −1 0 0 −


4 4

−1 1 2 1 −1 1 2 1

1 0 4 3 3 −→ 1 0 4 3 3

R4 → R4 − R3 − = −7.
4 0 0 1 0 4 0 0 1 0

0 0 1 −7 0 0 0 −7

Il teorema che segue stabilisce importanti proprietà del determinante in relazione al pro-
dotto di una matrice per uno scalare e al prodotto di matrici.

Teorema 2.16 1. det(λA) = λn det(A), A ∈ Rn,n , λ ∈ R;

2. Teorema di Binet: det(AB) = det(A) det(B), A, B ∈ Rn,n ;

3. Se A è una matrice invertibile, allora det(A−1 ) = det(A)−1 .

Dimostrazione 1. È ovvia dalla Definizione 2.4 di prodotto di un numero reale per


una matrice e dalla Definizione 2.9 di determinante.

2. Si tratta di una proprietà sorprendente e di difficile dimostrazione. È vera nel caso


di matrici triangolari superiori, ricordando che il prodotto di due matrici triangolari
superiori è ancora una matrice dello stesso tipo e che il determinante di una matrice
triangolare superiore è il prodotto degli elementi della diagonale principale (analo-
gamente è anche vero nel caso delle matrici triangolari inferiori). Nel Capitolo 7 si
dimostrerà questa proprietà nel caso di matrici quadrate con particolari proprietà (le
matrici diagonalizzabili), ma solo nel Paragrafo 8.8 si arriverà ad una dimostrazione
nel caso generale.

3. È una conseguenza del Teorema di Binet applicato a AA−1 = I con I matrice


unità. Si ha det(A) det(A−1 ) = det(I) = 1 da cui la tesi.

Osservazione 2.12 1. Si deduce, dalla proprietà 3. del teorema precedente, che:


64 Matrici e Determinanti

se A ∈ Rn,n è invertibile, allora det(A) 6= 0;

nel paragrafo che segue si dimostrerà anche il viceversa.


2. In generale, se A, B sono matrici di Rn,n allora det(A + B) 6= det(A) + det(B).
Infatti si considerino le matrici:
   
1 2 1 −2
A= , B=
3 4 4 5
per le quali det(A) = −2, det(B) = 13, ma:
 
2 0
A+B =
7 9
e det(A + B) = 18.
Esercizio 2.6 Dimostrare che se A è una matrice antisimmetrica di ordine dispari, allora
det(A) = 0.

2.8.1 I Teoremi di Laplace


Un’altra definizione di rango di una matrice
Esempio 2.15 Si consideri lo sviluppo del determinante di una matrice di ordine 3 de-
scritto nell’Esempio 2.14 e lo si trasformi applicando le proprietà commutativa e distribu-
tiva del prodotto rispetto alla somma di numeri reali nel modo seguente:


a11 a12 a13

a21 a22 a23 = a11 a22 a33 + a13 a21 a32 + a12 a23 a31 − a11 a23 a32

a31 a32 a33 −a13 a22 a31 − a12 a21 a33

= a11 (a22 a33 − a23 a32 ) − a12 (a21 a33 − a23 a31 )
+a13 (a21 a32 − a22 a31 )

a a
= a11 22 23 − a12 a21 a23 + a13 a21 a22


a32 a33 a31 a33 a31 a32

a a
= a31 12 13 − a32 a11 a13 + a33 a11 a12


a22 a23 a21 a23 a21 a22

a a
= −a12 21 23 + a22 a11 a13 − a32 a11 a13

.
a31 a33 a31 a33 a21 a23
Capitolo 2 65

L’espressione precedente permette di indovinare una regola di calcolo del determinante


per le matrici di ordine qualsiasi. Per fare ciò è necessario introdurre alcune definizioni.

Definizione 2.10 Sia A = (aij ) ∈ Rn,n ; si definisce minore dell’elemento aij il determi-
nante Mij della matrice di ordine n − 1 che si ottiene da A togliendo l’i-esima riga e la
j -esima colonna.

La definizione precedente si estende in modo naturale alla seguente.

Definizione 2.11 Un minore di ordine k, (k < m, k < n, k 6= 0) di una matrice A


di Rm,n è il determinante di una qualsiasi sottomatrice quadrata B di ordine k che si
ottiene da A togliendo m − k righe e n − k colonne.

Esempio 2.16 Data la matrice:


 
1 2 3 4
 
 5 6 7 8 
A= ,
 
 9 10 11 12 
 
1 −2 3 −4

il minore M12 è:


5 7 8


M12 = 9 11 12 = 64.


1 3 −4
Un minore di ordine 2 della matrice A è:

1 2
= −4,
5 6

infatti è il determinante della matrice quadrata di ordine 2 ottenuta togliendo la terza e la


quarta riga e la terza e la quarta colonna della matrice A. A partire dalla matrice A quanti
minori di ordine 2 si trovano? È evidente invece che i minori di ordine 1 di A sono 16 e
sono gli elementi di A.

Definizione 2.12 Sia A = (aij ) ∈ Rn,n ; si definisce cofattore o complemento algebrico


dell’elemento aij il numero Aij definito da:

Aij = (−1)i+j Mij .


66 Matrici e Determinanti

Esempio 2.17 Nell’Esempio 2.16 il cofattore dell’elemento a12 è A12 = −M12 = −64.
L’Esempio 2.15 suggerisce il seguente importante teorema per il calcolo del determinante
di una matrice quadrata di ordine qualsiasi.
Teorema 2.17 – Primo Teorema di Laplace – Il determinante di una matrice quadrata
A = (aij ) ∈ Rn,n è dato da:
n
X n
X
det(A) = aik Aik = ahj Ahj , (2.16)
k=1 h=1

per ogni i = 1, 2, . . . , n, j = 1, 2, . . . , n. In altri termini, il determinante della matri-


ce quadrata A si ottiene moltiplicando gli elementi di una riga fissata (nella formula
precedente è la i-esima) per i rispettivi cofattori, inoltre il valore ottenuto non dipende
dalla riga scelta. L’ultimo membro di (2.16) afferma che tale proprietà vale anche per la
j -esima colonna.
Dimostrazione È un calcolo che segue da (2.14), allo stesso modo con cui è stato
condotto nell’Esempio 2.15.
Esempio 2.18 Per calcolare il determinante della matrice, oggetto dell’Esercizio 2.5, si
può usare il Primo Teorema di Laplace 2.17. La presenza del numero 0 al posto (4, 2) di
tale matrice suggerisce di sviluppare il determinante rispetto alla seconda colonna oppure
rispetto alla quarta riga. Si riportano di seguito esplicitamente entrambi i calcoli:

3 1 2 1 2 1 1 2 1

det(A) = 2 −2 1 + 2 −2 1 − 2 3 1 2
1 1 −1 1 1 −1 1 1 −1
 
−2 1 + 2 2 −2
2 1
= 3 −
1 −1 1 −1 1 1
 
−2 1 2 −2
− 2 2 1

+ +
1 −1 1 −1 1 1
 
1 2 − 2 3 2
3 1
−2 +
1 −1 1 −1 1 1

−1 2 1 1 −1 1 1 −1 2

= − 1 1 2 − 3
1 2 − 3
1 1 ,

2 −2 1 2 2 1 2 2 −2
si lascia la conclusione al Lettore, osservando però che la determinazione dello stesso
determinante condotta nell’Esercizio 2.5 è stata molto più agevole.
Capitolo 2 67

Teorema 2.18 – Secondo Teorema di Laplace – In una matrice quadrata A = (aij ) di


Rn,n la somma dei prodotti degli elementi di una riga (o colonna) per i cofattori di una
riga (o una colonna) parallela è zero, in formule:
n
X n
X
aik Ajk = ahi Ahj = 0, i 6= j. (2.17)
k=1 h=1

Dimostrazione È evidente conseguenza della seconda proprietà del Teorema 2.14, in-
fatti (2.17) si può interpretare come lo sviluppo del determinante di un matrice in cui, nel
primo caso, la riga j -esima coincide con la riga i-esima e nel secondo caso, la colonna
j -esima coincide con la colonna i-esima.

Utilizzando la nozione di determinante e di minore si può enunciare una seconda defini-


zione di rango di una matrice A ∈ Rm,n , equivalente a quella già introdotta (cfr. Def.
1.10). La dimostrazione dell’equivalenza tra le due definizioni di rango è rimandata al
Paragrafo 4.5.

Definizione 2.13 Il rango di una matrice A ∈ Rm,n è pari al massimo ordine di un


minore non nullo di A.

Esempio 2.19 Si consideri la matrice:


 
1 2 1 2
A= 2 4 2 4 
0 1 0 1

che ha evidentemente rango 2 se si procede al calcolo del suo rango riducendola per righe.
Considerando, invece, la Definizione 2.13 di rango si vede subito che ogni minore di A
di ordine 3 è uguale a zero, infatti ogni matrice quadrata di ordine 3 estratta da A ha due
righe proporzionali. Invece:
2 4
0 1 =2

da cui segue che rank(A) = 2 in quanto esiste un minore di ordine 2 di A non nullo.

2.8.2 Calcolo della matrice inversa, secondo metodo


In questo paragrafo si introdurrà un altro metodo di calcolo della matrice inversa A−1 di
una matrice data A, facendo uso della nozione di determinante. Per questo scopo si inizia
con la definizione di una matrice particolare associata ad una qualsiasi matrice quadrata.
68 Matrici e Determinanti

Definizione 2.14 Data A ∈ Rn,n , si consideri la matrice B = (Aij ) ∈ Rn,n avente


ordinatamente come elementi i cofattori di A, la trasposta di tale matrice prende il nome
di aggiunta di A e si indica con adj(A).

Esempio 2.20 Data:


 
1 2 3
A =  −1 2 5 
0 1 2
la sua aggiunta è:
 
−1 −1 4
adj(A) =  2 2 −8 .
−1 −1 4

Teorema 2.19 Sia A una matrice quadrata di ordine n, se det(A) 6= 0 allora esiste
l’inversa di A e:
1
A−1 = adj(A).
det(A)

Dimostrazione Sia:
1
B = (bij ) = adj(A),
det(A)
il teorema è dimostrato se AB = (cij ) = I , in altri termini se cij = δij , dove δij è il
simbolo di Kronecker, ossia δii = 1 e δij = 0, i 6= j . Si calcola:
n n
X 1 X 1
cii = aik bki = aik Aik = det(A) = 1;
k=1
det(A) k=1 det(A)

la precedente uguaglianza segue dal Primo Teorema di Laplace 2.17. Se i 6= j si ha


invece:
n n
X 1 X
cij = aik bkj = aik Ajk = 0,
k=1
det(A) k=1

per il Secondo Teorema di Laplace 2.18.

Osservazione 2.13 Il teorema precedente insieme con il Teorema 2.16 e il Teorema 2.13
permettono di concludere che, nel caso di una matrice quadrata A ∈ Rn,n :

∃A−1 ⇐⇒ det(A) 6= 0 ⇐⇒ rank(A) = n.


Capitolo 2 69

Esempio 2.21 È agevole applicare il metodo di calcolo della matrice inversa appena
introdotto nel caso di una matrice quadrata di ordine 2, infatti se:
 
a11 a12
A=
a21 a22

e det(A) 6= 0 allora:  
−1 1 a22 −a12
A = .
det(A) −a21 a11

Esempio 2.22 Considerata la matrice A dell’Esercizio 2.2, se ne determini l’inversa


usando il procedimento descritto. Si tratta di calcolare i cofattori di tutti gli elementi
della matrice, ossia 16 determinanti di matrici quadrate di ordine 3 e, quindi, la matrice
aggiunta. Si ottiene:
 
−8 6 2 2
1 1  15 0 −10 0 
A−1 = adj(A) = .
det(A) 10  5 0 0 0 
8 4 −2 −2

Osservazione 2.14 Dalla definizione di aggiunta di una matrice quadrata A di ordine n,


segue:
A adj(A) = det(A)I, (2.18)
dove I indica la matrice unità di Rn,n . Si osservi che la formula (2.18) vale per ogni
matrice A, anche se non è invertibile.

2.8.3 Il Teorema di Cramer


È conseguenza del paragrafo precedente un metodo di calcolo che permette di risolvere
i sistemi lineari compatibili che hanno il numero delle equazioni pari al numero delle
incognite, cioè del tipo:


 a11 x1 + a12 x2 + . . . . . . + a1n xn = b1
 a21 x1 + a22 x2 + . . . . . . + a2n xn = b2

.. (2.19)


 .
 a x + a x + ...... + a x = b .
n1 1 n2 2 nn n n

La matrice dei coefficienti A = (aij ) ∈ Rn,n è quadrata. Se det(A) 6= 0 segue dal


Teorema di Rouché–Capelli 1.2 che il sistema lineare (2.19) è compatibile. In notazione
matriciale (cfr. Par. 2.2.1) il sistema lineare (2.19) equivale a:
AX = B, (2.20)
70 Matrici e Determinanti

dove X ∈ Rn,1 è la matrice delle incognite e B ∈ Rn,1 è la matrice colonna dei termini
noti. Poiché det(A) 6= 0, A è invertibile e quindi è possibile moltiplicare a sinistra ambo
i membri di (2.20) per A−1 , ottenendo cosı̀:

X = A−1 B.

Dal Teorema 2.19, sostituendo l’espressione di A−1 , si ha:


    
x1 A11 A21 . . . An1 b1
 x2  1  A12 A22 . . . An2 b2
  
X =  ..  =
   
 . .. ... .. ..
 .  det(A)  ..
 
. .  . 
xn A1n A2n . . . Ann bn

da cui, uguagliando, si ricava:




b1 a12 . . . a1n
1 b2 a22 . . . a2n
x1 = .. .

.. .. ...
det(A)

. . .
bn an2 . . . ann

In generale si ha:


a11 a12 . . . b1 . . . a1n


a21 a22 . . . b2 . . . a2n

1
.. .. .. ..
. . . .

xi = , i = 1, 2, . . . , n, (2.21)
det(A)
.. .. .. ..

. . . .


an1 an2 . . . bn . . . ann

dove l’i-esima colonna coincide con quella dei termini noti.

Teorema 2.20 – Teorema di Cramer – In un sistema lineare del tipo (2.19) di n equa-
zioni in n incognite la cui matrice A dei coefficienti ha determinante diverso da zero la
i-esima incognita si ottiene dalla formula (2.21).

Esempio 2.23 Dato il sistema lineare:



 2x1 − x2 + x3 = 0
3x1 + 2x2 − 5x3 = 1
x1 + 3x2 − 2x3 = 4,

Capitolo 2 71

il determinante della matrice A dei coefficienti è dato da:



2 −1 1

det(A) = 3 2 −5 = 28 6= 0.
1 3 −2
Quindi esiste una sola soluzione che può essere determinata usando il Teorema di Cramer
nel modo seguente:

0 −1 1 2 0 1 2 −1 0
1 , x2 = 1 3 1 −5 , x3 = 1 3

x1 = 1 2 −5 2 1 .
28 28 28
4 3 −2 1 4 −2 1 3 4

Osservazione 2.15 Si osservi che ad ogni sistema lineare compatibile è applicabile il


Teorema di Cramer. Sia, infatti, AX = B un sistema lineare compatibile con A in Rm,n ,
X in Rn,1 , B in Rm,1 e sia r = rank(A | B) = rank(A). Riducendo eventualmente per
righe la matrice completa iniziale (A | B) e scambiando opportunamente le righe si può
ottenere una nuova matrice:
 0
a11 a012 . . . a01n b01

 .. .. .. .. 
 . . . . 
(A0 | B 0 ) =  a0r1 a0r2 . . . a0rn b0r 
 
 . .. .. .. 
 ..

. . . 
a0 m1 a0 m2 . . . a0 b0
mn m

tale che le prime r righe di A0 formino una matrice di rango r. Equivalentemente non
è restrittivo supporre che dalle prime r righe di A0 sia possibile estrarre una matrice
quadrata C di ordine r e di rango r. Infatti, se cosı̀ non fosse si avrebbe rank(A) =
rank(A0 ) ≤ r − 1, perché ogni matrice quadrata di ordine r estratta da A0 avrebbe
determinante nullo (cfr. Def. 2.13). Portando a secondo membro le colonne di A0 diverse
da quelle di C si ottiene la matrice completa (C | B 00 ) di un nuovo sistema lineare con r
incognite e con det(C) 6= 0, equivalente a quello di partenza. Quest’ultima affermazione
è vera perché le operazioni di riduzione per righe trasformano il sistema lineare in un altro
ad esso equivalente e dal fatto che il rango di C sia r segue che il sistema lineare ammette
infinite soluzioni che dipendono da n − r incognite libere che sono, con questo metodo,
proprio quelle portate a secondo membro (cfr. Cap.1). In questo modo, utilizzando il
Teorema di Cramer si possono esprimere le r incognite in funzione delle rimanenti n − r
incognite libere. Segue un esempio di ciò che è stato appena osservato.

Esempio 2.24 Si consideri il sistema lineare:



x + 3y + z = −1
(2.22)
−x + 2y − z = 0,
72 Matrici e Determinanti

osservato che il rango della matrice dei coefficienti:


 
1 3 1
A=
−1 2 −1

è 2 e assunta z come incognita libera, in questo caso la matrice C citata nell’osservazione


precedente è:  
1 3
C= .
−1 2
Il sistema lineare (2.22) si può scrivere:

x + 3y = −1 − z
(2.23)
−x + 2y = z.

Ma a (2.23) è applicabile il Teorema di Cramer perché:



1 3
−1 2 = 5.

La soluzione è:

−1−z 3 1 −1−z

z 2 2 −1 z 1
x= = −z − , y= =− , z ∈ R.
5 5 5 5

2.9 Per saperne di più


In questo paragrafo sono riportate le dimostrazioni di alcune proprietà che nel paragrafo
precedente sono state lasciate al Lettore per esercizio.

Esercizio 2.7 Si dimostri che:


(AB)C = A(BC), A ∈ Rm,n , B ∈ Rn,p , C ∈ Rp,l .

Soluzione Siano A = (aij ) ∈ Rm,n , B = (bij ) ∈ Rn,p , C = (cij ) ∈ Rp,l .


Allora AB = (dij ) ∈ Rm,p e:
Xn
dij = aik bkj .
k=1

Quindi (AB)C = (eij ) ∈ Rm,l , con:


p p p
n
! n
X X X X X
eij = dih chj = aik bkh chj = aik bkh chj
h=1 h=1 k=1 h=1 k=1
Capitolo 2 73

che è l’espressione del generico elemento della matrice a primo membro. Per il secondo
membro si ha BC = (fij ) ∈ Rn,l , con:
p
X
fij = bih chj
h=1

e A(BC) = (gij ) ∈ Rm,l , dove:


p p
n n
! n X
X X X X
gij = aik fkj = aik bkh chj = aik bkh chj ,
k=1 k=1 h=1 k=1 h=1

da cui segue la tesi.

Esercizio 2.8 Si dimostri che:

t
(AB) = tB tA, A ∈ Rn,p , B ∈ Rp,m .

Soluzione Date la matrici A = (aij ) ∈ Rn,p e B = (bij ) ∈ Rp,m , il loro prodotto è la


matrice C = AB = (cij ) ∈ Rn,m , dove:
p
X
cij = aik bkj .
k=1

La matrice a primo membro t (AB) = (dij ) di Rm,n ha elementi del tipo:


p
X
dij = cji = ajk bki .
k=1

La matrice tA = (eij ) di Rp,n ha elementi del tipo eij = aji . La matrice tB = (fij )
di Rm,p ha elementi del tipo fij = bji . La matrice prodotto tB tA = (gij ) di Rm,n ha
elementi del tipo:
p p p
X X X
gij = fik ekj = bki ajk = ajk bki ,
k=1 k=1 k=1

da cui segue la tesi.

Esercizio 2.9 Si dimostri che:


(tA)−1 = t (A−1 ),
per ogni matrice invertibile A ∈ Rn,n .
74 Matrici e Determinanti

Soluzione Si tratta di dimostrare che t (A−1 ) è l’inversa di tA, infatti:


t
(A−1 ) tA = t (A A−1 ) = t I = I.

Esercizio 2.10 Si dimostri che:

tr(A B) = tr(B A), A, B ∈ Rn,n .

Soluzione Date le matrici A = (aij ) ∈ Rn,n e B = (bij ) ∈ Rn,n , gli elementi della
diagonale principale del prodotto AB sono:
n
X
cii = aih bhi ,
h=1

quindi:
n
X n
X
tr(A B) = cll = alh bhl . (2.24)
l=1 h,l=1

Siano dii gli elementi della diagonale principale del prodotto BA, si ha:
n
X
dii = bik aki ,
k=1

la traccia di BA diventa:
n
X n
X
tr(B A) = dmm = bmk akm
m=1 m,k=1

da cui, confrontando con (2.24), segue la tesi.


Capitolo 3

Calcolo Vettoriale

Il calcolo vettoriale elementare è l’argomento di base per lo studio dell’algebra linea-


re e della geometria analitica nella retta, nel piano e nello spazio, inoltre si rivela uno
strumento prezioso per la matematica applicata e la fisica in particolare.
In questo capitolo si assumono note le principali nozioni di geometria euclidea del piano
e dello spazio, cosı̀ come sono solitamente trattate nel primo biennio della scuola secon-
daria superiore. Vale a dire si assume che il Lettore abbia familiarità con i concetti di:
punto, retta, piano e le loro reciproche posizioni, nonché le loro principali proprietà. Sa-
ranno, pertanto, usate le notazioni tradizionali, indicando, quindi, con le lettere maiuscole
dell’alfabeto A, B, . . . , i punti, con le lettere minuscole r, s, . . . , le rette e con le lettere
minuscole dell’alfabeto greco α, β, . . . , i piani. La retta (intesa come retta di punti) sarà
indicata con S1 , il piano (inteso come piano di punti) con S2 , lo spazio, inteso come
spazio di punti, con S3 . Gli spazi S1 , S2 , S3 sono esempi di spazi affini rispettivamente
di dimensione 1, 2, 3. Per la trattazione assiomatica degli spazi affini, che non è inserita
in questo testo, si rimanda ad esempio a [17], invece il concetto di dimensione di uno
spazio formato da vettori sarà introdotto in questo capitolo e poi definito formalmente
nel capitolo successivo Per il momento si raccomanda di non pensare al significato for-
male dei termini che sono stati usati, ma di limitarsi a richiamare le nozioni elementari
impartite nelle scuole secondarie su questi spazi. Man mano che si procederà con lo stu-
dio dell’algebra lineare, si preciseranno in modo corretto le terminologie comunemente
usate. Si assumono, inoltre, noti i primi rudimenti di trigonometria, quali, ad esempio, le
definizioni delle funzioni trigonometriche elementari e le loro principali proprietà.

3.1 Definizione di vettore


Definizione 3.1 Si consideri un segmento AB appartenente ad una retta r dello spazio
ambiente S3 . Ad AB si associa la direzione, quella della retta r, il verso, ad esempio,

75
76 Calcolo Vettoriale

quello da A verso B e la lunghezza indicata con kABk e detta norma o lunghezza di AB .


Un segmento di questo tipo si dice segmento orientato e sarà indicato con la simbologia
−→
AB . La totalità di tutti i segmenti orientati aventi la stessa direzione, lo stesso verso e la
stessa lunghezza di AB , prende il nome di vettore x e sarà generalmente indicato con le
lettere minuscole in grassetto.
Riassumendo, ad ogni vettore x si associano tre entità:

 direzione di x
verso di x
norma di x indicata con kxk.

Per definizione, la norma di ogni vettore è un numero reale positivo, eventualmente nullo.
Se il vettore x è individuato dai punti A e B dello spazio, per indicarlo si potranno usare,
−→ −→
indifferentemente, le seguenti notazioni: x, AB , B − A, [AB]. Inoltre AB è detto un
rappresentante del vettore x; per abbreviare si scriverà:
−→
x = AB.
Segue dalla definizione che lo stesso vettore x ammette infiniti rappresentanti, per esem-
pio la coppia di punti C, D dello spazio tali che i segmenti AB e CD siano paralleli,
−→ −−→
abbiano la stessa lunghezza e lo stesso verso, cioè x = AB = CD.
Se A = B , il segmento ottenuto, che ha come rappresentante A e anche un qualsiasi
punto dello spazio, si indica con o e prende il nome di vettore nullo. Il vettore nullo o è
l’unico vettore di norma uguale a zero ed ha direzione e verso indeterminati.
Se kxk = 1, x si dice versore. Sarà molto utile il concetto di versore in quanto permetterà
di individuare agevolmente l’unità di misura.
Se si fissa un punto O nello spazio S3 e si identifica, di conseguenza, ogni vettore x con il
−→
punto P dato da x = OP allora lo spazio S3 coincide con l’insieme dei vettori dello spa-
zio che si indica con V3 , analogamente, S2 (fissato il punto O) si identifica con l’insieme
dei vettori V2 di un piano e S1 con l’insieme dei vettori V1 di una retta. Il significato dei
numeri 1, 2, 3 in V1 , V2 , V3 sarà discusso ampiamente in questo capitolo. Si osservi inol-
tre che, se non viene fissato il punto O, V1 si può interpretare geometricamente come una
qualsiasi retta dello spazio di direzione uguale a quella dei suoi vettori, V2 invece si può
visualizzare geometricamente come un qualsiasi piano dello spazio parallelo ai vettori ad
esso appartenenti. I vettori per cui non è indicato il punto di applicazione prendono anche
il nome di vettori liberi. V1 e V2 vengono, rispettivamente, chiamati retta vettoriale e
piano vettoriale.
Nel Paragrafo 3.10 viene data una formulazione più rigorosa della Definizione 3.1; per
quello che segue, però, è sufficiente che il Lettore abbia un’idea intuitiva di questo con-
cetto.
Capitolo 3 77

Nei due paragrafi successivi si introdurranno alcune operazioni tra vettori, iniziando dalla
somma di vettori e dal prodotto di un numero reale per un vettore. È molto importante
osservare che queste operazioni (ovviamente con una definizione diversa da quella che
sarà di seguito presentata) sono già state introdotte nell’insieme delle matrici, nel capitolo
precedente. Sarà sorprendente notare che per le operazioni tra vettori saranno valide le
stesse proprietà dimostrate per le analoghe operazioni tra matrici. Il capitolo successivo
sarà dedicato allo studio assiomatico degli insiemi su cui è possibile definire operazioni
di questo tipo e che daranno luogo alla nozione di spazio vettoriale di cui l’insieme delle
matrici Rm,n e gli insiemi dei vettori V3 , V2 , V1 sono esempi.

3.2 Somma di vettori


Definizione 3.2 La somma in V3 è l’operazione:

+ : V3 × V3 −→ V3 , (x, y) 7−→ x + y,
−→ −−→
dove il vettore x + y è cosı̀ definito: fissato un punto O di S3 , siano OA e OB due
−→
segmenti orientati rappresentanti di x e y, rispettivamente, allora x + y = OC , dove
−→
OC è il segmento orientato che si determina con la regola del parallelogramma, illustrata
nella Figura 3.1.

B C

y x+y

O x A

Figura 3.1: Somma di due vettori

Osservazione 3.1 1. La definizione di somma di vettori è ben data. Vale a dire, facen-
do riferimento alle notazioni della Definizione 3.2, se si cambiano i rappresentanti
di x e di y, allora il nuovo rappresentante di x + y, ottenuto con la regola del
78 Calcolo Vettoriale

−→
parallegramma, ha la stessa direzione, lo stesso verso e la stessa norma di OC . La
situazione geometrica è illustrata nella Figura 3.2, la dimostrazione di questa af-
fermazione, che segue in modo elementare dalle proprietà dei parallelogrammi, è
lasciata al Lettore.

2. Per definizione x + y è complanare a x e a y, dove con il temine complanare si


indicano i vettori che ammettono rappresentanti appartenenti allo stesso piano. Di
conseguenza l’operazione di somma di vettori è ben definita anche in V2 e anche in
V1 . Infatti se x e y sono paralleli, ossia se ammettono rappresentanti appartenenti
alla stessa retta, o, equivalentemente, se hanno la stessa direzione, allora la loro
somma x + y è ancora un vettore parallelo ad x e a y, la cui norma è pari alla
somma delle norme di x e di y se essi sono concordi (ossia se hanno lo stesso
verso), in caso contrario, ossia se i vettori sono discordi, la norma di x + y è la
differenza delle norme di x e y. Il verso di x + y è concorde con il verso del
vettore addendo di norma maggiore. L’evidente situazione geometrica è illustrata
nella Figura 3.3. Questo fatto si esprime anche dicendo che V2 e V1 sono chiusi
rispetto all’operazione di somma di vettori.

3. Il punto C è il simmetrico di O rispetto al punto medio del segmento AB, (cfr.


Fig. 3.1).

4. Per ogni vettore x (non nullo) esiste l’opposto −x, che è il vettore parallelo ad x
avente la stessa norma di x ma verso opposto. Quindi:

x + (−x) = o.

Si osservi, inoltre, che anche il vettore nullo o ammette l’opposto, che coincide con
il vettore nullo stesso.

Teorema 3.1 Per la somma di vettori in V3 valgono le seguenti proprietà:

1. x + y = y + x, x, y ∈ V3 (proprietà commutativa);

2. (x + y) + z = x + (y + z), x, y, z ∈ V3 (proprietà associativa);

3. ∃ o ∈ V3 | x + o = x, x ∈ V3 (esistenza dell’elemento neutro);

4. ∀x ∈ V3 , ∃ −x ∈ V3 | x + (−x) = o (esistenza dell’opposto).

Inoltre:

5. kxk − kyk ≤ kx + yk ≤ kxk + kyk, x, y ∈ V3 .

Capitolo 3 79

B C

x+y
y

O x A
B' C'

x+y
y

O' x A'

Figura 3.2: La somma di due vettori non dipende dai loro rappresentanti

x y x

y
x+y
x+y

Figura 3.3: Somma di due vettori paralleli


80 Calcolo Vettoriale

Dimostrazione La dimostrazione segue dalla definizione di somma di vettori e dalle


proprietà dei parallelogrammi ed è lasciata al Lettore. L’elemento neutro è il vettore nullo
o e l’opposto del vettore x coincide con il vettore −x prima definito. Si osservi che le
due uguaglianze in 5. possono valere solo se i vettori x e y sono paralleli.

Osservazione 3.2 1. Dati due vettori x e y la loro somma x + y si può ottenere


mediante la regola della poligonale, cioè scelti due segmenti orientati consecutivi
−→ −−→ −→
x = AB, y = BC , risulta x + y = AC .

2. La proprietà associativa permette di estendere la definizione di somma di vettori a


n addendi. Dati, quindi, i vettori x1 , x2 , . . . , xn , la loro somma x1 + x2 + . . . + xn
si può rappresentare agevolmente, tenendo conto dell’osservazione precedente, con
il segmento che chiude la poligonale ottenuta dai segmenti posti consecutivamen-
te, che rappresentano i vettori addendi. La situazione geometrica è illustrata nella
Figura 3.4.

3. È molto importante osservare che le proprietà della somma di vettori coincidono


con le proprietà della somma di numeri reali, in questo caso il vettore nullo è il
numero 0. In un certo senso, questo è un motivo che autorizza la denominazione
“somma” all’operazione tra vettori appena introdotta. Dal punto di vista “sperimen-
tale”, invece, la definizione di somma di vettori è giustificata dal comportamento
fisico della composizione di due forze applicate nello stesso punto.

4. Il teorema precedente, ha permesso di definire la differenza di due vettori, ossia:

x − y = x + (−y).

La Figura 3.5 illustra come la differenza di due vettori non paralleli sia rappresenta-
ta dalla diagonale del parallelogramma che non rappresenta la loro somma. Si lascia
per esercizio la rappresentazione grafica della differenza di due vettori paralleli.

5. Dato un qualsiasi vettore x e due direzioni non parallele tra di loro ma complanari
con x, esistono e sono unici due vettori x1 ed x2 in quelle direzioni, tali che:

x = x1 + x2 .

L’operazione prende il nome di decomposizione di un vettore lungo due direzioni


assegnate.

6. Si osservi che (V3 , + ) con l’operazione di somma di vettori ha la struttura di


gruppo commutativo (cfr. Oss. 2.2).
Capitolo 3 81

x4

x3
x1 + x2 + x3 + x4

x2

x1

Figura 3.4: Somma di quattro vettori

-y x-y

Figura 3.5: Differenza di due vettori


82 Calcolo Vettoriale

3.3 Il prodotto di un numero reale per un vettore


L’operazione che sta per essere definita trova giustificazione nel mondo in cui si vive, in
quanto formalizza il risultato che si ottiene quando una forza viene raddoppiata o molti-
plicata per un numero reale qualsiasi. D’altra parte, questa operazione è in un certo senso
singolare dal punto di vista algebrico perché gli elementi che concorrono alla sua defi-
nizione appartengono ad insiemi diversi. Inoltre, si può considerare come l’operazione
analoga al prodotto di un numero reale per una matrice introdotto nella Definizione 2.4.

Definizione 3.3 Il prodotto di un numero reale λ per un vettore x ∈ V3 è l’operazione:

R × V3 −→ V3 , (λ, x) 7−→ λx,

dove il vettore λx (detto anche prodotto dello scalare λ per x) è definito nel modo
seguente:

1. se λ = 0 o x = o, allora λx = o.

2. Se λ 6= 0 e x 6= o si pone λx = y, dove:
la direzione di y coincide con la direzione di x;
il verso di y è concorde con quello di x se λ > 0, discorde se λ < 0;
kyk = |λ|kxk, dove |λ| indica il valore assoluto del numero reale λ.

Osservazione 3.3 Dalla definizione segue che λx = o se e solo se λ = 0 oppure x = o.


Per la dimostrazione si veda l’Esercizio 4.23.

Sono valide le seguenti proprietà la cui dimostrazione è lasciata per esercizio.

Teorema 3.2 1. λ(x + y) = λx + λy, λ ∈ R, x, y ∈ V3 ;

2. (λ + µ)x = λx + µx, λ, µ ∈ R, x ∈ V3 ;

3. λ(µx) = (λµ)x, λ, µ ∈ R, x ∈ V3 ;

4. 1 x = x, x ∈ V3 .

Osservazione 3.4 L’insieme V3 con le operazioni di somma di vettori e le relative quattro


proprietà e di prodotto di un numero reale per un vettore e le relative quattro proprietà,
è un esempio di spazio vettoriale su R. La definizione assiomatica di spazio vettoriale è
rimandata al capitolo successivo. Allo stesso modo, anche V2 e V1 sono esempi di spazi
vettoriali. In realtà, V2 e V1 sono esempi di sottospazi vettoriali di V3 perché sono chiusi
Capitolo 3 83

rispetto alle operazioni di somma e di prodotto per numeri reali, vale a dire per ogni x e
y in V2 e per ogni λ ∈ R si ha che x + y ∈ V2 e λx ∈ V2 (analogamente per V1 ). Inoltre,
in un certo senso (considerando le rette vettoriali di direzione indeterminata appartenenti
ad un piano vettoriale qualsiasi) si può pensare che V1 ⊂ V2 ⊂ V3 .

Seguono alcune definizioni e proprietà di tipo teorico, che saranno riprese in modo com-
pleto nel capitolo successivo. Si è deciso di inserire in questo contesto ciò che segue,
anche se i risultati che si ottengono saranno conseguenza della teoria più generale degli
spazi vettoriali, e saranno, quindi, dedotti nel Capitolo 4, in quanto solo in V3 è pos-
sibile rappresentare graficamente le nozioni man mano introdotte, aiutando cosı̀ la loro
comprensione.

Definizione 3.4 Dati k vettori v1 , v2 , . . . , vk di V3 , si dice che un vettore x ∈ V3 è


combinazione lineare di v1 , v2 , . . . , vk se esistono k numeri reali x1 , x2 , . . . , xk tali che:

x = x1 v 1 + x2 v 2 + . . . + xk v k .

I numeri reali x1 , x2 , . . . , xk si dicono coefficienti della combinazione lineare.

Mediante la nozione di combinazione lineare di vettori si possono riformulare, in modo


più accurato dal punto di vista algebrico, le nozioni, già introdotte in modo geometrica-
mente intuitivo, di retta vettoriale e di piano vettoriale.

Definizione 3.5 Dato un vettore x 6= o, la retta vettoriale generata da x è l’insieme:

L(x) = {λx | λ ∈ R}.

Dati due vettori x e y non paralleli il piano vettoriale generato da x e da y è l’insieme:

L(x, y) = {λx + µy | λ, µ ∈ R}.

Osservazione 3.5 Segue in modo evidente dalla definizione che L(x, y) = L(y, x). Non
ci si deve infatti far trarre in inganno dalla presenza nella scrittura delle parentesi tonde,
usualmente usate per indicare che è importante l’ordine dei vettori; è una convenzione
usare questa notazione anche se non è corretta.

Scopo del prossimo paragrafo è mettere in relazione le nozioni algebriche e geometriche


enunciate nelle definizioni precedenti.
84 Calcolo Vettoriale

3.4 Dipendenza lineare e basi


Dalla Definizione 3.5 segue che il parallelismo e la complanarità tra vettori possono essere
letti in termini delle loro combinazioni lineari. Per differenziare ulteriormente le due
diverse situazioni geometriche è necessario introdurre la seguente definizione.

Definizione 3.6 Dati k vettori v1 , v2 , . . . , vk di V3 , essi si dicono linearmente indipen-


denti se l’unica loro combinazione lineare uguale al vettore nullo è quella con coefficienti
tutti nulli, vale a dire:

x1 v 1 + x2 v 2 + . . . + xk v k = o =⇒ x1 = x2 = . . . = xk = 0. (3.1)

L’insieme {v1 , v2 , . . . , vk } di vettori linearmente indipendenti si dice libero.


Di conseguenza k vettori v1 , v2 , . . . , vk di V3 si dicono linearmente dipendenti se esiste
almeno una loro combinazione lineare uguale al vettore nullo a coefficienti non tutti nulli,
cioè se si ha:
x1 v 1 + x2 v 2 + . . . + xk v k = o
con almeno uno tra i coefficienti x1 , x2 , . . . , xk non nullo.

Osservazione 3.6 1. Si osservi che in (3.1) vale anche l’implicazione opposta.

2. L’insieme {x} è libero se e solo se x 6= o.

Prima di proporre alcuni esempi conviene enunciare il teorema che segue, molto facile,
ma utile per riconoscere vettori linearmente dipendenti o linearmente indipendenti. Per la
dimostrazione si rimanda al Paragrafo 4.3.

Teorema 3.3 I vettori v1 , v2 , . . . , vk di V3 sono linearmente dipendenti se e solo se


almeno uno di essi si può esprimere come combinazione lineare dei rimanenti.

Esempio 3.1 1. Se x = 2y, allora λx + µy = o con λ = 1, µ = −2. Pertanto i


vettori x e y sono linearmente dipendenti.

2. Il vettore nullo o è linearmente dipendente con ogni altro vettore x in quanto:

λo + 0x = o,

per ogni λ ∈ R, quindi anche per valori non nulli di λ. In particolare, l’insieme
contenente solo il vettore nullo {o} non è libero.
Capitolo 3 85

3. Gli elementi di L(x) sono tutti linearmente dipendenti tra di loro, ma la stessa
proprietà non vale per L(x, y), si vedrà infatti nel Teorema 3.4 che due vettori non
paralleli sono linearmente indipendenti, anche se il risultato si ottiene in modo quasi
banale da considerazioni geometriche elementari.

Il teorema che segue conclude lo studio del parallelismo e della complanarità tra vettori
mediante la dipendenza lineare.

Teorema 3.4 1. Due vettori x e y di V3 sono linearmente dipendenti se e solo se


sono paralleli, ossia se e solo se appartengono alla stessa retta vettoriale.

2. Tre vettori x, y e z di V3 sono linearmente dipendenti se e solo se sono complanari,


ossia se e solo se appartengono allo stesso piano vettoriale.

3. Quattro vettori di V3 sono sempre linearmente dipendenti.

Segue subito dal teorema appena enunciato che:

1. il numero massimo di vettori linearmente indipendenti in una retta vettoriale


V1 è 1.

2. Il numero massimo di vettori linearmente indipendenti in un piano vettoriale


V2 è 2.

3. Il numero massimo di vettori linearmente indipendenti nello spazio vettoriale


V3 è 3.

Ecco, finalmente, una prima definizione algebrica del numero che si legge a pedice!

Dimostrazione 1. Si supponga che x e y siano paralleli. Se entrambi i vettori sono


il vettore nullo, o uno solo dei due è il vettore nullo, allora sono linearmente dipen-
denti. Si supponga ora che entrambi i vettori non siano nulli. Dalla Definizione 3.3
si ha che esiste un numero reale λ per cui x = λy il cui valore assoluto è dato da:

kxk
|λ| =
kyk

e il segno di λ è positivo se x e y hanno verso concorde, altrimenti è negativo.


Dal Teorema 3.3 segue che i vettori x e y sono linearmente dipendenti. Viceversa,
se x e y sono linearmente dipendenti si perviene alla tesi applicando di nuovo il
Teorema 3.3.
86 Calcolo Vettoriale

K C

B z

O x A H

Figura 3.6: Complanarità di tre vettori

C
D
v3
x
v2
B

O
H

v1 A

Figura 3.7: Dipendenza lineare di quattro vettori


Capitolo 3 87

2. Si inizia a dimostrare che se i vettori x, y, z sono complanari, allora sono linear-


mente dipendenti. Si esamina solo il caso in cui x e y sono linearmente indipen-
denti, lasciando per esercizio gli altri casi. A tale scopo si considerino tre segmenti
orientati che li rappresentano, aventi tutti l’estremo O in comune (la situazione
geometrica è descritta nella Figura 3.6) si ha:
−→ −−→ −→
OA = x, OB = y, OC = z.

Essendo i tre vettori complanari, i punti O, A, B, C appartengono allo stesso piano.


Si decomponga il vettore z lungo le direzioni di x e di y (cfr. Oss. 3.2, punto 4.),
individuando i punti H sulla retta OA e K sulla retta OB ; si ottiene:
−→ −−→ −−→
OC = OH + OK, (3.2)
−−→ −−→
ma OH è il rappresentante di un vettore parallelo a x e OK è il rappresentante di
un vettore parallelo a y. La relazione (3.2) equivale alla dipendenza lineare dei tre
vettori dati. Il viceversa è lasciato per esercizio.

3. Siano v1 , v2 , v3 , x quattro vettori di V3 . Si supponga che v1 , v2 , v3 non siano com-


planari, quindi siano linearmente indipendenti, lasciando per esercizio tutti gli altri
casi particolari, da cui si perviene agevolmente alla tesi. Facendo riferimento alla
−→ −−→ −→ −−→
Figura 3.7, si indichino con OA = v1 , OB = v2 , OC = v3 , OD = x i rap-
presentanti dei quattro vettori dati, aventi tutti un estremo in O. I punti O, A, B, C
non sono complanari, mentre i punti O, A, B individuano un piano π . Si supponga,
inoltre, che D non appartenga a π (in caso contrario il teorema sarebbe dimostra-
to). Si tracci dal punto D la parallela alla retta OC che incontra il piano π in H .
Per costruzione:
−−→ −−→ −−→
OD = OH + HD. (3.3)
−−→
Decomponendo il vettore OH nelle direzioni dei vettori v1 e v2 , si individuano tre
numeri reali x1 , x2 , x3 che permettono di riscrivere la (3.3) come:

x = x1 v 1 + x2 v 2 + x3 v 3 , (3.4)

e, quindi, segue la tesi.

La decomposizione di un generico vettore nello spazio, rispetto a tre vettori linearmente


indipendenti assegnati, ottenuta per costruzione nella dimostrazione dell’ultimo punto del
teorema precedente, è in realtà unica, come afferma il teorema che segue.

Teorema 3.5 In V3 , dati tre vettori linearmente indipendenti v1 , v2 , v3 , ogni vettore x


di V3 si scrive in modo unico come combinazione lineare dei tre vettori dati.
88 Calcolo Vettoriale

Dimostrazione È sufficiente dimostrare l’unicità della decomposizione (3.4). Si sup-


ponga che esistano altri numeri reali y1 , y2 , y3 tali che:

(x1 , x2 , x3 ) 6= (y1 , y2 , y3 )

e per cui:
x = y1 v1 + y2 v2 + y3 v3 . (3.5)
Uguagliando (3.4) e (3.5) segue:

o = (x1 − y1 )v1 + (x2 − y2 )v2 + (x3 − y3 )v3 .

Poiché v1 , v2 , v3 sono linearmente indipendenti, si ha x1 = y1 , x2 = y2 , x3 = y3 .

Il teorema che segue riformula i risultati precedenti nei casi particolari di V2 e di V1 .

Teorema 3.6 1. Dati due vettori linearmente indipendenti v1 , v2 di un piano vetto-


riale V2 , ogni vettore x di V2 determina in modo unico la coppia di numeri reali
(x1 , x2 ) tale che:
x = x1 v 1 + x2 v 2 . (3.6)

2. Dato un vettore v1 non nullo in una retta vettoriale V1 , ogni vettore x ∈ V1


determina in modo unico il numero reale x1 tale che:

x = x1 v 1 . (3.7)

Segue, in modo evidente, che la posizione di un vettore nello spazio vettoriale V3 è indi-
viduata dalla scelta di tre vettori linearmente indipendenti, in modo analogo per un piano
vettoriale V2 è sufficiente scegliere due vettori linearmente indipendenti per individuare
tutti i vettori di V2 e nel caso di una retta vettoriale V1 è sufficiente scegliere un qualsiasi
vettore non nullo per determinare tutti gli altri vettori. Questa considerazione permette di
definire in modo inequivocabile i concetti fondamentali di base e di dimensione nel modo
che segue.

Definizione 3.7 1. Si dice base di V3 una qualsiasi terna ordinata di vettori linear-
mente indipendenti. Si dice dimensione di V3 il numero dei vettori di una base e si
indica con dim(V3 ) = 3.

2. Si dice base di un piano vettoriale V2 una qualsiasi coppia ordinata di vettori li-
nearmente indipendenti di V2 . Si dice dimensione di V2 il numero dei vettori di una
base e si indica con dim(V2 ) = 2.
Capitolo 3 89

3. Si dice base di una retta vettoriale V1 un suo qualsiasi vettore non nullo. Si dice
dimensione di V1 il numero dei vettori di una base e si indica con dim(V1 ) = 1.

Una base di V3 verrà indicata con la notazione B = (v1 , v2 , v3 ). In questo caso l’ordine
con cui si scrivono i vettori è importante perché determina l’ordine con cui si scrivono
i coefficienti (x1 , x2 , x3 ) della combinazione lineare (3.4). In modo analogo una base
di un piano vettoriale V2 sarà B 0 = (v1 , v2 ) e una base di una retta vettoriale V1 sarà
B 00 = (v1 ).

v3

v2
a

v1
Figura 3.8: Decomposizione di un vettore rispetto a tre direzioni complanari

Osservazione 3.7 In V3 , in V2 e in V1 esistono infinite basi ma il numero dei vettori che


le compongono è sempre pari alla dimensione dei rispettivi spazi vettoriali.

Osservazione 3.8 Dati tre vettori complanari (non paralleli) v1 , v2 , v3 si ha che ogni vet-
tore x appartenente al piano vettoriale individuato da v1 , v2 , v3 , si decompone in infiniti
modi diversi rispetto ai tre vettori dati. Per esempio è sufficiente scegliere una direzione
arbitraria individuata da un vettore a come combinazione lineare di v1 , v2 e decomporre
x rispetto alle direzioni individuate da v3 e a; oppure decomporre x rispetto ad una di-
rezione arbitraria b ottenuta come combinazione lineare di v2 e v3 e cosı̀ via (cfr. Oss.
3.2 punto 5.). La situazione geometrica è descritta nella Figura 3.8 in cui si è posto, per
esempio, a = v1 + v2 e x = λa + µv3 ed inoltre si è posto b = v2 + v3 e x = νb + ϕv1 ,
dove λ, µ, ν, ϕ sono opportuni numeri reali.
90 Calcolo Vettoriale

I Teoremi 3.5 e 3.6 permettono di introdurre la seguente definizione.

Definizione 3.8 Fissata una base B = (v1 , v2 , v3 ) di V3 , per ogni vettore x di V3 gli
elementi dell’unica terna ordinata di numeri reali (x1 , x2 , x3 ) definita da (3.4) sono detti
le componenti di x rispetto alla base B. In modo analogo la formula (3.6) definisce
le componenti di un generico vettore x del piano vettoriale V2 rispetto alla base B 0 =
(v1 , v2 ) di V2 e la formula (3.7) definisce la componente di un generico vettore x di una
retta vettoriale V1 rispetto alla base B 00 = (v1 ).

Osservazione 3.9 Nel caso di V3 , fissata una base B = (v1 , v2 , v3 ), si è definita una
corrispondenza biunivoca tra V3 e R3 che associa ad ogni vettore x le sue componenti.
Spesso si scrive, con un abuso di notazione:

x = (x1 , x2 , x3 )

o, in forma matriciale, con:  


x1
x =  x2 .
x3
Si vedrà, infatti, in seguito, come sia più conveniente nei calcoli utilizzare una matrice
colonna di R3,1 per indicare le componenti di un vettore di V3 , che è preferibile chiamare
X per distinguerla dal vettore x:
 
x1
X =  x2 .
x3

Analoghe considerazioni valgono per i casi particolari di V2 e di V1 .

Il teorema che segue, la cui dimostrazione è un facile esercizio, permette di calcola-


re la somma di due vettori e il prodotto di un numero reale per un vettore mediante le
componenti.

Teorema 3.7 In V3 , dati i vettori x = x1 v1 + x2 v2 + x3 v3 , y = y1 v1 + y2 v2 + y3 v3 ,


scritti rispetto alla base B = (v1 , v2 , v3 ), si ha:

x + y = (x1 + y1 )v1 + (x2 + y2 )v2 + (x3 + y3 )v3 ,

λx = (λx1 )v1 + (λx2 )v2 + (λx3 )v3 ,

con λ ∈ R; cioè le componenti della somma di due vettori si ottengono semplicemente


sommando le rispettive componenti, mentre le componenti del vettore λx si ottengono
Capitolo 3 91

moltiplicando λ per ogni componente di x. In notazione matriciale, al vettore x + y si


associa la matrice colonna delle sue componenti rispetto alla base B:
 
x1 + y 1
X + Y =  x2 + y2 .
x3 + y 3

Al vettore λx si associa la matrice colonna delle sue componenti rispetto alla base B:
 
λ x1
λX =  λ x2 .
λ x3

Analoghe affermazioni valgono anche nel caso di un piano vettoriale V2 e di una retta
vettoriale V1 .

Osservazione 3.10 1. Il vettore nullo o è l’unico vettore di V3 avente componenti


tutte nulle o = (0, 0, 0), rispetto ad una qualsiasi base di V3 .

2. I vettori di una base B = (v1 , v2 , v3 ) di V3 hanno componenti, rispetto alla stessa


base B:
v1 = (1, 0, 0), v2 = (0, 1, 0), v3 = (0, 0, 1).

3. Dal teorema precedente e dalla notazione matriciale usata per le componenti di un


vettore segue l’assoluta concordanza tra le definizioni di somma di matrici e di
prodotto di un numero reale per una matrice, introdotte nel capitolo precedente e la
somma di vettori in componenti e il prodotto di un numero reale per un vettore, in
componenti definite in questo capitolo.

Gli esempi che seguono sono volti ad individuare la dipendenza o indipendenza lineare
dei vettori mediante le loro componenti. Si farà uso delle nozioni di rango di una matrice
e del Teorema di Rouché–Capelli introdotti nel Capitolo 1 per la risoluzione dei sistemi
lineari.

Esempio 3.2 1. In V3 , fissata una base B = (v1 , v2 , v3 ), si considerino i vettori x =


x1 v1 + x2 v2 + x3 v3 e y = y1 v1 + y2 v2 + y3 v3 . Dal Teorema 3.4 segue che x è
parallelo a y se e solo se x e y sono linearmente dipendenti, ossia se e solo se è
possibile determinare un numero reale λ tale che:

y = λx.
92 Calcolo Vettoriale

Scrivendo questa relazione mediante le componenti dei due vettori segue:



 y1 = λx1
y2 = λx2
y3 = λx3

e, in termini matriciali, equivale a richiedere che:


 
x1 x2 x3
rank ≤ 1.
y1 y2 y3

Per esempio i vettori x = (1, −2, 3) e y = (2, −4, 6) sono paralleli, mentre i vettori
x e z = (1, 0, 3) non lo sono. Il rango della matrice:
 
x1 x2 x3
y1 y2 y3

è pari a 1 anche nel caso in cui uno solo dei vettori x e y sia diverso dal vettore
nullo. Il rango di questa matrice è 0 se e solo se x = y = o.

2. Dal Teorema 3.4 si ha che tre vettori x, y, z sono complanari se e solo se sono
linearmente dipendenti, ossia per esempio se esistono i numeri reali λ e µ per cui:

z = λx + µy. (3.8)

Fissata una base B = (v1 , v2 , v3 ) di V3 , si indichino con:

x = (x1 , x2 , x3 ), y = (y1 , y2 , y3 ), z = (z1 , z2 , z3 )

le componenti dei tre vettori dati. La relazione (3.8), scritta rispetto a queste
componenti, equivale al sistema lineare:

 z1 = λx1 + µy1
z2 = λx2 + µy2
z3 = λx3 + µy3

e in termini matriciali equivale a:


 
x1 x2 x3
rank  y1 y2 y3  ≤ 2.
z1 z2 z3

Infatti se i vettori x e y non sono paralleli allora il rango della matrice su scritta è
proprio 2, invece se i vettori x e y sono paralleli, allora anche il vettore z è ad essi
parallelo e il rango della matrice vale 1. Il rango è 0 se e solo se x = y = z = o.
Capitolo 3 93

Esercizio 3.1 In V3 , rispetto ad una base B = (v1 , v2 , v3 ), sono dati i vettori:


a = (1, 3, −1), b = (4, 1, 0), c = (2, −5, 2),
come sono posizionati questi tre vettori nello spazio vettoriale V3 ?

Soluzione Si consideri la matrice A, quadrata di ordine tre, le cui righe sono date dalle
componenti dei tre vettori:  
1 3 −1
A= 4 1 0 ,
2 −5 2
riducendo A per righe si ha:
   
1 3 −1 1 3 −1
−→
A=  4 1 0   4 1 0 .
R3 → R3 + 2R1
2 −5 2 4 1 0

Quindi rank(A) = 2 e ciò implica che i tre vettori sono complanari (infatti sono linear-
mente dipendenti). Poiché i vettori a e b non sono paralleli (infatti sono linearmente
indipendenti in quanto le loro componenti non sono proporzionali), devono esistere due
numeri reali λ e µ tali che:
c = λa + µb.
Questa relazione vettoriale, scritta mediante le componenti dei tre vettori, equivale al
sistema lineare: 
 λ + 4µ = 2
3λ + µ = −5
−λ = 2

la cui soluzione è (λ = −2, µ = 1), e perciò c = −2a + b.

Gli esempi precedenti, riletti in termini di indipendenza lineare di vettori, possono essere
riassunti nel seguente teorema.

Teorema 3.8 Sia B = (v1 , v2 , v3 ) una base di V3 , si considerino vettori:


x = (x1 , x2 , x3 ), y = (y1 , y2 , y3 ), z = (z1 , z2 , z3 )
scritti in componenti rispetto alla base B.
1. Un vettore non nullo x in V3 è linearmente indipendente se e solo se, indicata con
A la matrice avente come unica riga le componenti di x:

A = x 1 x 2 x3 ,
si ha rank(A) = 1. Equivalentemente x = o se e solo se rank(A) = 0.
94 Calcolo Vettoriale

2. Due vettori x e y di V3 sono linearmente indipendenti se e solo se, indicata con A


la matrice avente come righe le componenti dei due vettori:
 
x1 x2 x3
A= ,
y1 y2 y3

si ha rank(A) = 2. Equivalentemente, i vettori x e y (entrambi non nulli) sono


linearmente dipendenti, vale a dire sono paralleli, se e solo se rank(A) = 1. Se
x = y = o, allora rank(A) = 0 e viceversa.

3. Tre vettori x, y, z sono linearmente indipendenti in V3 (vale a dire formano una


base di V3 ) se e solo se, indicata con A la matrice quadrata avente come righe le
componenti dei tre vettori:
 
x1 x2 x3
A =  y1 y2 y3 , (3.9)
z1 z2 z3

si ha:
rank(A) = 3 ⇐⇒ ∃A−1 ⇐⇒ det(A) 6= 0.
Equivalentemente, i vettori x, y, z sono linearmente dipendenti se e solo se:

rank(A) < 3.

Se rank(A) = 2 allora due dei tre vettori dati sono linearmente indipendenti e il
terzo vettore appartiene al piano vettoriale individuato dai primi due. Se invece
rank(A) = 1 i tre vettori (non contemporaneamente tutti uguali al vettore nullo)
sono paralleli. Il caso rank(A) = 0 corrisponde a x = y = z = o.

Dimostrazione La dimostrazione segue dall’Esempio 3.2. In alternativa, per dimostra-


re l’ultimo punto si può anche procedere esplicitando, mediante le componenti dei vettori,
la relazione:
λ1 x + λ2 y + λ3 z = o,
con λ1 , λ2 λ3 ∈ R, che equivale al sistema lineare omogeneo:

 λ1 x1 + λ2 y1 + λ3 z1 = 0
λ1 x2 + λ2 y2 + λ3 z2 = 0
λ1 x3 + λ2 y3 + λ3 z3 = 0.

Affinché i tre vettori dati siano linearmente indipendenti, tale sistema lineare omogeneo
deve ammettere la sola soluzione nulla. Questo accade se e solo se:
Capitolo 3 95

 
x1 y1 z1
rank  x2 y2 z2  = 3.
x3 y3 z3
Si osservi che la matrice ottenuta è la trasposta della matrice A in (3.9). Si dovrà attende-
re la dimostrazione del Teorema 4.19 per assicurare l’equivalenza dei due procedimenti
seguiti per pervenire alla tesi. Il risultato, in realtà, è intuitivamente accettabile, tenendo
conto che det(A) = det(tA).
Esercizio 3.2 In V3 , rispetto ad una base B = (v1 , v2 , v3 ), sono dati i vettori:
u1 = (1, 0, −h), u2 = (2, −1, 1), u3 = (h, 1, −1),
stabilire per quali valori di h ∈ R essi formano una base di V3 .
Soluzione I tre vettori dati formano una base di V3 se e solo se sono linearmente
indipendenti, ossia se la matrice A :
 
1 0 −h
A =  2 −1 1 
h 1 −1
ha det(A) 6= 0. Poiché det(A) = −h(2 + h) si ha che i vettori u1 , u2 , u3 formano una
base di V3 se e solo se h ∈
/ {−2, 0}.
Esercizio 3.3 In V3 , rispetto ad una base B = (v1 , v2 , v3 ), sono dati i vettori:
u = v1 − v2 + 3v3 , v = 2v1 + v2 − v3 , w = v1 + 2v2 + v3 ,
dimostrare che costituiscono una base di V3 .
Soluzione Si tratta di dimostrare che il rango della matrice:
 
1 −1 3
A= 2 1 −1 
1 2 1
è 3. Riducendola per righe si ha:
   
1 −1 3 −→ 1 −1 3
A=  2 1 −1  R2 → R2 + R1  3 0 2 
1 2 1 R3 → R3 + 2R1 3 0 7
 
1 −1 3
−→  3 0 2 ,
R3 → R3 − R2
0 0 5
96 Calcolo Vettoriale

da cui la tesi.
Esercizio 3.4 In V3 , rispetto ad una base B = (v1 , v2 , v3 ), sono dati i vettori:
u = 2v1 + v2 − v3 , v = v1 + v3 , w = v1 + v2 − 2v3 .
Verificare che u, v, w sono linearmente dipendenti ed esprimerne uno di essi come com-
binazione lineare dei rimanenti.
Soluzione Si consideri la combinazione lineare dei vettori u, v, w a coefficienti reali
λ, µ e ν e la si ponga uguale al vettore nullo:
λu + µv + νw = o.
Sostituendo nella combinazione lineare l’espressione dei vettori scritta rispetto alla base
B, si ha:
λ(2v1 + v2 − v3 ) + µ(v1 + v3 ) + ν(v1 + v2 − 2v3 )
= (2λ + µ + ν)v1 + (λ + ν)v2 + (−λ + µ − 2ν)v3 = o.
Si è cosı̀ ottenuta una combinazione lineare dei vettori della base B che è uguale al vettore
nullo. Ma i vettori della base B sono linearmente indipendenti, quindi tutti i coefficienti
di tale combinazione lineare devono essere nulli, ossia:

 2λ + µ + ν = 0
λ+ν =0
−λ + µ − 2ν = 0.

Il sistema lineare omogeneo cosı̀ ottenuto ha matrice dei coefficienti:


 
2 1 1
A= 1 0 1 .
−1 1 −2
Riducendo A per righe si ha:
   
2 1 1 2 1 1
−→
A= 1 0 1   1 0 1 
R3 → R3 − R1
−1 1 −2 −3 0 −3
 
2 1 1
−→  1 0 1 ,
R3 → R3 + 3R2
0 0 0
ossia rank(A) = 2. Il sistema lineare omogeneo ammette, quindi, infinite soluzioni date
da (λ, −λ, λ), λ ∈ R. I vettori u, v, w sono perciò linearmente dipendenti e quindi, posto
per esempio λ = 1, si ottiene u = v + w. Come già osservato nella dimostrazione del
Teorema 3.8, si noti che la matrice A ha come colonne le componenti dei vettori u, v, w.
Capitolo 3 97

3.5 Il cambiamento di base in V3


Il problema del cambiamento di base in V3 consiste nel determinare la relazione che
intercorre tra le componenti di un qualsiasi vettore scritto rispetto a due basi diverse,
precedentemente assegnate.

Siano date due basi B = (v1 , v2 , v3 ) e B 0 = (v10 , v20 , v30 ) di V3 . Ogni vettore x ∈ V3 si
scrive in componenti, rispetto alla due basi, nella forma:
x = x1 v1 + x2 v2 + x3 v3 = x01 v10 + x02 v20 + x03 v30 . (3.10)
Usando la notazione matriciale introdotta nel paragrafo precedente, si indichino con:
   0 
x1 x1
X =  x2 , X 0 =  x02  (3.11)
0
x3 x3
le matrici colonna delle componenti di x rispetto alle due basi assegnate. La base B 0 è
nota quando sono note le componenti dei suoi vettori rispetto alla base B, ossia:
 0
 v1 = p11 v1 + p21 v2 + p31 v3
v0 = p12 v1 + p22 v2 + p32 v3 (3.12)
 20
v3 = p13 v1 + p23 v2 + p33 v3 .
In altri termini, la base B 0 è nota quando è assegnata la matrice:
 
p11 p12 p13
P =  p21 p22 p23 .
p31 p32 p33
P è invertibile perché le sue colonne sono le componenti di vettori linearmente indipen-
denti. La matrice P prende il nome di matrice del cambiamento di base da B a B 0 ed è
0
spesso anche indicata come P = M B,B proprio per mettere maggiormente in evidenza
la sua interpretazione geometrica. La scelta di porre in colonna, anziché in riga, le com-
ponenti dei vettori della base B 0 rende i calcoli più agevoli. Le equazioni (3.12) in forma
matriciale diventano:  0   
v1 v1
 v20  = tP  v2 .
v30 v3
Sostituendo questa espressione in (3.10) si ha:
   0   
v 1  v1 v 1
x = x1 x2 x3  v2  = x01 x02 x03  v20  = x01 x02 x03 tP  v2 .
 

v3 v30 v3
98 Calcolo Vettoriale

Dal Teorema 3.5 segue:


t
x01 x02 x03

x1 x2 x3 = P,

da cui, considerando la trasposta di ambo i membri:


   0 
x1 x1
 x2  = P  x02 .
x3 x03

Usando le notazioni di (3.11) si ottiene:

X = P X 0,

che sono le relazioni richieste e che prendono il nome di equazioni del cambiamento di
base da B a B 0 .

Osservazione 3.11 1. È chiaro che se si esprimono i vettori della base B in compo-


nenti rispetto alla base B 0 si ottiene la matrice inversa P −1 , infatti le equazioni del
cambiamento di base da B 0 a B sono X 0 = P −1 X.

2. Si può trattare in modo analogo il problema del cambiamento di base nel caso del
piano vettoriale V2 . La matrice del cambiamento di base sarà una matrice invertibile
di ordine 2.

3. Nel caso della retta vettoriale V1 ogni numero reale non nullo esprime la compo-
nente del vettore della base B 0= (v10 ) rispetto alla base B = (v1 ). Se per esempio
v10 = 2v1 , allora P = 2 , mentre le equazioni del cambiamento di base si
riducono all’unica equazione: x1 = 2x01 o x01 = 1/2 x1 . Infatti:
 
1
x = x 1 v1 = x01 v10 = x1 2v1 .
2

Esercizio 3.5 In V3 , rispetto ad una base B = (v1 , v2 , v3 ), sono dati i vettori:

u = 2v1 + v2 + v3 , v = −v1 + 2v2 + v3 ,


w = v1 − v2 − 2v3 , z = −v1 − 2v2 + v3 .

Verificare che B 0 = (u, v, w) è una base di V3 e trovare le componenti di z rispetto alla


base B 0 .
Capitolo 3 99

Soluzione Si inizia con il calcolo del rango della matrice P le cui colonne sono,
rispettivamente, le componenti dei vettori u, v, w.
 
2 −1 1 −→
P = 1 2 −1  R2 → R2 + 2R1
1 1 −2 R3 → R3 + R1
   
2 −1 1 2 −1 1
 5 −→
0 1   5 0 1 .
R3 → R3 + R2
3 0 −1 8 0 0

Allora rank(P ) = 3, quindi i vettori u, v, w sono linearmente indipendenti. La matrice


P è pertanto la matrice del cambiamento di base dalla base B alla base B 0. Si devono
determinare le componenti x01 , x02 , x03 del vettore z rispetto alla base B 0 , ossia:

z = x01 u + x02 v + x03 w.

Si tratta di risolvere l’equazione matriciale X = P X 0 , dove:


   0 
−1 x1
0
X = −2 , X =
   x02 ,
1 x03

che corrisponde al sistema lineare che esprime le equazioni del cambiamento di base da
B a B0 :  0
 2x1 − x02 + x03 = −1
x0 + 2x02 − x03 = −2
 10
x1 + x02 − 2x03 = 1.
Riducendo per righe la matrice completa si ha:
   
2 −1 1 −1 −→ 2 −1 1 −1
−→
 1 2 −1 −2  R2 → R2 + 2R1  5 0 1 −4 
R3 → R3 + R2
1 1 −2 1 R3 → R3 + R1 3 0 −1 0
   
2 −1 1 −1 2 −1 1 −1
−→ −→
 5 0 1 −4   5 0 1 −4 
R3 → (1/4)R3 R1 → R1 − R2
8 0 0 −4 2 0 0 −1
   
−3 −1 0 3 −→ 0 −2 0 3
 5 0 1 −4  R1 → 2R1 + 3R3  0 0 2 −3 .
2 0 0 −1 R2 → 2R2 − 5R3 2 0 0 −1
100 Calcolo Vettoriale

Si perviene alla soluzione:


1

0

 x 1 = −



 2


3

x02 = −


 2


 x03 = − 3 .



2
Allora:
1 3 3
z = − u − v − w.
2 2 2

3.6 Angolo tra due vettori


Nei paragrafi precedenti si sono considerati solo il parallelismo e la complanarità di vettori
ma non l’angolo che questi formano; per esempio non è stata trattata l’ortogonalità tra
vettori. Per prendere in considerazione quest’aspetto geometrico è necessario introdurre
la nozione precisa di angolo tra due vettori nel modo seguente.

−→ −−→
Definizione 3.9 In V3 , considerati due vettori non nulli x = OA, y = OB , scelti i
rispettivi rappresentanti con l’estremo O in comune, si definisce angolo xy
c tra i due
vettori x e y l’angolo convesso θ = xy c di vertice O e compreso tra i segmenti OA,
OB . Di conseguenza 0 ≤ θ ≤ π. La situazione geometrica è illustrata nella Figura 3.9.
Inoltre:

• se θ = 0 o se θ = π i vettori x e y si dicono paralleli.

π
• Se θ = i vettori x e y si dicono ortogonali (o perpendicolari).
2

• L’angolo tra il vettore nullo o e un qualunque altro vettore può assumere qualsiasi
valore, vale a dire il vettore nullo si può considerare parallelo e ortogonale ad ogni
altro vettore.

Si osservi che se θ = 0 i due vettori x e y hanno verso concorde, mentre se θ = π


il verso è discorde. Nel Paragrafo 3.7.2 si dimostrerà che la definizione geometrica di
parallelismo di due vettori, intendendosi come tali due vettori che formano un angolo
θ = 0 o θ = π, coincide con la dipendenza lineare dei due vettori.
Capitolo 3 101

Θ
O x A

Figura 3.9: Angolo tra i due vettori x e y

3.7 Operazioni non lineari tra vettori


In questo paragrafo saranno introdotte tre particolari operazioni tra vettori di V3 che
coinvolgono la nozione di angolo, e precisamente:

1. il prodotto scalare tra due vettori (che a due vettori associa un numero reale);

2. il prodotto vettoriale o esterno tra due vettori (che a due vettori associa un vettore);

3. il prodotto misto tra tre vettori (che a tre vettori associa un numero reale).

Esse sono dette non lineari perché prevedono operazioni con le componenti dei vettori
che non sono di primo grado.

3.7.1 Il prodotto scalare di due vettori


Il prodotto scalare, introdotto in questo paragrafo, è una particolare operazione tra due
vettori mediante la quale sarà possibile calcolare la norma di ogni vettore e individuare
l’angolo tra essi formato. Inoltre, la sua particolare espressione permetterà di estenderla
anche al caso di spazi vettoriali di dimensione superiore a tre, ma questo argomento sarà
trattato nel Capitolo 5.

Definizione 3.10 Il prodotto scalare x · y di due vettori x e y in V3 in V3 è la funzione:

· : V3 × V3 −→ R
102 Calcolo Vettoriale

cosı̀ definita:
x · y = kxkkyk cos(xy).
c (3.13)

Osservazione 3.12 1. La definizione di prodotto scalare di due vettori, appena intro-


dotta, coinvolge solo la lunghezza dei due vettori dati e l’angolo da essi formato,
quindi può essere ripetuta, allo stesso modo, per i vettori di un piano vettoriale V2 .
Vale a dire:
· : V2 × V2 −→ R, x · y = kxkkyk cos(xy). c

2. Per definizione, il risultato del prodotto scalare di due vettori può essere un numero
reale qualsiasi il cui segno è esclusivamente legato all’ampiezza dell’angolo tra i
due vettori. Precisamente se x e y sono due vettori entrambi non nulli si ha:
π
a. 0 ≤ θ < se e solo se x · y > 0;
2
π
b. < θ ≤ π se e solo se x · y < 0;
2
π
c. se θ = allora x · y = 0.
2
Se, invece, uno almeno dei due vettori x e y è il vettore nullo, allora x · y = 0.

3. Da (3.13), ponendo x = y, si ottiene la formula che permette di calcolare la norma


del vettore x: √
kxk = x · x.

4. Da (3.13) segue l’espressione del coseno dell’angolo tra due vettori non nulli x e
y, in funzione del valore del loro prodotto scalare e delle loro norme:
x·y
cos(xy)
c = .
kxkkyk

Il teorema che segue, la cui dimostrazione è una semplice conseguenza delle osservazioni
precedenti, è però estremamente importante perché esprime una condizione equivalente
all’ortogonalità di due vettori.

Teorema 3.9 Due vettori di V3 sono ortogonali se e solo se il loro prodotto scalare è
uguale a zero, in formule:

x⊥y ⇐⇒ x · y = 0, x, y ∈ V3 .

Si procede ora con lo studio dell’interpretazione geometrica del numero reale che esprime
il prodotto scalare tra due vettori, nel caso in cui questo non sia uguale a zero.
Capitolo 3 103

O p x A
H

Figura 3.10: Vettore proiezione ortogonale di y su x con x · y > 0

H p O x A

Figura 3.11: Vettore proiezione ortogonale di y su x con x · y < 0


104 Calcolo Vettoriale

Teorema 3.10 – Significato geometrico del prodotto scalare – Il prodotto scalare di


due vettori di V3 è il prodotto della lunghezza di uno dei due vettori per la proiezione
ortogonale con segno dell’altro vettore sul primo.

Dimostrazione Segue da teoremi elementari di trigonometria. Dati due vettori x e y


non nulli e non ortogonali (in caso contrario il prodotto scalare si annulla) è necessario
distinguere due casi:
π
a. θ = xy
c< ,
2
π
b. θ = xy
c> .
2
In entrambi i casi, considerando i vettori x e y rappresentati mediante segmenti orientati
−→ −−→
aventi un estremo in comune, ossia ponendo x = OA e y = OB si ha:

x · y = kxk OH, (3.14)

dove H è la proiezione ortogonale di B sulla retta OA. Pertanto il prodotto scalare di


x e di y coincide con il prodotto della norma di x per la proiezione ortogonale di y su
x. Nel primo caso OH è proprio la lunghezza del segmento proiezione ortogonale di
OB sulla retta OA, nel secondo caso OA è l’opposto di tale lunghezza. La situazione
geometrica è illustrata nelle Figure 3.10 e 3.11. Da notare che i ruoli dei vettori x e y
possono essere scambiati, nel senso che il loro prodotto scalare è anche pari alla norma di
y per la proiezione ortogonale, con segno, di x su y.

Teorema 3.11 – Vettore proiezione ortogonale – Dati due vettori x e y non nulli, il
vettore proiezione ortogonale di y su x è:
x·y
p= x. (3.15)
kxk2

Il vettore proiezione ortogonale di x su y è:


x·y
p0 = y.
kyk2

Il vettore proiezione ortogonale di y su x è, quindi, un vettore parallelo a x, mentre il


vettore proiezione ortogonale di x su y è un vettore parallelo a y.

Dimostrazione È una facile conseguenza del teorema precedente. Innanzi tutto è evi-
dente che x e y sono ortogonali se e solo se p = p0 = o. Se x e y non sono ortogonali,
Capitolo 3 105

allora la lunghezza (con segno) della proiezione ortogonale di x su y si ricava da (3.14)


ed è:
x·y
OH = ,
kxk
che coincide con la norma, con segno, del vettore p. Tenendo conto che, per costruzione,
p è parallelo a x si ha la tesi. La situazione geometrica è illustrata nelle Figure 3.10 e
3.11. Il vettore p0 si ottiene in modo analogo a p scambiando i ruoli di x e di y.

Rimane da determinare l’espressione del prodotto scalare tra due vettori usando le loro
componenti, rispetto ad una base di V3 fissata, ma per fare ciò è necessario ricavare le
proprietà del prodotto scalare in relazione alla somma di vettori e al prodotto di un numero
reale per un vettore.

Teorema 3.12 Il prodotto scalare tra due vettori gode delle seguenti proprietà:
1. x · y = y · x, x, y ∈ V3 ,
2. x · (y1 + y2 ) = x · y1 + x · y2 , x, y1 , y2 ∈ V3 ,
3. λ(x · y) = (λx) · y = x · (λy), λ ∈ R, x, y ∈ V3 .

Dimostrazione 1. È conseguenza immediata della definizione di prodotto scalare.


2. La dimostrazione si evince dalle Figure 3.12 e 3.13. In entrambi i casi sono rap-
−→ −−→
presentati i vettori con i punti indicati, in particolare y1 = AB e y2 = BC , quindi
−→
y1 + y2 = AC . Dal Teorema 3.10 segue:
x · y1 = kxk AH, x · y2 = kxk HK, x · (y1 + y2 ) = kxk AK,
tenendo conto del segno legato alle lunghezze delle proiezioni ortogonali, si pervie-
ne alla tesi.
3. Occorre distinguere tre casi:
a. λ = 0;
b. λ > 0;
c. λ < 0.
I primi due casi sono molto semplici e vengono lasciati per esercizio.
Se λ < 0 si ha:
\ = |λ|kxkkyk cos((λx)y)
(λx)·y = k(λx)kkyk cos((λx)y) \ = −|λ|kxkkyk cos(xy),
c
in quanto, essendo λ < 0, l’angolo formato dai vettori x e y è supplementare
dell’angolo formato dai vettori λx e y.
106 Calcolo Vettoriale

y2

y
2
+
y
1

B
y1
x
A H K

Figura 3.12: x · (y1 + y2 )

C
y
2

y2
+
y
1

H x
A K
y1

Figura 3.13: x · (y1 + y2 )


Capitolo 3 107

Sia B = (v1 , v2 , v3 ) una base di V3 . Dati i vettori:

x = x1 v 1 + x2 v 2 + x3 v 3 , y = y1 v1 + y2 v2 + y3 v3

di V3 , tenendo conto delle proprietà dimostrate nel Teorema 3.12, il calcolo del loro
prodotto scalare mediante le componenti, rispetto a B, risulta essere:
3
X
x·y = xi y j v i · v j
i,j=1

da cui segue che il valore di x · y dipende dai prodotti scalari tra i vettori della base B.
In altri termini, per calcolare il prodotto scalare tra due vettori è necessario conoscere, in
modo preciso, l’angolo formato tra i vettori della base che si sta usando e la loro norma.
Per rendere più agevoli i calcoli si impone, pertanto, la scelta di particolari basi in cui
siano noti a priori le lunghezze dei vettori che le compongono e gli angoli tra di essi.

Definizione 3.11 1. Una base B = (v1 , v2 , v3 ) di V3 si dice ortogonale se vi · vj = 0


per ogni i, j = 1, 2, 3.

2. Una base B = (i, j, k) di V3 si dice ortonormale se:

a. i · j = i · k = j · k = 0,
b. kik = kjk = kkk = 1,

ossia i vettori della base B sono versori a due a due ortogonali.

3. Una base B = (i, j) di un piano vettoriale V2 si dice ortonormale se:

a. i · j = 0,
b. kik = kjk = 1,

ossia i vettori della base B sono versori ortogonali.

4. Una base B = (i) di una retta vettoriale V1 si dice ortonormale se kik = 1, ossia
se è formata da un versore.

Osservazione 3.13 1. Una base ortonormale è, quindi, una base ortogonale i cui vet-
tori sono anche versori.

2. È evidente che sia nello spazio vettoriale V3 sia in ogni piano vettoriale V2 sia in
ogni retta vettoriale V1 esistono infinite basi ortonormali.
108 Calcolo Vettoriale

3. Le basi ortonormali nello spazio vettoriale V3 possono essere schematizzate nei


due grafici rappresentati nella Figura 3.14. Si osservi che la definizione di base
ortonormale in V3 non permette di distinguere tra le due situazioni geometriche,
per questo si dovrà attendere il concetto di prodotto vettoriale, definito nel Paragrafo
3.7.2.

4. Le basi ortonormali in un piano vetttoriale V2 possono essere schematizzate nei


due grafici rappresentati nella Figura 3.15. Si osservi che, anche in questo caso,
la definizione di base ortonormale in V2 non permette di distinguere tra le due
situazioni geometriche.

j
j
i
i k
k

Figura 3.14: Basi ortonormali in V3

j i

i
j

Figura 3.15: Basi ortonormali in V2


Capitolo 3 109

Usando la definizione di base ortonormale è possibile semplificare il calcolo del prodotto


scalare tra due vettori, come risulta dal teorema seguente.

Teorema 3.13 – Prodotto scalare in componenti – Sia B = (i, j, k) una base ortonor-
male di V3 e siano:

x = x1 i + x2 j + x3 k, y = y1 i + y2 j + y3 k

due vettori di V3 le cui componenti possono essere rappresentate dalle matrici colonne:
   
x1 y1
X =  x2 , Y =  y2 .
x3 y3

Il prodotto scalare tra i vettori x e y è dato da:

x · y = x1 y1 + x2 y2 + x3 y3 = tX Y.

La norma del vettore x è:


q √
kxk = x21 + x22 + x23 = tXX.

Il coseno dell’angolo formato dai vettori x e y è:


t
x1 y1 + x2 y2 + x3 y3 XY
cos(xy)
c = p p = √ √ .
x21 + x22 + x23 y12 + y22 + y32 tXX tY Y

Dimostrazione La dimostrazione segue in modo evidente dalle proprietà del prodotto


scalare e dalla definizione di base ortonormale.

Osservazione 3.14 1. Si può ripetere il Teorema 3.13 nel caso particolare di un pia-
no vettoriale V2 . Precisamente, se B = (i, j) è una base ortonormale di un piano
vettoriale V2 e x = x1 i + x2 j e y = y1 i + y2 j sono due vettori di V2 , allora:

x · y = x1 y1 + x2 y2 ,
p
kxk = x21 + x22 ,
x1 y1 + x2 y2
cos(xy)
c =p p .
x21 + x22 y12 + y22
110 Calcolo Vettoriale

2. In V3 , dati una base ortonormale B = (i, j, k) e un vettore x = x1 i + x2 j + x3 k si


ha:
i · x = x1 , j · x = x2 , k · x = x3 .
Tenendo conto del significato geometrico del prodotto scalare, ne segue che le com-
ponenti di un vettore, rispetto ad una base ortonormale, coincidono con le lunghezze
(con segno) delle proiezioni ortogonali del vettore lungo le rette vettoriali individua-
te dai vettori della base. La situazione geometrica è illustrata nella Figura 3.16. In
formule si ha:
x = (x · i)i + (x · j)j + (x · k)k.
Calcolando, invece, il coseno degli angoli formati dal vettore x con i vettori della
base ortonormale B si ha:
b = x1 , cos(jx)
cos(ix) b = x2 , cos(kx) c = x3 .
kxk kxk kxk
I coseni appena determinati sono a volte indicati con il temine coseni direttori del
vettore x per sottolineare che la direzione di x è individuata dagli angoli formati da
x con i tre vettori della base. Dall’espressione dei coseni direttori appena ricavata
segue:
cos2 (ix)
b + cos2 (jx)
b + cos2 (kx)c = 1. (3.16)

3. Il punto precedente si può ripetere, in modo totalmente analogo, nel caso di un


piano vettoriale V2 , riferito ad una base ortonormale B = (i, j). In particolare la
formula (3.16) si riduce a:
cos2 (ix)
b + cos2 (jx)
b = 1,

che coincide con la ben nota relazione di trigonometria piana sin2 α + cos2 α = 1
valida per un angolo α qualsiasi. La situazione geometrica è illustrata nella Figura
3.17.

Esercizio 3.6 In V3 , rispetto ad una base ortonormale B = (i, j, k), sono dati i vettori
u = (2, 1, 3) e v = (0, 2, 3), determinare il vettore x simmetrico di u rispetto a v.

Soluzione Indicato con p il vettore proiezione ortogonale di u su v, il vettore x,


simmetrico di u rispetto a v, è tale che:
x + u = 2p.
Dall’espressione del vettore proiezione ortogonale (3.15) si ha:
u·v 11
p= 2
v= (0, 2, 3),
kvk 13
Capitolo 3 111

k x3

j
i x1
x2

Figura 3.16: Componenti di x rispetto a B = (i, j, k)

x2
x

i x1

Figura 3.17: Componenti di x rispetto a B = (i, j)


112 Calcolo Vettoriale

quindi:  
31 27
x = 2p − u = −2, , .
13 13

Esercizio 3.7 1. In V3 , riferito ad una base ortonormale B = (i, j, k), i vettori:

a = (1, 2, 0), b = (0, 1, 1)

possono rappresentare i lati di un rettangolo?

2. Determinare i vettori v paralleli alle altezze del parallelogramma individuato da a


e da b.

Soluzione 1. I vettori a e b possono rappresentare i lati di un rettangolo se e solo se


sono ortogonali, ma a · b = 2, quindi a e b possono rappresentano i lati di un
parallelogramma non rettangolo.

2. Si determina il vettore h rappresentato nella Figura 3.18 e si lascia al Lettore il


calcolo degli altri vettori che risolvono il problema. Per costruzione, se p indica il
vettore proiezione ortogonale di b su a si ha:

p + h = b.

Da (3.15) segue:
b·a 2
p= 2
a = (1, 2, 0)
kak 5
da cui:  
2 1
h = b − p = − , ,1 .
5 5

b
h

p a

Figura 3.18: Esercizio 3.7


Capitolo 3 113

3.7.2 Il prodotto vettoriale di due vettori


Il prodotto vettoriale di due vettori, oggetto di questo paragrafo, è un’operazione parti-
colare tra due vettori che, a differenza del prodotto scalare, può essere solo definita sullo
spazio vettoriale V3 . Esistono opportune generalizzazioni di questa operazione a spazi
vettoriali di dimensione maggiore di 3, ma solo in alcuni casi particolari. Lo studio di
queste generalizzazioni non è immediato e richiede nozioni inserite spesso in corsi più
avanzati. In realtà la definizione del prodotto vettoriale è estremamente importante per
descrivere in Fisica la rotazione dei corpi e il momento angolare.

Definizione 3.12 Il prodotto vettoriale (o esterno) è una funzione:

∧ : V3 × V3 −→ V3 , (x, y) 7−→ x ∧ y.

Il vettore x ∧ y (che si legge x vettoriale y o x esterno y) è cosı̀ definito:

a. la norma di x ∧ y è kx ∧ yk = kxk kyk sin(xy),


c

b. la direzione di x ∧ y è ortogonale al piano vettoriale individuato da x e da y,

c. il verso di x ∧ y rispetta la cosiddetta regola della mano destra, ossia ponendo


l’indice della mano destra parallelamente a x, il medio parallelamente a y, la
direzione assunta naturalmente dal pollice coincide con il verso di x ∧ y.

xßy

Figura 3.19: Il prodotto vettoriale di x e di y


114 Calcolo Vettoriale

La situazione geometrica è rappresentata nella Figura 3.19.

Osservazione 3.15 La definizione di prodotto vettoriale di due vettori x e y è ancora


valida se entrambi i vettori o uno solo dei due è il vettore nullo. Infatti si ha subito che,
in questo caso, kx ∧ yk = 0, rendendo di conseguenza non rilevanti le definizioni di
direzione e verso.

Come si può immediatamente dedurre dalla definizione di prodotto vettoriale e dall’os-


servazione precedente, il prodotto vettoriale di due vettori ha norma pari a zero non solo
nel caso in cui uno dei due vettori sia il vettore nullo o entrambi i vettori siano il vettore
nullo, infatti vale il seguente teorema la cui dimostrazione è conseguenza evidente della
definizione di prodotto vettoriale.

Teorema 3.14 Due vettori x, y di V3 sono paralleli se e solo se il loro prodotto vettoriale
è uguale al vettore nullo; in formule:

x k y ⇐⇒ x ∧ y = o.

H
A x B

Figura 3.20: Significato geometrico di kx ∧ yk

Nel caso in cui il prodotto vettoriale di due vettori non sia il vettore nullo, la sua norma
assume un’interessante significato geometrico, vale, infatti, il seguente teorema.

Teorema 3.15 – Significato geometrico della norma del prodotto vettoriale – La nor-
ma del prodotto vettoriale di due vettori è pari al doppio dell’area del triangolo indi-
viduato da due segmenti orientati, rappresentanti dei vettori dati, aventi un estremo in
comune.
Capitolo 3 115

−→ −→
Dimostrazione Siano AB e AC rappresentanti dei vettori x e y rispettivamente. Con
riferimento alla Figura 3.20 e tenendo conto che:
−→ −→
kx ∧ yk = kABkkACk sin(BAC)
[

si ha la tesi.

Tramite il prodotto vettoriale di due vettori è possibile calcolare il vettore proiezione orto-
gonale di un vettore qualsiasi di V3 su un piano vettoriale, precisamente si ha il seguente
teorema.

Teorema 3.16 – Vettore proiezione ortogonale su un piano vettoriale – Dati due vetto-
ri u, v di V3 linearmente indipendenti, il vettore p proiezione ortogonale di un generico
vettore x di V3 sul piano vettoriale individuato da u e da v è dato da:

x · (u ∧ v)
p=x− (u ∧ v).
ku ∧ vk2
−→ −→
Dimostrazione Siano AB, AC i segmenti orientati rappresentanti dei vettori u e v
−−→
rispettivamente. Sia AD rappresentante del vettore x. Dalla Figura 3.21 segue che
x = p + q. Ma il vettore q non è altro che il vettore proiezione ortogonale di x su
u ∧ v. La tesi è conseguenza, quindi, del Teorema 3.11.

Osservazione 3.16 Se in un piano vettoriale si considera una base ortogonale, non è ne-
cessario usare la nozione di prodotto vettoriale di due vettori per determinare il vettore
proiezione ortogonale di ogni vettore di V3 su tale piano. Siano, infatti, a e b due vettori
ortogonali, ossia a · b = 0, la proiezione ortogonale p di un generico vettore x di V3 sul
piano vettoriale individuato da a e da b è data da:

x·a x·b
p= 2
a+ b.
kak kbk2

La formula appena citata è facile conseguenza del Teorema 3.11, ma è di grande impor-
tanza, perché si potrà facilmente estendere a spazi vettoriali di dimensione superiore a 3
(cfr. Teor. 5.5).

Teorema 3.17 Il prodotto vettoriale tra due vettori gode delle seguenti proprietà:

1. x ∧ y = −y ∧ x, x, y ∈ V3 ,

2. (λx) ∧ y = x ∧ (λy) = λ(x ∧ y), x, y ∈ V3 , λ ∈ R,


116 Calcolo Vettoriale

x
q

uïv

C
v
p H

A u B

Figura 3.21: Vettore proiezione ortogonale su un piano vettoriale


Capitolo 3 117

3. x ∧ (y + z) = x ∧ y + x ∧ z, x, y, z ∈ V3 .

Dimostrazione 1. È ovvia conseguenza della definizione di prodotto vettoriale.

2. Occorre distinguere tre casi:

a. λ = 0;
b. λ > 0;
c. λ < 0.

I primi due casi sono molto semplici e vengono lasciati per esercizio.
Se λ < 0 si deve dimostrare per esempio che:

(λx) ∧ y = λ(x ∧ y), x, y ∈ V3 .

Trattandosi di un’uguaglianza tra due vettori è necessario dimostrare che i vettori


a primo e a secondo membro abbiano la stessa lunghezza, la stessa direzione e lo
stesso verso. Per la lunghezza si ha:

\ = |λ|kxk kyk sin(π − xy)


k(λx) ∧ yk = k(λx)k kyk sin((λx)y) c = |λ|kx ∧ yk.

Le verifiche riguardanti l’uguaglianza della direzione e del verso sono lasciate per
esercizio.

3. La dimostrazione di questa proprietà è proposta nell’Esercizio 3.10.

Allo scopo di determinare l’espressione del prodotto vettoriale in funzione delle compo-
nenti dei due vettori è necessario, come per il calcolo del prodotto scalare, fissare una
base ortonormale di V3 , ma è anche fondamentale, in questo caso, distinguere tra le due
possibili configurazioni di basi ortonormali schematizzate nella Figura 3.14. Nel primo
caso si osserva che i ∧ j = k, nel secondo caso, invece, i ∧ j = −k. Si impone, quindi,
la necessità di introdurre la seguente definizione.

Definizione 3.13 1. Un base ortogonale B = (v1 , v2 , v3 ) di V3 si dice positiva se:

v1 ∧ v2 · v3 > 0.

2. Un base ortogonale B = (v1 , v2 , v3 ) di V3 si dice negativa se:

v1 ∧ v2 · v3 < 0.
118 Calcolo Vettoriale

3. Una base ortonormale B = (i, j, k) di V3 si dice positiva se:

i ∧ j = k,

cioè se:
i ∧ j · k = 1.

4. Una base ortonormale B = (i, j, k) di V3 si dice negativa se:

i ∧ j = −k,

cioè se:
i ∧ j · k = −1.

Osservazione 3.17 Si osservi che la Definizione 3.13 può essere enunciata anche nel
caso di una base qualsiasi, non necessariamente ortogonale o ortonormale.

Fissando una base ortonormale positiva è possibile ricavare in modo agevole l’espressione
del prodotto vettoriale di due vettori in componenti, come risulta dal seguente teorema.

Teorema 3.18 – Prodotto vettoriale in componenti – Sia B = (i, j, k) una base orto-
normale positiva di V3 e siano:

x = x1 i + x2 j + x3 k, y = y1 i + y2 j + y3 k

due vettori di V3 . Il prodotto vettoriale dei vettori x e y è dato da:



x2 x3 x1 x3 x1 x2
x ∧ y = i −
y1 y3 j + y1 y2 k.
(3.17)
y2 y3

Dimostrazione Essendo B = (i, j, k) una base ortonormale positiva si ha:

i ∧ j = k, k ∧ i = j, j ∧ k = i,
j ∧ i = −k, i ∧ k = −j, k ∧ j = −i.

Inoltre dal Teorema 3.14 segue:

i ∧ i = j ∧ j = k ∧ k = o.

Tenendo conto delle uguaglianze appena trascritte e applicando le proprietà del prodotto
vettoriale enunciate nel Teorema 3.17 si perviene facilmente alla tesi.
Capitolo 3 119

Osservazione 3.18 1. Si osservi che la formula (3.17) potrebbe essere scritta come
segue:
i j k

x ∧ y = x1 x2 x3 , (3.18)
y1 y2 y3
anche se l’espressione a secondo membro è priva di significato matematico, in quan-
to si indica il calcolo del determinante di un oggetto che non è una matrice. D’altra
parte è molto più facile ricordare (3.18) anziché (3.17).
2. Si osservi che dal Teorema 3.14 e dalla formula (3.17) segue che, fissata una base
ortonormale positiva B = (i, j, k), due vettori:
x = x1 i + x2 j + x3 k, y = y1 i + y2 j + y3 k
sono paralleli se e solo se:

x2 x3 x1 x3 x1 x2
=
y1 y3 = y1 y2 = 0.

y2 y3
Ciò equivale a richiedere che le componenti dei due vettori siano a due a due pro-
porzionali, ossia che i due vettori x e y siano linearmente dipendenti. A maggior
precisione si osservi che la condizione di dipendenza lineare letta sulle componenti
di due vettori è stata a suo tempo ricavata rispetto ad una base qualsiasi di V3 e non
solamente rispetto ad una base ortonormale positiva. Infatti la dipendenza lineare
equivale al parallelismo di due vettori anche in dimensione superiore a 3, come sarà
dimostrato nel Teorema 5.3.
Esercizio 3.8 Nel spazio vettoriale V3 , rispetto ad una base B = (i, j, k) ortonormale
positiva, sono dati i vettori:
a = (2, 1, 1), b = (0, 1, 1).
Determinare tutti i vettori x di V3 tali che la loro proiezione ortogonale sul piano vetto-
riale generato da a e da b sia il vettore a + b.
Soluzione I vettori richiesti sono dati da:
x = (a + b) + λ a ∧ b, λ ∈ R,
dove:

i j k
1 1
i − 2 1 j + 2 1

a ∧ b = 2 1 1 =
1 1 0 1 0 1
k = −2j + 2k.

0 1 1
Di conseguenza:
x = (a + b) + λ a ∧ b = (2, 2 − 2λ, 2 + 2λ), λ ∈ R.
120 Calcolo Vettoriale

3.7.3 Il prodotto misto di tre vettori


L’operazione tra vettori che segue, e che è anche l’ultima proposta, non è nuova ma è
definita tramite le operazioni di prodotto scalare e di prodotto vettoriale.

Definizione 3.14 Il prodotto misto di tre vettori nello spazio vettoriale V3 è la funzione:

V3 × V3 × V3 −→ R

cosı̀ definita:
(x, y, z) 7−→ x ∧ y · z.

È chiaro dalla definizione appena scritta che le operazioni di prodotto vettoriale e di


prodotto scalare sono da eseguirsi nell’ordine indicato.

Il numero reale che si ottiene dal prodotto misto di tre vettori linearmente indipendenti
dello spazio vettoriale V3 ha un importante significato geometrico, come si evince dal
teorema che segue.

xïy

D
H

y C

A
x
B

Figura 3.22: Significato geometrico del prodotto misto di tre vettori


Capitolo 3 121

Teorema 3.19 – Significato geometrico del prodotto misto – Il prodotto misto di tre
vettori non complanari di V3 è pari a 6 volte il volume, con segno, del tetraedro indivi-
duato da tre segmenti orientati, rappresentanti dei tre vettori dati, e aventi un estremo in
comune.
−→ −→ −−→
Dimostrazione Siano AB, AC, AD tre segmenti orientati rappresentanti dei vettori
x, y, z rispettivamente. Essendo, per ipotesi, i tre vettori considerati linearmente indi-
pendenti, si può supporre che il punto D non appartenga al piano individuato dai punti
A, B, C . La situazione geometrica è rappresentata nella Figura 3.22. Dalla definizione di
prodotto scalare si ha:

(x ∧ y) · z = kx ∧ ykkzk cos((x\
∧ y)z) = kx ∧ ykAH, (3.19)

dove con AH si indica la lunghezza con segno della proiezione ortogonale del vettore
z su x ∧ y. Come è noto, il segno della lunghezza della proiezione ortogonale dipende
dall’ampiezza dall’angolo che il vettore z forma con il vettore x ∧ y, ossia se questo
angolo è acuto il segno è positivo (situazione geometrica descritta nella Figura 3.22), se
l’angolo è ottuso il segno è negativo. Non si considera il caso dell’angolo retto perché,
se cosı̀ fosse, il vettore z sarebbe complanare ai vettori x e y. Ricordando il significato
geometrico della norma del prodotto vettoriale di due vettori (cfr. Teor. 3.15) la formula
(3.19) diventa:
(x ∧ y) · z = 2AABC AH = 6VABCD ,
dove AABC indica l’area del triangolo ABC e VABCD il volume (con segno) del tetraedro
ABCD.

Osservazione 3.19 1. Dalla prima proprietà del prodotto vettoriale del Teorema 3.17
e dalla prima proprietà del prodotto scalare del Teorema 3.12 si ottengono le se-
guenti proprietà del prodotto misto di tre vettori:

x∧y·z=z·x∧y (3.20)

x ∧ y · z = −y ∧ x · z. (3.21)

2. Si osservi che il segno del prodotto misto di tre vettori x, y, z dipende dall’ordine
in cui sono considerati i tre vettori come si deduce da (3.21), mentre il valore as-
soluto del prodotto misto dei tre vettori non cambia, qualunque sia l’ordine in cui i
vettori sono considerati, infatti la medesima terna di vettori, qualunque sia l’ordine,
individua lo stesso tetraedro.

Nel caso in cui tre vettori di V3 siano complanari allora vale il seguente teorema la cui
dimostrazione è una facile conseguenza delle definizioni e delle proprietà del prodotto
vettoriale e del prodotto scalare ed è lasciata al Lettore.
122 Calcolo Vettoriale

Teorema 3.20 Tre vettori di V3 sono complanari se e solo se il loro prodotto misto si
annulla.

Il teorema che segue permette di calcolare il prodotto misto mediante le componen-


ti dei vettori e, di conseguenza, di controllare mediante il calcolo in componenti, che
l’annullarsi del prodotto misto di tre vettori equivale alla loro dipendenza lineare.

Teorema 3.21 – Prodotto misto in componenti – Sia B = (i, j, k) una base ortonor-
male positiva di V3 e siano:

x = x1 i + x2 j + x3 k, y = y1 i + y2 j + y3 k, z = z1 i + z2 j + z3 k

tre vettori di V3 . Il prodotto misto di x, y, z è dato da:



x1 x2 x3

x ∧ y · z = y1 y2 y3 .

z1 z2 z3

Dimostrazione Dalle espressioni del prodotto vettoriale e del prodotto scalare in com-
ponenti si ha:
 
x2 x3 x1 x3 x1 x2
x∧y·z = y2 y3 i − y1 y3 j + y1 y2 k · (z1 i + z2 j + z3 k)


x2 x3 x1 x3 x1 x 2
= z − z + z ,
y2 y3 1 y1 y3 2 y1 y2 3

dal Primo Teorema di Laplace (cfr. Teor. 2.17) segue la tesi.

Dal Teorema appena dimostrato e da tutte le proprietà del calcolo del determinante di
una matrice quadrata di ordine 3, dimostrate nel Paragrafo 2.8, si ottengono le seguenti
proprietà del prodotto misto, alcune delle quali sono già state ricavate in precedenza e la
cui dimostrazione è lasciata al Lettore per esercizio.

Teorema 3.22 Per il prodotto misto di tre vettori valgono le seguenti proprietà:

1. x ∧ y · z = x · y ∧ z, x, y, z ∈ V3 ;

2. x ∧ y · z = z ∧ x · y = y ∧ z · x, x, y, z ∈ V3 ;

3. x ∧ y · z = 0 se e solo se i vettori x, y, z sono complanari.


Capitolo 3 123

Osservazione 3.20 La proprietà 1. del Teorema 3.22 può essere dimostrata, in generale,
indipendentemente dall’espressione in componenti dei tre vettori x, y, z. È facile dimo-
strare che, in valore assoluto, il primo membro di 1. coincide con il secondo membro,
in quanto i tre vettori individuano lo stesso tetraedro, pertanto, in valore assoluto, la pro-
prietà non esprime altro che il volume di questo tetraedro. Si perviene all’uguaglianza dei
segni dei due membri se si osserva che il segno del prodotto misto della terna di vettori
x, y, z è invariante per le loro permutazioni circolari. La dimostrazione completa si può
leggere, per esempio, in [7].

Esercizio 3.9 Nello spazio vettoriale V3 , rispetto ad una base B = (i, j, k), ortonormale
positiva, sono dati i vettori:

a = (1, 0, 1), b = (−2, 1, 0), c = (h, k, −2), h, k ∈ R.

Assegnati ad h e a k i valori
√ per cui c è parallelo al vettore a∧b, calcolare le componenti
del vettore x di norma 3, complanare ad a e a b e tale che il volume (con segno) del
tetraedro di spigoli a, c, x sia uguale a 2.

Soluzione Si ricava facilmente che a ∧ b = −i − 2j + k, quindi c è parallelo a a ∧ b se


e solo se h = 2 e k = 4, da cui c = (2, 4, −2). Sia x = x1 i + x2 j + x3 k, x è complanare
ad a e a b se e solo se x ∧ a · b = 0 ossia, in componenti, se e solo se:

x1 x2 x3

1 0 1 = 0. (3.22)

−2 1 0

Il volume con segno del tetraedro individuato dalla terna ordinata dei vettori a, c, x è
uguale a 2 se e solo se a ∧ c · x = 12, che, in componenti, equivale a:

1 0 1

2 4 −2 = 12. (3.23)

x1 x2 x3

La norma del vettore x è pari a 3 se e solo se:

x21 + x22 + x23 = 3. (3.24)

Risolvendo il sistema formato dalle equazioni (3.22), (3.23) e (3.24) si ha x = (−1, 1, 1).

Esercizio 3.10 Usando il prodotto misto di tre vettori, si dimostri la proprietà distributiva
del prodotto vettoriale rispetto alla somma di vettori:

x ∧ (y + z) = x ∧ y + x ∧ z, x, y, z ∈ V3 . (3.25)
124 Calcolo Vettoriale

Soluzione Dimostrare la proprietà (3.25) equivale a provare che:

a · [x ∧ (y + z)] = a · (x ∧ y + x ∧ z), x, y, z, a ∈ V3 , (3.26)

ovvero a dimostrare che la proiezione ortogonale del vettore a primo membro su un gene-
rico vettore a di V3 coincide con la proiezione ortogonale del vettore a secondo membro
sullo stesso vettore a di V3 . È chiaro che ciò è vero solo perché il vettore a può variare
tra tutti i vettori di V3 , questa affermazione è palesemente falsa, in caso contrario. Per
verificare (3.26) è sufficiente procedere applicando ripetutamente le varie proprietà del
prodotto misto, del prodotto vettoriale e del prodotto scalare di vettori, precisamente si
ha:
a · [x ∧ (y + z)] = (a ∧ x) · (y + z)
= (a ∧ x) · y + (a ∧ x) · z
= a·x∧y+a·x∧z
= a · (x ∧ y + x ∧ z).

3.8 Cambiamenti di basi ortonormali in V3 e in V2


Il teorema che segue permette di caratterizzare le matrici del cambiamento di base tra due
basi ortonormali.

Teorema 3.23 Sia B = (i, j, k) una base ortonormale di V3 , allora anche B 0 = (i0 , j0 , k0 )
è una base ortonormale di V3 se e solo se la matrice P del cambiamento di base da B a
B 0 verifica la condizione:
t
P P = I, (3.27)
dove I indica la matrice unità di ordine 3.

Dimostrazione Sia P = (pij ) la matrice del cambiamento di base ottenuta come


descritto nel Paragrafo 3.5, vale a dire:
 0
 i = p11 i + p21 j + p31 k

j0 = p12 i + p22 j + p32 k (3.28)

 0
k = p13 i + p23 j + p33 k.

Se sia B sia B 0 sono entrambe basi ortonormali allora:

kik2 = kjk2 = kkk2 = ki0 k2 = kj0 k2 = kk0 k2 = 1


(3.29)
i · j = i · k = j · k = i0 · j0 = i0 · k0 = j0 · k0 = 0.
Capitolo 3 125

Le precedenti relazioni, scritte in componenti, equivalgono alle seguenti equazioni:

ki0 k2 = p211 + p221 + p231 = 1,


kj0 k2 = p212 + p222 + p232 = 1,
kk0 k2 = p213 + p223 + p233 = 1,
(3.30)
i0 · j0 = j0 · i0 = p11 p12 + p21 p22 + p31 p32 = 0,
i0 · k0 = k0 · i0 = p11 p13 + p21 p23 + p31 p33 = 0,
j0 · k0 = k0 · j0 = p12 p13 + p22 p23 + p32 p33 = 0,

che equivalgono all’uguaglianza, elemento per elemento, delle matrici:


 0 0 
i ·i i0 · j0 i0 · k0
 
t
 0 0 0 0 0 0 

PP =   j · i j · j j · k  = I.
 
0 0 0 0 0 0
k ·i k ·j k ·k

Il viceversa si ottiene in modo analogo.

Osservazione 3.21 1. Si ricordi che le matrici P per cui vale la (3.27) prendono il
nome di matrici ortogonali (cfr. Par. 2.5), il Teorema 3.23 ne giustifica questa
particolare denominazione. Allora il Teorema 3.23 afferma che le matrici ortogo-
nali caratterizzano il cambiamento di base tra basi ortonormali. Si osservi anche
che le colonne di una matrice ortogonale di ordine 3 sono i vettori di una base
ortonormale.

2. Applicando il Teorema di Binet (cfr. Teor. 2.16) a (3.27) si ha:

det(tP P ) = det(tP ) det(P ) = (det(P ))2 = det(I) = 1,

quindi:
det(P ) = ±1.
Si perviene allo stesso risultato ricordando l’espressione in componenti del prodotto
misto di tre vettori, infatti:

det(P ) = i0 ∧ j0 · k0 = ±1.

Quindi il cambiamento di base tra due basi ortonormali positive è caratterizza-


to da una matrice ortogonale con determinante uguale a 1, in caso contrario il
determinante della matrice ortogonale è −1.
126 Calcolo Vettoriale

3. Si osservi che è fondamentale richiedere nel Teorema 3.23 che entrambe le basi B e
B 0 siano basi ortonormali, infatti le relazioni (3.30) non sarebbero valide se B non
fosse una base ortonormale (cfr. Teor. 3.13), anche se B 0 fosse ortonormale.

4. Il Teorema 3.23 è valido anche nel caso del cambiamento di base tra due ba-
si ortonormali in ogni piano vettoriale V2 , si studierà di seguito l’interpretazione
geometrica in questo caso particolare.

5. Il Teorema 3.23 propone un’altra interpretazione del prodotto righe per colonne di
matrici quadrate di ordine 3 e di ordine 2; infatti il prodotto di una riga per una
colonna può essere considerato come il prodotto scalare tra la riga e la colonna se
i proprii elementi si interpretano come le componenti di un vettore rispetto ad una
base ortonormale.

j' i'

Θ
i

Figura 3.23: Cambiamento di basi ortonormali in V2 , primo caso

Si consideri ora il caso particolare del cambiamento di base tra basi ortonormali in un
piano vettoriale V2 con lo scopo di determinare gli elementi della matrice ortogonale
P = (pij ) ∈ R2,2 che lo regola. Date due basi ortonormali B = (i, j) e B 0 = (i0 , j0 )
la seconda base si può ottenere dalla prima in uno dei modi rappresentati nelle Figure
3.23, 3.24, 3.25. Si osservi che le prime due figure sono in realtà dello stesso tipo e
corrispondono ad una rotazione che la base B compie per sovrapporsi alla base B 0 , invece
nella terza figura la base B deve effettuare un movimento di riflessione (non interno al
piano vettoriale V2 ) per sovrapporsi alla base B 0 .
Capitolo 3 127

j'

-Θ i

i'

Figura 3.24: Cambiamento di basi ortonormali in V2 , secondo caso

j
i' j'

Figura 3.25: Cambiamento di basi ortonormali in V2 , terzo caso


128 Calcolo Vettoriale

Nel primo caso (cfr. Fig. 3.23) si ha:


 0
 i = cos θ i + sin θ j

 j0 = cos θ + π i + sin θ + π j = − sin θ i + cos θ j,


   

2 2
quindi la matrice del cambiamento di base da B a B 0 è:
 
cos θ − sin θ
P = . (3.31)
sin θ cos θ

Si osservi che det(P ) = 1. In questo contesto, per mettere in evidenza la dipendenza


della matrice P dall’angolo θ, è preferibile usare la notazione:

P = R[θ].

Nel secondo caso (cfr. Fig. 3.24), con un procedimento analogo a quello appena descritto,
si ottiene:  
cos θ sin θ
R[−θ] = , (3.32)
− sin θ cos θ
anche in questo caso det(R[−θ]) = 1. Si osservi che la matrice (3.32) corrisponde alla
matrice (3.31) in cui al posto di θ si considera l’angolo −θ.

Nel terzo caso (cfr. Fig. 3.25) si ha:


 
cos θ sin θ
P = . (3.33)
sin θ − cos θ

invece, in questo caso det(P ) = −1.

Si conclude, quindi, in modo totalmente coerente con ciò che si è ottenuto nel caso dello
spazio vettoriale V3 , che il cambiamento di base tra due basi ortonormali positive nel
piano vettoriale si ottiene mediante una matrice ortogonale con determinante pari a 1 e,
in caso contrario tramite una matrice ortogonale con determinante pari a −1.

Esercizio 3.11 Si dimostri che gli elementi di O(2), ovvero le matrici ortogonali di or-
dine 2, sono necessariamente o di tipo (3.31) o di tipo (3.33). Inoltre, si provi che
O(1) = {−1, 1}.

Esercizio 3.12 In un piano vettoriale V2 , a partire da B = (i, j), base ortonormale po-
sitiva, si consideri il cambiamento di base ottenuto mediante una rotazione di angolo θ1
Capitolo 3 129

che conduce alla base ortonormale positiva B 0 = (i0 , j0 ) mediante la matrice ortogonale
R[θ1 ]. A partire dalla base ortonormale positiva B 0 = (i0 , j0 ) si consideri la rotazione di
angolo θ2 che conduce alla base ortonormale positiva B 00 = (i00 , j00 ) mediante la matrice
ortogonale R[θ2 ]. Si dimostri che la matrice del cambiamento di base dalla base ortonor-
male positiva B = (i, j) alla base ortonormale positiva B 00 = (i00 , j00 ), corrispondente alla
rotazione di angolo θ1 + θ2 , è la matrice prodotto R[θ1 ]R[θ2 ]. Si ripeta lo stesso esercizio
dove, al posto delle rotazioni, si considerano riflessioni.

3.9 Esercizi di riepilogo svolti


Esercizio 3.13 Nello spazio vettoriale V3 si considerino i vettori x e y tali che:

kxk = 5, kyk = 7, kx + yk = 10.

Determinare kx − yk.

Soluzione Applicando la definizione e le proprietà del prodotto scalare si ha:

kx + yk2 = (x + y) · (x + y) = kxk2 + 2x · y + kyk2 ,

d’altra parte:

kx − yk2 = (x − y) · (x − y) = kxk2 − 2x · y + kyk2

e quindi:
kx + yk2 + kx − yk2 = 2 (kxk2 + kyk2 )
da cui:
kx − yk2 = 2(25 + 49) − 100 = 48.

Esercizio 3.14 Siano u, v, w vettori linearmente indipendenti di V3 . Dimostrare che se


z è un vettore di V3 ortogonale a ciascuno di essi allora z = o.

Soluzione Osservato che (u, v, w) è una base di V3 è sufficiente dimostrare che se z è


ortogonale ad un generico vettore:

x = λu + µv + ν w

di V3 , con λ, µ, ν ∈ R, allora z = o. Infatti si ha:

z · x = z · (λu + µv + ν w) = λ z · u + µ z · v + ν z · w = 0,

in quanto, per ipotesi, z · u = z · v = z · w = 0. In particolare z · z = kzk2 = 0, quindi


z = o.
130 Calcolo Vettoriale

Esercizio 3.15 Dimostrare che, se i vettori a, b, c di V3 sono non nulli e a due a due
ortogonali, anche i vettori:
a ∧ b, b ∧ c, c ∧ a
sono non nulli e a due a due ortogonali.

Soluzione Per definizione di prodotto vettoriale di due vettori, a ∧ b è ortogonale sia


ad a sia a b, quindi è parallelo a c, da cui:

a ∧ b = λ c,

dove λ è un numero reale non nullo. Analogamente si ha b ∧ c = µ a e c ∧ a = ν b


con µ 6= 0, ν 6= 0. Pertanto a ∧ b, b ∧ c, c ∧ a sono non nulli e a due a due ortogonali
essendo paralleli a vettori non nulli, a due a due ortogonali.

Esercizio 3.16 In V3 , dimostrare che, se i vettori a ∧ b, b ∧ c, c ∧ a sono linearmente


indipendenti anche i vettori a, b e c sono linearmente indipendenti.

Soluzione Se i vettori a, b, c fossero linearmente dipendenti essi sarebbero complanari


e quindi i vettori a ∧ b, b ∧ c, c ∧ a, per definizione di prodotto vettoriale, sarebbero
paralleli che è assurdo.

Esercizio 3.17 In V3 , rispetto ad una base ortonormale positiva B = (i, j, k), sono dati i
vettori:
a = (−h, 3h, 1), b = (0, 3, h), c = (1, 1, h), h ∈ R.

1. Determinare i valori di h per cui a, b, c non formano una base di V3 .

2. Determinare dei valori di h per cui esistono dei vettori x = (x1 , x2 , x3 ) tali che:

x∧a=b

e calcolarne le componenti.

Soluzione 1. I vettori a, b, c non formano una base di V3 se sono linearmente dipen-


denti, ossia se la matrice:
 
−h 3h 1
A= 0 3 h 
1 1 h

le cui righe sono date dalle componenti dei vettori a, b, c ha determinante uguale

a zero. Si ha che det(A) = h2 − 3, quindi i valori di h richiesti sono h = ± 3.
Capitolo 3 131

2. Da x ∧ a = b si ha:
i j k

x1 x2 x3 = 3j + hk.

−h 3h 1
Uguagliando ordinatamente le componenti del vettore a primo membro a quelle del
vettore a secondo membro si perviene al sistema lineare:

 x2 − 3hx3 = 0
−x1 − hx3 = 3
3hx1 + hx2 = h,

che non ammette soluzioni se h 6= 0; invece se h = 0 i vettori x = (−3, 0, t), per


ogni t ∈ R, verificano l’uguaglianza richiesta.

3.10 Per saperne di più


3.10.1 Un’altra definizione di vettore
In questo paragrafo viene introdotta una definizione di vettore più rigorosa, che si basa
sul concetto di relazione di equivalenza e di classi di equivalenza.

Definizione 3.15 Due segmenti orientati AB e CD dello spazio S3 sono detti equipol-
lenti se i punti medi dei segmenti AD e BC coincidono. La situazione geometrica è
illustrata nella Figura 3.26.

C D

A B
Figura 3.26: Segmenti orientati equipollenti

Per indicare che i segmenti orientati AB e CD sono equipollenti si userà la notazione


AB ∼ CD.
132 Calcolo Vettoriale

Teorema 3.24 La relazione di equipollenza è una relazione di equivalenza.

Dimostrazione È sufficiente verificare che sono valide le seguenti proprietà:

1. la proprietà riflessiva: AB ∼ AB , per ogni coppia di punti A e B ;

2. la proprietà simmetrica: se dati i segmenti orientati AB e CD per cui AB ∼ CD


allora CD ∼ AB ;

3. la proprietà transitiva: se dati i segmenti orientati AB , CD ed EF tali che


AB ∼ CD e CD ∼ EF allora AB ∼ EF .

La dimostrazione segue dalla definizione di equipollenza ed è lasciata per esercizio.

Di conseguenza, l’insieme dei segmenti orientati dello spazio viene suddiviso nelle classi
di equivalenza determinate dalla relazione di equipollenza, dette classi di equipollenza,
ogni classe contiene tutti e soli i segmenti orientati equipollenti ad un segmento dato e
può essere rappresentata da un qualsiasi segmento che ad essa appartiene. Allora si ha la
seguente definizione.

Definizione 3.16 Le classi di equipollenza dello spazio S3 sono dette vettori.

È chiaro che la definizione intuitiva di vettore introdotta all’inizio di questo capitolo


coincide con la definizione più rigorosa di vettore appena enunciata.

3.10.2 Ulteriori proprietà delle operazioni tra vettori


In questo paragrafo verranno riassunte alcune proprietà delle operazioni tra vettori stu-
diate in questo capitolo e non introdotte in precedenza, che anche se hanno conseguenze
importanti nello studio approfondito di argomenti di geometria e di fisica, possono essere
omesse ad una prima lettura.

Teorema 3.25 Sono valide le seguenti proprietà per il prodotto vettoriale e scalare tra
vettori:

1. (x ∧ y) ∧ z = (x · z) y − (y · z) x, x, y, z ∈ V3 ;

2. (x ∧ y) ∧ (z ∧ w) = (w · x ∧ y) z − (z · x ∧ y) w, x, y, z, w ∈ V3 ;

3. (x ∧ y) · (z ∧ w) = (x · z)(y · w) − (x · w)(y.z), x, y, z, w ∈ V3 ;

4. (x ∧ y) ∧ z + (y ∧ z) ∧ x + (z ∧ x) ∧ y = o, x, y, z ∈ V3 .
Capitolo 3 133

Dimostrazione 1. Si supponga che x, y, z siano vettori di V3 non complanari, negli


altri casi si lascia per esercizio la dimostrazione dell’identità 1. Il vettore
(x ∧ y) ∧ z è ortogonale al vettore x ∧ y e quindi appartiene al piano vettoriale
individuato da x e da y. Esistono pertanto due numeri reali λ, µ tali che:

(x ∧ y) ∧ z = λx + µy. (3.34)

Se si moltiplicano ambo i membri di (3.34) scalarmente per z, si ottiene a primo


membro:
(x ∧ y) ∧ z · z = (x ∧ y) · z ∧ z = 0
e a secondo membro:
λx · z + µy · z = 0,
da cui segue che è possibile determinare un numero reale ρ per cui:

λ = −ρ(y · z), µ = ρ(x · z).

L’identità 1. è dimostrata se si verifica che ρ non dipende dalla scelta dei vettori
x, y, z. Supposto per assurdo che ρ dipenda, ad esempio, da z, si ponga:

(x ∧ y) ∧ z = ρ(z)[(x · z)y − (y · z)x]. (3.35)

Scelto un vettore arbitrario a di V3 , moltiplicando scalarmente ambo i membri di


(3.35) per a, si ha:

(z ∧ a) · (y ∧ x) = ρ(z)[(x · z)(y · a) − (y · z)(x · a)]. (3.36)

Scambiando nell’identità (3.36) i vettori z e a si ottiene:

ρ(z)[(x · z)(y · a) − (y · z)(x · a)] = ρ(a)[(x · z)(y · a) − (y · z)(x · a)].

Quindi si deduce che ρ(a) = ρ(z). In modo analogo si dimostra che ρ non dipende
dai vettori x e w.

2. Segue da 1. sostituendo a z il vettore z ∧ w e scambiando i ruoli di x e y con z e


w, rispettivamente.

3. Segue da 1. moltiplicando scalarmente ambo i membri per w.

4. Segue da 1. in modo immediato.


134 Calcolo Vettoriale

Osservazione 3.22 1. Siano x, y, z vettori di V3 non complanari. L’identità 1. del


Teorema 3.25 prende il nome di doppio prodotto vettoriale ed esprime il fatto che
il vettore (x ∧ y) ∧ z appartiene al piano vettoriale individuato dai vettori x e y.
È evidente da questa identità che non vale, in generale, la proprietà associativa del
prodotto vettoriale, infatti:

(x ∧ y) ∧ z 6= x ∧ (y ∧ z),

in quanto il vettore x ∧ (y ∧ z) appartiene al piano vettoriale individuato da y e da


z che, in generale, non coincide con il piano vettoriale individuato da x e da y.

2. Se nell’identità 3. del Teorema 3.25 si pone x = z e y = w si ha:

kx ∧ yk2 = kxk2 kyk2 − (x · y)2 .

La relazione appena ottenuta è nota come identità di Lagrange. È di grande im-


portanza nello studio delle proprietà delle superfici nello spazio, (cfr. per esem-
pio [11]), in quanto esprime la norma del prodotto vettoriale di due vettori solo
in termini del loro prodotto scalare. È anche doveroso osservare che l’identità di
Lagrange ha una dimostrazione elementare (che viene lasciata per esercizio) senza
necessariamente considerare la dimostrazione dell’identità 3.

3. La relazione 4. del Teorema 3.25 prende il nome di identità di Jacobi e riveste


un’importanza notevole nello studio delle algebre di Lie. Per maggiori approfondi-
menti sull’argomento si vedano per esempio [2] o [13].
Capitolo 4

Spazi Vettoriali e Sottospazi Vettoriali

4.1 Spazi vettoriali


In questo paragrafo viene introdotta la definizione di spazio vettoriale, concetto su cui
si basa l’algebra lineare. Nel testo si studieranno, salvo avviso contrario, solo gli spazi
vettoriali costruiti sul campo dei numeri reali, cioè solo spazi vettoriali reali. Cenni sugli
spazi vettoriali complessi sono stati inseriti nei paragrafi “Per saperne di più”.
La definizione di spazio vettoriale trae origine dal ben noto esempio dell’insieme dei vet-
tori V3 nello spazio tridimensionale ordinario, trattato nel capitolo precedente. Si intende
introdurre tale concetto in modo astratto con il duplice scopo di dimostrare teoremi dalle
conseguenze fondamentali nel caso dello spazio vettoriale ordinario V3 e di estendere tali
nozioni a spazi vettoriali di dimensione superiore a tre.

Definizione 4.1 Un insieme V si dice spazio vettoriale sul campo dei numeri reali R o
spazio vettoriale reale se sono definite su V le due operazioni seguenti:

A. la somma:
+ : V × V −→ V, (x, y) 7−→ x + y
rispetto alla quale V ha la struttura di gruppo commutativo, ossia valgono le proprietà:

1. x + y = y + x, x, y ∈ V (proprietà commutativa);

2. (x + y) + z = x + (y + z), x, y, z ∈ V (proprietà associativa);

3. ∃ o ∈ V | x + o = x, x ∈ V (esistenza dell’elemento neutro);

4. ∀x ∈ V ∃ − x ∈ V | x + (−x) = o (esistenza dell’opposto);

135
136 Spazi Vettoriali e Sottospazi Vettoriali

B. il prodotto per numeri reali:


R × V −→ V, (λ, x) 7−→ λx
per cui valgono le seguenti proprietà:

1. λ(x + y) = λx + λy, x, y ∈ V, λ ∈ R;
2. (λ + µ)x = λx + µx, x ∈ V, λ, µ ∈ R;
3. (λµ)x = λ(µx), x ∈ V, λ, µ ∈ R;
4. 1 x = x, x∈V.

Gli elementi di V prendono il nome di vettori e saranno, in generale, indicati con le


lettere minuscole in grassetto. Gli elementi di R prendono il nome di scalari, quindi il
prodotto di un numero reale per un vettore è spesso anche detto prodotto di uno scalare
per un vettore. L’elemento neutro o di V è detto vettore nullo, mentre il vettore −x è
l’opposto del vettore x.

Osservazione 4.1 Si può introdurre una definizione analoga di spazio vettoriale ma co-
struito su un qualsiasi campo, per esempio sul campo dei numeri razionali Q o dei numeri
complessi C. Nel caso della definizione su C, lo spazio vettoriale si dice anche spazio
vettoriale complesso.

Osservazione 4.2 È chiaro che il campo dei numeri reali R è un esempio evidente di
spazio vettoriale su R rispetto alle usuali operazioni di somma e di prodotto, come del
resto si otterrrà come caso particolare dell’Esempio 4.3, ma R è anche un esempio di
spazio vettoriale sul campo dei numeri razionali Q.

Osservazione 4.3 Si osservi che le proprietà B.1. e B.2., a differenza di quanto accade
per (R, +, · ) con l’usuale somma e prodotto di numeri reali, non possono essere chiama-
te proprietà distributive del prodotto rispetto alla somma, in quanto esse coinvolgono ele-
menti appartenenti ad insiemi diversi. Analogamente, la proprietà B.3. non è la proprietà
associativa.

Verranno descritti di seguito gli esempi ritenuti più significativi, si rimanda al Paragrafo
4.5 per ulteriori esempi ed esercizi.

Esempio 4.1 Si inizia con gli esempi che hanno dato il nome alla struttura di spazio
vettoriale appena definita. Gli insiemi dei vettori di una retta vettoriale V1 , di un piano
vettoriale V2 e dello spazio vettoriale ordinario V3 sono esempi di spazi vettoriali su R,
rispetto alle operazioni di somma di vettori e di prodotto di un numero reale per un vettore
definite nel Capitolo 3.
Capitolo 4 137

Esempio 4.2 Gli insiemi delle matrici Rm,n di m righe e n colonne, ad elementi reali,
definiti nel Capitolo 2, sono esempi di spazi vettoriali reali rispetto alle operazioni di
somma di matrici e di prodotto di un numero reale per una matrice là definite.

Esempio 4.3 L’esempio fondamentale:

Rn = {(x1 , x2 , . . . , xn ) | xi ∈ R, i = 1, 2, . . . , n}

è un caso particolare dell’esempio precedente ma, visto il ruolo fondamentale che avrà in
tutto il testo, verrà trattato a parte.
La somma di due n-uple (x1 , x2 , . . . , xn ) e (y1 , y2 , . . . , yn ) di Rn è definita come:

(x1 , x2 , . . . , xn ) + (y1 , y2 , . . . , yn ) = (x1 + y1 , x2 + y2 , . . . , xn + yn ).

Il vettore nullo di Rn è dato dalla n-upla (0, 0,. . ., 0) e l’opposto del vettore (x1 , x2 ,. . ., xn )
è il vettore (−x1 , −x2 , . . . , −xn ). Il prodotto di un numero reale λ per un elemento
(x1 , x2 , . . . , xn ) di Rn è definito da:

λ(x1 , x2 , . . . , xn ) = (λx1 , λx2 , . . . , λxn ).

Esempio 4.4 Il campo dei numeri razionali Q è un esempio di spazio vettoriale su Q


(ma non su R), analogamente il campo dei numeri complessi C ha la struttura di spazio
vettoriale su se stesso e anche su R. Si lascia per esercizio la spiegazione dettagliata di
tali affermazioni.

Esempio 4.5 L’insieme delle funzioni reali di variabile reale F(R) = {f : R −→ R} è


un esempio di spazio vettoriale su R, dove la somma di due elementi f e g di F(R) è
definita da:
(f + g)(x) = f (x) + g(x), x ∈ R
e il prodotto di un numero reale λ per una funzione f ∈ F(R) è:

(λf )(x) = λ(f (x)), x ∈ R.


Si verifica facilmente che il vettore nullo è la funzione nulla O, definita da O(x) = 0,
con x ∈ R, l’opposto di f è la funzione −f definita in modo evidente:

(−f )(x) = −f (x), x ∈ R.


Più in generale, anche l’insieme delle funzioni F(I, V ) = {F : I −→ V } da un insieme
I qualsiasi ad uno spazio vettoriale reale V ha la struttura di spazio vettoriale su R in
cui la somma di funzioni ed il prodotto di un numero reale per una funzione sono definite
come nel caso di F(R) ma considerando le operazioni dello spazio vettoriale V.
138 Spazi Vettoriali e Sottospazi Vettoriali

Esempio 4.6 Sia R[x] l’insieme dei polinomi nella variabile x a coefficienti reali, ossia:

R[x] = {a0 + a1 x + . . . + an xn | n ∈ N, ai ∈ R, i = 0, 1, . . . , n},


(N = {0, 1, 2, . . .} indica l’insieme dei numeri naturali). Le usuali operazioni di somma
di polinomi e di prodotto di un numero reale per un polinomio conferiscono a R[x] la
struttura di spazio vettoriale reale. Il vettore nullo è dato dal numero reale 0 e l’opposto
del polinomio p(x) = a0 + a1 x + a2 x2 + . . . + an xn è il polinomio:

−p(x) = −a0 − a1 x − a2 x2 − . . . − an xn .

Vale il seguente teorema, il cui enunciato è naturalmente intuibile.

Teorema 4.1 In uno spazio vettoriale reale V si ha:

1. il vettore nullo o è unico;

2. per ogni vettore x ∈ V l’opposto −x è unico;

3. se per x, y, z ∈ V si ha x + y = x + z, allora y = z;

4. λx = o (con λ ∈ R e x ∈ V ) ⇐⇒ λ = 0 oppure x = o;

5. (−1)x = −x, per ogni x ∈ V.

Dimostrazione La dimostrazione, quasi un esercizio, si può leggere nel Paragrafo


4.5.

Osservazione 4.4 L’insieme {o} formato dal solo vettore nullo è un esempio di spazio
vettoriale reale. Si osservi che è l’unico spazio vettoriale reale con un numero finito di
elementi.

4.2 Sottospazi vettoriali


La nozione di sottospazio vettoriale di uno spazio vettoriale reale, oggetto di questo para-
grafo, intende estendere il concetto, già considerato nel capitolo precedente, degli insiemi
dei vettori di una retta vettoriale V1 e di un piano vettoriale V2 visti come sottoinsiemi
dello spazio vettoriale V3 .
Capitolo 4 139

4.2.1 Definizione ed esempi


Definizione 4.2 Sia V uno spazio vettoriale reale, un sottoinsieme W ⊆ V è un sotto-
spazio vettoriale di V se W è uno spazio vettoriale rispetto alle stesse operazioni di V,
ossia se è chiuso rispetto alle operazioni di somma e di prodotto per scalari definite in V,
vale a dire:

∀x, y ∈ W =⇒ x + y ∈ W,

∀λ ∈ R, ∀x ∈ W =⇒ λx ∈ W,
che equivale a:

∀λ, µ ∈ R, ∀x, y ∈ W =⇒ λx + µy ∈ W.

Osservazione 4.5 1. Un sottoinsieme H di un gruppo G è un sottogruppo se è un


gruppo con il prodotto definito in G. Pertanto, poiché uno spazio vettoriale V è un
gruppo commutativo rispetto all’operazione di somma, un sottospazio vettoriale W
di V è un sottogruppo di V.
2. Segue dalla Definizione 4.2 e dalla proprietà 4. del Teorema 4.1 che il vettore nullo
o di uno spazio vettoriale V deve necessariamente appartenere ad ogni sottospazio
vettoriale W di V.

Esempio 4.7 Ogni spazio vettoriale V ammette almeno due sottospazi vettoriali: V e
{o}. Essi coincidono se e solo se V = {o}. Tali sottospazi vettoriali si dicono improprii.

Esempio 4.8 L’insieme dei vettori ordinari di ogni piano vettoriale V2 è un sottospazio
vettoriale dell’insieme dei vettori dello spazio V3 . L’insieme dei vettori di una retta vet-
toriale V1 è un sottospazio vettoriale del piano vettoriale V2 che la contiene e ogni retta
vettoriale è un sottospazio vettoriale di V3 .

Esempio 4.9 Si osservi che, nonostante Q sia un sottoinsieme di R, l’insieme dei numeri
razionali Q (spazio vettoriale su Q) non è un sottospazio vettoriale dello spazio vettoriale
reale R, in quanto su Q non è definito lo stesso prodotto per scalari di R. Infatti, il
prodotto di un numero reale per un numero razionale non è necessariamente razionale.

Esempio 4.10 Sia a ∈ R e fa : R −→ R la funzione definita da fa (x) = ax; l’insieme:


W = {fa ∈ F(R) | a ∈ R}
è un sottospazio vettoriale dello spazio vettoriale reale F(R) introdotto nell’Esempio
4.5. Infatti se fa , fb ∈ W , allora per ogni λ, µ ∈ R, si ha che λfa + µfb ∈ W, poiché
λfa + µfb = fλa+µb . La verifica è lasciata al Lettore per esercizio.
140 Spazi Vettoriali e Sottospazi Vettoriali

Esempio 4.11 Sia R[x] lo spazio vettoriale dei polinomi nella variabile x a coefficienti
reali, introdotto nell’Esempio 4.6. Sottospazi vettoriali notevoli di R[x] sono gli insiemi
dei polinomi di grado non superiore ad un numero intero positivo fissato n. In formule, si
indica con:

Rn [x] = {a0 + a1 x + a2 x2 + . . . + an xn | ai ∈ R, i = 0, 1, 2, . . . , n}

il sottospazio vettoriale dei polinomi di grado minore o uguale ad n. La verifica che


Rn [x] sia un sottospazio vettoriale di R[x] è lasciata per esercizio. In particolare, quindi,
l’insieme R è un sottospazio vettoriale di R[x] in quanto può essere visto come l’insieme
dei polinomi di grado zero. In generale, l’insieme dei polinomi di grado fissato n > 0
non è un sottospazio vettoriale di R[x], anche se è un sottoinsieme di Rn [x]. Infatti, per
esempio, l’insieme dei polinomi di grado 3:

P = {a0 + a1 x + a2 x2 + a3 x3 ∈ R3 [x] | ai ∈ R, i = 0, 1, 2, 3, a3 6= 0}

non è un sottospazio vettoriale di R3 [x] in quanto non contiene il vettore nullo di R3 [x].

Viene trattata ora la rappresentazione mediante equazioni dei sottospazi vettoriali dello
spazio vettoriale Rn . Per capire meglio la teoria, si inizia con un esercizio.

Esercizio 4.1 Dati i seguenti sottoinsiemi di R3 :

A = {(x1 , x2 , x3 ) ∈ R3 | 2x1 + 3x2 − x3 = 0},

B = {(x1 , x2 , x3 ) ∈ R3 | 2x1 + 3x2 − x3 = x2 + x3 = 0},

C = {(x1 , x2 , x3 ) ∈ R3 | 2x1 + 3x2 − x3 = 5},

D = {(x1 , x2 , x3 ) ∈ R3 | 2x21 + 3x2 − x3 = 0},

dire quali sono sottospazi vettoriali di R3 giustificando la risposta.

Soluzione A è un sottospazio vettoriale di R3 . Infatti, siano (x1 , x2 , x3 ) e (y1 , y2 , y3 )


due elementi di A ossia tali che 2x1 + 3x2 − x3 = 2y1 + 3y2 − y3 = 0, si verifica che la
loro somma (x1 + y1 , x2 + y2 , x3 + y3 ) è un elemento di A, vale a dire:

2(x1 + y1 ) + 3(x2 + y2 ) − (x3 + y3 ) = 0,

che è ovvia conseguenza dell’appartenenza ad A di (x1 , x2 , x3 ) e di (y1 , y2 , y3 ). Ana-


logamente si verifica che λ(x1 , x2 , x3 ) = (λx1 , λx2 , λx3 ) è un elemento di A per ogni
λ ∈ R e per ogni (x1 , x2 , x3 ) ∈ A.
Capitolo 4 141

Si dimostra in modo analogo che B è un sottospazio vettoriale di R3 .


È facile osservare che C non è un sottospazio vettoriale di R3 perché non contiene il
vettore nullo di R3 , in altri termini l’equazione lineare che definisce C non è omogenea.
D non è un sottospazio vettoriale di R3 , pur contenendo il vettore nullo di R3 , infatti dati
(1, 0, 2), (2, 0, 8) ∈ D la loro somma (3, 0, 10) non appartiene a D in quanto 2·32−10 6= 0.

L’esercizio precedente suggerisce il seguente risultato di carattere generale.

Esempio 4.12 – Esempio fondamentale di sottospazio vettoriale – L’insieme delle so-


luzioni di un sistema lineare omogeneo di m equazioni in n incognite è un sottospazio
vettoriale di Rn . La verifica, che è conseguenza evidente dell’esempio precedente, può
essere anche ottenuta procedendo in modo sintetico. Infatti, usando la notazione matri-
ciale di un sistema lineare omogeneo AX = O, con A ∈ Rm,n , X ∈ Rn,1 , O ∈ Rm,1 (cfr.
Par. 2.2.1), si ha che l’insieme delle soluzioni del sistema lineare omogeneo AX = O
coincide con l’insieme:

N (A) = {X ∈ Rn | AX = O},

dove si identifica Rn,1 con Rn . Dati X1 , X2 ∈ N (A), allora AX1 = AX2 = O. Si deve
dimostrare che λX1 + µX2 ∈ N (A) per ogni λ, µ ∈ R, ma:

A(λX1 + µX2 ) = λAX1 + µAX2 = O.

Il sottospazio vettoriale N (A) di Rn prende il nome di nullspace (o annullatore o nullifi-


catore) della matrice A ∈ Rm,n .

Esercizio 4.2 Ogni sottospazio vettoriale, diverso da {o}, di uno spazio vettoriale reale
contiene sempre un numero infinito di vettori?

Si continua ora con un elenco di sottospazi vettoriali notevoli dello spazio vettoriale delle
matrici Rm,n . Le verifiche sono lasciate per esercizio.

Esempio 4.13 Il sottoinsieme D(Rn,n ) di Rn,n (spazio vettoriale delle matrici quadrate
di ordine n) formato dalle matrici diagonali, definito in (2.2), è un sottospazio vettoriale
di Rn,n .

Esempio 4.14 Il sottoinsieme T (Rn,n ) di Rn,n delle matrici triangolari superiori, definite
in (2.6), è un sottospazio vettoriale di Rn,n ; analoga affermazione vale per il sottoinsieme
delle matrici triangolari inferiori.
142 Spazi Vettoriali e Sottospazi Vettoriali

Esempio 4.15 L’insieme delle matrici simmetriche (cfr. (2.7)):

S(Rn,n ) = {A ∈ Rn,n | tA = A}

è un sottospazio vettoriale di Rn,n , infatti se A1 , A2 ∈ S(Rn,n ) si ha che tA1 = A1 e


t
A2 = A2 , allora t (A1 + A2 ) = tA1 + tA2 = A1 + A2 , la dimostrazione della chiusura
rispetto al prodotto per un numero reale è lasciata per esercizio.

Esempio 4.16 L’insieme delle matrici antisimmetriche (cfr. (2.8)):

A(Rn,n ) = {A ∈ Rn,n | tA + A = O}

è un sottospazio vettoriale di Rn,n (per la dimostrazione si procede in modo analogo


all’esempio precedente).

Osservazione 4.6 Si osservi che l’insieme delle matrici ortogonali (cfr. (2.9)):

O(n) = {A ∈ Rn,n | tA A = I}

non è un sottospazio vettoriale di Rn,n , perché non contiene il vettore nullo di Rn,n .

Osservazione 4.7 Si osservi che l’insieme:

{A ∈ Rn,n | det(A) = 0}

non è un sottospazio vettoriale di Rn,n , se n > 1. Perché?

Osservazione 4.8 Si osservi che l’insieme:

{A ∈ Rn,n | tr(A) = 0}

è un sottospazio vettoriale di Rn,n , mentre l’insieme:

{A ∈ Rn,n | tr(A) = 2}

non lo è.

Esempio 4.17 In R4 [x] si consideri l’insieme W dei polinomi divisibili per 3x − 1.


Si può verificare che W è un sottospazio vettoriale di R4 [x]. Infatti ogni polinomio
p(x) ∈ W è della forma p(x) = (3x − 1)q(x), con q(x) polinomio di grado ≤ 3. Quindi,
per ogni p1 (x) = (3x − 1)q1 (x), p2 (x) = (3x − 1)q2 (x) ∈ W e per ogni λ, µ ∈ R, si ha:

λp1 (x) + µp2 (x) = λ(3x − 1)q1 (x) + µ(3x − 1)q2 (x)
= (3x − 1)(λq1 (x) + µq2 (x)) ∈ W.
Capitolo 4 143

4.2.2 Intersezione e somma di sottospazi vettoriali


Dati due sottospazi vettoriali W1 , W2 di uno spazio vettoriale reale V, si vuole stabilire
se la loro intersezione insiemistica e la loro unione insiemistica siano ancora sottospazi
vettoriali di V. Si inizia con il seguente teorema.

Teorema 4.2 L’intersezione insiemistica W1 ∩ W2 è un sottospazio vettoriale di V.

Dimostrazione È immediata conseguenza delle definizioni di sottospazio vettoriale e


di intersezione insiemistica.

Esempio 4.18 Si considerino i sottospazi vettoriali di R3 :


W1 = {(x1 , x2 , x3 ) ∈ R3 | 3x1 + x2 + x3 = 0},

W2 = {(x1 , x2 , x3 ) ∈ R3 | x1 − x3 = 0}.

La loro intersezione è il sottospazio vettoriale:


W1 ∩ W2 = {(x1 , x2 , x3 ) ∈ R3 | 3x1 + x2 + x3 = x1 − x3 = 0}
= {(a, −4a, a) ∈ R3 | a ∈ R}.

Esempio 4.19 In V3 , spazio vettoriale reale dei vettori ordinari, riferito ad una base
ortonormale positiva B = (i, j, k), i sottospazi vettoriali:

W1 = L(i, j), W2 = L(i, k)

si intersecano nella retta vettoriale:

W1 ∩ W2 = L(i).

Si ricordi che la notazione L(a) indica l’insieme di tutti i vettori che sono paralleli ad a,
analogamente L(a, b) indica l’insieme dei vettori complanari ad a, b (cfr. Def. 3.5); nel
Paragrafo 4.3 si generalizzerà questa notazione.

Osservazione 4.9 L’unione insiemistica di due sottospazi vettoriali di uno spazio vetto-
riale V non è, in generale, un sottospazio vettoriale di V, come si deduce dagli esempi
prima citati. Infatti si ha:
nell’Esempio 4.18 l’unione W1 ∪ W2 non è un sottospazio vettoriale di R3 perché, per
esempio, la somma di (1, 2, −5) ∈ W1 insieme con (2, 3, 2) ∈ W2 non appartiene a
W1 ∪ W2 ;
nell’Esempio 4.19 il vettore v = (2i + 3j) + (4k) non appartiene a W1 ∪ W2 , pur essendo
somma di un vettore di W1 e di un vettore di W2 .
144 Spazi Vettoriali e Sottospazi Vettoriali

Esercizio 4.3 In quali casi l’unione di due sottospazi vettoriali di uno spazio vettoriale V
è un sottospazio vettoriale di V ?

Gli esempi precedenti giustificano la seguente definizione.

Definizione 4.3 Dati W1 e W2 sottospazi vettoriali di uno spazio vettoriale reale V, si


definisce somma di W1 e W2 l’insieme:

W1 + W2 = {x1 + x2 | x1 ∈ W1 , x2 ∈ W2 }.

Teorema 4.3 1. W1 + W2 è un sottospazio vettoriale di V.

2. W1 + W2 è il più piccolo sottospazio vettoriale di V contenente W1 e W2 .

Dimostrazione 1. Segue dalle definizioni di somma di sottospazi vettoriali e di sotto-


spazio vettoriale.

2. W1 ⊆ W1 + W2 in quanto i suoi elementi possono essere scritti come x + o, per


ogni x ∈ W1 , considerando il vettore nullo o come elemento di W2 . Dimostra-
zione analoga per W2 . La somma W1 + W2 è il più piccolo sottospazio vettoriale
contenente sia W1 sia W2 perché ogni altro sottospazio vettoriale con questa pro-
prietà deve necessariamente contenere tutte le combinazioni lineari di elementi di
W1 e di W2 e, quindi, deve contenere W1 + W2 .

La definizione di somma di due sottospazi vettoriali si estende in modo naturale a quella


di più di due sottospazi vettoriali.

Definizione 4.4 Siano Wi , i = 1, 2, . . . , k , sottospazi vettoriali di uno spazio vettoriale


reale V. La loro somma è data da:

W1 + W2 + . . . + Wk = {x1 + x2 + . . . + xk | xi ∈ Wi , i = 1, 2, . . . k}.

Anche in questo caso si può dimostrare una proprietà analoga al Teorema 4.3.

Si presti particolare attenzione ai seguenti esempi.

Esempio 4.20 Si considerino i sottospazi vettoriali di R3 :

W1 = {(x1 , x2 , 0) ∈ R3 | x1 , x2 ∈ R},

W2 = {(0, 0, x3 ) ∈ R3 | x3 ∈ R}.
Capitolo 4 145

Si verifica che W1 ∩ W2 = {o} e W1 + W2 = R3 . Ogni elemento (x1 , x2 , x3 ) ∈ R3


si scrive, in modo unico, come somma di un elemento di W1 e di un elemento di W2 ,
infatti:
(x1 , x2 , x3 ) = (x1 , x2 , 0) + (0, 0, x3 ).

Esempio 4.21 Si considerino i sottospazi vettoriali di R3 :

W1 = {(x1 , x2 , 0) ∈ R3 | x1 , x2 ∈ R},

Z2 = {(x1 , 0, x3 ) ∈ R3 | x1 , x3 ∈ R}.

Si verifica che W1 ∩ Z2 = {(x1 , 0, 0) ∈ R3 | x1 ∈ R} e W1 + Z2 = R3 . In questo


caso, per esempio, (1, 2, 3) ∈ R3 si può scrivere in infiniti modi diversi come somma di
un elemento di W1 e di un elemento di Z2 , infatti:

(1, 2, 3) = (a, 2, 0) + (b, 0, 3), con a, b ∈ R | a + b = 1.

Ciò suggerisce la seguente definizione.

Definizione 4.5 Siano W1 , W2 sottospazi vettoriali di uno spazio vettoriale reale V, la


loro somma W1 + W2 si dice diretta e si scrive:

W1 ⊕ W2

se ogni vettore x ∈ W1 ⊕ W2 si decompone in modo unico come x = x1 + x2 , con


x1 ∈ W1 e x2 ∈ W2 .

La precedente definizione si estende a più di due sottospazi vettoriali nel modo seguente.

Definizione 4.6 Siano Wi , i = 1, 2, . . . k, sottospazi vettoriali di uno spazio vettoriale


reale V ; la loro somma si dice diretta e si scrive:

W1 ⊕ W2 ⊕ . . . ⊕ Wk

se ogni vettore x ∈ W1 ⊕ W2 ⊕ . . . ⊕ Wk si decompone in modo unico come:

x = x 1 + x2 + . . . + xk ,

con xi ∈ Wi , i = 1, 2, . . . k.

Sarà utile la seguente definizione.


146 Spazi Vettoriali e Sottospazi Vettoriali

Definizione 4.7 W1 e W2 , sottospazi vettoriali di uno spazio vettoriale reale V, si dicono


supplementari in V se:
W1 ⊕ W2 = V.

Osservazione 4.10 Dalla Definizione 3.5 segue che:

V3 = L(i) ⊕ L(j) ⊕ L(k) = L(i, j) ⊕ L(k) = L(i, j) ⊕ L(j + k) = . . . . . . .

In V3 esistono infiniti sottospazi vettoriali supplementari di L(i, j).

Teorema 4.4 Lo spazio vettoriale Rn,n delle matrici quadrate di ordine n si decompone
nel modo seguente:

Rn,n = S(Rn,n ) ⊕ A(Rn,n ),


dove S(Rn,n ) indica il sottospazio vettoriale delle matrici simmetriche di Rn,n e A(Rn,n )
è il sottospazio vettoriale delle matrici antisimmetriche, definiti negli Esempi 4.15 e 4.16.

Dimostrazione Segue dalla scrittura:


1 1
A = (A + tA) + (A − tA), con A ∈ Rn,n
2 2

e dal fatto che A + tA è una matrice simmetrica, mentre A − tA è antisimmetrica.

Il seguente teorema caratterizza la somma diretta di due sottospazi vettoriali.

Teorema 4.5 La somma di due sottospazi vettoriali W1 e W2 di uno spazio vettoriale


reale V è diretta se e solo se la loro intersezione W1 ∩ W2 si riduce al solo vettore nullo.
In formule:

W = W1 ⊕ W2 ⇐⇒ W = W1 + W2 e W1 ∩ W2 = {o}.

Dimostrazione Sia W = W1 + W2 , si vuole provare che W = W1 ⊕ W2 se e solo se


W1 ∩ W2 = {o}.
Si supponga che la somma dei due sottospazi vettoriali W1 + W2 = W sia diretta. Allora
ogni x ∈ W si scrive in modo unico come x1 + x2 , con x1 ∈ W1 e x2 ∈ W2 . Per
assurdo, se esistesse un vettore non nullo y ∈ W1 ∩ W2 allora l’espressione:

x = (x1 + y) + (x2 − y)

contraddirebbe l’ipotesi. Pertanto si ha W1 ∩ W2 = {o}.


Capitolo 4 147

Viceversa, si supponga che W1 ∩ W2 = {o} e che per assurdo la somma W1 + W2 = W


non sia diretta, ovvero che esista x ∈ W = W1 + W2 tale che:

x = x 1 + x2 = y1 + y2 ,

con x1 , y1 ∈ W1 , x2 , y2 ∈ W2 e x1 6= y1 oppure (o anche) x2 6= y2 . Segue che


x1 − y1 = −x2 + y2 ∈ W1 ∩ W2 da cui si perviene ad una contraddizione dell’ipotesi
W1 ∩ W2 = {o}.

L’esempio che segue mostra che il teorema precedente non può essere esteso in modo
ovvio al caso della somma diretta di più di due sottospazi vettoriali.

Esempio 4.22 In V3 , rispetto ad una base ortonormale positiva B = (i, j, k), si conside-
rino i seguenti sottospazi vettoriali:

W1 = L(i, j); W2 = L(i + k); W3 = L(j + k).

È chiaro che W1 ∩ W2 ∩ W3 = {o}, W1 ∩ W2 = W1 ∩ W3 = W2 ∩ W3 = {o}, e


W1 + W2 + W3 = V3 ma la loro somma W1 + W2 + W3 non è diretta; per esempio:

i + j + k = [ai + (1 − a)j] + [(1 − a)i + (1 − a)k] + (aj + ak), con a ∈ R,


contraddice la Definizione 4.6.

Il teorema (di cui si omette la dimostrazione) che caratterizza la somma diretta di più di
due sottospazi vettoriali mediante le loro intersezioni, è, infatti, il seguente.

Teorema 4.6 Sia V uno spazio vettoriale e siano W1 , W2 , . . . , Wk sottospazi vettoriali


di V, allora:

W = W1 ⊕ W2 ⊕ . . . ⊕ Wk ⇐⇒ W = W1 + W2 + . . . + Wk
e Wi ∩ (W1 + W2 + . . . + W
ci + . . . + Wk ) = {o}, i = 1, 2, . . . k,

(W
ci indica che si deve escludere il sottospazio vettoriale Wi dalla somma).

Per la dimostrazione si veda ad esempio [15].

Esercizio 4.4 Avvertenza Questo esercizio è risolto a titolo di esempio per chiarire i
concetti appena esposti. Nel paragrafo successivo verrà introdotto un metodo più rapido
per risolvere problemi analoghi.
148 Spazi Vettoriali e Sottospazi Vettoriali

In R4 si considerino i sottospazi vettoriali:

W1 = {(x1 , x2 , x3 , x4 ) ∈ R4 | x1 + 2x2 + 3x3 + x4 = 0},

W2 = {(x1 , x2 , x3 , x4 ) ∈ R4 | x1 + x2 = x1 + x3 = x1 − x2 + x3 = 0},

dimostrare che W1 ⊕ W2 = R4 .

Soluzione Innanzi tutto si osservi che effettivamente W1 e W2 sono sottospazi vetto-


riali di R4 essendo definiti tramite sistemi lineari omogenei. La loro intersezione W1 ∩W2
coincide con l’insieme delle soluzioni del sistema lineare omogeneo formato da tutte le
equazioni che definiscono W1 e da tutte le equazioni che definiscono W2 , nel nostro caso
si ha: 
 x1 + 2x2 + 3x3 + x4 = 0

x1 + x2 = 0


 x1 + x3 = 0
x1 − x2 + x 3 = 0

le cui soluzioni, come spiegato nel Paragrafo 1.2, dipendono dal rango della matrice dei
coefficienti:  
1 2 3 1
 1 1 0 0 
A=  1
.
0 1 0 
1 −1 1 0
Riducendo per righe la matrice A si ottiene rank(A) = 4 da cui segue W1 ∩ W2 = {o}.
Per dimostrare che W1 + W2 = R4 si devono scrivere esplicitamente le espressioni dei
vettori di W1 e di W2 . Nel primo caso, risolvendo l’equazione che definisce W1 , si
ottiene che (x1 , x2 , x3 , x4 ) ∈ W1 se:

(x1 , x2 , x3 , x4 ) = (−2t1 − 3t2 − t3 , t1 , t2 , t3 ), con t1 , t2 , t3 ∈ R.

Invece, risolvendo il sistema lineare che definisce W2 , si ha che (x1 , x2 , x3 , x4 ) ∈ W2 se:

(x1 , x2 , x3 , x4 ) = (0, 0, 0, λ), con λ ∈ R.

Si perviene alla tesi provando che un generico vettore (x1 , x2 , x3 , x4 ) ∈ R4 si può scri-
vere come somma di un vettore di W1 e di un vettore di W2 , in altri termini dato
(x1 , x2 , x3 , x4 ) esistono opportuni valori di t1 , t2 , t3 , λ ∈ R per cui:

(x1 , x2 , x3 , x4 ) = (−2t1 − 3t2 − t3 , t1 , t2 , t3 + λ).

Si ricavano infatti t1 , t2 , t3 , λ ∈ R dalla scrittura stessa. Il Teorema 4.5 e il calcolo


dell’intersezione dei due sottospazi vettoriali assicurano che tali valori sono unici.
Capitolo 4 149

4.3 Generatori, basi e dimensione


In questo paragrafo saranno ripetute, nel caso di un generico spazio vettoriale reale V,
alcune definizioni e proprietà già enunciate nel caso particolare di V3 (cfr. Par. 3.4). Si è
scelto questo approccio da un lato perché si ritiene didatticamente utile iniziare lo studio
di una teoria astratta e a volte ostica partendo dal caso, più facile, dello spazio vettoriale
V3 , dall’altro perché si è deciso di non far sempre riferimento al Capitolo 3 per rendere i
due capitoli indipendenti tra di loro e per non perdere la scansione logica del discorso.

4.3.1 Base di uno spazio vettoriale


Definizione 4.8 Dati k vettori v1 , v2 , . . . , vk di uno spazio vettoriale reale V, si dice che
un vettore x ∈ V è combinazione lineare dei vettori v1 , v2 , . . . , vk se esistono k numeri
reali x1 , x2 , . . . xk tali che:
x = x1 v 1 + x2 v 2 + . . . + xk v k .
I numeri reali x1 , x2 , . . . , xk si dicono coefficienti della combinazione lineare.

Fissati i vettori v1 , v2 , . . . , vk in V si vogliono considerare tutte le loro combinazioni


lineari. Tale insieme indicato con:
L(v1 , v2 , . . . , vk ),

o con hv1 , v2 , . . . , vk i, in inglese prende il nome di span di v1 , v2 , . . . , vk , di cui


{v1 , v2 , . . . , vk }
è il sistema (o insieme) di generatori. È immediato dimostrare il seguente teorema.

Teorema 4.7 L(v1 , v2 , . . . , vk ) è un sottospazio vettoriale di V ed è il più piccolo sot-


tospazio vettoriale di V contenente i vettori v1 , v2 , . . . , vk .

Dimostrazione È un esercizio che segue dalla definizione di sottospazio vettoriale.

Osservazione 4.11 A differenza di ciò che la notazione usata potrebbe far pensare, si
osservi che le combinazioni lineari dei vettori v1 , v2 , . . . , vk non dipendono dall’ordine
in cui si considerano i vettori v1 , v2 , . . . , vk , cioè ad esempio:
L(v1 , v2 , . . . , vk ) = L(v2 , v1 , . . . , vk ).
È consuetudine, infatti, usare le parentesi tonde per indicare questo sottospazio vettoriale
anziché usare la notazione L{v1 , v2 , . . . , vk }, che sarebbe più corretta dal punto di vista
matematico.
150 Spazi Vettoriali e Sottospazi Vettoriali

Esempio 4.23 In R4 , dati i due vettori v1 = (1, 0, 0, 2) e v2 = (−1, 2, 0, 0) il piano


vettoriale L(v1 , v2 ) è un sottospazio vettoriale di R4 .

Definizione 4.9 Sia V uno spazio vettoriale reale e siano v1 , v2 , . . . , vk vettori qualsiasi
di V. Si dice che un sottospazio vettoriale W di V ammette come sistema di generatori
l’insieme dei vettori {v1 , v2 , . . . , vk } se:

W = L(v1 , v2 , . . . , vk ).

Il teorema che segue, la cui dimostrazione è un esercizio, permette di cambiare i generatori


di un sottospazio vettoriale.

Teorema 4.8 Dato W = L(v1 , v2 , . . . , vk ), si possono aggiungere o sostituire più gene-


ratori di W con loro combinazioni lineari.

Ad esempio, come conseguenza del teorema precedente, si ottiene:

W = L(v1 , v2 , . . . , vi , . . . , vk , λvl + µvm ) = L(v1 , v2 , . . . , v̂i , . . . , vk , vi + λvj ),

per ogni λ, µ ∈ R e per ogni l, m, i, j nell’insieme {1, 2, . . . , k} e dove con il simbolo


v̂i si indica che si è tolto il vettore vi dall’elenco dei generatori di W.

Osservazione 4.12 Come immediata conseguenza del teorema precedente si ottiene an-
che che W = L(v1 , v2 , . . . , vk ) ammette infiniti generatori e quindi ha infiniti sistemi di
generatori.

Osservazione 4.13 Nell’Esempio 4.23 l’insieme {i, j} è un sistema di generatori di L(i, j)


ma anche {2i, 3i + 2j} è un altro insieme di generatori di L(i, j) e cosı̀ via, ma {i} non
è un sistema di generatori di L(i, j).

Definizione 4.10 Uno spazio vettoriale reale V si dice finitamente generato se esistono
m vettori v1 , v2 , . . . , vm di V per cui:

L(v1 , v2 , . . . , vm ) = V.

Analogamente, un sottospazio vettoriale W di uno spazio vettoriale reale V si dice


finitamente generato se esistono k vettori v1 , v2 , . . . , vk tali che:

L(v1 , v2 , . . . , vk ) = W.
Capitolo 4 151

Esempio 4.24 Lo spazio vettoriale dei numeri reali può essere generato da un qualsiasi
numero non nullo: R = L(1) = L(35) e quindi è un esempio di spazio vettoriale rea-
le finitamente generato. Analogamente, l’insieme dei numeri complessi C è uno spazio
vettoriale reale finitamente generato in quanto C = L(1, i), dove con i si indica l’u-
nità immaginaria. D’altra parte C è anche uno spazio vettoriale complesso finitamente
generato perché, in questo caso, C = L(1).

Esempio 4.25 Rn è finitamente generato, per esempio:

R3 = L((1, 0, 0), (0, 1, 0), (0, 0, 1)) = L((1, 2, 3), (2, 3, 0), (0, 0, 2), (4, 5, 6)).

Esempio 4.26 R2,2 è generato, per esempio, dalle matrici:


       
1 0 0 1 0 0 0 0
, , , ,
0 0 0 0 1 0 0 1

ma anche dalle matrici:


           
2 0 0 4 0 0 0 0 0 0 7 −2
, , , , , .
0 0 0 0 −7 0 0 8 0 0 0 9

Osservazione 4.14 Si osservi che uno spazio vettoriale finitamente generato ammette un
numero finito di generatori, ma ciò non significa che ogni suo sistema di generatori debba
avere un numero finito di elementi. Le combinazioni lineari dei vettori che si conside-
reranno nel testo saranno sempre somme finite. Le somme infinite, ossia le serie ed i
problemi di convergenza che ne scaturiscono, sono invece studiati in Analisi Funzionale
(cfr. per esempio [20]).

Esempio 4.27 Lo spazio vettoriale R[x] dei polinomi a coefficienti in R è un esempio


di spazio vettoriale reale non finitamente generato. Infatti, se p1 (x), p2 (x), . . . , pk (x)
sono k polinomi e d è il loro massimo grado, allora L(p1 (x), p2 (x), . . . , pk (x)) non
contiene polinomi di grado maggiore a d e quindi L(p1 (x), p2 (x), . . . , pk (x)) ⊂ R[x],
ma L(p1 (x), p2 (x), . . . , pk (x)) 6= R[x]. È facile, invece, verificare che il sottospazio
vettoriale Rn [x] dei polinomi di grado minore o uguale ad n è finitamente generato:

Rn [x] = L(1, x, x2 , . . . , xn ).

Esempio 4.28 Nel Paragrafo 4.5 si dimostra che anche lo spazio vettoriale delle funzioni
reali di variabile reale F(R) descritto nell’Esempio 4.5, non è finitamente generato.
152 Spazi Vettoriali e Sottospazi Vettoriali

Esempio 4.29 Si consideri il sottospazio vettoriale di R3 :

W = {(x1 , x2 , x3 ) ∈ R3 | 2x1 + 3x2 − x3 = x2 + x3 = 0}

introdotto nell’Esercizio 4.1 e se ne determini un sistema di generatori. A tale scopo si


deve risolvere il sistema lineare omogeneo che definisce W . Come descritto nel Paragrafo
1.2 si ottengono infinite soluzioni date da:

 x1 = 2t
x2 = −t
x3 = t, t ∈ R.

In altri termini, il generico vettore di W è del tipo (2t, −t, t) = t(2, −1, 1), t ∈ R, ossia
(2, −1, 1) è un generatore di W .

In questo testo si studieranno solo spazi vettoriali finitamente generati, le definizioni e le


proprietà che seguono sono da considerarsi in questo contesto, anche se alcune di esse
possono essere agevolmente riscritte nel caso di spazi vettoriali non finitamente generati,
ma in tutto il testo non saranno mai discusse tali generalizzazioni. Per uno studio appro-
fondito degli spazi vettoriali non finitamente generati si può far riferimento a testi di base
di Analisi Funzionale (ad esempio [20]).

Poiché si vuole enunciare la definizione rigorosa di dimensione di uno spazio vettoriale


V (finitamente generato), sono riprese e riformulate, in un contesto più generale, alcune
definizioni e proprietà già studiate nel capitolo precedente nel caso particolare dello spazio
vettoriale V3 .

Definizione 4.11 Dati k vettori v1 , v2 , . . . , vk di uno spazio vettoriale reale V, essi si


dicono linearmente indipendenti se l’unica loro combinazione lineare uguale al vettore
nullo ha coefficienti tutti nulli, vale a dire:

x1 v1 + x2 v2 + . . . + xk vk = o =⇒ x1 = x2 = . . . = xk = 0. (4.1)

L’insieme {v1 , v2 , . . . , vk } di vettori linearmente indipendenti si dice libero.


Di conseguenza, k vettori v1 , v2 , . . . , vk di V si dicono linearmente dipendenti se esiste
almeno una loro combinazione lineare uguale al vettore nullo a coefficienti non tutti nulli.

Osservazione 4.15 Si osservi che in (4.1) vale anche l’implicazione opposta.

Prima di proporre alcuni esempi conviene dimostrare la seguente proprietà, molto facile,
ma utile per riconoscere vettori linearmente indipendenti o linearmente dipendenti.
Capitolo 4 153

Teorema 4.9 Dati k vettori v1 , v2 , . . . , vk di uno spazio vettoriale reale V, essi sono li-
nearmente dipendenti se e solo se almeno uno di essi si può esprimere come combinazione
lineare dei rimanenti.

Dimostrazione Si supponga che, per ipotesi, i vettori v1 , v2 , . . . , vk siano linearmente


dipendenti, allora x1 v1 + x2 v2 + . . . + xk vk = o, con x1 6= 0 (se il coefficiente non nullo
non fosse x1 si potrebbe commutare in modo da porre al primo posto il coefficiente non
nullo), è perciò possibile ricavare:
x2 xk
v1 = − v2 − . . . − vk
x1 x1
da cui la tesi. Il viceversa è lasciato per esercizio.

La verifica degli esempi che seguono è lasciata per esercizio.

Esempio 4.30 Ogni insieme contenente un solo vettore I = {x} con x 6= o è libero.

Esempio 4.31 In V3 i vettori di una base ortonormale B = (i, j, k) sono linearmente


indipendenti, lo stesso vale per ogni sottoinsieme non vuoto di B.

Esempio 4.32 Se in un insieme di vettori I compare il vettore nullo, allora I non è


libero. L’insieme {o} non è libero.

Esempio 4.33 Se I è un insieme libero di vettori, allora ogni sottoinsieme non vuoto di
I è libero.

Esempio 4.34 Se I è un insieme di vettori linearmente dipendenti allora ogni insieme


che contiene I è formato da vettori linearmente dipendenti.

La definizione che segue estende la nozione di base già data nel capitolo precedente nel
caso particolare dello spazio vettoriale V3 (cfr. Def. 3.7).

Definizione 4.12 Sia V uno spazio vettoriale reale, un insieme finito e ordinato di vettori
B = (v1 ,v2 ,. . .,vn ) di V prende il nome di base di V se:

1. B è un insieme libero,

2. B è un sistema di generatori di V, ossia L(B) = V.

Osservazione 4.16 Si vedrà che sarà fondamentale l’ordine in cui sono considerati i
vettori di una base.
154 Spazi Vettoriali e Sottospazi Vettoriali

Esempio 4.35 1. Una base ortonormale positiva B = (i, j, k) è un esempio di base di


V3 , in quanto verifica la definizione appena enunciata.

2. In Rn una base è data da B = (e1 , e2 , . . . en ), dove:

e1 = (1, 0, . . . , 0), e2 = (0, 1, . . . , 0), ..., en = (0, 0, . . . , 1).

Questa base particolare, molto naturale, prende il nome di base standard o base
canonica di Rn . Per esempio, nel caso particolare di R4 si ha che la quaterna:
(1, 2, 3, 4) si scrive come 1e1 + 2e2 + 3e3 + 4e4 , da cui la giustificazione della
particolare denominazione usata. Sempre in R4 se si considera, invece, la base
B 0 = (f1 , f2 , f3 , f4 ), dove:

f1 = (2, 0, 0, 0), f2 = (0, 3, 0, 0), f3 = (0, 0, 1, 0), f4 = (0, 0, 0, 4),

si ha:
1 2
(1, 2, 3, 4) = f1 + f2 + 3f3 + 1f4
2 3
che è una decomposizione dello stesso vettore (1, 2, 3, 4) molto meno naturale della
precedente.

3. Analogamente al caso di Rn , la base canonica dello spazio vettoriale delle matrici


Rm,n è formata, ordinatamente, dalle mn matrici Eij aventi il numero 1 al posto ij
e 0 per ogni altro elemento. Nel caso particolare di R2,3 la base canonica è formata
dalle 6 matrici seguenti:
     
1 0 0 0 1 0 0 0 1
E11 = , E12 = , E13 = ,
0 0 0 0 0 0 0 0 0
     
0 0 0 0 0 0 0 0 0
E21 = , E22 = , E23 = ;
1 0 0 0 1 0 0 0 1

quindi:
 
1 2 3
= E11 + 2E12 + 3E13 + 4E21 + 5E22 + 6E23 .
4 5 6

4. In Rn [x] una base è data dall’insieme B = (1, x, x2 , . . . , xn ).

Il teorema che segue caratterizza le basi di uno spazio vettoriale.


Capitolo 4 155

Teorema 4.10 1. Sia B = (v1 , v2 , . . . , vn ) una base dello spazio vettoriale reale V,
allora ogni vettore x di V si decompone in modo unico come:
x = x1 v 1 + x2 v 2 + . . . + xn v n , (4.2)

con (x1 , x2 , . . . , xn ) ∈ Rn .
2. Se {v1 , v2 , . . . , vn } è un insieme di vettori di V tale che ogni vettore x di V si
decomponga in modo unico rispetto a tali vettori come in (4.2), allora l’insieme
{v1 , v2 , . . . , vn } è una base di V.
La dimostrazione è lasciata per esercizio.

Il teorema appena enunciato conduce alla definizione di componenti di un vettore rispetto


ad una base assegnata, nel modo seguente.
Definizione 4.13 Sia V uno spazio vettoriale di dimensione n. Fissata una base B =
(v1 , v2 , . . . , vn ) in V, per ogni vettore x di V i numeri reali x1 , x2 , . . . , xn individuati
univocamente da (4.2), si dicono componenti di x rispetto alla base B.
Osservazione 4.17 Fissata una base B in uno spazio vettoriale V, con un abuso di lin-
guaggio volto ad enfatizzare l’ordine delle componenti, si scriverà che la n-upla di Rn
(x1 , x2 , . . . , xn ) indica le componenti di x rispetto alla base B. In modo equivalente, ogni
vettore x di V si individua, rispetto alla base B, con la matrice colonna X ∈ Rn,1 data
da:  
x1
 x2 
X =  .. .
 
 . 
xn
Osservazione 4.18 Fissata una base B in V, dati due vettori x e y di V le cui matrici
colonne delle componenti, rispetto a B, sono:
   
x1 y1
 x2   y2 
X =  .. , Y =  .. ,
   
 .   . 
xn yn
il vettore x + y ha componenti, rispetto a B:
 
x1 + y 1
 x2 + y 2 
X +Y =
 
.. 
 . 
xn + y n
156 Spazi Vettoriali e Sottospazi Vettoriali

e il vettore λx (λ ∈ R) ha componenti, rispetto a B:


 
λx1
 λx2 
λX =  .. .
 
 . 
λxn

Si osservi, inoltre, l’assoluta coerenza tra le definizioni di somma di matrici e somma di


vettori e tra prodotto di un numero reale per una matrice e prodotto di un numero reale
per un vettore.

Dalla definizione di base di uno spazio vettoriale e dal Teorema 4.10 emergono in modo
naturale le seguenti domande:

1. in ogni spazio vettoriale esiste sempre almeno una base?


2. In caso affermativo, in uno spazio vettoriale quante basi esistono?
3. Nel caso in cui esistano molte basi in uno spazio vettoriale, quanti vettori conten-
gono ciascuna?

Nel caso particolare degli spazi vettoriali dei vettori ordinari V3 , V2 e V1 , aiutati dalla
visualizzazione geometrica, si conoscono già le risposte alle precedenti domande (cfr.
Teor. 3.4); i teoremi che seguono permettono di dare analoghe risposte nel caso particolare
degli spazi vettoriali finitamente generati, quali, ad esempio Rn e lo spazio delle matrici
Rm,n (cfr. Es. 4.35). Si enunciano ora uno di seguito all’altro i teoremi che caratterizzano
la struttura degli spazi vettoriali, anteponendo il commento e le loro conseguenze alle loro
dimostrazioni.

Teorema 4.11 – Teorema di esistenza di una base – Sia V uno spazio vettoriale rea-
le finitamente generato e sia G = {w1 , w2 , . . . , wm } un sistema di generatori di V.
L’insieme G contiene almeno una base di V.

Osservazione 4.19 Dal teorema precedente e dall’Osservazione 4.12 segue che, essendo
possibile ottenere infiniti sistemi di generatori di V a partire da G , esistono infinite basi
in uno spazio vettoriale finitamente generato.

Teorema 4.12 – Lemma di Steinitz – Sia B = (v1 , v2 , . . . , vn ) una base di uno spazio
vettoriale reale V e sia I = {u1 , u2 , . . . , up } un insieme libero di V, allora p ≤ n.

Teorema 4.13 – Teorema della dimensione – Tutte le basi di uno spazio vettoriale reale
V finitamente generato hanno lo stesso numero di vettori.
Capitolo 4 157

Definizione 4.14 In uno spazio vettoriale reale V finitamente generato il numero dei
vettori appartenenti ad una base prende il nome di dimensione di V e si indica con
dim(V ).

Se V è formato dal solo vettore nullo V = {o}, si pone dim({o}) = 0.

Dai teoremi elencati si ottiene in modo evidente il seguente teorema.

Teorema 4.14 Sia W un sottospazio vettoriale di uno spazio vettoriale reale V, allora:

1. se lo spazio vettoriale V è finitamente generato anche W è finitamente generato.

2. dim(W) ≤ dim(V ).

3. dim(W) = dim(V ) ⇐⇒ W = V.

Esempio 4.36 Segue dall’Esempio 4.35 che:

• dim(Rn ) = n.

• dim(Rm,n ) = mn.

• dim(Rn [x]) = n + 1.

Per dimostrare il Teorema 4.11 è necessario anteporre il seguente lemma tecnico.

Lemma 4.1 Sia I = {a1 , a2 , . . . , ak } un insieme libero di V. Sia x ∈ V un vettore che


non è combinazione lineare dei vettori di I , allora l’insieme I ∪ {x} è libero in V.

Dimostrazione Si procede per assurdo, i dettagli sono lasciati al Lettore.

Dimostrazione del Teorema 4.11 La dimostrazione consiste in un numero finito di


passi applicati all’insieme G , procedimento autorizzato dal fatto che G è finito. Si inizia
supponendo che ogni vettore di G sia diverso dal vettore nullo, in caso contrario si toglie
il vettore nullo da G .
Primo passo: si considerano l’insieme I1 = {w1 } e i vettori rimanenti wi , i = 2, . . . , m.
Se ogni vettore wi è linearmente dipendente da w1 , ossia se esistono numeri reali λi tali
che wi = λi w1 , i = 2, . . . , m, allora I1 è una base di V e il teorema è dimostrato. In
caso contrario si considera il primo vettore di G che non verifica questa condizione. Sia,
per esempio w2 ∈ / L(w1 ), si procede con il:
secondo passo: si considera l’insieme libero (cfr. Lemma 4.1) I2 = {w1 , w2 }. Si pre-
sentano due possibilità: o ogni vettore rimanente in G è combinazione lineare dei vettori
158 Spazi Vettoriali e Sottospazi Vettoriali

di I2 , allora I2 è una base di V (quindi segue la tesi), oppure esiste almeno un vettore di
G che non è combinazione lineare dei vettori di I2 , si suppone che sia w3 ; in questo caso
si procede con il:
terzo passo: si considera l’insieme libero (cfr. Lemma 4.1) I3 = {w1 , w2 , w3 } e si
procede come nel secondo passo.
Il procedimento termina dopo un numero finito di passi, al più m. Si è cosı̀ costruita
una base di V a partire dal primo vettore w1 di G . È evidente che procedendo con lo
stesso metodo a partire da un altro vettore di G o da un’altro insieme di generatori di V
si ottengono infinite basi.

Osservazione 4.20 Il metodo descritto nella dimostrazione precedente prende il nome di


metodo degli scarti successivi per il procedimento di calcolo che prevede.

Esercizio 4.5 In A(R3,3 ), sottospazio vettoriale di R3,3 delle matrici antisimmetriche, si


consideri l’insieme G = {A1 , A2 , A3 , A4 , A5 , A6 , A7 } con:
   
0 1 2 0 0 1
A1 =  −1 0 3 , A2 =  0 0 −1 ,
−2 −3 0 −1 1 0
   
0 0 0 0 0 0
A3 =  0 0 5 , A4 =  0 0 0 ,
0 −5 0 0 0 0
    (4.3)
0 −1 2 0 1 −1
A5 =  1 0 0 , A6 =  −1 0 4 ,
−2 0 0 1 −4 0
 
0 5 1
A7 =  −5 0 −2 .
−1 2 0

Si dimostri che G è un insieme di generatori di A(R3,3 ) e se ne estragga una base.

Soluzione Per rispondere al primo quesito si deve esprimere la generica matrice:


 
0 a12 a13
A =  −a12 0 a23  (4.4)
−a13 −a23 0
di A(R3,3 ) come combinazione lineare:
A = λ1 A1 + λ2 A2 + λ3 A3 + λ4 A4 + λ5 A5 + λ6 A6 + λ7 A7 (4.5)
Capitolo 4 159

degli elementi di G . Sostituendo in (4.5) le matrici (4.3) e (4.4) prima indicate, si perviene
al sistema lineare nelle incognite λi , i = 1, 2, . . . , 7:

 λ1 − λ5 + λ6 + 5λ7 = a12 ,
2λ1 + λ2 + 2λ5 − λ6 + λ7 = a13 ,
3λ1 − λ2 + 5λ3 + 4λ6 − 2λ7 = a23 ,

le cui soluzioni sono lasciate da determinare al Lettore per esercizio.


Per estrarre una base da G si procede come nella dimostrazione del Teorema 4.11, si ha:
primo passo: sia I1 = {A1 }. Si verifica subito che {A1 , A2 } è un insieme libero in
A(R3,3 ), si passa quindi al:
secondo passo: sia I2 = {A1 , A2 }. Si verifica che {A1 , A2 , A3 } è un insieme libero, si
procede, quindi, con il:
terzo passo: sia I3 = {A1 , A2 , A3 }. Si verifica che ogni altro vettore di G è combinazione
lineare di I3 , si deduce, cosı̀ che I3 è una base di A(R3,3 ). Tutte le verifiche sono lasciate
al Lettore per esercizio.

Per la dimostrazione del Teorema 4.12 si rimanda al Paragrafo 4.5.

Dimostrazione del Teorema 4.13 Siano B = (v1 , v2 , . . . , vn ) e C = (w1 , w2 , . . . , wm )


due basi di V, si tratta di dimostrare che n = m. Si consideri B base di V e C insieme
libero di V , dal Teorema 4.12 segue che m ≤ n, invertendo i ruoli di B e di C si perviene
alla tesi.

Osservazione 4.21 Si osservi l’importanza dell’ordine dei vettori della base che si riflette
sull’ordine delle componenti dei vettori. In altri termini, mentre lo spazio vettoriale V si
può scrivere indifferentemente come:

V = L(v1 , v2 , . . . , vn ) = L(v2 , v1 , . . . , vn ),

la base B = (v1 , v2 , . . . , vn ) è diversa dalla base B 0 = (v2 , v1 , . . . , vn ). Come cambiano


le componenti dei vettori di V quando sono scritti rispetto alla base B e alla base B 0 ?

Esempio 4.37 1. A partire dalla scrittura di una matrice diagonale si verifica facil-
mente che dim(D(Rn,n )) è n. Una sua base è formata ordinatamente dalle matrici
Eii , i = 1, 2, . . . , n, definite nell’Esempio 4.35.

2. A partire dalla scrittura di una matrice triangolare superiore, si verifica facilmente


che dim(T (Rn,n )) = n(n+1)/2 e una sua base è data, ordinatamente, dalle matrici
Eij con 1 ≤ i ≤ j ≤ n definite nell’Esempio 4.35.
160 Spazi Vettoriali e Sottospazi Vettoriali

3. A partire dalla scrittura di una matrice simmetrica si verifica facilmente che:

n(n + 1)
dim(S(Rn,n )) =
2
e una sua base è:
    
1 0 ... 0 0 1 ... 0 0 0 ... 1
 0 0 ... 0  1 0 ... 0   0 0 ... 0 
,  , . . . ,  ,
    
 .. .. .. .. .... . . .. .... . . ..
 . . . .  . . . .   . . . . 
0 0 ... 0 0 0 ... 0 1 0 ... 0
    
0 0 ... 0 0 ... 0 0 0 0 ... 0
 0 1 ... 0   .. . . ....   0 0 ... 0 
.
, . . . ,  . . . 
,  .
    
 .... . . .. .... . . ..
 . . . .  0 ... 0 1  . . . . 
0 0 ... 0 0 ... 1 0 0 0 ... 1

4. A partire dalla scrittura di una matrice antisimmetrica si verifica facilmente che:

n(n − 1)
dim(A(Rn,n )) =
2
e una sua base è:
    
0 1 0 ... 0 0 0 1 ... 0 0 0 ... 0 0
 −1 0 0 . . . 0  0 0 0 ... 0   0 0 ... 0 0 
    
 0 0 0 . . . 0 −1 0 0 ... 0 .... . . . ..
,  , . . . ,  . .. .
   

 .. .. .. . . . . .
..  .. .. .. .. ..   
 . . . . .  . . . . .   0 0 ... 0 1 
0 0 0 ... 0 0 0 0 ... 0 0 0 . . . −1 0

Si conclude con l’enunciato di un teorema che sarà molto usato nel testo.

Teorema 4.15 – Teorema del completamento della base – Sia V uno spazio vettoriale
di dimensione n e sia B = (v1 , v2 , . . . , vn ) una sua base. Dato l’insieme libero:
I = {a1 , a2 , . . . , ak }, k ≤ n,
esiste una base B 0 di V contenente tutti i vettori di I e n − k vettori di B.

Dimostrazione Si consideri l’insieme A = I ∪ B, poiché A contiene una base, allora


V = L(A). Si applichi il Teorema 4.11 ad A partendo dai vettori di I , segue cosı̀ la
tesi.
Capitolo 4 161

Esercizio 4.6 Nel sottospazio vettoriale S(R3,3 ) delle matrici simmetriche di ordine 3
completare l’insieme libero I = {I1 , I2 , I3 }, con:
     
1 2 0 1 0 0 0 1 −1
I1 =  2 0 0 , I2 =  0 −1 0 , I3 =  1 0 0 
0 0 0 0 0 1 −1 0 0

fino ad ottenere una base di S(R3,3 ).

Soluzione Si consideri la base di S(R3,3 ) contenente ordinatamente le matrici:


     
1 0 0 0 1 0 0 0 1
A1 =  0 0 0 , A2 =  1 0 0 , A3 =  0 0 0 ,
0 0 0 0 0 0 1 0 0
     
0 0 0 0 0 0 0 0 0
A4 =  0 1 0 , A5 =  0 0 1 , A6 =  0 0 0 ,
0 0 0 0 1 0 0 0 1

allora si possono riscrivere (per comodità di calcolo) i vettori di I tramite le loro compo-
nenti rispetto alla base B. Si ha:

I1 = (1, 2, 0, 0, 0, 0), I2 = (1, 0, 0, −1, 0, 1), I3 = (0, 1, −1, 0, 0, 0).

Si applica il Teorema 4.11 all’insieme di generatori:

G = {I1 , I2 , I3 , A1 , A2 , A3 , A4 , A5 , A6 }

partendo dagli elementi di I . Si ottiene che (I1 , I2 , I3 , A1 , A4 , A5 ) è una base di S(R3,3 ).


I dettagli di calcolo sono lasciati al Lettore.

Nel caso di uno spazio vettoriale di dimensione n, come corollario dei teoremi precedenti
si può agevolmente dimostrare il seguente teorema.

Teorema 4.16 1. Sia V uno spazio vettoriale reale di dimensione n. Un insieme


libero I = {v1 , v2 , . . . , vn } di n vettori di V è una base di V.

2. Sia V uno spazio vettoriale reale di dimensione n. Un sistema di generatori


I = {v1 , v2 , . . . , vn } di n vettori di V è una base di V.

Dimostrazione 1. L(v1 , v2 , . . . , vn ) è un sottospazio vettoriale di V di dimensione n,


quindi per la proprietà 3. del Teorema 4.14 si ha L(v1 , v2 , . . . , vn ) = V. Pertanto
162 Spazi Vettoriali e Sottospazi Vettoriali

v1 , v2 , . . . , vn sono generatori di V.

2. Per ipotesi L(v1 , v2 , . . . , vn ) = V e dim(V ) = n. Applicando il Teorema 4.11 al


sistema di generatori {v1 , v2 , . . . , vn } di V si può estrarre da esso una base di V,
ma, essendo dim(V ) = n, l’insieme {v1 , v2 , . . . , vn } è una base di V.

Osservazione 4.22 Mediante il Teorema del Completamento della Base (cfr. Teor. 4.15)
si può agevolmente determinare un sottospazio vettoriale supplementare di un sottospazio
vettoriale W di uno spazio vettoriale V. Se dim(V ) = n e se (a1 , a2 , . . . , ak ) è una
base di W, (k < n), allora si perviene ad un sottospazio vettoriale supplementare di W
completando l’insieme libero (a1 , a2 , . . . , ak ) fino ad ottenere una base di V, data per
esempio da:
(a1 , a2 , . . . , ak , b1 , b2 , . . . , bn−k ).
Infatti:
L(a1 , a2 , . . . , ak ) ∩ L(b1 , b2 , . . . , bn−k ) = {o}
e L(b1 , b2 , . . . , bn−k ) è un sottospazio vettoriale di V supplementare di W . Un esempio
di quanto osservato sarà trattato nell’Esercizio 4.12.

4.3.2 Basi e somma diretta


Sia V uno spazio vettoriale di dimensione n e sia B = (v1 , v2 , . . . , vn ) una sua base,
allora:
V = L(v1 ) ⊕ L(v2 ) ⊕ . . . ⊕ L(vn ),
oppure, per esempio:

V = L(v1 , v2 ) ⊕ L(v3 , v4 , v5 ) ⊕ . . . ⊕ L(vn−1 , vn ).


Inoltre segue in modo evidente dalla definizione di somma di due o più sottospazi vet-
toriali dello spazio vettoriale V che essa è generata dall’unione dei medesimi, nel senso
che i vettori del sottospazio vettoriale somma sono combinazioni lineari dei vettori dei
sottospazi vettoriali addendi.

Alla luce di queste considerazioni, il teorema che segue indica un metodo per determinare
una base dello spazio vettoriale V (o più in generale di un sottospazio vettoriale W di V )
a partire dalle basi dei sottospazi vettoriali in cui V (o W) si decompone.

Teorema 4.17 Si supponga che lo spazio vettoriale reale V sia decomposto nella somma
diretta di k suoi sottospazi vettoriali:

V = W1 ⊕ W2 ⊕ . . . ⊕ Wk ,
Capitolo 4 163

allora è possibile formare una base di V mediante l’unione dei vettori appartenenti ad
una base di ciascuno dei sottospazi vettoriali Wi , i = 1, 2, . . . , k .

Dimostrazione Siano dim(W1 ) = n1 , dim(W2 ) = n2 , . . . , dim(Wk ) = nk le dimen-


sioni dei sottospazi vettoriali considerati e siano B1 = (a11 , a12 , . . . , a1n1 ) una base di
W1 , B2 = (a21 , a22 , . . . , a2n2 ) una base di W2 e cosı̀ via fino a Bk = (ak1 , ak2 , . . . , aknk )
base di Wk . Per definizione di somma diretta e di base, ogni vettore di V si scrive in
modo unico come combinazione lineare dei vettori delle basi dei sottospazi vettoriali Wi ,
i = 1, 2, . . . , k. Pertanto, l’insieme di vettori:

B1 ∪ B2 ∪ . . . ∪ Bk = {a11 , a12 , . . . , a1n1 , a21 , a22 , . . . , a2n2 , . . . , ak1 , ak2 , . . . , aknk }

è una base dello spazio vettoriale V.

Dal teorema precedente si ottiene il corollario di seguito enunciato.

Corollario 4.1 Se W = W1 ⊕ W2 ⊕ . . . ⊕ Wk , allora:

dim(W) = dim(W1 ) + dim(W2 ) + . . . + dim(Wk ).

Esercizio 4.7 Vale il viceversa del Corollario 4.1?

Osservazione 4.23 Come immediata conseguenza del Corollario 4.1 segue che, dato un
sottospazio vettoriale W di V con dim(V ) = n e dim(W) = k , k < n, un suo supple-
mentare W 0 (tale che W ⊕ W 0 = V ) ha dimensione n − k . Una base di W 0 può essere
formata dai vettori che si aggiungono ad una base di W per ottenere una base di V (cfr.
Oss. 4.22). Si ottiene, quindi, che esistono infiniti sottospazi vettoriali supplementari di
W , supponendo ovviamente che W = 6 V eW= 6 {o}.

Nel caso della somma di due sottospazi vettoriali è utile conoscere la formula che mette in
relazione le loro dimensioni con le dimensioni della loro intersezione e della loro somma,
per la dimostrazione si veda il Paragrafo 4.5.

Teorema 4.18 – Formula di Grassmann – Siano W1 e W2 due sottospazi vettoriali di


uno spazio vettoriale V, allora:

dim(W1 + W2 ) = dim(W1 ) + dim(W2 ) − dim(W1 ∩ W2 ).

Esercizio 4.8 In R5 si consideri il sottospazio vettoriale:

W = {(x1 , x2 , x3 , x4 , x5 ) ∈ R5 | x1 + x2 + 2x3 + x4 − x5 = 0}.


164 Spazi Vettoriali e Sottospazi Vettoriali

1. Si decomponga W nella somma diretta di due sottospazi vettoriali W1 e W2 .


2. Si scriva il vettore (−5, 2, −1, 3, −2) di W come somma di un vettore di W1 e di
un vettore di W2 .

Soluzione 1. Per esempio si controlla che i sottospazi vettoriali:


W1 = L((−1, 1, 0, 0, 0), (−2, 0, 1, 0, 0)),

W2 = L((−1, 0, 0, 1, 0), (1, 0, 0, 0, 1)),


verificano la condizione richiesta, infatti la loro intersezione si riduce al vettore
nullo e la loro somma riproduce W.
Quante sono le risposte possibili? Si provi ad elencarne almeno due diverse.

2. Dal calcolo diretto si ha:

(−5, 2, −1, 3, −2) = (0, 2, −1, 0, 0) + (−5, 0, 0, 3, −2).

Esercizio 4.9 In R2,2 si considerino i sottospazi vettoriali:


  
x1 x2 2,2
W1 = ∈ R | x 1 + x4 = x2 + x3 = 0 ,
x3 x4
  
x1 x2 2,2
W2 = ∈R | x1 − x4 = x2 − x3 = 0 .
x3 x4

Dimostrare che W1 ⊕ W2 = R2,2 .

Soluzione Per l’intersezione W1 ∩ W2 è sufficiente osservare che la matrice dei coef-


ficienti del sistema lineare omogeneo:


 x1 + x4 = 0
x2 + x3 = 0


 x1 − x4 = 0
x2 − x3 = 0

ha determinante non nullo. Rimane da dimostrare che W1 ⊕ W2 = R2,2 . Si ottiene


facilmente che una generica matrice di R2,2 si può scrivere come:
     
x1 x2 1 x1 − x4 x2 − x3 1 x1 + x4 x2 + x3
= +
x3 x4 2 −x2 + x3 −x1 + x4 2 x2 + x3 x1 + x4
e ciò prova la decomposizione (unica) di un vettore di R2,2 nella somma di due vettori di
W1 e W2 , rispettivamente.
Capitolo 4 165

Esercizio 4.10 In R3,3 si considerino i sottospazi vettoriali:


  
 0 a b 
W1 =  0 0 c  ∈ R3,3 | a, b, c ∈ R ,
0 0 0
 

W2 = D(R3,3 ),
  
 x1 0 0 
3,3
W3 =  x2 x3 0  ∈ R | 2x1 − x3 = x1 + 3x3 = 0 .
x4 x5 0
 

Dimostrare che W1 ⊕ W2 ⊕ W3 = R3,3 .

Soluzione Si può verificare direttamente che ogni vettore di R3,3 si decompone in mo-
do unico come somma di un vettore di W1 insieme con un vettore di W2 insieme con un
vettore di W3 .

Esercizio 4.11 In R3 [x] si consideri il sottospazio vettoriale W dei polinomi aventi una
radice uguale a 2.
1. Decomporre W nella somma diretta di due sottospazi vettoriali W1 e W2 .
2. Scrivere il polinomio −4 − 2x + x3 di W come somma di un polinomio di W1 e
di un polinomio di W2 .

Soluzione 1. Dal Teorema di Ruffini sui polinomi, si ha che ogni polinomio di W si


scrive come:
p(x) = (x − 2)(a0 + a1 x + a2 x2 ), a0 , a1 , a2 ∈ R,
quindi W = L(−2 + x, (−2 + x)x, (−2 + x)x2 ) e dim(W) = 3.
Ad esempio si può porre W = W1 ⊕ W2 , con:
W1 = L(−2 + x, (−2 + x)x), W2 = L((−2 + x)x2 ).
2. Si devono trovare i numeri reali λi , i = 1, 2, 3, tali che:
−4 − 2x + x3 = λ1 (−2 + x) + λ2 (−2 + x)x + λ3 (−2 + x)x2 .
Dall’uguaglianza dei coefficienti dei monomi di grado uguale segue:
λ1 = 2, λ2 = 2, λ3 = 1.
Pertanto −4 − 2x + x3 = p1 (x) + p2 (x), con p1 (x) = −4 − 2x + 2x2 ∈ W1 e
p2 (x) = −2x2 + x3 ∈ W2 .
166 Spazi Vettoriali e Sottospazi Vettoriali

Esercizio 4.12 Dato il sottospazio vettoriale H di R4 definito da:

H = {(x1 , x2 , x3 , x4 ) ∈ R4 | x1 + x2 + x4 = x3 = 0},

si determinino due sottospazi vettoriali diversi entrambi supplementari di H in R4 .

Soluzione Risolvendo il sistema lineare omogeneo che definisce H si ottiene che un


generico vettore di H è del tipo (t1 , t2 , 0, −t1 − t2 ) con t1 , t2 ∈ R da cui segue che
dim(H) = 2 ed i vettori a1 = (1, 0, 0, −1), a2 = (0, 1, 0, −1) formano una base di
H. Si verifica facilmente (usando il metodo degli scarti successivi descritto nella di-
mostrazione del Teorema 4.11) che, ad esempio, (a1 , a2 , e1 , e3 ), con e1 = (1, 0, 0, 0) e
e3 = (0, 0, 1, 0), è una base di R4 , ovvero che H⊕L(e1 , e3 ) = R4 . Quindi un sottospazio
vettoriale supplementare di H in R4 è K1 = L(e1 , e3 ). Con un procedimento analogo si
verifica che, ad esempio, (a1 , a2 , e3 , e4 ), con e4 = (0, 0, 0, 1), è un’altra base di R4 . Si
può allora definire un altro sottospazio vettoriale, diverso dal precedente, supplementare
di H in R4 , dato da K2 = L(e3 , e4 ).

Osservazione 4.24 Nel paragrafo seguente si introdurrà il concetto di rango di una ma-
trice che permetterà di risolvere gli esercizi proposti in questo paragrafo in un altro modo,
a volte più rapido.

4.3.3 Rango di una matrice


In questo paragrafo verrà introdotta la definizione formale di rango di una matrice, mentre
la Definizione 1.10 inserita nel Capitolo 1 ne costituisce un metodo di calcolo.

Sia A = (aij ) ∈ Rm,n una matrice di m righe e n colonne, le cui righe sono date dai
vettori:
R1 = (a11 , a12 , . . . , a1n ),
R2 = (a21 , a22 , . . . , a2n ),
..
.
Rm = (am1 , am2 , . . . , amn ).
I vettori Ri ∈ Rn , i = 1, 2, . . . , m, prendono il nome di vettori riga della matrice A ed il
sottospazio vettoriale:
R(A) = L(R1 , R2 , . . . , Rm )

è lo spazio vettoriale delle righe di A. Per costruzione R(A) è un sottospazio vettoriale


di Rn , ed avendo m generatori, la sua dimensione sarà al più pari al minore tra i numeri
m ed n.
Capitolo 4 167

Si ripete lo stesso discorso per le colonne di A. Siano:

C1 = (a11 , a21 , . . . , am1 ),


C2 = (a12 , a22 , . . . , am2 ),
..
.
Cn = (a1n , a2n , . . . , amn )

i vettori colonna di A. Il sottospazio vettoriale:

C(A) = L(C1 , C2 , . . . , Cn )

è lo spazio vettoriale delle colonne di A. Per costruzione C(A) è un sottospazio vettoriale


di Rm , ed avendo n generatori la sua dimensione sarà al più pari al minore tra i numeri
m ed n.

Osservazione 4.25 1. Per una matrice A ∈ Rm,n lo spazio vettoriale delle righe R(A)
è un sottospazio vettoriale di Rn , mentre lo spazio vettoriale delle colonne C(A)
è un sottospazio vettoriale di Rm , quindi R(A) e C(A) sono, in generale, spazi
vettoriali diversi. Se m 6= n, R(A) e C(A) sono sempre spazi vettoriali diversi.

2. Se A è una matrice qualsiasi di Rm,n , allora R(tA) = C(A), C(tA) = R(A), dove
t
A indica la trasposta della matrice A.
Se A ∈ Rn,n è una matrice simmetrica, allora R(A) = C(A).
Se A ∈ Rn,n è una matrice antisimmetrica, allora R(−A) = R(A) = C(A).

Vale il seguente teorema.

Teorema 4.19 – Teorema del Rango – Per ogni matrice A ∈ Rm,n si ha:

dim(R(A)) = dim(C(A)).

Nel Paragrafo 4.5 si propone una dimostrazione di questo teorema, ma si dovrà aspettare
il Capitolo 6 per una dimostrazione alternativa, molto più sintetica.

Il teorema appena enunciato giustifica la seguente fondamentale definizione.

Definizione 4.15 Si definisce rango di una matrice A ∈ Rm,n (e lo si indica con rank(A))
la dimensione dello spazio vettoriale delle righe (o delle colonne) di A:

rank(A) = dim(R(A)) = dim(C(A)).


168 Spazi Vettoriali e Sottospazi Vettoriali

Osservazione 4.26 Come conseguenza immediata del precedente teorema si ha anche


che:
rank(A) = rank( tA), A ∈ Rm,n ,
e che rank(A) è minore o uguale del minimo tra m e n.

Le proprietà che seguono sono volte a dimostrare che la definizione di rango di una ma-
trice, appena enunciata, coincide con la Definizione 1.10 data nel Capitolo 1. Si procede
come segue.

1. Sia A una matrice ridotta per righe, si dimostrerà che il numero delle righe non
nulle di A coincide con la dimensione dello spazio vettoriale delle righe di A.
2. Si dimostrerà, inoltre, che il processo di riduzione di una matrice per righe descritto
nel Paragrafo 1.2 lascia invariata la dimensione dello spazio vettoriale delle righe
di A, pur cambiando la matrice A.
3. A corretta conclusione, si devono aggiungere la definizione di matrice ridotta per
colonne e il procedimento di riduzione per colonne.

Teorema 4.20 Se A ∈ Rm,n è una matrice ridotta per righe, la Definizione 1.9 del Ca-
pitolo 1 coincide con la Definizione 4.15. Pertanto la definizione di rango di una matrice
è formulata in modo corretto.

Dimostrazione Poiché ogni matrice ridotta per righe può essere trasformata in una
matrice triangolare superiore mediante l’applicazione delle tre operazioni di riduzione
sulle righe senza alterarne il numero di righe non nulle (cfr. la dimostrazione del Teorema
2.13), si può supporre che una matrice ridotta per righe A ∈ Rm,n con k righe non nulle
sia del tipo seguente:  
a11 a12 . . . . . . . . . a1n
 0 a22 . . . . . . . . . a2n 
 . .. 
 . ...
. . 


 0 . . . 0 akk . . . akn ,
 
 0 ... 0 ... 0 0 
 
 . .. .. .. 
 .. . . . 
0 ... 0 ... 0 0
con a11 a22 . . . akk 6= 0. Si tratta ora di dimostrare che il numero k delle righe non nulle di
A coincide con dim(R(A)), cioè che le prime k righe di A sono linearmente indipendenti
in Rn . Il risultato è quasi ovvio ed è la conseguenza della particolare posizione delle
componenti nulle nelle righe di A. Infatti, dall’equazione:
λ1 R1 + λ2 R2 + . . . + λk Rk = o
Capitolo 4 169

nelle incognite λ1 , λ2 , . . . , λk , con:


R1 = (a11 , a12 , . . . , a1n ),
R2 = (0, a22 , . . . , a2n ),
..
.
Rk = (0, . . . , 0, akk , . . . , akn )
e o ∈ Rn , si ottiene un sistema lineare omogeneo la cui prima equazione è:
λ1 a11 = 0;
ma a11 6= 0 allora λ1 = 0. Sostituendo questo risultato nella seconda equazione:
λ1 a12 + λ2 a22 = 0
si ottiene λ2 = 0 e cosı̀ via, da cui segue che le righe non nulle della matrice A ridotta
per righe sono linearmente indipendenti.

Teorema 4.21 Le operazioni consentite per ridurre una matrice A ∈ Rm,n per righe non
cambiano la dimensione dello spazio vettoriale delle righe di A.

Dimostrazione Si ricordino le operazioni, descritte nel Paragrafo 1.2, consentite per


ridurre per righe una matrice, e precisamente:

1. Ri ←→ Rj ;
2. Ri −→ λRi , λ ∈ R, λ 6= 0;
3. Ri −→ Ri + λRj , λ ∈ R, i 6= j.

Il teorema segue allora in modo evidente dal Teorema 4.8.

Si può ripetere il procedimento di riduzione di una matrice sulle colonne, di conseguenza,


dopo aver ridotto per colonne la matrice, il suo rango sarà dato dal numero di colonne
non nulle. Più precisamente si può enunciare la seguente definizione.

Definizione 4.16 Una matrice A si dice ridotta per colonne se in ogni sua colonna non
nulla esiste un elemento non nullo a destra del quale ci sono tutti zeri.

Esempio 4.38 La matrice seguente è ridotta per colonne:


 
1 0 0
 1 1 0 
A=  2 3 4 .

5 6 7
170 Spazi Vettoriali e Sottospazi Vettoriali

Teorema 4.22 Il rango di una matrice A (inteso come la dimensione dello spazio vetto-
riale delle colonne di A) si calcola riducendo la matrice A per colonne, in altri termini
eseguendo sulle colonne, un numero finito di volte, le operazioni seguenti:
1. Ci ←→ Cj : scambiare tra di loro due colonne;
2. Ci −→ λCi , λ ∈ R, λ 6= 0 : moltiplicare tutti gli elementi di una colonna per un
numero reale non nullo;
3. Ci −→ Ci + λCj , λ ∈ R, i 6= j : sostituire ad una colonna una combinazione
lineare di se stessa con una colonna parallela
e poi contando il numero di colonne non nulle della matrice ridotta per colonne ottenuta.

La dimostrazione è un evidente esercizio.

Osservazione 4.27 Riducendo per righe una matrice A non cambia lo spazio vettoriale
R(A), anche se si ottengono matrici ridotte per righe tra di loro diverse.
Riducendo per righe una matrice A non cambia dim(C(A)) ma cambia invece lo spa-
zio vettoriale C(A). Analogamente, riducendo per colonne la matrice A non cambia
dim(R(A)) ma cambia R(A). In particolare, si osservi che riducendo per colonne la
matrice completa di una sistema lineare non si ottiene un sistema lineare equivalente al
sistema lineare dato.

Esercizio 4.13 Calcolare il rango della matrice:


 
1 2 −1
 1 1 0 
 
A =  −1
 2 4 
,
 1 1 −1 
−3 −1 2
riducendola per colonne; calcolare il rango di A riducendola per righe e osservare che si
ottiene lo stesso risultato ma la matrice ridotta per colonne ottenuta è diversa dalla matrice
ridotta per righe.

Esistono dei casi in cui le matrici ridotte per righe e per colonne a cui si perviene dalla
stessa matrice A coincidono?

Teorema 4.23 – Teorema di Nullità più Rango – Sia AX = O un sistema lineare


omogeneo con matrice dei coefficienti A ∈ Rm,n , incognite X ∈ Rn,1 e con colonna dei
termini noti la matrice nulla O ∈ Rm,1 . Sia N (A) il sottospazio vettoriale di Rn delle
soluzioni del sistema lineare omogeneo (cfr. Es. 4.12) , allora:
rank(A) + dim(N (A)) = n.
Capitolo 4 171

Dimostrazione Segue dalla definizione di rango di una matrice e dalla risoluzione dei
sistemi lineari omogenei mediante il metodo di riduzione di Gauss. Si risolve, infatti, il
sistema lineare omogeneo AX = O riducendo per righe la matrice A. Supponendo che
rank(A) = k , non si perde in generalità (cfr. la dimostrazione del Teorema 2.13) se si
assume di pervenire al seguente sistema lineare omogeneo ridotto:
    
a11 a12 . . . . . . . . . a1n x1 0
 0 a22 . . . . . . . . . a2n   x2   0 
 .. ... .. .. .. 
  ..
   .. 
. . . .  . .
   
   
0 ... 0 akk . . . akn   xk = 0 , aii 6= 0, i = 1, 2, . . . , k.
    

0 ... 0 ... 0 0   xk+1 0
    
   
 .. .. .. ..   .   .. 
 . . . .   ..   . 
0 ... 0 ... 0 0 xn 0

Si ottengono cosı̀ infinite soluzioni che dipendono da n − k incognite libere. Ponendo:




 xk+1 = t1
 xk+2 = t2

..


 .
 x = t , t ,t ,...,t
n n−k ∈ R,
1 2 n−k

sostituendo questi valori nella k -esima equazione si ha:


akk+1 akn
xk = − t1 − . . . − tn−k
akk akk

e cosı̀ via per tutte le altre incognite. Di conseguenza il nullspace N (A) risulta essere:

N (A) = {t1 (b11 , b21 , . . . , bk1 , 1, 0, . . . , 0)

+t2 (b12 , b22 , . . . , bk2 , 0, 1, . . . , 0)

+...

+tn−k (b1k−1 , b2k−1 , . . . , bkk−1 , 0, 0, . . . , 1), t1 , t2 , . . . , tn−k ∈ R},

dove i numeri reali bij indicano i coefficienti ottenuti dalla risoluzione del sistema lineare
omogeneo, per esempio:
akk+1
bk1 = − .
akk
Segue subito che dim(N (A)) = n − k .
172 Spazi Vettoriali e Sottospazi Vettoriali

Anche se la dimostrazione del teorema precedente è ovvia, la sua importanza sarà fon-
damentale nel resto del corso. La denominazione nullità deriva, come già osservato in
precedenza, dalla traduzione del termine “nullspace ”che indica in inglese il sottospazio
vettoriale N (A).

La formulazione del Teorema di Nullità più Rango appena presentato è quella classica,
che viene usata per le sue svariate applicazioni. In realtà l’enunciato completo del teorema
è il seguente.

Teorema 4.24 – Teorema di Nullità più Rango – Sia AX = O un sistema lineare


omogeneo con matrice dei coefficienti A ∈ Rm,n , incognite X ∈ Rn,1 e colonna dei
termini noti O ∈ Rm,1 . Siano R(A) lo spazio vettoriale delle righe di A, C(A) lo spazio
vettoriale delle colonne di A e N (A) il sottospazio vettoriale di Rn delle soluzioni del
sistema lineare omogeneo, allora:
R(A) ⊕ N (A) = Rn
e, equivalentemente,
C(A) ⊕ N (tA) = Rm .

Dimostrazione Tenendo conto del Teorema 4.23 è sufficiente dimostrare che:


R(A) ∩ N (A) = {o}.
Per assurdo sia x = (x1 , x2 , . . . , xn ) un elemento non nullo di R(A) ∩ N (A). Si suppon-
ga per esempio che x = R1 + 2R2 , dove R1 e R2 sono le prime due righe della matrice
A. L’ipotesi non è restrittiva, si lasciano al Lettore le varie generalizzazioni. Il vettore
x verifica tutte le equazioni del sistema lineare AX = O, in particolare, verifica anche
l’equazione che si ottiene dalla somma della prima equazione del sistema lineare con il
doppio della seconda, se A = (aij ) e X = (xi ) significa che:
(a11 + 2a21 )x1 + (a12 + 2a22 )x2 + . . . + (a1n + 2a2n )xn = 0.
Sostituendo in tale equazione l’espressione di x segue:
(a11 + 2a21 )2 + (a12 + 2a22 )2 + . . . + (a1n + 2a2n )2 = 0,
da cui x = o, che è assurdo. La seconda affermazione del teorema si ottiene sostituendo
ad A la sua trasposta.

Osservazione 4.28 È fondamentale osservare che, anche se fosse possibile, come nel
caso delle matrici quadrate, il teorema precedente non vale se si invertono i ruoli di R(A)
e di C(A). Nel Capitolo 6 si presenterà un esempio di matrice in cui C(A) ⊆ N (A) (cfr.
Oss. 6.10).
Capitolo 4 173

Osservazione 4.29 Una delle applicazioni della definizione di rango di una matrice è la
possibilità di risolvere in modo più agevole alcuni degli esercizi già proposti. Sia, infatti,
B = (v1 , v2 , . . . , vn ) una base di V e siano w1 , w2 , . . . , wk i generatori di un sottospazio
vettoriale W di V. Per trovare una base di W si può procedere considerando la matrice
A ∈ Rk,n che ha come vettori riga i vettori wi , i = 1, 2, . . . , k, scritti in componenti
rispetto alla base B. Riducendo la matrice A per righe, segue che i vettori riga non nulli,
della matrice ridotta per righe cosı̀ ottenuta, costituiscono una base di W e la dimensione
di W coincide con il rango della matrice A. Attenzione al fatto che se si riduce la matrice
A per colonne i vettori riga della matrice ridotta per colonne non determinano più una
base di W . Analogamente se W1 e W2 sono due sottospazi vettoriali di V di cui si
conoscono le componenti dei vettori delle loro basi, per determinare la dimensione e una
base di W1 +W2 si può procedere scrivendo la matrice B che ha come vettori riga i vettori
delle basi di W1 e di W2 , scritti in componenti ripetto ad una base di V. Riducendo la
matrice B per righe si ha che il rango di B coincide con la dimensione di W1 + W2 e i
vettori riga non nulli della matrice ridotta per righe che si ottiene costituiscono una base
di W1 + W2 .

Esercizio 4.14 Determinare una base del sottospazio vettoriale H di R4 cosı̀ definito:

H = L((1, 2, 0, 1), (2, 4, −1, 1), (0, 0, 1, 1), (1, 2, 4, 5), (1, −1, 0, 5)).

Soluzione Si riduce per righe la matrice A ottenuta ponendo in riga i generatori di H.


Si ha:
   
1 2 0 1 1 2 0 1
−→

 2 4 −1 1 
 R2 → R2 − 2R1

 0 0 −1 −1 

A=
 0 0 1 1 
 R4 → R4 − R1

 0 0 1 1 

 1 2 4 5   0 0 4 4 
R5 → R5 − R1
1 −1 0 5 0 −3 0 4

   
1 2 0 1 1 2 0 1
 0 −3 0 4  −→  0 −3 0 4 
−→  
 R4 → R4 − 4R3
 
 0 0 1 1  0 0 1 1 ,
R2 ↔ R5  
 R5 → R5 + R3
 
 0 0 4 4  0 0 0 0 
0 0 −1 −1 0 0 0 0
da cui segue che rank(A) = 3, quindi dim(H) = 3 e una sua base è data dalle prime tre
righe della matrice ridotta per righe ottenuta da A, cioè dai vettori:

z1 = (1, 2, 0, 1), z2 = (0, −3, 0, 4), z3 = (0, 0, 1, 1).


174 Spazi Vettoriali e Sottospazi Vettoriali

Osservazione 4.30 Si consiglia di rifare gli esercizi precedentemente svolti usando il


metodo proposto in questo paragrafo (Esercizi 4.5, 4.6, 4.9, 4.10).

Esercizio 4.15 Dato il sottospazio vettoriale di R4 :

K = {(x1 , x2 , x3 , x4 ) ∈ R4 | x1 − x2 = x1 − x3 = 0},

determinare la dimensione e una base di H+K e H∩K, dove H è il sottospazio vettoriale


definito nell’Esercizio 4.14.

Soluzione Una base di K è data ad esempio da (w1 , w2 ) con w1 = (1, 1, 1, 0) e w2 =


(0, 0, 0, 1). Per trovare la dimensione e una base di H + K, si riduce per righe la matrice
B ottenuta ponendo in riga i vettori z1 , z2 , z3 , w1 , w2 :
   
1 2 0 1 1 2 0 1
 0 −3 0 4   0 −3 0 4 
  −→  
B=  0 0 1 1 
 R4 → R4 − R1 
 0 0 1 1 

 1 1 1 0   0 −1 1 −1 
0 0 0 1 0 0 0 1
   
1 2 0 1 1 2 0 1
 0 −3 0 4   0 −3 0 4 
−→   −→  
 0 0 1 1   0 0 1 1 .
R4 → 3R4 − R2   R4 → R4 − 3R3  
 0 0 3 −7   0 0 0 −10 
0 0 0 1 0 0 0 1

Si vede che il rango di B è 4, cioè che H + K = R4 . Dalla Formula di Grassmann (cfr.


Teor. 4.18) si ha che dim(H ∩ K) = 3 + 2 − 4 = 1. Per trovare una base di H ∩ K si può
procedere in questo modo. Un generico vettore di H ∩ K è della forma:

λ1 z1 + λ2 z2 + λ3 z3 = µ1 w1 + µ2 w2 , (4.6)

con λ1 , λ2 λ3 , µ1 , µ2 ∈ R. Si deve perciò risolvere il sistema lineare omogeneo nelle in-


cognite (λ1 , λ2 , λ3 , µ1 , µ2 ) associato alla precedente equazione con la riduzione per righe
della corrispondente matrice dei coefficienti:
 
1 0 0 −1 0
 2 −3 0 −1 0 
C= .
 0 0 1 −1 0 
1 4 1 0 −1
Capitolo 4 175

Si trovano infinite soluzioni:


 
1 10
λ1 = µ1 , λ2 = µ1 , λ3 = µ1 , µ2 = µ1 ,
3 3
con µ1 ∈ R. Sostituendo tali valori in (4.6) si ottiene che:
 
10
w1 + w2
3
è una base di H ∩ K.
Esercizio 4.16 In R3 [x] si considerino i polinomi:
p1 (x) = 1 + x2 , p2 (x) = x + x3 , p3 (x) = 2 + x + x3 .
1. Verificare che l’insieme I = {p1 (x), p2 (x), p3 (x)} è libero.
2. Individuare una base di R3 [x] contenente I .
Soluzione 1. Sia B = (1, x, x2 , x3 ) una base di R3 [x]. Rispetto a B, i polinomi dati
hanno componenti:
p1 (x) = (1, 0, 1, 0), p2 (x) = (0, 1, 0, 1), p3 (x) = (2, 1, 0, 1).
Si consideri la matrice A di R3,4 avente come righe le componenti dei tre poli-
nomi e ne si calcoli il rango riducendola per righe:
   
1 0 1 0 1 0 1 0
−→
A= 0 1 0 1   0 1 0 1 
R3 → R3 − 2R1
2 1 0 1 0 1 −2 1
 
1 0 1 0
−→  0 1 0 1 .
R3 → R3 − R2
0 0 −2 0
Segue che rank(A) = 3 e, quindi, la tesi.
2. Per ottenere una base di R3 [x] contenente I è sufficiente aggiungere ai polinomi
dati un polinomio in modo che i quattro polinomi siano linearmente indipendenti.
Allora, è sufficiente aggiungere all’ultima matrice ottenuta nel calcolo precedente
una riga in modo tale che la matrice quadrata di ordine 4 cosı̀ ottenuta sia ridotta
per righe e abbia rango 4, precisamente si ha:
 
1 0 1 0
 0 1 0 1 
 0 0 −2 0 ,
 

0 0 0 1
quindi un polinomio (ma non è l’unico) che risolve l’esercizio è x3 .
176 Spazi Vettoriali e Sottospazi Vettoriali

4.3.4 Il cambiamento di base


In questo paragrafo si presenta il problema del cambiamento di base in uno spazio vetto-
riale reale qualsiasi V, estendendo a V l’analogo problema risolto nel caso dello spazio
vettoriale dei vettori ordinari V3 nel Paragrafo 3.5.

Nello spazio vettoriale reale V, di dimensione n, si considerino due basi:


B = (v1 , v2 , . . . , vn ), B 0 = (v10 , v20 , . . . , vn0 ).
Si ponga: 

 v10 = p11 v1 + p21 v2 + . . . + pn1 vn ,
 v0 = p12 v1 + p22 v2 + . . . + pn2 vn ,

2
.. (4.7)

 .
 v0 = p v + p v + . . . + p v .

n 1n 1 2n 2 nn n

La matrice:
0
P = M B,B = (pij ), i, j = 1, 2, . . . , n,
che è cosı̀ determinata, prende il nome di matrice del cambiamento di base da B a B 0,
0
come precisato nella notazione M B,B . P è ottenuta ponendo ordinatamente in colonna
le componenti dei vettori della base B 0 rispetto ai vettori della base B. La ragione della
scelta delle colonne è giustificata da una maggiore semplicità della formula finale (4.9)
che si ottiene. P è una matrice quadrata, ad elementi reali, di rango massimo (rank(P ) =
n) e, quindi, per i Teoremi 2.16 e 2.8, P è invertibile e det(P ) 6= 0. Le equazioni (4.7)
si possono scrivere, in notazione matriciale, come:
   
v10 v1
 v0   v2 
 2 
 ..  = tP  .. . (4.8)
 
 .   . 
vn0 vn
Considerato un qualsiasi vettore x ∈ V, il problema del cambiamento di base consiste
nel determinare le relazioni che intercorrono tra le componenti di x rispetto alle due basi
introdotte. Si supponga, quindi, che:

x = x1 v1 + x2 v2 + . . . + xn vn = x01 v10 + x02 v20 + . . . + x0n vn0 ,


vale a dire, in notazione matriciale:
   
v1 v10
 v2   v20 
x= x1 x2 . . . xn  = x01 x02 ... x0n .
   
..  ..
 .   . 
vn vn0
Capitolo 4 177

Sostituendo le equazioni (4.8) nell’uguaglianza precedente e tenendo conto dell’unicità


delle componenti di un vettore rispetto alla base B si perviene alle relazioni:
   
x1 x01
 x2   x0 
 2 
 ..  = P  .. 
 
 .   . 
xn x0n

che saranno spesso indicate come:

X = P X 0, (4.9)

dove X e X 0 sono, rispettivamente, le matrici colonna delle componenti di x rispetto alla


base B e alla base B 0. Tali relazioni prendono il nome di equazioni del cambiamento di
base da B a B 0 e risolvono il problema posto.

Osservazione 4.31 La matrice del cambiamento di base da B 0 a B è P −1 , in quanto le


equazioni del cambiamento di base, in questo caso, sono X 0 = P −1 X .

Esercizio 4.17 1. Verificare che:


     
0 1 −2 2 1 4 −1
B = , ,
−2 1 1 3 −1 −5

è una base di S(R2,2 ).

2. Trovare le componenti della matrice:


 
4 −11
A=
−11 −7

rispetto alla base B 0 .

Soluzione 1. Sia:
     
1 0 0 1 0 0
B= , ,
0 0 1 0 0 1

una base di S(R2,2 ). La matrice del cambiamento di base da B a B 0 , ottenuta


ponendo in colonna le componenti dei vettori di B 0 rispetto a B, è:
 
1 2 4
P =  −2 1 −1 .
1 3 −5
178 Spazi Vettoriali e Sottospazi Vettoriali

Si verifica che det(P ) = −52, quindi i tre vettori dati formano, effettivamente,
una base di S(R2,2 ).

2. Le componenti richieste sono la soluzione del sistema lineare:


   0 
4 x1
−11  = P  x02 ,
−7 x03

ossia x01 = 4, x02 = −2, x03 = 1.

4.3.5 Iperpiani vettoriali


Definizione 4.17 Sia V uno spazio vettoriale reale di dimensione n. Ogni sottospazio
vettoriale W di V tale che dim(W) = n − 1 prende il nome di iperpiano vettoriale di V.

Per definizione, quindi, un iperpiano vettoriale è generato da n − 1 vettori linearmente


indipendenti di V.

Esempio 4.39 In R4 l’iperpiano vettoriale W generato dai vettori:

a1 = (1, 0, 1, 4), a2 = (0, 1, 1, 2), a3 = (0, 0, 3, 4)

è il sottospazio vettoriale di R4 :

W = {(x1 , x2 , x3 , x4 ) = k1 a1 + k2 a2 + k3 a3 , k1 , k2 , k3 ∈ R}
= {(k1 , k2 , k1 + 3k3 , 4k1 + 2k2 + 4k3 ) | k1 , k2 , k3 ∈ R}.

Vale il seguente teorema.

Teorema 4.25 Sia B = (v1 , v2 , . . . , vn ) una base di uno spazio vettoriale V di dimen-
sione n e siano (x1 , x2 , . . . , xn ) le componenti di un qualsiasi vettore x di V rispetto
alla base B.

1. Tutte e sole le equazioni lineari omogenee in (x1 , x2 , . . . , xn ) rappresentano, ri-


spetto alla base B, gli iperpiani vettoriali di V.

2. Ogni sottospazio vettoriale W di V di dimensione k è rappresentabile, rispetto alla


base B, mediante un sistema lineare omogeneo di n − k equazioni nelle incognite
(x1 , x2 , . . . , xn ).

Dimostrazione 1. La dimostrazione è lasciata per esercizio.


Capitolo 4 179

2. Sia (a1 , a2 , . . . , ak ) una base di W, allora ogni vettore x di W è del tipo:


x = λ1 a1 + λ2 a2 + . . . + λk ak , λ1 , λ2 , . . . , λk ∈ R. (4.10)
Eliminando i parametri λ1 , λ2 , . . . , λk tra le n equazioni che si ottengono scriven-
do in componenti l’equazione vettoriale (4.10) si perviene ad un sistema lineare
omogeneo di n − k equazioni nelle componenti (x1 , x2 , . . . , xn ).

Come immediata conseguenza del secondo punto del teorema precedente si ottiene il
seguente corollario.
Corollario 4.2 Un sottospazio vettoriale W, di dimensione k, di uno spazio vettoriale
V, di dimensione n, è l’intersezione di n − k iperpiani vettoriali di V.
Esempio 4.40 In R4 , l’equazione lineare omogenea:
x1 + x2 + 3x3 + 2x4 = 0,
rispetto alla base canonica B = (e1 , e2 , e3 , e4 ) di R4 , individua l’iperpiano vettoriale
generato, ad esempio, dai vettori:
(−1, 1, 0, 0), (−3, 0, 1, 0), (−2, 0, 0, 1).
Esercizio 4.18 Qual è l’equazione dell’iperpiano vettoriale considerato nell’Esempio 4.39
rispetto alla base canonica di R4 ?
Soluzione I vettori a1 , a2 , a3 , x = (x1 , x2 , x3 , x4 ) appartengono a W se e solo se sono
linearmente dipendenti, ossia se la matrice quadrata, di ordine 4, le cui righe sono le
componenti dei quattro vettori, ha determinante nullo. L’equazione richiesta è:

1 0 1 4

0 1 1 2
0 0 3 4 = 0.


x1 x2 x3 x4

La motivazione dell’ultimo passaggio è lasciata al Lettore.


Esempio 4.41 Nell’Esercizio 4.11 il sottospazio vettoriale W dei polinomi divisibili per
2 in R3 [x] è un iperpiano vettoriale, la cui equazione lineare omogenea nelle componenti
(a0 , a1 , a2 , a3 ) di un polinomio p(x) = a0 + a1 x + a2 x2 + a3 x3 ∈ R3 [x] rispetto alla base
B = (1, x, x2 , x3 ) è data da p(2) = a0 + 2a1 + 4a2 + 8a3 = 0.
Esempio 4.42 In Rn,n il sottospazio vettoriale:
W = {A ∈ Rn,n | tr(A) = 0},
dove tr(A) indica la traccia della matrice A, è un iperpiano vettoriale di Rn,n .
180 Spazi Vettoriali e Sottospazi Vettoriali

4.4 Esercizi di riepilogo svolti


Esercizio 4.19 In R4 si considerino i vettori:
a1 = (1, 1, 0, 0), a2 = (0, 1, 0, 1), a3 = (1, 3, 0, 2).
Posto E1 = L(a1 ), E2 = L(a2 ), E3 = L(a3 ),
1. determinare i vettori che appartengono a H = E1 + E2 + E3 e verificare che la
somma non è diretta.
2. Dimostrare che v = (2, 5, 0, 3) è un elemento di H e scrivere v in due modi diversi
come combinazione lineare di vettori di E1 , E2 , E3 .

Soluzione 1. H = {λ1 a1 + λ2 a2 + λ3 a3 | λ1 , λ2 , λ3 ∈ R}

= {(λ1 + λ3 , λ1 + λ2 + 3λ3 , 0, λ2 + 2λ3 ) | λ1 , λ2 , λ3 ∈ R}.

L’insieme {a1 , a2 , a3 } non è libero in quanto a3 = a1 + 2a2 . Quindi:


L(a3 ) = L(a1 + 2a2 ) ⊂ L(a1 ) + L(a2 ),
cioè E3 ⊂ E1 + E2 . H non è somma diretta di E1 , E2 , E3 .

2. Per definizione il vettore v appartiene ad H se esistono λ1 , λ2 , λ3 ∈ R tali che:



 2 = λ1 + λ3
5 = λ1 + λ2 + 3λ3
3 = λ2 + 2λ3 .

Risolvendo il sistema lineare si trova:


λ1 = 2 − t, λ2 = 3 − 2t, λ3 = t, t ∈ R.

Ponendo, per esempio, t = 0 si ottiene v = 2a1 + 3a2 , per t = 1 si ha:


v = a1 + a2 + a3 .

Esercizio 4.20 Data la matrice:


 
6 −9
A= ,
4 −6
1. dimostrare che i sottoinsiemi:
F = {X ∈ R2,2 | AX = XA}, G = {X ∈ R2,2 | AX = −XA}

sono sottospazi vettoriali di R2,2 e trovare una base per ciascuno di essi.
Capitolo 4 181

2. Determinare una base per i sottospazi vettoriali F ∩ G e F + G .

3. Data la matrice:  
0 h−2
C= , h ∈ R,
0 h−3

stabilire per quale valore di h la matrice C appartiene al sottospazio vettoriale


F + G . Assegnato ad h tale valore, trovare due matrici C1 ∈ F e C2 ∈ G in modo
tale che C = C1 + C2 .

Soluzione 1. Siano X1 , X2 matrici di R2,2, appartenenti a F , allora AX1 = X1 A e


AX2 = X2 A. F è un sottospazio vettoriale di R2,2 se λ1 X1 + λ2 X2 ∈ F con
λ1 , λ2 numeri reali qualsiasi, ossia se:

A(λ1 X1 + λ2 X2 ) = (λ1 X1 + λ2 X2 )A.

La verifica è un facile esercizio. In modo analogo si dimostra che G è un sottospa-


zio vettoriale di R2,2 . Per determinare la dimensione e una base sia di F sia di G
è necessario scrivere esplicitamente le equazioni che li definiscono. Ponendo:
 
x1 x2
X= ,
x3 x4

la condizione AX = XA equivale al sistema lineare omogeneo:




 4x2 + 9x3 = 0
9x1 + 12x2 − 9x4 = 0


 4x1 − 12x3 − 4x4 = 0
4x2 + 9x3 = 0,

le cui soluzioni sono:


 
9
3λ1 + λ2 , − λ1 , λ1 , λ2 , λ1 , λ2 ∈ R,
4

quindi dim(F) = 2 e una base di F è:


  
12 −9 1 0
B= , .
4 0 0 1

Per determinare la dimensione e una base di G si procede allo stesso modo, la


182 Spazi Vettoriali e Sottospazi Vettoriali

condizione AX = −XA equivale al sistema lineare omogeneo:




 12x1 + 4x2 − 9x3 = 0
9x1 + 9x4 = 0


 4x 1 + 4x4 = 0
4x2 − 9x3 − 12x4 = 0,

le cui soluzioni sono:


 
9
−λ1 , 3λ1 + λ2 , λ2 , λ1 , λ1 , λ2 ∈ R,
4

quindi dim(G) = 2 e una base di G è:


  
−1 3 0 9
C= , .
0 1 4 0

2. Conviene, in generale, iniziare con il calcolo della somma dei due sottospazi vetto-
riali. Riducendo per righe la matrice quadrata di ordine 4 che si ottiene ponendo in
riga le componenti dei vettori di B e di C si ha che il rango di tale matrice è 3 e che
una base di F + G è:
   
1 0 0 3 0 0
D= , , .
0 1 0 2 4 −6

Dalla formula di Grassmann segue che dim(F ∩ G) = 1. Una generica matrice


appartenente a tale intersezione si deve poter scrivere come:
       
12 −9 1 0 −1 3 0 9
λ1 + λ2 = µ1 + µ2 (4.11)
4 0 0 1 0 1 4 0

per qualche valore di λ1 , λ2 , µ1 , µ2 ∈ R. Il sistema lineare omogeneo che ne


deriva ha infinite soluzioni date da:
 
1
λ1 = − µ1 , λ2 = µ1 , µ1 ∈ R.
6

Sostituendo questo risultato a primo membro di (4.11) si ottiene:


 
−6 9
F ∩G =L .
−4 6
Capitolo 4 183

3. La matrice C appartiene a F + C se la matrice quadrata di ordine 4 le cui righe


sono date dalle componenti di C e dalle componenti degli elementi della base D
ha determinante uguale a zero, ossia:

1 0 0 1

0 3 0 2
= 0,
0
0 4 −6
0 h−2 0 h−3

da cui segue h = 5. La matrice C è dunque:


 
0 3
C=
0 2

e si decompone nella somma di infinite coppie di matrici C1 ∈ F e C2 ∈ G nel


modo seguente:

C = C1 + C2
         
12 −9 1 0 −1 3 0 9
= λ1 + λ2 + µ1 + µ2 ,
4 0 0 1 0 1 4 0

con λ1 , λ2 , µ1 , µ2 ∈ R. Il sistema lineare che segue da tale scrittura ammette infinite


soluzioni che dipendono da un’incognita libera (essendo dim(F ∩ G) = 1), la
soluzione di questo sistema lineare e la conseguente determinazione di C1 e di C2
sono lasciate per esercizio.

4.5 Per saperne di più


In questo paragrafo sono inseriti alcuni esercizi che possono essere omessi ad una prima
lettura. Si propone anche la dimostrazione di qualche teorema citato nei paragrafi pre-
cedenti. Di grande importanza, invece, la parte finale del paragrafo, che è in generale
oggetto di corsi più avanzati di algebra lineare, dove vengono introdotti alcuni esempi di
spazi vettoriali complessi. Si studia lo spazio vettoriale Cn,n delle matrici quadrate ad
elementi nel campo complesso e si introducono due suoi sottospazi vettoriali reali: quel-
lo delle matrici hermitiane e quello delle matrici anti-hermitiane che sono l’analogo, in
campo complesso, degli spazi vettoriali delle matrici simmetriche e antisimmetriche.

Esercizio 4.21 1. Verificare che il campo dei numeri reali R dotato delle seguenti
operazioni:
184 Spazi Vettoriali e Sottospazi Vettoriali

p
x ♦ y = 3√x3 + y 3 ,
λ x = 3 λ x, λ ∈ R, x, y ∈ R,

è uno spazio vettoriale di dimensione 1 su R stesso.

2. Verificare se tale proprietà è ancora valida nel caso delle operazioni:


p
x4y = √3
x3 + y 3 ,
λ x = λ x, λ ∈ R, x, y ∈ R.

Soluzione 1. Si verifica facilmente che (R, ♦) è un gruppo abeliano, con 0 elemento


neutro e −x opposto di x ∈ R. Anche la verifica delle quattro proprietà del
prodotto per scalari è semplice. Inoltre R = L(1), in quanto ogni x ∈ R si può
scrivere come x3 1.

2. La definizione di prodotto per scalari λ x non verifica, per esempio, la seguente


proprietà:

(λ + µ) x = (λ x) 4 (µ x),

infatti: p
(λ + µ) x = λ + µ x,
mentre:
√ √
q√

(λ x) 4 (µ x) = λ x 4 µ x = 3 ( λ)3 x3 + ( µ)3 x3
q√

= 3 ( λ)3 + ( µ)3 x.

Esercizio 4.22 Si verifichi che lo spazio vettoriale F(R) delle funzioni reali di variabile
reale descritto nell’Esempio 4.5 non è finitamente generato.

Soluzione Sia S un sottoinsieme finito di R e si indichi con F(S, R) lo spazio vetto-


riale delle funzioni f : S −→ R costruito in modo analogo all’Esempio 4.5. Tale spazio
vettoriale è finitamente generato, infatti una sua base è data dall’insieme delle funzioni
caratteristiche di S :
X = {χs ∈ F(S, R) | s ∈ S},
dove: 
1, t = s,
χs (t) =
6 s.
0, t =
Capitolo 4 185

X genera F(S, R), infatti per ogni f ∈ F(S, R), f = Σs∈S f (s)χs . Si controlla fa-
cilmente che X è un insieme libero. È evidente che con questo tipo di ragionamento si
perviene ad un sistema di generatori di F(R) formato da infiniti elementi.

Esercizio 4.23 Dimostrare il Teorema 4.1 di seguito riportato.

In V, spazio vettoriale reale, si ha:

1. il vettore nullo o è unico;

2. per ogni vettore x ∈ V, l’opposto −x è unico;

3. se x + y = x + z, allora y = z, per ogni x, y, z ∈ V ;

4. λx = o ⇐⇒ λ = 0, oppure x = o, con λ ∈ R e x ∈ V ;

5. (−1)x = −x, per ogni x ∈ V.

Soluzione 1. Per assurdo, siano o e o0 due vettori nulli, o 6= o0 . Allora o = o + o0


essendo o0 il vettore nullo, ma anche o + o0 = o0 essendo o il vettore nullo, da
cui la tesi.

2. Per assurdo, siano x1 e x2 due opposti di x, con x1 6= x2 , allora:

(x + x1 ) + x2 = o + x2 = x2 ,

ma anche:

(x + x1 ) + x2 = x + (x1 + x2 ) = x + (x2 + x1 ) = (x + x2 ) + x1 = x1 ,

da cui l’assurdo.

3. Segue in modo evidente dalla proprietà precedente, infatti da x + y = x + z si ha:


x + y − x = x + z − x da cui la tesi.

4. Si inizia con il dimostrare che 0 x = o e che λo = o. Si ha:

0 x = (0 + 0)x = 0 x + 0 x,

applicando la proprietà precedente si ha 0 x = o. Analogamente:

λo = λ(o + o) = λo + λo,

da cui λo = o. Viceversa si dimostra che se λx = o, allora, necessariamente λ = 0


oppure (non esclusivo) x = o. Nel punto precedente è stato provato che 0 x = o,
186 Spazi Vettoriali e Sottospazi Vettoriali

supposto, quindi, λ 6= 0, si prova che da λx = o segue necessariamente x = o. Se


λ 6= 0, allora esiste il suo inverso λ−1 . Da:

o = λ−1 o = λ−1 (λx) = (λ−1 λ)x = 1x

segue la tesi.
5. La tesi consiste nel provare che x + (−1)x = o, infatti:

1x + (−1)x = (1 − 1)x = 0 x = o.

Esercizio 4.24 Dimostrare la Formula di Grassmann 4.18 di seguito riportata.

Siano W1 e W2 sottospazi vettoriali di uno spazio vettoriale reale V, allora:

dim(W1 + W2 ) = dim(W1 ) + dim(W2 ) − dim(W1 ∩ W2 ).

Soluzione Siano dim(V ) = n, dim(W1 ) = l, dim(W2 ) = p, con l, p ≤ n. Si ponga


dim(W1 ∩ W2 ) = k , dove k ≤ l, p. Si lasciano per esercizio i casi particolari k = l e
k = p e si tratta solo il caso di k < l e k < p. Sia B = (a1 , a2 , . . . , ak ) una base di
W1 ∩ W2 . B è, quindi, un insieme libero sia in W1 sia in W2 . Dal Teorema 4.15 segue
che si possono costruire una base:

C = (a1 , . . . , ak , bk+1 , . . . , bl )

di W1 e una base:
D = (a1 , . . . , ak , ck+1 , . . . , cp )
di W2 . La tesi consiste, allora, nel dimostrare che:

E = (a1 , . . . , ak , bk+1 , . . . , bl , ck+1 , . . . , cp )

è una base di W1 + W2 . Per costruzione E è un sistema di generatori di W1 + W2 . Si


deve quindi provare che E è libero. A tale scopo si consideri la combinazione lineare a
coefficienti reali:

α1 a1 + . . . + αk ak + βk+1 bk+1 + . . . + βl bl + γk+1 ck+1 + . . . + γp cp = o, (4.12)

con α1 , . . . , αk , βk+1 , . . . , βl , γk+1 , . . . , γp ∈ R. Sia:

c = −γk+1 ck+1 − . . . − γp cp . (4.13)

Per definizione c ∈ W2 , da (4.12) segue che c = α1 a1 +. . .+αk ak +βk+1 bk+1 +. . .+βl bl ,


quindi c ∈ W1 , pertanto c ∈ W1 ∩ W2 . Allora esistono opportuni coefficienti reali
λi , i = 1, 2, . . . , k, tali che c = λ1 a1 + . . . + λk ak . Da (4.13) si ottiene:
Capitolo 4 187

λ1 a1 + . . . + λk ak + γk+1 ck+1 + . . . + γp cp = o, (4.14)


ma i vettori che compaiono in (4.14) sono i vettori della base D, pertanto sono linearmente
indipendenti, da cui segue, tra l’altro, che γk+1 = . . . = γp = 0. Sostituendo in (4.12) e
ricordando che la combinazione lineare rimasta è formata dai vettori della base C, si ha
la tesi.

Esercizio 4.25 Dimostrare il Lemma di Steinitz 4.12 di seguito riportato.

Sia B = (v1 , v2 , . . . , vn ) una base di uno spazio vettoriale V e sia I = {u1 , u2 , . . . , up }


un insieme libero di V, allora p ≤ n.

Soluzione Siano (λ1 , λ2 , . . . , λn ) le componenti di u1 rispetto alla base B. Poiché I è


un insieme libero, u1 6= o, pertanto almeno una componente tra λi , i = 1, 2, . . . , n, non
è nulla; si supponga che sia λ1 6= 0 (in caso contrario si riordinano i vettori di B in modo
da porre al primo posto un coefficiente non nullo). Dalla relazione:

u1 = λ1 v1 + λ2 v2 + . . . + λn vn (4.15)
si ricava:
v1 = λ−1 −1 −1
1 u1 − λ1 λ2 v2 − . . . − λ1 λn vn .

In altri termini v1 ∈ L(u1 ,v2, . . . ,vn ). Si vuole dimostrare che l’insieme {u1 ,v2 ,. . . ,vn }
è una base di V. Si inizia con il provare che si tratta di un sistema di generatori di V. Da
(4.15) segue che, per ogni x ∈ V, si ha:

x = x1 v 1 + x2 v 2 + . . . + xn v n
= x1 (λ−1 −1 −1
1 u1 − λ1 λ2 v2 − . . . − λ1 λn vn ) + x2 v2 + . . . + xn vn
= µ1 u1 + µ2 v2 + . . . + µn vn
da cui la tesi. L’insieme {v2 , v3 , . . . , vn } è libero essendo un sottoinsieme non vuoto
di B (cfr. Es. 4.33). Il vettore u1 non appartiene a L(v2 , v3 , . . . , vn ), quindi l’insieme
{u1 , v2 , . . . , vn } è libero (cfr. Lemma 4.1). Si osservi che, a questo punto, partendo dalla
base B, si è ottenuta una nuova base B1 = (u1 , v2 , . . . , vn ) in cui si è sostituito al primo
vettore di B il primo vettore di I . Si itera questo procedimento, passando a considerare
il vettore u2 e lo si esprime come combinazione lineare dei vettori di B1 . Si ha:

u2 = γ1 u1 + γ2 v2 + . . . + γn vn .

Di nuovo, essendo u2 non nullo, esiste almeno una sua componente tra γi , i = 1, 2, . . . , n,
non nulla. Non può succedere che sia γ1 6= 0 e gli altri γi = 0, i = 2, . . . , n, perché i
188 Spazi Vettoriali e Sottospazi Vettoriali

vettori u1 , u2 sono linearmente indipendenti, pertanto si può supporre γ2 6= 0. Si ricava


v2 in funzione dei vettori rimanenti e si dimostra che B2 = (u1 , u2 , v3 , . . . , vn ) è una
base di V in modo analogo al caso precedente. Si procede di nuovo con un terzo vettore
di I, questo tipo di ragionamento è autorizzato dal fatto che B e I sono insiemi finiti. Il
procedimento descritto si può arrestare solo per due motivi:

a. si sono esauriti tutti i vettori di I e pertanto sono stati inseriti i vettori di I all’in-
terno di B, da cui segue la tesi;

b. si sono esauriti prima i vettori di B e rimangono ancora dei vettori in I , segue che
I contiene una base di V che è assurdo, essendo I libero.

4.5.1 Equazioni vettoriali e teorema del rango


Definizione 4.18 Dati i vettori a1 , a2 , . . . , am , b di uno spazio vettoriale reale V, la
relazione:
x1 a1 + x2 a2 + . . . + xm am = b (4.16)
è un’equazione vettoriale nell’incognita (x1 , x2 , . . . , xm ) ∈ Rm .

Definizione 4.19 Una soluzione dell’equazione vettoriale (4.16) è una m–upla:

(x01 , x02 , . . . , x0m ) ∈ Rm

che sostituita in (4.16) la verifica.

Esempio 4.43 Nei capitoli precedenti si sono incontrate più volte equazioni vettoriali,
per esempio la definizione di vettori linearmente indipendenti fa uso di un’equazione
vettoriale di cui si chiede che ammetta solo la soluzione nulla.

L’esempio precedente impone la seguente definizione.

Definizione 4.20 L’equazione vettoriale (4.16) si dice omogenea se b = o e o è il vettore


nullo di V.

Osservazione 4.32 È chiaro che un’equazione vettoriale omogenea ammette la soluzione


nulla (0, 0, . . . , 0). L’equazione vettoriale (4.16) ammette solo la soluzione nulla se e solo
se i vettori a1 , a2 , . . . , ak sono linearmente indipendenti, ovviamente supponendo a priori
che siano tutti diversi dal vettore nullo.

Il teorema che segue determina le condizioni affinché un’equazione vettoriale ammetta


soluzioni e propone anche il metodo per determinarle.
Capitolo 4 189

Teorema 4.26 – Teorema di Rouché–Capelli – L’equazione vettoriale (4.16) ammette


soluzioni se e solo se:

dim(L(a1 , a2 , . . . , am )) = dim(L(a1 , a2 , . . . , am , b)).

Dimostrazione Innanzi tutto si osservi che L(a1 , a2 , . . . , am ) ⊆ L(a1 , a2 , . . . , am , b)


e, se dim(L(a1 , a2 , . . . , am )) = k, allora k ≤ dim(L(a1 , a2 , . . . , am , b)) ≤ k + 1. Si
supponga che l’equazione (4.16) ammetta soluzioni, si deve dimostrare che:

L(a1 , a2 , . . . , am , b) ⊆ L(a1 , a2 , . . . , am ).
Per ipotesi esiste una m–upla di numeri reali (x01 , x02 , . . . , x0m ) tale che:

x01 a1 + x02 a2 + . . . x0m am = b,

da cui segue la tesi, (cfr. Teor. 4.8).


Viceversa, si supponga che dim(L(a1 , a2 , . . . , am )) = dim(L(a1 , a2 , . . . , am , b)). Con-
viene distinguere due casi e analizzarli separatamente:

a. dim(L(a1 , a2 , . . . , am )) = dim(L(a1 , a2 , . . . , am , b)) = m;

b. dim(L(a1 , a2 , . . . , am )) = dim(L(a1 , a2 , . . . , am , b)) = k < m.

a. Se dim(L(a1 , a2 , . . . , am )) = dim(L(a1 , a2 , . . . , am , b)) = m, i vettori a1 , a2 , . . . ,


am costituiscono una base sia di L(a1 , a2 , . . . , am ) sia di L(a1 , a2 , . . . , am , b), al-
lora il vettore b si esprime, in modo unico, come combinazione lineare dei vettori
a1 , a2 , . . . , am e, quindi, l’equazione (4.16) ammette una sola soluzione data dalle
componenti di b rispetto alla base (a1 , a2 , . . . , am ).

b. Dal Teorema 4.11 segue che esistono k vettori tra a1 , a2 , . . . , am che formano una
base di L(a1 , a2 , . . . , am ). Si supponga che siano i primi k (in caso contrario si rior-
dinano i vettori in modo da ottenere questo risultato), quindi L(a1 , a2 , . . . , ak ) =
L(a1 , a2 , . . . , am ), ma per ipotesi si ha anche che:

L(a1 , a2 , . . . , ak ) = L(a1 , a2 , . . . , am , b).

Segue che esistono k scalari x01 , x02 , . . . , x0k tali che:

b = x01 a1 + x02 a2 + . . . + x0k ak .

Il teorema è dimostrato perché la m–upla (x01 , x02 , . . . , x0k , 0, . . . , 0) ∈ Rm è una


soluzione dell’equazione vettoriale (4.16). In questo caso, esistono infinite solu-
zioni che dipendono da m − k incognite libere, infatti scelti ad arbitrio gli scalari
190 Spazi Vettoriali e Sottospazi Vettoriali

µk+1 , . . . , µm , il vettore b − µk+1 ak+1 − . . . − µm am appartiene a L(a1 , a2 , . . . , ak )


pertanto:

b = x01 a1 + x02 a2 + . . . + x0k ak + µk+1 ak+1 + . . . + µm am

da cui segue la tesi.

Osservazione 4.33 Il Lettore verifichi per esercizio (usando la definizione di rango di una
matrice) che il Teorema di Rouché–Capelli appena dimostrato coincide con il Teorema di
Rouché–Capelli 1.2 enunciato nel Paragrafo 1.2.

Esercizio 4.26 Dimostrare il Teorema del Rango 4.19, di seguito riportato.

Per ogni matrice A ∈ Rm,n si ha:

dim(R(A)) = dim(C(A)).

Soluzione Sia:
 
a11 a12 . . . a1n
 a21 a22 . . . a2n 
A=  ∈ Rm,n .
 
.. .. .. ..
 . . . . 
am1 am2 . . . amn
R(A) = L(R1 , R2 , . . . , Rm ) ⊆ Rn è lo spazio vettoriale delle righe di A, dove:

R1 = (a11 , a12 , . . . , a1n )


R2 = (a21 , a22 , . . . , a2n )
..
.
Rm = (am1 , am2 , . . . , amn ).

C(A) = L(C1 , C2 , . . . , Cn ) ⊆ Rm è lo spazio vettoriale delle colonne di A, dove:

C1 = (a11 , a21 , . . . , am1 )


C2 = (a12 , a22 , . . . , am2 )
..
.
Cn = (a1n , a2n , . . . , amn ).

Siano k = dim(C(A)) e h = dim(R(A)). La tesi si ottiene dimostrando che k ≤ h,


infatti, per la disuguaglianza opposta è sufficiente considerare tA, per cui si ha R(A) =
C( tA) e C(A) = R( tA), applicando il fatto che k ≤ h a tA segue h ≤ k .
Capitolo 4 191

Si consideri il sistema lineare omogeneo AX = O avente A come matrice dei coefficien-


ti, O ∈ Rm,1 matrice nulla dei termini noti e
 
x1
 x2 
X =  ..  ∈ Rn,1
 
 . 
xn
matrice delle incognite. Dalla sua scrittura esplicita:


 a11 x1 + a12 x2 + . . . + a1n xn = 0
 a21 x1 + a22 x2 + . . . + a2n xn = 0

.. (4.17)


 .
 a x + a x + ... + a x = 0
m1 1 m2 2 mn n

si deduce che esso è equivalente all’equazione vettoriale:

x1 C1 + x2 C2 + . . . + xn Cn = o,
(o ∈ Rm ) le cui soluzioni dipendono da k vettori di C(A) linearmente indipendenti, dove
k = dim(C(A)), (cfr. Teor. 4.26). Essendo h = dim(R(A)), si supponga che le prime
h righe di A siano linearmente indipendenti, questa non è un’ipotesi restrittiva perché
in caso contrario si può effettuare un cambiamento dell’ordine in cui sono considerate le
righe. Si supponga, quindi, che l’insieme {R1 , R2 , . . . , Rh } sia libero. Dalla Definizione
1.6 e dal Teorema 1.1 segue che il sistema lineare (4.17) è equivalente al sistema lineare
omogeneo: 

 a11 x1 + a12 x2 + . . . + a1n xn = 0
 a21 x1 + a22 x2 + . . . + a2n xn = 0

.. (4.18)


 .
 a x + a x + ... + a x = 0
h1 1 h2 2 hn n

che è, a sua volta, equivalente all’equazione vettoriale:

x1 a1 + x2 a2 + . . . + xn an = o,

dove:

a1 = (a11 , a21 , . . . , ah1 )


a2 = (a12 , a22 , . . . , ah2 )
..
.
an = (a1n , a2n , . . . , ahn ).
192 Spazi Vettoriali e Sottospazi Vettoriali

Dal fatto che i sistemi lineari (4.17) e (4.18) sono equivalenti segue:

dim(L(a1 , a2 , . . . , an )) = dim(C(A)) = k

ma L(a1 , a2 , . . . , an ) ⊆ Rh , da cui la tesi.

Esercizio 4.27 Dimostrare il Teorema 2.4, di seguito riportato.

Siano A1 , A2 , . . . , An matrici moltiplicabili tra di loro, allora:

rank(A1 A2 · · · An ) ≤ min{rank(A1 ), rank(A2 ), . . . , rank(An )}.

Soluzione Si inizia con il dimostrare il teorema nel caso n = 2. È un esercizio osser-


vare che le colonne della matrice prodotto A1 A2 sono combinazione lineare delle colonne
della matrice A1 e che le righe della matrice prodotto A1 A2 sono combinazione lineare
delle righe della matrice A2 . Per semplicità e per capire meglio quanto appena osservato
si considera il caso del prodotto di due matrici quadrate di ordine 2:
  
a1 a2 b1 b2
A1 A2 =
a3 a4 b3 b4

 
a1 b 1 + a2 b 3 a1 b 2 + a2 b 4
=
a3 b 1 + a4 b 3 a3 b 2 + a4 b 4

         
a1 a2 a1 a2
= b1 + b3 b2 + b4
a3 a4 a3 a4

   
a1 b1 b2 + a2 b3 b4
=   
.
a3 b1 b2 + a4 b3 b4
Di conseguenza si ha:

C(A1 A2 ) ⊆ C(A1 ), R(A1 A2 ) ⊆ R(A2 )

e, quindi:
rank(A1 A2 ) ≤ rank(A1 ), rank(A1 A2 ) ≤ rank(A2 )
da cui la tesi. Il caso del prodotto di n matrici si ottiene iterando il risultato appena
ottenuto.
Capitolo 4 193

Esercizio 4.28 Discutere, al variare di h ∈ R, le soluzioni della seguente equazione


vettoriale di R4 :
x1 a1 + x2 a2 + x3 a3 = b,
dove:

a1 = (2, −1, 0, 4), a2 = (−3, 2, 4, h), a3 = (5, −3, h, −1), b = (14, −8, h, −1).

Soluzione È sufficiente trasformare l’equazione vettoriale assegnata nel sistema linea-


re ad essa equivalente e risolvere quest’ultimo applicando i metodi descritti nel Capitolo
1. Si ha:

se h ∈
/ {−2, 14} non esistono soluzioni;
 
8 + 3h −h 8+h
se h = −2 o h = 14, la soluzione è x1 = , x2 = , x3 = .
4+h 4+h 4+h

Se si vuole, invece usare il Teorema 4.26 si può procedere confrontando L(a1 , a2 , a3 ) e


L(a1 , a2 , a3 , b). Per L(a1 , a2 , a3 ) si ha:
   
2 −1 0 4 −→ 2 −1 0 4
 −3 2 4 h  R2 → 2R2 + 3R1  0 1 8 12 + 2h 
5 −3 h −1 R3 → 2R3 − 5R1 0 −1 2h −22
 
2 −1 0 4
−→  0 1 8 12 + 2h .
R3 → R3 + R2
0 0 8 + 2h −10 + 2h

Quindi dim (L(a1 , a2 , a3 )) = 3 per ogni valore di h. Per L(a1 , a2 , a3 , b) si ha:



2 −1 0 4

−3 2 4 h 2
5 −3 h −1 = h − 12h − 28,


14 −8 h −1

per cui dim (L(a1 , a2 , a3 , b)) = 3 se e solo se h = −2 o h = 14. Pertanto l’equazione


vettoriale è compatibile solo se h = −2 o h = 14. Sostituendo tali valori nei vettori dati
si ottengono le soluzioni cercate.

4.5.2 Equivalenza tra due definizioni di rango di una matrice


In questo paragrafo si intende dimostrare l’equivalenza tra la definizione di rango di una
matrice (cfr. Def. 4.15) inteso come dimensione dello spazio vettoriale delle righe o delle
194 Spazi Vettoriali e Sottospazi Vettoriali

colonne della matrice e la definizione di rango di una matrice (cfr. Def. 2.13) data tramite
l’uso dei minori. A questo proposito si ricordano i fatti seguenti.

Sia A una matrice quadrata di ordine n. Come conseguenza della Definizione 4.15 di
rango di A come la dimensione dello spazio vettoriale delle righe R(A) (o dello spazio
vettoriale delle colonne C(A)) e del Teorema di Nullità più Rango (cfr. Teor. 4.24) si ha
l’equivalenza tra le seguenti condizioni:

a. rank(A) < n;

b. i vettori riga di A sono linearmente dipendenti;

c. i vettori colonna di A sono linearmente dipendenti;

d. il sistema lineare omogeneo AX = O ha soluzioni non nulle;

e. det(A) = 0.

In generale nel caso di una matrice A ∈ Rm,n , non necessariamente quadrata, si può
provare il seguente teorema.

Teorema 4.27 Sia A ∈ Rm,n , le condizioni seguenti sono equivalenti:

1. rank(A) = r;

2. la matrice A ha almeno un minore non nullo di ordine r e tutti i minori di ordine


r + 1 sono uguali a zero;

3. la matrice A ha almeno un minore non nullo di ordine r e tutti i minori di ordine


p > r sono nulli.

Dimostrazione Per dimostrare l’equivalenza delle tre affermazioni si proveranno le


seguenti implicazioni:

1. =⇒ 2. =⇒ 3. =⇒ 1.

Innanzitutto, si osservi che se la matrice A ha un minore non nullo di ordine k allora


le k righe corrispondenti a quelle del minore non nullo sono linearmente indipendenti.
Per dimostrare l’implicazione 1. =⇒ 2. si supponga quindi che rank(A) = r. Sia B la
sottomatrice quadrata di A ottenuta intersecando r righe linearmente indipendenti di A
con r colonne linearmente indipendenti di A. Allora si ha rank(B) = dim(R(B)) = r
e pertanto det(B) 6= 0, ovvero la matrice A ha un minore non nullo di ordine r. D’altra
parte ogni minore di A di ordine r + 1 ha i vettori riga linearmente dipendenti e quindi
Capitolo 4 195

è nullo per l’equivalenza tra le condizioni b. ed e. prima elencate. Infatti, se esistesse un


minore di ordine r + 1 diverso da zero, allora la matrice A avrebbe rango r + 1, in quanto
avrebbe r + 1 righe linearmente indipendenti.
L’implicazione 2. =⇒ 3. è una semplice conseguenza del Primo Teorema di Laplace (cfr.
Teor. 2.17).
Per dimostrare l’implicazione 3. =⇒ 1. si supponga quindi che A abbia un minore
non nullo di ordine r e che tutti i minori di ordine p > r siano nulli. Le righe corri-
spondenti ad un minore non nullo di A sono pertanto linearmente indipendenti e quindi
dim(R(A)) ≥ r, ovvero rank(A) ≥ r. Se fosse rank(A) > r si avrebbe una riga linear-
mente indipendente con le righe di A corrispondenti a quelle del minore non nullo, allora
si avrebbe una sottomatrice C ∈ Rr+1,n di rango r + 1. Per l’implicazione 1. =⇒ 2. si
potrebbe allora estrarre dalla sottomatrice C (e quindi dalla matrice A) un minore non
nullo di ordine p > r, ma questo sarebbe assurdo.

L’equivalenza tra le due definizioni di rango (cfr. Def. 4.15 e Def. 2.13) è quindi una
semplice conseguenza del teorema precedente.

4.5.3 Spazi vettoriali complessi,


matrici hermitiane e anti-hermitiane
Come già visto nell’Osservazione 4.1, si può definire uno spazio vettoriale complesso,
ossia uno spazio vettoriale su C. Analogamente al caso degli spazi vettoriali reali anche
nel caso degli spazi vettoriali complessi si possono introdurre i concetti di sottospazio
vettoriale, somma e intersezione di sottospazi vettoriali, generatori, vettori linearmente
dipendenti e indipendenti, basi e dimensione.
L’insieme dei numeri complessi C, con le usuali operazioni di somma e prodotto di nu-
meri complessi, è l’esempio più semplice di spazio vettoriale complesso, ma C può essere
anche visto come spazio vettoriale reale. Come spazio vettoriale complesso C ha dimen-
sione 1 ed una sua base è ad esempio (1), mentre come spazio vettoriale reale C ha
dimensione 2 ed una sua base è ad esempio (1, i) (cfr. Es. 4.24).

Analogamente al caso reale, si hanno i due esempi fondamentali seguenti di spazi vetto-
riali complessi (cfr. Es. 4.3 e 4.2).

Esempio 4.44 L’insieme:


Cn = {(x1 , x2 , . . . , xn ) | xj ∈ C, j = 1, 2, . . . , n}
è uno spazio vettoriale complesso. La somma di due n-uple di Cn è definita come:
(x1 , x2 , . . . , xn ) + (y1 , y2 , . . . , yn ) = (x1 + y1 , x2 + y2 , . . . , xn + yn ).
196 Spazi Vettoriali e Sottospazi Vettoriali

Il vettore nullo di Cn è la n-upla (0, 0,. . ., 0) e l’opposto del vettore (x1 , x2 ,. . ., xn ) è il


vettore (−x1 , −x2 ,. . .,−xn ). Il prodotto di un numero complesso λ per un elemento di
Cn è definito da:
λ(x1 , x2 , . . . , xn ) = (λx1 , λx2 , . . . , λxn ).
Cn , come spazio vettoriale complesso, ha dimensione n e gli n vettori:

e1 = (1, 0, . . . , , 0), e2 = (0, 1, 0, . . . , 0), ..., en = (0, 0, . . . , 1)

formano una base, detta base canonica o standard di Cn .

Esempio 4.45 Più in generale, se si indica con Cm,n l’insieme delle matrici con m righe
e n colonne ad elementi in C e si introducono le operazioni di somma di due matrici e di
prodotto di un numero complesso per una matrice come nel caso reale, è facile verificare
che Cm,n è uno spazio vettoriale complesso. Il vettore nullo di Cm,n è la matrice nulla.
Lo spazio vettoriale Cm,n , come spazio vettoriale complesso, ha dimensione mn ed una
sua base è data dalle mn matrici Eij aventi tutti gli elementi uguali a zero ad eccezione
di quello di posto ij che vale 1. Tale base è chiamata base canonica di Cm,n .

Esercizio 4.29 Determinare una base e la dimensione di Cm,n , pensato come spazio
vettoriale reale.

Soluzione Ogni matrice Z = (zhk ) ad elementi complessi si può scrivere come somma
di due matrici reali A = (ahk ) e B = (bhk ) dello stesso ordine:

Z = A + iB

ottenute, in modo naturale, dalla scrittura di ogni elemento Z come zhk = ahk + ibhk .
È evidente, quindi, che, come spazio vettoriale su R, dim Cm,n = 2mn. Si lascia per
esercizio la determinazione di una sua base.

Se A ∈ Cm,n , si indichi con A la matrice coniugata di A, ossia la matrice che ha come


elementi i coniugati degli elementi di A. Se A ∈ Rm,n , cioè se A è reale, ovviamen-
te A = A. Per la coniugata di una matrice valgono ovvie proprietà che sono facile
conseguenza dell’operazione di coniugio sui numeri complessi, e precisamente:

1. A + B = A + B, A, B ∈ Cm,n ;

2. λA = λ A, λ ∈ C, A ∈ Cm,n ;

3. AB = A B, A ∈ Cm,n , B ∈ Cn,k ;
t
4. A = tA, A ∈ Cm,n ;
Capitolo 4 197

5. det(A) = det(A), A ∈ Cn,n .

Si introducono ora due sottoinsiemi dello spazio vettoriale delle matrici quadrate com-
plesse Cn,n , che sono l’analogo, nel caso di Rn,n , del sottospazio vettoriale delle matrici
simmetriche S(Rn,n ) e di quello delle matrici antisimmetriche A(Rn,n ) (cfr. Es. 4.15 e
4.16). Precisamente, si definiscono l’insieme delle matrici hermitiane:

H(Cn,n ) = {A ∈ Cn,n | tA = A}

e l’insieme delle matrici anti-hermitiane:

AH(Cn,n ) = {A ∈ Cn,n | tA = −A}.


Chiaramente una matrice reale simmetrica A ∈ S(Rn,n ) è hermitiana ed una matrice reale
antisimmetrica A ∈ A(Rn,n ) è anti-hermitiana.
Ad esempio la matrice:  
2 1+i
1 − i −3
è hermitiana. Si osservi che gli elementi sulla sua diagonale principale sono reali. Questa
proprietà non è casuale, infatti gli elementi sulla diagonale principale di una matrice her-
mitiana A sono necessariamente reali, in quanto devono coincidere, per definizione, con i
proprii coniugati. Si può verificare che la somma di due matrici hermitiane è hermitiana e
l’inversa di una matrice hermitiana invertibile è hermitiana. Analoghe proprietà valgono
per le matrici anti-hermitane. Come per le matrici reali simmetriche, la matrice prodotto
AB di due matrici hermitiane A e B è hermitiana solo se A e B commutano, cioè se e
solo se AB = BA.

Esercizio 4.30 Si verifichi che l’insieme delle matrici hermitiane H(Cn,n ), con le opera-
zioni di somma e prodotto per un numero reale, è uno spazio vettoriale su R di dimensione
n2 . Inoltre, si provi invece che H(Cn,n ), con le operazioni di somma e prodotto per un
numero complesso, non è un sottospazio vettoriale complesso di Cn,n .

Soluzione Siano A e B due matrici hermitiane, ossia tA = A e tB = B, si tratta di


dimostrare che la matrice A + B è hermitiana, infatti:
t
(A + B) = tA + tB = A + B = (A + B).

Sia λ ∈ R, si deve dimostrare che λA è una matrice hermitiana se A ∈ H(Cn,n ), infatti:


t
(λA) = λ tA = λA = (λA),

in quanto λ = λ.
198 Spazi Vettoriali e Sottospazi Vettoriali

È evidente che questa proprietà è falsa se λ ∈ C, quindi H(Cn,n ) è uno spazio vet-
toriale reale ed è un sottospazio vettoriale reale di Cn,n , inteso come spazio vettoriale
reale, ma non è un sottospazio vettoriale complesso di Cn,n inteso come spazio vettoriale
complesso.

Come già accennato in precedenza, una matrice hermitiana A è del tipo:


 
a11 a12 + ib12 . . . a1n + ib1n
 
 
 a12 − ib12 a 22 . . . a2n + ib 2n

 
A= ,
 
 .. .. . . .. 
 . . . . 
 
 
a1n − ib1n a2n − ib2n . . . ann
dove ahk , bhk , h, k = 1, 2, . . . , n sono numeri reali. È quindi un esercizio dimostrare che
una base di H(Cn,n ) è:
    
1 0 ... ... 0 0 1 ... ... 0 0 0 ... ... 1
 0 0 ... ... 0  1 0 ... ... 0   0 0 ... ... 0 
.... . . .. .... . . .. .... . . ..
    
. ,  . , . . . ,  . ,
    
 . . . . . . . . .
 .... .. ..  .... .. ..   .... .. .. 
 . . . .  . . . .   . . . . 
0 0 ... ... 0 0 0 ... ... 0 1 0 ... ... 0
     
0 0 ... ... 0 0 ... ... 0 0 0 ... ... 0 0
0 1 ... ... 0 .. . . .. .. .. . . .. ..
. .
     
. . . . . .
.... . . ..
     

. . . . ,...,
  .. .. .. ,
  .. .. .. .. ,
 ..
 . . . . . . . .
 .... .. ..     
 . . . .   0 ... ... 0 1   0 ... ... 0 0 
0 0 ... ... 0 0 ... ... 1 0 0 ... ... 0 1
     
0 i ... ... 0 0 0 ... ... i 0 ... ... 0 0
−i 0 ... ... 0 0 0 ... ... 0 .. . . .. ..
.
     
. . .
.. .. . . .. .... . . ..
     
.. .. . ..
. , . . . ,  . , . . . ,  . .. .
     
 . . . . . . . .
 .. .. .. ..   .... .. ..   
 . . . .   . . . .   0 ... ... 0 i 
0 0 ... ... 0 −i 0 . . . . . . 0 0 . . . . . . −i 0

Da questo segue che:


n(n + 1) n(n − 1)
dim(H(Cn,n )) = + = n2 .
2 2
Capitolo 4 199

Esercizio 4.31 Si verifichi che l’insieme delle matrici anti-hermitiane AH(Cn,n ), con le
operazioni di somma e prodotto per un numero reale, è uno spazio vettoriale su R di
dimensione n2 . Inoltre, si provi invece che AH(Cn,n ), con le operazioni di somma e
prodotto per un numero complesso, non è un sottospazio vettoriale complesso di Cn,n ..

Soluzione In modo analogo all’esercizio precedente si dimostra che AH(Cn,n ) è un


sottospazio vettoriale reale di Cn,n ma non è un sottospazio vettoriale complesso.

È facile verificare, a partire dalla definizione, che una matrice anti-hermitiana A è del
tipo:
 
ib11 a12 + ib12 . . . a1n + ib1n
 
 
 −a12 + ib12 ib22 . . . a2n + ib2n 
 
A= ,
 
 .. .. . . .. 
 . . . . 
 
 
−a1n + ib1n −a2n + ib2n . . . ibnn

dove ahk , bhk , h, k = 1, 2, . . . , n sono numeri reali. È quindi un esercizio dimostrare che
una base di AH(Cn,n ) è:
     
0 1 ... ... 0 0 0 ... ... 1 0 ... ... 0 0
−1 0 ... ... 0 0 0 ... ... 0 .. . . .. ..
.
     
. . .
.. .. . . .. .... . . ..
     
.. .. . ..
.  ,..., . ,  . ..
     
  . . . . . . . .

  .. .. .. ..   .... .. ..  
  . . . .   . . . .  0 ... ... 0 1 
0 0 ... ... 0 −1 0 . . . . . . 0 0 . . . . . . −1 0
    
i 0 ... ... 0 0 0 ... ... 0 0 ... ... 0 0
0 0 ... ... 0 0 i ... ... 0 .. . . .. ..
.
    
. . .
.... . . .. .... . . ..
    

. . . . , . . . 
 
. . . . , 
 .. .. .. ,
 ..
 . . . .
 .... .. ..   .... .. ..  
 . . . .   . . . .  0 ... ... 0 0 
0 0 ... ... 0 0 0 ... ... 0 0 ... ... 0 i
     
0 i ... ... 0 0 0 ... ... i 0 ... ... 0 0
i 0 ... ... 0 0 0 ... ... 0 .. . . .. ..
.
     
. . .
.... . . .. .. .. . . ..
     

. . . . , . . . , 
 
. . . . , . . . , 
  .. .. .. .
 ..
 . . . .
 .... .. ..   .. .. .. ..   
 . . . .   . . . .   0 ... ... 0 i 
0 0 ... ... 0 i 0 ... ... 0 0 ... ... i 0
200 Spazi Vettoriali e Sottospazi Vettoriali

Da questo segue che dim(AH(Cn,n )) = n2 . Si osservi, inoltre, che una matrice A ∈ Cn,n
è hermitiana se e solo se iA è anti-hermitiana.

È valido, in campo complesso, il seguente teorema, analogo al Teorema 4.4 dimostrato


nel caso delle matrici quadrate ad elementi reali.

Teorema 4.28 Lo spazio vettoriale reale Cn,n si decompone nel modo seguente:

Cn,n = H(Cn,n ) ⊕ AH(Cn,n ).

Dimostrazione Si procede come nella dimostrazione del Teorema 4.4, tenendo conto
che ogni matrice A ∈ Cn,n si decompone come:
1 1
A = (A + tA) + (A − tA)
2 2
e che (A + tA) ∈ H(Cn,n ) e (A − tA) ∈ AH(Cn,n ).

Osservazione 4.34 In letteratura è spesso usata la notazione:

A∗ = tA,

pertanto una matrice A è hermitiana se e solo se A = A∗ ed è anti-hermitiana se e solo


se A = −A∗ . Per maggiori proprietà ed esempi si veda per esempio [15].
Capitolo 5

Spazi Vettoriali Euclidei

Lo scopo di questo capitolo è quello di estendere il concetto di prodotto scalare, definito


nel Paragrafo 3.7.1 nel caso dello spazio vettoriale V3 , agli spazi vettoriali di dimensione
superiore a tre e, quindi, di introdurre le nozioni di perpendicolarità e di angolo in genera-
le, permettendo, di conseguenza, lo studio della geometria euclidea negli spazi vettoriali
di dimensione qualsiasi.

5.1 Definizione di prodotto scalare


Definizione 5.1 Sia V uno spazio vettoriale reale. Si definisce prodotto scalare su V la
funzione:

· : V × V −→ R, (x, y) 7−→ x · y
per cui valgano le seguenti proprietà:

1. x · y = y · x, x, y ∈ V ;
2. (x + x0 ) · y = x · y + x0 · y, x, x0 , y ∈ V ;
3. (λx) · y = λ(x · y) = x · (λy), λ ∈ R, x, y ∈ V ;
4. x · x ≥ 0, x ∈ V e x · x = 0 ⇐⇒ x = o.

Uno spazio vettoriale reale V su cui è definito un prodotto scalare “·” prende il nome di
spazio vettoriale euclideo e si indica, in generale, con la scrittura (V, · ).

Esempio 5.1 Il prodotto scalare x · y = kxkkyk cos(xy) c definito nel Paragrafo 3.7.1
conferisce a V3 la struttura di spazio vettoriale euclideo.

201
202 Spazi Vettoriali Euclidei

Esempio 5.2 Su Rn si definisce un prodotto scalare “naturale” che ricalca il calcolo


in componenti (rispetto ad una base ortonormale) del prodotto scalare standard su V3 ,
ricordato nell’esempio precedente. Precisamente si pone:
n
X
(x1 , x2 , . . . , xn ) · (y1 , y2 , . . . , yn ) = x1 y1 + x2 y2 + . . . + xn yn = xi y i , (5.1)
i=1

per ogni (x1 , x2 , . . . , xn ), (y1 , y2 , . . . , yn ) ∈ Rn . Si lascia per esercizio la verifica delle


quattro proprietà di definizione di prodotto scalare. Con la notazione matriciale:
   
x1 y1
 x2   y2 
X =  .. , Y =  .. 
   
 .   . 
xn yn
la (5.1) si scrive come:

X · Y = t X Y. (5.2)
Il prodotto scalare (5.2) prende il nome di prodotto scalare standard su Rn , che viene
cosı̀ dotato della struttura di spazio vettoriale euclideo.

Esempio 5.3 Si consideri la funzione:


• : R3 × R3 −→ R,

cosı̀ definita:
(x1 , x2 , x3 ) • (y1 , y2 , y3 ) = 3x1 y1 + 4x2 y2 + 5x3 y3 .
Si verifica facilmente che “•” è un altro prodotto scalare su R3 , chiaramente diverso dal
prodotto scalare standard.

L’esempio appena incontrato permette di affermare che, almeno su Rn , è possibile defi-


nire infiniti prodotti scalari, quindi infinite strutture euclidee.

Esempio 5.4 Si consideri la funzione:


∗ : R3 × R3 −→ R,

cosı̀ definita:
(x1 , x2 , x3 ) ∗ (y1 , y2 , y3 ) = x1 y1 + x2 y2 − x3 y3 .
Si osserva che “∗” non è un prodotto scalare su R3 , per esempio (0, 0, 1)∗(0, 0, 1) = −1
che contraddice il quarto assioma di definizione di prodotto scalare.
Capitolo 5 203

Esempio 5.5 Si consideri la funzione:

? : R3 × R3 −→ R,

cosı̀ definita:
(x1 , x2 , x3 ) ? (y1 , y2 , y3 ) = x1 y1 + x2 y2 .
Anche “?” non è un prodotto scalare su R3 , per esempio (0, 0, 1) ? (0, 0, 1) = 0 che
contraddice il quarto assioma di definizione di prodotto scalare.

Il teorema seguente dimostra che uno spazio vettoriale reale, di dimensione finita, ammet-
te almeno un prodotto scalare.

Teorema 5.1 Sia V uno spazio vettoriale reale di dimensione n e sia B = (v1 , v2 , . . . , vn )
una sua base. Esiste un prodotto scalare su V tale che:

x · y = tX Y, x, y ∈ V, (5.3)
dove:
   
x1 y1
 x2   y2 
X= , Y =
   
.. .. 
 .   . 
xn yn
e (x1 , x2 , . . . , xn ) e (y1 , y2 , . . . , yn ) sono le componenti, rispettivamente di x e y, rispetto
alla base B.

La dimostrazione è lasciata al Lettore per esercizio.

Dal teorema precedente segue che ogni spazio vettoriale reale è uno spazio vettoriale
euclideo e poiché esistono infinite basi su uno spazio vettoriale, esistono anche infiniti
prodotti scalari sullo stesso spazio vettoriale.

Esercizio 5.1 Verificare che la funzione:

· : Rm,n × Rm,n −→ R,

definita da:
A · B = tr(tA B), (5.4)
è un prodotto scalare su Rm,n .
204 Spazi Vettoriali Euclidei

Esempio 5.6 Si consideri nel caso di R2,2 il prodotto scalare definito nell’esempio pre-
cedente. Si vuole calcolarne l’espressione esplicita rispetto a due matrici A = (aij ) e
B = (bij ) di R2,2 . Si ha:

  
a11 a21 b11 b12
A · B = tr = a11 b11 + a12 b12 + a21 b21 + a22 b22 .
a12 a22 b21 b22

Quindi, se si interpretano gli elementi aij e bij delle matrici A e B come le componenti
delle matrici A e B rispetto alla base canonica (Eij ), i, j = 1, 2, di R2,2 , il precedente
prodotto scalare in componenti corrisponde al prodotto scalare standard su R4 . Si può
verificare che la stessa proprietà vale in generale su Rm,n , ovvero che il prodotto scala-
re (5.4) scritto in componenti rispetto alla base canonica (Eij ), i = 1, 2, . . . , m, j =
1, 2, . . . , n, corrisponde al prodotto scalare standard in Rmn .

Esercizio 5.2 Posto:

p(x) = a0 + a1 x + . . . + an xn , q(x) = b0 + b1 x + . . . + bn xn ,

verificare che la funzione:


· : Rn [x] × Rn [x],
definita da: n
X
p(x) · q(x) = ai b i (5.5)
i=0

è un prodotto scalare sullo spazio vettoriale Rn [x] dei polinomi di grado minore o uguale
ad n. La funzione:
∗ : Rn [x] × Rn [x] −→ R,
definita da: n
X
p(x) ∗ q(x) = ai b i
i=1

definisce un prodotto scalare su Rn [x]?

5.2 Norma di un vettore


Definizione 5.2 Sia (V, · ) uno spazio vettoriale euclideo. Si definisce norma di un
vettore x di V il numero reale positivo dato da:

kxk = x · x.
Capitolo 5 205

Si osservi che la precedente definizione ha senso perché, per il quarto assioma di defini-
zione del prodotto scalare, x · x ≥ 0, per ogni x ∈ V.

Esempio 5.7 In V3 , dotato del prodotto scalare standard (cfr. Par. 3.7.1), la norma di un
vettore x coincide con la sua usuale lunghezza.

Esempio 5.8 Nello spazio vettoriale euclideo (R3 , · ), dotato del prodotto scalare stan-
dard, si ha: q
kxk = x21 + x22 + x23 ,
per ogni x = (x1 , x2 , x3 ) ∈ R3 .

Esempio 5.9 Se si considera su R3 il prodotto scalare definito nell’Esempio 5.3 si ha


che: q
kxk = 3x21 + 4x22 + 5x23 ,
per ogni x = (x1 , x2 , x3 ) ∈ R3 .

Esempio 5.10 Nello spazio vettoriale euclideo (Rn , · ), dotato del prodotto scalare stan-
dard, si ha: q
kxk = x21 + x22 + . . . + x2n ,

per ogni x = (x1 , x2 , . . . , xn ) ∈ Rn .

Esempio 5.11 Se su uno spazio vettoriale V su R di dimensione n, riferito ad una base


B = (v1 , v2 , . . . , vn ), si considera il prodotto scalare (5.3), la norma del vettore x =
x1 v1 + x2 v2 + . . . + xn vn è data da:
√ q
kxk = tX X = x21 + x22 + . . . + x2n .

Esempio 5.12 La norma della matrice A = (aij ) ∈ R2,2 , rispetto al prodotto scalare
considerato nell’Esempio 5.6, è:
p q
kAk = tr(tA A) = a211 + a212 + a221 + a222 .

Esempio 5.13 La norma del polinomio p(x) = a0 + a1 x + . . . + an xn ∈ Rn [x] rispetto


al prodotto scalare (5.5) è: v
u n
uX
kp(x)k = t a2i .
i=0
206 Spazi Vettoriali Euclidei

In generale, una funzione a valori reali prende il nome di “norma” solo se definisce un
numero reale positivo che verifica proprietà opportune, precisamente quelle enunciate nel
teorema seguente.

Teorema 5.2 Su uno spazio vettoriale euclideo (V, · ), la funzione:

k · k : V −→ R, x 7−→ kxk

verifica le seguenti proprietà:

1. kxk ≥ 0, x ∈ V e kxk = 0 ⇐⇒ x = o.

2. kλxk = |λ| kxk, λ ∈ R, x ∈ V.

3. Teorema di Pitagora: x · y = 0 ⇐⇒ kx + yk2 = kxk2 + kyk2 .

4. Disuguaglianza di Cauchy–Schwarz: |x · y| ≤ kxk kyk, x, y ∈ V.

5. Disuguaglianza triangolare (o di Minkowski): kx + yk ≤ kxk + kyk, x, y ∈ V.

Dimostrazione 1. La dimostrazione è lasciata al Lettore per esercizio.

2. La dimostrazione segue da (λx) · (λx) = λ2 kxk2 .

3. Segue da:

k(x + y)k2 = (x + y) · (x + y) = kxk2 + 2x · y + kyk2 . (5.6)

4. La disuguaglianza di Cauchy–Schwarz è banalmente soddisfatta se uno dei vettori


coincide con il vettore nullo. La si dimostra, quindi, nel caso in cui x e y siano
entrambi diversi dal vettore nullo. Per ogni λ ∈ R si può considerare il polinomio
di secondo grado in λ:

kλx + yk2 = (λx + y) · (λx + y) = λ2 kxk2 + 2λ x · y + kyk2 .

Per il punto 1. si ha che:

λ2 kxk2 + 2λ x · y + kyk2 ≥ 0

per ogni λ ∈ R e, quindi, il trinomio di secondo grado deve avere discriminante


negativo, cioè:
(x · y)2 − kxk2 kyk2 ≤ 0,
per ogni x, y ∈ V.
Capitolo 5 207

5. Usando (5.6) e la disuguaglianza di Cauchy-Schwarz si ha:

kx + yk2 ≤ kxk2 + 2kxk kyk + kyk2 = (kxk + kyk)2 ,

per ogni x, y ∈ V .

Considerati due vettori non nulli x e y di uno spazio vettoriale euclideo (V, ·), come
conseguenza della disuguaglianza di Cauchy–Schwarz si ha che:
|x · y|
≤1
kxk kyk
e quindi:
x·y
−1 ≤ ≤ 1,
kxk kyk
si può allora enunciare la seguente definizione.

Definizione 5.3 Sia (V, · ) uno spazio vettoriale euclideo. Dati due vettori x, y ∈ V non
nulli, si definisce angolo tra i due vettori x e y l’angolo θ ∈ [0, π] tale che:
x·y
cos θ = .
kxk kyk

Osservazione 5.1 1. È necessario osservare che la nozione di angolo θ tra due vettori,
appena introdotta, è coerente con la definizione di angolo tra vettori considerata nel
Paragrafo 3.6, cosı̀ come lo è la definizione di ortogonalità che segue. Inoltre, la
nozione di angolo tra due vettori non dipende dall’ordine dei due vettori.

2. Come in V3 , anche nel caso generale di uno spazio vettoriale euclideo V l’angolo
tra il vettore nullo o e un qualunque altro vettore è indeterminato, ossia può essere
un qualsiasi angolo θ ∈ [0, π].

Definizione 5.4 Due vettori non nulli x e y di uno spazio vettoriale euclideo (V, · ) si
dicono ortogonali o perpendicolari se l’angolo θ che essi determinano è θ = π/2. Il
vettore nullo si considera ortogonale ad ogni altro vettore di V. Se θ = 0 o θ = π i due
vettori si dicono paralleli.

Di conseguenza, le nozioni di angolo e di ortogonalità permettono di introdurre gli usuali


concetti di geometria analitica del piano e dello spazio (cfr. Cap. 9, 10, 11 e 12) in spazi
vettoriali euclidei di dimensione maggiore di 3. Si vedrà, per esempio, nell’osservazione
che segue che la nozione di parallelismo di due vettori corrisponde alla dipendenza lineare
dei due vettori.
208 Spazi Vettoriali Euclidei

Osservazione 5.2 Fissati due vettori, la misura dell’angolo che essi determinano può
cambiare a seconda del prodotto scalare che si considera. Addirittura, dati due vettori
qualsiasi (non nulli e non paralleli) è possibile definire un prodotto scalare che li renda
ortogonali. Esempi di questo tipo si possono leggere nel Capitolo 8 (cfr. Es. 8.18), per-
ché non si è ancora in grado, in questo capitolo, di costruirli esplicitamente in quanto
non è ancora chiaro come, in generale, sia possibile verificare facilmente che una funzio-
ne qualsiasi di dominio V × V e codominio R sia o meno un prodotto scalare. È però
una semplice conseguenza della definizione di norma di un vettore il fatto che, per ogni
possibile prodotto scalare definito su uno spazio vettoriale V, il concetto di parallelismo
tra vettori rimane invariato, in altri termini se due vettori sono linearmente dipendenti lo
rimangono per tutti i possibili prodotti scalari che si possano definire su V. Infatti vale il
teorema seguente.
Teorema 5.3 In uno spazio vettoriale euclideo (V, · ) due vettori x e y, che individuano
l’angolo θ, sono linearmente dipendenti se e solo θ = 0 o θ = π , cioè se e solo se:
x · y = ±kxk kyk.
Dimostrazione La proprietà è banalmente vera se uno dei due vettori coincide con il
vettore nullo. Si supponga allora che i due vettori siano entrambi non nulli. Se x e y
sono linearmente dipendenti esiste λ ∈ R tale che y = λx e la precedente uguaglianza è
verificata.
Viceversa, si supponga che per una coppia di vettori non nulli x e y valga l’uguaglianza
x · y = kxk kyk (il caso con il segno negativo è analogo), allora si ha:
2    
x y x y x y
kxk − kyk = − · −

kxk kyk kxk kyk
x·x x·y y·y
= 2
−2 + = 0.
kxk kxk kyk kyk2
Dal quarto assioma di definizione del prodotto scalare segue:
kyk
y= x,
kxk
cioè x e y sono linearmente dipendenti.

5.3 Basi ortonormali


I naturali concetti geometrici di base ortogonale e ortonormale in V3 , introdotti nel Para-
grafo 3.7.1, possono essere agevolmente estesi ad uno spazio vettoriale euclideo qualsiasi
con la seguente definizione.
Capitolo 5 209

Definizione 5.5 Sia (V, · ) uno spazio vettoriale euclideo di dimensione n. Una base
B = (v1 , v2 , . . . , vn ) di V si dice ortogonale se i vettori che la definiscono verificano la
condizione:
vi · vj = 0, i 6= j, i, j = 1, 2, . . . , n.
In altri termini, una base si dice ortogonale se i vettori che la compongono sono a due a
due ortogonali.

Una base B = (e1 , e2 , . . . , en ) di V si dice ortonormale se i vettori che la definiscono


verificano entrambe le condizioni:

1. ei · ej = 0, i 6= j , i, j = 1, 2, . . . , n;
2. kei k = 1, i = 1, 2, . . . , n.

In altri termini, una base si dice ortonormale se è una base ortogonale ed ogni vettore
che la compone ha norma uguale a 1.

Esempio 5.14 In R3 la base canonica (e1 , e2 , e3 ), dove:

e1 = (1, 0, 0), e2 = (0, 1, 0), e3 = (0, 0, 1),

è ortonormale rispetto al prodotto scalare standard.

Più in generale, in Rn la base canonica (e1 , e2 , . . . , en ), dove:

e1 = (1, 0, . . . , 0), e2 = (0, 1, 0, . . . , 0), ..., en = (0, . . . , 0, 1)

è anch’essa ortonormale rispetto al prodotto scalare standard.

Esercizio 5.3 Si determini in R3 una base ortonormale rispetto al prodotto scalare:

x · y = 2x1 y1 + 3x2 y2 + 4x3 y3 . (5.7)

Soluzione È immediato verificare che i vettori della base canonica (e1 , e2 , e3 ) di R3


sono a due a due ortogonali e quindi verificano la condizione 1. della Definizione 5.5. Se
si calcola la norma dei tre vettori, rispetto al prodotto scalare che si sta considerando, si
ha: √ √
ke1 k = 2, ke2 k = 3, ke3 k = 2.
Quindi i vettori:  
1 1 1
√ e1 , √ e2 , e3
2 3 2
formano una base ortonormale di R3 dotato del prodotto scalare (5.7).
210 Spazi Vettoriali Euclidei

Esempio 5.15 In Rm,n la base canonica (Eij ), i = 1, 2, . . . , m, j = 1, 2, . . . , n, è una


base ortonormale rispetto al prodotto scalare definito da (5.4).

Esempio 5.16 In Rn [x] la base (1, x, . . . , xn ) è ortonormale rispetto al prodotto scalare


definito da (5.5).

Se si scrive l’espressione del prodotto scalare in componenti rispetto ad una base ortonor-
male su uno spazio vettoriale euclideo di dimensione n, si ottiene la stessa espressione
del prodotto scalare standard su Rn , come si può dedurre dal seguente teorema, la cui
dimostrazione è un facile esercizio.

Teorema 5.4 Sia (V, · ) uno spazio vettoriale euclideo di dimensione n.

1. Se B = (e1 , e2 , . . . , en ) è una base ortonormale e:

x = x1 e1 + x2 e2 + . . . + xn en , y = y1 e1 + y2 e2 + . . . + yn en

sono due vettori qualsiasi di V, allora il loro prodotto scalare è:

x · y = x1 y1 + x2 y2 + . . . + xn yn = tX Y, (5.8)

dove tX Y denota il prodotto della matrice riga e della matrice colonna formate
rispettivamente dalle componenti di x e y, rispetto alla base B.

2. Se B = (e1 , e2 , . . . , en ) è una base di V tale che, per ogni coppia di vettori:

x = x1 e1 + x2 e2 + . . . + xn en , y = y 1 e1 + y 2 e2 + . . . + y n en

di V si ha:
x · y = x1 y1 + x2 y2 + . . . + xn yn = tX Y, (5.9)
dove tX Y denota il prodotto della matrice riga e della matrice colonna formate
rispettivamente dalle componenti di x e y, rispetto alla base B, allora B è una
base ortonormale.

Osservazione 5.3 Si osservi che, in particolare, come conseguenza del teorema prece-
dente si ha che se B = (e1 , e2 , . . . , en ) è una base di uno spazio vettoriale V, allora esiste
su V un prodotto scalare che rende la base B ortonormale. Tale prodotto scalare è in-
fatti semplicemente definito da (5.9). Nell’Esercizio 5.13 si determinerà esplicitamente
l’espressione del prodotto scalare che rende ortonormale una particolare base di R3 .
Capitolo 5 211

Ora che si è in grado di scrivere l’espressione in componenti del prodotto scalare rispetto
ad una base ortonormale rimane da dimostrare l’esistenza di almeno una base ortonormale
rispetto ad ogni prodotto scalare definito su V. A tale scopo è necessario premettere il
seguente lemma.

Lemma 5.1 Sia (V, · ) uno spazio vettoriale euclideo di dimensione n. Un insieme I di
k vettori di V :
I = {v1 , v2 , . . . , vk }
tale che:

1. k ≤ n;

2. vi 6= o, i = 1, 2, . . . , k ;

3. vi · vj = 0, i 6= j , i, j = 1, 2, . . . , k

è un insieme libero. Se k = n allora I è una base ortogonale di V.

Dimostrazione Occorre dimostrare che i vettori v1 , v2 , . . . , vk sono linearmente indi-


pendenti, cioè che l’unica loro combinazione lineare uguale al vettore nullo è quella con
coefficienti tutti uguali a 0. Infatti, se si considera l’equazione vettoriale:

λ1 v1 + . . . + λk vk = o, λi ∈ R, i = 1, 2, . . . , k

e si moltiplicano scalarmente entrambi i membri per ogni vi , i = 1, 2, . . . , k , tenendo


conto dell’ipotesi di ortogonalità dei vettori, si ha:

λi vi · vi = λi kvi k2 = 0.

Dalla condizione 2. segue λi = 0, per ogni i = 1, 2, . . . , k .

Teorema 5.5 Sia (V, · ) uno spazio vettoriale euclideo di dimensione n e sia:

B = (v1 , v2 , . . . , vn )

una sua base. A partire da B è possibile costruire una base ortonormale:

B 0 = (e1 , e2 , . . . , en )

di V tale che:

L(v1 , v2 , . . . , vk ) = L(e1 , e2 , . . . , ek ), k = 1, 2, . . . , n.
212 Spazi Vettoriali Euclidei

Dimostrazione Per dimostrare il teorema si utilizza un metodo di calcolo per co-


struire una base ortonormale a partire da una base assegnata noto come il processo di
ortonormalizzazione di Gram–Schmidt.

Data una base B = (v1 , v2 , . . . , vn ) si procede con un numero finito di passi, nel modo
seguente:

1. si sceglie come primo vettore della base ortonormale il versore:


v1
e1 = vers v1 = .
kv1 k

2. Per costruire il secondo vettore e2 si considera il vettore a2 = v2 + λe1 , con λ ∈ R


e si determina λ in modo tale che a2 sia ortogonale a e1 ossia a2 · e1 = 0. Si
ottiene:
λ = −v2 · e1 .
Quindi:
e2 = vers(v2 − (v2 · e1 ) e1 )
è un vettore di norma 1 e ortogonale a e1 .

3. Per costruire il terzo vettore e3 si considera il vettore a3 = v3 + λ1 e1 + λ2 e2 , con


λ1 , λ2 ∈ R e si impongono le due condizioni di ortogonalità:

a3 · e1 = 0 = v3 · e1 + λ1 ,
a3 · e2 = 0 = v3 · e2 + λ2 .

Il terzo vettore è quindi:

e3 = vers(v3 − (v3 · e1 ) e1 − (v3 · e2 ) e2 ).

Iterando questo procedimento si ottiene un insieme di n vettori:

ek = vers(vk − (vk · e1 ) e1 − . . . − (vk · ek−1 ) ek−1 ), k = 1, 2, . . . , n,

a due a due ortogonali e di norma uguale a 1. Per il Lemma 5.1, i vettori (e1 , e2 , . . . , en )
costituiscono una base di V. Inoltre, ad ogni passo si ha:

L(v1 , v2 , . . . , vk ) = L(e1 , e2 , . . . , ek ), k = 1, 2, . . . , n.

Osservazione 5.4 Se (e1 , e2 , . . . , en ) è una base ortonormale dello spazio vettoriale eu-
clideo (V, · ), ogni vettore v di V si può esprimere come:

v = (v · e1 ) e1 + (v · e2 ) e2 + . . . + (v · en ) en .
Capitolo 5 213

Il vettore:
(v · e1 ) e1 + (v · e2 ) e2 + . . . + (v · ek ) ek ,
con k < n, rappresenta, geometricamente, il vettore proiezione ortogonale di v sul sot-
tospazio vettoriale generato dai vettori e1 , e2 , . . . , ek . Si estende cosı̀, in dimensione
maggiore di 3, la situazione geometrica descritta nell’Osservazione 3.16.

Si osservi anche che si può applicare il processo di ortonormalizzazione di Gram–Schmidt


considerando come vettore e1 il versore di uno qualunque dei vettori della base assegnata
B. Poiché in ogni spazio vettoriale esistono infinite basi, si può concludere che sullo spa-
zio vettoriale euclideo (V, · ) esistono infinite basi ortonormali, ed è altrettanto chiaro che
una base ortonormale rispetto ad un prodotto scalare non è necessariamente ortonormale
rispetto ad un altro prodotto scalare definito sullo stesso spazio vettoriale euclideo (cfr.
Es. 5.3).

Esercizio 5.4 Nello spazio vettoriale euclideo (R4 , · ), dotato del prodotto scalare stan-
dard, è data la base B = (v1 , v2 , v3 , v4 ) con:

v1 = (1, 2, 0, 0), v2 = (0, 1, −1, 0), v3 = (0, 0, 1, −1), v4 = (0, 0, 0, 5).

Determinare una base ortonormale di R4 a partire da B.

Soluzione Si applica il procedimento di ortonormalizzazione di Gram–Schmidt alla


base B. Si può iniziare con:
v1 1
e1 = = √ (1, 2, 0, 0).
kv1 k 5
Il secondo vettore e2 è dato dal versore di:
 
2 1 2 1
v2 − (v2 · e1 ) e1 = (0, 1, −1, 0) − √ √ (1, 2, 0, 0) = − , , −1, 0 .
5 5 5 5

Quindi: r r !
 
5 2 1 2 1 5
e2 = √ − , , −1, 0 = − , √ ,− ,0 .
30 5 5 15 30 6
Analogamente si considera come e3 il versore di:

v3 − (v3 · e1 ) e1 − (v3 · e2 ) e2 ,

dato da: r r !
2 1 1 6
e3 = − , √ , √ ,− .
21 42 42 7
214 Spazi Vettoriali Euclidei

In modo analogo, a completamento della base ortonormale richiesta, si ottiene:


 
2 1 1 1
e4 = − √ , √ , √ , √ .
7 7 7 7

Ci si vuole ora occupare dello studio delle proprietà della matrice del cambiamento di
base tra due basi ortonormali definite su uno spazio vettoriale euclideo (V, · ). Vale l’im-
portante teorema che segue, con l’avvertenza che, per capirne la dimostrazione, si deve
far riferimento alle nozioni spiegate nel Paragrafo 4.3.4.

Teorema 5.6 Sia B = (e1 , e2 , . . . , en ) una base ortonormale di uno spazio vettoriale
euclideo V di dimensione n, allora B 0 = (e01 , e02 , . . . , e0n ) è una base ortonormale di V
se e solo se la matrice del cambiamento di base da B a B 0 è una matrice ortogonale di
ordine n.

Dimostrazione In uno spazio vettoriale euclideo (V, · ) di dimensione n si consideri


la matrice P del cambiamento di base dalla base ortonormale B = (e1 , e2 , . . . , en ) ad
un’altra base ortonormale B 0 = (e01 , e02 , . . . , e0n ) di V. P è una matrice invertibile che
ha sulle colonne le componenti dei vettori e0i , i = 1, 2, . . . , n, rispetto alla base B e si
può verificare che l’elemento di posto ij del prodotto tP P è dato dal prodotto scalare
e0i · e0j scritto in componenti rispetto alla base B. Quindi tP P = I , cioè P è una matrice
ortogonale di ordine n. Il viceversa segue in modo analogo.

Osservazione 5.5 Se P ∈ Rn,n è una matrice ortogonale, ossia se tP P = I , allora


t
P = P −1 , moltiplicando ambo i membri per P segue P tP = I ; in altri termini anche
la matrice tP è ortogonale. Applicando la dimostrazione del Teorema 5.6 a tP si ha che
non solo i vettori colonna ma anche i vettori riga della matrice P costituiscono una base
ortonormale dello spazio vettoriale euclideo Rn , rispetto al prodotto scalare standard. Per
maggiori chiarimenti si veda il Teorema 5.7 in cui sono elencate tutte le proprietà delle
matrici ortogonali.

Osservazione 5.6 Il Teorema 5.6 non è più valido se una delle due basi non è ortonorma-
le. La matrice P del cambiamento di base da una qualunque base B (non ortonormale)
ad una base ortonormale ottenuta da B mediante il processo di ortonormalizzazione di
Gram–Schmidt non è una matrice ortogonale, come si può osservare nell’esempio che
segue.

Esempio 5.17 In R3 si considerino i due prodotti scalari seguenti:

x · y = x1 y1 + x2 y2 + x3 y3 ,

x y = 3x1 y1 + 4x2 y2 + x3 y3 ,
Capitolo 5 215

dove x = x1 e1 + x2 e2 + x3 e3 , y = y1 e1 + y2 e2 + y3 e3 e B = (e1 , e2 , e3 ) con:

e1 = (1, 0, 0), e2 = (0, 1, 0), e3 = (0, 0, 1)

base canonica di R3 . B è una base ortonormale rispetto al prodotto scalare “·” (cfr. Es.
5.14) ma non è ortonormale rispetto al prodotto scalare “ ”. La base B 0 = (v1 , v2 , v3 )
con:    
1 1
v1 = √ , 0, 0 , v2 = 0, , 0 , v3 = (0, 0, 1)
3 2
è ortonormale rispetto al prodotto scalare “ ”, ma, ovviamente, la matrice:

1
 
√ 0 0
 3 
 
 
P =
 1 
 0 0 

 2 
 
0 0 1

del cambiamento di base da B a B 0 non è ortogonale. Si osservi inoltre che se:

x = x01 v1 + x02 v2 + x03 v3 , y = y10 v1 + y20 v2 + y30 v3 ,

allora:
x y = x01 y10 + x02 y20 + x03 y30

essendo B 0 una base ortonormale rispetto al prodotto scalare “ ”.

Sia (a1 , a2 , a3 ) una base di R3 con:

a1 = (1, 0, 2), a2 = (1, 3, 4), a3 = (0, 3, 4).

A partire da tale base, usando il processo di ortonormalizzazione di Gram–Schmidt si


vogliono determinare una base ortonormale rispetto al prodotto scalare “·” e una base
ortonormale rispetto al prodotto scalare “ ”. Nel primo caso si ottiene la base:
  √ !  !
1 2 4 3 5 2 6 2 3
C= √ , 0, √ , − √ , , √ , − ,− , .
5 5 7 5 7 7 5 7 7 7

La matrice:
216 Spazi Vettoriali Euclidei

1 4 6
 
√ − √ −
 5
 7 5 7  

 √ 

Q= 0
 3 5 2 
− 

 7 7  
 
 2 2 3 
√ √
5 7 5 7
è ortogonale, essendo la matrice del cambiamento di base tra due basi ortonormali B e
C , rispetto allo stesso prodotto scalare. Rispetto al prodotto scalare “ ” si ottiene la base
ortonormale C 0 = (v10 , v20 , v30 ) con:
  r r r !
1 2 2 1 21 3
v10 = √ , 0, √ , v20 = − , , ,
7 7 231 2 22 154
r !
2 1 3
v30 = − ,− √ , √ .
11 2 22 22
La matrice R che ha sulle colonne le componenti della base C 0 non è una matrice orto-
gonale, mentre lo deve essere la matrice del cambiamento di base da B 0 a C 0 , ottenuta dal
prodotto P −1 R. Si lascia per esercizio sia la verifica dell’ortogonalità dell’ultima matrice
sia la giustificazione del fatto che essa si ottenga proprio nel modo indicato.
Per le matrici ortogonali sono valide le seguenti proprietà, alcune delle quali sono già
state anticipate nel Paragrafo 2.5 e nel corso di questo capitolo.
Teorema 5.7 1. Il prodotto di due matrici ortogonali è una matrice ortogonale.
2. La matrice identità I è ortogonale.
3. L’inversa P −1 di una matrice ortogonale P è ortogonale.
4. La trasposta tP di una matrice ortogonale P è ortogonale.
5. Una matrice P ∈ Rn,n è ortogonale se e solo se le righe e le colonne di P sono le
componenti di una base ortonormale in Rn , rispetto al prodotto scalare standard.
6. Il determinante di una matrice ortogonale P vale ±1.
Dimostrazione 1. Se P e Q sono matrici ortogonali si ha:
t
(P Q)P Q = tQ tP P Q = I
e quindi la matrice prodotto P Q è ortogonale.
Capitolo 5 217

2. La verifica è lasciata per esercizio.


3. Da tP = P −1 e dal Teorema 2.7 punto 4. segue che (tP )−1 = (P −1 )−1 da cui la
tesi.
4. Da tP = P −1 segue che t (tP ) tP = P tP = P P −1 = I da cui la tesi.
5. La verifica è lasciata per esercizio.
6. Per il Teorema 2.16 punto 2. si ha che det(tP P ) = det(tP ) det(P ) = det(I) = 1.
Quindi (det(P ))2 = 1.
Osservazione 5.7 1. Non vale il viceversa del punto 6. del teorema precedente. Ad
esempio, se si considera la matrice:
 
1 1
A=
0 1
si ha che il determinante di A è 1 ma A non è ortogonale.
2. Segue dai punti 1., 2. e 3. che l’insieme O(n) delle matrici ortogonali di ordine
n (cfr. (2.9)) è un gruppo rispetto al prodotto di matrici (cfr. Oss. 2.2). Si osservi
inoltre che il gruppo O(2) è già stato descritto nell’Esercizio 3.11.
3. Gli insiemi di matrici:
SL(n, R) = {A ∈ Rn,n | det(A) = 1}
e:
SO(n) = {A ∈ O(n) | det(A) = 1} = O(n) ∩ SL(n, R) (5.10)
sono entrambi gruppi rispetto al prodotto di matrici. SL(n, R) prende il nome di
gruppo lineare speciale e SO(n) è detto gruppo ortogonale speciale.
Osservazione 5.8 Si osservi che il valore del prodotto scalare di due vettori in uno spa-
zio vettoriale euclideo V non varia, qualunque sia la base ortonormale scelta per calco-
larlo. Infatti se si esprime la formula (5.8), scritta rispetto alla base ortonormale B =
(e1 , e2 , . . . , en ), rispetto ad un’altra base ortonormale B 0 = (e01 , e02 , . . . , e0n ) si ha:
x · y = tX 0 Y 0 ,
dove X 0 e Y 0 indicano, rispettivamente, le matrici colonne delle componenti dei vettori
x e y rispetto alla base ortonormale B 0 . Dalle equazioni del cambiamento di base si ha:
X = P X 0, Y = P Y 0,
dove P è la matrice ortogonale del cambiamento di base da B a B 0 , quindi:
x · y = tX Y = t (P X 0 )(P Y 0 ) = tX 0 (tP P ) Y 0 = tX 0 Y 0 .
218 Spazi Vettoriali Euclidei

Esercizio 5.5 Determinare una matrice ortogonale P in R3,3 in modo tale che il primo
vettore riga sia:
√ √ !
2 2
a = 0, ,− .
2 2

Soluzione Per determinare una matrice ortogonale con le caratteristiche richieste oc-
corre completare l’insieme libero {a} a una base ortonormale (a, b, c) di R3 . Si può, ad
esempio, usando il Teorema 4.15, costruire la base C = (a, e1 , e2 ) con :

e1 = (1, 0, 0), e2 = (0, 0, 1).

Per determinare una base ortonormale, è sufficiente applicare il processo di ortonormaliz-


zazione di Gram–Schmidt alla base C , considerando:
b = vers(e1 − (e1 · a)a) = vers(1, 0, 0) = e1 ,
 
1 1
c = vers(e2 − (e2 · a)a − (v3 · b)b) = vers 0, , .
2 2
La matrice ortogonale cercata è ad esempio:
 √
√ 
2 2
 0 2 − 2 
 
 
P = 1 0 0 .
 
 
 √ √ 
2 2
 
0
2 2

5.4 Il complemento ortogonale


Siano (V, · ) uno spazio vettoriale euclideo di dimensione n e W un suo sottospazio
vettoriale di dimensione k ≤ n.

Definizione 5.6 Si dice complemento ortogonale di W e lo si denota con W ⊥ il sottoin-


sieme di V formato da tutti i vettori di V ortogonali ad ogni vettore di W , cioè:

W ⊥ = {x ∈ V | x · y = 0, ∀y ∈ W}.

Osservazione 5.9 Per definizione, il complemento ortogonale W ⊥ di un sottospazio vet-


toriale W di uno spazio vettoriale euclideo (V, · ) è unico. Inoltre, se W = {o}, allora
W ⊥ = V e se W = V allora W ⊥ = {o}.
Capitolo 5 219

Osservazione 5.10 Scelta una base (a1 , a2 , . . . , ak ) di W , la condizione x · y = 0, per


ogni y ∈ W, è equivalente a:

x · ai = 0, i = 1, 2, . . . , k.

Infatti si ha:
x · (λ1 a1 + λ2 a2 + . . . + λk ak ) = x · y = 0,
per ogni λi ∈ R, i = 1, 2, . . . , k . Ma questa condizione è verificata se e solo se x·ai = 0,
per ogni i = 1, 2, . . . , k .

Il teorema che segue elenca le proprietà fondamentali del complemento ortogonale di un


sottospazio vettoriale.

Teorema 5.8 Sia (V, · ) uno spazio vettoriale euclideo e sia W un suo sottospazio vet-
toriale, allora:

1. W ⊥ ⊆ V è un sottospazio vettoriale di V ;

2. W ⊕ W ⊥ = V ;

3. (W ⊥ )⊥ = W.

Dimostrazione 1. La dimostrazione è lasciata al Lettore per esercizio.

2. Per dimostrare che W + W ⊥ = V si può procedere in questo modo. Sia dim(V ) =


n, scelta una base (a1 , a2 , . . . , ak ) di W si costruisce la matrice A ∈ Rk,n avente
come vettori riga le componenti dei vettori della base di W, rispetto ad una base
ortonormale B di (V, · ), cioè tale che R(A) = W , si ottiene che A ha rango k e
il suo nullspace N (A) coincide con W ⊥ (cfr. Oss 5.10). Quindi dal Teorema 4.23
segue che dim(W ⊥ ) + dim(W) = n = dim(V ). Dal Teorema 4.24 si ha anche
che la somma dei due sottospazi vettoriali è diretta. In aggiunta, si osservi che la
verifica che W ∩ W ⊥ = {o} segue anche facilmente dal fatto che se x ∈ W ∩ W ⊥
si ha che x · x = 0 e quindi x = o.

3. È ovvia conseguenza di 2. Infatti:

W ⊥ ⊕ (W ⊥ )⊥ = V

ma si ha anche che W ⊥ ⊕ W = V e quindi segue la tesi per l’unicità del comple-


mento ortogonale.
220 Spazi Vettoriali Euclidei

Osservazione 5.11 È importante notare che W ⊥ è un sottospazio vettoriale di V supple-


mentare di W in V, ma mentre esistono infiniti sottospazi vettoriali di V supplementari
di W in V, il complemento ortogonale è unico.

Esercizio 5.6 In (R3 , · ), dotato del prodotto scalare standard, determinare il comple-
mento ortogonale W ⊥ del sottospazio vettoriale:

W = {(x1 , x2 , x3 ) ∈ R3 | x1 + x2 + x3 = 0}.

Soluzione Per l’Osservazione 5.10 si può prima determinare una base di W e poi
l’insieme dei vettori x ortogonali a tutti i vettori di questa base. Una base di W è, ad
esempio, data dai due vettori:

a1 = (−1, 1, 0), a2 = (−1, 0, 1).

Il complemento ortogonale di W è formato da tutti i vettori y = (y1 , y2 , y3 ) ∈ R3 che


verificano le due condizioni:

y · a1 = −y1 + y2 = 0
y · a2 = −y1 + y3 = 0.

Si vede che W ⊥ corrisponde al nullspace della matrice:


 
−1 1 0
A= ,
−1 0 1

cioè al complemento ortogonale dello spazio vettoriale delle righe R(A), si ottiene che
W ⊥ = L((1, 1, 1)). Per ulteriori precisazioni sull’ultima osservazione si veda l’Esempio
5.18.

Osservazione 5.12 Da notare che, nell’esercizio precedente, una base di W ⊥ è formata


dai vettori che hanno come componenti i coefficienti dell’equazione x1 + x2 + x3 = 0
che definisce W . Si giustifichi teoricamente questo fatto, ma si presti particolare atten-
zione a non applicare questa regola nel caso in cui W sia definito come l’insieme delle
combinazioni lineari di alcuni vettori.

Esercizio 5.7 In R2,2 si consideri il sottospazio vettoriale:

W = {A ∈ R2,2 | tr(A) = 0}.

Si determinino due sottospazi vettoriali diversi supplementari di W e il suo complemento


ortogonale, rispetto al prodotto scalare definito in (5.4).
Capitolo 5 221

Soluzione Innanzi tutto si osservi che, per le proprietà della traccia di una matrice
quadrata, W è un sottospazio vettoriale. È facile ottenere che dim(W) = 3 e:
     
1 0 0 1 0 0
W=L , , ,
0 −1 0 0 1 0

pertanto W è un iperpiano vettoriale di R2,2 (cfr. Def. 4.17). I sottospazi vettoriali:


   
1 0 0 0
W1 = L , W2 = L
0 1 0 1
sono diversi e entrambi supplementari di W ; il complemento ortogonale W ⊥ coincide
con W1 .

Esercizio 5.8 Siano W1 e W2 sottospazi vettoriali di uno spazio vettoriale euclideo


(V, · ) di dimensione n. Dimostrare che:

(W1 + W2 )⊥ = W1⊥ ∩ W2⊥ ,

(W1 ∩ W2 )⊥ = W1⊥ + W2⊥ .


Se invece W1 ⊆ W2 , allora dimostrare che:
W2⊥ ⊆ W1⊥ .

Esercizio 5.9 In R4 , rispetto al prodotto scalare standard, determinare la proiezione or-


togonale del vettore a = (1, 2, 0, 1) sul sottospazio vettoriale:
W = {(x1 , x2 , x3 , x4 ) ∈ R4 | x1 + x2 + x3 = 0}.

Soluzione Per risolvere questo esercizio si deve tener conto dell’Osservazione 5.4. Si
tratta, quindi, di determinare una base ortonormale del sottospazio vettoriale W. W è un
iperpiano vettoriale di R4 generato dai vettori:
a1 = (0, 0, 0, 1), a2 = (1, 0, −1, 0), a3 = (0, 1, −1, 0).

Applicando il processo di ortonormalizzazione di Gram–Schmidt si perviene alla base


ortonormale di W data dai vettori:

b1 = a1 = (0, 0, 0, 1),
 
1 1
b2 = vers(a2 − (a2 · b1 )b1 ) = √ , 0, − √ , 0 ,
2 2
 
1 2 1
b3 = vers(a3 − (a3 · b1 )b1 − (a3 · b2 )b2 ) = − √ , √ , − √ , 0 .
6 6 6
222 Spazi Vettoriali Euclidei

Il vettore p proiezione ortogonale di a su W è dato da:

p = (a · b1 )b1 + (a · b2 )b2 + (a · b3 )b3 = (0, 1, −1, 1).

Esercizio 5.10 Si dimostri che nello spazio vettoriale euclideo (Rn,n , · ) delle matrici
quadrate di ordine n, dotato del prodotto scalare standard definito in (5.4), il complemento
ortogonale del sottospazio vettoriale delle matrici simmetriche S(Rn,n ) è il sottospazio
vettoriale delle matrici antisimmetriche A(Rn,n ).

Soluzione Nel Teorema 4.4 si dimostra che Rn,n = S(Rn,n ) ⊕ A(Rn,n ). Per comple-
tare l’esercizio è sufficiente verificare che ogni matrice simmetrica è ortogonale ad ogni
matrice antisimmetrica. Siano S ∈ S(Rn,n ), S 6= O, e A ∈ A(Rn,n ), A 6= O, dove
con O ∈ Rn,n si indica la matrice nulla, allora tS = S e tA = −A, quindi, ricordando le
proprietà della traccia di una matrice, si ha:

S · A = tr(tS A) = tr(S A) = tr(A S) = − tr(tA S) = −A · S,

da cui segue S · A = 0.

Esempio 5.18 Sia (V, · ) uno spazio vettoriale euclideo di dimensione n e sia:

B = (e1 , e2 , . . . , en )

una sua base ortonormale. Sia W = L(a1 , . . . , ak ) un sottospazio vettoriale di V gene-


rato da k vettori linearmente indipendenti a1 , a2 , . . . , ak dati da:
      
a1 a11 a12 . . . a1n e1 e1
 a2   a21 a22 . . . a2n   e2   e2 
 ..  =  .. ..   ..  = A  .. .
      
 .   . .  .   . 
ak ak1 ak2 . . . akn en en

A è dunque una matrice di Rk,n di rango k . Come già osservato nella dimostrazione del
Teorema 5.8, il complemento ortogonale di W è formato dai vettori x di V la cui matrice
X delle componenti è soluzione del sistema lineare omogeneo AX = O, dove O ∈ Rn,1
è la matrice nulla. Pertanto il nullspace N (A) di A coincide con W ⊥ . Se si indica con
R(A) lo spazio vettoriale delle righe di A e con C(A) lo spazio vettoriale delle colonne
di A (cfr. Cap. 4.3) segue:

R(A)⊥ = N (A), C(A)⊥ = N (tA).


Si osservi che nel Teorema 4.24 era già stato dimostrato che R(A) ⊕ N (A) = Rn e che
C(A) ⊕ N (tA) = Rk .
Capitolo 5 223

5.5 Esercizi di riepilogo svolti


Esercizio 5.11 Siano:
u1 = (1, 1, 1, 1), u2 = (−3, 1, 1, 1), u3 = (0, 1, 1, −2)
elementi di uno spazio vettoriale euclideo (V4 , · ), riferiti ad una sua base ortonormale
B = (e1 , e2 , e3 , e4 ).
1. Verificare che i vettori u1 , u2 , u3 sono a due a due ortogonali.

2. Trovare le componenti, rispetto a B, di un vettore u4 , di norma 2, formante un
angolo acuto con e2 e tale che la quaterna (u1 , u2 , u3 , u4 ) sia una base ortogonale
di V4 .

Soluzione 1. Si verifica subito che:



−3
 1 
u1 · u2 = 1 1 1 1 
 1  = 0,

1
 
0
 1 
u1 · u3 = 1 1 1 1 
 1  = 0,

−2
 
0
 1 
u2 · u3 = −3 1 1 1 
 1  = 0.

−2
2. Sia u4 = (y1 , y2 , y3 , y4 ) il vettore da determinare. Affinché u4 sia ortogonale ai
tre vettori dati, le sue componenti y1 , y2 , y3 , y4 devono essere soluzioni del sistema
lineare omogeneo con matrice associata A le cui righe sono le componenti dei
vettori u1 , u2 , u3 . Poiché u1 , u2 , u3 sono linearmente indipendenti, rank(A) = 3.
Le soluzioni di tale sistema lineare omogeneo sono:
(y1 = 0, y2 = t, y3 = −t, y4 = 0), t ∈ R.

La condizione ku4 k = 2 equivale all’equazione t2 = 1, vale a dire a t = ±1.
Si ottengono cosı̀ due vettori di componenti (0, 1, −1, 0) e (0, −1, 1, 0). Il vetto-
re u4 cercato è il primo in quanto la seconda componente è positiva, condizione
equivalente al fatto che l’angolo tra u4 e e2 sia acuto.
224 Spazi Vettoriali Euclidei

Esercizio 5.12 Sia (V, · ) uno spazio vettoriale euclideo.

1. Verificare che l’insieme F formato dai vettori di un iperpiano H che sono ortogo-
nali ad un vettore u di V è un sottospazio vettoriale di V.

2. Nel caso in cui V abbia dimensione 4 e B = (e1 , e2 , e3 , e4 ) sia una sua base
ortonormale, sono dati:

H = {x = x1 e1 + x2 e2 + x3 e3 + x4 e4 ∈ V | 2x1 − x3 + x4 = 0}

e u = (0, −1, 2, 1), trovare una base ortogonale di F e completarla in modo da


ottenere una base ortogonale di H.

Soluzione 1. Se u è ortogonale ad H (in particolare se u = o) allora F = H. Se u


non è ortogonale ad H, F è l’intersezione di H con l’iperpiano vettoriale H0 =
L(u)⊥ ortogonale a u, quindi è ancora un sottospazio vettoriale di V.

2. Poiché u non è ortogonale ad H, F = H ∩ H0 , dove H0 è l’iperpiano vettoriale


ortogonale a u, formato dai vettori x tali che x · u = 0, pertanto:

F = {x = x1 e1 + x2 e2 + x3 e3 + x4 e4 ∈ V | 2x1 − x3 + x4 = −x2 + 2x3 + x4 = 0}.

Una base di F è C = (a1 , a2 ) con a1 = (1, 4, 2, 0), a2 = (−1, 2, 0, 2). Per ottenere
una base ortogonale di F si può mantenere il vettore a1 e sostituire al vettore a2
il vettore b2 = a2 + λa1 , determinando λ in modo tale che b2 · a1 = 0. Si ha
λ = −1/3, da cui segue:
 
4 2 2
b2 = − , , − , 2 .
3 3 3

Per completare la base (a1 , b2 ) di F ad una base ortogonale di H è sufficiente


aggiungere un vettore b3 = (y1 , y2 , y3 , y4 ) appartenente ad H e ortogonale a a1 e
a b2 , ossia tale che:


 y1 + 4y2 + 2y3 = 0



4 2 2
− y1 + y2 − y3 + 2y4 = 0


 3 3 3

2y1 − y3 + y4 = 0,

da cui si ottiene b3 = (−2t, 6t, −11t, −7t), t ∈ R, t 6= 0. Assegnando al parame-


tro t un valore qualsiasi, non nullo, si ottiene una delle basi richieste.
Capitolo 5 225

Esercizio 5.13 In R3 si consideri il prodotto scalare x · y, con x, y ∈ R3 , rispetto al


quale la base:
B 0 = ((1, 1, 1), (0, 2, 1), (0, 0, 1))
risulti ortonormale.

1. Determinare la matrice A ∈ R3,3 che permette di esprimere in forma matriciale


t
XAY il prodotto scalare x·y considerato, dove X e Y indicano le matrici colonne
delle componenti del vettore x e del vettore y, rispetto alla base canonica B di R3 .

2. Verificare che i vettori a = (0, 1, 0) e b = (0, 1, 1) sono ortogonali rispetto al


prodotto scalare considerato.

Soluzione 1. Rispetto alla base B 0 il prodotto scalare in questione è dato da:

x · y = tX 0 Y 0 (5.11)

dove X 0 e Y 0 sono le matrici colonna delle componenti dei vettori x e y riferite a


B 0 . Sia P ∈ GL(3, R) la matrice del cambiamento di base dalla base canonica B
di R3 alla base B 0 . Siano X = P X 0 e Y = P Y 0 le equazioni del cambiamento di
base che determinano le relazioni tra le componenti dei vettori x e y rispetto a B
e a B 0 . Si ricava quindi:

X 0 = P −1 X, Y 0 = P −1 Y

e, sostituendo in (5.11) si ottiene:


t
X0 Y 0 = t
(P −1 X)(P −1 Y ) = tX t (P −1 )P −1 Y
= t
X((tP )−1 P −1 )Y = tX(P tP )−1 Y.

Pertanto la matrice A cercata, che permette di esprimere il prodotto scalare richie-


sto rispetto alla base B, è:

A = (P tP )−1 .

Tenendo conto che la matrice P, le cui colonne sono, ordinatamente, le componenti


dei vettori di B 0 , è data da:
 
1 0 0
P =  1 2 0 ,
1 1 1
226 Spazi Vettoriali Euclidei

si ricava:
3 1
 
0 − 

 2 2 
 
1 1 
A = (P tP )−1

= 0 −  .

 2 2 

 
 1 1 
− − 1
2 2

2. È immediato verificare che i vettori a e b sono ortogonali rispetto a questo prodotto


scalare, infatti si ha:
3 1
  
 2 0 −  0 
 2  
  
 1 1  
a·b= 0 1 0  0 −   1  = 0.

 2 2   
 
  
 1 1  
− − 1 1
2 2

5.5.1 Per saperne di più


Lo scopo di questo paragrafo è quello di introdurre un “prodotto scalare” opportuno nel
caso degli spazi vettoriali complessi in modo da potere, anche in questo contesto, definire
il concetto di ortogonalità di due vettori.

5.5.2 Spazi vettoriali hermitiani


L’operazione di prodotto scalare (cfr. Def. 5.1) introdotta su uno spazio vettoriale reale
può essere estesa mediante la seguente definizione agli spazi vettoriali complessi.

Definizione 5.7 Sia V uno spazio vettoriale su C. Si definisce prodotto hermitiano su V


la funzione:

· : V × V −→ C, (x, y) 7−→ x · y,
per cui valgano le seguenti proprietà:

1. x · y = y · x x, y ∈ V ;

2. (x1 + x2 ) · y = x1 · y + x2 · y, x1 , x 2 , y ∈ V ;
Capitolo 5 227

3. (λx) · y = λ(x · y), λ ∈ C, x, y ∈ V ;

4. x · x ≥ 0, x ∈ V e x · x = 0 ⇐⇒ x = o,

dove y · x indica il complesso coniugato di y · x.

Uno spazio vettoriale complesso V su cui è definito un prodotto hermitiano “·” prende il
nome di spazio vettoriale hermitiano o di spazio vettoriale euclideo complesso e si indica,
in generale, con la scrittura (V, · ).

Osservazione 5.13 1. Come conseguenza delle Proprietà 1. e 3. della Definizione 5.7


si ha:

x · (λy) = (λy) · x = λ(y · x) = λ (y · x) = λ (x · y), λ ∈ C, x, y ∈ V.

Inoltre, dalle Proprietà 1., 2. e 3 della Definizione 5.7 si ottiene:

x · (λ1 y1 + λ2 y2 ) = λ1 (x · y1 ) + λ2 (x · y2 ), λ1 , λ2 ∈ C, x, y1 , y2 ∈ V. (5.12)

2. La Proprietà 4. della Definizione 5.7 ha senso in quanto x · x = x · x e pertanto


x · x è un numero reale.

Nel caso degli spazi vettoriali hermitiani valgono esempi e teoremi analoghi a quelli già
dimostrati per gli spazi vettoriali euclidei.

Esempio 5.19 Sullo spazio vettoriale complesso Cn (cfr. Es. 4.44) si può definire un pro-
dotto hermitiano che, se ristretto a Rn , coincide con il prodotto scalare standard introdotto
nell’Esempio 5.2. Precisamente si pone:
n
X
(x1 , x2 , . . . , xn ) · (y1 , y2 , . . . , yn ) = x1 y1 + x2 y2 + . . . + xn yn = xi yi , (5.13)
i=1

per ogni (x1 , x2 , . . . , xn ), (y1 , y2 , . . . , yn ) ∈ Cn . Con la notazione matriciale:


   
x1 y1
 x2   y2 
X =  ..  , Y =  .. 
   
 .   . 
xn yn

la (5.13) si scrive come:


X · Y = tX Y ,
228 Spazi Vettoriali Euclidei

dove Y indica la matrice complessa coniugata di Y. È un esercizio dimostrare che (5.13)


è un prodotto hermitiano che, spesso, prende il nome di prodotto hermitiano standard
su Cn , che viene cosı̀ dotato della struttura di spazio vettoriale hermitiano. È ancora un
esercizio dimostrare che:
X · Y = tX Y
è un altro prodotto hermitiano su Cn , che coincide con il prodotto scalare standard di Rn ,
quando lo si riferisce a numeri reali.

Ogni spazio vettoriale complesso, di dimensione finita, ammette almeno un prodotto


hermitiano, vale infatti il seguente teorema.

Teorema 5.9 Sia V uno spazio vettoriale complesso di dimensione n. Data una base
B = (v1 , v2 , . . .,vn ) di V, la funzione:

· : V × V −→ C,

definita da:
x · y = tX Y ,
dove:    
x1 y1
 x2   y2 
X= , Y =
   
.. .. 
 .   . 
xn yn
e (x1 , x2 , . . . , xn ) e (y1 , y2 , . . . , yn ) sono le componenti rispettivamente di x e y rispetto
alla base B, è un prodotto hermitiano su V.

La dimostrazione è un esercizio.

La proprietà 4. della Definizione 5.7 permette, come per gli spazi vettoriali euclidei, di
definire la norma di un vettore anche nel caso di uno spazio vettoriale hermitiano (V, · ).
Infatti si definisce norma di un vettore x di V il numero reale positivo dato da:

kxk = x · x

ed è lasciata al Lettore la verifica della proprieà:

kλxk = |λ| kxk, x ∈ V, λ ∈ C,

dove |λ| indica il modulo del numero complesso λ.


Capitolo 5 229

Esempio 5.20 Nello spazio vettoriale hermitiano (Cn , · ) con il prodotto hermitiano stan-
dard (5.13), la norma di x è data da:
v v
u n u n
uX uX
kxk = t xi xi = t |xi |2 ,
i=1 i=1

dove |xi | indica il modulo del numero complesso xi , i = 1, 2, . . . , n.

Continuano a valere, anche nel caso degli spazi vettoriali hermitiani, la disuguaglianza
di Cauchy–Schwarz e la disuguaglianza triangolare (cfr. Teor. 5.2), anche se la loro
dimostrazione è più laboriosa rispetto a quella del caso euclideo. Precisamente, vale il
teorema seguente.

Teorema 5.10 Su uno spazio vettoriale hermitiano (V, · ), la funzione:

k · k : V −→ R, x 7−→ kxk

verifica le seguenti proprietà:

1. Teorema di Pitagora: x · y = 0 ⇐⇒ kx + yk2 = kxk2 + kyk2 .

2. Disuguaglianza di Cauchy–Schwarz: |x · y| ≤ kxk kyk, x, y ∈ V ,


dove |x · y| indica il modulo del numero complesso x · y.

3. Disuguaglianza triangolare: kx + yk ≤ kxk + kyk, x, y ∈ V.

Dimostrazione 1. Segue da:

kx + yk2 = (x + y) · (x + y) = kxk2 + x · y + x · y + kxk2 .

2. La disuguaglianza di Cauchy–Schwarz è banalmente verificata se uno dei due vet-


tori coincide con il vettore nullo. Si supponga, quindi, che x e y siano entrambi
diversi dal vettore nullo. Si inizia la dimostrazione nel caso particolare kyk = 1.
Si ha:
0 ≤ kx − (x · y) yk2 = (x − (x · y) y) · (x − (x · y) y)
= kxk2 − (x · y)(x · y) − (x · y)(y · x)
+(x · y)(x · y)kyk2
= kxk2 − 2|x · y|2 + |x · y|2 kyk2 = kxk2 − |x · y|2 .
230 Spazi Vettoriali Euclidei

Quindi |x · y| ≤ kxk se kyk = 1. Se y 6= o, si può considerare il versore di y.


Applicando allora la precedente disuguaglianza si ottiene:


x · y
kyk ≤ kxk,

da cui la tesi.

3. La dimostrazione è analoga a quella vista nel caso di uno spazio vettoriale euclideo
se si tiene conto che:

x · y + y · x = x · y + x · y ≤ 2|x · y|. (5.14)

Infatti, dato un numero complesso z = a + ib, con a, b ∈ R e a = Re(z), dove


Re(z) indica la parte reale di z, si ha:

|z|2 = z z = a2 + b2 ≥ a2 = (Re(z))2 .

D’altra parte 2 Re(z) = z + z da cui:

2 Re(z) = z + z ≤ 2|z|,

ossia la (5.14).

Considerati due vettori x e y non nulli di uno spazio vettoriale hermitiano (V, ·), dalla
disuguaglianza di Cauchy–Schwarz segue che:

|x · y|
≤ 1,
kxk kyk

ma ciò significa solo che il modulo del numero complesso (x · y)/(kxk kyk) è minore o
uguale a 1. Pertanto non è possibile nel caso degli spazi vettoriali hermitiani introdurre
il concetto di angolo tra due vettori nello stesso modo in cui è stato definito per gli spazi
vettoriali euclidei. Nonostante ciò, sugli spazi vettoriali hermitiani, come nel caso reale,
si può introdurre il concetto di ortogonalità. Più precisamente, due vettori x e y di uno
spazio vettoriale hermitiano (V, · ) si dicono ortogonali se x · y = 0. Di conseguenza, è
valida anche in questo caso la definizione di base ortogonale e ortonormale e continua a
valere anche per uno spazio vettoriale hermitiano il Lemma 5.1. Una base ortonormale su
uno spazio vettoriale hermitiano è in generale chiamata base unitaria.

Esempio 5.21 La base canonica (e1 , e2 , . . . en ) di Cn è una base unitaria dello spazio
vettoriale hermitiano (Cn , · ) con il prodotto hermitiano standard (5.13).
Capitolo 5 231

Inoltre, analogamente a quanto dimostrato per uno spazio vettoriale euclideo, in uno spa-
zio vettoriale hermitiano (V, · ) utilizzando il processo di ortonormalizzazione di Gram–
Schmidt (che vale anche nel caso complesso) si può costruire una base unitaria a partire
da una base di V. La dimostrazione è analoga a quella vista per il Teorema 5.5, facendo
attenzione al fatto che, a differenza del caso reale, il prodotto hermitiano non è simme-
trico, ossia non vale la relazione x · y = y · x, ∀x, y ∈ V, ma vale la proprietà 1. della
Definizione 5.7.

Osservazione 5.14 La disuguaglianza di Cauchy–Schwarz può essere dimostrata in molti


modi diversi. Si propone di seguito una seconda versione della dimostrazione precedente,
che, anche se più lunga, è interessante per la sua interpretazione geometrica. Infatti,
sorprendentemente, anche se in uno spazio vettoriale hermitiano non è definito l’angolo
tra due vettori, il prodotto hermitiano permette di introdurre la nozione di proiezione
ortogonale di un vettore su un altro vettore. Sia x un vettore non nullo, si definisce il
vettore:
x·y
w =x− y,
kyk2
che, nel caso di uno spazio vettoriale euclideo, rappresenterebbe un vettore ortogonale
a y in quanto w è la differenza di x con la sua proiezione ortogonale su y. Anche in
questo caso si dimostra che w · y = 0, infatti:
 
x·y x·y
w·y = x− 2
y ·y =x·y− y · y = 0.
kyk kyk2

Dal fatto che kwk2 ≥ 0 si ha:

kxk2 kyk2 − |y · x|2


 
x·y
0≤w·w =w·x= x− y · x = ,
kyk2 kyk2

ossia la tesi.

Dal Teorema 5.6 segue che le matrici ortogonali esprimono il cambiamento di base tra
coppie di basi ortonormali di uno spazio vettoriale euclideo. Un risultato analogo è valido
in uno spazio vettoriale hermitiano, con la differenza che la matrice P del cambiamento
di base deve verificare la relazione:
tP P = I.

Si può allora introdurre l’insieme delle matrici unitarie di Cn,n definito da:

U (n) = {P ∈ Cn,n | tP P = I},


232 Spazi Vettoriali Euclidei

che è l’analogo, nel caso complesso, dell’insieme O(n) delle matrici ortogonali (cfr.
(2.9)).
Si osservi che dalla relazione tP P = I si ottiene tP P = I e P −1 = tP . Inoltre, una
matrice unitaria ad elementi reali è ovviamente ortogonale ed una matrice ortogonale,
considerata come matrice complessa, è unitaria. Per le matrici unitarie valgono le seguenti
proprietà.

Teorema 5.11 1. Il prodotto di due matrici unitarie è una matrice unitaria.


2. La matrice identità I è unitaria.
3. L’inversa P −1 di una matrice unitaria P è unitaria.
4. La trasposta tP di una matrice unitaria P è unitaria.
5. Una matrice P ∈ Cn,n è unitaria se e e solo se le righe e le colonne di P so-
no le componenti di una base ortonormale di Cn , rispetto al prodotto hermitiano
standard.
6. Il determinante di una matrice unitaria P è un numero complesso di modulo 1.

La dimostrazione, analoga a quella vista per il Teorema 5.7, è lasciata al Lettore per
esercizio.

Osservazione 5.15 Segue dalle proprietà 1., 2., 3. del Teorema 5.11 che l’insieme delle
matrici unitarie U (n) è un gruppo rispetto al prodotto di matrici (cfr. Oss. 2.2). U (n)
prende il nome di gruppo unitario.

Esempio 5.22 Le matrici unitarie di ordine 1 sono facilmente individuabili, infatti si ha:

U (1) = {z ∈ C | z z = 1},

si tratta, quindi, dei numeri complessi di modulo 1. Nel Capitolo 10 si vedrà un’inter-
pretazione geometrica di tale insieme. È meno semplice individuare le matrici unitarie di
ordine 2. Si dimostra che sono tutte e sole le matrici:
 
z1 z2
A=λ
z 2 −z 1
dove λ, z1 , z2 sono numeri complessi tali che:

|λ| = 1, |z1 |2 + |z2 |2 = 1.

Nel Capitolo 11 si vedrà un’interessante rappresentazione geometrica dell’insieme degli


elementi di U (2) aventi determinante 1.
Capitolo 5 233

Siano (V, · ) uno spazio vettoriale hermitiano di dimensione n e W un suo sottospazio


vettoriale di dimensione k ≤ n. Come nel caso degli spazi vettoriali euclidei si può
definire il complemento ortogonale W ⊥ di W per cui valgono le stesse proprietà del caso
reale (cfr. Teor. 5.8).

Si conclude il capitolo osservando che la norma di un vettore individua il prodotto scalare


o hermitiano che la definisce. Infatti è un facile esercizio dimostrare che in uno spazio
vettoriale euclideo reale V vale la formula:
1
kx + yk2 − kxk2 − kyk2 ,

x·y = x, y ∈ V.
2
Più complicata la relazione analoga che vale nel caso di uno spazio vettoriale hermitiano:
1
x·y = (ktx + yk2 − kxk2 − kyk2 )
2
(5.15)
i
+ (kx + iyk2 − kxk2 − kyk2 ), x, y ∈ V.
2
234 Spazi Vettoriali Euclidei
Capitolo 6

Applicazioni Lineari

Lo scopo di questo capitolo è quello di introdurre la nozione di applicazione lineare tra


due spazi vettoriali, mettendoli cosı̀ in relazione l’un l’altro e in modo da poter definire,
come caso particolare, il concetto di movimento rigido o euclideo in uno spazio vettoriale.

Definizione 6.1 Dati due spazi vettoriali reali V e W, si dice applicazione lineare o
omomorfismo o trasformazione lineare da V in W una funzione f : V −→ W che
verifica le seguenti proprietà:

f (x + y) = f (x) + f (y),
f (λx) = λf (x),

per ogni x e y in V e per ogni λ in R, o, equivalentemente:

f (λx + µy) = λf (x) + µf (y),

per ogni x e y in V e per ogni λ e µ in R.

Lo spazio vettoriale V prende il nome di dominio di f, mentre lo spazio vettoriale W è il


codominio di f ; f (x) ∈ W è detto vettore immagine di x ∈ V mediante f. Se w = f (x)
allora il vettore x ∈ V è detto vettore controimmagine di w ∈ W mediante f.

Definizione 6.2 Sia f : V −→ V un’applicazione lineare in cui il dominio e il codominio


coincidono, allora f è detta endomorfismo o operatore lineare o trasformazione lineare
di V.

Di seguito si riporta un elenco di funzioni di cui si lascia al Lettore, per esercizio, la


verifica dell’eventuale linearità.

235
236 Applicazioni Lineari

Esempio 6.1 La funzione:

id : V −→ V, x 7−→ x,

detta applicazione lineare identica o identità, è un’endomorfismo.

Esempio 6.2 La funzione:

O : V −→ W, x 7−→ oW ,

dove oW indica il vettore nullo di W, è un’applicazione lineare, detta applicazione li-


neare nulla. Se W = V, l’endomorfismo O : V −→ V, x 7−→ oV , prende il nome di
endomorfismo nullo.

Esempio 6.3 La funzione:

f : R2 −→ R, (x, y) 7−→ 3x + 2y

è un’applicazione lineare.

Esempio 6.4 La funzione:

f : R2 −→ R, (x, y) 7−→ 3x + 2y + 5

non è un’applicazione lineare.

Esempio 6.5 La funzione:

f : R2 −→ R, (x, y) 7−→ x2 + 2y

non è un’applicazione lineare.

Esempio 6.6 La funzione:

f : V3 −→ R, x 7−→ a · x

con “·” prodotto scalare su V3 e a vettore fissato di V3 , è lineare. Se a = o allora


f (a) = 0, cioè f è l’applicazione lineare nulla.

Esempio 6.7 La funzione:

f : V3 −→ V3 , x 7−→ a ∧ x,

con “∧” prodotto vettoriale e a vettore fissato di V3 , è un endomorfismo. Se a = o


allora f (a) = o, ossia f è l’endomorfismo nullo.
Capitolo 6 237

Esempio 6.8 La funzione:


f : Rn,n −→ R, A 7−→ det(A),
dove det(A) è il determinante della matrice A, non è un’applicazione lineare se n > 1.

Esempio 6.9 La funzione:


f : Rn,n −→ R, A 7−→ tr(A),
dove tr(A) è la traccia della matrice A, è un’applicazione lineare.

Esempio 6.10 Se lo spazio vettoriale V è dato dalla somma diretta di due sottospazi
vettoriali W1 e W2 , V = W1 ⊕ W2 , allora dalla Definizione 4.5 si ha che ogni vettore
x di V si decompone in modo unico come x = x1 + x2 , con x1 ∈ W1 e x2 ∈ W2 . Le
funzioni:
f1 : V −→ V, x 7−→ x1 e f2 : V −→ V, x 7−→ x2
sono applicazioni lineari e prendono il nome di proiezioni di V su W1 e su W2 rispetti-
vamente.
In particolare, se W è un sottospazio vettoriale di uno spazio vettoriale euclideo (V, · ),
si ha che V = W ⊕ W ⊥ , dove W ⊥ indica il complemento ortogonale di W, allora ogni
vettore x di V si decompone in modo unico come x = xW + xW ⊥ , con xW ∈ W e
xW ⊥ ∈ W ⊥ . L’applicazione lineare:
p : V −→ V, x 7−→ xW
prende il nome di proiezione ortogonale su W .

Esempio 6.11 La funzione:


f : V2 −→ V2 , (x1 , x2 ) 7−→ (−x1 , x2 ),
dove (x1 , x2 ) sono le componenti di un qualsiasi vettore di un piano vettoriale V2 rispetto
ad una base ortonormale positiva B = (i, j) (cfr. Cap. 3), è un endomorfismo di V2 . Si
tratta dell’applicazione lineare che associa ad ogni vettore di V2 il suo simmetrico rispetto
a j.

Esempio 6.12 La funzione:


f : V3 −→ V3 , (x1 , x2 , x3 ) 7−→ (x1 , x2 , −x3 ),
dove (x1 , x2 , x3 ) sono le componenti di un qualsiasi vettore dello spazio vettoriale V3
rispetto ad una base ortonormale positiva B = (i, j, k) (cfr. Cap. 3), è un endomorfismo di
V3 . Si tratta dell’applicazione lineare che associa ad ogni vettore di V3 il suo simmetrico
rispetto al piano vettoriale generato da i e da j.
238 Applicazioni Lineari

Esempio 6.13 La funzione:

f : Rn −→ Rn , X 7−→ AX,

dove X ∈ Rn (ma è considerata come matrice colonna di Rn,1 ) e A ∈ Rn,n , è un


endomorfismo di Rn . Più in generale:

f : Rn −→ Rm , X 7−→ AX,

con X ∈ Rn e A ∈ Rm,n , è anch’essa un’applicazione lineare.

La dimostrazione del seguente teorema è lasciata per esercizio.

Teorema 6.1 Sia f : V −→ W un’applicazione lineare tra due spazi vettoriali V e W,


si ha:

1. f (oV ) = oW ,
dove oV indica il vettore nullo di V e oW indica il vettore nullo di W ;
2. f (−x) = −f (x), x∈V;
3. f (λ1 x1 + λ2 x2 + . . . + λk xk ) = λ1 f (x1 ) + λ2 f (x2 ) + . . . + λk f (xk ),

λi ∈ R, xi ∈ V, i = 1, 2, . . . , k .

6.1 Matrice associata ad un’applicazione lineare


Equazioni di un’applicazione lineare
Il paragrafo inizia con la dimostrazione del teorema più importante sulle applicazioni
lineari, in cui si chiarisce come si possa assegnare un’applicazione lineare tra due spazi
vettoriali di dimensione finita. È fondamentale osservare, infatti, che il teorema seguente
è valido solo nel caso in cui il dominio sia finitamente generato.

Teorema 6.2 – Teorema fondamentale delle applicazioni lineari – Sia V uno spa-
zio vettoriale reale di dimensione n e sia B = (v1 , v2 , . . . , vn ) una sua base. Dato
un insieme {a1 , a2 , . . . , an } di n vettori di uno spazio vettoriale W, esiste ed è unica
l’applicazione lineare:
f : V −→ W
tale che:
f (vi ) = ai , i = 1, 2, . . . , n.
Capitolo 6 239

In altri termini: per assegnare un’applicazione lineare tra due spazi vettoriali V e W,
di cui almeno V di dimensione finita, è sufficiente conoscere le immagini, mediante la
funzione f, dei vettori di una base di V.

Dimostrazione Sia x = x1 v1 + x2 v2 + . . . + xn vn ∈ V, si definisce f ponendo:

f (x) = x1 a1 + x2 a2 + . . . + xn an .

La dimostrazione del teorema si ottiene dai quattro punti seguenti:

1. f è una funzione, infatti il vettore f (x) è definito per ogni vettore x di V ed è


univocamente determinato, per l’esistenza e l’unicità delle componenti di x rispetto
alla base B.

2. Dalla definizione di f si ha f (vi ) = ai , i = 1, 2, . . . , n. Per esempio, f (v1 ) = a1


in quanto v1 = (1, 0, . . . , 0) rispetto alla base B, e cosı̀ via.

3. Per dimostrare la linearità di f si deve verificare che:

f (λx + µy) = λf (x) + µf (y), x, y ∈ V, λ, µ ∈ R.

La tesi segue dalla definizione di f, ponendo:

x = x1 v 1 + x2 v 2 + . . . + xn v n , y = y1 v1 + y2 v2 + . . . + yn vn .

Poiché:

λx + µy = (λx1 + µy1 )v1 + (λx2 + µy2 )v2 + . . . + (λxn + µyn )vn ,

un semplice calcolo prova che:

f (λx+µy) = (λx1 +µy1 )a1 +(λx2 +µy2 )a2 +. . .+(λxn +µyn )an = λf (x)+µf (y).

4. L’applicazione lineare f è unica. Infatti, se esistesse un’altra applicazione lineare


g : V −→ W, tale che g(vi ) = ai , i = 1, 2, . . . , n, allora si avrebbe:

g(x) = g(x1 v1 + x2 v2 + . . . + xn vn )
= x1 g(v1 ) + x2 g(v2 ) + . . . + xn g(vn )
= x1 a1 + x2 a2 + . . . + xn an ,

per ogni x ∈ V, ciò implicherebbe g(x) = f (x), per ogni x ∈ V e quindi g = f .


240 Applicazioni Lineari

Dal Teorema 6.2 segue che definire un’applicazione lineare tra due spazi vettoriali di di-
mensione finita equivale a conoscere le immagini degli elementi di una base del dominio.
Siano, quindi, V uno spazio vettoriale reale di dimensione n e B = (v1 , v2 , . . . , vn ) una
sua base, e W uno spazio vettoriale reale di dimensione m e C = (w1 , w2 , . . . , wm ) una
sua base. Si intende definire l’applicazione lineare f : V −→ W ponendo:


 f (v1 ) = a11 w1 + a21 w2 + . . . + am1 wm
 f (v2 ) = a12 w1 + a22 w2 + . . . + am2 wm

.. (6.1)


 .
 f (v ) = a w + a w + . . . + a w ,
n 1n 1 2n 2 mn m

con aij ∈ R, i = 1, 2, . . . , m, j = 1, 2, . . . , n, che equivale ad assegnare la matrice:


 
a11 a12 . . . a1n
 a21 a22 . . . a2n 
A=  ∈ Rm,n
 
.. .. ..
 . . . 
am1 am2 . . . amn

ottenuta mettendo, ordinatamente, in colonna le immagini dei vettori della base B espres-
se rispetto alla base C . La matrice A prende il nome di matrice associata all’applicazione
lineare f rispetto alle basi B e C e si indica come:

A = M B,C (f ).

La scelta di porre in colonna le componenti è una convenzione, che si ripercuote forte-


mente sulle considerazioni successive.

Osservazione 6.1 1. Fissata una base B nel dominio V e una base C nel codominio
W, segue dal Teorema 6.2 che la matrice A = M B,C (f ) determina in modo univoco
l’applicazione lineare f : V −→ W.

2. Da notare, quindi, che la matrice A associata all’applicazione lineare f : V −→ W


(rispetto ad una qualsiasi coppia di basi scelta) ha un numero di righe pari alla
dimensione del codominio W e un numero di colonne pari alla dimensione del
dominio V.

3. Se V = W, la matrice associata all’endomorfismo f : V −→ V, rispetto ad una


base B di V, è la matrice quadrata A = M B,B (f ). Attenzione al fatto che si può an-
che in questo caso considerare una matrice M B,C (f ) con B =6 C, che, ovviamente,
sarà diversa dalla matrice A, come si vedrà nell’Esempio 6.14.
Capitolo 6 241

In notazione matriciale le relazioni (6.1) si scrivono come:


   
f (v1 ) w1
 f (v2 )   w2 
 ..  = tA  .. . (6.2)
   
 .   . 
f (vn ) wm

Dato un generico vettore x di V, ci si propone di calcolare la sua immagine f (x) me-


diante la matrice A. Sia:  
x1
 x2 
X =  .. 
 
 . 
xn
la matrice colonna delle componenti di x rispetto alla base B. Si ponga:

f (x) = y1 w1 + y2 w2 + . . . + ym wm ,

se si indica con:  
y1
 y2 
Y =
 
.. 
 . 
ym
la matrice colonna delle componenti di f (x) rispetto alla base C , allora:
 
w1
t
 w2 
f (x) = Y  . (6.3)
 
..
 . 
wm

Per la linearità di f si ha:

f (x) = f (x1 v1 + x2 v2 + . . . + xn vn )
= x1 f (v1 ) + x2 f (v2 ) + . . . + xn f (vn )
 
f (v1 )
t
 f (v2 ) 
= X .
 
..
 . 
f (vn )
242 Applicazioni Lineari

Da (6.3) e da (6.2) segue:


     
w1 f (v1 ) w1

t
w2  
t 
f (v2 ) 
t

t 
w2 
f (x) = Y  = X  = X A ,
   
.. .. ..
 .   .   . 
wm f (vn ) wm

ossia, per l’unicità delle componenti di un vettore rispetto ad una base, si ottiene:
t
Y = tX tA

e quindi:
Y = A X, (6.4)
che è il legame cercato tra le componenti, rispetto alla base B, di un vettore x del dominio
V e le componenti della sua immagine f (x), rispetto alla base C . Il sistema lineare, di
m equazioni nelle n incognite (x1 , x2 , . . . , xn ), associato all’equazione matriciale (6.4)
prende il nome di sistema lineare delle equazioni dell’applicazione lineare f , rispetto
alle basi B e C .

Gli esempi che seguono mettono in luce la fondamentale importanza della matrice asso-
ciata ad un’applicazione lineare e delle sue equazioni.

Esempio 6.14 La matrice associata all’identità:

id : V −→ V, x 7−→ x,

rispetto ad una qualsiasi base B = (v1 , v2 , . . . , vn ) di V, è la matrice unità I di ordine


n (cfr. Es. 6.1). Se si considera un’altra base B 0 = (v10 , v20 , . . . , vn0 ) di V, si ha, invece,
che la matrice associata all’identità rispetto alla base B nel dominio e alla base B 0 nel
0
codominio, M B,B (id), coincide con la matrice del cambiamento di base da B 0 a B. In-
0
fatti, id(vj ) = vj , per ogni j = 1, 2, . . . , n, e quindi per costruzione la matrice M B,B (id)
ha sulle colonne le componenti dei vettori vj della base B rispetto alla base B 0 . Sia
0
P = M B,B la matrice del cambiamento di base da B a B 0 (cfr. Par. 4.3.4), allora:
0
M B,B (id) = P−1 .

Ponendo:

id(x) = id(x1 v1 + x2 v2 + . . . + xn vn ) = x01 v10 + x02 v20 + . . . + x0n vn0

segue che le equazioni dell’applicazione lineare id in questo caso sono:

X 0 = P −1 X,
Capitolo 6 243

dove con X si indica la matrice colonna delle componenti del vettore x rispetto alla
base B e con X 0 la matrice colonna delle componenti del vettore id(x) rispetto alla
base B 0 . Si osservi che le equazioni dell’endomorfismo id coincidono con le equazioni
del cambiamento di base da B 0 a B. In altri termini la matrice associata all’identità è
la matrice unità se e solo se essa è scritta rispetto alla stessa base nel dominio e nel
codominio.

Esempio 6.15 La matrice associata all’endomorfismo nullo:


O : V −→ V, x 7−→ o,
rispetto ad una qualsiasi base B di V, è la matrice nulla O di ordine n se dim(V ) = n
(cfr. Es. 6.2).

Esempio 6.16 Le equazioni, rispetto alla base canonica B di R3 , dell’endomorfismo:


f : R3 −→ R3 , (x, y, z) 7−→ (2x + 3y, y, 3x − 2z)

sono:  0
 x = 2x + 3y
y0 = y (6.5)
 0
z = 3x − 2z,
dove (x0 , y 0 , z 0 ) = f ((x, y, z)). Quindi la matrice associata all’applicazione lineare f,
rispetto alla base canonica di R3 , è:
 
2 3 0
A= 0 1 0 .
3 0 −2

Di conseguenza, l’immagine del vettore (2, 0, 3) si calcola mediante il prodotto:


  
2 3 0 2
 0 1 0   0 
3 0 −2 3
oppure sostituendo ordinatamente in (6.5) i numeri 2, 0, 3 al posto di x, y, z , rispettiva-
mente.

Esempio 6.17 Si consideri di nuovo l’Esempio 6.7. In V3 , spazio vettoriale dei vettori
ordinari riferito ad una base ortonormale positiva B = (i, j, k), si definisce l’endomorfi-
smo:
f : V3 −→ V3 , x 7−→ a ∧ x,
con a vettore di V3 . La matrice associata ad f , rispetto alla base B, può essere determi-
nata in due modi:
244 Applicazioni Lineari

1. si calcola f (x), ponendo x = x1 i + x2 j + x3 k e a = a1 i + a2 j + a3 k. Si ha:

f (x) = (−a3 x2 + a2 x3 )i + (a3 x1 − a1 x3 )j + (−a2 x1 + a1 x2 )k,

allora la matrice associata ad f, rispetto alla base B, è:


 
0 −a3 a2
A =  a3 0 −a1 .
−a2 a1 0

Si osservi che A è una matrice antisimmetrica.

2. Si può pervenire alla matrice A calcolando le immagini dei vettori della base B
e mettendo sulle colonne, rispettivamente, le componenti di f (i), f (j), f (k), di
nuovo rispetto alla base B.

Se a è il vettore nullo, allora A coincide con la matrice nulla O ∈ R3,3 e f è l’endomor-


fismo nullo.

Esempio 6.18 Rispetto alle basi canoniche B del dominio e C del codominio, la matrice
associata all’applicazione lineare f : R3 −→ R2,2 definita da:
 
a a+b
f ((a, b, c)) =
a+b+c 0

è la matrice appartenente a R4,3 data da:


 
1 0 0
 1 1 0 
A=
 1
.
1 1 
0 0 0

Da notare che le equazioni dell’applicazione lineare f, rispetto alle basi B e C , sono:


 0

 a =a
 0
b =a+b

 c0 = a + b + c
 0
d =0
con:
a0 b 0
 
f ((a, b, c)) = .
c0 d0
Capitolo 6 245

Esercizio 6.1 Si scrivano le matrici associate alle applicazioni lineari introdotte negli
Esempi 6.3, 6.6, 6.9, 6.10, 6.11, 6.12, 6.13, dopo aver fissato basi opportune nel dominio
e nel codominio.

Esercizio 6.2 In R3 , rispetto alla base canonica B = (e1 , e2 , e3 ), è dato l’endomorfismo


f tale che: 
 f (e1 ) − f (e2 ) − f (e3 ) = o
2f (e1 ) − f (e2 ) = 3e1 + 2e2 − e3
−f (e1 ) + f (e2 ) = 3e1 − e2 + 2e3 ,

determinare la matrice A = M B,B (f ) associata ad f rispetto alla base canonica B di R3


e scrivere le equazioni di f.

Soluzione Si osservi che si ottiene la matrice A risolvendo il sistema lineare di equa-


zioni vettoriali assegnato e si osservi anche che la soluzione esiste ed è unica se e solo se
la matrice dei coefficienti di tale sistema lineare ha rango massimo. Si proceda, quindi,
con la riduzione per righe della matrice completa:
   
1 −1 −1 0 0 0 1 −1 −1 0 0 0
 2 −1 −→
0 3 2 −1   2 −1 0 3 2 −1 
R 3 → R3 + R 2
−1 1 0 3 −1 2 1 0 0 6 1 1

da cui si ha: 
 f (e1 ) = (6, 1, 1)
2f (e1 ) − f (e2 ) = (3, 2, −1)
f (e1 ) − f (e2 ) − f (e3 ) = (0, 0, 0),

quindi: 
 f (e1 ) = 6e1 + e2 + e3
f (e2 ) = 9e1 + 3e3
f (e3 ) = −3e1 + e2 − 2e3 ,

di conseguenza la matrice cercata è:


 
6 9 −3
A=  1 0 1 .
1 3 −2

Le equazioni di f, rispetto alla base canonica B di R3 , sono:



 y1 = 6x1 + 9x2 − 3x3
y 2 = x1 + x3
y3 = x1 + 3x2 − 2x3 ,

con f ((x1 , x2 , x3 )) = (y1 , y2 , y3 ).


246 Applicazioni Lineari

6.2 Cambiamenti di base e applicazioni lineari


Per la lettura di questo paragrafo si deve fare costante riferimento al Paragrafo 4.3.4 sul
cambiamento di base in uno spazio vettoriale. Si vogliono, infatti, determinare le relazioni
che intercorrono tra tutte le matrici associate alla stessa applicazione lineare, costruite
cambiando base sia nel dominio sia nel codominio. Si ricordi ciò che è stato dimostrato
nel paragrafo precedente. Dati due spazi vettoriali reali V e W con dim(V ) = n e
base B = (v1 , v2 , . . . , vn ), con dim(W ) = m e base C = (w1 , w2 , . . . , wm ), si indichi
con A = M B,C (f ) ∈ Rm,n la matrice associata ad un’applicazione lineare f : V −→ W,
rispetto alle basi B e C. Sia X ∈ Rn,1 la matrice colonna delle componenti di un generico
vettore x di V, rispetto alla base B, allora la matrice colonna Y delle componenti del
vettore f (x), rispetto alla base C, è data dall’equazione (6.4):
Y = AX.

Si inizia con l’effettuare un cambiamento di base in V. Sia B 0 = (v10 , v20 , . . . , vn0 ) un’altra
base di V, indicata con X 0 ∈ Rn,1 la matrice colonna delle componenti del vettore x,
rispetto alla base B 0 , le equazioni del cambiamento di base sono:
X = P X 0, (6.6)

dove P è la matrice invertibile di ordine n del cambiamento di base da B a B 0. Si effettua


anche un cambiamento di base in W. Sia C 0 = (w10 , w20 , . . . , wm
0
) un’altra base di W,
indicata con Y 0 ∈ Rm,1 la matrice colonna delle componenti del vettore f (x), rispetto
alla base C 0 , le equazioni del cambiamento di base sono:
Y = QY 0 , (6.7)

dove Q è la matrice invertibile di ordine m del cambiamento di base da C a C 0 . Di


0 0
conseguenza, indicata con A0 = M B ,C (f ) ∈ Rm,n la matrice associata ad f, rispetto alle
basi B 0 e C 0 , le equazioni di f, rispetto a tali basi, sono:
Y 0 = A0 X 0 . (6.8)

Scopo di questo paragrafo è quello di individuare la relazione che intercorre tra le matrici
A e A0 . Sostituendo le equazioni (6.6) e (6.7) in (6.4) si ha:
QY 0 = AP X 0
da cui, tenendo conto che la precedente uguaglianza è valida per ogni X 0 ∈ Rn,1 , segue:
A0 = Q−1AP (6.9)

che stabilisce il legame cercato tra le matrici A e A0 associate all’applicazione lineare f .


Capitolo 6 247

Osservazione 6.2 Le matrici associate ad una applicazione lineare f : V −→ W tra


due spazi vettoriali V e W sono infinite, in quanto le basi di V e di W sono infinite.
Due matrici A e A0 , entrambe appartenenti a Rm,n , rappresentano la stessa applicazione
lineare se e solo se esistono una matrice invertibile P ∈ Rn,n e una matrice invertibile
Q ∈ Rm,m per le quali vale la relazione (6.9).

Nel caso particolare di un endomorfismo f : V −→ V ed effettuando un solo cambia-


mento di base nello spazio vettoriale V, cioè considerando nel dominio e nel codominio
lo stesso cambiamento di base, la (6.9) si riduce a:

A0 = P −1AP. (6.10)

Le matrici di questo tipo rivestono una grande importanza in algebra lineare e hanno una
particolare denominazione, come stabilisce la definizione che segue.

Definizione 6.3 Due matrici quadrate A e A0 , entrambe di ordine n, si dicono simili se


esiste una matrice invertibile P di ordine n tale che A0 = P −1AP.

Le matrici simili sono legate dalle seguenti proprietà.

Teorema 6.3 Matrici simili hanno:

1. determinante uguale,

2. traccia uguale.

Dimostrazione 1. Segue dal Teorema 2.16, punto 2.

2. È già stato dimostrato in (2.13) nel Capitolo 2.

Esercizio 6.3 In R4 sono dati i vettori:

v1 = (1, 2, 0, 1), v2 = (1, 0, 1, 0), v3 = (−1, 0, 0, −2), v4 = (0, 1, 0, −1),

dopo aver verificato che essi costituiscono una base C di R4 , si consideri l’endomorfismo
g di R4 cosı̀ definito:

g(v1 ) = v1 , g(v2 ) = 2v1 + v2 , g(v3 ) = −v2 + v3 , g(v4 ) = v3 .

Si scrivano le matrici associate a g sia rispetto alla base C sia rispetto alla base canonica
B di R4 .
248 Applicazioni Lineari

Soluzione La matrice P, ottenuta mettendo in colonna le componenti dei vettori di C


rispetto alla base B, è la matrice del cambiamento di base da B a C se e solo se ha rango
4, infatti si ha che:  
1 1 −1 0
 2 0 0 1 
P =  0 1

0 0 
1 0 −2 −1
e det(P ) = 1. La matrice associata a g rispetto alla base C è:
 
1 2 0 0
 0 1 −1 0 
A0 = M C,C (g) =   0 0
.
1 1 
0 0 0 0

Da (6.10) segue che la matrice A associata a g , rispetto alla base canonica B di R4 , si


ottiene dal prodotto:
A = P A0 P −1 .

6.3 Immagine e controimmagine di sottospazi vettoriali


Sia f : V −→ W un’applicazione lineare tra due spazi vettoriali reali V e W. In questo
paragrafo si intendono studiare l’immagine mediante f di un generico sottospazio vetto-
riale H di V e la controimmagine mediante f di un generico sottospazio vettoriale K di
W. Si inizia con la seguente definizione.

Definizione 6.4 Sia f : V −→ W un’applicazione lineare tra due spazi vettoriali V e


W e sia H un sottospazio vettoriale di V, il sottoinsieme di W :

f (H) = {f (x) ∈ W | x ∈ H}

prende il nome di immagine del sottospazio vettoriale H mediante f .

È molto facile e intuitivo il teorema che segue, la cui dimostrazione è lasciata al Let-
tore per esercizio ed è una conseguenza delle definizioni di sottospazio vettoriale e di
immagine di un sottospazio vettoriale.

Teorema 6.4 Sia H ⊆ V un sottospazio vettoriale di V, allora l’insieme f (H), imma-


gine del sottospazio vettoriale H mediante un’applicazione lineare f : V −→ W, è un
sottospazio vettoriale dello spazio vettoriale W.
Capitolo 6 249

Se dim(V ) = n e dim(H) = h con h ≤ n, data una base (a1 , a2 , . . . , ah ) di H, allora


ogni vettore x di H si esprime come x = x1 a1 + x2 a2 + . . . + xh ah , con x1 , x2 , . . . , xh
numeri reali. Di conseguenza, per la linearità di f, si ha:

f (x) = x1 f (a1 ) + x2 f (a2 ) + . . . + xh f (ah )

da cui segue che i vettori f (a1 ), f (a2 ), . . . , f (ah ) sono generatori di f (H). In altri
termini:
dim(f (H)) ≤ h.
Per determinare una base di f (H) è sufficiente estrarre una base dal suo sistema di
generatori {f (a1 ), f (a2 ), . . . , f (ah )}.

Esercizio 6.4 Sia f : R3 −→ R4 l’applicazione lineare definita da:

f ((x1 , x2 , x3 )) = (x1 + x2 , 2x1 + x2 + x3 , x1 + x3 , x2 − x3 ),

calcolare una base e la dimensione di f (H), dove:

H = {(x1 , x2 , x3 ) ∈ R3 | x1 + x2 + x3 = 0}.

Soluzione Si verifica che dim(H) = 2 e, rispetto alla base canonica di R3 , una base di
H è data da (a1 , a2 ), con:

a1 = (1, 0, −1), a2 = (0, 1, −1),

allora f (H) è generato dai vettori:

f (a1 ) = (1, 1, 0, 1), f (a2 ) = (1, 0, −1, 2),

scritti rispetto alla base canonica di R4 . Si tratta di due vettori linearmente indipendenti,
pertanto costituiscono una base di f (H) e dim(f (H)) = 2.

Data l’applicazione lineare f : V −→ W tra due spazi vettoriali V e W, come caso


particolare di immagine di un sottospazio vettoriale di V si può considerare il sottospazio
vettoriale di W dato da f (V ), ciò suggerisce la seguente definizione.

Definizione 6.5 Si definisce sottospazio immagine e si indica con im f il sottospazio


vettoriale f (V ) di W.

In generale dim(im f ) ≤ dim(W ) e, in modo naturale, si ha il seguente teorema.

Teorema 6.5 Un’applicazione lineare f : V −→ W tra due spazi vettoriali V e W è


suriettiva se e solo se im f = W.
250 Applicazioni Lineari

Osservazione 6.3 Se f : V −→ W e se dim(V ) = n, data una base B = (v1 , v2 , . . . , vn )


di V, allora:
im f = L(f (v1 ), f (v2 ), . . . , f (vn ))
quindi:
dim(im f ) ≤ dim(V ).
Se dim(W ) = m e C = (w1 , w2 , . . . , wm ) è una base di W, indicata con A la matrice di
Rm,n associata ad f rispetto alle basi B e C , dal Paragrafo 6.1 segue che:
dim(im f ) = dim(C(A)) = rank(A),

dove C(A) indica lo spazio vettoriale delle colonne della matrice A.

Vale anche l’evidente ma importante teorema di seguito enunciato.

Teorema 6.6 Tutte le matrici associate alla stessa applicazione lineare hanno lo stesso
rango. In particolare matrici simili hanno lo stesso rango.

Osservazione 6.4 1. f : V −→ W è suriettiva se e solo se:


rank(A) = dim(W )
dove A è una qualsiasi matrice associata ad f .
2. Non esiste alcuna applicazione lineare suriettiva da R2 in R3 . Perché?

Esercizio 6.5 Si calcoli im f, dove f : R3 −→ R4 è l’applicazione lineare definita


nell’Esercizio 6.4.

Soluzione La matrice associata ad f, rispetto alle basi canoniche di R3 e di R4 , è:


 
1 1 0
 2 1 1 
A=  1 0
;
1 
0 1 −1
riducendo A per colonne si ottiene:

     
1 1 0 1 0 0 1 0 0
 2
 1 1 
 −→  2 −1
 1 
 −→  2 −1
 0 

 1 0 1  C2 → C2 − C 1  1 −1 1  C3 → C3 + C 2  1 −1 0 
0 1 −1 0 1 −1 0 1 0

quindi rank(A) = 2 da cui dim(im f ) = 2. Una base di im f è data dalle due colonne
non nulle della matrice ridotta per colonne, ossia im f = L((1, 2, 1, 0), (0, −1, −1, 1)).
Capitolo 6 251

Osservazione 6.5 Se si riduce per righe una qualsiasi matrice A associata ad un’appli-
cazione lineare f : V −→ W si ottiene una matrice A0 , ridotta per righe, tale che
rank(A) = rank(A0 ) = dim(im f ) ma in generale lo spazio vettoriale C(A) delle co-
lonne di A è diverso dallo spazio vettoriale C(A0 ) delle colonne di A0 . Pertanto ci si deve
ricordare che per determinare una base di im f (e non solo la sua dimensione) si deve
ridurre la matrice A per colonne e non per righe.

Si intende ora discutere il problema analogo al calcolo dell’immagine di un sottospazio


vettoriale del dominio di un’applicazione lineare, ma relativo ad un sottospazio vettoriale
K del codominio. Si deve pertanto enunciare la seguente definizione.

Definizione 6.6 Sia f : V −→ W un’applicazione lineare tra i due spazi vettoriali V


e W. Si definisce controimmagine di un sottospazio vettoriale K di W mediante f il
sottoinsieme di V dato da:

f −1 (K) = {x ∈ V | f (x) ∈ K},

vale a dire l’insieme delle controimmagini di tutti i vettori di K.

Anche in questo caso si può dimostrare un teorema analogo al Teorema 6.4.

Teorema 6.7 La controimmagine f −1 (K) di un sottospazio vettoriale K di W è un


sottospazio vettoriale di V.

Dimostrazione Dalla definizione di sottospazio vettoriale (cfr. Def. 4.2) segue che è
necessario dimostrare che per ogni x1 , x2 ∈ f −1 (K) e per ogni λ, µ ∈ R si ha:

λx1 + µx2 ∈ f −1 (K).

Ciò significa che si deve dimostrare che f (λx1 + µx2 ) è un vettore di K. Per la linearità
di f segue:
f (λx1 + µx2 ) = λf (x1 ) + µf (x2 ).
Poiché x1 , x2 ∈ f −1 (K), le loro immagini f (x1 ) e f (x2 ) appartengono a K, cosı̀ come
la loro somma e il loro prodotto per numeri reali, essendo K un sottospazio vettoriale di
W.

Osservazione 6.6 Si faccia molta attenzione a non confondere (a causa della notazione
usata) il sottospazio vettoriale f −1 (K) con la funzione inversa f −1 (se esiste) di f che
sarà definita nel Paragrafo 6.4.

Esercizio 6.6 In quali casi la controimmagine di un sottospazio vettoriale coincide con


tutto il dominio? Invece è evidente che f −1 (K) = f −1 (K ∩ im f ).
252 Applicazioni Lineari

Esercizio 6.7 Data l’applicazione lineare f : R3 −→ R4 introdotta nell’Esercizio 6.4 si


calcoli la controimmagine del sottospazio vettoriale K di R4 definito da:

K = {(y1 , y2 , y3 , y4 ) ∈ R4 | y1 + y2 = 0}.

Soluzione Il sottospazio vettoriale K è dato da:

K = {(t1 , −t1 , t2 , t3 ) | t1 , t2 , t3 ∈ R},

quindi i vettori x ∈ R3 la cui immagine appartiene a K sono le soluzioni dell’equazione


matriciale AX = Y, con A matrice associata ad f (rispetto alle basi canoniche di R3 e
di R4 ), X matrice colonna delle componenti di x rispetto alla base canonica di R3 e Y
matrice colonna delle componenti, rispetto alla base canonica di R4 , del generico vettore
di K. In questo caso si ha:
   
1 1 0 t1 1 1 0 t1
 2

−t1  −→  0 −1

−3t1
 1 1  R2 → R2 − 2R1  1


 1 0 1 t2   0 −1 1 t2 − t1 
R3 → R3 − R1
0 1 −1 t3 0 1 −1 t3
 
1 1 0 t1
−→  0 1 −1 3t1 
R3 → R3 − R2 
 0

0 0 2t1 + t2

R4 → R4 + R2
0 0 0 t3 − 3t1
da cui si ottiene che il sistema lineare è compatibile se e solo se:

2t1 + t2 = 0,
−3t1 + t3 = 0,

ossia se t2 = −2t1 e t3 = 3t1 con t1 ∈ R.


Si controlli, per esercizio, che le condizioni ottenute coincidono con l’imporre che i vettori
(t1 , −t1 , t2 , t3 ) appartengano a K ∩ im f. Risolvendo il sistema lineare associato alla
matrice ridotta per righe:
 
1 1 0 t1
 0
 1 −1 3t1 

 0 0 0 0 
0 0 0 0
Capitolo 6 253

si ottiene: 
 x1 = t1 − λ
x2 = λ
x3 = −3t1 + λ, λ, t1 ∈ R,

da cui segue:
f −1 (K) = L((−1, 1, 1), (1, 0, −3)).
Si osservi che, in alternativa, in questo caso, si poteva pervenire allo stesso risultato
sostituendo nell’equazione di K : y1 + y2 = 0 le equazioni di f :


 y1 = x1 + x2
y2 = 2x1 + x2 + x3 ,


 y3 = x1 + x3 ,
y4 = x2 − x 3 ,

da cui segue:
3x1 + 2x2 + x3 = 0
che è l’equazione di f −1 (K), rispetto alla base canonica di R3 .

Estremamente importante è il caso particolare della controimmagine del sottospazio vet-


toriale improprio {oW } del codominio, per cui vale la seguente definizione.

Definizione 6.7 Il nucleo di un’applicazione lineare f : V −→ W tra due spazi vetto-


riali V e W è il sottospazio vettoriale di V controimmagine del sottospazio vettoriale
{oW } del codominio W e si indica con:

ker f = {x ∈ V | f (x) = oW }.

Osservazione 6.7 Il fatto che ker f sia un sottospazio vettoriale di V segue dal Teorema
6.7.

Esempio 6.19 Nel caso dell’identità, definita nell’Esempio 6.1, si ha che ker id = {o} e
im id = V.

Esempio 6.20 Nel caso dell’applicazione nulla, definita nell’Esempio 6.2, ker O = V e
im O = {oW }.

Esempio 6.21 L’applicazione lineare definita nell’Esempio 6.6 ha come nucleo il piano
vettoriale ortogonale al vettore a, cioè ker f = L(a)⊥ , mentre im f = R.
254 Applicazioni Lineari

Il calcolo del sottospazio vettoriale im f costituisce un test per valutare l’eventuale su-
riettività dell’applicazione lineare f . Lo studio di ker f , invece, è legato all’iniettività di
f , e precisamente vale il seguente teorema.

Teorema 6.8 Sia f : V −→ W un’applicazione lineare tra gli spazi vettoriali V e W,


f è iniettiva se e solo se ker f = {oV }.

Dimostrazione Se ker f = {oV } si tratta di dimostrare che f è iniettiva, ossia che se


f (x) = f (y), con x, y ∈ V allora x = y. Ma da f (x) = f (y) segue, per la linearità di
f , che f (x − y) = oW , cioè x − y = oV da cui la tesi.
Viceversa, se f è iniettiva e se si suppone che x ∈ ker f , allora f (x) = f (oV ) = oW , da
cui x = oV .

Per il calcolo esplicito di ker f, si consideri la matrice A = M B,C (f ) associata al-


l’applicazione lineare f : V −→ W , rispetto alle basi B = (v1 , v2 , . . . , vn ) di V e
C = (w1 , w2 , . . . , wm ) di W. Per definizione, un vettore x ∈ V appartiene a ker f se
f (x) = oW , che, usando le equazioni dell’applicazione lineare f scritte rispetto alle basi
B e C , equivale a:

AX = O, (6.11)
dove X indica la matrice colonna delle componenti di x rispetto alla base B e O ∈ Rn,1
è la matrice colonna nulla. Quindi calcolare ker f equivale a risolvere il sistema lineare
omogeneo (6.11). Dal Teorema 4.23 segue:
dim(ker f ) = dim(V ) − rank(A). (6.12)

Esempio 6.22 Si calcoli ker f nel caso dell’applicazione lineare introdotta nell’Esercizio
6.4 e studiata anche nell’Esercizio 6.5. Riducendo per righe la matrice A associata ad f ,
rispetto alle basi canoniche di R3 e R4 , si ha:
   
1 1 0 1 1 0
−→
 R2 → R2 − 2R1  0 −1
 2 1 1   1 
A=  1 0  0 −1

1  1 
R3 → R3 − R1
0 1 −1 0 1 −1
 
1 1 0
−→  0 −1 1 
R3 → R3 − R2 
 0

0 0 
R4 → R4 + R2
0 0 0

da cui si ottiene che rank(A) = 2 = dim(im f ), mentre dim(ker f ) = 1 = 3 − 2. Risol-


vendo il sistema lineare omogeneo ridotto associato alla matrice ridotta per righe prima
Capitolo 6 255

ottenuta segue che ker f = L((−1, 1, 1)). Si ricordi che, per determinare esplicitamente
im f , si deve ridurre la matrice A per colonne, come spiegato nell’Esercizio 6.5.

Esercizio 6.8 Sia f : R3 −→ R3 l’endomorfismo definito da:



 f (e1 ) = 2e1
f (e2 ) = e1 + e2 + e3
f (e3 ) = −e1 + e2 − e3 ,

con B = (e1 , e2 , e3 ) base canonica di R3 . Calcolare ker f e im f .

Soluzione La matrice associata ad f, rispetto alla base canonica B di R3 , è:


 
2 1 −1
A= 0 1 1 .
0 1 −1

Poiché det(A) = −4, il rango di A è 3, quindi dim(im f ) = 3, ossia im f = R3 e


dim(ker f ) = 0, da cui ker f = {o}. Quindi f è sia iniettiva sia suriettiva.

Il teorema che segue stabilisce che l’iniettività di un’applicazione lineare f è equivalente


al fatto che dim(f (H)) = dim(H), per ogni sottospazio vettoriale H del dominio.

Teorema 6.9 L’applicazione lineare f : V −→ W tra due spazi vettoriali V e W è


iniettiva se e solo se l’immagine di ogni insieme libero di V è un insieme libero di W.

Dimostrazione Sia f : V −→ W un’applicazione lineare iniettiva e sia {a1 , a2 , . . . , ak }


un insieme di vettori linearmente indipendenti di V, si tratta di dimostrare che l’insieme
di vettori {f (a1 ), f (a2 ), . . . , f (ak )} di W è libero. La tesi segue dalla definizione di vet-
tori linearmente indipendenti e dal Teorema 6.8. Infatti, se si considera la combinazione
lineare:
λ1 f (a1 ) + λ2 f (a2 ) + . . . + λk f (ak ) = oW ,
con λ1 , λ2 , . . . , λk ∈ R, per la linearità di f si ha:

f (λ1 a1 + λ2 a2 + . . . + λk ak ) = oW

e, quindi, per l’iniettività di f segue λ1 = λ2 = . . . = λk = 0.


Viceversa, sia x 6= oV , allora {x} è un insieme libero in V e quindi per ipotesi an-
che l’insieme {f (x)} è un insieme libero. Pertanto f (x) 6= oW , da cui segue che
necessariamente ker f = {oV }, quindi la tesi.
256 Applicazioni Lineari

Definizione 6.8 Dati due spazi vettoriali V e W, un’applicazione lineare f : V −→ W


che sia biiettiva (cioè iniettiva e suriettiva) prende il nome di isomorfismo tra V e W. Se
è possibile definire un isomorfismo tra due spazi vettoriali, questi si dicono isomorfi. Un
endomorfismo f : V −→ V biiettivo prende il nome di automorfismo di V.

Il teorema che segue stabilisce un’importante relazione tra le dimensioni di ker f e di V


ed il rango di una qualunque matrice associata all’applicazione lineare f : V −→ W,
ottenendo in questo modo un’altra dimostrazione del Teorema del Rango 4.19.

Teorema 6.10 – Teorema del Rango – Sia f : V −→ W un’applicazione lineare tra


due spazi vettoriali V e W, allora:

dim(ker f ) + dim(im f ) = dim(V ).

Dimostrazione Si supponga che dim(V ) = n e dim(ker f ) = h ≤ n. Se h = 0 e se


h = n il teorema è dimostrato (perché?). Sia dunque h < n e sia (a1 , a2 , . . . , ah ) una
base di ker f . Usando il Teorema 4.15 si completi tale insieme libero di vettori fino ad
ottenere la base di V (a1 , a2 , . . . , ah , b1 , b2 , . . . , bn−h ). Dall’Osservazione 6.3 si ha che:

{f (a1 ), f (a2 ), . . . , f (ah ), f (b1 ), f (b2 ), . . . , f (bn−h )}

è un sistema di generatori di im f . Poiché f (a1 ) = oW , f (a2 ) = oW , . . . , f (ah ) = oW ,


la tesi segue se si dimostra che C = {f (b1 ), f (b2 ), . . . , f (bn−h )} è un insieme libero di
W e, quindi, una base di im f . Per provare l’indipendenza lineare dei vettori di C si pone:

λ1 f (b1 ) + λ2 f (b2 ) + . . . + λn−h f (bn−h ) = oW ,

con λi ∈ R, i = 1, 2, . . . , n − h, ossia:

f (λ1 b1 + λ2 b2 + . . . + +λn−h bn−h ) = oW ,

da cui segue che il vettore λ1 b1 + λ2 b2 + . . . + +λn−h bn−h appartiene a ker f, come tale
si può scrivere come combinazione lineare dei vettori della base (a1 , a2 , . . . , ah ) di ker f .
Dall’espressione esplicita di tale combinazione lineare e dal fatto che (a1 , a2 , . . . , ah , b1 ,
b2 , . . . , bn−h ) è una base di V segue che λ1 = λ2 = . . . = λn−h = 0, ovvero la tesi.

Osservazione 6.8 Si osservi che, nelle ipotesi del teorema precedente,

dim(ker f ) = dim(N (A)) = n − dim(R(A)),

dove A indica una matrice associata ad f, rispetto ad una base di V e ad una base di
W, N (A) è il nullspace di A e R(A) indica lo spazio vettoriale delle righe di A. Dal
Capitolo 6 257

fatto che dim(im f ) = dim(C(A)), con C(A) spazio vettoriale delle colonne di A, segue
quindi che:
dim(R(A)) = dim(C(A)),
vale a dire il Teorema del Rango 4.19. Infatti ogni matrice A ∈ Rm,n può sempre essere
considerata come associata ad un’applicazione lineare f : Rn −→ Rm , rispetto alle basi
canoniche di Rn e di Rm .

Nel caso particolare di un endomorfismo di V, tutti i risultati man mano ottenuti si


possono riassumere nel seguente teorema, la cui dimostrazione è lasciata per esercizio.

Teorema 6.11 1. Sia f : V −→ W un’applicazione lineare tra due spazi vettoriali


V e W con dim(V ) = dim(W ), allora f è iniettiva se e solo se f è suriettiva.
2. Sia f : V −→ W un’applicazione lineare tra due spazi vettoriali V e W con
dim(V ) = dim(W ), allora:
a. f è un isomorfismo se e solo se ker f = {oV }.
b. f è un isomorfismo se e solo se im f = W.
3. Sia f : V −→ V un endomorfismo di uno spazio vettoriale reale V, allora:
a. f è un automorfismo se e solo se ker f = {oV }.
b. f è un automorfismo se e solo se im f = V.

Osservazione 6.9 Il teorema precedente, il Teorema 6.8 e l’Osservazione 6.4 possono


essere riscritti in termini di una qualsiasi matrice associata ad un’applicazione lineare f
nel modo seguente.
1. Sia f : V −→ W un’applicazione lineare tra due spazi vettoriali V e W, con
dim(V ) = n e sia B = (v1 , v2 , . . . , vn ) una base di V. Sia dim(W ) = m e
sia C = (w1 , w2 , . . . , wm ) una base di W. Si indichi con A ∈ Rm,n la matrice
M B,C (f ) associata a f, rispetto alle basi B e C, allora:
rank(A) = n ⇐⇒ f è iniettiva,
rank(A) = m ⇐⇒ f è suriettiva.

2. Sia f : V −→ W un’applicazione lineare tra due spazi vettoriali V e W tali


che dim(V ) = dim(W ) = n. Sia B = (v1 , v2 , . . . , vn ) una base di V e sia
C = (w1 , w2 , . . . , wn ) una base di W. Si indichi con A ∈ Rn,n la matrice quadrata
M B,C (f ) associata a f, rispetto alle basi B e C, allora:
rank(A) = n ⇐⇒ det(A) 6= 0 ⇐⇒ f è un isomorfismo.
258 Applicazioni Lineari

3. Sia f : V −→ V un’endomorfismo di uno spazio vettoriale V, con dim(V ) = n e


con B = (v1 , v2 , . . . , vn ) base di V. Si indichi con A ∈ Rn,n la matrice quadrata
M B,B (f ) associata a f , rispetto alla base B, allora:

rank(A) = n ⇐⇒ det(A) 6= 0 ⇐⇒ f è un automorfismo.

A completamento, invece, dello studio della controimmagine di un sottospazio vettoriale


mediante un’applicazione lineare, è utile risolvere il seguente esercizio la cui soluzione è
lasciata al Lettore.

Esercizio 6.9 Sia f : V −→ W un’applicazione lineare tra due spazi vettoriali V e W.


Sia K un sottospazio vettoriale di W allora:

1. ker f ⊆ f −1 (K);

2. se K ⊆ im f allora dim(f −1 (K)) = dim(ker f ) + dim(K);

3. in generale dim(f −1 (K ∩ im f )) = dim(ker f ) + dim(K ∩ im f ).

L’ultimo teorema di questo paragrafo stabilisce la condizione necessaria e sufficiente


affinché due spazi vettoriali siano isomorfi.

Teorema 6.12 Due spazi vettoriali sono isomorfi se e solo se essi hanno la stessa dimen-
sione.

Dimostrazione Il fatto che due spazi vettoriali isomorfi abbiano la stessa dimensione
segue in modo evidente dai teoremi precedenti.
Viceversa, si considerino due spazi vettoriali V e W tali che dim(V ) = dim(W ) = n, il
teorema è dimostrato se si è in grado di definire un isomorfismo tra di essi. Fissate dunque
una base B = (v1 , v2 , . . . , vn ) in V e una base C = (w1 , w2 , . . . , wn ) in W, si definisca
f : V −→ W ponendo:

f (v1 ) = w1 , f (v2 ) = w2 , ..., f (vn ) = wn ,

f è un isomorfismo in quanto im f = W .

Osservazione 6.10 Si osservi che, anche nel caso di un endomorfismo f : V −→ V dalla


relazione dim(ker f ) + dim(im f ) = dim(V ) non segue ker f ⊕ im f = V. Si consideri,
per esempio, un endomorfismo f di V tale che f 2 = O con O : V −→ V endomorfismo
nullo, dove f 2 è la composizione f ◦f definita da f 2 (x) = f (f (x)) (cfr. Par. 6.4). Anche
Capitolo 6 259

se non è ancora stato formalmente introdotto il concetto di composizione di applicazioni


lineari la sua definizione è molto naturale. Dati x0 ∈ im f e x ∈ V tali che f (x) = x0 ,
applicando f ad ambo i membri dell’ultima uguaglianza, segue f 2 (x) = f (x0 ) = o,
quindi im f ⊆ ker f . Sia A una matrice associata a f rispetto ad una base di V, poiché
im f = C(A) (dove C(A) indica lo spazio vettoriale generato dalle colonne di A) e
ker f = N (A) (dove N (A) indica il nullspace di A), si è costruito un esempio in cui
C(A) ⊆ N (A). Si tratta, infatti, di un esercizio che completa la trattazione del Teorema
4.24.

Esempio 6.23 Usando le stesse notazioni del Paragrafo 4.3.4, si considerino due basi
B = (v1 , v2 , . . . , vn ) e B 0 = (v10 , v20 , . . . , vn0 ) in uno spazio vettoriale V. Come già
0
osservato nell’Esempio 6.14, la matrice M B,B (id) associata all’identià di V rispetto alla
base B nel dominio e alla base B 0 nel codominio è la matrice del cambiamento di base
da B 0 a B (attenzione allo scambio dell’ordine delle due basi!) Invece se si considera
l’applicazione lineare:
p : V −→ V, vi 7−→ vi0 , i = 1, 2, . . . , n,
si ottiene, dalla sua definizione, che p è un automorfismo di V (cfr. Teor. 6.12). La
matrice ad essa associata, rispetto alla base B sia nel dominio sia nel codomino, è la
0
matrice del cambiamento di base P = M B,B , ottenuta, infatti, ponendo in colonna le
componenti dei vettori della base B 0 rispetto ai vettori della base B. Si osservi, invece,
che la matrice associata all’applicazione lineare p rispetto alla base B nel dominio e alla
base B 0 nel codominio è la matrice unità I di ordine n anche se p non è l’applicazione
lineare identica. Si vuole in questo esempio approfondire il legame tra le equazioni del
cambiamento di base da B a B 0 e le equazioni dell’automorfismo p, riferite alla matrice
P ad esso associata. Si ricordi che (cfr. Par. 4.3.4), dato un vettore x di V le sue
componenti:  
x1
 x2 
X =  .. ,
 
 . 
xn
scritte rispetto alla base B, e le sue componenti:
 
x01
 x0 
0  2
X =  .. ,

 . 
x0n
scritte rispetto alla base B 0 , sono legate dalle equazioni del cambiamento di base:
X = P X 0. (6.13)
260 Applicazioni Lineari

D’altra parte, l’immagine del vettore x mediante l’automorfismo p è il vettore:


 
v1
 v2 

p(x) = y1 y2 . . . yn  .. 
 . 
vn

tale che:
Y = P X, (6.14)
dove:  
y1
 y2 
Y = .
 
..
 . 
yn
Si osservi che le equazioni (6.13) e (6.14) sono in perfetto accordo in quanto:

p(x) = y1 v1 + y2 v2 + . . . + yn vn
= p(x1 v1 + x2 v2 + . . . + xn vn )
= x1 p(v1 ) + x2 p(v2 ) + . . . + xn p(vn )
= x1 v10 + x2 v20 + . . . + xn vn0 ,

ossia (x1 , x2 , . . . , xn ) sono le componenti di p(x) rispetto alla base B 0 e (y1 , y2 , . . . , yn )


sono le componenti di p(x) rispetto alla base B.

6.4 Operazioni tra applicazioni lineari


In questo paragrafo si inizia con il dimostrare che l’insieme delle applicazioni lineari tra
due spazi vettoriali reali V e W :

L(V, W ) = {f : V −→ W | f è un’applicazione lineare}

è uno spazio vettoriale reale. Infatti, date f, g ∈ L(V, W ), si definisce somma di f e di g


la funzione data da:
(f + g)(x) = f (x) + g(x),
per ogni x ∈ V. La funzione f + g è ancora un elemento di L(V, W ), la verifica è lascia-
ta per esercizio. Si dimostra anche facilmente che per la somma di applicazioni lineari
appena definita valgono le proprietà commutativa ed associativa. Esiste, inoltre, l’elemen-
to neutro rispetto alla somma di applicazioni lineari dato dall’applicazione lineare nulla
Capitolo 6 261

O definita nell’Esempio 6.2 e l’applicazione lineare opposta di f ∈ L(V, W ), data da


(−f )(x) = −f (x), con x ∈ V.

In modo altrettanto naturale, è possibile definire il prodotto di un numero reale λ per una
applicazione lineare f ∈ L(V, W ) come:

(λf )(x) = λf (x),

per ogni x ∈ V. Si verifica che tale prodotto λf è ancora un’applicazione lineare per cui
valgono le quattro proprietà di definizione di prodotto di un numero reale per un vettore
(la verifica è un facile esercizio). Segue che L(V, W ) è un esempio di spazio vettoriale
su R.

Siano dim(V ) = n e B = (v1 , v2 , . . . , vn ) una base di V. Inoltre, siano dim(W ) = m e


C = (w1 , w2 , . . . , wm ) una base di W. Siano A = M B,C (f ) ∈ Rm,n la matrice associata
a f e B = M B,C (g) ∈ Rm,n la matrice associata a g, è un esercizio dimostrare che A + B
è la matrice associata a f + g, rispetto alle basi B e C. Inoltre λA è la matrice associata a
λf, rispetto alle basi B e C. Fissate le basi B di V e C di W viene cosı̀ definita, in modo
naturale, la funzione:

φ : L(V, W ) −→ Rm,n , f 7−→ M B,C (f ),

ossia φ è la funzione che associa ad ogni applicazione lineare f la matrice associata ad f


(rispetto alle basi B e C del dominio e del codominio). È di nuovo un esercizio verificare
che φ è un isomorfismo, quindi segue dal Teorema 6.12 che:

dim(L(V, W )) = mn. (6.15)

Ci si occuperà ora della composizione di due applicazioni lineari opportunamente definite.


Sia f : V −→ W un’applicazione lineare tra due spazi vettoriali V e W. Ponendo
dim(V ) = n e B = (v1 , v2 , . . . , vn ) base di V, dim(W ) = m e C = (w1 , w2 , . . . , wm )
base di W, si indichi con A ∈ Rm,n la matrice associata ad f rispetto alle basi B e C .
Sia g : W −→ Z un’altra applicazione lineare tra gli spazi vettoriali W e Z. Posto
dim(Z) = p e D = (z1 , z2 , . . . , zp ) una base di Z, si indichi con B in Rp,m la matrice
associata a g rispetto alle basi C e D. La funzione:

g ◦ f : V −→ Z, x 7−→ g(f (x))

prende il nome di composizione delle applicazioni lineari f e g. È un facile esercizio


verificare che g ◦ f è un’applicazione lineare. Si vuole, quindi, determinare la matrice
ad essa associata, rispetto alle basi B e D. Le equazioni dell’applicazione lineare f sono
Y = AX , dove X indica la matrice colonna di Rn,1 delle componenti del generico vettore
262 Applicazioni Lineari

x di V rispetto alla base B e Y indica la matrice colonna di Rm,1 delle componenti di


f (x) rispetto alla base C . Calcolando l’immagine di f (x) mediante g si ottiene Z = BY
dove Z indica la matrice colonna di Rp,1 delle componenti di g(f (x)), rispetto alla base
D, sostituendo si ha:
Z = BY = BAX,
quindi la matrice C ∈ Rp,n associata a g ◦ f , rispetto alle basi B e D è data dal prodotto:

C = BA. (6.16)

Osservazione 6.11 Questo risultato costituisce un’altra giustificazione della definizio-


ne di prodotto di matrici (righe per colonne) introdotto nel Capitolo 2 e permette di
dimostrare in modo alternativo a quanto visto nel Paragrafo 4.5.1 la relazione:

rank(BA) ≤ min(rank(B), rank(A)).

Infatti, se f, g sono le applicazioni lineari rappresentate dalle matrici A e B si ha che il


prodotto BA, come è stato appena dimostrato, è la matrice associata alla composizione
g ◦ f . Dall’inclusione, di facile dimostrazione, im(g ◦ f ) ⊂ im g , si ottiene:

rank(BA) = dim(im(g ◦ f )) ≤ dim(im g) = rank(B).

Inoltre, dall’inclusione, anch’essa facilmente dimostrabile, ker f ⊂ ker(g ◦ f ) e grazie al


Teorema del Rango 6.10 si ottiene l’altra disuguaglianza:

rank(BA) = dim(im(g ◦ f )) ≤ dim(im f ) = rank(A).

Esercizio 6.10 Si considerino gli spazi vettoriali R2 , R3 , R4 riferiti alle rispettive basi
canoniche B, B 0 , B 00 . Date le applicazioni lineari:
 
0 1 −1 2
f : R3 −→ R2 , con A = M B ,B (f ) = ,
1 −2 3
 
4 2 B00 ,B −3 −4 3 0
g : R −→ R , con B = M (g) = ,
−5 −9 4 −1

determinare, se esiste, un’applicazione lineare h : R4 −→ R3 tale che f ◦ h = g .

Soluzione All’applicazione lineare h (rispetto alla basi canoniche del dominio e del
codominio) si associa una matrice X ∈ R3,4 , tale che AX = B . Si tratta, quindi, di
risolvere l’equazione matriciale cosı̀ ottenuta usando il metodo descritto nel Capitolo 2.
Capitolo 6 263

Nel caso particolare di L(V, V ), ossia dello spazio vettoriale degli endomorfismi di V,
a volte anche indicato con il simbolo End(V ), la composizione di due endomorfismi è
un’operazione interna, per cui vale la proprietà associativa, esiste l’elemento neutro (l’ap-
plicazione lineare identica) ma non vale la proprietà commutativa. Da nozioni elementari
di algebra segue che una funzione è invertibile se e solo se è una biiezione. Si supponga
che f ∈ End(V ) sia una biiezione, ossia che f sia un automorfismo di V, esiste allora la
funzione inversa f −1 di f definita come l’unica funzione per cui:
f −1 ◦ f = f ◦ f −1 = id,
con id identità di V. Nel caso degli automorfismi di End(V ) si può dimostrare il seguente
teorema.

Teorema 6.13 Sia V uno spazio vettoriale reale.


1. Se f è un automorfismo di V, anche f −1 è un automorfismo di V.
2. Se f e g sono automorfismi di V, la loro composizione g ◦ f è ancora un automor-
fismo di V, inoltre:
(g ◦ f )−1 = f −1 ◦ g −1 . (6.17)

Dimostrazione Per dimostrare 1. è sufficiente dimostrare che f −1 è un endomorfismo


di V, ossia che per ogni x1 , x2 ∈ V e per ogni λ, µ ∈ R allora:
f −1 (λx1 + µx2 ) = λf −1 (x1 ) + µf −1 (x2 ).
Ma l’uguaglianza è vera perché se si applica f ad ambo i membri si ha:
f (f −1 (λx1 + µx2 )) = f (λf −1 (x1 ) + µf −1 (x2 )) = λf (f −1 (x1 )) + µf (f −1 (x2 )).
La tesi segue dalla definizione di inversa di una funzione, dal fatto che una funzione
invertibile è necessariamente iniettiva e dalla linearità di f.
Per dimostrare 2. tenendo conto che la composizione di due endomorfismi è un endomor-
fismo, è sufficiente dimostrare che g ◦ f è iniettivo. Ma per l’iniettività di f e di g , si ha
(g ◦ f )(x) = o se e solo se x = o. La dimostrazione di (6.17) è lasciata al Lettore per
esercizio.

Osservazione 6.12 1. Più in generale, se f : V −→ W è una biezione tra due spa-


zi vettoriali V e W diversi, si può ugualmente introdurre il concetto di funzione
inversa f −1 come l’unica funzione f −1 : W −→ V tale che
f −1 ◦ f = idV , f ◦ f −1 = idW ,
dove idV e idW indicano, rispettivamente, l’identità di V e l’identità di W. Se f
è un isomorfismo si dimostra, come nel teorema precedente, che f −1 è ancora un
isomorfismo.
264 Applicazioni Lineari

2. Dal fatto che la matrice associata alla composizione di due applicazioni lineari è
il prodotto delle matrici associate alle due applicazioni lineari (scegliendo oppor-
tunamente le basi nel dominio e nel codominio) segue che all’applicazione lineare
inversa di f è associata la matrice inversa a quella associata ad f (rispetto alla
stessa scelta di basi in V ). Si noti l’assoluto accordo tra risultati noti sull’esistenza
dell’inversa di una matrice quadrata (rango massimo) e sull’esistenza dell’inverso di
un endomorfismo (biiettività quindi rango massimo della matrice associata). Si os-
servi, inoltre, che la relazione (6.17) corrisponde alla relazione (BA)−1 = A−1 B −1
(cfr. Teor. 2.6) se si considera A matrice associata ad f e B matrice associata a g .

Esercizio 6.11 Sia f : V −→ W un isomorfismo tra due spazi vettoriali reali V e W.


Data una base C = (w1 , w2 , . . . , wn ) di W dimostrare che esiste una base B di V tale
che la matrice associata ad f rispetto alle basi B e C sia la matrice unità I di ordine n.

Soluzione La base B è data da:

B = (f −1 (w1 ), f −1 (w2 ), . . . , f −1 (wn )),

dove per f −1 indica l’isomorfismo inverso di f. La dimostrazione del fatto che B sia una
base di V e che M B,C (f ) = I è lasciata al Lettore per esercizio.

Esempio 6.24 Si consideri la rotazione R[θ] : V2 −→ V2 in senso antiorario di angolo θ


di ogni vettore x del piano vettoriale V2 . Nel Paragrafo 3.8 è stata determinata la matrice
del cambiamento di base da una base ortonormale B = (i, j) di V2 alla base ortonormale
B 0 = (i0 , j0 ) ottenuta a partire dalla base B mediante la rotazione di angolo θ. Pertanto la
matrice associata a R[θ], rispetto alla base B, coincide con la matrice del cambiamento
di base, ossia:  
B,B cos θ − sin θ
M (R[θ]) = ,
sin θ cos θ
mentre le equazioni della rotazione R[θ], che applicata ad un vettore x = xi+yj permette
di ottenere il vettore R[θ](x) = x0 i + y 0 j, sono:

x0 = x cos θ − y sin θ


y 0 = x sin θ + y cos θ.

Si lascia per esercizio la verifica del fatto che la composizione delle rotazioni R[θ1 ] e
R[θ2 ], rispettivamente di angoli θ1 e θ2 , è la rotazione R[θ1 + θ2 ]. La rotazione R[θ] è un
automorfismo di V2 per ogni valore dell’angolo θ, si verifichi per esercizio che l’inversa
della rotazione R[θ] è la rotazione R[−θ].
Capitolo 6 265

L’insieme delle rotazioni del piano vettoriale V2 , studiate nell’esempio precedente, è un


esempio di gruppo commutativo (cfr. Oss. 2.2). Esso è in generale indicato come SO(2)
e denominato gruppo ortogonale speciale di ordine 2 (cfr. (5.10)):
  
cos θ − sin θ 2,2
SO(2) = {R[θ] | θ ∈ [0, 2π)} = ∈R | θ ∈ [0, 2π) .
sin θ cos θ
In particolare, esso è un sottogruppo del gruppo O(2) delle matrici ortogonali di ordine
2, dove è chiaro che un sottogruppo di un gruppo è un sottoinsieme chiuso rispetto al-
l’operazione del gruppo e contenente l’inverso di ogni suo elemento (cfr. Oss. 4.5 per la
nozione di sottogruppo).

Dato uno spazio vettoriale reale V, l’insieme degli automorfismi di V, indicato come:

GL(V, R) = {f : V −→ V | f è un automorfismo}

è un gruppo rispetto alla composizione di automorfismi e, in generale, non è commutativo.


Se dim(V ) = n e fissata una base B in V allora si può stabilire, in modo naturale, la
corrispondenza biunivoca tra GL(V, R) ed il gruppo lineare generale reale GL(n, R) (cfr.
Oss. 2.7) che associa ad ogni f ∈ GL(V, R) la matrice A = M B,B (f ). Tale biiezione
è un automorfismo in quanto alla composizione di automorfismi si associa il prodotto di
matrici e all’inverso di un automorfismo si associa l’inversa della matrice. Un importante
sottogruppo di GL(n, R) è il gruppo ortogonale O(n) delle matrici ortogonali di Rn.n ,
definito in (2.9). Per approfondimenti sull’argomento e maggiori dettagli si rimanda a
testi classici di teoria dei gruppi, quali ad esempio [2] e [13].

6.5 Sottospazi vettoriali invarianti


Sia f : V −→ V è un endomorfismo di uno spazio vettoriale reale V, il nucleo di f, ker f,
gode di un’interessante proprietà in quanto l’immagine di ogni suo elemento è ancora un
elemento di ker f , ossia:
f (ker f ) ⊆ ker f,
infatti si ha banalmente f (ker f ) = {o}. Lo studio dei sottospazi vettoriali di V per cui
vale lo stesso tipo di proprietà rivestirà una grande importanza nel capitolo successivo, è
giustificata quindi la definizione che segue.

Definizione 6.9 Sia f : V −→ V un endomorfismo di uno spazio vettoriale V e sia H


un sottospazio vettoriale di V, H si dice invariante per f se f (H) ⊆ H.

Osservazione 6.13 La definizione precedente è ragionevole solo nel caso di un endomor-


fismo, infatti se f è un’applicazione lineare f : V −→ W, tra due spazi vettoriali V e W
266 Applicazioni Lineari

diversi, non ha senso confrontare un sottospazio vettoriale H di V con la sua immagine


f (H).

Per i sottospazi vettoriali invarianti vale la seguente proprietà, la cui dimostrazione è


lasciata al Lettore per esercizio.

Teorema 6.14 Sia f un endomorfismo di uno spazio vettoriale V. Se H1 , H2 , . . . , Hk


sono sottospazi vettoriali di V invarianti per f, allora la loro somma H1 + H2 + . . . + Hk
è un sottospazio vettoriale di V invariante per f .

Esercizio 6.12 Sia f : V3 −→ V3 l’endomorfismo, la cui matrice associata, rispetto ad


una base ortonormale positiva B = (i, j, k) di V3 , è:
 
cos θ − sin θ 0
A=  sin θ cos θ 0 .
0 0 1

Si descriva il significato geometrico di f e si dimostri che il piano L(i, j) è un sottospazio


vettoriale di V3 invariante per f.

Esercizio 6.13 Sia f : R3 −→ R3 un endomorfismo tale che f 3 = f ◦ f ◦ f = O


e per cui f 2 6= O, dove O indica l’applicazione nulla di R3 . Si dimostri che ker(f 2 )
è un sottospazio vettoriale invariante per f . Per svolgere l’esercizio si tenga conto che
ker f ⊆ ker(f 2 ) e che f 3 (x) = (f ◦ f 2 )(x), x ∈ V.

Data un’applicazione lineare f : V −→ W tra due spazi vettoriali V e W ed un sotto-


spazio vettoriale H del dominio, si introduce in modo naturale il concetto di restrizione
di f a H nel modo seguente.

Definizione 6.10 Sia f : V −→ W un’applicazione lineare tra due spazi vettoriali V e


W, sia H un sottospazio vettoriale di V, la restrizione di f a H è la funzione:

f |H : H −→ W, x 7−→ f (x).

Il teorema che segue si ottiene in modo evidente dalla definizione di restrizione di un’ap-
plicazione lineare e dalla definizione di sottospazio vettoriale invariante per un endomor-
fismo.

Teorema 6.15 1. La restrizione di un’applicazione lineare f : V −→ W tra due spa-


zi vettoriali V e W ad un sottospazio vettoriale H di V è ancora un’applicazione
lineare.
Capitolo 6 267

2. La restrizione di un endomorfismo f : V −→ V ad un sottospazio vettoriale H di


V invariante per f è ancora un endomorfismo:

f |H : H −→ H

tale che:
f |H (x) = f (x), x ∈ H. (6.18)

Esercizio 6.14 Verificare che la restrizione f |H di un endomorfismo f di uno spazio


vettoriale reale V a H = ker f è l’applicazione lineare nulla su H.

Esercizio 6.15 Sia f : R4 −→ R3 l’applicazione lineare definita da:

f ((x1 , x2 , x3 , x4 )) = (3x1 + 5x2 + x3 + 2x4 , 3x1 + 5x2 + 3x3 + 4x4 , x3 + x4 );

si consideri l’iperpiano vettoriale H di R4 di equazione x1 + x2 + x3 − x4 = 0. Verificare


che l’insieme B = {(1, 0, 0, 1), (0, 1, 0, 1), (0, 0, 1, 1)} è una base di H e scrivere la ma-
trice A0 della restrizione di f ad H, rispetto alla base B del dominio e alla base canonica
del codominio.

Soluzione L’iperpiano vettoriale H ha dimensione 3, si verifica facilmente che B è


una sua base in quanto i vettori di B appartengono ad H e sono linearmente indipendenti.
La matrice A associata all’applicazione lineare f rispetto alle basi canoniche di R4 e di
R3 è:
 
3 5 1 2
A =  3 5 3 4 .
0 0 1 1
Le immagini dei vettori di B mediante f sono:

   
 1     0   
3 5 1 2   5 3 5 1 2   7
 3 5 3 4   0  =  7 ,  3 5 3 4   1  =  9 ,
 0   0 
0 0 1 1 1 0 0 1 1 1
1 1
 
 0   
3 5 1 2   3
 3 5 3 4   0  =  7 .
 1 
0 0 1 1 2
1

Segue, quindi, che la matrice A0 richiesta è:


268 Applicazioni Lineari

 
5 7 3
A0 =  7 9 7 .
1 1 2

6.6 Applicazione lineare aggiunta


Endomorfismi autoaggiunti
Siano (V, · ) e (W, · ) due spazi vettoriali euclidei e sia f : V −→ W un’applicazione
lineare. Tramite i prodotti scalari definiti su V e su W è possibile introdurre una nuova
applicazione lineare da W a V nel modo seguente.

Teorema 6.16 Siano (V, · ) e (W, · ) due spazi vettoriali euclidei di dimensione n e m,
rispettivamente. Data un’applicazione lineare f : V −→ W, esiste un’unica applicazio-
ne lineare:
f † : W −→ V,
detta applicazione lineare aggiunta di f , tale che:
f (x) · y = x · f † (y), x ∈ V, y ∈ W. (6.19)
Inoltre, se B = (v1 , v2 , . . . , vn ) e C = (w1 , w2 , . . . , wm ) sono basi ortonormali di V e
W rispettivamente, le matrici associate a f e f † verificano la seguente relazione:
M C,B (f † ) = t (M B,C (f )),
ossia la matrice associata a f † , rispetto alle basi ortonormali B e C, è la trasposta della
matrice associata a f rispetto alle stesse basi in ordine scambiato.

Dimostrazione La relazione (6.19) permette di dimostrare che f † è una funzione. In-


fatti, per ogni y ∈ W esiste ed è unico f † (y), in quanto fissato x ∈ V, il primo membro
di (6.19) è ben determinato. Inoltre f † è un’applicazione lineare, la verifica è un fa-
cile esercizio che segue dalla linearità di f e dalle proprietà del prodotto scalare. Sia
A = M B,C (f ) la matrice associata a f rispetto alle basi ortonormali B e C e siano
x = x1 v1 + x2 v2 + . . . + xn vn ∈ V, y = y1 w1 + y2 w2 + . . . + ym wm ∈ W. Per
l’ortonormalità di C si ha:
f (x) · y = t (AX)Y = tX tA Y,
dove X e Y sono le matrici colonna con elementi le componenti di x e di y rispettiva-
mente. Se si indicano con Z la matrice colonna con elementi le componenti di z = f † (y)
rispetto alla base B, per l’ortonormalità di B e dall’uguaglianza (6.19), si ottiene:
t
X tA Y = x · z = tX Z,
Capitolo 6 269

per ogni X , Y e Z , da cui Z = tA Y. Quindi si ha che la matrice associata a f † è


M C,B (f † ) = tA.

Osservazione 6.14 1. Come conseguenza del precedente teorema e dell’Osservazione


4.26 si ha dim(im f ) = dim(im f † ).

2. Dalla definizione di applicazione lineare aggiunta segue che (f † )† = f.

3. Se le basi B e C non sono ortonormali, la relazione tra le matrici associate a f e f †


è più complicata.

Esercizio 6.16 Siano (V, · ) e (W, · ) due spazi vettoriali euclidei. Verificare che, se
f : V −→ W è un’applicazione lineare e f † : W −→ V è l’applicazione lineare
aggiunta di f , allora:

1. V = im f † ⊕ ker f,

2. W = im f ⊕ ker f † ,

3. im f † = (ker f )⊥ ,

4. im f = (ker f † )⊥ .

Esercizio 6.17 Verificare che, se f, g sono endomorfismi di uno spazio vettoriale eucli-
deo (V, · ), allora:
(g ◦ f )† = f † ◦ g †
e che se f è invertibile, allora:
(f −1 )† = (f † )−1 .

Nel caso di un endomorfismo f di uno spazio vettoriale euclideo V ha senso confrontare


f con la propria applicazione lineare aggiunta f † ed è pertanto naturale enunciare la
seguente definizione.

Definizione 6.11 Sia f un endomorfismo di uno spazio vettoriale euclideo (V, · ), f si


dice autoaggiunto (o simmetrico), se f † = f , ossia se:

f (x) · y = x · f (y), x, y ∈ V.
270 Applicazioni Lineari

Esempio 6.25 Si consideri lo spazio vettoriale euclideo (R2 , · ) dotato del prodotto sca-
lare standard. L’endomorfismo

f : R2 −→ R2 , (x, y) 7−→ (y, x + 2y)

è autoaggiunto. Infatti:

f ((x, y)) · (x0 , y 0 ) = (y, x + 2y) · (x0 , y 0 ) = yx0 + xy 0 + 2yy 0 ,


(x, y) · f ((x0 , y 0 )) = (x, y) · (y 0 , x0 + 2y 0 ) = xy 0 + yx0 + 2yy 0 ,

per ogni (x, y), (x0 , y 0 ) appartenenti a R2 .

Esempio 6.26 Un esempio importante di endomorfismo autoaggiunto di uno spazio vet-


toriale euclideo (V, · ) è la proiezione ortogonale p su un sottospazio vettoriale W di V
(cfr. Es. 6.10). Infatti, posto p(x) = xW , si ha:

p(x) · y = xW · (yW + yW ⊥ ) = xW · yW = x · p(y),

per ogni x, y in V.

Teorema 6.17 Sia f un endomorfismo di uno spazio vettoriale euclideo (V, · ) di dimen-
sione n e sia B una base ortonormale di V. L’endomorfismo f è autoaggiunto se e solo
se la matrice A = M B,B (f ) ∈ Rn,n è simmetrica.

Dimostrazione Poiché la base B è ortonormale, dal Teorema 6.16 si ottiene che


M (f ) = A. Pertanto f = f † se e solo se tA = A, ossia se e solo se la matrice
B,B † t

A è simmetrica.

Osservazione 6.15 Si osservi che dal Teorema 6.17 segue che la matrice associata ad un
endomorfismo autoaggiunto f : V −→ V di uno spazio vettoriale euclideo (V, · ) di
dimensione n, rispetto ad una base B di V, è simmetrica solo se la base B è ortonormale.
Infatti, se si considera un’altra base C di V, allora si ha che la matrice associata a f
rispetto a C è A0 = P −1 AP, con P matrice del cambiamento di base da B a C. In
generale, A0 non è simmetrica nonostante A lo sia, in quanto
t
A0 = t (P −1 AP ) = t P tA t (P −1 ) = t P A t (P −1 )

che non coincide con A0 a meno che tP = P −1 , ovvero a meno che P sia una matrice
ortogonale. In altri termini, affinché A0 sia simmetrica, anche la base C deve essere
ortonormale (cfr. Teor. 5.6).
Capitolo 6 271

Osservazione 6.16 Nel caso della proiezione ortogonale p su un sottospazio vettoriale


W di uno spazio vettoriale euclideo, considerata nell’Esempio 6.26, si ha non solo che
W è invariante per p (cfr. Def. 6.9) ma lo è anche il suo complemento ortogonale. Infatti
se x ∈ W ⊥ allora p(x) = o.

Vale il seguente teorema che estende la precedente osservazione ad ogni endomorfismo


autoaggiunto e ad ogni sottospazio vettoriale invariante.

Teorema 6.18 Se f è un endomorfismo autoaggiunto di uno spazio vettoriale eucli-


deo (V, · ) e se W è un sottospazio vettoriale di V invariante rispetto a f, anche il
complemento ortogonale W ⊥ di W è invariante rispetto a f .

Dimostrazione Per ogni x ∈ W ⊥ e per ogni y ∈ W si ha:

f (x) · y = x · f (y) = 0,

poiché f (y) ∈ W per ipotesi. Quindi f (x) è ortogonale a tutti gli elementi di W e perciò
appartiene a W ⊥ .

Esercizio 6.18 Sia V uno spazio vettoriale euclideo e siano W1 , W2 due suoi sottospazi
vettoriali supplementari, ossia V = W1 ⊕ W2 . Si considerino i due endomorfismi f1
e f2 di V, proiezioni su W1 e su W2 rispettivamente. Vale a dire, se per ogni x in V,
x = x1 + x2 , (x1 ∈ W1 e x2 ∈ W2 ) allora si ha f1 (x) = x1 e f2 (x) = x2 (cfr. Es. 6.10).
Dire se e quando f1 e f2 sono endomorfismi autoaggiunti.

6.7 Esercizi di riepilogo svolti


Esercizio 6.19 In R3 , rispetto alla base canonica B = (e1 , e2 , e3 ), si consideri l’endo-
morfismo f definito, al variare di un parametro reale h, da:

 f (e1 ) = e1 + 2e2 − e3
f (e2 ) = −e1 + 2e2
f (e3 ) = 3e1 + he2 + (h + 1)e3 .

Determinare:

1. la matrice A associata ad f, rispetto alla base B;

2. l’espressione dell’immagine di un generico vettore di R3 ;

3. per quali valori di h f è un automorfismo;


272 Applicazioni Lineari

4. nel caso di h = −2 una base di ker f ed una base di im f ;


5. la matrice associata all’automorfismo f −1 , rispetto alla base B, nei casi in cui ciò
sia possibile.
Soluzione 1. È necessario osservare che le condizioni date definiscono un unico endo-
morfismo f, in quanto sono state assegnate le immagini dei vettori della base B.
(Perché?) Per costruzione, la matrice A associata ad f, rispetto alla base B, si ot-
tiene scrivendo in colonna, ordinatamente, le componenti dei vettori immagine dei
vettori della base, pertanto:
 
1 −1 3
A = M B,B (f ) =  2 2 h .
−1 0 h+1

2. Se x = x1 e1 + x2 e2 + x3 e3 è un generico vettore di R3 , allora la sua immagine


f (x) = y1 e1 + y2 e2 + y3 e3 si ottiene mediante le equazioni di f scritte rispetto alla
base B, vale a dire: 
 y1 = x1 − x2 + 3x3
y2 = 2x1 + 2x2 + hx3
y3 = −x1 + (h + 1)x3 .

3. L’endomorfismo f è un automorfismo se e solo se il rango della matrice A è massi-


mo, o, in modo equivalente, se e solo se det(A) 6= 0. Dal calcolo del determinante
della matrice A si ottiene det(A) = 5h + 10, di conseguenza f è un automorfismo
per ogni valore di h ad eccezione di h = −2.
4. Dal punto precedente segue che per h = −2 l’endomorfismo f non è un automor-
fismo. Riducendo la matrice A per righe si ha:
   
1 −1 3 1 −1 3
−→
A =  2 2 −2   1 1 −1 
R2 → (1/2)R2
−1 0 −1 −1 0 −1
 
1 −1 3
−→  2 0 2 ,
R2 → R2 + R1
−1 0 −1

da cui segue che rank(A) = 2, perciò dim(im f ) = 2 e dim(ker f ) = 1. Una


base del nucleo di f si ottiene risolvendo il sistema lineare omogeneo associato
alla matrice ridotta per righe ottenuta da A, ossia:

x1 − x2 + 3x3 = 0
x1 + x3 = 0,
Capitolo 6 273

le cui soluzioni sono (x1 = t, x2 = −2t, x3 = −t), con t ∈ R, perciò:

ker f = L((1, −2, −1)).

Una base di im f è formata da due colonne linearmente indipendenti della matrice


A, per esempio:
im f = L((1, 2, −1), (−1, 2, 0)).

5. Esiste f −1 se e solo se f è un automorfismo, ossia se e solo se h 6= −2. In questi


casi, la matrice associata a f −1 , rispetto alla base B, è A−1 data da:

2(1 + h) 1+h 6+h


 

 5(2 + h) 5(2 + h) 5(2 + h) 
 
 
 2 + 3h 4+h 6−h 
A−1 = − .
 
 5(2 + h) 5(2 + h) 5(2 + h) 
 
 
 2 1 4 
5(2 + h) 5(2 + h) 5(2 + h)

Esercizio 6.20 Nello spazio vettoriale R3 siano B la base canonica e B 0 = (u1 , u2 , u3 )


la base formata dai vettori u1 = (1, 2, −3), u2 = (0, −1, 1), u3 = (2, 1, 0) e, nello
spazio vettoriale R4 , sia C la base canonica. Data l’applicazione lineare f : R3 −→ R4
definita, per ogni parametro k reale, ponendo:

f (u1 ) = (1, 2, k, 1), f (u2 ) = (0, 2, 0, k), f (u3 ) = (0, 4, 0, 2),

1. scrivere la matrice A0 associata ad f rispetto alle basi B 0 e C ;

2. scrivere la matrice A associata ad f rispetto alle basi B e C ;

3. stabilire per quali valori di k l’applicazione lineare f non è iniettiva e determinare


in questi casi una base di ker f ;

4. stabilire per quali valori di k l’applicazione lineare è suriettiva;

5. posto k = 1, determinare la dimensione e una base di f −1 (K) con K = L(a.b),


dove a = (0, 1, 0, −1), b = (1, 4, 1, 3).
274 Applicazioni Lineari

Soluzione 1. La matrice A0 associata ad f, rispetto alle basi B 0 e C, si ottiene, per


costruzione, scrivendo in colonna le componenti, rispetto alla base C , dei vettori
immagine mediante f degli elementi di B 0 , pertanto:

 
1 0 0
0 2 2 4 
A0 = M B ,C (f ) = 

.
 k 0 0 
1 k 2

2. Sia P la matrice del cambiamento di base da B a B 0 , ottenuta ponendo in colonna


le componenti dei vettori della base B 0 rispetto alla base B, ossia:
 
1 0 2
P =  2 −1 1 .
−3 1 0

Dal Paragrafo 6.2 segue che A0 = AP, da cui:


  1 2 2

1 2 2
 
1 0 0 − −
   3 −3 −3   3 3 3 
  
 2 2 4  −4 −2
 
  4 
  1 −2 −1  
A = A0 P −1

= = .


  k 2k 2k
 k 0 0  
  − −
  
 
  1 1 1   3 3 3 
1 k 2 3 3 3 1 + k −2k −k

3. Riducendo per righe la matrice A si ottiene:

a. rank(A) = 3 se e solo se k 6= 1, in questo caso f è iniettiva.


b. rank(A) = 2 se e solo se k = 1, in questo caso dim(ker f ) = 1 e una base di
ker f è data dal vettore (−2, −3, 2).

4. f non può essere suriettiva, in quanto dim(ker f ) + dim(im f ) = dim(R3 ) = 3.


Per stabilire l’esatta dimensione di im f, come nel punto precedente, è necessario
distinguere due casi:

a. se k 6= 1, allora dim(im f ) = rank(A) = 3, le tre colonne della matrice A


sono linearmente indipendenti e formano, quindi, una base di im f.
b. se k = 1 allora dim(im f ) = rank(A) = 2, per esempio le prime due colonne
della matrice A sono linearmente indipendenti e formano una base di im f.
Capitolo 6 275

5. I vettori x = (x1 , x2 , x3 ) appartenenti a f −1 (K) sono le soluzioni del sistema


lineare:
A X = Y,

dove:
1 2 2
     
0 1
− −  

 3 3 3 
 x1 



 
 
 4 −4 −2     1   4 
       
A= , X= x 2
, Y = λ +µ  , λ, µ ∈ R.
1 2 2 
       
 0   1 
− − 
  
    
 3 3 3  x3    
2 −2 −1 −1 3

Si trova che il sistema lineare è compatibile se e solo se λ + 2µ = 0, condizione che


permette di individuare tutti e soli i vettori y = λa + µb appartenenti a K ∩ im f,
vale a dire i vettori che ammettono controimmagine. Risolvendo si ottiene:
 
5 3
x = −2µ − t, − µ − t, t , µ, t ∈ R,
2 2

ossia:
f −1 (K) = ker f + L((4, 5, 0)),

in accordo con quanto affermato nell’Esercizio 6.9.

Esercizio 6.21 Sia f l’endomorfismo di R4 associato, rispetto alla base canonica di R4 ,


alla matrice:  
0 2 −4 −2
 −2 1 −1 
 
0
A=  .
 4 −1 0 3  
2 1 −3 0
Verificare che ker f e im f sono sottospazi vettoriali ortogonali rispetto al prodotto sca-
lare standard di R4 .

Soluzione Riducendo per righe la matrice A, si ottiene rank(A) = 2, quindi:


dim(ker f ) = 2, dim(im f ) = 2.
Le equazioni che determinano ker f sono per esempio:

4x1 − x2 + 3x4 = 0
−x2 + 2x3 + x4 = 0,
276 Applicazioni Lineari

da cui si legge che (ker f )⊥ = L((4, −1, 0, 3), (0, −1, 2, 1)). I vettori della base di (ker f )⊥
appena determinata coincidono con due colonne linearmente indipendenti di A.

Esercizio 6.22 Prendendo spunto dall’esercizio precedente e dall’Esercizio 6.16, si stu-


dino le proprietà degli endomorfismi f : V −→ V, con (V, · ) spazio vettoriale euclideo,
tali che:
(ker f )⊥ = im f.

6.8 Per saperne di più


6.8.1 Forme lineari – dualità
In questo paragrafo si intendono studiare le particolari proprietà delle applicazioni lineari
aventi R come codominio, ricordando che il campo dei numeri reali è un esempio di
spazio vettoriale reale di dimensione uno.

Definizione 6.12 Sia V uno spazio vettoriale reale, un’applicazione lineare:

α : V −→ R,

cioè un elemento di L(V, R), si dice forma lineare su V. Lo spazio vettoriale L(V, R) si
dice spazio vettoriale duale di V e lo si indica con V ∗.

Esempio 6.27 Una forma lineare α su Rn è determinata da n numeri reali a1 , a2 , . . . , an


tali che:

α((x1 , x2 , . . . , xn )) = a1 x1 + a2 x2 + . . . + an xn , ai ∈ R, i = 1, 2, . . . , n, (6.20)

per ogni (x1 , x2 , . . . , xn ) ∈ Rn . Rispetto alla base canonica B di Rn e alla base C = (1)
di R la matrice associata ad α è dunque:

A = M B,C (α) = a1 a2 . . . an .


Se α non è la forma nulla (ossia se almeno uno tra gli ai , i = 1, 2, . . . , n, non è uguale a
zero) allora α è suriettiva e il suo nucleo ha equazione, rispetto alla base B:

a1 x1 + a2 x2 + . . . + an xn = 0, (6.21)

si tratta, quindi, di un iperpiano vettoriale di Rn . Viceversa, dato un iperpiano vettoriale


H di Rn di equazione (6.21), esso è il nucleo della forma lineare α definita da (6.20) ma
H è anche il nucleo delle forme lineari 2α, 3α, . . . , λα con λ ∈ R, λ 6= 0. Perché?
Capitolo 6 277

Osservazione 6.17 Si osservi che in generale, in modo analogo all’esempio precedente,


si può provare che se α è una forma lineare non nulla su uno spazio vettoriale reale V,
allora α è suriettiva e il suo nucleo è un iperpiano vettoriale di V.

Esempio 6.28 In V3 , riferito alla base ortonormale B = (i, j, k), si consideri la funzione
definita nell’Esempio 6.6:

a · : V3 −→ R, x 7−→ a · x.

È chiaro che a · è un esempio di forma lineare su V3 . Se a = a1 i + a2 j + a3 k, allora la


matrice A associata alla forma lineare a ·, rispetto alla base B di V3 e alla base canonica
di R, è: 
A = a1 a2 a3 .
Si dimostrerà che per ogni spazio vettoriale euclideo (V, · ), fissato un vettore a ∈ V , la
funzione a · : V −→ R è una forma lineare su V (cfr. Es. 6.31).

Esempio 6.29 L’applicazione lineare:

Rn,n −→ R, A 7−→ tr(A),

dove tr(A) indica la traccia della matrice A, è una forma lineare su Rn,n .

Poiché V ∗ = L(V, R), se dim(V ) = n segue da (6.15) che anche dim(V ∗ ) = n. Quindi
lo spazio vettoriale V e il suo spazio vettoriale duale V ∗ hanno la stessa dimensione. Il
teorema che segue dimostra di nuovo questo risultato ed, inoltre, indica il metodo con cui
si può costruire esplicitamente una base di V ∗ a partire da una base di V.

Teorema 6.19 Se V è uno spazio vettoriale reale di dimensione finita, allora:

dim(V ) = dim(V ∗ ).

Dimostrazione Sia dim(V ) = n e sia B = (v1 , v2 , . . . , vn ) una sua base. Per il


Teorema 6.2, esistono e sono uniche le forme lineari αi : V −→ R, i = 1, 2, . . . , n, cosı̀
definite:   

 α 1 (v 1 ) = 1 
 α 2 (v 1 ) = 0 
 αn (v1 ) = 0
 α1 (v2 ) = 0
  α2 (v2 ) = 1
  αn (v2 ) = 0

.. .. ... ..


 . 

 . 

 .
 α (v ) = 0,  α (v ) = 0,  α (v ) = 1,
1 n 2 n n n

che si possono anche scrivere nella forma:

αi (vj ) = δij ,
278 Applicazioni Lineari

dove δij è il simbolo di Kronecker (δij = 0, se i 6= j e δii = 1). Di conseguenza per ogni
x ∈ V scritto come x = x1 v1 + x2 v2 + . . . + xn vn risulta:
αi (x) = xi , i = 1, 2, . . . , n.
In altri termini, la forma lineare αi associa ad ogni vettore di V la sua i–esima compo-
nente, calcolata rispetto alla base di V che ne determina la sua definizione.
Si perviene alla tesi se si dimostra che B ∗ = (α1 , α2 , . . . , αn ) è una base di V ∗, ossia:
1. B ∗ è un sistema di generatori di V ∗. Infatti, per ogni forma lineare α ∈ V ∗, posto:
α(v1 ) = a1 , α(v2 ) = a2 , ..., α(vn ) = an ,
con a1 , a2 , . . . , an ∈ R e per ogni vettore x = x1 v1 + x2 v2 + . . . + xn vn di V, si
ha:
α(x) = x1 α(v1 ) + x2 α(v2 ) + . . . + xn α(vn )
= x 1 a1 + x 2 a2 + . . . + x n an
= a1 α1 (x) + a2 α2 (x) + . . . + an αn (x)
= (a1 α1 + a2 α2 + . . . + an αn )(x).
Allora:
α = a1 α1 + a2 α2 + . . . + an αn ,
ovvero la forma lineare α è combinazione lineare degli elementi di B ∗.
2. B ∗ è un insieme di vettori linearmente indipendenti in V ∗. Si consideri la combina-
zione lineare:
λ1 α1 + λ2 α2 + . . . + λn αn = oV ∗ , (6.22)
con λ1 , λ2 , . . . , λn ∈ R e con oV ∗ vettore nullo di V ∗ , che non è altro che la forma
lineare nulla. Applicando ambo i membri di (6.22) agli elementi della base B segue:
(λ1 α1 + λ2 α2 + . . . + λn αn )(vj ) = oV ∗ (vj ) = 0, j = 1, 2, . . . , n,
ossia λj αj (vj ) = λj = 0, j = 1, 2, . . . , n, da cui la tesi.
Definizione 6.13 La base B ∗ dello spazio vettoriale duale V ∗, definita nella dimostra-
zione del Teorema 6.19, è detta base duale della base B di V.
Esempio 6.30 Procedendo in modo analogo alla dimostrazione del Teorema 6.19 si ve-
rifica che la base duale B ∗ = (α1 , α2 , . . . , αn ) della base canonica B di Rn è data dal-
le forme lineari che associano ordinatamente ad ogni n–upla (x1 , x2 , . . . , xn ) di Rn le
rispettive componenti, ossia:
αj ((x1 , x2 , . . . , xn )) = xj , j = 1, 2, . . . , n,
(cfr. Es. 6.27). Inoltre, se si considera V3 , riferito alla base ortonormale B = (i, j, k) (cfr.
Es. 6.28), si deduce facilmente che la base duale di B è B ∗ = (i ·, j ·, k ·).
Capitolo 6 279

Il teorema seguente, la cui dimostrazione è lasciata per esercizio, è un corollario del


Teorema 6.19.
Teorema 6.20 Sia V uno spazio vettoriale reale di dimensione n e sia B = (v1 , v2 , . . . , vn )
una sua base. Data la forma lineare α : V −→ R associata alla matrice:
A = a1 a2 . . . an ∈ R1,n


rispetto alla base B e alla base C = (1) di R, allora:


α = a1 α 1 + a2 α 2 + . . . + an α n
dove B ∗ = (α1 , α2 , . . . , αn ) è la base duale di B in V ∗.
Osservazione 6.18 Dati due spazi vettoriali complessi V e W, come per il caso reale,
si può introdurre la nozione di applicazione lineare da V a W. Infatti un’applicazione
lineare tra due spazi vettoriali complessi V e W è una funzione f : V −→ W tale che:
f (λx + µy) = λf (x) + µf (y),
per ogni x e y in V e per ogni λ e µ in C. In particolare, un endomorfismo di V è
un’applicazione lineare da V in V. Come nel caso reale, si dimostrano teoremi analoghi
a quelli esposti in questo capitolo. Per esempio, vale il teorema fondamentale per le
applicazioni lineari (cfr. Teor. 6.2 ) da cui si deducono la nozione di matrice associata (ad
elementi complessi) ad un’applicazione lineare e di conseguenza la nozione di equazioni
di un’applicazione lineare. Inoltre, come nel caso reale, si possono definire immagine e
controimmagine di sottospazi vettoriali, somma e prodotto per un numero complesso di
applicazioni lineari, sottospazio vettoriale invariante per un endomorfismo.
Inoltre, se V è uno spazio vettoriale complesso, un’applicazione lineare α : V −→ C,
cioè un elemento di L(V, C), si dice forma lineare su V. Lo spazio vettoriale complesso
L(V, C) è lo spazio vettoriale duale di V e lo si indica con V ∗. Come nel caso reale, se
dim(V ) = n, allora anche dim(V ∗ ) = n.

6.8.2 Cambiamento di base in V ∗


Si considerino due basi B = (v1 , v2 , . . . , vn ) e B 0 = (v10 , v20 , . . . , vn0 ) dello spazio vet-
toriale V di dimensione n e si indichi con P ∈ GL(n, R) (cfr. Oss. 2.7) la matrice del
cambiamento di base da B a B 0 le cui colonne sono date dalle componenti dei vettori
della base B 0 scritti rispetto alla base B, ossia:
   
v10 v1
 v0   v2 
 2  t 
 ..  = P  .. . (6.23)

 .   . 
vn0 vn
280 Applicazioni Lineari

Siano B ∗ = (α1 , α2 , . . . , αn ) e (B 0 )∗ = (α10 , α20 , . . . , αn0 ) le basi duali di B e di B 0 rispet-


tivamente. Si indichi con Q ∈ GL(n, R) la matrice del cambiamento di base da B ∗ a
(B 0 )∗, ossia:    
α10 α1
 α0   α2 
 2 
 ..  = t Q  .. . (6.24)
 
 .   . 
αn0 αn
Scopo di questo paragrafo è quello di determinare la relazione che lega le matrici P e Q.
In notazione matriciale, la dualità tra le basi B e B ∗ si può esprimere come:
 
α1
 α2  
 ..  v1 v2 . . . vn = I, (6.25)
 
 . 
αn

dove I è la matrice unità di ordine n. Analogamente, la dualità tra le basi B 0 e (B 0 )∗


equivale alla relazione:
 
α10
 α0 
 2 
 ..  v10 v20 . . . vn0 = I.

(6.26)
 . 
αn0

Sostituendo (6.24) e (6.23) in (6.26) si ha:


 
α1
 α2 
t 

Q  ..  v1 v2 . . . vn P = I,

 . 
αn

da cui, tenendo conto di (6.25), segue t Q P = I e, quindi, ricordando la proprietà


t
(P −1 ) = (t P )−1 , si ottiene:
Q = tP −1 , (6.27)
che è la relazione cercata.

Esercizio 6.23 In R2 si considerino due basi: la base canonica B = ((1, 0), (0, 1)) e
la base B 0 = ((−1, 2), (1, −1)). Nello spazio vettoriale duale (R2 )∗ si consideri la base
B ∗ = (α1 , α2 ), duale della base B. Determinare le componenti dei vettori della base
(B 0 )∗ = (α10 , α20 ), duale della base B 0 , rispetto alla base B ∗.
Capitolo 6 281

Soluzione In accordo con (6.27), la matrice del cambiamento di base da B ∗ a (B 0 )∗ è:


t −1  
−1 1 1 2
Q= = .
2 −1 1 1

Esercizio 6.24 Determinare la base duale (B 0 )∗ della base B 0 = ((1, 0, −2), (0, 1, −1), (2, 1, 2))
dello spazio vettoriale R3 , rispetto alla base duale B ∗ della base canonica B di R3 .

Soluzione Sia (B 0 )∗ = (α10 , α20 , α30 ) la base duale di B 0 , allora dalla formula (6.26) si
ha:      
0 3 2 2 0 2 6 1 0 2 1 1
α1 = , − , − , α2 = − , , − , α3 = , , ,
7 7 7 7 7 7 7 7 7
dove le componenti sono date rispetto alla base duale B ∗ della base canonica B di R3 .

6.8.3 Spazio vettoriale biduale


Fissato un vettore x ∈ V, al variare di α nello spazio vettoriale duale V ∗ , i numeri reali
α(x) definiscono una funzione:
e : V ∗ −→ R,
x α 7−→ α(x). (6.28)

È naturale, quindi, introdurre la seguente definizione.

Definizione 6.14 Dato uno spazio vettoriale reale V, lo spazio vettoriale duale del suo
duale V ∗ prende il nome di spazio vettoriale biduale e lo si indica con V ∗∗.

Osservazione 6.19 Poiché V ∗∗ = L(V ∗, R), segue:


dim(V ) = dim(V ∗ ) = dim(V ∗∗ ).

Teorema 6.21 Per ogni vettore x ∈ V, la funzione:


e : V ∗ −→ R,
x α 7−→ α(x),
è una forma lineare, cioè appartiene allo spazio vettoriale biduale V ∗∗.

Dimostrazione È conseguenza immediata della definizione.

Teorema 6.22 Siano V uno spazio vettoriale reale di dimensione n e V ∗∗ lo spazio


vettoriale biduale di V. La funzione:
ψ : V −→ V ∗∗, x 7−→ x
e (6.29)
è un isomorfismo, dove x
e è definito da (6.28).
282 Applicazioni Lineari

Dimostrazione La tesi segue in quanto:

a. ψ è lineare, ossia per ogni x, y ∈ V e per ogni λ, µ ∈ R si deve dimostrare che:

ψ(λx + µy) = λψ(x) + µψ(y).

Infatti, per ogni α ∈ V ∗ si ha:

^
ψ(λx + µy)(α) = (λx + µy)(α) = α(λx + µy)

= λα(x) + µα(y) = λe
x(α) + µe
y(α)

= (λψ(x) + µψ(y))(α).

e = oV ∗∗ allora per ogni α ∈ V ∗,


b. Si deve dimostrare che ker ψ = {oV }. Infatti, se x
risulta x
e(α) = α(x) = oV quindi x = oV .

Poiché dim(V ∗∗ ) = dim(V ) = n, per il Teorema 6.11, segue che ψ è un isomorfismo.

Osservazione 6.20 1. Si osservi che l’isomorfismo ψ non dipende dalla scelta di par-
ticolari basi in V e in V ∗∗, ma è definito in modo intrinseco, senza coinvolgere le
componenti dei vettori sia in V sia in V ∗∗, pertanto si tratta di un isomorfismo ca-
nonico. In altri termini, i due spazi vettoriali V e V ∗∗ sono uno la copia dell’altro,
rendendo cosı̀ inutile l’iterazione del processo di dualità a V ∗∗.

2. L’isomorfismo tra V e V ∗∗ vale se e solo se V ha dimensione finita. Se V non è


finitamente generato, la funzione (6.29) è iniettiva, ma non è detto che sia suriettiva.
Per maggiori dettagli nel caso di spazi vettoriali non finitamente generati, cioè di
dimensione infinita, si consulti ad esempio [20].

3. Se V è uno spazio vettoriale complesso di dimensione finita, si ha, come nel caso
reale, un isomorfismo canonico tra V e V ∗∗.

Osservazione 6.21 Si considerino una base B = (v1 , v2 , . . . , vn ) di V e la sua base


duale B ∗ = (α1 , α2 , . . . , αn ) in V ∗ . I vettori cosı̀ definiti:

ee1 = ψ(e1 ), ee2 = ψ(e2 ), ..., een = ψ(en )

formano una base Be di V ∗∗. Dal fatto che eei (αj ) = αj (ei ) = δij , i, j = 1, 2, . . . , n, si ha
che Be è la base duale di B ∗. Allora ogni elemento x e di V ∗∗ si decompone, rispetto alla
base B,
e come:
x
e = xe1 ee1 + xe2 ee2 + . . . + x
fn een ,
Capitolo 6 283

dove le componenti xei sono date da xei = x e(αi ). D’altra parte x


e(αi ) = αi (x) = xi ,
quindi xei = xi , con i = 1, 2, . . . , n. È cosı̀ dimostrato che le componenti di x ∈ V,
relative alla base B, sono anche le componenti dell’immagine di x tramite l’isomorfismo
canonico ψ : V −→ V ∗∗ , relativamente alla base B, e biduale della base B; perciò, anche
in questo senso, lo spazio vettoriale biduale V ∗∗ si può identificare con V. In altri termini,
la matrice associata a ψ , rispetto alle basi B e B, e è la matrice unità I di ordine n. Si
noti che questa osservazione non può sostituire la dimostrazione del Teorema 6.21 perché
coinvolge l’uso delle basi.

Esercizio 6.25 Sia R2 [x] lo spazio vettoriale dei polinomi in x a coefficienti reali di
grado minore o uguale a 2 (cfr. Es. 4.11) e siano b0 , b1 , b2 tre numeri reali distinti. Si
considerino le tre forme lineari:
α00 : R2 [x] −→ R, p(x) 7−→ p(b0 ),
α10 : R2 [x] −→ R, p(x) 7−→ p(b1 ), (6.30)
α20 : R2 [x] −→ R, p(x) 7−→ p(b2 ),

1. Verificare che (B 0 )∗ = (α00 , α10 , α20 ) è una base di R2 [x]∗ .

2. Trovare la base duale (B 0 )∗∗ di (B 0 )∗ .

Soluzione 1. Si deve verificare che (B 0 )∗ è un insieme di vettori linearmente indipen-


denti. A tale scopo si consideri la combinazione lineare:

λ1 α00 + λ2 α10 + λ3 α20 = oR2 [x]∗ ,

con λ1 , λ2 , λ3 ∈ R e oR2 [x]∗ forma lineare nulla su R2 [x]. Sia B = (1, x, x2 ) una
base di R2 [x], tenendo conto delle relazioni (6.30), segue:

α0 0 (1) = α0 1 (1) = α0 2 (1) = 1,


α0 0 (x) = b0 , α0 1 (x) = b1 , α0 2 (x) = b2 ,
α0 0 (x2 ) = b20 , α0 1 (x2 ) = b21 , α0 2 (x2 ) = b22 ,

da cui si ha:
0 0 0

 (λ1 α0 + λ2 α1 + λ3 α2 )(1) = λ1 + λ2 + λ3 = 0,

(λ1 α00 + λ2 α10 + λ3 α20 )(x) = λ1 b0 + λ2 b1 + λ3 b2 = 0, (6.31)

(λ1 α00 + λ2 α10 + λ3 α20 )(x2 ) = λ1 b20 + λ2 b21 + λ3 b22 = 0.

Si ottiene un sistema lineare omogeneo la cui matrice dei coefficienti P ha deter-


284 Applicazioni Lineari

minante:

1 1 1

det(P ) = b0 b1 b2 = (b0 − b1 )(b0 − b2 )(b2 − b1 ) 6= 0.


b2 b2 b2
0 1 2

Pertanto l’unica soluzione del sistema lineare omogeneo (6.31) è λ1 = λ2 = λ3 = 0,


vale a dire α00 , α10 e α20 sono linearmente indipendenti. Si osservi che tP è la matrice
del cambiamento di base dalla base B ∗ = (α0 , α1 , α2 ), duale della base B, alla ba-
se (B 0 )∗ , ovvero:
 0   
α0 α0
 α10  = tP  α1 .
α20 α2

2. Mediante l’isomorfismo canonico ψ tra V e V ∗∗ si possono identificare i vettori


della base B = (1, x, x2 ) con i vettori della base B ∗∗ = (ψ(1), ψ(x), ψ(x2 )). Per-
tanto per determinare la base (B 0 )∗∗ di R2 [x]∗∗ duale della base (B 0 )∗ = (α00 , α10 , α20 )
è sufficiente determinare la base B 0 = (p0 (x), p1 (x), p2 (x)) la cui base duale è (B 0 )∗
ossia tale che:

(αi0 )(pj (x)) = pj (bi ) = δij , i, j = 0, 1, 2,

con δij simbolo di Kronecker, da cui segue:

1
p0 (x) = (b1 b2 − (b1 + b2 )x + x2 ) ,
(b0 − b1 )(b0 − b2 )
1
p1 (x) = (b0 b2 − (b0 + b2 )x + x2 ) ,
(b0 − b1 )(b2 − b1 )
1
p2 (x) = (b0 b1 − (b0 + b1 )x + x2 ) .
(b0 − b2 )(b1 − b2 )

Si osservi che dalla relazione (6.27) segue che P −1 è la matrice del cambiamento
di base da B a B 0 e pertanto:

   
p0 (x) 1
 p1 (x)  = P −1  x .
p2 (x) x2
Capitolo 6 285

6.8.4 Dualità nel caso degli spazi vettoriali euclidei


Scopo di questo paragrafo è quello di dimostrare che, se (V, · ) è uno spazio vettoriale
euclideo di dimensione finita, allora lo spazio vettoriale duale V ∗ è canonicamente iso-
morfo a V. Si perviene a questo importante risultato estendendo l’Esempio 6.28 al caso
generale di uno spazio vettoriale euclideo V.

Esempio 6.31 Sia (V, · ) uno spazio vettoriale euclideo, fissato un vettore x in V, la
funzione:
x · : V −→ R, y 7−→ x · y,
con “·” prodotto scalare su V, è una forma lineare. Infatti, dalle proprietà del prodotto
scalare si ha:

x · (λy1 + µy2 ) = λx · y1 + µx · y2 ,
per ogni λ, µ ∈ R e per ogni y1 , y2 ∈ V.

Teorema 6.23 Sia (V, · ) uno spazio vettoriale euclideo di dimensione finita, la funzione:

iV : V −→ V ∗, x 7−→ x · (6.32)
è un isomorfismo.

Dimostrazione Dalle proprietà del prodotto scalare segue che la funzione iV è un’ap-
plicazione lineare. L’iniettività di iV è conseguenza del calcolo di ker iV , ossia:

ker iV = {x ∈ V | iV (x) = oV ∗ } = {x ∈ V | x · y = 0, ∀y ∈ V } = {oV }.


Dal Teorema 6.11 segue che iV è un isomorfismo.

Osservazione 6.22 Nel caso di uno spazio vettoriale euclideo (V, · ) è quindi possibile
definire, mediante (6.32), un isomorfismo canonico tra V e il suo duale V ∗ che non dipen-
de dalla scelta delle basi nei due spazi vettoriali ma solo dal prodotto scalare che conferi-
sce a V la struttura di spazio vettoriale euclideo. Si osservi, che se B = (e1 , e2 , . . . , en )
è una base ortonormale di (V, · ) e se si indica con B ∗ = (α1 , α2 , . . . , αn ) la base duale
di B, si ha:

iV (ej )(ek ) = ej · ek = δjk = αj (ek ), j, k = 1, 2, . . . , n,



dove δjk è il simbolo di Kronecker. Pertanto la matrice M B,B (iV ) associata all’isomor-
fismo iV , rispetto alle basi B e B ∗ , è la matrice unità I di ordine n.
286 Applicazioni Lineari

Osservazione 6.23 Nel caso di uno spazio vettoriale hermitiano (V, · ), la funzione:

x · : V −→ C, y 7−→ x · y,

non è una forma lineare (cfr. (5.12)). Invece la funzione:

· x : V −→ C, y 7−→ y · x,

è una forma lineare, ma la funzione:

V −→ V ∗, x 7−→ · x

non è un’applicazione lineare. Pertanto, a differenza del caso reale, un prodotto hermi-
tiano non permette di definire un isomorfismo canonico (senza l’uso delle basi) tra uno
spazio vettoriale hermitiano ed il suo duale.

6.8.5 Trasposta di un’applicazione lineare


Lo scopo di questo paragrafo è quello di individuare il legame tra un’applicazione li-
neare associata ad una matrice A e l’applicazione lineare associata alla trasposta della
matrice A stessa, senza necessariamente introdurre un prodotto scalare, come nel caso
dell’endomorfismo autoaggiunto definito nel Paragrafo 6.6.

Sia f : V −→ W un’applicazione lineare da uno spazio vettoriale reale V in uno spazio


vettoriale reale W. Data una generica forma lineare β in W ∗, la composizione β ◦ f è una
forma lineare su V, ossia β ◦ f ∈ V ∗. Si può, allora, enunciare la seguente definizione.

Definizione 6.15 Data un’applicazione lineare f : V −→ W tra due spazi vettoriali V


e W, la funzione:
t
f : W ∗ −→ V ∗, β 7−→ (tf )(β) = β ◦ f, (6.33)
si dice trasposta dell’applicazione lineare f .

Teorema 6.24 La funzione tf appena definita è un’applicazione lineare.

Dimostrazione È conseguenza evidente della definizione e delle linearità di β e di f .

Osservazione 6.24 La denominazione “trasposta” per l’applicazione lineare tf è giusti-


ficata dal seguente teorema.
Capitolo 6 287

Teorema 6.25 Siano V uno spazio vettoriale reale di dimensione n e W uno spazio vet-
toriale reale di dimensione m. Data un’applicazione lineare f : V −→ W, si indichi con
A = M B,C (f ) la matrice di Rm,n associata ad f rispetto alle basi B = (v1 , v2 , . . . , vn )
di V e C = (w1 , w2 , . . . , wm ) di W. Si considerino nello spazio vettoriale duale V ∗ la
base B ∗ = (α1 , α2 , . . . , αn ) duale della base B e nello spazio vettoriale duale W ∗ la
base C ∗ = (β1 , β2 , . . . , βm ) duale di C. La matrice associata all’applicazione lineare:
f : W ∗ −→ V ∗
t

rispetto alle basi C ∗ e B ∗ è la trasposta della matrice A:


∗ ∗
M C ,B (tf ) = tA.

Dimostrazione La definizione di trasposta di un’applicazione lineare (6.33), applicata


ad un vettore x di V, restituisce il numero reale dato da:
((tf )(β))(x) = (β ◦ f )(x). (6.34)
Si indichino con G ∈ Rn,m la matrice associata a tf rispetto alle basi C ∗ e B ∗ , con
B ∈ Rn,1 la matrice associata alla forma lineare β rispetto alla base C di W e alla base
D = (1) di R:
B = M C,D (β) = b1 b2 . . . bm


e con:  
x1
 x2 
X=
 
.. 
 . 
xn
la matrice delle componenti del vettore x di V rispetto alla base B. Si vuole ora scrivere,
in notazione matriciale, la relazione (6.34). Si ha:
a. il secondo membro di (6.34) è il numero reale:
BAX, (6.35)
in quanto alla composizione di applicazioni lineari β ◦ f si associa il prodotto di
matrici BA ∈ R1,n come segue da (6.16).
b. Il calcolo del primo membro di (6.34) è più laborioso; la matrice colonna delle
componenti, rispetto alla base B ∗, della forma lineare α = (tf )(β) ∈ V ∗ si ottiene
applicando la matrice G (associata a tf ) alla matrice colonna delle componenti,
rispetto alla base C ∗, del vettore β ossia G tB . Quindi il primo membro di (6.34) si
riduce a α(x) ossia a:
t
(G tB)X. (6.36)
288 Applicazioni Lineari

Dall’uguaglianza di (6.36) con (6.35) si ottiene:


t
(G tB) = B tG = BA

da cui la tesi.

Osservazione 6.25 Dalla formula (6.35) si deduce che per calcolare l’immagine di un
vettore mediante la trasposta di un’applicazione lineare si effettua il prodotto della ma-
trice riga delle componenti del vettore a destra della matrice associata all’applicazione
lineare di partenza. Mentre per calcolare l’immagine di un vettore mediante un’applica-
zione lineare si effettua il prodotto a sinistra per la matrice colonna delle componenti del
vettore.

Seguono alcuni teoremi che mettono in relazione la trasposta di un’applicazione lineare


con la somma di applicazioni lineari, con il prodotto di un numero reale per un’applicazio-
ne lineare, con la composizione di applicazioni lineari e con l’inversa di un’applicazione
lineare invertibile. Tutte le dimostrazioni sono lasciate al Lettore per esercizio.

Teorema 6.26 Se f, g ∈ L(V, W ) e λ ∈ R, allora:

1. t (f + g) = tf + tg ,

2. t (λf ) = λ tf .

Teorema 6.27 Siano V, W, Z spazi vettoriali reali, allora, per ogni f ∈ L(V, W ) e per
ogni g ∈ L(W, Z) si ha:
t
(g ◦ f ) = tf ◦ tg.

Se f è un endomorfismo di uno spazio vettoriale reale V, allora tf è un endomorfismo


dello spazio vettoriale duale V ∗ di V, inoltre:

(t idV )(α) = α ◦ idV = idV ∗ (α), α ∈ V ∗,

dove idV e idV ∗ indicano, rispettivamente, l’identità in V e V ∗. Pertanto t idV = idV ∗ .

Da queste considerazioni e dal Teorema 6.27 si ottiene il seguente teorema.

Teorema 6.28 Se f è un automorfismo dello spazio vettoriale V allora tf è un automor-


fismo dello spazio vettoriale duale V ∗ e:

(tf )−1 = t (f −1 ).
Capitolo 6 289

Esercizio 6.26 Siano f : R4 −→ R3 l’applicazione lineare la cui matrice, rispetto alle


basi canoniche di R4 e di R3 , è:
 
1 2 −1 2
A =  −1 1 1 1 
−2 1 0 −1

e β : R3 −→ R la forma lineare la cui matrice, rispetto alla base canonica di R3 e alla


base C = (1) di R, è: 
M (β) = 1 −2 2 .

Determinare la matrice associata alla forma lineare α = (tf )(β).

Soluzione Per definizione di applicazione lineare trasposta (tf )(β) = β ◦ f , la cui


matrice associata è data da M (β)A. Quindi la matrice associata alla forma lineare α,
rispetto alla base canonica di R4 e alla base C, è:
 
 1 2 −1 2 
M (β)A = 1 −2 2  −1 1 1 1  = −1 2 −3 −2
−2 1 0 −1
e l’equazione di α risulta essere:
   
x1 x1
t
 x 2 
 
 x2
 
 x3  = −1 2 −3 −2  x3
f (β)   = −x1 + 2x2 − 3x3 − 2x4 ,

x4 x4

dove (x1 , x2 , x3 , x4 ) è un generico elemento di R4 .

Osservazione 6.26 Nel Paragrafo 6.8.4 è stato dimostrato che la trasposta di una matrice,
associata ad un’applicazione lineare f : V −→ W rispetto alle basi B di V e C di W, è
la matrice associata all’applicazione lineare trasposta tf : W ∗ −→ V ∗ rispetto alle basi
duali C ∗ di W ∗ e B ∗ di V ∗ (cfr. Def. 6.15 e Teor. 6.25).
Data un’applicazione lineare f : V −→ W tra due spazi vettoriali euclidei (V, · ) e
(W, · ), rispettivamente di dimensione n e m, si intende in questa osservazione, tramite
l’isomorfismo canonico tra uno spazio vettoriale euclideo ed il suo duale, determinare il
legame tra la trasposta tf : W ∗ −→ V ∗ di f e l’aggiunta f † : W −→ V di f (cfr. Teor.
6.16). Si ha infatti:

f (x) · y = iW (y)(f (x)) = (tf )(iW (y))(x),


290 Applicazioni Lineari

per ogni x in V e y in W. Dalla definizione di aggiunta, si ha pertanto che:

(tf )(iW (y))(x) = iV (f † (y))(x), x ∈ V, y ∈ W,

ossia:
(tf ) ◦ iW = iV ◦ f † . (6.37)
Si osservi che, fissate una base ortonormale B di (V, · ) ed una base ortonormale C di
(W, · ), se si indica con A la matrice associata a f rispetto alle basi B e C , la matrice
trasposta di A, che è la matrice associata a tf rispetto alle basi duali C ∗ e B ∗ (cfr. Teor.
6.25), è anche la matrice associata a f † rispetto alle basi C e B, ovvero:
∗ ,B ∗
MC (tf ) = M C,B (f † ) = tA.

In notazione matriciale, rispetto alle basi ortonormali B, C e alle loro basi duali B ∗ , C ∗ , la
relazione (6.37) si traduce nella relazione:
t
A Im = In tA

dove Im e In indicano la matrice unità di ordine m ed n rispettivamente (cfr. Par. 6.4 e


Oss. 6.22).

6.8.6 Endomorfismi autoaggiunti e matrici hermitiane


Analogamente a quanto visto nel Paragrafo 6.6 si può introdurre il concetto di aggiun-
ta di un’applicazione lineare tra spazi vettoriali hermitiani. Per semplicità si tratterà in
dettaglio solo il caso di un endomorfismo di uno spazio vettoriale hermitiano.
Sia (V, · ) uno spazio vettoriale hermitiano (cfr. Def. 5.7), analogamente al caso reale,
l’aggiunto di un endomorfismo f di V è l’endomorfismo f † di V tale che:

f (x) · y = x · f † (y), x, y ∈ V. (6.38)

Si supponga che V abbia dimensione n e si indichino rispettivamente con A e A† le


matrici associate ad f e f † rispetto ad una base unitaria B = (e1 , e2 , . . . , en ) di V. Se
X ∈ Cn,1 e Y ∈ Cn,1 denotano, rispettivamente, la matrice colonna delle componenti dei
vettori x e y rispetto alla base B, l’equazione (6.38) è equivalente a:
t
(AX) Y = t XA† Y ,

da cui si ottiene:
t
X tA Y = t X A† Y ,
ossia A† = tA. Di conseguenza vale il seguente teorema, che è l’analogo del Teorema
6.16 in campo complesso.
Capitolo 6 291

Teorema 6.29 Sia (V, · ) uno spazio vettoriale hermitiano di dimensione n. Dato un’en-
domorfismo f di V, la matrice associata M B,B (f † ) all’endomorfismo aggiunto f † di f
rispetto ad una base unitaria B di (V, · ) è la trasposta coniugata della matrice associata
M B,B (f ) a f rispetto alla stessa base.

In particolare, un endomorfismo f di uno spazio vettoriale hermitiano (V, · ) si dice


autoaggiunto o hermitiano se f † = f . In questo caso vale il seguente teorema che è
l’analogo, nel caso hermitiano, del Teorema 6.17.

Teorema 6.30 Sia (V, · ) uno spazio vettoriale hermitiano di dimensione n e sia B una
base unitaria di V. Un endomorfismo f di V è autoaggiunto se e solo se la matrice
A = M B,B (f ) ∈ Cn,n è hermitiana, ossia se e solo se tA = A.

6.8.7 Isometrie, similitudini, trasformazioni unitarie


In questo paragrafo si intende estendere sia al caso degli spazi vettoriali euclidei sia al
caso degli spazi vettoriali hermitiani il concetto di movimento euclideo del piano, inten-
dendosi per tale il movimento “rigido” del piano che non cambia la lunghezza dei vettori
e l’ampiezza degli angoli. Si ricordi infatti che la geometria euclidea del piano è per
definizione l’insieme di assiomi e teoremi invarianti per effetto dei movimenti rigidi.

Sia (V, · ) uno spazio vettoriale euclideo di dimensione finita. La definizione seguente
estende (in modo naturale) a dimensioni superiori il concetto elementare di isometria o
movimento euclideo nel piano e nello spazio.

Definizione 6.16 Un endomorfismo f di uno spazio vettoriale euclideo (V, · ) prende il


nome di isometria o trasformazione ortogonale se:

f (x) · f (y) = x · y, x, y ∈ V. (6.39)

Il teorema che segue afferma che la definizione di isometria impone che necessariamente
essa sia un’isomorfismo.

Teorema 6.31 Sia (V, · ) uno spazio vettoriale euclideo di dimensione n. Se f è un’iso-
metria di (V, · ), allora f è un automorfismo di V.

Dimostrazione Per il Teorema 6.11 è sufficiente dimostrare che ker f = {o}. Se x è


un vettore di ker f si ha f (x) = o, d’altra parte essendo f un un’isometria si ha:

f (x) · f (x) = kxk2 = kok2 = 0,


292 Applicazioni Lineari

quindi x = o.

Si può generalizzare la definizione precedente al caso di isomorfismi tra due spazi vet-
toriali euclidei in questo modo: dati due spazi vettoriali euclidei V e W, con la stessa
dimensione, un isomorfismo f : V −→ W si dice isometria se “non cambia ” il prodotto
scalare.

Esempio 6.32 Ogni rotazione R[θ] (in senso antiorario) di angolo θ del piano vettoriale
V2 è un’isometria (cfr. Es. 6.24). Inoltre, come è già stato affermato, la matrice associata
a R[θ] (rispetto ad una base ortonormale (i, j) di V2 ) è la matrice ortogonale:
 
cos θ − sin θ
.
sin θ cos θ

Esempio 6.33 L’identità id : V −→ V (cfr. Es. 6.1) è un’isometria rispetto ad ogni


prodotto scalare definito su V.

Esempio 6.34 L’applicazione −id : V −→ V definita da −id(x) = −x, x ∈ V, è


un’isometria rispetto ad ogni prodotto scalare definito su V.

Alcune tra le principali proprietà delle isometrie sono riassunte nel seguente teorema.

Teorema 6.32 Sia (V, · ) uno spazio vettoriale euclideo di dimensione n.

1. Un endomorfismo f di V è un’isometria se e solo se non cambia la norma dei


vettori:
kf (x)k = kxk, x ∈ V. (6.40)

2. Se f è un’isometria di V, allora la misura dell’angolo individuato dai vettori x e


y di V coincide con la misura dell’angolo individuato dai vettori f (x) e f (y), per
ogni x, y ∈ V.

3. La composizione di due isometrie è un’isometria.

4. L’inversa di un’isometria è un’isometria.

5. Un endomorfismo f di V è un’isometria di V se e solo se le immagini dei vettori


di una base ortonormale di V formano una base ortonormale di V.

6. Un endomorfismo f di V è un’isometria di V se e solo se la matrice associata ad


f , rispetto ad una base ortonormale di V, è una matrice ortogonale.
Capitolo 6 293

7. Un endomorfismo f di V è un’isometria se e solo se f −1 = f † , dove f † è


l’applicazione aggiunta di f .

Dimostrazione 1. Se f è un’isometria, la (6.40) segue ponendo y = x in (6.39).


Viceversa, si dimostra che se vale la (6.40) allora f è un’isometria. Dalla formula
(5.6) si ottiene:
1
kx + yk2 − kxk2 − kyk2

x·y =
2
e:
1
kf (x) + f (y)k2 − kf (x)k2 − kf (y)k2 .

f (x) · f (y) =
2
Pertanto per la linearità di f e da (6.40) segue quindi la (6.39).

2. Se f è un’isometria, da (6.39) e dal punto 2. segue:

kxk kyk cos(xy) \


c = kxk kyk cos(f (x)f (y)),

per ogni x, y ∈ V, dove xy \


c e f (x)f (y) indicano, rispettivamente, l’angolo tra i
vettori x e y ed i vettori f (x) e f (y) (cfr. Def. 5.3). Pertanto:

cos(xy) \
c = cos(f (x)f (y)). (6.41)

3. Se f e g sono isometrie, allora:

k(g ◦ f )(x)k = kg(f (x))k = kf (x)k = kxk,

per ogni x ∈ V.

4. Sia f un’isometria. Si ha: kf (f −1 (x))k = kid(x)k, dove id è l’identità di V , ma

kf (f −1 (x))k = kf −1 (x)k = kxk,

per ogni x ∈ V , da cui la tesi.

5. Se f è un’isometria e B = (e1 , e2 , . . . , en ) una base ortonormale di V, allora


B 0 = (f (e1 ), f (e2 ), . . . , f (en )) è una base ortonormale perché f mantiene im-
mutata sia la norma dei vettori sia i loro prodotti scalari. Viceversa, siano B =
(e1 , e2 , . . . , en ) e B 0 = (f (e1 ), f (e2 ), . . . , f (en )) due basi ortonormali di V. Dato:

x = x1 e1 + x2 e2 + . . . + xn en
294 Applicazioni Lineari

in V, allora:
kxk2 = x21 + x22 + . . . + x2n ,
d’altra parte, per la linearità di f :

f (x) = x1 f (e1 ) + x2 f (e2 ) + . . . + xn f (en ),

quindi:
kf (x)k2 = x21 + x22 + . . . + x2n ,
da cui kf (x)k = kxk. Si osservi che il calcolo della norma dei vettori x e f (x) ha
assunto l’espressione suddetta in quanto riferito a due basi ortonormali (cfr. Teor.
5.4).

6. Sia A la matrice associata ad f , rispetto ad una base ortonormale B di V, e siano


Y = AX le equazioni di f rispetto a B. Poiché, per ogni x ∈ V, kf (x)k2 = kxk2
e ricordando che kxk2 = t XX si ha:
t
X 0 X 0 = t (AX)(AX) = tX tAAX = t XX,

da cui segue la tesi. Si osservi che kxk2 = t XX se e solo se X è la matrice


colonna delle componenti di x rispetto ad una base ortonormale.

7. Per definizione di f † , applicazione lineare aggiunta di f, si ha:

f (x) · f (y) = f † (f (x)) · y, x, y ∈ V. (6.42)

Quindi, se f è un isometria, cioè se vale (6.39), si deve avere:

f † (f (x)) · y = x · y, x, y ∈ V,

da cui
((f † ◦ f )(x) − x) · y = 0,
per ogni x e y. Pertanto, f † ◦ f = id, ossia f † = f −1 . Viceversa, se f † = f −1 ,
allora da (6.42) si ha immediatamente che f è un’isometria.

Osservazione 6.27 1. Dai punti 2. e 3. del teorema precedente segue che l’insieme
delle isometrie di uno spazio vettoriale euclideo (V, · ) è un gruppo (cfr. Oss. 2.2)
rispetto alla composizione di funzioni. Inoltre, fissata una base ortonormale B nel-
lo spazio vettoriale euclideo (V, · ), allora per la proprietà 6. si può stabilire, in
modo naturale, un isomorfismo tra l’insieme delle isometrie di (V, · ) ed il grup-
po ortogonale O(n) associando ad ogni isometria f di V la matrice ortogonale
A = M B,B (f ).
Capitolo 6 295

2. Si osservi che se un automorfismo di uno spazio vettoriale euclideo (V, · ) mantiene


invariati gli angoli tra i vettori di V allora non è necessariamente un’isometria. Un
esempio elementare è dato dall’automorfismo:

f : V −→ V, x 7−→ 2x, (6.43)

ossia dalla funzione 2 id.

Esempio 6.35 Gli elementi di O(2), ovvero le matrici ortogonali di ordine 2, sono ne-
cessariamente o di tipo (3.31) o di tipo (3.33) (cfr. Es. 3.11). Pertanto gli endomorfismi
del piano vettoriale V2 con matrice associata, rispetto ad una base ortonormale B = (i, j),
di tipo (3.31) o di tipo (3.33) sono isometrie di V2 . Nel caso di matrici di tipo (3.31) si
ottengono le rotazioni R[θ] già considerate nell’ Esempio 6.32. Se si considera invece
un endomorfismo rθ del piano vettoriale V2 con matrice associata, rispetto ad una base
ortonormale B = (i, j), di tipo (3.33), ossia:
 
cos θ sin θ
Aθ = ,
sin θ − cos θ
si ha un’isometria di V2 tale che rθ ◦ rθ coincide con l’identità di V2 , ovvero per cui
rθ−1 = rθ .

Esercizio 6.27 Si consideri su R2 la struttura euclidea determinata dal prodotto scalare

(x1 , x2 ) · (x2 , y2 ) = x1 y1 + 4x2 y2 .

Verificare che l’automorfismo di R2 la cui matrice associata, rispetto alla base canonica
B = (e1 , e2 ) di R2 , è la matrice:
 √ 
3
 2 1 
A= ,
 
√ 
1 3
 

4 2
è un’isometria di R2 . Per quale motivo A non è una matrice ortogonale?

Soluzione Le equazioni di f, rispetto alla base B, sono:


 √
0 3
 x1 = 2 x1 + x2




 x0 = − 1 x + 3 x ,



2 1 2
4 2
296 Applicazioni Lineari

con (x01 , x02 ) = f ((x1 , x2 )). Per provare che f è un’isometria di (R2 , · ) è sufficiente
verificare che:
kf (x)k2 = (x01 )2 + 4(x02 )2 = x21 + 4x22 = kxk2 ,
con x = (x1 , x2 ) ∈ R2 .
La matrice A non è un elemento di O(2) perché non è associata ad una base ortonormale
(rispetto al prodotto scalare introdotto), infatti ke2 k = 2.

Esercizio 6.28 Nello spazio vettoriale euclideo (V, · ) di dimensione 4, riferito alla base
ortonormale B = (e1 , e2 , e3 , e4 ), sono dati i vettori:

a = 2e1 − e3 + 2e4 , b = e3 − e4 .

1. Detto c il versore di a, verificare che la funzione

f : V −→ V, x 7−→ x − 2(x · c)c

è un isometria di V .

2. Calcolare kf −1 (b)k ed il coseno dell’angolo θ tra i vettori f −1 (a) e f −1 (b).

Soluzione 1. La funzione f è un endomorfismo in quanto:

f (λx + µy) = (λx + µy) − 2 ((λx + µy) · c) c


= λx − 2(λx · c)c + µy − 2(µy · c)c
= λf (x) + µf (y),

per ogni λ, µ ∈ R e per ogni x, y ∈ V. Inoltre:

kf (x)k2 = f (x) · f (x) = (x − 2(x · c)c) · (x − 2(x · c)c)


= x · x − 4(x · c)(x · c) + 4(x · c)2 (c · c) = kxk2 .

2. Essendo f un’isometria, anche f −1 è un’isometria. Quindi:



kf −1 (b)k = kbk = 2,
a·b 1
cos θ = cos(f −1 (a)f
\ −1 (b)) = cos(ab)
c = = −√ .
kak kbk 2

Si lascia per esercizio la determinazione della matrice A associata a f rispetto alla base
B e la verifica del fatto che A sia una matrice ortogonale.
Capitolo 6 297

Osservazione 6.28 Siano (V, · ) uno spazio vettoriale euclideo di dimensione n e W un


iperpiano vettoriale di V. La funzione:

x, x∈W
g : V −→ V, x 7−→
−x, x ∈ W ⊥,

che coincide con l’identità su W e che associa ad ogni vettore del complemento orto-
gonale W ⊥ di W il proprio opposto, è un endomorfismo di V. Infatti, si può verificare
che:
1
(x + g(x))
2
coincide con la proiezione ortogonale di x su W. L’endomorfismo g prende il nome
di simmetria ortogonale o riflessione rispetto all’iperpiano vettoriale W. È un esercizio
verificare che g è un’isometria dello spazio vettoriale euclideo (V, · ) e che g ◦ g coincide
con l’identità di V. Infine, se c è un versore ortogonale a W, allora:

g(x) = x − 2(x · c)c

Quindi l’isometria f dell’esercizio precedente non è altro che la simmetria ortogonale


rispetto all’iperpiano vettoriale L(a)⊥ di equazione:

2x1 − x3 + 2x4 = 0.

Infine si può verificare che l’endomorfismo rθ del piano vettoriale V2 , considerato nel-
l’Esempio 6.35, è una simmetria ortogonale rispetto ad una retta vettoriale. Infatti, si
ha:  
2 θ θ θ
 1 − 2 sin 2 2 cos sin 
2 2 
Aθ = 


 θ θ θ 
2 cos sin 1 − 2cos2
2 2 2
   
1 0 θ
sin  
2 

θ θ
  
=   − 2  sin − cos .
  
   θ  2 2
0 1 − cos
2

Automorfismi di uno spazio vettoriale euclideo che mantengano invariata la misura degli
angoli tra coppie di vettori e le loro immagini, ma in generale non le norme dei vettori, so-
no dati dalle similitudini, di cui l’automorfismo (6.43) ne è un esempio. Più precisamente
si può enunciare la seguente definizione.
298 Applicazioni Lineari

Definizione 6.17 Sia f : V −→ V un automorfismo di uno spazio vettoriale euclideo


(V, · ), f prende il nome di similitudine di rapporto µ se:

kf (x)k = µkxk, x ∈ V,

da cui si deduce che µ deve essere un numero reale positivo non nullo.

Osservazione 6.29 Ogni isometria è una similitudine di rapporto 1. Mentre l’automorfi-


smo definito da (6.43) è una similitudine di rapporto 2.

Il teorema che segue, la cui dimostrazione è lasciata al Lettore per esercizio, riassume
alcune tra le principali proprietà delle similitudini.

Teorema 6.33 Sia (V, · ) uno spazio vettoriale euclideo di dimensione n.

1. Se f è una similitudine di V, allora la misura dell’angolo individuato dai vettori


x e y di V coincide con la la misura dell’angolo individuato dai vettori f (x) e
f (y), per ogni x, y ∈ V.

2. La matrice associata ad una similitudine di rapporto µ, rispetto ad una base orto-


normale di V, è data dal prodotto µA con A ∈ O(n).

Analogamente al caso reale, un endomorfismo f di uno spazio vettoriale hermitiano


(V, · ) si dice una trasformazione unitaria o operatore unitario o isometria complessa
se non cambia il prodotto hermitiano, cioè se vale la relazione (6.39). Come nel caso
delle isometrie si può dimostrare il teorema che segue.

Teorema 6.34 Sia (V, · ) uno spazio vettoriale hermitiano di dimensione n.

1. Un endomorfismo f : V −→ V è una trasformazione unitaria se e solo se:

kf (x)k = kxk, x ∈ V.

2. La composizione di due trasformazioni unitarie è una trasformazione unitaria.

3. L’inversa di una trasformazione unitaria è una trasformazione unitaria.

4. Un endomorfismo f di V è una trasformazione unitaria di V se e solo se le


immagini dei vettori di una base unitaria di V formano una base unitaria di V.

5. Un endomorfismo f di V è una trasformazione unitaria di V se e solo se la matrice


associata ad f, rispetto ad una base unitaria di V, è una matrice unitaria.
Capitolo 6 299

6. Un endomorfismo f di V è una trasformazione unitaria se e solo se f −1 = f † ,


dove f † è l’aggiunto di f .

La dimostrazione del Teorema 6.34 è analoga a quella del Teorema 6.32 tenendo però
conto che in questo caso vale la relazione (5.15).

Osservazione 6.30 Come per le isometrie, dai punti 2. e 3. del Teorema 6.34 segue che
l’insieme delle trasformazioni unitarie di uno spazio vettoriale hermitiano (V, · ) è un
gruppo (cfr. Oss. 2.2) rispetto alla composizione di funzioni. Inoltre, fissata una base
ortonormale B nello spazio vettoriale hermitiano (V, · ) allora per il punto 5. dello stesso
teorema si può stabilire, in modo naturale, un isomorfismo tra l’insieme delle trasforma-
zioni unitarie di (V, · ) ed il gruppo unitario U (n) delle matrici unitarie (cfr. Oss. 5.15)
associando ad ogni trasformazione unitaria f di V la matrice unitaria A = M B,B (f ).
300 Applicazioni Lineari
Capitolo 7

Diagonalizzazione

Questo capitolo è di importanza fondamentale per le sue svariate applicazioni in mate-


matica, in fisica e in tutte quelle discipline a carattere scientifico e non, ad esempio la
musica. Nel caso di un endomorfismo si vuole determinare, tra le infinite matrici ad esso
associate, almeno una particolarmente semplice: una matrice diagonale. In altri termini
si vuole determinare una base opportuna dello spazio vettoriale V, su cui l’endomorfismo
è definito, rispetto alla quale la matrice ad esso associata sia diagonale; si vedrà però nel
corso del capitolo che questo scopo non può essere sempre raggiunto.

7.1 Autovalori e autovettori di un endomorfismo


Si inizia con l’introdurre una definizione che diventerà fondamentale per lo scopo che ci
si è proposti.

Definizione 7.1 Sia f : V −→ V un endomorfismo di uno spazio vettoriale reale V. Un


vettore x non nullo di V si dice autovettore di f se esiste uno scalare λ ∈ R tale che:

f (x) = λx, (7.1)

λ si dice autovalore di f relativo all’autovettore x.

Osservazione 7.1 1. È evidente dalla definizione di autovettore la necessità di sce-


gliere x diverso dal vettore nullo di V, infatti λo = o per ogni λ ∈ R.

2. La precedente definizione può essere anche formulata nel modo seguente: λ ∈ R è


un autovalore dell’endomorfismo f se e solo se esiste un vettore x non nullo di V
per cui valga l’uguaglianza (7.1).

301
302 Diagonalizzazione

3. Si osservi che se x è un autovettore di f relativo all’autovalore λ, allora anche µx


è un autovettore di f relativo all’autovalore λ, per ogni numero reale µ 6= 0.

Si antepongono due facili proprietà agli esempi, per poter meglio capire la definizione
appena enunciata.

Teorema 7.1 Sia x un autovettore di un endomorfismo f di uno spazio vettoriale V,


allora l’autovalore λ ad esso relativo è unico.

Dimostrazione Per assurdo siano λ 6= λ0 due autovalori di f relativi allo stesso auto-
vettore x, allora f (x) = λx = λ0 x da cui (λ − λ0 )x = o, quindi segue la tesi.

Teorema 7.2 Sia λ un autovalore di un endomorfismo f di uno spazio vettoriale V, tutti


gli autovettori relativi a λ insieme con il vettore nullo di V costituiscono un sottospazio
vettoriale di V, indicato esplicitamente come:

Vλ = {x ∈ V | f (x) = λx},

detto autospazio di f relativo all’autovalore λ. Inoltre, Vλ è un sottospazio vettoriale


invariante per f.

Dimostrazione Verificare che Vλ è un sottospazio vettoriale di V invariante per f è un


facile esercizio che è conseguenza delle Definizioni 4.2 e 6.9.

Osservazione 7.2 Dal precedente teorema segue, quindi, che ogni combinazione lineare
αx + βy, con x, y autovettori di un endomorfismo f relativi allo stesso autovalore λ
e α, β ∈ R, è ancora un elemento dell’autospazio Vλ . Se si considerano, invece, due
autovettori x e y relativi a due autovalori distinti λ e µ (λ 6= µ), ossia tali che f (x) = λx
e f (y) = µy si ha che la generica loro combinazione lineare non è più un autovettore di
f, in quanto:
f (αx + βy) = λ(αx) + µ(βy).

Definizione 7.2 Dato un endomorfismo f di uno spazio vettoriale reale V, l’insieme


degli autovalori di f prende il nome di spettro di f .

Questa definizione giustifica la particolare denominazione del Teorema 7.8.

Esempio 7.1 L’identità id : V −→ V, definita nell’Esempio 6.1, ammette solo l’autova-


lore λ = 1. L’autospazio Vλ relativo all’autovalore λ = 1 coincide con V. Si osservi che
la matrice ad essa associata, rispetto ad una qualunque base di V, è la matrice unità, che è
quindi una matrice diagonale avente il numero 1 (l’autovalore) sulla diagonale principale.
Capitolo 7 303

Esempio 7.2 L’applicazione lineare nulla, definita nell’Esempio 6.2, ammette solo l’au-
tovalore λ = 0. L’unico autospazio Vλ , cioè l’autospazio relativo a λ = 0, coincide con
V. Si osservi che la matrice ad essa associata, rispetto ad una qualunque base di V, è la
matrice nulla. Pertanto, anche in questo caso la matrice è diagonale con l’autovalore 0
sulla diagonale principale.

Osservazione 7.3 Sia f un endomorfismo non iniettivo di uno spazio vettoriale V. Dal
Teorema 6.8 si ha che ker f 6= {o}, allora f ammette l’autovalore 0 e l’autospazio ad
esso relativo coincide con ker f. Viceversa, se f è iniettivo, allora ker f = {o}, quindi il
numero 0 non può essere un autovalore di f .

Esempio 7.3 Si consideri, nello spazio dei vettori ordinari V3 , l’endomorfismo:

f : V3 −→ V3 , x 7−→ (x · u)u,

con u vettore fissato e “·” prodotto scalare. Se u = o si ha l’endomorfismo nullo, già


considerato in precedenza. Se u è un versore f è la funzione che ad ogni vettore x di V3
associa la proiezione ortogonale di x sulla retta vettoriale L(u). Pertanto si vede che gli
unici autovalori di f sono λ1 = 0 e λ2 = 1. Infatti, si ha che f (x) = o se e solo se x
è un vettore perpendicolare a u. Quindi λ1 = 0 è un autovalore di f e l’autospazio ad
esso relativo è Vλ1 = ker f, che coincide con il piano vettoriale ortogonale ad u. D’altra
parte, l’unica altra possibilità per avere f (x) = λx è f (x) = x, che si ottiene solo se x
è parallelo ad u, pertanto esiste anche l’autovalore λ2 = 1 e l’autospazio ad esso relativo
è la retta vettoriale Vλ2 = L(u). Si osservi che vale la decomposizione:

Vλ1 ⊕ Vλ2 = V3

e Vλ2 = Vλ⊥1 .

Esempio 7.4 A titolo di esempio si procede con il calcolo degli eventuali autovalori della
rotazione, in senso antiorario, di angolo θ in un piano vettoriale V2 , (cfr. Es. 6.24) vale a
dire della trasformazione lineare:

R[θ] : V2 −→ V2 , x 7−→ R[θ](x)

le cui equazioni, rispetto ad una base ortonormale B = (i, j) di V2 , sono:


 0
x = x cos θ − y sin θ
y 0 = x sin θ + y cos θ,

dove x = xi + yj e R[θ](x) = x0 i + y 0 j. Se λ ∈ R è un autovalore di R[θ] ed x è un


autovettore ad esso relativo, allora R[θ](x) = λx, quindi:
304 Diagonalizzazione


x cos θ − y sin θ = λx
x sin θ + y cos θ = λy.
Risolvendo il precedente sistema lineare omogeneo nelle incognite x e y si ottiene che
esistono soluzioni non nulle se e solo se il rango della matrice dei coefficienti:
 
cos θ − λ − sin θ
sin θ cos θ − λ

è 1, ossia se e solo se il determinante di tale matrice è uguale a zero, in altri termini, se e


solo se:
λ2 − 2 cos θ λ + 1 = 0.
Questa equazione di secondo grado in λ ha soluzioni reali se e solo se cos θ = ±1, da cui
segue ciò che era già intuibile geometricamente, ossia solo le rotazioni di angolo 0 e π
ammettono autovalori. Tali rotazioni coincidono, rispettivamente, con l’identità id di V2 ,
già studiata nell’Esempio 7.1 e con l’endomorfismo −id di equazioni:
 0
x = −x
y 0 = −y

che ammette solo l’autovalore −1 perché definito da (−id)(x) = −x, x ∈ V2 (cfr. Par.
6.4) e che si può considerare geometricamente come un ribaltamento del vettore x sulla
retta che lo contiene.

Prima di procedere con il calcolo degli autovalori e degli autovettori di un generico en-
domorfismo, vale a dire prima di introdurre il procedimento che generalizza l’esempio
appena esposto, si vuole dimostrare con il Teorema 7.3 una conseguenza importante delle
definizioni date e precisamente: la somma degli autospazi di un endomorfismo è diretta.
A titolo di esercizio, si inizia con il provare questa proprietà per la somma di due auto-
spazi. In questo caso, dimostrare che la somma di due autospazi Vλ1 + Vλ2 , con λ1 6= λ2 ,
è diretta equivale a provare che Vλ1 ∩ Vλ2 = {o}, (cfr. Teor. 4.5). Se per assurdo esiste
x ∈ Vλ1 ∩ Vλ2 , x 6= o, allora f (x) = λ1 x = λ2 x da cui segue (λ1 − λ2 )x = o, quindi
λ1 = λ2 , che è assurdo. Per dimostrare questa proprietà in generale è però necessario
anteporre il lemma che segue, la cui dimostrazione è rimandata al Paragrafo 7.6.3.

Lemma 7.1 Siano λ1 , λ2 , . . . , λk autovalori distinti di un endomorfismo f : V −→ V di


uno spazio vettoriale V e siano Vλ1 , Vλ2 , . . . , Vλk gli autospazi ad essi corrispondenti.
Scelti in modo arbitrario gli autovettori x1 , x2 , . . . , xk , uno per ciascun autospazio ad
esso relativo (xi ∈ Vλi , i = 1, 2, . . . , k ), allora l’insieme I = {x1 , x2 , . . . , xk } è libero.

Come conseguenza si ha il seguente teorema.


Capitolo 7 305

Teorema 7.3 Sia f un endomorfismo di uno spazio vettoriale reale V e siano λ1 , λ2 , . . . ,


λk gli autovalori distinti di f, allora la somma degli autospazi Vλ1 + Vλ2 + . . . + Vλk è
diretta.

Dimostrazione Provare che la somma Vλ1 + Vλ2 + . . . + Vλk è diretta equivale a dimo-
strare che ogni elemento x ∈ Vλ1 + Vλ2 + . . . + Vλk ha un’unica decomposizione come
somma di vettori di ciascuno degli autospazi addendi (cfr. Def. 4.6). Sia allora x apparte-
nente a Vλ1 +Vλ2 +. . .+Vλk , si supponga per assurdo che x ammetta due decomposizioni
diverse del tipo:

x = x 1 + x2 + . . . + xk = y1 + y2 + . . . + y k ,

dove xi , yi ∈ Vλi , i = 1, 2, . . . , k, allora si ha:

(x1 − y1 ) + (x2 − y2 ) + . . . + (xk − yk ) = o

in evidente contrasto con il Lemma 7.1.

Osservazione 7.4 Si osservi che il teorema appena enunciato afferma che, considerati
tutti gli autovalori distinti λ1 , λ2 , . . . , λk di f , allora:

Vλ1 ⊕ Vλ2 ⊕ . . . ⊕ Vλk ⊆ V ;

lo studio dell’uguaglianza tra questi due insiemi sarà oggetto del Paragrafo 7.3.

7.2 Determinazione degli autovalori e degli autospazi


Sia f : V −→ V un endomorfismo di uno spazio vettoriale reale V. Si supponga che
dim(V ) = n e che B = (v1 , v2 , . . . , vn ) sia una base di V. Indicate con A ∈ Rn,n la
matrice associata ad f rispetto alla base B e con X ∈ Rn,1 la matrice colonna delle
componenti di un vettore x di V rispetto alla base B, e tenendo conto delle equazioni
dell’endomorfismo f scritte in forma matriciale (cfr. (6.4)), la formula (7.1) si traduce,
in componenti, nella relazione:
AX = λX
vale a dire in:
(A − λI)X = O, (7.2)
dove I ∈ Rn,n indica la matrice unità e O ∈ Rn,1 la matrice colonna nulla. Dalla teoria
dei sistemi lineari omogenei descritta nel Paragrafo 1.2.1, segue che il sistema lineare
306 Diagonalizzazione

omogeneo (7.2) ammette soluzioni non nulle se e solo se rank(A − λI) < n, ossia se e
solo se:
det(A − λI) = 0. (7.3)
Si perviene allo stesso risultato facendo uso delle definizioni di somma e di prodotto per
scalari di endomorfismi introdotte nel Paragrafo 6.4 e riscrivendo (7.1) come:

(f − λ id)(x) = o,

dove id indica l’identità di V. Pertanto gli autovettori di f, relativi all’autovalore λ,


coincidono con gli elementi, diversi dal vettore nullo, di ker(f − λ id), cioè:

Vλ = ker(f − λ id).

Si procede ora con lo studio dettagliato dell’equazione (7.3) che prende il nome di equa-
zione caratteristica della matrice A; (7.3) è anche detta equazione caratteristica dell’en-
domorfismo f, infatti si dimostrerà nel Teorema 7.4 che non dipende dalla scelta della
matrice associata ad f , ovvero che tutte le matrici associate allo stesso endomorfismo
(matrici simili) hanno lo stesso polinomio caratteristico. Il polinomio det(A − λI) a
primo membro di (7.3) è detto polinomio caratteristico di A (o dell’endomorfismo f ) e
lo si indicherà con P (λ). Pertanto, gli autovalori di f coincidono con le radici reali di
P (λ). Per ogni radice reale λ = α, l’autospazio corrispondente Vα è formato dai vet-
tori x di V tali che f (x) = αx, ossia dalle soluzioni X del sistema lineare omogeneo
(A − αI)X = O. Per questo motivo anche se il calcolo degli autovalori è riferito ad un
endomorfismo f spesso si parla di calcolo degli autovalori di una matrice quadrata A,
intendendosi come tale il calcolo degli autovalori dell’endomorfismo f a cui la matrice
A è associata rispetto ad una base di V.

Con l’esempio che segue si vuole determinare, per iniziare a capire il tipo di calcolo che
si deve svolgere, il polinomio caratteristico nel caso particolare delle matrici quadrate di
ordine 2, ossia nel caso di endomorfismi di uno spazio vettoriale reale di dimensione 2.

Esempio 7.5 Sia:  


a11 a12
A= ∈ R2,2 ,
a21 a22
il suo polinomio caratteristico è:

a −λ a12
P (λ) = det(A − λI) = 11

,
a21 a22 − λ

da cui segue:
det(A − λI) = λ2 − tr(A)λ + det(A). (7.4)
Capitolo 7 307

Con un calcolo analogo si ha che il polinomio caratteristico di una matrice quadrata A di


ordine n è dato da:

P (λ) = det(A − λI) = (−1)n λn + (−1)n−1 tr(A)λn−1 + . . . + det(A).

Infatti:

1. ciascun addendo nel calcolo del determinante della matrice quadrata A − λI di


ordine n è il prodotto di n fattori appartenenti a righe e colonne diverse (cfr. Par.
2.8), quindi il polinomio caratteristico in λ che si ottiene avrà necessariamente
grado n.

2. Il termine di grado massimo del polinomio caratteristico si ha solo dal prodotto


degli elementi sulla diagonale principale:

(a11 − λ)(a22 − λ) . . . (ann − λ),

quindi il coefficiente di λn deve essere (−1)n .

3. Anche il termine di grado n − 1 del polinomio caratteristico si ottiene solo dal pro-
dotto degli elementi della diagonale principale (provare, per esempio, a fare il cal-
colo esplicito nel caso particolare delle matrici quadrate di ordine 3), è abbastanza
facile notare che il suo coefficiente deve essere (−1)n−1 tr(A).

4. Il termine noto del polinomio caratteristico si ottiene ponendo λ = 0 nell’espres-


sione di P (λ), quindi deve essere det(A), cioè:

P (0) = det(A).

Di conseguenza l’equazione (7.3) ammette la soluzione λ = 0 se e solo se si ha


det(A) = 0, in assoluto accordo con ciò che era già stato osservato (cfr. Oss. 7.3),
vale a dire esiste l’autovalore λ = 0 di f se e solo se ker f 6= {o}.

5. Per il Teorema Fondamentale dell’Algebra in cui si afferma che ogni polinomio di


grado n, a coefficienti complessi, ammette n radici complesse, contate con le loro
molteplicità, segue che ogni matrice A ∈ Rn,n ammette al più n autovalori. Per
la dimostrazione del Teorema Fondamentale dell’Algebra si veda ad esempio [5].
Si ricorda che una radice α di un polinomio p(λ) a coefficienti reali o complessi si
dice avere molteplicità h se il polinomio (λ − α)h divide p(λ) ma (λ − α)h+1 non
divide p(λ).

6. Se un’equazione a coefficienti reali in un’incognita ammette una radice complessa,


allora ammette anche una seconda radice complessa che è la complessa coniugata
308 Diagonalizzazione

della precedente (si pensi alla formula risolutiva delle equazioni di secondo grado),
pertanto una matrice reale quadrata di ordine pari può non ammettere autovalori
(non si dimentichi che si sta solo trattando il caso degli spazi vettoriali reali), mentre
una matrice reale quadrata di ordine dispari ammette almeno un autovalore.

Esempio 7.6 La matrice quadrata di ordine 2:


 
2 2
A= ,
−1 1

ha come polinomio caratteristico:

det(A − λI) = λ2 − 3λ + 4

che non ha radici reali, pertanto la matrice A non ammette autovalori.

Esempio 7.7 Sia f : R4 −→ R4 l’endomorfismo che, rispetto alla base canonica B di


R4 , è associato alla matrice:
 
−2 0 0 0
 0 −2 6 6 
A=
 0
,
0 3 3 
0 0 −2 −2

si vogliono determinare gli autovalori e gli autospazi di f (o, equivalentemente, gli


autovalori e gli autospazi di A). Si inizia con il calcolo dell’equazione caratteristica:

−2 − λ 0 0 0

0 −2 − λ 6 6
det(A − λI) = =0
0 0 3−λ 3

0 0 −2 −2 − λ
e si ha:

det(A − λI) = λ(λ − 1)(λ + 2)2 = 0


da cui si ottengono tre autovalori λ1 = 0, λ2 = 1, λ3 = −2. Si avranno quindi tre
autospazi, si procede al loro calcolo uno alla volta.

Vλ1 coincide con ker f, che si ottiene riducendo per righe la matrice A. Si lasciano i
dettagli per esercizio, si ha rank(A) = 3, quindi dim(ker f ) = dim(Vλ1 ) = 1 e:

Vλ1 = L((0, 0, −1, 1)).


Capitolo 7 309

Per λ2 = 1 si ottiene:  
−3 0 0 0
 0 −3 6 6 
A−I =
 0
,
0 2 3 
0 0 −2 −3
da cui rank(A − I) = 3 e, quindi, risolvendo il sistema lineare omogeneo corrispondente
all’equazione matriciale (A − I)X = 0, si perviene a:

Vλ2 = L((0, 2, 3, −2)).

Nel caso di λ3 = −2 invece:


 
0 0 0 0
 0 0 6 6 
A + 2I = 
 0

0 5 3 
0 0 −2 0

ha rank(A + 2I) = 2 e quindi:

Vλ3 = L((1, 0, 0, 0), (0, 1, 0, 0)).

Il risultato appena trovato sugli autovalori e autospazi di f sarà ridiscusso nell’Osserva-


zione 7.6.

Si dimostrerà ora il teorema già annunciato, vale a dire matrici simili hanno lo stesso
polinomio caratteristico.

Teorema 7.4 Sia f un endomorfismo di uno spazio vettoriale reale V di dimensione n.


Il polinomio caratteristico di f non dipende dalla base di V scelta per la sua determina-
zione.

Dimostrazione Considerate due basi B e B 0 di V, si indichino con A = M B,B (f ) e


0 B0 ,B0
A =M (f ) le matrici, quadrate di ordine n, associate ad f rispetto alle due basi B e
B 0 . Dalla relazione (6.10) si ha che le due matrici A e A0 sono simili e pertanto si ottiene
la tesi provando che:
det(A − λI) = det(P −1AP − λI)
con P matrice, invertibile di ordine n, del cambiamento di base da B a B 0 , I matrice
unità di ordine n e λ ∈ R. Usando le proprietà del prodotto di matrici, la formula di
Binet e il calcolo del determinante dell’inversa di una matrice (cfr. Teor. 2.16) si ha:
310 Diagonalizzazione

det(P −1AP − λI) = det(P −1 (A − λI)P )


= det(P −1 ) det(A − λI) det(P )
= det(A − λI),

dopo aver tenuto conto che λI = P −1 λIP e della proprietà det(P −1 ) = det(P )−1 .
Osservazione 7.5 Si osservi che esistono matrici che hanno lo stesso polinomio caratte-
ristico ma che non sono simili, per esempio le due matrici:
   
1 0 1 1
I= , B= ,
0 1 0 1
in quanto P −1 IP = I , per ogni matrice invertibile P.
Il teorema che segue stabilisce un’importante relazione tra la dimensione di un autospazio
e la molteplicità del proprio autovalore nel polinomio caratteristico.
Teorema 7.5 Sia f un endomorfismo di uno spazio vettoriale reale V, sia α un suo
autovalore di molteplicità mα e sia Vα l’autospazio relativo ad α, allora:
1 ≤ dim(Vα ) ≤ mα .
Dimostrazione Poiché α è un autovalore, allora dim(Vα ) ≥ 1. Per dimostrare la
seconda disuguaglianza della tesi si suppongano dim(V ) = n e dim(Vα ) = k. Se k = n,
la tesi è ovvia perché f (x) = αx, per ogni x ∈ V e pertanto Vα = V. Sia, quindi, k < n
e sia (a1 , a2 , . . . , ak ) una base di Vα . Si completi (cfr. Teor. 4.15) tale insieme libero fino
ad ottenere la base B di V data da B = (a1 , a2 , . . . , ak , bk+1 , . . . , bn ). Di conseguenza
la matrice associata A = M B,B (f ) assume la forma seguente:
 
α 0 ... 0 a1k+1 ... a1n
 0 α ... 0 a2k+1 ... a2n 
 .. .. . . .. .. ... .. 

 . . . . . .


A= 0 0 ... α akk+1 . . . akn
 

0 0 ... 0 ak+1k+1 . . . ak+1n
 
 
 .. .. . . .. .. .. .. 
 . . .
. . . . 
0 0 . . . 0 ank+1 . . . ann
il cui polinomio caratteristico è:
det(A − λI) = (α − λ)k Q(λ)
dove Q(λ) è un polinomio in λ di grado n − k , ciò significa che la molteplicità di α è
almeno k .
Capitolo 7 311

Osservazione 7.6 Si osservi che nell’Esempio 7.7 si sono ottenuti tre autovalori distinti
λ1 = 0 con molteplicità mλ1 = 1, λ2 = 1 con molteplicità mλ2 = 1 e λ3 = −2 con
molteplicità mλ3 = 2. I tre autospazi Vλ1 , Vλ2 , Vλ3 avevano, rispettivamente, dimensione
1, 1, 2 e pertanto:
Vλ1 ⊕ Vλ2 ⊕ Vλ3 = R4 .
Inoltre, gli autovettori di f (o di A):

v1 = (0, 0, −1, 1), v2 = (0, 2, 3, −2), v3 = (1, 0, 0, 0), v4 = (0, 1, 0, 0)


0 0
formano una base B 0 di R4 . La matrice M B ,B (f ) associata ad f rispetto alla base
B 0 = (v1 , v2 , v3 , v4 ) di R4 è la matrice diagonale:
 
0 0 0 0
 0 1 0 0 
D=  0 0 −2
,
0 
0 0 0 −2
in quanto:

f (v1 ) = o, f (v2 ) = v2 , f (v3 ) = −2v3 , f (v4 ) = −2v4 .

Di conseguenza A è simile alla matrice diagonale D, cioè P −1AP = D, dove P è la


matrice del cambiamento di base dalla base canonica B di R4 alla base B 0 di R4 formata
dai quattro autovettori di f prima indicati.

Esercizio 7.1 Si calcolino gli autovalori e gli autospazi della matrice:


 
2 0 0
A =  0 1 1 .
0 0 1

Soluzione Il polinomio caratteristico della matrice A è dato da:



2−λ 0 0

det(A − λI) = 0 1−λ 1 = (2 − λ)(1 − λ)2 .
0 0 1−λ
Si ottengono gli autovalori λ1 = 2 con molteplicità mλ1 = 1 e λ2 = 1 con molteplicità
mλ2 = 2. Gli autospazi relativi ai due autovalori sono:

Vλ1 = L((1, 0, 0)), Vλ2 = L((0, 1, 0)).

In questo caso si ha quindi che Vλ1 ⊕ Vλ2 è un sottospazio vettoriale di R3 di dimensione


2 e pertanto Vλ1 ⊕ Vλ2 6= R3 .
312 Diagonalizzazione

7.3 Endomorfismi diagonalizzabili


Matrici diagonalizzabili
Il paragrafo inizia con due importanti definizioni, palesemente equivalenti.

Definizione 7.3 Un endomorfismo f : V −→ V di uno spazio vettoriale reale V si dice


diagonalizzabile (o anche semplice) se esiste una base di V rispetto alla quale la matrice
associata ad f è diagonale.

Definizione 7.4 Una matrice quadrata A ∈ Rn,n si dice diagonalizzabile se esiste una
matrice invertibile P di ordine n tale che:

P −1AP = D,

con D matrice diagonale di ordine n, o in altri termini, se A è simile ad una matrice


diagonale.

Nei precedenti paragrafi di questo capitolo si sono incontrati alcuni esempi di endomor-
fismi diagonalizzabili, quali l’applicazione identità, l’applicazione nulla, l’Esempio 7.7.
In questo paragrafo si cercherà di precisare quando un endomorfismo è diagonalizzabile
e come si procede, in pratica, alla diagonalizzazione di una matrice quadrata, dopo aver
controllato che ciò sia possibile.

Il primo teorema (la cui dimostrazione è conseguenza immediata della Definizione 7.3)
provvede a dare un metodo pratico, utile per riconoscere se un endomorfismo è diagona-
lizzabile.

Teorema 7.6 Un endomorfismo f : V −→ V di uno spazio vettoriale reale V è diago-


nalizzabile se e solo se esiste una base di V formata da autovettori di f .

Osservazione 7.7 Dal precedente teorema è quindi evidente che se f è un endomorfismo


diagonalizzabile di uno spazio vettoriale reale V allora una base di V, rispetto alla quale
la matrice associata ad f sia diagonale, è formata da autovettori.

Si possono perciò enunciare quelli che usualmente vengono indicati come i criteri di
diagonalizzazione.

Teorema 7.7 Sia f : V −→ V un endomorfismo di uno spazio vettoriale reale V. Le


seguenti affermazioni sono equivalenti:

1. f è diagonalizzabile.
Capitolo 7 313

2. V = Vλ1 ⊕ Vλ2 ⊕ . . . ⊕ Vλk , dove λ1 , λ2 , . . . , λk sono tutti gli autovalori distinti di


f e Vλ1 , Vλ2 , . . . , Vλk i relativi autospazi.
3. dim(V ) = dim(Vλ1 ) + dim(Vλ2 ) + . . . + dim(Vλk ), dove λ1 , λ2 , . . . , λk sono tutti
gli autovalori distinti di f e Vλ1 , Vλ2 , . . . , Vλk i relativi autospazi.
4. Ogni radice del polinomio caratteristico P (λ) di f è reale e per ogni radice λi
(cioè per ogni autovalore di f ) di molteplicità mλi la dimensione dell’autospazio
Vλi coincide con la molteplicità mλi , in formule:

dim(Vλi ) = mλi , i = 1, 2, . . . , k.

Dimostrazione Per dimostrare l’equivalenza delle quattro affermazioni si proveranno


le seguenti implicazioni:

1. =⇒ 4. =⇒ 3. =⇒ 2. =⇒ 1.

Per dimostrare l’implicazione 1. =⇒ 4. si supponga che f sia diagonalizzabile, cioè che


esista una base B di V formata da autovettori e quindi tale che la matrice A associata ad
f rispetto alla base B sia diagonale, con gli autovalori di f come elementi della diagonale
principale, scritti in ordine, in corrispondenza ai vettori della base B. Se si indicano con
λ1 , λ2 , . . . , λk gli autovalori distinti di f e con mλ1 , mλ2 , . . . , mλk le relative molteplicità,
si ha che il polinomio caratteristico di f è dato da:

P (λ) = det(A − λI) = (λ1 − λ)mλ1 . . . (λk − λ)mλk ,

da cui segue che ogni radice del polinomio caratteristico è reale. Inoltre, per ogni autova-
lore λi si ha:
dim(Vλi ) = n − rank(A − λi I) = mλi .

Per dimostrare l’implicazione 4. =⇒ 3. si può osservare che, per ipotesi, ogni radice del
polinomio caratteristico è reale e quindi la somma delle moltiplicità delle radici distinte,
cioè degli autovalori distinti, coincide con il grado del polinomio caratteristico, ovvero:

mλ1 + mλ2 + . . . + mλk = dim(V )

e quindi:
dim(Vλ1 ) + dim(Vλ2 ) + . . . + dim(Vλk ) = dim(V ).

Per dimostrare l’implicazione 3. =⇒ 2., tenendo conto che per il Teorema 7.3 la somma
di tutti gli autospazi relativi agli autovalori distinti λ1 , λ2 , . . . , λk è diretta e che dall’affer-
mazione 3. la somma delle dimensioni degli autospazi è pari alla dimensione di V, segue
che la somma di tutti gli autospazi coincide necessariamente con V.
314 Diagonalizzazione

Per provare l’ultima implicazione 2. =⇒ 1. è sufficiente osservare che, se per ogni


autospazio Vλi , i = 1, 2, . . . , k si considera una base Bi , allora per il Teorema 4.17
l’unione:
B1 ∪ B2 ∪ . . . ∪ Bk
è una base di V in quanto la somma degli autospazi è diretta.

Osservazione 7.8 La decomposizione 2. del teorema precedente è anche nota come de-
composizione spettrale di V.

Osservazione 7.9 In base ai precedenti criteri segue che l’endomorfismo f dell’Esempio


7.7 è diagonalizzabile (o equivalentemente la sua matrice associata A è diagonalizzabi-
le). Le matrici diagonali simili ad A sono tutte le possibili matrici diagonali aventi sulla
diagonale principale gli autovalori di A. (Quante sono in totale?)
L’endomorfismo dell’Esercizio 7.1 non è diagonalizzabile, in quanto per l’autovalore
λ2 = 1 si ha che dim(Vλ2 ) < mλ2 .

Come conseguenza immediata del Teorema 7.7 si ha il seguente corollario, la cui dimo-
strazione è lasciata al Lettore come esercizio.

Corollario 7.1 Se f è un endomorfismo di uno spazio vettoriale reale V di dimensione


n con n autovalori distinti, allora f è diagonalizzabile.

7.4 Il teorema spettrale


Nel caso particolare delle matrici simmetriche si può dimostrare il fondamentale teorema
spettrale.

Teorema 7.8 – Teorema Spettrale – 1. Sia A una matrice simmetrica, allora A è


diagonalizzabile, esistono quindi una matrice diagonale D e una matrice inverti-
bile P tali che:
D = P −1AP.

2. Sia A una matrice simmetrica, è sempre possibile individuare una matrice ortogo-
nale Q tale che:
D = Q−1AQ = t QAQ,
cioè A è diagonalizzabile mediante una matrice ortogonale.
Capitolo 7 315

3. Se A ∈ Rn,n è una matrice diagonalizzabile e se esiste una matrice Q ortogonale


tale che
t
QAQ = D,
con D matrice diagonale, allora A è simmetrica.

Si ricordi che il Teorema 6.17 afferma che, fissata una base ortonormale B in uno spa-
zio vettoriale euclideo (V, · ), la matrice M B,B (f ) associata ad un endomorfismo f di V
è simmetrica se e solo se l’endomorfismo f è autoaggiunto. Di conseguenza, si dimo-
strerà, in questo paragrafo, che è possibile formulare il Teorema Spettrale 7.8 in termini
di endomorfismi autoaggiunti e che le due formulazioni sono equivalenti se e solo se si
considerano basi ortonormali dello spazio vettoriale euclideo (V, · ). Più precisamente si
dimostrerà il seguente teorema.

Teorema 7.9 – Teorema Spettrale – 1. Sia f : V −→ V un endomorfismo autoag-


giunto di uno spazio vettoriale euclideo (V, · ) e siano λ1 , λ2 , . . . , λk tutti i suoi
autovalori distinti, allora la somma diretta di tutti gli autospazi coincide con V :
Vλ1 ⊕ Vλ2 ⊕ . . . ⊕ Vλk = V
e gli autospazi sono a due ortogonali, vale a dire:
Vλi ⊥ Vλj , i 6= j, i, j = 1, 2, . . . , k,
nel senso che per ogni x ∈ Vλi e per ogni y ∈ Vλj si ha x · y = 0.

2. Sia (V, · ) uno spazio vettoriale euclideo e sia f un endomorfismo diagonalizzabile


di V e V = Vλ1 ⊕ Vλ2 ⊕ . . . ⊕ Vλk la relativa decomposizione spettrale, dove
Vλi indica l’autospazio di f relativo all’autovalore λi . Si supponga che per ogni
i, j , i 6= j , i, j = 1, 2, . . . , k si abbia Vλi ⊥ Vλj . Allora f è un endomorfismo
autoaggiunto di (V, · ).

Osservazione 7.10 1. Si osservi che le due formulazioni del Teorema Spettrale 7.8 e
7.9 sono equivalenti solo se si sceglie nello spazio vettoriale euclideo (V, · ) una
base ortonormale. Pertanto dalla dimostrazione del Teorema 7.9 segue la dimostra-
zione del Teorema 7.8.
2. Per dimostrare il punto 3. del Teorema Spettrale 7.8 si può anche osservare che
dal fatto che esiste una matrice Q ortogonale tale che t QAQ = D, si deduce
A = QD t Q e quindi:
t
A = t (QD t Q) = QD t Q = A,
in quanto ovviamente tD = D.
316 Diagonalizzazione

Si inizia con enunciare una prima proprietà sulle radici del polinomio caratteristico di una
matrice simmetrica, la cui dimostrazione è rimandata al Paragrafo 7.6 in quanto essa segue
dal fatto che si dovrà considerare uno spazio vettoriale definito sul campo dei numeri
complessi C, invece che su R.

Lemma 7.2 Tutte le radici del polinomio caratteristico di una matrice simmetrica A di
ordine n sono reali, o in modo equivalente, tutte le radici del polinomio caratteristi-
co di un endomorfismo autoaggiunto f di uno spazio vettoriale euclideo (V, · ) sono
reali. In altri termini, se λ1 , λ2 , . . . , λk sono tutti gli autovalori distinti di un endomor-
fismo autoaggiunto f di V con rispettive molteplicità mλ1 , mλ2 , . . . , mλk , allora si ha
l’uguaglianza:
mλ1 + mλ2 + . . . + mλk = n,
dove n è la dimensione di V.

In generale, per un endomorfismo qualsiasi di uno spazio vettoriale euclideo (V, · ) si


può solo affermare che due autovettori relativi a due autovalori distinti non sono paralleli
(cfr. Lemma 7.1). Nel caso particolare di endomorfismi autoaggiunti si può dimostrare
l’ortogonalità tra i due autovettori. Si ha infatti il seguente teorema.

Teorema 7.10 Se λ1 e λ2 sono due autovalori distinti di un endomorfismo autoaggiunto


f di uno spazio vettoriale euclideo (V, · ), allora i relativi autospazi Vλ1 e Vλ2 sono
ortogonali tra di loro, ossia:
x · y = 0,
per ogni x ∈ Vλ1 e per ogni y ∈ Vλ2 .

Dimostrazione Considerati x ∈ Vλ1 e y ∈ Vλ2 , dalla definizione di endomorfismo


autoaggiunto segue:

f (x) · y = (λ1 x) · y = λ1 (x · y) = x · f (y) = x · (λ2 y) = λ2 (x · y) = λ2 (x · y).

Di conseguenza (λ1 − λ2 )(x · y) = 0, ma λ1 6= λ2 , perciò x · y = 0.

Dimostrazione del Teorema 7.9 1. Siano λ1 , λ2 , . . . , λk tutti gli autovalori distinti di


f e siano Vλ1 , Vλ2 , . . . , Vλk i relativi autospazi, che sono tutti in somma diretta (cfr.
Teor. 7.3). Sia:
H = Vλ1 ⊕ Vλ2 ⊕ . . . ⊕ Vλk ,
si perviene alla tesi se si dimostra che H = V. Poiché ogni autospazio Vλi , i = 1,
2, . . . , k , è invariante per f (cfr. Teor. 7.2), segue dal Teorema 6.14 che anche H
Capitolo 7 317

è invariante per f , ossia:


f (H) ⊆ H.
Si supponga per assurdo che H 6= V , allora:
V = H ⊕ H⊥ ,

dove H⊥ indica il complemento ortogonale di H in V e H⊥ 6= {o}. Per il Teorema


6.18 si ha che anche H⊥ è un sottospazio vettoriale di V invariante per f. Sia:
f 0 : H⊥ −→ H⊥
la restrizione di f a H⊥ , definita da (6.18), cioè da f 0 (x) = f (x), con x in H⊥ .
Essendo f è autoaggiunto, anche f 0 è autoaggiunto sullo spazio vettoriale euclideo
(H⊥ , · ) dotato dello stesso prodotto scalare di V. Poiché tutte le radici del polino-
mio caratteristico di f 0 sono reali (cfr. Lemma 7.2) esiste un vettore x ∈ H⊥ che
è un autovettore di f 0 , quindi x è un autovettore di f , da cui l’assurdo. L’ortogo-
nalità tra gli autospazi segue dal Teorema 7.10.
2. Si tratta di dimostrare che:
f (x) · y = x · f (y),
per ogni x, y ∈ V. Dalla Definizione 4.6 segue che esiste una sola decomposizione
dei vettori x e y del tipo:
x = x1 + x 2 + . . . + xk , y = y1 + y2 + . . . + y k ,
con xi , yi ∈ Vλi , i = 1, 2, . . . , k. Si ha:
f (x) · y = f (x1 + x2 + . . . + xk ) · (y1 + y2 + . . . + yk )
= f (x1 ) · y1 + f (x2 ) · y2 + . . . + f (xk ) · yk ,
in quanto, per ipotesi, f (xi ) · yj = 0, per ogni i, j = 1, 2, . . . , k, i 6= j. Poiché
f (xi ) = λi xi , la relazione precedente diventa:
f (x) · y = λ1 x1 · y1 + λ2 x2 · y2 + . . . + λk xk · yk .
Procedendo con un conto analogo a secondo membro si perviene alla tesi.

Osservazione 7.11 Come già affermato, il Teorema 7.8 è conseguenza del Teorema 7.9.
Ma il Teorema 7.9 afferma che ogni matrice associata ad un endomorfismo autoaggiunto
di uno spazio vettoriale euclideo (V, · ) è diagonalizzabile, anche se la matrice associata
non è simmetrica. Un esempio significativo è studiato nell’Esercizio 8.19. Nel Teorema
8.28 sono determinate tutte le matrici associate ad un endomorfismo autoaggiunto rispetto
ad una base qualsiasi di V.
318 Diagonalizzazione

A corretta conclusione di questa trattazione si riportano i due teoremi seguenti.

Corollario 7.2 Sia f un endomorfismo autoaggiunto di uno spazio vettoriale euclideo


(V, · ), allora esiste una base ortonormale di V formata da autovettori.

Dimostrazione Siano λ1 , λ2 , . . . , λk tutti gli autovalori (distinti) di f e Vλ1 , Vλ2 , . . . , Vλk


i relativi autospazi. Poiché f è autoaggiunto, f è diagonalizzabile (cfr. Teor. 7.9). Dalla
decomposizione:
V = Vλ1 ⊕ Vλ2 ⊕ . . . ⊕ Vλk
e dal fatto che gli autospazi sono ortogonali (cfr. Lemma 7.10) si può determinare una
base ortonormale di V formata da autovettori di f come unione di basi ortonormali per
ogni autospazio Vλi . Più precisamente, si trova una base per ciascun autospazio Vλi , i =
1, 2, . . . , k e la si normalizza con il metodo di Gram–Schmidt (cfr. Teor. 5.5), ottenendo
in questo modo una base ortonormale Bi per ogni autospazio Vλi . Per il Teorema 7.10,
se λi 6= λj allora Vλi ⊥ Vλj , pertanto l’unione delle basi ortonormali B1 ∪ . . . ∪ Bk cos