Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
7. Autovalori e autovettori.
2 2 2
Sia f : VO → VO un’applicazione lineare; ci chiediamo se ci siano vettori v ∈ VO tali che f (v) sia un
multiplo di v (ciò equivale a dire che la f non fa cambiare la direzione di v).
Ad esempio, vediamo questa cosa in R2 ; sia f (x, y) = (2x, x + 2y). Allora per tutti i vettori v = (0, y)
si ha f (v) = 2v, infatti f (0, y) = (0, 2y).
Vogliamo generalizzare tale nozione ad uno spazio vettoriale qualsiasi:
Definizione 7.1: Sia f : V → V un’applicazione lineare da uno spazio vettoriale V in sé (si dice anche un
endomorfismo di V ); diremo che un vettore v ∈ V , v = 0V è un autovettore per la f se ∃λ ∈ R tale che:
f (v) = λv.
Esempio: Sia f : R2 → R2 data da f (x, y) = (x + y, 2x); si ha allora che f (1, 1) = (2, 2) = 2(1, 1). Quindi
(1, 1) è un autovettore per f , relativo all’autovalore λ = 2.
Notiamo che se v è un autovalore per un’endomorfismo f , allora lo è anche ogni suo multiplo av, per
a ∈ R, a = 0; infatti se f (v) = λv, allora anche
Notiamo anche che se non avessimo posto v = 0V nella Def. 7.1, allora ogni λ ∈ R sarebbe un autovalore
per la f in quanto f (0V ) = 0V = λ0V , qualsiasi sia λ ∈ R.
quindi av + bw ∈ Vλ .
Notiamo che con questo punto di vista, ker f non è altro che V0 , l’autospazio relativo all’autovalore
0 ∈ R, infatti
V0 = {v ∈ V |f (v) = 0.v = 0V } = ker f.
Vogliamo ora vedere come fare a determinare gli autovalori e gli autovettori relativi ad un endomorfismo
f ; ci limiteremo al caso in cui dim V < +∞. Sia dim V = n, allora, come abbiamo visto nella sezione
5, scegliendo una base B di V possiamo associare alla f una matrice A = MB,B (f ) ∈ Rn,n , tale che se
v = XB ∈ Rn,1 , cioè v è rappresentato dal vettore colonna X dei suoi coefficienti rispetto alla base B, allora
f (v) = A · X (sempre scritto rispetto alla base B).
-1- 10/10/04
Usando la A, avremo allora che cercare i possibili autovalori λ per f , equivale a determinare i valori
λ ∈ R per i quali esiste un vettore colonna X = 0 tale che A · X = λX.
Useremo il termine autovalore anche per le matrici quadrate: diremo che λ ∈ R è un autovalore per
A ∈ Rn,n quando esiste X ∈ Rn,1 , X = 0, tale che A · X = λX, e diremo che un tale X è un autovettore per
A, relativo a λ.
Allora, se λ è un autovalore per A, dovrà aversi: A · X − λX = 0, cioè (scrivendo X come I · X):
A · X − λI · X = 0, e quindi
(A − λI) · X = 0.
Gli autovalori di A saranno allora le soluzioni X, diverse dal vettore nullo, del sistema omogeneo: (A − λI) ·
X = 0. Sappiamo che tale sistema ammette sempre soluzione (quella nulla), ed in particolare ha ∞n−r
soluzioni, ove r è il rango della matrice dei coefficienti del sistema, cioè r = r(A − λI). Avremo quindi che
se r = n esiste un unica soluzione che è quella nulla, che non ci dà nessun autovalore X, mentre se r < n,
esisteranno infinite soluzioni X del sistema, che saranno autovettori per λ.
Riassumendo:
λ sarà un autovalore per f (e per A), se e solo se la matrice A − λI non ha rango massimo (= n);
quindi se e solo se
det(A − λI) = 0.
Questo ci dà il metodo per calcolare gli autovalori di una matrice A (e di un endomorfismo f ):
Data una matrice A ∈ Rn,n , i suoi autovalori sono le soluzioni della equazione:
Definizione 7.3: Il polinomio pA (t) = det(A − tI) si dice il polinomio caratteristico della matrice A, e le
sue radici, come abbiamo visto, sono gli autovalori di A.
Esempio 7.4: Sia f : R2 → R2 l’applicazione: f (x, y) = (2x + y, −x). Vogliamo determinarne autovalori ed
autovettori.
Applicando f ai vettori della base canonica otteniamo:
-2- 10/10/04
Quindi gli autovalori sono le soluzioni dell’equazione t2 − 2t + 1 = 0, cioè (t − 1)2 = 0. La sola soluzione è
per t = 1.
Allora il solo autovalore è λ = 1. Gli autovettori sono le soluzioni del sistema: (A − 1I) · X = 0:
2−1 1 x 0
· =
−1 −1 y 0
x+y =0 x
cioè =⇒ X = .
−x − y = 0 −x
Allora gli autovalori sono i vettori non nulli dell’autospazio: V1 = {(x, −x)|x ∈ R}.
⎛ ⎞
1 0 0
Esempio 7.5: Vogliamo determinare autovalori ed autovettori per la matrice: A = ⎝ 0 0 1 ⎠.
0 −1 0
Calcoliamo il determinante di A − tI, e cioè il polinomio caratteristico di A, e cerchiamone le radici:
⎛ ⎞
1−t 0 0
det(A − tI) = det ⎝ 0 −t 1 ⎠ = (1 − t)(t2 + 1) = 0.
0 −1 −t
Il fattore t2 + 1 non si annulla mai (per nessun valore t ∈ R; ci sono valori complessi di t che lo annullano,
e cioè t = ±i, ma qui ci limitiamo allo studio di autovalori reali), quindi l’unico autovalore è dato da t = 1.
L’autospazio di V1 è dato dalle soluzioni del sistema:
⎧
⎨ 0=0
(A − 1I)X = 0, ⇒ −y + z = 0
⎩
−y − z = 0
Un Esempio.
Consideriamo il seguente problema: un’associazione venatoria vuole ripopolare di conigli selvatici una
zona che attualmente ne è sprovvista. La zona è divisa in tre aree comunicanti A,B, e C; solo nell’area C
sarà consentita la caccia.
La previsione è che la popolazione destinata all’area A si quadruplicherà ogni anno, quella dell’area B
settuplicherà , mentre quella dell’area C, essendo soggetta a caccia, si dimezzerà .
Poiché i ”nuovi conigli” nati durante l’anno si redistribuiscono uniformemente nelle tre zone, vorremmo
ottenere a fine anno una distribuzione della popolazione nelle tre aree proporzionale a quella iniziale. Se
ciò fosse possibile vogliamo sapere quale sarà la situazione dopo un anno se abbiamo immesso in tutto 800
conigli.
Siano x,y e z le quantità di conigli immesse nelle tre zone, si avrà :
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
A x 4x x + 3x x + x + 2y 2x + 2y
B ⎝ y ⎠ → 1 anno → ⎝ 7y ⎠ = ⎝ y + 6y ⎠ → redistribuzione → ⎝ y + x + 2y ⎠ = ⎝ x + 3y ⎠
C z z/2 z/2 z/2 + x + 2y x + 2y + z/2
-3- 10/10/04
Se X è la colonna delle distribuzioni iniziali, noi vorremmo che la distribuzione dopo un anno fosse del tipo
λX, proporzionale ad X, quindi quello che cerchiamo sono gli autovalori ed autovettori di M . Il polinomio
caratteristico è : ⎛ ⎞
2−t 2 0
1
pM (t) = det ⎝ 1 3−t 0 ⎠ = ( − t)(t2 − 5t + 4).
1 2
1 2 2 −t
Si vede facilmente che le soluzioni di pM (t) = 0 sono:
1
λ1 = , λ2 = 1, λ3 = 4.
2
λ2 = 1. Si ha:
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎧
2−1 2 0 x 0 ⎨ x + 2y = 0
⎝ 1 x = −2y
3−1 0 ⎠ · ⎝y ⎠ = ⎝0⎠ → x + 2y = 0 → .
1 ⎩ z z=0
1 2 2 −1 z 0 x + 2y − 2 = 0
λ1 = 4. Si ha:
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎧
2−4 2 0 x 0 ⎨ −2x + 2y = 0
⎝ 1 x=y
3−4 0 ⎠ · ⎝y ⎠ = ⎝0⎠ → x−y =0 → .
1 ⎩ 7z z = 6x
1 2 2 −4 z 0 x + 2y − 2 = 0 7
Vediamo ora di interretare questi risultati alla luce del nostro problema.
L’autovalore λ1 = 12 , con gli autovettori {(0, 0, z)} ci danno una possibile soluzione al nostro problema:
immettere tutti i conigli nella sola area C! Ma questa è una scelta che solo dei cacciatori miopemente
ingordi farebbero. Certo, per il primo anno avrebbero a disposizione molta selvaggina cacciabile, ma essa si
dimezzerebbe ogni anno, e dopo poco la popolazione diventerebbe irrisoria.
L’autovalore λ2 = 1 non dà nessuna soluzione al nostro problema: infatti gli autovettori {(−2y, y, 0)}
non hanno alcun interesse in quanto non possiamo immettere in una zona una quantità di conigli negativa!
Quindi l’ultima speranza per i nostri cacciatori è l’autovalore λ3 = 4, con gli autovettori {(x, x, 6x
7 )}.
Se la quantità totale immessa deve essere 800, avremo:
x + x + 6x
7 = 800 e cioè
20x
7 = 800 e x = 280.
Quindi questa è la soluzione ottimale per i cacciatori: immetteranno 280 conigli rispettivamente nelle
aree A e B, e 240 nell’area C. Dopo un anno la popolazione totale sarà quadruplicata e nella zona C ci
saranno ben 960 conigli da cacciare, molti di più dei 400 che avremmo avuto con la soluzione ”ingorda” data
dal primo autovalore.
-4- 10/10/04
Ma, purtroppo per i cacciatori, il problema non finisce qui. Un gruppo di agricoltori e di ”verdi” ha
esaminato il piano dei cacciatori ed ha fatto i conti un po’ più in là : cosa accadrà dopo 5 anni? Dopo
5 anni la situazione sarà data dalla matrice M 5 , ed avremo una distribuzione dei conigli descritta da:
M 5 X = λ5 X = 1024X. Quindi, dopo 5 anni, la popolazione dei conigli sarà di ben 819.200 unità (e dopo 10
anni sarebbe sul miliardo)! Questo causerebbe danni alle colture ed alle altre specie, e quindi questi gruppi
si opporranno strenuamente a queste modalità di immissione scriteriata di nuove specie nel territorio!
Come abbiamo visto anche negli esempi precedenti, in generale il polinomio caratteristico di una matrice
A ∈ Rn,n si potrà scrivere come:
ove λ1 , ..., λs ∈ R sono le radici reali di pA (t), ed il fattore q(t) non ha radici reali. I λ1 , ..., λs sono gli
autovalori di A ed il numero ni è detto molteplicità algebrica dell’autovalore λi .
Ad esempio nell’Es.7.5, si ha un unico autovalore λ1 = 1, con n1 = 1, mentre q(t) = t2 + 1; invece in
Es. 7.4 si ha ancora il solo autovalore λ1 = 1, ma n1 = 2, mentre q(t) = 1.
Si ha ovviamente (poiché pA (t) ha grado n): n1 +n2 +...+ns ≤ n, ed il grado di q(t) è n−n1 −...−ns (in
particolare quando, come in Es. 7.4, n = n1 + ... + ns , allora q(t) = 1 e più semplicemente non lo scriviamo
nello sviluppo di pA (t)).
1 ≤ mi ≤ ni
Definizione 7.6. Una matrice D = (dij ) ∈ Rn,n si dice diagonale se è tale che dij = 0, ∀i = j. Una matrice
A ∈ Rn,n si dice diagonalizzabile se è simile ad una matrice diagonale, cioè se esistono una matrice invertibile
-5- 10/10/04
È immediato (per quanto osservato prima) che se dimV = n, f è semplice se e solo se è rappresentabile
con una matrice diagonale (scegliendo come base una base di autovettori), e che a sua volta ciò equivale a
dire che ogni matrice che rappresenta la f (cioè comunque si scelga la base di V ) sarà diagonalizzabile.
(1 − t)(t2 − t − 1) − (1 − t) = (1 − t)(t2 − t − 2) = 0
che dà come soluzioni: t = 1, −1, 2. Determiniamo gli autovettori relativi ai tre autovalori trovati:
λ1 = −1: V−1 è dato dalle soluzioni del sistema:
⎧
⎨ 2x + z = 0
−2x = z
2y + z = 0 ⇒
⎩ y=x
x+y+z =0
Consideriamo adesso gli autovettori (1, 1, −2), (1, −1, 0), (1, 1, 1), ognuno dei quali è un generatore di
uno dei tre autospazi. I tre vettori sono linearmente indipendenti (vederlo per esercizio) e quindi costituiscono
una base di R3 , che denotiamo con B. Vediamo ora di rappresentare f tramite questa base:
⎛ ⎞
−1
f (1, 1, −2) = (−1, −1, 2) = −1(1, 1, −2) + 0(1, −1, 0) + 0(1, 1, 1) = ⎝ 0 ⎠ ,
0 B
⎛ ⎞
0
f (1, −1, 0) = (1, −1, 0) = 0(1, 1, −2) + 1(1, −1, 0) + 0(1, 1, 1) = ⎝ 1 ⎠ ,
0 B
-6- 10/10/04
⎛ ⎞
0
f (1, 1, 1) = (2, 2, 2) = 0(1, 1, −2) + 0(1, −1, 0) + 2(1, 1, 1) = ⎝ 0 ⎠ .
2 B
⎛ ⎞
−1 0 0
Quindi MB,B (f ) = ⎝ 0 1 0 ⎠, ed f è semplice. Quindi si ha anche che A è diagonalizzabile, infatti
0 0 2
avremo (se E è la base canonica):
ove MB,B (f ) è diagonale e le matrici dei cambiamenti di base sono una l’inversa dell’altra.
Vogliamo adesso un criterio per determinare se un’applicazione lineare f sia semplice (o una matrice A ∈
n,n
R sia diagonalizzabile), senza dover eseguire tutta la ricerca di una base di autovettori come nell’esempio
precedente.
Ci tornerà utile nel seguito la seguente
Definizione 7.8: Se V1 ,...,Vs sono sottospazi di uno spazio vettoriale V , si dice spazio somma di essi il
sottospazio
V1 + V2 + ... + Vs = {v ∈ V | ∃vi ∈ Vi , i = 1, ..., s, v = v1 + v2 + ...vs }.
Proposizione 7.9: Sia f : V → V , dim V = n, e siano λ1 , ..., λs gli autovalori (distinti) di f . Allora
dim(V1 + V2 + ... + Vs ) = dim V1 + dim V2 + ... + dim Vs .
Dimostrazione : Sia dim Vi = mi , e siano Bi = {v1,i , ..., vmi ,i } basi dei Vi , i = 1, ..., s. Per dimostrare la
proposizione vogliamo vedere che B = ∪si=1 Bi = {v1,1 , ..., vm1 ,1 , ..., v1,s , ..., vms ,s } è una base di V1 + ... + Vs .
Ovviamente B è un insieme di generatori per V1 +...+Vs , infatti se v ∈ V1 +...+Vs , si avrà v = v1 +...+vs ,
con vi ∈ Vi ; inoltre esisteranno α1,i , ..., αmi ,i ∈ R tali che vi = α1,i v1,i ... + αmi ,i vmi ,i , i = 1, ..., s, e quindi
v = α1,1 v1,1 + ...αm1 ,1 vm1 ,1 + ... + α1,s v1,s + ... + αms ,s vms ,s .
Per vedere che i vi,j sono anche linearmente indipendenti si procede per induzione su s. Per s = 1
l’enunciato è ovvio; supponiamo che esso sia vero per s − 1 e vediamo che allora vale anche per s. Siano
αi,j ∈ R tali che
α1,1 v1,1 + ... + αm1 ,1 vm1 ,1 + ... + α1,s v1,s + ... + αms ,s vms ,s = 0V .
Dobbiamo dimostrare che allora gli αi,j sono tutti nulli. Applicando la f ai due lati di questa uguaglianza
avremo:
f (α1,1 v1,1 + ... + αms ,s vms ,s ) = λ1 α1,1 v1,1 ... + λs αms ,s vms ,s = f (0V ) = 0V .
Ma, poiché λi −λs = 0, i = 1, ..., s−1, e, per ipotesi induttiva, v1,1 ...vms−1 ,s−1 sono linearmente indipendenti,
avremo che α1,1 = ... = αms−1 ,s−1 = 0. Allora la prima uguaglianza diviene:
-7- 10/10/04
il che implica che α1,1 = ... = αms ,s = 0 (perché i v1,1 , ..., vms ,s sono indipendenti essendo una base di Vs ).
Quindi tutti gli αi,j sono tutti nulli.
-8- 10/10/04