Sei sulla pagina 1di 28

Capitolo 1

Sistemi di equazioni lineari

1.1 Insiemi numerici e campi


Il primo oggetto di studio di questo corso saranno le equazioni lineari (e i
sistemi di equazioni lineari), ovvero equazioni del tipo
x + 1 = 0, 2x = 5, x + y = 3, 3x − y + z = 1 ...
in cui una o più incognite x, y, z, . . . compaiono senza esponenti, radici etc.
ma semplicemente moltiplicate per un coefficiente numerico.
Prima di dare una definizione più precisa di cosa sia in generale un’equazione
lineare1 e dare un metodo generale per la risoluzione dei sistemi formati
da tali equazioni, facciamo alcune considerazioni preliminari sulle proprietà
elementari di cui avremo bisogno per manipolare e risolvere tali equazioni.
A questo scopo, prendiamo come modello la semplice equazione 2x + 3 = 0.
Ricordiamo che risolvere un’equazione significa determinare i valori numerici
che sostituiti all’incognita rendono l’equazione un’uguaglianza vera (ad esem-
pio, se l’equazione è 2x = 6 sostituendo x = 3 otteniamo l’uguaglianza vera
2 · 3 = 6, mentre sostituendo x = 5 otteniamo l’uguaglianza falsa 2 · 5 = 6:
quindi, diremo che 3 è soluzione dell’equazione mentre 5 non lo è).
Per risolvere 2x + 3 = 0 dobbiamo determinare il valore della x che rende
vera questa uguaglianza, ovvero vogliamo, manipolando l’equazione, arrivare
a un’espressione del tipo x = . . . che ci dirà proprio a quanto deve essere
uguale l’incognita x.
Ma arrivare a un’espressione del tipo x = . . . significa “isolare” l’incognita
in modo che a primo membro appaia solo la x. Per fare ciò a partire da
2x + 3 = 0 dobbiamo, in un certo senso, spostare dal primo membro al
secondo l’addendo +3 e il coefficiente 2.
1
Si veda il paragrafo 1.2 di questo capitolo.

1
I due passaggi con i quali si ottiene questo scopo sono:

- Si porta il +3 a secondo membro cambiandolo di segno :

2x + 3 = 0 → 2x = −3

- Si dividono entrambi i membri per 2 :


3
2x = −3 → x = −
2

Ora, analizziamo con maggiore attenzione questi due passaggi.


La prima cosa di cui abbiamo bisogno per poter svolgere il primo è l’esistenza
per ogni numero a di un suo inverso additivo o opposto, ovvero un numero,
denotato −a, tale che a + (−a) = (−a) + a = 0. Infatti, grazie a questo
fatto possiamo prima sommare a primo e a secondo membro dell’equazione
l’opposto −3 di 3, ottenendo

(2x + 3) + (−3) = 0 + (−3);


poi, sfruttando a primo membro la proprietà associativa della somma (a +
b) + c = a + (b + c) e a secondo membro il fatto che 0 è elemento neutro per
la somma, ovvero a + 0 = 0 + a = a qualunque sia a, si ottiene

2x + (3 + (−3)) = −3
ovvero, sfruttando la proprietà dell’opposto a + (−a) = (−a) + a = 0,

2x + 0 = −3.
Infine, usando di nuovo il fatto che 0 è elemento neutro per la somma,
possiamo scrivere

2x = −3.
Analogamente, quello che ci serve per svolgere il secondo passaggio (dividere
entrambi i membri di 2x = −3 per 2) è l’esistenza per ogni numero a diverso
da zero2 di un suo inverso moltiplicativo o semplicemente inverso, ovvero di
un altro numero, denotato a−1 o a1 , tale che aa−1 = a−1 a = 1.
2
Se pretendessimo che anche lo 0 debba avere un inverso moltiplicativo, diciamo 0−1 ,
avremmo che tale numero soddisferebbe la proprietà 00−1 = 1, entrando cosı̀ in conflitto
con la nota proprietà che quando moltiplico per zero qualunque numero (quindi anche
0−1 ) il risultato deve essere zero, e non uno.

2
Infatti, grazie a questo fatto possiamo moltiplicare primo e secondo membro
di 2x = −3 per l’inverso 12 di 2 ottenendo
1 1
(2x) = (−3).
2 2
Sfruttando ora a primo membro la proprietà associativa della moltiplicazione
(ab)c = a(bc) si può scrivere
1 3
( 2)x = −
2 2
ovvero, sfruttando la proprietà dell’inverso aa−1 = a−1 a = 1
3
1x = −
2
cioè, essendo 1 l’elemento neutro per la moltiplicazione (per ogni numero a
si ha 1a = a1 = a)
3
x=−
2
Quindi, riassumendo, già le operazioni che usiamo per risolvere la semplice
equazione 2x + 3 = 0 mostrano come l’insieme numerico nel quale lavoriamo
deve avere almeno le seguenti proprietà:

(1) l’insieme deve contenere l’elemento 0 neutro per la somma, con la


proprietà che a + 0 = 0 + a = a per ogni a

(2) per ogni numero a, deve esistere un inverso additivo −a tale che a +
(−a) = (−a) + a = 0

(3) deve valere la proprietà associativa della somma, ovvero (a + b) + c =


a + (b + c)

(4) l’insieme deve contenere l’elemento 1 neutro per la moltiplicazione, con


la proprietà che a1 = 1a = a per ogni a

(5) per ogni numero a 6= 0, deve esistere un inverso moltiplicativo a−1 tale
che aa−1 = a−1 a = 1

(6) deve valere la proprietà associativa della moltiplicazione, ovvero (ab)c =


a(bc)

3
Ad esempio, l’insieme dei numeri naturali {0, 1, 2, . . . } (quelli che “si usano
per contare”), denotato solitamente N, possiede le proprietà (1),(3),(4),(6)
ma non le proprietà (2) e (5): quindi, limitarsi ai numeri naturali renderebbe
impossibile la risoluzione anche di semplici equazioni come 2x + 3 = 0.
L’insieme dei numeri interi {0, ±1, ±2, . . . }, che si può pensare ottenuto dai
naturali aggiungendo a ogni numero naturale il suo opposto, e denotato so-
litamente Z, possiede tutte le proprietà tranne la (5): quindi neanche tale
insieme è sufficiente per i nostri scopi.
Il più semplice insieme numerico nel quale valgono tutte le proprietà (1)-
(6) di sopra è l’insieme dei numeri razionali, denotato solitamente Q, che
possiamo pensare come l’insieme di tutte le frazioni ± ab (dove a, b sono numeri
naturali con b 6= 0) o, equivalentemente, come l’insieme di tutte le espressioni
decimali con un numero limitato di cifre dopo la virgola o con una successione
illimitata di cifre ma periodica.
Accanto alle proprietà (1)-(6), l’insieme Q ha anche le seguenti proprietà:

(7) vale la proprietà commutativa della somma, ovvero a + b = b + a

(8) vale la proprietà commutativa della moltiplicazione, ovvero ab = ba

(9) vale la proprietà distributiva, ovvero a(b+c) = ab+ac e (a+b)c = ac+bc

Tali proprietà si dimostrano in effetti anch’esse necessarie per le manipola-


zioni elementari che si svolgono normalmente su un’equazione lineare o su
un sistema di equazioni lineari: ad esempio, per risolvere il sistema di due
equazioni in due incognite

2x + y = 4
x−y =1
basta ricavare x = 1+y dalla seconda equazione portando a secondo membro
la y e cambiandole il segno (quindi usando, come abbiamo visto sopra, le
proprietà (1)-(6)) e poi sostituire tale espressione di x nella prima equazione,
ovvero

2(1 + y) + y = 4
A questo punto, per procedere è necessario usare la proprietà distributiva,
che ci dice che 2(1 + y) = 2 · 1 + 2 · y = 2 + 2y ottenendo

2 + 2y + y = 4
ovvero

4
2 + 3y = 4
e si continua risolvendo questa equazione nella sola incognita y.
Si capisce quindi che, per poter manipolare le equazioni lineari e i loro sistemi
e sviluppare dei metodi soddisfacenti per la loro risoluzione, bisogna supporre
che valgano le proprietà (1)-(9) viste sopra.
Questo giustifica la seguente:

Definizione 1.1. Un insieme numerico nel quale valgano le proprietà (1)-(9)


di sopra si dice un campo.

Solitamente un campo si denota con la lettera K.


Come abbiamo visto sopra, l’insieme Q dei numeri razionali è un campo; altri
esempi importanti di campi sono l’insieme dei numeri reali R (che possiamo
pensare come l’insieme che si ottiene aggiungendo a Q anche le espressio-
ni decimali illimitate non periodiche3 ) o l’insieme dei numeri complessi C,
definibile come l’insieme di tutte le espressioni del tipo a + bi, dove a e b
sono numeri reali e i è un nuovo numero con la proprietà (non soddisfatta
da nessun numero reale) che i2 = −1 (tale estensione si rende necessaria ad
esempio perché tutte le equazioni di secondo grado abbiano una soluzione).
Nel seguito, dal momento che per sviluppare la nostra teoria ci basta che
l’insieme numerico sul quale stiamo lavorando abbia le proprietà di campo,
indipendentemente dal fatto che esso sia Q, R o C, parleremo di equazioni
a coefficienti in un campo K: questo farà sı̀ che i metodi che descriveremo
saranno validi e applicabili sia che i coefficienti delle nostre equazioni siano
razionali, sia che siano reali, sia che siano complessi, e la teoria cosı̀ sviluppata
non avrà bisogno di distinguere tra questi tre casi.

1.2 Equazioni lineari, sistemi e matrici


Per definire rigorosamente cosa intendiamo per equazione lineare e scrive-
re il generico esempio di equazione lineare, troviamo prima una notazione
conveniente per denotare le incognite.
Infatti, per non avere limitazioni sul numero delle incognite, non possiamo
continuare a indicarle con le lettere dell’alfabeto, che sono in numero limitato,
ma useremo sempre la stessa lettera, tradizionalmente la x, con degli indici
3
Tale estensione si rende necessaria,
√ ad esempio, in geometria: la diagonale di un qua-
drato di lato unitario misura 2, che si dimostra avere un’espressione decimale illimitata
non periodica; un altro esempio di numero reale che non è esprimibile come frazione è π,
ovvero il rapporto tra la misura di una qualunque circonferenza e il suo diametro.

5
numerici che ci dicono di quale incognita si tratta: x1 indicherà quindi la
prima incognita, x2 la seconda, e cosı̀ via in generale xn indicherà la n-esima
incognita, dove n è un numero naturale.
Possiamo allora dire che per equazione lineare in n incognite x1 , x2 , . . . , xn (i
puntini indicano che stiamo omettendo di scrivere le incognite tra la seconda
e l’ultima) a coefficienti in un campo K intendiamo un’equazione del tipo

a1 x1 + a2 x2 + · · · + an xn = b (1.1)
dove b, a1 , a2 , . . . , an sono elementi di K che svolgono il ruolo rispettivamente
di termine noto e coefficienti delle incognite (per ogni incognita xi , denotiamo
il suo coefficiente con una lettera, a, con lo stesso indice dell’incognita).
Dare una soluzione dell’equazione (1.1) significa trovare dei numeri (o, più
precisamente, elementi del campo K) che sostituiti alle incognite rendano
l’uguaglianza vera.
Ad esempio, nell’equazione lineare in due incognite x1 − x2 = 1 a coefficienti
nel campo dei reali R, ponendo x1 = 2 e x2 = 1 si ottiene l’uguaglianza vera
2 − 1 = 1, mentre ad esempio ponendo x1 = 1 e x2 = 2 si ottiene 1 − 2 = 1
che è falsa.
Da questo semplice esempio si vede come dare una soluzione dell’equazione
x1 − x2 = 1 significa non solo dare due elementi di K, da sostituire alle
due incognite dell’equazione, ma è necessario precisare quale vada sostituito
alla prima incognita e quale alla seconda, ovvero specificare in quale ordine
stiamo prendendo questi due elementi.
La soluzione data di tale equazione può allora essere pensata e scritta come
una coppia ordinata di numeri, che denotiamo (2, 1). La coppia (2, 1) è una
soluzione dell’equazione x1 − x2 = 1, mentre la coppia (1, 2) non lo è.
Analogamente, per un’equazione con 3 incognite, una sua soluzione sarà data
da una cosiddetta terna ordinata: ad esempio, se l’equazione è x1 − x2 + x3 =
2, possiamo dire che la terna ordinata (3, 2, 1) è una sua soluzione, in quanto
sostituendo x1 = 3, x2 = 2, x3 = 1 si ottiene l’uguaglianza vera 3 − 2 + 1 = 2;
la terna (2, 1, 3) invece, non è una sua soluzione.
La generalizzazione dei concetti di coppia e terna ordinata è quello di n-
upla ordinata (v1 , v2 , . . . , vn ) (o semplicemente n-upla), che può essere quindi
definita come una sequenza di n elementi v1 , v2 , . . . , vn di K disposti in un
preciso ordine4
Possiamo allora dare la seguente:
4
Non bisogna quindi confondere la n-upla (v1 , v2 , . . . , vn ) con l’insieme {v1 , v2 , . . . , vn },
per denotare il quale usiamo le parentesi graffe, che è determinato solo dagli elementi
v1 , v2 , . . . , vn indipendentemente dal loro ordine.

6
Definizione 1.2. Data un’equazione lineare a1 x1 + a2 x2 + · · · + an xn = b in
n incognite a coefficienti in un campo K, si dice soluzione dell’equazione una
n-upla ordinata (v1 , v2 , . . . , vn ) di elementi di K tale che sostituendo v1 al
posto di x1 , v2 al posto di x2 etc. fino a vn al posto di xn l’equazione risulta
verificata (ovvero l’uguaglianza a1 v1 + a2 v2 + · · · + an vn = b risulta vera).

L’insieme delle n-uple di elementi di K si denota Kn .


Ora, un sistema di equazioni lineari è semplicemente un insieme di equazioni
lineari.
Per scrivere un generico tale sistema, dobbiamo risolvere un problema di no-
tazione simile a quello affrontato quando abbiamo scritto la generica equa-
zione lineare, ovvero abbiamo bisogno di una notazione efficace per indicare
i diversi coefficienti delle incognite nelle diverse equazioni del sistema.
A questo scopo, nell’espressione della generica equazione lineare a1 x1 +a2 x2 +
· · · + an xn = b faremo precedere sia i coefficienti sia il termine noto da un
ulteriore indice che ci dice di quale equazione del sistema si tratta: la prima
equazione del sistema sarà cioè denotata a11 x1 + a12 x2 + · · · + a1n xn = b1 , la
seconda a21 x1 + a22 x2 + · · · + a2n xn = b2 e cosı̀ via.
Allora, il generico sistema di equazioni lineari con n incognite e m equazioni
(il numero di incognite può anche essere diverso dal numero di equazioni,
perciò li indichiamo con due lettere diverse) sarà


 a11 x1 + a12 x2 + · · · + a1n xn = b1
a21 x1 + a22 x2 + · · · + a2n xn = b2




·

(1.2)

 ·
·




am1 x1 + am2 x2 + · · · + amn xn = bm

(i puntini indicano che stiamo omettendo di scrivere le equazioni tra la


seconda e l’ultima).
Possiamo quindi dare la seguente

Definizione 1.3. Una soluzione del sistema (1.2) è una n-upla (v1 , v2 , . . . , vn ) ∈
Kn che è soluzione comune di tutte le equazioni del sistema.

Ora osserviamo che, ovviamente, per conoscere un sistema abbiamo biso-


gno solo di sapere, equazione per equazione, quali sono i coefficienti che
moltiplicano ogni singola incognita e i termini noti.
Quindi, se, dato un sistema, scriviamo una tabella di numeri disposti in righe
e in colonne in modo che in ogni riga ci siano i coefficienti delle incognite
di una certa equazione (ordinati secondo le incognite) e il termine noto, tale

7
tabella conterrà tutte le informazioni che ci servono sul sistema. Ad esempio,
il sistema

x1 + 3x2 = 5
(1.3)
2x1 − x2 = 4
può essere rappresentato dalla tabella
 
1 3 5
(1.4)
2 −1 4
che chiameremo la matrice completa del sistema.
Come vedremo, non solo la matrice completa costituisce una “fotografia”
fedele di un sistema e contiene tutte le informazioni necessarie a determinarlo,
ma sarà anche l’oggetto sul quale lavoreremo per risolverlo.
Se ci limitiamo ai coefficienti delle incognite otterremo la cosiddetta matrice
dei coefficienti del sistema. Ad esempio, la matrice dei coefficienti del sistema
(1.3) è
 
1 3
(1.5)
2 −1

Come vedremo, il concetto di matrice sarà di fondamentale importanza per


l’algebra lineare e comparirà in molti contesti in questo corso. Tratteremo in
modo approfondito e indipendente le matrici nel Capitolo 2: per il momento,
limitiamoci a definire una matrice come una tabella rettangolare di elementi
di K, detti le sue entrate, disposti in righe e in colonne. Analogamente alla
notazione che abbiamo introdotto per identificare i coefficienti delle incognite
di un sistema, per denotare la generica entrata di una matrice useremo due
indici: il primo che ci dice in quale riga della matrice si trova, il secondo che
ci dice in quale colonna.
Una generica matrice sarà quindi
 
a11 a12 . . . a1n
 a21 a22 . . . a2n 
A=  (1.6)
 ... 
am1 am2 . . . amn
Come si vede, tale matrice ha m righe e n colonne; la sua generica entrata
è del tipo aij , dove il primo indice è detto indice di riga e va da 1 a m,
mentre il secondo, detto indice di colonna, va da 1 a n; si dice anche che aij
è l’entrata di posto i j.

8
 
5 3
Ad esempio, nella matrice  2 −1  che ha tre righe e due colonne, 5
0 7
è la prima entrata della prima riga, e quindi a11 = 5; il numero 7 invece lo
troviamo in corrispondenza della terza riga e seconda colonna, quindi a32 = 7.

1.3 Equazioni superflue e equazioni incompa-


tibili
Nel prossimo paragrafo vedremo come lavorando sulla matrice completa di
un sistema si possano determinare tutte le sue soluzioni. In particolare,
scopriremo che possono verificarsi solo le seguenti tre possibilità5 :

- il sistema non ha nessuna soluzione

- il sistema ha una sola soluzione

- il sistema ha infinite soluzioni

Prima di entrare nei dettagli, vediamo un esempio di ciascuna di queste


possibilità, con l’obiettivo di iniziare a capire le ragioni per cui esse possono
verificarsi.
Non è difficile esibire un esempio di sistema con infinite soluzioni. Ad esem-
pio, consideriamo il seguente sistema formato da una sola equazione in due
incognite 
x1 + x2 = 0.
Una soluzione del sistema è una coppia di numeri reali tali che la loro som-
ma dà come risultato zero: questo significa che i numeri devono essere uno
l’opposto dell’altro, e quindi scelto un qualunque t ∈ R, la coppia (t, −t) è
una soluzione: le soluzioni sono quindi infinite, tante quanti i numeri reali.
Aggiungiamo ora alla x1 + x2 = 0 un’altra condizione, ottenendo quindi un
sistema di due equazioni, ad esempio

x1 + x2 = 0
(1.7)
x1 − x2 = 0
Le soluzioni del sistema sono quindi le coppie che soddisfano non solo la
prima equazione, cioè come abbiamo detto tutte quelle del tipo (t, −t), ma
5
Questo è un fatto caratteristico delle equazioni lineari: per una generica equazione
possono verificarsi anche altri casi, ad esempio l’equazione x2 = 9 ha due soluzioni, x = 3
e x = −3.

9
anche la seconda, che afferma semplicemente che x1 = x2 , cioè i due elementi
della coppia devono essere non solo opposti ma anche uguali tra loro. Ma
l’unico numero reale uguale al suo opposto è lo zero, e quindi il sistema ha
come unica soluzione la coppia (0, 0).
Questo esempio suggerisce che in generale più equazioni ci sono in un sistema,
maggiori sono i vincoli che imponiamo sulle incognite e quindi meno n-uple
ci saranno che soddisfano tutte le condizioni espresse dalle equazioni, ovvero
meno soluzioni: il sistema (1.7) sembra ad esempio suggerire che con due
incognite, due condizioni siano sufficienti a ottenere una sola soluzione.
Tuttavia, è facile fare un altro esempio che mostra che questa prima impres-
sione non è del tutto esatta: consideriamo il sistema

x1 + x2 = 0
(1.8)
2x1 + 2x2 = 0
Ora, è immediato vedere che le soluzioni (t, −t) della prima equazione sod-
disfano tutte anche la seconda, quindi il sistema continua ad avere le infinite
soluzioni (t, −t). Questo accade perché la seconda equazione è in realtà del
tutto equivalente alla prima (mettendo in evidenza il 2, si può riscrivere
2x1 + 2x2 = 0 come 2(x1 + x2 ) = 0, ovvero, dividendo per 2, proprio la prima
equazione) e non aggiunge nessun nuovo vincolo sulle incognite: si tratta di
un’equazione superflua, la cui presenza o meno non cambia l’insieme delle
soluzioni.
Le equazioni superflue presenti in un sistema possono essere tuttavia molto
meno evidenti che nel caso appena visto. Ad esempio, consideriamo il sistema
di due equazioni in tre incognite

x1 + x2 + x 3 = 1
(1.9)
2x1 + x2 + 3x3 = 2
Una qualunque terna (x1 , x2 , x3 ) che verifica le due equazioni soddisfa neces-
sariamente anche l’uguaglianza che si ottiene sommandole membro a mem-
bro, ovvero

(x1 + x2 + x3 ) + (2x1 + x2 + 3x3 ) = 1 + 2


cioè, svolgendo i conti,

3x1 + 2x2 + 4x3 = 3


Essendo tale equazione una conseguenza delle prime due, aggiungerla al
sistema non modifica l’insieme delle soluzioni: in altre parole, il sistema

10

 x1 + x 2 + x3 = 1
2x1 + x2 + 3x3 = 2 (1.10)
3x1 + 2x2 + 4x3 = 3

contiene un’equazione superflua, dipendente dalle altre, certamente meno


evidente a prima vista che nel caso del sistema (1.8).
Si noti che, nella matrice completa del sistema (1.10)
 
1 1 1 1
 2 1 3 2  (1.11)
3 2 4 3
il fatto che la terza equazione sia stata ottenuta sommando le altre membro
a membro si traduce nel fatto che la terza riga della matrice è somma delle
prime due, nel senso che ogni entrata di tale riga si ottiene sommando le
corrispondenti entrate delle altre due righe (la prima con la prima: 1+2 =
3; la seconda con la seconda: 1+1=2 etc.). Denotando con R1 , R2 , R3 le tre
righe, possiamo scrivere questo fatto usando la notazione R3 = R1 + R2 .
Naturalmente, equazioni superflue possono essere ottenute anche con com-
binazioni più complicate della somma delle prime due equazioni, ad esempio
sempre in riferimento al sistema (1.9), una terna che soddisfi le due equazioni
necessariamente soddisfa anche l’uguaglianza

5(x1 + x2 + x3 ) + (−3)(2x1 + x2 + 3x3 ) = 5 · 1 + (−3) · 2


cioè, svolgendo i conti,

−x1 + 2x2 − 4x3 = −1


ovvero anche nel sistema

 x1 + x2 + x3 = 1
2x1 + x2 + 3x3 = 2 (1.12)
−x1 + 2x2 − 4x3 = −1

la terza equazione è superflua, in un modo forse ancora meno evidente.


Anche qui, nella matrice completa del sistema (1.12)
 
1 1 1 1
 2 1 3 2  (1.13)
−1 2 −4 −1
la relazione di dipendenza tra le equazioni si traduce nella corrispondente
relazione di dipendenza tra le righe, che stavolta possiamo scrivere come R3 =

11
5R1 + (−3)R2 (ovvero ogni entrata della terza riga si ottiene moltiplicando
la corrispondente entrata della prima per 5 e sommando la corrispondente
entrata della seconda riga moltiplicata per -3).
Per quello che riguarda i sistemi senza soluzioni, è abbastanza semplice
esibirne uno. Ad esempio, il sistema di due equazioni in due incognite
seguente

x1 + x2 = 0
x1 + x2 = 1
è evidentemente privo di soluzioni, in quanto se la somma di due numeri è
uguale a 0 non può certamente nello stesso tempo essere uguale a 1.
In altre parole, le due equazioni del sistema sono tra loro incompatibili, ovvero
esprimono condizioni contraddittorie.
Per questo motivo, un sistema che non ha soluzioni si dice incompatibile (e
per contro, si dirà compatibile un sistema che ha almeno una soluzione).
Analogamente a quanto fatto sopra per le equazioni superflue, si possono
costruire esempi di sistemi in cui l’incompatibilità di una equazione con le
altre non è cosı̀ evidente come nel semplice sistema precedente.
Ad esempio, prendiamo sempre come punto di partenza il sistema (1.9).
Come abbiamo visto sopra, una terna che soddisfi le due equazioni soddisfa
anche l’uguaglianza 3x1 + 2x2 + 4x3 = 3 che si ottiene sommando le due
equazioni membro a membro.
Ma allora, se modifichiamo solo il termine noto di quest’ultima uguaglianza,
ne otteniamo una che è incompatibile con le altre due: ad esempio, il sistema

 x1 + x2 + x3 = 1
2x1 + x2 + 3x3 = 2 (1.14)
3x1 + 2x2 + 4x3 = 5

non ha soluzioni, perchè per una qualunque terna che soddisfi le prime due
equazioni si deve avere che 3x1 + 2x2 + 4x3 è uguale a 3, e non a 5.
Confrontando la matrice dei coefficienti e la matrice completa del sistema
(1.14)
   
1 1 1 1 1 1 1
 2 1 3 ,  2 1 3 2 
3 2 4 3 2 4 5
notiamo che l’incompatibilità delle equazioni si traduce nel fatto che nella
matrice dei coefficienti la terza riga è somma delle prime due, mentre nella
matrice completa no (l’ultima entrata non soddisfa 5 = 1 + 2): la matrice

12
dei coefficienti presenta una relazione di dipendenza tra le sue righe che nella
matrice completa non vale (giustamente, in quanto l’incompatibilità è stata
ottenuta sommando i primi membri delle due equazioni, che contengono i
coefficienti delle incognite, ma non i termini noti).

Osservazione 1.4. Osserviamo che un sistema di equazioni in cui i termini


noti siano tutti uguali a zero (un tale sistema si dice omogeneo) ha sem-
pre almeno la soluzione (0, 0, . . . , 0): quindi i sistemi omogenei sono sempre
compatibili.

1.4 La risoluzione di un sistema lineare


In questo paragrafo vedremo finalmente un metodo generale di risoluzione
dei sistemi di equazioni lineari. Tale metodo, come vedremo, consiste nel
trasformare il sistema dato in un altro sistema in modo che nel corso del-
la trasformazione emergano le eventuali incompatibilità tra le equazioni e
scompaiano le equazioni superflue.
Più precisamente, trasformeremo il sistema lavorando sulla sua matrice com-
pleta, e in particolare trasformandola in una cosiddetta matrice a gradini:

Definizione 1.5. Una matrice si dice a gradini se, guardando le righe dalla
prima all’ultima, il primo elemento non nullo in ogni riga compare con un
indice di colonna sempre più grande.
Il primo elemento non nullo in ogni riga di una matrice a gradini si chiama
pivot.

Chiariamo subito la Definizione 1.5 con qualche esempio: la matrice seguente


 
7 1 1 3
 0 4 3 5 
0 0 0 6
è a gradini: i suoi pivot (7 nella prima riga, 4 nella seconda e 6 nella terza) si
trovano, nell’ordine, sulla prima, seconda e quarta colonna (indice di colonna
sempre più grande).
Invece, le matrici
   
7 1 1 3 7 1 1 3
 0 1 3 5 ,  0 0 3 5 
0 2 0 6 0 4 0 6
non sono a gradini: nella prima matrice, il primo elemento non nullo della
terza riga sta nella stessa colonna (la seconda) del primo elemento non nullo

13
della seconda riga; nella seconda matrice, il primo elemento non nullo della
terza riga sta in una colonna di indice più piccolo del primo elemento non
nullo della seconda riga.
Ora, lo scopo del procedimento che descriveremo per risolvere un sistema,
detto procedimento di riduzione a gradini o procedimento di eliminazione di
Gauss-Jordan, consiste nel trasformarlo in un sistema cosiddetto a gradini.
Definizione 1.6. Un sistema si dice a gradini se la sua matrice completa è
una matrice a gradini.
Ad esempio, il seguente sistema

 x1 + x2 + x3 = 1
2x2 + 3x3 = 2
4x3 = 5

ha come matrice completa la matrice


 
1 1 1 1
 0 2 3 2 
0 0 4 5
che è una matrice a gradini: si tratta quindi di un sistema a gradini.
Vedremo ora come trasformare un qualunque sistema in un sistema a gradini,
mostreremo che in questo procedimento di trasformazione emergono le even-
tuali incompatibilità e le equazioni superflue e si ottengono tutte le soluzioni
del sistema.
Per trasformare un sistema in un sistema a gradini, trasformeremo la sua
matrice completa in una matrice a gradini effettuando le seguenti operazioni
sulle sue righe, dette operazioni elementari di primo, secondo e terzo tipo:

(primo tipo): Scambiare tra loro due righe della matrice


(secondo tipo): Moltiplicare una riga della matrice per un c ∈ K che non sia zero
(terzo tipo): Sommare a una riga della matrice un’altra riga moltiplicata per un
c ∈ K qualunque.
 
1 1 1
Esempio 1.7. Consideriamo la matrice .
2 3 4
Come esempio di operazione elementare del primo tipo, possiamo scambiare
tra di loro la prima e la seconda riga della matrice:
   
1 1 1 2 3 4

2 3 4 1 1 1

14
Come esempio di operazione elementare del secondo tipo, possiamo moltipli-
care la prima riga della matrice per 3:
   
1 1 1 3 3 3

2 3 4 2 3 4
Infine, come esempio di operazione elementare del terzo tipo, possiamo som-
mare alla seconda riga della matrice la prima moltiplicata per 2
   
1 1 1 1 1 1

2 3 4 4 5 6
In generale, se R1 , . . . , Rm indicano le righe di una matrice, scriveremo Ri ↔
Rj per dire che stiamo scambiando tra loro la riga i-esima con la riga j-
esima (operazione del primo tipo); Ri → cRi per indicare che stiamo mol-
tiplicando la riga i-esima della matrice per c (operazione del secondo tipo);
Ri → Ri + cRj per indicare che stiamo sommando alla riga i-esima la riga
j-esima moltiplicata per c (operazione del terzo tipo).
Ad esempio, le tre operazioni fatte nella matrice dell’Esempio 1.7 sono,
nell’ordine, R1 ↔ R2 , R1 → 3R1 , R2 → R2 + 2R1 .
Ora, dimostriamo il seguente importante risultato:
Proposizione 1.8. Se effettuiamo operazioni elementari sulla matrice com-
pleta di un sistema, la matrice trasformata è la matrice completa di un siste-
ma equivalente a quello iniziale (ovvero avente le stesse soluzioni del sistema
iniziale).
Dimostrazione. Dobbiamo dimostrare che in seguito a ciascuna delle opera-
zioni elementari, l’insieme, diciamo S, delle soluzioni del sistema originale
e l’insieme, diciamo S 0 , delle soluzioni del sistema trasformato rimangono
uguali.
Ricordiamo che verificare che due insiemi S e S 0 sono uguali significa verificare
che ogni elemento del primo insieme S sta anche nell’insieme S 0 (cioè nel
passare da S a S 0 non abbiamo perso soluzioni), e viceversa che ogni elemento
di S 0 appartiene anche a S (cioè nel passare da S a S 0 non abbiamo aggiunto
soluzioni)6 .
6
Verificare una sola di queste due affermazioni significa verificare solo che uno dei due
insiemi è incluso nell’altro. Prendiamo ad esempio le due equazioni 2x = 6 e 4x2 = 36
(ottenuta dalla prima elevando al quadrato entrambi i membri): l’unica soluzione x = 3
della prima equazione è anche soluzione della seconda, ma viceversa non è vero che tutte
le soluzioni della seconda equazione sono soluzioni della prima (la seconda equazione ha
anche la soluzione x = −3, che non è soluzione della prima). Ovvero, l’insieme {3} delle
soluzioni della prima equazione è incluso nell’insieme {3, −3} delle soluzioni della seconda,
ma non uguale.

15
Iniziamo dalle operazioni elementari del primo tipo:
Data la matrice completa
 
a11 a12 · · · a1n b1
..
.
 
 
 ai1 ai2 · · · ain bi 
 
 .. 
(1.15)

 . 

 j1 aj2 · · · ajn bj 
 a 
 .. 
 . 
am1 am2 · · · amn bm
del sistema 
 a11 x1 + a12 x2 + · · · + a1n xn = b1
..


.




a x + a x + · · · + ain xn = bi



 i1 1 i2 2
.. (1.16)
 .


 aj1 x1 + aj2 x2 + · · · + ajn xn = bj
..


.




am1 x1 + am2 x2 + · · · + amn xn = bm

applichiamo l’operazione elementare che consiste nello scambiare la riga i-


esima con la riga j-esima, ottenendo la matrice
 
a11 a12 · · · a1n b1
..
.
 
 
 aj1 aj2 · · · ajn bj 
 
 .. 
(1.17)

 . 

 i1 ai2 · · · ain bi 
 a 
 .. 
 . 
am1 am2 · · · amn bm
che corrisponde al sistema trasformato

 a11 x1 + a12 x2 + · · · + a1n xn = b1
..


.




 aj1 x1 + aj2 x2 + · · · + ajn xn = bj



.. (1.18)
 .
 ai1 x1 + ai2 x2 + · · · + ain xn = bi


..


.




am1 x1 + am2 x2 + · · · + amn xn = bm

16
Notiamo che, chiaramente, il sistema originale (1.16) e il sistema trasformato
(1.18) hanno esattamente le stesse equazioni: scambiare le righe della matrice
ha avuto solo l’effetto di scambiare le corrispondenti equazioni nel sistema
che rimangono le stesse anche se disposte in un altro ordine.
Ma allora è chiaro che gli insiemi S e S 0 delle soluzioni del sistema originale
e del sistema trasformato sono uguali, in quanto il fatto che una n-upla sia
soluzione di una sistema non dipende dall’ordine in cui mettiamo le equazioni
del sistema.
Vediamo ora cosa succede nel caso di operazioni elementari del secondo tipo.
Effettuiamo sulla matrice completa
a11 a12 · · · a1n b1
 
..
.
 
 
 ai1 ai2 · · · ain bi  (1.19)
 

 .
..


am1 am2 · · · amn bm
del sistema

a11 x1 + a12 x2 + · · · + a1n xn = b1





 ..
.



ai1 x1 + ai2 x2 + · · · + ain xn = bi (1.20)

 ..


 .
am1 x1 + am2 x2 + · · · + amn xn = bm

l’operazione elementare che consiste nel moltiplicare la riga i-esima per c 6= 0,


ottenendo quindi la matrice
a11 a12 · · · a1n b1
 
..
.
 
 
 cai1 cai2 · · · cain cbi  (1.21)
 

 .
..


am1 am2 · · · amn bm
che corrisponde al nuovo sistema
a11 x1 + a12 x2 + · · · + a1n xn = b1



 ..
.



cai1 x1 + cai2 x2 + · · · + cain xn = cbi (1.22)

 ..


 .
am1 x1 + am2 x2 + · · · + amn xn = bm

17
Ora, se (v1 , . . . , vn ) ∈ S è una soluzione del sistema (1.20), questa verifica in
particolare la sua i-esima equazione, ovvero

ai1 v1 + ai2 v2 + · · · + ain vn = bi .


Moltiplicando entrambi i membri di questa uguaglianza per c abbiamo

c(ai1 v1 + ai2 v2 + · · · + ain vn ) = cbi


ovvero, sfruttando a primo membro la proprietà distributiva (che vale in
quanto siamo in un campo K),

cai1 v1 + cai2 v2 + · · · + cain vn = cbi


Questa uguaglianza ci dice che (v1 , . . . , vn ) soddisfa anche la i-esima equa-
zione del sistema trasformato (1.22). Non dovendo verificare nulla sulle altre
equazioni, che non sono cambiate, possiamo allora dire che (v1 , . . . , vn ) è
soluzione del sistema (1.22): in altre parole, abbiamo dimostrato la prima
implicazione (v1 , . . . , vn ) ∈ S ⇒ (v1 , . . . , vn ) ∈ S 0 .
Per verificare l’implicazione opposta, supponiamo che (v1 , . . . , vn ) ∈ S 0 sia
una soluzione del sistema (1.22): in particolare, tale n-upla verifica la sua
i-esima equazione, ovvero

cai1 v1 + cai2 v2 + · · · + cain vn = cbi .


Mettendo in evidenza il fattore comune c a primo membro abbiamo

c(ai1 v1 + ai2 v2 + · · · + ain vn ) = cbi


e, dividendo per c entrambi i membri (si noti che possiamo farlo perché
siamo in un campo e perché c 6= 0 per definizione di operazione elementare
del secondo tipo), otteniamo

ai1 v1 + ai2 v2 + · · · + ain vn = bi .


Questa uguaglianza ci dice che (v1 , . . . , vn ) soddisfa anche la i-esima equazio-
ne del sistema originale (1.20). Di nuovo, non dovendo verificare nulla sulle
altre equazioni, che non sono cambiate, possiamo allora dire che (v1 , . . . , vn )
è soluzione del sistema (1.20): in altre parole, abbiamo dimostrato anche la
seconda implicazione (v1 , . . . , vn ) ∈ S 0 ⇒ (v1 , . . . , vn ) ∈ S, che assieme alla
prima mostra che S = S 0 , come volevamo.
Vediamo ora cosa succede nel caso di operazioni elementari del terzo tipo.

18
Effettuiamo sulla matrice completa
 
a11 a12 · · · a1n b1
..
.
 
 
 ai1 ai2 · · · ain bi 
 
 .. 
(1.23)

 . 

 a
 j1 a j2 · · · ajn bj 


 .
..


am1 am2 · · · amn bm
del sistema

 a11 x1 + a12 x2 + · · · + a1n xn = b1
..


.




a x + a x + · · · + ain xn = bi



 i1 1 i2 2
.. (1.24)
 .


 aj1 x1 + aj2 x2 + · · · + ajn xn = bj
..


.




am1 x1 + am2 x2 + · · · + amn xn = bm

l’operazione elementare che consiste nel sommare alla riga j-esima la riga
i-esima moltiplicata per c, ottenendo quindi la matrice
 
a11 a12 ··· a1n b1
..
.
 
 
ai1 ai2 ··· ain bi
 
 
 .. 
(1.25)

 . 

 a + ca a + ca · · · a + ca
in bj + cbi 

 j1 i1 j2 i2 jn

 .
..


am1 am2 ··· amn bm
che corrisponde al sistema

 a11 x1 + a12 x2 + · · · + a1n xn = b1
..


.




ai1 x1 + ai2 x2 + · · · + ain xn = bi




.. (1.26)
 .
 (aj1 + cai1 )x1 + (aj2 + cai2 )x2 + · · · + (ajn + cain )xn = bj + cbi


..


.




am1 x1 + am2 x2 + · · · + amn xn = bm

19
Ora, se (v1 , . . . , vn ) ∈ S, cioè è una soluzione del sistema (1.24), essa verifica
in particolare le sue i-esima e j-esima equazione, ovvero

ai1 v1 + ai2 v2 + · · · + ain vn = bi


(1.27)
aj1 v1 + aj2 v2 + · · · + ajn vn = bj
Sommando il primo membro della seconda equazione con il primo membro
della prima, moltiplicato per c, troviamo allora l’uguaglianza

aj1 v1 + aj2 v2 + · · · + ajn vn + c(ai1 v1 + ai2 v2 + · · · + ain vn ) = bj + cbi .

Sviluppando i calcoli,

aj1 v1 + aj2 v2 + · · · + ajn vn + cai1 v1 + cai2 v2 + · · · + cain vn = bj + cbi

che, mettendo in evidenza v1 , . . . , vn , può essere riscritta

(aj1 + cai1 )v1 + (aj2 + cai2 )v2 + · · · + (ajn + cain )vn = bj + cbi

Questa uguaglianza ci dice che (v1 , . . . , vn ) soddisfa anche la j-esima equa-


zione del sistema trasformato (1.26). Non dovendo verificare nulla sulle altre
equazioni, che non sono cambiate, possiamo allora dire che (v1 , . . . , vn ) è
soluzione del sistema (1.26): in altre parole, abbiamo dimostrato la prima
implicazione (v1 , . . . , vn ) ∈ S ⇒ (v1 , . . . , vn ) ∈ S 0 .
Per verificare l’implicazione opposta, supponiamo che (v1 , . . . , vn ) ∈ S 0 sia
una soluzione del sistema (1.26): in particolare, tale n-upla verifica le sue
i-esima e j-esima equazione, ovvero

ai1 v1 + ai2 v2 + · · · + ain vn = bi


(1.28)
(aj1 + cai1 )v1 + (aj2 + cai2 )v2 + · · · + (ajn + cain )vn = bj + cbi

Sviluppando i conti nella seconda uguaglianza, troviamo

aj1 v1 + cai1 v1 + aj2 v2 + cai2 v2 + · · · + ajn vn + cain vn = bj + cbi

ovvero, mettendo in evidenza il fattore c negli addendi in cui compare,

aj1 v1 + aj2 v2 + · · · + ajn vn + c(ai1 v1 + ai2 v2 + +ain vn ) = bj + cbi (1.29)

20
Ora, poichè (v1 , . . . , vn ) soddisfa la prima delle uguaglianze (1.28), la quantità
che moltiplica c a primo membro della (1.29) è uguale a bi , e quindi possiamo
riscrivere la (1.29) come

aj1 v1 + aj2 v2 + · · · + ajn vn + cbi = bj + cbi


Ma allora, semplificando il termine cbi che compare sia a primo che a secondo
membro, arriviamo a

aj1 v1 + aj2 v2 + · · · + ajn vn = bj


che ci dice esattamente che (v1 , . . . , vn ) soddisfa anche la j-esima equazione
del sistema originale (1.24). Di nuovo, non dovendo verificare nulla sulle
altre equazioni, che non sono cambiate, possiamo allora dire che (v1 , . . . , vn )
è soluzione del sistema (1.24): in altre parole, abbiamo dimostrato anche a
seconda implicazione (v1 , . . . , vn ) ∈ S 0 ⇒ (v1 , . . . , vn ) ∈ S, che assieme alla
prima mostra che S = S 0 , come volevamo.
La dimostrazione è conclusa.

Ora, mostriamo tramite alcuni esempi come, usando le operazioni elementari,


si possa trasformare un qualunque sistema in un sistema a gradini (che, in
base alla Proposizione 1.8, sarà equivalente al sistema originale) e come poi
risolvere tale sistema.
Sia

 x1 + x2 + x3 = 1
−x1 + x2 − 3x3 = 0 (1.30)
−x1 + x2 + x3 = −3

il sistema con matrice completa7


 
1 1 1 1
 −1 1 −3 0  . (1.31)

−1 1 1 −3
Ora, vogliamo trasformare tale matrice in una matrice a gradini usando le
operazioni elementari, in modo da ottenere un sistema a gradini equivalente
al sistema (1.30).
Ricordiamo che, in base alla definizione di matrice a gradini, visto che il primo
elemento a11 della prima riga è diverso da zero, e sta nella prima colonna, i
7
D’ora in poi, nella matrice completa tracceremo a volte una linea per separare la
matrice dei coefficienti dalla colonna dei termini noti.

21
primi elementi diversi da zero della seconda e della terza riga non possono
stare anche loro nella prima colonna: in altre parole, dobbiamo trasformare
la matrice in modo che a21 e a31 siano uguali a zero.
Otteniamo sicuramente questo scopo se applichiamo le operazioni elementari
del terzo tipo R2 → R2 + R1 e R3 → R3 + R1 : infatti,
   
1 1 1 1 1 1 1 1
 −1 1 −3 0  −→  0 2 −2 1 
R2 →R2 +R1
−1 1 1 −3 R3 →R3 +R1 0 2 2 −2
La matrice trasformata non è ancora una matrice a gradini in quanto il
primo elemento non nullo della terza riga si trova in corrispondenza della
stessa colonna (la seconda) del primo elemento non nullo nella seconda riga:
dobbiamo far sı̀ che a32 = 0. A questo scopo, basta applicare l’operazione
elementare R3 → R3 − R2 : cosı̀ facendo si ottiene
   
1 1 1 1 1 1 1 1
 0 2 −2 1  −→  0 2 −2 1 
R3 →R3 −R2
0 2 2 −2 0 0 4 −3
Abbiamo ottenuto quindi lo scopo desiderato di trasformare la matrice in
una matrice a gradini.
Il sistema

 x1 + x2 + x3 = 1
2x2 − 2x3 = 1 (1.32)
4x3 = −3

corrispondente alla matrice trasformata è, come sappiamo, equivalente al


sistema originale (1.30), quindi trovando le sue soluzioni avremo risolto il
sistema (1.30).
Ora, il principale vantaggio di un sistema a gradini consiste nel fatto che
nelle equazioni compaiono sempre meno incognite (leggendole dalla prima
all’ultima): per risolverlo, basta quindi iniziare a risolvere le equazioni da
quella che contiene meno incognite (l’ultima) e risalire mediante sostituzioni
fino alla prima. Più precisamente, dall’ultima equazione 4x3 = −3 ricaviamo
subito x3 = − 43 ; sostituendo il valore cosı̀ trovato nella seconda equazione
troviamo

3 3 1 1
2x2 − 2x3 = 1 → 2x2 = 1 + 2x3 = 1 + 2(− ) = 1 − = − → x2 = −
4 2 2 4
e analogamente, sostituendo i valori di x2 e x3 cosı̀ ottenuti nella prima
equazione troviamo

22
1 3
x1 + x2 + x3 = 1 → x1 = 1 − x2 − x3 = 1 − (− ) − (− ) = 2
4 4
Riassumendo, la terna (2, − 14 , − 43 ) è l’unica soluzione del sistema (1.32),
ovvero del sistema iniziale (1.30).
Ora vediamo altri due esempi significativi di risoluzione di un sistema lineare,
che metteranno in evidenza ulteriori vantaggi della riduzione a gradini.
Consideriamo il sistema

 x1 + x 2 + x3 = 1
x1 − x 2 − x3 = 0 (1.33)
x1 + 3x2 + 3x3 = 1

che ha come matrice completa


 
1 1 1 1
 1 −1 −1 0  . (1.34)

1 3 3 1
Come fatto per il sistema precedente, trasformiamo tale matrice in una
matrice a gradini mediante operazioni elementari.
   
1 1 1 1 1 1 1 1
 1 −1 −1 0  −→  0 −2 −2 −1 
R2 →R2 −R1
1 3 3 1 R3 →R3 −R1 0 2 2 0
   
1 1 1 1 1 1 1 1
 0 −2 −2 −1  −→  0 −2 −2 −1 
R3 →R3 +R2
0 2 2 0 0 0 0 −1
Notiamo che la terza riga della matrice trasformata corrisponde all’equazione
0x1 + 0x2 + 0x3 = −1, ovvero 0 = −1: poichè questa uguaglianza è falsa,
non esiste nessuna terna che soddisfi le tre condizioni del sistema ridotto
corrispondente, ovvero tale sistema non ha soluzioni. Questo, in virtù dell’e-
quivalenza tra il sistema originale e quello ridotto, ci dice che il sistema di
partenza non ha soluzioni, ovvero è incompatibile.
Evidentemente tra le equazioni del sistema di partenza vi era una incom-
patibilità non evidente che il procedimento di riduzione a gradini ha fatto
emergere.
Consideriamo ora come ultimo esempio il sistema

23

 x1 + x2 + 3x3 = 1
x1 − 2x2 + x3 = 0 (1.35)
x1 − 5x2 − x3 = −1

che ha come matrice completa


 
1 1 3 1

 1 −2 1 0 . (1.36)

1 −5 −1 −1
Applicando operazioni elementari per ridurre a gradini,

   
1 1 3 1
1 1 3 1

 1 −2 1 0  −→  0 −3 −2 −1  (1.37)
R2 →R2 −R1
1 −5 −1 −1 R3 →R3 −R1 0 −6 −4 −2

   
1 1 3 1
1 1 3 1

 0 −3 −2 −1  −→  0 −3 −2 −1  (1.38)
R3 →R3 −2R2
0 −6 −4 −2 0 0 0 0
Notiamo che la terza riga della matrice trasformata corrisponde all’equazione
0x1 + 0x2 + 0x3 = 0, ovvero 0 = 0.
Quest’ultima condizione è un’identità vera indipendentemente dal valore che
diamo alle incognite, quindi essa può essere cancellata dal sistema senza
influire sulle sue soluzioni. In altre parole, il sistema iniziale di tre equazioni
si è trasformato nel sistema di due equazioni equivalente

x1 + x2 + 3x3 = 1
(1.39)
−3x2 − 2x3 = −1
Benché non sia rimasta un’equazione con una sola incognita come nel pri-
mo sistema che abbiamo risolto, possiamo comunque procedere nel modo
seguente: ricaviamo x2 dalla seconda equazione:

2 1
−3x2 − 2x3 = −1 → −3x2 = 2x3 − 1 → x2 = − x3 + (1.40)
3 3
e sostituiamo l’espressione ottenuta nella prima equazione per ricavare x1 :

 
2 1 2 7
x1 + x2 + 3x3 = 1 → x1 = 1 − x2 − 3x3 = 1 − − x3 + − 3x3 = − x3 .
3 3 3 3
(1.41)

24
Ora, qualunque valore t ∈ R assegniamo a x3 , la (1.40) e la (1.41) ci dicono
che se poniamo x2 = − 32 t + 31 e x1 = 23 − 73 t, le equazioni del sistema saranno
soddisfatte, ovvero otterremo una soluzione.
In altre parole, le soluzioni del sistema sono esattamente tutte le terne del
tipo ( 23 − 37 t, − 23 t + 31 , t) al variare di t ∈ R: il sistema ha quindi infinite
soluzioni.
Più precisamente, dal momento che le infinite soluzioni del sistema dipendono
da un solo parametro libero t, si dice che il sistema ha “infinito alla uno” (si
scrive ∞1 ) soluzioni.
In generale, possiamo dare la seguente

Definizione 1.9. Un sistema di equazioni lineari ha ∞k soluzioni se l’espres-


sione generale della sua soluzione dipende da k parametri liberi.

Osservazione 1.10. Quando risolviamo un sistema ridotto a gradini, pro-


cediamo dall’ultima equazione alla prima ricavando per ogni equazione del
sistema una incognita (eventualmente in funzione di altre incognite): questo
significa che il numero di parametri liberi nell’espressione della soluzione sarà
uguale alla differenza tra il numero delle incognite e il numero di equazioni
non nulle rimaste dopo la riduzione.
In particolare, avremo un’unica soluzione (cioè nessun parametro libero) solo
nel caso in cui il numero di equazioni non nulle rimaste dopo la riduzione sia
uguale al numero di incognite8 .

Concludiamo questo capitolo con una dimostrazione rigorosa del fatto che
un sistema a gradini non ha equazioni dipendenti dalle altre, il che prova che
il procedimento di riduzione elimina tutte le eventuali equazioni dipendenti
(superflue) presenti in un sistema.
Poichè le equazioni di un sistema corrispondono alle righe della sua matrice
completa e, in base alla definizione di sistema a gradini, tale matrice è una
matrice a gradini, basterà dimostrare che in una matrice a gradini nessuna
riga può essere scritta come combinazione lineare delle altre.
Prima di dare la dimostrazione, osserviamo che il fatto che una tra le righe
R1 , R2 , . . . , Rm di una matrice si possa scrivere come combinazione delle altre
equivale all’esistenza di una relazione del tipo

c1 R1 + c2 R2 + · · · + cm Rm = 0 (1.42)
8
Osserviamo che questa affermazione è falsa se non ci limitiamo a sistemi ridotti a
gradini, come dimostra il semplice esempio del sistema (1.8) che ha due equazioni, due
incognite ma infinite soluzioni.

25
dove c1 , c2 , . . . , cm sono elementi di K non tutti uguali a zero (altrimenti tale
uguaglianza sarebbe sempre banalmente vera) e dove stiamo denotando con
0 la riga nulla.
Infatti, da una parte, se vale la (1.42) con coefficienti c1 , c2 , . . . , cm non tutti
nulli, allora, supponendo ad esempio che sia ci 6= 0, possiamo, portando a
secondo membro9 tutti gli addendi tranne ci Ri , scrivere

ci Ri = −c1 R1 − · · · − ci−1 Ri−1 − ci+1 Ri+1 − · · · − cm Rm


e a questo punto, dividendo per ci che per ipotesi è diverso da zero, otteniamo
c1 ci−1 ci+1 cm
Ri = − R1 − · · · − Ri−1 − Ri+1 − · · · − Rm
ci ci ci ci
ovvero vediamo che una riga (proprio Ri ) si scrive come combinazione delle
altre.
Viceversa, se una riga Ri si scrive come combinazione delle altre, ovvero

Ri = +c1 R1 + · · · + ci−1 Ri−1 + ci+1 Ri+1 + · · · + cm Rm ,


portando tutto a secondo membro otteniamo

c1 R1 + · · · + ci−1 Ri−1 − Ri + ci+1 Ri+1 + · · · + cm Rm = 0


ovvero una relazione del tipo (1.42) con i coefficienti non tutti nulli (il
coefficiente di Ri è −1).
Siamo ora pronti a dimostrare quanto annunciato, ovvero la seguente

Proposizione 1.11. Tra le righe non nulle di una matrice a gradini non
esiste nessuna relazione di dipendenza del tipo (1.42) con i coefficienti ci non
tutti nulli.

Dimostrazione. Per definizione di matrice a gradini le sue righe saranno del


tipo

R1 = (a11 , . . . ), a11 6= 0
R2 = (0, . . . , 0, a2k , . . . , ), a2k 6= 0
R3 = (0, . . . , 0, 0, . . . , 0, a3j , . . . , ), a3j 6= 0
9
Portare a secondo membro le righe presuppone, come abbiamo spiegato nel primo
paragrafo nella discussione preliminare alla definizione di campo (pag. 2), che ogni riga R
abbia un suo opposto, ovvero una riga R0 che sommata a R dà come risultato la riga nulla.
Ma questo in effetti è vero: basta prendere come R0 la riga che si ottiene da R cambiando
di segno tutte le sue entrate (in altre parole, R0 = (−1)R).

26
..
.
con k > 1, j > k etc. ovvero in ogni riga il primo elemento non nullo compare
via via con secondo indice sempre più grande.
Ora, se tra le righe valesse una relazione come la (1.42), questo vorrebbe dire
che

c1 (a11 , . . . )+c2 (0, . . . , 0, a2k , . . . , )+c3 (0, . . . , 0, 0, . . . , 0, a3j , . . . , )+· · · = (0, . . . , 0)

(1.43)

Ma andiamo a guardare cosa significa questa uguaglianza entrata per entrata:


poichè la prima riga è l’unica con prima entrata diversa da zero, facendo i
calcoli a primo membro della (1.43) vediamo che nella prima entrata rimane
solo c1 a11 = 0: ma, essendo per ipotesi a11 6= 0, necessariamente deve essere
c1 = 0. Quindi, la (1.43) si riduce a

c2 (0, . . . , 0, a2k , . . . , )+c3 (0, . . . , 0, 0, . . . , 0, a3j , . . . , )+· · · = (0, . . . , 0) (1.44)

Ora, guardiamo la k-esima entrata di questa relazione (cioè la prima diversa


da zero nella seconda riga): dal momento che tutte le righe successive alle
seconda hanno la prima entrata diversa da zero con indice più alto, otteniamo
c2 a2k = 0, che, essendo a2k 6= 0, ci dice che c2 = 0.
Dunque la (1.44) si riduce a

c3 (0, . . . , 0, 0, . . . , 0, a3j , . . . , ) + · · · = (0, . . . , 0)


e, continuando a ragionare in questo modo, vedremo che tutti i coefficienti
ci si devono annullare, e quindi non può esistere una relazione di dipendenza
del tipo (1.42) con i coefficienti non tutti nulli.

Esempio 1.12. Non è difficile vedere concretamente come la comparsa di


una riga nulla dopo una riduzione indica sempre una relazione di dipendenza
tra le righe iniziali.
Ad esempio, riprendiamo il sistema (1.35) e in particolare la riduzione fatta
nei passaggi (1.37) - (1.38).
In tali passaggi, abbiamo effettuato prima le due operazioni R2 → R2 − R1 ,
R3 → R3 −R1 e infine abbiamo sottratto alla terza riga la seconda (entrambe
trasformate dopo il primo passaggio) moltiplicata per due, ottenendo come
risultato una riga nulla.

27
In altre parole, se denotiamo con R20 e R30 la seconda e la terza riga trasformate
dopo il primo passaggio (cioè R20 = R2 − R1 e R30 = R3 − R1 ) abbiamo
trovato R30 − 2R20 = 0, ovvero, sostituendo l’espressione di R30 e R20 , si ha
(R3 − R1 ) − 2(R2 − R1 ) = 0, che svolgendo i conti ci dice

R3 + R1 − 2R2 = 0
che è proprio una relazione di dipendenza del tipo (1.42).
Procedendo come in questo esempio si può dimostrare rigorosamente che
in generale se dopo una riduzione si annulla una riga allora nella matrice
originaria era presente una relazione di dipendenza, ma omettiamo i dettagli.

28

Potrebbero piacerti anche