F0123 904 Appunti Matematica Discreta 12 Gennaio 2010 PDF

0
VERSIONE 12 GENNAIO 2010

Capitolo 1
INSIEMI E FUNZIONI
1.1 Insiemi
Una delle fondamentali attività del pensiero umano è quella di formare insiemi: essa
consiste nel raggruppare gli oggetti che quotidianamente cadono sotto la nostra attenzione,
a seconda delle loro proprietà o a seconda delle relazioni che intercorrono fra di essi.
Intuitivamente, dunque, un insieme è un recipiente ideale contenente degli oggetti,
detti elementi dellinsieme. Per esempio:
(1) Linsieme i cui elementi sono i numeri 1, 35, 4, 2, 5, 2.

(2) Linsieme i cui elementi sono le lettere a, e, i, o, u.
(3) Linsieme i cui elementi sono i numeri interi positivi che sono somma di due numeri
dispari.
(4) Linsieme i cui elementi sono i numeri interi pari positivi.
(5) Linsieme i cui elementi sono le soluzioni reali dellequazione x2 2x 8 = 0.
(6) Linsieme i cui elementi sono i numeri 0, 1, 2, 3, ecc. e le lettere a, e, i, o, u.
(7) Linsieme i cui elementi sono i numeri 2, 4.
(8) Linsieme i cui elementi sono le circonferenze di un dato piano che hanno tutte
il centro in un punto fissato.
Gli elementi di un insieme possono essere, alcuni o tutti, a loro volta insiemi. E il caso
dellinsieme (8); infatti una circonferenza può essere a sua volta pensata come linsieme
di tutti i punti di un piano che hanno una distanza prefissata (il raggio) da un punto
prefissato (il centro).
Indicheremo solitamente gli insiemi con lettere (latine o greche) maiuscole come A,
B, C,. . . , A, B, C,. . . , , , ,. . . , mentre useremo lettere minuscole come a, b, c,. . . ,
, , ,. . . per indicare gli elementi di un insieme. Naturalmente non potremo sempre
osservare tale convenzione, specie quando si tratta di insiemi i cui elementi sono a loro
volta insiemi. In ogni caso la scelta di un particolare simbolo per indicare un insieme (o
un qualunque oggetto matematico) è dettata essenzialmente da motivi di opportunità o
di consuetudine.
1
CAPITOLO 1. INSIEMI E FUNZIONI 2
La proprietà di partenza nella Teoria degli Insiemi è la proprietà di appartenenza:

se A è un insieme ed a è qualche oggetto, si scrive
aA oppure A3a
per indicare che a è un elemento di A e si legge, appunto, a appartiene ad A. In caso
contrario si scrive
a 6 A oppure A 63 a.
Dunque, se A è un insieme, per ogni oggetto a risulta a A oppure a 6 A (qui la congiun-
zione oppure va presa con il significato avversativo: come ci suggerisce il buon senso,
almeno una delle due condizioni deve valere e mai tutte e due contemporaneamente); in
altri termini un insieme è perfettamente individuato dai suoi elementi, con il che possiamo
stabilire il seguente
Principio di Uguaglianza per gli Insiemi: Due insiemi A, B sono uguali se, e solo
se, essi hanno gli stessi elementi, cioè se, e solo se, da a A segue a B e da a B segue
a A. Si indica ciò scrivendo A = B.
In base a tale principio due insiemi A, B sono distinti (scriviamo A 6= B) se, e solo
se, esiste almeno un elemento di A che non appartiene a B oppure un elemento di B che
non appartiene ad A (in questo caso la congiunzione oppure non è avversativa, perchè,
comè evidente, non dobbiamo escludere che si verifichino tutte e due le condizioni).
Un insieme A si dice vuoto se non ha elementi, ossia se per ogni oggetto a risulta
a 6 A. Se due insiemi A, B sono vuoti allora necessariamente A = B. Infatti, se cos` non
fosse, per il Principio di Uguaglianza per gli Insiemi vi sarebbe un elemento a A tale
che a 6 B, oppure un elemento b B tale che b 6 A, quindi almeno uno degli insiemi
A, B non sarebbe vuoto in contrasto con lipotesi. Lunico insieme vuoto si indica con il
simbolo .
Consideriamo gli insiemi dati negli esempi allinizio di questa sezione e indichiamoli
rispettivamente con A1 , A2 , . . . , A8 . Osserviamo che nellassegnare tali insiemi abbiamo
seguito due distinte modalità. La prima consiste nellelencare esplicitamente gli elementi
dellinsieme in questione, come nel caso degli insiemi A1 , A2 , A7 ; linsieme viene allora
indicato scrivendo i simboli che denotano i suoi elementi, racchiudendoli fra due parentesi
graffe, come per esempio:
A1 = {1, 35, 4, 2, 5, 2},
A2 = {a, e, i, o, u},
A7 = {2, 4},
Si dice allora che si è data la rappresentazione tabulare dellinsieme. Si noti che,
come conseguenza del Principio di Uguaglianza degli Insiemi, lordine nel quale vengono
scritti gli elementi è irrilevante, come pure la ripetizione di un singolo elemento; per
esempio gli insiemi {2, 2, 1, 35, 5, 4} e {2, 1, 35, 2, 1, 5, 4, 35} coincidono con linsieme
A1 . A volte si scrive una rappresentazione tabulare di un insieme indicando solo alcuni
dei suoi elementi, risultando chiari dal contesto i rimanenti; è il caso di A6 . La seconda
modalità consiste nellenunciare una certa proprietà la quale, automaticamente, individua
linsieme di tutti gli oggetti che la verificano (come per gli insiemi A3 , A4 , A5 , A8 ). Su
questo punto torneremo nella prossima sezione.
Mentre la teoria degli insiemi fornisce alla Matematica il linguaggio, i numeri costitu-
iscono per essa gli ingredienti di base. In realtà si sa da oltre un secolo che i numeri stessi
possono essere definiti usando unicamente il linguaggio insiemistico, addirittura assumen-
do solamente lesistenza dellinsieme vuoto e imponendo pochi postulati generali sugli
insiemi. Anche se lesporre in modo completo ed organico questa teoria esula dai nostri
scopi, nelle Sezioni 1.4, 1.6 e 2.6 noi forniremo dei concetti di base sui principali insiemi
di numeri. Tuttavia, al solo scopo di avere sottomano degli esempi concreti dei concetti
che andiamo esponendo, anticipiamo qui appresso lingresso di tali insiemi, designandoli
con i simboli che vengono usati ormai universalmente:
N := {0, 1, 2, 3, . . .} è linsieme dei numeri naturali ; (1 )

Z := {0, 1, 1, 2, 2, 3, 3, . . .} è linsieme dei numeri interi relativi ;
Q è linsieme dei numeri razionali , cioè le frazioni a/b dove a, b sono interi
relativi e b 6= 0;
Q+ è linsieme dei numeri razionali non negativi ;
R è linsieme dei numeri reali ;
R+ è linsieme dei numeri reali non negativi ;
Useremo inoltre i simboli N , Z , Q , Q+ , R , R+ per indicare gli insiemi N, Z, Q, Q+ , R,

R+ privati del numero 0. Avvertiamo che, nella letteratura, non cè uniformità nelluso
del simbolo N. Infatti, nella tradizione anglosassone vengono intesi come numeri naturali
i numeri 1, 2, 3, . . ., usando il simbolo N per indicare linsieme da essi formato (per il quale
noi usiamo invece il simbolo N ).
Se n è un intero positivo, noi indichiamo con n linsieme dei numeri da 1 a n, scrivendo
n = {1, . . . , n}, ossia 1 = {1}, 2 = {1, 2}, 3 = {1, 2, 3}, ecc.. Coerentemente, dobbiamo
porre 0 = .
Ragionevolmente, ci sono insiemi finiti e insiemi infiniti. Pi` u avanti definiremo in
modo formale e preciso tali concetti; per ora, anche in questo caso al solo fine di disporre
di esempi concreti, noi ci accontentiamo del seguente significato intuitivo: diciamo che
un insieme A è finito se è vuoto o se i suoi elementi possono essere contati tramite i
numeri naturali positivi e il processo di conteggio si arresta ad un certo numero n, che si
chiama la cardinalit` a di A e si indica con |A|; se ciò non accade, si dice che A è infinito.
Cos`, in particolare, risulta |n| = n.
Definizione 1.1.1. Dati due insiemi A, B, si dice che A è un sottoinsieme o una

parte di B, oppure che A è contenuto in B o che B contiene A, se ogni elemento di
A è anche un elemento di B. In tal caso si scrive A B oppure B A; tale proprietà si
chiama linclusione.
Se A non è un sottoinsieme di B, cioè se vi è almeno un elemento a A tale che a 6 B,

allora si scrive A 6 B oppure B 6 A. E importante osservare che scrivendo A B non
si esclude che sia addirittura A = B; per questa ragione alcuni autori scrivono A B
(rispettivamente B A) in luogo di A B (risp. B A).
1
Il simbolo := viene usato con il seguente criterio: il significato dellespressione che si trova alla
sua sinistra, che compare per la prima volta nel testo, viene specificato dallespressione che si trova alla
sua destra, la quale ha un significato gi`
a noto.
Se A B, ma A 6= B (cioè A B e A 6 B, ossia ogni elemento di A appartiene a

B ma almeno un elemento di B non appartiene ad A), allora si dice che A è una parte
propria o sottoinsieme proprio di B e si scrive A $ B oppure B % A.
Dalla definizione segue immediatamente che due insiemi A, B sono uguali esattamente
quando è al tempo stesso A B e B A; in particolare A A per ogni insieme A.
Se A, B, C sono tre insiemi ed è A B e B C (questo fatto lo indicheremo spesso
scrivendo A B C), allora A C. Si osservi che per ogni insieme A risulta A;
se cos` non fosse, esisterebbe un insieme A tale che 6 A, quindi vi sarebbe un elemento
x tale che x 6 A: assurdo perche è privo di elementi.
Esercizio 1.1.2. Di ciascuna delle seguenti affermazioni stabilire quale è vera e quale è
falsa, spiegando con precisione il motivo (attenzione: qui e nel seguito, salvo diversamente
specificato, il simbolo 0 indica il numero zero , da distinguere dalla lettera O):
a) 0 {}; b) {, 1}; c) ; d) {}; e) 0 {{0}}; f) {x, {}}; g) {};
h) {x, {}} = {x, }; i) {, } = {, {}}; j) {{2, 4, 2}} = {2, 4, 2}.
Definizione 1.1.3. Dato un insieme A, linsieme i cui elementi sono i sottoinsiemi di A

si chiama linsieme delle parti di A, o linsieme potenza di A, e si indica con P(A)
oppure 2A .
(il motivo delluso della seconda notazione apparirà chiaro nel seguito).
Esempi 1.1.4. Risulta P() = {}. Se A = {x}, B = {a, b, c}, C = {4, 9}, al-
lora P(A) = {{x}, }, P(B) = {{a}, {b}, {c}, {a, b}, {a, c}, {b, c}, {a, b, c}, }, P(C) =
{{4}, {9}, {4, 9}, }.
Esercizio 1.1.5. Trovare linsieme delle parti di ciascuno dei seguenti insiemi:
a) {3, 6, 2, 3}; b) {{2}}; c) {, {2, 1}}; d) {}; e) P(); f) P(P()).
1.2 Il concetto di enunciato. Elementi di logica.

Nella sezione precedente abbiamo visto come un insieme possa essere dato come la to-
talità degli oggetti che verificano una proprietà assegnata. Siccome in Matematica questa
procedura è molto pi` u frequente rispetto a quella che consiste nellelencare esplicitamente
gli elementi dellinsieme, riteniamo utile approfondire un poco il concetto di proprietà,
fornendo alcuni elementi di Logica, o Calcolo dei Predicati.
In linea di principio un enunciato è una qualunque espressione linguistica della quale
abbia senso dichiarare che è vera o falsa e mai tutte e due le cose assieme. Sinonimi di
enunciato sono propriet` a e proposizione . Ecco alcuni esempi:
la molecola di acqua possiede due atomi di idrogeno. (1.2.1)
il numero 4 è maggiore del numero 3, (1.2.2)

il numero intero 3 divide il numero intero 10, (1.2.3)
il fiume Tevere sfocia nel mar Baltico, (1.2.4)
Naturalmente le (1.2.1), (1.2.2) sono vere, mentre le (1.2.3), (1.2.4) sono false. In Matema-
tica si dichiarano molti enunciati che non riguardano oggetti specifici, come ad esempio:
il numero x è maggiore del numero 3. (1.2.5)
Evidentemente non ha senso chiedersi se la (1.2.5) è vera o falsa: questo dipenderà da

quale numero sostituiamo ad x. Qui la lettera x sta ad indicare un oggetto generico,
non specificato; si dice allora che x è una variabile o parametro e si dice che la (1.2.5)
è una propriet` a di x. Enunciati di questo genere si chiamano enunciati aperti o
funzioni proposizionali. Naturalmente vi sono enunciati aperti che dipendono da due
o pi`
u variabili, come ad esempio:
x2 + y 2 6 3,
x2 + y 2 = z.
Come ulteriore esempio abbiamo la proprietà fondamentale (e primordiale) che è alla
base della Teoria degli Insiemi: si tratta della proprietà
x è un elemento di Y
di appartenenza di un oggetto x ad un insieme Y , abbreviata con x Y . Anche qui

la lettera x sta ad indicare un oggetto generico, non specificato e analogamente Y indica
un insieme generico, non specificato.
Unaltra proprietà fondamentale è luguaglianza o identit` a. In determinati contesti
può accadere che due simboli distinti, per esempio x e y, indichino uno stesso oggetto;
comè usuale si scrive allora x = y e si legge x è uguale ad y oppure x e y sono lo
stesso oggetto .
In quello che segue indichiamo generici enunciati con lettere maiuscole A, B, C . . . ,
scrivendo inoltre A(x), B(x, y), C(x, y, z) . . . per indicare enunciati aperti relativi ad una
singola variabile x, a due variabili x, y, a tre variabili x, y, z, ecc..
Accanto ad ogni enunciato A si può considerare la sua negazione non A , abbreviata
con il simbolo A; per esempio se A è lenunciato il numero 34 è divisibile per 3 , A
è lenunciato il numero 34 non è divisibile per 3 . In generale A è vero esattamente
quando A è falso. Se V sta per vero e F per falso, possiamo compilare la tavola
di verit`
a della negazione (speriamo che il senso di questa tavola, come delle successive
che mostreremo, scaturisca semplicemente dal suo aspetto):
A V F
A F V
Tramite luso delle congiunzioni e , oppure si possono costruire proprietà (o enun-
ciati) pi`
u complesse partendo da proprietà pi` u semplici. Se A, B sono due enunciati,
lenunciato A e B si chiama la congiunzione di A e B e si abbrevia con A B; per
esempio se A, B sono rispettivamente gli enunciati 5 è un numero primo e 7 è multi-
plo di 2 , A B è lenunciato 5 è un numero primo e 7 è multiplo di 2 . Chiaramente
A B è vero esattamente quando A e B sono ambedue veri; in particolare, nellesempio
appena dato lenunciato A B è falso, essendo falso B. Dunque la tavola di verità della
congiunzione è la seguente:
A V V F F
B V F V F
AB V F F F
Lenunciato A oppure B si abbrevia con A B e si chiama la disgiunzione di A e

B; se questi hanno il significato dellesempio di cui sopra, allora A B è lenunciato 5 è
un numero primo oppure 7 è multiplo di 2 . Avvertiamo che in matematica lenunciato
A oppure B significa sempre A oppure B oppure entrambi ; se in un determinato
contesto la terza possibilità è esclusa, ciò viene detto esplicitamente. Dunque A B
è vero esattamente quando almeno uno dei due enunciati A, B è vero; in particolare,
nellesempio di cui sopra A B è vero. Ecco la tavola di verità della disgiunzione:
A V V F F
B V F V F
AB V V V F
Dati due enunciati A, B, lenunciato se A è vero, allora anche B è vero , che ha

lo stesso significato di A implica B , si abbrevia con il simbolo A = B e si chiama
implicazione (semplice). La doppia implicazione tra A e B si abbrevia con A B
` importante
e significa A implica B e B implica A , oppure A e B sono equivalenti . E
rendersi conto che lenunciato A = B è equivalente a ciascuno degli enunciati B è vero
oppure A è falso e A solo se B , mentre A B è equivalente a A se e solo se B
ed anche a A esattamente se B . Ecco le relative tavole di verità:
A V V F F
B V F V F
A = B V F V V
A V V F F
B V F V F
A B V F F V
Esercizio 1.2.1. Aiutandosi con le opportune tavole di verità, si stabiliscano le seguenti

equivalenze (si noti che le parentesi hanno il solo scopo di evitare possibili confusioni):
a) ((A)) A,
b) (A = B) ((A) B),
c) ((A B)) ((A) (B)),
d) ((A B)) ((A) (B)),
e) (A = B) ((B) = (A)),
f) ((A = B) (B = C)) = (A = C),
g) (A B) ((A) (B)),
h) A (B C)) (A B) (A C),
i) A (B C)) (A B) (A C).
Esercizio 1.2.2. Utilizzando i connettivi logici introdotti, esprimere in formule gli enun-
ciati seguenti:
a) A oppure B e non entrambi.

b) Almeno due di tre enunciati A, B, C sono veri.
Le locuzioni per ogni ed esiste si chiamano rispettivamente quantificatore uni-

versale e quantificatore esistenziale. Se A è un insieme e P (x) è una proprietà della
variabile x, la proprietà per ogni x A, P (x) è vera si usa abbreviare con
(x A)P (x); (1.2.6)
il simbolo significa appunto per ogni . La proprietà esiste un x A tale che P (x) è
vera si usa abbreviare con
(x A)P (x) oppure pi`

u spesso x A | P (x); (1.2.7)
il simbolo significa esiste qualche , per qualche , per almeno un , mentre la sbarra
verticale | abbrevia la locuzione tale che . E estremamente importante notare che le
(1.2.6), (1.2.7) sono proprietà dellinsieme A e non di x; in altre parole dipende da A se
esse sono vere o false, mentre non ha alcun senso chiedersi se esse sono vere o false per un
particolare elemento x. In tali proprietà la lettera x funge da variabile e, chiaramente, essa
può essere sostituita da qualunque altra lettera; cos` (y A)P (y) e (y A)P (y) hanno
lo stesso significato delle (1.2.6) e (1.2.7) rispettivamente. La negazione della proprietà
(x A)P (x), ossia la proprietà non è vero che per ogni x A P (x) è vera equivale
evidentemente alla proprietà esiste un x A tale che P (x) non è vera . Analogamente,
la negazione della proprietà (x A)P (x) equivale alla proprietà per ogni x A, P (x)
non è vera . Dunque possiamo scrivere in formule:
((x A)P (x)) ((x A)P (x)),
((x A)P (x)) ((x A)(P (x))).

Se A è un insieme e P (x) è una proprietà di x, linsieme di tutti gli elementi x A
tali che P (x) è vera si indica con
{x A | P (x)} oppure {x | x A e P (x)}.
Queste si leggono linsieme di tutti gli x A tali che P (x) è vera oppure linsieme
degli x tali che x A e P (x) è vera . Spesso, quando dal contesto risulta chiaro qualè
linsieme A, linsieme di cui sopra si indica semplicemente con {x | P (x)}. Dato un
insieme B, se A è un insieme contenente B e P (x) è una proprietà tale che
B = {x A | P (x)},
questultima uguaglianza si chiama una rappresentazione caratteristica di B.

Esempio 1.2.3. Ogni insieme A ammette almeno una rappresentazione caratteristica.
Infatti, se P (x) indica la proprietà x = x, è evidente che A = {x A | P (x)}.
Esempio 1.2.4. Riferendoci agli insiemi A3 , A4 , A5 della sez. precedente, abbiamo le

seguenti rappresentazioni caratteristiche:
A3 = {x N | x = y + z dove y, z sono numeri positivi dispari},
A4 = {x N | x = 2y per qualche intero positivo y},
A5 = {x N | x2 2x 8 = 0}.
Esempio 1.2.5. Uno stesso insieme può avere diverse rappresentazioni caratteristiche.
In altre parole, se A, A0 sono due insiemi distinti e P (x), P 0 (x) sono due distinte proprietà
di x, può accadere benissimo che i due insiemi {x A | P (x)} e {x A0 | P 0 (x)} coinci-
dano. Per esempio si vede subito che linsieme A5 = {2, 4}, oltre alla rappresentazione
caratteristica data sopra, ammette la seguente: A5 = {x N | (x + 2)(x 4) = 0}.
Esempio 1.2.6. Linsieme A = {x N | x2 16 = 0} possiede come unico elemento il
numero 4, ossia A = {4}. Incontreremo molto spesso insiemi che consistono di un singolo
elemento (abbiamo già visto che, per esempio, P() = {}). Il lettore dovrà aver cura di
non confondere un oggetto x con linsieme che ha come unico elemento x (daltra parte
questa distinzione ha un riscontro nella normale vita quotidiana: un libro non è la stessa
cosa dello scaffale che contiene solo quel libro).
Esempio 1.2.7. Se n è un numero intero positivo, abbiamo indicato con n linsieme
{1, . . . , n}. E chiaro che n = {x N | 1 6 x 6 n}, con il che n è definito anche per
n = 0, avendosi 0 = {x N | 1 6 x 6 0} = .
Esempio 1.2.8. Se A è un insieme, per P(A) abbiamo la seguente rappresentazione
caratteristica: P(A) = {X | X A}.
Esercizio 1.2.9. Dato un insieme A e una proprietà P (x), si provi che la proprietà
(x A)(P (x)) equivale alla proprietà {x A | P (x)} = .
Esercizio 1.2.10. Per ogni insieme A indicheremo con Pf (A) linsieme delle parti finite
di A. E chiaro che Pf (A) = P(A) esattamente quando A è finito. E vero che
Pf (A) = {B A | |B| = n}
per qualche n N?
1.3 Operazioni con gli insiemi.

In questa sezione presentiamo le operazioni basilari che permettono di ottenere nuovi
insiemi partendo da insiemi dati.
Definizione 1.3.1. Dati due insiemi A, B, linsieme degli elementi che appartengono ad
A oppure a B si chiama lunione di A e B e si indica con A B. In formule:
A B = { x | (x A) (x B) }.
In generale, se A è un insieme di insiemi, si chiama lunione di A linsieme
S degli elementi
che
S appartengono almeno S ad un membro di A; esso si indica con {A | A A}, oppure
AA A, o brevemente A. In formule:
[
A = { x | (A A)(x A) }.
Lavvertenza che abbiamo dato nella sezione precedente a proposito delluso in mate-
matica della congiunzione oppure comporta, in particolare, che laffermazione x AB
equivale ad affermare che x A oppure x B oppure ambedue le condizioni.
Esempi 1.3.2. a) Se A = {a, e, i, o, u, 31, 5} e B = {a, 5, 3, b, c, o, u}, allora A B =
{a, i, o, u, b, c, 31, 5, 3}.
b) Se A è linsieme degli interi multipli di due e B è linsieme degli interi multipli di
tre, A B è linsieme degli interi multipli di due, oppure di tre.
c) Sia A linsieme di tutti gli intervalli aperti a sinistra di Q+ (gli elementi di A sono
coiè gli insiemi della forma ]a, b] =S {x Q | a < x < b}, al variare di a, b in Q con la
condizione che 0 6 a 6 b). Allora A = Q+ .
Definizione 1.3.3. Dati due insiemi A, B, linsieme degli elementi che appartengono ad
A e a B si chiama lintersezione di A e B e si indica con A B. In formule:
A B = { x | (x A) (x B) }.
In generale, se A è un insieme di insiemi, si chiama lintersezione
T di A linsieme degli
elementi
T T a tutti i membri di A; esso si indica con {A | A A}, oppure
che appartengono
AA A, o brevemente A. In formule:
\
A = { x | (A A)(x A) }.
Gli insiemi A, B si dicono disgiunti se A B = .

Se A è un T S elementi n insiemi, diciamo A = {A1 , A2 , . . . , An }, allora
insieme che ha per
lintersezione A e lunione A si indicano rispettivamente anche con
A1 A2 A n , A1 A2 An ,
oppure rispettivamente
n
[ n
\
Ai , Ai .
i=1 i=1
Esempi 1.3.4. a) Se A = {a, e, i, o, u, 31, 5} e B = {a, 5, 3, b, c, o, u}, allora A B =

{a, o, u, 5, }.
b) Se A è linsieme degli interi multipli di due e B è linsieme degli interi multipli
di tre, allora A B è linsieme degli interi multipli di sei. Se A è linsieme degli interi
negativi e B è linsieme degli interi positivi, allora A e B sono disgiunti. Invece, se R è
linsieme degli interi non negativi e T è linsieme degli interi non positivi, allora R, S non
sono disgiunti, avendosi R T = {0}. T
c) Se A è linsieme dellesempio 1.3.2 c), allora A = .
Definizione 1.3.5. Dati due insiemi A, B, si chiama differenza di A e B (nellordine!)
e si indica con A B, oppure A \ B, linsieme formato da tutti gli elementi di A che non
appartengono a B:
A B = { x A | x 6 B }.
Nel caso in cui B A, linsieme A B si chiama anche il complementare di B in A
e si indica con {A B.
Esempi 1.3.6. a) Se A = {2, 3, 1, 5} e B = {3, 4, 5, 6}, allora A B = {2, 1}; se

C = {2, 5, 7, 1, 9, 3}, allora A C = . In generale, è chiaro che A B = se e solo se
A B.
b) Indichiamo con R2 il piano euclideo reale riferito ad una coppia di assi cartesiani
ortogonali Ox, Oy. Dato un numero reale r > 0, indichiamo con Dr il disco (pieno) di
centro lorigine e raggio r; formalmente
Dr := {(x, y) R2 | x2 + y 2 6 r2 }.
Allora risulta {R2 Dr = {(x, y) R2 | x2 + y 2 > r2 }, cioè {R2 Dr è linsieme dei punti di R2
che hanno distanza dallorigine maggiore di r.
Proposizione 1.3.7. Supponiamo che A, B, C siano sottoinsiemi di un dato insieme

ambiente U e, per ogni sottoinsieme X di U , scriviamo X 0 in luogo di {U X. Allora
risulta:
A B = B A, A B = B A,
(A B) C = A (B C), (A B) C = A (B C), (1.3.1)
A A = A, A A = A,
A (B C) = (A B) (A C), A (B C) = (A B) (A C), (1.3.2)
A = A, A U = A,
A A B, B A B, A A B, B A B,
(A C) (B C) (A B C), (A C) (B C) (A B C),
(A B)0 = A0 B 0 , (A B)0 = A0 B 0 . (1.3.3)
Dimostrazione. Alcune di queste uguaglianze sono ovvia conseguenza delle definizioni,

mentre le altre richiedono un minimo di attenta analisi. A titolo di esempio dimostriamo
due di questultime, lasciando la dimostrazione delle rimanenti al lettore per esercizio.
Proviamo la prima delle (1.3.2). Sia x A (B C). Allora x A oppure x B C.
Se x A, allora è al tempo stesso x A B e x A C, quindi x (A B) (A C). Se
invece x B C, ciò significa che x B e x C. Ma allora è anche vero che x A B e
x A C, per cui è ancora x (A B) (A C). Dunque
A (B C) (A B) (A C). (1.3.4)
Viceversa, supponiamo che x (A B) (A C), cioè x A B e x A C. Allora x A,

oppure x B e x C, ossia x A oppure x B C. Dunque x A (B C), per cui
A (B C) (A B) (A C). (1.3.5)
Dalle due inclusioni (1.3.4) e (1.3.5) segue appunto la prima delle (1.3.2).
Proviamo la prima delle (1.3.3). Dire che x (A B)0 equivale a dire che x U e
x 6 A B, cioè x A0 e x B 0 , ossia x A0 B 0 . Dunque (A B)0 e A0 B 0 hanno gli
stessi elementi e quindi sono uguali.
Esercizi 1.3.8. Dimostrare le seguenti formule, dove A, B, C sono sottoinsiemi di un

dato insieme U :
a) (A B)0 = A0 B;
b) A B = B 0 A0 ;
c) A (A B) = A B;
d) A (B C) = (A B) (A C);
e) (A B) (A B 0 ) = A;
f) A (A0 B) = A B;
g) A (A0 B) = A B;
h) A (A B) = A;
i) A (A B) = A.
j) Provare che A B = B se e solo se A = B = .
k) Provare che A B = A se e solo se A B = .
Esercizi 1.3.9. a) E vero che per ogni A, B, C risulta (A B) C = A (B C)?

b) E vero che per ogni A, B, C risulta A (B C) = (A B) (A C)?
Definizione
S 1.3.10. Un insieme A di parti di un insieme U si chiama un ricoprimento
di U se A = U , cioè se per ogni x U risulta x A per almeno un A A. Si dice che
A è una partizione di U se valgono le seguenti condizioni:
(1) A è un ricoprimento di U ,
(2) per ogni A A risulta A 6= ,
(3) se A, B A e A 6= B, allora A B = .
Esempi 1.3.11. a) Linsieme A di cui allesempio 1.3.2 c) è un ricoprimento di Q+ che

non è una partizione.
b) Per ogni numero reale r > 0 siano Cr e Dr rispettivamente la circonferenza e il
disco pieno del piano R2 che hanno centro nellorigine e raggio r (vedi lesempio 1.3.6 b)).
Poniamo inoltre
C = {Cr | r R+ } D = {Dr | r R+ }.
Si vede facilmente che C è una partizione di R2 , mentre D è un ricoprimento di R2 che
non è una partizione.
Esercizio 1.3.12. Per ogni numero reale r > 0 si considerino i complementari Cr0 e Dr0 di
Cr e Dr rispetto al piano R2 . Posto C 0 = {Cr0 | r R+ } e D0 = {Dr0 | r R+ }, di ciascuno
di questi insiemi si decida se si tratta di una partizione, ovvero solo un ricoprimento di
R2 , oppure nessuna delle due cose.
1.4 I numeri naturali.

Si chiamano numeri naturali i familiari numeri 0, 1, 2, 3, 4, . . .. Linsieme da essi costi-
tuito si indica con N:
N = {0, 1, 2, 3, 4, . . .}.
In N sono definite le tradizionali operazioni di addizione e moltiplicazione; si tratta

delle due leggi che a due elementi a, b N assegnano la prima la somma a + b, la
seconda il prodotto a b (da scriversi anche ab). Elenchiamo di seguito le loro proprietà
di base, anticipando la terminologia che formalizzeremo in un contesto pi`
u generale (vedi
la Sezione 2.1).
LAddizione `
e associativa:
per ogni a, b, c N risulta a + (b + c) = (a + b) + c;
LAddizione `
e commutativa:
per ogni a, b N risulta a + b = b + a;
Il numero 0 `
e elemento neutro per laddizione:
per ogni a N risulta 0 + a = a;
Ogni elemento a N `
e cancellabile per laddizione:
dati a, b, c N, se a + b = a + c, allora b = c;
La moltiplicazione `
e associativa:
per ogni a, b, c N risulta a (b c) = (a b) c;
e commutativa:
per ogni a, b N risulta a b = b a;
Il numero 1 `
e elemento neutro per la moltiplicazione:
per ogni a N risulta 1 a = a;
Ogni elemento a N diverso da 0 `

e cancellabile per la moltiplicazione:
dati a, b, c N con a 6= 0, se a b = a c, allora b = c;
e distributiva rispetto alladdizione:
per ogni a, b, c N risulta a (b + c) = (a b) + (a c);
N`
e conico rispetto alladdizione:
per ogni a, b N, se a + b = 0, allora a = b = 0;

N`
e conico rispetto alla moltiplicazione:
per ogni a, b N, se a b = 1, allora a = b = 1.
Dalle sopra elencate proprietà discendono le seguenti:
per ogni a N risulta a 0 = 0; (1.4.1)

se a, b N ed è a b = 0, allora a = 0 oppure b = 0. (1.4.2)
Infatti, dato a N, usando due volte il fatto che 0 è elemento neutro per laddizione e una
volta la distributività della moltiplicazione rispetto alladdizione otteniamo la seguente
catena di uguaglianze:
a0 + 0 = a0 = a(0 + 0) = a0 + a0.
Di conseguenza a0 + 0 = a0 + a0. Da questa segue a0 = 0, perche ogni elemento di N, in
particolare a0, è cancellabile per laddizione. Infine, dati a, b N, se a b = 0 ed è per
esempio a 6= 0, utilizzando la proprietà (1.4.1) appena dimostrata possiamo scrivere che
a b = 0 = a 0. Avendo supposto a 6= 0, lelemento a è cancellabile per la moltiplicazione,
per cui deve essere b = 0.
Nellinsieme N è definito lordinamento naturale 6. Esplicitamente, dati a, b N,
si dichiara che
a 6 b : b = a + c per un c N. 2 (1.4.3)
Si noti che lelemento c di cui alla (1.4.3) è unico (perche?); esso si chiama la differenza
tra b ed a (in questo ordine!) e si indica con il simbolo b a. Si dichiara altres` che
a < b se e solo se b = a + c per un c N con c 6= 0.
Naturalmente a 6 b e b > a significano la stessa cosa, come pure a < b e b > a; inoltre,
dichiarare che a < b equivale a dichiarare che è al tempo stesso a 6 b e a 6= b. Valgono le
seguenti proprietà:
Propriet`
a riflessiva:
per ogni a N risulta a 6 a;
Propriet`
a antisimmetrica:
per ogni a, b N, se a 6 b e b 6 a, allora a = b;
Propriet`
a transitiva:
per ogni a, b, c N, se a 6 b e b 6 c, allora a 6 c.

2
In analogia con il simbolo :=, il simbolo : viene usato con il seguente criterio: laggregato
di simboli che figura alla sua sinistra viene introdotto per designare in forma abbreviata la proprietà
illustrata esplicitamente alla sua destra.
Queste proprietà sono deducibili dalla definizione (1.4.3). Infatti, per ogni a N risulta
a = a + 0, il che significa appunto che a 6 a. Inoltre, se a, b N sono tali che a 6 b e
b 6 a, allora esistono c, d N tali che b = a + c ed a = b + d. Di conseguenza
a = b + d = (a + c) + d = a + (c + d)
e quindi c + d = 0 (perche?). Dunque c = d = 0 in base alla conicità di N rispetto

alladdizione, da cui a = b. Infine, siano a, b, c N e supponiamo che a 6 b e b 6 c, ossia
che vi siano d, e N tali che b = a + d ed c = b + e. Allora c = (a + d) + e = a + (d + e),
da cui a 6 c.
Di importanza cruciale è il seguente
Principio del Minimo dellordinamento naturale in N: Se A è un sottoinsieme

non vuoto di N, allora A possiede minimo, ossia esiste un m A tale che
m 6 a per ogni a A. (1.4.4)
Detto in altre parole, in ogni insieme non vuoto di numeri naturali è presente il primo
numero. Vale la pena osservare che lelemento m verificante la (1.4.4) è necessariamente
unico, perche se m0 A e risulta m0 6 a per ogni a A, in particolare m0 6 m. Siccome
è anche m 6 m0 , segue m0 = m. Per questo si parla de il minimo di A.
La prima conseguenza immediata del Principio del Minimo in N è la
Legge di tricotomia: per ogni a, b N vale esattamente una delle seguenti condizioni:
a 6 b, b 6 a, a = b.
Infatti, dati a, b N con a 6= b, linsieme A = {a, b} non è vuoto e quindi ha il minimo,

il quale è a oppure b. In corrispondenza risulterà a 6 b oppure b 6 a. Al lettore
superficiale la legge di tricotomia potrebbe sembrare unovvia proprietà intrinseca dei
numeri naturali. In realtà, in N si possono definire molti ordinamenti che non verificano
la legge di tricotomia (vedi lEsempio 1.16.5).
A titolo di esercizio il lettore può dedurre dalla (1.4.3) e dalle proprietà delladdizione
e della moltiplicazione le seguenti ulteriori proprietà dellordinamento naturale.
Propriet`
a di isotonia rispetto alladdizione:
per ogni a, b, c N, se a 6 b, allora a + c 6 b + c;
Propriet`
a di isotonia rispetto alla moltiplicazione:
per ogni a, b, c N, se a 6 b e c 6 d, allora ac 6 bd.

1.5 Il Principio di Induzione.

Fissato a N, indichiamo con a linsieme degli n N tali che a 6 n:
a := {n N | a 6 n} = {a, a + 1, a + 2, a + 3, . . .}.
Si noti che se [a, +[ indica lintervallo illimitato a destra {x R | a 6 x} di R, allora

a = [a, +[ N. Chiamiamo a lintervallo illimitato di N di estremo a. Molto
frequentemente ci si trova di fronte al problema di provare che una proprietà P (n), che
dipende dallintero n, è vera per qualunque n che varia in un intervallo a . In altri termini
si vorrebbero provare tutte le infinite proprietà P (a), P (a + 1), P (a + 2), . . .. Non sempre è
possibile impostare un argomento che provi direttamente la verità di tutte queste propri-
età. In queste circostanze laiuto decisivo è fornito da una fondamentale conseguenza della
Condizione del Minimo: si tratta del Principio di Induzione, che andiamo ad illustrare.
Premettiamo il seguente risultato.
Teorema 1.5.1. Dato a N, sia X un sottoinsieme di a tale che:
(1) a X;
(2) se n X, allora n + 1 X.
In tali condizioni risulta X = a .
Dimostrazione. Siccome per ipotesi è X a , posto Y = a X, per provare la tesi
basta mostrare che Y = . Supponiamo, per assurdo, che sia Y 6= . Per la Condizione
del Minimo Y ha allora il minimo, sia questo m. Dallipotesi (1) segue che a 6 Y , quindi
a < m, ossia a 6 m 1. Siccome m 1 a Y = X, segue dallipotesi (2) che
m = (m 1) + 1 X, in contrasto con il fatto che m Y , mentre X Y = . Deve
dunque essere Y = .
Teorema 1.5.2. Principio di Induzione. Sia a N, sia P (n) una proprietà che
dipende dallintero n, per n che varia in a , e supponiamo che siano verificate le seguenti
condizioni:
(1) P (a) è vera;
(2) dato n a , se P (n) è vera, allora anche P (n + 1) è vera.

Allora P (n) è vera per ogni n a .
Dimostrazione. Si vede immediatamente che linsieme
X = {n N | P (n) è vera}
verifica le condizioni (1) e (2) del Teorema 1.5.1, dal quale segue allora X = a , il che è
quanto dire che P (n) è vera per ogni n a .
Nella maggior parte dei casi la proprietà P (n) è definita a partire da n = 0, quindi
per tutti gli n 0 = N. Sottolineiamo che, usando il Principio di Induzione, dopo
aver provato che P (a) è vera (si parla di base dellinduzione) non dobbiamo cercare di di-
mostrare che P (n) è vera! , bens` dobbiamo supporre che P (n) sia vera (si parla dellipotesi
induttiva ) e provare che, di conseguenza , è vera anche P (n + 1).
Come Pprimo esempio di applicazione del Principio di Induzione, proviamo che che la
somma nk=1 k = 1 + 2 + 3 + + n dei primi n numeri naturali non nulli è n(n + 1)/2.
Indichiamo con P (n) la proprietà
1 + 2 + 3 + + n = n(n + 1)/2. (1.5.1)
Dunque P (n) è una proprietà di n, per n che varia in 1 = N . Partiamo da P (1) e

osserviamo che essa è ovviamente vera, riducendosi alluguaglianza 1 = 1 (base dellin-
duzione). Dato un numero naturale n > 0, supponiamo che P (n) sia vera, cioè che sia vera
la (1.5.1) (ipotesi induttiva). Dobbiamo mostrare che, di conseguenza, è vera P (n + 1),
ossia che vale la (1.5.1) con n + 1 al posto di n. Utilizzando la (1.5.1) stessa, abbiamo:
1 + 2 + 3 + + n + (n + 1) = (1 + 2 + 3 + + n) + (n + 1)
n(n + 1) n(n + 1) 2(n + 1)
= + (n + 1) = +
2 2 2
(n + 1)[(n + 1) + 1]
= .
2
Ciò prova che P (n + 1) è vera. Finalmente dal Principio di Induzione segue che P (n) è
vera per ogni n N .
Dai Principio di Induzione segue il seguente Principio del Massimo per i sottoinsiemi
finiti di N.
Proposizione 1.5.3. Se A è una parte non vuota e finita di N, allora A possiede il
massimo, cioè esiste un a A tale che x 6 a per ogni x A.
Dimostrazione. Se n N , indichiamo con P (n) laffermazione seguente:
Se A è una parte di N con n elementi, allora A possiede il massimo.
Occorre allora provare che P (n) è vera per ogni n N . Evidentemente P (1) è vera:
se A = {x}, allora x è il massimo di A. Dato n N , supponiamo che P (n) sia vera
e mostriamo che, di conseguenza, è vera P (n + 1). Preso un sottoinsieme A N con
|A| = n + 1, scegliamo un elemento x A e consideriamo linsieme B = A {x}. Allora
|B| = n e quindi, in base allipotesi induttiva (cioè P (n) è vera), B ha il massimo: sia
questo b. Se x < b, allora b è anche il massimo di A, mentre se b < x, è allora x il massimo
di A. Dunque P (n + 1) è vera e, in base al Principio di Induzione, concludiamo che P (n)
è vera per ogni n N .
Esercizi 1.5.4. Per i seguenti

P esercizi si usi il Principio di Induzione.
a) Provare che la somma nk=1 (2k 1) = 1 + 3 + 5 + + (2n 1) dei primi n numeri
naturali dispari è n2 .
b) Calcolare la somma nk=1 (2k) = 2 + 4 + 6 + + 2n dei primi n numeri naturali
P
non nulli pari.
c) Provare che, dato un numero naturale a > 1, la somma nk=1 ak = 1 + a + a2 + a3 +

P
+ an delle prime n + 1 potenze di a è (1 an+1 )/ (1 a).
d) Provare che se m, n N e n > 0, allora esiste un k N tale che m 6 kn. (Sugg.:
Tenendo fisso m, procedere per induzione su n).
1.6 I numeri interi.

Un numero naturale a si dice positivo se a > 0; in tal caso ad a si associa lintero
negativo a che si chiama lopposto di a. Linsieme i cui elementi sono i numeri naturali
e gli opposti dei numeri naturali positivi si indica con il simbolo Z; i suoi elementi si dicono
anche gli interi relativi, o semplicemente gli interi. Naturalmente risulta N Z, dato
che i numeri naturali sono particolari interi. Comè noto, le due operazioni di addizione e
di moltiplicazione fra numeri naturali si estendono a tutti gli interi, rimanendo associative
e commutative; inoltre 0 e 1 restano elementi neutri rispettivamente per laddizione e per
la moltiplicazione in Z. Questa volta, però, in Z vale per laddizione una proprietà che
non vale in N. Infatti ogni elemento x Z è simmetrizzabile, nel senso che esiste un
elemento y Z tale che x + y = 0, precisamente y = x. In N solo 0 ha opposto: se
stesso; questo fatto lo abbiamo espresso dicendo che N è conico rispetto alladdizione.
Invece, Z non è conico; per esempio 3 + (3) = 0, ma 3 6= 0 6= 3. Risulta poi 0 = 0 e
(x) = x per ogni x Z. Ricordiamo inoltre le seguenti regole:
per ogni x, y Z, (x + y) = (x) + (y); (1.6.1)
per ogni x, y Z, (xy) = (x)y = x(y). (1.6.2)
La differenza x y fra interi è sempre definibile, dichiarando
x y := x + (y). (1.6.3)
Si osservi che Z non è neppure conico rispetto alla moltiplicazione, dato che (1)(1) = 1,
ma 1 6= 1 6= 1.
Lordinamento naturale fra i numeri naturali si estende agli interi relativi, dichiarando
che, dati x, y Z,
x6y se e solo se y = x + c per un c N, (1.6.4)
scrivendo poi x < y nel caso in cui x 6 y e x 6= y. Si osservi che per ogni x Z risulta
x 1 < x < x + 1;
ciò comporta che in Z non vale il Principio del Minimo rispetto allordinamento naturale.
Nonostante ciò la legge di tricotomia ancora vale in Z (perche?).
Esercizi 1.6.1. a) Provare che in Z lordinamento naturale verifica la proprietà di
isotonia per laddizione.
b) Provare, con qualche esempio, che in Z lordinamento naturale non verifica la
proprietà di isotonia per la moltiplicazione. Provare che, tuttavia, vale la seguente
proprietà:
dati x, y, z Z con x 6 y, allora xz 6 yz se z > 0, mentre xz > yz se z < 0.
` corretto affermare che se x, y Z, allora x 6 y se e solo se y = x + z per qualche

c) E
z Z?
d) Siano x, y, z Z. Provare che se x + z 6 y + z, allora x 6 y (Sugg.: usare la
definizione (1.6.4) dellordinamento naturale e la cancellabilità rispetto alladdizione).
e) Siano x, y, z Z. Provare che se z 6= 0 ed è xz 6 yz, allora x 6 y se z > 0, mentre
x > y se z < 0 (Sugg.: si supponga che sia x > y e si usi la (1.6.4) per giungere alla
conclusione che deve essere z = 0, quindi una contraddizione).
Dati due interi a, b Z, si dice che a è un divisore di b, oppure che a è un divide
b, o anche che b è un multiplo di a se
b = ac per qualche c Z.
Si abbrevia tale proprietà scrivendo a | b (si legge appunto a divide b; da non confondere
con la frazione a/b). Usiamo il simbolo a - b per indicare che a non è un divisore di b,
Fissato un intero a, indicheremo con aZ linsieme degli interi multipli di a:
aZ := {ax | x Z}.
Proposizione 1.6.2. Dati due numeri interi a, b, risulta aZ bZ se e solo se b | a.

Dimostrazione. Se aZ bZ, in particolare a bZ, per cui a = bh per un h Z,
ossia b | a. Viceversa, se b | a, cioè se a = bh per un h Z, per ogni k Z risulta
ak = bhk bZ, per cui aZ bZ.
Se a, b sono due numeri naturali con b > 0, sappiamo fare la divisione con resto di a
per b, sappiamo cioè determinare il pi` u grande numero naturale q tale che bq 6 a, di modo
che possiamo scrivere a = bq + r dove 0 6 r < b; dichiariamo allora che b è il quoziente e
r è il resto della divisione. Naturalmente risulta r = 0 precisamente quando b divide a.
In realtà la divisione con resto si estende a Z, come precisato dal teorema che segue.
Teorema 1.6.3. Dati due numeri a, b Z con b 6= 0, esistono degli unici q, r Z tali che
a = bq + r e 0 6 r < |b|; (1.6.5)
q ed r si chiamano rispettivamente il quoziente e il resto della divisione di a per b.

Dimostrazione. Sia A linsieme di tutti quei numeri naturali che si possono scrivere
sotto la forma a bq per qualche q Z:
A := {a bq | q Z} N.
Risulta A 6= , perche se a > 0, prendendo q = 0 si vede che a A; se è invece a < 0,

scelto un intero positivo c tale che |a| 6 c |b| (vedi lEsercizio 1.5.4, d)), se b > 0 risulta
a qb N per q = c, mentre se b < 0 risulta a qb N per q = c. Per la Condizione
del Minimo A possiede il minimo, sia questo r, con il che r = a bq per un q Z, ossia
a = bq + r. Necessariamente r < |b|. Infatti, supponiamo che sia r > |b|. Se b > 0, allora
0 6 r b = a bq b = a b(q + 1) A
e r b < r, in contrasto con il fatto che r è il minimo di A. Se b < 0, allora

0 6 r + b = a bq + b = a b(1 q) A
e r + b < r, ancora in contrasto con il fatto che r è il minimo di A. Sono cos` stabilite le
(1.6.5) e resta da provare lunicità di q ed r. Siano anche q 0 , r0 Z tali che
a = bq 0 + r0 e 0 6 r0 < |b|.
Allora r0 = a bq 0 A, per cui r0 > r e quindi 0 6 r0 r = b(q q 0 ). Siccome
0 6 r0 r < |b|, ricordando che tutti i numeri coinvolti sono interi deduciamo che deve
essere r0 r = 0 e quindi anche b(q q 0 ) = 0. Concludiamo che r0 = r e q 0 = q, tenendo
presente che b 6= 0.
1.7 Relazioni binarie e funzioni.

Come abbiamo già osservato, nellassegnare un insieme dichiarando esplicitamente
ciascuno dei suoi elementi, lordine nel quale questi vengono assegnati è irrilevante, come
pure sono ininfluenti eventuali loro ripetizioni. In molte circostanze è però importante
lordine nel quale vengono assegnati degli elementi. Per esempio, se nel piano euclideo
reale si fissa un sistema di coordinate cartesiane, ogni punto viene individuato assegnando
le sue coordinate, cioè due numeri reali. Ma in questo caso è importante lordine nel quale
questi vengono dati, ossia occorrere prescrivere quale dei due è lascissa e quale lordinata;
cos`, il punto che ha ascissa 2 e ordinata 5 non è la stessa cosa del punto che ha ascissa
5 e ordinata 2. Addirittura vi sono dei punti per i quali ascissa ed ordinata coincidono
(si tratta naturalmente dei punti della bisettrice del primo e del terzo quadrante). Non
è dunque corretto affermare che un punto nel piano è individuato da un insieme di due
numeri reali. Una situazione simile si presenta con le parole di un dizionario. Pensando
a parole come
roba, bora, baro, bollo, lobo,
ci si convince facilmente che una parola non può essere presentata come un mero insieme
di lettere, visto che, come insiemi, risulterebbe
{r,o,b,a} = {b,o,r,a} = {b,a,r,o}, {b,o,l,l,o} = {l,o,b,o} = {b,l,o}.
In generale, dare una coppia ordinata significa dare due oggetti a, b specificando quale
deve essere il primo e quale il secondo; se il primo è a (e quindi b è il secondo), tale coppia
ordinata si indica con il simbolo (a, b), dove a si chiama appunto la prima coordinata e b
la seconda coordinata. Si noti che non si impedisce affatto che sia a = b. Luguaglianza
fra coppie ordinate è stabilita dalla seguente regola, dove a, b, c, d sono oggetti generici:
(a, b) = (c, d) a=c e b = d. (1.7.1)
Partendo dal concetto di coppia ordinata, nulla impedisce di definire il concetto di
terna ordinata e di quaterna ordinata. Se abbiamo certi oggetti a, b, c, d, . . ., la
terna ordinata (a, b, c) può essere definita dichiarando
(a, b, c) := ((a, b), c).
Dalla (1.7.1) segue immediatamente che (a, b, c) = (a0 , b0 , c0 ) se e solo se a = a0 , b = b0 ,

c = c0 . Possiamo inoltre definire la quaterna ordinata (a, b, c, d) ponendo
(a, b, c, d) := ((a, b, c), d).
Definizione 1.7.1. Dati due insiemi A, B, linsieme i cui elementi sono le coppie ordinate
(a, b) con a A, b B si chiama il prodotto cartesiano di A per B e si indica con AB:
A B := { (a, b) | a A, b B }.
Nel caso in cui A = B il prodotto cartesiano A B = A A si indica anche con A2 : il

sottoinsieme di A2 formato dalle coppie ordinate del tipo (a, a), al variare di a in A, si
chiama la diagonale di A2 e si indica con 2A :
2A := { (a, b) A A | a = a } = { (a, a) | a A }.
Dati tre insiemi A, B, C, possiamo definire il prodotto cartesiano A B C ponendo
A B C := (A B) C = { (a, b, c) | a A, b B, c C }.
Chiaramente questa costruzione si può generalizzare al caso di quattro o pi`

u insiemi.
Esempio 1.7.2. Siano A = {a, b, c} e B = {r, s}. Allora A B = {(a, r), (b, r), (c, r),
(a, s), (b, s), (c, s)}; A2 = AA = {(a, a), (a, b), (a, c), (b, a), (b, b), (b, c), (c, a), (c, b), (c, c)}.
Esempio 1.7.3. Dati due insiemi A, B risulta A B = se e solo se A = oppure
B = . Infatti, se A 6= 6= B, preso un x A e un y B, risulta (x, y) A B e quindi
A B 6= . Viceversa, se vale questultima condizione, preso un elemento z A B vi
sono un x A e un y B tali che (x, y) = z, quindi A 6= =
6 B.
Esempio 1.7.4. Se nel piano euclideo reale si fissa un sistema di coordinate cartesiane,
ad ogni punto viene a corrispondere esattamente una coppia ordinata di numeri reali (le
coordinate del punto) e viceversa. Per questa ragione il piano euclideo reale viene spesso
identificato con linsieme R2 = R R.
Esercizio 1.7.5. Dimostrare che, dati due insiemi A, B, risulta A B = B A se e solo
se si verifica almeno uno dei seguenti casi: A = B, A = , B = .
` vero che, dati quattro insiemi A, B, C, D, risulta sempre
Esercizio 1.7.6. E
(A B) (C D) = (A B) (C D) ?
` vero che, dati quattro insiemi A, B, C, D, risulta sempre
Esercizio 1.7.7. E
(A B) (C D) = (A B) (C D) ?
Enunciati aperti che coinvolgono due variabili vengono chiamati relazioni binarie. Se
R(x, y) è una relaziona binaria e A, B sono due insiemi per i quali ha senso dire se R(x, y)
è vera o falsa quando x A e y B, linsieme
{ (x, y) A B | R(x, y) è vera }

si chiama il grafico su A B della relazione R(x, y).

E chiaro che una proprietà R(x, y) risulta individuata qualora, dati due insiemi A, B
e dati x A e y B si sappia dire se R(x, y) è vera o no, ossia, per usare la terminologia
appena introdotta, qualora si conosca il grafico di R(x, y) su AB. Inversamente, dati gli
insiemi A, B e un sottoinsieme C AB, il grafico su AB della la proprietà (x, y) C
è evidentemente C stesso. Per questa ragione in Teoria degli Insiemi risulta conveniente
identificare le proprietà di due variabili con i sottoinsiemi dei prodotti cartesiani di due
insiemi, usando quasi sempre la stessa lettera per indicare sia la relazione che il suo grafico.
Adotteremo dunque la seguente definizione formale.
Definizione 1.7.8. Dati due insiemi A e B, ogni sottoinsieme R di A B si chiama
una relazione binaria tra A e B ; se (x, y) R si dice che x ` e in relazione con y
tramite R e si scrive anche R(x, y). Se A = B si dice che R è una relazione binaria
in A. Si chiama infine semplicemente relazione binaria ogni terna ordinata (A, B, C)
dove A, B sono insiemi e R A B.
Siccome due terne ordinate sono uguali esattamente quando sono ordinatamente uguali
le rispettive coordinate, possiamo enunciare il seguente
Principio di Uguaglianza per le Relazioni Binarie : Due relazioni binarie (A, B, R),
(C, D, S) sono uguali se, e solo se, A = C, B = D e R = S.
Esempi 1.7.9. a) Lesempio pi` u elementare di relazione binaria in un qualunque insieme

A è luguaglianza x = y; il suo grafico non è altro che la diagonale 2A . Se A = R e si
identifica R2 con il piano euclideo reale, questa diagonale non è altro che la retta bisettrice
del primo e del terzo quadrante.
b) Lordinamento naturale x 6 y definisce una relazione binaria in N, come pure la
relazione di divisibilità x|y.
c) Considerate le relazioni x2 + y 2 6 3 e x2 + y 2 = 3 in R, i rispettivi grafici sono
(usiamo i simboli introdotti nellEsempio 1.3.11)
D3 = {(x, y) R2 | x2 + y 2 6 3} e C3 = {(x, y) R2 | x2 + y 2 = 3}.
d) Il grafico in R2 della relazione x 6 y è dato dallinsieme dei punti del piano che
appartengono alla bisettrice del primo e del terzo quadrante oppure si trovano al di sopra
di essa.
Una relazione binaria R tra due insiemi finiti A e B può essere dichiarata in maniera
tabulare, compilando una tabella di due righe e tante colonne quanti sono gli elementi di
R, secondo il criterio seguente: se x A e y B, allora nella tabella compare una colonna
con x nella posizione superiore e y nella posizione inferiore se e solo se se (x, y) R, cioè
se e solo se x è in relazione con y tramite R.
Esempio 1.7.10. Se A = {a, b, c, d, e}, B = {1, 2, 3, 4}, la rappresentazione tabu-
lare della relazione R = {(a, 2), (a, 3), (c, 1), (c, 2), (c, 4), (d, 3), (e, 1), (e, 2)} si scrive come
segue:
a a c c c d e e
R= . (1.7.2)
2 3 1 2 4 3 1 2
Ovviamente la relazione di uguaglianza in un insieme si rappresenta con la tabella

nelle cui due righe sono elencati tutti gli elementi di quellinsieme e nello stesso ordine.
Risulta utile sapere che ogni relazione binaria (A, B, R) ha una sua controparte, nel
senso della seguente definizione.
Definizione 1.7.11. Si chiama relazione opposta, o reciproca , di una relazione

binaria (A, B, R) la relazione (B, A, Rop ) definita come segue:
Rop := {(y, x) B A | (x, y) R}.
Cos`, con riferimento allesempio 1.7.10 abbiamo
Rop = {(2, a), (3, a), (1, c), (2, c), (4, c), (3, d), (1, e), (2, e)}.
` evidente
Se R è la relazione di uguaglianza in un insieme A, allora è chiaro che R = Rop . E
op
che la tabella che dà la rappresentazione tabulare di R si ottiene da quella relativa ad
R scambiando le due righe
Fra le relazioni binarie pi` u importanti vi sono le funzioni, o applicazioni, che ora
andiamo a definire.
Definizione 1.7.12. Una relazione binaria (A, B, f ) si chiama una funzione o appli-
cazione da A verso B se per ogni x A esiste esattamente un y B tale che (x, y) f .
In tal caso gli insiemi A, B si dicono rispettivamente il dominio e il codominio di f .
Nella pratica non si usa quasi mai la notazione (A, B, f ) per indicare una funzione da
A verso B; si preferisce infatti usare i simboli
f
f : A B oppure A B,
e si usa dire che f è una funzione da A verso B. Se x A, si scrive f (x) = y per indicare
che y è lunico elemento di B tale che (x, y) f e y si chiama limmagine di x tramite
f oppure il valore di f in x o, infine, lelemento che f assegna ad x . Specie
quando A e B sono insiemi di numeri e f (x) è unespressione matematica che coinvolge
x, la funzione viene indicata con il simbolo
x 7 f (x) : A B,
oppure solo con x 7 f (x) o, molto sovente, semplicemente con lespressione f (x) stessa.
Si noti che, usando uno di questi tre simbolismi, la lettera x ha il ruolo di variabile
indipendente e può essere sostituita da qualunque altra lettera. Cos`, ad esempio, se
A = B = R parleremo della funzione 1 + x2 , intendendo x 7 1 + x2 : A B.
Dal Principio di Uguaglianza per le Relazioni Binarie discende il seguente
Principio di Uguaglianza per le Funzioni : Due funzioni f : A B, g : C D sono

uguali se, e solo se,
A = C, B=D e f (x) = g(x) per ogni x A.

Quando A e B sono insiemi finiti, anche una funzione f : A B, in quanto relazione

binaria tra A e B, ha la sua rappresentazione tabulare. In generale, se f è una qualunque
relazione binaria tra A e B, dalla rappresentazione tabulare di f è possibile decidere se f
è una funzione. Infatti, tenuto conto della Definizione 1.7.12, f è una funzione se e solo se
nella prima riga della sua rappresentazione tabulare figurano tutti gli elementi di A senza
ripetizioni; se ciò avviene, lelemento che si trova nella seconda riga sotto un dato elemento
x A è limmagine f (x) di x. Per esempio, se A = {a, b, c, d, e} e B = {1, 2, 3, 4}, la
funzione f : A B definita da
f (a) = 3, f (b) = 1, f (c) = 3, f (d) = 4, f (d) = 1
ha la seguente rappresentazione tabulare:

a b c d e
f= . (1.7.3)
3 1 3 4 1
Si noti che la relazione di cui allesempio 1.7.10 non è una funzione per due ragioni: nella
prima riga vi sono delle ripetizioni e in essa non figurano tutti gli elementi di A.
Linsieme di tutte le funzioni da A verso B si indica con il simbolo B A ; dunque
B A := {(A, B, f ) | f P(A B) e f è una funzione}.
Se A è un qualunque insieme e B è un suo sottoinsieme, la funzione x 7 x : B A

si chiama l iniezione canonica o inclusione di B in A . Nel caso particolare in cui
B = A, tale funzione si chiama la funzione identica o identit` a di A e si indica con il
simbolo 1A ; dunque 1A (x) = x per ogni x A.
Data una funzione f : A B e considerati due sottoinsiemi X A, S B, gli insiemi
f (X) = : {f (x) | x X} e f 1 (S) = : {x | x A e f (x) S}
si chiamano rispettivamente limmagine di X e la controimmagine o immagine

inversa di X (tramite f ). Naturalmente risulta f (X) B e f 1 (S) A. Il sottoinsieme
f (A) di B si chiama limmagine della funzione f . Se b B si scrive f 1 (b) in luogo
di f 1 ({b}); dunque
f 1 (b) = {x | x A e f (x) = b}. (1.7.4)
Nota 1.7.13. Data una funzione f : A B e un sottoinsieme X A, dalle definizioni
risulta che è sempre f (X) 6= quando X 6= . Per contro, se S è un sottoinsieme di
B, può accadere che f 1 (S) = anche se S 6= (vedi comunque lesercizio 1.10.13); per
esempio, considerata la funzione (1.7.3), risulta f 1 ({2}) = .
Si dice che una funzione f : A B è costante se la sua immagine f (A) è ridotta ad
un singolo elemento, ossia se f (x) = f (y) qualunque siano x, y A.
Se f : A B è una funzione e C è un sottoinsieme di A, si chiama restrizione a C
di f , e si indica con f |C : C B, la funzione da C verso B definita come segue:
per ogni x C, f |C (x) = f (x).
Dunque f |C agisce sugli elementi di C esattamente come f .

Data una funzione f : A B, per ciascun elemento b di f (A) consideriamo la sua

controimmagine f 1 (b), come definita dalla (1.7.4). Possiamo allora considerare linsieme
Af := f 1 (b) | b f (A) ,

il quale è a sua volta un sottoinsieme di P(A). Con la proposizione che segue vogliamo
evidenziare una peculiarità molto importante dellinsieme Af .
Proposizione e Definizione 1.7.14. Con le notazioni di cui sopra, linsieme Af è una

partizione di A; essa si chiama la partizione associata alla funzione f : A B. Se
f (A) è finito, allora anche Af è finito ed ha la stessa cardinalità di f (A).
Dimostrazione. Se a A, posto b = f (a) risulta a f 1 (b), per cui Af è un ricopri-

mento di A. Per ogni b f (A), dalla stessa definizione di f (A) risulta che f 1 (b) 6= .
Infine, siano b, c f (A) e supponiamo f 1 (b) 6= f 1 (c). Necessariamente b 6= c; se vi fosse
un a f 1 (b) f 1 (c), avremmo al tempo stesso f (a) = b e f (a) = c, il che è vietato
dalla definizione di funzione dal momento che b 6= c. Dunque Af è una partizione di A.
Lultima affermazione segue dal fatto che f 1 (b) 6= f 1 (c) quando b 6= c.
Esercizio 1.7.15. Dato un insieme A, controllare che valgono le seguenti uguaglianze:
A = {};

{}, se A = ;
A =
, se A 6= ;
1 = .
Esercizio 1.7.16. Posto A = {1, 2}, si elenchino tutte le relazioni binarie in A (cioè
tutti i sottoinsiemi di A A) e, fra queste, si individuino le funzioni da A in A.
Esercizio 1.7.17. Siano A = {1, 2, 3, 4, 5, 6}, B = {a, b, c, d, e, f } e si consideri la

funzione
1 2 3 4 5 6
f= .
b f b a e f
Determinare f 1 (c), f (X) e f 1 (S), dove X = {1, 3, 4, 6} e S = {a, b, c}.
Esercizio 1.7.18. Sia f : A B una qualunque funzione e siano X, Y A e S, T B.

Provare che valgono le seguenti proprietà:
X Y f (X) f (Y ), (1.7.5)
S T f 1 (S) f 1 (T ); (1.7.6)
X f 1 (f (X)) e S f (f 1 (S)); (1.7.7)
f (X) = f (f 1 ((f (X))) e f 1 (S) = f 1 (f (f 1 (S))); (1.7.8)
f (X Y ) = f (X) f (Y ); (1.7.9)
f (X Y ) f (X) f (Y ); (1.7.10)
f (X Y ) f (X) f (Y ). (1.7.11)
Individuare dei casi concreti in cui accade alternativamente che

f (X Y ) $ f (X) f (Y ),
f (X Y ) % f (X) f (Y ).
(confronta con gli Esercizi 1.10.9 e 1.10.12).
1.8 Successioni. Definizione di una successione per

ricorrenza.
Definizione 1.8.1. Dato un insieme A, si chiama successione di elementi di A o,
semplicemente, successione in A una qualunque funzione da N verso A.
Se f : N A è una generica successione in A e n N, è consuetudine indicare il
valore di f in n con il simbolo fn , anziche f (n), chiamandolo ln-esimo termine di f ; la
successione medesima si usa allora indicare con uno dei simboli
(f0 , f1 , f2 , . . . , fn , . . .), (fn )06n , (fn )n .
1

Per esempio n+1 06n
sta ad indicare la seguente successione in Q:

1 1 1
1, , , . . . , ,... ;
2 3 n+1
1
si tratta della funzione n 7 n+1 : N Q.
A volte una successione (fn )n in un insieme A non può essere definita dichiarando
in maniera esplicita lelemento fn che corrisponde ad n. In tal caso si usa la cosiddetta
definizione per ricorrenza; questa consiste nel dichiarare esplicitamente lelemento f0 (si
parla di condizione iniziale) fornendo poi, per ogni n N, un procedimento esplicito che
consenta di individuare lelemento fn+1 , una volta noto lelemento fn (questo si chiama
il processo di ricorrenza). Il caso tipico è la definizione delle potenze di un numero reale
con esponente un numero naturale, come specificato nellesempio che segue.
Definizione 1.8.2. Se x è un numero reale, la funzione n 7 xn che ad ogni n N
assegna ln-esima potenza di x si definisce per ricorrenza come segue:
x0 := 1,
per ogni n N, xn+1 := xn x.
Possiamo cos` parlare della successione
(x0 = 1, x1 = x, x2 , x3 , . . . , xn , . . .),
che si chiama la successione geometrica di ragione x.
Riguardo la definizione appena data, sorgono naturali le due domande seguenti:
esiste realmente una funzione f : N R tale che f (0) = 1 e f (n + 1) = xn+1 per ogni
n N? Quante ne esistono? La risposta a queste domande è data dal seguente teorema,
di cui omettiamo la dimostrazione.
Teorema 1.8.3 (Teorema di Ricorrenza). Siano dati un insieme A, un elemento a A e

una funzione g : A A. Allora esiste ununica funzione f : N A verificante le seguenti
condizioni:
(1) f (0) = a;
(2) per ogni n N, f (n + 1) = g(f (n)).
Si dice che f `
e definita per ricorrenza tramite le (1) e (2).
Parafrasando questo teorema, una successione f : N A è individuata in maniera

univoca specificando la condizione iniziale (1) e il processo di ricorrenza (2); questultimo,
tramite lassegnata funzione ausiliaria g : A A, fornisce il protocollo da seguire per
costruire ln + 1-esimo termine f (n + 1) in funzione delln-esimo termine f (n). Cos`, con
riferimento alla Definizione 1.8.2, inseriamo nel Teorema di Ricorrenza i seguenti dati:
A = R, a = 1 e come funzione ausiliaria g : R R quella definita da g(y) = yx per ogni
y R. Allora il teorema afferma che esiste ununica funzione f : N R tale che f (0) = 1
e f (n + 1) = f (n)x per ogni n N. Ci accorgiamo allora che risulta:
f (0) = 1,
f (1) = f (0 + 1) = g(f (0)) = g(1) = x,
f (2) = f (1 + 1) = g(f (1)) = g(x) = xx,
f (3) = f (2 + 1) = g(f (2)) = g(xx) = (xx)x = xxx.
Non resta altro che definire successione geometrica di ragione x la funzione f , deno-
tando con il simbolo xn il numero f (n). La Definizione 1.8.2 è cos` legittimata (vedi pi`
u
avanti la Definizione 2.4.1).
Altro esempio importante è il seguente.
Definizione 1.8.4. La funzione fattoriale n 7 n! è la successione in N definita per

ricorrenza come segue:
0! := 1,
per ogni n N, (n + 1)! := n!(n + 1).
Dunque, un pò pi`

u esplicitamente,
1! = 1,
2! = 1 2 = 2,
3! = 2! 3 = 6,
4! = 3! 4 = 24,
e, per n > 1, n! = 1 2 3 (n 1) n.
Il lettore può controllare che anche tale definizione è legittimata dal Teorema di Ri-
correnza, nel quale si ponga A = N, a = 1 e si prenda come funzione ausiliaria g : N N
quella definita da g(y) = y(y + 1).
Definizione 1.8.5. Se A è un insieme e n N, una funzione f : n A si chiama una

successione finita di lunghezza n o, semplicemente, successione di lunghezza n
o anche n-pla ordinata di elementi di A e si indica con il simbolo (f1 , f2 , . . . , fn ).
Appare evidente che le coppie ordinate, le terne ordinate, le quaterne ordinate, ecc.
sono identificabili con le successioni di lunghezza 2, 3, 4, ecc.. Cos`, dati n insiemi
A1 , A2 , . . . , An , possiamo definire il loro prodotto cartesiano nel modo seguente:
A1 A2 An := {(a1 , a2 , . . . , an ) | ai Ai per i n}.
Indicheremo con An il prodotto cartesiano di n copie di un singolo insieme A.

Nota 1.8.6. Sia n > 0 un numero naturale e sia (f1 , f2 , . . . , fn ) una successione di
elementi di qualche insieme A. Se i è un numero naturale tale che 1 6 i < n, possi-
amo naturalmente considerare le due successioni (f1 , f2 , . . . , fi ) e (fi+1 , fi+1 , . . . , fn ). Nel
seguito noi non faremo alcuna distinzione fra la coppia ordinata
((f1 , f2 , . . . , fi ), (fi+1 , fi+1 , . . . , fn )).
e la successione (f1 , f2 , . . . , fi ) stessa. In questordine di idee, se abbiamo degli insiemi

A1 , A2 , . . . , An e un numero naturale i tale che 1 6 i < n, noi porremo
A1 A2 An = (A1 A2 Ai ) (Ai+1 Ai+2 An ).
1.9 Famiglie di elementi di un insieme.

Il concetto di successione di elementi di un insieme A ha una naturale generalizzazione.
Precisamente, se I è un qualunque insieme, una funzione I A si chiama anche una
famiglia di elementi di A avente come insieme di indici (o parametri) I. Dunque
dare una famiglia di elementi di A con insieme di indici I significa assegnare a ciascun
elemento di I un elemento di A; in particolare, una successione di elementi di A non è
altro che una famiglia di elementi di A con insieme di indici N.
Una famiglia di elementi di A con insieme di indici I viene solitamente indicata con
un simbolo del tipo (ai )iI , oppure (ai )i quando linsieme I è sottinteso dal contesto; ai
sta ad indicare lelemento di A immagine dellindice i I tramite la funzione I A
che si sta considerando. E ` di fondamentale importanza non confondere una famiglia
(ai )iI con linsieme di tutti gli ai al variare di i in I, cioè con linsieme {ai | i I};
questultimo è limmagine della funzione I A che individua la famiglia data. Tra laltro
può accadere che per due indici distinti i, j I risulti ai = aj ; si pensi, ad esempio, ad
una successione come (1, 2, 3, 1, 2, 3, 1, 2, 3, . . .) o, addirittura, ad una successione costante
come (2, 2, 2, . . .).
Si dice che due famiglie (ai )iI , (bi )iI di elementi di un insieme A con lo stesso insieme
di indici I coincidono se risulta ai = bi . Dunque
(ai )iI = (bi )iI ai = bi i I.
Se I è un insieme e per ogni i I è assegnato un insieme Ai , possiamo parlare della

famiglia di insiemi (Ai )iI , la quale può essere considerata a tutti gli effetti come una
famiglia di elementi di un insieme U . Infatti, se prendiamo per U lunione di tutti gli Ai

al variare di i in I, prendiamo cioè
[
U = {Ai | i I},
ciascun Ai è un elemento di P(A). Dunque (Ai )iI è una famiglia di elementi di P(A).
Lunione U e lintersezione dellinsieme {Ai | i I} si chiamano rispettivamente lunione
e lintersezione della famiglia (Ai )iI e si usano i seguenti rispettivi simboli:
[ [
Ai := {Ai | i I} = {x | x Ai per qualche i I},
iI
\ \
Ai := {Ai | i I} = {x | x Ai per ogni i I}.
iI
1.10 Funzioni iniettive, suriettive, biiettive.

Elenchiamo alcune proprietà che una funzione è suscettibile di possedere; esse risul-
teranno di estrema importanza.
Definizione 1.10.1. Sia data una funzione f : A B.
(1) Si dice che f è iniettiva se
per ogni x, y A, da f (x) = f (y) segue x = y.
(2) Si dice che f è suriettiva se
per ogni y B, esiste almeno un x A tale che y = f (x).
(3) Si dice che f è biiettiva, o che è una biiezione, se essa è al tempo stesso iniettiva
e suriettiva.
(4) Se A = B, si dice che f è una permutazione di A se f è biiettiva.
Nota 1.10.2. E ` importante rilevare che liniettività di una funzione f : A B equivale
a ciascuna delle due condizioni seguenti:
(5) Per ogni x, y A, se x 6= y, allora f (x) 6= f (y);
(6) Per ogni z B, il sottoinsieme f 1 (z) di A possiede al massimo un elemento.
Cos` pure, la suriettività di f è equivalente a ciascuna delle due condizioni seguenti:
(7) f (A) = B;
(8) Per ogni z B, il sottoinsieme f 1 (z) di A possiede almeno un elemento.
Esempio 1.10.3. Se B è un sottoinsieme di un insieme A e f : B A è liniezione
canonica, allora f iniettiva avendosi f (x) = x per ogni x B; chiaramente f è anche
suriettiva, e quindi biiettiva, se e solo se B = A, risultando allora f = 1A .
Esempio 1.10.4. La funzione f : N N definita da f (x) = 3x + 1 è iniettiva, perche

se f (x) = f (y), cioè 3x + 1 = 3y + 1, allora x = y. Invece f non è suriettiva perche, per
esempio, non vi è alcun x N tale che 5 = f (x) = 3x + 1.
Esempio 1.10.5. La funzione g : N N definita da
(
x 1 se x > 0,
g(x) =
2 se x = 0
è suriettiva, perche se y N, allora y = g(y + 1). Ma g non è iniettiva, perche g(0) = 2 =

g(3).
Esempio 1.10.6. Ricordiamo che ogni numero reale y > 0 ha ununica radice quadrata,
ossia esiste un unico numero reale x > 0 tale che x2 = y. Ciò equivale a dire che la
funzione f : R R+ definita da f (x) = x2 è suriettiva. Tuttavia f non è iniettiva; infatti
risulta f (x) = f (x) per ogni x R ed è x = x se e solo se x = 0.
Esempio 1.10.7. Se A = {a, b, c, d, e} e B = {1, 2, 3, 4}, la funzione

a b c d e
f=
3 1 3 4 1
non è ne iniettiva ne suriettiva. Infatti, da un lato risulta f (a) = 3 = f (c), per cui f non
è iniettiva essendo a 6= c; inoltre non vi è alcun x A tale che f (x) = 2 e quindi f non è
suriettiva.
Esercizio 1.10.8. Dato un insieme A, con riferimento allEsercizio 1.7.15 controllare che
lunica funzione A è iniettiva; essa è suriettiva se e solo se A = . Inoltre, lunica
funzione A (se esiste) è suriettiva. In particolare, lunica funzione è biiettiva.
Esercizio 1.10.9. Provare che una funzione f : A B è iniettiva se e solo se per ogni
coppia di sottoinsiemi X, Y di A risulta
f (X Y ) = f (X) f (Y ).
sottoinsieme X di A risulta
X = f 1 (f (X)).
Esercizio 1.10.11. Provare che una funzione f : A B è suriettiva se e solo se per ogni
sottoinsieme S di B risulta
S = f (f 1 (S)).
coppia di sottoinsiemi X, Y di A risulta
f (X Y ) = f (X) f (Y ).
Esercizio 1.10.13. Provare che una funzione f : A B è suriettiva se e solo se risulta

f 1 (S) 6= ogni volta che S è un sottoinsieme non vuoto di B.
Esercizio 1.10.14. Sia A = {1, 2, 3}. Tramite la loro rappresentazione tabulare (come
nella (1.7.3), per intenderci), elencare tutte le funzioni non iniettive e quelle non suriettive
da A verso A. Elencare inoltre tutte le permutazioni di A.
Esercizio 1.10.15. Dato un insieme A qualunque, provare che la funzione f : P(A)
P(A) definita da
f (X) = {A X per ogni X A
è biiettiva. Determinare f 1 .
Esercizio 1.10.16. Dato un insieme qualunque A, per ogni sottoinsieme X A defini-
amo la funzione X : A 2 (ricordiamo che 2 = {1, 2}) definita come segue:
(
1 se a 6 X,
per ogni a A, X (a) =
2 se a X.
In un certo senso la funzione X , che si chiama la funzione caratteristica di X , dichiara
se un dato elemento a A non appartiene o appartiene ad X. Possiamo allora considerare
la funzione
: P(A) 2A
definita da (X) = X per ogni X P(A), ossia la funzione che ad ogni parte di A
assegna la sua funzione caratteristica. Si provi che è una funzione biiettiva.
1.11 Composizione di funzioni.

Definizione 1.11.1. Date due funzioni f : A B e g : B C, si chiama funzione
composta o composizione di f con g (in questo ordine!) la funzione
x 7 g(f (x)) : A C;
essa si indica con g f oppure gf . Formalmente
(g f )(x) := g(f (x)) per ogni x A.
Dunque nella composizione g f opera prima f e poi g sul risultato. Sottolineiamo che
la composizione g f è definita esattamente nel caso in cui il dominio di g coincide con il
codominio di f ; in particolare, se f e g sono come nella definizione precedente, mentre da
un lato è definita g f , la composizione f g non è definita nel caso in cui C 6= A.
` importante notare che la composizione tra funzioni è associativa, nel senso che, date
E
tre funzioni f : A B, g : B C e h : C D, risulta
h(g f ) = (hg)f. (1.11.1)
Infatti, da un lato il dominio (risp. il codominio) della funzione a primo membro coincide
con il dominio (risp. il codominio) della funzione a secondo membro; inoltre per ogni
x A abbiamo:
[h(g f )](x) = h[(g f )(x)] = h[g(f (x))] = (hg)[f (x)] = [(hg)f ](x).
Potremo allora indicare la funzione (1.11.1) semplicemente con la notazione hg f , oppure
hgf , senza dover inserire delle parentesi.
Esercizio 1.11.2. Provare che per ogni funzione f : A B risulta
f 1A = f = 1B f.
Esercizio 1.11.3. Siano f : A B e g : B C due funzioni assegnate.

a) Provare che se f e g sono iniettive (rispett. suriettive, biiettive), allora g f è
iniettiva (rispett. suriettiva, biiettiva).
b) Provare che se g f è iniettiva, allora f è iniettiva.
c) Provare che se g f è suriettiva, allora g è suriettiva.
Esercizio 1.11.4. a) Dare due funzioni f : A B e g : B C in maniera che g f è
iniettiva ma g non è iniettiva.
b) Dare due funzioni f : A B e g : B C in maniera che g f è suriettiva ma f non
è suriettiva.
Definizione 1.11.5. Sia data una funzione f : A B. Una funzione f 0 : B A si dice
uninversa destra (risp. uninversa sinistra) per f se
f f 0 = 1B , (risp. f 0 f = 1A ). (1.11.2)
Se f 0 è sia inversa destra che sinistra per f , allora si dice che f 0 è uninversa per f . Si
dice che la funzione f : A B è invertibile a destra (risp. invertibile a sinistra,
invertibile) se ammette uninversa destra (risp. uninversa sinistra, uninversa).
Se f 0 : B A f 00 : B A sono rispettivamente uninversa sinistra e uninversa destra
per una funzione f : A B, allora f 0 = f 00 ; infatti risulta:
f 0 = f 0 1B = f 0 (f f 00 ) = (f 0 f )f 00 = 1A f 00 = f 00 , (1.11.3)
Di conseguenza, se f è invertibile, allora per essa vi è ununica inversa, che viene di solito
indicata con f 1 .
Proposizione 1.11.6. Una funzione f : A B è invertibile se e solo se è biiettiva. In
tal caso anche linversa f 1 : B A è biiettiva e risulta (f 1 )1 = f .
Dimostrazione. Supponiamo f invertibile e sia f 0 : B A la sua inversa. Tenuto
conto che la funzione identica su un qualunque insieme è biiettiva, dalla prima delle
(1.11.2) e dallEsercizio 1.11.3, c) segue che f è suriettiva, mentre dalla seconda delle
delle (1.11.2) e dallEsercizio 1.11.3, b) segue che f è iniettiva. Dunque f è biiettiva.
Viceversa, supponiamo f biiettiva e definiamo la funzione f 0 : B A nel modo seguente:
dato y B, per la biettività di f esiste un unico y 0 A tale che y = f (y 0 ). Dichiariamo
dunque f 0 (y) = y 0 . Allora
(f f 0 )(y) = f (f 0 (y)) = f (y 0 ) = y = 1B (y) per ogni y B,
per cui f f 0 = 1B . Daltro canto, tenuto conto di come abbiamo definito f 0 risulta
(f 0 f )(x) = f 0 (f (x)) = x = 1A (x) per ogni x A,
quindi f 0 f = 1A . Concludiamo che f è invertibile.

Nota 1.11.7. Attenzione alluso del simbolo f 1 ! Esso è già entrato come parte delle
notazioni f 1 (S) e f 1 (b), le quali indicano le controimmagini rispettivamente di un
sottoinsieme S e di un elemento b del codominio di f . Tuttavia ciò non significa che si
possa sempre parlare della funzione f 1 inversa di f , a meno che questultima non sia
biiettiva, come specificato dalla Proposizione precedente.
Proposizione 1.11.8. Se f : A B è una funzione iniettiva e A 6= , allora f ha almeno

uninversa sinistra.
Dimostrazione. Osserviamo che liniettività di f comporta che se y f (A), allora

esiste in A un unico elemento, diciamo xy , tale che y = f (xy ). Se f è anche suriettiva,
allora f è biiettiva e quindi è invertibile per la Proposizione 1.11.6. Supponiamo f non
suriettiva, cioè f (A) $ B, scegliamo un elemento x0 A (ciò è consentito dallipotesi
A 6= ) e definiamo la funzione g : B A nel modo seguente: per ogni y B

xy , se y f (A);
g(y) =
x0 , se y 6 f (A).
Se x A, allora evidentemente x = xf (x) , per cui x = g(f (x)) = (g f )(x). Dunque

g f = 1A .
Proposizione 1.11.9. Dato un numero naturale n e un insieme A, se f : n A è una

funzione suriettiva, allora f ha almeno uninversa destra.
Dimostrazione. Se n = 0, allora n = e quindi la suriettività di f comporta che A = .

In tal caso f è lunica funzione , la quale è biiettiva e quindi invertibile. Supponiamo
n > 0. Dato x A, a causa della suriettività di f la controimmagine f 1 (x) non è vuota
e quindi ha minimo, sia questo g(x). Lassegnazione x 7 g(x) determina una funzione
g : A n e risulta f (g(x)) = x per ogni y A, ossia f g = 1A .
Esercizio 1.11.10. Provare che se A è un insieme non vuoto, lunica funzione A è

iniettiva ma non è invertibile a sinistra (Vedi gli Esercizi 1.7.15 e 1.10.8).
Esercizio 1.11.11. Date due funzioni biiettive f : A B e g : B C, si provi che
(f 1 )1 = f e (g f )1 = f 1 g 1 . (1.11.4)
Esercizio 1.11.12. Sia data una funzione f : A B. Provare che f è biiettiva se e

solo se la relazione opposta f op (vedi la Definizione 1.7.11) è una funzione. In tal caso
f op = f 1 .
Esercizio 1.11.13. Provare che una funzione invertibile a destra (risp. a sinistra) è
suriettiva (risp. iniettiva) (Sugg.: Applicare lEsercizio 1.11.3).
Esercizio 1.11.14. Trovare almeno due inverse sinistre per la funzione f di cui allE-
sempio 1.10.4.
Esercizio 1.11.15. Trovare almeno due inverse destre per la funzione g di cui allEsempio
1.10.5.
Esercizio 1.11.16. Trovare, se esiste, linversa per le funzioni f : Q Q, g : Z Z,

h : Z Z, k : R+ R+ definite come segue:
f (x) = 2x 7 per ogni x Q,

g(x) = x 7 per ogni x Z,
h(x) = x 7 per ogni x Z,
k(x) = (1 + x)2 per ogni x R+ .
Esercizio 1.11.17. Trovare linversa per la funzione f di cui allEsercizio 1.10.15.
Esercizio 1.11.18. Trovare linversa per la funzione di cui allEsercizio 1.10.16.
Esercizio 1.11.19. Determinare tutte le funzioni invertibili dallinsieme A = {1, 2, 3} in

se.
Esercizio 1.11.20. Siano A, B due insiemi finiti con rispettivamente 3 e 4 elementi.

Quante inverse sinistre possiede f ?
1.12 Insiemi finiti.

Finora il lettore ha avuto a che fare con gli insiemi finiti limitatamente a certi esempi
ed esercizi. Adesso che disponiamo del concetto di funzione siamo in grado di dare la
definizione ufficiale di insieme finito. Intuitivamente, per esempio noi diciamo che un
insieme A possiede quattro elementi se, contando questi ultimi (ovviamente non contan-
do più di una volta uno stesso elemento!), il processo si arresta dopo quattro passi, avendo
esaurito gli elementi di A. Dovrebbe essere evidente che loperazione di contare gli ele-
menti di A equivale al decidere una specifica funzione biiettiva dallinsieme 4 = {1, 2, 3, 4}
verso A o, equivalentemente, da A verso 4. Apparirebbe dunque naturale dichiarare che,
se n è un numero naturale, un insieme A possiede n elementi se esiste una funzione biiet-
tiva da n verso A; tuttavia, per poter ufficializzare tale dichiarazione rendendola una
definizione formale, è indispensabile provare che se vale quella proprietà allora il numero n
è unico. Per raggiungere tale scopo abbiamo bisogno del seguente risultato fondamentale.
Teorema 1.12.1. Sia n un numero naturale e sia f : n n una funzione. Allora le

seguenti condizioni sono equivalenti:
(1) f è iniettiva;
(2) f è suriettiva;
(3) f è biiettiva.
Dimostrazione. Se n = 0, oppure n = 1, lequivalenza delle tre condizioni è ovvia,

dal momento che le uniche funzioni e 1 1 sono ovviamente biiettive (Esercizio
1.10.8). Procedendo allora per induzione su n, assumiamo che per un certo n N e per
ogni funzione f : n n le tre condizioni siano equivalenti. Dobbiamo dimostrare che, di
conseguenza, data una funzione f : n+1 n+1 quelle condizioni continuano ad essere
equivalenti.
(1)(3) Supponiamo che f sia iniettiva e supponiamo, per assurdo, che f non sia
suriettiva, distinguendo i due casi n+1 6 f (n+1) e n+1 f (n+1). Il primo caso equivale
ad affermare che f (n+1) n; possiamo allora considerare la restrizione f |n : n n, la
quale è iniettiva perche lo è f . Dunque f |n è biiettiva in base allipotesi induttiva. Dal
momento che f (n + 1) n, dalla suriettività di f |n segue che vi è un x n tale che
f |n (x) = f (n + 1), ossia f (x) = f (n + 1). Ma x 6= n + 1, in contrasto con liniettività di
f . Se invece n + 1 f (n+1), scegliamo un elemento y n+1 f (n+1) e consideriamo
la funzione g : n+1 n+1 definita come segue:

n + 1, se x = y;
per ogni x n+1, g(x) = y, se x = n + 1;
x, se x 6= y e x 6= n + 1.

Notiamo che g è biiettiva; essa non è altro che la permutazione di n+1 che scambia fra loro
n + 1 e y, mentre lascia fissi gli altri elementi. Allora la funzione h = g f : n+1 n+1
è iniettiva, in quanto composizione di funzioni iniettive, e non è suriettiva, altrimenti
lo sarebbe f = g 1 h. Ora si controlla immediatamente che n + 1 6 h(n+1), per cui
possiamo applicare ad h largomento svolto su f nel primo caso, giungendo quindi ad una
contraddizione. Concludiamo che f deve essere suriettiva.
(2)(3) Supponiamo che f sia suriettiva. Allora f ha uninversa destra g : n+1
n+1 e g è iniettiva (Esercizio 1.11.13), quindi biiettiva per limplicazione (1)(3) sopra
dimostrata. Dunque f = g 1 è biiettiva.
Le implicazioni (3)(1) e (3)(2) sono ovvie.
Corollario 1.12.2. Se m, n N e m < n, allora non vi può essere alcuna funzione

iniettiva da n verso m.
Dimostrazione. Se h : m n è liniezione canonica, allora h è iniettiva ma non è su-
riettiva. Di conseguenza, se vi fosse una funzione iniettiva f : n m, la composizione
hf : n n sarebbe iniettiva ma non suriettiva, in contrasto con il Teorema 1.12.1.
Proposizione 1.12.3. Dato un insieme A e due numeri naturali m, n, se vi sono due

funzioni biiettive f : m A e g : n A, allora m = n.
Dimostrazione. Supponiamo, per assurdo, che sia per esempio m < n e consideriamo
liniezione canonica h : m n, la quale è iniettiva ma non è suriettiva. Di conseguenza
la funzione f = k f 1 g : n n è iniettiva e non è suriettiva, in contrasto con il Teorema
1.12.1.
Possiamo ora definire in modo formale gli insiemi finiti.

Definizione 1.12.4. Si dice che un insieme A è finito se esiste un numero naturale n

(necessariamente unico per la Proposizione 1.12.3) e una biiezione n A; si dice in tal
caso che A possiede n elementi, oppure che A ha cardinalit` a n e si scrive |A| = n.
Si dice invece che A è infinito se non è finito.
Da tale definizione segue che se f : A B è una funzione biiettiva, allora A è finito

se e solo se B è finito, avendosi in tal caso |A| = |B| (Esercizio!).
Proposizione 1.12.5. Un insieme A è infinito se e solo se per ogni n N vi è almeno

una funzione iniettiva da n verso A.
Dimostrazione. La parte se è conseguenza della Definizione 1.12.4 e della Proposizione

1.12.3. Supponiamo A infinito. Lunica funzione 0 = A è iniettiva. Procedendo
per induzione, dato n N, supponiamo che vi sia una funzione iniettiva f : n A e
mostriamo che, di conseguenza, esiste una funzione iniettiva da n+1 verso A. Siccome
A è infinito, f non è suriettiva e quindi possiamo prendere un elemento a A f (n).
Definiamo allora la funzione g : n+1 A come segue: per ogni i n+1

f (i), se i n;
g(i) =
a, se i = n + 1.
Liniettività di f e la scelta dellelemento a comportano liniettività di g.
Corollario 1.12.6. Se B è un insieme finito e A B, allora anche A è finito e |A| 6 |B|.
Dimostrazione. Sia n = |B| e sia f : n B una biiezione. Osserviamo che se m N e

vi è una funzione iniettiva g : m A, allora è necessariamente m 6 n. Infatti, conside-
rata la funzione iniettiva h : m B tale che h(i) = g(i) per ogni i m, questa dà luogo
alla funzione iniettiva f 1 h : m n e dal Corollario 1.12.2 segue appunto che m 6 n.
Di conseguenza, se m > n, allora non vi può essere una funzione iniettiva da m verso A.
Il fatto che A deve essere finito segue ora dalla Proposizione 1.12.5.
Corollario 1.12.7. Se f : A B è una funzione iniettiva e B è finito, allora anche A è

finito e |A| 6 |B|.
Dimostrazione. Per il Corollario 1.12.6 f (A) è finito e |f (A)| 6 |B|. Daltra parte la
legge x 7 f (x) definisce una biiezione da A verso f (A); dunque |A| = |f (A)| 6 |B|.
Corollario 1.12.8. Se Se f : A B è una funzione suriettiva e A è finito, allora f ha

almeno uninversa destra. Inoltre anche B è finito e |B| 6 |A|.
Dimostrazione. Posto n = |A|, vi è una funzione biiettiva g : n A. Possiamo allora

considerare la funzione suriettiva f g : n B, la quale ha uninversa destra h : B n in
base alla Proposizione 1.11.9, quindi g h : B A è uninversa destra per f . Siccome g h
è iniettiva, dal Corollario 1.12.7 segue che B è finito e |B| 6 |A|.
Corollario 1.12.9. Siano A, B insiemi finiti aventi la stessa cardinalità. Data una
funzione f : A B, le seguenti condizioni sono equivalenti:
(1) f è iniettiva;
(2) f è suriettiva;
(3) f è biiettiva.
Dimostrazione. Per lipotesi vi è un numero naturale n e due biiezioni h : n A e

k : n B, per cui possiamo considerare la funzione g = k 1 f h : n n. A titolo di
esercizio il lettore può dimostrare che g è iniettiva, suriettiva o biiettiva se e solo se f ha la
corrispondente proprietà. A questo punto la tesi è una diretta conseguenza del Teorema
1.12.1.
1.13 Elementi di calcolo combinatorio.

In questa sezione affrontiamo alcuni problemi elementari di calcolo della cardinalità
di certi insiemi finiti, quando questi sono ottenuti come risultato di alcune operazioni su
insiemi finiti preassegnati. Quasi sempre lo strumento chiave risulta essere il Principio
di Induzione, oppure la sua versione finita che ora presentiamo. Questultima riguarda
il caso di una proprietà P (n) definita non su un intervallo illimitato (e quindi infinito)
a , bens` su un intervallo finito di N, cioè per n soggetto alla condizione a 6 n 6 b per
certi a, b N. La sua dimostrazione è praticamente la stessa, considerato che valendo il
Principio del Minimo in N, a maggior ragione tale principio vale nel sottoinsieme
{n N | a 6 n 6 b}.
Teorema 1.13.1. Principio di Induzione Finita. Siano a, b N con a < b, sia P (n)
una proprietà che dipende dallintero n, dove a 6 n 6 b, e supponiamo che siano verificate
le seguenti condizioni:
(1) P (a) è vera;
(2) dato n N con a 6 n < b, se P (n) è vera, allora anche P (n + 1) è vera.
Allora P (n) è vera per ogni n tale che a 6 n 6 b.
Come prima cosa, calcoliamo la cardinalità dellunione di un insieme finito di insiemi

finiti a due a due disgiunti.
Proposizione 1.13.2. Sia A un insieme, sia {A1 , A2 , . . . , An } una partizione finita di A

e supponiamo che gli insiemi A1 , A2 , . . . , An siano finiti. Allora anche A è finito e risulta
|A| = |A1 | + |A2 | + + |An |. (1.13.1)

Dimostrazione. Consideriamo dapprima il caso n = 2, ossia il caso in cui A = B C,

dove B, C sono finiti e B C = . Vi sono dunque due numeri naturali r, s e due biiezioni
f : B r e g : C s. Definiamo la funzione h : A r + s nel modo seguente:

f (x), se x B;
per ogni x A h(x) =
r + g(x), se x C.
Allora h è biiettiva. Infatti, siano x, y A e supponiamo che x 6= y. Se x, y B,
allora h(x) = f (x) 6= f (y) = h(y); analogamente, se x, y C, allora h(x) = r + g(x) 6=
r + g(y) = h(y). Se poi è per esempio x B e y C, allora h(x) = f (x) 6 r, mentre
h(y) = r +g(y) > r +1. In ogni caso risulta h(x) 6= h(y), per cui h è iniettiva. Infine, dato
t r + s, se 1 6 t 6 r, allora t f (B) h(A); se invece r + 1 6 t 6 s, allora t = m + u
per un unico numero naturale u s, per cui vi è un elemento y C tale che u = g(y).
Dunque otteniamo t = m + u = m + g(y) = h(y). Concludiamo che h è anche suriettiva.
Con ciò abbiamo dimostrato che la tesi della proposizione è vera se n = 2. Torniamo ora
alle ipotesi generali, poniamo mi = Bi per ogni i = 1, . . . , n e procediamo per induzione
su n. Per n = 1 la (1.13.1) è ovviamente vera, dato che in questo caso risulta A = A1
(base dellinduzione). Dato un numero naturale n > 1, supponiamo che la (1.13.1) sia
vera tutte le volte che abbiamo una partizione {A1 , A2 , . . . , An } di A formata da n insiemi
finiti (ipotesi induttiva). Considerata una partizione di A formata da n + 1 insiemi finiti
{A1 , A2 , . . . , An , An+1 }, poniamo B = A1 A2 . . . An . Siccome {A1 , A2 , . . . , An , } è
una partizione di B, per lipotesi induttiva risulta
|B| = |A1 | + |A2 | + + |An |.
Siccome A = B An+1 e B An+1 = , usando il fatto che la tesi è vera per n = 2,
otteniamo:
|A| = |B| + |An+1 | = (|A1 | + |A2 | + + |An |) + |An+1 | = |A1 | + |A2 | + + |An | + |An+1 |,
come volevamo.
Passiamo ora a calcolare la cardinalità del prodotto cartesiano di un numero finito

di insiemi finiti, provando dapprima cha se che se A, B sono due insiemi finiti con r =
|A|, s = |B|, allora
|A B| = rs. (1.13.2)
Procedendo per induzione su s, se s = 0, cioè B = , allora A B = , ossia |A B| = 0.
Dunque la (1.13.2) è vera se s = 0 (base dellinduzione). Dato un qualunque numero
naturale s, supponiamo che la (1.13.2) sia vera (ipotesi induttiva) e proviamo che, di
conseguenza, è vera la stessa uguaglianza con s + 1 al posto di s. Sia dunque B un insieme
di s + 1 elementi, scegliamo arbitrariamente un elemento b B e poniamo C = B {b}.
Allora |C| = s e quindi dallipotesi induttiva segue che |A C| = rs. Daltro canto è
chiaro che
A B = (A C) (A {b}) e (A C) (A {b}) = .
Tenuto conto della Proposizione 1.13.2, possiamo concludere che |AB| = rs+r = r(s+1)
e quindi la (1.13.2) vale per ogni r, in base al Principio di Induzione; inoltre essa vale per
ogni s per il semplice motivo che largomento sopra svolto non dipende dalla scelta di un
valore specifico per s.
Passando al caso generale, abbiamo la seguente
Proposizione 1.13.3. Se A1 , A2 , . . . , An sono degli insiemi finiti, allora risulta
|A1 A2 An | = |A1 | |A2 | |An |.
Dimostrazione. Abbiamo provato sopra che la tesi è vera se n = 2. Dato un qualunque
intero n > 2, supponiamo la tesi vera per n insiemi finiti e proviamo che essa continua ad
essere vera per n + 1 insiemi finiti A1 , A2 , . . . , An , An+1 . Usando il fatto che la tesi vale
per due insiemi, come abbiamo provato sopra, tenuto conto della Nota 1.8.6 dallipotesi
induttiva deduciamo che
|A1 A2 An An+1 | = | (A1 A2 An ) An+1 |
= | (A1 A2 An ) | |An+1 | = (|A1 | |A2 | |An |)|An+1 | = |A1 | |A2 | |An ||An+1 |,
come volevamo.
La proposizione appena dimostrata ci mette in grado di calcolare il numero delle

funzioni da un insieme finito verso un altro insieme finito.
Proposizione 1.13.4. Se A e B sono due insiemi finiti non vuoti, per linsieme B A delle
funzioni da A verso B abbiamo
|B A | = |B||A| .
Dimostrazione. Posto m = |A| e indicati con a1 , a2 , . . . , am gli elementi di A, ricordiamo
che una funzione f : A B può essere specificata in maniera tabulare ponendo

a1 a2 . . . am
f= ,
b1 b2 . . . b m
dove si intende che b1 = f (a1 ), b2 = f (a2 ), . . . , bm = f (am ). Dunque di funzioni da A
verso B ve ne sono tante quante sono le m-ple ordinate (b1 , b2 , . . . , bm ) di elementi di B,
ossia tanti quanti sono gli elementi del prodotto cartesiano B m . Dalla Proposizione 1.13.3
risulta allora |B m | = |B|m = |B||A| .
Lultima proposizione ci mette in grado di contare i sottoinsiemi di un insieme finito

A. Ricordiamoci che la legge che ad ogni parte X A associa la relativa funzione
caratteristica X : A 2 definisce una funzione biiettiva : P(A) 2A (vedi lEsercizio
1.10.16); di conseguenza P(A) e 2A hanno la stessa cardinalità. Grazie alla Proposizione
1.13.4 possiamo allora concludere con il corollario seguente.
Corollario 1.13.5. Se A è un insieme finito, posto n = |A| risulta
|P(A)| = 2n . (1.13.3)
Calcoliamo il numero delle funzioni iniettive da un insieme finito A verso un altro
insieme finito B. Naturalmente dovrà essere |A| 6 |B|, perche altrimenti non vi sono
funzioni iniettive da A verso B, come conseguenza del corollario 1.12.2.
Proposizione 1.13.6. Siano A, B insiemi finiti non vuoti con |A| = k e |B| = n. Se
k 6 n e DA,B è linsieme delle funzioni iniettive da A verso B, allora
n!
|DA,B | = . (1.13.4)
(n k)!
Dimostrazione. Applicheremo il Principio di Induzione Finita intendendo la (1.13.4)

come una proprietà che dipende da k, dove 1 6 k 6 n. Se k = 1 il secondo membro
della (1.13.4) vale n; dallaltro lato, avendo A un singolo elemento, vi sono esattamente
n funzioni da A verso B le quali, ovviamente, sono tutte iniettive. Dunque la (1.13.4)
vale per k = 1 (base dellinduzione). Dato k tale che 1 6 k < n, supponiamo che valga
la (1.13.4) quando |A| = k (ipotesi induttiva); preso un insieme C di k + 1 elementi,
dobbiamo mostrare che, di conseguenza, risulta
n!
|DC,B | = . (1.13.5)
(n (k + 1))!
Indicando con c1 , c2 , . . . , ck , ck+1 gli elementi di C, osserviamo che definire una funzione
iniettiva f : C B equivale a prescrivere una successione finita
b1 , b2 , . . . , bk , bk+1
di elementi di B, nella quale non devono figurare ripetizioni, e dichiarare
f (c1 ) = b1 , f (c2 ) = b2 , . . . , f (ck ) = bk , f (ck+1 ) = bk+1 ,
ossia dichiarare
c1 c2 . . . ck ck+1
f= : C B.
b1 b2 . . . bk bk+1
Chiaramente, posto A = {c1 , c2 , . . . , ck }, per per definire f occorre prima specificare una
funzione iniettiva
c 1 c 2 . . . ck
g= : A B,
b1 b2 . . . b k
dopo di che occorre dichiarare f (ck+1 ) = bk+1 . Dunque g va scelta in DA,B , mentre bk+1
deve essere scelto nellinsieme B {b1 , b2 , . . . , bk }, il quale ha n k elementi. Tenuto
conto dellipotesi induttiva (1.13.4), concludiamo che
n! n! n!
|DC,B | = (n k) = = ,
(n k)! (n k 1))! (n (k + 1))!
quindi la (1.13.5).
Si ricordi che abbiamo chiamato permutazioni di un insieme A le funzioni biiettive

da A in A. Linsieme delle permutazioni di A si indica con il simbolo S(A). Se A è finito,
in base alla Proposizione 1.12.9 linsieme DA,A delle funzioni iniettive da A in A coincide
con S(A). La Proposizione 1.13.6 ci permette allora di affermare quanto segue:
Corollario 1.13.7. Se A è un insieme finito di n elementi allora |S(A)| = n!. Pi` u in

generale, se A e B sono due insiemi tali che |A| = n = |B|, allora vi sono esattamente n!
funzioni biiettive da A verso B.
Sia A un insieme finito di cardinalità n e sia k un intero tale che 0 6 k 6 n. Quanti
sono i sottoinsiemi di A di k elementi? Per rispondere a questa domanda, osserviamo
che ogni funzione iniettiva f dallinsieme k = {1, 2, . . . , k} verso A individua uno di tali
sottoinsiemi, precisamente
f (k) = {f (1), f (2), . . . , f (k)},

n!
ossia limmagine di f . Per la Proposizione 1.13.6 vi sono funzioni iniettive da k
(n k)!
verso A. Daltra parte, se X è un sottoinsieme di A di k elementi, una funzione iniettiva
f : k A tale che f (k) = X corrisponde ad una funzione iniettiva da k verso X, e
viceversa; di queste ultime ve ne sono k! in base al Corollario 1.13.7. Ciò significa che di
tutte le funzioni iniettive appartenenti a Dk,A , esattamente k! hanno per immagine X.
Possiamo allora concludere con la seguente
Proposizione 1.13.8. Se A è un insieme finito di cardinalità n e k è un intero tale che
n!
0 6 k 6 n, allora in A vi sono sottoinsiemi di cardinalità k.
k!(n k)!

n
Introduciamo il simbolo , ponendo per definizione
k

n n!
:= ; (1.13.6)
k k!(n k)!
Un numero di questa forma si chiama un coefficiente binomiale; questo nome è motivato
dal fatto che sono proprio di questo tipo i coefficienti nello sviluppo della n-esima potenza
di un binomio a + b, dove a e b sono numeri reali.
Nota 1.13.9. Nel linguaggio del calcolo combinatorio classico, se A è un insieme di n
elementi e k è un qualunque numero intero positivo, una funzione da k verso A viene detta
disposizione con ripetizioni di elementi di A di classe k; se k 6 n, una funzione
iniettiva da k verso A viene detta disposizione (semplice) di elementi di A di classe
k. Infine un sottoinsieme di A di cardinalità k viene chiamato una combinazione di
elementi di A di classe k.
Esercizi 1.13.10. a) Dati due numeri naturali n, k con k 6 n, provare che

n n
= .
k nk
b) Dati due numeri naturali n, k con k 6 n, utilizzando la (1.13.6) provare che

n n n+1
+ = . (1.13.7)
k k+1 k+1
Scrivere una dimostrazione alternativa di tale uguaglianza che utilizza argomenti in-
siemistici (Sugg.: Sia A un insieme di n + 1 elementi e si fissi un suo elemento a0 . Si
suddividano i sottoinsiemi di A di cardinalità k +1 fra quelli ai quali a0 appartiene e quelli
ai quali a0 non appartiene.)
c) Dato un numero naturale n, si provi che
n
X n
= 2n
k=0
k
(Sugg.: Si ricordi che un insieme di n elementi ha 2n sottoinsiemi).
Terminiamo questa sezione con il calcolo della potenza di un binomio. Si chiama

Triangolo di Tartaglia o di Pascal la seguente tabella di numeri con infinite righe:
1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 5
1 6 15 20 15 6 1
... ... ... ... ... ... ... ...,
In essa i numeri che figurano nella n-esima riga (consideriamo come 0-esima riga quella
che contiene solo 1) sono, nellordine,

n n n n n n n
= 1, = n, ,..., ,..., , = n, = 1.
0 1 2 k n2 n1 n
Si noti che ogni numero coincide con la somma dei due numeri pi` u vicini ad esso che si
trovano sulla riga immediatamente superiore; ciò è in accordo con la formula (1.13.7). La
successione dei numeri che si trovano nella n-esima riga del Triangolo di Tartaglia sono
i coefficienti nello sviluppo delln-esima potenza di un binomio, come meglio precisato
dalla proposizione che segue; avvertiamo che il lettore che non abbia ancora familiarità
con luso delle sommatorie può rinviarne la lettura fino a dopo la Sezione 2.4.
Proposizione 1.13.11. Dati due numeri reali a, b, per ogni numero naturale n risulta
n
n
X n
(a + b) = ank bk . (1.13.8)
k=0
k
Dimostrazione. Procedendo per induzione su n, notiamo che la la (1.13.8) è chiaramente

vera per n = 0, riducendosi alla 1 = 1. Supponendola vera per un n N, otteniamo:

n n
n+1 n
X n nk+1 k X n nk k+1
(a + b) = (a + b) (a + b) = a b + a b
k=0
k k=0
k
n n
n+1
X n n+1k k X n
=a + a b + an+1k bk + bn+1
k=1
k k=1
k 1
n
X n
n
= an+1 + + an+1k bk + bn+1
k=1
k k1
n
X n + 1 n+1k k
= an+1 + a b + bn+1 per la (1.13.7),
k=1
k
n+1
X n + 1

= an+1k bk .
k=0
k
Dunque la (1.13.8) vale con n + 1 in luogo di n e la tesi segue dal Principio di Induzione.
1.14 Relazioni di equivalenza.

Dopo le funzioni, le più importanti relazioni binarie in un insieme sono le relazioni di
equivalenza e le relazioni dordine. In questa sezione ci occupiamo delle prime.
Definizione 1.14.1. Sia A un insieme. Una relazione binaria R = R(x, y) in A si dice:
(1) riflessiva se per ogni x A è vera la proprietà R(x, x);
(2) simmetrica se, dati x, y A, dallessere vera R(x, y) segue che anche R(y, x) è
vera;
(3) transitiva se, dati x, y, z A, dallessere vere R(x, y) e R(y, z) segue che è vera
R(x, z).
La relazione R è una relazione di equivalenza o, semplicemente, unequivalenza in
A se è riflessiva, simmetrica e transitiva.
Se la relazione R è data semplicemente come grafico di se stessa, ossia come sottoin-
sieme di A A (vedi la Definizione 1.7.1), le tre condizioni sopra definite si traducono
rispettivamente nelle seguenti:
(1) R è riflessiva se R contiene la diagonale 2A = {(a, a) | a A};
(2) R è simmetrica se, dati x, y A, dallessere (x, y) R segue che (y, x) R;
(3) R è transitiva se, dati x, y, z A, dallessere (x, y) R e (y, z) R segue che
(x, z) R.
Si noti che una relazione R in un insieme A è simmetrica se e solo se R = Rop . Gli
esempi di relazioni di equivalenza abbondano.
Esempi 1.14.2. a) Ecco il primo esempio banale di relazione di equivalenza: Dato

un insieme qualunque A, la relazione di uguaglianza x = y è evidentemente riflessiva,
simmetrica e transitiva.
b) La relazione di parallelismo è una relazione di equivalenza nellinsieme di tutte le
rette dello spazio, come pure nellinsieme di tutti i piani dello spazio.
f) Se è un piano nel quale è stato fissato un sistema di riferimento cartesiano ortonor-
male (significa che si sono scelti degli assi coordinati fra loro perpendicolari e i loro segmen-
ti unitari hanno la stessa lunghezza), la proprietà di avere la stessa distanza dallorigine è
una relazione di equivalenza in , considerato come insieme dei suoi punti, naturalmente.
Esercizio 1.14.3. Sia A linsieme delle rette di un dato piano e si dichiari che due rette
sono in relazione quando hanno almeno un punto in comune. Si tratta di una relazione
di equivalenza in A?
Esercizio 1.14.4. Si stabilisca quali delle seguenti relazioni binarie sono relazioni di
equivalenza in R:
a) x 6 y; b) x2 + y 2 = 1; c) xy = 1; d) x2 y 2 = 1; e) log x = y;
f) x = y + h per qualche h Z.
Esercizio 1.14.5. Sia A un qualunque insieme con almeno due elementi. Se a A, allora
{(a, a)} è un esempio di relazione binaria in A che non è riflessiva (perche?), ma è simme-
trica e transitiva. Stabilire, allora, che cosa cè di sbagliato nella seguente dimostrazione
del fatto che se una relazione binaria R in un insieme A è simmetrica e transitiva allora
essa è anche riflessiva: Siccome R è simmetrica, da (x, y) R segue (y, x) R. Siccome
R è anche transitiva, da (x, y) R e (y, x) R segue (x, x) R, dunque R è anche
riflessiva.
Esercizio 1.14.6. a) Se A è un insieme con (almeno) due elementi, si provi che in A vi

è una relazione riflessiva, transitiva ma non simmetrica.
b) Provare che se A è un insieme con soli due elementi, allora ogni relazione in A
riflessiva e simmetrica è anche transitiva. Ma se A ha almeno tre elementi, allora vi è
almeno una relazione riflessiva, simmetrica ma non transitiva.
Sia R una relazione di equivalenza in un insieme A. Dati x, y A, se (x, y) R (ossia

x è in relazione con y tramite R), si usa anche dire che x `
e equivalente ad y modulo R;
per indicare questo fatto noi scriveremo di norma x R y, oppure x y quando è chiaro
dal contesto a quale relazione di equivalenza ci si riferisce. Per ogni x A indichiamo
con [x] il sottoinsieme di A di tutti gli elementi che sono in relazione con x:
[x] := {z A | z x}.
Osserviamo che [x] non è mai vuoto perche, a causa della riflessività di R, risulta x x
e quindi è almeno x [x]. Linsieme [x] si chiama la classe di equivalenza modulo R
che contiene x. Dunque linsieme {[x] | x A} di tutte le classi di equivalenza modulo
R, che è un sottoinsieme di P(A), è un ricoprimento di A. Siano x, y due elementi di
A. Se x y, dalla simmetricità e dalla transitività di R segue facilmente che [x] = [y];
viceversa, se vale questultima uguaglianza, siccome y [y], segue che x y. Cosa accade
se è invece x y (intendiamo x non è equivalente ad y modulo R)? In questo caso
risulta [x][y] = , perche se vi fosse un z [x][y], avremmo z x e z y, quindi x y
per la simmetricità e la transitività di R. Dunque le classi di equivalenza modulo R sono a
due a due disgiunte; poiche, come abbiamo visto sopra, esse costituiscono un ricoprimento
di A, concludiamo che linsieme {[x] | x A} è una partizione di A. Riassumendo:
Proposizione e Definizione 1.14.7. Con le notazioni di cui sopra, dati x, y A risulta:
(1) x [x];
(2) x y se e solo se [x] = [y];
(3) se x y, allora [x] [y] = .
Di conseguenza linsieme i cui elementi sono le classi di equivalenza modulo R è una
partizione di A che si chiama linsieme quoziente di A rispetto ad R e si indica con
A/R (da leggersi: A su R):
A/R := {[x] | x A}.
La funzione : A A/R definita da
(x) := [x] per ogni x A
si chiama la proiezione canonica di A sullinsieme quoziente A/R. Comè evidente,
è sempre una funzione suriettiva e risulta (x) = (y) se e solo se [x] = [y], cioè se e
solo se x y. Se x A, ogni elemento della classe di equivalenza [x] (quindi anche x
stesso) si chiama un rappresentante della classe [x] e si dice che x rappresenta [x]. Da
quanto sopra risulta evidente che due elementi x, y A rappresentano la stessa classe di
equivalenza se e solo se x y, se e solo se appartengono alla stessa classe di equivalenza,
se e solo se [x] = [y]. Infine, si chiama un insieme di rappresentanti per le classi
di equivalenza modulo R, o per A/R, ogni sottoinsieme B di A con le seguenti due
proprietà:
(1) se x, y sono due elementi distinti di B, allora x y;
(2) per ogni z A vi è un (unico) x B tale che z x.
Esempi 1.14.8. a) Se R è la relazione di uguaglianza in un insieme A (questo era il nostro
primo esempio banale di relazione di equivalenza), è ovvio che [x] = {x} per ogni x A,
di modo che A/R = {{x} | x A}, cioè A/R è linsieme di tutti i sottoinsiemi di A che
hanno un unico elemento. E ` allora evidente che, in questo caso, A è lunico insieme di
rappresentanti.
b) Se A è linsieme di tutte le rette dello spazio e R è la relazione di parallelismo, per
ogni retta r la classe [r] è semplicemente linsieme di tutte le rette parallele ad r. Fissato
un punto P , linsieme B di tutte le rette che passano per P è un insieme di rappresentanti
per A/R.
c) Con riferimento allEsempio 1.14.2, f), le classi di equivalenza sono le circonferenze
del piano che hanno centro nellorigine O e ogni semiretta di origine O è un insieme di
rappresentanti.
Concludiamo questa sezione con un teorema, la cui importanza apparirà evidente solo
quando lo applicheremo allo studio delle strutture algebriche quozienti.
Teorema 1.14.9 (Teorema Fondamentale dellInsieme Quoziente). Sia A un insieme e
sia R una relazione di equivalenza in A. Se f : A B è una funzione con la proprietà
che, dati x, y A, da y segue f (x) = f (y), allora esiste ununica funzione f : A/R B
che rende commutativo il diagramma 3

A - A/R
HH
fH
HH f
H ?
jB .
H
H (1.14.1)
Inoltre risulta:
(1) f è suriettiva se e solo se f è suriettiva;
(2) f è iniettiva se e solo se, dati x, y A, le proprietà x y e f (x) = f (y) sono

equivalenti;
(3) f è biiettiva se e solo se f è suriettiva e le proprietà x y e f (x) = f (y) sono

equivalenti.
Dimostrazione. Sia f : A B una funzione come nellipotesi e definiamo la funzione
f : A/R B ponendo
f [x] := f (x) (1.14.2)
per ogni classe di equivalenza [x] A/R. E ` consistente questa definizione o, come si
usa dire, si tratta di una buona definizione? Cogliamo qui loccasione per chiarire un
problema che si porrà ogni volta che dovremo definire una funzione che ha per dominio un
insieme quoziente. Questo problema sorge dal fatto che nel primo membro della (1.14.2)
figura la classe di equivalenza [x], mentre il secondo membro dipende dal rappresentante x
della classe [x]. Se noi prendiamo un altro rappresentante y [x], ossia un elemento y A
tale che y x, il primo membro della (1.14.2) non cambia, dal momento che [y] = [x],
mentre il secondo membro diviene f (y). Siccome da y x non segue necessariamente che
y = x (vedi gli esempi che abbiamo dato), senza alcuna ipotesi sulla funzione f potrebbe
accadere che f (y) 6= f (x) e dalla (1.14.2) risulterebbe
f (y) = f [y] = f [x] = f (x),
quindi una contraddizione. La (1.14.2) sarebbe cos` inconsistente, dal momento che il
secondo membro è mutato pur restando invariato il primo. Fortunatamente, nel caso pre-
sente, il fatto che da y x segua f (y) = f (x) costituisce lipotesi del nostro teorema, per
cui la contraddizione di cui sopra non sorge e la (1.14.2) è dunque una buona definizione:
essa è atta a definire la funzione f e diremo anche che f è ben definita.
A questo punto è immediato verificare che il diagramma (1.14.1) è commutativo. Sia
g : A/R B unaltra funzione tale che f = g . Allora risulta g = f = f , ossia
3
Intendiamo dire che f = f .
g([x]) = f ([x]) per ogni x A. Dunque g = f , ciò che prova lunicità della funzione f
con la proprietà voluta.
La (1) segue dal fatto che f = f , tenuto conto dellEsercizio 1.11.3 e del fatto che
è suriettiva.
Proviamo la (2). Supponiamo che,dati x, y A, le proprietà s y e f (x) = f (y)
siano equivalenti e proviamo che, conseguentemente, f è iniettiva. Dati [x], [y] A/R,
se è f [x] = f [y], dalla (1.14.2) segue f (x) = f (y), cioè x y. In base alla Proposizione
1.14.7 questultimo fatto equivale adire che [x] = [y], per cui f è iniettiva. Viceversa,
assumiamo f iniettiva e, dati x, y A, supponiamo che sia f (x) = f (y). Allora dalla
(1.14.2) segue f ([x]) = f ([y]) e quindi [x] = [y], ossia x y. Siccome per lipotesi del
Teorema x y implica f (x) = f (y), concludiamo che le proprietà x y e f (x) = f (y)
sono equivalenti.
Infine la (3) segue dalle (1) e (2).
1.15 Un caso particolare di importanza fondamen-

tale: le congruenze fra gli interi.
In Z vi è una classe di relazioni di equivalenza che rivestono una particolare importanza
nello studio delle strutture algebriche e, in campo applicativo informatico, nelle tecniche
di codificazione per la trasmissione di dati. Si tratta delle congruenze, che ora andiamo a
definire.
Definizione 1.15.1. Fissiamo un numero naturale n. Se x, y Z, diciamo che x `

e
congruo ad y modulo n e scriviamo
x y mod. n, oppure x n y,
quando x y è divisibile per n, ossia x y = hn per qualche h Z. La proprietà x n y

si chiama congruenza modulo n.
Come primi esempi esaminiamo i casi n = 0, n = 1 e n = 2. Se n = 0, vediamo subito

che x 0 y esattamente quando x = y; dunque la congruenza modulo 0 è luguaglianza.
Per n = 1 è vero che x 1 y qualunque siano x e y, per cui il grafico della congruenza
modulo 1 è lintero prodotto cartesiano Z Z. Per n = 2 vediamo che x 2 y esattamente
quando x y è pari, ossia quando x, y sono ambedue pari o ambedue dispari.
Proposizione 1.15.2. Per ogni numero naturale n la congruenza modulo n è una re-
lazione di equivalenza in Z
Dimostrazione. Per ogni x Z risulta x x = 0 = 0n, ossia x n x, per cui n è

riflessiva. Dati x, y Z, supponiamo che x n y, ossia x y = hn per qualche h Z.
Allora y x = (h)n, per cui y n x. Dunque n è simmetrica. Infine, siano x, y, z Z
e supponiamo che x n y e y n z, cioè x y = hn ed y z = kn per certi h, k Z.
Allora x z = x y + y z = hn + kn = (h + k)n, per cui z n z, con il che è provata
la transitività di n .
Osserviamo preliminarmente che, dato un numero naturale n e un intero x, risulta

x n 0 esattamente quando x è un multiplo di n. Da questo fatto possiamo dedurre
facilmente che se m, n sono numeri naturali distinti, allora sono distinte le due congruenze
m e n . Infatti, dato che m m 0 e n n 0 in base a quanto appena osservato, se m e
n coincidessero, allora avremmo anche m n 0 e n m 0, di conseguenza n | m e m | n,
quindi m = n (si ricordi che prendiamo m, n N).
Esercizi 1.15.3. Negli esercizi che seguono n è un numero naturale prefissato.

a) Dati x, y, x0 , y 0 Z, si provi che
se x n x0 e y n y 0 , allora x + y n x0 + y 0 e xy n x0 y 0 .
b) Provare che se r, s sono numeri naturali tali che 0 6 r < s 6 n 1, allora r e s non
sono congrui modulo n.
c) Provare che per ogni intero x vi è un unico numero naturale r tale che 0 6 r 6 n 1
e x n r (Sugg.: considerare la divisione di x per n. . . ).
d) Provare che due interi x, y sono congrui modulo n se e solo se hanno lo stesso resto
nella divisione per n.
Passiamo a studiare le classi di equivalenza relative alla congruenza modulo n, che si

chiamano direttamente classi di congruenza modulo n, o anche gli interi modulo
n, nonche linsieme quoziente Z/ n , per il quale viene usato il simbolo Zn . Se x Z,
dalla definizione discende che gli interi congrui ad x mod. n sono precisamente quelli che
si ottengono da x sommando un multiplo di n:
[x] = x + nZ = {x + hn | h Z}.
DallEsercizio 1.15.3, c) deduciamo che vi e un intero r tale che 0 6 r 6 n 1 e [x] = [r].

Ne segue che possiamo scrivere
Zn = {0 + nZ = nZ, 1 + nZ, 2 + nZ, . . . , (n 1) + nZ}.
Sono esattamente n gli elementi indicati? La risposta viene dallEsercizio 1.15.3, b), dal
quale risulta appunto che, se r, s sono numeri naturali tali che 0 6 r < s 6 n 1, allora
[r] 6= [s]. Dunque |Zn | = n e linsieme
{0, 1, 2, . . . , n 1}
è un insieme di rappresentanti per gli elementi di Zn .
1.16 Relazioni dordine. Insiemi ordinati.

Oltre alle relazioni di equivalenza, un altro tipo di relazioni binarie che ricorrono con
estrema frequenza sono le relazioni dordine.
Definizione 1.16.1. Si dice che una relazione binaria R = R(x, y) in un insieme A è

antisimmetrica se, dati x, y A, dallessere vere R(x, y) e R(y, x) segue che x = y.
La relazione R è una relazione dordine o, semplicemente, unordinamento in A se è
riflessiva, antisimmetrica e transitiva. Si chiama insieme ordinato una coppia ordinata
(A, R) dove A è un insieme e R è un ordinamento in A; linsieme A viene allora detto
linsieme sostegno dellinsieme ordinato (A, R).
Se la relazione R è data come sottoinsieme di A A, il fatto che R sia antisimmetrica
significa che, dati x, y A, dallessere (x, y) R e (y, x) R segue che x = y. Alcuni
autori usano i termini relazione dordine parziale e insieme parzialmente ordinato
in luogo di relazione dordine e insieme ordinato, rispettivamente.
` essenziale rendersi conto che, a dispetto di ciò che il lessico corrente sembra suggerire,
E
una relazione anti simmetrica non è una relazione che non è simmetrica! Per esempio, se
R è la relazione di uguaglianza in un insieme A (cioè (x, y) R se e solo se x = y), allora
R è sia una relazione di equivalenza che un ordinamento; in particolare R è simmetrica e
antisimmetrica. Un insieme ordinato (A, R) si indica spesso solamente con A, quando dal
contesto si capisce chiaramente qualè lordinamento R che si vuole considerare; inoltre,
se x, y A e (x, y) R, si scrive x 6 y, oppure y > x, e si dice che x precede y, oppure
che y segue x nellordinamento R, ovvero che x ` e minore o uguale a y, o che y ` e
maggiore o uguale a x. Se (x, y) R e x 6= y, si scrive allora x < y, oppure y > x,
dicendo che x precede strettamente y, oppure che y segue strettamente x, ovvero
che x è strettamente minore di y, o che y ` e strettamente maggiore di x. In ogni
caso si dice che x e y sono comparabili se vale almeno una delle condizioni x 6 y e
x > y. Molto spesso lo stesso simbolo 6 da solo viene usato al posto di una lettera per
indicare un ordinamento in un insieme A dicendo, ad esempio: sia 6 un ordinamento in
A, oppure sia (A, 6) un insieme ordinato.
Definizione 1.16.2. Un ordinamento 6 in un insieme A si chiama un ordinamento
totale, e il corrispondente insieme ordinato (A, 6) si dice insieme totalmente ordi-
nato o catena, se per ogni x, y A risulta x 6 y oppure x > y, cioè se due elementi di
A sono sempre comparabili.
Esempio 1.16.3. Se A è un qualunque insieme, la relazione di inclusione X Y definisce
un ordinamento nellinsieme delle parti P(A). Se A possiede pi` u di un elemento, allora
non è un ordinamento totale (lo si controlli!).
Esempio 1.16.4. Lordinamento naturale 6 fra i numeri naturali (Sezione 1.4) è un
ordinamento totale per N.
Esempio 1.16.5. La relazione di divisibilit` a x divide y, che si abbrevia con x | y,
è anchessa un ordinamento in N. Infatti, abbiamo che x | y se e solo se y = xh per un
h N. E ` chiaro che x | x per ogni x N, quindi la divisibilità in N è riflessiva. Se x | y e
y | x, cioè y = xh e x = yk per certi h, k N, allora x = xhk. Se x 6= 0, allora hk = 1 e
quindi h = 1 = k, per cui x = y. Se invece x = 0, è chiaro che deve anche essere y = 0.
Dunque la divisibilità in N è antisimmetrica. Infine essa è transitiva, perche se x | y e
y | z, cioè y = xh e z = yk per certi h, k N, allora z = xhk e quindi x | z. La divisibilità
è un ordinamento diverso dallordinamento naturale (per esempio 2 < 3, ma 2 - 3) e non
è un ordinamento totale (per esempio 2 - 3 e 3 - 2).
Esempio 1.16.6. Se R è un ordinamento in un insieme A, allora anche Rop lo è (lo si

provi!). Rop si chiama lordinamento opposto di R; esso è un ordinamento totale se e
solo se lo è R.
Esempio 1.16.7. Se R è un ordinamento in un insieme A e B è un sottoinsieme di A,
allora possiamo considerare la relazione binaria S = R (B B). Una rapida verifica
mostra che S è un ordinamento in B che si chiama lordinamento indotto da R in
B. Se S è un ordinamento totale in B, allora si dice che B è una catena dellinsieme
ordinato (A, R).
Esercizio 1.16.8. Comè noto, relazione di divisibilità è definita in tutto Z; stabilire se
si tratta di un ordinamento in Z, o no.
Esercizio 1.16.9. Si consideri la seguente relazione binaria a in in Z:
dati x, y Z, x a y se e solo se y = x + r per qualche r Z.
a) Stabilire se a è un ordinamento in Z, o no.

b) Determinare il grafico in Z Z di a.
Definizione 1.16.10. Un elemento a di un insieme ordinato A si dice:
(1) minimale se, per ogni x A, da x 6 a segue x = a;
(2) massimale se, per ogni x A, da x > a segue x = a;
(3) minimo se risulta a 6 x per ogni x A;
(4) massimo se risulta x 6 a per ogni x A.
Se a, a0 sono due minimi di A, allora a = a0 , dovendo essere al tempo stesso a 6 a0 e
a0 6 a. Analogamente si vede che due massimi di A coincidono. Inoltre il minimo (risp.
massimo) di A, se esiste, è lunico elemento minimale (risp. massimale) di A; tuttavia,
come si può vedere con gli esempi che seguono, A potrebbe avere uno o pi` u elementi
`
minimali (risp. massimali) senza avere minimo (risp. massimo). E infine evidente che a è
minimale (risp. massimale, minimo, massimo) se e solo se a è massimale (risp. minimale,
massimo, minimo) nellinsieme A dotato dellordinamento opposto di quello dato. Se A
è totalmente ordinato, un elemento minimale (risp. massimale) di A è necessariamente il
minimo (risp: massimo).
Esempio 1.16.11. Sia E un insieme e prendiamo A = P(E), ordinato per inclusione.
Allora e E sono rispettivamente il minimo e il massimo di A.
Esempio 1.16.12. Sia E un insieme con almeno due elementi e prendiamo A = P(E)
{, E}, ordinato per inclusione. Allora A non possiede ne minimo ne massimo. Ogni parte
di E costituita da un singolo elemento è un elemento minimale di A, mentre ogni parte
ottenuta da E privandolo di un singolo elemento è un elemento massimale di A.
Esempio 1.16.13. Linsieme R dei numeri reali, con lordine usuale 6, non ha ne
elementi minimali ne elementi massimali, mentre N con lo stesso ordinamento ha per
minimo 0 e non ha elementi massimali.
Esempio 1.16.14. Consideriamo linsieme N ordinato con la divisibilità (vedi lEsempio

1.16.5). Questa volta 0 e 1 risultano essere rispettivamente il massimo e il minimo. Se
invece prendiamo A = N {0, 1} ordinato anchesso con la divisibilità, allora gli elementi
minimali di A sono i numeri primi (ricordiamo che un intero p > 1 si dice primo se i suoi
unici divisori in N sono 1 e p); inoltre A non ha ne minimo ne elementi massimali.
Un ordinamento in un insieme finito può essere assegnato specificando quello che si

chiama il suo diagramma di Hasse. In generale, un diagramma di Hasse per un insieme
A consiste nel disporre gli elementi di A su delle linee orizzontali; ciascun elemento x può
essere unito, o no, con un trattino ad uno o più elementi che si trovano su righe superiori
a quella nella quale si trova x. A tale diagramma viene associato un ordinamento in A,
specificando che se x, y A, allora x < y esattamente quando x si trova in una riga
inferiore a quella in cui si trova y e x, y sono uniti da uno o pi` u trattini contigui. Per
esempio, considerati gli insiemi
A = {a, b, c}, B = {1, 2, 3, 4}, C = {r, s, t, u, v, w, x, y},
i seguenti sono alcuni diagrammi di Hasse per essi:
c 4 3 4 s w
b
J J

J

J
J J

J
b
J 2 1 2 r t x
a c J
J
J
J
a 3 1 u y v
I primi due diagrammi specificano due distinti ordinamenti per A, il terzo e il quarto
danno anchessi due distinti ordinamenti per B e il quinto illustra un ordinamento in C.
Precisamente, il primo specifica che a < b, b < c e a < c; inoltre a è il minimo e c è il
massimo. Il secondo specifica che a < b, c < b e i due elementi a, c non sono comparabili;
b è il massimo, non vi è minimo, mentre a, c sono minimali. Il terzo specifica che 3 < 2,
3 < 1, 2 < 4, 1 < 4, 3 < 4, mentre 1 e 2 non sono comparabili; 3 è il minimo e 4 è il
massimo. Il quarto specifica che 1 < 2, 2 < 3, 2 < 4, mentre 3 e 4 non sono comparabili;
qui 1 è il minimo, non ce massimo e 3, 4 sono massimali. Infine il quinto specifica che
u < r, u < t, r < s, t < s, t < w, u < s, u < w, v < x, mentre ciascuno deli elementi
v, x non è comparabile con alcuno degli elementi r, s, t, u, w e y non è comparabile con
alcuno degli altri elementi di C (si dice in tal caso che y è un elemento isolato per
quellordinamento). In questo quinto esempio sono assenti massimo e minimo, u, v sono
minimali, s, w, x sono massimali e y è al tempo stesso minimale e massimale.
1.17 Funzioni crescenti e funzioni decrescenti.

Il lettore già dovrebbe avere il concetto di funzione reale crescente o decrescente. Questo
concetto si generalizza in modo naturale alle funzioni fra insiemi ordinati.
Definizione 1.17.1. Dati due insiemi ordinati A, B (indichiamo con lo stesso simbolo
600 sia lordinamento di A che quello di B), una funzione f : A B si dice:
(1) crescente (risp. decrescente) se, per ogni x, y A, da x 6 y segue f (x) 6 f (y)
(risp. f (x) > f (y));
(2) strettamente crescente (risp. strettamente decrescente) se, per ogni x, y

A, da x < y segue f (x) < f (y) (risp. f (x) > f (y));
(3) isomorfismo di insiemi ordinati, oppure (risp. isomorfismo dordine) se f

è crescente, biiettiva ed anche la sua inversa f 1 è crescente e quindi è anchessa un
isomorfismo dordine.
(4) anti-isomorfismo di insiemi ordinati se f è decrescente, biiettiva ed anche la

sua inversa f 1 è decrescente.
I due insiemi ordinati A, B si dicono isomorfi quando vi è almeno un isomorfismo dordine

da A verso B, quindi anche uno da B verso A.
` evidente che f : A B è crescente (risp. decrescente, strettamente crescente,
E
strettamente decrescente) se e solo se f è decrescente (risp. crescente, strettamente
decrescente, strettamente crescente) quando si considera in A (oppure in B, ma mai
contemporaneamente in A e in B) lordinamento opposto di quello dato.
Come abbiamo sopra accennato, il lettore può attingere dallo studio elementare delle
funzioni reali di una variabile reale innumerevoli esempi di funzioni crescenti o decrescenti.
Diamo qui di seguito alcuni esempi di altra natura ma non per questo meno importanti.
Esempio 1.17.2. Dato un insieme E, ordiniamo P(E) per inclusione. Allora la funzione
{E : P(E) P(E) che ad ogni sottoinsieme X E assegna il suo complementare {E X è
decrescente, avendosi infatti {E X {E Y ogni volta che X y. Siccome {E {E X = X
per ogni X E, la funzione {E è inversa di se stessa, per cui è un anti-isomorfismo.
Se una funzione f : A B fra insiemi ordinati è iniettiva e crescente (risp. decres-

cente), allora essa è strettamente crescente (risp. strettamente decrescente), come si prova
immediatamente. Tuttavia non vale il viceversa, cioè, senza qualche ipotesi aggiuntiva,
una funzione strettamente crescente o strettamente decrescente non è necessariamente
iniettiva, come mostrato dallesempio e dallesercizio che seguono.
Esempio 1.17.3. Consideriamo gli insiemi A = {a, b, c}, B = {1, 2} ordinati secondo i
seguenti diagrammi di Hasse:
b 2

J

J
a c 1
Allora la funzione f : A B definita da f (a) = f (c) = 1 e f (b) = 2 è strettamente

crescente ma non è iniettiva.
Esercizio 1.17.4. Siano A, B due insiemi ordinati e sia f : A B una funzione

strettamente crescente. Provare che se A è totalmente ordinato, allora f è iniettiva.
Una funzione f : A B fra insiemi ordinati può essere biiettiva e crescente senza
per questo essere un isomorfismo, cioè la sua inversa f 1 : B A potrebbe non essere
crescente.
Esempio 1.17.5. Sia (B, 6) un qualunque insieme ordinato nel quale lordine 6 non sia
luguaglianza (cioè B possiede due elementi a, b tali che a < b) e consideriamo linsieme
ordinato A = (B, =), cioè linsieme ordinato il cui insieme sostegno è B e lordinamento
è luguaglianza. Allora la funzione f : A B definita da f (x) = x per ogni x A (in
sostanza f = 1B ) è ovviamente biiettiva ed è crescente, perche se x 6 y in A, allora x = y,
per cui f (x) = f (y) e quindi è vero che f (x) 6 f (y) in B. Linversa f 1 : B A è sempre
lidentità sullinsieme B, ma non è crescente. Infatti, presi x, y B tali che x < y, se
fosse f 1 (x) 6 f 1 (y) in A, allora avremmo f 1 (x) = f 1 (y), ossia x = y.
Esempio 1.17.6. Consideriamo gli insiemi ordinati A = (N, |) e B = (N, 6). Dunque
A, B hanno lo stesso sostegno N, ma in A consideriamo lordinamento dato dalla divisi-
bilità e in B lordinamento naturale. Se f : A B è lidentità su N, allora f è biiettiva
e crescente, ma non è un isomorfismo.
La proposizione che segue fornisce un criterio per decidere se una funzione fra insiemi
ordinati è un isomorfismo dordine.
Proposizione 1.17.7. Siano A, B insiemi ordinati e sia data una funzione f : A B.

Allora f è un isomorfismo dordine se e solo se verifica le due seguenti condizioni:
(1) f è biiettiva;
(2) dati x, y A, le proprietà x 6 y e f (x) 6 f (y) sono equivalenti.
Dimostrazione. Se f è un isomorfismo dordine, dalla definizione risulta che f è biiet-

tiva; inoltre, dati x, y A, se x 6 y, allora f (x) 6 f (y) perche f è crescente. Daltra
parte, se f (x) 6 f (y), tenuto conto che f 1 è crescente risulta
x = 1A (x) = (f 1 f )(x) = f 1 (f (x)) 6 f 1 (f (y)) = (f 1 f )(y) = 1A (y) = y,
quindi x 6 y.
Viceversa, supponiamo che le condizioni (1) e (2) siano verificate. Siccome dalla (2)
segue che f è crescente, dobbiamo solo provare che f 1 è crescente. Dati u, v B
con u 6 v e posto x = f 1 (u) e y = f 1 (v), abbiamo che u = f (f 1 (u)) = f (x) e
v = f (f 1 (v)) = f (y) . Siccome u 6 v, allora f (x) 6 f (y) e dalla condizione (2) segue
x 6 y, cioè f 1 (u) 6 f 1 (v), come volevamo.
Esercizio 1.17.8. Siano A, B insiemi ordinati e sia f : A B un isomorfismo dordine.

Provare che un elemento a A è, minimale, massimale, minimo, massimo, isolato se e solo
se f (x) ha la corrispondente proprietà in B. Provare inoltre che A è totalmente ordinato
se e solo se lo è B.
1.18 Estremo inferiore ed estremo superiore.

Reticoli.
Proseguiamo con lo studio di altre proprietà interessanti che alcuni elementi di un insieme
ordinato possono avere, fissando la terminologia che ci sarà utile nel seguito.
Definizione 1.18.1. Sia A un insieme ordinato e sia X un sottoinsieme di A. Si dice che

un elemento a A è:
(1) un minorante di X se per ogni x X risulta a 6 x;
(2) un maggiorante di X se per ogni x X risulta x 6 a;
(3) l estremo inferiore di X se a è il massimo dei minoranti di X, cioè se a 6 x per

ogni x X e vale la seguente proprietà: se un elemento b A è tale che b 6 x per
ogni x X, allora b 6 a; si scrive in tal caso
a = inf (X);
A
(4) l estremo superiore di X se a è il minimo dei maggioranti di X, cioè se x 6 a

per ogni x X e vale la seguente proprietà: se un elemento b A è tale che x 6 b
per ogni x X, allora b 6 a; si scrive in tal caso
a = sup(X).
A
Si dice che X è limitato inferiormente (risp. limitato superiormente) se in A vi

è almeno un minorante (risp. un maggiorante) per X. Si dice che X è limitato se lo è
inferiormente e superiormente.
Nota 1.18.2. Con le notazioni della Definizione 1.18.1, supponiamo che B sia un sot-
toinsieme proprio di A tale che X B, inteso come insieme ordinato con lordine indotto
da quello di A. In questo caso dobbiamo considerare sia inf A (X) che inf B (X). Infatti,
il primo è il massimo dellinsieme A0 dei minoranti di X appartenenti ad A, mentre il
secondo è il massimo dellinsieme B 0 dei minoranti di X appartenenti a B. Dato che
abbiamo preso B 6= A, i due insiemi A0 e B 0 potrebbero essere distinti e può verificarsi
ciascuna delle seguenti cinque eventualità: non esistono inf A (X) e inf B (X), oppure uno
dei due esiste e laltro no (due possibilità), oppure esistono tutti e due ma sono distinti
oppure, infine, esistono tutti e due e coincidono. Si noti che se esistono tutti e due, allora
inf B (X) 6 inf A (X) (perche?). Analogo discorso vale per gli estremi superiori di X in A
e B, per i quali si usano i simboli supA (X) e supB (X) rispettivamente.
Esercizio 1.18.3. Aiutandosi con adeguati diagrammi di Hasse, mostrare che tutte
le circostanze considerate nella Nota 1.18.2 possono effettivamente presentarsi (bastano
pochissimi elementi...).
Se x1 , . . . , xn sono degli elementi di A, si usa scrivere inf A (x1 , . . . , xn ) in luogo di

` chiaro che un elemento a
inf A ({x1 , . . . , xn }); analogamente per lestremo superiore. E
è un minorante (risp. un maggiorante, estremo inferiore, estremo superiore) di X se e
solo se a è un maggiorante (risp. un minorante, estremo superiore, estremo inferiore)
di X quando in A si considera lordinamento opposto di quello dato. Si noti che che
inf A (X) X se e solo se X ha minimo (rispetto allordinamento indotto da quello di
A, si intende), il quale è allora inf A (X); analogamente supA (X) X se e solo se X ha
massimo, il quale è allora supA (X). Tuttavia può accadere che inf A (X) (oppure supA (X))
esista ma sia fuori di X.
Esempio 1.18.4. Nellinsieme R con lordinamento usuale il sottoinsieme Q non ha
maggioranti e non ha minoranti. Il sottoinsieme Q+ dei numeri razionali positivi ha per
minoranti 0 e tutti i numeri negativi. Chiaramente 0 = inf R (Q+ ) 6 Q+ .
Esempio 1.18.5. Sia E un T S = P(E) ordinato per inclusione.
insieme qualunque e sia A
Se X A, allora inf A (X) = X, mentre supA (X) = X.
Esercizio 1.18.6. Se A è un insieme ordinato, inf A () e supA () sono rispettivamente il
massimo e il minimo di A, mentre inf A (A) e supA (A) sono rispettivamente il minimo e il
massimo di A.
Definizione 1.18.7. Un insieme ordinato A si dice:
(1) filtrante inferiormente se per ogni x, y A esiste almeno un z A tale che
z 6 x e z 6 y;
(2) filtrante superiormente se per ogni x, y A esiste almeno un z A tale che
x 6 z e y 6 z;
(3) reticolo se per ogni x, y A esistono inf A (x, y) e supA (x, y);
(4) reticolo completo se per ogni sottoinsieme X A esistono inf A (X) e supA (X).
A volte invece di filtrante inferiormente e filtrante superiormente si dice filtrante
a sinistra e filtrante a destra. Chiaramente A è filtrante inferiormente, filtrante superi-
ormente, un reticolo se e solo se A, con lordinamento opposto, è filtrante superiormente,
filtrante inferiormente, un reticolo rispettivamente. Dalla definizione segue che un reticolo
completo A è dotato di minimo e di massimo, visto che questi sono rispettivamente inf(A)
e sup(A). Tuttavia un reticolo con massimo e minimo non è necessariamente completo
(vedi lesercizio che segue).
Esercizio 1.18.8. Provare che (N, |) (vedi lEsercizio 1.16.5) è un reticolo non completo,
pur avendo massimo e minimo.
Dato un insieme ordinato A, per ogni x, y A, risulta
x6y inf(x, y) = x sup(x, y) = y,
di conseguenza, se A è totalmente ordinato, allora A è un reticolo. Se A è un reticolo,
allora A è filtrante inferiormente e superiormente; per contro vi sono insiemi ordinati
filtranti inferiormente e superiormente che non sono reticoli (Esercizio 1.18.14).
Esercizio 1.18.9. Sia A un insieme ordinato filtrante inferiormente. Provare che se

x1 , x2 , . . . , xn A, allora esiste un elemento y A tale che y 6 xi per ogni i n (Sugg.:
Una semplice induzione su n...). Provare che se A è anche finito, allora in A vi è il minimo.
Esercizio 1.18.10. Sia A un reticolo. Provare che se x1 , x2 , . . . , xn A, allora in A

esistono inf A (x1 , . . . , xn ) e supA (x1 , . . . , xn ) (Sugg.: Una semplice induzione su n...).
Esercizio 1.18.11. Provare che un reticolo finito è necessariamente completo.
Esercizio 1.18.12. Se E è un insieme, allora linsieme A = P(E) ordinato per inclusione

è un reticolo completo (vedi lEsempio 1.18.5). Provare che se B è il sottoinsieme diA delle
parti finite di E, allora B, ordinato ancora per inclusione, è un reticolo che è completo se
e solo se E stesso è finito.
Esempio 1.18.13. Consideriamo i due insiemi A = {a, b, c}, B = {1, 2, 3, 4} ordinati

secondo i seguenti diagrammi di Hasse:
2 4
b @

J @

J @
a c @
1 3
Allora A è filtrante superiormente ma non inferiormente, mentre B non è filtrante ne

superiormente ne inferiormente.
Esercizio 1.18.14. Provare che ogni insieme ordinato filtrante superiormente e inferior-
mente che ha non pi` u di 5 elementi è un reticolo. Dare un esempio di insieme ordinato
filtrante superiormente e inferiormente, con 6 elementi, che non è un reticolo.
Definizione 1.18.15. Dato un reticolo A, si dice che un sottoinsieme B A è un

sottoreticolo di A se per ogni x, y B risulta
inf (x, y) = inf (x, y) e sup(x, y) = sup(x, y)

B A B A
Esempio 1.18.16. Con riferimento allEsercizio 1.18.12, B è un sottoreticolo di A,

perche lintersezione e lunione di due sottoinsiemi finiti di E sono anchessi finiti.
Dovrebbe essere chiaro dalla definizione che se B è un sottoreticolo di un reticolo A,

allora B, con lordine indotto, è a sua volta un reticolo. Tuttavia non vale il viceversa;
con lesercizio che segue si vede che è possibile che un sottoinsieme B di un reticolo A sia
un reticolo con lordine indotto, senza però essere un sottoreticolo di A.
Esercizio 1.18.17. Si considerino gli insiemi A = {1, 2, 6, 10, 30}, B = {1, 6, 10, 30}
e C = {2, 6, 10, 30} ordinati secondo la divisibilità. Mostrare che essi sono tutti e tre
reticoli; tuttavia B non è un sottoreticolo di A, mentre C lo è.
Capitolo 2
LE STRUTTURE ALGEBRICHE
2.1 Prime nozioni

Le ordinarie operazioni di addizione e moltiplicazione in N sono, in realtà, delle particolari
funzioni da N N verso N; infatti si tratta delle funzioni (x, y) 7 x + y e (x, y) 7 xy
rispettivamente. In generale, dato un insieme G, ogni funzione da G G verso G si
chiama unoperazione binaria in G. Per indicare unoperazione binaria, in luogo di una
lettera si preferisce usare uno dei tanti simboli grafici disponibili, creati a bella posta,
come +, , , , , , , , , , , , ecc.. Se : G G G è unoperazione binaria in
G, per ogni (x, y) G G lelemento (x, y) di G si chiama il risultato delloperazione
su x e y e viene quasi sempre indicato con x y anziche (x, y) (esattamente come si
preferisce scrivere x + y, anziche +(x, y), per indicare la somma di due numeri x, y).
Per struttura algebrica si intende una coppia (G, ) o una terna (G, , ) dove G è
un insieme e , sono operazioni binarie in G. Naturalmente si possono considerare
strutture algebriche con tre o pi` u operazioni. In questa sezione introduciamo alcune
nozioni elementari sulle strutture algebriche con una operazione, al solo scopo di avere
una terminologia da utilizzare nei paragrafi successivi, nei quali studieremo le strutture
legate agli insiemi numerici. Nei capitoli successivi analizzeremo pi` u in profondità la
struttura di alcune delle pi` u importanti strutture algebriche.
Definizione 2.1.1. Si chiama gruppoide una coppia ordinata (G, ), dove G è un in-
sieme assegnato e : G G G è unoperazione binaria in G. Linsieme G si chiama
linsieme sostegno del gruppoide (G, ).
Con questa definizione, fissato un insieme G, si possono considerare tanti gruppoidi,
aventi G come insieme sostegno, quante sono le funzioni da G G verso G. Se G possiede
un solo elemento, è chiaro che anche G G ha un solo elemento, per cui vi è ununica
funzione da G G verso G, la quale corrisponde allunica e ovvia operazione binaria in G.
Se G possiede due elementi, il lettore può controllare che vi sono 16 funzioni da GG verso
G, quindi vi sono 16 gruppoidi aventi G come insieme sostegno. E ` importante rendersi
conto che, alla luce di queste elementari considerazioni, non è corretto affermare che un
gruppoide è un insieme nel quale esiste unoperazione binaria, perche, appunto, in ogni
insieme di queste operazioni ve ne è sempre almeno una; occorre pertanto dichiararne
una specifica. Quanto allinsieme N dei numeri naturali, esso è infinito e quindi infinite
56
CAPITOLO 2. LE STRUTTURE ALGEBRICHE 57
sono le funzioni da N N verso N, per cui sono infiniti i gruppoidi aventi N come insieme
sostegno. In realtà pochi fra questi sono realmente interessanti e di qualche utilità, come
certamente lo sono il gruppoide additivo (N, +) e il gruppoide moltiplicativo (N, ).
Vediamo allora di individuare alcune proprietà che, se possedute da unoperazione in un
generico insieme, rendono questa interessante e di qualche utilità.
Definizione 2.1.2. Sia (G, ) un gruppoide. Loperazione si dice:
(1) associativa se
per ogni x, y, z G, (x y) z = x (y z). (2.1.1)
(2) commutativa se
per ogni x, y G, x y = x y.
Un elemento u G si chiama un elemento neutro per il gruppoide (G, ), o

elemento neutro per loperazione , se risulta
x u = x = u u per ogni x G.
Un gruppoide commutativo o abeliano è un gruppoide la cui operazione è commuta-

tiva. Si dice che un gruppoide (G, ) è un monoide se loperazione è associativa e vi è
un elemento neutro; parleremo poi di monoide commutativo o abeliano nel caso in
cui loperazione è anche commutativa.
Se loperazione è associativa, lelemento indicato dai due membri delluguaglianza

(2.1.1) viene denotato semplicemente con x y z.
Se in un gruppoide (G, ) vi è un elemento neutro u, esso è unico; infatti, se anche
v G è elemento neutro, allora u = u v = v.
Come testimoniato dagli esempi che seguiranno, i monoidi sono le strutture algebriche
pi`
u frequenti. In un gruppoide possono essere presenti elementi che hanno comporta-
menti speciali rispetto alloperazione data. Nella definizione che segue individuiamo i pi`
u
interessanti, restringendoci al caso dei monoidi.
Definizione 2.1.3. Sia (G, ) un monoide, sia u il suo elemento neutro e siano x, y
elementi di G. Si dice che:
(1) y è un elemento simmetrico destro (risp. simmetrico sinistro) di x se
x y = u (risp. y x = u).
(2) y è un elemento simmetrico per x se y è sia un simmetrico destro che un simmetrico

sinistro di x se
(3) x è simmetrizzabile a destra (risp. simmetrizzabile a sinistra, simmetriz-

zabile) se per esso vi è in G almeno un simmetrico destro (risp. un simmetrico
sinistro, un simmetrico).
(4) x è cancellabile (o regolare) a destra (risp. cancellabile (o regolare) a

sinistra) se
dati y, z G, da y x = z x (risp, x y = x z) segue y = z.
(5) x è cancellabile (o regolare) se esso è cancellabile a destra e a sinistra.
(6) x è idempotente se x x = x.
Ovviamente lelemento neutro u idempotente ed è simmetrico di se stesso, dato che

u u = u. Tuttavia vi sono monoidi che hanno elementi idempotenti diversi dallelemento
neutro Se x è simmetrizzabile a destra in (G, ), allora x è anche cancellabile a destra.
Infatti, se x0 G è un simmetrico destro per x e risulta y x = z x per certi y, z G,
allora abbiamo
y = y u = y (x x0 ) = (y x) x0 = (z x) x0 = z (x x0 ) = z u = z,
ossia y = z. Analogamente, se x è simmetrizzabile a sinistra (risp. simmetrizzabile), allora

x è anche cancellabile a sinistra (risp. cancellabile). Non vale tuttavia il viceversa, ossia
un elemento cancellabile a destra, per esempio, non è necessariamente simmetrizzabile a
destra, come mostrato negli esempi che seguiranno. Infine, se x ha in (G, ) un simmetrico
sinistro x0 e un simmetrico destro x00 allora, utilizzando lassociatività delloperazione,
abbiamo:
x0 = x0 u = x0 (x x00 ) = (x0 x) x00 = u x00 = x00 ,
ossia x0 = x00 (lanalogia con la (1.11.3) non è casuale!); in particolare, se x è simmetrizz-
abile, allora esso possiede un unico simmetrico.
Definizione 2.1.4. Sia (G, ) un monoide e sia u il suo elemento neutro. Si dice che:
(1) (G, ) è conico se u è lunico elemento simmetrizzabile di G ossia,
dati x, y G, da x y = u = y x segue x = y = u.
(2) (G, ) è un gruppo se ogni suo elemento è simmetrizzabile.
Fra le varie notazioni che si usano nella letteratura per indicare unoperazione binaria
in un insieme G, la notazione moltiplicativa e la notazione additiva sembrano essere di gran
lunga le più favorite. Tramite esse si indica con xy, o semplicemente xy, (rispettivamente
x + y) il risultato delloperazione in oggetto effettuata su due elementi x e y di G, anche
se gli elementi dellinsieme G non hanno nulla a che vedere con i numeri e loperazione
in questione non ha nulla a che vedere con la moltiplicazione (o laddizione) fra numeri.
Vogliamo sottolineare che la scelta di una notazione per una specifica operazione non è
vincolata dalla natura di questultima, bens` è dettata da semplici motivi di convenienza
e/o di consuetudine. In notazione moltiplicativa (rispett. additiva) lelemento neutro, se
presente, viene indicato con il simbolo 1 (rispett. 0); quasi sempre dal contesto si capisce se
i simboli 1 e 0 sono riferiti a numeri o ad altri oggetti. Inoltre, il simmetrico di un elemento
x in notazione moltiplicativa si indica con x1 e si chiama linverso di x e, se esiste, si dice
che x è invertibile. In notazione additiva il simmetrico di x si indica con x e si chiama

l opposto di x.
Avvertiamo infine che, nella pratica, per indicare un gruppoide (G, ) si usa quasi
sempre il solo simbolo G che indica linsieme sostegno, sempre che dal contesto sia chiaro
qualè loperazione che in esso si vuole considerare.
Con la definizione che segue vogliamo individuare alcuni sottoinsiemi di un gruppoide
che godono di una particolare rilevanza.
Definizione 2.1.5. Sia G un gruppoide e sia H un sottoinsieme di G. Si dice H è un
sottogruppoide, oppure che è una parte stabile di G se
1) per ogni x, y H risulta x y H.
Se G è un gruppo, si dice che H è un sottogruppo di G se H e un sottogruppoide che,
in pi`
u, verifica le seguenti due condizioni:
2) lelemento neutro di G si trova in H,
3) se x H e x0 è lelemento simmetrico di x in G, allora x0 H.
Note 2.1.6. a) Se H è un sottogruppoide di un gruppoide (G, ), allora (H, ) è a sua
volta un gruppoide con la medesima operazione ristretta agli elementi di H. Se H, K
sono due sottogruppoidi di (G, ) e H K allora H è un sottogruppoide di K.
b) Se (G, ) è un gruppo, quanto detto nella precedente nota a) resta valido sostituendo
il termine sottogruppo al termine sottogruppoide (verificarlo!).
c) Linsieme vuoto è automaticamente un sottogruppoide di ogni gruppoide (perche?).
Ma se G è un gruppo, con elemento neutro u, e H è un suo sottogruppo, allora H 6= ,
perche dalla condizione 3) della Definizione 2.1.5 risulta u H. Si noti che {u} e G sono
rispettivamente il pi` u grande sottogruppo di (G, ).
u piccolo e il pi`
2.2 Esempi.
Studiamo ora alcuni fra gli esempi principali e pi`
u elementari di gruppoidi, ad illustrazione
e giustificazione dei concetti appena introdotti.
Esempio 2.2.1. I monoidi (N, +) e (N, ).
Considerato il ruolo centrale che essi giocano, i primi da annoverare sono gruppoidi
(N, +) e (N, ), dove + e sono le ordinarie addizione e moltiplicazione. Da quanto
abbiamo visto nella Sezione 1.4 risulta che essi sono due monoidi abeliani, con elemento
neutro il numero 0 e il numero 1 rispettivamente. In (N, ) il numero 0 è un elemento
idempotente diverso dallelemento neutro 1. In (N, +) ogni elemento è cancellabile, ma
solo 0 è simmetrizzabile. In (N, ) tutti gli elementi diversi da 0 sono cancellabili e, di
nuovo, solo 1 è simmetrizzabile. Dunque (N, +) e (N, ) non sono gruppi e sono ambedue
monoidi conici.
Esempio 2.2.2. Il gruppo (Z, +) e il monoide (Z, ).
Il gruppoide (Z, +) (vedi la Sezione 1.6) è un gruppo abeliano, mentre (Z, ) è un
monoide abeliano che non è un gruppo; infatti, rispetto alla moltiplicazione solo 1 e 1
sono invertibili. Tuttavia, dato che in Z vi è un elemento invertibile diverso da 1, il

monoide (Z, ) non è conico. Infine N è parte stabile sia per (Z, +) che per (Z, ). Si noti
che N non è un sottogruppo di (Z, +).
Esempio 2.2.3. I monoidi (P(A), ) e (P(A), ).

Dato un insieme A, i gruppoidi (P(A), ) e (P(A), ) sono monoidi abeliani (vedi la
Proposizione 1.3.7).
Esempio 2.2.4. Il monoide (AA , ).

Abbiamo visto che la composizione di funzioni è associativa, valendo la (1.11.1) ogni
volta che le composizioni nei due membri sono definite. Di conseguenza, dato un insieme
A, possiamo considerare il monoide (AA , ) che ha come insieme sostegno linsieme di tutte
le funzioni da A verso A e come operazione la composizione di funzioni. In esso lelemento
neutro è evidentemente la funzione identica 1A .
Esempio 2.2.5. Il gruppo simmetrico Sn .

Dato un insieme A, abbiamo definito le permutazioni di A come le biiezioni da A in
A. Cos`, la funzione identica 1A è una permutazione di A, come pure lo è la composizione
di due permutazioni di A (Esercizio 1.11.3); inoltre dalla Proposizione 1.11.6 segue che
ogni permutazione di A è invertibile e la sua inversa è ancora una permutazione di A.
Se indichiamo con S(A) linsieme delle permutazioni di A, possiamo dunque parlare del
gruppo S(A) = (S(A), ) delle permutazioni dellinsieme A. Nel caso in cui A = n =
{1, 2, . . . , n}, il gruppo S(n) si indica con Sn e si chiama il gruppo simmetrico di
grado n. Ricordiamo che |Sn | = n!, come risulta dal Corollario 1.13.7.
Dedicheremo il Capitolo 3 ad uno studio pi`

u approfondito dei gruppi.
Esempio 2.2.6. Il monoide delle parole, o delle stringhe, su un insieme X.

Come abbiamo avuto modo di osservare introducendo il concetto di coppia, terna,
quaterna... ordinata, se X indica linsieme delle lettere dellalfabeto latino, una parola
di quattro lettere non può essere considerata come un sottoinsieme di X che ha quattro
elementi; piuttosto essa è assimilabile ad un elemento del prodotto cartesiano X 4 anche
se, ad esempio, invece di (m, a, r, e) noi usiamo scrivere mare. Fra le parole che possiamo
creare con gli elementi dellinsieme Y = {a, m, e, r}, alcune hanno significato, come per
esempio mare, mara, mera, era, emma, arma, remare, amare, ammarare, mentre
altre forse non ne hanno alcuno, come rrm, eaae, mra, ecc.. Indipendentemente da ciò,
dovrebbe essere chiaro che con gli elementi di Y si possono formare 42 parole di due
` possibile formalizzare e
lettere, 43 parole di tre lettere, 44 parole di tre lettere, ecc.. E
generalizzare il concetto di parola nel modo che segue. Dato un numero naturale m > 0,
si chiama parola di lunghezza (o grado) n su X ogni m-pla (x1 , . . . , xm ) di elementi
di X, cioè ogni elemento del prodotto cartesiano X m . In luogo di parola si usa anche
il termine stringa. Estenderemo la definizione anche al caso in cui m = 0, chiamando
parola vuota, oppure stringa vuota, lunico elemento di X 0 , (cioè ), indicandolo con
il simbolo 1. Denotiamo linsieme di tutti i monomi su X con M(X) e poniamo infine
M() = {1}. In questo nuovo contesto una m-pla (x1 , . . . , xm ) viene indicata piuttosto
con x1 xm , come se si trattasse appunto di una parola. In accordo con la definizione,
risulta [
M(X) = X m.
mN
Date due parole x = x1 xm e y = y1 yn M(X), la parola x1 xm y1 yn si

chiama la giustapposizione di y ad x (nellordine!), o semplicemente il prodotto di x
per y; formalmente
xy = (x1 xm )(y1 yn ) := (x1 xm y1 yn ).
E conveniente estendere tale operazione anche al caso in cui uno dei monomi è vuoto,
ponendo
(x1 xm )1 := (x1 xm ) := 1(x1 xm ).
E ormai ovvio che loperazione introdotta in M(X) è associativa e con essa M(X) acquista
una struttura di monoide.
Definizione 2.2.7. Con le notazioni di cui sopra e con loperazione di giustapposizione,

M(X) si chiama il monoide libero generato da X, oppure il monoide delle parole,
o delle stringhe su X .
E importante rendersi conto che il monoide M(X) non è mai commutativo se X ha

u di un elemento (per esempio mare 6= rame). Se X ha un solo elemento, diciamo
pi`
X = {x}, allora
M(X) = {1, x, xx, xxx, . . .}
e M(X) è evidentemente commutativo.
Esercizio 2.2.8. Dato un insieme X, stabilire in quali casi M(X) è conico e in quali
casi M(X) è un gruppo.
Sia A un reticolo. Dati due elementi x, y A, lestremo inferiore inf(x, y) e lestremo

superiore sup(x, y) si usano indicare anche con i simboli x y e x y rispettivamente. Le
due funzioni (x, y) 7 x y e (x, y) 7 x y definiscono due operazioni binarie in A, cos`
che possiamo considerare i due gruppoidi (A, ) e (A, ).
Esercizio 2.2.9. Sia A un reticolo.

a) Provare che le due operazioni , sopra definite sono associative e commutative.
Provare, inoltre, che ogni elemento è idempotente rispetto a ciascuna di esse.
b) Provare che u è elemento neutro in (A, ) (risp. in (A, )) se e solo se u è il massimo
(risp. il minimo) di A.
In vista dellesercizio precedente e dellEsercizio 1.18.6, se A è un reticolo completo

allora (A, ) e (A, ) sono monoidi abeliani.
Esercizio 2.2.10. Sia A un reticolo completo. Provare che (A, ) e (A, ) sono monoidi
conici. In quale caso sono gruppi?
Esercizio 2.2.11. Esaminare loperazione di differenza (x, y) 7 x y in Z, stabilendo

se essa è associativa, commutativa e se per essa vi è un elemento neutro in Z.
Quando linsieme sostegno G di un gruppoide (G, ) è finito, diciamo |G| = n, si può

illustrare il modo di agire delloperazione tramite una tavola ad n righe e n colonne
(detta anche tavola pitagorica del gruppoide (G, )), ciascuna delle quali è costituita da
elementi di G, secondo il seguente criterio. Ad ogni elemento di G corrisponde una riga
ed una colonna della tabella e, dati x, y G, lelemento che si trova allincrocio della riga
che corrisponde ad x e della colonna che corrisponde ad y è x y.
Esempio 2.2.12. Considerato linsieme 2 = {1, 2}, vi sono esattamente quattro funzioni
da 2 verso 2, precisamente

2 1 2 1 2 1 2 1 2
2 = 12 = ,f = ,g = ,h = .
1 2 1 1 2 2 2 1
Calcolando le 16 composizioni possibili, otteniamo la seguente tavola pitagorica per il

monoide (22 , ):
12 f g h
12 12 f g h
f f f f f
g g g g g
h h g f 12
Le uniche permutazioni di 2 sono 12 e h, ossia S2 = {12 , h}; ecco la relativa tavola:
12 h
12 12 h
h h 12
Dunque (22 , ) è un monoide non abeliano, mentre S2 è un gruppo abeliano.
Esercizio 2.2.13. Dato un insieme A, stabilire se i monoidi (P(A), ) e (P(A), ) sono

conici o no. Stabilire, inoltre, in quali casi essi sono dei gruppi.
Esercizio 2.2.14. Compilare le tavole dei gruppoidi (P(A), ) e (P(A), ), prima nel
caso A = 2 e poi nel caso A = 3.
Esercizio 2.2.15. Dato un intero n > 0, provare che linsieme nZ = {nx | x Z} dei
multipli interi di n è un sottogruppo di (Z, +).
Esercizio 2.2.16. Si consideri in Z loperazione definita da x y = xy. Stabilire se

il gruppoide (Z, ) è abeliano, se è un monoide, se è un gruppo.
Esercizio 2.2.17. Sia (G, ) un gruppo e sia x G. Provare che se x x = x, allora x

coincide con lelemento neutro.
Esercizio 2.2.18. Provare che se H, K sono due sottogruppi di un gruppo (G, ), allora
anche HK è un sottogruppo di (G, ), ma HK può non esserlo (Sugg.: Per questultimo
punto considerare, per esempio, due sottogruppi di (Z, +) del tipo mZ e nZ (Esercizio
2.2.15), scegliendo opportunamente i numeri m, n).
Esercizio 2.2.19. Sia loperazione in N che ad ogni x, y N associa il minimo fra x e

y. Stabilire se è associativa, commutativa, se in (N, ) vi è lelemento neutro e, infine,
se (N, ) è un gruppo (Sugg.: Per lultimo quesito, si usi il precedente Esercizio 2.2.17).
Esercizio 2.2.20. Si consideri in Z loperazione definita come segue:
per ogni x, y Z, x y := x + y xy.
Stabilire se è associativa, commutativa, se in (Z, ) vi è lelemento neutro e, infine, se

(Z, ) è un gruppo. Posto G = Z {1}, si provi che (G, ) è un gruppo.
Esercizio 2.2.21. Sia G un gruppo, la cui operazione è denotata moltiplicativamente.
Provare che per ogni x, y G risulta
(x1 )1 = x, (xy)1 = y 1 x1 . (2.2.1)
Esercizio 2.2.22. Dato un intero positivo n, nel prodotto cartesiano Zn si consideri la

seguente addizione: per ogni (x1 , . . . , xn ), (y1 , . . . , yn ) Zn
(x1 , . . . , xn ) + (y1 , . . . , yn ) := (x1 + y1 , . . . , xn + yn ).
Provare che, con tale operazione, Zn è un gruppo abeliano.
2.3 Prodotti generalizzati e sommatorie.

Supponiamo che G = (G, ) sia un monoide. Se a1 , a2 , a3 sono elementi di G, visto che a
causa dellassociatività delloperazione vale luguaglianza
(a1 a2 ) a3 = a1 (a2 a3 ),
possiamo abbandonare le parentesi e denotare con a1 a2 a3 lelemento indicato dai

due membri. Possiamo fare di pi` u; precisamente, per ogni intero positivo n e per ogni
sequenza finita (a1 , . . . , an ) di elementi di G possiamo definire per ricorrenza lelemento
a1 . . . an di G nel modo seguente:
a1 . . . an := a1 , se n = 1; (2.3.1)
a1 . . . an := (a1 . . . an1 ) an , per ogni n > 1. (2.3.2)
Se invece del simbolo loperazione di G è denotata moltiplicativamente, il primo membro

delle (2.3.1) e (2.3.2) si indica con a1 an o con il simbolo di prodotto generalizzato
n
Y
ai .
i=1
La versione additiva è naturalmente il simbolo a1 + + an , che viene anche sostituito

dal tradizionale simbolo di sommatoria
n
X
ai .
i=1
Nella letteratura si incontrano le seguenti varianti dei simboli di prodotto generalizzato

e di sommatoria; naturalmente esse hanno gli stessi rispettivi significati che abbiamo
specificato di sopra:
Yn Y Xn X
ai , ai , ai , ai .
i i
1 16i6n 1 16i6n
Elenchiamo ora le regole

P basilari che governano
Q luso delle sommatorie. Ovviamente,
sostituendo il simbolo con il simbolo si ottengono altrettante regole che riguardano
i prodotti generalizzati.
Proposizione 2.3.1. Sia G un monoide (denotato additivamente), sia n un intero positivo

e sia (a1 , . . . , an ) una successione finita di elementi di G. Allora, per ogni intero m tale
che 1 6 m < n risulta ! !
Xn Xm Xn
ai = ai + aj . (2.3.3)
i=1 i=1 j=m+1
Dimostrazione. Proviamo dapprima che la (2.3.3) vale per m = 1 e per ogni n > 2,
procedendo per induzione su n. Se n = 2 abbiamo
n
! n
X X
a1 + ai = a1 + a2 = ai ,
i=2 i=1
per cui la (2.3.3) vale per m = 1 e per n = 2. Dato n > 2, supponiamo che la (2.3.3) valga
per m = 1. Allora, data una successione (a1 , . . . , an , an+1 ) di elementi di G abbiamo:
n+1
! " n ! #
X X
a1 + ai = a1 + ai + an+1 per la definizione (2.3.2),
i=2 i=2
" n
!#
X
= a1 + ai + an+1 per lassociatività,
n
!i=2
X
= ai + an+1 per lipotesi induttiva,
i=1
n+1
X
= ai per la definizione (2.3.2).
i=1
A questo punto, dato n > 2, possiamo procedere per induzione finita su m per provare
che la (2.3.3) vale ogni volta che 1 6 m < n. Supponiamo, induttivamente, che essa valga
per un m tale che 1 6 m < n 1. Allora abbiamo:

n m
! n
!
X X X
ai = ai + aj per lipotesi induttiva,
i=1 i=1 j=m+1
m
! " n
!#
X X
= ai + am+1 + aj per quanto provato sopra,
i=1 j=m+2
" m
! # n
!
X X
= ai + am+1 + aj per lassociatività,
i=1 j=m+2
m+1
! n
!
X X
= ai + aj per la definizione (2.3.2).
i=1 j=m+2
Dunque la (2.3.3) vale anche per m + 1 e la dimostrazione è completa.

Se G è un monoide commutativo (denotato additivamente) e consideriamo tre elementi
a, b, c G, possiamo considerare le sei espressioni
a + b + c, a + c + b, b + a + c, b + c + a, c + a + b, c + b + a,
ottenibili operando le possibili permutazioni dellinsieme {a, b, c}. Non abbiamo dubbi sul
fatto che esse rappresentano lo stesso elemento di G; in realtà, utilizzando ripetutamente
la proprietà commutativa e la proprietà associativa è piuttosto facile provare che la prima
espressione coincide con ciascuna delle rimanenti cinque. Ciò si generalizza al caso di una
qualunque successione finita (a1 , . . . , an ) di elementi di G, come specificato dal risultato
seguente.
Proposizione 2.3.2. Sia G un monoide commutativo (denotato additivamente), sia n

un intero positivo e sia (a1 , . . . , an ) una successione finita di elementi di G. Allora per
ogni permutazione Sn risulta
n
X n
X
ai = a(i) . (2.3.4)
i=1 i=1
Dimostrazione. Per n = 1 la (2.3.4) si riduce alla a1 = a1 . Procedendo per induzione su

n, dato n > 0, assumiamo che la (2.3.4) sia vera per ogni successione (a1 , . . . , an ) di elemen-
ti di G e per ogni permutazione Sn . Consideriamo una successione (a1 , . . . , an , an+1 )
di elementi di G, una permutazione Sn+1 e, posto k = (1), consideriamo dapprima
il caso in cui è 1 < k < n + 1. Scriviamo
bi = a(i+1)
per ogni i n e consideriamo la funzione : n n definita da

1
(i) 1, se 1 6 i 6 k 1;
(i) = 1
(i + 1) 1, se k 6 i 6 n.
Il lettore può verificare per esercizio che è iniettiva e quindi è una permutazione (vedi
il Teorema 1.12.1). Inoltre per ogni i n risulta

ai , se 1 6 i 6 k 1;
b (i) = a( (i)+1) =
ai+1 , se k 6 i 6 n.
Di conseguenza abbiamo:
n+1
X n+1
X
a(i) = a(1) + a(i) per la Proposizione 2.3.1 (con m = 1),
i=1 i=2
n
X
= ak + bi
i=1
n
X
= ak + b (i) per lipotesi induttiva,
i=1
k1 n
!
X X
= ak + b (i) + b (i)
i=1 i=k
k1 n+1
!
X X
= ak + ai + ai
i=1 i=k+1
k1
! n+1
X X
= ak + ai + ai
i=1 i=k+1
k1
! n+1
X X
= ai + ak + ai
i=1 i=k+1
k
X n+1
X
= ai + ai
i=1 i=k+1
n+1
X
= ai .
i=1
I casi k = 1 e k = n + 1 sono pi` u semplici da trattare. Se k = 1 (rispett. k = n + 1)

si ponga bi = ai+1 (rispett. bi = ai ) per ogni i n, si consideri la permutazione Sn
definita da
(i) = (i + 1) 1 (rispett. (i) = (i)) per ogni i n,
con il che risulta
b (i) = a(i+1) (rispett. b (i) = a(i) ) per ogni i n.
A questo punto si procede con un computo analogo al caso precedente.
Consideriamo ora un qualunque sottoinsieme finito A non vuoto di un monoide com-

mutativo (denotato additivamente) G. Se n è il numero degli elementi di A, possiamo
numerare questi da 1 ad n, il che equivale a decidere una specifica funzione biiettiva

: n A; è chiaro che
A = {(1), (2), . . . , (n)}.
Vi sono esattamente n! modi distinti di numerare gli elementi di A da 1 ad n, dato che
tutte le funzioni biiettive da n verso A sono della forma , dove Sn (perche?).
Applicando la Proposizione 2.3.2 (dove scriveremo (i) in luogo di ai ) abbiamo che
n
X n
X
(i) = ( (i)),
i=1 i=1
quanto dire che la somma degli elementi di A non dipende dalla numerazione scelta per
essi. Lelemento di G che è il risultato di tale somma viene allora chiamato la somma del
sottoinsieme A e viene indicato con il simbolo
X X
x oppure {x | x A}.
xA
Proposizione 2.3.3. Sia G un monoide commutativo (denotato additivamente), sia n

un intero positivo e siano (a1 , . . . , an ), (b1 , . . . , bn ) due successioni finite di elementi di G.
Allora risulta ! !
Xn X n Xn
(ai + bi ) = ai + bi . (2.3.5)
i=1 i=1 i=1
Dimostrazione. Se n = 1 la (2.3.5) è ovviamente vera, riducendosi alluguaglianza

a1 + b1 = a1 + b1 . Dato n > 1, supponiamo che la (2.3.5) sia vera per ogni coppia
(a1 , . . . , an ), (b1 , . . . , bn ) di successioni di elementi di G e mostriamo che essa è ancora vera
con n + 1 in luogo di n. Considerate due successioni (a1 , . . . , an , an+1 ), (b1 , . . . , bn , bn+1 )
di elementi di G, abbiamo:
n+1
" n #
X X
(ai + bi ) = (ai + bi ) + (an+1 + bn+1 ) per la definizione (2.3.2),
i=1
" i=1n ! n
!#
X X
= ai + bi + (an+1 + bn+1 ) per lipotesi induttiva,
i=1 i=1
n
! n
!
X X
= ai + bi + an+1 + bn+1 per lassociatività,
i=1 i=1
" n
! # " n
! #
X X
= ai + an+1 + bi + bn+1 per lassociatività e
i=1 i=1
la commutatività,
n+1
! n+1
!
X X
= ai + bi per la definizione (2.3.2).
i=1 i=1
Proposizione 2.3.4. Sia G un monoide commutativo (denotato additivamente), siano

m, n due interi positivi e sia (aij )16i6m,16j6n una famiglia di elementi di G. Allora risulta
m n
! n m
!
X X X X
aij = aij . (2.3.6)
i=1 j=1 j=1 i=1
Dimostrazione. La (2.3.6) vale per m = 1 e per ogni n > 0. Infatti risulta

1 n
! n n 1
!
X X X X X
aij = a1j = aij .
i=1 j=1 j=1 j=1 i=1
Supponiamo che la (2.3.6) valga per un dato m > 0 e per ogni n > 0. Allora abbiamo:
m+1 n
! " m n
!# n
!
X X X X X
aij = aij + am+1,j per la definizione (2.3.2),
i=1 j=1 i=1 j=1 j=1
" n m
!# n
!
X X X
= aij + am+1,j per lipotesi induttiva,
j=1 i=1 j=1
n
" m
! #
X X
= aij + am+1,j per la Proposizione 2.3.3,
j=1 i=1
n m+1
!
X X
= aij per la definizione (2.3.2).
j=1 i=1
Dunque la (2.3.6) vale per m + 1 e per ogni n > 0.
In vista dellultima proposizione, nella pratica vengono omesse le parentesi nelle som-
matorie a primo e secondo membro della (2.3.6) sempreche, ribadiamo, il monoide nel
quale si effettua loperazione sia commutativo.
2.4 Potenze in un monoide.

Se a è un elemento di un monoide G = (G, ), naturalmente possiamo considerare gli
elementi a a e a a a, per esempio; se loperazione di G è denotata moltiplicativamente
(risp. additivamente), questi si scriveranno come aa e aaa (risp. a + a e a + a + a)
oppure, comè più comodo, come a2 e a3 (risp. 2a e 3a). Generalizzando, sulla traccia
della Definizione 1.8.2 della potenza di un numero reale, possiamo stabilire la seguente
definizione formale di potenza (risp. di multiplo) di un elemento di un monoide.
Definizione 2.4.1. Sia G un monoide con elemento neutro u, la cui operazione è denotata
moltiplicativamente. Dato un elemento a G e un numero naturale n N, si chiama
ln-esima potenza di a lelemento an di G definito per ricorrenza come segue:
a0 := u,
an+1 := an a per ogni n N.
Dunque
a2 = aa, a3 = a2 a = (aa)a = aaa, . . . .
Se loperazione del monoide G è denotata additivamente, in luogo di an si usa il simbolo
na e si parla allora delln-esimo multiplo di a; esso è dunque lelemento di G definito
per ricorrenza come segue:
0a := u,
(n + 1)a := na + a per ogni n N.
Dunque
2a = a + a, 3a = 2a + a = (a + a) + a = a + a + a, . . . .
Proposizione 2.4.2. Sia G un monoide con elemento neutro u, siano a, b due elementi
di G e siano m, n N. Se loperazione di G è notata moltiplicativamente ed è ab = ba,
allora valgono le uguaglianze
am bn = bn am ; (2.4.1)
(ab)n = an bn ; (2.4.2)
am an = am+n ; (2.4.3)
(am )n = amn = (an )m . (2.4.4)
Se invece loperazione di G è notata additivamente ed è a + b = b + a, allora valgono le

uguaglianze
ma + nb = nb + ma; (2.4.5)
n(a + b) = na + nb; (2.4.6)
ma + na = (m + n)a; (2.4.7)
m(na) = (mn)a = n(ma). (2.4.8)
Dimostrazione. Proviamo, dapprima, che risulta
am b = bam per ogni m N. (2.4.9)
Questuguaglianza vale per m = 0, dato che a0 b = ub = bu = ba0 . Supponiamo,

induttivamente, che sia am b = bam per un dato m N. Allora
am+1 b = (am a)b = am (ab) = am (ba) = (am b)a = (bam )a = b(am a) = bam+1 .
Dunque am+1 b = bam+1 e, tenuto conto del Principio di Induzione, concludiamo che vale
laffermazione (2.4.9). Ora, per provare che per ogni m, n N vale la (2.4.1) basta
mostrare che, dato m N, la (2.4.1) vale per ogni n N. Essa è vera per n = 0, avendosi
am b0 = am u = uam = b0 am . Supponiamo che la (2.4.1) valga per un dato n N. Allora
abbiamo
am bn+1 = am (bn b) = (am bn )b = (bn am )b per lipotesi induttiva

= bn (am b) = bn (bam ) per la (2.4.9)
= (bn b)am = bn+1 am .
Dunque la (2.4.1) vale per ogni n N.

Indichiamo ora con P (n) la proprietà (2.4.2). Notiamo che P (0) è vera perche per
n = 0 ambo i membri delluguaglianza (2.4.2) sono uguali ad u. Dato n N, supposta la
P (n) vera, dobbiamo provare che è di conseguenza vera anche la P (n + 1), cioè che
(ab)n+1 = an+1 bn+1 . (2.4.10)
Risulta, usando variamente lassociatività deloperazione di G,
(ab)n+1 = (ab)n (ab) = an bn ab = an abn b = an+1 bn+1 ,
dove la seconda uguaglianza segue dallipotesi induttiva e la terza dal fatto che vale la
(2.4.1) per ogni m, n N. Dunque vale la (2.4.10), ossia è vera la P (n + 1). In base al
Principio di Induzione possiamo concludere che la (2.4.2) è vera per ogni n N.
Passando alla (2.4.3), è evidente che dichiarare che essa vale per ogni m, n N equivale
a dichiarare che, dato un qualunque m N, per ogni n N vale la (2.4.3). Fissiamo
dunque arbitrariamente m N. Ovviamente la (2.4.3) vale per n = 0, essendo in tal caso
ambo i membri uguali ad am . Dato n N, supponiamo la (2.4.3) vera e proviamo che
am an+1 = am+(n+1) . (2.4.11)
Abbiamo
am an+1 = am an a = am+n a = a(m+n)+1 = am+(n+1) ,
dove la seconda uguaglianza segue dallipotesi induttiva; di conseguenza vale la (2.4.11).
Dunque la (2.4.3) vale per ogni n N in base al Principio di Induzione. Avendo fissato
arbitrariamente m N, concludiamo che la (2.4.11) è vera per ogni m N e per ogni
n N.
Infine, fissiamo un m N. La prima uguaglianza della (2.4.4) è vera se n = 0, dato
che in questo caso i due membri sono uguali ad u. Dato n N, assumiamo vera la prima
uguaglianza della (2.4.4). Allora abbiamo:
(am )n+1 = (am )n am = (amn )am = amn+m = am(n+1)
dove la seconda uguaglianza segue dallipotesi induttiva e la terza dal fatto che, come
abbiamo sopra provato, vale la (2.4.3) per ogni m, n N. Dunque (am )n+1 = am(n+1) e
il Principio di Induzione, unitamente allarbitrarietà di m, ci permette di concludere che
la prima uguaglianza della (2.4.4) vale per ogni m N e per ogni n N. Quanto alla
seconda uguaglianza della (2.4.4), essa discende dalla prima dal momento che mn = nm.
Per concludere, le (2.4.5), (2.4.6), (2.4.7) e (2.4.8) non sono altro che la traduzione in
notazione additiva delle (2.4.1), (2.4.2), (2.4.3) e (2.4.4) rispettivamente.
Lemma 2.4.3. Sia G un monoide (notato moltiplicativamente) e siano a, b due elementi
invertibili di G tali che ab = ba. Allora valgono le uguaglianze
a1 b = ba1 ,
a1 b1 = b1 a1 .
Dimostrazione. Esercizio.
Esercizio 2.4.4. Dato un insieme A e una funzione f : A A, sia x A e si supponga
che per un intero positivo r risulti f r (x) = x. Provare che, di conseguenza, f rs (x) = x
per ogni s N (Sugg.: Usare le regole delle potenze nel monoide (AA , )...).
2.5 Anelli e campi.

Le strutture algebriche con due operazioni di maggiore interesse sono gli anelli e, in
particolare, i campi che ora andiamo a definire.
Definizione 2.5.1. Si chiama anello una terna ordinata (R, +, ), dove R è un in-
sieme (detto il sostegno dellanello) e +, sono due operazioni binarie in R, chiamate
rispettivamente addizione e moltiplicazione dellanello, verificanti i seguenti assiomi:
A1 per ogni a, b, c R risulta a + (b + c) = (a + b) + c;
A2 per ogni a, b R risulta a + b = b + a;
A3 vi è un elemento 0R R tale che per ogni a R, a + 0R = a;
A4 per ogni a R vi è un elemento a R tale che a + (a) = 0R ;
A5 per ogni a, b, c R risulta a(bc) = (ab)c;
A6 vi è un elemento 1R R tale che per ogni a R, a1R = a = 1R a;
A7 per ogni a, b, c R risulta a(b + c) = ab + ac e (a + b)c = ac + bc.

Se in pi`
u vale la condizione:
A8 per ogni a, b R risulta ab = ba, cioè la moltiplicazione è commutativa,
allora si dice che (R, +, ) è un anello commutativo. Infine si dice che (R, +, ) è un
campo se è un anello commutativo verificante la seguente condizione:
A9 ogni elemento di R {0R } è invertibile rispetto alla moltiplicazione, cioè, per ogni
a R {0R } esiste a1 R tale che aa1 = 1R .
Dunque A1, A2, A3, A4 prescrivono che (R, +) deve essere un gruppo abeliano,
dove 0R è lelemento neutro, mentre A5, A6 impongono che (R, ) sia un monoide dove 1R
è lelemento neutro. In conformità con quanto già detto prima per i gruppoidi, in pratica
usiamo i simboli 0 e 1 in luogo di 0R e 1R rispettivamente, sempreche dal contesto risulti
chiaro quando essi indicano i numeri naturali zero e uno oppure gli elementi neutri
di un particolare anello. Con il simbolo R intendiamo linsieme R {0} e scriviamo di
solito a b per indicare lelemento a + (b). Infine scriveremo R al posto di (R, +, )
quando, nuovamente, risultano chiare dal contesto le due operazioni di addizione e
moltiplicazione che vogliamo usare in R.
Definizione 2.5.2. Un sottoanello di un anello (R, +, ) è un sottoinsieme S di R tale
che:
1) S è un sottogruppo del gruppo additivo (R, +),
2) S è stabile rispetto alla moltiplicazione,
3) 1R S.
Dedicheremo il Capitolo 4 allo studio approfondito degli anelli, accontentandoci per

ora di esaminare alcuni esempi fondamentali.
Esempio 2.5.3. Lanello Z dei numeri interi.

Linsieme Z degli interi relativi è un anello commutativo rispetto alle ordinarie oper-
azioni aritmetiche di addizione e moltiplicazione. Esso non è però un campo, perche solo
1 e 1 hanno inverso (se stessi) in Z.
Esercizio 2.5.4. Provare che Z è lunico sottoanello di se stesso.
Esercizio 2.5.5. Considerato il gruppo abeliano Z, si provi che vi sono esattamente

due modi di definire unoperazione (a, b) 7 a b in maniera che (Z, +, ) sia un anello.
(Sugg.: Se (Z, +, ) è un anello, indicato con u il suo elemento neutro moltiplicativo risulta
1 = u 1 = (u1) 1 = u(1 1), per cui u = 1 oppure u = 1. . . . ).
Esercizio 2.5.6. a) Stabilire se (N, +, ) è un anello.
Esercizio 2.5.7. Provare che se R è un campo, allora R è stabile rispetto alla moltipli-
cazione ed è un gruppo abeliano.
Esempio 2.5.8. Lanello Zn degli interi mod. n,

Dato un numero naturale n, nella Sezione 1.15 abbiamo introdotto linsieme Zn delle
classi di congruenza modulo n, dette anche gli interi mod. n. Definiamo ora in Zn unad-
dizione e una moltiplicazione canoniche. Innanzi tutto, dati due sottoinsiemi X, X Z,
definiamo i seguenti nuovi sottoinsiemi di Z:
X + Y := {x + y | x X, y Y }, (2.5.1)
XY := {xy | x X, y Y }. (2.5.2)
Si tratta di due operazioni definite nellinsieme P(Z) delle parti di Z. Il fatto notevole e
che linsieme Zn , il quale e ovviamente un sottoinsieme di P(Z), e stabile rispetto a tali
operazioni, risultando
(x + nZ) + (x + nZ) = (x + y) + nZ, (2.5.3)

(x + nZ)(x + nZ) = xy + nZ (2.5.4)
(Esercizio!). Si noti che queste uguaglianze sono in accordo con quanto visto nellEser-
cizio 1.15.3, a). A questo punto il lettore provi per esercizio che Zn , con laddizione
(2.5.3) e la moltiplicazione (2.5.4), è un anello commutativo. Per questa ragione Zn viene
chiamato lanello degli interi mod. n, considerando tacitamente in esso le operazioni
(2.5.3) e (2.5.4), oppure il gruppo (additivo) degli interi mod. n, se ci si interessa solo
alladdizione.
Nella pratica è comodo rappresentare gli elementi di Zn con i numeri 0, 1, 2, . . . , n 1,
cioè i possibili resti della divisione per n. Cos`, se r, s {0, 1, 2, . . . , n1}, allora [r]+[s] =
[v] e [r][s] = [w], dove v e w sono i resti delle divisioni per n di r + s e rs rispettivamente.
A titolo di esempio mostriamo le tavole pitagoriche di Z2 , Z3 , Z4 , Z5 , Z6 :

+ 0 1 0 1
Z2 : 0 0 1 0 0 0
1 1 0 1 0 1
+ 0 1 2 0 1 2
0 0 1 2 0 0 0 0
Z3 :
1 1 2 0 1 0 1 2
2 2 1 0 2 0 2 1
+ 0 1 2 3 0 1 2 3
0 0 1 2 3 0 0 0 0 0
Z4 : 1 1 2 3 0 1 0 1 2 3
2 2 3 0 1 2 0 2 0 2
3 3 0 1 2 3 0 3 2 1
+ 0 1 2 3 4 0 1 2 3 4
0 0 1 2 3 4 0 0 0 0 0 0
1 1 2 3 4 0 1 0 1 2 3 4
Z5 :
2 2 3 4 0 1 2 0 2 4 1 3
3 3 4 0 1 2 3 0 3 1 4 2
4 4 0 1 2 3 4 0 4 3 2 1
+ 0 1 2 3 4 5 0 1 2 3 4 5
0 0 1 2 3 4 5 0 0 0 0 0 0 0
1 1 2 3 4 5 0 1 0 1 2 3 4 5
Z6 : 2 2 3 4 5 0 1 2 0 2 4 0 2 4
3 3 4 5 0 1 2 3 0 3 0 3 0 3
4 4 5 0 1 2 3 4 0 4 2 0 4 2
5 5 0 1 2 3 4 5 0 5 4 3 2 1
Esercizio 2.5.9. Provare che Z2 , Z3 e Z5 sono campi, mentre Z4 e Z2 non lo sono.
In realtà, come vedremo pi`
u avanti, Zn è un campo esattamente quando n è un numero
primo (vedi Teorema 4.2.11).
Esercizio 2.5.10. Stabilire se linsieme P(Z) delle parti di Z, con laddizione e molti-
plicazione definite rispettivamente dalle (2.5.1) e (2.5.2), è un anello.
2.6 Il campo Q dei numeri razionali e il campo R dei

numeri reali.
a
I numeri razionali sono le frazioni intere , dove a, b Z e b 6= 0; i numeri a, b si
b
chiamano rispettivamente il numeratore e il denominatore della frazione. Ricordiamo
che le frazioni sono governate dalla seguente regola:

a c
per ogni a, b, c, d Z risulta = se e solo se ac = bd. (2.6.1)
b d
Dunque, formalmente: na o
Q := a, b Z, b 6= 0 .

b
a
Ogni numero intero a Z si identifica con la frazione , di modo che Z risulta essere
1
un sottoinsieme di Q. Addizione e moltiplicazione per le frazioni sono definite nel modo
a c
seguente: per ogni , Q, si dichiara che
b d
a c ad + bc a c ac
+ := , := . (2.6.2)
b d bd b d bd
Queste definizioni sono coerenti con la regola (2.6.1), nel senso che se
a a0 c c0
= 0 e = 0, (2.6.3)
b b d d
allora
ad + bc a0 d0 + b0 c0 ac a0 c 0
= e = . (2.6.4)
bd b0 d0 bd b0 d0
Infatti, tenuto conto che le (2.6.3) si traducono rispettivamente nelle
ab0 = a0 b e cd0 = c0 d, (2.6.5)
abbiamo
(ad + bc)b0 d0 = ab0 dd0 + bb0 cd0 = a0 bdd0 + bb0 c0 d = (a0 d0 + b0 c0 )bd
e
(ac)(b0 d0 ) = ab0 cd0 = a0 bc0 d = (a0 c0 )(bd),
da cui le (2.6.4). Lasciamo al lettore la facile ma noiosa dimostrazione della proposizione
che segue; per essa va usata semplicemente la naturale struttura di anello commutativo
di Z.
Proposizione 2.6.1. Linsieme Q è un campo rispetto alladdizione e alla moltiplicazione

definite dalle (2.6.2); queste si riducono in Z alle ordinarie operazioni di addizione e
moltiplicazione, per cui Z risulta essere un sottoanello di Q.
Esercizio 2.6.2. Siano a1 , a2 , . . . , an , b1 , b2 , . . . , bn degli interi con bi 6= 0 per ogni i =

1, 2, . . . , n. Provare che !, n !
n n
Y ai Y Y
= ai bi .
i=1 i
b i=1 i=1
Nel campo Q vi è un ordinamento che, ristretto a Z si riduce allordinamento naturale.

a c
Formalmente, dati , Q, si dichiara che
b d
a c
6 : ad 6 bc. (2.6.6)
b d
Anche qui occorre stabilire la coerenza di tale definizione. Precisamente, dobbiamo essere
certi che se valgono le (2.6.3), allora vale limplicazione
ad 6 bc = a0 d0 6 b0 c0 . (2.6.7)
Innanzi tutto notiamo che la condizione ad 6 bc equivale alla (a)(d) 6 (b)(c).

Di conseguenza, allo scopo di provare limplicazione (2.6.7), possiamo supporre che i
denominatori b, b0 , d, d0 siano positivi. In tali condizioni abbiamo la seguente catena di
implicazioni:
ad 6 bc = adb0 d0 6 bcb0 d0 (vedi lEsercizio 1.6.1, b))

= a0 dbd0 6 bc0 db0 per le (2.6.5)
= a0 d0 bd 6 b0 c0 bd
= a0 d0 6 c0 d0 (vedi lEsercizio 1.6.1, d)).
Da queste segue limplicazione (2.6.7). Il passo successivo è provare che la relazione 600
in Q definita dalla (2.6.6) è effettivamente un ordinamento. Evidentemente, per ogni
a
Q risulta
b
a a
6 .
b b
a c
dato che ab 6 ab. Inoltre, dati , Q, se
b d
a c c a
6 e 6 ,
b d d b
a c a c e
ossia ad 6 bc e bc 6 ad, allora ad = bc, per cui = , Infine, siano , , Q e
b d b d f
supponiamo che sia
a c c e
6 e 6 ,
b d d f
cioè ad 6 bc e cf 6 ed. Come visto poco sopra, allo scopo di provare che risulta di
a e
conseguenza 6 , possiamo supporre che i denominatori b, d, f siano positivi. Allora
b f
abbiamo, tenuto conto dellEsercizio 1.6.1, b):
adf 6 bcf 6 bed,
per cui af d 6 bcf 6 bed. Da questa, tenuto conto dellEsercizio 1.6.1, d), otteniamo
a e
af 6 bcf 6 be, per cui = . Possiamo concludere che la relazione 6 in Q definita
b f
dalla (2.6.6) è un ordinamento, che chiamiamo ancora ordinamento naturale di Q.
Questo nome è motivato dal fatto che la relazione 6 in Q, ristretta a Z, si riduce

allordinamento naturale fra gli interi, dato che se a, b Z, allora
a b
6 a 6 b.
1 1
a c
Esercizio 2.6.3. Provare che, dati , Q, risulta
b d
a c a c
6 > .
b d b d
Provare inoltre che
a
06 0 6 a e 0 < b, oppure a 6 0 e b < 0.
b
Sempre a titolo di esercizio il lettore può verificare le seguenti fondamentali proprietà
dellordinamento naturale (1.4.3) di Q:
Propriet`
a di isotonia rispetto alladdizione:
per ogni x, y, z, d Q, se x 6 y, allora x + z 6 y + z;
Propriet`
a di isotonia per fattori positivi rispetto alla moltiplicazione:
per ogni x, y, z Q, se x 6 y e z > 0, allora xz 6 yz.
In virt`
u di tali proprietà si dice che Q è un campo ordinato.
Proposizione 2.6.4. Se x, y Q ed è x < y, allora esiste un z Q tale che x < z < y.
Dimostrazione. Consideriamo dapprima il caso in cui x = 0 e prendiamo a, b Z tali

a
che y = . Tenuto conto dellEsercizio 2.6.3, possiamo supporre 0 < a e 0 < b, per cui
b
a a a
dalla (2.6.6) segue che 0 < < . Dunque risulta x < z < y prendendo z = .
b+1 b b+1
Consideriamo ora degli arbitrari x, y Q tali che x < y. Allora 0 = x x < y x
per lisotonia rispetto alladdizione. Per quanto appena provato esiste un t Q tale
che 0 < t < y x. Da questa, sempre per lisotonia rispetto alladdizione otteniamo
x < t + x < (y x) + x, da cui x < z < y con z = t + x.
La proprietà descritta dalla proposizione precedente si esprime dicendo che Q è denso

in s
e rispetto allordinamento naturale. Notoriamente Z non verifica tale proprietà: se
x Z, per esempio non vi è alcun z Z tale che x < z < x + 1.
La costruzione del campo reale R è alquanto laboriosa ed esula dai nostri compiti.
Anziche definire cosa deve essere un numero reale, ci limitiamo a definire in blocco
R stesso come un campo speciale, dichiarando i numeri reali semplicemente come gli
elementi di R.
Definizione 2.6.5. Il campo reale è un campo R ordinato, archimedeo e completo. In

dettaglio, R è un campo nel quale è definito un ordinamento 6 verificante le seguenti
proprietà:
(1) Q è un sottoanello denso di R, nel senso che
per ogni x, y R, se x < y allora esiste almeno un z Q tale che x < z < y.
(2) R è completo, nel senso che ogni sottoinsieme di R limitato superiormente (rispett.
limitato inferiormente) ha un estremo superiore (rispett. un estremo inferiore).
(3) propriet`
a archimedea:
per ogni x, y R, se y 6= 0 allora esiste un numero intero n tale che x < ny.
Si può dimostrare che esiste almeno un campo ordinato con le condizioni imposte in
tale definizione e che, inoltre, due di tali campi sono necessariamente isomorfi (vedi la
Definizione 4.2.1). Si può inoltre dimostrare che, dato un numero reale positivo a e un
intero n > 1, esiste un numero reale b tale che bn = a. Il numero b si chiama la radice
1
n-esima di a e si indica con n a, oppure a n .
Circa la proprietà (2) di completezza di cui alla definizione precedente, è importante
osservare che il campo ordinato Q non è completo in quel senso. A titolo di esempio,
consideriamo i sottoinsiemi
A = {x Q+ | x2 < 2}, B = {y Q+ | 2 6 y 2 }.
` facile controllare che A è limitato superiormente in Q, mentre B è limitato inferiormente
E
in Q. Si può dimostrare (noi non lo faremo) che se A avesse estremo superiore u in
2
questo sarebbe anche lestremo inferiore per B e risulterebbe u = 2, ossia
Q, u =
2. Tuttavia, come proveremo pi` u avanti (vedi la Proposizione 3.5.17), risulta 2 6 Q.
Dunque Q non è completo, perche A non ha estremo superiore in Q e B non ha estremo
inferiore in Q.
Ogni numero reale positivo x ha ununica rappresentazione decimale; precisamente
esiste ununica successione finita a0 , a1 , a2 , . . . , an e ununica successione non necessaria-
mente finita b1 , b2 , b3 , . . ., dove ai , bj variano nellinsieme delle cifre decimali
{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}
con la condizione che a0 6= 0, con le quali si scrive
x = a0 a1 a2 . . . an , b1 b2 . . . .
Comè noto, il numero intero
y = a0 a1 a2 . . . an = an + 10an1 + 102 an2 + + 10n1 a1 + 10n a0
si chiama la parte intera di x, mentre il numero

1 1 1
z = 0, b1 b2 b3 . . . = b1 + b2 2 + b3 3 +
10 10 10
è la parte decimale di x e risulta x = y + z. In pratica il numero reale x viene ap-

prossimato utilizzando solo un numero finito di cifre per rappresentarlo, il che significa
approssimare x con dei numeri razionali, dal momento che un numero reale la cui rappre-
sentazione decimale ha solo un numero finito di cifre non nulle è necessariamente razionale.
Per esempio la scrittura

2 = 1, 414213562373095048801688724209 (2.6.8)

sta ad indicare che il numero razionale a secondo membro approssima 2 a meno di 1/1030 ;
ribadiamo che, di per se, luguaglianza (2.6.8) è formalmente scorretta, dal momento che

2 non è un numero razionale. Dovrebbe comunque essere noto che vi sono anche dei
numeri razionali nella cui rappresentazione decimale compaiono infinite cifre decimali non
nulle, come per esempio
1
= 0, 33333333333 . . . .
3
Esercizio 2.6.6. Usando solo le condizioni da A1 ad A9 della definizione 2.5.1, come
pure il fatto che a0 = 0 = 0a per ogni a R, provare che:
(1) Per ogni a, b R risulta (a)b = (ab) = a(b).
(2) Per ogni a, b R risulta (a)(b) = ab.
Si chiama modulo o valore assoluto di un numero reale x il numero reale non
negativo |x| definito come segue:

x, se x > 0;
|x| =
x, se x < 0.
Esercizio 2.6.7. Provare che per ogni x, y R valgono le seguenti relazioni:
|xy| = |x| |y|,

|x + y| 6 |x| + |y|,
||x| |y|| 6 |x y|.
Esercizio 2.6.8. Per funzione reale di una variabile reale si intende una funzione
che ha per dominio un sottoinsieme di R e per codominio R. Dato un sottoinsieme
C R, consideriamo linsieme RC di tutte le funzioni reali che hanno C per dominio e,
se f, g RC , definiamo la funzione somma f + g : C R nel modo seguente:
per ogni x C, (f + g)(x) = f (x) + g(x). (2.6.9)
Provare che (RC , +) è un gruppo abeliano. Dato un sottoinsieme C R e due funzioni

f, g : C R, definiamo la funzione prodotto f g : C R nel modo seguente:
per ogni x C, (f g)(x) = f (x)g(x). (2.6.10)
Provare che linsieme RC di tutte le funzioni reali che hanno C per dominio è un anello
commutativo rispetto alladdizione ed alla moltiplicazione definita dalle (2.6.9) e (2.6.10)
rispettivamente. Può mai essere un campo?
2.7 Matrici.
Generalmente parlando, dato un insieme X e due interi positivi m, n, una matrice ad m
righe e n colonne, oppure una matrice di formato (o tipo) m n è una qualunque
funzione A : m n X. Se i m, j n, lelemento A(i, j) X che A associa alla
coppia (i, j) si chiama lelemento, o entrata, di posto (i, j) della matrice A e lo si
indica di solito con Aij , mentre la matrice A si rappresenta con una tabella scrivendo

A11 A12 . . . A1n
A21 A22 . . . A2n
A = .. .. .

..
. . ... .
Am1 Am2 . . . Amn
Occasionalmente può risultare conveniente indicare gli elementi di una matrice con lettere
minuscole, per esempio scrivendo aij in luogo di Aij . Linsieme di tutte le matrici di tipo
m n ad elementi in un insieme X ( insistiamo: è linsieme X mn delle funzioni da m n
verso X) si indica con Mm,n (X). Naturalmente hanno particolare interesse le matrici di
tipo n n, nelle quali il numero delle righe è uguale al numero delle colonne; una matrice
di questo tipo si chiama una matrice quadrata di ordine n e linsieme di tali matrici
si indica con Mn (X), anziche Mn,n (X). Dal Principio di Uguaglianza per le Funzioni
discende il Principio di Uguaglianza per le Matrici: due matrici A, B Mm,n (X) sono
uguali se e solo se per ogni i m, j m risulta Aij = Bij ; in particolare una matrice A
è individuata quando, e solo quando, per ogni i m, j m viene specificato lelemento
Aij . Naturalmente si possono considerare anche matrici di formato 1 1 le quali, comè
evidente, possono identificarsi con i singoli elementi di X.
Le matrici che a noi pi` u interessano sono quelle le cui entrate sono elementi di un
assegnato anello R, cioè dove X = R. Per esempio, ecco alcune matrici con elementi nel
campo R:

0 0 0
2 3/5
0 3 3 4
1 ;

A= , B= 4 , C = 0 1 1 2 , D = 0
31 3 5 0 0 2
2 5 0 2
abbiamo cos`, rispettivamente, una matrice di tipo 2 3, una di tipo 4 3, una di tipo
1 4 ed una di tipo 4 1. Una matrice ad una riga viene anche detta matrice riga,
o semplicemente riga; analogamente una matrice ad una colonna viene detta matrice
colonna, o semplicemente colonna.
Data una matrice A Mm,n (X) e fissati i m, j n, le due particolari matrici

A1j
A2j
e Aj = ..

Ai = Ai1 Ai2 . . . Ain

.
Amj
si chiamano rispettivamente la i-esima riga e la j-esima colonna della matrice A, di
modo che Aij è lelemento di X che si trova allincrocio della i-esima riga con la j-esima
colonna di A (1 ). Con riferimento agli esempi di cui sopra, abbiamo in particolare:

3 0
, B2 = 3 3 4 , C1 = C, C 1 = (0).

A13 = 0, A22 = 3, A =
5
Da questo punto in poi, salvo diversamente specificato, consideriamo matrici con el-
ementi in un assegnato anello R. Vogliamo definire laddizione e la moltiplicazione
matriciali. Incominciamo con laddizione.
Definizione 2.7.1. Date due matrici A, B Mm,n (R), si definisce la matrice somma
A + B Mm,n (R) come segue: per ogni i m, j m
(A + B)ij := Aij + Bij . (2.7.1)
La (2.7.1) va letta come segue: per ogni i m, j m lentrata di posto (i, j) della
matrice A + B è definita come la somma delle entrate di posto (i, j) delle matrici A e B,
utilizzando laddizione dellanello R, si intende. Per esempio, prendendo R = R, siano
1

2 1 2 0 1
A= , B= .
0 2 1 6 3 1
Allora
1
1 23

2+ 1 + 0 2
+1 2+
A+B = = .
0 + (6) 2 + 3 1 + 1 6 3 + 2 0
E ora facile provare che Mm,n (R), con laddizione (A, B) 7 A + B appena definita, è un
gruppo abeliano il cui elemento neutro è quella che si chiama la matrice nulla, cioè la
matrice con tutte le entrate uguali a 0R ; inoltre per ogni matrice A Mm,n (R) lopposta
A è la matrice definita da (A)ij = Aij per ogni i m, j m, cioè lentrata di posto
(i, j) di A è lopposta dellentrata di posto (i, j) di A.
Passiamo a definire la moltiplicazione fra matrici, cosiddetta righe per colonne.
Definizione 2.7.2. Dati degli interi positivi m, n, p e due matrici A Mm,n (R), B
Mn,p (R), si chiama matrice prodotto di A per B la matrice AB Mnp (R) definita da
n
X
(AB)ik := Ai1 B1k + Ai2 B2k + + Ain Bnk = Aij Bjk
j=1
per ogni i m, k p.
Per esempio, considerate le due matrici

1 1 0 4
5 1 0
A= M2,3 (Z), B = 2 0 0 1 M3,4 (Z),
1 3 2
1 1 3 2
1
Ovviamente la lettera j nel simbolo Aj non sta qui ad indicare un esponente; prestando un minimo
di attenzione, in genere dal contesto sar`
a sempre facile capire se una lettera è da intendersi come indice
o come esponente.
vogliamo calcolare la matrice C = AB M2,4 (Z). In base alla definizione C deve essere
una matrice a due righe e quattro colonne:

C11 C12 C13 C14
C= ,
C21 C22 C23 C24
dove
C11 = 5 1 + 1 (2) + 0 1, C12 = 5 (1) + 1 0 + 0 1,

C13 = 5 0 + 1 0 + 0 3, C14 = 5 4 + 1 1 + 0 2,
C21 = (1) 1 + 3 (2) + 2 1, C22 = (1) (1) + 3 0 + 2 1,
C23 = (1) 0 + 3 0 + 2 3, C24 = (1) 4 + 3 1 + 2 2.
Dunque
3 5 0 21
C= .
5 3 6 3
Si comprende dalla definizione che il prodotto AB fra due matrici ha senso quando il
numero delle colonne di A coincide con il numero delle righe di B.
Il prodotto fra matrici è associativo e distributivo rispetto alla somma, come appresso
specificato.
Proposizione 2.7.3. Date delle matrici A, B, C,D, risulta
(AB)C = A(BC), (2.7.2)
A(B + C) = AB + AC, (B + C)D = BD + CD, (2.7.3)

quando i prodotti e le somme indicate hanno senso; precisamente, la (2.7.2)ha senso se
A Mm,n (R), B Mn,p (R) e C Mp,q (R) per certi interi positivi m, n, p, q, mentre la
(2.7.3)ha senso se A Mm,n (R), B, C Mn,p (R) e D Mp,q (R) per certi interi positivi
m, n, p, q.
Dimostrazione. Per provare la (2.7.2) occorre mostrare che ((AB)C)ij = (A(BC))ij

per ogni i m, j m. Abbiamo infatti
p
X
((AB)C)ij = [(AB)ih Chj ]
h=1
p
" n
! #
X X
= Aik Bkh Chj
h=1
p
" nk=1 #
X X
= (Aik Bkh )Chj per la distributività della moltiplicazione
h=1 k=1
sulladdizione in R,
p
" n #
X X
= Aik (Bkh Chj ) per lassociatività della moltiplicazione in R,
h=1 k=1
n
" p #
X X
= Aik (Bkh Chj ) per la Proposizione 2.3.4,
k=1
n
" h=1 p
!#
X X
= Aik Bkh Chj per la distributività della moltiplicazione
k=1 h=1
sulladdizione in R,
n
X
= [Aik (BC)kj ]
k=1
= (A(BC))ij .
Inoltre per ogni i m, h p abbiamo:

n
X
(A(B + C))ij = [Aik (B + C)kj ]
k=1
n
X
= [Aik (Bkj + Ckj )]
k=1
Xn
= (Aik Bkj + Aik Ckj ) per la distributività della moltiplicazione
k=1
sulladdizione in R,
n
X n
X
= Aik Bkj + Aik Ckj per la Proposizione 2.3.3,
k=1 k=1
= (AB)ij + (AC)ij
= (AB + AC)ij ,
quindi vale la prima delle (2.7.3); la seconda si prova in modo analogo.
Per ogni intero n > 0 la matrice unitaria U(n) Mn (R) è definita da (2 )

1
1
U(n) := .. ,

.
1
cioè (U(n) )ii = 1 e (U(n) )ij = 0 se i 6= j, dove per semplicità abbiamo scritto 1 e 0 in luogo
di 1R e 0R rispettivamente. Una facile verifica mostra che per ogni a Mm,n (R) risulta
U(m) A = A = AU(n) .
2
Qui e nel seguito, quando nella rappresentazione di una matrice certi elementi non vengono indicati,
si intende che questi sono uguali a 0R .
A questo punto possiamo concludere che per ogni intero n > 0 laddizione e la moltipli-
cazione matriciali sopra definite danno allinsieme Mn (R) una struttura di anello: l anello
delle matrici quadrate di ordine n ad elementi nellanello R. E chiaro che M1 (R),
come anello, si identifica con R. Per n > 2 lanello Mn (R) non è mai commutativo, perche
posto per esempio

0 0 0 ... 0
1 1 0 ... 0 1 1 0 . . . 0
0 0 0 . . . 0
0 0 0 . . . 0
A = .. .. .. . , B= ,

. . . . . . .. .. .. .. ..
. . . . . . .
0 0 0 ... 0
0 0 0 ... 0
risulta AB = A 6= B = BA.
Se A Mn (R) è una matrice quadrata di ordine n, la sequenza (A11 , A22 , . . . , Ann ) si
chiama la diagonale principale di A. Per esempio, se

2 0 1
A = 4 1 1 , (2.7.4)
2 3 0
allora la diagonale principale di A è (2, 1, 0). Anche per le matrici non quadrate a volte
è utile far riferimento ad una diagonale privilegiata. Precisamente, sia A Nm,n (R);
se m > n, si chiama diagonale principale di A ancora la sequenza (A11 , A22 , . . . , Ann ),
mentre se m < n, si chiama diagonale principale di A la sequenza (A11 , A22 , . . . , Amm ).
Per esempio, se

3 0 5
1 4 2
2 3 0 3
B= 0 0 1 , C=
1 1 5 2
, (2.7.5)
6 2 0
1 1 1
allora la diagonale principale di B è (3, 4, 1), mentre la diagonale principale di C è

(2, 1).
Si chiama matrice trasposta di una matrice A di formato mn la matrice di formato
n m nella quale lentrata di posto (i, j) coincide con lentrata di posto (j, i) di A, per
ogni i n e j m. Questa nuova matrice si indica con ( A), o semplicemente A ; in
formule:
per ogni i n e j m, ( A )ij = Aji .
Per esempio, se A, B, C sono le matrici di cui alle (2.7.4) e (2.7.5), allora

2 3
2 4 2 3 1 0 6 1 3 1

A = 0 1 3 , B = 0 4 0 2 1 , C = 0 5 .

1 1 0 5 2 1 0 1
3 2
La matrice trasposta si ottiene dunque ribaltando la matrice data rispetto alla sua
` evidente che per ogni matrice A risulta
diagonale principale. E

( A ) = A. (2.7.6)
Una matrice quadrata A Mn (R) si dice:

matrice diagonale se Aij = 0 per i 6= j.
scalare se A11 = A22 = . . . = Ann e Aij = 0 per i 6= j.
triangolare superiore se Aij = 0 per i > j.
triangolare inferiore se Aij = 0 per i < j.
Per questi quattro casi la matrice A assume rispettivamente le seguenti forme:

A11 a
A22 a
. , . ,

. .

. .
Ann a

A11 A12 . . . A1n A11
A22 . . . A2n A21 A22

... ..
,

.. .. . ,

. . . ..
Ann An1 An2 . . . Ann
dove a R.
Esercizi 2.7.4. Sia R un dato anello.
a) Provare che nellanello Mn (R) il sottoinsieme delle matrici triangolari superiori e
quello delle matrici triangolari inferiori sono sottoanelli. Essi si indicano rispettivamente
con UTn (R) e LTn (R).
b) Provare che il sottoinsieme S di Mn (R) delle matrici diagonali è anchesso un
sottoanello, come pure lo è il sottoinsieme delle matrici scalari.
Esercizi 2.7.5. Sia R un dato anello. a) Siano m, n, p interi positivi e siano A, B
Mm,n (R) e C Mn,p (R). Provare che risulta

( A + B) = A + B ,
( AC) = ( C )( A ). (2.7.7)
b) Una matrice quadrata A Mn (R) si dice simmetrica se A = A. Provare che il

sottoinsieme di Mn (R) delle matrici simmetriche è un sottoanello.
Esercizi 2.7.6. Calcolare le seguenti matrici:

1 2 2 1
1 1 2
2
1 2 3 1

a) 0 3 4 2 1 2 0 + 3 2 2
;

1 0 0 5
3 0 0 5
3

2

6
b) 2 1 5 1 7 2 ;

6 5

(1/7) 2
4
3

2

6
c) 2 1 5 1 7 2 .

6 5

(1/7) 2
4

a c
Esercizio 2.7.7. Sia K un campo. Data una matrice M2 (K) con a 6= 0 6= b,
0 0 0 b
0 0
a c a c a c 1 0
determinare una matrice 0 M2 (K) in maniera che 0 = .
0 b 0 b 0 b 0 1
Consideriamo ancora lanello Mn (R) delle matrici quadrate n n ad elementi in

unanello R e indichiamo con S il sottoanello di Mn (R) delle matrici scalari (Esercizio
2.7.4, b)). La funzione : R Mn (R) definita da

a
..
(a) =
.

a
per ogni a R è chiaramente biiettiva; inoltre essa rispetta le operazioni, nel senso che
risulta
(a + a0 ) = (a) + (a0 ) e (aa0 ) = (a)(a0 ) per ogni a, a0 R,
come è immediato verificare. In virt` u di questo fatto, usando una terminologia che in-
trodurremo più avanti diremo che è un isomorfismo dallanello R verso lanello S; per
questa ragione è consentito, e risulta conveniente, identificare ogni elemento a R con la
corrispondente matrice scalare (a).
2.8 Il campo C dei numeri complessi.

Considerato lanello M2 (R) delle matrici 22 ad elementi numeri reali, fissiamo lattenzio-
ne sul suo sottoinsieme
a b
C= a, b R .
b a
Definizione 2.8.1. Gli elementi di C si chiamano i numeri complessi.
Una verifica diretta mostra subito che C è un sottoanello commutativo di M2 (R). Seguendo
lindicazione di cui alla fine della sezione
precedente,
identifichiamo ogni numero reale a
a 0
con la corrispondente matrice scalare . In questa maniera il campo reale R viene
0 a
ad essere identificato con il sottoanello

a 0
aR
0 a
di C delle matrici scalari. Tradizionalmente la lettera i viene usata per indicare uno
speciale numero complesso, precisamente

0 1
i := .
1 0

2 1 0 a b
Allora i = = 1. In tal modo per ogni C abbiamo
0 1 b a

a b 1 0 a 0 0 1 b 0
= + = 1a + ib = a + ib.
b a 0 1 0 a 1 0 0 b
Dunque ciascun numero complesso si può scrivere sotto la forma a + ib per degli unici
numeri reali a, b. Inoltre, presi due numeri complessi w = a + ib, z = c + id, abbiamo

a b c d a + c (b + d)
w+z = + = = a + c + i(b + d), (2.8.1)
b a d c b+d a+c

a b c d ac bd (ad + bc)
wz = = = ac bd + i(ad + bc). (2.8.2)
b a d c ad + bc ac bd
Come si vede, la rappresentazione sotto la forma a + ib per i numeri complessi offre il
vantaggio che con essa le operazioni di addizione e moltiplicazione si possono effettuare
utilizzando le consuete regole formali del calcolo letterale, oltre alla regola i2 = 1.
Definizione 2.8.2. Sia dato un numero complesso z = a+ib. Il numero reale a e il numero
complesso ib si chiamano rispettivamente la parte reale e la parte immaginaria di
z. Si chiama il coniugato di z il numero complesso z = a ib. Il numero reale (non
2 2
negativo)
p a + b = zz si chiama la norma di z e si indica con N (z), mentre il numero
reale N (z) si chiama il modulo di z e si indica con |z|.
Si noti che se z C, allora z R se e solo se z = z.
Proposizione 2.8.3. Lanello C è un campo.

1
Dimostrazione. Se 0 6= z C, allora N(z) 6= 0, per cui da zz = N(z) segue z z =
N(z)
z
1, ossia z 1 = .
N(z)
Esercizi 2.8.4. a) Scomporre nella somma della parte reale pi`

u la parte immaginaria i
seguenti numeri complessi:
!3
1 3 12 3 4i
(1 + i)2 , (1 + i)2 , (1 + i)5 , + i , , ,
2 2 3i (2 i)2
!8 !8 !8 !8
2 2 2 2 2 2 2 2
+ i , + i , i , i .
2 2 2 2 2 2 2 2
a) Si provi che la funzione z 7 z è biiettiva: essa si chiama il coniugio. Si provi che
w+z =w+z e wz = w z
per ogni w, z C.
b) Si provi che
N (wz) = N (w)N (z) e |wz| = |w||z|
per ogni w, z C.
Per come abbiamo definito i numeri complessi, dovrebbe essere chiaro che la legge
(a, b) 7 a + ib definisce una biiezione dallinsieme R2 delle coppie ordinate di numeri reali
verso C. Ciò suggerisce di rappresentare i numeri complessi come i punti di un piano
euclideo reale P , nel quale si sia fissato un sistema di coordinate cartesiane ortonormali
(3 ). In tale contesto il piano P viene anche chiamato il piano di Argand-Gauss.
Precisamente, un numero complesso z = a + ib si rappresenta con il punto di ascissa a e
ordinata b, oppure (il che è equivalente) con il vettore del piano, applicato allorigine, di
coordinate a, b rispetto alla base canonica i = (1, 0), j = (0, 1), il quale è rappresentato
dal segmento orientato di origine il punto O = (0, 0) e termine il punto (a, b) (vedi figura).
b z

*
j 6
- -
O i a

Chiaramente il numero |z| = a2 + b2 è anche il modulo (= lunghezza) del vettore che
rappresenta z. Viceversa, è evidente che ogni vettore del piano, applicato allorigine,
rappresenta un unico numero complesso. In questo contesto gli assi Ox e Oy si dicono
rispettivamente lasse reale e lasse immaginario. Naturalmente un numero complesso
z è reale se e solo se è rappresentato da un punto dellasse Ox. E interessante osservare
che il vettore che rappresenta la somma w + z di due numeri complessi w, z coincide con
la somma dei vettori (secondo la nota regola del parallelogramma) che rappresentano w
e z, come subito si deduce dalla (2.8.1).
3
Significa scegliere gli assi coordinati perpendicolari fra loro, con i punti unità alla stessa distanza
dallorigine.
Definizione 2.8.5. Dato un numero complesso non nullo z = a+ib, si chiama argomen-
to di z, e si indica con Arg(z), la misura (compresa tra 0 e 2) (4 ) dellangolo orientato
formato dalla semiretta positiva Ox e la semiretta di origine O passante per il punto di
coordinate (a, b).
Dalla definizione segue che, dati w, z C , risulta
w = z se e solo se |w| = |z| e Arg(w) = Arg(z). (2.8.3)
Posto = |z| e = Arg(z), dalla definizione precedente risulta
a = cos , b = sen , (2.8.4)
quindi
z = (cos + i sen ). (2.8.5)
Questultima prende il nome di rappresentazione trigonometrica o polare di z.
Viceversa, dati due numeri reali , con > 0, resta definito il numero complesso z
dato dalla (2.8.5). Con la rappresentazione trigonometrica il prodotto di due numeri
complessi assume un nuovo aspetto, come illustrato di seguito.
Proposizione 2.8.6. (Formula di De Moivre) Per ogni , 0 , , 0 R con , 0 > 0,
risulta
(cos + i sen ) 0 (cos 0 + i sen 0 ) = 0 (cos( + 0 ) + i sen( + 0 )). (2.8.6)
Come conseguenza, per ogni n Z risulta
((cos + i sen ))n = n (cos (n) + i sen (n0 )). (2.8.7)
Dimostrazione. Il calcolo è diretto, avendosi
(cos + i sen ) 0 (cos 0 + i sen 0 )
= 0 (cos cos 0 sen sen 0 + i sen cos 0 + i cos sen 0 )
= 0 (cos( + 0 ) + i sen( + 0 )).
2.9 Sottogruppi moltiplicativi notevoli di C.

Le radici complesse di 1
Siccome C è un campo, il sottoinsieme C dei numeri complessi diversi da 0 è un gruppo
rispetto alla moltiplicazione (Esercizio 2.5.6, b)). Se fissiamo un numero reale > 0 e
indichiamo con G linsieme dei numeri complessi aventi modulo , allora gli elementi di
G sono rappresentati nel piano di Argand-Gauss dai punti della circonferenza di centro
lorigine e raggio . Il fatto notevole è che G è un sottogruppo moltiplicativo di C se e
solo se = 1 (esercizio!). Tale sottogruppo si indica con il simbolo U.
Dato un intero n > 1, si dice che un numero complesso z è una radice n-esima di 1
se risulta z n = 1. Ovviamente 1 è lunica radice 1-esima di 1, mentre 1 e 1 sono radici
quadrate di 1.
4
Come unit` a di misura per gli angoli useremo sempre il radiante e come verso positivo di rotazione
quello antiorario.
Esercizio 2.9.1. Controllare direttamente che i numeri complessi

1 3 1 3
+i , i
2 2 2 2
sono radici cubiche di 1.
Quanto ai numeri 1, 1, i, i, essi sono radici quarte di 1. Fissato un intero n > 1, ci
proponiamo di determinare tutte le radici n-esime di 1; linsieme di tali numeri complessi
lo indichiamo con Un :
Un := {z C | z n = 1} .
Allora Un è un sottogruppo di C (Esercizio!). Osserviamo intanto che se un numero
complesso z è una radice n-esima di 1, allora da z n = 1 segue |z|n = |z n | = 1 (perche?).
Di conseguenza, siccome |z| è un numero reale non negativo, deve essere |z| = 1. Le radici
n-esime di 1 vanno dunque cercate nel gruppo U. Prendiamo allora un numero reale e
consideriamo il numero complesso
z = cos + i sen U.
Affinche risulti z n = 1, ossia cos(n) + i sen(n) = 1, è necessario e sufficiente che sia

al tempo stesso cos(n) = 1 e sen(n) = 0. Ciò accade se e solo se vi è qualche k Z
tale che n = 2k, cioè = 2k/n. Dunque, al variare di k in Z, i numeri complessi
cos(2k/n) + i sen(2k/n) esauriscono tutte le radici n-esime di 1:

2k 2k
Un = cos + i sen kZ .
n n
Se ora poniamo
2 2
z1 = cos + i sen ,
n n
dalla formula di De Moivre risulta allora
2k 2k
cos + i sen = z1k per ogni k Z,
n n
di modo che
Un = z1k k Z .

Preso un intero k Z qualunque, operiamo la sua divisione per n con resto, scrivendo cioè
k = nq + r per degli unici q, r Z con 0 6 r 6 n 1 (Teorema 1.6.3). Allora troviamo
che
z1k = z1nq+r = z1nq z1r = (z1n )q z1r = 1q z1r = z1r
Di conseguenza Un non ha pi`
u di n elementi:
Un = 1, z1 , z12 , z13 , . . . , z1n1

(2.9.1)
oppure, pi`
u esplicitamente,

2 2 4 4 2(n 1) 2(n 1)
Un = 1, cos + i sen , cos + i sen , . . . , cos + i sen .
n n n n n n
In realtà Un possiede esattamente n elementi, dato che quelli indicati nella (2.9.1) sono
effettivamente distinti. Infatti, se r, s fossero due interi tali che 0 6 r < s 6 n 1 e
z1r = z1s , allora avremmo
2(s r) 2(s r)
1 = z1sr = cos + i sen ,
n n
per cui vi sarebbe un k Z tale che
2(s r)
= 2k,
n
da cui s r = kn. Ciò è assurdo perche risulta 0 < s r < n.
Esercizio 2.9.2. Dato un intero n > 0, si provi che le radici n-esime di 1 sono rappre-
sentate nel piano di Argand-Gauss dai vertici del poligono regolare di n lati inscritto nella
circonferenza di centro lorigine e raggio 1, di cui un vertice coincide con il punto (1, 0).
Capitolo 3
I GRUPPI
Ricordiamo che un gruppo è un monoide nel quale ogni elemento è simmetrizzabile (vedi
la Definizione 2.1.3). Il nostro programma in questo capitolo è quello entrare in maggiore
dettaglio nella struttura dei gruppi. Per questo scopo è innanzi tutto necessario introdurre
il concetto generale di omomorfismo fra strutture algebriche.
3.1 Omomorfismi.
Definizione 3.1.1. Siano G = (G, ) e G0 = (G0 , ) due gruppoidi. Si dice che una
funzione f : G G0 è un omomorfismo se:
f (a b) = f (a) f (b) per ogni a, b G. (3.1.1)
Se G e G0 sono monoidi con rispettivi elementi neutri u e u0 , si dice che f è un omomor-

fismo di monoidi se, oltre alla (3.1.1), risulta
f (u) = u0 .
Un omomorfismo f : G G0 si dice isomorfismo se, come funzione, è biiettiva. In

questo caso anche f 1 è un isomorfismo (Esercizio!). Si dice che G è isomorfo a G0 se
esiste almeno un isomorfismo da G verso G0 , e quindi anche uno da G0 verso G; si dice
allora che G e G0 sono isomorfi. Se G = G0 e = , un omomorfismo f : G G si dice
anche un endomorfismo di G. Un endomorfismo di G che è un isomorfismo si chniama
un automorfismo di G.
Esempi 3.1.2. 1) Se G è un gruppoide, ovviamente la funzione identica 1G è un auto-

morfismo di G.
2) Fissato un intero a Z, la funzione f : Z Z definita da f (x) = ax per ogni x Z
è un endomorfismo del gruppo additivo Z ed è omomorfismo di monoidi. Infatti per ogni
x, y Z risulta
f (x + y) = a(x + y) = ax + ay = f (x) + f (y)
e f (0) = 0. Si noti che f è iniettiva se e solo se a 6= 0, mentre è suriettiva se e solo se
a = 1, cioè nel caso banale in cui f = 1Z .
91
CAPITOLO 3. I GRUPPI 92
3) Fissato un numero naturale a N, la funzione g : N N definita da g(n) = an

per ogni n N è un omomorfismo di monoidi dal monoide additivo N verso il monoide
moltiplicativo N, avendosi
g(m + n) = am+n = am an = g(m)g(n)
per ogni m, n N (vedi la (2.4.3)) e g(0) = 1.
Dalla definizione si deduce facilmente che se G, G0 e G00 sono tre gruppoidi e
f : G G0 , f 0 : G0 G00 sono due omomorfismi, allora la composizione f 0 f : G G00 è
a sua volta un omomorfismo. Se G, G0 , G00 sono monoidi, allora f 0 f è un omomorfismo
di monoidi se sono tali f e f 0 .
Nota 3.1.3. Sia G un gruppo e sia u è il suo elemento neutro. Se a G è un elemento
tale che a = aa, allora a = u. Infatti risulta
u = aa1 = (aa)a1 = a(aa1 ) = au = a.
Come conseguenza abbiamo il seguente risultato.
Proposizione 3.1.4. Siano G, G0 due gruppi di rispettivi elementi neutri u, u0 . Se
f : G G0 è un omomorfismo, allora
f (u) = u0 ,
ossia f è un omomorfismo di monoidi.
Dimostrazione. Infatti risulta
f (u) = f (uu) = f (u)f (u),
da cui f (u) = u0 in base alla nota precedente.
Lemma 3.1.5. Siano G, G0 due monoidi e sia f : G G0 un omomorfismo di monoidi.
Allora, per ogni n N e per ogni x G risulta
f (an ) = f (a)n . (3.1.2)
Se a è simmetrizzabile, allora
f (a1 ) = f (a)1 . (3.1.3)
Dimostrazione. Esercizio.
Nota 3.1.6. Le (3.1.2) e (3.1.3) si riferiscono al caso in cui le operazioni in G e G0 sono
ambedue notate moltiplicativamente. Se invece queste sono notate additivamente, le due
suddette uguaglianze divengono rispettivamente
f (na) = nf (a) e f (a) = f (a).
Possono naturalmente presentarsi i casi in cui G è notato moltiplicativamente e G0 addi-
tivamente o viceversa; per questi due casi le (3.1.2) e (3.1.3) divengono rispettivamente
f (an ) = nf (a) e f (a1 ) = f (a),
f (na) = f (a)n e f (a) = f (a)1 .
Sia G un gruppo qualunque e consideriamo il gruppo additivo dei numeri interi Z.

Osserviamo che un omomorfismo f : Z G è determinato dallimmagine f (1) G del
numero 1. Infatti, tenuto conto del Lemma 3.1.5 e della Nota 3.1.6, per ogni intero n > 0
risulta
f (n) = f (n 1) = f (1)n ,
quindi
f (n) = f (n)1 = (f (1)n )1 .
Se, viceversa, fissiamo un elemento a G, possiamo chiederci se esiste qualche omomor-
fismo f : Z G tale che f (1) = a. La risposta è affermativa; di pi`
u, di tali omomorfismi
ve ne è no solo! Per provarlo, iniziamo con losservare che ogni elemento di Z può essere
scritto in infiniti modi come differenza h k di due numeri naturali h, k N. Potremmo
allora definire la funzione f : Z G che cerchiamo dichiarando
f (h k) := ah (ak )1 per ogni h, k N. (3.1.4)
Tuttavia, per poter affermare che con la posizione (3.1.4) abbiamo effettivamente definito
una funzione, dobbiamo essere certi che se h k = r s per due distinte coppie ordinate
(h, k), (r, s) di numeri naturali, allora risulta anche
ah (ak )1 = ar (as )1 ; (3.1.5)
u immagini per il numero h k = r s, quindi con la (3.1.4)
se cos` non fosse f avrebbe pi`
non avremmo definito alcuna funzione! Notiamo che luguaglianza h k = r s equivale
alla h + s = r + k e quindi, tenuto conto della Proposizione 2.4.2, risulta
ah as = ah+s = ar+k = ar ak .
A questo punto, applicando alluguaglianza fra il primo e il quarto membro il Lemma
2.4.3 otteniamo la (3.1.5). Possiamo dunque affermare che la posizione (3.1.4) è atta a
definire una funzione f : Z G; si usa dire che la (3.1.4) è una buona definizione. Dalla
(3.1.4) risulta in particolare che f (1) = a. Proviamo che f è un omomorfismo. Dati
h, k, r, s N, usando ancora la Proposizione 2.4.2 e il Lemma 3.1.5 e della Nota 3.1.6
troviamo:
f ((h k) + (r s)) = f ((h + r) (k + s)) = ah+r (ak+s )1
= ah ar (ak as )1 = ah ar (as )1 (ak )1
= ah (ak )1 ar (as )1
= f (h k)f (r s).
Dunque f è un omomorfismo. Infine, se g : Z G è un qualunque omomorfismo tale che
g(1) = a, allora per ogni h, k N abbiamo, tenuto conto di nuovo del Lemma 3.1.5 e
della Nota 3.1.6:
g(h k) = g(h)g(k) = g(h)g(k)1 = g(h 1)g(k 1)1 = g(1)h (g(1)k )1 = ah (ak )1
= f (h k).
Dunque g = f . Abbiamo cos` dimostrato il seguente Teorema fondamentale il quale dice,
in sostanza, che di omomorfismi dal gruppo additivo Z verso un qualunque gruppo G ve
ne è uno per ogni elemento di G.
Teorema 3.1.7. Sia G un gruppo e sia a G. Allora esiste un unico omomorfismo

f : Z G ( Z trattato come gruppo additivo!) tale che f (1) = a. Precisamente
f (h) = ah e f (h) = (ah )1 per ogni h N. (3.1.6)
Dato un gruppo G e un elemento a G, con la Definizione 2.4.1 abbiamo dato un

preciso significato alla potenza an quando n è un numero naturale. Con la definizione che
segue estendiamo il concetto di potenza al caso di un esponente intero negativo.
Definizione 3.1.8. Sia G un gruppo e sia a G. Dato un numero naturale n N, se

G è notato moltiplicativamente (risp. additivamente) si definisce la potenza an ( risp. il
multiplo (n)a ) secondo la regola
an := (an )1 ( risp. (n)a := (na) ).
Con questa definizione possiamo vedere come la Proposizione 2.4.2 ammette la seguen-
te estensione, nel caso di un gruppo.
Proposizione 3.1.9. Sia G un gruppo e siano a, b due elementi di G. Allora le (2.4.1),

(2.4.2) (2.4.3) e (2.4.4) (oppure (2.4.5), (2.4.6), (2.4.7) e (2.4.8) nel caso in cui G sia
notato additivamente) valgono per ogni m, n Z.
Dimostrazione. Per quanto riguarda le (2.4.1) e (2.4.2) basta usare il fatto che esse
valgono per esponenti non negativi e il Lemma 2.4.3. Dunque, dati m, n N, abbiamo
ad esempio:
am bn = (am )1 bn = bn (am )1 = bn am .
Inoltre
(ab)n = ((ab)n )1 = (an bn )1 = (bn )1 (an )1 = (an )1 (bn )1 = an bn .
Considerando poi lunico omomorfismo f : Z G tale che f (1) = a, per il Lemma 3.1.5
abbiamo
an = (an )1 = f (n)1 = f (n)
per ogni n N. Dunque per ogni m, n N abbiamo
am an = f (m)f (n) = f (m + n) = am+n .
Analogamente otteniamo che
am an = f (m)f (n) = f (m n) = amn .
Ciò prova che la (2.4.3) vale per ogni m, n Z. Per ogni m, n N abbiamo ora:
(am )n = ((am )n )1 = (amn )1 = amn = am(n) .
Notiamo inoltre che

(a1 )m = (am )1
per ogni m N. Basta infatti osservare che (si usi la (2.4.2) ponendo a1 , a, m in luogo
di a, b, n rispettivamente, ricordando che a1 a = u = aa1 )
(a1 )m am = (a1 a)m = um = u,
quindi (a1 )m è effettivamente linverso di am . A questo punto è facile ricavare che

(am )n = a(m)n per ogni m, n N. Infine
(am )n = ((a1 )m )n = (a1 )m(n) = a(m(n)) = a(m)(n) ,
con il che resta provata la validità della (2.4.4) per ogni m, n Z.

Risulterà spesso utile la seguente versione per i gruppi del Lemma 3.1.5.
Lemma 3.1.10. Siano G, G0 due gruppi e sia f : G G0 un omomorfismo di monoidi.
Allora, per ogni n Z e per ogni x G risulta
f (an ) = f (a)n . (3.1.7)
Dimostrazione. Se n > 0, la tesi è quanto afferma il Lemma 3.1.5 stesso. Tuttavia,

preso sempre n > 0, usando lo stesso lemma e la Definizione 3.1.8 abbiamo:
f (an ) = f ((an )1 ) = f (an )1 = (f (a)n )1 ) = f (a)n .
Dunque la tesi.
3.2 Le regole di calcolo in un gruppo. Sottogruppi.

Per comodità del lettore ricapitoliamo in un unico elenco le basilari regole di calcolo in
un gruppo, quali derivano dalle proprietà generali che abbiamo discusso nelle due Sezioni
precedenti, nonche nella Sezione 2.2. In quello che segue G denota un dato gruppo, il
cui elemento neutro indichiamo con u se G è denotato moltiplicativamente, con 0 se G è
denotato additivamente. Se G è finito, ossia è finito il suo insieme sostegno, il numero
dei suoi elementi si chiama anche lordine di G; altrimenti si dice che G è un gruppo
infinito.
Regola (A) In un G vi è un solo elemento neutro.
Regola (B) Ogni elemento di G possiede un solo inverso (od opposto se G è notato
additivamente).
Regola (C) Ogni elemento di G è cancellabile a sinistra e a destra.
Regola (D) Se a, b G allora risulta
(a1 )1 = a, (ab)1 = b1 a1
in notazione moltiplicativa, mentre in notazione additiva queste uguaglianze diven-

gono
(a) = a, (ab) = (b) + (a) = b a, 0 = 0.
Regola (E) Dati a, b G, ciascuna delle equazioni
xa = b, ax = b
nellincognita x ha ununica soluzione; precisamente ba1 la prima e a1 b la seconda.
Regola (F) Dato a G, per ogni m, n Z risulta:
a0 = u, a1 = a,
(a1 )n = an = (an )1 ,
am+n = am an ,
(am )n = amn = (an )m .
Se due elementi a, b G sono tali che ab = ba, in particolare se G è abeliano, allora

per ogni n Z risulta
(ab)n = an bn .
Se G è abeliano ed è notato additivamente, le ultime cinque formule si scrivono
rispettivamente
0a = 0, 1 a = a, (3.2.1)
n(a) = (n)a = (na),
(m + n)a = ma + na,
n(ma) = (nm)a = m(na),
n(a + b) = na + nb.
Si faccia attenzione alla prime delle (3.2.1): il simbolo 0 nel primo membro indica il
numero zero, mentre nel secondo membro indica lelemento neutro di G.
Definizione 3.2.1. Dato un gruppo G, un sottoinsieme H di G si dice sottogruppo di

G se:
(1) u H;
(2) per ogni a, b H risulta ab H, cioè H è una parte stabile di G;
(3) per ogni a H risulta a1 H.
Dalla definizione segue immediatamente che G stesso e {u} sono in modo ovvio sot-
togruppi di G : essi si dicono i sottogruppi banali di G. Ogni sottogruppo di G distinto
da G si chiama sottogruppo proprio. Per indicare che H è un sottogruppo di G usere-
mo la notazione H 6 G. Con la proposizione che segue elenchiamo dei criteri alternativi
che possono risultare utili nel decidere se un dato sottoinsieme di un gruppo è un suo
sottogruppo.
Proposizione 3.2.2. Dato un gruppo G e un sottoinsieme H G, le seguenti affer-

mazioni sono equivalenti:
(1) H è un sottogruppo di G.
(2) H è una parte stabile di G che e un gruppo rispetto alloperazione indotta da quella
di G.
(3) H è una parte stabile non vuota di G e da a H segue a1 H.
(4) H 6= e da a, b H segue ab1 H.
Dimostrazione. (1)(2): segue facilmente dalla Definizione 3.2.1.

(2)(3) Supponiamo che valga la (2). Evidentemente H 6= , dato che in H vi è
almeno lelemento neutro; indicato questultimo con u0 , risulta u0 u0 = u0 = u0 u, da cui
u0 = u, dato che in G ogni elemento è cancellabile. Se a H e a0 è il simmetrico di a in
H, allora aa0 = u0 = u = aa1 , per cui a0 = a1 e quindi a1 H.
(3)(4) Se vale (3), dati a, b H risulta b1 H, per cui ab1 H a causa della
stabilità di H.
(4)(1) Supponiamo che valga la (4). Essendo H 6= , possiamo prendere un elemento
a H e da (4) segue allora che u = aa1 H. Dato ora un qualunque elemento
a H, sempre applicando la (4) otteniamo che a1 = ua1 H. Infine, dati a, b H,
risulta a1 H per quanto appena provato e quindi, ancora dalla (4), otteniamo che
ab = a(b1 )1 H. Concludiamo che H verifica le condizioni di cui alla Definizione 3.2.1,
per cui è un sottogruppo.
Proposizione 3.2.3. Siano G, G0 due gruppi e sia f : G G0 un omomorfismo.
(1) Se H è un sottogruppo di G, allora f (H) è un sottogruppo di G0 .
(2) Se H 0 è un sottogruppo di G0 , allora f 1 (H 0 ) è un sottogruppo di G.
Dimostrazione. Indichiamo con u e u0 gli elementi neutri di G e G0 rispettivamente.

(1) Se H è un sottogruppo di G, da H 6= segue f (H) 6= . Inoltre, dati a0 , b0 f (H),
esistono a, b H tali che a0 = f (a) e b0 = f (b). Tenuto conto del Lemma 3.1.5, abbiamo
a0 b01 = f (a)f (b)1 = f (a)f (b1 ) = f (ab1 ) f (H), dato che ab1 H. Dunque f (H) è
un sottogruppo di G0 in base alla Proposizione 3.2.2
(2) Se H 0 è un sottogruppo di G0 , allora f 1 (H 0 ) 6= , avendosi u0 H 0 e u0 = f (u) per
la Proposizione 3.1.4. Dati a, b f 1 (H 0 ), risulta f (ab1 ) = f (a)f (b1 ) = f (a)f (b)1
H 0 , perche f (a), f (b) H 0 e H 0 è un sottogruppo di G0 . Di conseguenza ab1 f 1 (H 0 )
e ciò prova che f 1 (H 0 ) è un sottogruppo di G.
3.3 Principali esempi di gruppi.

Nel capitolo precedente abbiamo già incontrato svariati esempi di gruppi, quali i gruppi
additivi Z, Q, R, C. Naturalmente Z, Q, R sono sottogruppi di C. Abbiamo poi visto i
gruppi moltiplicativi Q , R , C , il gruppo U dei numeri complessi di modulo 1. Per ogni
n N vi sono gruppi di ordine n, come il gruppo Zn degli interi mod. n e il gruppo Un
delle radici n-esime di 1. Tutti i gruppi citati sono abeliani. Studiamo ora alcuni gruppi
non abeliani.
Esempio 3.3.1. Nellesempio 2.2.5 abbiamo introdotto il gruppo S(A) delle permu-
tazioni di un qualunque insieme A. In particolare, per ogni intero positivo n abbia-
mo il gruppo simmetrico Sn di grado n, cioè il gruppo delle permutazioni dellinsieme
{1, 2, . . . , n}. Ricordiamo che Sn ha ordine n! (Corollario 1.13.7). Con n = 3, il gruppo S3
fornisce il primo esempio di gruppo non commutativo. Per compilarne la tavola pitagorica,
poniamo

1 2 3 1 2 3 1 2 3 1 2 3
1= , = , = , = ,
1 2 3 1 3 2 3 2 1 2 1 3

1 2 3 1 2 3
= , = .
2 3 1 3 1 2
Notiamo allora che valgono le seguenti uguaglianze (per semplicità usiamo la notazione
moltiplicativa):
2 = 2 = 2 = 1,
= = = ,
= = = .
Da queste, usando in maniera adeguata le regole di calcolo in un gruppo si trova la

seguente tavola di S3 :
1
1 1
1
1
1
1
1
Esercizio 3.3.2. Determinare tutti i sottogruppi di S3 .
Esercizio 3.3.3. Provare che ogni gruppo di ordine inferiore a 6 è abeliano.
Esercizio 3.3.4. Dato un insieme A e una sua permutazione , si dice che un elemento
x X è un elemento fisso per , oppure che lascia fisso x, se accade che (x) = x.
Se B è un sottoinsieme di A, si provi che linsieme delle permutazioni di A che lasciano
fissi gli elementi di A B è un sottogruppo di S(A).
Considerato un piano , una funzione f : si chiama movimento o isometria
di se conserva le distanze, cioè se
|AB| = |f (A)f (B)| per ogni A, B .
Supponiamo che f sia un movimento e, se A, B, C, . . . sono punti di , per semplicità

indichiamo con A0 , B 0 , C 0 , . . . le rispettive immagini tramite f . Dalla definizione appare
chiaro che se A, B, C sono tre punti distinti di , allora gli angoli ABC [ e A\ 0 B 0 C 0 hanno
0 0 0
la stessa misura (si pensi ai due triangoli di vertici ABC e A B C : i lati AB,BC e AC
hanno la stessa lunghezza dei lati A0 B 0 ,B 0 C 0 e A0 C 0 rispettivamente); in particolare, se

A, B, C sono allineati, allora lo sono pure A0 B 0 C 0 . Di conseguenza f muta rette in rette
e manda coppie di rette ortogonali in coppie di rette ortogonali. Ovviamente lidentità è
un movimento. Si può dimostrare che se f è un movimento, allora f è necessariamente
una funzione biiettiva e anche f 1 è un movimento. Siccome la composizione di due
movimenti è evidentemente un movimento, abbiamo che linsieme di tutti i movimenti del
piano è un sottogruppo del gruppo S() delle permutazioni di . Da un punto di vista
intuitivo dovrebbe essere chiaro che la definizione di movimento non è che la traduzione in
termini formali del concetto di movimento rigido (in senso fisico) del piano in se stesso,
includendo anche le riflessioni di rispetto ad una sua retta.
Sia ora F una figura nel piano , intesa come sottoinsieme di questultimo. Si chiama
simmetria di F ogni movimento f : tale che f (F ) = F . In parole, un movimento
f è una simmetria per F se, tramite esso, la nuova posizione di ogni punto di F è ancora
un punto di F e, viceversa, ogni punto di F è la nuova posizione di qualche punto di F
(necessariamente unico). Per esempio, se la figura F consiste di un singolo punto O, le
simmetrie di F sono le rotazioni di attorno ad O e le riflessioni di rispetto alle rette
per O.
Esercizio 3.3.5. Provare che linsieme delle simmetrie di una figura F di un piano è
un sottogruppo del gruppo S() delle permutazioni di .
Esempio 3.3.6. Studiamo il gruppo delle simmetrie di un triangolo equilatero. Per

questo scopo il lettore può realizzare un modello materiale nel modo seguente. Si prendano
un foglio di carta b ed un lucido a, possibilmente dello stesso formato per semplificare le
cose. Sul foglio di carta si disegni con precisione un triangolo equilatero. Sovrapponendo
al foglio di carta il lucido, si disegni su questultimo lo stesso triangolo, sulla traccia
di quello precedentemente disegnato sul foglio di carta. A questo punto si numerino in
senso antiorario i vertici dei due triangoli, avendo cura di porre i numeri allesterno del
triangolo sul lucido a e allinterno del triangolo sul foglio b, come nella Figura 3.1. Se ora
vogliamo sovrapporre il lucido a al foglio b in maniera che i due triangoli combacino, ci
accorgiamo che vi sono esattamente sei possibilità di fare ciò, come illustrato nella Figura
3.2. Possiamo ora immaginare il foglio b come un modello del piano che contiene il
nostro triangolo, usando il lucido sovrapposto al foglio per illustrare le nuove posizioni dei
punti di sotto leffetto dei possibili movimenti. In questordine di idee, dovrebbe essere
chiaro che le prime tre configurazioni nella Figura 3.2 sono leffetto delle tre rotazioni (in
senso antiorario) del piano attorno al centro del triangolo con angoli rispettivamente di
misure 0, 2/3 e 4/3, mentre le rimanenti tre sono leffetto delle tre riflessioni rispetto
alle bisettrici degli angoli 2, 1 e 3 rispettivamente. Naturalmente la rotazione di un angolo
di misura 0 non è che lidentità 1 = 1 .
Indicando con R la rotazione di 2/3, è chiaro che R2 = RR è la rotazione di 4/3,
mentre R3 = 1. Denotando poi con D la riflessione rispetto alla bisettrice dellangolo
1, vediamo che RD e R2 D sono le riflessioni rispetto alle bisettrici degli angoli 3 e 2
rispettivamente e valgono le uguaglianze
RD = DR2 , R2 D = DR, D2 = (RD)2 = (R2 D)2 = 1.

Figura 3.1:
a b
2
2
3 1
3 1
Figura 3.2:
Le simmetrie del triangolo equilatero sono dunque

1, R, R2 , D, RD, R2 D
e la tavola pitagorica del gruppo che esse formano è la seguente:
1 R R2 D RD R2 D
1 1 R R2 D RD R2 D
R R R2 1 RD R2 D D
R2 R2 1 R R2 D D RD
D D R2 D RD 1 R2 R
RD RD D R2 D R 1 R2
R2 D R2 D RD D R2 R 1
In generale, se P è un poligono regolare di n > 3 lati, il gruppo delle simmetrie di P
si chiama il gruppo diedrale di grado n e si indica con il simbolo Dn (in realtà tale
gruppo è definito a meno di un isomorfismo, come specificato nellEsercizio 3.3.7). Per
descrivere questo gruppo, numeriamo i vertici di P da 1 ad n, in ordine circolare antiorario.
Un elemento di Dn è la rotazione R di un angolo pari a 2/n in senso antiorario attorno al
centro; dunque, per ogni k Z abbiamo che Rk è la rotazione di un angolo pari a 2k/n
e risulta Rn = 1. Di conseguenza, per ogni h, k Z risulta
Rh = Rk se e solo se h k mod. n (3.3.1)
(Esercizio!), per cui 1 = R0 , R, R2 , . . . , Rn1 sono le n rotazioni in senso antiorario attorno
al centro di angoli pari a 0, 2/n, 4/n, . . . , 2(n 1)/n. Ai fini del computo totale degli
elementi di Dn , osserviamo che ogni simmetria di P lascia fisso il centro O di P , per
cui deve essere una rotazione oppure una riflessione rispetto ad una retta per O. In
questultimo caso, tale retta deve necessariamente essere la bisettrice di un angolo di P ,
oppure la mediana di un lato di P . Di queste rette ve ne sono esattamente n (perche?).
In totale Dn possiede 2n elementi. E ` utile notare che ogni riflessione di Dn può essere
espressa come prodotto di una rotazione per una prefissata riflessione. Infatti, indichiamo
con D la riflessione rispetto alla bisettrice dellangolo al vertice 1. Ogni riflessione inverte
lordine antiorario nel quale si susseguono i vertici 1, 2, . . . , n ed è determinata dalla sua
azione sul vertice 1. Di conseguenza, se essa manda il vertice 1 nel vertice i, allora essa
coincide con Ri D. Concludiamo che
Dn = {1, R, R2 , . . . , Rn1 , D, RD, R2 D, . . . , Rn1 D}.
Volendo compilare la tavola pitagorica di Dn basta tenere presente la (3.3.1) e il fatto che
per ogni i n risulta
Ri D = DRni . (3.3.2)
Infatti, essendo Ri D una riflessione abbiamo che (Ri D)(Ri D) = 1. Moltiplicando questa
a destra per D, a sinistra per Rni D e tenendo presente che D2 = 1 e Rn = 1 otteniamo
la (3.3.2). Come conseguenza abbiamo che il gruppo Dn non è commutativo. Prendendo
ad esempio n = 4, dunque un quadrato, abbiamo
D4 = {1, R, R2 , R3 , D, RD, R2 D, R3 D}
e la tavola pitagorica è la seguente:
1 R R2 R3 D RD R2 D R3 D
1 1 R R2 R3 D RD R2 D R3 D
R R R2 R3 1 RD R2 D R3 D D
R2 R2 R3 1 R R2 D R3 D D RD
R3 R3 D 1 R R2 R3 D D RD R2 D
D D R3 D R2 D RD 1 R3 R2 R
RD RD D R3 D R2 D R 1 R3 R2
R2 D R2 D RD D R3 D R2 R 1 R3
R3 D R3 D R2 D RD D R3 R2 R 1
Esercizio 3.3.7. Provare che se P e Q sono due poligoni regolari aventi uno stesso
numero di lati, allora i loro gruppi delle simmetrie sono isomorfi.
` vero che per ogni intero n > 3 i gruppi Sn e Dn sono isomorfi?.
Esercizio 3.3.8. E
Esercizio 3.3.9. Provare che il gruppo G = {1, R, R2 , . . . , Rn1 } delle rotazioni di un

poligono regolare di n lati è isomorfo al gruppo moltiplicativo Un delle radici n-esime
complesse del numero 1.
Esercizio 3.3.10. Elencare tutti i sottogruppi di D4 .
Esercizio 3.3.11. Studiare il gruppo delle simmetrie di un triangolo isoscele non equi-
latero.
Esercizio 3.3.12. Studiare il gruppo delle simmetrie di un rettangolo che non è un

quadrato.
Esercizio 3.3.13. Si considerino le seguenti matrici:

1 0 0 0 0 1 0 0
0 1 0 0 1 0 0 0
U = 0 0 1 0 ,
I= ,
0 0 0 1
0 0 0 1 0 0 1 0

0 0 1 0 0 0 0 1
0 0 0 1 0 0 1 0
J =
1 0
, K= .
0 0 0 1 0 0
0 1 0 0 1 0 0 0
Provare che linsieme Q8 = { U, I, J, K, U, I, J, K} è un gruppo non commutativo
(rispetto alla moltiplicazione matriciale), compilandone la tavola pitagorica; esso si chiama
il gruppo quaternione. Si determinino tutti i sottogruppi di Q8 e si stabilisca se Q8 è
isomorfo al gruppo D4 , oppure no.
3.4 Insiemi generatori di un gruppo. Il reticolo dei

sottogruppi di un gruppo
Se G è un gruppo T e A è un insieme non vuoto di suoi sottogruppi, allora è facile vedere
S
che lintersezione A è ancora un sottogruppo di G, mentre in generale lunione A
può non esserlo (vedi lEsercizio 2.2.18). Se X è un sottoinsieme di G, risulta spesso utile
poter considerare il più piccolo (nel senso dellinclusione, si intende) sottogruppo H di G
che contiene X. Se X è già un sottogruppo, è ovvio che X stesso è il sottogruppo cercato.
Altrimenti lesistenza di tale sottogruppo può essere provata nel seguente modo. Preso
linsieme A di tutti i sottogruppi di G che contengono X, osserviamo che ATnon è vuoto,
dato che è almeno G A. Possiamo allora considerare lintersezione H = A la quale,
per quanto visto sopra, è un sottogruppo di G e contiene X, ovviamente. Se K è un
qualsiasi sottogruppo di G che contiene X, allora K A e quindi H K. Dunque H è
il sottogruppo cercato. Poniamo allora la seguente definizione.
Definizione 3.4.1. Sia G un gruppo e sia X un sottoinsieme di G.
(1) Il pi`
u piccolo sottogruppo di G che contiene X (cioè il sottogruppo H sopra definito)
si chiama il sottogruppo di G generato da X e si indica con hXi.
(2) Se in particolare risulta hXi = G, allora si dice che X è un insieme generatore

per G. Se in G vi è un insieme generatore finito, allora si dice che G è finitamente
generato.
(3) Se X = {x}, cioè X possiede un singolo elemento, e risulta h{x}i = G, allora si

dice che G è un gruppo ciclico e che x è un suo generatore, oppure che G ` e
generato da x. In altre parole G è un gruppo ciclico se può essere generato da un
singolo elemento. Si usa scrivere hxi in luogo di h{x}i.
Se G è un gruppo ciclico, allora G è ovviamente finitamente generato. Si noti che
per ogni x G risulta hxi = hx1 i (perche?). Un gruppo finito è a fortiori finitamente
generato, ma un gruppo finitamente generato non è necessariamente finito: per esempio
il gruppo additivo Z è ciclico, avendosi Z = h1i = h1i, tuttavia Z è infinito.
Se X è un sottoinsieme di un gruppo G, è possibile descrivere concretamente gli
elementi del sottogruppo hXi generato da X, in funzione dei singoli elementi di X, come
specificato dalla proposizione seguente.
Proposizione 3.4.2. Se X è un sottoinsieme non vuoto di un gruppo G, allora gli
elementi del sottogruppo hXi sono tutti e soli i prodotti finiti della forma
mk
xm1 m2
1 x2 xk , (3.4.1)
dove k N, x1 , x2 , . . . , xk X e m1 , m2 , . . . , mk Z.
Dimostrazione. Indichiamo con H linsieme di tutti gli elementi del tipo (3.4.1). Per
provare che H = hXi basta mostrare che H è un sottogruppo di G, che H contiene X e
che H è a sua volta contenuto in ogni sottogruppo di G contenente X. Risulta X H,
dato che se x X, allora x può essere scritto nella forma (3.4.1) prendendo k = 1, x1 = x
e m1 = 1. Ora H è stabile perche, comè evidente, il prodotto di due elementi del tipo
(3.4.1) è a sua volta un elemento dello stesso tipo. Inoltre u H, perche u può essere
scritto nella forma (3.4.1) prendendo k, x1 , x2 , . . . , xk arbitrari e m1 = m2 = = mk = 0.
Infine, dati k N, x1 , x2 , . . . , xk X e m1 , m2 , . . . , mk Z abbiamo
mk 1
(xm1 m2
1 x2 xk ) = xm
k
k
xm
2
2 m1
x1 ,
tenuto conto delle regole di calcolo in un gruppo. Dunque linverso di un elemento del
tipo (3.4.1) è a sua volta un elemento dello stesso tipo. Con ciò abbiamo provato che H
è un sottogruppo di G e X H. Per finire, se K è un sottogruppo di G tale che X K,
allora in K vi sono, oltre agli elementi di X, anche tutte le potenze con esponente intero
relativo degli elementi di X, nonche tutti i prodotti finiti di tali potenze. Dunque H K,
come volevamo.
Si noti che se il gruppo G è notato additivamente, la Proposizione 3.4.2 ci dice che il

sottogruppo hXi generato da X è costituito da tutti gli elementi del tipo
m1 x1 + m2 x2 + + mk xk , (3.4.2)
per ogni k N, x1 , x2 , . . . , xk X e m1 , m2 , . . . , mk Z. Unespressione come la (3.4.2)

si chiama una combinazione lineare degli elementi x1 , x2 , . . . , xk con coefficienti
m 1 , m2 , . . . , m k .
Ci sarà utile il seguente risultato.
Proposizione 3.4.3. Sia G un gruppo e sia X un insieme generatore per G (eventual-

mente infinito). Se G è finitamente generato, allora vi è in X un sottoinsieme finito Y
tale che G = hY i.
Dimostrazione. Supponiamo che {z1 , z2 , . . . , zn } sia un insieme generatore per G. Sic-

come anche X è un insieme generatore per G, in base alla Proposizione 3.4.2 ogni ele-
mento zi si può scrivere come prodotto di potenze con esponente intero di un numero
finito di elementi di X; indicando con Yi linsieme di tali elementi, è chiaro che linsieme
Y = Y1 Yn è finito. Ora ogni elemento a G è prodotto finito di potenze degli zi
e quindi, per quanto sopra, a è prodotto finito di potenze di elementi di Y . La tesi segue
allora dalla Proposizione 3.4.2.
Proposizione 3.4.4. Siano G, G0 due gruppi a sia f : G G0 un omomorfismo.
(1) Se X G, allora f (hXi) = hf (X)i. In parole: limmagine mediante f del sottogrup-

po hXi di G generato da X coincide con il sottogruppo hf (X)i di G0 generato da
f (X). In particolare, per ogni a G risulta f (hai) = hf (a)i.
(2) Se X è un insieme generatore per G e g : G G0 è un omomorfismo che coincide

con f su X (vuol dire che g(x) = f (x) per ogni x X), allora g = f .
Dimostrazione. (1) Innanzi tutto f (hXi) è un sottogruppo di G0 in base alla Propo-

sizione 3.2.3 e risulta f (X) f (hXi), dato che X hXi (vedi la (1.7.5)). Per provare
che f (hXi) è generato da f (X), basta mostrare che f (hXi) è il pi`
u piccolo sottogruppo
di G0 contenente f (X). Sia dunque H 0 un sottogruppo di G0 tale che f (X) H 0 . Allora

risulta
X f 1 (f (X)) f 1 (H 0 )
(vedi lEsercizio 1.7.18). Siccome f 1 (H 0 ) è un sottogruppo di G in base alla Proposizione
3.2.3, deve essere hXi f 1 (H 0 ) e quindi f (hXi) f (f 1 (H 0 )) H 0 (vedere ancora
lEsercizio 1.7.18), come volevamo.
(2) Dato a G, per la Proposizione 3.4.2 vi sono x1 , x2 , . . . , xk X e m1 , m2 , . . . , mk
mk
Z tali che a = xm 1 m2
1 x2 xk . Usando il Lemma 3.1.10 otteniamo:
mk
g(a) = g(xm 1 m2
1 x2 xk )
= g(x1 )m1 g(x2 )m2 g(xk )mk
= f (x1 )m1 f (x2 )m2 f (xk )mk
mk
= f (xm 1 m2
1 x2 xk )
= f (a).
Dunque g = f .
Dato un gruppo G, indichiamo con G(G) linsieme di tutti i sottogruppi di G. Rispetto

allinclusione G(G) è un reticolo. Infatti, se H, K G(G), abbiamo già osservato che
H H è un sottogruppo di G; essendo anche il pi` u grande sottoinsieme contenuto in H e
in K, risulta inf G(G) (H, K) = H H. Per quanto riguarda supG(G) (H, K), non possiamo
prendere direttamente H K, perche solo in casi banali è un sottogruppo (vedi lEsercizio
3.4.5). In ogni modo hH Ki è il pi`
u piccolo sottogruppo di G contenente H e K, per cui
supG(G) (H, K) = hH Ki. Se H1 , H2 , . . . , Hn sono sottogruppi di G, scriveremo di solito
H1 H2 Hn in luogo di supG(G) (H1 , H2 , . . . , Hn ).
Se X, Y sono due sottoinsiemi di un gruppo G, si usa la notazione XY per indicare
il sottoinsieme di tutti gli elementi di G che sono prodotto di un elemento di X per un
elemento di Y :
XY := {xy | x X, y Y }.
Se G è notato additivamente, scriveremo allora X + Y in luogo di XY :
X + Y := {x + y | x X, y Y }.
Esercizio 3.4.5. Siano H, K due sottogruppi di un gruppo G. Provare che H K è un

sottogruppo di G se e solo se H K, oppure K H .
Esercizio 3.4.6. Considerato il gruppo moltiplicativo U dei numeri complessi di modulo

1, sia
G = {z U | esiste un n N tale che z n = 1}.
S
Evidentemente G = {Un | n N}. Provare che G è un sottogruppo proprio di U.
Esercizio 3.4.7. Provare che se G è un gruppo commutativo e H1 , H2 , . . . , Hn sono suoi

sottogruppi, allora H1 H2 Hn = H1 H2 Hn .
Supponiamo di avere due gruppi G, G0 isomorfi e sia f : G G0 un particolare iso-

morfismo. Allora sappiamo che anche la funzione inversa f 1 : G0 G è un isomorfismo.
Se H è un sottogruppo di G, allora f (H) è un sottogruppo di G0 (Proposizione 3.2.3).
Possiamo allora considerare la funzione G(f ) : G(G) G(G0 ) definita da G(f )(H) = f (H)
per ogni H G(G). Analogamente abbiamo la funzione G(f 1 ) : G(G0 ) G(G) definita
da G(f 1 )(H 0 ) = f 1 (H 0 ) per ogni H 0 G(G0 ). Una verifica diretta mostra che G(f ) e
G(f 1 ) sono luna inversa dellaltra e sono ambedue crescenti (usare gli Esercizi 1.10.10
e 1.10.11 e le (1.7.5), (1.7.5)). Dunque i reticoli G(G) e G(G0 ) sono isomorfi. Possiamo
allora enunciare quanto segue.
Proposizione 3.4.8. Se G e G0 sono due gruppi isomorfi, allora i rispettivi reticoli dei
sottogruppi sono isomorfi. Precisamente, se f : G G0 un isomorfismo, allora la funzione
G(f ) : G(G) G(G0 ) definita da G(f )(H) = f (H), per ogni H G(G), è un isomorfismo
dordine.
Se due gruppi G, G0 sono isomorfi, allora tutte le proprietà delluno, espresse in termini
algebrici, si trasferiscono allaltro. Cos`, per esempio, G è finitamente generato se e solo
se lo è G0 , G è ciclico se e solo se lo è G0 : si tratta di due immediate conseguenze della
Proposizione 3.4.4. Inoltre G è abeliano se e solo se lo è G0 . Spesso ci si trova di fronte
ad un gruppo G definito in modo del tutto astratto. In questa circostanza il problema
tipico consiste nel mostrare che G è isomorfo a qualche gruppo concreto G0 , scelto in
una lista di gruppi standard abbastanza noti. A quel punto tutte le informazioni che
possiediamo su G0 ci forniranno delle corrispondenti informazioni sulla struttura di G.
Esercizio 3.4.9. Si considerino il gruppo U8 delle radici ottave complesse di 1, il gruppo

quaternione Q8 (Esercizio 3.3.13), il gruppo D4 del quadrato e sia G il sottogruppo delle
rotazioni del gruppo D8 dellottagono regolare. Dunque si tratta di quattro gruppi di
ordine otto. Determinare fra questi, se ci sono, le coppie di gruppi isomorfi.
3.5 La struttura del gruppo additivo Z

Se n è un numero naturale, sappiamo che linsieme nZ = {nx | x Z} dei multipli interi
di n è un sottogruppo di Z; esso non è altro che il sottogruppo ciclico generato da n. Si
noti che è anche (n)Z = nZ. Una proprietà fondamentale del gruppo Z è che tutti i
suoi sottogruppi sono di quella forma.
Teorema 3.5.1. Dato un sottogruppo H di Z, vi è un unico n N tale che H = nZ. Se

n > 0, allora n è il pi`
u piccolo intero positivo presente in H.
Dimostrazione. Se H = {0}, allora è ovvio che H = 0Z. Supponiamo che H 6= {0}

e consideriamo linsieme A degli interi positivi presenti in H; formalmente A = H N .
Osserviamo che A 6= . Infatti, preso x H con x 6= 0, allora è anche x H essendo
H un sottogruppo, per cui uno dei due interi x, x è positivo. In base alla Condizione
del Minimo linsieme A possiede il minimo, sia questo n; in altre parole, n è il pi`
u pic-
colo intero positivo presente in H. Risulta allora nZ H; vogliamo provare che è anche
H nZ. Preso x H, per il Teorema 1.6.3 esistono q, r Z tali che x = nq + r e
0 6 x 6 n 1. Siccome x H e nq H, allora r = x nq H. Se fosse r 6= 0, allora

r sarebbe un intero positivo presente in H e minore di n, in contrasto con la scelta fatta
sopra di n. Dunque r = 0 e quindi x = nq. Ciò prova che H nZ e quindi H = nZ.
Supponiamo ora che sia mZ = nZ con m, n N. Allora esistono h, k Z tali che m = hn
e n = km ed è necessariamente h, k N. Segue m = hkm, per cui hk = 1 e quindi
h = k = 1. Dunque m = n e quindi vi è un unico n N tale che H = nZ.
Lemma 3.5.2. Dati due numeri naturali m, n, risulta mZ nZ se e solo se n | m.

Dimostrazione. Se mZ nZ, in particolare m nZ, per cui m = nh per un h Z,
ossia n | m. Viceversa, se n | m, cioè se m = nh per un h Z, per ogni k Z risulta
mk = nhk nZ, per cui mZ nZ.
Dato un intero x Z, fra i divisori di X vi sono 1, 1, x, x; questi si chiamano i

divisori impropri di x, mentre tutti gli altri si dicono i divisori propri di x.
Definizione 3.5.3. Un intero p Z si dice primo se p > 1 e se p non ha divisori propri.
Indichiamo con P linsieme dei numeri primi.
Dati degli interi x1 , x2 , . . . , xn Z non nulli, consideriamo i seguenti insiemi di numeri
naturali :
D(x1 , x2 , . . . , xn ) = {a N | a divide xi per ogni i n},
M(x1 , x2 , . . . , xn ) = {a N | a è multiplo di xi per ogni i n}.
Tali insiemi non sono vuoti, perche nel primo vi è almeno il numero 1, mentre il secondo
è sempre infinito, dato che in esso vi è almeno |x1 x2 xn | e tutti i multipli di questo.
Inoltre il primo è sempre finito, perche se h è un suo elemento, allora h non può superare
u piccolo dei numeri naturali |x1 |, |x2 |, . . . , |xn |, di conseguenza esso ha il massimo
il pi`
(Proposizione 1.5.3).
Definizione 3.5.4. Il massimo dellinsieme D(x1 , x2 , . . . , xn ) si chiama il massimo co-
mune divisore degli interi x1 , x2 , . . . , xn e si indica con MCD(x1 , x2 , . . . , xn ). Gli interi
x1 , x2 , . . . , xn si dicono relativamente primi o primi fra loro se
MCD(x1 , x2 , . . . , xn ) = 1.
Il minimo dellinsieme M(x1 , x2 , . . . , xn ) si chiama il minimo comune multiplo degli
interi x1 , x2 , . . . , xn e si indica con mcm(x1 , x2 , . . . , xn ).
Il Teorema 3.5.1 che caratterizza i sottogruppi di Z permette di illustrare le proprietà
aritmetiche del massimo comune divisore e del minimo comune multiplo di n interi non
nulli x1 , x2 , . . . , xn . Partiamo dallosservazione che il sottogruppo hx1 , x2 , . . . , xn i di Z
generato da x1 , x2 , . . . , xn è costituito dalle combinazioni lineari x1 y1 + x2 y2 + + xn yn
dei numeri x1 , x2 , . . . , xn con coefficienti in Z, quindi
hx1 , x2 , . . . , xn i = x1 Z + x2 Z + + xn Z
(vedi lEsercizio 3.4.7). Abbiamo cos` la seguente caratterizzazione del massimo comune
divisore.
Proposizione 3.5.5. Dati degli interi non nulli x1 , x2 , . . . , xn e un intero positivo d, le

seguenti affermazioni sono equivalenti:
(1) d = MCD(x1 , x2 , . . . , xn ).
(2) dZ = x1 Z + x2 Z + + xn Z.
(3) d è il pi`
u piccolo intero positivo che si può scrivere sotto la forma
d = x1 y1 + x2 y2 + + xn yn (3.5.1)
per certi y1 , y2 , . . . , yn Z.
(1)(2) Supponiamo la (1). Allora ogni xi è multiplo di d e quindi xi Z dZ in base
al Lemma 3.5.2, per cui
x1 Z + x2 Z + + xn Z dZ. (3.5.2)
Per il Teorema 3.5.1 esiste un unico intero positivo d0 tale che d0 Z = x1 Z+x2 Z+ +xn Z.
Di conseguenza, da un lato d0 è un divisore di ciascun xi e quindi d0 6 d, dallaltro lato la
(3.5.2) implica che d | d0 per il Lemma 3.5.2. Concludiamo che d0 = d e quindi la (3).
(2)(1) Assumiamo la (2). Allora ciascun xi appartiene a dZ e quindi d divide tutti
gli xi . Sia d0 > 0 anchesso un divisore comune degli xi e mostriamo che, di conseguenza,
d0 divide d, dal che seguirà d0 6 d e quindi la (1). Per il Lemma 3.5.2 risulta xi Z d0 Z,
per cui
dZ = x1 Z + x2 Z + + xn Z d0 Z.
Dunque d0 | d, come volevamo.
Lequivalenza (2)(3) segue dal Teorema 3.5.1, tenuto conto dellosservazione prece-
dente.
La proposizione precedente ha il seguente importante corollario (si tenga presente che

1Z = Z).
Corollario 3.5.6 (Teorema di Bezout). Dati n > 2 interi non nulli x1 , x2 , . . . , xn , essi
sono relativamente primi se e solo se esistono y1 , y2 , . . . , yn Z tali che
1 = x1 y1 + x2 y2 + + xn yn .
Equivalentemente, x1 , x2 , . . . , xn sono relativamente primi se e solo se il sottogruppo da

essi generato è Z.
Esercizio 3.5.7. Dati n > 2 interi non nulli x1 , x2 , . . . , xn , sia d = MCD(x1 , x2 , . . . , xn ).

Usando la Proposizione 3.5.5 e il Teorema di Bezout, provare che se gli interi y1 , y2 , . . . , yn
verificano la (3.5.1), allora essi sono relativamente primi. Provare che anche gli interi
x1 x2 xn
, ,...,
d d d
sono relativamente primi.
Per quanto riguarda il minimo comune multiplo abbiamo il seguente risultato.
Proposizione 3.5.8. Dati degli interi non nulli x1 , x2 , . . . , xn e un intero positivo m,

risulta m = mcm(x1 , x2 , . . . , xn ) se e solo se
mZ = x1 Z x2 Z xn Z. (3.5.3)
Dimostrazione. Supponiamo che sia m = mcm(x1 , x2 , . . . , xn ). Per ogni i n, essendo

m multiplo di xi risulta mZ xi Z, per cui mZ x1 Z x2 Z xn Z. Daltra parte, per
il Teorema 3.5.1 esiste un unico intero positivo m0 tale che m0 Z = x1 Z x2 Z xn Z.
Quindi mZ m0 Z, cioè m0 divide m, per cui m0 6 m. Siccome m è il minimo dellinsieme
M(x1 , x2 , . . . , xn ) e m0 appartiene a questultimo, segue m0 = m e vale la (3.5.3). Viceversa,
supponiamo che valga questultima. Siccome gli elementi di x1 Zx2 Z xn Z sono pre-
cisamente gli interi multipli comuni di x1 , x2 , . . . , xn , il fatto che m = mcm(x1 , x2 , . . . , xn )
segue direttamente dal Teorema 3.5.1.
I numeri primi svolgono un ruolo di primaria importanza nella teoria della divisibilità
in Z, per via del loro comportamento caratteristico illustrato dalla seguente proposizione.
Proposizione 3.5.9. Un intero positivo p è primo se e solo se verifica la seguente

proprietà: dati degli interi non nulli x1 , x2 , . . . , xn , con n > 2, se p divide il prodotto
x1 x2 xn , allora p divide xi per almeno un i n.
Dimostrazione. Supponiamo che p sia primo, siano x1 , x2 Z e supponiamo che p

divida x1 x2 . Dunque esiste h Z tale che
x1 x2 = hp. (3.5.4)
Se p non divide x1 , allora p e x1 sono relativamente primi (perche?). Di conseguenza, per

il Teorema di Bezout (Corollario 3.5.6) esistono a, b Z tali che 1 = ap + bx1 . Tenuto
conto della (3.5.4) risulta
x2 = x2 1 = x2 ap + x2 bx1 = x2 ap + bhp = (x2 a + bh)p,
per cui p divide x2 . Procedendo per induzione, dato n > 2, supponiamo che se p divide il
prodotto di n interi, allora p divide almeno uno di essi. Mostriamo che, di conseguenza, p
verifica la stessa proprietà per n + 1 interi. Se p divide x1 x2 xn xn+1 = (x1 x2 xn )xn+1
ma non divide xn+1 , per quanto sopra dimostrato p divide x1 x2 xn . Allora, per lipotesi
induttiva p divide almeno uno degli x1 , x2 , . . . , xn .
Viceversa, supponiamo che p verifichi la proprietà di cui allenunciato e mostriamo
che, di conseguenza, p è primo. Supposto, per assurdo, che p abbia un divisore proprio,
allora ne avrebbe uno d > 1, per cui vi sarebbe un intero positivo q tale che
p = dq. (3.5.5)
Ora p divide ovviamente p e quindi anche dq, per cui p divide d oppure q. Ciò è impos-
sibile perche, essendo d > 1 e d 6= p, dalla (3.5.5) segue d < p e q < p. Dunque p deve
essere primo.
Esercizio 3.5.10. Sia p un numero primo e n un intero positivo. Dati due interi non
nulli x1 , x2 , provare che se pn divide x1 x2 e p non divide x1 , allora pn divide x2 (Sugg.:
Induzione su n.).
Ogni intero positivo ammette una scomposizione in fattori primi, nel senso precisato
dal seguente teorema, noto per motivi storici come il Teorema Fondamentale dellArit-
metica
Teorema 3.5.11. Per ogni intero x > 1 esiste una successione finita (p1 , p2 , . . . , pr ) di
numeri primi tale che
x = p1 p2 pr . (3.5.6)
Tale fattorizzazione di x è essenzialmente unica, nel senso che se anche (q1 , q2 , . . . , qs ) è
una successione di numeri primi tale che x = q1 q2 qs , allora s = r e la successione
(q1 , q2 , . . . , qs ) differisce dalla (p1 , p2 , . . . , pr ) al pi`
u per lordine nel quale si susseguono gli
elementi.
Dimostrazione. Sia A linsieme degli interi maggiori di 1 che non sono prodotto di
numeri primi e supponiamo, per assurdo, che sia A 6= . Dato che A N, per il Principio
del Minimo in A vi è il minimo, sia questo z. Ora z non può essere primo, per come
abbiamo preso A, quindi z ha un divisore proprio positivo h e possiamo scrivere z = hk
per qualche intero k > 1. Dovendo essere h < z e k < z, segue h, k 6 A. Di conseguenza
h e k sono ambedue prodotto di numeri primi e quindi lo è anche z = hk, in contrasto
con il fatto che z A. Concludiamo che deve essere A = , il che prova la prima parte
del teorema.
Proveremo lunicità della scomposizione in fattori primi (3.5.6) procedendo per in-
duzione su r. Se r = 1 lunicità è immediata, dato che un singolo numero primo non può
essere prodotto di più numeri primi. Supponiamo che, per un dato r > 1, ogni intero
maggiore di 1 che è prodotto di r numeri primi abbia fattorizzazione essenzialmente unica
e supponiamo che un intero x > 1 abbia due fattorizzazioni
x = p1 p2 pr pr+1 = q1 q2 qs , (3.5.7)
dove p1 , p2 , . . . , pr , pr+1 , q1 , q2 , . . . , qs sono numeri primi. Chiaramente deve essere s > 1.

Ora pr+1 divide il secondo e quindi il terzo membro della (3.5.7), di conseguenza pr+1
divide qj per almeno un j s in base alla Proposizione 3.5.9. Essendo qj primo, deve
risultare qj = pr+1 . Alterando eventualmente lordine dei fattori nel terzo membro della
(3.5.7), possiamo supporre che j = s, per cui qs = pr+1 . Cancellando pr+1 otteniamo
p1 p2 pr = q1 q2 qs1 .
A questo punto dallipotesi induttiva segue che s 1 = r, ossia s = r + 1. Concludiamo

che le due successioni (p1 , p2 , . . . , pr , pr+1 ), (q1 , q2 , . . . , qs ) differiscono al pi`
u per lordine
nel quale si susseguono gli elementi.
Una prima conseguenza del teorema precedente è il fatto che linsieme dei numeri
primi è infinito.
Teorema 3.5.12. Linsieme P dei numeri primi è infinito.
Dimostrazione. Supponiamo che, al contrario, P sia finito e poniamo
P = {p1 , p2 , . . . , pn }.
Considerato il numero a = p1 p2 pn + 1, per il Teorema 3.5.11 esiste almeno un numero

primo q che divide a. Daltra parte, per quanto abbiamo supposto, q deve essere uno
dei p1 , p2 , . . . , pn , quindi q divide anche il numero p1 p2 pn . Di conseguenza q divide
a p1 p2 pn = 1, il che è impossibile essendo q > 1. Concludiamo che P non è finito.
Unaltra conseguenza del Teorema 3.5.11 è il corollario seguente.
Corollario 3.5.13. Degli interi non nulli x1 , x2 , . . . , xn sono relativamente primi se e solo
se non sono divisibili per uno stesso numero primo.
Dimostrazione. Se x1 , x2 , . . . , xn sono relativamente primi, allora essi hanno come unici

divisori comuni 1 e 1, per cui non possono essere divisibili per uno stesso numero primo.
Viceversa, supponiamo che valga questultima condizione e sia d = MCD(x1 , x2 , . . . , xn ).
Se fosse d > 1, per il Teorema 3.5.11 vi sarebbe almeno un numero primo p che divide d.
Ma allora p dividerebbe tutti gli x1 , x2 , . . . , xn .
Nota 3.5.14. Si osservi che nel secondo membro della (3.5.6) ciascun numero primo pi
può comparire pi` u volte; comunque, riordinando eventualmente i fattori, si vede che x
può essere scritto come prodotto di potenze di numeri primi distinti.
Partendo dallosservazione precedente, dati degli interi positivi x1 , x2 , . . . , xn , utiliz-

zando le loro fattorizzazioni nel prodotto di numeri primi è possibile calcolare il loro
massimo comune divisore e il loro minimo comune multiplo nel modo che ora spieghiamo.
Siano p1 , p2 , . . . , pr i numeri primi che compaiono almeno una volta nella fattorizzazione
di almeno uno degli xi , di modo che possiamo scrivere
x1 = ph1 11 ph2 12 phr 1r ,

x2 = ph1 21 ph2 22 phr 2r ,
.. (3.5.8)
.
xn = ph1 n1 ph2 n2 phr nr
per certi hij N (i n, j r). Naturalmente, se un dato pj non compare nella

scomposizione di xi , il che significa che pj non divide xi , prenderemo hij = 0. Osserviamo
che se q è un numero primo una cui potenza q t divide tutti gli xi , per la Proposizione
3.5.9 deve risultare q = pj per un j r (necessariamente unico) e lesponente t non
può superare il pi` u piccolo degli esponenti h1j , h2j , . . . , hnj . Ne segue che i divisori comuni
positivi di x1 , x2 , . . . , xn sono tutti della forma pt11 pt22 ptrr , dove tj 6 inf(h1j , h2j , . . . , hnj )
v
per ogni j r. Inoltre ogni multiplo comune degli xi deve essere divisibile per pj j , dove
vj = sup(h1j , h2j , . . . , hnj ). Possiamo allora concludere con la proposizione seguente.
Proposizione 3.5.15. Dati degli interi positivi x1 , x2 , . . . , xn e considerate le loro fatto-

rizzazioni (3.5.8)nel prodotto di potenze di numeri primi distinti, risulta
MCD(x1 , x2 , . . . , xn ) = pu1 1 pu2 2 pur r ,

mcm(x1 , x2 , . . . , xn ) = pv11 pv22 pvrr ,
dove uj = inf(h1j , h2j , . . . , hnj ) e vj = sup(h1j , h2j , . . . , hnj ) per ogni j r. Di conseguen-
za, per n = 2 risulta
x1 x2 = p1h11 +h21 ph2 12 +h22 phr 1r +h2r = MCD(x1 , x2 ) mcm(x1 , x2 ) (3.5.9)
e x1 , x2 sono relativamente primi se e solo se mcm(x1 , x2 ) = x1 , x2 .

Proposizione 3.5.16. Dato un numero razionale x, esistono degli unici interi a, b relati-
a
vamente primi tali che x = e b > 0.
b
r
Dimostrazione. Scegliamo due interi r, s, con s > 0, tali che x = e sia d = MCD(r, s).
s
Allora vi sono a, b Z tali che r = ad e s = bd, per cui
r ad a
x= = =
s bd b
e b > 0. Per la Proposizione 3.5.5 vi sono u, v Z tali che d = ru + sv, quindi
d = ru + sv = adu + bdv = d(au + bv),
da cui 1 = au + bv. Dunque a, b sono relativamente primi in base al Teorema di Bezout

a
(Corollario 3.5.6). Supponiamo che sia anche x = 0 b0 , dove a0 , b0 sono interi relativamente
primi e b0 >=. Allora
ab0 = a0 b. (3.5.10)
Se p è un numero primo che divide b e n è il massimo numero naturale tale che pn divide
b0 , allora pn divide ab0 e quindi divide a0 b per la (3.5.10). Siccome p non divide a0 , allora
pn divide b (Esercizio 3.5.10). Siccome b0 può essere scritto come prodotto di potenze di
numeri primi distinti (vedi la Nota 3.5.14), deduciamo che b0 | b. Lo stesso ragionamento
condotto scambiando i ruoli di b0 e b comporta che b0 | b; essendo b, b0 positivi, risulta
allora b = b0 . Dalla (3.5.10) concludiamo che è anche a = a0 .
a
Se a, b sono due interi positivi, si dice che è una frazione ridotta se a, b sono
b
relativamente primi.
Chiudiamo la presente sezione con un risultato che dà conto del fatto che, pur essendo il
campo Q denso nel campo R (vedi la Definizione 2.6.5), questultimo è incomparabilmente
più grande di Q. Non possiamo entrare nel merito per precisare in modo formale tale
concetto. Tuttavia riteniamo che il seguente risultato possa servire per dare almeno
unidea della quantità di lacune presenti nel campo razionale. Si può dimostrare che
esistela radice n-esima di ogni numero reale positivo a, ossia un numero reale n a tale
che ( n a)n = a.
Proposizione 3.5.17. Se p è un numero primo e n è un intero tale che n > 2, non esiste
alcun numero razionale x tale che xn = p. In altri termini, la radice n-esima di p non è
un numero razionale.
Dimostrazione. Supponiamo che, al contrario, vi sia un x Q tale che xn = p e
a
scriviamo x = , dove a, b sono relativamente primi (Proposizione 3.5.16). Dunque risulta
b
an
= p, per cui
bn
an = pbn . (3.5.11)
Di conseguenza p divide an , per cui p divide a (Proposizione 3.5.9) ma non divide b.
Dunque a = pc per un c Z e quindi dalla (3.5.11) segue che pn cn = pbn . Da questa
deduciamo che
pn1 cn = bn .
Siccome n 1 > 1, dallultima uguaglianza segue che p divide bn e quindi anche b (ancora
la Proposizione 3.5.9), quando invece avevamo appena osservato che p non divide b. La
contraddizione ottenuta prova che quel numero razionale x non esiste.
3.6 Classi laterali. Il Teorema di Lagrange.

Sia G un gruppo e sia H un sottogruppo di G. Dato a G, i sottoinsiemi
aH = {ah | h H} , Ha = {ha | h H}
di G si chiamano rispettivamente la classe laterale sinistra di a modulo H e la classe

laterale destra di a modulo H. Indichiamo con LH linsieme di tutte le classi laterali
sinistre e con RH linsieme di tutte le classi laterali destre modulo H, ossia poniamo
LH := {aH | a G} , RH := {Ha | a G}.
Chiaramente, se G è commutativo cade la distinzione fra classi laterali sinistre e classi

laterali destre. Per esempio, se G = Z e n è un numero naturale, le classi di congruenza
modulo n non sono altro che le classi laterali degli elementi di Z modulo il sottogruppo
nZ (Sezione 1.15).
Fissato un sottogruppo H del gruppo G, esso individua in G le due relazioni binarie
LH e RH definite nel modo seguente: se a, b G, dichiariamo che LH (a, b) è vera se vi è
un h H tale che b = ah, mentre dichiariamo che RH (a, b) è vera se vi è un h H tale
che b = ha. Ancora una volta, è chiaro che LH e RH sono la stessa relazione quando il
gruppo G è commutativo.
Esercizio 3.6.1. Con le notazioni di cui sopra, provare che LH e RH sono due relazioni
di equivalenza in G. Provare inoltre che se a G, allora le classi di equivalenza modulo
LH e RH che contengono a sono rispettivamente aH e Ha.
Alla luce dellesercizio precedente risulta
G/LH = LH e G/RH = RH ;
in particolare LH e RH sono due partizioni di G. E ` importante osservare che vi è una

funzione biiettiva dal sottogruppo H verso ciascuna classe laterale modulo H, destra o
sinistra che sia. Infatti, dato a G, è facile vedere che le due funzioni f : H aH
e g : H Ha definite da f (h) = ah e g(h) = ha per ogni h H sono biiettive. Di
conseguenza, se G è finito risulta
|aH| = |H| = |Ha| per ogni a G. (3.6.1)
Lemma 3.6.2. Sia G un gruppo e sia H un suo sottogruppo. Dati a, b G, le seguenti

condizioni sono equivalenti:
(1) LH (a, b).
(2) a bH.
(3) aH = bH.
(4) b1 a H.
(5) a1 b H.
(6) RH (a1 , b1 ).
(7) a1 Hb1 .
(8) Ha1 = Hb1 .

Dimostrazione. Tenuto conto dellEsercizio 3.6.2, lequivalenza delle condizioni (1),
(2), (3) è conseguenza della Proposizione e Definizione 1.14.7. Per la stessa ragione sono
equivalenti le condizioni (6), (7), (8).
(1)(4). Supponiamo che valga (1). Allora vi è un c H tale a = bc. Moltiplicando
questa a sinistra per b1 otteniamo b1 a = b1 bc = c H, quindi vale la (4).
(4)(1). Supponiamo la (4) e poniamo c = b1 a. Allora a = bc, ossia vale LH (a, b).
(4)(5) Siccome H è un sottogruppo di G, per ogni x G risulta x H se e solo se
x H. In particolare, b1 a H se e solo se a1 b = (b1 a)1 H.
1
Seguendo la traccia di queste semplici dimostrazioni, il lettore può completare la prova

del lemma dimostrando le implicazioni (6)(5) e (5)(6).
Esercizio 3.6.3. Sia G un gruppo, sia H un suo sottogruppo e sia a G. Provare che
le seguenti tre condizioni sono equivalenti:
(1) aH = H.
(2) a H.
(3) aH è un sottogruppo di G
Proposizione e Definizione 3.6.4. Sia G un gruppo e sia H un suo sottogruppo.
Allora vi è una funzione biiettiva da LH verso RH . Di conseguenza, se G è finito, allora
|LH | = |RH |; tale numero si chiama lindice di H in G e si indica con il simbolo (G : H).
Dimostrazione. Consideriamo le due funzioni : LH RH e : RH LH definite

da
(aH) = Ha1 , (Ha) = a1 H per ogni aH LH e Ha RH .
Si tratta di buone definizioni, nel senso che se aH = bH per certi a, b G, allora
Ha1 = Hb1 in base al Lemma 3.6.2. Lasciamo al lettore la verifica che se Ha = Hb,
allora a1 H = b1 H. E` ora immediato verificare che = 1L e = 1R , quindi è
H H
biiettiva ed ha per inversa .
Tenendo presente che LH e RH sono due partizioni di G, la proposizione prece-

dente assieme alla proprietà (3.6.1) ha come conseguenza immediata il seguente teorema
fondamentale.
Teorema 3.6.5 (Teorema di Lagrange). Sia G un gruppo finito e sia H un suo sot-
togruppo. Allora lordine di H è un divisore dellordine di G; precisamente vale la seguente
uguaglianza:
|G| = (G : H)|H|.
Facciamo notare che il Teorema di Lagrange non si inverte!, nel senso che se G è un
gruppo di ordine n e un intero positivo h divide n, ciò non comporta necessariamente che
in G vi sia qualche sottogruppo di ordine h. Mentre ciò è vero p. es. quando G è un
gruppo ciclico finto (vedi il Teorema 3.9.2), vedremo pi` u avanti un esempio di gruppo di
ordine 12 sprovvisto di sottogruppi di ordine 6 (vedi lEsercizio 3.11.6).
3.7 Gruppi quozienti.

Definizione 3.7.1. Sia G un gruppo e sia H un suo sottogruppo. Si dice che H è un
sottogruppo normale di G se per ogni a G risulta aH = Ha; in tal caso si usa la
notazione H G.
Occorre prestare bene attenzione che la condizione aH = Ha esprime luguaglianza

dei due insiemi aH e Ha, non il fatto che se h H, allora ah = ha; naturalmente
questultima circostanza si verifica se G è commutativo. La condizione aH = Ha equivale
ad affermare che, dato h H, vi sono h0 , h00 H tali che ah = h0 a e ha = ah00 ; può
effettivamente accadere che h0 6= h e, in tal caso, deve essere pure h00 6= h (perche?).
In ogni gruppo G i sottogruppi banali G e {u} sono evidentemente normali.
Esercizio 3.7.2. Sia G un gruppo finito. Provare che se H è un sottogruppo di G di

indice due, allora H è un sottogruppo normale.
Esercizio 3.7.3. Determinare tutti i sottogruppi normali dei gruppi S3 , Q8 , D4 .
Esercizio 3.7.4. Provare che se H e K sono due sottogruppi normali di un gruppo G,

allora anche il sottogruppo H K è normale.
Esercizio 3.7.5. Trovare nel gruppo D4 due sottogruppi H, K tali che H K, H K,

K G, ma H non è un sottogruppo normale di G.
Se H è un sottogruppo normale del gruppo G, allora è chiaro che LH = RH . Tuttavia

questuguaglianza può valere anche se H non è un sottogruppo normale, come si può
vedere con lesercizio che segue.
Esercizio 3.7.6. a) Mostrare che per ogni sottogruppo H di S3 risulta LH = RH .

Tuttavia in S3 vi sono tre sottogruppi che non sono normali.
b) Mostrare che il gruppo D4 contiene un sottogruppo H, necessariamente non nor-
male, tale che LH 6= RH .
Se X è un sottoinsieme di un gruppo G e a, b G, il simbolo aXb indica linsieme

degli elementi di G della forma axb, al variare di x in X:
aXb = {axb | x X}.
Lemma 3.7.7. Se H è un sottogruppo di un gruppo G, le seguenti affermazioni sono

equivalenti:
(1) H G.
(2) Per ogni a G risulta aHa1 = H.
(3) Per ogni a G risulta aHa1 H.
(4) Per ogni a G risulta aH Ha.
Dimostrazione. Limplicazione (1)(4) è ovvia.

(4)(3) Supponiamo che valga la (4). Allora, dato a G e h H, esiste un k H
tale che ah = ka, quindi aha1 = k H. Dunque aHa1 H.
(3)(2) Assumendo la (3), dato a G, risulta in particolare a1 Ha H. Di con-
seguenza, preso h H e posto k = a1 ha H, abbiamo h = aka1 aHa1 . Ciò prova
che H aHa1 e quindi la (2).
(2)(1): esercizio.
Proposizione 3.7.8. Siano H e K due sottogruppi di un gruppo G.
(1) Se H e K sono sottogruppi normali di G, allora lo è anche H K.
(2) Se uno dei due sottogruppi H e K è normale, allora
H K = HK = KH
e, se H e K sono ambedue sottogruppi normali di G, allora lo è anche HK.
Dimostrazione. (1) Supponiamo che H e K siano sottogruppi normali di G, sia a G

e h H K. Dallipotesi e dal fatto che h H e h K segue che vi sono h0 H e
k K tali che ah = h0 a e ah = ka, da cui h0 a = ka e quindi h0 = k H K. Ciò prova
che, qualunque sia a G, risulta a(H K) (H K)a, quindi H K G in base al
Lemma 3.7.7.
(2) Supponiamo che sia H G, per esempio. Chiaramente HK 6= . Presi h, h0 H,

k, k 0 K, proviamo che (hk)(h0 k 0 )1 HK, dal che seguirà che HK è un sottogruppo di
G in base alla Proposizione 3.2.2. Siccome H G e h01 H, esiste un h00 H tale che
(kk 01 )h01 = h00 (kk 01 ). Dunque
(hk)(h0 k 0 )1 = hkk 01 h01 = (hh00 )(kk 01 ) HK,
come volevamo. Il fatto che HK = KH è di verifica immediata, tenuto conto che H G.

Inoltre è chiaro che H HK e K HK, per cui H K HK; ma è altres` evidente
che HK H K, per cui H K = HK. Infine, se ambedue H e K sono sottogruppi
normali di G, allora per ogni a G risulta
a(HK) = (aH)K = (Ha)K = H(aK) = H(Ka) = HKa.
Dunque HK G.
Dalla proposizione precedente segue che linsieme N (G) dei sottogruppi normali di un
gruppo G è un sottoreticolo del reticolo G(G) di tutti i sottogruppi di G.
I sottogruppi normali di un gruppo G sono strettamente legati a delle speciali relazioni
di equivalenza in G, che ora andiamo a definire.
Definizione 3.7.9. Una relazione di equivalenza R in un gruppo G si dice compatibile
(con loperazione di G) se vale la seguente proprietà:
dati a, b, a0 , b0 G, se a R b e a0 R b0 , allora aa0 R bb0 .
Per esempio, dato un numero naturale n, sappiamo che nel gruppo Z la congruenza
mod. n è compatibile con laddizione (vedi lEsercizio 1.15.3, a)).
Sia G un gruppo e sia H un sottogruppo normale di G. Allora le classi laterali sinistre
modulo H (che ora sono anche le classi laterali destre) formano una partizione di G e
quindi individuano una relazione di equivalenza in G; si tratta di dichiarare equivalenti due
elementi di G che si trovano nella stessa classe laterale. Precisamente, se a, b G, diciamo
che a è congruo a b modulo H , abbreviando con a b mod. H, se aH = bH, cioè se
b1 a H (si tenga presente il Lemma 3.6.2); chiamiamo tale relazione di equivalenza la
congruenza modulo H. Per esempio, nel gruppo Z la congruenza modulo un numero
naturale n e la congruenza modulo il sottogruppo nZ sono la stessa cosa. Sottolineiamo
che per il Lemma 3.6.2 risulta:
a b mod. H se e solo se aH = bH,

se e solo se a bH,
se e solo se b1 a H.
La congruenza modulo H è compatibile con loperazione di G. Infatti, supponiamo che,

dati a, b, a0 , b0 G risulti a a0 mod. H e b b0 mod. H e siano h, k H tali che
a01 a = h e b01 b = k. Allora abbiamo (a0 b0 )1 (ab) = b01 a01 ab = b01 hb. Siccome H G,
esiste un l H tale che hb = bl, per cui (a0 b0 )1 (ab) = b01 bl = kl H. concludiamo che
ab a0 b0 mod. H.
Viceversa, supponiamo di avere una relazione di equivalenza R in G compatibile con

loperazione e indichiamo con H la classe di equivalenza che contiene lelemento neutro
u. Proveremo che H è un sottogruppo normale di G e, dati a, b G, risulta a R b se e
solo se a b mod. H. Intanto u H, per come abbiamo preso H. Se h, k H, cioè se
h R u e k R u, per la compatibilità di R risulta hk R u e quindi hk H. Inoltre,
siccome h1 R h1 , sempre dalla compatibilità di R segue che hh1 R uh1 , per cui
h1 R u e quindi h1 H. Con ciò abbiamo provato che H è un sottogruppo di G. Se
a G e h H, allora a R a e h R u, quindi ah R a, da cui aha1 R aa1 , cioè
aha1 R u, ossia aha1 H. Dunque aHa1 H, per cui H G in base al Lemma
3.7.7. A questo punto, dati a, b G, grazie alla compatibilità di R risulta a R b se e
solo se b1 a R b1 b, se e solo se b1 a R u, se e solo se b1 a H.
Il ragionamento ora svolto costituisce la dimostrazione del teorema seguente.
Teorema 3.7.10. Sia G un gruppo. Se H è un sottogruppo normale di G, la congruenza

modulo H è una relazione di equivalenza compatible in G. Viceversa, se R è una relazione
di equivalenza compatibile in G, la classe di equivalenza modulo R che contiene lelemento
neutro è un sottogruppo normale H e risulta
a R b se e solo se aH = bH.
Supponiamo che H sia un sottogruppo normale di un gruppo G. Per indicare linsieme

LH = RH delle classi laterali modulo H si usa allora il simbolo G/H, da leggersi G su
H. Il lettore può provare per esercizio che per ogni a, b G risulta
(aH)(bH) = abH. (3.7.1)
Naturalmente, in accordo con le notazioni introdotte (aH)(bH) è linsieme degli elementi

del tipo ahbk, mentre abH è linsieme degli elementi del tipo abl, al variare di h, k, l
H. La (3.7.1) è in accordo con il fatto che la congruenza modulo H è compatibile con
loperazione di G, per cui se due elementi a0 b0 G sono tali che aH = a0 H e bH = b0 H,
allora abH = a0 b0 H. Dunque la (3.7.1) può essere letta come definizione di unoperazione
(aH, bH) 7 abH in G/H. Il fatto notevole è che con tale operazione G/H è un gruppo.
Presi infatti aH, bH, cH G/H, abbiamo
[(aH)(bH)](cH) = (abH)(cH) = ((ab)c)H = (a(bc))H = (aH)[(bH)(cH)],
per cui loperazione (3.7.1) è associativa. Inoltre la classe laterale uH = H dellelemento

neutro U di G funziona come elemento neutro in G/H, dato che per ogni aH G/H
risulta
(aH)H = (aH)(uH) = auH = aH = uaH = (uH)(aH) = H(aH).
Infine, per ogni aH G/H abbiamo
(aH)(a1 H) = aa1 H = uH = a1 aH = (a1 H)(aH),
per cui
(aH)1 = a1 H.
Definizione 3.7.11. Con le notazioni di cui sopra, il gruppo G/H si chiama il gruppo
quoziente di G rispetto ad H. La funzione : G G/H definita da
(a) = aH per ogni a G,
la quale è un omomorfismo suriettivo (controllare!), si chiama la proiezione canonica

di G verso G/H.
Esempio 3.7.12. Il primo esempio di gruppo quoziente lo abbiamo già incontrato, anche
se non lo abbiamo chiamato in questo modo: si tratta del gruppo Zn degli interi mod. n.
Infatti Zn non è altro che il gruppo quoziente Z/nZ.
Esempio 3.7.13. Dato un gruppo G, siccome i due sottogruppi banali {u} e G sono
normali, possiamo considerare i sottogruppi quozienti G/{u} e G/G. Siccome le classi
laterali modulo {u} sono tutte ridotte ad un singolo elemento, per cui risulta G/{u} =
{{a} | a G}, la proiezione canonica : G G/{u} è un isomorfismo. Invece vi è
ununica classe laterale modulo G: si tratta dellintero gruppo G, per cui G/G = {G}.
Esercizio 3.7.14. Provare che il gruppo quoziente Q/Z è infinito (Sugg.: si considerino
le classi laterali dei numeri razionali del tipo 1/n, dove n è un intero positivo...).
3.8 Nucleo e immagine di un omomorfismo di gruppi.

Sottogruppi di un gruppo quoziente.
I sottogruppi normali scaturiscono in modo naturale quando si considerano gli omomor-
fismi fra gruppi. Premettiamo il seguente risultato.
Proposizione 3.8.1. Siano G, G0 due gruppi e sia f : G G0 un omomorfismo.
(1) Se H è un sottogruppo normale di G, allora f (H) è un sottogruppo normale di
f (G).
(2) Se H 0 è un sottogruppo normale di G0 , allora f 1 (H 0 ) è un sottogruppo normale di

G.
Dimostrazione. (Esercizio).
Definizione 3.8.2. Dato un omomorfismo f : G G0 di gruppi, si chiama nucleo di
f , e si indica con Ker(f ), la controimmagine f 1 ({u0 }) dellelemento neutro u0 di G0 . Si
chiama immagine di f il sottogruppo f (G) di G0 ; esso si indica con Im(f ).
In base alla Proposizione 3.8.1 Ker(f ) è un sottogruppo normale di G, dato che {u0 }
è un sottogruppo normale di G0 . In realtà ogni sottogruppo normale H di G è il nucleo
di un omomorfismo di dominio G. Basta per questo considerare il gruppo quoziente e
la proiezione canonica : G G/H; infatti, tenendo presente che lelemento neutro di
G/H è H, abbiamo
Ker() = 1 ({H}) = {a G | (a) = H} = {a G | aH = H} = H. (3.8.1)

Definizione 3.8.3. Sia f : G G0 un omomorfismo di gruppi.

(1) Si dice che f è un monomorfismo se è una funzione iniettiva;
(2) Si dice che f è un epimorfismo se è una funzione suriettiva.

Dunque f : G G0 è un isomorfismo se e solo se è un monomorfismo e un epimorfismo.
Proposizione 3.8.4. Un omomorfismo di gruppi f : G G0 è un monomorfismo se e
solo se Ker(f ) = {u}.
Dimostrazione. Se f è un monomorfismo, ossia è una funzione iniettiva, è chiaro
che deve essere Ker(f ) = {u}. Viceversa, supponiamo che sia Ker(f ) = {u} e siano
a, b G tali che f (a) = f (b). Allora f (ab1 ) = f (a)f (b1 ) = f (a)f (b)1 = u0 , per cui
ab1 Ker(f ). Di conseguenza ab1 = u e quindi a = b. Ciò prova che f è iniettiva.
Proposizione 3.8.5. Sia f : G G0 un omomorfismo di gruppi.

(1) Se H 0 è un sottogruppo di G0 , allora Ker(f ) f 1 (H 0 ).
(2) Se H è un sottogruppo di G, allora f 1 f ((H)) = H(Ker(f )) = (Ker(f ))H.
(3) Se H è un sottogruppo di G, allora f 1 f ((H)) = H se e solo se Ker(f ) H.

Dimostrazione. (1) Siccome {u0 } H 0 allora, tenuto conto della (1.7.6), risulta
Ker(f ) = f 1 ({u0 }) f 1 (H 0 ).
(2) Se H è un sottogruppo di G, allora dalla (1) segue che Ker(f ) f 1 (f (H)).
Siccome H f 1 (f (H)) (vedi la (1.7.7)) e Ker(f ) G, dalla Proposizione 3.7.8 segue
H Ker(f ) = H(Ker(f )) = (Ker(f ))H f 1 (f (H)).
Daltra parte, se a f 1 (f (H)), allora f (a) f (H), ossia esiste un h H tale che
f (a) = f (h), da cui f (ah1 ) = u0 e quindi ah1 Ker(f ). Di conseguenza a = ah1 h
(Ker(f ))H. Concludiamo che f 1 (f (H)) (Ker(f ))H e quindi luguaglianza.
(3) è una diretta conseguenza di (2).
Occupiamoci ora dello studio dei sottogruppi di un gruppo quoziente. Consideriamo

un gruppo G, un suo sottogruppo normale N e indichiamo con G(N, G) linsieme dei sot-
togruppi di G che contengono N . Una facile verifica mostra che G(N, G) è un sottoreticolo
del reticolo G(G) di tutti i sottogruppi di G. Consideriamo inoltre a proiezione canonica
: G G/N , la quale è un epimorfismo e Ker() = N (vedi la (3.8.1)). Se prendiamo
un H G(N, G), siccome N G, allora è anche N H e quindi possiamo considerare il
gruppo quoziente H/N . Evidentemente H/N G/N ; di pi` u, H/N è un sottogruppo di
G/N , perche H/N = (H). Possiamo allora parlare della funzione
: G(N, G) G(G/N )
definita da (H) = H/N per ogni H G(N, G). Se prendiamo un altro sottogruppo
K G(N, G) ed è H K, allora chiaro che H/N K/N , per cui è una funzione
crescente. Vogliamo provare che è un isomorfismo dordine, cioè che possiede uninversa
anchessa crescente; questo comporterà che ogni sottogruppo di G/N è della forma H/N
per un unico sottogruppo H di G contenente N . Definiamo dunque la funzione
: G(G/N ) G(N, G)
nel modo seguente: se H 0 è un sottogruppo di G/N , risulta N = Ker() 1 (H 0 )

(vedi la (1) della Proposizione 3.8.5), per cui 1 (H 0 ) G(N, G); dichiariamo allora
(H 0 ) = 1 (H 0 ). Ora per ogni H G(N, G) e H 0 G(G/N ) abbiamo, tenuto conto
della (3) della Proposizione 3.8.5 (non si dimentichi che Ker() = N H):
((H)) = (H/N ) = 1 (H/N ) = 1 ((H)) = H.
Inoltre per ogni H 0 G(G/N ) risulta
((H 0 )) = ( 1 (H 0 )) = ( 1 (H 0 )) = H,
tenuto conto della suriettività di e dellEsercizio 1.10.11. Dunque le funzioni e sono

luna inversa dellaltra. Il fatto che anche è crescente è di verifica immediata. Abbiamo
dunque dimostrato il teorema seguente.
Teorema 3.8.6. (Teorema di Corrispondenza per i sottogruppi di un gruppo
quoziente). Dato un gruppo G e un suo sottogruppo normale N , ogni sottogruppo di
G/N è della forma H/N per un unico sottogruppo H di G che contiene N . Lassegnazione
H 7 H/N definisce un isomorfismo dal reticolo G(N, G) dei sottogruppi di G contenenti
N verso il reticolo G(G/N ) di tutti i sottogruppi di G/N .
Da tale teorema discende facilmente il seguente corollario.
Corollario 3.8.7. Sia G un gruppo e sia N un suo sottogruppo normale. Se H e K sono
due sottogruppi di G contenenti N , allora risulta
(H/N ) (K/N ) = (H K)/N,

(H/N ) (K/N ) = (H K)/N.
Useremo frequentemente il seguente teorema, il quale può essere considerato come un

raffinamento del Teorema Fondamentale dellInsieme Quoziente (Teorema 1.14.9).
Teorema 3.8.8 (Teorema Fondamentale del Gruppo Quoziente). Sia G un gruppo
e sia N un sottogruppo normale di G. Se G0 è un altro gruppo e f : G G0 è un
omomorfismo tale che N Ker(f ), allora esiste un unico omomorfismo f : G/N G0
che rende commutativo il diagramma 1

G - G/N
H
HH
f H f
HH ?
j G0 .
H
H (3.8.2)
Inoltre risulta:
1
Intendiamo dire che f = f .
(1) f è un epimorfismo se e solo se f è un epimorfismo;

(2) f è un monomorfismo se e solo se N = Ker(f );
(3) f è un isomorfismo se e solo se f è un epimorfismo e risulta N = Ker(f ).
Dimostrazione. Incominciamo con losservare che, dati a, b G, la condizione f (a) =
f (b) equivale alla condizione f (b1 a) Ker(f ) (Esercizio!). Di conseguenza, se a
b mod. N , ossia b1 a N , dallipotesi N Ker(f ) segue f (a) = f (b). Se ora teniamo
presente che G/N è precisamente linsieme quoziente di G rispetto alla congruenza modulo
N , vediamo che ci troviamo nelle condizioni di cui al Teorema 1.14.9, il quale ci assicura
lesistenza di ununica funzione f : G/N G0 che rende commutativo il diagramma
(3.8.2). Ricordiamo che f è definita come segue:
f (aN ) = f (a) per ogni aN G/N .
Se aN, bN G/N , allora
f ((aN )(bN )) = f (abN ) = f (ab) = f (a)f (b)

= f (aN )f (bN ),
per cui f è un omomorfismo.

(1), (2) e (3) non sono altro che la specializzazione delle corrispondenti affermazioni
di cui alla seconda parte del Teorema 1.14.9, perche la condizione N = Ker(f ) equivale
alla condizione secondo cui, presi a, b G, le proprietà a b mod. N e f (a) = f (b) sono
equivalenti. Infatti, da un lato è sempre vero che da a b mod. N segue f (a) = f (b),
come abbiamo sopra rilevato. Se N = Ker(f ) e f (a) = f (b), allora f (b1 a) Ker(f ) = N
e quindi a b mod. N . Viceversa, se da f (a) = f (b) segue a b mod. N qualunque
siano a, b G, supposto a Ker(f ) risulta f (a) = u0 = f (u), quindi a u mod. N , da
cui a N . Ciò prova che deve essere Ker(f ) N e quindi luguaglianza.
Il risultato che segue è una prima importante conseguenza del teorema precedente.
Corollario 3.8.9 (Primo teorema di isomorfismo). Sia f : G G0 un omomorfismo
di gruppi. Allora vi è un isomorfismo
f : G/ Ker(f ) Im(f )
definito da
f (a Ker(f )) = f (a) per ogni a Ker(f ) G/ Ker(f ). (3.8.3)
Dimostrazione. Consideriamo la funzione g : G Im(f ) definita da g(a) = f (a) per
ogni a G; in sostanza g non è che la funzione f nella quale abbiamo alterato il
codominio, sopprimendo gli eventuali elementi di G0 che non si trovano in Im(f ) = f (G).
Evidentemente g è suriettiva; essa è un omomorfismo perche lo è f . Dunque g è un
epimorfismo e, ovviamente, Ker(g) = Ker(f ). Il Teorema 3.8.8, nel quale si pone rispet-
tivamente Im(f ) e g al posto di G0 ed f e si pone N = Ker(g) = Ker(f ), ci fornisce
direttamente la tesi attuale.
3.9 La struttura dei gruppi ciclici.

Ricordiamo che un gruppo G è ciclico se in esso vi è un elemento a che lo genera (vedi la
Definizione 3.4.1). In tal caso risulta dalla Proposizione 3.4.2 che
G = {ah | h Z},
oppure
G = {ha | h Z},
a seconda che loperazione di G sia notata moltiplicativamente o additivamente. Ogni
gruppo G contiene sottogruppi ciclici; preso un singolo elemento a G, se a non genera
lintero G, abbiamo comunque il sottogruppo ciclico hai = {ah | h Z} generato da
a. Quanto ad esempi concreti di gruppi ciclici, innanzi tutto disponiamo del gruppo
additivo Z degli interi. Se n è un intero positivo, il gruppo Zn degli interi mod. n è
ciclico di ordine n ed è generato da [1] = 1 + nZ, comè immediato verificare. Anche il
gruppo moltiplicativo Un delle radici n-esime complesse del numero 1 è ciclico di ordine
n, essendo generato dal numero z1 = cos 2 n
+ i sen 2
n
(Sezione 2.9). Supponiamo, dunque,
che G sia un gruppo ciclico generato da un suo elemento a. Per il Teorema 3.1.7 possiamo
considerare lomomorfismo : Z G definito da (h) = ah , per ogni h Z, il quale
è un epimorfismo perche Im() = {ah | h Z} = G. In base al Primo Teorema di
Isomorfismo (Corollario 3.8.9) abbiamo allora un isomorfismo : Z/ Ker() G definito
da (h + Ker()) = ah . Tenuto conto del Teorema 3.5.1, abbiamo che Ker() = nZ per
un unico intero n > 0. Se G è finito, è evidente che non può essere iniettivo e quindi
Ker() 6= {0}, per cui n > 0 e è un isomorfismo da Zn verso G; come si vede n è
precisamente lordine di G. Se G è infinito, per quanto appena visto deve essere n = 0,
ossia Ker() = {0} e quindi è un isomorfismo. Abbiamo dunque dimostrato il teorema
che segue.
Teorema 3.9.1 (Teorema di Struttura dei Gruppi Ciclici). Sia G un gruppo ciclico
e sia a un suo generatore.
(1) Se G è finito ed ha ordine n, allora è isomorfo a Zn . Precisamente la funzione

: Zn G definita da (h + nZ) = ah è un isomorfismo e risulta
G = {u = a0 , a1 , a2 , . . . , an1 },
dove gli elementi indicati sono distinti. Di conseguenza an = u e n divide ogni intero
h tale che ah = u; in particolare n è il pi`
u piccolo intero positivo tale che an = u.
(2) Se G è infinito, allora G è isomorfo a Z. Precisamente la funzione : Z G definita

da (h) = ah è un isomorfismo. Di conseguenza risulta ah = u se e solo se h = 0.
Passiamo ora allo studio dei sottogruppi di un gruppo ciclico. Supponiamo che G sia
un gruppo ciclico finito di ordine n e consideriamo lisomorfismo : Zn G di cui al
Teorema 3.9.1. In base alla Proposizione 3.4.8 abbiamo allora lisomorfismo di reticoli
G() : G(Zn ) G(G) definito da G()(H) = (H) per ogni sottogruppo H di Zn . Di
conseguenza, ogni informazione che possiamo ottenere analizzando i sottogruppi di Zn ci
fornirà uninformazione sui sottogruppi di G. Dato che Zn = Z/nZ, per il Teorema 3.8.6 i
sottogruppi di Zn sono tutti e solo della forma L/nZ, dove L è un sottogruppo di Z conte-
nente nZ, ossia L = rZ/nZ, dove r è un divisore positivo di n (vedi il Lemma 3.5.2). Indi-
cando con D(n) linsieme dei divisori positivi di n, la funzione : D(n) G(Zn ) definita
da (r) = rZ/nZ è biiettiva (perche?), per cui la composizione = G() : D(n) G(G)
è anchessa biiettiva; precisamente, per ogni r D(n) risulta:
(r) = G()((r)) = G()(rZ/nZ)

= (rZ/nZ) = {(rh + nZ) | h Z}
= {arh | h Z} = {(ar )h | h Z}
= har i.
Per quanto riguarda lordine di har i, posto n = rs, lasciamo al lettore per esercizio la prova
del fato che |rZ/nZ| = |har i| = s. Concludiamo che lassegnazione r 7 har i definisce una
biiezione da D(n) verso linsieme G(G) dei sottogruppi di G, i quali sono dunque tutti
ciclici.
Occupiamoci ora del caso in cui G è infinito. Ancora dal Teorema 3.9.1 abbiamo
lisomorfismo : Z G definito da (h) = ah , il quale induce lisomorfismo di reticoli
G() : G(Z) G(G) definito da G()(H) = (H) per ogni sottogruppo H di Z. Tenuto
conto del Teorema 3.5.1, la funzione : N G(Z) definita da (r) = rZ è biiettiva, per
cui la composizione = G() : N G(G) è anchessa biiettiva; per ogni r N abbiamo:
(r) = G()((r)) = G()(rZ)

= (rZ) = {(rh) | h Z}
= {arh | h Z} = {(ar )h | h Z}
= har i.
Lassegnazione r 7 har i definisce dunque una biiezione da N verso linsieme G(G) dei
sottogruppi di G, i quali sono dunque tutti ciclici.
Riassumendo, possiamo enunciare quanto segue.
Teorema 3.9.2. Ogni sottogruppo di un gruppo ciclico G = hai è a sua volta ciclico.
Precisamente:
7 har i definisce una biiezione dallin-
(1) Se G è finito di ordine n, lassegnazione r
sieme D(n) dei divisori positivi di n verso il reticolo G(G) dei sottogruppi di G.
Se r D(n), allora har i ha ordine n/r.
(2) Se G è infinito, lassegnazione r 7 har i definisce una biiezione da N verso il reticolo

G(G) dei sottogruppi di G.
Supponiamo di avere un gruppo ciclico finito G = {u, a1 , a2 , . . . , an1 } di ordine n,

generato da un elemento a. Se r è un divisore positivo di n, dal teorema precedente sap-
piamo che lordine del sottogruppo har i è n/r. Se ora prendiamo un qualunque elemento
ak G, con 2 6 k 6 n 1, qualè lordine del sottogruppo hak i? La risposta è fornita
dalla proposizione seguente.
Proposizione 3.9.3. Sia G un gruppo ciclico finito di ordine n, sia a un suo generatore
e sia k un intero tale che 2 6 k 6 n 1. Allora risulta hak i = had i, dove d = MCD(k, n),
per cui hak i ha ordine n/d.
Dimostrazione. Per la Proposizione 3.5.5 vi sono x, y Z tali che d = kx + ny. Allora,

posto h = k/d, abbiamo:
hak i = hadh i = h(ad )h i had i = hakx+ny i = hakx any i = hakx i = h(ak )x i hak i,
(abbiamo usato il fatto che any = u per ogni y Z) da cui hak i = had i.
Abbiamo già osservato che se un intero x genera Z, allora x = 1, oppure x = 1. Di

conseguenza, alla luce del Teorema 3.9.1, se G è un gruppo ciclico infinito e a è un suo
generatore, lunico altro elemento che genera G è a1 . Segue invece dalla Proposizione
3.9.3 che se G è ciclico finito, allora esso può avere molti pi`
u generatori, come precisato
dal risultato che segue.
Corollario 3.9.4. Sia G un gruppo ciclico finito di ordine n, sia a un suo generatore e
sia k un intero tale che 2 6 k 6 n 1. Allora ak è un generatore di G se e solo se k e n
sono relativamente primi.
Se G è un gruppo qualunque e a è un suo elemento, possiamo applicare i risultati

generali ottenuti sui gruppi ciclici al sottogruppo hai generato da a. Per il Teorema 3.9.1
hai è finito se e solo se vi è qualche intero k 6= 0 tale che ak = u, ossia se e solo se
Ker() 6= 0, dove : Z G è lomomorfismo definito da (h) = ah ; se ciò accade, allora
Ker() = nZ per un intero n > 0 e risulta |hai| = n. Essendo n pi` u piccolo intero positivo
u piccolo intero positivo tale che an = u;
presente in nZ (vedi il Teorema 3.5.1), n è il pi`
h r
inoltre, per ogni h Z risulta a = a , dove r è il resto della divisione di h per n. Per
riassumere:
Proposizione e Definizione 3.9.5. Si dice che un elemento a di un gruppo G ha

periodo finito, oppure che è un elemento di torsione, se vi è qualche intero positivo
k tale che ak = u; il pi`
u piccolo di tali interi si chiama lordine o il periodo di a (esso
coincide con lordine del sottogruppo hai). Se invece ak 6= u per ogni k 6= 0, allora si
dice che a è un elemento di periodo infinito o senza torsione. Se a è un elemento di
torsione di ordine n allora, dati h, k Z, risulta
ah = ak se e solo se h n k.
Di conseguenza
hai = {ah | h N} = {u = a0 , a, a2 , . . . , an1 }.
Qualunque sia il gruppo G, il suo elemento neutro ha periodo 1. Se G è un gruppo

finito, è evidente che ogni suo elemento è di torsione. Per contro, vi sono gruppi infiniti
che hanno elementi di torsione diversi dallelemento neutro; anzi, vi sono gruppi infiniti
nei quali tutti gli elementi hanno periodo finito (vedi gli esercizi seguenti).
Esercizio 3.9.6. Determinare gli elementi di torsione nei gruppi moltiplicativi Q e R .

Esercizio 3.9.7. Determinare gli elementi di torsione nel gruppo moltiplicativo U dei
numeri complessi di modulo 1.
Esercizio 3.9.8. Il gruppo Q/Z è infinito (Esercizio 3.7.14); mostrare che ogni suo
elemento ha periodo finito.
Proposizione 3.9.9. Se G è un gruppo finito di ordine n, lordine di ciascun elemento

di G è un divisore di n. Di conseguenza risulta an = u per ogni a G.
Dimostrazione. Se a G, per il Teorema di Lagrange (Teorema 3.6.5) lordine del

sottogruppo hai, ossia lordine di a, è un divisore di n.
Con il teorema seguente determiniamo la struttura dei gruppi finiti il cui ordine è un
numero primo.
Teorema 3.9.10. Dato un gruppo G 6= {u}, le seguenti affermazioni sono equivalenti:
(1) Lunico sottogruppo proprio di G è {u}.
(2) G è finito e il suo ordine è un numero primo.
(3) G è isomorfo a Zp , dove p è un numero primo.
Dimostrazione. (1)(3) Supponiamo che valga (1). Se a G e a 6= u, allora hai = G.

Dunque G è ciclico ed è necessariamente finito, altrimenti per il Teorema 3.9.1 G sarebbe
isomorfo a Z e quindi avrebbe infiniti sottogruppi. Dunque G è isomorfo a Zp per qualche
intero p > 1. Il fatto che p deve essere primo segue ora dalla (1) del Teorema 3.9.2.
(3)(2): è ovvio.
(2)(1) Se vale (2), dal Teorema di Lagrange segue che G e {u} sono gli unici
sottogruppi di G.
3.10 La struttura del gruppo delle permutazioni.

Cicli di una permutazione.
In questa sezione ci proponiamo di approfondire le nostre conoscenze circa la struttura
del gruppo simmetrico Sn (Esempi 2.2.5 e 3.3.1). Ricordiamo che Sn è il gruppo delle
permutazioni dellinsieme n = {1, 2, . . . , n}. Se consideriamo una qualunque permu-

tazione Sn , essa induce in modo naturale una relazione binaria nellinsieme n.

Precisamente, se x, y n, scriviamo x y per indicare che si verifica il fatto seguente:
y = h (x) per qualche h Z.

In parole semplici, la proprietà x y significa che y è ottenibile, partendo da x, iterando

un numero finito di volte la permutazione . La relazione è unequivalenza. Infatti,

per ogni x n risulta x = 1n (x) = 0 (x), per cui x x. Se x y per certi x, y n,
ossia y = h (x) per qualche h Z, applicando ad ambo i membri linversa h di h

otteniamo x = h (y) e quindi y x. Infine, se per certi x, y, z n risulta x y e y z,
ossia vi sono h, k Z tali che y = h (x) e z = k (y), allora z = k (h (x)) = h+k (x),

per cui x z. Le classi di equivalenza dellinsieme n modulo si chiamano le orbite
della permutazione . Come sono fatte le orbite di ? Sia X una di esse. Se X consiste
di un singolo elemento x, ciò significa semplicemente che x non viene mosso da , ossia
(x) = x; in tal caso si dice che X è unorbita banale di . Altrimenti X ha almeno
due elementi e si dice allora che X è unorbita non banale di . In questo caso, scelto
un qualunque elemento x X, per quanto detto sopra i rimanenti elementi elementi sono
quelli della forma h (x) al variare di h Z. Dunque
X = {h (x) | h Z}.
Dato che X è un insieme finito, vi sono due interi distinti h, k tali che h < k e h (x) =
k (x); questa equivale alla kh (x) = x (perche?). Se è per esempio h < k, ossia kh > 0,
ciò permette di affermare che linsieme
A = {m N | m (x) = x}
non è vuoto e per il Principio del Minimo esso ha il minimo: sia questo r. Mostriamo
che, dato un intero h, risulta h (x) = x se e solo se r divide h. Infatti, da un lato per
ogni intero t risulta rt (x) = x (vedi lEsercizio 2.4.4). Viceversa, supponiamo che sia
h (x) = x e scriviamo h = qr + s, dove q ed s sono rispettivamente il quoziente e il resto
della divisione di h per r (Teorema 1.6.3). Allora otteniamo:
x = h (x) = qr+s (x) = (s qr )(x) = s (qr (x)) = s (x).
Siccome 0 6 s < r, se fosse 0 < s, risulterebbe s A contro il fatto che r è il minimo di

A. Dunque s = 0 e quindi r divide h. A sua volta, quanto sopra porta come conseguenza
che, dati due interi h, k, risulta h (x) = k (x), ossia kh (x) = x, se e solo se h, k sono
fra loro congrui modulo r. Possiamo concludere che
X = {x, (x), 2 (x), . . . , r1 (x)} (3.10.1)
e gli elementi indicati sono distinti, per cui r = |X|. Riassumendo:
Proposizione 3.10.1. Sia X unorbita non banale di una permutazione Sn . Se

r = |X|, per ogni x X vale la (3.10.1); inoltre h (x) = k (x) se e solo se h, k sono fra
loro congrui modulo r.
Per esempio, se

1 2 3 4 5 6 7 8 9 10
= S9 ,
5 1 7 6 2 3 4 10 9 8
allora vediamo che

(1) = 5, 2 (1) = 2, 3 (1) = 1.
Dunque una prima orbita è {1, 2, 5}. Successivamente,
(4) = 6, 2 (4) = 3, 3 (1) = 7, 4 (1) = 4,

per cui {3, 4, 6, 7} è unaltra orbita. Ancora,
(8) = 10, 2 (8) = 8,
quindi {8, 10} è una terza orbita. Lultimo elemento che rimane, cioè 9, è lasciato fisso
da e riempie lunica orbita banale {9}.
Di particolare interesse sono le permutazioni che hanno una sola orbita non banale.
Se è una tale permutazione e X è la sua unica orbita non banale, posto r = |X| e preso
un elemento x1 X deve risultare
X = {x1 , (x1 ), 2 (x1 ), . . . , r1 (x1 )}
in base alla Proposizione 3.10.1. Dunque, posto
x2 = (x1 ), x2 = 2 (x1 ), ..., xr = r1 (x1 ),
permuta ciclicamente x1 , x2 , . . . , xr e lascia fissi gli altri elementi di n. Si dice allora

che è un ciclo di lunghezza r, o r-ciclo, e si indica con il simbolo (x1 x2 . . . xr )
(oppure (x1 , x2 , . . . , xr ) nel caso in cui lassenza delle virgole dovesse causare ambiguità).
Lunica orbita non banale di viene detta semplicemente lorbita di . Per esempio,
scrivere = (2413) vuol dire che (2) = 4, (4) = 1, (1) = 3, (3) = 2 e (x) = x se
x 6= 1, 2, 3, 4. In questordine di idee appare chiaro che gli r simboli
(x1 x2 . . . xr ), (x2 x3 . . . xr x1 ), . . . (xr x1 x2 . . . xr1 )
rappresentano tutti uno stesso ciclo.
Nota 3.10.2. Un ciclo non è univocamente individuato conoscendo la sua orbita; occorre
precisare anche la sequenza secondo cui vengono mossi gli elementi di questa! (Vedi
lesercizio che segue).
Esercizio 3.10.3. Dati degli interi r, n tali che 2 < r 6 n e un sottoinsieme X n con
|X| = r, quanti sono i cicli di Sn che hanno X come orbita?
Proposizione 3.10.4. Sia = (x1 x2 . . . xr ) un ciclo di lunghezza r di Sn . Allora per

ogni coppia di interi j, k tali che 0 6 j 6 r e 0 6 k 6 r risulta

k xj+k , se j + k 6 r;
(xj ) = (3.10.2)
xj+kr , se j + k > r.
Di conseguenza è un elemento di ordine r di Sn .
Dimostrazione. Procediamo per induzione finita su k, per 0 6 k 6 r. Se k = 0, la

(3.10.2) è evidentemente vera, dato che 0 = 1n . Assumiamo 0 6 k < r e supponiamo
che la (3.10.2) sia vera. Ser j + (k + 1) 6 r, allora j + k < r, quindi dallipotesi induttiva
segue che k (xj ) = xj+k . Di conseguenza
k+1 (xj ) = ( k (xj )) = (xj+k ) = xj+(k+1) .

Supponiamo j + (k + 1) > r. Se è j + (k + 1) = r + 1, allora j + k = r e dallipotesi

induttiva segue che k (xj ) = xj+k = xr , per cui
k+1 (xj ) = ( k (xj )) = (xr ) = x1 = xj+(k+1)r .
Se poi j + (k + 1) > r + 1, allora j + k > r e ancora dallipotesi induttiva segue che

k (xj ) = xj+kr . Di conseguenza
k+1 (xj ) = ( k (xj )) = (xj+kr ) = x(j+kr)+1 = xj+(k+1)r
(si tenga presente che, essendo 0 6 k < r, risulta j + k < 2r, per cui j + k r < r).
Possiamo ora concludere che la (3.10.2) vale ancora sostituendo k + 1 in luogo di k.
Infine dalla (3.10.2) otteniamo che r = 1n . Se fosse s = 1n per un intero positivo
s < r, allora lorbita di avrebbe non più di s < r elementi, in contrasto con lipotesi.
Dunque lordine di è r.
Due cicli , si dicono disgiunti se le loro orbite hanno intersezione vuota, cioè se,
dato x n, da (x) 6= x segue (x) = x e da (x) 6= x segue (x) = x: ciascuno dei due
lascia fermi gli elementi mossi dallaltro.
Lemma 3.10.5. Se , sono due cicli disgiunti, allora = .
Dimostrazione. Sia x n. Se (x) = x = (x), allora è ovvio che ((x)) = ((x)).

Se (x) 6= x, allora (x) = x e quindi ((x)) = (x); inoltre, siccome è biiettiva,
deve essere ((x)) 6= (x), per cui ((x)) = (x). Concludiamo che ((x)) = (x) =
((x)). In modo analogo si vede che se (x) 6= x, allora ((x)) = ((x)). Dunque la
tesi.
Teorema 3.10.6. Sia Sn , con 6= 1n . Allora esistono dei cicli a due a due disgiunti
1 , . . . , s tali che
= 1 s . (3.10.3)
Tale scomposizione è essenzialmente unica, nel senso che se è anche = 1 t , dove
1 , . . . , t sono anchessi cicli a due a due disgiunti, allora s = t e la successione (1 , . . . , s )
differisce dalla (1 , . . . , t ) al pi`
u per lordine nel quale si susseguono gli elementi.
Dimostrazione. Dato che 6= 1n , la permutazione ha delle orbite non banali; siano

queste
X1 , X2 , . . . , Xs .
Per ogni i {1, . . . , s}, sia ri = |Xi | e scegliamo un elemento xi1 Xi ; poniamo inoltre
xij = j1 (xi1 ) per ogni j {1, . . . , ri } di modo che
Xi = {xi1 , xi2 , . . . , xiri }
(vedi la Proposizione 3.10.1). Se per ogni i {1, . . . , s} consideriamo il ciclo
i = (xi1 xi2 . . . xiri ),

è ora chiaro che i cicli 1 , . . . , s sono a due a due disgiunti e vale la (3.10.3), come risulta
facilmente confrontando le immagini tramite i due membri del generico elemento x n
(Esercizio!).
Infine, supponiamo di avere una seconda scomposizione = 1 t di nel prodotto
di cicli a due a due disgiunti, diversa dalla (3.10.3). Se Y1 , . . . , Yt sono le orbite rispettive
di 1 , . . . , t , deve allora risultare
{Y1 , . . . , Yt } = {X1 , . . . , Xs },
per cui s = t. In vista del Lemma 3.10.5 possiamo cos` supporre che sia 1 6= 1 ma
Y1 = X1 . Ciò significa che vi è un x X1 n tale che (x) = 1 (x) 6= 1 (x) = (x),
quindi una contraddizione. Concludiamo che la scomposizione di nel prodotto di cicli
a due a due disgiunti è unica, a parte lordine dei fattori.
I cicli 1 , . . . , s della scomposizione (3.10.3) si chiamano i cicli di . La dimostrazione

stessa del teorema precedente suggerisce come procedere in pratica per la ricerca di tali
cicli. Come in molte circostanze, un esempio concreto vale molto pi` u di ogni spiegazione
di carattere generale.
Esempio 3.10.7. Consideriamo la permutazione S12 definita da

1 2 3 4 5 6 7 8 9 10 11 12
= .
7 12 1 3 8 10 4 5 9 6 2 11
Scegliamo un elemento di 12 = {1, 2, . . . , 12} mosso da , per esempio 1. Vediamo che
(1) = 7, 2 (1) = (7) = 4, 3 (1) = (4) = 3, 4 (1) = (3) = 1,
quindi (1 7 4 3) è uno dei cicli della scomposizione di , la cui orbita è {1, 3, 4, 7}. Conside-
rato poi un elemento mosso da che non si trova in quellorbita, per esempio 5, troviamo
che
(5) = 8, 2 (5) = (8) = 5.
Dunque (5 8) è un altro dei cicli della scomposizione di con corrispondente orbita {5, 8}.
Nuovamente, si prende un elemento mosso da che non si trova in qualcuna delle orbite
gi`
a trovate e si procede come sopra, fino ad esaurire tutti gli elementi mossi da . Troviamo
cos` i rimanenti cicli di , che sono (2 , 12 , 11) e (6 , 10). Concludiamo che
= (1 7 4 3)(5 8)(2 , 12 , 11)(6 , 10)
è la scomposizione di a nel prodotto di cicli a due a due disgiunti. Si noti che 9 non
compare in nessun ciclo, per il semplice motivo che non viene mosso da .
Esempio 3.10.8. Dovrebbe essere abbastanza evidente che, affinche una permutazione
diversa dallidentità non sia un ciclo, bisogna che muova almeno 4 elementi. Di
conseguenza nei gruppi S2 e S3 tutte le permutazioni diverse dallidentità sono cicli. Nel
gruppo S4 le 23 permutazioni diverse dallidentità sono ripartite come segue:
(1) 6 cicli di lunghezza 2: (1 2), (1 3), (1 4), (2 3), (2 4), (3 4);
(2) 8 cicli di lunghezza 3: (1 2 3), (1 3 2), (1 2 4), (1 4 2), (1 3 4), (1 4 3), (2 3 4), (2 4 3);
(3) 6 cicli di lunghezza 4: (1 2 3 4), (4 3 2 1), (1 3 2 4), (4 2 3 1), (1 4 2 3), (3 2 4 1);
(4) 3 prodotti di due cicli disgiunti: (1 2)(3 4), (1 3)(2 4), (1 4)(2 3).
Esercizio 3.10.9. Decomporre nel prodotto di cicli a due a due disgiunti le due permu-
tazioni (1 2 3 4)(1 2 3 5)(1 2 3 6)(1 2 3 7) e (1 2 3)(2 3 4)(3 4 5)(4 5 6)(5 6 7).
Esercizio 3.10.10. Dati due interi k, n con 2 6 k 6 n, calcolare quanti sono i cicli di
lunghezza k in Sn .
Esercizio 3.10.11. Trovare tutti i sottogruppi di ordine 2 di S4 .
Esercizio 3.10.12. Trovare tutti i sottogruppi di ordine 3 di S4 .
Abbiamo visto con la Proposizione 3.10.4 che se Sn è un ciclo di lunghezza r, allora
r è lordine di , ossia lordine del sottogruppo hi generato da . La scomposizione
nel prodotto di cicli a due a due disgiunti di una permutazione permette di valutare
immediatamente lordine di questultima, come precisato dal risultato che segue.
Proposizione 3.10.13. Sia Sn con 6= 1n e sia = 1 s la fattorizzazione di
nel prodotto di cicli a due a due disgiunti. Se r1 , . . . , rs sono le lunghezze di 1 , . . . , s
rispettivamente, allora lordine di è mcm(r1 , . . . , rs ).
Dimostrazione. Posto m = mcm(r1 , . . . , rs ), risulta
m = 1m sm = 1n .
La prima uguaglianza deriva dalla Regola (F) di calcolo in un gruppo, tenuto conto del
fatto che cicli disgiunti sono permutabili (Lemma 3.10.5), mentre la seconda segue dal
fatto che km = 1n per ogni k = 1, . . . , s. Ricordiamo poi che, per ogni k = 1, . . . , s,
la restrizione di allunica orbita non banale del ciclo k coincide con k stesso: di
conseguenza, se per un intero l Z risulta l = 1n , allora kl = 1n e quindi l è divisibile
per rk (ricordare la (1) del Teorema 3.9.1). Dunque l è divisibile per m e ciò prova che m
è lordine di .
3.11 Parità di una permutazione.

Il gruppo alternante An.
Un ciclo di lunghezza 2 di Sn si chiama trasposizione o scambio . Dunque una per-
mutazione è una trasposizione se e solo se scambia due elementi di n e lascia fissi i
rimanenti. In tal caso è chiaro che 6= 1n e 2 = 1n , ossia 1 = . Limportanza delle
trasposizioni risiede nel seguente risultato.
Proposizione 3.11.1. Dato un ciclo (x1 x2 . . . xr ) di Sn , risulta
(x1 x2 . . . xr ) = (x1 xr )(x1 xr1 ) (x1 x3 )(x1 x2 ). (3.11.1)
Di conseguenza ogni permutazione è prodotto di trasposizioni, per cui il gruppo Sn è
generato dallinsieme delle trasposizioni.
Dimostrazione. Abbiamo sopra osservato che 1n = 2 per ogni trasposizione . Quanto

alla (3.11.1), essa è di verifica immediata e ci dice che ogni ciclo può essere scomposto
nel prodotto di trasposizioni. Infine, siccome dal Teorema 3.10.6 risulta che ogni per-
mutazione è prodotto di cicli, possiamo concludere che ogni permutazione è prodotto di
trasposizioni.
` importante osservare che, mentre una permutazione 6= 1n è prodotto di un unico

E
insieme di cicli a due a due disgiunti, la scomposizione di nel prodotto di trasposizioni
non è necessariamente unica.
Esempio 3.11.2. Considerato il ciclo (1 2 3 4) S4 , abbiamo che (1 2 3 4) = (2 3 4 1) e
quindi, applicando la (3.11.1), troviamo che (1 2 3 4) = (1 4)(1 3)(1 2) = (2 1)(2 4)(2 3).
In ogni caso risulta che il numero dei fattori che compaiono in due differenti decompo-
sizioni di una permutazione nel prodotto di trasposizioni è sempre pari o sempre dispari,
questo fatto dipendendo solo dalla permutazione considerata. Per arrivare a questa con-
clusione è necessario introdurre in modo preciso il concetto di parità di una permutazione.
Incominciamo con losservare che, data una permutazione Sn , facendo variare x e y
in n con la condizione che x < y, il prodotto di tutti i valori assoluti del tipo |(y) (x)|
coincide con il prodotto di tutti i valori assoluti del tipo |y x|:
Y Y
|(y) (x)| = |y x|;
x,yn x,yn
x<y x<y
infatti, essendo biiettiva, ogni fattore presente nel primo membro compare esattamente
una volta a secondo membro e viceversa. Di conseguenza il numero

,
Y (y) (x) Y Y
= ((y) (x)) (y x)

x,yn
y x x,yn x,yn
x<y x<y x<y
(vedi lEsercizio 2.6.2) vale 1 oppure 1.

a di una permutazione Sn il
Definizione 3.11.3. Si chiama segnatura o parit`
numero sgn() definito da
Y (y) (x)
sgn() := . (3.11.2)
x,yn
y x
x<y
Si noti che il prodotto indicatoconsiste

di tanti fattori quanti sono i sottoinsiemi di
n 1
due elementi di n, il cui numero è = n(n 1) (Proposizione 1.13.8).
2 2
Proposizione 3.11.4. Se , Sn , allora
sgn() = sgn() sgn().
In altre parole, la funzione sgn : Sn {1, 1} è un omomorfismo dal gruppo Sn verso il
gruppo moltiplicativo formato dai due interi 1, 1.
Dimostrazione. Osserviamo che vale luguaglianza

Y ((y)) ((x)) Y (y) (x)
=
x,yn
(y) (x) x,yn
yx
x<y x<y
poiche, essendo biiettiva, ogni fattore presente nel primo membro compare esattamente
una volta a secondo membro e viceversa. Di conseguenza abbiamo:
Y ()(y)) ()(x))
sgn() =
x,yn
yx
x<y
Y ((y)) ((x))
=
x,yn
yx
x<y
Q Q
x,yn (((y)) ((x))) x,yn ((y) (x))
x<y x<y
= Q Q
x,yn ((y) (x)) x,yn (y x)
x<y x<y

Y ((y)) ((x)) Y (y) (x)
=
(y) (x) yx

x,yn x,yn
x<y x<y

Y (y) (x) Y (y) (x)
=
yx yx

x,yn x,yn
x<y x<y
= sgn() sgn().
Se è una trasposizione, allora sgn() = 1. Infatti scambia fra loro due elementi
distinti x, y e lascia fissi i rimanenti, per cui nel prodotto a secondo membro della (3.11.2)
tutti i fattori valgono 1 eccetto
(y) (x) xy
= = 1.
yx yx
Se consideriamo una qualunque permutazione Sn , questa è uguale ad un prodotto di
trasposizioni in base alla Proposizione 3.11.1:
= 1 t . (3.11.3)
Tenuto conto della Proposizione 3.11.4 abbiamo allora
sgn() = sgn(1 t ) = sgn(1 ) sgn(t ) = (1)t ,
per cui sgn() = 1 se t è pari, mentre sgn() = 1 se t è dispari. Siccome sgn() è

un numero ben definito dalla formula (3.11.2), che dipende unicamente da , possiamo
concludere con il seguente risultato, già precedentemente annunciato.
Teorema e Definizione 3.11.5. Il numero dei fattori che compaiono in una qualunque
scomposizione di una permutazione Sn nel prodotto di trasposizioni è sempre pari
o sempre dispari, questo fatto dipendendo unicamente da . Nel primo caso risulta
sgn() = 1 e si dice che è una permutazione pari; nel secondo risulta sgn() = 1 e si
dice che è una permutazione dispari. Linsieme di tutte le permutazioni pari si indica
con il simbolo An ; esso è il nucleo dellomomorfismo sgn : Sn {1, 1} ed è quindi un
sottogruppo normale di Sn che si chiama il gruppo alternante di grado n.
Come calcolare la parità di una permutazione ? Certamente, la definizione formale

3.11.3 della segnatura di non è comoda da usare in pratica. E ` invece il Teorema 3.11.5
stesso a fornirci il suggerimento decisivo. Infatti, se è un ciclo di lunghezza r > 2, la
(3.11.1) ci dice che è scomponibile nel prodotto di r 1 trasposizioni; di conseguenza
il Teorema 3.11.5 ci dice che è una permutazione pari (risp. dispari) se ha lunghezza
dispari (risp. pari). Se non è un ciclo, si procede alla sua scomposizione nel prodotto
di cicli a due a due disgiunti. Se questa è la (3.10.3), da quanto sopra risulta che è
pari quando il numero dei cicli di lunghezza pari che compaiono a secondo membro della
(3.10.3) è pari, altrimenti è dispari.
Siccome An = Ker(sgn) e sgn è un epimorfismo, allora {1, 1} = Sn /An in base al
Corollario 3.8.9. Di conseguenza An è un sottogruppo di indice 2 di Sn e quindi
n!
|An | = .
2
Esercizio 3.11.6. Elencare tutti gli elementi di A4 e provare che, sebbene A4 abbia
ordine 12, esso non ha sottogruppi di ordine 6.
Capitolo 4
GLI ANELLI
4.1 Le regole di calcolo in un anello.

Nella Sezione 2.5 abbiamo introdotto concetto di anello e, ora che abbiamo informazioni
più approfondite sui gruppi, abbiamo strumenti adeguati per iniziare uno studio un pò
approfondito della struttura degli anelli. Come prima cosa, con la presente sezione inco-
minciamo con lelencare le regole basilari di calcolo negli anelli e, tramite esercizi, acquisi-
amo informazioni sulla struttura dei sottoanelli del campo razionale e su alcuni sottoanel-
li del campo reale, in maniera da avere abbastanza materiale concreto per saggiare i
concetti generali e astratti che tratteremo.
Proposizione 4.1.1. Dato un anello R, valgono le seguenti proprietà:
(1) Per ogni a R risulta a0R = 0R = 0R a.
(2) Se R 6= {0R }, allora 1R 6= 0R .
(3) Per ogni a, b R risulta (a)b = (ab) = a(b).
(4) Per ogni a, b R risulta (a)(b) = ab.
(5) Per ogni a1 , . . . , ah , b1 , . . . , bk R risulta

h X
X k
(a1 + . . . + ah )(b1 + . . . + bk ) = ai b j . (4.1.1)
i=1 j=1
(6) Per ogni a, b R e per ogni n Z risulta
n(ab) = (na)b = a(nb). (4.1.2)
(7) Per ogni a, b R e per ogni m, n Z risulta
(mn)(ab) = (ma)(nb) = (na)(mb). (4.1.3)
135
CAPITOLO 4. GLI ANELLI 136
(8) Se R è commutativo, per ogni a, b R e per ogni n N risulta

n
n
X n
(a + b) = ak bnk . (4.1.4)
k=0
k
Dimostrazione. Essenzialmente queste regole derivano dalle regole elementari di calcolo

in un monoide moltiplicativo e in un gruppo additivo, combinate con la distributività della
moltiplicazione sulladdizione. (1) Siccome a + 0R = a, usando la distributività si ottiene
aa = a(a + 0R ) = aa + a0R , da cui a0R = 0R , perche R è un gruppo abeliano rispetto
alladdizione e quindi ogni suo elemento è cancellabile rispetto ad essa. Analogamente
si vede che 0R a = 0R . Se 1R = 0R , tenuto conto di (1) per ogni a R risulta a =
a1R = a0R = 0R , quindi R = {0R }, il che prova (2). Usando (1) e la distributività,
abbiamo 0R = 0R b = (a + (a))b = ab + (a)b, da cui (a)b = (ab). Analogamente
si prova che a(b) = (ab), quindi vale la (3). La (4) segue ora da (3) tenendo presente
che (a) = a. La (5) è vera per h = 1 e k = 2: si tratta della distributività della
moltiplicazione sulladdizione. Si procede allora con un facile ragionamento di induzione,
prima su k fissando h = 1 e poi su h, fissando k > 2 arbitrario. Allo scopo di provare le
(6) e (7) ricordiamo che, essendo R un gruppo abeliano rispetto alladdizione, risulta
(n)a = n(a) e (mn)a = m(na) per ogni m, n Z e a R. (4.1.5)
Siano dunque a, b R e m, n Z. Supposto dapprima n > 0, ponendo in (4.1.1) h = n,

k = 1, a1 = = ah = a e b1 = b otteniamo (na)b = n(ab), mentre per h = 1, k = n,
a1 = a e b1 = = bk = b otteniamo a(nb) = n(ab). Dunque la (4.1.2) vale per n > 0; che
essa valga anche per n 6 0 segue ora dalla (4.1.5). A questo punto, combinando le (4.1.5)
e la (6) appena provata, vediamo che (mn)(ab) = m(n(ab)) = m(a(nb)) = (ma)(nb),
quindi la (4.1.3). Infine, la prova della (5) è identica a quella già svolta per dimostrare la
Proposizione 1.13.11.
Ricordiamo che un sottoanello di un anello R è un sottoinsieme S R che è un

sottogruppo additivo e un sottomonoide moltiplicativo di R (Definizione 2.5.2). Si verifica
immediatamente che se S è un sottoanello di R allora, con le operazioni indotte, S è a
sua volta un anello e 0S = 0R , 1S = 1R . Per esempio Z è un sottoanello di Q e Q è un
sottoanello di R.
Esercizio 4.1.2. Provare che se R è un sottoanello di Q, allora Z R.
Esercizio 4.1.3. Sia S un sottoanello di un anello commutativo R, sia a un elemento di

R e si consideri linsieme
S[a] := { f0 + f1 a + f2 a2 + + fn an | f0 , f1 , f2 , , fn S, n N }.
Si provi che S[a] è un sottoanello di R ed è il pi`

u piccolo sottoanello di R che contiene S
e a, nel senso che se T è un sottoanello di R tale che a T e S T , allora S[a] T .
Esercizio 4.1.4. Sia p un numero primo.

a) Si provi che, con la notazione dellEsercizio 4.1.3, risulta

Q[ p] = { x + y p | x, y Q }.

b) Provare che se x + y p = u + v p, dove x, y, u, v Q, allora x = u e y = v (usare

la Proposizione 3.5.17). Dedurre che Q[ p] è un campo.
Esercizio 4.1.5. Sia A P e si consideri il sottoinsieme

1 x
p1 , . . . , pn A, x Z, n N
Z A =
p1 pn
di Q. Provare che Z [A1 ] è un sottoanello di Q. Inoltre se anche B P, allora Z [A1 ]

Z [B 1 ] se e solo se A B.
Lo scopo dellesercizio che segue è mostrare che lassegnazione A 7 Z [A1 ] definisce

una biiezione dallinsieme P(P) delle parti di P verso linsieme dei sottoanelli di Q.
Esercizio 4.1.6. Sia R un sottoanello di Q e si ricordi che Z R (Esercizio 4.1.2).

x 1
a) Provare che se 0 6= a = R e la frazione è ridotta, allora R.
y y
x
b) Provare che se 0 6= a = R e la frazione è ridotta, allora per ogni divisore z di
y
1 1
y risulta R. Di conseguenza, se p è un numero primo che divide y, allora R.
z p
c) Si prenda
1
A = p P R

p
e si provi che R = Z [A1 ].
d) Che cosa sono Z [1 ] e Q = Z [P1 ]?
In un anello può accadere che ab = 0 pur essendo a 6= 0 e b 6= 0. Per esempio,

considerato lanello Z6 , risulta 2 6= 0 6= 3, ma 2 3 = 6 = 0.
Definizione 4.1.7. Un elemento a di un anello R si dice zero divisore se esiste un

b R con b 6= 0 tale che ba = 0 oppure ab = 0. Si dice che a è regolare se a non è zero
divisore. Se ogni elemento non nullo di R è regolare, allora si dice che R è un dominio
di integrità, o semplicemente un dominio.
Esercizi 4.1.8. a) Si provi che un elemento a di un anello R è regolare se e solo se a è

cancellabile a destra e a sinistra rispetto alla moltiplicazione.
b) Si provi che in un anello ogni elemento invertibile è regolare. In particolare ogni
corpo è un dominio.
Si noti che Z è un dominio che non è un campo. Segue inoltre dalla definizione che
ogni sottoanello di un dominio è a sua volta un dominio.
4.2 Omomorfismi di anelli. La caratteristica di un

anello.
Definizione 4.2.1. Dati due anelli R, S, una funzione : R S si dice omomorfismo
di anelli se:
(1) per ogni a, b R
(a + b) = (a) + (b), (ab) = (a) (b);
(2) (1R ) = 1S .
Si dice che è un isomorfismo di anelli se è un omomorfismo di anelli biiettivo.

Scriveremo R = S, dicendo che R e S sono anelli isomorfi, se vi è un isomorfismo di
anelli da R verso S. Un automorfismo di un anello R è un isomorfismo di anelli da R
verso R.
In parole, è un omomorfismo di anelli se esso è un omomorfismo di gruppi additivi

e un omomorfismo di monoidi moltiplicativi.
Esempi 4.2.2. a) Dato un intero n > 0, la proiezione canonica : Z Zn , definita da

(a) = a = a + nZ è un omomorfismo di anelli.
b) Se R è un sottoanello di un anello S, liniezione canonica i : R , S è evidentemente
un omomorfismo di anelli. In particolare la funzione identica 1R : R R è un isomorfismo
di anelli. Infine, se R, S, T sono anelli e : R S, : S T sono omomorfismi di anelli,
allora anche la composizione : R T è un omomorfismo di anelli.
Esercizi 4.2.3. a) Sia : R S un omomorfismo di anelli. Provare che se R0 è un

sottoanello di R, allora (R0 ) è un sottoanello di S. Inoltre se S 0 è un sottoanello di S,
allora 1 (S 0 ) è un sottoanello di R.
b) Dimostrare che se : R S è un omomorfismo di anelli, S 6= {0S } e R è un corpo,
allora è iniettivo.
c) Dimostrare che se : R S è un isomorfismo di anelli, allora anche 1 : S R
è un isomorfismo di anelli.
d) Sia : R S un isomorfismo di anelli. Si provi che R è commutativo, oppure è
rispett. un anello con divisione, un campo, un dominio, se e solo se S ha la corrispondente
proprietà.
Un omomorfismo di anelli iniettivo : R S viene spesso chiamato unimmersione

di R in S; si noti che lassegnazione a 7 (a) definisce un isomorfismo di anelli da R
verso il sottoanello (R) di S e, a seconda dei contesti specifici, ciò consente di identificare
ciascun elemento a R con la sua immagine (a) in S, identificando quindi R e (R) e
dicendo che R si immerge come sottoanello in S.
Il seguente risultato è di importanza cruciale.
Teorema 4.2.4. Per ogni anello R vi è un unico omomorfismo di anelli : Z R.

Dimostrazione. Considerato R come gruppo additivo, per il Teorema 3.1.7 esiste un

unico omomorfismo (di gruppi) : Z R tale che (1) = 1R ed è
(h) = h 1R per ogni h Z.
Daltra parte, se : Z R è un qualunque omomorfismo di anelli, è in particolare un

omomorfismo di gruppi additivi tale che (1) = 1R , per cui è necessariamente = . Non
resta altro da provare che è anche un omomorfismo di anelli, ossia (hk) = (h) (k)
per ognih, k Z. Tenuto
conto del Lemma 4.1.1, abbiamo (hk) = (hk)1R = k h1R =
k(h1R ) 1R = h1R k1R = (h)(k).
Limmagine (Z) dellomomorfismo di cui al teorema precedente è un sottoanello di

R (Esercizio 4.2.3 a)); esso consiste di tutti gli elementi della forma h1R al variare di H
in Z. Daltra parte se S è un sottoanello di R, siccome 1R S, allora (Z) S. Come
si vede, (Z) è il pi`
u piccolo sottoanello di R. E` importante notare altres` che (Z) è il
sottogruppo ciclico additivo di R generato da 1R e quindi, per il Teorema di Struttura dei
Gruppi Ciclici (Teorema 3.9.1), esso è isomorfo a Z oppure a Zn per un ben preciso intero
n > 0. Il primo caso si presenta quando è iniettivo (ossia quando h1R = 0R se e solo se
h = 0); il secondo caso si verifica quando h1R = 0R per qualche intero h > 0 e allora n è
il pi`
u piccolo intero positivo tale che n1R = 0R .
Proposizione e Definizione 4.2.5. Con le notazioni di cui sopra, (Z) si chiama il

sottoanello fondamentale di R e si indica con Z1R .
(1) Se Z1R = Zn per un intero n > 0, allora si dice che lanello R ha caratteristica n.
In tal caso, per ogni a R e per ogni h, k Z risulta ha = ka quando h k mod. n;
in particolare ha = 0R quando h nZ.
(2) Se Z1R
= Z, allora si dice che R ha caratteristica zero.
Dimostrazione. Se R ha caratteristica n, per quanto detto sopra n è lordine di 1R come

elemento del gruppo additivo R. Di conseguenza, se h k mod. n, allora h1R = k1R e
quindi, dato un qualunque elemento a R, tenuto conto della Proposizione 4.1.1, (6)
risulta
ha = h(1R a) = (h1R )a = (k1R )a = k(1R a) = ka.
Esempi 4.2.6. a) Evidentemente Z, Q, R hanno caratteristica zero. Per ogni intero

positivo n lanello Zn ha caratteristica n.
b) Ogni anello finito ha ovviamente caratteristica positiva. Ma vi sono anche anelli
infiniti che hanno caratteristica positiva (vedi la Proposizione 4.3.2).
Esercizi 4.2.7. a) Dato un anello R, si provi che Z1R Cen(R).

b) Sia R un anello di caratteristica positiva n. Si provi che nel gruppo additivo R ogni
elemento non nullo ha ordine finito, il quale deve essere un divisore di n.
c) Si provi che nel gruppo additivo Q/Z non è possibile definire alcuna moltiplicazione
che lo renda un anello. (Sugg.: quale caratteristica dovrebbe avere un tale anello?).
d) Si provi che se : R S è un omomorfismo di anelli, allora (Z1R ) = Z1S . Di

conseguenza, se è iniettivo (in particolare se R è un sottoanello di S), allora R ed S
hanno la stessa caratteristica.
e) Siano R, S anelli di caratteristiche m, n rispettivamente. Si provi che se m > 0 ed
esiste un omomorfismo di anelli : R S, allora è necessariamente n > 0 e n divide m.
Teorema 4.2.8. Se R è un dominio, allora la sua caratteristica è zero oppure è un numero

primo.
Dimostrazione. Sia p la caratteristica di R e supponiamo p > 0. Se p non fosse pri-

mo, vi sarebbero due interi
positivi
h, k, minori di p, tali che p = hk. Risulterebbe
0R = p1R = (hk)1R = h1R k1R , pur essendo h1R 6= 0 6= k1R , in contrasto con lipotesi
che R è un dominio.
Proposizione e Definizione 4.2.9. Sia R un anello commutativo di caratteristica un

numero primo p. Allora per ogni a, b R e per ogni i N risulta
i i i
(a + b)p = ap + bp . (4.2.1)
Di conseguenza la funzione : R R, definita da (a) = ap per ogni a R, è un

omomorfismo di anelli che si chiama l omomorfismo di Frobenius dellanello R.
Dimostrazione. Procediamo per induzione su i, osservando che la (4.2.1) è ovviamente

vera se i = 0. Proviamo dapprima che essa è vera per i = 1. Osserviamo che, se
0 < k < p, allora p divide kp . Infatti, siccome k! (p k)! kp = p!, abbiamo che p divide

il primo membro di questa. Daltra parte p non divide k! (p k)!, perche questultimo
è un prodotto di numeri naturali minori di p e p è primo. Dunque p divide kp (stiamo

usando la Proposizione 3.5.9). A questo punto la (4.2.1) segue dalla (4.1.4), tenuto conto
della Proposizione 4.2.5. Sia ora j un intero positivo fissato e supponiamo che la (4.2.1)
sia vera per ogni i < j. Allora abbiamo
j j1 p j1 p j1 p j j
(a + b)p = (a + b)p = ap + bp = ap + b p .
Dunque la (4.2.1) vale per ogni i N.
Corollario 4.2.10. Piccolo Teorema di Fermat. Se p è un numero primo, allora

ap a mod. p per ogni a Z.
Dimostrazione. Sia lomomorfismo di Frobenius dellanello Zp (che ha caratteristica

p). Per ogni a Z, considerato lelemento a Zp abbiamo
(a)p = (a) = (a 1) = a (1) = a 1 = a,
cioè (a)p = a in Zp . Dunque la tesi.
Teorema 4.2.11. Dato un numero naturale p > 0, le seguenti condizioni sono equivalenti:
(1) p è un numero primo.

(2) Zp è un dominio.
(3) Zp è un campo.
Dimostrazione. (1) (2) Supponiamo che p sia primo e siano a, b Z con a b = 0.
Allora p divide a oppure b; dunque a = 0 oppure b = 0. Ciò prova che Zp è un dominio.
Viceversa, supponiamo che Zp sia un dominio. Se a, b N e ab = p, allora a b = ab = 0
in Zp , quindi a = 0 oppure b = 0, ossia a = p oppure b = p. Dunque p è primo.
(2) (3) Supponiamo che Zp sia un dominio. Allora p è primo in virt` u di quanto
appena provato. Se 0 6= a Zp , per il Corollario 4.2.10 risulta (a) = a, cioè (a)p1 a = 1a.
p
Essendo a cancellabile in Zp (vedi Esercizio 4.1.8 a)), segue (a)p1 = 1, da cui a (a)p2 = 1
e quindi a è invertibile in Zp .
(3) (2) Ogni campo è un dominio.
4.3 Polinomi.
In questa sezione e nelle successive, salvo avviso contrario, tutti gli anelli che consideriamo
sono da intendersi commutativi.
Fissiamo un anello R e consideriamo linsieme RN di tutte le successioni di elementi
di R (Definizione 1.8.1). Se
f = (f0 , f1 , f2 , . . . , fn , . . .)
è una di tali successioni, si chiama supporto di f linsieme degli i N per i quali è
fi 6= 0. Dire che tale insieme è finito equivale a dire che vi è un n N tale che fi = 0
se i > n. Consideriamo il sottoinsieme S di RN tutte le successioni di supporto finito
e, in esso, introduciamo unaddizione e una moltiplicazione secondo le regole che ora
precisiamo. Innanzi tutto ricordiamo che per dichiarare una successione occorre e basta
specificare i suoi termini. Se f, g S, definiamo dunque la somma f + g e il prodotto
di convoluzione f g come segue: per ogni n N
(f + g)n = fn + gn (4.3.1)
e X
(f g)n := f0 gn + f1 gn1 + + fn1 g1 fn g0 = fi gj . (4.3.2)
i+j=n
Il fatto che le due successioni f e g hanno supporto finito comporta che anche f + g e f g
hanno supporto finito (verificare!), per cui abbiamo effettivamente definito due operazioni
in S.
Proposizione 4.3.1. Rispetto alladdizione puntuale e al prodotto di convoluzione lin-
sieme S è un anello commutativo.
Dimostrazione. Siano date tre successioni f, g, h S. Per ogni n N abbiamo
! !
X X X X X
(f (gh))n = fi (gh)j = fi gr hs = fi (gr hs )
i+j=n i+j=n r+s=j i+j=n r+s=j
X
= fi gr hs ;
i+r+s=n
P
in modo analogo si vede che ((f g)h)n = i+r+s=n fi gr hs . Dunque (f (gh)) = ((f g)h), per
cui il prodotto di convoluzione è associativo. Quanto allelemento neutro per il prodotto
di convoluzione, si controlla facilmente che questo è dato dalla successione 10 : N R tale
che 10 (0) = 1 e 10 (n) = 0 per ogni n > 0, ossia 10 = (1, 0, 0, . . .). Con ciò abbiamo provato
che S è un monoide rispetto al prodotto di convoluzione, la cui commutatività segue dalla
definizione stessa (4.3.2). Per ogni n N abbiamo ora:
X X X
(f (g + h))n = fi (g + h)j = fi (gj + hj ) = fi gj + fi hj
i+j=n i+j=n i+j=n
X X
= fi gj + fi hj = (f g)n + (f h)n
i+j=n i+j=n
= (f g + f h)n ,
per cui f (g + h) = f g + f h. La prova del fatto che S è un gruppo abeliano rispet-

to alladdizione 4.3.1 è quasi banale; lelemento neutro è la successione ovunque nulla
0 = (0, 0, 0, . . . , 0, . . .) e, se f S, allora la sua opposta è la successione f definita da
(f )n = fn per ogni n N.
Per ogni a R possiamo considerare la successione a0 = (a, 0, 0, . . .) RN ; formal-

mente
0 a, se k = 0,
ak := per ogni k N, (4.3.3)
0, se k 6= 0
Allora è immediato verificare che la funzione : R S definita da (a) = a0 è un omo-
morfismo di anelli iniettivo, che chiameremo omomorfismo canonico; di conseguenza è
lecito e conveniente identificare ciascun elemento a R con la corrispondente successione
a0 , considerando dunque R stesso come un sottoanello di S: il sottoanello delle succes-
sioni che hanno nulli tutti i termini da quello di posto 1 in poi. In questordine di idee
lomomorfismo viene detto limmersione canonica di R in RN .
Indichiamo con x, e chiamiamo indeterminata, la successione definita da

1, se k = 1,
xk := per ogni k N, (4.3.4)
0, se k 6= 1
cioè x = (0, 1, 0, 0 . . .). Per ogni n N la n-esima potenza xn = x x (n volte) è la

successione tale che per ogni k N

n 1, se k = n,
(x )k = per ogni k N (4.3.5)
0, se k 6= n
(lo si può provare con una facile induzione su n). Chiaramente xm 6= xn se m 6= n e risulta
x0 = 1. Se a R, allora axn è la successione definita come segue:

n a, se k = n,
(ax )k = per ogni k N. (4.3.6)
0, se k 6= n
Indichiamo definitivamente con il simbolo R[x] lanello (S, +, ), chiamando i suoi elementi
i polinomi nellindeterminata x a coefficienti in R. Se f R[x], per ogni n N
lelemento fn R si chiama ln-esimo coefficiente di f ; lo 0-esimo coefficiente f0 si

dice il termine costante di f . Il pi` u grande indice m tale che fm 6= 0 si chiama il grado
di f e si scrive gr(f ) = m, mentre il coefficiente fm si chiama il coefficiente direttivo
di f ; ciascun elemento a di R, considerato come elemento di R[x], è un polinomio di
grado 0 e si chiama un polinomio costante o semplicemente una costante. Si noti che,
deliberatamente, non attribuiamo alcun grado al polinomio nullo 0. Polinomi di grado
1,2,3,4,. . . si chiamano rispettivamente polinomi lineari, quadratici, cubici, quartici,
ecc..
Se f = (f0 , f1 , . . . , fm , 0, 0, . . .) è un polinomio di grado m, allora
f = (f0 , 0, . . .) + (0, f1 , 0, 0, . . .) + (0, . . . , 0, fm , 0, 0, . . .);
da questa, tenuto conto della (4.3.6) otteniamo la seguente rappresentazione usuale per i
polinomi:
f = f0 + f1 x + f2 x2 + + fm xm . (4.3.7)
Dalle definizioni si deduce facilmente che se f, g sono polinomi non nulli, allora risulta
gr(f + g) 6 sup(gr(f ), gr(g)), gr(f g) 6 gr(f ) + gr(g), (4.3.8)
sempre che f + g 6= 0 e f g 6= 0, rispettivamente. Con la proposizione seguente vediamo

che, almeno in un caso importante, la seconda disuguaglianza diviene unuguaglianza.
Proposizione 4.3.2. Sia R un anello. Allora R[x] è un anello infinito e risulta:
(1) R e R[x] hanno la stessa caratteristica;
(2) R è un dominio se e solo se R[x] è un dominio, nel qual caso la seconda delle (4.3.8)
è unuguaglianza.
Dimostrazione. La (1) segue dal fatto che R[x] contiene R come sottoanello, per cui il
loro sottoanello fondamentale coincide con quello di R.
(2) Supponiamo che R sia un dominio, siano f, g R[x] due polinomi non nulli e siano
u piccoli numeri naturali tali che fr 6= 0 e gs 6= 0. Allora abbiamo
r, s i pi`
(f g)r+s = f0 gr+s + f1 gr+s1 + + fr gs + + fr+s1 g1 + fr+s g0 = fr gs 6= 0.
Dunque f g 6= 0, per cui R[x] è un dominio. Daltra parte, se R[x] è un dominio, allora
anche R è un dominio in quanto sottoanello di R[x]. Infine, siano f, g R[x] polinomi non
nulli e siano m = gr(f ), n = gr(g). Allora (f g)i = 0 se i > m+n, mentre (f g)m+n = fn gn ;
di conseguenza, se R è un dominio, risulta fn gn 6= 0 e quindi
gr(f g) = m + n = gr(f ) + gr(g).
Esercizio 4.3.3. Provare che se R è un qualunque anello, in R[x] vi sono infiniti polinomi
che non hanno un inverso in R[x].
Esercizio 4.3.4. Provare che se R è un dominio, un polinomio f R[x] ha un inverso
in R[x] se e solo se f è una costante invertibile in R.
Esercizio 4.3.5. Trovare in Z4 [x] un polinomio di grado 1 che ha un inverso in Z4 [x].

Esercizio 4.3.6. Dare un esempio di anello R e due polinomi non nulli f, g R[x] tali
che le disuguaglianze (4.3.8) siano strette.
Esercizio 4.3.7. Provare che se R è un qualunque anello, allora vi sono infiniti omomor-
fismi iniettivi di anelli da R[x] in se.
Definizione 4.3.8. Dato un anello R e un polinomio f = f0 + f1 x + + fm xm R[x],
si chiama funzione polinomiale associata ad f la funzione f : R R definita da
f (a) = f0 + f1 a + + fn am per ogni a R.
Solitamente si indica con f (a) lelemento f (a), chiamandolo il valore di f in a (vedi

comunque la Nota 4.3.10 qui appresso).
Esercizio 4.3.9. a) Dato un anello R, si consideri lanello RR con laddizione e molti-
plicazione puntuali. Provare che la funzione : R[x] RR definita da (f ) = f è un
omomorfismo di anelli.
b) Si prenda R = Zp , dove p è un numero primo. Provare che se un polinomio f R[x]
è divisibile per x xp , cioè se esiste un polinomio g R[x] tale che f = (x xp )g, allora
f : R R è la funzione costantemente nulla (Sugg.: Usare il Corollario 4.2.10).
Nota 4.3.10. E importante non confondere un polinomio f R[x] con la relativa
funzione polinomiale f : R R. Infatti LEsercizio 4.3.9, b) insegna che lomomorfismo
: R[x] RR , che ad ogni polinomio assegna la relativa funzione polinomiale, può non
essere iniettivo; in altre parole, due polinomi distinti f, g R[x] possono dare luogo alla
stessa funzione polinomiale. A maggior ragione ciò accade se R è un anello finito, dato
che è allora finito anche RR , mentre R[x] è sempre infinito. Tuttavia, come proveremo pi` u
avanti (vedi la Proposizione 4.8.13), se R è un dominio infinito, il suddetto omomorfismo
è iniettivo, per cui è in questo caso legittimo identificare ciascun polinomio a coefficienti in
R con la relativa funzione polinomiale. Questo è esattamente ciò che si usa fare in Analisi
Matematica, dove è abitudine pensare ad un polinomio f = f0 + f1 x + + fm xm R[x]
come ad una speciale funzione della variabile x, definita in R e a valori in R.
Ogni omomorfismo di anelli : R S si estende canonicamente ai rispettivi anelli
dei polinomi, nel senso chiarito dalla seguente proposizione.
Proposizione 4.3.11. Dato un omomorfismo di anelli : R S, esiste un unico
b : R[x] S[x] tale che
omomorfismo di anelli

b(x) = x e
b(a) = a per ogni a R; (4.3.9)
precisamente
b(f0 + f1 x + + fm xm ) = (f0 ) + (f1 )x + + (fm )xm

(4.3.10)
per ogni polinomio f0 + f1 x + + fm xm R[x]. Se è iniettivo (risp. suriettivo, un

isomorfismo), allora anche
b è iniettivo (risp. suriettivo, un isomorfismo).
Dimostrazione. Unimmediata verifica mostra che la funzione b : R[x] S[x] definita

dalla (4.3.10) è un omomorfismo di anelli che verifica le (4.3.9). Se anche 0 : R[x] S[x]
è un omomorfismo di anelli tale che 0 (x) = x e 0 (a) = a per ogni a R, allora per ogni
f R[x] risulta:
0 (f0 + f1 x + + fm xm ) = 0 (f0 ) + 0 (f1 )x + + 0 (fm )xm

= (f0 ) + (f1 )x + + (fm )xm = b(f ).
Dunque 0 = b. La prova della parte rimanente della proposizione viene lasciata come
esercizio per il lettore.
Teorema 4.3.12. Sia R un anello e supponiamo che vi sia un anello S, un omomorfismo
di anelli : R S e un elemento b S tali che
b(r) = (r)b per ogni r R. (4.3.11)
e : R[x] S tale che

Allora esiste un unico omomorfismo di anelli e(x) = b ed è
commutativo il diagramma

R - R[x]
HH
HH

e
H
HH ?
jS ,
H
(4.3.12)
dove : R R[x] è limmersione canonica.
e ponendo, per ogni f R[x],
Dimostrazione. Definiamo
e(f0 + f1 x + + fm xm ) = (f0 ) + (f1 )b + + (fm )bm ;

(4.3.13)
si verifica facilmente che

e è un omomorfismo di anelli (si noti che lipotesi (4.3.11) su b è
essenziale a questo fine), per il quale è commutativo il diagramma (4.3.12) ed è e(x) = b.
Daltra parte, se : R[x] S è un qualunque omomorfismo di anelli che rende commuta-
tivo il diagramma (4.3.12) (con al posto di e), ciò equivale ad affermare che (a) = (a)
per ogni a R. Se, in pi` u, verifica la condizione che (x) = b, allora (f ) coincide con
il secondo membro della (4.3.13), per ogni f R[x]. Dunque = e.
4.4 Ideali.
In un anello, oltre ai sottoanelli, vi sono altri sottoinsiemi che hanno una rilevanza
fondamentale.
Definizione 4.4.1. Sia R un anello. Si dice che un sottoinsieme I di R è un ideale di
R, e si scrive I 6 R, se:
(1) I è un sottogruppo additivo di R;
(2) Per ogni x I e r R risulta xr I.

Esempio 4.4.2. In ogni anello R, sia {0} che R stesso sono evidentemente ideali; essi si
chiamano gli ideali banali di R. Si chiamano invece ideali propri quelli diversi da R.
Nota 4.4.3. Se I è un ideale di R, allora I è proprio se e solo se 1R 6 I. Infatti, se fosse

1R I, per ogni r R risulterebbe r = 1R r I, per cui R = I.
Definizione 4.4.4. Se a è un elemento di un anello R, il sottoinsieme
(a) = {ar | r R}
è un ideale di R; esso si chiama lideale principale di R generato da a. In generale,

un ideale I di R si dice principale se esiste un elemento a R tale che I = (a).
Si noti che lideale principale (a) generato da a è il minimo ideale di R contenente a;

infatti, se I è un ideale di R e a I, allora ar I per ogni r R, per cui (a) I.
Se I è un sottogruppo additivo di un anello R, ciò non comporta che I sia un ideale
(destro, sinistro o bilatero) di R, come si può vedere con lesercizio che segue.
Almeno in un caso gli ideali sono esattamente i sottogruppi additivi.
Proposizione 4.4.5. Gli ideali dellanello Z sono esattamente i suoi sottogruppi. Infatti
questi sono tutti del tipo nZ per un n N e sono quindi ideali principali.
Dimostrazione. Si tratta di una rilettura del Teorema 3.5.1.
Esercizio 4.4.6. Sia R un anello e sia a R. Tenuto conto della Nota 4.4.3, provare
che (a) = R se e solo se a è invertibile. Dedurre che se I è un ideale di R, allora I = R
se e solo se I contiene un elemento invertibile.
Una volta portato a compimento lesercizio precedente, la seguente proposizione ap-

parirà evidente.
Proposizione 4.4.7. Un anello R 6= {0} è un campo se e solo se {0} e R sono gli unici
ideali sinistri di R.
La proposizione che segue è unimmediata conseguenza della definizione di ideale.
Proposizione 4.4.8. Sia S un anello, sia R un sottoanello di S e sia I un sottoinsieme

di R. Se I è un ideale di S, allora I è anche un ideale di R.
Nota 4.4.9. Importa sottolineare che, ferme restando le ipotesi, non vale lanaloga della
proposizione precedente che si ottiene scambiando nella tesi R ed S. Precisamente, può
accadere che I sia un ideale di R ma non di S, pur continuando ad essere un sottogruppo
additivo di S. Ad illustrare ciò basterebbe il caso in cui R è un sottoanello proprio di S;
infatti, da un lato R è ideale di se stesso, ma non è ideale (ne destro ne sinistro) di S, dal
momento che 1S = 1R R ma R 6= S (vedi la Nota 4.4.3). Come altro esempio, abbiamo
che Z è un sottoanello proprio di Q e Z ha infiniti ideali (Proposizione 4.4.5) ma, tenuto
conto della Proposizione 4.4.7, di questi solo {0} è anche ideale di Q.
Terminiamo questa sezione mostrando come gli ideali di un anello R sono intimamente
legati agli omomorfismi di anelli che hanno per dominio R.
Proposizione 4.4.10. Se : R S è un omomorfismo di anelli, allora Ker() è un

ideale di R.
Dimostrazione. Siccome è un omomorfismo relativamente alla struttura di gruppi

additivi di R e S, già sappiamo che Ker() è un sottogruppo additivo di R (Sezione 3.8).
Se x Ker() e r R, allora (xr) = (x)(r) = 0(r) = 0, per cui xr Ker(),
dunque Ker() è un ideale di R.
Vedremo pi` u avanti (Proposizione 4.5.3) che vale anche il viceversa, cioè ogni ideale
di R è il nucleo di qualche omomorfismo di anelli di dominio R.
Dato un anello R, indichiamo con il simboli L(R) linsieme degli ideali di R. In quanto
insieme di parti di R, penseremo L(R) ordinato rispetto allinclusione; il fatto notevole
è che esso risulta essere un reticolo. Considerati infatti due ideali I, J di R, è un facile
esercizio mostrare che I J è ancora un ideale; esso è ovviamente il massimo ideale
contenuto in I e J, per cui risulta
inf (I, J) = I J.
L(R)
Essendo I, J in particolare sottogruppi additivi di R, possiamo considerare la loro somma

I + J, cioè
I + J = {x + y | x I, y J}.
Lasciamo al lettore la verifica del fatto che si tratta ancora di un ideale. Dovrebbe essere
sufficientemente chiaro che se K è un qualunque ideale di R tale che I K e J K,
allora I + J K, di modo che I + J è il minimo ideale contenente I e J; di conseguenza
sup(I, J) = I + J.
L(R)
La proposizione seguente illustra il comportamento degli ideali rispetto agli omomor-

fismi di anelli; la sua dimostrazione è un facile esercizio (confronta con le Proposizioni
3.2.3 e 3.8.5).
Proposizione 4.4.11. Sia : R S un omomorfismo di anelli.
(1) Se I è un ideale di R, allora (I) è un ideale di (R).
(2) Se J è un ideale di S, allora 1 (J) è un ideale di R.
(3) Posto K = Ker(), per ogni sottoanello, oppure ideale I di R risulta
1 ((I)) = I + K.
Inoltre risulta 1 ((I)) = I + K se e solo se K I.

4.5 Anelli quozienti.

Nella Sezione 3.7 abbiamo visto come i sottogruppi normali di un gruppo G sono stretta-
mente legati alle relazioni di equivalenza in G compatibili con loperazione di G. Ebbene,
uno stesso legame esiste fra gli ideali di un anello R e le relazioni di equivalenza in R
compatibili sia con laddizione che con la moltiplicazione.
Sia I un ideale di un anello R. Allora I, in quanto sottogruppo del gruppo abeliano
additivo R, dà luogo ad una relazione di equivalenza in R compatibile con laddizione,
cioè la congruenza modulo I:
dati a, b R, a b mod. I se e solo se a b I (4.5.1)
(vedi il Teorema 3.7.10). Il fatto che I è un ideale comporta che la congruenza mod. I è
compatibile anche con la moltiplicazione. Infatti, se a a0 mod. I e b b0 mod. I, cioè
a a0 I e b b0 I, allora ab a0 b = (a a0 )b I e a0 b a0 b0 = a0 (b b0 ) I, quindi
ab a0 b0 = (ab a0 b) + (a0 b a0 b0 ) I, per cui aa0 bb0 mod. I.
Viceversa, sia una relazione di equivalenza in R compatibile con laddizione e la
moltiplicazione. Segue allora dal Teorema 3.7.10 che la classe di equivalenza che contiene
0 è un sottogruppo additivo I di R e vale la (4.5.1). Inoltre I è un ideale. Infatti, se
a R e x I, allora x 0 mod. I e a a mod. I. Dalla compatibilità di rispetto alla
moltiplicazione segue xa 0a = 0 mod. I, per cui xa I. Possiamo dunque concludere
con il seguente teorema, che è lanalogo per gli anelli del Teorema 3.7.10.
Teorema 4.5.1. Sia R un anello. Se I è un ideale, la relazione binaria definita dalla

(4.5.1) è una relazione di equivalenza in R compatibile con laddizione e la moltiplicazione.
Viceversa, se è una relazione di equivalenza in R compatibile con laddizione e la
moltiplicazione, allora la classe di equivalenza che contiene 0 è un ideale I e risulta a b
se e solo se a b I.
Se I è un ideale dellanello R, possiamo considerare il gruppo quoziente R/I del gruppo

additivo R rispetto al sottogruppo additivo I e la proiezione canonica : R R/I.
Rammentiamo che gli elementi di R/I sono le classi laterali a + I al variare di a in R:
R/I = {a + I | a R};
inoltre laddizione in R/I è definita come segue:
per ogni a + I, b + I R/I, (a + I) + (b + I) = (a + b) + I (4.5.2)
e è un omomorfismo rispetto alle addizioni in R e R/I. Siccome la congruenza modulo

I è compatibile anche con la moltiplicazione di R, questultima induce, per passaggio al
quoziente, una moltiplicazione in R/I:
per ogni a + I, b + I R/I, (a + I)(b + I) = ab + I; (4.5.3)
con tale moltiplicazione R/I è un monoide e si verifica immediatamente che è un

omomorfismo di monoidi moltiplicativi. Infine abbiamo che la moltiplicazione (4.5.3)
è distributiva sulladdizione; infatti, per ogni a, b, c R risulta

(a + I)[(b + I) + (c + I)] = (a + I)[(b + c) + I] = a(b + c) + I
= (ab + ac) + I = (ab + I) + (ac + I)
= (a + I)(b + I) + (a + I)(c + I)
e, analogamente, [(a + I) + (b + I)](c + I) = (a + I)(c + I) + (b + I)(c + I). Dunque R/I
è un anello e è un omomorfismo di anelli.
Definizione 4.5.2. Sia R un anello e sia I un ideale di R. Lanello R/I, con laddizione
(4.5.2) e la moltiplicazione (4.5.3), si chiama lanello quoziente di R rispetto ad I.
Siccome R/I, come gruppo additivo, non è altro che il gruppo quoziente di R rispetto
allideale I, abbiamo immediatamente il seguente risultato, il quale ci dice anche che ogni
ideale di R è il nucleo di qualche omomorfismo di anelli di dominio R:
Proposizione 4.5.3. Sia R un anello, sia I un ideale di R e sia : R R/I la proiezione
canonica. Allora Ker() = I.
Usando il fatto che un sottoanello, oppure un ideale destro, sinistro, bilatero di R
(risp. di R/I) è in particolare un sottogruppo additivo di R (risp. di R/I), è possibile
specializzare il Teorema 3.8.6 al caso degli anelli, al fine di ottenere informazioni sui
sottoanelli e sugli ideali di R/I. Abbiamo cos` il teorema seguente, nel quale indichiamo
con A(I, R), L(I, R) i sottoreticoli di A(R), L(R) rispettivamente dei sottoanelli e degli
ideali di R contenenti I. La dimostrazione di questo teorema può essere svolta dal lettore,
seguendo la traccia del Teorema 3.8.6 e applicando la Proposizione 4.4.11 alla proiezione
canonica : R R/I.
Teorema 4.5.4. Dato un anello R e un suo ideale I, ogni sottoanello (risp. ideale)
di R/I è della forma J/I per un unico sottoanello (risp. ideale) J di R contenente I.
Lassegnazione J 7 J/I definisce degli isomorfismi dai reticoli A(I, R) e L(I, R) verso i
reticoli A(R/I) e L(R/I) rispettivamente.
Diverse altre proprietà di base dei gruppi quozienti sono valide, mutatis mutandis,
per gli anelli quozienti; salvo qualche dettaglio tecnico, le relative dimostrazioni sono
sostanzialmente analoghe a quelle relative ai gruppi.
Corollario 4.5.5. Sia R un anello e sia I un suo ideale. Se J, K sono due sottoanelli,
oppure due ideali di R contenenti I, allora valgono le seguenti uguaglianze:
(J/I) (K/I) = (J K)/I,
(J/I) + (K/I) = (J + K)/I.
Teorema 4.5.6 (Teorema Fondamentale dellAnello Quoziente). Sia R un anello e sia I
un suo ideale. Per ogni anello S e per ogni omomorfismo di anelli : R S tale che
I Ker() esiste un unico omomorfismo di anelli : R/I S che rende commutativo il
diagramma

R - R/I
HH
H

HH
H ?
jS
H
H (4.5.4)
( : R R/I è la proiezione canonica) e risulta
(a + I) = (a) per ogni a + I R/I.
Inoltre è un isomorfismo se e solo se è suriettivo e I = Ker().
Prendendo nel teorema precedente I = Ker() otteniamo il seguente corollario.

Corollario 4.5.7 (Primo Teorema di Isomorfismo per gli Anelli). Se : R S è un
omomorfismo di anelli, lassegnazione a + Ker() 7 (a) definisce un isomorfismo di
anelli
R/ Ker()
= Im().
In molte circostanze, dato un ideale I di un anello R, ha interesse decidere se lanello
quoziente R/I è isomorfo ad un dato anello S. In questo caso si cerca di definire, se
possibile, un omomorfismo di anelli suriettivo : R S tale che Ker() = I; il I
Teorema di Isomorfismo per gli Anelli 4.5.7 garantisce allora lesistenza di un isomorfismo
R/I = S.
Esempio 4.5.8. Dato un anello R, lideale (x) generato dallindeterminata x è costituito
dai polinomi che hanno termine costante nullo. Lanello quoziente R[x]/(x) è isomorfo
ad R. Per provarlo, consideriamo la funzione : R[x] R definita da (f ) = f0 = f (0).
Una facile verifica mostra che è un omomorfismo di anelli suriettivo e Ker() = (x).
Per il Primo Teorema di Isomorfismo per gli Anelli induce lisomorfismo R[x]/(x) =R
definito da f + (x) 7 f0 .
Esercizio 4.5.9. Dato un anello R e un elemento a R, provare che R[x]/(a x)
= R.
4.6 Ideali massimali ed ideali primi.

Definizione 4.6.1. Dato un anello R, un ideale M di R si dice ideale massimale se
M 6= R e, se I è un ideale di R tale che M I, allora I = M oppure I = R. Linsieme
di tutti gli ideali massimali di R si chiama lo spettro massimale di R si indica con il
simbolo (R).
In altre parole M è un ideale massimale di R se M è proprio e non esiste alcun ideale
proprio di R che contenga propriamente M .
Nota 4.6.2. Si faccia bene attenzione che un ideale massimale di un anello R non è un
elemento massimale del reticolo L(R) degli ideali di R, bens` è un elemento massimale
dellinsieme L(R) {R} degli ideali propri di R.
Esempio 4.6.3. Se a, b sono due numeri naturali e consideriamo gli ideali aZ e bZ di
Z, sappiamo che aZ bZ se e solo se b divide a; di conseguenza, tenuto conto della
Proposizione 4.4.5, gli ideali massimali di Z sono esattamente quelli della forma pZ, dove
p è un numero primo.
Il seguente teorema è una conseguenza immediata della definizione di ideale massimale,
unitamente alla Proposizione 4.4.7.
Teorema 4.6.4. Dato un anello commutativo R 6= {0}, le seguenti condizioni sono

equivalenti:
(1) R è un campo.
(2) {0} è lunico ideale proprio di R.
(3) {0} è un ideale massimale di R.
Se M è un ideale dellanello R, allora M/M/ è lideale nullo di R/M ; combinando il

teorema precedente con il Teorema 4.5.4 otteniamo il seguente risultato fondamentale.
Teorema 4.6.5. Sia R un anello commutativo e sia M un ideale di R. Allora M è un

ideale massimale se e solo se R/M è un campo.
Definizione 4.6.6. Dato un anello R, un ideale P di R si dice ideale primo se P 6= R e,

dati a, b R, se ab P allora a P oppure b P . Linsieme di tutti gli ideali massimali
di R si chiama lo spettro primo di R si indica con il simbolo Spec(R).
Il teorema che segue fornisce delle caratterizzazioni equivalenti per gli ideali primi.
Teorema 4.6.7. Se P è un ideale proprio di un anello R, le seguenti affermazioni sono

equivalenti:
(1) P è un ideale primo.
(2) R/P è un dominio.
(3) R P è un sottomonoide moltiplicativo di R.
(4) Dati due ideali I, J di R, se IJ P , allora I P oppure J P .
Dimostrazione. Lequivalenza (1)(3) segue dal fatto che la (3) è semplicemente una
riformulazione, con parole diverse, della Definizione 4.6.6, mentre lequivalenza (1)(2)
si prova immediatamente tenendo presente che se a R, allora a + P = 0 + P = P se e
solo se a P .
(1)(4) Supponiamo che P sia un ideale primo e siano I, J ideali di R. Se fosse I 6 P
e J 6 P , allora vi sarebbero x I e y J tali che x P e y P , in contrasto con il
fatto che xy P .
(4)(1) Supponiamo che valga la (4) e siano a, b R tali che ab P . Considerati gli
ideali principali (a) e (b), risulta (a)(b) = (ab) P , per cui deve essere (a) P oppure
(b) P . Dunque a P oppure b P .
Corollario 4.6.8. Se M è un ideale massimale di un anello R, allora M è un ideale primo

di R.
Dimostrazione. Infatti, se M è un ideale massimale di R, allora R/M è un campo per

il Teorema 4.6.5. In particolare R/M è un dominio, per cui M è un ideale primo in base
al Teorema 4.6.7.
Esempio 4.6.9. Dalle Definizioni 4.1.7 e 4.6.6 risulta che un anello R è un dominio se e
solo se {0} è un ideale primo.
Esempio 4.6.10. Si vede facilmente che in Z gli ideali primi non nulli sono quelli del
tipo pZ con p numero primo, quindi sono tutti massimali (Esempio 4.6.3). Naturalmente,
essendo Z un dominio che non è un campo, {0} è un ideale primo che non è massimale.
Allo scopo di decidere se un ideale I di un anello R è primo, oppure massimale, spesso

non è pratico controllare direttamente se le condizioni di cui alle rispettive definizioni sono
soddisfatte; in questi casi è comodo procedere con la verifica indiretta, controllando cioè
se lanello quoziente R/I è un dominio, oppure un campo, applicando poi il Teorema 4.6.7
oppure 4.6.5, rispettivamente.
Esempio 4.6.11. Dato un anello R, sappiamo che R[x]/(x) = R (Esempio 4.5.8). Di

conseguenza (x) è un ideale primo (risp. massimale) di R[x] se e solo se R è un dominio
(risp. un campo).
Il seguente teorema fondamentale (di cui omettiamo la dimostrazione) ci dice che ogni
anello (non banale) contiene abbastanza ideali massimali.
Teorema 4.6.12 (Teorema di Krull). Se I è un ideale proprio di un anello R, allora vi è

almeno un ideale massimale M di R tale che I M . Di conseguenza, se R 6= {0}, allora
R ha almeno un ideale massimale.
4.7 Divisibilit`
a nei domini.
Definizione 4.7.1. Sia R un dominio e siano a, b, c elementi di R. Si dice che:
(1) a è un divisore di b, oppure b è un multiplo di a (in simboli: a | b) se esiste un

c R tale che b = ac. Si noti che se a 6= 0, allora c è unico, essendo R un dominio.
(2) a è associato a b (in simboli: a b) se a | b e b | a. Si vede facilmente che ciò

accade se e solo se a = bu per un u U (R); inoltre è evidentemente una relazione
di equivalenza in R .
(3) a è un divisore proprio di b se a | b ma a 6 U (R) e a - b. Tale definizione

è giustificata dal fatto che se a U (R), allora a | b per ogni b R, avendosi
b = a(a1 b).
(4) a è irriducibile se a 6 U (R) e a non possiede divisori propri. Se a non è irriducibile

si dice che a è riducibile.
(5) a è primo se a 6 U (R) e da a | bc segue a | b oppure a | c.
Si vede facilmente che se a a0 , allora a possiede una delle proprietà sopra elencate
se e solo se la possiede a0 .
Proposizione 4.7.2. Se R è un dominio, dati a, b R risulta:

(1) a | b se e solo se (b) (a).
(2) a b se e solo se (a) = (b).
(3) a è un divisore proprio di b se e solo se (b) $ (a) $ R.
(4) a è primo se e solo se (a) è un ideale primo di R.
(5) Se a 6= 0 e a è primo, allora a è irriducibile.
Dimostrazione. Le prime quattro affermazioni sono di facile verifica. (5) Sia a 6= 0,

supponiamo che a sia primo e supponiamo a = bc. Allora a | b oppure a | c. Siccome b | a
e c | a, deduciamo che a b oppure a c; in ambedue i casi deduciamo che b e c non
sono divisori propri. Concludiamo che a è irriducibile.
Laffermazione (4) della proposizione precedente non si inverte: vi sono domini che
hanno elementi irriducibili che non sono primi.
Esempio 4.7.3. Consideriamo il seguente sottoanello di C:

R = a + b 5 | a, b Z .
R è un dominio nel quale 3 è irriducibile ma non è primo. Infatti, per quanto riguarda
lirriducibilità, supponiamo che

3 = (a + b 5)(c + d 5)

per certi a, b, c, d Z. Posto = a + b 5 e = c + d 5 e considerando le norme,
risulta N ()N () = 9. Sono quindi possibili solo tre casi: N () = 9 e N () = 1, oppure
N () = 1 e N () = 9, ovvero N () = 3 e N () = 3. Questultimo caso non può
sussistere, perche non esistono a, b Z tali che N () = a2 + 5b2 = 3. Daltro canto
N () = 1 implica = 1 e quindi = 3; analogamente N () = 1 implica = 1
e quindi = 3. Dunque 3 è irriducibile. Infine 3 non è primo, perche per esempio
abbiamo che
3 | 9 = (2 + 5)(2 5),

ma è subito visto che 3 - (2 + 5) e 3 - (2 5).
4.8 Domini ad ideali principali e domini euclidei.

Definizione 4.8.1. Un dominio R si chiama dominio ad ideali principali (abbreviato
PID) se ogni suo ideale è principale, cioè della forma (a) con a R.
Teorema 4.8.2. Sia R un PID e sia 0 6= a R. Allora le seguenti affermazioni sono

equivalenti:
(1) a è un elemento irriducibile.
(2) (a) è un ideale massimale.

(3) (a) è un ideale primo.
(4) a è un elemento primo.
Dimostrazione. (1)(2). Supponiamo a irriducibile. Allora necessariamente (a) $ R.

Se (a) (b) R, allora b | a, per cui b U (R) oppure b a, il che è quanto dire (b) = R
oppure (b) = (a) (Proposizione 4.7.2). Dunque (a) è un ideale massimale. Limplicazione
(2)(3) è nota e le implicazioni (3)(4) e (4)(1) seguono dalla Proposizione 4.7.2. .
Definizione 4.8.3. Un dominio R si dice dominio euclideo se esiste una funzione

: R N, chiamata valutazione euclidea, tale che:
(1) se a, b R e a | b, allora (a) 6 (b);
(2) se a, b R e b 6= 0, allora esistono q, r R tali che a = bq + r con r = 0 oppure

(r) < (b).
Esempio 4.8.4. Si controlla facilmente che la funzione a 7 |a| è una valutazione euclidea
in Z, il quale è cos` un dominio euclideo.
Esercizio 4.8.5. Provare che un dominio R è un campo se e solo se ha una valutazione

euclidea che è una funzione costante. In tal caso ogni funzione costante : R N è una
valutazione euclidea per R.
Teorema 4.8.6. Sia R un anello (non necessariamente commutativo), siano f, g R[x] e

assumiamo che il coefficiente direttivo di g sia invertibile in R. Allora esistono degli unici
polinomi q, r R[x] tali che f = gq + r, dove r = 0 oppure gr(r) < gr(g).
Dimostrazione. Proviamo dapprima lesistenza. Se gr(f ) < gr(g) non cè nulla da
dimostrare: basta prendere q = 0 e r = f . Procedendo per induzione sul grado di f ,
prendiamo dunque n > gr(g), supponiamo induttivamente che la tesi sia vera per tutti i
polinomi f di grado < n e sia f un polinomio di grado n. Posto m = gr(g), essendo gm
invertibile possiamo considerare il polinomio
1 nm
h = fn gm x g;
osserviamo che gr(h) = n e hn = fn . Allora il polinomio f 0 = f h ha grado minore di

n e quindi, per lipotesi induttiva, esistono q 0 , r0 R[x] tali che f 0 = q 0 g + r0 , con r0 = 0
oppure gr(r0 ) < gr(g). Otteniamo quindi
f = f 0 + h = q 0 g + fn gm
1 nm
g + r0 = q 0 + fn gm1 nm
g + r0 .

x x
Dunque f = qg + r con q = q 0 + fn gm 1 nm
x e r = r0 . Supponiamo che sia f = qg + r =
q g + r con r = 0 oppure gr(r ) < gr(g). Supponiamo che sia q 6= q 00 , cioè q q 00 6= 0.
00 00 00 00
Siccome il coefficiente direttivo di g è invertibile, risulta gr((q q 00 )g) = gr(q q 00 ) + gr(g);

abbiamo dunque gr(g) 6 gr((q q 00 )g) = gr(r00 r) < gr(g): una contraddizione. Dunque
q = q 00 , da cui r = r00 .
Corollario 4.8.7. Se F è un campo, allora F [x] è un dominio euclideo prendendo come

valutazione la funzione f 7 gr(f ).
Teorema 4.8.8. Sia R un dominio euclideo. Allora:
(1) U (R) = { a R | (a) = (1)}.
(2) R è un PID.
Dimostrazione. (1) Sia a U (R) e sia b R tale che ab = 1. Allora a | 1, quindi
(a) 6 (1). Siccome è in ogni caso 1 | a e quindi (1) 6 (a), segue (1) = (a).
Viceversa, supponiamo che valga questultima uguaglianza. Per ipotesi esistono q, r R
tali che 1 = qa + r con r = 0 oppure (r) < (a). Se fosse r 6= 0, avremmo allora
(r) < (a) = (1), in contrasto con il fatto che è sempre (1) < (r) perche 1 | r.
Dunque 1 = qa e quindi a U (R).
(2) Sia I un ideale di R. Se I = {0}, allora è ovvio che I = (0). Supponiamo dunque
I 6= (0) e prendiamo un b I (0) in modo che (b) sia minimo possibile. Abbiamo allora
(b) I. Se a I, esistono q, r R tali che a = bq + r, con r = 0 oppure (r) < (b).
Questultima condizione non può sussistere per come abbiamo preso b e per il fatto che
r = a bq I. Dunque a = bq (b), per cui (b) I. Concludiamo che I = (b).
Omettiamo la dimostrazione del teorema che segue, il quale generalizza ai domini

euclidei il Teorema Fondamentale dellAritmetica (Teorema 3.5.11).
Teorema 4.8.9. Se R è un dominio euclideo, ogni elemento non nullo e non invertibile
a R si scompone nel prodotto di elementi irriducibili in modo essenzialmente unico,
nel senso che se è al tempo stesso
a = p1 pm , a = q 1 qn
dove p1 , . . . , pm , a = q1 , . . . , qn sono elementi irriducibili di R, allora m = n e, eventual-

mente alterando lordine dei fattori in una delle due fattorizzazioni, risulta pi qi per
i = 1, . . . , m.
Ricordiamo che, dato un anello R e un polinomio f = f0 + f1 x + + fn xn R[x], la
funzione polinomiale associata ad f è la funzione f : R R definita da
f (a) = f0 + f1 a + + fn an per ogni a R.
(vedi la Definizione 4.3.8). Se il polinomio f ha grado n, la proprietà di x espressa dalla
f0 + f1 x + + fn xn = 0, (4.8.1)
si chiama equazione algebrica di grado n in x a coefficienti in R. Una soluzione

di detta equazione è un elemento a R che, sostituito ad x nella (4.8.1) rende questa
vera; si tratta in altri termini di un elemento tale che f (a) = 0. In tal caso a si chiama
anche uno zero o radice del polinomio f .
Teorema 4.8.10 (Teorema di Ruffini). Sia R un anello, sia a R e sia f R[x]. Allora
a è uno zero per f se e solo se a x divide f .
Dimostrazione. Se f = (a x)q per un q R[x], allora è chiaro che f (a) = 0. Vicever-

sa, supponiamo f (a) = 0. Per il Teorema 4.8.6 (1 è invertibile!) esistono q, r R[x] tali
che f = (a x)q + r, con r = 0 oppure gr(r) < gr(g) = 1, il che forza ad essere gr(r) = 0
e quindi r R. Di conseguenza abbiamo 0 = f (a) = (a a)q(a) + r(a) = r(a) = r, da
cui r = 0. Dunque a x divide f .
Sia R un dominio e sia a R. Se i è un intero positivo e (a x)i divide un polinomio

f R[x], è chiaro che deve essere i 6 gr(f ). In vista del Teorema di Ruffini 4.8.10 risulta
motivata la seguente definizione.
Definizione 4.8.11. Sia R un dominio e sia f R[x]. Se a è una radice per f , si chiama
a di a il massimo intero positivo k tale che (a x)k divide f .
molteplicit`
Teorema 4.8.12. Se R è un dominio e f R[x] ha grado n > 1, allora f ha al massimo

n zeri.
Dimostrazione. Laffermazione è vera se n = 1, perche se f = f0 + f1 x con f1 6= 0 e

risulta f (a) = 0 = f (b) per certi a, b R, allora f1 a = f0 = f1 b, per cui a = b essendo
R un dominio. Dato n > 1, supponiamo che laffermazione sia vera per tutti i polinomi
di grado < n e consideriamo un polinomio f R[x] di grado n. Se a R è uno zero per
f , in base al Teorema di Ruffini 4.8.10 risulta f = (a x)q per un q R[x]. Siccome R
è un dominio, q deve avere grado n 1 e quindi, per lipotesi induttiva, q ha al massimo
n 1 zeri. Essendo R un dominio, un elemento b R è uno zero per f = (a x)q se e
solo se b = a oppure b è uno zero per q. Ciò prova che f ha al massimo n zeri.
Sappiamo che la funzione : R[x] RR che ad ogni polinomio f R[x] assegna la

relativa funzione polinomiale f è un omomorfismo di anelli non necessariamente iniettivo
(vedi lEsercizio 4.3.9 a), b)); per questa ragione, come già osservato con la Nota 4.3.10,
non è lecito identificare un polinomio f con la relativa funzione polinomiale f : R R.
Tuttavia, almeno in un caso importante è iniettivo, per cui quellidentificazione diviene
legittima.
Proposizione 4.8.13. Se R è un dominio infinito, lomomorfismo : R[x] RR è

iniettivo.
Dimostrazione. Se : R[x] RR non fosse iniettivo, vi sarebbe un polinomio non nul-

lo f R[x] tale che (f ) = f : R R è la funzione costantemente nulla, ossia f (a) = 0
per ogni a R. Questultimo fatto, assieme alipotesi f 6= 0, comporta che gr(f ) > 1 ed
f ha infiniti zeri, in contrasto con il Teorema 4.8.12.
Il seguente teorema viene chiamato, per motivi storici, il Teorema Fondamentale

dellAlgebra. Ne omettiamo la dimostrazione.
Teorema 4.8.14. Ogni polinomio di grado positivo f C[x] ha almeno una radice in
C.
Corollario 4.8.15. Un polinomio f C[x] è irriducibile se e solo se gr(f ) = 1.

Dimostrazione. Se gr(f ) = 1, allora si controlla facilmente che f è irriducibile. Sup-

poniamo che sia gr(f ) > 1. Allora per il Teorema 4.8.14 f ha almeno una radice a e
quindi, tenuto conto del Teorema di Ruffini 4.8.10, vi è un polinomio q C[x] tale che
f = (a x)q. Dal fatto che gr(f ) > 1 segue che gr(q) > 1 e quindi a x e q sono divisori
propri per f , il quale è dunque riducibile.
Proposizione 4.8.16. Se f C[x] e gr(f ) > 1, allora vi sono degli unici c, z1 , . . . , zn C,

con c 6= 0, tali che
f = c(z1 x) . . . (zn x).
Dimostrazione. Si tratta di una conseguenza del Teorema 4.8.9, tenuto conto che C[x] è
un dominio euclideo (Corollario 4.8.7). Si noti che c non è altro che il coefficiente direttivo
di f moltiplicato per (1)n .
Gli elementi della successione (z1 , . . . , zn ) di cui allultimo corollario sono evidente-
mente tutte e sole le radici di f ; naturalmente esse non sono necessariamente distinte e
ciascuna di esse compare un numero di volte pari alla sua molteplicità.
Proposizione 4.8.17. Sia f R[x] un polinomio reale di grado > 1. Allora le radici
di f sono reali oppure numeri complessi coniugati a coppie, nel senso che se z C,
allora f (z) = 0 se e solo se f (z) = 0, nel qual caso z e z hanno la stessa molteplicità.
Conseguentemente, se f ha grado dispari, allora f ha almeno una radice reale.
Dimostrazione. Per ogni f C[x] indichiamo con f il polinomio f0 + f1 x + + fn xn ,

con il che risulta f R[x] se e solo se f = f . Siccome la funzione z 7 z è un automorfis-
mo del campo C, si vede facilmente che la funzione f 7 f è un automorfismo dellanello
C[x]. Supponiamo che f R[x]. Per ogni z C abbiamo f (z) = f (z) = f (z). Dunque
z è una radice per f se e solo se lo è z. Se (z x)k divide f , cioè f = (z x)k g per
un g C[x], allora f = f = (z x)n g = (z x)k g, cioè (z x)k divide f . Vicever-
sa, siccome z per ogni z C, se (z x)k divide f allora anche (z x)k divide f . Ciò
prova che z è una radice di f di molteplicità k se e solo se lo è z ha la medesima proprietà.
Capitolo 5
VETTORI E SPAZI VETTORIALI
5.1 Richiami di geometria elementare nel piano e

nello spazio.
Almeno ad un livello intuitivo, il lettore ha già familiarità con i concetti geometrici di
punto, retta e piano dellordinario spazio tridimensionale, come pure con il concetto di
parallelismo fra due rette, fra due piani e fra una retta ed un piano. Riteniamo comunque
opportuno richiamare, sia pure sommariamente, alcuni fatti basilari riguardanti la ge-
ometria elementare. Seguendo quella che sembra essere una tradizione consolidata, quasi
sempre indicheremo i punti con lettere latine maiuscole, le rette con lettere latine minus-
cole e i piani con lettere greche minuscole. Stabiliamo intanto di indicare con E lordinario
spazio tridimensionale, inteso come insieme dei suoi punti, considerando a loro volta ogni
retta ed ogni piano come insieme dei propri punti, quindi come speciali sottoinsiemi di
E. Se A è un punto e r è una retta tale che A r, si usa dire che r passa per A;
analogamente un piano passa per A quando A , mentre passa per la retta r se
r .
Per un singolo punto A passano infinite rette e infiniti piani dello spazio. Se è un
piano tale che A , allora sono infinite le rette contenute in che passano per A.
Se r è una retta, linsieme dei piani contenenti r è infinito; esso si chiama il fascio
proprio di piani di asse r.
Si dice che n punti A1 , . . . , An sono allineati (rispettivamente complanari) se essi
appartengono tutti ad una singola retta (rispettivamente ad un singolo piano); se essi
sono allineati, allora sono anche complanari, potendo tuttavia non valere il viceversa.
Due punti A e B sono sempre allineati. Se A 6= B, allora esiste ununica retta r
alla quale A e B appartengono e infiniti piani ai quali A e B appartengono; questi ultimi
sono, naturalmente, tutti e soli i piani appartenenti al fascio proprio di piani di asse r. Tre
punti A, B, C sono sempre complanari ma possono essere non allineati ; in questultimo
caso esiste ununico piano al quale essi appartengono. Infine, quattro o pi` u punti possono
essere non complanari .
Si dice che n rette r1 , . . . , rn sono complanari se esse sono tutte contenute in un sin-
golo piano. Due rette r, s non complanari si dicono sghembe; se invece sono complanari,
esse sono parallele se r = s oppure r s = (si dice anche che r ed s hanno la stessa
158
CAPITOLO 5. VETTORI E SPAZI VETTORIALI 159
direzione), mentre sono incidenti se hanno in comune esattamente un punto A, cioè se

r s = {A}.
Due piani , sono paralleli se = oppure = (si dice anche che e
hanno la stessa giacitura); in caso contrario essi sono incidenti e è una retta.
Dati un piano e una retta r, si verifica esattamente uno dei tre casi seguenti:
r è contenuta in ;
r e non hanno punti in comune;
r e hanno esattamente un punto in comune.
Diremo che e r sono paralleli nei primi due casi ed incidenti nel terzo.
Se r è una retta e A è un punto che non appartiene ad r, allora:
esiste un unico piano tale che A e r ;
esiste un unica retta s parallela ad r e tale che A s; naturalmente s è contenuta

nellunico piano che contiene r e A.
Se è un piano e A è un punto che non appartiene a , allora esiste un unico piano

parallelo a e tale che A .
Se è un piano e r è una retta parallela a , allora esiste un unico piano parallelo
a e tale che r . Naturalmente = se e solo se r .
Se r e s sono due rette sghembe, allora esiste un unico piano , parallelo ad s, tale che
r .
Considerati tre piani distinti, si verifica esattamente una delle seguenti cinque situ-
azioni:
essi sono paralleli fra loro;
due di essi sono paralleli e il terzo non è parallelo ad essi, quindi li interseca secondo
due rette necessariamente parallele;
tra essi non ve ne sono due paralleli, ma tutti e tre sono paralleli ad una stessa retta;
la loro intersezione è una retta;
la loro intersezione è ridotta ad un punto.
Si noti che i primi quattro casi sono esattamente quelli che si presentano quando vi è una
retta alla quale i tre piani sono paralleli; in tal caso di tali rette ve ne sono infinite e,
nel secondo, terzo e quarto caso, si tratta di tutte le rette che hanno una determinata
direzione.
5.2 Proiezioni parallele ad una retta.

Siano r e s due rette incidenti e sia il piano in cui esse sono contenute. Dato un punto
A , lunica retta t passante per A e parallela ad r interseca s in un punto A0 , il
quale si chiama la proiezione parallela ad r, o nella direzione di r, del punto A
sulla retta s; è chiaro che se A r, allora A0 è semplicemente il punto di intersezione
fra r e s.
Passando alla situazione tridimensionale, consideriamo un piano e una retta r inci-
denti. Dato un punto A dello spazio, lunica retta t passante per A e parallela ad
r interseca in un punto A0 , il quale si chiama la proiezione parallela ad r, o nella
direzione di r, del punto A sul piano . Si noti che se A r, allora A0 è il punto
di intersezione fra r e . Se, al contrario, è A 6 r e è lunico piano contenente r ed A,
allora A0 è anche la proiezione parallela ad r, di A sulla retta s intersezione tra e .
Nota 5.2.1. La legge che ad ogni punto A associa la sua proiezione A0 parallela ad
r su s definisce una funzione pr,s : s, la quale si chiama ancora la proiezione su
s parallela ad r; essa è suriettiva ma non è iniettiva. Infatti, se B s, è chiaro che
B = p(C) per ogni punto C della retta t per B parallela ad r, risultando p1 (B) = t.
In questo modo si vede che la partizione di associata a p (Proposizione e Definizione
1.7.14) è semplicemente linsieme di tutte le rette di parallele ad r. Questa osservazione
si estende allo spazio, potendo parlare della proiezione su parallela ad r pr, : E
che ad ogni punto dello spazio E associa la sua proiezione parallela ad r su . Anche in
questo caso, per ogni punto B E, la controimmagine p1 r, (B) `
e la retta per B parallela
ad r e la partizione di E associata ad p è linsieme di tutte le rette di E parallele ad r.
Un segmento va inteso come uno speciale sottoinsieme della retta nella quale si
trova ed è individuato completamente dai suoi estremi; se questi sono i punti A e B,
indicheremo il segmento in questione indifferentemente con AB oppure BA. Si noti che
la legge {A, B} 7 AB definisce una funzione biiettiva dallinsieme i cui elementi sono i
sottoinsiemi dello spazio costituiti da due soli punti, verso linsieme di tutti i segmenti
dello spazio medesimo. Con il simbolo |AB| indicheremo la lunghezza del segmento AB,
valutata rispetto ad ununità di misura fissata a priori. Per ogni punto A sarà comodo
poter considerare anche il segmento di lunghezza zero AA. Si noti che se A, B sono punti
di una retta r, il segmento AB può essere definito formalmente come segue:
AB := {P r | |P A| 6 |AB| e |P B| 6 |AB|}.
Ricordiamo il seguente
Teorema 5.2.2. (Teorema di Talete). Siano p, p0 , r, s, t cinque rette complanari, di

cui r, s, t parallele fra loro e non parallele ne a p ne a p0 . Se A, B, C sono i punti di
intersezione di p con r, s, t rispettivamente e, analogamente, A0 , B 0 , C 0 sono i rispettivi
punti di intersezione di p0 con r, s, t (naturalmente non è escluso che A = A0 , oppure
B = B 0 , o anche C = C 0 ) allora
|AB| |A0 B 0 |
= 0 0 .
|BC| |B C |
Il teorema di Talete ha il seguente importante corollario.

Corollario 5.2.3. Siano p, p0 , r, s quattro rette complanari, di cui p, p0 incidenti in un
punto O, r, s parallele fra loro ma non a p ne a p0 e non passanti per O. Se A, B sono i
punti di intersezione di p con r, s rispettivamente e, analogamente, A0 , B 0 sono i rispettivi
punti di intersezione di p0 con r, s, allora
|OA| |OA0 |
= .
|OB| |OB 0 |
Ricordiamo che un parallelogramma è un quadrilatero ABCD1 nel quale AB è pa-

rallelo a CD e BC è parallelo a AD; equivalentemente, ABCD è un parallelogramma se
|AB| = |CD| e |BC| = |AD|. Un parallelepipedo è un esaedro le cui sei facce sono
parallelogrammi.
Nota 5.2.4. Quando diciamo che ABCD è un parallelogramma, includiamo anche i casi
in cui esso è degenere, cioè collassa in un segmento. Chiaramente, a questo riguardo
abbiamo cinque possibilità:
i punti A, B, C, D sono distinti: il parallelogramma si riduce ad uno dei segmenti
AC, DB;
B = D, oppure A = C: il parallelogramma si riduce al segmento AC oppure BD

rispettivamente;
A = D e B = C, ossia i due segmenti AB, DC coincidono: il parallelogramma si

riduce al segmento AB;
A = B e C = D, ossia i due segmenti AD, BC coincidono: il parallelogramma si

riduce al segmento AD.
A = B = C = D: il parallelogramma si riduce ad un singolo punto.

Esercizi 5.2.5. a) Siano r, s due rette incidenti di un piano . Provare che la proiezione
pr,s (AB) su s, parallela ad r, di un segmento AB di è il segmento A0 B 0 , dove A0 = pr,s (A)
e B 0 = pr,s (B).
b) Siano un piano e r una retta incidente a . Provare che se s è una retta non
parallela ad r, allora la proiezione pr, (s) su , parallela ad r, di s è una retta (Sugg.: Si
tratta della retta intersezione di con lunico piano per s parallelo ad r).
c) Siano un piano e r una retta incidente a . Provare che se quattro punti OABC di
E sono i vertici di un parallelogramma e O0 , A0 , B 0 , C 0 sono le rispettive immagini tramite
la proiezione pr, su parallela ad r, allora O0 A0 B 0 C 0 è un parallelogramma in ; esso
è degenere esattamente quando OABC si trova su un piano parallelo ad r. Si noti che
questultima situazione include anche il caso in cui OABC è già degenere (perche?).
Proposizione 5.2.6. Dati tre punti O, A, B dello spazio E, esiste un unico punto C tale
che il quadrilatero OACB è un parallelogramma.
1
Qui lordine nel quale scriviamo i quattro vertici sta a significare che AB, BC, CD e DA sono i
quattro lati.
Dimostrazione. Supponendo dapprima che O, A, B siano allineati, occorre distinguere

due casi, a seconda che O appartenga, o no, al segmento AB. Denotando con r la retta
che contiene O, A, B, nel primo caso vi è un unico punto C AB tale che |AC| = |OB|.
Nel secondo caso vi è un unico punto C r tale che C 6 AB e |AC| = |OB|. Il lettore
provi per esercizio che, in ambedue i casi, C è lunico punto tale che |OA| = |BC| e
|OB| = |AC|, di modo che O, A, B sono vertici del parallelogramma degenere OABC.
Supponiamo ora che O, A, B non siano allineati, sia r lunica retta passante per A paral-
lela a OB e sia s lunica retta passante per B parallela a OA; si noti che r, s si trovano su
uno stesso piano, precisamente lunico piano cui appartengono i punti O, A, B. E ` chiaro
che r, s non sono parallele, altrimenti sarebbero paralleli i segmenti OA e OB e quindi
i punti O, A, B sarebbero allineati; di conseguenza r, s si intersecano in un punto C e
OACB è il parallelogramma cercato.
Proposizione 5.2.7. Quattro punti non complanari O, A, B, C dello spazio E sono sem-
pre vertici di un unico parallelepipedo; precisamente vi sono degli unici punti U, D, E, F
tali che OAF C, OBEC, U EBD, U DAF , OADB e CF U E sono parallelogrammi.
Dimostrazione. Notiamo preliminarmente che, tolto uno dei quattro punti O, A, B, C,

dallipotesi segue che i rimanenti tre punti non sono allineati. Di conseguenza possiamo
considerare gli unici piani BC , AC e AB , il primo contenente i punti O, B, C, il secondo
contenente i punti O, A, C, il terzo contenente i punti O, A, B, con il che risulta A 6 BC ,
B 6 AC e C 6 AB . Ancora dallipotesi segue che
OA AB AC , OB AB BC , OC BC AC ,
BC AC AB = {O}.
Sia C il piano per C parallelo a AB . In accordo con la Proposizione 5.2.6, vi sono degli
unici punti D AB , E BC , F AC , U C tali che OADB, OBEC, OAF C
e CF U E sono parallelogrammi. Il lettore può provare per esercizio che anche U DAF
e U DBE sono parallelogrammi e O, A, D, B, C, F, U, E sono i vertici del parallelepipedo
cercato.
Nota 5.2.8. Con riferimento alla Proposizione 5.2.7 e alla sua dimostrazione, se A , B
sono rispettivamente il piano per A parallelo a BC e il piano per B parallelo a AC ,
allora i parallelogrammi U DAF , U EBD e CF U E sono contenuti nei piani A , B e C
rispettivamente (perche?); inoltre
A B C = {U }.
5.3 Vettori applicati.

Un segmento orientato è un segmento al quale è stato fissato un verso, specificando
quale dei due estremi è lorigine e chiamando termine laltro estremo; se questi sono

rispettivamente A e B, il segmento orientato in questione si indica con AB e viene anche
chiamato un vettore applicato nel punto A. Indichiamo con S linsieme di tutti i
segmenti orientati di E mentre, fissato un punto O E, indichiamo con SO il sottoinsieme

di S di tutti i vettori applicati in O:

S := {AB | A, B E}, SO := {OB | B E}.
` abitudine indicare i vettori in SO anche con lettere latine minuscole in grassetto come i,
E
j, k, u, v, w, ecc.. restando sottinteso che si tratta di vettori applicati in O. Soprattutto
in vista delle operazioni che introdurremo, è importante ricordare che a SO appartiene il

vettore nullo OO, che indicheremo con 0. Se r è una retta e è un piano ambedue
passanti per O, ci interesserà considerare gli insiemi SOr e SO dei vettori applicati in O
che sono contenuti in r e in rispettivamente; in formule,
SOr := SO r, SO := SO .

Nota 5.3.1. Se OA SO e A 6= O, allora la retta che passa per O e A è lunica retta

tale che OA SOr . Inoltre, preso un secondo vettore OB tale che B non è allineato con

O e A, il piano che passa per O, A e B è lunico piano tale che OA, OB SO .
Nota 5.3.2. Fissato un punto O E, la legge che ad ogni punto A E assegna il vettore
OA definisce una funzione

GO : E SO , GO (A) := OA per ogni A E.
Tale funzione è chiaramente biiettiva. Naturalmente, considerata una retta r o un piano

, la medesima legge definisce anche delle biiezioni
GOr : r SOr , GO : SO ,

dove GOr (A) := OA e GO (A) := OA per ogni A r oppure A rispettivamente.
Per via della biiezione GO , spesso ciascun punto A E viene identificato con il vettore
OA, confondendo cos` una retta r e un piano passanti per O con gli insiemi SOr e SO
rispettivamente.

Un segmento orientato AB si dice equipollente ad un segmento orientato CD se il
quadrilatero ABDC è un parallelogramma (Figura ??; attenzione allordine nel quale si
dichiarano i punti!);

se ciò accade scriviamo AB CD. Chiaramente ciò accade esattamente quando AB e
` utile contemplare anche
CD sono paralleli, hanno la stessa lunghezza e lo stesso verso. E
i casi degeneri in ci il parallelogramma ABDC collassa in un segmento (vedi la Nota

5.2.4). In ogni caso è chiaro che AB CD se e solo se AC BD.
Importa osservare che, come si evince subito dalla definizione, la relazione di equipol-
lenza è una relazione di equivalenza in S. Rispetto ad essa, per ogni punto O E
linsieme SO dei vettori applicati in O è un insieme di rappresentanti (Definizione 1.14.7).

Infatti, da un lato è evidente che due distinti vettori OP e OQ applicati in O non sono
equipollenti. Dallaltro lato vale la seguente

Proposizione 5.3.3. Dato un punto O dello spazio, per ogni segmento orientato AB

esiste un unico punto C tale che OC AB.
Dimostrazione. Per la Proposizione 5.2.6 vi è un unico punto C tale che OABC è un

parallelogramma (eventualmente degenere), ossia OC AB.

Esercizio 5.3.4. Dati sei punti A, A0 , B, B 0 , C, C 0 dello spazio, supponendo che AB

A0 B 0 e BC B 0 C 0 , provare che di conseguenza AC A0 C 0 .
5.4 Coordinate cartesiane su una retta, su un piano

e nello spazio.
Dare unorientazione su una retta r significa fissare in essa un verso da dirsi positivo,
chiamando poi negativo il verso opposto e chiamando retta orientata la coppia formata
dalla retta r e lorientazione scelta. Tipicamente questo viene fatto scegliendo due punti
distinti O, U in r, chiamando tradizionalmente O lorigine, dichiarando poi su r come

positivo il verso del segmento orientato i = OU . Supponiamo, dunque, di aver fissato
questi dati (Figura ??). Dato un punto A di r, si chiama lascissa di A rispetto al
segmento orientato i quel numero reale a definito come segue: in valore assoluto
|OA|
|a| = ;
|OU |

inoltre il numero a è positivo se OA ha lo stesso verso di i, altrimenti a è negativo. In
particolare U ha ascissa 1 e, per questa ragione, viene anche chiamato punto unit` a e il

segmento OA viene detto il segmento unitario; lo stesso segmento orientato OU viene
chiamato un riferimento cartesiano su r. nella Figura ?? sono indicati i punti A,B,C,D
che hanno ascisse 2, 5/2, 1, 3/2, per esempio. Inversamente, considerato un qualunque
numero reale a, esso è lascissa rispetto ad i di un unico punto di r. Infatti, se a = 0,
allora O è ovviamente il punto di r che ha ascissa a. Se a 6= 0, vi sono esattamente due
punti A, B r, in posizione simmetrica rispetto ad O, con A dalla parte del verso positivo
e B dalla parte del verso negativo di r, tali che
|OA| |OB|
= |a| = .
|OU | |OU |
Il punto di ascissa a è A se a > 0, altrimenti è B. Possiamo allora parlare della funzione
(biiettiva per quanto appena detto)
Hi : R r
tale che, per ogni a R, Hi (a) è il punto di r che ha ascissa a rispetto ad i. In particolare,
con riferimento alla Figura 3.2, risulta
Hi (0) = O, Hi (1) = U, Hi (2) = A, Hi (5/2) = B, Hi (1) = C, Hi (3/2) = D.
Abbiamo dovuto specificare i nel simbolo Hi per la semplice ragione che, se prendiamo

su r un altro vettore j = OV diverso da i, la funzione Hj sarà diversa dalla Hi (vedi
lEsercizio che segue).
Esercizio 5.4.1. Con riferimento alla Figura 3.2, si individui il punto V che ha ascissa

1/2 rispetto a i (in altri termini V = Hi (1/2)) e si consideri il vettore j = OV . Si calcolino
le coordinate dei punti O, U, V, A, B, C, D rispetto a j. Individuare inoltre i punti
Hj (0), Hj (1), Hj (2), Hj (5/2), Hj (1), Hj (3/2).
In un piano fissiamo tre punti O, U, V non allineati, consideriamo i due vettori

i = OU e j = OV applicati in O e siano x e y le rette che li contengono rispettivamente,
su ciascuna delle quali i e j costituiscono un riferimento cartesiano. Diremo che la coppia
ordinata (i, j) è un sistema di riferimento cartesiano nel piano e le rette x e y
(che risultano essere orientate da i e j rispettivamente) si chiamano gli assi coordinati;
più specificamente x viene detto lasse delle ascisse e y lasse delle ordinate, mentre
il punto O si chiama lorigine del sistema. Con questi dati, ad ogni punto A
possiamo associare una coppia ordinata (a, b) di numeri reali, da chiamarsi rispettivamente
ascissa e ordinata di A rispetto al sistema (i, j), con il seguente criterio: se Ax e Ay
sono rispettivamente la proiezione parallela alla retta y di A sulla retta x e la proiezione
parallela alla retta x di A sulla retta y, allora a è lascissa di Ax rispetto a i, mentre b è
lascissa di Ay rispetto a j (Figura ??). Diremo allora che il punto A ha coordinate
(a, b) rispetto a (i, j). Viceversa, data una coppia ordinata (a, b) di numeri reali, sia B
il punto della retta x che ha ascissa a rispetto ad i e sia C il punto della retta y che ha
ascissa b rispetto ad j. Allora lunico punto D tale che OBDC è un parallelogramma
(Proposizione 5.2.6) è anche lunico punto di che ha per ascissa e ordinata rispetto a
(i, j) i numeri a e b rispettivamente. Possiamo dunque considerare la funzione biiettiva
Hi,j : R2
tale che, per ogni (a, b) R2 , Hi,j (a, b) è il punto di che ha coordinate (a, b) rispetto
a (i, j). Come per la funzione Hi : R r, nella Hi,j è indispensabile specificare sia i
vettori i e j che lordine nel quale questi devono comparire, ossia occorre specificare la
coppia ordinata (i, j). Si tenga infatti presente che, per esempio, se un punto A ha
coordinate (1, 2) rispetto ad un riferimento (i, j), lo stesso punto avrà coordinate (2, 1)
rispetto al riferimento (j, i), di modo che Hi,j 6= Hj,i .
Passando allo spazio E, fissiamo quattro punti O, U, V, W non complanari, consi-

deriamo i tre vettori i = OU , j = OV e k = OW applicati in O e siano x, y e z le rette
(ovviamente passanti per O e non complanari) che li contengono rispettivamente. Diciamo
che la terna ordinata (i, j, k) è un sistema di riferimento cartesiano nello spazio, il
punto O ne è lorigine e le rette x, y, z gli assi coordinati. In aggiunta, questa volta
compaiono quelli che chiamiamo piani coordinati: si tratta dei tre piani xy , yz e xz
che contengono x, y il primo, y, z il secondo e x, z il terzo; naturalmente questi hanno
come unico punto comune lorigine O. Ad ogni punto A E associamo la terna ordinata
(a, b, c) delle coordinate di A rispetto a (i, j, k), le quali sono quei numeri reali che si
determinano nel modo che ora spieghiamo. Dal punto A si considerino i piani A,x , A,y ,
A,z paralleli rispettivamente ai piani coordinati yz , xz , xy ; essi intersecano gli assi
coordinati x, y, z rispettivamente nei punti Ax , Ay , Az . Ora a, b, c sono rispettivamente
lascissa di Ax rispetto a i, lascissa di Ay rispetto a j e lascissa di Az rispetto a k.
Esercizio 5.4.2. Con i dati e le notazioni di cui sopra, siano Axy , Ayz , Axz rispettiva-
mente la proiezione di A su xy parallela a z, la proiezione di A su yz parallela ad x, la
proiezione di A su xz parallela ad y. Controllare che Axy ha coordinate (a, b) rispetto a
(i, j), Ayz ha coordinate (b, c) rispetto a (j, k) e Axz ha coordinate (a, c) rispetto a (i, k).
Verificare, infine, che OAx Axy Ay e Az Axz AAyz sono parallelogrammi e sono facce opposte
di un parallelepipedo.
Prendendo di nuovo un sistema di riferimento cartesiano (i, j, k) con origine O nello
spazio E, partiamo da una terna ordinata (a, b, c) di numeri reali e individuiamo sullasse
x il punto A di ascissa a rispetto ad i, sullasse y il punto B di ascissa b rispetto ad j
e sullasse z il punto C di ascissa c rispetto ad k. In base alla Proposizione 5.2.7 vi è
un unico modo di aggiungere quattro punti D, E, F, U in maniera che questi, assieme a
punti O, A, B, C, siano vertici di un parallelepipedo; precisamente D è il punto di xy che
ha coordinate (a, b) rispetto a (i, j), E è il punto di yz che ha coordinate (b, c) rispetto
a (j, k) e F è il punto di xz che ha coordinate (a, c) rispetto a (i, k). Finalmente U è
lunico punto di E che ha coordinate (a, b, c) rispetto a (i, j, k). Anche ora resta definita
la funzione (biiettiva per quanto detto finora)
Hi,j,k : R3 E
tale che, per ogni (a, b, c) R3 , Hi,j,k (a, b, c) è il punto che ha coordinate (a, b, c) rispetto
a (i, j, k).
Esercizi 5.4.3. Sia dato un sistema di riferimento cartesiano (i, j, k) con origine O nello
spazio E.
a) Cercando, alla meglio, di illustrare su un foglio di carta la relativa situazione tridi-
mensionale e scegliendo per i, j, k unorientazione simile a quella che appare nella Figura
XXX, individuare la collocazione dei punti
Hi,j,k (1, 1, 1), Hi,j,k (1, 1, 1), Hi,j,k (1, 1, 1), Hi,j,k (1, 1, 1),
Hi,j,k (1, 1, 1), Hi,j,k (1, 1, 1), Hi,j,k (1, 1, 1), Hi,j,k (1, 1, 1).
b) Dove sono i punti che hanno coordinate della forma (a, b, 0), con a, b qualunque?
c) Dove sono i punti che hanno coordinate della forma (a, 0, c), con a, c qualunque?
d) Dove sono i punti che hanno coordinate della forma (0, b, c), con b, c qualunque?
b) Dove sono i punti che hanno coordinate della forma (a, 0, 0), con a qualunque?
c) Dove sono i punti che hanno coordinate della forma (0, b, 0), con b qualunque?
d) Dove sono i punti che hanno coordinate della forma (0, 0, c), con c qualunque?
5.5 Operazioni elementari con i vettori applicati.

Fissato nello spazio E un punto O, nellinsieme SO dei vettori applicati in O vi sono due
operazioni fondamentali. La prima è laddizione, che ora passiamo a definire.

Definizione 5.5.1. Dati due vettori OA e OB applicati in O, se C è lunico punto di E

tale che AC OB (Proposizione 5.3.3), il vettore OC si chiama la somma di OA pi` u
OB:

OA + OB := OC.
Si noti che il punto C è determinato in maniera tale che OACB è un parallelogramma,

il quale può essere degenere (vedi la Nota 5.2.4). Per esempio, se B = O, allora C = A;
analogamente, se A = O, allora C = O. Dunque risulta

OA + OO = OA e OO + OB = OB

per ogni A, B E. Ciò significa che che 0 = OO ` e elemento neutro per laddizione
tra vettori applicati in O. Resta da considerare, fra i casi degeneri, quello in cui
O 6= A e O 6= B e i punti O, A, B sono allineati. Detta r la retta alla quale O, A, B
appartengono, il punto C r è collocato, rispetto ad A, sulla stessa semiretta in cui si

trova O, o sullaltra, a seconda che OA e OB abbiano versi opposti o lo stesso verso.
Il procedimento per la costruzione del vettore somma formalizzato nella nostra defini-
zione, noto come regola del parallelogramma, ha la sua giustificazione nella Meccanica

Classica, dove un segmento orientato P Q rappresenta una forza applicata in P , che ha
come direzione la retta che contiene P e Q, come verso quello da P verso Q e intensità

pari a |P Q| (rispetto a ununità di misura prestabilita). Date allora due forze OA e OB

applicate nel punto O, la forza rappresentata da OC viene detta la risultante delle due
forze date.
Tornando alla Definizione 5.5.1, osserviamo che il punto C è anche lunico punto tale

che BC OA, per cui risulta

OA + OB = OB + OA.
Dunque laddizione tra vettori applicati in O è commutativa. Essa è anche associativa,

ossia, dati OA, OB, OC SO risulta

OA + (OB + OC) = (OA + OB) + OC. (5.5.1)
Per provarlo, consideriamo gli unici punti B 0 , C 0 , C 00 tali che (Proposizione 5.3.3)
0
AB OB, B 0 C 0 OC e BC 00 OC.

Allora AC 0 OC 00 (vedi lEsercizio 5.3.4) e risulta inoltre
0
OA + OB = OB e OB + OC = OC 00 ,
di conseguenza

(OA + OB) + OC = OB 0 + OC = OC 0 .
Daltro canto risulta anche

OA + (OB + OC) = OA + OC 00 = OC 0 ,

lultima uguaglianza seguendo dal fatto che AC 0 OC 00 , dunque vale la (5.5.1).

Infine ogni vettore v = OA SO ha un simmetrico rispetto alladdizione tra
vettori applicati in O. Infatti, se A0 è lunico punto della retta contenente v tale che
0
OA AO, è chiaro che OA + OA0 = OO. Il vettore OA0 , simmetrico di v, si chiama il
vettore opposto di v e si indica con v:

v := OA0 , dove OA0 AO. (5.5.2)
Possiamo dunque concludere con la seguente

Proposizione 5.5.2. Linsieme SO dei vettori dello spazio E applicati nel punto O è un
gruppo abeliano rispetto alladdizione.
Esercizio 5.5.3. Provare che risulta
(v + w) = (v) + (w) per ogni v, w SO (5.5.3)
(confronta con la seconda delle (2.2.1), Esercizio 2.2.21).

La seconda operazione fondamentale non è unoperazione binaria in SO , bens` unope-
razione esterna, nel senso che essa coinvolge un numero reale e un vettore.

Definizione 5.5.4. Definiamo il prodotto a OA di un numero reale a per un

vettore OA applicato in O come quel vettore OB tale che O, A, B sono allineati, |OB| =

|a||OA| e OB ha lo stesso verso di OA, o quello opposto, a seconda che a sia positivo o
negativo:

a OA := OB.

In altri termini, se OA = 0 allora a OA = 0; altrimenti a OA = OB, dove B è il punto

della retta che passa per O, A che ha ascissa a rispetto al riferimento cartesiano OA.
La seguente proposizione illustra le proprietà fondamentali della moltiplicazione fra
numeri reali (che nel contesto dellalgebra dei vettori vengono chiamati gli scalari) e
vettori, nonche linterazione fra questa con laddizione.
Proposizione 5.5.5. Valgono le seguenti proprietà:
1v = v per ogni v SO ; (5.5.4)

a(v) = (a)v = (av) per ogni a R e v SO ; (5.5.5)
(ab)v = a(bv) per ogni a, b R e v SO ; (5.5.6)
(a + b)v = av + bv per ogni a, b R e v SO ; (5.5.7)
a(v + w) = av + aw per ogni a R e v, w SO ; (5.5.8)
dati a R e v SO , risulta av = 0 se e solo se a = 0 oppure v = 0; (5.5.9)
dati a, b R se 0 6= v SO e av = bv, allora a = b. (5.5.10)
Dimostrazione. La (5.5.4) e le (5.5.5) seguono immediatamente dalla Definizione 5.5.4,

tenuto conto di quanto detto dopo la Definizione 5.5.1 a proposito di v; a loro volta
esse implicano la (5.5.6) se a = 0 oppure b = 0. Supponiamo a e b positivi e poniamo

OA = v, OB = bv e OC = (ab)v. Allora risulta
|OC| = (ab)|OA| = a (b|OA|) = a|OB|,


di conseguenza OC = a OB = a(b OA), da cui (ab)v = a(bv). A questo punto, usando
la terza delle (5.5.4) e le (5.5.5) otteniamo:
[a(b)]v = [(ab)]v = [(ab)v] = [a(bv)] = a[(bv)] = a[(b)v].
In modo analogo vediamo che [(a)b]v = (a)(bv) e la (5.5.6) è completamente provata.

Quanto alla (5.5.7), siano a, b R e v SO . Possiamo supporre che a 6= 0 6= b,
altrimenti non vi è nulla da dimostrare, tenuto conto della prima delle (5.5.4); possiamo
inoltre supporre che v 6= 0 perche, in caso contrario, i due membri delluguaglianza nella
(5.5.7) sarebbero chiaramente uguali al vettore nullo. Sia r la retta che contiene v, siano

A, B i punti di r di rispettive ascisse a, b relativamente a v, di modo che OA = av e

OB = bv; sia inoltre C lunico punto di r tale che AC AB, cosicche OA + OB = OC.
Considerando singolarmente i quattro casi possibili
( ( ( (
a>0 a>0 a<0 a<0
b > 0, b < 0, b > 0, b < 0,
il lettore non avrà difficoltà a riconoscere che C ha ascissa a+b rispetto a v. Di conseguenza
(a + b)v = av + bv.
Sia a R e siano v, w SO . Al fine di dimostrare la (5.5.8) possiamo supporre che
a 6= 0 e v 6= 0 6= w, altrimenti luguaglianza da provare si riduce alla 0 = 0 nel primo
caso e, nel secondo, alla av = av se è per esempio w = 0. Considerando dapprima

il caso a > 0, poniamo OA = v, OB = w, OC = v + w, OA0 = av, OB 0 = aw e
0
OC = av + aw. Considerato il parallelogramma (eventualmente degenere) OA0 C 0 B 0 ,
una facile applicazione del Teorema di Talete 5.2.2 porta a concludere che il punto C è

allineato con O e C 0 e risulta aOC = OC 0 , ossia a(v + w) = av + aw. A questo punto
otteniamo:
(a)(v + w) = a[(v + w)] = a[(v) + (w)] = a(v) + a(w) = (a)v + (a)w,
dove abbiamo usato la (5.5.5) per la prima e la quarta uguaglianza, la (5.5.3) per la
seconda e, per la terza, abbiamo usato la tesi già dimostrata per il caso in cui a > 0. La
(5.5.8) è ora completamente provata.
Passando alla (5.5.9), dalla Definizione 5.5.4 segue subito che 0v = 0 per ogni v SO .
Inoltre, tenuto conto della (5.5.8) per ogni a R abbiamo
a0 = a(0 + 0) = a0 + a0,
per cui a0 = 0 (vedi lEsercizio 2.2.17). Viceversa, supponiamo che av = 0 con a 6= 0.

Allora usando le proprietà ormai dimostrate otteniamo:
v = 1v = (a1 a)v = a1 (av) = a1 0 = 0,
per cui v = 0.
Infine, se 0 6= v e av = bv, allora
(a b)v = av + (b)v = av + [(bv)] = 0,

quindi a b = 0 per la (5.5.9), cioè a = b.

Diciamo che un vettore OB è multiplo di un vettore OA, oppure che OB è pro-

porzionale a OA, se OB = a OA per qualche numero reale a. Supposto A 6= O, in
base alla Definizione 5.5.4 e a quanto detto nella sezione precedente a proposito delle

coordinate cartesiane sulla retta, dovrebbe essere chiaro che OB = a OA se e solo se B

è allineato con A e O e il numero a è lascissa di B rispetto a OA.
Esercizio 5.5.6. Stabilito un riferimento cartesiano (i, j) in SO in un piano (si faccia

un disegno), individuare i vettori v1 = 2i + j, v2 = (1/3)i j, v3 = 2j, v4 = i + 2j.
Esercizi 5.5.7. a) Provare che lunico vettore proporzionale ad ogni vettore di SO è il

vettore nullo 0.
b) Posto T := SO {0}, cioè T è linsieme dei vettori non nulli di SO , provare che la
relazione di proporzionalità è una relazione di equivalenza in T .
5.6 Basi su una retta, in un piano e nello spazio.

Su una retta r fissiamo un riferimento cartesiano i = OU e consideriamo la funzione
Fi : R SOr
che agisce nel modo seguente: per ogni a R, Fi (a) è il vettore applicato in O con termine
il punto di r che ha ascissa a rispetto ad i. Tenuto conto della Definizione 5.5.4 risulta
allora
Fi (a) = ai per ogni a R. (5.6.1)
Si noti che la funzione Fi è biiettiva ed è la composizione della biiezione Hi : R r,
introdotta nella Sezione 3.4, seguita dalla biiezione GOr : r SOr (Sezione 3.2):
Fi = GOr Hi .
Possiamo allora affermare quanto segue:

Proposizione 5.6.1. Data una retta r e un vettore i = OU su di essa, per ogni vettore

v = OA SOr vi è un unico a R tale che
v = ai;
il numero a è lascissa di A rispetto al riferimento i. Inoltre risulta
SOr = {ai | a R}. (5.6.2)
In altre parole, il singolo vettore i è sufficiente per determinare tutti i vettori di SOr ;
questi sono tutti e soli i multipli ai di i e risulta ai = bi se e solo se a = b. Per questa
ragione, anticipando una nozione che introdurremo nella Sezione 4.9, si dice che il vettore i
costituisce una base per SOr . Se prendiamo un altro vettore non nullo i0 SOr , anchesso
è una base per SOr (per lo stesso motivo per cui lo è i!); dunque, se v è un generico vettore
di SOr , vi sono degli unici a, a0 R tali che
v = ai = a0 i0 .
` tuttavia importante rendersi conto che se i0 6= i, allora a 6= a0 , eccetto il caso in cui
E
v = 0, perche allora a = a0 = 0 in base alla (5.5.9).

Esercizi 5.6.2. Su una retta r fissiamo un riferimento cartesiano i = OU e consideriamo
il vettore i0 = (2/3)i.
a) Presi i vettori v = (4/3)i e w = 2i, determinare i numeri reali a, b in maniera che
v = ai0 e w = bi0 . (Sugg.: Dal momento che i0 = (2/3)i, allora i = (3/2)i0 . . . ).
b) Presi i vettori v0 = (1/3)i0 e w0 = (2/5)i0 , determinare i numeri reali a0 , b0 in maniera
che v0 = a0 i e w0 = b0 i.
Passiamo a considerare un piano , sul quale scegliamo un punto origine O. Questa

volta non sarà pi`
u sufficiente un singolo vettore non nullo i per determinare tutti i vettori
di SO , dal momento che con i multipli ai di i non si esce dalla retta che contiene i.

Prendiamo dunque due vettori non proporzionali i = OU e j = OV , che assumiamo
come sistema di riferimento cartesiano, indicando con x e y le rette che contengono i e
j rispettivamente (gli assi coordinati). Sia A è un qualunque punto di . Ricordiamo
che, se (a, b) sono le coordinate di A rispetto a (i, j), dette Ax e Ay rispettivamente la
proiezione parallela alla retta y di A sulla retta x e la proiezione parallela alla retta x di
A sulla retta y, allora a è lascissa di Ax rispetto a i, mentre b è lascissa di Ay rispetto a
j, di modo che

OAx = ai e OAy = bj.
Se A si trova sullasse x, allora A = Ax e Ay = O e quindi A ha coordinate (a, 0) e risulta
OA = ai; analogamente, se A y, allora A = Ay e Ax = O, quindi A ha coordinate (0, b)

ed è OA = bj. Se A non appartiene ne a x ne a y, allora OAx AAy è un parallelogramma

non degenere; tenuto conto della Definizione 5.5.1, abbiamo che OA = OAx + OAy e
quindi

OA = ai + bj.
Appare ora naturale considerare la funzione
Fi,j : R2 SO
definita da
Fi,j (a, b) = ai + bj per ogni (a, b) R2 ; (5.6.3)
largomento appena svolto sopra mostra che tale funzione è suriettiva. In realtà Fi,j è
anche iniettiva, quindi biiettiva. Infatti, supponiamo che sia Fi,j (a, b) = Fi,j (a0 , b0 ) per due
coppie (a, b), (a0 , b0 ) R2 , ossia
ai + bj = a0 i + b0 j. (5.6.4)
Da questa otteniamo
ai + (a0 )i = (b)j + b0 j
(questo passaggio è lecito: esso consiste nellaggiungere (b)j + (a0 )i ai due membri
della (5.6.4), usando poi le regole formali già stabilite per laddizione fra vettori e la
moltiplicazione per uno scalare), quindi
(a a0 )i = (b + b0 )j. (5.6.5)
Se fosse a 6= a0 , ossia a a0 6= 0, moltiplicando ambo i membri della (5.6.5) per 1/(a a0 )

otterremmo
b + b0
i= j,
a a0
per cui i e j sarebbero proporzionali, contro il fatto che li avevamo presi non proporzionali!
Deve dunque essere a = a0 , per cui il primo membro della (5.6.5), e quindi anche il
secondo, è il vettore nullo. Ancora usando la (5.5.9) otteniamo che b0 b = 0. Dunque
(a, b) = (a0 , b0 ) e liniettività di Fi,j è provata. Riassumendo, possiamo enunciare quanto
segue.
Proposizione 5.6.3. Se è un piano e i, j sono due vettori non proporzionali applicati

in un punto O , allora per ogni vettore v = OA SO vi è ununica coppia (a, b) di
numeri reali tale che
v = ai + bj; (5.6.6)
precisamente (a, b) è la coppia delle coordinate di A rispetto al riferimento cartesiano
(i, j). Inoltre la funzione Fi,j : R2 SO definita dalla (5.6.3) è biiettiva, per cui
SO = {ai + bj | a, b R}. (5.6.7)
Dunque ogni insieme {i, j} formato da due vettori non proporzionali è sufficiente a
determinare tutti i vettori di SO ; ciascuno di questi si esprime in modo unico sotto la
forma (5.6.6). Si dice allora che linsieme {i, j} è una base per SO e la coppia (a, b)
di numeri che compaiono nella (5.6.6) si chiama anche la copia delle coordinate del
vettore v rispetto alla base {i, j}. Lanalisi del modo di variare delle coordinate di
un vettore di SO , quando si passa da una base allaltra, è sensibilmente più complessa
rispetto a quanto visto sulla retta. Su questo punto torneremo pi` u avanti. Per ora ci
limitiamo a qualche esercizio elementare.
Esercizi 5.6.4. Su un piano fissiamo

unorigine O e un riferimento cartesiano (i, j).
a) Si considerino i vettori i0 = 2i, j0 = (1/2)j. Dopo aver stabilito che (i0 , j0 ) è una
base per SO , si trovino le coordinate,
rispetto ad essa, del generico vettore v = ai + bj.
b) Si considerino i vettori i = 2i + j, j = 3j. Dopo aver stabilito che (i0 , j0 ) è una
0 0
base per SO , si trovino le coordinate, rispetto ad essa, del generico vettore v = ai + bj.
Analogamente a quanto fatto per una retta e per un piano, fissiamo nello spazio E
unorigine O e poniamoci il problema di trovare una base per SO , cioè un insieme minimo
di vettori con i quali sia possibile determinare tutti i vettori di SO , utilizzando le operazioni
di addizione fra vettori e moltiplicazione di questi per uno scalare. Considerati due vettori

non proporzionali i = OU e j = OV , dalle considerazioni svolte finora risulta chiaro che
essi non sono pi` u sufficienti per il nostro scopo, dal momento che, comunque si prendono
due numeri reali a, b, il vettore ai+bj rimane nel piano (unico) che contiene i punti O, U, V .

Siamo dunque costretti a prendere un terzo vettore k = OW non complanare con i e j,
altrimenti, qualunque siano i numeri reali a, b, c, il vettore ai + bj + ck continuerebbe
a trovarsi nel piano che contiene i e j. La terna di vettori (i, j, k) costituisce ora un
riferimento cartesiano in E (vedi la Sezione 4.4). Dato un punto A E e considerati
i piani A,x , A,y , A,z paralleli rispettivamente ai piani coordinati yz , xz , xy , essi
intersecano gli assi coordinati x, y, z rispettivamente nei punti Ax , Ay , Az . Ricordiamo
che la terna di numeri (a, b, c) dà le coordinate di A rispetto a (i, j, k) esattamente quando
a, b, c sono rispettivamente lascissa di Ax rispetto a i, lascissa di Ay rispetto a j e lascissa
di Az rispetto a k (Figura XXX), per cui

OAx = ai, OAy = bj e OAz = ck.
Naturalmente A potrebbe trovarsi su uno dei piani coordinati o, addirittura, su uno degli
assi coordinati. Ecco lelenco delle situazioni possibili:
A xy se e solo se c = 0;
A yz se e solo se a = 0;
A xz se e solo se b = 0;
Ax se e solo se b = c = 0;
Ay se e solo se a = c = 0;
Az se e solo se a = b = 0.
Supponiamo che A non si trovi in alcuna delle situazioni particolari elencate e siano Axy ,
Ayz , Axz rispettivamente la proiezione di A su xy parallela a z, la proiezione di A su yz
parallela ad x, la proiezione di A su xz parallela ad y. Allora OAx Axy Ay e Az Axz AAyz
sono parallelogrammi non degeneri e sono facce opposte di un parallelepipedo, per cui

Ax Axy è equipollente a OAy e Axy A è equipollente a OAz . Possiamo allora concludere

che OA = OAx + OAy + OAz e quindi

OA = ai + bj + ck.
Naturalmente questa uguaglianza resta valida anche se A si trova in una delle sei situazioni
particolari sopra elencate. Seguendo la stessa traccia del ragionamento svolto per il piano,
consideriamo la funzione
Fi,j,k : R3 SO
definita da
Fi,j,k (a, b, c) = ai + bj + ck per ogni (a, b, c) R3 ; (5.6.8)
la quale è suriettiva per quanto visto sopra. Proviamo che Fi,j,k è anche iniettiva, quindi
biiettiva. Infatti, consideriamo due terne (a, b, c), (a0 , b0 , c0 ) R3 , supponiamo che sia
Fi,j,k (a, b, c) = Fi,j,k (a0 , b0 , c0 ), cioè
ai + bj + ck = a0 i + b0 j + c0 k, (5.6.9)
e proviamo che a = a0 , b = b0 e c = c0 . Supponiamo che, al contrario, sia per esempio

a 6= a0 , cioè a a0 6= 0. Dalla (5.6.9) risulta
ai + (a0 )i = (b)j + b0 j + (c)k + c0 k,
da cui
(a a0 )i = (b + b0 )j + (c + c0 )j. (5.6.10)
Moltiplicando ambo i membri di questa per (a a0 )1 otteniamo
b + b0 c + c0
i= j + )j.
a a0 a a0
Questa uguaglianza comporta che il vettore i si trova sullo stesso piano di j e k, mentre
noi avevamo supposto i, j e k non complanari. Deve dunque essere a = a0 e, in maniera
analoga, si vede che b = b0 e c = c0 , con il che rimane provato che Fi,j,k è iniettiva.
Possiamo finalmente enunciare quanto segue.
Proposizione 5.6.5. Fissata unorigine O dello spazio E e tre vettori non complanari i,

j, k applicati in O , allora per ogni vettore v = OA SO vi è ununica terna (a, b, c)
di numeri reali tale che
v = ai + bj + ck; (5.6.11)
precisamente (a, b, c) è la terna delle coordinate di A rispetto al riferimento cartesiano
(i, j, k). Inoltre la funzione Fi,j,k : R3 SO definita dalla (5.6.8) è biiettiva, per cui
SO = {ai + bj + ck | a, b, c R}. (5.6.12)
Come si vede, ogni insieme {i, j, k} formato da tre vettori non complanari costituisce
una base per SO , nel senso che ogni vettore di SO si esprime in modo unico sotto la
forma (5.6.11) e la terna di numeri (a, b, c) si chiama anche la terna delle coordinate del
vettore v rispetto alla base {i, j, k}.
Esercizi 5.6.6. Nello spazio E si fissi unorigine O e un riferimento cartesiano (i, j, k).
Considerati i vettori i0 = (1)i, j0 = (1/2)j, k0 = (1/2)j, dopo aver stabilito che (i0 , j0 , k0 )
è una base per SO , si trovino le coordinate, rispetto ad essa, del generico vettore v =
ai + bj + ck.
5.7 Spazi vettoriali.

Con lintroduzione delladdizione e del prodotto per uno scalare, nella Sezione 4.5 abbiamo
individuato nelinsieme SO dei vettori dello spazio applicati nel punto O una struttura
algebrica ben articolata e ricca di proprietà. Strutture di questo genere si presentano
con enorme frequenza in Matematica; un gran numero di problemi che si incontrano nel
mondo reale (fisica, economia, ottimizzazione, ecc.) sono riconducibili ad una classe di
problemi matematici, chiamati problemi lineari, i quali vengono efficacemente affrontati e
risolti se collocati nellambito di queste strutture. Per esempio, la ricerca delle soluzioni
di un sistema di equazioni di primo grado, di cui ci occuperemo pi` u avanti, è un tipico
problema lineare. Procediamo allora a definire in modo formale e preciso queste strutture.
Definizione 5.7.1. Uno spazio vettoriale o spazio lineare (reale) è un gruppo abelia-
no V , i cui elementi vengono detti vettori e la cui operazione viene di norma denotata
additivamente, per il quale è stata definita una moltiplicazione esterna tra i numeri
reali (che nel presente contesto si chiamano gli scalari) e gli elementi di V , ossia unope-
razione che ad ogni coppia ordinata (a, v) R V associa un elemento av V , la quale
verifica le seguenti condizioni:
V1 a(v + w) = av + aw per ogni a R e v, w V ;
V2 (a + b)v = av + bv per ogni a, b R e v V ;
V3 (ab)v = a(bv) per ogni a, b R e v V ;
V4 1v = v per ogni v V .
Indichiamo sempre con 0 lelemento neutro del gruppo V , chiamandolo il vettore
nullo, e chiamiamo il vettore opposto di un vettore v V lelemento simmetrico
di v, indicandolo con v. Come per i vettori di SO , se v, w V , diciamo che w è
proporzionale a v, oppure che w è multiplo di v, se vi è un numero reale a tale che
w = av. Se ciò accade e a 6= 0, allora a1 w = a1 (av) = (a1 a)v = 1v = v, per cui v è
proporzionale a w.
Elenchiamo alcuni esempi.
Esempio 5.7.2. Dalla Proposizione 5.5.2 sappiamo che linsieme SO dei vettori dello
spazio applicati nel punto O è un gruppo abeliano rispetto alladdizione fra vettori di cui
alla Definizione 5.5.1. Se in aggiunta consideriamo la moltiplicazione fra uno scalare e
un vettore di cui alla Definizione 5.5.4, le proprietà (5.5.8), (5.5.7), (5.5.6) e la (5.5.4)
dichiarate dalla Proposizione 5.5.5 ci dicono che valgono le condizioni V1, V2, V3 e V4,
per cui SO è uno spazio vettoriale.
Esempio 5.7.3. Facendo svolgere ad ogni numero reale contemporaneamente il ruolo di
vettore e quello di scalare, le usuali operazioni di addizione e moltiplicazione danno ad R
una naturale struttura di spazio vettoriale. Infatti già sappiamo che (R, +) è un gruppo
abeliano, le V1 e V2 esprimono la distributività della moltiplicazione sulladdizione, la
V3 esprime lassociatività della moltiplicazione e la V4 dichiara che il numero 1 è elemento
neutro per la moltiplicazione.
Esempio 5.7.4. Dato un intero n > 0, nel prodotto cartesiano Rn di n copie di R
consideriamo laddizione definita da
(x1 , . . . , xn ) + (y1 , . . . , yn ) := (x1 + y1 , . . . , xn + yn )
per ogni (x1 , . . . , xn ), (y1 , . . . , yn ) Rn . Allora (Rn , +) è un gruppo abeliano il cui ele-
mento neutro è ln-pla nulla (0, . . . , 0), mentre lopposta di unn-pla (x1 , . . . , xn ) è ln-pla
(x1 , . . . , xn ) (vedi lEsercizio 2.2.22). Definiamo il prodotto fra i numeri reali e gli
elementi di Rn come segue:
a(x1 , . . . , xn ) := (ax1 , . . . , axn ) per ogni a R e (x1 , . . . , xn ) Rn .
Il lettore può verificare per esercizio che le condizioni V1, V2, V3 e V4 sono soddisfatte
e quindi Rn è uno spazio vettoriale rispetto alle operazioni dichiarate. Si noti che per
n = 1 ritroviamo lesempio b).
Esempio 5.7.5. Come naturale generalizzazione dellesempio precedente, possiamo con-

siderare linsieme Mm,n (R) delle matrici reali ad m righe ed n colonne, dove m, n sono
interi positivi assegnati. Sappiamo che, rispetto alladdizione termine a termine, Mm,n (R)
ha una struttura di gruppo abeliano, il cui elemento neutro è la matrice nulla (vedi la
Sezione 2.7). Dato un numero reale r e una matrice A Mm,n (R), il prodotto rA è la
matrice ottenuta da A moltiplicando tutte le sue entrate per r. Il lettore può verificare
facilmente che, con tale moltiplicazione il gruppo additivo Mm,n (R) diviene uno spazio
vettoriale.
Nota 5.7.6. Evidentemente una n-pla ordinata di numeri reali può essere considerata
come una matrice ad una riga ed n colonne, di modo che lo spazio vettoriale Rn delle n-ple
di numeri reali, discusso nellEsempio 5.7.4, è un caso particolare dellEsempio 5.7.5, dato
che Rn = M1,n (R). Nel seguito faremo largo uso anche dello spazio vettoriale Mn,1 (R)
delle colonne ad n righe, che indichiamo brevemente con il simbolo Rn :

x1

..
Rn := . x 1 . . . , xn R .

x

n
` evidente che
E
Rn = { X | X Rn }.
Esempio 5.7.7. Facendo riferimento allEsercizio 2.6.8, consideriamo il gruppo abeliano

additivo RC delle funzioni reali definite in un dato sottoinsieme C R e definiamo il
prodotto di un numero reale a per una funzione f RC come quella funzione
af : C R
tale che
(af )(x) := af (x) per ogni x C. (5.7.1)
Per esempio, prendendo C = R, se f : R R è la funzione definita da f (x) = 3 + 2x2 ,
5 5 10
allora f è la funzione x 7 (3 + 2x2 ) = 5 + x2 . Anche in questo caso il lettore può
3 3 3
verificare per esercizio che RC è uno spazio vettoriale rispetto alla somma (2.6.9) e al
prodotto (5.7.1), controllando che valgono le condizioni V1, V2, V3 e V4.
Esempio 5.7.8. Un caso particolare dellesempio precedente è dato dallo spazio vetto-
riale RN delle successioni di numeri reali, dove le operazioni sono definite come segue:
date due successioni (a0 , a1 , . . . , an , . . .), (b0 , b1 , . . . , bn , . . .) e un numero reale c,
(a0 , a1 , . . . , an , . . .) + (b0 , b1 , . . . , bn , . . .) = (a0 + b0 , a1 + b1 , . . . , an + bn , . . .).
c(a0 , a1 , . . . , an , . . .) = (ca0 , ca1 , . . . , can , . . .),
Nota 5.7.9. Se V è uno spazio vettoriale, allora
(v + w) = (v) + (w) per ogni v, w V . (5.7.2)

Questa proprietà è, in realtà, una facile conseguenza del fatto che (V, +) è un gruppo
abeliano (confronta con la seconda delle (2.2.1), Esercizio 2.2.21). Daltro canto, con
lEsercizio 5.5.3 abbiamo richiamato lattenzione sul fatto che questa proprietà già vale
nello spazio vettoriale SO . Altre proprietà individuate nello spazio SO si estendono ad
ogni spazio vettoriale V , specificamente le (5.5.5) e (5.5.9):
dati a R e v V , risulta av = 0 se e solo se a = 0 oppure v = 0; (5.7.3)

a(v) = (a)v = (av) per ogni a R e v V . (5.7.4)
Infatti, per ogni a R risulta a0 = a(0 + 0) = a0 + a0 e quindi a0 = 0, tenuto conto

dellEsercizio 2.2.17; analogamente, per ogni v V risulta 0v = (0+0)v = 0v+0v, per cui
0v = 0. Viceversa, esattamente come nella dimostrazione della (5.5.9) nella Proposizione
5.5.5 si prova che se a 6= 0 e av = 0, allora v = 0. Ciò prova la (5.7.3). Infine, dati
a R e v V , usando la V2 e la (5.7.3) abbiamo (a)v + av = (a + a)v = 0v = 0,
per cui (a)v = (av). Analogamente, usando la V3 e ancora la (5.7.3) otteniamo
a(v) + av = a(v + v) = a0 = 0, quindi a(v) = (av).
Esercizio 5.7.10. Sia V uno spazio vettoriale. Procedendo per induzione, provare che
per ogni numero naturale n > 2 valgono le seguenti generalizzazioni delle condizioni V1
e V2:
a(v1 + v2 + + vn ) = av1 + av2 + + avn per ogni a R e v1 , v2 , . . . , vn V ;

(a1 + a2 + + an )v = a1 v + a2 v + + an v per ogni a1 , a2 , . . . , an R e v V .
5.8 Sottospazi.
Certi sottoinsiemi di uno spazio vettoriale rivestono una particolare importanza.
Definizione 5.8.1. Se V è uno spazio vettoriale, un sottoinsieme non vuoto E di V è un

sottospazio vettoriale, o semplicemente un sottospazio di V , se E è stabile rispetto
alladdizione e alla moltiplicazione per gli scalari, cioè se
v+w E e av E per ogni v, w E e a R.
Note 5.8.2. a) Se E è un sottospazio di uno spazio V , allora necessariamente 0 E;

infatti, siccome E è a priori non vuoto, vi è un v E e dalla definizione segue in
particolare che 0 = 0v E; inoltre, per ogni v E, sempre dalla definizione risulta
che v = (1)v E. Come conseguenza abbiamo che E è un sottogruppo additivo di
V . Tuttavia, un sottogruppo additivo di V non è necessariamente un sottospazio (vedi
lEsempio 5.8.4).
b) Sia {0} che lintero V sono ovviamente sottospazi di V : essi si chiamano i sot-
tospazi banali. Se E è un sottospazio di V ed è E 6= V , allora si dice che E è un
sottospazio proprio.
` importante rendersi conto che se E è un sottospazio di V ed è E 6= {0}, allora E
c) E
è infinito. Infatti, se 0 6= v E, allora in E vi sono tutti i vettori av, al variare di a in
R, e questi sono infiniti, dato che av 6= bv se a 6= b (perche?).
d) Un sottospazio E di uno spazio V è a sua volta uno spazio vettoriale rispetto alle
operazioni di V ristrette a E (controllare!); inoltre, se E F V e F è un sottospazio
di V , allora E è un sottospazio di V se e solo se E è un sottospazio di F .
Per controllare che un sottoinsieme non vuoto E di uno spazio vettoriale V è un
sottospazio, risulta spesso pi`
u comodo utilizzare il seguente criterio, la cui prova lasciamo
al lettore per esercizio.
Proposizione 5.8.3. Un sottoinsieme non vuoto E di uno spazio vettoriale V è un
sottospazio se e solo se vale la seguente condizione:
av + bw E per ogni v, w E e a, b R.
Passiamo a discutere alcuni esempi (tutti molto importanti!).

Esempio 5.8.4. Con riferimento allEsempio 5.7.3, b), chiediamoci quali sono i sottospazi
di R oltre, naturalmente, a {0} e R stesso. Se E è un sottospazio di R e E 6= {0}, preso
a E con a 6= 0, dalla Definizione 5.8.1 segue che 1 = a1 a E; ma allora la medesima
definizione comporta che b = b 1 E per ogni b R, per cui E = R. Concludiamo
che {0} e R sono gli unici sottospazi di R. Tuttavia R ha infiniti sottogruppi additivi
(controllare!).
Esempio 5.8.5. Fissiamo, al solito, un punto O dello spazio e consideriamo lo spazio
vettoriale SO dei vettori applicati in O. Se r è una retta passante per O, allora linsieme
SOr dei vettori applicati in O e contenuti in r è un sottospazio di SO , perche la somma di
due vettori che appartengono a SOr è ancora in SOr e ogni vettore proporzionale ad un
vettore di SOr appartiene a SOr . Se è un piano passante per O, allora anche linsieme SO

dei vettori applicati in O e contenuti in è un sottospazio di SO . Infatti, siano v = OA e

w = OB vettori di SO , cioe A, B . Detto C lunico punto dello spazio tale che OACB

è un parallelogramma, risulta C , per cui v + w = OC SO . Inoltre av SO per
ogni a R; ciò è chiaro se a = 0 oppure v = 0; in caso contrario, se r è la retta che passa
per O e A, allora v SOr e quindi av SOr perche, come abbiamo osservato sopra, SOr
è già un sottospazio di SO . Daltra parte r , per cui SOr SO e quindi v SO .

Identificando ciascun punto A E con il vettore OA, e quindi identificando una retta
r e un piano passanti per O con gli insiemi SOr e SO rispettivamente (vedi la Nota
5.3.2), possiamo dunque affermare che le rette e i piani passanti per lorigine O sono tutti
sottospazi di SO . Se poi fissiamo un piano passante per O, allora tutte le rette contenute
in e passanti per O sono, a loro volta, sottospazi di .
Esercizio 5.8.6. Sia E un sottospazio di uno spazio vettoriale V . Dato un intero n > 2,
si provi che se v1 , v2 , . . . , vn E, allora è anche v1 + v2 + + vn E.
Esercizio 5.8.7. Fissato un intero n > 2, si consideri lo spazio vettoriale Rn (Esempio
5.7.8). Provare che, dati degli interi i1 , . . . , ik {1, 2, . . . , n}, il sottoinsieme
W = {(x1 , . . . , xn ) | xi = 0 se i = i1 , . . . , ik }
delle n-ple aventi nulle le coordinate di posto i1 , . . . , ik è un sottospazio di Rn . Quanti

sono i sottospazi ottenibili in questo modo nei casi n = 2 e n = 3?
Esercizio 5.8.8. Dei seguenti sottoinsiemi di R3 , si decida quale è un sottospazio e quale

non lo è:
(a) {(x, x + y, x + y + z) | x, y, z R};
(b) {(x, y 2 , 1/x) | x, y R};
(c) {(x, x, 3x) | x R};
(d) {(1 + x, x + y, 2) | x, y, z R};
(e) {(x, sin x, cos x) | x, y, z R};
(f) {(4x y, x + y, y z) | x, y, z R}.
Esercizio 5.8.9. Sia C un sottoinsieme di R e si consideri lo spazio vettoriale RC delle

funzioni reali definite in C (Esempio 5.7.7). Fissato un sottoinsieme D C, provare che
il sottoinsieme
W = {f RC | f (x) = 0 se x D}
delle funzioni che valgono 0 in ogni punto di D è un sottospazio di RC . E ` vero che, in
generale, il sottoinsieme di RC delle funzioni che assumono tutte un fissato valore c in un
dato punto x0 C è sempre un sottospazio di RC ?
Esercizio 5.8.10. Provare che se E, F sono sottospazi di uno spazio vettoriale V , allora
anche E F è un sottospazio di V .
Esercizio 5.8.11. Provare che se E, F sono sottospazi di uno spazio vettoriale V , allora
E F è un sottospazio se e solo se E F oppure F E.
5.9 Il sottospazio generato da un insieme di vettori.

Alla luce degli esempi ed esercizi della Sezione precedente, sorge naturale il problema di
classificare, in qualche modo, tutti i sottospazi di un dato spazio vettoriale. In particolare,
vi sono in SO altri sottospazi oltre alle rette e i piani passanti per O e, naturalmente, i
sottospazi banali {0} e SO ? Come vedremo fra breve la risposta a questultima domanda
è negativa. In ogni modo noi non tratteremo il problema in tutta la sua generalità; ci
limiteremo ad esaminare le situazioni pi` u elementari, ma non per questo meno importanti.
Incominciamo con il porci il problema seguente.
Problema. Dato uno spazio vettoriale V e un suo sottoinsieme A, fra tutti i sottospazi
di V che contengono A (ovviamente ve ne è almeno uno: V stesso), determinare il minimo
possibile E, nel senso che se F è un qualunque sottospazio di V che contiene A, allora
E F.
Procediamo per gradi e incominciamo con il caso in cui in A vi è un solo vettore:
A = {v1 }. Osserviamo che linsieme {av1 | a R} di tutti i vettori proporzionali a v1
è un sottospazio di V (perche?) e risulta v1 = 1v1 {av1 | a R}. Inoltre, se F è
un qualunque sottospazio di V tale che v1 F , allora dalla Definizione 5.8.1 segue che
av1 F per ogni a R, ossia {av1 | a R} F . E ` dunque {av1 | a R} il minimo

sottospazio di V al quale v1 appartiene, cioè il minimo sottospazio contenente A.

Esempio 5.9.1. Alla luce della Proposizione 5.6.3 abbiamo che se v1 = OA è un vettore
non nullo di SO e r è la retta che passa per O e A, allora il minimo sottospazio di SO che
contiene v1 è SOr e questo si identifica con la retta r stessa.
Esempio 5.9.2. Nello spazio vettoriale R4 (vedi lEsempio 5.7.4) consideriamo il vettore
v = (2, 0, 3, 7). Allora il minimo sottospazio di R4 che contiene v è
{av | a R} = {(2a, 0, 3a, 7a) | a R}.
Passiamo al caso di un insieme A = {v1 , v2 } di due vettori dello spazio V e sia F un
sottospazio di V tale che A F . Allora, comunque si prendano due numeri reali a1 , a2 ,
anche a1 v1 e a2 v2 appartengono a F , quindi anche la loro somma a1 v1 + a2 v2 . Dunque
possiamo scrivere
{a1 v1 + a2 v2 | a1 , a2 R} F. (5.9.1)
Daltro canto, indicando con E linsieme a primo membro della (5.9.1), scopriamo che E
contiene singolarmente v1 e v2 (prendere prima a1 = 1 e a2 = 0, poi a1 = 0 e a2 = 1),
per cui A E. Inoltre E stesso è un sottospazio. Infatti, applicando il criterio di cui
alla Proposizione 5.8.3, se v, w E, cioè v = a1 v1 + a2 v2 e w = b1 v1 + b2 v2 per certi
a1 , a2 , b1 , b2 R, allora per ogni c, d R risulta
cv + dw = c(a1 v1 + a2 v2 ) + d(b1 v1 + b2 v2 ) = (ca1 + db1 )v1 + (ca2 + db2 )v2 E.
u piccolo sottospazio di V che contiene A.
Possiamo allora concludere che E è il pi`
Passando ormai al problema generale, conviene introdurre una nuova nozione con la
relativa terminologia.
Definizione 5.9.3. Sia V uno spazio vettoriale e siano v1 , v2 , . . . , vn degli elementi di
V . Si dice che un vettore v di V è combinazione lineare dei vettori v1 , v2 , . . . , vn se
vi sono dei numeri reali a1 , a2 , . . . , an tali che
v = a1 v1 + a2 v2 + + an vn . (5.9.2)
Si dice anche che lespressione a secondo membro della (5.9.2) (la quale, peraltro, rap-
presenta un vettore di V ) è una combinazione lineare dei vettori v1 , v2 , . . . , vn con
coefficienti a1 , a2 , . . . , an .
Dato un sottoinsieme A di uno spazio vettoriale V , indichiamo con hAi il sottoinsieme
di V costituito dai vettori che si possono esprimere come combinazione lineare di vettori
di A:
hAi := {a1 v1 + + an vk | a1 , . . . , ak R, v1 , . . . , vk A, k N } (5.9.3)
(il lettore faccia attenzione alla descrizione dellinsieme a secondo membro: esso è cos-
tituito da tutti i vettori che sono multipli di qualche vettore di A, e dai vettori che
sono somma di multipli di due, o pi` u, vettori di A). Nel caso di un sottoinsieme finito
A = {v1 , v2 , . . . , vn } di V , si usa anche il simbolo hv1 , v2 , . . . , vn i in luogo di hAi; si noti
che, in questo caso, ogni vettore di hAi si può scrivere sotto la forma (5.9.2).
Proposizione e Definizione 5.9.4. Con i dati e le notazioni di cui sopra, hAi è il pi` u
piccolo sottospazio che contiene A; esso si chiama il sottospazio generato da A, o il
sottospazio generato dai vettori v1 , v2 , . . . , vn nel caso in cui A = {v1 , v2 , . . . , vn }. Se E
è un sottospazio di V , si dice che un sottoinsieme A di E è un insieme generatore per
E, oppure che genera E, se
E = hAi.
Dimostrazione. La dimostrazione è praticamente identica a quella svolta sopra per
il caso in cui A = {v1 , v2 }; tuttavia riteniamo utile presentarla ugualmente. Se v
A, allora v è banalmente una combinazione lineare di vettori di A: basta prendere a
secondo membro della (5.9.2) n = 1, v1 = v e a1 = 1. Dunque A hAi. Siano
v, w hAi. Allora vi sono dei vettori v1 , v2 , . . . , vm , w1 , w2 , . . . , wn di A e dei numeri
reali a1 , a2 , . . . , am , b1 , b2 , . . . , bn tali che
v = a1 v1 + a2 v2 + + am vm e w = b1 w1 + b2 w2 + + bn wn ,
per cui
v + w = a1 v1 + a2 v2 + + am vm + b1 w1 + b2 w2 + + bn wn
e quindi v + w hAi. Inoltre, dato c R, abbiamo
cv = c(a1 v1 + a2 v2 + + an vn ) = (ca1 )v1 + (ca2 )v2 + + (can )vn ,
per cui cv hAi. Dunque hAi è un sottospazio di V . Se E è un qualunque sottospazio
di V contenente A, allora in E vi sono anche tutti i multipli di ciascun vettore di A e
quindi ogni combinazione lineare di vettori di A (tenere conto dellEsercizio 5.8.6), per
cui hAi E.
Esercizio 5.9.5. Stante il significato del simbolo hv1 , v2 , . . . , vn i dichiarato nella Propo-
sizione e Definizione 5.9.4, è essenziale lordine nel quale vengono scritti in esso i vettori
v1 , v2 , . . . , vn ? In particolare, sono uguali o distinti i sottospazi hv1 , v2 i e hv2 , v1 i?
Esercizio 5.9.6. Siano A e B due sottoinsiemi di uno spazio V .
(1) Provare che se A B, allora hAi hBi.
(2) Provare che A hBi se e solo se hAi hBi.
Esercizio 5.9.7. Dato uno spazio vettoriale V e presi due vettori non nulli v1 , v2 V ,
provare che sono equivalenti le seguenti condizioni:
(1) hv1 i = hv2 i;
(2) v1 hv2 i;
(3) v1 e v2 sono proporzionali;
(4) hv1 , v2 i = hv1 i.
Esercizi 5.9.8. Si fissi nello spazio E unorigine e un riferimento cartesiano (i, j, k).
a) Considerati i vettori v1 = 2i3j, v2 = i+2j e v3 = ij, determinare il sottospazio
hv1 , v2 , v3 i di SO .
b) Trovare il sottospazio h3k, 2i, j + 2k, 4ji di SO .
5.10 Dipendenza lineare. Basi.

Definizione 5.10.1. Sia V uno spazio vettoriale.
(1) Si dice che n vettori v1 , v2 , . . . , vn di V sono linearmente dipendenti, se esistono

n numeri reali a1 , a2 , . . . , an non tutti nulli tali che
a1 v1 + a2 v2 + + an vn = 0. (5.10.1)
Se ciò non accade, cioè lunico caso in cui vale la (5.10.1) è quando a1 = a2 = =
an = 0, allora si dice che i vettori v1 , v2 , . . . , vn sono linearmente indipendenti.
(2) Si dice che un sottoinsieme (finito o infinito) A di V è linearmente indipen-

dente o libero se, comunque presi dei vettori distinti v1 , v2 , . . . , vn A, essi sono
linearmente indipendenti.
(3) Si dice che un sottoinsieme (finito o infinito) A di V è una base per V se:
(a) A è un insieme generatore per V , ossia hAi = V ,

(b) A è linearmente indipendente.
La proprietà che segue, che noi enunciamo limitatamente al caso in cui lo spazio
vettoriale in questione possiede qualche insieme generatore finito, illustra la ragione per
cui le basi, fra tutti gli insiemi generatori, hanno un interesse particolare.
Proposizione e Definizione 5.10.2. Dato un sottoinsieme finito A = {v1 , v2 , . . . , vn }

di uno spazio vettoriale V , le seguenti condizioni sono equivalenti:
(1) A è una base;
(2) Per ogni v V esistono degli unici scalari a1 , a2 , . . . , an tali che
v = a1 v1 + a2 v2 + . . . + an vn . (5.10.2)
Se A è una base, i numeri a1 , a2 , . . . , an si chiamano le coordinate di v rispetto ad A.
Dimostrazione. (1)(2) Se A è una base e v V , essendo A un insieme generatore

esistono a1 , a2 , . . . , an R per i quali vale la (5.10.2). Se risulta anche
v = b1 v1 + b2 v2 + . . . + bn vn
per certi b1 , b2 , . . . , bn R, allora
a1 v1 + a2 v2 + . . . + an vn = b1 v1 + b2 v2 + . . . + bn vn ,
ossia
(a1 b1 )v1 + (a2 b2 )v2 + . . . + (an bn )vn = 0.
Siccome v1 , v2 , . . . , vn sono linearmente indipendenti, deve risultare ai bi = 0 per ogni
i n e quindi ai = bi .
(2)(1) Supponiamo che valga la (2). Allora A è un insieme generatore. Se a1 , a2 , . . . ,

an R sono tali che
a1 v1 + a2 v2 + . . . + an vn = 0,
siccome risulta anche
0v1 + 0v2 + . . . + 0vn = 0,
dallipotesi segue che deve essere ai = 0 per ogni i n. Dunque v1 , v2 , . . . , vn sono
Considerato un singolo vettore v di uno spazio vettoriale V , in base alla definizione

linsieme {v} è linearmente dipendente se esiste un numero reale a 6= 0 tale che
av = 0.
Tenuto conto della (5.5.9), ciò significa che v = 0. Di conseguenza, dire che {v} è
linearmente indipendente significa semplicemente affermare che v 6= 0.
Se i vettori v1 , v2 , . . . , vn sono linearmente indipendenti, allora essi sono distinti. In-
fatti, se p. es. fosse v1 = v2 , presi a1 = 1, a2 = 1, a3 = = an = 0 sarebbe vera la
(5.10.1). Tuttavia, come ora vedremo per il caso n = 2, il fatto che v1 , v2 , . . . , vn siano
distinti non comporta che essi siano necessariamente linearmente indipendenti.
Prendiamo due vettori non nulli v1 , v2 di V . Linsieme {v1 , v2 } è linearmente dipen-
dente se vi sono due numeri reali a1 , a2 , di cui almeno uno non nullo, tali che
a1 v1 + a2 v2 = 0. (5.10.3)
Da questa si ricava facilmente che

a2 a1
v1 = v2 , oppure v2 = v1 ;
a1 a2
naturalmente la prima ha senso quando a1 6= 0 e la seconda se a2 6= 0. In ogni caso risulta
che v1 e v2 sono proporzionali. Viceversa, se vale questultima condizione, cioè esiste un
numero reale a, necessariamente diverso da zero, tale che v1 = av2 , allora la (5.10.3) vale
se prendiamo per esempio a1 = 1 e a2 = a. Abbiamo dunque il risultato seguente.
Proposizione 5.10.3. Due vettori v1 , v2 di uno spazio V sono linearmente dipendenti

se e solo se sono proporzionali.
Importa osservare che, in vista dellEsercizio 5.9.7, la proposizione precedente affer-

ma in sostanza che v1 , v2 sono linearmente dipendenti se e solo se uno dei due vettori
appartiene al sottospazio generato dallaltro. In realtà questo è un caso particolare della
proprietà generale che segue.
Proposizione 5.10.4. Dati n vettori v1 , v2 , . . . , vn di uno spazio V , essi sono linearmente

dipendenti se e solo se almeno uno di essi appartiene al sottospazio generato dai rimanenti.
Dimostrazione. Supponiamo che vi siano n numeri reali a1 , a2 , . . . , an non tutti nulli

tali che valga la (5.10.1). Possiamo supporre a1 6= 0 (altrimenti, grazie alla commutatività
e associatività delladdizione in V , possiamo sempre alterare lordine degli addendi nel

primo membro), quindi con facili passaggi dalla (5.10.1) otteniamo
a2 a3 an
v1 = v2 + v3 + + vn .
a1 a1 a1
Dunque v1 hv2 , v3 , . . . , vn i. Se, viceversa, vale questa condizione, ossia v1 = b2 v2 +
b3 v3 + + bn vn per certi b2 , b3 , . . . , bn R, allora vale la (5.10.1) prendendo a1 = 1,
a2 = b2 , a3 = b3 , . . . , an = bn .
La proposizione appena dimostrata consiste nella dichiarazione di equivalenza di due

proprietà; questa dichiarazione, a sua volta, equivale ad affermare che sono equivalenti le
negazioni di quelle proprietà (vedi lEsercizio 1.2.1, g)). Alla luce di questa osservazione
vediamo che la Proposizione 5.10.4 ammette la seguente formulazione equivalente.
Proposizione 5.10.5. Dati n vettori v1 , v2 , . . . , vn di uno spazio V , essi sono linearmente

indipendenti se e solo se nessuno di essi appartiene al sottospazio generato dagli altri.
Nel seguito sarà utile disporre del seguente risultato.
Proposizione 5.10.6. Siano v1 , v2 , . . . , vn vettori non nulli di uno spazio V . Allora le

seguenti affermazioni sono equivalenti:
(1) I vettori v1 , v2 , . . . , vn sono linearmente indipendenti.
(2) Se a1 , . . . , an , b1 , . . . , bn R e
a1 v1 + + an vn = b1 v1 + + bn vn , (5.10.4)
allora a1 = b1 , . . . , an = bn .
(3) Se 1 6 i 6 n 1, allora
hv1 , . . . , vi i hvi+1 , . . . , vn i = {0}.
Dimostrazione. (1)=(2) Supponendo (1), usando le regole di calcolo in uno spazio

vettoriale dalla (5.10.4) segue che
(a1 b1 )v1 + + (an bn )vn = 0,
per cui (a1 b1 ) = = (an bn ) = 0, ossia a1 = b1 , . . . , an = bn .

(2)=(3) Supponiamo che valga la (2), sia 1 6 i 6 n e supponiamo che
v hv1 , . . . , vi i hvi+1 , . . . , vn i.
Allora vi sono a1 , . . . , ai , bi+1 , . . . , bn R tali che
v = a1 v1 + + ai vi = bi+1 vi+1 + + bn vn ,
per cui
a1 v1 + + ai vi + 0vi+1 + + 0vn = 0v1 + + 0vi + bi+1 vi+1 + + bn vn
e quindi a1 = = ai = bi+1 = = bn = 0. Segue che v = 0.

(3)=(1) Assumiamo la (3), siano a1 , . . . , an R tali che
a1 v1 + + an vn = 0 (5.10.5)
e supponiamo, per assurdo, che qualcuno dei numeri a1 , . . . , an , ad esempio a1 , sia non
nullo. Allora a1 v1 6= 0 e, siccome dalla (5.10.5) risulta a1 v1 = a2 v2 an vn ,
seguirebbe
0 6= a1 v1 hv1 i hv2 , . . . , vn i,
in contrasto con lipotesi (3). Dunque deve essere a1 = = an = 0.
Nota 5.10.7. In ogni spazio vettoriale V il sottoinsieme vuoto è necessariamente libero.

Se cos` non fosse, in base alla definizione esisterebbero v1 , v2 , . . . , vn e dei numeri reali
non tutti nulli a1 , . . . , an per i quali vale la (5.10.1). Ciò è impossibile perche, appunto,
in non vi sono vettori! Come conseguenza, se V = {0}, allora è lunica base per V ,
dal momento che hi = {0}.
Vediamo ora di scoprire il significato geometrico della dipendenza lineare, quando
questa viene considerata nellambito dello spazio vettoriale SO dei vettori di E applicati
in un punto O.

Due vettori non nulli v1 = OA1 , v2 = OA2 di SO sono linearmente dipendenti se e
solo se essi sono proporzionali, cioè se e solo se i punti O, A1 , A2 sono allineati. Se r è
una retta per O e 0 6= v1 SOr , dalla Proposizione 5.6.1 abbiamo che SOr = hv1 i. Di
conseguenza abbiamo:
Proposizione 5.10.8. Data una retta r per O, un insieme {v1 , v2 , . . . , vn } di vettori non
nulli di SOr è sempre linearmente dipendente se n > 1 ed è una base per SOr se n = 1.

Se due vettori non nulli v1 = OA1 , v2 = OA2 sono indipendenti, cioè non sono
allineati, detto il piano per O, A2 , A3 risulta hv1 , v2 i = SO e quindi {v1 , v2 } è una
base per SO (confronta con la Proposizione 5.6.3). Consideriamo tre vettori non nulli

v1 = OA1 , v2 = OA2 e v3 = OA3 di SO . Tenuto conto della Proposizione 5.10.4, essi sono
linearmente dipendenti se e solo se uno, diciamo v1 , appartiene a hv2 , v3 i. Questultimo
è una retta se i tre punti O, A2 , A3 sono allineati, altrimenti è il piano che passa per essi.
Possiamo concludere affermando che v1 , v2 e v3 sono linearmente dipendenti se e solo se
sono complanari. Consideriamo ora un piano per O e un insieme {v1 , v2 , . . . , vn } di
vettori non nulli di SO con n > 2. Se questi sono allineati allora linsieme è linearmente
dipendente per la Proposizione 5.10.8. Altrimenti fra di essi ve ne sono due non allineati,
diciamo v1 e v2 , quindi, per quanto visto sopra, hv1 , v2 i = SO . Ciò comporta che i
rimanenti vettori v3 , . . . , vn appartengono a hv1 , v2 i, quindi linsieme {v1 , v2 , . . . , vn } è
linearmente dipendente per la Proposizione 5.10.4. Riassumendo, possiamo enunciare
quanto segue.
Proposizione 5.10.9. Tre vettori di SO sono linearmente dipendenti se e solo se sono

complanari. Se è un piano per O, un insieme {v1 , v2 , . . . , vn } di vettori non nulli di
SO è sempre linearmente dipendente se n > 2 ed è una base per SO se e solo se n = 2 e
v1 , v2 non sono allineati.
Tenuto conto della Proposizione 5.6.5, tre vettori non complanari (quindi linearmente
indipendenti per quanto detto sopra) costituiscono sempre una base per SO . Prendiamo,
invece, un insieme {v1 , v2 , . . . , vn } di vettori non nulli di SO con n > 3. Se gli n vettori
sono complanari, lintero insieme è linearmente dipendente per la Proposizione 5.10.9.
In caso contrario, tre di quei vettori non sono complanari, diciamo v1 , v2 , v3 . Dunque
{v1 , v2 , v3 } è una base per SO e quindi i rimanenti vettori v4 , . . . , vn appartengono a
hv1 , v2 , v3 i, per cui linsieme {v1 , v2 , . . . , vn } è linearmente dipendente per la Proposizione
5.10.4. Possiamo allora concludere con la seguente
Proposizione 5.10.10. Un insieme {v1 , v2 , . . . , vn } di vettori non nulli di SO è sempre

linearmente dipendente se n > 3 ed è una base per SO se e solo se n = 3 e v1 , v2 , v3 non
sono complanari.
Occupiamoci ora dello spazio vettoriale Rn e, per ogni i {1, 2, . . . , n}, sia ei la n-pla
le cui coordinate sono tutte zero salvo la i-esima, la quale è 1:
e1 = (1, 0, . . . , 0), e2 = (0, 1, 0, . . . , 0), e3 = (0, 0, 1, 0, . . . , 0), . . . en = (0, . . . , 0, 1).
Allora per ogni x = (x1 , x2 , . . . , xn ) Rn risulta
x = (x1 , x2 , . . . , xn ) = (x1 , 0, . . . , 0) + (0, x2 , 0, . . . , xn ) + + (0, . . . , 0, xn )

= x1 (1, 0, . . . , 0) + x2 (0, 1, 0, . . . , xn ) + + xn (0, . . . , 0, 1)
= x 1 e1 + x 2 e 2 + + x n e n .
Dunque Rn = he1 , e2 , . . . , en i. Se a1 , a2 , . . . , an sono numeri reali tali che
a1 e1 + a2 e2 + + an en = 0 = (0, 0, . . . , 0),
allora necessariamente a1 = a2 = = an = 0, perche il primo membro è la n-pla

(a1 , a2 , . . . , an ). Di conseguenza {e1 , e2 , . . . , en } è una base per Rn . Lo stesso tipo di
ragionamento può essere fatto, mutatis mutandis, sulle colonne

0
0
1 1
0

0
0 1 ..

e1 = .. , e2 = 0 , e3 = 0 , . . . en = . ,

. .. 0
. ..
0 . 1
0
0
giungendo alla conclusione che { e1 , e2 , . . . , en } è una base per Rn . Riassumendo:

Proposizione 5.10.11. Con le notazioni di cui sopra, gli insiemi

{e1 , e2 , . . . , en } e { e1 , e2 , . . . , en }
sono delle basi per gli spazi vettoriali Rn e Rn rispettivamente; esse si chiamano le basi
canoniche.
Esercizi 5.10.12. Si fissi in E unorigine e un riferimento cartesiano (i, j, k).
a) Provare che se a, b, c sono numeri reali non nulli, allora {ai, bj, ck} è una base per
SO . (Sugg.: basta provare che i tre vettori ai, bj, ck sono linearmente indipendenti).
b) Provare che {i, i + j, i + j + k} è una base per SO . (Sugg.: se a, b, c sono numeri
reali tali che
ai + b(i + j) + c(i + j + k),
allora. . . ).
c) Considerati i vettori v1 = 2i + j 2k, v2 = j 3k, v3 = 2i + 2j + k, stabilire se
{v1 , v2 , v3 } è una base di SO oppure no (Sugg.: Basta esaminare se v1 , v2 , v3 sono linear-
mente indipendenti. Siano x, y, z numeri reali tali che xv1 + yv2 + zv3 = 0. Sostituendo
a v1 , v2 , v3 le loro espressioni assegnate in termini della base {i, j, k} e raccogliendo si
ottiene
(2x + 2z)i + (x y + 2z)j + (2x 3y + z)k = 0.
Siccome i, j, k sono linearmente indipendenti, deve essere

2x + 2z
=0
x y + 2z =0

2x 3y + z = 0.

Questo è un sistema lineare di tre equazioni nelle incognite x, y, z che si risolve in modo
elementare.)
d) Stesso quesito di c), con v1 = i + j, v2 = j 2k, v3 = 2i.
e) Stesso quesito di c), con v1 = 2j + k, v2 = 3j k, v3 = 2i.
Esercizio 5.10.13. Sia v un vettore non nullo di uno spazio vettoriale V . Provare che se
a1 , . . . , an sono numeri reali (con n > 2), allora i vettori a1 v, a2 v, . . . , an v sono linearmente
dipendenti.
Esercizio 5.10.14. Sia {v1 , v2 , . . . , vn } una base di uno spazio vettoriale V . E ` sempre
vero che, se a1 , a2 , . . . , an sono numeri reali, allora {a1 v1 , a2 v2 , . . . , an vn } è ancora una
base per V ?
Esercizio 5.10.15. Si consideri lo spazio vettoriale R4 . Di ciascuno dei seguenti insiemi
di vettori di R4 , stabilire se si tratta di una base per R4 (Sugg.: Procedere come suggerito
nellEsercizio 5.10.12, c), esprimendo i vettori in questione come combinazioni lineari dei
vettori e1 , e2 , e3 , e4 della base canonica):
a) {(1, 2, 0, 5), (1, 0, 1, 3), (0, 1, 5, 2), (1, 1, 1, 0)};
b) {(1, 2, 0, 5), (2, 0, 2, 6), (0, 2, 10, 4), (3, 4, 8, 3)};
c) {(1, 2, 0, 0), (0, 1, 2, 0), (0, 0, 3, 3), (1, 0, 0, 5)}.
5.11 Dimensione di uno spazio vettoriale.

In questa sezione vogliamo approfondire il concetto di base per uno spazio vettoriale.
Innanzi tutto, alla luce di quanto discusso nella sezione precedente sorgono naturali alcuni
problemi; il primo di essi è il seguente:
` vero che ogni spazio vettoriale ha una base?
Problema 1. E
Diciamo subito che la risposta a questa domanda è affermativa, anche se la prova di ciò
richiede strumenti che non possono essere introdotti in questo corso. A parte lesempio che
discuteremo fra breve, noi ci interesseremo solo di spazi vettoriali che possiedono qualche
base finita. Ma ecco allora il secondo problema:
Problema 1. Vi sono spazi vettoriali che non hanno una base finita?
Anche la risposta a questo problema è affermativa, come mostrato dallesempio seguente.
Esempio 5.11.1. Diciamo che una successione a = (a0 , a1 , . . . , an , . . .) di numeri reali
è definitivamente nulla se, per essa, esiste un indice k tale che ai = 0 quando i >
k. Chiaramente questa condizione equivale ad affermare che nella successione a vi è al
massimo un numero finito di termini diversi da zero. Per esempio:
(0, 0, . . . , 0, . . .), (2, 0, 5, 3, 0, 0, . . . , 0, . . .), (0, 1, 0, 0 . . . , 0, . . .),

(0, 0, 0, 3 5, 0, 0, . . . , 0, . . .), (1, 5, 0, 2, 1/4, 0, 0, . . . , 0, . . .).
Il lettore può provare facilmente (esercizio da fare!) che linsieme R(N) di tutte le succes-
sioni definitivamente nulle è un sottospazio dello spazio vettoriale RN di tutte le successioni
di numeri reali (vedi lEsempio 5.7.8). Di conseguenza R(N) è esso stesso un spazio vetto-
riale rispetto alle operazioni definite in RN (vedi la Nota 5.8.2). Per ogni numero naturale
k possiamo isolare in R(N) il sottoinsieme delle successioni che hanno nulli i termini dal
k + 1-esimo in poi, indicandolo con Vk :
Vk := {(a0 , a1 , . . . , ak , 0, 0 . . .) | a0 , a1 , . . . , ak R}.
Quindi V0 contiene le successioni del tipo (a0 , 0, 0, . . .) con a0 arbitrario, V1 contiene le
` chiaro che se h < k, allora
successioni del tipo (a0 , a1 , 0, 0, . . .) con a0 , a1 arbitrari, ecc.. E
(N)
Vh $ Vk e ciascuno dei Vk è un sottospazio di R (provarlo!). Si noti, infine, che se
0 6= a = (a0 , a1 , . . . , an , . . .) R(N) e ak è lultimo termine diverso da zero di a, allora
a Vk ; in altri termini risulta (vedi la Definizione 1.3.1)
[
R(N) = Vk .
kN
Supponiamo che R(N) abbia una base finita, sia questa {a1 , a2 , . . . , ar }. Per ogni indice
i {1, 2, . . . , r}, denotiamo con aij il j-esimo termine della successione ai . Siccome le
successioni a1 , a2 , . . . , ar hanno ciascuna un numero finito di termini diversi da zero,
vi deve essere un indice k sufficientemente grande tale che a1 , a2 , . . . , ar si trovano in
Vk . Ma questultimo è un sottospazio, quindi ogni combinazione lineare delle successioni
a1 , a2 , . . . , ar rimane in esso, per cui ha1 , a2 , . . . , ar i Vk $ R(N) , quando noi avevamo
preteso che fosse ha1 , a2 , . . . , ar i = R(N) . Questa contraddizione prova che R(N) non ha
una base finita.
Esercizio 5.11.2. Non è difficile individuare una base (necessariamente infinita) per
R(N) . Per ogni n N indichiamo con ei la successione che ha nulli tutti i suoi termini
salvo ln-esimo, che è 1:
e0 = (1, 0, 0 . . .), e1 = (0, 1, 0, 0 . . .), e2 = (0, 0, 1, 0, 0 . . .), ecc..
Provare che {e0 , e1 , . . . , ek } è una base per Vk , per ogni k N. Dedurre che linsieme
{ek | k N} = {e0 , e1 , e2 , . . .} è una base per R(N) .
Limitando la nostra attenzione agli spazi vettoriali che hanno una base finita, abbiamo
allora il seguente problema:
Problema 2. E ` possibile che uno spazio vettoriale V abbia due basi {v1 , v2 , . . . , vm } e
{w1 , w2 , . . . , wn } con m 6= n?
Questa volta la risposta è negativa; la chiave di ciò risiede nel seguente fondamentale
teorema, detto anche Teorema del completamento.
Teorema 5.11.3. Sia V uno spazio vettoriale che ha una base A di n elementi. Se B è
un sottoinsieme indipendente di V di cardinalità m 6 n, allora è possibile estrarre n m
vettori v1 , v2 , . . . , vnm della base A tali che B {v1 , v2 , . . . , vnm } è una base di V di n
elementi. In particolare, se B ha n elementi, allora anche B è una base.
Dimostrazione. Se 0 6 m 6 n, indichiamo con P (m) la seguente affermazione:
Se B un sottoinsieme indipendente di V di cardinalità m, allora esiste

un sottoinsieme B 0 A tale che |B 0 | = n m e B B 0 è una base di V di n elementi.
Dobbiamo allora dimostrare che P (m) è vera per ogni m tale che 0 6 m 6 n. Per
raggiungere tale obiettivo applicheremo il Principio di Induzione Finita 1.13.1 allintervallo
[0, n]. Laffermazione P (0) è unovvietà: per m = 0 si prende B 0 = A. Assumiamo
0 6 m < n, supponiamo che P (m) sia vera e proviamo che, di conseguenza, anche
P (m + 1) è vera. Supponiamo dunque di avere un sottoinsieme indipendente C V tale
che |C| = m + 1 e mostriamo che vi è un sottoinsieme C 0 A tale che |C 0 | = n (m + 1)
e C C 0 è una base di V di n elementi. Se C A, basta prendere C 0 = A C; in caso
contrario, scelto w C A, linsieme B = C {w} è indipendente ed ha m elementi; in
base allipotesi induttiva esiste un sottoinsieme B 0 A tale che |B0 | = n m e B B 0 è
una base di V di n elementi. Di conseguenza, scrivendo
B 0 = {v1 , v2 , . . . , vnm } e C = {w1 , w2 , . . . , wm , wm+1 = w},
risulta
wm+1 = a1 v1 + + anm vnm + b1 w1 + + bm wm (5.11.1)
per certi a1 , . . . , anm , b1 , . . . , bm R. Almeno uno dei coefficienti a1 , . . . , anm non è nullo
(perche?); eventualmente rinumerando gli elementi di B 0 e, in corrispondenza, i coefficienti
a1 , . . . , anm , possiamo supporre che anm 6= 0, per cui dalla (5.11.1) otteniamo
a1 anm1 b1 bm
vnm = v1 vnm1 w1 wm + wm+1 .
anm anm anm anm
Preso C 0 = {v1 , v2 , . . . , vnm1 }, abbiamo che C C 0 genera V (perche?). Resta da

mostrare che C C 0 è libero. Supponiamo, per assurdo, che vi siano c1 , . . . , cnm1 ,
d1 , . . . , dm+1 R non tutti nulli tali che
c1 v1 + + cnm1 vnm1 + d1 w1 + + dm+1 wm+1 = 0.
Necessariamente dm+1 6= 0, perche {v1 , . . . , vnm1 , w1 , . . . , wm } è indipendente in quanto
sottoinsieme della base B B 0 . Otteniamo allora
c1 cnm1 d1 dm
wm+1 = v1 vnm1 w1 wm .
dm+1 dm+1 dm+1 dm+1
Confrontando questa uguaglianza con la (5.11.1) e applicando la Proposizione 5.10.6 de-
duciamo che deve essere anm = 0, in contraddizione con quanto sopra supposto. Dunque
i numeri c1 , . . . , cnm1 , d1 , . . . , dm+1 sono tutti nulli; ciò prova da un lato lindipenden-
za di C C 0 , dallaltro lato che nella lista v1 , . . . , vnm1 , w1 , . . . , wm , wm+1 non vi sono
ripetizioni. Possiamo dunque concludere che C C 0 è una base di n elementi, per cui è
vera P (m + 1). In forza del Principio di Induzione Finita possiamo affermare che P (m) è
vera ogni volta che 0 6 m 6 n. Infine, se B ha n elementi, per quanto sopra dimostrato
vi è un sottoinsieme B 0 A di cardinalità n n = 0 tale che B B0 è una base. Dato che
adesso è B 0 = , concludiamo che B è una base.
La prima importante conseguenza del teorema appena dimostrato è il fatto che se uno
spazio vettoriale V ha una base di n elementi, allora ogni altra base di V ha n elementi.
Per provare ciò abbiamo bisogno del seguente utile lemma, la cui dimostrazione lasciamo
al lettore per esercizio.
Lemma 5.11.4. Dati m vettori v1 , . . . , vm di uno spazio vettoriale V , se per qualche
n < m linsieme {v1 , . . . , vn } è una base per V , allora i vettori v1 , . . . , vm sono linearmente
dipendenti.
Teorema e Definizione 5.11.5. Sia V uno spazio vettoriale. Se V ha una base A di n
elementi, allora tutte le basi di V hanno n elementi. Si dice allora che V ha dimensione
n e si scrive dim(V ) = n.
Dimostrazione. Supponiamo che B sia una base di V di cardinalità m. Se fosse m < n,
essendo B indipendente, in base al Teorema 5.11.3 vi sarebbe un sottoinsieme A0 di AB,
avente n m > 0 elementi, tale che B A0 è una base di n elementi. Ciò è impossibile,
perche B era già una base di V e quindi, per il Lemma 5.11.4, B A0 non potrebbe essere
indipendente, dato che contiene B ed ha pi` u elementi di B. Dunque deve essere m > n e,
scambiando i ruoli di A e B, lo stesso argomento mostra che deve essere n > m, per cui
m = n.
In generale, per spazio vettoriale di dimensione finita si intende uno spazio vet-
toriale che ha una base finita. Salvo diversamente specificato, tutti gli spazi vettoriali che
consideriamo sono da intendersi di dimensione finita.
Corollario 5.11.6. Se V è uno spazio vettoriale di dimensione n, allora un sottoinsieme
linearmente indipendente di V ha al massimo n elementi.
Il seguente teorema illustra unaltra proprietà fondamentale degli spazi vettoriali.
Teorema 5.11.7. Se V è uno spazio vettoriale di dimensione finita n, allora ogni sot-
toinsieme A di V contiene almeno un sottoinsieme libero massimale B, nel senso che se
B $ C A, allora C non è libero. Inoltre
|B| 6 n
e B è una base per il sottospazio hAi di V generato da A. Se, in particolare, A è un

insieme generatore per V , allora B è una base di V .
Dimostrazione. Possiamo supporre che A 6= , perche altrimenti la tesi è immediata,

tenuto conto della Nota 5.10.7. Per ogni intero positivo m, denotiamo con P (m) la
seguente affermazione:
in A vi è un sottoinsieme libero di m elementi .
Notiamo che P (0) è vera, perche è un sottoinsieme libero di A di 0 elementi. Allora

linsieme
X = {m N | P (m) è vera}
non è vuoto, visto che almeno 0 X; inoltre X è finito, perche se m X, allora
m 6 n per il Corollario 5.11.6. Dunque X ha il massimo (Proposizione 1.5.3): sia questo
r. Esplicitamente, questo significa che A contiene almeno un sottoinsieme libero B di
u di r elementi. Dunque B è un
r elementi, ma non contiene sottoinsiemi liberi di pi`
sottoinsieme libero massimale di A e, per quanto sopra, risulta r 6 n. Per provare ora
che B è una base di hAi, basta provare che
hBi = hAi. (5.11.2)
Indicando con v1 , . . . , vr gli r elementi di B, se w A B, allora w, v1 , . . . , vr sono

linearmente dipendenti, altrimenti {w, v1 , . . . , vr } sarebbe un sottoinsieme libero di A di
r + 1 elementi. Dunque vi sono dei numeri reali a0 , a1 , . . . , ar non tutti nulli tali che
a0 w + a1 v1 + + ar vr = 0.
Non può essere a0 = 0, perche v1 , . . . , vr sono linearmente indipendenti. Di conseguenza

otteniamo
w = a1 1
0 a1 v1 a0 ar vr ,
per cui w hv1 , . . . , vr i. Concludiamo che
hAi hv1 , . . . , vr i hAi,
quindi vale la (5.11.2).
Corollario 5.11.8. Se A è un sottoinsieme (finito) di uno spazio vettoriale V , allora

dim(hAi) 6 |A|; inoltre risulta dim(hAi) = |A| se e solo se A è indipendente e, di
conseguenza, è una base per hAi.
Se E è un sottospazio di uno spazio vettoriale di dimensione finita, allora anche E ha

dimensione finita, come precisato di seguito.
Teorema 5.11.9. Sia V uno spazio vettoriale di dimensione finita n. Se E è un sot-

tospazio di V , allora
dim(E) 6 n.
Se F è un secondo sottospazio di V tale che E $ F , allora dim(E) < dim(F ); in particolare
dim(E) = n se e solo se E = V.
Dimostrazione. Per il Teorema 5.11.7 in E vi è un sottoinsieme libero massimale B con

|B| 6 n. Siccome hEi = E, allora B è una base di E, per cui dim(E) = |B| 6 n. Supponia-
mo che F sia un secondo sottospazio tale che E F . Allora dim(E) 6 dim(F ), per quanto
appena visto. Scelte due basi B e C per E ed F rispettivamente, se è dim(E) = dim(F ),
allora |B| = |C| e quindi dal Teorema del Completamento 5.11.3 deduciamo che anche B
è una base per F . Di conseguenza E = hBi = F .
Tenendo presente quanto abbiamo visto nella sezione precedente, fissata unorigine
O nello spazio E, le rette per O sono spazi vettoriali di dimensione uno, i piani per O
sono spazi vettoriali di dimensione due e lintero spazio SO dei vettori applicati in O ha
dimensione tre. La Proposizione 5.10.11 ci dice che, per ogni intero positivo n, gli spazi
vettoriali Rn e Rn hanno dimensione n. Uno spazio vettoriale V ha dimensione zero se e
solo se V = {0} (vedi la Nota 5.10.7).
Esercizio 5.11.10. Se m, n sono due interi positivi, qualè la dimensione dello spazio
vettoriale Mm,n (R) delle matrici di formato m n?
Esercizio 5.11.11. Siano dati n + 1 vettori v, v1 , v2 , . . . , vn di uno spazio vettoriale V .

Provare che v hv1 , v2 , . . . , vn i se e solo se
dim(hv1 , v2 , . . . , vn i) = dim(hv, v1 , v2 , . . . , vn i).
5.12 Somma e somma diretta di sottospazi.

Sia V uno spazio vettoriale. Se E, F sono sottospazi di V , allora anche E F è un
sottospazio (Esercizio 5.8.10); quanto allunione E F , essa è un sottospazio solo nei casi
banali in cui E F oppure F E (Esercizio 5.8.11). Definiamo la somma E + F nel
modo seguente:
E + F = : {u + v | u E, v F }. (5.12.1)
Siccome 0 E e 0 F , allora 0 = 0 + 0 E + F . Inoltre, dati w1 , w2 E + F e
a1 , a2 R, risulta
w1 = u1 + v1 e w2 = u2 + v2 ,
per certi u1 , u2 E e v1 , v2 F ; di conseguenza
a1 w1 + a2 w2 = a1 u1 + a2 u2 + a1 v1 + a2 v2 E + F,
dato che a1 u1 + a2 u2 E e a1 v1 + a2 v2 F . Dunque E + F è un sottospazio di V in

base alla Proposizione 5.8.3.
Vale la pena osservare che, data la commutatività delladdizione in V , dalla definizione
(5.12.1) segue che
E + F = F + E.
Pi`
u in generale, definiamo la somma di un numero arbitrario E1 , E2 , . . . , En di sot-
tospazi di V dichiarando
E1 + E2 + + En = : {v1 + v2 + + vn | v1 E1 , v2 E2 , . . . , vn En }; (5.12.2)
sarà cura del lettore provare che il secondo membro è effettivamente un sottospazio.
Osserviamo che, fissato un i n e preso un vettore u Ei , possiamo ovviamente scrivere
u = u1 + + ui + + un
prendendo uj = u se j = i e uj = 0 se j 6= i; siccome il vettore nullo appartiene

ad ogni sottospazio di V , questa uguaglianza mostra che u E1 + E2 + + En . Di
conseguenza ciascuno dei sottospazi E1 , E2 , . . . , En è contenuto in E1 + E2 + + En .
Daltro canto, se F è un sottospazio di V che contiene tutti gli E1 , E2 , . . . , En , presi
u1 E1 , u2 E2 , . . . , un En deve necessariamente essere u1 + u2 + + un F ,
per cui E1 + E2 + + En F . Infine, supponiamo che A1 , A2 , . . . , An siano insiemi
generatori per E1 , E2 , . . . , En rispettivamente, ossia Ei = hAi i per ogni i n, e siano
u1 E1 , u2 E2 , . . . , un En . Allora per ogni i n vi sono dei vettori ui1 , . . . , ui mi Ai
e degli scalari ai1 , . . . , ai mi tali che
ui = ai1 ui1 + + ai mi ui mi ,
per cui
u1 + u2 + + un = + a11 u11 + + a1 m1 u1 m1
+ a21 u21 + + a2 m2 u2 m2
+ + an1 un1 + + an mn un mn ,
dove il secondo membro appartiene evidentemente a hA1 A2 An i. In conclusione,

abbiamo la proposizione seguente:
Proposizione 5.12.1. Se E1 , E2 , . . . , En sono sottospazi di uno spazio vettoriale V , al-

lora E1 + E2 + + En è il minimo (rispetto allinclusione) sottospazio di V fra quelli
che li contengono. Inoltre, se A1 , A2 , . . . , An sono insiemi generatori per E1 , E2 , . . . , En
rispettivamente, allora A1 A2 An è un insieme generatore per E1 +E2 + +En .
Esercizio 5.12.2. Siano E, F, G sottospazi di uno spazio vettoriale V . Provare che se

E G, allora
E + (F G) = (E + F ) G.
Se E1 , E2 , . . . , En sono sottospazi di V , un vettore v E1 + E2 + + En può avere

diverse scomposizioni
v = v1 + v2 + + vn
nella somma di vettori v1 E1 , v2 E2 , . . . , vn En . Per esempio, sia V = R3 e
prendiamo
E1 = {(x, y, 0) | x, y R} e E2 = {(0, y, z) | y, z R}.
Il lettore può provare, a titolo di esercizio, che E1 +E2 = R3 e E1 E2 = {(0, y, 0) | y R}.
Notiamo che risulta, per esempio,
(1, 1, 1) = (1, 1, 0) + (0, 0, 1) = (1, 2, 0) + (0, 1, 1) = (1, 5, 0) + (0, 4, 1)
ed è (1, 1, 0), (1, 2, 0), (1, 5, 0) E1 e (0, 0, 1), (0, 1, 1), (0, 4, 1) E2 . Invece, se pren-
diamo due sottospazi E1 , E2 tali che E1 E2 = {0}, allora ogni vettore di E1 + E2 ha
ununica scomposizione nella somma di un vettore di E1 pi` u un vettore di E2 . Infatti, se
v1 + v2 = w1 + w2
con v1 , w1 E1 e v2 , w2 E2 , allora
v1 w1 = w2 v2 E1 E2 ,
per cui
v1 w1 = w2 v2 = 0;
di conseguenza v1 = w1 e v2 = w2 . La situazione appena descritta è, in reaà, un caso
particolare di una delle proprietà descritte nel seguente fondamentale teorema.
Teorema e Definizione 5.12.3. Dati n > 1 sottospazi E1 , E2 , . . . , En di uno spazio

vettoriale V e considerato il sottospazio
F = E1 + E2 + + En ,
le seguenti condizioni sono equivalenti:
(1) Se v F , allora vi sono degli unici v1 E1 , v2 E2 , . . . , vn En tali che
v = v1 + v2 + + vn . (5.12.3)
(2) Se v1 E1 , v2 E2 , . . . , vn En e risulta
v1 + v2 + + vn = 0, (5.12.4)
allora v1 = v2 = = vn = 0.
(3) Presi comunque dei vettori non nulli v1 E1 , v2 E2 , . . . , vn En , linsieme

{v1 , v2 , . . . , vn } è linearmente indipendente.
(4) Per ogni i n risulta
ci + + En ) = {0} 2 ;
Ei (E1 + E2 + + E (5.12.5)
in parole: lintersezione fra uno qualunque dei sottospazi E1 , E2 , . . . , En e la somma

dei rimanenti è ridotta al vettore nullo.
(5) Se A1 , A2 , . . . , An sono basi di E1 , E2 , . . . , En rispettivamente, allora
Ai Aj = per ogni i, j n con i 6= j (5.12.6)
Se vale una (e quindi anche le rimanenti) di tali condizioni, si dice che il sottospazio F
è somma diretta dei sottospazi E1 , E2 , . . . , En e che questi ultimi sono indipendenti.
In tali condizioni si scrive anche
F = E1 E2 En ,
dicendo che questa uguaglianza è una decomposizione diretta di F e, precisamente,

che F si decompone nella somma diretta di E1 , E2 , . . . , En .
Dimostrazione. (1)(2) Questa implicazione è immediata, visto che la (5.12.4) vale in

modo ovvio prendendo v1 = v2 = = vn = 0.
(2)(3) Supponiamo che valga la (2), consideriamo dei vettori non nulli v1 E1 , v2
E2 , . . . , vn En e siano a1 , a2 , . . . , an R tali che
a1 v1 + a2 v2 + + an vn = 0.
Allora segue dalla condizione (2) che deve essere ai vi = 0 per ogni i n. Siccome ciascun
vi è diverso dal vettore nullo, concludiamo che a1 = a2 = = an = 0, per cui linsieme
{v1 , v2 , . . . , vn } è linearmente indipendente.
(3)(4) Assumiamo (3), sia i n e mostriamo che se
v Ei (E1 + E2 + + E
ci + + En ), (5.12.7)
allora v = 0. Dalla (5.12.7) segue che vi sono dei vettori vj Ej , con j n {i}, tali
che
v = v1 + + c
vi + + vn ,
ossia
v v1 c
vi vn = 0.
In forza dellipotesi (3) deve essere v = 0 e vj = 0 per j n {i}.
(4)(1) Assumendo (4), consideriamo dei vettori v1 , w1 E1 , v2 , w1 E2 , . . . ,
vn , w1 En e supponiamo che
v1 + v2 + + vn = w1 + w2 + + wn .
2
Salvo diversamente specificato, quando in una sommatoria su un termine viene apposto il cappello
c , si intende che tale termine non deve comparire.
Allora, preso i n, abbiamo che
vi wi = (w1 v1 ) + + (w\
i vi ) + + (wn vn ),
di modo che
vi wi E1 (E1 + E2 + + E
ci + + En ).
Come conseguenza abbiamo che vi wi = 0, ossia vi = wi .

(4)(5) Supponiamo che valga la (4) e siano A1 , A2 , . . . , An basi per E1 , E2 , . . . , En
rispettivamente. Presi i, j n con i 6= j, se fosse v Ai Aj , tenendo presente che
Ai Ei e Aj E1 + E2 + + E
ci + + En ,
dalla (5.12.5) seguirebbe che v = 0, contro il fatto che 0 6 Ai . Dunque deve essere
Ai Aj = . Poniamo ora A = A1 A2 An e notiamo che F = hAi, tenuto conto
della Proposizione 5.12.1; di conseguenza, per provare che A è una base per F , non resta
che mostrare lindipendenza di A. Per questo scopo applichiamo la Proposizione 5.10.5,
facendo vedere che nessun vettore di A appartiene al sottospazio generato dai rimanenti.
Supponiamo che, al contrario, vi sia un v A tale che
v hA {v}i. (5.12.8)
Dallipotesi (4) risulta v hAi i per un unico i n e quindi dalla (5.12.8) segue che
v hAi {v}i + E1 + E2 + + E
ci + + En .
Possiamo allora scrivere

v =u+w
per certi u hAi {v}i Ei e w E1 + E2 + + E
ci + + En . Notando che v Ei ,
segue che
v u = w E1 (E1 + E2 + + Eci + + En ),
per cui vu = 0, ossia v = u. Dunque v appartiene al sottospazio hAi {v}i, in contrasto

con la Proposizione 5.10.5. Concludiamo che nessuno dei vettori di A appartiene al
sottospazio generato dai rimanenti, per cui A è indipendente di nuovo per la Proposizione
5.10.5.
(5)(4) Assumiamo che valga la (5) e prendiamo delle basi A1 , A2 , . . . , An per E1 ,
E2 , . . . , En rispettivamente. Dato i n, dobbiamo mostrare che se vale la (5.12.7), allora
v = 0. Poniamo
A = A1 An = {u1 , . . . , ur , v1 , . . . , vs },
dove {u1 , . . . , ur } = Ai . Osserviamo che dalla (5.12.6) segue che
A Ai = A 1 A
ci An = {v1 , . . . , vs },
per cui
E1 + E2 + + E
ci + + En = hA Ai i,
tenuto conto della Proposizione 5.12.1. Dalla (5.12.7) deduciamo allora che vi sono
a1 , . . . , ar , b1 , . . . , bs R tali che
v = a1 u1 + + ar ur = b1 v1 + + bs vs
e quindi
a1 u1 + + ar ur b1 v1 bs vs = 0.
Ma A = {u1 , . . . , ur , v1 , . . . , vs } è indipendente, quindi a1 = = ar = b1 = = bs = 0.
Dunque v = 0, come volevamo.
La condizione (5) del Teorema 5.12.3 suggerisce come ottenere delle decomposizioni
dirette di uno spazio V , una volta che si disponga di una sua base A. Infatti, considerata
una qualunque partizione {A1 , A2 , . . . , An } di A e posto Ei = hAi i per ogni i n, risulta
V = E1 E2 En .
Esercizio 5.12.4. Provare che se E1 , E2 , . . . , En sono sottospazi di uno spazio vettoriale
V , allora risulta
dim(E1 + E2 + + En ) 6 dim(E1 ) + dim(E2 ) + + dim(En ) (5.12.9)
(Sugg.: tenere presenti la Proposizione 5.12.1 e il Corollario 5.11.8).
In quali casi nella (5.12.9) vale luguaglianza? Una risposta parziale è fornita dal
seguente risultato.
Proposizione 5.12.5. Se E1 , E2 , . . . , En sono sottospazi indipendenti di uno spazio vet-
toriale V , allora risulta
dim(E1 E2 En ) = dim(E1 ) + dim(E2 ) + + dim(En ). (5.12.10)
Dimostrazione. Siano A1 , A2 , . . . , An delle basi di E1 , E2 , . . . , En rispettivamente e
poniamo A = A1 A2 An . Allora la condizione (5) del Teorema 5.12.3 ci dice che
{A1 , . . . , An } è una partizione di A. Di conseguenza |A| = |A1 | + |A2 | + + |An | (vedi
la Proposizione 1.13.2) e quindi la (5.12.10).
Come vedremo fra breve, laffermazione di cui alla proposizione appena dimostrata
si inverte, ossia il fatto che nella (5.12.9) valga luguaglianza è una condizione non solo
necessaria, ma anche sufficiente affinche la soma dei sottospazi E1 , E2 , . . . , En sia diretta.
Se V è uno spazio vettoriale (di dimensione finita), ogni sottospazio di V è membro
di qualche decomposizione diretta di V , come precisato dalla proposizione che segue.
Proposizione e Definizione 5.12.6. Sia V uno spazio vettoriale di dimensione n e sia
E un sottospazio di V . Allora esiste un sottospazio F di V tale che V = E F ; il
sottospazio F si chiama un complemento di E in V .
Dimostrazione. Scegliamo due basi A, B per V ed E rispettivamente e sia m = dim(E).
Per il Teorema 5.11.3 esiste un sottoinsieme C di A tale che |C| = n m e A B è una
base per V . Se prendiamo F = hCi, la tesi segue immediatamente dalla condizione (5)
del Teorema 5.12.3.
Note 5.12.7. a) Se F è un complemento per E in V , allora E è un complemento per F

in V e dalla Proposizione 5.12.5 segue che
dim(E) + dim(F ) = dim(V ).
b) Evidentemente V e il sottospazio nullo {0} sono ciascuno lunico complemento per

laltro in V ; ma se dim(V ) > 1 ed E è un sottospazio non banale di V , allora E ha infiniti
complementi in V .
Teorema 5.12.8. (Teorema di Grassman). Sia V uno spazio vettoriale di dimensione

finita. Se E, F sono due sottospazi di V , allora
dim(E + F ) = dim(E) + dim(F ) dim(E F ). (5.12.11)
Dimostrazione. In base alla Proposizione 5.12.6 possiamo scegliere un complemento H

per E F in E e un complemento K per E F in F , di modo che
E = H (E F ) e F = K (E F ) (5.12.12)
e quindi
E + F = H + K + (E F ). (5.12.13)
Vogliamo mostrare che la somma a secondo membro della (5.12.13) è diretta. Per questo
scopo verifichiamo che i sottospazi H, K, E F soddisfano la condizione (2) del Teorema
5.12.3. Presi u H, v K, w E F , supponiamo che
u+v+w =0 (5.12.14)
e mostriamo che, di conseguenza, deve essere u = v = w = 0. Tenuto conto della seconda

delle (5.12.12), dalla (5.12.14) segue che
u = v w K (E F ) = F
e quindi u H (E F ) = {0}, ossia u = 0. Deduciamo allora dalla (5.12.14) che

v = w K (E F ) = {0}, per cui v = w = 0, come volevamo. A questo punto,
tenuto conto delle (5.12.12) e della Proposizione 5.12.5, possiamo concludere che
dim(E + F ) = dim(H) + dim(K) + dim(E F )

= (dim(E) dim(E F )) + (dim(F ) dim(E F )) + dim(E F )
= dim(E) + dim(F ) dim(E F ).
Grazie al Teorema di Grassman è ora possibile invertire la Proposizione 5.12.5.
Proposizione 5.12.9. Se E1 , E2 , . . . , En sono sottospazi di uno spazio vettoriale V e

risulta
dim(E1 + E2 + + En ) = dim(E1 ) + dim(E2 ) + + dim(En ),
allora la somma E1 + E2 + + En è diretta.
Dimostrazione. Procedendo per induzione sul numero n dei sottospazi considerati,

osserviamo che laffermazione relativa al caso n = 1 è ovvia (un singolo sottospazio E1 è
indipendente, dato che per n = 1 è verificata la condizione (1) del Teorema 5.12.3). Dato
un intero n > 0, supponiamo induttivamente che laffermazione sia valida nel caso di n
sottospazi; considerati n + 1 sottospazi E1 , . . . , En , En+1 tali che
dim(E1 + + En + En+1 ) = dim(E1 ) + + dim(En ) + dim(En+1 ), (5.12.15)
dobbiamo provare che, di conseguenza, la somma E1 + + En + En+1 è diretta. Per il

Teorema di Grassman abbiamo
dim(E1 + + En + En+1 )
= dim(E1 + + En ) + dim(En+1 ) dim((E1 + + En ) En+1 );
questa, assieme alla (5.12.15), implica che
dim(E1 ) + + dim(En ) = dim(E1 + + En ) dim((E1 + + En ) En+1 ).
Di conseguenza abbiamo
dim(E1 + + En ) 6 dim(E1 ) + + dim(En )

= dim(E1 + + En ) dim((E1 + + En ) En+1 ) 6 dim(E1 + En )
(per la prima disuguaglianza vedi lEsercizio 5.12.4). Dunque abbiamo da un lato che
dim((E1 + + En ) En+1 ) = 0,
per cui
(E1 + + En ) En+1 = {0};
dallaltro lato deve essere
dim(E1 + + En ) = dim(E1 ) + + dim(En ),
quindi la somma E1 + + En è diretta in base allipotesi induttiva. Finalmente, per

provare che anche la somma E1 + + En + En+1 è diretta, prendiamo v1 E1 , . . . , vn
En , vn+1 En+1 , e supponiamo che sia
v1 + + vn + vn+1 = 0.
Allora
vn+1 = (v1 + + vn ) (E1 + + En ) En+1 = {0},
da cui
vn+1 = 0 e v1 + + vn = 0.
Dal Teorema 5.12.3 segue che deve essere anche v1 = = vn = 0, dato che la somma
E1 + + En è diretta. Ancora grazie al Teorema 5.12.3, possiamo concludere che la
somma E1 + + En + En+1 è diretta.
5.13 Applicazioni lineari.

Definizione 5.13.1. Dati due spazi vettoriali V , W , si dice che una funzione f : V W
è lineare, oppure che è una applicazione lineare, o untrasformazione lineare se
valgono le seguenti proprietà:
f (v1 + v2 ) = f (v1 ) + f (v2 ) per ogni v1 , v2 V ,
f (av) = af (v) per ogni v V e a R .
Note 5.13.2. a) Il lettore può provare per esercizio che f : V W è unapplicazione
lineare se e solo se verifica la seguente condizione:
f (a1 v1 + a2 v2 ) = a1 f (v1 ) + a2 f (v2 ) per ogni v1 , v2 V e a1 , a2 R .
b) Se f : V W è unapplicazione lineare, allora
f (0) = 0 (5.13.1)
(dovrebbe essere chiaro dal contesto che con lo stesso simbolo 0 intendiamo il vettore
nullo di V al primo membro e il vettore nullo di W a secondo membro); inoltre
f (v) = f (v) per ogni v V . (5.13.2)
Infatti la (5.13.1) segue dal fatto che, considerato il vettore nullo 0 V , risulta
f (0) = f (0 + 0) = f (0) + f (0).
Inoltre, dato v V , abbiamo
0 = f (0) = f (v + v) = f (v) + f (v),
da cui la (5.13.2).
Esempi 5.13.3. a) Come prima cosa elenchiamo gli esempi banali. Se V è un qualun-
que spazio vettoriale, la funzione identica 1V : V V è chiaramente lineare, come pure è
lineare liniezione canonica i : E V di un sottospazio E di V in V stesso. Dati due spazi
vettoriali V e W , sia 0 : V W la funzione costante che ad ogni vettore di V assegna il
vettore nullo di W , cioè
0(v) = 0 per ogni v V .
A causa dalla (5.13.1), 0 è lunica funzione costante da V verso W ad essere lineare.
b) Le funzioni x 7 x2 : R R e x 7 (2x 5) : R R non sono lineari (perche?).
c) Dato uno spazio vettoriale V e un numero reale k, la funzione k : V V definita
da
k (v) = kv per ogni v V
è lineare (controllarlo!); essa si chiama lomotetia di rapporto k.
d) Come caso particolare di c), controlliamo che una funzione f : R R è lineare se e
solo se essa è unomotetia. Infatti, supponiamo che f sia lineare e consideriamo il numero
k = f (1). Allora per ogni x R abbiamo f (x) = f (x1) = xf (1) = xk = kx = k (x), per
cui f = k .
Il seguente esempio è di importanza cruciale.

Esempio 5.13.4. Data una matrice A Mm,n (R), sia LA : Rn Rm la funzione definita
da
LA (X) = : Ax, per ogni X Rn ; (5.13.3)

x1
x2
esplicitamente, se x = .. e indicando al solito con Aij lentrata di posto (i, j) di A,

.
xn

x1 A11 A12 . . . A1n x1
x2 A21 A22 . . . A2n x2
LA .. = ..

.. .. ..
. . . ... . .
xn Am1 Am2 . . . Amn xn

A11 x1 + A12 x2 + + A1n xn
A21 x1 + A22 x2 + + A2n xn
= .

..
.
Am1 x1 + Am2 x2 + + Amn xn
Il lettore può provare per esercizio che LA è unapplicazione lineare, che viene detta
lapplicazione lineare associata alla matrice A. Se m = n, ossia A è una matrice
quadrata, allora LA : Rn Rn è unomotetia se e solo se A è una matrice scalare; in tal
caso LA = k , dove k = A11 = A22 = = Ann .
Nota 5.13.5. Circa lapplicazione lineare LA : Rn Rm di cui allesempio precedente,
nel seguito risulterà estremamente utile osservare che, per ogni j n, risulta

A1j
A2j

LA ( ej ) = A ej = .. ,

.
Amj
ossia limmagine tramite LA del j-esimo vettore ej della base canonica di Rn è esatta-
mente la j-esima colonna della matrice A.
Limportanza dellesempio precedente risiede nel fatto che le applicazioni lineari da
Rn verso Rm sono tutte della forma LA , come precisato dal risultato che segue.
Proposizione 5.13.6. Per ogni applicazione lineare f : Rn Rm esiste ununica matrice
A Mm,n (R) tale che f = LA . Tale matrice si chiama la matrice associata allappli-
cazione lineare f (relativamente alle basi canoniche) e si indica con il simbolo M (f ) .
Di conseguenza risulta:
f = LM (f ) per ogni applicazione lineare f : Rn Rm ,

A = M (LA ) per ogni matrice A Mm,n (R).
Dimostrazione. Per quanto riguarda lunicità, se per due matrici A, B Mm,n (R)
risulta LA = LB , allora per ogni per ogni j n deve essere
LA ( ej ) = LB ( ej ).
Tenuto conto della Nota 5.13.5, i due membri di questuguaglianza sono la j-esima colonna
di A il primo e la j-esima colonna di B il secondo. Dunque A = B. Supponiamo ora
di avere unapplicazione lineare f : Rn Rm e consideriamo le immagini tramite f dei
vettori e1 , . . . , en della base canonica di Rn ; in quanto vettori di Rm , queste saranno
delle colonne ad m righe:

A11 A12 A1n
A21 A22 A2n

f ( e1 ) = .. , f ( e2 ) = .. , . . . , f ( e1 ) = .. .

. . .
Am1 Am2 Amn
Possiamo allora considerare la matrice M (f ) Mm,n (R) che possiede, nellordine, queste
colonne:
A11 A12 . . . A1n
A21 A22 . . . A2n
M (f ) = .. .. .

..
. . ... .
Am1 Am2 . . . Amn
Lasciamo al lettore la facile verifica del fatto che per ogni vettore x Rm risulta f (x) =
M (f )x e quindi f = LM (f ) . Infine, data una matrice A Mm,n (R), la matrice M (LA )
associata allapplicazione lineare LA è necessariamente A stessa (vedi ancora la Nota
5.13.5), ossia A = M (LA ).
Esercizio 5.13.7. Sia V uno spazio vettoriale, sia E un sottospazio di V e sia F un
complemento di E in F ; per ogni v V indichiamo con vE e vF gli unici vettori di E ed
F , rispettivamente, tali che v = vE + vF . Provare che la funzione pE
F : M F definita
da
pE
F (v) = vF per ogni v V ,
è lineare; essa si chiama la proiezione di V su F parallela ad E.
Proposizione 5.13.8. Se V, W, X sono spazi vettoriali e f : V W , g : W X sono
applicazioni lineari, allora anche la composizione g f : V X è unapplicazione lineare.
Dimostrazione. Possiamo usare il criterio di cui alla Nota 5.13.2, a). Dati v1 , v2 V
e a1 , a2 R, abbiamo
(g f )(a1 v1 + a2 v2 ) = g(f (a1 v1 + a2 v2 ))

= g(a1 f (v1 ) + a2 f (v2 )) per la linearità di f ,
= a1 g(f (v1 )) + a2 g(f (v2 )) per la linearità di g,
= a1 (g f )(v1 ) + a2 (g f )(v2 ).
Dunque la tesi.
Esercizio 5.13.9. Date due matrici A Mm,n (R), B Mn,p (R) e considerate le
applicazioni lineari associate LA : Rn Rm , LB : Rp Rn , provare che risulta
LA LB = LAB .
Inoltre
LU(n) = 1Rn .
Esercizio 5.13.10. Date due applicazioni lineari f : Rn Rm e g : Rp Rn , provare
che risulta
M (g f ) = M (g)M (f );
in parole: la matrice associata allapplicazione lineare composta g f è uguale al prodotto
della matrice associata a g per la matrice associata ad f . Inoltre risulta
M (1Rn ) = U(n) .
Unapplicazione lineare è determinata dalla sua azione sui singoli vettori di una fissata
base del dominio. Precisamente, consideriamo unapplicazione lineare f : V W e sia
A = {v1 , v2 , . . . , vn } una base per lo spazio V . Se v V , allora vi sono degli unici
x1 , x2 , . . . , xn R tali che
v = x1 v1 + x2 v2 + + xn vn (5.13.4)
(vedi la Proposizione 5.10.2); da questa ricaviamo facilmente che
f (v) = x1 f (v1 ) + x2 f (v2 ) + + xn f (vn ). (5.13.5)
Dunque f è determinata dalle immagini f (v1 ), f (v2 ), . . . , f (vn ) dei vettori della base A.
La proposizione che segue ci dice che accade qualcosa di pi` u.
Proposizione 5.13.11. Siano V , W due spazi vettoriali e sia A = {v1 , v2 , . . . , vn } una
base per V . Se w1 , w2 , . . . , wn sono dei vettori assegnati di W , allora esiste ununica
applicazione lineare f : V W tale che
f (v1 ) = w1 , f (v2 ) = w2 , . . . , f (vn ) = wn . (5.13.6)
Precisamente, dato v V e considerata lunica scomposizione (5.13.4), risulta
f (v) = x1 w1 + x2 w2 + + xn wn . (5.13.7)
Dimostrazione. Visto che ciascun vettore v V determina in modo univoco le sue
coordinate x1 , x2 , . . . , xn rispetto alla base A, il secondo membro della (5.13.7) dipende
solo da v, per cui la (5.13.7) stessa definisce in modo univoco una funzione f : V W .
Il lettore provi, per esercizio, che f è lineare e che se g : V W è unapplicazione lineare
tale che
g(v1 ) = w1 , g(v2 ) = w2 , . . . , g(vn ) = wn ,
allora g = f .
Le applicazioni lineari rispettano i sottospazi del dominio e del codominio, nel senso
chiarito dalla proposizione seguente.
Proposizione 5.13.12. Siano V , W spazi vettoriali e sia f : V W unapplicazione

lineare.
(1) Se E è un sottospazio di V , allora f (E) è un sottospazio di W .
(2) Se M è un sottospazio di W , allora f 1 (M ) è un sottospazio di V .
(3) Se v1 , v2 , . . . , vn sono vettori di V , allora
f (hv1 , v2 , . . . , vn i) = hf (v1 ), f (v2 ), . . . , f (vn )i (5.13.8)
Dimostrazione. Useremo il criterio di cui alla Proposizione 5.8.3.

(1) Sia E un sottospazio di V . Dati w1 , w2 f (E) e a1 , a2 R, vi sono v1 , v2 E
tali che w1 = f (v1 ) e w2 = f (v2 ), per cui
a1 w1 + a2 w2 = a1 f (v1 ) + a2 f (v2 ) = f (a1 v1 ) + f (a2 v2 ) = f (a1 v1 + a2 v2 ).
Siccome a1 v1 + a2 v2 E, concludiamo che a1 w1 + a2 w2 f (E).
(2) Supponiamo che M sia un sottospazio di W . Dati v1 , v2 f 1 (M ) e a1 , a2 R,
abbiamo
f (a1 v1 + a2 v2 ) = a1 f (v1 ) + a2 f (v2 )
Siccome f (v1 ), f (v2 ) M , il secondo membro di questa uguaglianza è un vettore di M .
Dunque a1 v1 + a2 v2 f 1 (M ).
(3) A causa della linearità di f , per ogni x1 , x2 , . . . , xn R abbiamo
f (x1 v1 + x2 v2 + + xn vn ) = x1 f (v1 ) + x2 f (v2 ) + + xn f (vn ). (5.13.9)
Ma allora gli elementi del primo e del secondo membro della (5.13.8) sono precisamente i
vettori espressi rispettivamente dal primo e dal secondo membro della (5.13.9). Dunque
vale luguaglianza (5.13.8).
Esercizio 5.13.13. Sia f : V W unapplicazione lineare. Provare che se E1 , . . . , Er
sono sottospazi di V , allora
f (E1 + + Er ) = f (E1 ) + + f (Er ).
Come viene mostrato con lesercizio seguente, se f : V W è unapplicazione lineare
e A = {v1 , v2 , . . . , vn } è una base di V , non è detto che f (A) = {f (v1 ), f (v2 ), . . . , f (vn )}
sia un insieme generatore di W e neppure che f (A) sia linearmente indipendente.
Esercizio 5.13.14. Sia LA : R3 R3 lapplicazione lineare associata alla matrice

2 3 1
A= 1 0 2 .
1 2 4
Considerati i vettori

1 0 0

e1 = 0 , e2 = 1 , e3 = 0 ,
0 0 1
della base canonica di R3 , provare che linsieme {LA ( e1 ), LA ( e2 ), LA ( e3 )} non è linear-
mente indipendente e neppure genera R3 (Sugg.: ricordare la Nota 5.13.5).
Come vedremo pi` u avanti, il fatto che unapplicazione lineare conservi lindipendenza
lineare è legato alliniettività.
Definizione 5.13.15. Siano V , W spazi vettoriali e sia f : V W unapplicazione

lineare. Il sottospazio f 1 ({0}) di V si chiama il nucleo di f e si indica con Ker(f ),
mentre il sottospazio f (V ) di W si chiama limmagine di f e si indica con Im(f ).
Esplicitamente:
Ker(f ) = : {v V | f (v) = 0},
Im(f ) = : {w W | w = f (v) per qualche v V } = {f (v) | v V }.
Si chiama il rango dellapplicazione lineare f , e si indica con rg(f ), la dimensione
dellimmagine di f :
rg(f ) = : dim(Im(f )).
Esercizio 5.13.16. Con riferimento allEsercizio 5.13.7, provare che Ker(pE

F) = E e
E
Im(pF ) = F .
Dalla (3) della Proposizione 5.13.12 abbiamo immediatamente la seguente proprietà.
Proposizione 5.13.17. Se f : V W è unapplicazione lineare e v1 , v2 , . . . , vn è una

base di V , allora
Im(f ) = f (V ) = hf (v1 ), f (v2 ), . . . , f (vn )i. (5.13.10)
Come applicazione, data una matrice A Mm,n (R), possiamo facilmente determinare
limmagine dellapplicazione lineare LA : Rn Rm associata ad A. Indicando con w1 , w2 ,
. . . , wn le colonne di A, ricordiamo che queste sono le rispettive immagini, tramite LA ,
dei vettori e1 , e2 , . . . , en della base canonica di Rn (vedi la Nota 5.13.5). La (5.13.10)
ci permette allora di affermare quanto segue.
Corollario 5.13.18. Sia data una matrice A Mm,n (R), sia LA : Rn Rm lapplicazione
lineare associata ad A e siano w1 , w2 , . . . , wn le colonne di A. Allora
Im(LA ) = hw1 , w2 , . . . , wn i.
In parole, limmagine di LA coincide con il sottospazio di Rm generato dalle colonne di

A.
Le dimensioni del dominio del nucleo e dellimmagine di unapplicazione lineare sono

vincolate fra loro, come illustrato dal teorema che segue.
Teorema 5.13.19. Se V , W sono spazi vettoriali (di dimensione finita) e f : V W è

unapplicazione lineare, allora risulta
dim(V ) = dim(Ker(f )) + dim(Im(f )). (5.13.11)
Dimostrazione. Scelto in V un complemento E per Ker(f ), in base alla Proposizione

5.12.5 risulta
dim(V ) = dim(Ker(f )) + dim(E).
Basta allora provare che dim(Im(f )) = dim(E). Scelta una base u1 , . . . , ur per E, abbi-
amo che i vettori f (u1 ), . . . , f (ur ) di Im(f ) sono linearmente indipendenti. Infatti, dati
x1 , x2 , . . . , xr R, se x1 f (u1 ) + + xr f (ur ) = 0, allora per la linearità di f segue che
f (x1 u1 + + xr ur ) = 0 e quindi x1 u1 + + xr ur Ker(f ). Daltra parte è anche
x1 u1 + + xr ur E; siccome E Ker(f ) = {0}, deve essere x1 u1 + + xr ur = 0 e
quindi x1 = x2 = = xr = 0. Infine, siccome
Im(f ) = f (V ) = f (Ker(f ) + E) = f (Ker(f )) + f (E) = f (E)

= f (hu1 , . . . , ur i) = hf (u1 ), . . . , f (ur )i,
(usare lEsercizio 5.13.13 e la (3) della Proposizione 5.13.12) concludiamo che i vettori
f (u1 ), . . . , f (ur ) costituiscono una base di Im(f ), per cui dim(Im(f )) = r = dim(E).
Chiaramente unapplicazione lineare f : V W è suriettiva se e solo se Im(f ) = W .

Per quanto riguarda liniettività abbiamo il seguente risultato.
Proposizione 5.13.20. Data unapplicazione lineare f : V W , le seguenti condizioni

sono equivalenti:
(1) f è iniettiva.
(2) Ker(f ) = {0}.
(3) Vi è una base {u1 , u2 , . . . , un } di V tale che i vettori f (u1 ), f (u2 ), . . . , f (un ) sono
(4) dim(Im(f )) = dim(V ).
Se una (e quindi anche le rimanenti) di tali condizioni è verificata e dei vettori v1 , v2 , . . . , vr

di V sono linearmente indipendenti, allora sono linearmente indipendenti anche i vettori
f (v1 ), f (v2 ), . . . , f (vr ).
Dimostrazione. (1)(2) Se f : V W è iniettiva e v Ker(f ), allora f (v) = 0 =

f (0), per cui v = 0 e quindi Ker(f ) = {0}.
(2)(1) Supponiamo che valga la (2). Se v, w V sono tali che f (v) = f (w), allora
0 = f (v) f (w) = f (v w), per cui v w Ker(f ). Concludiamo che v w = 0, ossia
v = w, per cui f è iniettiva.
(2)(3) Supponiamo che valga la (2) e mostriamo che se v1 , v2 , . . . , vr sono vet-
tori di V linearmente indipendenti, allora sono linearmente indipendenti anche i vettori
f (v1 ), f (v2 ), . . . , f (vr ); in particolare vale a (3), dato che noi assumiamo che gli spazi
vettoriali che consideriamo possiedano almeno una base. Siano x1 , x2 , . . . , xn R tali che
x1 f (v1 ) + x2 f (v2 ) + + xn f (vn ) = 0.
Il primo membro di questuguaglianza coincide con f (x1 v1 +x2 v2 + +xn vn ) a causa della
linearità di f , per cui x1 v1 +x2 v2 + +xn vn Ker(f ) e quindi x1 v1 +x2 v2 + +xn vn = 0.
Di conseguenza x1 = x2 = = xn = 0, per cui f (v1 ), f (v2 ), . . . , f (vr ) sono linearmente
indipendenti.
(3)(2) Supponiamo che valga la (3) e prendiamo v Ker(f ). Vi sono degli unici
x1 , x2 , . . . , xn R tali che v = x1 v1 + x2 v2 + + xn vn , per cui
x1 f (v1 ) + x2 f (v2 ) + + xn f (vn ) = f (x1 v1 + x2 v2 + + xn vn ) = f (v) = 0.
Dunque x1 = x2 = = xn = 0 e quindi v = 0.
(2)(4): si tratta di unovvia conseguenza del Teorema 5.13.19.
Esercizio 5.13.21. Sia f : V W unapplicazione lineare qualunque e siano dati

dei vettori v1 , v2 , . . . , vn di V . Provare che se f (v1 ), f (v2 ), . . . , f (vn ) sono linearmente
indipendenti, allora anche v1 , v2 , . . . , vn sono linearmente indipendenti.
5.14 Isomorfismi di spazi vettoriali.

Di particolare interesse sono le applicazioni lineari che sono biiettive come funzioni, ossia
sono invertibili (vedi la Proposizione 1.11.6). E` importante osservare che
Proposizione 5.14.1. Se unapplicazione lineare f : V W è biiettiva, allora anche la

funzione inversa f 1 : W V è lineare.
Dimostrazione. Applicando il criterio di cui alla Nota 5.13.2, a), consideriamo due
scalari a1 , a2 R e due vettori w1 , w2 W . Abbiamo
f (f 1 (a1 w1 + a2 w2 )) = a1 w1 + a2 w2
= a1 f (f 1 (w1 )) + a2 f (f 1 (w2 ))
= f (a1 f 1 (w1 ) + a2 f 1 (w2 )),
dove lultima uguaglianza è dovuta alla linearità di f . Confrontando il primo e lultimo

membro, dalliniettività di f segue
f 1 (a1 w1 + a2 w2 ) = a1 f 1 (w1 ) + a2 f 1 (w2 ),
quindi la linearità di f 1 .
Definizione 5.14.2. Unapplicazione lineare f : V W si dice un isomorfismo se è
biiettiva; in tal caso anche f 1 : W V è un isomorfismo, detto lisomorfismo inverso
di f . Si dice che due spazi vettoriali V , W sono isomorfi se esiste almeno un isomorfismo
da V verso W , e quindi anche uno da W verso V (dato dallinverso del primo).
Se V, W, X sono spazi vettoriali e f : V W , g : W X sono due isomorfismi,
allora anche la composizione g f : V X è un isomorfismo (perche?). La funzione
identica 1V : V V è ovviamente un isomorfismo. Altri esempi, di importanza cruciale,
li presentiamo negli esercizi seguenti.
Esercizio 5.14.3. Sia V uno spazio vettoriale, sia A = {v1 , v2 , . . . , vn } una base di V e
consideriamo la funzione
FV,A : Rn V
definita da
x1
x2
FV,A = x1 v1 + x2 v2 + + xn vn . (5.14.1)

..
.
xn
La Proposizione 5.10.2 afferma che FV,A è una biiezione, di cui le Fi , Fi,j , Fi,j,k introdotte
nella Sezione 5.6 sono casi particolari. A titolo di esercizio, il lettore provi che FV,A è
lineare, quindi è un isomorfismo.
Esercizio 5.14.4. Dati due interi positivi m, n, provare che la funzione : Mm,n (R)
Mn,m (R) che ad ogni matrice A assegna la trasposta A è un isomorfismo. Come caso
particolare, la funzione : Rn Rn definita da

x1
x2

x1 x2 xn 7 x1 x2 xn = ..
.
xn
è un isomorfismo.
Proposizione 5.14.5. Sia f : V W un isomorfismo di spazi vettoriali e sia A =
{v1 , v2 , . . . , vn } un sottoinsieme finito di V . Allora A è una base per V se e solo se
f (A) = {f (v1 ), f (v2 ), . . . , f (vn )} è una base per W .
Dimostrazione. Se A è una base per V , allora i vettori v1 , v2 , . . . , vn sono linearmente
indipendenti. Essendo f iniettiva, in base alla Proposizione 5.13.20 sono linearmente in-
dipendenti le immagini f (v1 ), f (v2 ), . . . , f (vn ). Inoltre dalla Proposizione 5.13.17 risulta
che f (A) è un insieme generatore per Im(f ) = W , dunque f (A) è una base per W .
La proposizione precedente ci dice che se due spazi vettoriali V , W sono isomorfi,

allora dim(V ) = dim(W ). In realtà vale anche il viceversa, come affermato dal teorema
seguente.
Teorema 5.14.6. Se gli spazi vettoriali V , W sono isomorfi, allora dim(V ) = dim(W ).
Viceversa, se dim(V ) = dim(W ) e A = {v1 , v2 , . . . , vn }, B = {w1 , w2 , . . . , wn } sono due
basi per V e W rispettivamente, lunica applicazione lineare f : V W tale che
f (v1 ) = w1 , f (v2 ) = w2 , . . . , f (vn ) = wn
(vedi la Proposizione 5.13.11) è un isomorfismo.
Dimostrazione. Dobbiamo solamente provare che f è biiettiva. Liniettività segue dal
fatto che f verifica la (3) della Proposizione 5.13.20, mentre la suriettività segue dalla
Proposizione 5.13.17, dato che
hf (v1 ), f (v2 ), . . . , f (vn )i = hw1 , w2 , . . . , wn i = W.
Esercizio 5.14.7. Con riferimento allEsercizio 5.14.3, provare che se f è lisomorfismo

di cui al Teorema 5.14.6, allora
f = FW,B (FV,A )1 .
Facciamo notare lanalogia formale fra il seguente teorema e la Proposizione ??.
Teorema 5.14.8. Sia f : V W unapplicazione lineare e supponiamo che sia dim(V ) =

n = dim(W ). Allora le seguenti condizioni sono equivalenti:
(1) f è iniettiva.
(2) f è suriettiva.
(3) f è un isomorfismo.
Dimostrazione. (1)(3) Supponiamo che f sia iniettiva e sia {v1 , v2 , . . . , vn } una base
per V . Allora i vettori f (v1 ), f (v2 ), . . . , f (vn ) sono linearmente indipendenti per la Propo-
sizione 5.13.20 e generano Im(f ) per la Proposizione 5.13.17, per cui essi formano una
base per Im(f ). Di conseguenza dim(Im(f )) = n e quindi Im(f ) = W in base al Teorema
5.11.9, dato che dim(W ) = n. Ciò prova che f è suriettiva e quindi è un isomorfismo.
(3)(2): è ovvio.
(2)(1) Supponiamo che f sia suriettiva e sia {w1 , w2 , . . . , wn } una base per W . Vi
sono dei vettori u1 , u2 , . . . , un V tali che f (u1 ) = w1 , f (u2 ) = w2 , . . . , f (un ) = wn .
Siccome u1 , u2 , . . . , un devono essere linearmente indipendenti (vedi lEsercizio 5.13.21),
essendo dim(V ) = n essi formano una base per V . Liniettività di f segue allora dalla
Proposizione 5.13.20, dato che è verificata la condizione (3) di questultima.
5.15 Rango di una matrice. La riduzione a scala.

Data una matrice A Mmn (R), risulta di rilevante interesse determinare la dimensione
del sottospazio di Rn generato dalle sue righe. Come vedremo pi`
u avanti, questa coincide
con la dimensione del sottospazio di Rm generato dalle colonne, il quale non è altro che
limmagine dellapplicazione lineare associata LA : Rn Rm (Corollario 5.13.18).
Definizione 5.15.1. Data una matrice A Mmn (R), si chiama rango di A la dimensione
del sottospazio di Rn generato dalle righe di A; esso si indica con il simbolo rg(A).
Introduciamo ora una classe speciale di matrici, per le quali la determinazione del
rango è immediatamente possibile con un esame diretto di esse.
Definizione 5.15.2. Si dice che una matrice A Mm,n (R) è una matrice a scala (o a
gradini) se:
(1) vi è un intero positivo r 6 m tale che le prime r righe di A sono tutte e sole le righe
non nulle;
(2) per ogni i r, se Aiji è la prima entrata non nulla delli-esima riga, le entrate della
ji esima colonna al di sotto di Aiji sono tutte zero.
Le entrate A1j1 , A2j2 , . . . , Arjr si chiamano i cardini (o pivots) della matrice A.
Dunque la matrice A è a scala se ha il seguente aspetto, il quale ne giustifica il nome:
0 . . . 0 A1j1 . . . ... ... ...

0 . . . 0 0 0 . . . 0 A2j2
... ... ...
0 ... 0 0 0 ... 0 0
. 0 . . . 0 A3j3 . . . . . .
. . .. .. . .. .. .. .. .. .. .. .. ..
. . . . .. . . . . . .. . . ... . . . ... . . . ... .

A=
0 ... 0 0 0 ... 0 0 0 . . . 0 0 0 . . . 0 Arjr . . .

0 ... 0 0 0 ... 0 0 0 ... 0 0 0 ... 0 0 0 ... 0

.
.. . . . ... ..
.
.. .
. . . . ..
..
.
.. .
. . . . ..
..
.
.. .
. . . . ..
..
.
.. .
. . . . ..
0 ... 0 0 0 ... 0 0 0 ... 0 0 0 ... 0 0 0 ... 0
(quando unentrata di una matrice viene indicata con un asterisco, si intende che il suo
valore non è rilevante nel contesto). Si noti che il numero r dei cardini di A non può
superare il pi`
u piccolo dei numeri m, n. Nel seguito potrà risultare conveniente chiamare
i cardini A1j1 , A2j2 , . . . , Arjr rispettivamente il primo cardine, il secondo cardine, . . . ,
lultimo cardine di A.
Per esempio, sono a scala le seguenti matrici:

6 5 2 2
2 0 0 1 1 0 1 1 2
0 1 0 0 3

0 0
0 3 1 0 1 0 5
3 0
0 0 0 , 0 0 2 0 ,
0 0 0 0 4 , 0 0 ,

0 2
0 0 0 0 0 0 3
0 0 0 0 0 0 0 0 0
0 0 0 0

3
1 2 1 1 2 1 3 0
0 3 1 , 0 3 1 0 , 2 1 5 0 2 , 0 ;

0 0 5 0 0 5 0
0
i cardini sono 2, 1, 4 nella 1a , 6, 1, 3, 2 nella 2a , 3 nella 3a , 1, 2, 3 nella 4a , 1, 3, 5 nella

5a e nella 6a , 2 nella 7a e 3 nella 8a . Non sono a scala, invece, le seguenti matrici:

1 3 0 5 7
0 1 0 0 3 2 0 0 1 1 0 2 0 0 2
0 0 0 0 4 0 0 0 0 0
2 0 0 1 1 , 0 1 0 0 3 , 0 3 5 1 4 ,

0 0 2 0 1
0 0 0 0 0 0 0 0 0 4
0 0 0 0 0

0
0 0 5 0 0 0 4
0 3 1 , 3 0 0 , .
0
1 2 1 1 0 0
0
Proposizione 5.15.3. Sia A Mmn (R) una matrice a scala con r cardini e siano E,
F rispettivamente il sottospazio di Rm generato dalle righe di A e il sottospazio di Rn
generato dalle colonne di A. Allora:
(1) Le righe di A contenenti i cardini costituiscono una base per E, mentre le colonne
contenenti i cardini costituiscono una base per F .
(2) F coincide con il sottospazio h e1 , e2 , . . . , er i di Rm generato dai primi r vettori

della base canonica.
Di conseguenza rg(A) = dim(E) = dim(F ) = r.
Dimostrazione. Indichiamo con v1 , v2 , . . . , vm le righe e con w1 , w2 , . . . , wn le colonne

di A. Se la matrice A ha un solo cardine, allora la prima riga è lunica riga non nulla di A ed
è quindi indipendente. Anche la colonna contenente lunico cardine è indipendente perche
non nulla (anche se non è necessariamente lunica colonna non nulla di A!). Procedendo
per induzione, dato un intero r > 0, supponiamo che la proprietà (1) sia vera ogni volta
che A è una matrice a scala con meno di r cardini e prendiamo una matrice a scala A con
r cardini A1j1 , A2j2 , . . . , Arjr . Se indichiamo con A0 la matrice ottenuta da A sopprimendo
la prima riga, allora A0 è una matrice di formato (m 1) n con r 1 cardini. Per
lipotesi induttiva, le righe di A0 contenenti i cardini, cioè v2 , . . . , vr , sono vettori di Rn
linearmente indipendenti e formano una base per il sottospazio di Rn generato dalle righe
di A0 . Mostriamo che anche le righe di A contenenti i cardini, cioè v1 , v2 , . . . , vr , sono
linearmente indipendenti. Supponiamo che vi siano dei numeri reali c1 , c2 , . . . , cr tali che
c1 v1 + c2 v2 + + cr vr = (0, 0, . . . , 0).
Il primo membro di questa uguaglianza è un vettore di Rn che ha nulle tutte le coordinate

che precedono la j1 -esima, la quale coincide con c1 A1j1 . Deve allora essere c1 A1j1 = 0, per
cui c1 = 0, dato che A1j1 6= 0. Di conseguenza
c2 v2 + + cr vr = (0, 0, . . . , 0)
e quindi, essendo v2 , . . . , vr linearmente indipendenti per lipotesi induttiva, deduciamo

che c2 = = cr = 0. Dunque le righe v1 , v2 , . . . , vr sono linearmente indipendenti.
Siccome queste sono anche le uniche righe non nulle di A, esse formano una base per E,
per cui dim(E) = r. Non molto diverso è il ragionamento sulle colonne. Sia A00 la matrice
che si ottiene da A sopprimendo le colone dalla jr -esima in poi. Allora A00 è una matrice
a scala con r 1 cardini e quindi, per lipotesi induttiva, le colonne di A00 contenenti
cardini, ossia wj1 , . . . , wjr1 , sono vettori di Rm linearmente indipendenti. Supponiamo
che vi siano dei numeri reali d1 , d2 , . . . , dr tali che

0
0
d1 wj1 + + dr1 wjr1 + dr wjr = .. .

.
0
Il primo membro di questa uguaglianza è un vettore di Rm che ha nulle tutte le coordinate

che seguono la r-esima, la quale coincide con dr Arjr . Deve allora essere d1 Arjr = 0, per
cui dr = 0, dato che Arjr 6= 0. Di conseguenza

0
0
d1 wj1 + + dr1 wjr1 = .. ,

.
0
per cui d1 = = dr1 = 0 in base allipotesi induttiva. Concludiamo che le colonne

wj1 , . . . , wjr1 , wjr sono linearmente indipendenti e quindi dim(F ) > r. Ora le colonne di
A appartengono tutte al sottospazio h e1 , e2 , . . . , er i di Rm generato dai primi r vettori
della base canonica, per cui
F h e1 , e2 , . . . , er i.
Di conseguenza
r 6 dim(F ) 6 dim(h e1 , e2 , . . . , er i) = r,
per cui dim(F ) = r e laffermazione (2) è provata.
Definizione 5.15.4. Due matrici A, B Mm,n si dicono equivalenti se il sottospazio di

Rn generato dalle righe di A coincide con il sottospazio generato dalle righe di B.
La terminologia è giustificata dal fatto che la relazione binaria in Mm,n (R), la quale
dichiara che A è in relazione con B quando il sottospazio di Rn generato dalle righe di
A coincide con il sottospazio generato dalle righe di B, è chiaramente una relazione di
equivalenza. Evidentemente, se A e B sono equivalenti, allora rg(A) = rg(B). Tuttavia,
il fatto che A e B abbiano lo stesso formato e rg(A) = rg(B) non comporta lequivalenza
di A e B (Esercizio 5.15.6).
Esercizio 5.15.5. Stabilire se le due seguenti matrici sono equivalenti o no:

1 0 1 2 2 2 4 4
2 1 1 0 , 0 1 3 4 .
1 1 2 2 2 0 2 4
Esercizio 5.15.6. Stabilire che le due seguenti matrici hanno lo stesso rango ma non
sono equivalenti:

1 0 1 2 1 1 2 2
2 1 1 0 , 0 1 3 4 .
1 1 0 2 1 0 1 2
Definizione 5.15.7. Si chiamano operazioni elementari sulle righe di una matrice

A Mm,n (R) le seguenti:
(1) scambio di due righe;

(2) moltiplicare una riga per

un numero reale non nullo, ossia sostituire
la i-esima riga
Ai1 Ai2 Ain con la riga rAi1 rAi2 rAin dove r è un numero
reale non nullo;
(3) sommare ad una riga una delle rimanenti moltiplicata per un numero reale os-
sia, scelti i, j m con
i 6= j e un numero reale r, sommare
alla i-esima riga
Ai1 Ai2 Ain la riga rAj1 rAj2 rAjn , sostituendo dunque la
i-esima riga con la nuova riga

Ai1 + rAj1 Ai2 + rAj2 Ain + rAjn ,
Proposizione 5.15.8. Date due matrici A, B Mm,n , se è possibile passare da A a B

tramite una sequenza finita di operazioni elementari sulle righe di A, allora A e B sono
equivalenti.
Dimostrazione. Siano v1 , v2 , . . . , vm le righe di A e siano w1 , w2 , . . . , wm le righe di

B. Supponiamo che B sia ottenibile tramite una sequenza finita di operazioni elementari
sulle righe di A. Al fine di provare che A è equivalente a B, basta evidentemente supporre
che B sia il risultato di una singola operazione elementare sulle righe di A. Se questa
operazione è lo scambio di due righe, è chiaro che A e B sono equivalenti. Supponiamo
che B sia ottenuta da A moltiplicando la i-esima riga per un numero reale r 6= 0, ossia
wj = vj se j 6= i, mentre wi = rvi . Allora
hw1 , w2 , . . . , wm i = hv1 , . . . vi1 , rvi , vi+1 . . . , vm i = hv1 , v2 , . . . , vm i,
per cui A e B sono equivalenti. Infine, supponiamo che B sia ottenuta da A tramite
unoperazione di tipo (3), ossia che vi siano degli indici i, j m, con i 6= j, e un numero
reale r tali che

wi = vi + rvj = Ai1 + rAj1 Ai2 + rAj2 Ain + rAjn , (5.15.1)
mentre wk = vk se k 6= i. Di conseguenza, da un lato è chiaro che
hw1 , w2 , . . . , wm i hv1 , v2 , . . . , vm i,
mentre dalla (5.15.1) ricaviamo che
vi = vi + rvj rvj = wi rwj ,
per cui
hw1 , w2 , . . . , wm i hv1 , v2 , . . . , vm i.
Dunque i due sottospazi coincidono, per cui A e B sono equivalenti.
Teorema 5.15.9. Ogni matrice non nulla è equivalente ad una matrice a scala.
Dimostrazione. Dato un intero positivo m e indicata con P (m) la proposizione

Ogni matrice non nulla avente m righe è equivalente ad una matrice a scala ,
il teorema afferma che P (m) è vera per ogni intero positivo m. Per quanto riguarda P (1),
questa è evidentemente vera, dato che una matrice non nulla con una sola riga è già una
matrice a scala, avente come unico cardine la prima entrata non nulla. Dato un intero
m > 1, supponiamo che P (m 1) sia vera e proviamo che, di conseguenza, è vera anche
P (m). In maniera esplicita, supponiamo che ogni matrice non nulla con m 1 righe
sia equivalente ad una matrice a scala (Ipotesi Induttiva), consideriamo una matrice non
non nulla A con m righe e mostriamo che anche questa è equivalente ad una matrice a
scala. Alterando eventualmente lordine delle righe di A, attraverso una sequenza finita di
operazioni di tipo (1)), possiamo supporre che nella prima colonna non nulla di A, diciamo
la j1 -esima, lentrata che si trova nella prima riga non sia zero, ossia A1j1 6= 0. Per ogni
i {2, 3, . . . , m} aggiungiamo alla i-esima riga la prima moltiplicata per (Aij1 /A1j1 ),
effettuando cos` m 1 operazioni di tipo (3). Otteniamo la matrice

0 0 A1j1 A1,j1 +1 A1n
0 0 0 A2,j1 +1 (A2j1 /A1j1 )A1,j1 +1 A2n (A2j1 /A1j1 )A1n
B = .. .. .. ,

.. .. ..
. . . . . .
0 0 0 Am,j1 +1 (Amj1 /A1j1 )A1,j1 +1 Amn (Amj1 /A1j1 )Amn
equivalente alla matrice A. Indicando con B 0 la matrice ottenuta da B sopprimendo la

prima riga, otteniamo una matrice B 0 con m 1 righe la quale, per lipotesi induttiva, è
equivalente ad una matrice a scala C. Indichiamo ora con u1 , . . . , um le righe di A, con
v1 , . . . , vm le righe di B e con w1 , . . . , wm1 le righe di C. Allora v2 , . . . , vm sono le righe
di B 0 e la matrice D le cui righe sono, nellordine, v1 , w1 , . . . , wm1 è una matrice a scala;
inoltre da quanto sopra abbiamo
hu1 , . . . , um i = hv1 , . . . , vm i
= hv1 i + hv2 , . . . , vm i
= hv1 i + hw1 , . . . , wm1 i
= hv1 , w1 , . . . , wm1 i.
Dunque A è equivalente a D e la dimostrazione è completa.
In generale si parla di riduzione a scala di una matrice A riferendosi al processo di

ricerca di una qualunque matrice a scala equivalente ad A; se B è una matrice a scala ot-
tenuta da A con tale processo, si dice anche che B è una riduzione a scala di A; per quanto
abbiamo visto sopra, il numero dei cardini di B ci dà il rango di A. La dimostrazione del
teorema precedente fornisce un protocollo standard da seguire per ottenere una riduzione
a scala, il quale consiste in una sequenza finita di operazioni elementari. In ogni modo,
riteniamo che lattuazione esplicita della procedura su un esempio concreto valga pi` u di
ogni ulteriore spiegazione di carattere generale. Consideriamo la matrice

0 0 2 1 1 3 1
0 2 1 2 0 1 3
A= .
0 2 5 0 2 5 1
0 0 2 1 0 3 2
Riordiniamo le righe in maniera che la prima (da sinistra, si intende) entrata non nulla
della prima riga si trovi nella prima colonna non nulla:

0 2 1 2 0 1 3
0 2 5 0 2 5 1
;
0 0 2 1 1 3 1
0 0 2 1 0 3 2
aggiungiamo alla seconda riga la prima moltiplicata per 1:

0 2 1 2 0 1 3
0 0 4 2 2 6 2
;
0 0 2 1 1 3 1
0 0 2 1 0 3 2
aggiungiamo alla terza riga la seconda moltiplicata per 1/2:

0 2 1 2 0 1 3
0 0 4 2 2 6 2
;
0 0 0 0 0 0 0
0 0 0 0 1 6 3
scambiamo le ultime due righe:

0 2 1 2 0 1 3
0
0 4 2 2 6 2
.
0 0 0 0 1 6 3
0 0 0 0 0 0 0
Siamo pervenuti ad una matrice a scala con tre cardini: 2, 4, 1; questa è equivalente
alla matrice A, per cui le righe

0 2 1 2 0 1 3 , 0 0 4 2 2 6 2 ,

0 0 0 0 1 6 3
costituiscono una base per lo spazio generato dalle righe di A; in particolare rg(A) = 3.
Nota 5.15.10. Vale la pena sottolineare che, in generale, una matrice non nulla A
possiede infinite riduzioni a scala. Basta solo osservare che se B è una riduzione a scala
di A, moltiplicando una qualunque riga non nulla di B per un numero reale non nullo si
ottiene unaltra riduzione a scala di A. In particolare, moltiplicando ciascuna riga di B
contenente un cardine per linverso di quel cardine, si ottiene una riduzione a scala di A
con cardini tutti uguali ad 1. In ogni modo, tutte le riduzioni a scala di A hanno lo stesso
numero di cardini: il rango di A.
Proposizione 5.15.11. Se A, B Mm,n (R) sono due matrici equivalenti, allora
Ker(LA ) = Ker(LB ) e dim(Im(LA )) = dim(Im(LB )).
Dimostrazione. Siano v1 , . . . , vm le righe di A e w1 , . . . , wm le righe di B. Per ipotesi

abbiamo che
hv1 , . . . , vm i = hw1 , . . . , wm i.
Supponiamo che sia x Ker(LA ), ossia Ax = 0; questultima condizione equivale ad
affermare che vi x = 0 per ogni i m (non si dimentichi che le righe di A devono essere
considerate come matrici ad una riga ed n colonne e Ker(LA ) Rn ). Dato j m, risulta
wj = a1 v1 + + am vm per certi a1 , . . . , am R, per cui
wj x = (a1 v1 + + am vm )x
= (a1 v1 )x + + (am vm )x
= a1 (v1 x) + + am (vm x) = 0.
Dunque Bx = 0, ossia x Ker(LA ), per cui Ker(LA ) Ker(LB ). Scambiando i ruoli di

A e B, lo stesso argomento mostra che Ker(LB ) Ker(LA ), quindi vale luguaglianza.
Questultima, tenuto conto del Teorema 5.13.19, comporta che
dim(Im(LA )) = n dim(Ker(LA )) = n dim(Ker(LB )) = dim(Im(LB )).
Abbiamo ormai gli strumenti sufficienti per provare che, come anticipato, in ogni
matrice la dimensione dello spazio generato dalle colonne coincide con la dimensione dello
spazio generato dalle righe, cioè con il rango di essa.
Teorema 5.15.12. Sia data una matrice non nulla A Mm,n (R), sia B una riduzione a
scala di A avente r cardini B1j1 , B2j2 , . . . , Brjr e siano u1 , . . . , un le colonne di A. Allora
risulta:
(1) dim(hu1 , . . . , un i) = rg(A) = r.
(2) Le colonne uj1 , uj2 , . . . , ujr costituiscono una base per hu1 , . . . , un i.
(3) dim(Ker(LA )) = n rg(A).
Dimostrazione. (1) Ricordando che hu1 , . . . , un i = Im(LA ) (Corollario 5.13.18), abbia-

mo:
dim(hu1 , . . . , un i) = dim(Im(LA )) = n dim(Ker(LA )) per il Teorema 5.13.19

= n dim(Ker(LB )) per la Proposizione 5.15.11
= dim(Im(LB )) per il Teorema 5.13.19
= rg(B) = r.
Dunque vale la (1), tenendo presente che rg(A) = rg(B).

(2) Sia A0 la matrice che ha per colonne uj1 , uj2 , . . . , ujr , nellordine. Notiamo che la
sequenza di operazioni elementari che porta da A a B, se effettuata sulla matrice A0 , porta
alla matrice a scala B 0 che si ottiene da B sopprimendo le colonne che non contengono
i cardini. Ora A0 e B 0 sono matrici equivalenti di formato m r e B 0 è una matrice
a scala con r cardini (gli stessi di B, naturalmente); con riferimento alle applicazioni
lineari LA0 , LB 0 : Rr Rm , tenendo presente la Proposizione 5.15.11, il fatto che Im(LB 0 )
è generato dalle colonne di B 0 (Corollario 5.13.18) e la Proposizione 5.15.3, abbiamo:
dim(Im(LA0 )) = dim(Im(LB 0 )) = r.
Di conseguenza, siccome A0 ha r colonne, precisamente uj1 , uj2 , . . . , ujr , le quali generano

Im(LA0 ), queste devono essere linearmente indipendenti. A questo punto, dalla (1) sopra
provata segue immediatamente la (2). Infine la (3) segue dal Teorema 5.13.19, dal fatto
che hu1 , . . . , un i = Im(LA ) e dalla (1) sopra dimostrata.
Alla luce di quanto fin qui acquisito, la definizione di rango di una matrice, dovrebbe
apparire coerente con la definizione di rango di unapplicazione lineare, dato che il rango
di una matrice A coincide con la dimensione di Im(LA ), ossia con il rango di LA :
rg(A) = rg(LA ). (5.15.2)
Se A è una matrice, la valutazione del suo rango permette di decidere liniettività e/o
la suriettività dellapplicazione lineare associata LA , come qui di seguito specificato.
Proposizione 5.15.13. Sia data una matrice non nulla A Mm,n (R). Allora, con
riferimento allapplicazione lineare associata LA : Rn Rm , risulta:
(1) LA è iniettiva se e solo se rg(A) = n.
(2) LA è suriettiva se e solo se rg(A) = m.
Dimostrazione. La (1) segue dalla (3) del Teorema 5.15.12. Per quanto riguarda
la (2), abbiamo che LA è suriettiva se e solo se Im(LA ) = Rm , quindi se e solo se
rg(A) = rg(Im(LA )) = dim(Im(LA )) = m.
5.16 Sistemi di equazioni lineari. Generalit`

a.
Il lettore ha sicuramente familiarità con il concetto di equazione lineare, o equazione di
primo grado in una incognita x; si tratta di unuguaglianza del tipo
ax = b, (5.16.1)
dove a, b sono numeri reali preassegnati, il primo dei quali si chiama il coefficiente e
il secondo termine noto (o termine costante). La lettera x indica una variabile;
ogni numero reale c che, sostituito ad x, rende vera la (5.16.1) si chiama una soluzione
dellequazione. Ovviamente, se a = b = 0 ciascun c R è soluzione della (5.16.1), mentre
questa non ha soluzioni se a = 0 e b 6= 0 ed ha come unica soluzione c = ba1 se a 6= 0.
In una gran quantità di circostanze si incontrano equazioni lineari in pi`

u di una inco-
gnita. In generale, unuguaglianza del tipo
A1 x1 + + An xn = B, (5.16.2)
dove A1 , . . . , An , B sono numeri reali preassegnati e i simboli x1 , . . . , xn indicano delle

variabili, si chiama unequazione lineare nelle n incognite x1 , . . . , xn , con coefficienti
A1 , . . . , An e termine noto (o termine costante) B. Anticipando quanto diremo a
proposito dei sistemi di equazioni lineari, introduciamo la matrice riga

A = A1 . . . An
dei coefficienti, la matrice colonna

x1
x = ...

xn
delle incognite e consideriamo il numero B come matrice ad una riga ed una colona. Allora
il primo membro della (5.16.2) è precisamente il prodotto righe per colonne di A per X e
la (5.16.2) può essere riscritta sotto la forma
Ax = B,
la quale è la forma matriciale dellequazione (5.16.2): lincognita è la matrice x, con la

matrice
c1Aper coefficiente. Chiamiamo allora soluzioni dellequazione (5.16.2) le colonne
v = ... di numeri reali che, sostituite ad x, rendono valida la (5.16.1), ossia tali che,
cn
sostituendo ci a xi per ogni i n, risulta valida la (5.16.2). Le soluzioni di unequazione
lineare in n incognite sono dunque da ricercare nello spazio Rn delle colonne ad n righe
(vedi la Nota 5.7.6).
La ricerca di tutte le soluzioni di unequazione come la (5.16.2) è meno banale rispetto
al caso di unequazione in una singola incognita ma, come ora vedremo, non è difficile.
Iniziamo con un esempio, considerando lequazione
5x1 2x2 = 6. (5.16.3)
In questo caso la matrice riga dei coefficienti è (5, 2) e la colonna delle incognite è xx12 .

0
Chiaramente le colonne 2

8 e 3 sono soluzioni della (5.16.3), mentre ( 21 ) non lo è.
Come determinare tutte le soluzioni? A questo fine, notiamo che la (5.16.3) equivale alla
seguente:
2 6
x1 = x2 + . (5.16.4)
5 5
Passando dalla (5.16.3) alla (5.16.4) si dice che si è risolta la (5.16.3) rispetto a x1 .
Dunque una colona ( xx12 ) è una soluzione della (5.16.3) se e solo se vale la (5.16.4), per
cui, scegliendo arbitrariamente x2 e determinando x1 tramite la (5.16.4), abbiamo che la
colonna ( xx12 ) è una soluzione della (5.16.3). Concludiamo che le soluzioni della (5.16.3)
sono precisamente gli elementi dellinsieme (chiaramente infinito)
2 6

5
x 2 + 5

x2 R .
S=
x2
Naturalmente la (5.16.3) è equivalente anche alla

5
x2 = x1 3 (5.16.5)
2
(questa volta abbiamo risolto la (5.16.3) rispetto a x2 ), per cui S può essere anche descritto
come linsieme di tutte le colonne ( xx12 ), dove x1 è arbitrario e x2 è dato dalla (5.16.5), cioè

x1
S= x R .
x 3 1
5

2 1
Nota 5.16.1. Vale la pena insistere sul fatto che se da un lato la (5.16.3) è verificata, ad
esempio, per x1 = 2 e x2 = 8, non è tuttavia corretto dire che
i numeri 2 e 8 sono delle soluzioni della (5.16.3);
laffermazione corretta è invece:

2

la colonna 8 è una soluzione della (5.16.3).
Sulla traccia dellelementare esempio sopra discusso, vediamo di descrivere linsieme

S di tutte le soluzioni di una generale equazione lineare come la (5.16.2). Banalmente,
se tutti i coefficienti A1 , . . . , An sono nulli, allora la (5.16.2) non ha soluzioni se B 6= 0,
mentre ogni vettore di Rn è una soluzione se B = 0. Supponiamo dunque che per un
i n sia Ai 6= 0. Risolvendo la (5.16.2) rispetto a xi si vede che essa è equivalente alla
A1 \Ai An B X Ak B
xi = x1 xi xn + = xk + (5.16.6)
Ai Ai Ai Ai kn
A i A i
k6=i
Ai
(il simbolo \ x sta ad indicare che A i
x non figura). Di conseguenza una colon-
x1 Ai i Ai i
na .. Rn è una soluzione della (5.16.2) se e solo se vale la (5.16.6), per cui

.
xn
una qualunque di queste soluzioni si ottiene fissando arbitrariamente le sue coordinate
x1 , . . . , xn eccetto la xi , che va determinata tramite (5.16.6). Abbiamo cos` la seguente
rappresentazione caratteristica per S:

x 1

x1

.. .

.

.
.

x = P Ak B
S= i kn Ai
x k + xi Rn1
Ai c

k6=i .
..

..

.

x
x n

n
(anche qui, il simbolo c xi sta ad indicare che xi non figura). Dovrebbe essere chiaro
che S ammette tante di queste rappresentazioni quanti sono gli indici i per i quali il
corrispondente coefficiente Ai è diverso da zero.
Nella maggior parte dei casi si è interessati alle soluzioni simultanee di pi`
u equazioni
lineari date. Formalmente, si chiama sistema lineare di m equazioni in n incognite
lassegnazione simultanea di m equazioni lineari in n incognite x1 , . . . , xn , secondo lo
schema seguente:

A11 x1 + A12 x2 + + A1n xn = B1
A21 x1 + A22 x2 + + A2n xn = B2

.. (5.16.7)

.
A x + A x + + A x = B .
m1 1 m2 2 mn n m
Dati i m, j n, chiamiamo
Ai1 x1 + Ai2 x2 + + Ain xn = Bi
la i-esima equazione del sistema, mentre diciamo che Aij è il coefficiente della j-
esima incognita xj nella i-esima equazione c1 e Bi è li-esimo termine costante
(o termine noto). Una colonna v = .. Rn si dice una soluzione del sistema
.
cn
(5.16.7) quando essa è una soluzione di tutte le n equazioni che compongono il sistema.
Volendo usare il linguaggio insiemistico, indicando con S linsieme delle soluzioni del
sistema (5.16.7) e, per ogni j m, indicando con Sj linsieme delle soluzioni della j-esima
equazione, abbiamo
S = S1 Sm .
Definizione 5.16.2. Un sistema lineare si dice non banale o proprio se almeno uno
dei coefficienti è diverso da zero; altrimenti il sistema si dice banale.
` evidente che un sistema banale in n incognite x1 , . . . , xn non ha soluzioni se qualcuno
E
dei termini costanti è diverso da zero, altrimenti ogni vettore di Rn è una soluzione.
Chiaramente un sistema lineare è totalmente individuato quando sono prescritti i
coefficienti e i termini costanti, assieme alle loro posizioni. Per la precisione, fissando
lattenzione sul sistema (5.16.7) vediamo che i coefficienti e i termini costanti, con le loro
posizioni, vengono stabiliti dalle matrici

A11 A12 . . . A1n B1
A21 A22 . . . A2n B2
A = .. .. , B = .. ,

..
. . ... . .
Am1 Am2 . . . Amn Bm
le quali si chiamano, appunto, rispettivamente la matrice dei coefficienti e la matrice
dei termini costanti del sistema. Spesso la matrice dei coefficienti si chiama anche la
matrice incompleta del sistema, mentre viene chiamata matrice completa la matrice

A11 A1 . . . A1n B1
A1 A22 . . . A2n B2
(A , B) = .. .. .

.. ..
. . ... . .
Am1 Am2 . . . Amn Bm
Notiamo che il complesso delle m uguaglianze che figurano nel sistema (5.16.7) equivalgono
alluguaglianza
A11 x1 + A12 x2 + + A1n xn B1
A21 x1 + A22 x2 + + A2n xn B2
= .. (5.16.8)

..
. .
Am1 x1 + Am2 x2 + + Amn xn Bm
x1
fra matrici di formato m1; considerando la colonna x = ... formata con le incognite,
xn
a sua volta la (5.16.8) è equivalente allequazione matriciale
Ax = B , (5.16.9)
la quale viene detta appunto lequazione matriciale associata al sistema (5.16.7).

Un interesse particolare hanno i sistemi lineari nei quali i termini costanti sono tutti
zero; un sistema di questo genere, cioè

A11 x1 + A12 x2 + + A1n xn = 0

A21 x1 + A22 x2 + + A2n xn = 0

.. (5.16.10)

.
A x + A x + + A x = 0 ,
m1 1 m2 2 mn n
si chiama un sistema omogeneo. Un tale sistema ha sempre almeno una soluzione: il

vettore nullo 0; ogni altra soluzione si chiama autosoluzione del sistema. Se è dato il
sistema (non necessariamente omogeneo) (5.16.7), la matrice dei suoi coefficienti è anche
la matrice dei coefficienti del sistema omogeneo (5.16.10), il quale si chiama in questo caso
il sistema omogeneo associato al sistema (5.16.7). Vedremo nella prossima sezione che
vi è un legame profondo tra le soluzioni di un qualunque sistema lineare e le soluzioni del
sistema omogeneo ad esso associato.
5.17 Sistemi lineari e immagini inverse rispetto ad

unapplicazione lineare.
Supponiamo di avere un sistema lineare

A11 x1 + A12 x2 + + A1n xn = B1

A21 x1 + A22 x2 + + A2n xn = B2

.. (5.17.1)

.
A x + A x + + A x = B
m1 1 m2 2 mn n m
e consideriamo la sua forma matriciale
Ax = B , (5.17.2)
dove indichiamo con A la matrice dei coefficienti, con B la colonna dei termini costanti
e con x la colonna delle incognite. Possiamo allora considerare lapplicazione lineare
LA : Rn Rm associata ad A. Osservando che B Rm , vediamo che linsieme delle

soluzioni del sistema (5.17.1), ossia linsieme delle soluzioni della (5.17.2), altro non è che
limmagine inversa di B rispetto a LA ; dunque
{ x Rn | Ax = B} = (LA )1 (B). (5.17.3)
Nel caso particolare in cui B = 0, cioè il sistema (5.17.1) è omogeneo, tale insieme è
chiaramente il nucleo Ker(LA ) di LA , dunque è un sottospazio di Rn (Definizione 5.13.15).
Proposizione 5.17.1. Data una matrice A Mm,n (R), linsieme delle soluzioni del
sistema omogeneo
Ax = 0 (5.17.4)
è dato da Ker(LA ), quindi è un sottospazio di Rn che ha dimensione n rg(A). Di
conseguenza il sistema omogeneo (5.17.4) ammette autosoluzioni se e solo se
rg(A) < n
ed in tal caso il sistema ha infinite autosoluzioni.
Dimostrazione. La prima affermazione segue dalla (3) del Teorema 5.15.12, mentre
la seconda segue dal fatto che il sistema (5.17.4) ammette autosoluzioni se e solo se
Ker(LA ) 6= {0}, cioè se e solo se dim(Ker(LA )) > 0.
Utilizzando il metodo che descriveremo nella prossima sezione, potremo trovare delle
autosoluzioni (se ve ne sono!) v1 , v2 , . . . , vr che formino una base per Ker(LA ), con il che
potremo dire di conoscere linsieme di tutte le soluzioni: queste sono tutte le combinazioni
lineari delle particolari soluzioni v1 , v2 , . . . , vr , ossia
{x Rn | Ax = 0} = Ker(LA ) = {a1 v1 + a2 v2 + + ar vr | a1 , a2 , . . . , ar R}.
Come descrivere linsieme delle soluzioni (5.17.3) nel caso non omogeneo, ossia con
B 6= 0? Per questo fine ci sarà di aiuto il seguente risultato.
Lemma 5.17.2. Sia f : V W unapplicazione lineare e consideri un vettore w W .

Se v è un vettore di V tale che f (v) = w, allora
f 1 (w) = {v + u | u Ker(f )}. (5.17.5)
Dimostrazione. Se u Ker(f ), allora f (v + u) = f (v) + f (u) = f (v) = w, per cui

v + u f 1 (w). Viceversa, sia v0 f 1 (w). Allora, posto u = v0 v, abbiamo
f (u) = f (v0 v) = f (v0 ) f (v) = w w = 0.
Dunque u Ker(f ) e v0 = v + u, per cui luguaglianza (5.17.5) è provata.

Teorema 5.17.3. Sia dato il sistema lineare (5.17.1),

csiaA la matrice dei suoi coefficienti,
1
sia B la colonna dei suoi termini costanti e sia v = ... Rn una sua soluzione. Allora
cn
risulta
{ x Rn | Ax = B} = {v + u | u Ker(LA )}, (5.17.6)
ossia le soluzioni di (5.17.1) sono precisamente i vettori di Rn che si ottengono sommando
alla particolare soluzione v una soluzione del sistema omogeneo associato a (5.17.1). Di
conseguenza il sistema (5.17.1) ha infinite soluzioni se rg(A) < n, mentre v è lunica
soluzione se rg(A) = n.
Dimostrazione. La (5.17.6) segue dal Lemma 5.17.2 e dalla (5.17.3), mentre lultima
affermazione segue dalla (3) del Teorema 5.15.12.
Quanto allesistenza di soluzioni per un sistema lineare, abbiamo il teorema seguente.

Teorema 5.17.4. (Teorema di Rouch e-Capelli). Il sistema lineare (5.17.1) ammette
almeno una soluzione se e solo se la matrice A dei coefficienti e la matrice completa (A, B)
hanno lo stesso rango.
Dimostrazione. Siccome una soluzione del sistema (5.17.1) è un vettore v Rn tale
che Av = B e Av = LA (v), deduciamo che il sistema (5.17.1) ha una soluzione se e solo
se B Im(LA ). Ricordando che
Im(LA ) = hv1 , v2 , . . . , vn i,
dove v1 , v2 , . . . , vn sono le colonne di A (Corollario 5.13.18), tenuto conto dellEsercizio

5.11.11 abbiamo che B Im(LA ) se e solo se
dim(hv1 , v2 , . . . , vn i) = dim(hv1 , v2 , . . . , vn , Bi). (5.17.7)
La tesi segue ora dal fatto che, in base al Teorema 5.15.12, il primo membro e il secondo
della (5.17.7) coincidono rispettivamente con rg(A) e rg(A, B).
Se nel sistema (5.17.1) la matrice A dei coefficienti ha rango m, cioè pari al numero
delle equazioni, allora anche la matrice completa (A, B) ha rango m (perche?). Possiamo
allora enunciare quanto segue.
Corollario 5.17.5. Se in un sistema lineare il rango della matrice dei coefficienti coincide
con il numero delle equazioni, allora il sistema ha almeno una soluzione.
Grazie al procedimento della riduzione a scala illustrato nella Sezione 5.15, il Teorema
di Rouche-Capelli fornisce un criterio di uso immediato per decidere se un sistema ha
soluzioni.
Esempio 5.17.6. Consideriamo il sistema

2x1
4x3 + 4x4 =1
3x1 + 2x2 4x3 + 8x4 =1 (5.17.8)

x1 + x2 + 3x3 x4 =2

nelle incognite x1 , x2 , x3 , x4 . La matrice dei coefficienti e la matrice completa sono rispet-

tivamente
2 0 4 4 2 0 4 4 1
3 2 4 8 e 3 2 4 8 1 .
1 1 3 1 1 1 3 1 2
Operando opportune riduzioni a scala (da fare!) si vede che la prima matrice ha rango
2, mentre la seconda ha rango 3. Dunque il sistema (5.17.8) non ha soluzioni. Il lettore
provi per esercizio che, invece, il sistema seguente ammette soluzioni:

2x1
4x3 + 4x4 = 2
3x1 + 2x2 4x3 + 8x4 = 3 (5.17.9)

x1 + x2 + 3x3 x4 = 4 .

Teorema 5.17.7. Supponiamo che nel sistema lineare (5.17.1) sia m = n, cioè che il
numero delle equazioni sia uguale al numero delle incognite. Allora il sistema ha ununica
soluzione se e solo se rg(A) = n.
Dimostrazione. Consideriamo lapplicazione lineare LA : Rn Rn associata alla ma-

trice A dei coefficienti. Se il sistema (5.17.1) ha ununica soluzione, dal Teorema 5.17.3
segue che rg(A) = n. Viceversa, se rg(A) = n, segue dalla Proposizione 5.15.13 che LA
è iniettiva e suriettiva, ossia è un isomorfismo. Di conseguenza esiste un unico v Rn
tale che LA (v) = B, cioè A(v) = B; il vettore v è dunque lunica soluzione del sistema
(5.17.1).
Vedremo nella prossima sezione come trovare concretamente delle soluzioni di un

sistema lineare.
5.18 Ricerca delle soluzioni di un sistema lineare.

Sistemi a scala.
Affrontiamo ora il problema della ricerca concreta delle soluzioni di un sistema lineare.
Tutte le strategie volte a questo obbiettivo consistono in una sequenza di opportune al-
terazioni del sistema originario, allo scopo di trasformare questo in un nuovo sistema di
cui sia abbastanza facile determinare le soluzioni. Naturalmente ciascuna di queste alter-
azioni deve essere legittima, nel senso che il sistema ottenuto dopo leffetto di essa deve
avere le stesse soluzioni di quello di partenza. In questa sezione ci occupiamo di una classe
di sistemi lineari per i quali la ricerca delle soluzioni è piuttosto elementare: i cosiddet-
ti sistemi a scala. Nella prossima sezione illustreremo le alterazioni sopra menzionate,
mediante le quali è sempre possibile ricondursi alla risoluzione di un sistema a scala.
Definizione 5.18.1. Si dice che un sistema lineare Ax = B è un sistema a scala se la

matrice A dei coefficienti è una matrice a scala; i cardini di questultima si dicono anche
i cardini del sistema.
Siccome dalla Definizione 5.15.2 risulta che una matrice a scala non può essere nulla,
un sistema a scala è sempre non banale. Ovviamente, ogni singola equazione lineare non
banale è un sistema a scala, dato che la matrice dei suoi coefficienti è costituita da una
singola riga non nulla. Ai fini della ricerca delle soluzioni, possiamo supporre che nel
sistema in esame il numero dei cardini coincida con il numero delle equazioni ; se cos` non
fosse, essendo m il numero delle equazioni e r < m il numero dei cardini, per r < j 6 m
la j-esima equazione avrebbe la forma
0 = Bj .
Se qualcuno dei termini costanti Br+1 , Br+2 , . . . , Bm fosse diverso da 0, evidentemente il

sistema non avrebbe soluzioni. In caso contrario, le equazioni dalla (r + 1)-esima alla
m-esima sarebbero della forma 0 = 0 e quindi possono essere ignorate, dato che esse non
impongono alcuna condizione sulle incognite.
Vediamo alcuni esempi concreti di sistemi a scala (con almeno due equazioni).
Esempio 5.18.2. Il primo esempio è alquanto elementare: consideriamo il sistema

2x1 3x2 = 2
(5.18.1)
4x2 = 8
nelle incognite x1 , x2 , la cui matrice dei coefficienti è

2 3
;
0 4
si tratta dunque di un sistema a scala con cardini 2, 4. Dalla seconda equazione ricaviamo
che deve essere x2 = 2; sostituendo questo valore di x2 nella prima equazione, da questa
otteniamo che x1 = 4. Concludiamo che la colonna ( 42 ) è lunica soluzione del sistema
(5.18.1).

2x2 3x3 = 2
(5.18.2)
4x3 = 8
nelle incognite x1 , x2 , x3 , la cui matrice dei coefficienti è

0 2 3
.
0 0 4
Lo stesso ragionamento svolto per il sistema (5.18.1) porta a concludere che deve essere
x3 = 2 e x2 = 4. Quanto ad x1 , esso non compare in alcuna delle equazioni del sistema
(ovviamente, si intende che il coefficiente di x1 è 0 in tutte e due le equazioni), il che
significa che il sistema non pone per x1 alcuna condizione. Le soluzioni del sistema
(5.18.2) appartengono dunque al sottoinsieme

x1
S= 4 x 1 R

2

di R3 . Daltra parte si verifica immediatamente che ogni vettore appartenente ad S

verifica ambedue le equazioni del sistema (5.18.2), per cui linsieme delle soluzioni di
questultimo è precisamente S. Alternativamente è possibile determinare S come nella
(5.17.6), scegliendo cioè una particolare soluzione v e descrivere S come linsieme delle
somme v+u dove u varia nel sottospazio E delle soluzioni del sistema omogeneo associato,
che nel nostro caso è
2x2 3x3 = 0
(5.18.3)
4x3 = 0 .
Siccome il rango della matrice dei coefficienti è 2, il sottospazio delle
soluzioni di 5.18.3
1
ha dimensione 1 in base alla Proposizione 5.17.1, per cui, visto che 0 è evidentemente
0
una autosoluzione, deve essere

x1
E= 0 x 1 R .

0

0
Scegliendo per esempio v = 4 , otteniamo
2

0 x1
S = 4 + 0 x1 R .
2 0

Naturalmente, fissato ad arbitrio il numero reale a, risulta

a x1
S = 4 + 0 x1 R
2 0

(perche?).

2x1 + 5x2 x4 =8

2x + x 2x 2 3 4 =0
(5.18.4)

x3 3x4 =0

3x4 =2
nelle incognite x1 , x2 , x3 , x4 , la cui matrice dei coefficienti è

2 5 0 1
0 2
1 2 .
0 0 1 3
0 0 0 3
Dalla quarta equazione vediamo che deve essere x4 = 2/3; sostituendo questo valore di
x4 nella terza equazione, da questa otteniamo che x3 = 2. Proseguendo, nella seconda
equazione sostituiamo a x3 e x4 i rispettivi valori appena trovati, ottenendo allora che

deve essere x2 = 1/3. Passando, infine, alla prima equazione, dopo aver sostituito a
x2 , x3 e x4 i valori trovati vediamo che deve essere x1 = 31/6. Concludiamo che il vettore

31/6
1/3

2
2/3
è lunica soluzione del sistema.
Nota 5.18.5. Ad un esame superficiale, i sistemi di cui agli Esempi 5.18.2 e 5.18.3
potrebbero apparire come due scritture diverse di uno stesso sistema di due equazioni in
due incognite. Naturalmente non è cos` e la diversa numerazione delle incognite lo sta
ad indicare; a seconda del contesto in cui si opera, il fatto che una particolare incognita
non compaia in una equazione non significa che di essa non occorre tenere conto. Infatti,
nellEsempio 5.18.2 il problema da risolvere è la ricerca delle soluzioni del sistema (5.18.1)
nello spazio R2 , mentre nellEsempio 5.18.3 sono richieste le soluzioni del sistema (5.18.2)
presenti nello spazio R3 . In questo ordine di idee, in un dato contesto si potrebbe essere
interessati alle soluzioni del sistema (5.18.1) nello spazio R3 , considerando allora (5.18.1)
come sistema lineare nelle incognite x1 , x2 , x3 , dove il coefficiente di x3 è 0 in tutte e
due le equazioni. Questa volta, ragionando come nellEsempio 5.18.3, non sono imposte
condizioni su x3 e quindi linsieme delle soluzioni è

4

2 x3 R .

x3

In conclusione, di fronte ad un sistema di equazioni lineari, è fondamentale riconoscere

dal contesto quali sono le incognite che si considerano.
Nei sistemi a scala (5.18.1) e (5.18.3) il numero delle incognite coincide con il numero
dei cardini, ossia con il rango della matrice dei coefficienti; inoltre essi hanno ciascuno
ununica soluzione, il che è coerente con Teorema 5.17.7. Si tratta di casi particolari di
una speciale classe di sistemi lineari a scala: quelli nei quali la matrice dei coefficienti è
una matrice quadrata triangolare superiore, nella quale tutti gli elementi della diagonale
principale sono diversi da zero. Per tali sistemi il Teorema 5.17.7 fornisce direttamente il
seguente risultato.
Teorema 5.18.6. Dato un qualunque intero positivo n, un sistema lineare Ax = B di n

equazioni in n incognite, la cui matrice A dei coefficienti è triangolare superiore e tutti gli
elementi della diagonale principale sono diversi da zero, ha una ed una sola soluzione.
Il metodo abbastanza elementare con il quale abbiamo risolto i sistemi degli esempi
citati è applicabile ad un qualunque sistema verificante le ipotesi del teorema precedente;
infatti, dato un intero n > 1, consideriamo un sistema della forma

A11 x1 + A12 x2 + A13 x3 + + A1,n1 xn1 + A1n xn = B1
A22 x2 + A23 x3 + + A2,n1 xn1 + A2n xn = B2

A33 x3 + + A3,n1 xn1 + A3n xn = B3

.. (5.18.5)

.

An1,n1 xn1 + An1,n xn = Bn1
Ann xn = Bn ,
nel quale Aii 6= 0 per ogni i n. Dunque abbiamo a che fare con un sistema a scala
di n equazioni in n incognite, avente n cardini. Essendo Ann 6= 0, dallultima equazione
ricaviamo che deve essere
Bn
xn = .
Ann
Andando a sostituire ad xn il valore appena trovato, la penultima equazione diviene
An1,n Bn
An1,n1 xn1 + = Bn1 ,
Ann
ossia
An1,n Bn
An1,n1 xn1 = Bn1 .
Ann
Essendo An1,n1 6 0, deve necessariamente risultare
=
Bn1 An1,n Bn
xn1 = .
An1,n1 An1,n1 Ann
A questo punto la terzultima equazione, nella quale sostituiamo ad xn e xn1 i valori
trovati, ci permette di ricavare il valore per xn2 , dato che è anche An2,n2 6= 0. Non
resta che continuare il processo, fino ad esaurire le equazioni. Tale processo, che viene
anche chiamato risoluzione allindietro del sistema, consiste dunque di n passi ciascuno
dei quali, a sua volta, consiste nella risoluzione di unequazione lineare in una incognita.
Esaminiamo ora il caso generale di un sistema a scala
Ax = B, (5.18.6)
in m equazioni, m cardini e n incognite, dove m < n. Denotiamo con i1 , i2 , . . . , im gli
indici delle colonne della matrice A contenenti i cardini (con lintesa che ih < ik se h < k),
i quali sono dunque
A1,i1 , A2,i2 , . . . , Am,im .
Posto r = n m, possiamo denotare con j1 , j2 , . . . , jr gli indici delle colonne della matrice
A non contenenti i cardini (sempre con lintesa che jh < jk se h < k). In ciascuna
delle equazioni del sistema (5.18.6) portiamo a secondo membro i termini contenenti le
incognite xj1 , xj2 , . . . , xjr ; dopo questa operazione il sistema assume il seguente aspetto:

A1,i1 xi1 + A1,i2 xi2 + + A1,im xim = B1 A1,j1 xj1 A1,j2 xj2 A1,jr xjr
A2,i2 xi2 + + A2,im xim = B2 A2,j1 xj1 A2,j2 xj2 A2,jr xjr

..

.
A
m,im im x = B A x A x A x .
m m,j1 j1 m,j2 j2 m,jr jr
(5.18.7)
A questo punto è opportuno distinguere due casi.
Caso omogeneo, ossia B1 = B2 = = Bm = 0. Linsieme delle soluzioni del sistema

(5.18.6) è ora un sottospazio E di Rn avente dimensione n m = r, che risulterà deter-
minato una volta che ne abbiamo trovato una base. Nel sistema 5.18.7 poniamo xj1 = 1 e
xjk = 0 per 1 < k 6 r, ottenendo cos` un sistema a scala di m equazioni nelle m incognite
xi1 , xi2 , . . . , xim , la cui matrice dei coefficienti A0 è triangolare superiore e gli elementi della
diagonale principale sono tutti diversi da zero, trattandosi infatti della matrice A privata
delle colonne c non contenenti i cardini. Per il Teorema 5.18.6 tale sistema ha ununica
1,i1
c1,i2
soluzione .. , la quale può essere determinata con il già descritto procedimento del-
.
c1,im
a11 !
a12
la risoluzione allindietro. Di conseguenza il vettore u1 = .. , dove a1,ih = c1,ih per
.
a1n
1 6 h 6 m e a1,j1 = 1, a1,j2 = = a1,jr = 0, è una soluzione per il sistema (5.18.6).
Successivamente, poniamo nel sistema 5.18.7 xj2 = 1 e xjk = 0 per 1 6 k 6 r e k 6= 2.
0
Di nuovo otteniamo un sistema a scala, avente ancora A come matrice dei coefficienti
c2,i1
c2,i2
e quindi dotato di ununica soluzione .. . Una seconda soluzione per il sistema
.
c2,im
a21 !
a22
(5.18.6) è allora il vettore u1 = .. , dove a2,ih = c2,ih per 1 6 h 6 m, a2,j2 = 1 e
.
a2n
a2,jk = 0 per 1 6 k 6 r e k 6= 2. Procedendo in questo modo è possibile determinare r
soluzioni
a11 a21 ar1
a12 a22 ar2
u1 = .. , u2 = .. , . . . , ur = ..

. . .
a1n a2n arn
ah,i per ogni h {1, . . . , r}, è ah,jh = 1, ah,jk = 0 per

per il sistema (5.18.6); precisamente,
1
ah,i2
1 6 k 6 r e k 6= h, mentre .. è lunica soluzione del sistema 5.18.7 nel quale si
.
ah,im
è posto xjh = 1 e xjk = 0 per 1 6 k 6 r e k 6= h. Ora i vettori u1 , u2 , . . . , ur sono
linearmente indipendenti. Infatti, supponiamo che sia
y 1 u1 + y 2 u2 + + y r ur = 0 (5.18.8)
per certi y1 , y2 , . . . , yr R. Osserviamo che se sopprimiamo nelle colonne u1 , u2 , . . . , ur

le entrate ah,ik per 1 6 h 6 r e 1 6 k 6 m, ciò che otteniamo sono precisamente vettori
e1 , e2 , . . . , er della base canonica di Rr e la (5.18.8) comporta che
y1 e1 + y2 e2 + + yr er = 0,
per cui y1 = y2 = = yr . Dato che Il sottospazio E delle soluzioni del sistema omogeneo
(5.18.6) ha dimensione r, concludiamo che i vettori u1 , u2 , . . . , ur costituiscono una base
per E e quindi possiamo dichiarare che
E = hu1 , u2 , . . . , ur i. (5.18.9)
Caso non omogeneo, cioè i termini costanti B1 , B2 , . . . , Bm non sono tutti nulli. Pre-
scrivendo a xj1 , xj2 , . . . , xjr dei valori arbitrari, diciamo cj1 , cj2 , . . . , cjr rispettivamente (in
pratica risulterà conveniente scegliere cj1 = cj2 = = cjr = 0), il sistema 5.18.7 di-
0
viene un sistema a scala, cavente
di nuovo A come matrice dei coefficienti e quindi dotato
i1 a1 !
ci2 a2
di ununica soluzione .. . A questo punto il vettore v = .. , dove aih = cih e
. .
cim an
ajk = cjk per 1 6 h 6 m e 1 6 k 6 r, è una soluzione per il sistema (5.18.6). Infine,
considerando il sottospazio E, descritto dalla (5.18.9), delle soluzioni del sistema omoge-
neo Ax = 0 associato al sistema (5.18.6) e indicando con S linsieme di tutte soluzioni di
questultimo, in conformità con il Teorema 5.17.3 risulta
S = {v + w | w E}.
Procediamo con un esempio.

Esempio 5.18.7. Consideriamo il sistema a scala

x1 2x2 +x3 +3x4 x6 x7 = 1
4x2 +x4 +x5 2x6 = 4

(5.18.10)

+2x4 x5 +2x7 = 0
x6 +x7 = 2

di quattro equazioni nelle incognite x1 , x2 , x3 , x4 , x5 , x6 , x7 . La matrice dei coefficienti

1 2 1 3 0 1 1
0 4 0 1 1 2 0
A=
0 0 0 2 1 0 2
0 0 0 0 0 1 1
è una matrice a scala con quattro cardini 1, 4, 2, 1 e quindi ha rango 4, per cui il sistema
ha sicuramente soluzioni in base al Corollario 5.17.5. La 3a , la 5a e la 7a colonna di A non
contengono cardini; poniamo dunque x3 = x5 = x7 = 0 nel sistema (5.18.10), ottenendo
quindi il nuovo sistema

x1 2x2 +3x4 x6 = 1
4x2 +x4 2x6 = 4

+2x 4 = 0
x6 = 2 ,

per il quale, con una facile risoluzione allindietro, troviamo lunica soluzione

x1 7
x2 2
x4 = 0 .

x6 2
Il vettore
7

2

0

v=
0

0

2
0
è dunque una soluzione per il sistema (5.18.10). Per determinare tutte le soluzioni occorre
ora individuare il sottospazio E di R7 delle soluzioni del sistema omogeneo

x1 2x2 +x3 +3x4 x6 x7 = 0
4x2 +x4 +x5 2x6 = 0

(5.18.11)

+2x4 x5 +2x7 = 0
x6 +x7 = 0

associato a (5.18.10). Siccome rg(A) = 4, risulta dim(E) = 7 4 = 3, per cui dobbiamo

trovare tre soluzioni linearmente indipendenti di (5.18.11). Seguendo il procedimento
generale che abbiamo descritto, in ciascuna equazione del sistema (5.18.11) portiamo a
secondo membro i termini contenenti le incognite x3 , x5 , x7 , ottenendo il sistema

x1 2x2 +3x4 x6 = x3 +x7
4x2 +x4 2x6 = x5

.

+2x 4 = +x5 2x7
x6 = x7

Poniamo dapprima x3 = 1, x5 = 0 = x7 , poi x3 = 0, x5 = 1, x7 = 0 e infine x3 = 0 =

x5 , x7 = 1, ottenendo in corrispondenza i sistemi

x1 2x2 +3x4 x6 = 1
4x2 +x4 2x6 = 0

,

+2x4 = 0
x6 = 0

x1 2x2 +3x4 x6 = 0
4x2 +x4 2x6 = 1

,

+2x4 = 1
x6 = 0

x1 2x2 +3x4 x6 = 1
4x2 +x4 2x6 = 0

.

+2x 4 = 2
x6 = 1

Occorre fare attenzione al fatto che questi sono tre sistemi nelle sette incognite x1 , x2 ,
x3 , x4 , x5 , x6 , x7 , anche se qualcuna di queste non compare esplicitamente in tutte le
equazioni. Con lormai consueto procedimento della risoluzione allindietro, troviamo per
questi sistemi le rispettive uniche soluzioni

1 9/4 5/2
0 3/8 1/4

1 0 0

u1 = 0 , u2 =

1/2
,
u3 =
1 ,

0 1 0

0 0 1
0 0 1
che sappiamo essere linearmente indipendenti e quindi formano una base per E. La
descrizione esplicita per E (come insieme, si intende) è la seguente:

1 9/4 5/2

0 3/8 1/4

1 0 0

E = a1 0 + a2 1/2 + a3 1 a1 , a2 , a3 R ,

0 1 0

0 0 1

0 0 1

oppure
a1 94 a2 + 52 a3

3 a2 1 a3

8 4

a1

1
E= a a3
2 2
a1 , a2 , a3 R .

a2

a

3

a3

Finalmente, ecco la descrizione delinsieme S delle soluzioni del sistema (5.18.7) dal quale
eravamo partiti:

7 a1 94 a2 + 52 a3

3 1
2 a a

2 3

8 4

a1

1
S = {v + w | w E} = a a3
2 2 a1 , a2 , a3 R .

a

2

2 a

3

a3

5.19 Ricerca delle soluzioni di un sistema lineare.

Riduzione a scala.
Definizione 5.19.1. Due sistemi lineari Ax = B, Cx = D in n incognite x1 , . . . , xn si
dicono equivalenti se hanno le stesse soluzioni.
In altre parole, i due sistemi Ax = B, Cx = D sono equivalenti quando accade che,

qualunque sia V Rn , risulta AV = B se e solo se CV = D.
Le seguenti si chiamano operazioni elementari su un sistema lineare Ax = B di m
equazioni in n incognite x1 , . . . , xn :
(1) scambio di due equazioni ;
(2) moltiplicare unequazione per un numero reale non nullo, ossia sostituire la i-esima
equazione
Ai1 x1 + Ai2 x2 + + Ain xn = Bi (5.19.1)
con lequazione
rAi1 x1 + rAi2 x2 + + rAin xn = rBi , (5.19.2)
dove r è un numero reale non nullo;
(3) sommare ad unequazione una delle rimanenti moltiplicata per un numero reale ossia,
scelti i, j m con i 6= j e un numero reale r, sommare alla i-esima equazione
Ai1 x1 + Ai2 x2 + + Ain xn = Bi lequazione rAj1 x1 + rAj2 x2 + + rAjn xn = rBj ,
sostituendo dunque la i-esima equazione con la nuova equazione
Ai1 x1 + Ai2 x2 + + Ain xn + r(Aj1 x1 + Aj2 x2 + + Ajn xn ) = Bi + rBj ,
cioè
(Ai1 + rAj1 )x1 + (Ai2 + rAj2 )x2 + + (Ain + rAjn )xn = Bi + rBj . (5.19.3)
Proposizione 5.19.2. Sia Ax = B un sistema di m equazioni in n incognite x1 , . . . , xn .

Allora ogni sistema Cx = D ottenuto tramite una sequenza finita di operazioni elementari
su Ax = B è equivalente a questultimo.
Dimostrazione. Chiaramente basta provare che se Cx = D è ottenuto da Ax = B

tramite una singola operazione elementare, allora Ax = B e Cx = D sono equivalenti.
Questo è banale se loperazione è lo scambio di due equazioni. Supponiamo che Cx =
D sia ottenuto da Ax = B moltiplicando la i-esima equazione per un numero reale
r 6= 0. Dunque le (5.19.1) e (5.19.2) sono le i-esime equazioni di Ax = B e Cx = D
rispettivamente. Dato un vettore

v1
..
V = . Rn ,

vn1
vn
risulta Ai1 v1 + Ai2 v2 + + Ain vn = Bi se e solo se rAj1 v1 + rAj2 v2 + + rAjn vn = rBj ,

appunto perche r può essere cancellato essendo r 6= 0. Dunque le i-esime equazioni di
Ax = B e Cx = D hanno le stesse soluzioni. Siccome le j-esime equazioni di Ax = B
e Cx = D coincidono se j 6= i, concludiamo che i due sistemi hanno le stesse soluzioni.
Infine, supponiamo che Cx = D sia ottenuto da Ax = B tramite unoperazione di tipo
(3), ossia che vi siano degli indici i, j m, con i 6= j, e un numero reale r tali che (5.19.3)
è la i-esima equazione del sistema Cx = D, mentre la k-esima equazione di Cx = D
coincide con la la k-esima equazione di Ax = B se k 6= i. Se v è una soluzione di Ax = B
allora, in particolare, deve essere
Ai1 v1 + Ai2 v2 + + Ain vn = Bi e Aj1 v1 + Aj2 v2 + + Ajn vn = Bj . (5.19.4)
Di conseguenza
(Ai1 + rAj1 )v1 + (Ai2 + rAj2 )v2 + + (Ain + rAjn )vn = Bi + rBj (5.19.5)
e quindi v è anche una soluzione per Cx = D. Viceversa, supponiamo che v sia una
soluzione per Cx = D. Allora, in particolare, vale la seconda delle (5.19.4) e la (5.19.5).
Deduciamo che
Ai1 v1 + Ai2 v2 + + Ain vn + rBj

= Ai1 v1 + Ai2 v2 + + Ain vn + r(Aj1 v1 + Aj2 v2 + + Ajn vn )
= (Ai1 + rAj1 )v1 + (Ai2 + rAj2 )v2 + + (Ain + rAjn )vn
= Bi + rBj ,
da cui, confrontando il primo e il quarto membro e cancellando rBj , otteniamo
Ai1 v1 + Ai2 v2 + + Ain vn = Bi .
Possiamo concludere che v è una soluzione per Ax = B e la dimostrazione è completa.
Teorema 5.19.3. Ogni sistema lineare non banale è equivalente ad un sistema a scala.
Dimostrazione. Dato un intero positivo n e indicata con P (n) laffermazione

Ogni sistema lineare non banale in n incognite è equivalente ad un sistema a scala,
il teorema afferma che P (n) è vera per ogni intero positivo n. Per quanto riguarda
P (1), dobbiamo considerare un sistema lineare non banale in una incognita x1 , cioè un
sistema della forma

A11 x1 = B1
A21 x1 = B2

.. (5.19.6)

.
A x = B .
m1 1 m
Eventualmente alterando lordine delle equazioni, ossia effettuando una sequenza finita
di operazioni elementari di tipo (1), possiamo supporre che sia A11 6= 0. Per ogni i
{1, 2, . . . , m}, aggiungiamo alla i-esima equazione la prima moltiplicata per (Ai1 /A11 ),
effettuando cos` m 1 operazioni di tipo (3). Dunque, tenuto conto della Proposizione
5.19.2, il sistema (5.19.6) è equivalente al sistema

A11 x1 = B1
0 = (A21 /A11 )B2

.. (5.19.7)

.
0 = (Am1 /A11 )Bm ,
il quale è un sistema a scala con unico cardine A11 . Dunque P (1) è vera. Dato un intero
positivo n, supponiamo che P (n1) sia vera e proviamo che, di conseguenza, è vera anche
P (n). In maniera esplicita, supponiamo che ogni sistema lineare non banale con meno
di n incognite sia equivalente ad un sistema a scala (Ipotesi Induttiva), consideriamo un
sistema non banale Ax = B in n incognite x1 , . . . , xn e mostriamo che anche questo è
equivalente ad un sistema a scala. Se il coefficiente di x1 è zero in tutte le equazioni del
sistema Ax = B, questultimo è un sistema nelle n 1 rimanenti incognite x2 , . . . , xn ,
per cui esso è equivalente ad un sistema a scala in base allipotesi induttiva. Altrimenti,
alterando eventualmente lordine delle equazioni, possiamo supporre che sia A11 6= 0.
Come abbiamo fatto per il caso n = 1, se m è il numero delle equazioni di Ax = B,
per ogni i {1, 2, . . . , m} aggiungiamo alla i-esima equazione la prima moltiplicata per
(Ai1 /A11 ). Perveniamo cos` al sistema

A11 x1 +A12 x2 + +A1n xn = B1
(A21 /A11 )A22 x2 (A21 /A11 )A2n xn = (A21 /A11 )B2

..

.
(A /A )A x (A /A )A x = (A /A )B ,
m1 11 m2 2 m1 11 mn n m1 11 m
il quale è un sistema a scala nel caso in cui sono nulli tutti i coefficienti delle equazioni
dalla seconda in poi. In caso contrario, passiamo a considerare il sistema

(A21 /A11 )A22 x2 (A21 /A11 )A2n xn = (A21 /A11 )B2
..
.
(A /A )A x (A /A )A x = (A /A )B .
m1 11 m2 2 m1 11 mn n m1 11 m
` questo un sistema non banale nelle n 1 incognite x2 , . . . , xn il quale, in base allIpotesi

E
Induttiva, è equivalente ad un sistema a scala A0 x0 = B 0 dove, appunto, A0 è una matrice
a scala di formato (m 1) (n 1) e x0 è la colonna delle incognite x2 , . . . , xn . Ma allora
il sistema (5.19.8), e quindi il sistema Ax = B, è equivalente al sistema

A11 x1 + A12 x2 + + A1n xn = B1
(5.19.8)
A0 x0 = B 0
il quale è un sistema a scala.

5.20 Problemi.
Esercizio 5.20.1. Tramite la riduzione a scala, decidere la risolvibilità, o meno, dei
seguenti sistemi lineari. In caso affermativo, descrivere gli insiemi delle soluzioni.

x1 + 2x2 x3 + 3x4 + x5 = 6

2x + 3x + x + 5x
1 2 3 4 =8
(a)

4x1 + x2 + x3 + 8x4 + 2x5 = 21
x1 + 4x3 + 3x4 + x5

= 3.

2x1 + x2 + 2x3 + x4 + 13x5 =0

5x 5x + 20x + 25x 5x = 2
1 2 3 4 5
(b)

x1 x2 + 4x3 + 5x4 x5 = 1
x1 + x2 x4 + 9x5

= 0.

x1 + 4x2 + 5x3 2x4 = 12

3x + 3x + 6x 2x = 14
1 2 3 4
(c)

x1 + x2 + 5x3 + 5x4 = 0

2x1 + x3 = 3.

x1 + 4x2 + 5x3 + x4 =2

3x + 3x + 6x + 3x = 1
1 2 3 4
(d)

x1 + x2 + 5x3 6x4 = 5

2x1 + x3 + 3x4 = 3.
Esercizio 5.20.2. Stabilire se i seguenti sistemi lineari omogenei ammettono autosolu-

zioni. In caso affermativo, trovare una base per lo spazio delle soluzioni.

x1 + 2x2 x3 + 3x4 + x5 = 0

2x + 3x + x + 5x
1 2 3 4 =0
(a)

4x1 + x2 + x3 + 8x4 + 2x5 = 0
x1 + 4x3 + 3x4 + x5

= 0.

2x1 + x2 + 2x3 + x4 + 13x5 =0

5x 5x + 20x + 25x 5x = 0
1 2 3 4 5
(b)

x1 x2 + 4x3 + 5x4 x5 =0
x1 + x2 x4 + 9x5

= 0.

x1 + 4x2 + 5x3 2x4 =0

3x + 3x + 6x 2x = 0
1 2 3 4
(c)

x1 + x2 + 5x3 + 5x4 = 0

2x1 + x3 = 0.

x1 + 4x2 + 5x3 + x4 =0

3x + 3x + 6x + 3x
1 2 3 4 =0
(d)

x1 + x2 + 5x3 6x4 =0

2x1 + x3 + 3x4 = 0.
Esercizio 5.20.3. E ` noto che le tre operazioni elementari sulle righe di una matrice
A Mm,n (R) non alterano il sottospazio h(A1 ) , (A2 ) , . . . , (Am ) i di Rn generato dalle
(trasposte delle) righe di A. Illustrare, con quattro diversi esempi, che le medesime
operazioni possono invece alterare il sottospazio hA1 , A2 , . . . , An i di Rm generato dalle
colonne.
Esercizio 5.20.4. Provare che, per ogni vettore (b1 , b2 , b3 , b4 ) R4 , il sistema lineare

x1 + 2x2 x3 + 3x4 + x5 = b1

2x + 3x + x + 5x
1 2 3 4 = b2

4x1 + x2 + x3 + 8x4 + 2x5 = b3
x1 + 4x3 + 3x4 + x5

= b4
ha infinite soluzioni.
Esercizio 5.20.5. Stabilire se esiste, o meno, un vettore (b1 , b2 , b3 , b4 ) R4 tale che il
sistema lineare

x1 + 2x2 + 4x3 x4 = b1

2x1 + 3x2 + x3 = b2

x1 + x2 + x3 + 4x4 = b3

3x1 + 5x2 + 8x3 + 3x4 = b4

x + 2x + x
1 3 4 = b1
non ha soluzioni.
Esercizio 5.20.6. Quali sono i valori per a tali che il sistema lineare

2x1 + 5x2 + x3 x4

=8
x + 2x x =0
1 2 4

2x1 + x2 + x3 3x4 =0

3x1 + 2x2 + 2x3 + ax4 =3
ha soluzioni?
Esercizio 5.20.7. Quale relazione deve legare i numeri b1 , b2 , b3 affinche il sistema lineare

2x1 + 5x2 + 3x3 = b1

3x1 x3 = b2

5x1 + 5x2 + 2x3 = b3

abbia soluzioni?
Esercizio 5.20.8. Caratterizzare le matrici ( ac db ) per le quali risulta

2
a b 0 0
= .
c d 0 0
Esercizio 5.20.9. E` possibile che per una matrice A = ( a b ) risulti An = 0 per un intero
c d
n > 2, ma A2 6= 0?
Esercizio 5.20.10. Trovare due matrici non nulle B M2,3 (R) e C M3,2 (R) tali che

1 3 5 1 3 5
B 4 1 1 = 0 e 4 1 1 C = 0.
0 1 2 0 1 2
Nei quattro problemi che seguono, consideriamo il sottoinsieme M R4 costituito dai

vettori

1 2 1 2 1
, v2 = 1 , v3 = 1 , v4 = 2 , v5 = 2 ;
0
v1 = 3 3 0 0 3
1 1 2 2 1
indichiamo inoltre con E il sottospazio di R4 generato da questi cinque vettori.

Esercizio 5.20.11. Visto che linsieme M è necessariamente linearmente dipendente
(perche?), trovare cinque numeri x1 , x2 , x3 , x4 , x5 non tutti nulli in maniera che
x1 v1 + x2 v2 + x3 v3 + x4 v4 + x5 v5 = 0.
Esercizio 5.20.12. Trovare tre distinte basi di E che non includano alcuno dei vettori
v1 , v2 , v3 , v4 , v5 .
Esercizio 5.20.13. Estrarre dallinsieme M cinque distinte basi M1 , M2 , M3 , M4 , M5 per
E in maniera che vi Mi per i {1, 2, 3, 4, 5}.
Esercizio 5.20.14. Completare le basi M1 , M2 , M3 , M4 , M5 di cui al Problema 13 con
vettori presi dalla base canonica

1 0 0 0
0 1 0 0
e1 = 0 , e 2 = 0 , e 3 = 1 , e 4 = 0

0 0 0 1

di R4 , in maniera da ottenere altrettante basi per R4 .

Esercizio 5.20.15. Mostrare che linsieme Mm,n (R) delle matrici ad m righe ed n colon-
ne è uno spazio vettoriale rispetto alladdizione matriciale ed alla moltiplicazione per uno
scalare; determinare la sua dimensione (Sugg.: si considerino le matrici che hanno tutte
le entrate nulle salvo una, che è 1).
Esercizio 5.20.16. Trovare cinque vettori v1 , v2 , v3 , v4 , v5 di R5 in maniera che gli

insiemi {v1 , v2 , v3 } e {v4 , v5 } siano linearmente indipendenti ma {v1 , v2 , v3 , v4 , v5 } non
è una base di R5 .
Esercizio 5.20.17. Si considerino in R4 i vettori

1 2
3 2
v1 =
3
, v2 =
3
1 1
e il sottospazio E = hv1 , v2 i generato da essi. Determinare due sottospazi F , G di R4 ,

assegnandone delle basi, in maniera che E F = {0} e E G abbia dimensione 1.
` possibile determinare F in maniera che sia E + F 6= R4 ?
(1) E
` possibile determinare G in maniera che sia E + G = R4 ?
(2) E
Esercizio 5.20.18. Si considerino in R3 i vettori

3 2 1 2
v1 = 3 , v2 = 2 , v3 = 2 , v4 = 3
1 1 1 1
e i sottospazi E = hv1 , v2 i, F = hv3 , v4 i. Determinare delle basi per i sottospazi E F

ed E + F .
Esercizio 5.20.19. Di ciascuno dei seguenti quattro sottoinsiemi di R4 , stabilire se si
tratta di un insieme generatore di R4 , di una base di R4 o nessuna delle due cose. Se
qualcuno di essi è un insieme generatore per R4 , si estraggano da esso tutte le possibili
basi.

2 3 2 5 6

1 1 4 5 2

M1 = ,
, , , ,

0 1 2 3 2
2 1 6 7 2

1 3 9 1 0

1 1 1 1 4

M2 = ,
, , ,
,

3 2 5 4 11
2 1 4 3 8

1 1 2 2 1

1 1 2 0 5
M3 = , ,
, , ,

3 3 3 6 6
2 3 3 2 5

2 2 3 5 3

1 0 1 5 2

M4 = , , , ,
.

3 6 3 6 3
1 2 1 1 2

Esercizio 5.20.20. Determinare una quaterna non nulla di numeri reali (A1 , A2 , A3 , A4 )
tale che lequazione
A1 x 1 + A2 x 2 + A3 x 3 + A4 x 4 = 0 (5.20.1)
abbia come soluzioni i vettori
1 0
1 0
, .
0 3
0 3
Esiste una quaterna non nulla di numeri reali (A1 , A2 , A3 , A4 ) tale che lequazione (5.20.1)
abbia come soluzioni i vettori

1 1 0 0
0 1 0 1
0 , 0 , 1 , 1 ?

1 0 1 0
Esercizio 5.20.21. Determinare una matrice

1
A1 A21 A31 A41
,
A12 A22 A32 A42
con righe non nulle, tale che il sottospazio di R4 delle soluzioni del sistema lineare
(
A11 x1 + A21 x2 + A31 x3 + A41 x4 = 0
A12 x1 + A22 x2 + A32 x3 + A42 x4 = 0

1 1
coincida con il sottospazio generato dai vettori 10 , 11 .
0 0
5.21 Il determinante. Sua esistenza ed unicit`

a.
Molto probabilmente il lettore ha già familiarità con il concetto di determinante di una
matrice quadrata ( ac db ), dove a, b, c, d sono certi numeri reali: si tratta del numero ad bc.
Se consideriamo la funzione
D : M2 (R) R
definita da
a b
D = ad bc
c d
per ogni ( ac db ) M2 (R), è facile provare che D verifica le seguenti proprietà, dove
a, b, c, d, a0 , b0 , c0 , d0 , r, s sono numeri reali qualunque:
ra + sa0 b
0
a b a b
(A) D = rD + sD ;
rc + sc0 d c d c0 d
a rb + sb0 a b0

a b
(A) D = rD + sD ;
c rd + sd0 c d c d0

a b b a
(B) D = D ;
c d d c

a a
(C) D = 0;
c c
!
a b a b
(D) D =D ;
c d c d

1 0
(E) D = 1;
0 1
0 0 0 0
a b a b a b a b
(F) D 0 0 =D D .
c d c d c d c0 d0
Le proprietà (A), (A) si esprimono dicendo che la funzione D è lineare nelle colonne,
mentre la proprietà (B) si esprime dicendo che la funzione D è alternante nelle colonne.
In realtà D è lineare e alternante anche nelle righe, come segue facilmente dalla (D). Le
(E), (F) ci dicono che D è un omomorfismo di monoidi dal monoide moltiplicativo M2 (R)
verso il monoide moltiplicativo R.
Il nostro programma è di estendere il concetto di determinante ad una qualunque
matrice quadrata di numeri reali. Dato un intero n > 1, se A M2 (R) e i n, sarà
comodo indicare con Ai la i-esima colonna e con Ai la I-esima riga di A, cos` che possiamo
scrivere
A1
A = A1 , . . . , An , oppure A = ... .

An
Se B è una colonna ad n righe e C è una riga ad n colonne, le scritture

A1
..
.

A = A1 , . . . , B , . . . , A n , A = i C

i ..
.
An
stanno a specificare che la i-esima colonna e la i-esima riga di A sono B e C rispettiva-

mente.
Definizione 5.21.1. Dato un intero positivo n, diciamo che una funzione D : Mn (R) R
è un determinante se verifica le seguenti condizioni:
(I) D è lineare nelle colonne, cioè: data una matrice A Mn (R), se per un i n
risulta Ai = rv + sw, dove v, w sono due colonne ad n righe e r, s R, allora

D A , . . . , rv + sw, . . . , A = rD A1 , . . . , v, . . . , An + sD A1 , . . . , w, . . . , An .
1 n
i i i
(II) D è alternante nelle colonne, cioè: per ogni A Mn (R) e 1 6 i 6 n 1 risulta

1 i i+1 n 1 i+1 i n
D A , . . . , A , A , . . . , A = D A , . . . , A , A , . . . , A ; (5.21.1)
i i+1 i i+1
in parole: scambiando due colonne consecutive il determinante cambia di segno.

(III) D(U(n) ) = 1 (ricordiamo che U(n) è la matrice unitaria).
Il nostro obbiettivo è provare che per ogni intero n > 1 esiste ununica funzione
determinante D : Mn (R) R. Per questo scopo abbiamo bisogno di alcuni risultati
preliminari.
Proposizione 5.21.2. Sia D : Mn (R) R una funzione lineare nelle colonne, cioè sod-
disfacente la condizione (I). Allora D verifica la condizione (II) se e solo se verifica la
seguente:
(II) Per ogni A Mn (R), se Ai = Ai+1 per un i n 1 (cioè se A possiede due colonne
consecutive uguali), allora D(A) = 0.
Dimostrazione. Supponiamo che D verifichi la (II) e sia A Mn (R) tale che Ai = Ai+1
per un i n 1. Allora

1 i i+1 n 1 i+1 i n
D(A) = D A , . . . , A , A , . . . , A = D A , . . . , A , A , . . . , A = D(A),
i i+1 i i+1
per cui D(A) = 0. Viceversa, supponiamo che verifichi la (II), sia A Mn (R) e sia
i n 1. Siccome D verifica la (I), allora risulta

1 i i+1 i i+1 n
0 = D A ,...,A + A ,A + A ,...,A
i i+1

1 i i i+1 n 1 i+1 i i+1 n
= D A ,...,A ,A + A ,...,A + D A ,...,A ,A + A ,...,A
i i+1 i i+1

= D A1 , . . . , Ai , Ai , . . . , An + D A1 , . . . , Ai , Ai+1 , . . . , An
i i+1 i i+1

1 i+1 i n 1 i+1 i+1 n
+ D A ,...,A , A ,...,A D A ,...,A ,A ,...,A
i i+1 i i+1

1 i i+1 n 1 i+1 i n
= D A ,...,A ,A ,...,A + D A ,...,A , A ,...,A ,
i i+1 i i+1
per cui vale la (5.21.1).
In quello che segue D : Mn (R) R indica una data funzione determinante.

Proposizione 5.21.3. Per ogni matrice A Mn (R), dati due indici i, j n tali che i < j
risulta

1 i j n 1 j i n
D A , . . . , A , . . . , A , . . . , A = D A , . . . , A , . . . , A , . . . , A . (5.21.2)
i j i j
Dimostrazione. Poniamo j = i + h per un h N e procediamo per induzione su

h. Se h = 1, la (5.21.2) non è altro che la (5.21.1) della condizione (II). Dato h N ,
supponiamo che la (5.21.2) sia vera con j = i + h e proviamo che, di conseguenza, essa è
vera per j = i + h + 1. Abbiamo infatti:

1 i i+h i+h+1 n 1 i i+h+1 i+h n
D A ,...,A ,...,A ,A . . . , A = D A , . . . , A , . . . , A , A ...,A
i i+h i+h+1 i i+h i+h+1

1 i+h+1 i i+h n
= D A ,...,A ,..., A , A ...,A
i i+h i+h+1

1 i+h+1 i+h i n
= D A , . . . , A ,...,A , A ...,A .
i i+h i+h+1
Corollario 5.21.4. Per ogni matrice A Mn (R) e per ogni permutazione Sn risulta:
D A(1) , . . . , A(n) = sgn()D(A);

(5.21.3)
in parole: operando una permutazione sulle colonne di A, il valore di D(A) non cambia
se è pari, mentre cambia di segno se è dispari.
Dimostrazione. Se è una trasposizione, allora sgn() = 1 e la (5.21.3) segue dal-
la Proposizione 5.21.3. Siccome ogni permutazione è prodotto di trasposizioni (vedi la
Proposizione 3.11.1), il corollario segue dalla Proposizione 5.21.3 e dal Teorema 3.11.5.
Corollario 5.21.5. Se la matrice A Mn (R) ha due colonne uguali, allora D(A) = 0.
Dimostrazione. Segue immediatamente dal Corollario (5.21.4) prendendo per la
permutazione che scambia fra loro le due colonne uguali.
Corollario 5.21.6. Data una matrice A Mn (R), un numero reale r e due indici distinti
i, j n, risulta
1 i j n
D A , . . . , A + rA , . . . , A = D(A); (5.21.4)
i
parafrasando: aggiungendo alla colonna Ai di A un multiplo unaltra colonna Aj di A,

con i 6= j, il valore assunto da D sulla matrice cos` ottenuta coincide con D(A).
Dimostrazione. Infatti, in base alla condizione (I) abbiamo:

D A , . . . , A + rA , . . . , A = D A1 , . . . , Ai , . . . , An + rD A1 , . . . , Aj , . . . , An .
1 i j n
i i i
Il
secondo addendo del secondo membro è zero per il Corollario (5.21.4), avendo la matrice
A1 . . . , Aj , . . . , An uguali la i-esima e la j-esima colonna. Dunque la tesi.
i
Con il lemma seguente entrano in gioco i prodotti fra n entrate di una matrice A
Mn (R) che si trovano in colonne diverse. Ognuno di questi prodotti ha la forma
A(1),1 A(i),i A(n),n (5.21.5)

dove, appunto, per ogni i n si è scelto un indice (i) n e si è considerata lentrata

A(i),i della matrice A che si trova nella i-esima colonna e nella (i)-esima riga. E ` chiaro
che di tali prodotti ve ne sono tanti quante sono le funzioni : n n. Ricordiamo che
nn è linsieme di tali funzioni, la cui cardinalità è nn (vedi la Proposizione 1.13.4). Fra
tutti gli nn prodotti (5.21.5) ve ne sono certi che, come vedremo, hanno un ruolo decisivo
nel comportamento della funzione determinante; si tratta di quelli nei quali due fattori
appartenenti a colonne diverse si trovano su righe diverse, ossia nella (5.21.5) risulta
(i) 6= (j) tutte le volte che i 6= j. Evidentemente ciò accade se e solo se è una
permutazione. Di tali prodotti ve ne sono dunque n!, tanti quanti sono gli elementi del
gruppo Sn delle permutazioni di n. A ciascuno di questi prodotti viene attribuito un
segno, moltiplicandolo per la parità sgn() della permutazione , considerando dunque il
numero
sgn()A(1),1 A(n),n ,
il quale si chiama un prodotto associato della matrice A relativo alla permutazione
.
Lemma 5.21.7. Date due matrici A, B Mn (R), risulta:

!
X
D(AB) = D(A) sgn()B(1),1 B(n),n (5.21.6)
Sn
dove, come indicato, la sommatoria a secondo membro è estesa a tutte le permutazioni

Sn .
Dimostrazione. Osserviamo che, per ogni i n, la i-esima colonna (AB)i della matrice
prodotto AB è una combinazione lineare delle righe della matrice A, avendosi precisamente
(AB)i = A1 B1i + A2 B2i + + An Bni .
Siccome D è lineare nelle colonne, in particolare lo è nella i-esima colonna, di conseguenza

abbiamo:
X n
1 i n
D(AB) = D (AB) , . . . , (AB) , . . . , (AB) = D (AB)1 , . . . , Aj , . . . , (AB)n Bji .
i i
j=1
La linearità nelle altre colonne causa allora lespansione di D(AB) nella somma di nn
termini ciascuno dei quali ha la forma
D A(1) , . . . , A(n) B(1),1 B(n),n ,

dove è una funzione da n in n, cos` che possiamo scrivere

X
D A(1) , . . . , A(n) B(1),1 B(n),n .

D(AB) = (5.21.7)
nn
In ogni modo, tutte le volte che non è una permutazione vi sono

due indici distinti i, j
(1) (n)
n tali che (i) = (j), per cui nella matrice A , . . . , A vi sono due colonne uguali
e quindi il corrispondente termine nella sommatoria a secondo membro della (5.21.7) è

nullo per il Corollario 5.21.5. Dunque la (5.21.7) diviene
X
D A(1) , . . . , A(n) B(1),1 B(n),n

D(AB) =
Sn
e da questa si ottiene la (5.21.6), tenuto conto del Corollario 5.21.4.
Siamo ora pronti per dimostrare il teorema di esistenza e di unicità del determinante.
Dato un intero n > 2 e una matrice A Mn (R), per ogni i, j n indichiamo con A fij la
matrice di formato (n 1) (n 1) che si ottiene da A sopprimendo la i-esima riga e la
j-esima colonna.
Teorema 5.21.8. Per ogni intero positivo n esiste una ed una sola funzione determinante
D : Mn (R) R. Inoltre per ogni A Mn (R) risulta
X
D(A) = sgn()A(1),1 A(n),n . (5.21.8)
Sn
Dimostrazione. Supponiamo che D : Mn (R) R sia una funzione determinante. Per

ogni matrice A Mn (R), considerata la matrice unitaria U(n) abbiamo U(n) A = A e
quindi, essendo D(U(n) ) = 1 in base alla condizione (III), dal Lemma 5.21.7 (ne quale si
pongono U(n) e A in luogo di A e B rispettivamente) segue la (5.21.8). Questa formula
ci dice che se D è una funzione determinante, allora il valore di D su ogni matrice A
deve coincidere con la somma di tutti i prodotti associati di A. Ciò prova lunicità della
funzione determinante. Per quanto riguarda lesistenza, sarebbe sufficiente mostrare che
definendo la funzione D come nella (5.21.8), allora D verifica le condizioni (I), (II) e (III).
Tuttavia questa verifica risulterebbe alquanto laboriosa; è invece molto pi` u conveniente
procedere per induzione sullintero n nel modo che ora spieghiamo. Per n = 1, la funzione
D : M1 (R) R definita da D(a) = a è in modo ovvio una funzione determinante (lo si
provi! Quanto alla condizione (II), potrebbe non valere se n = 1?). Supposto n > 1,
assumiamo che esista una funzione determinante D0 : Mn1 (R) R e mostriamo che, di
conseguenza, ne esiste una definita su Mn (R). Fissiamo un indice i n e consideriamo la
funzione D : Mn (R) R definita come segue: per ogni A Mn (R)

i+1 0 f i+j 0 f i+n 0 g
D(A) = (1) Ai1 D Ai1 + + (1) Aij D Aij + + (1) Ain D Ain .
(5.21.9)
Vogliamo provare che tale funzione D è un determinante.
Condizione (I). Sia A Mn (R) e supponiamo che per un k n risulti Ak = rv + sw,
dove r, s R e v, w sono due colonne ad n righe. Indichiamo con B, C le matrici di
formato n n che hanno le stesse colonne di A salvo la k-esima, la quale è v in B e
w in C. In tal modo abbiamo Aij = Bij = Cij se j 6= k e Aik = rBik + sCik ; inoltre
k
Afik = Bfik = C fik . Notiamo altres` che se j 6= k, allora per la k-esima colonna A fij
k k k
abbiamo A fij = r Bfij + s C fij e quindi, essendo la funzione D0 lineare nelle

colonne per lipotesi induttiva, risulta D0 Afij = rD0 B fij + sD0 C fij . Di conseguenza,
se j 6= k abbiamo
h i
i+j 0 f i+j 0 f 0 f
(1) Aij D Aij = (1) Aij rD Bij + sD Cij

= r(1)i+j Bij D0 Bfij + s(1)i+j Cij D0 C
fij ;
se invece j = k abbiamo

(1)i+k Aik D0 A
fik = r(1)i+k Bik D0 B
fik + s(1)i+k Cik D0 C
fik .
In conclusione risulta
X n
i+j 0 f
D(A) = (1) Aij D Aij
j=1
" n
# " n
#
X X
=r ((1)i+j Bij D0 B
fij +s ((1)i+j Cij D0 C
fij
j=1 j=1
= rD(B) + sD(C),
il che prova che la funzione D definita dalla (5.21.9) è lineare nelle colonne.
Condizione (II). Sia A Mn (R) e supponiamo che Ak = Ak+1 per un k n 1.
Allora Aik = Ai,k+1 e A fik = A
^ i,k+1 , per cui

(1)i+k Aik D0 A fik + (1)i+k+1 Ai,k+1 D0 Aî,k+1 = 0.

0 f
Se poi j < k oppure k + 1 < j, allora Aij ha due colonne uguali, quindi D Aik = 0 in
f
base al Corollario 5.21.5 e allipotesi induttiva. Di conseguenza il secondo membro della
(5.22.1) è nullo. Dunque D(A) = 0 e dalla Proposizione 5.21.2 segue che la funzione D
verifica la condizione (II).
Condizione (III). Osserviamo che per ogni i, j n risulta (Un )ij = ij , mentre ^
(Un )ii =
U(n1) . Di conseguenza dalla (5.21.9) otteniamo che D(Un ) = (1)i+i (Un )ii D0 (U ^ n )ii =
1. Concludiamo che la funzione D : Mn (R) R definita dalla (5.21.9) è un determinante.
5.22 Propriet`
a e calcolo del determinante.
In vista del Teorema 5.21.8 possiamo ormai parlare de il determinante di una qualunque
matrice quadrata. Se A Mn (R) indichiamo definitivamente con il simbolo det(A) il
determinante di A. Da quanto precede risulta che vi sono due modi diversi per calcolare
(si dice anche sviluppare) det(A). Il primo è dato dalla formula (5.21.8), in base alla quale
det(A) si ottiene come somma di tutti gli n! prodotti associati della matrice A. Il secondo
consiste nel fissare un indice i n e usare la formula (5.21.9) ossia, in modo conciso,
Xn
det(A) = (1)i+j Aij det A fij . (5.22.1)
j=1
Questultimo si chiama lo sviluppo di Laplace di det(A) secondo la i-esima riga e,

in base al Teorema 5.21.8, è indifferente la scelta di tale riga; con tale sviluppo il calcolo
del determinante di una matrice di formato n n viene ridotto al calcolo dei determinanti
di n matrici di formato (n 1) (n 1). Per n = 2 abbiamo, comera da aspettarsi:

A11 A12
det = A11 A22 A12 A21 ;
A21 A22
si noti che A11 A22 e A12 A21 sono precisamente i due prodotti associati della matrice in
oggetto. Per n = 3 di prodotti associati ve ne sono sei e risulta:

A11 A12 A13
det A21 A22 A23
A31 A32 A33
= A11 A22 A33 + A12 A23 A31 + A13 A21 A32 A11 A23 A32 A12 A21 A33 A13 A22 A31 .
Come regola mnemonica (regola di Sarrus), si effettuino i prodotti secondo il seguente

schema:
A11 A12 A13
@ @ @
@ @ @
@ @ @
A23 A21 A22 A23 A21
@ @ @
@
@ @@ @
@
A32 A33 A31 A33 A31 A32
(somma dei prodotti degli elementi lungo le linee continue meno la somma degli elementi
lungo le linee interrotte). Per n > 4 non è affatto pratico sviluppare det(A) come somma
di tutti gli n! prodotti associati. Come vedremo, un uso oculato delle operazioni elementari
sulle righe di una matrice A permette un calcolo abbastanza spedito di det(A). Prima di
procedere vogliamo individuare due fondamentali proprietà del determinante. La prima
è che il determinante di una matrice A Mn (R) coincide con il determinante della sua
trasposta A ; la seconda è che il determinante della matrice prodotto AB di due matrici
A, B Mn (R) coincide con il prodotto del determinante di A con il determinante di B.
Proposizione 5.22.1. Per ogni matrice A Mn (R) risulta det(A) = det( A ).
Dimostrazione. In base al Teorema 5.21.8 basta provare che le due matrici A e A

hanno gli stessi prodotti associati. Data una permutazione Sn , consideriamo il relativo
prodotto associato sgn()A(1),1 A(n),n della matrice A. Per ogni i n, considerata la
permutazione inversa 1 , risulta i = 1 ((i)), per cui abbiamo luguaglianza
sgn()A(1),1 A(n),n = sgn()A(1),1 ((1)) A(n),1 ((n)) .
Daltra parte gli insiemi {(1), . . . , (n)} e n = {1, . . . , n} coincidono (perche?) e quin-
di coincidono anche i due insiemi di numeri reali {A(1),1 ((1)) , . . . , A(n),1 ((n)) } e
{A1,1 (1) , . . . , An,1 (n) }. Riassumendo, tenuto conto del fatto che la moltiplicazione fra
numeri reali è commutativa e del fatto che sgn() = sgn(1 ), abbiamo
sgn()A(1),1 A(n),n = sgn()A(1),1 ((1)) A(n),1 ((n))

= sgn()A1,1 (1) An,1 (n)
= sgn(1 )( A )1 (1),1 ( A )1 (n),n .
Come si vede, il prodotto associato della matrice A relativo alla permutazione coincide
con il prodotto associato della matrice A relativo alla permutazione 1 . Dal momento
che, al variare di nel gruppo Sn , linversa 1 esaurisce Sn (si ricordi che in ogni gruppo
G il sottoinsieme degli inversi degli elementi di G coincide con G!), concludiamo che A e
A hanno gli stessi prodotti associati.
Dal momento che le righe di una matrice A sono le colonne della sua trasposta, il
risultato precedente ha una conseguenza immediata di fondamentale importanza: oltreche
verificare le condizioni (I), (II), la funzione determinante verifica le medesime condizioni
relativamente alle righe. Da queste deriva che valgono anche, relativamente alle righe,
delle proprietà analoghe a quelle descritte nelle Proposizioni 5.21.2, 5.21.3 e nei Corollari
5.21.4, 5.21.5 e 5.21.6. Per comodità elenchiamo in maniera esplicita tali proprietà.
Corollario 5.22.2. La funzione det : Mn (R) R verifica le seguenti condizioni, dove A
è una qualunque matrice n n:
(1) det è lineare nelle righe, cioè: se per un i n risulta Ai = rv + sw, dove v, w
sono due righe ad n colonne e r, s R, allora

A1 A1 A1
.. .. ..
. . .

det i rv + sw = r det i v + s det i w .

.. ..
..
. . .
An An An
(2) det è alternante nelle righe, cioè: per ogni A Mn (R) e 1 6 i 6 n 1 risulta

A1 A1
.. ..
. .

i Ai i Ai+1

= det
i + 1 Ai+1 i + 1 Ai

.. ..
. .
An An
in parole: scambiando due righe consecutive il determinante cambia di segno.
(3) Per ogni permutazione Sn risulta

det A(1) , . . . , A(n) = sgn() det(A);
in parole: operando una permutazione sulle righe di A, il valore di det(A) non

cambia se è pari, mentre cambia di segno se è dispari. In particolare, se la
matrice A0 si ottiene da A scambiando fra loro due righe, allora det(A) = det(A0 ).
(4) Se A possiede due righe uguali, allora det(A) = 0.
(5) Dato un numero reale r e due indici distinti i, j n, risulta

A1
..
.

det i Ai + rAj = det(A);

..
.
An
in parole: aggiungendo alla riga Ai di A un multiplo di unaltra riga Aj di A, con

i 6= j, il valore assunto da det sulla matrice cos` ottenuta coincide con det(A).
Unaltra utile conseguenza della Proposizione 5.22.1 è la possibilità di sviluppare il
determinante di una matrice anche secondo le colonne, come appresso specificato.
Proposizione 5.22.3. Data una matrice A Mn (R) con n > 2, per ogni i n risulta
n
X
det(A) = (1)i+j Aji det A
fji . (5.22.2)
j=1
Dimostrazione. Proviamo dapprima che, dati i, j n, risulta

f
Aij = (^ A ) .
ji (5.22.3)
Osserviamo che per ambedue le matrici di formato (n 1) (n 1) che figurano nella

(5.22.3) si può far variare lindice di riga e lindice di colonna negli insiemi {1, . . . , b j, . . . , n}
e {1, . . . , bi, . . . , n} rispettivamente, cioè negli insiemi ottenuti da n privandolo dellindice
j il primo e dellindice i il secondo. Per provare la (5.22.3) basta allora controllare che
per ogni h {1, . . . , b j, . . . , n} e k {1, . . . , bi, . . . , n} le due matrici hanno al posto (h, k)
la stessa entrata. Risulta infatti:

f
^
Aij = Aijf = Akh = ( A )hk = ( A )ji .
hk kh hk
A questo punto, usando la (5.22.1) applicata alla matrice A abbiamo:

n
X Xn
i+j
det(A) = det( A ) = (1)
^
( A )ij det ( A )ij = i+j
(1) Aji det A
fji
j=1 j=1
n
X
i+j
= (1) Aji det A
fji ,
j=1
quindi la (5.22.2).
Proposizione 5.22.4. (Teorema di Binet). Date due matrici A, B Mn (R), risulta

det(AB) = det(A) det(B).
Dimostrazione. Dal Lemma 5.21.7 e dalla (5.21.8) risulta direttamente:
!
X
det(AB) = det(A) sgn()B(1),1 B(n),n = det(A) det(B).
Sn
Per quanto riguarda il calcolo concreto del determinante di una matrice A Mn (R),
abbiamo già accennato che quasi mai si usa direttamente la formula (5.21.8). Anche
lo sviluppo secondo una riga usando la formula (5.22.1), oppure secondo una colonna
usando la formula (5.22.2), è il pi`
u delle volte piuttosto laborioso. Per esempio, già per
n = 4 queste due formule prevedono il calcolo preventivo del determinante di 4 matrici di
formato 3 3. Fortunatamente il processo di riduzione a scala descritto nella Sezione 5.15
semplifica enormemente tutto il lavoro. Partiamo dalla considerazione che il calcolo del
determinante di una matrice a scala è estremamente facile, come conseguenza risultato
seguente e del fatto che una matrice quadrata a scala è comunque una matrice triangolare
superiore.
Proposizione 5.22.5. Se la matrice A Mn (R) è triangolare superiore o triangolare
inferiore, allora det(A) è uguale al prodotto degli elementi della diagonale principale:

A11 A12 . . . A1n A11
A22 . . . A2n A21 A22
det

.. .. = A A
11 22 A nn = det

.. .. .. .

. .

. . .
Ann An1 An2 . . . Ann
Di conseguenza, se A è una matrice a scala, allora det(A) è uguale al prodotto dei cardini
se il numero di questi è n, altrimenti det(A) = 0 se il numero dei cardini è inferiore ad n.
Dimostrazione. Si tratta di una facile induzione su n (si sviluppi il primo determinante
secondo lultima riga e il secondo determinante secondo la prima riga). Se A è una matrice
a scala con r < n cardini, allora le ultime n r righe sono nulle, per cui det(A) = 0 in
base alla (2) del Corollario 5.22.2.
Data una qualunque matrice A Mn (R), ricordiamo che il processo di riduzione a

scala di A consiste in una sequenza di operazioni elementari sulle righe, ciascuna delle quali
consiste nello scambio di due righe, oppure nel sommare ad una riga una delle rimanenti
moltiplicata per un numero reale (vedi la Definizione 5.15.7). Dalla (1) e dalla (3) del
Corollario 5.22.2 risulta che nel primo caso il determinante cambia di segno, mentre non
si altera nel secondo. Tenuto conto della Proposizione 5.22.5 possiamo concludere come
segue.
Proposizione 5.22.6. Sia A Mn (R) e sia B una sua riduzione a scala. Se B possiede
r < n cardini, allora det(A) = 0. Se invece B possiede n cardini c1 , . . . , cn , allora
det(A) = (1)k c1 cn ,
dove k è il numero degli scambi di righe occorsi per passare da A a B.
5.23 Matrici invertibili.

Sono di particolare interesse le matrici quadrate invertibili. Ricordiamo che linsieme
Mn (R) delle matrici quadrate n n è un anello rispetto alle operazioni di addizione e
moltiplicazione matriciali. Una matrice A Mn (R) è invertibile se esiste una matrice
B Mn (R) tale che
AB = Un = BA. (5.23.1)
Quali matrici sono invertibili? Certamente non tutte, come si evince osservando che
se vale la (5.23.1), usando la Proposizione 5.22.4 otteniamo
det(A) det(B) = det(AB) = det(Un ) = 1,
per cui deve essere det(A) 6= 0. Come ora mostreremo, questa condizione è sufficiente per
garantire linvertibilità della matrice A.
Data una matrice A Mn (R) con n > 2, per ogni i, j n il numero Aij definito da

Aij = (1)i+j det A
fij
si chiama il complemento algebrico o cofattore dellentrata Aij . Le (5.22.1) e (5.22.2)

possono cos` essere espresse dicendo che, fissato un indice i n, il determinante di
A coincide con la somma dei prodotti delle entrate della i-esima riga per i rispettivi
complementi algebrici, come pure con la somma dei prodotti delle entrate della i-esima
colonna per i rispettivi complementi algebrici. Si chiama matrice aggiunta di A la
matrice A definita come segue:

A11 A21 . . . An1
A A . . . A
12 22 n2
A := .. .. ..
. . ... .
A1n A2n . . . Ann

(attenzione allinversione degli indici!).
Proposizione 5.23.1. Per ogni matrice A Mn (R) risulta
A A = det(A) Un = A A. (5.23.2)
Di conseguenza A è invertibile se e solo se det(A) 6= 0, nel qual caso risulta
A1 = (det(A))1 A . (5.23.3)
Dimostrazione. Per provare la prima uguaglianza nella (5.23.1) basta provare che, dato
un qualunque k n, per ogni i n risulta

det(A), se i = k;
(A A )ik =
0, se i 6= k.
Tenuto conto della definizione della matrice aggiunta A e della (5.22.1) abbiamo
n
X n
X

(A A )kk = Akj Ajk = (1)j+k Akj det A
g jk = det(A).
j=1 j=1
Supponiamo i 6= k e consideriamo la matrice B che ha le stesse righe di A salvo la k-esima,

la quale è uguale alla i-esima riga di A, ossia:

Ai , se h = k;
per ogni h n Bh =
Ah , se h 6= k.
Quindi per ogni j n abbiamo A

g kj = Bkj e Akj = Bkj . Allora risulta
g
n
X n
X

(A A )ik = Aij Ajk = (1)j+k Aij det A
g jk
j=1 j=1
n
X
= (1)j+k Bkj det A
g jk = det(B) = 0,
j=1
dove lultima uguaglianza segue dal fatto che B ha due righe uguali. Con ciò è provata
la prima uguaglianza nella (5.23.1). Osserviamo ora che, essendo det(A) Un una matrice
scalare, essa coincide con la propria trasposta; inoltre si vede immediatamente che ( A ) =
( A ) . Di conseguenza, tenendo presenti la seconda delle (2.7.7), la Proposizione 5.22.1 e
la prima delle (5.23.2) appena dimostrata otteniamo:
det(A) Un = ( det(A) Un ) = (det( A ) Un ) = ( A ( A ) )

= ( ( A ) ) ( A ) = ( ( A)) ( A ) = A A,
dunque la seconda delle (5.23.2). Infine, abbiamo già osservato che se A è invertibile,
allora det(A) 6= 0. Viceversa, se det(A) 6= 0, usando le (5.23.2) si vede immediatamente
che la matrice a secondo membro della (5.23.3) è linversa per A.
Una matrice A tale che det(A) 6= 0 si dice anche matrice non singolare.
Definizione 5.23.2. Il sottoinsieme di Mn (R) delle matrici invertibili è un gruppo rispet-

to alla moltiplicazione matriciale (Esercizio!); esso si chiama il gruppo lineare generale
di grado n sul campo reale e si indica con GLn (R).
Esercizio 5.23.3. Provare che il sottoinsieme di Mn (R) delle matrici che hanno determi-
nante 1 è un sottogruppo normale del gruppo GLn (R). Esso si chiama il gruppo lineare
speciale di grado n sul campo reale e si indica con SLn (R) (Sugg.: SLn (R) è il nucleo
di un omomorfismo...).
5.24 Il Teorema di Cramer. Il ritorno del rango della

matrice
Consideriamo un sistema lineare

A11 x1 + A12 x2 + + A1n xn = B1
A21 x1 + A22 x2 + + A2n xn = B2

.. (5.24.1)

.
A x + A x + + A x = B
n1 1 n2 2 nn n n
nel quale, come indicato, il numero n delle equazioni coincide con il numero delle incognite.
Come in precedenza, indichiamo con A la matrice dei coefficienti, con X la colonna delle
incognite e con B la colonna dei termini costanti; supponiamo inoltre che il sistema non
sia banale, ossia A 6== 0. Già sappiamo dal Teorema 5.17.7 che tale sistema ha ununica
soluzione se e solo se rg(A) = n. Disponendo ora del concetto di determinante, siamo
in grado di ottenere ulteriori informazioni circa il legame profondo tra il determinante di
A, la possibile dipendenza lineare delle righe (o colonne) di A e le soluzioni del sistema
lineare (5.24.1).
Teorema 5.24.1. Data una matrice A Mn (R), siano v1 , . . . , vn le righe di A e siano

w1 , . . . , wn le colonne di A. Allora le seguenti condizioni sono equivalenti:
(1) I vettori v1 , . . . , vn di Rn sono linearmente indipendenti.
(2) I vettori w1 , . . . , wn di Rn sono linearmente indipendenti.
(3) Ogni sistema lineare di cui A è la matrice dei coefficienti ammette ununica soluzione.
(4) Esiste almeno una colonna B Rn tale che il sistema lineare (5.24.1) ammette
ununica soluzione.
(5) rg(A) = n.
(6) det(A) 6= 0.
(7) Lapplicazione lineare LA : Rn Rn è un isomorfismo.
Supponiamo che valga una e quindi anche le rimanenti di tali condizioni. Con riferimento
al sistema (5.24.1), per ogni i n indichiamo con B(i) la matrice che si ottiene da A
sostituendo la i-esima colonna con la colonna B dei termini costanti. Allora lunica
soluzione del sistema (5.24.1) è data dal vettore colonna
(det(A))1 det(B(1) )

..
.

X = (det(A))1 det(B(i) ) . (5.24.2)

..
.
1
(det(A)) det(B(n) )
Dimostrazione. Sappiamo che rg(A) è al tempo stesso la dimensione del sottospazio

di Rn generato dalle righe e la dimensione del sottospazio di Rn generato dalle colonne
(Teorema 5.15.12), da cui lequivalenza delle condizioni (1), (2) e (5). Lequivalenza delle
condizioni (3), (4) e (5) è quanto affermato dal Teorema 5.17.7 già citato sopra.
(5)(7). Sappiamo che rg(A) = dim(Im(LA )) (Corollario 5.13.18 e Teorema 5.15.12),
per cui rg(A) = dim(Im(LA )) = n se e solo se LA è suriettiva, se e solo se LA è un
isomorfismo (Teorema 5.14.8).
(6)(7). Se det(A) 6= 0, allora A possiede uninversa per la Proposizione 5.23.1. Di
conseguenza, considerata lapplicazione lineare LA1 : Rn Rn associata alla matrice
inversa A1 , otteniamo che (vedi lEsercizio 5.13.9)
LA LA1 = LAA1 = LU(n) = 1Rn
e, analogamente, LA1 LA = 1Rn . Dunque LA è un isomorfismo.

(6)(7) Se LA è un isomorfismo, posto f = L1
A e considerata la sua matrice associata
M (f ), risulta (vedi lEsercizio 5.13.10)
AM (f ) = M (LA f ) = M (1Rn ) = U(n)
e, in modo analogo, M (f )A = U(n) . Dunque A è invertibile e quindi det(A) 6= 0.

Infine, supponiamo che valgano le condizioni indicate e scriviamo il sistema (5.24.1)
sotto forma matriciale dove, al solito, X è la colonna delle incognite e B è la colonna dei
termini costanti:
AX = B. (5.24.3)
Allora si vede immediatamente che X = A1 B è una soluzione della (5.24.3). Se X 0 è
unaltra soluzione, allora AX = B = AX 0 , da cui X = U(n) X = A1 AX = A1 AX 0 =
U(n) X 0 = X 0 e quindi lunicità della soluzione del sistema (5.24.1). Usando la (5.23.3)
possiamo ora calcolare la i esima coordinata Xi dellunica soluzione X:
n
X n
X
Xi = (A1 B)i = (A1 )ij Bj = (det(A))1 Aij Bj
j=1 j=1
Xn n
X
= (det(A))1 Aij Bj = (det(A))1 (1)i+j det A
fji Bj
j=1 j=1
1
= (det(A)) det(B(i) ).
Nota 5.24.2. La parte del teorema precedente che afferma che se det(A) 6= 0, allora il
sistema (5.24.3) ammette come unica soluzione quella espressa dalla (5.24.2) è nota come
il Teorema di Cramer.
Indice analitico
addizione fra vettori, 166 caratteristica di un anello, 139

addizione matriciale, 80 cardinalità di un insieme finito, 3, 35
anello, 71 cardini di un sistema a scala, 224
anello cardini di una matrice a scala, 210
dei polinomi, 142 catena, 48, 49
quoziente, 149 cicli di una permutazione, 130
anello Zn degli interi mod. n, 72 ciclo, 128
anello commutativo, 71 classe di equivalenza, 43
anello delle matrici quadrate, 83 classe laterale destra, 113
anti-isomorfismo di insiemi ordinati, 51 classe laterale sinistra, 113
appartenenza, 2 classi di congruenza modulo n, 47
applicazione, 22 codominio di una funzione, 22
applicazione lineare, 200 coefficiente binomiale, 40
Applicazione lineare associata ad una ma- coefficiente di un polinomio, 143
trice, 201 coefficiente direttivo, 143
argomento di un numero complesso, 88 cofattore, 251
ascissa, 164 colonna, 79
asse delle ascisse, 165 colonne di una matrice, 79
asse delle ordinate, 165 combinazione, 40
asse immaginario, 87 combinazione lineare, 180
asse reale, 87 compatibile, relazione di equivalenza, 117
assi coordinati, 165 complementare di un sottoinsieme, 9
automorfismo, 91, 138 complemento algebrico, 251
autosoluzione, 221 composizione di funzioni, 30
condizione iniziale, 25
banale, sistema, 220 congiunzione, 5
base canonica, 187 congruenza modulo n, 46
base dellinduzione, 16 congruenza modulo un sottogruppo normale
base di uno spazio vettoriale, 182 H, 117
base in un piano, 172 conico
base nello spazio, 174 monoide, 58
base su una retta, 170 coniugato di un numero complesso, 86
biiezione, 28 contenuto, 3
buona definizione, 45 contiene, 3
campo, 71 controimmagine, 23
campo ordinato, 76 coordinate cartesiane di un punto, 165
campo reale, 77 coppia ordinata, 19
255
INDICE ANALITICO 256
costante, 143 massimo, 49

costante, funzione, 23 minimale, 49
crescente, funzione, 51 minimo, 49
multiplo, 152
decomposizione diretta, 195 neutro, 57
decrescente, funzione, 51 opposto, 59
definizione per ricorrenza, 25, 26 primo, 152
denominatore, 73 regolare, 58
denso in se, 76 regolare a destra, 58
determinante, 241 regolare a sinistra, 58
diagonale, 20 riducibile, 152
diagonale principale di una matrice, 83 simmetrico, 57
diagramma di Hasse, 50 simmetrico destro, 57
differenza di due insiemi, 9 simmetrico sinistro, 57
dimensione di uno spazio vettoriale, 190 simmetrizzabile, 57
direzione di una retta, 159 simmetrizzabile a destra, 57
disgiunti, cicli, 129 simmetrizzabile a sinistra, 57
disgiunti, insiemi, 9 elemento di un insieme, 1
disgiunzione, 6 endomorfismo, 91
disposizione con ripetizioni, 40 entrata di una matrice, 79
disposizione semplice, 40 enunciato, 4
divisibilità, 48 enunciato aperto, 5
divisore, 18 epimorfismo, 120
divisore equazione algebrica, 155
improprio, 107 equazione lineare, 217
proprio, 107 equivalenti, matrici, 212
dominio, 137 equivalenti, sistemi lineari, 233
dominio ad ideali principali, 153 estremi di un segmento, 160
dominio di integrità, 137 estremo
dominio di una funzione, 22 inferiore, 53
dominio euclideo, 154 superiore, 53
elementi famiglia su un insieme di indici, 27
comparabili, 48 fascio di piani, 158
elemento fattoriale, 26
associato, 152 filtrante
cancellabile, 58 inferiormente, 54
cancellabile a destra, 58 superiormente, 54
cancellabile a sinistra, 58 finitamente generato, gruppo, 103
divisore, 152 fissato, elemento -, 98
divisore proprio, 152 frazione ridotta, 112
inverso, 58 funzione, 22
invertibile, 59 funzione
irriducibile, 152 ben definita, 45
isolato, 50 biiettiva, 28
massimale, 49
caratteristica, 30 ideali banali, 146

composta, 30 ideali propri, 146
costante, 23 idempotente, 58
identica, 23 identità, 5
iniettiva, 28 identità di un insieme, 23
inversa, 31 immagine, 22, 23
inversa destra, 31 immagine di un omomorfismo, 119
inversa sinistra, 31 immagine inversa, 23
invertibile, 31 immersione, 138
invertibile a destra, 31 immersione
invertibile a sinistra, 31 come sottoanello, 138
proposizionale, 5 implicazione, 6
somma, 78 implicazione, doppia, 6
suriettiva, 28 inclusione, 3, 23
funzione polinomiale, 144 indeterminata, 142
funzione prodotto, 78 indice di un sottogruppo in un gruppo, 114
indipendenti
giacitura di un piano, 159 sottospazi, 195
giustapposizione di due parole, 61 indipendenti
grado di un polinomio, 143 vettori, 182
grafico, 21 iniezione canonica, 23
gruppo, 58 insieme, 1
gruppo insieme
finito, 95 delle parti, 4
infinito, 95 di rappresentanti, 44
simmetrico, 60 finito, 3, 35
gruppo Zn degli interi mod. n, 72 infinito, 3, 35
gruppo alternante di grado n, 134 ordinato, 48
gruppo ciclico, 103 potenza, 4
gruppo diedrale, 101 quoziente, 44
gruppo lineare generale, 252 sostegno, 48, 56
gruppo lineare speciale, 252 totalmente ordinato, 48
gruppo quaternione, 102 vuoto, 2
gruppo quoziente, 119 insieme
gruppoide, 56 parzialmente ordinato, 48
gruppoide insieme generatore, 181
abeliano, 57 insieme generatore di un gruppo, 103
additivo, 57 insiemi
commutativo, 57 disgiunti, 9
moltiplicativo, 57 interi modulo n, 47
ideale, 145 intersezione, 9
ideale intervallo illimitato, 15
principale, 146 ipotesi induttiva, 16
ideale massimale, 150 isometria, 98
ideale primo, 151 isomorfi, gruppoidi, 91
isomorfi, insiemi ordinati, 51 minorante, 53

isomorfi, spazi vettoriali, 207 modulo, 78
isomorfismo, 91, 207 modulo di un numero complesso, 86
isomorfismo molteplicità di una radice, 156
di anelli, 138 moltiplicazione esterna, 175
isomorfismo dordine, 51 monoide, 57
isomorfismo di insiemi ordinati, 51 monoide
isomorfismo inverso, 207 abeliano, 57
isotonia, 14, 76 commutativo, 57
monoide delle parole, 61
Laplace, sviluppo di -, 247 monoide delle stringhe, 61
Legge di tricotomia, 14 monoide libero, 61
limitato, 53 monomorfismo, 120
limitato movimento, 98
inferiormente, 53 multiplo, 18
superiormente, 53 multiplo di un elemento di un monoide, 69
lunghezza di un segmento, 160 multiplo di un vettore, 170, 175
maggiorante, 53 negazione, 5
massimo comune divisore, 107 non banale, sistema, 220
matrice, 79 non singolare, matrice, 252
quadrata, 79 norma di un numero complesso, 86
matrice nucleo di un omomorfismo, 119
diagonale, 84 numeratore, 73
scalare, 84 numeri complessi, 85
simmetrica, 84 numeri interi relativi, 3, 17
triangolare inferiore, 84 numeri naturali, 3, 11
triangolare superiore, 84 numeri razionali, 3
matrice a gradini, 209 numeri reali, 3, 76
matrice a scala, 209 numero
matrice aggiunta, 251 primo, 107
matrice associata ad unapplicazione numero primo, 50
lineare, 201
matrice colonna, 79 omomorfismo, 91
matrice completa, 220 omomorfismo
matrice dei coefficienti, 220 di anelli, 138
matrice dei termini costanti, 220 di Frobenius, 140
matrice incompleta, 220 omomorfismo di monoidi, 91
matrice invertibile, 251 omotetia, 200
matrice nulla, 80 operazione
matrice prodotto, 80 associativa, 57
matrice riga, 79 binaria, 56
matrice somma, 80 commutativa, 57
matrice trasposta, 83 operazioni elementari sulle equazioni di un
matrice unitaria, 82 sistema lineare, 233
minimo comune multiplo, 107
operazioni elementari sulle righe di una ma-

Principio del Minimo, 14
trice, 212 Principio di Induzione, 15
orbita banale di una permutazione, 127 Principio di Induzione Finita, 36
orbita di una permutazione, 127 Principio di Uguaglianza per gli Insiemi, 2
ordinamento, 48 Principio di Uguaglianza per le Funzioni, 22
ordinamento Principio di Uguaglianza per le Relazioni
totale, 48 Binarie, 21
ordinamento indotto, 49 processo di ricorrenza, 25
ordinamento naturale, 13 prodotto associato, 244
ordinamento opposto, 49 prodotto cartesiano, 20, 27
ordine di un elemento, 125 prodotto di convoluzione, 141
orientazione su una retta, 164 prodotto di due parole, 61
origine di un segmento orientato, 162 prodotto di un numero reale per un vettore,
origine di un sistema di coordinate, 164, 165 168
proiezione canonica, 44, 119
parallelepipedo, 161 proiezione parallela, 160
parallelogramma, 161 proporzionale, vettore, 170, 175
parametro, 5 proposizione, 4
parità di una permutazione, 132 proprietà, 4
parola, 60 punti
parola vuota, 60 allineati, 158
parte di un insieme, 3 punti o rette
parte immaginaria di un numero complesso, complanari, 158
86 punto unità, 164
parte propria, 4
parte reale di un numero complesso, 86 quantificatore esistenziale, 7
parte stabile, 59 quantificatore universale, 7
partizione, 11 quaterna ordinata, 19
partizione associata ad una funzione, 24 quoziente, 18
periodo di un elemento, 125
periodo finito, elemento di, 125 radice n-esima, 77
periodo infinito, elemento di, 125 radice n-esima di 1, 88
permutazione, 28 radice di un polinomio, 155
piani coordinati, 165 rango di unapplicazione lineare, 205
piano di Argand-Gauss, 87 rango di una matrice, 209
Piccolo Teorema di Fermat, 140 rappresentante
PID, 153 di una classe di equivalenza, 44
pivot, 210 rappresentazione caratteristica di un insie-
polinomio, 142 me, 7
polinomio costante, 143 rappresentazione polare di un numero com-
potenza di un elemento di un monoide, 68 plesso, 88
primi fra loro, interi, 107 rappresentazione tabulare
Primo Teorema di Isomorfismo per gli Anel- di un insieme, 2
li, 150 di una relazione, 21
Principio del Massimo, 16 rappresentazione trigonometrica di un nu-
mero complesso, 88
regolare sistema omogeneo associato ad un sistema

elemento, 137 lineare, 221
relativamente primi, interi, 107 sistemi lineari equivalenti, 233
relazione soluzione di unequazione algebrica, 155
antisimmetrica, 48 somma di sottospazi, 192
dordine, 48 somma di un sottoinsieme A di un monoide,
dordine parziale, 48 67
di equivalenza, 42 somma diretta, 195
opposta, 22 sottoanello, 71
reciproca, 22 sottoanello fondamentale, 139
riflessiva, 42 sottogruppo, 59
simmetrica, 42 sottogruppo generato da -, 103
transitiva, 42 sottogruppo normale, 115
relazione binaria, 21 sottogruppoide, 59
resto, 18 sottoinsieme, 3
restrizione, 23 sottoinsieme proprio, 4
reticolo, 54 sottospazi banali, 177
reticolo sottospazi indipendenti, 195
completo, 54 sottospazio generato da, 181
retta orientata, 164 sottospazio proprio, 177
rette sottospazio vettoriale, 177
incidenti, 159 spazio vettoriale, 175
parallele, 158 spettro massimale, 150
sghembe, 158 spettro primo, 151
ricoprimento, 11 strettamente crescente, funzione, 51
riduzione a scala di una matrice, 214 strettamente decrescente, funzione, 51
riferimento cartesiano, 164 stringa, 60
riga, 79 stringa vuota, 60
righe di una matrice, 79 struttura algebrica, 56
risoluzione allindietro di un sistema lineare, successione, 25
228 successione finita, 27
successione geometrica, 25
Sarrus, regola di-, 247 supporto di una successione, 141
scalari, 175
scambio, 131 tavola pitagorica, 62
segmenti orientati equipollenti, 163 Teorema di
segmento, 160 Ricorrenza, 26
segmento orientato, 162 Teorema di Bezout, 108
segmento unitario, 164 Teorema di Corrispondenza per i sottogrup-
segnatura di una permutazione, 132 pi di un gruppo quoziente, 121
senza torsione, elemento, 125 Teorema di Cramer, 254
simmetria di una figura piana, 99 Teorema di Grassman, 198
sistema a scala, 224 Teorema di Krull, 152
sistema lineare, 220 Teorema di Lagrange, 115
sistema omogeneo, 221 Teorema di Rouche-Capelli, 223
Teorema di Ruffini, 156 R+ , 3

Teorema di Struttura dei Gruppi Ciclici, 123 R+ , 3
Teorema di Talete, 160 Z, 3
Teorema Fondamentale Z , 3
del Gruppo Quoziente, 121 , , 3
dellAritmetica, 110 n, 3
dellInsieme Quoziente, 45 P(A), 4
termine costante di un polinomio, 143 6, 6, 3
termine di un segmento orientato, 162 $, %, 4
termine di una successione, 25 A, 5
terna ordinata, 19 , congiunzione logica, 5
torsione, elemento di, 125 , 6
trasformazione lineare, 200 =, 6
trasposizione, 131 , disgiunzione logica, 6
trasposta di una matrice, 83 , 7
Triangolo di Tartaglia o di Pascal, 41 , 7
|, tale che, 7
uguaglianza, 5 {. . . | . . .}, 7
unione, 8 Pf (A), 8
T
valore assoluto, 78 T,n 9
valutazione euclidea, 154 Si=1 Ai , 9
variabile, 5 S,n 8
verso di un segmento orientato, 162 i=1 Ai , 8
vettore applicato, 162 , 9

vettore nullo, 163, 175 , 8
vettore opposto, 168, 175 A B, differenza di due insiemi, 9
vettore somma, 166 {A B, complementare di B in A, 9
vettori :, 13
linearmente dipendenti, 182 a , 15
linearmente indipendenti, 182 aZ, 18
a | b, a divide b, 18
zero di un polinomio, 155 a - b, a non divide b, 18
zero divisore, 137 (a, b), coppia ordinata, 19
, 6, 2 (a, b, c), terna ordinata, 19
3,63, 2 A B, 20
, 2 A2 , vedi A A, 20
:=, 3 2A , 20
N, 3 Rop , relazione opposta di R, 22
N , 3 B A , insieme delle funzioni da A verso B, 23
f
Q, 3 f : A B, A B, 22
Q , 3 f (x), 22
Q+ , 3 x 7 f (x), 22
Q+ , 3 1A , 23
R, 3 Af , partizione associata ad una funzione f ,
R , 3 24
f (), 23 1R , elemento neutro moltiplicativo dellanel-

f 1 (), 23 lo R, 71
f |C , 23 LTn (R), 84
(f0 , f1 , f2 , . . . , fn , . . .), 25 UT
n (R), 84
(fn )06n , 25 n
a, 77
1
(fn )n , 25 a n , 77
(f1 , f2 , . . . , fn ), 27 Mn (X), 79
A1 A2 An , 27 Mm,n (X), 79
(ai )iI , 27 U(n) , 82
(a
\i )i , 27 C, 85
, 28 N (z), norma del numero complesso z, 86
iI
[ | z |, modulo del numero complesso z, 86
, 28 z, coniugato del numero complesso z, 86
iI Arg(z), argomento del numero complesso z,
g f , gf , composizione di f con g, 30 88
f 1 , inversa di una funzione f , 31 U, 88
| A |, cardinalità di un insieme finito A, 35 Un , 89
n
k
, 40 H1 H2 Hn , 105
A/R, 44 X + Y , 105
[x], 43 XY , 105
x y, 43 G(f ), 106
x R y, 43 P, 107
n , 46 MCD(x1 , x2 , . . . , xn ), 107
x y mod. n, 46 mcm(x1 , x2 , . . . , xn ), 107
Zn , 47 LH , RH , 113
inf A , 53 aH, Ha, 113
supA , 53 (G : H), 114
x, opposto di un elemento x, 59 H G, 115
x1 , inverso di un elemento x, 58 Dn , 101
S(A), gruppo delle permutazioni di un in- N (G), 117
sieme A, 60 a b mod. H, 117
Sn , 60 Q8 , gruppo quaternione, 102
M(X), 60 G/H, 118
x y, 61 Im(f ), immagine di f , 119
x
Qn y, 61 Ker(f ), nucleo di f , 119
Pi=1 a i , 63 hXi, sottogruppo generato da X, 103
n
i=1 ai , 64 G(G), 105
n
a
P , 68 G(N, G), 120
P {x | x A}, 67 (x1 x2 . . . xr ), ciclo, 128
xA x, 67 S[a], 136
na, 69 Z [A1 ], 137
A , trasposta di una matrice A, 83 Z1R , 139

0R , elemento neutro additivo dellanello R, sgn(), segnatura di , 132
71 An , gruppo alternante di grado n, 134
R[x], 142
gr(f ), 143
f , 144
I 6 R, 145
L(R), 147
A(I, R), 149
L(I, R), 149
E, spazio euclideo tridimensionale, 158
AB, 162
GO , GOr , GO , 163
S, insieme dei segmenti orientati di E, 162
SO , insieme dei vettori applicati in O, 163
SO , 163
SOr , 163

AB CD, 163
Hi , 164
Hi,j , 165
Hi,j,k , 166
E + F , somma di due sottospazi E, F , 192
E1 En , somma diretta di sottospazi
E1 , . . . , En , 195
k , omotetia di rapporto k, 200
M (f ), matrice associata ad unapplicazione
lineare f , 201
rg(f ), rango di unapplicazione lineare f ,
205
LA , applicazione lineare associata ad una
matrice A, 201
rg(A), rango di una matrice A, 209
det(A), determinante di una matrice A, 246
A , matrice aggiunta di una matrice A, 251
Aij , complemento algebrico dellentrata Aij
di una matrice A, 251
GLn (R), gruppo lineare generale, 252

F0123 904 Appunti Matematica Discreta 12 Gennaio 2010 PDF

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

F0123 904 Appunti Matematica Discreta 12 Gennaio 2010 PDF

Caricato da

Copyright:

Formati disponibili

0

VERSIONE 12 GENNAIO 2010

(1) Linsieme i cui elementi sono i numeri 1, 35, 4, 2, 5, 2.

La proprietà di partenza nella Teoria degli Insiemi è la proprietà di appartenenza:

N := {0, 1, 2, 3, . . .} `e linsieme dei numeri naturali ; (1 )

Useremo inoltre i simboli N , Z , Q , Q+ , R , R+ per indicare gli insiemi N, Z, Q, Q+ , R,

Definizione 1.1.1. Dati due insiemi A, B, si dice che A `e un sottoinsieme o una

Se A non è un sottoinsieme di B, cioè se vi è almeno un elemento a A tale che a 6 B,

Se A B, ma A 6= B (cio`e A B e A 6 B, ossia ogni elemento di A appartiene a

Definizione 1.1.3. Dato un insieme A, linsieme i cui elementi sono i sottoinsiemi di A

1.2 Il concetto di enunciato. Elementi di logica.

la molecola di acqua possiede due atomi di idrogeno. (1.2.1)

il numero 4 `e maggiore del numero 3, (1.2.2)

il numero x `e maggiore del numero 3. (1.2.5)

Evidentemente non ha senso chiedersi se la (1.2.5) `e vera o falsa: questo dipender`a da

di appartenenza di un oggetto x ad un insieme Y , abbreviata con x Y . Anche qui

Lenunciato A oppure B si abbrevia con A B e si chiama la disgiunzione di A e

Dati due enunciati A, B, lenunciato se A `e vero, allora anche B `e vero , che ha

Esercizio 1.2.1. Aiutandosi con le opportune tavole di verit`a, si stabiliscano le seguenti

a) A oppure B e non entrambi.

Le locuzioni per ogni ed esiste si chiamano rispettivamente quantificatore uni-

(x A)P (x); (1.2.6)

(x A)P (x) oppure pi`

((x A)P (x)) ((x A)P (x)),

((x A)P (x)) ((x A)(P (x))).

{x A | P (x)} oppure {x | x A e P (x)}.

questultima uguaglianza si chiama una rappresentazione caratteristica di B.

Esempio 1.2.4. Riferendoci agli insiemi A3 , A4 , A5 della sez. precedente, abbiamo le

1.3 Operazioni con gli insiemi.

Gli insiemi A, B si dicono disgiunti se A B = .

Esempi 1.3.4. a) Se A = {a, e, i, o, u, 31, 5} e B = {a, 5, 3, b, c, o, u}, allora A B =

Esempi 1.3.6. a) Se A = {2, 3, 1, 5} e B = {3, 4, 5, 6}, allora A B = {2, 1}; se

Proposizione 1.3.7. Supponiamo che A, B, C siano sottoinsiemi di un dato insieme

Dimostrazione. Alcune di queste uguaglianze sono ovvia conseguenza delle definizioni,

Viceversa, supponiamo che x (A B) (A C), cio`e x A B e x A C. Allora x A,

Esercizi 1.3.8. Dimostrare le seguenti formule, dove A, B, C sono sottoinsiemi di un

Esercizi 1.3.9. a) E vero che per ogni A, B, C risulta (A B) C = A (B C)?

(2) per ogni A A risulta A 6= ,

Esempi 1.3.11. a) Linsieme A di cui allesempio 1.3.2 c) `e un ricoprimento di Q+ che

1.4 I numeri naturali.

In N sono definite le tradizionali operazioni di addizione e moltiplicazione; si tratta

per ogni a, b, c N risulta a + (b + c) = (a + b) + c;

per ogni a, b N risulta a + b = b + a;

per ogni a N risulta 0 + a = a;

per ogni a, b, c N risulta a (b c) = (a b) c;

per ogni a, b N risulta a b = b a;

per ogni a N risulta 1 a = a;

Ogni elemento a N diverso da 0 `

dati a, b, c N con a 6= 0, se a b = a c, allora b = c;

per ogni a, b, c N risulta a (b + c) = (a b) + (a c);

per ogni a, b N, se a + b = 0, allora a = b = 0;

per ogni a, b N, se a b = 1, allora a = b = 1.

Dalle sopra elencate propriet`a discendono le seguenti:

per ogni a N risulta a 0 = 0; (1.4.1)

a < b se e solo se b = a + c per un c N con c 6= 0.

per ogni a, b N, se a 6 b e b 6 a, allora a = b;

per ogni a, b, c N, se a 6 b e b 6 c, allora a 6 c.

e quindi c + d = 0 (perche?). Dunque c = d = 0 in base alla conicit`a di N rispetto

Principio del Minimo dellordinamento naturale in N: Se A `e un sottoinsieme

m 6 a per ogni a A. (1.4.4)

Infatti, dati a, b N con a 6= b, linsieme A = {a, b} non `e vuoto e quindi ha il minimo,

per ogni a, b, c N, se a 6 b, allora a + c 6 b + c;

per ogni a, b, c N, se a 6 b e c 6 d, allora ac 6 bd.