Sei sulla pagina 1di 227

Corso di Algebra

(Un approccio amichevole)

Prof. Alfio Ragusa

Dipartimento di Matematica e Informatica

Università di Catania

Anno Accademico 2008-2009


2
Indice

1 Teoria degli insiemi 7


1.1 Generalità sulla Teoria degli insiemi . . . . . . . . . 7
1.2 Relazioni . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3 Funzioni o applicazioni . . . . . . . . . . . . . . . . 23

2 Insiemi numerici 31
2.1 Numeri naturali . . . . . . . . . . . . . . . . . . . . 31
2.2 Divisibilità nei numeri naturali . . . . . . . . . . . 39
2.3 Cenni di calcolo combinatorico . . . . . . . . . . . . 43
2.4 Cardinalità di un insieme . . . . . . . . . . . . . . . 47
2.5 Insieme dei numeri interi relativi . . . . . . . . . . 52
2.6 Divisibilità negli interi relativi . . . . . . . . . . . . 56
2.7 Classi di resto modulo n . . . . . . . . . . . . . . . 62
2.8 Criteri di divisibilità . . . . . . . . . . . . . . . . . 70
2.9 Equazioni diofantee . . . . . . . . . . . . . . . . . . 72
2.10 Il Teorema cinese del resto . . . . . . . . . . . . . . 75
2.11 Una applicazione alla Crittografia . . . . . . . . . . 80
2.12 L’insieme dei numeri razionali . . . . . . . . . . . . 82
2.13 Cenni sul campo dei numeri reali . . . . . . . . . . 86
2.14 Il campo C dei numeri complessi . . . . . . . . . . . 87

3 Teoria dei polinomi 95


3.1 Funzioni polinomiali . . . . . . . . . . . . . . . . . 95
3.2 Polinomi: definizione formale . . . . . . . . . . . . 98
3.3 Divisibilità nei polinomi . . . . . . . . . . . . . . . 100

3
4 INDICE

3.4 Irriducibilità dei polinomi . . . . . . . . . . . . . . 103

4 Teoria dei gruppi 121


4.1 Definizioni e primi esempi . . . . . . . . . . . . . . 121
4.2 Sottogruppi . . . . . . . . . . . . . . . . . . . . . . 125
4.3 Gruppi ciclici . . . . . . . . . . . . . . . . . . . . . 129
4.4 Omomorfismi tra gruppi . . . . . . . . . . . . . . . 135
4.5 Laterali e gruppo quoziente . . . . . . . . . . . . . 138
4.6 Sottogruppi normali . . . . . . . . . . . . . . . . . 143
4.7 Teoremi dell’omomorfismo . . . . . . . . . . . . . . 147
4.8 Automorfismi di un gruppo . . . . . . . . . . . . . 152
4.9 Gruppi simmetrici . . . . . . . . . . . . . . . . . . . 153
4.10 Azione di gruppo su un insieme. Equazione delle classi.160
4.11 Teorema di Cauchy . . . . . . . . . . . . . . . . . . 164
4.12 p-gruppi . . . . . . . . . . . . . . . . . . . . . . . . 166
4.13 I Teoremi di Sylow . . . . . . . . . . . . . . . . . . 168
4.14 Somma diretta di gruppi . . . . . . . . . . . . . . . 172
4.15 Il Teorema di struttura dei gruppi abeliani finiti . . 175

5 Teoria degli anelli 181


5.1 Definizioni e prime proprietà . . . . . . . . . . . . . 181
5.2 Sottoanelli . . . . . . . . . . . . . . . . . . . . . . . 186
5.3 Omomorfismi di anelli . . . . . . . . . . . . . . . . 187
5.4 Anelli quozienti ed Ideali . . . . . . . . . . . . . . . 190
5.5 Teoremi dell’omomorfismo tra anelli . . . . . . . . . 192
5.6 Generatori di ideali ed ideali principali . . . . . . . 193
5.7 Ideali primi e massimali . . . . . . . . . . . . . . . 195
5.8 Domini euclidei . . . . . . . . . . . . . . . . . . . . 204
5.9 Domini a fattorizzazione unica (UFD) . . . . . . . . 215
5.10 Teorema di Gauss . . . . . . . . . . . . . . . . . . . 221
Introduzione

Queste note sono state realizzate per venire incontro alle esigenze
degli studenti dei corsi di studio in Matematica che trovano in ge-
nere grandi difficoltà ad accostarsi ai testi di Algebra usualmente in
commercio. Pertanto il taglio dato a questi appunti è volutamente
“amichevole” e meno rigido di quello che solitamente si usa per i
testi di Matematica in genere e per quelli di Algebra in particolare.
Ovviamente, essi vanno poi integrati con testi più completi e più
formali che tuttavia dovrebbero diventare di più facile comprensione
una volta assimilato il contenuto del presente volume.
Spero che la grande fatica fatta per rendere piacevoli ed or-
ganici questi appunti possa essere ricompensata dall’utilità che ne
potranno trarre coloro che si avvicinano allo studio dell’Algebra.

Alfio Ragusa

5
6 INDICE
Capitolo 1

Teoria degli insiemi

1.1 Generalità sulla Teoria degli insie-


mi
Il concetto di insieme è un concetto primitivo, cioè non è defini-
bile a partire da altri concetti precedentemente definiti. D’altra
parte, risulta evidente che in ogni scienza non è possibile definire
tutti i concetti proprio perché per definire un concetto ho bisogno
di conoscere altri concetti, diciamo più elementari, per cui vi sa-
ranno concetti cosı̀ elementari che non potranno essere definiti non
essendovi concetti ancor più elementari.
Per assegnare un insieme si può procedere o elencando tutti gli
oggetti dell’insieme oppure definendo una proprietà che caratterizza
gli elementi contenuti nell’insieme da assegnare, cioè una proprietà
che permetta di dedurre quali elementi appartengono all’insieme
stesso e quali non vi stanno.
Ad esempio, se volessimo definire l’insieme dei primi 5 numeri
naturali, potremo indicarlo nei seguenti modi:

1. A = {1, 2, 3, 4, 5};

2. A = {n ∈ N | 1 ≤ n ≤ 5}.

7
8 CAPITOLO 1. TEORIA DEGLI INSIEMI

Attenzione tuttavia a dare proprietà che definiscano in modo


“oggettivo”, ovvero non ambiguo, gli elementi di un insieme. Ad
esempio, non definisce alcun insieme la proprietà

{n ∈ N | n sia grande}.

Se l’insieme non contiene alcun elemento si suol dire che tale


insieme è l’insieme vuoto e si indica con il simbolo ∅.
In genere gli insiemi si possono rappresentare
A con i diagrammi
di Venn che sono figure del tipo

A
Un insieme B tale che ogni suo elemento sta nell’insieme A si
dice sottoinsieme di A e si scrive BB⊆ A.

Se B ⊆ A e A ⊆ B i due insieme si dicono uguali e scriveremo


A = B. Quando due insiemi non sono uguali scriveremo A 6= B.
Assegnato un insieme A, non vuoto, esistono certamente almeno
due suoi sottoinsiemi: ∅ ⊆ A e A ⊆ A, detti sottoinsiemi banali.
I sottoinsiemi B di A diversi da A si diranno propri ed in tal
caso scriveremo B ( A.

Esempio 1.1.1 Se A = {a, b} allora i suoi sottoinsiemi sono: ∅,


{a}, {b}, A.
Se A = {a, b, c} allora i suoi sottoinsiemi sono: ∅, {a}, {b}, {c},
{a, b}, {a, c}, {b, c}, A.
È naturale chiedersi quanti sottoinsiemi possieda un insieme che
contiene un numero n di elementi. La risposta, di cui in seguito
vedremo la motivazione, è piuttosto semplice: un insieme con n
elementi possiede 2n sottoinsiemi.

L’insieme dei sottoinsiemi di A, che è sempre un insieme non


vuoto dal momento che contiene almeno come elemento l’insieme
1.1. GENERALITÀ SULLA TEORIA DEGLI INSIEMI 9

vuoto, si indica con il simbolo: P(A) = {B | B ⊆ A} e si chiama


insieme delle parti di A. Quindi un qualunque sottoinsieme B di
A è un elemento di P(A), cioè B ∈ P(A).
Nota che se a ∈ A allora {a} ∈ P(A). Nota che, in tal caso, le
scritture a ∈ P(A) e a ⊆ A sono errate.
Passiamo a definire le principali operazioni tra insiemi.
A B
1. Intersezione: A ∩ B = {x | x ∈ A, x ∈ B};

L’intersezione gode delle seguenti proprietà:

1a. A ∩ ∅ = ∅;

1b. A ∩ A = A;

1c. A ∩ B = B ∩ A (proprietà commutativa);

1d. (A ∩ B) ∩ C = A ∩ (B ∩ C) (proprietà associativa);

1e. se B ⊆ A allora A ∩ B = B.

2. Unione: A ∪ B = {x | x ∈ A o x ∈ B}
(“o” qui va inteso in senso alternativo ovvero in questo in-
sieme sono compresi anche Agli elementi cheBappartengono ad
entrambi gli insiemi A e B).

L’unione gode delle seguenti proprietà:

2a. A ∪ ∅ = A;

2b. A ∪ A = A;

2c. A ∪ B = B ∪ A (proprietà commutativa);


10 CAPITOLO 1. TEORIA DEGLI INSIEMI

2d. (A ∪ B) ∪ C = A ∪ (B ∪ C) (proprietà associativa);

2e. se B ⊆ A allora A ∪ B = A;

2f. A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) (proprietà distributiva


dell’intersezione rispetto all’unione);

2g. A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) (proprietà distributiva


dell’unione rispetto all’intersezione.

3. Unione simmetrica o disgiunta: A4B = {x | x ∈ A oppure x ∈


B}
(in questo caso “oppure” va inteso in senso disgiuntivo, quindi
in questo insieme vi stanno gli elementi che appartengono ad
A B
A o a B ma non ad entrambi).

L’unione simmetrica gode delle seguenti proprietà:

3a. A4∅ = A;

3b. A4A = ∅;

3c. A4B = B4A (proprietà commutativa);

3d. (A4B)4C = A4(B4C) (proprietà associativa).

A B
4. Differenza: A \ B = {x | x ∈ A, x ∈
/ B}.

La differenza gode delle seguenti proprietà:

4a. A \ ∅ = A;
1.2. RELAZIONI 11

4b. A \ A = ∅;

4c. A \ (B ∪ C) = (A \ B) ∩ (A \ C) (legge di De Morgan);

4d. A \ (B ∩ C) = (A \ B) ∪ (A \ C) (legge di De Morgan);

4e. A \ (B \ C) = (A \ B) ∪ (A ∩ C);

4f. (A \ B) \ C = A \ (B ∪ C)

4g. A4B = (A ∪ B) \ (A ∩ B).

5. Prodotto cartesiano: A × B = {(x, y) | x ∈ A, y ∈ B}.

Nota che, in generale, A × B 6= B × A.


A titolo di esemplificazione proviamo alcune delle precedenti
proprietà.
- Prova di [2f.] Sia x ∈ A ∩ (B ∪ C), allora x ∈ A e x ∈ (B ∪ C), cioè
x ∈ B oppure x ∈ C, quindi x ∈ A ∩ B oppure x ∈ A ∩ C in ogni
caso quindi x ∈ (A∩B)∪(A∩C). Viceversa, se x ∈ (A∩B)∪(A∩C)
allora x ∈ A ∩ B oppure x ∈ A ∩ C ovvero x ∈ A e x ∈ B oppure
x ∈ C, per cui x ∈ A ∩ (B ∪ C).
- Prova di [4c.] Sia x ∈ A \ (B ∪ C), allora x ∈ A e x ∈ / (B ∪ C),
cioè x ∈
/ B e x ∈ / C, pertanto x ∈ A \ B e x ∈ A \ C ovvero
x ∈ (A \ B) ∩ (A \ C). Viceversa, se x ∈ (A \ B) ∩ (A \ C) allora
x ∈ A \ B e x ∈ A \ C, quindi x ∈ A e x ∈ / B e x ∈ / C ovvero
A \ (B ∪ C).

1.2 Relazioni
Un altro dei concetti fondamentali che entra in gioco in tutte le
scienze ed in particolare in Matematica è il concetto di relazione
che come vedremo è facilmente definibile a partire dalle definizioni
che abbiamo già conosciuto sugli insiemi.
12 CAPITOLO 1. TEORIA DEGLI INSIEMI

Definizione 1.2.1 Dati due insiemi A e B diremo relazione (bi-


naria) su A e B un qualunque sottoinsieme R di A × B. Se R è
R
una relazione su A e B scriveremo (x, y) ∈ R oppure x ∼ y per
indicare che x è in relazione con y.
¬R
Talvolta per indicare che (x, y) ∈
/ R si scriverà x ∼ y.

Esempio 1.2.2 Se D = {tutte le donne} ed E = {esseri umani},


una relazione su D ed E è la seguente

M = {(d, e) ∈ D × E | d è madre di e}.

Nel caso particolare in cui B = A una relazione su A e A si


dirà interna. Per il momento noi ci occuperemo di relazioni binarie
interne su un insieme A.
Intanto tra le tante relazioni su A ve n’è una molto particolare,
detta relazione diagonale e definita da

∆A = {(a, a) | ∀ a ∈ A}.

Inoltre, se R è una relazione su un insieme A, si dirà relazione


inversa di R la relazione R−1 su A definita come segue

R−1 = {(x, y) | (y, x) ∈ R}

cioè la relazione costituita dalle coppie ottenute invertendo di posto


gli elementi delle coppie in R.
Infine se R e S sono due relazioni su A si definisce composi-
zione tra R e S la relazione R ◦ S definita da

R ◦ S = {(x, y) | ∃ z ∈ A tale che (x, z) ∈ R, (z, y) ∈ S}.

Esempio 1.2.3 Se D = {tutte le donne} ed M è la relazione su


D definita da M = {(d, e) ∈ D × D | d è madre di e} allora
1.2. RELAZIONI 13

M−1 = {(d, e) ∈ D × D | d è figlia di e},


M ◦ M = {(d, e) ∈ D × D | d è nonna materna di e}.

Adesso ci occupiamo delle principali proprietà di cui può godere


una relazione binaria R su A.

Definizione 1.2.4 Una relazione binaria R su A si dice riflessiva


R
quando a ∼ a per ogni a ∈ A. Ciò è equivalente a dire che ∆A ⊆ R.

Esempio 1.2.5
1) Nell’insieme P delle parole consideriamo la relazione S defi-
S
nita da x ∼ y quando ogni lettera della parola x figura anche
R
nella parola y. Ad esempio como ∼ campione, mentre è falso
R
che abito ∼ alito. Ora è ovvio che tale proprietà sia riflessiva
in quanto ogni parola ha le stesse lettere di se stessa.
2) Nell’insieme R dei numeri reali consideriamo la relazione R
R
definita da x ∼ y quando x + y = 10. Ad esempio 73 e 23 sono
√ √ 3
in relazione, mentre 10 e 90 non lo sono. Tale relazione
non è riflessiva e per fare questa affermazione sarà sufficiente
portare un esempio di un elemento che non sia in relazione
con se stesso. Chiaramente, ad esempio, 7 non è in relazione
con se stesso in quanto 7 + 7 6= 10. Attenzione, il fatto che
invece 5+5 = 10, cioè che 5 sia in relazione con se stesso nulla
ci dice sulla proprietà riflessiva della relazione in quanto per
la validità della proprietà riflessiva occorre che ogni elemento
dell’insieme sia in relazione con se stesso.

Definizione 1.2.6 Una relazione binaria R su A si dice simme-


R R
trica quando dal fatto che a ∼ b segue che b ∼ a. Ciò è equivalente
a dire che R ⊆ R−1 (e quindi anche R = R−1 ).
14 CAPITOLO 1. TEORIA DEGLI INSIEMI

Esempio 1.2.7

1) Nell’insieme Z dei numeri interi relativi consideriamo la re-


R
lazione R definita da x ∼ y quando x − y = 10m per qualche
m ∈ Z. Questo significa che x − y è un multiplo di 10 ovvero
che x ed y divisi per 10 danno lo stesso resto. Ad esempio
R R ¬R
7 ∼ 27, 1 ∼ −9, mentre −13 ∼ 3 (non sono in relazione).
Tale relazione è sia riflessiva che simmetrica. Basta osserva-
re che per ogni x si ha x−x = 0 = 10·0, e che se x−y = 10m
allora y − x = 10(−m).

2) La relazione dell’Esempio 1.2.5 2) è simmetrica ma non ri-


flessiva; basta osservare che x + y = y + x.

3) La relazione dell’Esempio 1.2.5 1) è riflessiva ma non sim-


R
metrica. Basta portare un esempio quale como ∼ campione,
¬R
mentre campione ∼ como.

4) Nell’insieme R dei numeri reali consideriamo la relazione R


R
definita da x ∼ y quando x − y = 10. Tale relazione non è né
riflessiva, in quanto ad esempio 5−5 = 0 6= 10, né simmetrica
R ¬R
in quanto ad esempio 17 ∼ 7 ma 7 ∼ 17.

Definizione 1.2.8 Una relazione binaria R su A si dice transi-


R R R
tiva quando dal fatto che a ∼ b e b ∼ c segue che a ∼ c. Ciò è
equivalente a dire che R ◦ R ⊆ R.

Esempio 1.2.9

1) La relazione dell’Esempio 1.2.7 1) è, oltre che riflessiva e


R R
simmetrica, anche transitiva. Infatti, da a ∼ b e b ∼ c segue
che a − b = 10m e b − c = 10n, per cui sommando membro a
R
membro si ha a − c = 10(m + n) cioè a ∼ c.
1.2. RELAZIONI 15

2) Nell’insieme N dei numeri naturali consideriamo la relazione


R
R definita da x ∼ y quando x, y ∈ {1, 2, 3}. Tale relazione è
simmetrica e transitiva ma non riflessiva. Infatti, chiaramen-
R R R
te x ∼ y non dipende dall’ordine. Inoltre, se a ∼ b e b ∼ c
si ha a, b ∈ {1, 2, 3}, b, c ∈ {1, 2, 3} e quindi a, c ∈ {1, 2, 3}.
¬R
Infine, ad esempio, 7 ∼ 7.
R
3) Nell’insieme R dei numeri reali la relazione a ∼ b quando
a ≤ b (ricordiamo che a ≤ b quando esiste un numero reale
non negativo z tale che b = a + z) è riflessiva e transitiva,
ma non simmetrica. Infatti, è chiaro che x ≤ x; inoltre se
a ≤ b e b ≤ c, cioè b = a + z, e c = b + z 0 con z e z 0 numeri
reali non negativi, si ha c = a + (z + z 0 ) ovvero a ≤ c. Infine,
5 ≤ 13 ma è falso che 13 ≤ 5.

4) Nell’insieme Q dei numeri razionali consideriamo la relazione


R
R definita da x ∼ y quando |x − y| < 10. Tale relazione è
riflessiva e simmetrica, ma non transitiva. Basta osservare
che |x − x| = 0 < 10 e che |x − y| = |y − x| per la verifica delle
prime due proprietà. Infine, la relazione non è transitiva, in
R R ¬R
quanto ad esempio 20 ∼ 11 e 11 ∼ 2 ma 20 ∼ 2.
R
5) Nell’insieme R dei numeri reali la relazione a ∼ b quando
a < b (cioè quando esiste un numero reale positivo z tale che
b = a + z) è transitiva, ma non è né riflessiva né simmetrica.
Basta osservare che 8 < 8 è falso.

6) La relazione dell’Esempio 1.2.5 2) è simmetrica, ma non è né


R R
riflessiva né transitiva. Basta osservare che 8 ∼ 2 e 2 ∼ 8,
¬R
ma 8 ∼ 8 (8 + 8 6= 10).

7) Nell’insieme Q dei numeri razionali consideriamo la relazione


R
R definita da x ∼ y quando x − y < 10. Tale relazione è
riflessiva, ma né simmetrica né transitiva. Basta osservare
R ¬R
che 3 ∼ 18 ma 18 ∼ 3.
16 CAPITOLO 1. TEORIA DEGLI INSIEMI

8) La relazione M dell’Esempio 1.2.3 non è né riflessiva né


simmetrica né transitiva.

Definizione 1.2.10 Una relazione E su A che gode delle proprietà


riflessiva, simmetrica e transitiva è detta relazione d’equivalen-
za.

L’Esempio 1.2.7 1) fornisce una relazione di equivalenza.


Vediamo adesso cosa succede su un insieme A quando su esso è
assegnata una relazione di equivalenza E. Cominciamo a prendere
un elemento a ∈ A (ovviamente possiamo supporre che A 6= ∅) e
E
consideriamo il sottoinsieme di A, [a]E = {x ∈ A | x ∼ a}, detto
la classe di equivalenza di a. Osserviamo intanto che [a]E 6= ∅
E
in quanto esso contiene almeno a visto che per riflessività a ∼ a.
Se [a]E ( A consideriamo un elemento b ∈ A \ [a]E e procediamo
E
come prima definendo [b]E = {x ∈ A | x ∼ b}. Naturalmente,
come prima, [b]E 6= ∅; inoltre [a]E ∩ [b]E = ∅. Infatti, se per assurdo
E E
esistesse z ∈ [a]E ∩ [b]E sarebbe z ∼ a e z ∼ b e, per la simmetria
E E
di E, b ∼ z; cosı̀ per la transitività della relazione sarebbe b ∼ a,
il che contraddice il fatto che b ∈/ [a]E . Se [a]E ∪ [b]E 6= A, preso un
elemento c ∈ A \ ([a]E ∪ [b]E ) si definisce la classe di equivalenza di
c e si continua fintanto che l’unione di tutte le classi di equivalenza
cosı̀ costruite non esaurisca tutto l’insieme A. In definitiva, abbiamo
costruito una famiglia di sottoinsiemi di A, le classi di equivalenza,
che ha queste tre proprietà:
i) [a]E 6= ∅ per ogni a ∈ A;
¬E
ii) [a]E ∩ [b]E = ∅ per ogni a, b ∈ A con a ∼ b;
S
iii) a∈A [a]E = A.
L’insieme di tutte le classi di equivalenza sarà detto insieme quo-
ziente di A rispetto alla relazione di equivalenza E e sarà indicato
con A/E.
1.2. RELAZIONI 17

La costruzione precedentemente fatta ci porta alla seguente de-


finizione.

Definizione 1.2.11 Diremo partizione di un insieme A un in-


sieme di sottoinsiemi di A, {Ai }i∈I , tale che

i) Ai 6= ∅ per ogni i ∈ I;

ii) Ai ∩ Aj = ∅ per ogni i 6= j;


S
iii) i∈I Ai = A.

È facile vedere che, cosı̀ come una relazione di equivalenza de-


termina una partizione, quella delle sue classi di equivalenza, ogni
partizione determina una relazione di equivalenza. Infatti, fissata
P
una partizione {Ai }i∈I su A, la relazione definita da x ∼ y quando
x, y ∈ Ai per qualche i, è una relazione di equivalenza. Proprietà
riflessiva e simmetrica sono banalmente verificabili, mentre la tran-
sitiva segue dal fatto che se x, y ∈ Ai e y, z ∈ Aj , per il fatto che se
i 6= j allora Ai ∩ Aj = ∅, allora deve essere i = j cosı̀ che x, z ∈ Ai .
Adesso ci occupiamo di un’altra importante proprietà delle re-
lazioni.

Definizione 1.2.12 Una relazione binaria R su A si dice anti-


R R
simmetrica quando dal fatto che a ∼ b e b ∼ a segue a = b. Ciò è
equivalente a dire che R ∩ R−1 ⊆ ∆A .

Esempio 1.2.13 Gli esempi di relazioni che non sono antisimme-


triche sono molti, basta considerare le relazioni simmetriche già
viste. Qui portiamo due importanti esempi di relazioni antisimme-
triche.
18 CAPITOLO 1. TEORIA DEGLI INSIEMI

1) La relazione dell’Esempio 1.2.9 3) è antisimmetrica, infatti


R R
se x ∼ y e y ∼ x, cioè x ≤ y e y ≤ x, allora y = x + α e
x = y + β per qualche α, β reali non negativi; da esse segue
y = y + α + β ovvero α + β = 0 e dal fatto che essi sono non
negativi, nessuno dei due può essere positivo, quindi α = β =
0 e questo porta ad x = y.

2) Nell’insieme dei naturali non nulli N∗ consideriamo la rela-


R
zione x ∼ y quando x divide y, cioè quando esiste un numero
naturale n tale che xn = y, ed in tal caso scriveremo x|y. Tale
relazione, oltre che riflessiva e transitiva, come si può facil-
R
mente verificare, è anche antisimmetrica. Infatti, se x ∼ y e
R
y ∼ x, cioè x|y e y|x, allora y = mx e x = ny per qualche
m, n naturali non nulli; da esse segue allora y = mny ovvero
mn = 1 e dal fatto che essi sono naturali non nulli si deduce
che m = n = 1 e questo porta ad x = y.

Definizione 1.2.14 Una relazione P su A che gode delle proprietà


riflessiva, antisimmetrica e transitiva è detta relazione d’ordine
o ordinamento parziale.

Le relazioni dell’Esempio 1.2.13 1) e 2) sono relazioni d’ordine.


Quando su un insieme A è fissata una relazione d’ordine, che
per semplicità indicheremo , diremo che (A, ) è un insieme par-
zialmente ordinato, brevemente insieme p.o..

Definizione 1.2.15 Una relazione d’ordine  su A si dice rela-


zione di ordinamento totale se per ogni x, y ∈ A si ha x  y op-
pure y  x, cioè due elementi sono sempre confrontabili. Un insie-
me A su cui è data una relazione di ordine totale si dirà totalmente
ordinato o catena.

La relazione dell’Esempio 1.2.13 1) è di ordinamento totale, mentre


la relazione dell’Esempio 1.2.13 2) non è di ordinamento totale,
1.2. RELAZIONI 19

basti pensare che nella suddetta relazione di divisibilità si ha, ad


esempio, che 3 non divide 7 e 7 non divide 3.

Definizione 1.2.16 In un insieme p.o. (A, ) si definisce mini-


mo un elemento m ∈ A tale che m  a per ogni a ∈ A. Analoga-
mente, si definisce massimo un elemento M ∈ A tale che a  M
per ogni a ∈ A.

Esempio 1.2.17 1) Nell’insieme p.o. (N, ≤), con l’usuale or-


dinamento, il minimo è lo 0, mentre non esiste il massimo
2) Si consideri l’insieme p.o. A = {x ∈ R | − 3 < x ≤ 7} con
l’usuale ordinamento ≤. In tale insieme p.o. 7 è il massimo,
mentre non vi è alcun minimo (nota che −3 non è il minimo
in quanto −3 ∈ / A).
3) Si consideri l’insieme p.o. N∗ = N \ {0} con l’ordinamento
|, definito dalla divisibilità (vedi Esempio 1.2.13 2)). In tale
insieme il minimo è 1 (perché divide tutti i numeri naturali)
ma non vi è massimo.
4) Si consideri l’insieme p.o. N∗ \ {1} con l’ordinamento |, defi-
nito dalla divisibilità. In tale insieme non vi è né minimo né
massimo (nessun numero naturale > 1 divide tutti i numeri
naturali > 1).
5) Si consideri l’insieme p.o. B = {4, 9, 12, 36} con l’ordina-
mento |, definito dalla divisibilità. In tale insieme non vi è
minimo ma 36 è massimo in quanto tutti gli elementi di B
sono divisori di 36.
6) Si consideri l’insieme p.o. D = {4, 10, 12, 18, 24} con l’ordi-
namento |, definito dalla divisibilità. In tale insieme non vi è
né minimo né massimo. Notare che non vi è alcun elemento
in D che divide tutti gli elementi di D, né vi è un elemento
in D che sia multiplo di tutti gli elementi di D.
20 CAPITOLO 1. TEORIA DEGLI INSIEMI

Alla luce di quanto visto possiamo affermare che non è detto


che in un insieme p.o. esista un minimo o un massimo, ma se
essi esistono allora sono certamente unici. Infatti, se esistessero
due minimi m1 ed m2 , dovrebbe essere sia m1  m2 e, allo stesso
tempo, m2  m1 , ma l’antisimmetria allora implicherà che m1 =
m2 . Analogamente per il massimo.
Quando in un insieme p.o. (A, ) non esiste il minimo è in-
teressante cercare elementi che non hanno alcun elemento che li
“preceda” (a parte se stesso per ciascuno di essi); quando non esi-
ste il massimo è interessante cercare elementi che non hanno alcun
elemento che li “segua” (a parte se stesso). Diamo allora la seguente
definizione.

Definizione 1.2.18 Sia (A, ) un insieme p.o., un elemento u ∈


A si dice minimale se da x  u segue x = u. Analogamente, un
elemento v ∈ A si dice massimale se da v  y segue v = y.

A differenza del minimo e del massimo, ovviamente, gli elementi


minimali o massimali in un insieme p.o. possono essere più di uno.

Esempio 1.2.19 1) In A = N∗ \ {1} con la solita relazione di


divisibilità, come abbiamo visto nell’Esempio 1.2.17 4) non
esiste minimo e massimo, ma esistono infiniti elementi mini-
mali: tutti i numeri primi! (e nessun elemento massimale).
Essi, infatti, non hanno altri divisori in A a parte se stessi.

2) Nell’insieme p.o. D dell’Esempio 1.2.17 6) gli elementi 4, 10, 18


sono minimali, mentre 10, 18, 24 sono massimali.

Osserviamo che se (A, ) è un insieme p.o. e B ⊆ A allora


anche B sarà un insieme p.o. (rispetto alla stessa relazione d’ordine
definita in A).

Definizione 1.2.20 Sia (A, ) un insieme p.o. e B ⊆ A, si defi-


nisce minorante di B in A un elemento a ∈ A tale che a  b per
1.2. RELAZIONI 21

ogni b ∈ B. Analogamente, si definisce maggiorante di B in A un


elemento a ∈ A tale che b  a per ogni b ∈ B.

Esempio 1.2.21 1) Si consideri R p.o. con l’usuale ordina-


mento ≤ ed il suo sottoinsieme B = {x ∈ R | x > 7}. Ad
esempio, 4, −11 sono minoranti di B in R; in effetti l’insie-
me di tutti i minoranti è H = {x ∈ R | x ≤ 7}. Invece non ci
sono maggioranti di B in R.

2) Sia A = N∗ p.o. con la relazione di divisibilità e sia D =


{4, 10, 12, 18, 24}. Allora un minorante di D in A è un nume-
ro naturale che divide tutti gli elementi di D; quindi i mino-
ranti sono solo 1 e 2. Invece un maggiorante di D in A è un
numero naturale che è multiplo di ogni elemento di D; quindi
i maggioranti sono 360 e tutti i suoi multipli.

3) Sia A = {x ∈ N∗ | 3 ≤ x ≤ 50} p.o. con la relazione di


divisibilità e sia D = {4, 10, 12, 18, 24} Allora non esistono
né minoranti né maggioranti di D in A.

Osservazione 1.2.22 Ovviamente se un maggiorante di B in A


sta in B allora esso è anche il massimo di B. Ed analogamente, se
un minorante di B in A sta in B allora esso è anche il minimo per
B.

Come abbiamo visto nei vari esempi precedenti vi sono casi in


cui esistono maggioranti o minoranti e casi in cui non ne esistono.
In ogni caso possiamo dare la seguente definizione.

Definizione 1.2.23 Sia (A, ) un insieme p.o. e B ⊆ A. Il mas-


simo dell’insieme dei minoranti è detto estremo inferiore di B
in A. Il minimo dell’insieme dei maggioranti di B in A è chiamato
estremo superiore di B in A.
22 CAPITOLO 1. TEORIA DEGLI INSIEMI

Esempio 1.2.24

1) Nell’Esempio 1.2.21 2) l’estremo inferiore è 2, mentre l’e-


stremo superiore è 360. Osserviamo che questi rappresenta-
no, rispettivamente, il massimo comune divisore ed il minimo
comune multiplo degli elementi di D.

2) Nell’Esempio 1.2.21 3) D non ha né estremo inferiore né


estremo superiore.

I precedenti concetti permettono di dare le seguenti definizioni.

Definizione 1.2.25 Un insieme p.o. (A, ) in cui ogni sottoin-


sieme non vuoto ha il minimo si dice ben ordinato.
Un insieme p.o. (A, ) in cui ogni sottoinsieme non vuoto ha
l’estremo inferiore e l’estremo superiore si dice completo.

Osservazione 1.2.26 Osserviamo che se (A, ) è ben ordinato è


anche totalmente ordinato. Infatti, se x, y ∈ A allora {x, y}, essen-
do un sottoinsieme di A, ha il minimo; cosı̀ se il minimo è x si ha
x  y, mentre se il minimo è y si ha y  x.

1.3 Funzioni o applicazioni


A questo punto siamo in grado di introdurre il concetto di funzione
o applicazione.

Definizione 1.3.1 Dati due insiemi A e B diremo funzione o


applicazione tra gli insiemi A e B una relazione F ⊆ A × B su
tali insiemi, che sarà indicata con f : A → B, tale che per ogni
a ∈ A esiste un unico b ∈ B tale che (a, b) ∈ F.
1.3. FUNZIONI O APPLICAZIONI 23

In tal caso l’elemento b che nasce in corrispondenza di a si


chiama immagine di a tramite f e si indica con b = f (a).
Per una applicazione f : A → B, A è detto dominio di f e B
si chiama codominio di f.
Le funzioni sono, quindi, costituite da un dominio, un codominio
e da una relazione che dà la corrispondenza; se varia anche solo
uno di questi elementi, la funzione cambia. Per cui due funzioni
sono identiche solo se hanno uguali dominio, codominio e legge di
applicazione.

Esempio 1.3.2
1) Consideriamo f : R → R+ definita da f (x) = x2 + 1 (R+
insieme dei reali positivi). Questa è una applicazione perché
se x è un numero reale allora x2 +1 è un numero reale positivo.
2) Se E = {esseri umani} e D = {donne}, F ⊆ D × E definita
da (x, y) ∈ F quando x è madre di y, ovvero f : D → E dove
x è madre di f (x). Questa non è una applicazione in quanto
ci sono x che non sono madri di alcun elemento di E e vi
sono x che sono madri di più elementi di E.
3) f : E → D, definita da f (x) = madre di x, è una applicazione
infatti ogni essere umano x ha una ed una sola madre!
2
4) Sia f : N → Q definita da f (x) = xx+1+1
. Questa è una ap-
2 +1
plicazione in quanto per ogni naturale x, xx+1 è un numero
razionale (unico).
5) Consideriamo la precedente legge cambiando solamente il do-
minio o il codominio. Cosı̀ consideriamo f : Z → Q definita
2 +1
da f (x) = xx+1 . Questa non è una applicazione in quanto per
x = −1 non si ha alcun corrispondente.
6) Analogamente, consideriamo f : N → Z definita da f (x) =
x2 +1
x+1
. Questa non è una applicazione in quanto, per esempio
x = 2 non ha un corrispondente (in quanto in f (2) = 53 ∈/ Z).
24 CAPITOLO 1. TEORIA DEGLI INSIEMI

2
7) Sia f : Q \ {−1} → R definita da f (x) = xx+1+1
. Questa è una
applicazione in quanto per ogni razionale x diverso da −1,
x2 +1
x+1
è un numero razionale, quindi reale (unico).
2
8) Sia f : R+ → R definita da f (x) = xx+1 +1
. Questa è una
2 +1
applicazione in quanto per ogni numero reale positivo x, xx+1
è un numero reale (unico).

Nota che le applicazioni dell’Esempio 1.3.2 4), 7), 8), pur essendo
espresse dalla stessa legge, sono diverse tra loro perché differiscono
o per il dominio o per il codominio.
Vediamo adesso alcune proprietà di cui possono godere le fun-
zioni.
Intanto, Imf denoterà l’insieme delle immagini di A tramite f
ed è chiaramente un sottoinsieme del codominio B.

Definizione 1.3.3 Se f : A → B è una applicazione con Imf =


B, si dice che l’applicazione f è suriettiva; vale a dire che ogni
elemento di B proviene da qualche elemento di A.

Se f : A → B è una applicazione e b ∈ B, chiameremo con-


troimmagine di b il sottoinsieme di A dato da f −1 (b) = {x ∈
A | f (x) = b}. E più in generale se S ⊆ B la controimmagine di S
è f −1 (S) = {x ∈ A | f (x) ∈ S}.
Se f : A → B è una applicazione ed A0 ⊂ A, chiameremo
restrizione di f ad A0 l’applicazione definita dalla stessa legge ma
avente domino A0 e codominio B, cioè f|A0 : A0 → B.

Definizione 1.3.4 Se f : A → B è una applicazione tale che ele-


menti distinti di A hanno immagini diverse diremo che l’applica-
zione è iniettiva; in modo più formale, un’applicazione è iniettiva
se da f (x) = f (y) segue x = y.
1.3. FUNZIONI O APPLICAZIONI 25

Definizione 1.3.5 Una applicazione f : A → B che è tanto iniet-


tiva che suriettiva si dirà biiettiva.

Esempio 1.3.6

1) L’applicazione f : R → R+ 2 +
0 definita da f (x) = x (R0 insieme
dei reali non negativi) è suriettiva ma non iniettiva.
√ Infatti,
+
per ogni α ∈ R0 esiste un numero reale, β = α, tale f (β) =
β 2 = α. D’altra parte, anche f (−β) = α, quindi f non è
iniettiva.

2) L’applicazione f : N → N definita da f (x) = 5x non è su-


riettiva, in quanto le immagini sono tutte multiple di 5, ma è
iniettiva. Infatti, se f (x) = f (y), cioè 5x = 5y allora x = y.

3) L’applicazione f : E → E, (E l’insieme degli esseri umani)


definita da f (x) = madre di x, non è né iniettiva (più fra-
telli hanno la stessa madre) né suriettiva (non tutti gli esseri
umani sono madri).

4) L’applicazione f : N → 2N (2N insieme dei numeri pari)


definita da f (x) = 2x è biiettiva.

Se f : A → B è una applicazione biiettiva, allora, come detto,


per ogni b ∈ B nasce un unico elemento a ∈ A tale che f (a) = b;
allora, l’applicazione g : B → A definita da g(b) = a, con a tale che
f (a) = b si dirà l’inversa di f. L’inversa di f di solito si indica con
f −1 (osserviamo che il dominio di f −1 è il codominio della f ed il
codominio della f −1 è il dominio della f ).

Esempio 1.3.7 L’applicazione f : R− → R+ definita da f (x) = x2


(R+ insieme dei reali positivi e R− insieme dei reali negativi) è biiet-
tiva (verificare) e la sua
√ inversa f −1 : R+ → R− è l’applicazione
definita da f −1 (x) = − x.
26 CAPITOLO 1. TEORIA DEGLI INSIEMI

Per ogni insieme A si definisce la funzione identica 1A : A → A


mediante la legge 1A (x) = x per ogni x ∈ A. Se A ⊆ B si dirà
inclusione canonica l’applicazione iniettiva j : A → B definita
da j(a) = a per ogni a ∈ A.

Esempio 1.3.8 Vediamo come si comportano le applicazioni ri-


spetto all’unione ed all’intersezione di insiemi. Sia allora f : A →
B una applicazione e siano C ⊆ A, D ⊆ A, U ⊆ B, V ⊆ B
sottoinsiemi qualsiasi.
a) f (C ∪ D) = f (C) ∪ f (D);

b) f (C ∩ D) ⊆ f (C) ∩ f (D); se f è iniettiva allora vale l’ugua-


glianza;

c) f (f −1 (V )) ⊆ V ; se f è suriettiva allora vale l’uguaglianza;

d) f −1 (U ∪ V ) = f −1 (U ) ∪ f −1 (V );

e) f −1 (U ∩ V ) = f −1 (U ) ∩ f −1 (V ).
Verifichiamo a). Se x ∈ f (C ∪ D) segue x = f (a) per qualche
a ∈ C ∪ D; quindi a ∈ C o a ∈ D. Se a ∈ C allora x = f (a) ∈ f (C)
e quindi x ∈ f (C)∪f (D); se a ∈ D allora x = f (a) ∈ f (D) e quindi
x ∈ f (C) ∪ f (D). Viceversa, se x ∈ f (C) ∪ f (D), allora x ∈ f (C)
oppure x ∈ f (D). Se x ∈ f (C) allora x = f (c) per qualche c ∈ C e
quindi c ∈ C ∪ D ovvero x ∈ f (C ∪ D); se x ∈ f (D) allora x = f (d)
per qualche d ∈ D e quindi d ∈ C ∪ D ovvero x ∈ f (C ∪ D).

Verifichiamo b). Se x ∈ f (C ∩ D) segue x = f (a) per qualche a ∈


C ∩ D; quindi a ∈ C e a ∈ D, quindi x = f (a) ∈ f (C) e x = f (a) ∈
f (D) ovvero x ∈ f (C) ∩ f (D) per cui f (C ∩ D) ⊆ f (C) ∩ f (D).
Se adesso supponiamo f iniettiva, preso x ∈ f (C) ∩ f (D) ovvero
x ∈ f (C) e x ∈ f (D), questo implica che x = f (c) per qualche
c ∈ C e x = f (d) per qualche d ∈ D. Ma essendo f (c) = f (d) per
l’iniettività segue c = d quindi c = d ∈ C ∩ D. Allora x ∈ f (C ∩ D).
1.3. FUNZIONI O APPLICAZIONI 27

Verifichiamo c). Se x ∈ f (f −1 (V )) segue x = f (a) per qualche


a ∈ f −1 (V ), cioè f (a) ∈ V per cui x ∈ V. Se adesso supponiamo
f suriettiva, preso v ∈ V esiste un a ∈ A take che f (a) = v; ma
allora a ∈ f −1 (V ) cioè v ∈ f (f −1 (V ).

Verifichiamo d). Se x ∈ f −1 (U ∪ V ) segue f (x) ∈ U ∪ V quindi


f (x) ∈ U oppure f (x) ∈ V ; nel primo caso x ∈ f −1 (U ) e quin-
di x ∈ f −1 (U ) ∪ f −1 (V ); nel secondo caso x ∈ f −1 (V ) e quindi
x ∈ f −1 (U )∪f −1 (V ). Se ora x ∈ f −1 (U )∪f −1 (V ) allora x ∈ f −1 (U )
oppure x ∈ f −1 (V ), cioè f (x) ∈ U oppure f (x) ∈ V, per cui
x ∈ f −1 (U ∪ V ).

Verifichiamo e). Se x ∈ f −1 (U ∩ V ) segue f (x) ∈ U ∩ V quindi


f (x) ∈ U e f (x) ∈ V ovvero x ∈ f −1 (U ) ∩ f −1 (V ). Viceversa, se
x ∈ f −1 (U ) ∩ f −1 (V ) allora f (x) ∈ (U ) e f (x) ∈ V, cioè f (x) ∈
U ∩ V. In definitiva, x ∈ f −1 (U ∩ V ).

Supponiamo di avere un’applicazione f dall’insieme A all’insie-


me B e una seconda applicazione g che ha, invece, per dominio B
e per codominio C, cioè
f g
A → B → C.
In questa situazione possiamo costruire una nuova applicazione che
partendo dagli elementi di A restituisce come immagini elementi
dell’insieme C.
Tale applicazione, che chiameremo la composizione di f e g e
che indicheremo con g ◦ f : A → C si definisce mediante la legge
g ◦ f (a) = g(f (a)) per ogni a ∈ A.
È facile verificare che la composizione tra applicazioni è associa-
tiva, cioè, se f : A → B, g : B → C, h : C → D, allora (h ◦ g) ◦ f =
h ◦ (g ◦ f ). Infatti, [(h ◦ g) ◦ f ](a) = (h ◦ g)(f (a)) = h(g(f (a))) e
[h ◦ (g ◦ f )](a) = h((g ◦ f )(a)) = h(g(f (a))).
Supponiamo, ora, di avere una funzione biiettiva f : A → B,
ciò vuol dire, in base a quanto mostrato sopra, che esiste l’applica-
zione inversa f −1 : B → A, in tal caso possiamo considerare le due
28 CAPITOLO 1. TEORIA DEGLI INSIEMI

composizioni f −1 ◦ f : A → A e f ◦ f −1 : B → B. Ebbene, è facile


verificare che f −1 ◦ f = 1A e f ◦ f −1 = 1B . Inoltre, 1A ◦ f = f e
f ◦ 1B = f.
Vediamo il comportamento delle composizioni rispetto alla iniet-
tività, alla suriettività ed alla biiettiva.

f g
Proposizione 1.3.9 Siano A → B → C applicazioni, allora

1. se f e g sono iniettive allora g ◦ f è iniettiva;

2. se f e g sono suriettive allora g ◦ f è suriettiva;

3. se f e g sono biiettive allora g ◦ f è biiettiva;

4. se g ◦ f è iniettiva allora f è iniettiva;

5. se g ◦ f è suriettiva allora g è suriettiva;

6. se g ◦ f è biiettiva allora f è iniettiva e g è suriettiva.

Dimostrazione. Verifichiamo 1. Supponiamo che (g ◦ f )(x) =


(g ◦ f )(y), cioè g(f (x)) = g(f (y)); allora, per la iniettività di g si
ha f (x) = f (y), cosı̀ per la iniettività di f segue x = y.

Verifichiamo 2. Sia c ∈ C un qualsiasi elemento di C, per la su-


riettività di g esiste b ∈ B tale che g(b) = c. D’altra parte, per la
suriettività di f, esiste a ∈ A tale che f (a) = b. Cosı̀ (g ◦ f )(a) =
g(f (a)) = g(b) = c per cui g ◦ f è suriettiva.

La 3. segue da 1. e 2.

Verifichiamo la 4. Sia f (x) = f (y) allora g(f (x)) = g(f (y)) ovvero
(g ◦f )(x) = (g ◦f )(y), quindi per la iniettività di (g ◦f ) segue x = y.

Verifichiamo la 5. Sia c ∈ C, per la suriettività di g ◦ f esiste


a ∈ A tale che (g ◦ f )(a) = c; allora posto b = f (a), avremo
1.3. FUNZIONI O APPLICAZIONI 29

g(b) = g(f (a)) = c per cui g è suriettiva.

La 6. segue da 4. e 5.

Proposizione 1.3.10 Siano f : A → B e g : B → A applicazioni


tali che g ◦ f = 1A e f ◦ g = 1B , allora f e g sono biiettive ed
inoltre f = g −1 e g = f −1 . In particolare, (f −1 )−1 = f e (g ◦ f )−1 =
f −1 ◦ g −1 .

Dimostrazione. Da g ◦ f = 1A biiettiva segue f iniettiva e g


suriettiva; da f ◦ g = 1B , biiettiva segue g iniettiva e f suriettiva.
Cosı̀ f e g sono entrambe biiettive. Ora, da g ◦ f = 1A segue
g −1 ◦ (g ◦ f ) = g −1 ◦ 1A , cioè (g −1 ◦ g) ◦ f = g −1 , ovvero 1B ◦ f = g −1 ,
in definitiva f = g −1 . Ed analogamente, g = f −1 . Il resto della
proposizione consiste di banali conseguenze della prima parte.

Se A e B sono due insiemi, nel seguito indicheremo con B A (o


talvolta Hom(A, B)) l’insieme di tutte le applicazioni da A in B.
30 CAPITOLO 1. TEORIA DEGLI INSIEMI
Capitolo 2

Insiemi numerici

2.1 Numeri naturali


L’esigenza di costruire “insiemi numerici” è antica quanto l’uomo.
In effetti, una delle prime attività dell’uomo fu quella di “contare”
sicché il primo insieme numerico di cui si sente la necessita è quello
dei numeri naturali, N, costruito proprio per permettere di “conta-
re”. Ma ovviamente non tutti i problemi si riducono a contare. Per
esempio si ha talvolta la necessità di togliere da un numero natu-
rale un numero più grande (se dal proprio conto corrente si preleva
più di quanto si ha, oppure la temperatura da 7 gradi C. si abbas-
sa di ben 10 gradi, ecc.). Allora occorre un insieme numerico più
grande che comprenda numeri che consentano di risolvere questio-
ni come quelle appena descritte. Per cui si costruiscono i numeri
interi relativi, Z. Ma se bisogna dividere in parti uguali 10 caramel-
le a 3 bambini, i numeri interi a disposizione non sono sufficienti
a descrivere quante caramelle bisogna dare a ciascun bambino. Si
costruiscono allora i numeri razionali, cioè le cosiddette frazioni, Q.
Altre esigenze poi, quali dover confrontare (o misurare) segmenti
non commensurabili, portano alla costruzione dei numeri reali, R,
ed infine dei numeri complessi, C.
Un altro modo, più formale, di illustrare l’esigenza di costruire
insiemi numerici sempre più completi è quella di cercare le solu-

31
32 CAPITOLO 2. INSIEMI NUMERICI

zioni di equazioni algebriche, cioè del tipo f (x) = 0 dove f (x) è


un polinomio nella indeterminata x. Cosı̀, ad esempio l’equazione,
x = 1 ha la soluzione 1 (nell’insieme dei numeri naturali), mentre
l’equazione x + 2 = 0 non ha soluzioni in N ma la soluzione −2
in Z. Ed ancora, l’equazione 2x = 3 non ha soluzioni né in N né
in Z, ma la soluzione 23 in Q. Poi, l’equazione x2 = 2 non ha so-

luzioni in N, Z e Q, ma ha 2 soluzioni, ± 2 in R. E per finire,
2
l’equazione x√ + 2 = 0 non ha soluzioni in N, Z, Q, ed R, ma ha 2
soluzioni, ±i 2 in C. Per mettere assieme tutto quanto detto, se
consideriamo l’equazione (algebrica)

2x7 − x6 − 7x5 + 6x4 − 8x3 + 4x2 + 28x − 24 = 0,

e ne ricercassimo le soluzioni, dovremmo dire che

in N ha una sola soluzione: 1;

in Z ha due soluzioni: 1, −2;

in Q ha tre soluzioni: 1, −2, 23 ;


√ √
in R ha cinque soluzioni: 1, −2, 23 , + 2, − 2;
√ √ √ √
in C ha sette soluzioni: 1, −2, 32 , + 2, − 2, +i 2, −i 2.

Notiamo che in C le soluzioni sono 7 proprio quanto il grado dell’e-


quazione: non sarà un caso!
In questo capitolo, ci occuperemo della definizione e delle fon-
damentali proprietà degli insiemi numerici di cui abbiamo fatto
cenno.
Per definire l’insieme dei numeri naturali, useremo l’assiomatiz-
zazione di Peano, che per costruire l’insieme dei numeri naturali e,
conseguentemente, l’aritmetica utilizzò soltanto tre assiomi.
Sia allora N un insieme che goda di queste tre proprietà:

1) Esiste una applicazione iniettiva s : N → N; l’immagine di un


elemento n ∈ N, cioè s(n) si chiama il successivo di n.
2.1. NUMERI NATURALI 33

2) N \ im(s) possiede un unico elemento che sarà indicato (se-


condo Peano) con 0 (in particolare s non è suriettiva).

3) Vale il principio di induzione, cioè: se U ⊆ N è tale che

a) 0 ∈ U (base dell’induzione);
b) se u ∈ U (ipotesi induttiva) allora s(u) ∈ U ;

allora U = N.

Ebbene, partendo da questi tre semplici assiomi (e in quanto


tali sono proprietà che non si dimostrano) si riesce a costruire tutta
l’aritmetica.
L’insieme N che gode delle tre proprietà suddette sarà detto
l’insieme dei numeri naturali.
Per ritrovare l’usuale simbologia dei numeri naturali basta porre
1 = s(0) (cioè il successivo di 0), 2 = s(1) = s(s(0)), 3 = s(2), e
cosı̀ via.
Notiamo che il secondo assioma ci assicura che 0 è l’unico nu-
mero naturale a non essere successivo di alcun numero.
Vediamo alcune applicazioni del principio di induzione. Il prin-
cipio di induzione è un valido aiuto quando si voglia dimostrare la
validità di una proprietà per tutti i numeri naturali. Ovviamente
provare la data proprietà per ciascun numero naturale è una cosa
improponibile dal momento che N è un insieme infinito.
Sia P (n) una proprietà che vogliamo provare per ogni numero
naturale n: allora si prova la proprietà per n = 0 (il discorso si
può generalizzare provando la proprietà per il più piccolo naturale
n per cui vogliamo provare la proprietà), indi si suppone vera la
proprietà per un certo u e la si prova per s(u) (che come vedremo
sarà u + 1). A questo punto, per il principio di induzione la P (n)
sarà vera per ogni numero naturale n.
Analogamente, uno può usare il principio di induzione per co-
struire oggetti {cn } per ogni numero naturale n. Anche in tal caso,
si costruisce dapprima c0 e poi, supposto di aver costruito cu , si
34 CAPITOLO 2. INSIEMI NUMERICI

costruisce cu+1 . Il principio di induzione ci assicura allora di aver


costruito cn per ciascun n ∈ N.

Esempio 2.1.1 Vogliamo provare che la somma dei primi n nu-


2
meri naturali vale n 2+n .
Base dell’induzione: per n = 1 ⇒ 1 = 1+1 2
;
2
Ipotesi induttiva: supposto che 1 + 2 + · · · + u = u 2+u , proviamo
2
che 1 + 2 + · · · + u + (u + 1) = (u+1) 2+(u+1) . Infatti,

u2 + u u2 + u + 2u + 2
1 + 2 + · · · u + (u + 1) = + (u + 1) = =
2 2
(u + 1)2 + (u + 1)
= .
2

Esempio 2.1.2 Vogliamo provare che per ogni n > 3 si ha n! > 2n .


Base dell’induzione: per n = 4 ⇒ 24 = 4! > 24 = 16.
Facciamo l’ipotesi induttiva: supponiamo cioè che u! > 2u , per
u > 4, e proviamo che (u + 1)! > 2u+1 . Ed infatti, (u + 1)! =
(u + 1)u! > (u + 1)2u > 2 · 2u = 2u+1 .

Esempio 2.1.3 Vogliamo provare che la somma dei primi n nu-


meri naturali dispari è n2 .
Base dell’induzione: per n = 1 banalmente 1 = 12 .
Ipotesi induttiva: supponiamo che essa valga per un certo u, vale
a dire che 1 + 3 + · · · + (2u − 1) = u2 , e dimostriamo che vale per
u + 1, cioè che

1 + 3 + · · · + (2u − 1) + (2u + 1) = (u + 1)2 ;

ed infatti, [1+ 3+ · · · +(2u − 1)]+ (2u +1) = u2 +(2u +1) = (u +1)2


2.1. NUMERI NATURALI 35

Esempio 2.1.4 Voglio dimostrare per ogni numero naturale n

13 + 23 + · · · + n3 = (1 + 2 + · · · + n)2

cioè la somma dei primi n cubi è pari al quadrato della somma dei
primi n numeri.
Base dell’induzione: per n = 1 la proprietà è banale 13 = 12 .
Ipotesi induttiva: supponiamo che essa sia vera per u e provia-
mola per u + 1. Allora

[13 + 23 + · · · + u3 ] + (u + 1)3 = (1 + 2 + · · · + u)2 + (u + 1)3

ma ora osserviamo che


u2 + u
(u + 1)2 + 2(u + 1)(1 + 2 + · · · + u) = (u + 1)[(u + 1) + 2 ]=
2
(u + 1)(u + 1)2 = (u + 1)3 .
Quindi,

[13 + 23 + · · · + u3 ] + (u + 1)3 = (1 + 2 + · · · + u)2 + (u + 1)3 =

(1+2+· · ·+u)2 +(u+1)2 +2(u+1)(1+2+· · ·+u) = (1+2+· · ·+u+u+1)2

Esempio 2.1.5 Voglio dimostrare per ogni numero naturale n

20 + 21 + 22 · · · + 2n = 2n+1 − 1

cioè la somma delle potenze di 2 sino ad n è la successiva potenza


diminuita di 1.
Base dell’induzione: per n = 0 la proprietà è banale 20 = 21 − 1.
Ipotesi induttiva: supponiamo che essa sia vera per u, cioè 20 +
21 + 22 · · · + 2u = 2u+1 − 1 e proviamola per u + 1. Allora

[20 +21 +22 · · ·+2u ]+2u+1 = 2u+1 −1+2u+1 = 2·2u+1 −1 = 2u+2 −1.
36 CAPITOLO 2. INSIEMI NUMERICI

Questo risultato risponde alla seguente questione: se su una prima


scacchiera, 8×8, si mettono 1 centesimo nella prima casella, 2 nella
seconda, 22 = 4 nella terza, sino a 263 centesimi nella 64−esima;
mentre su una seconda scacchiera, 8 × 8, si mettono 2 centesimi
nella prima casella, 22 = 4 nella seconda, 23 = 8 nella terza, sino
a 264 centesimi nella 64−esima; è superiore la somma contenuta
in tutta la prima scacchiera o quella contenuta nell’ultima casella
della seconda scacchiera? Alla luce di quanto appena provato, po-
tremo concludere che nella prima scacchiera vi è complessivamente
una somma inferiore di 1 centesimo rispetto a quanto contenuto
nell’ultima casella della seconda scacchiera.

Esempio 2.1.6 Voglio dimostrare che se A è un insieme con n


elementi allora P(A) ha 2n elementi, per ogni numero naturale n.
Infatti, se A ha n = 0 elementi allora A = ∅ e quindi P(A) = {∅} ha
un unico elemento, cioè 20 = 1. Supponiamo ora che ogni insieme B
con u elementi è tale che P(B) ha 2u elementi, e sia A un insieme
con s(u) = u+1 elementi. Sia a ∈ A un dato elemento, allora P(A)
è formato dai sottoinsiemi di A che non contengono a e quelli che
invece contengono a. Ma i sottoinsiemi di A che non contengono
a sono tutti i sottoinsiemi di A \ {a} e poiché quest’ultimo ha u
elementi, per l’ipotesi induttiva tutti questi sottoinsiemi sono 2u .
Ma d’altra parte, quelli che contengono a sono ottenuti da quelli
senza a aggiungendo proprio a, quindi sono in numero uguale a
quelli privi di a. In definitiva, il numero di sottoinsiemi di A è
2u + 2u = 2 · 2u = 2u+1 .
Passiamo adesso a definire le operazioni su N.
Prima però occorre chiarire cosa si intende per operazione (bi-
naria) su un insieme A.
Una operazione binaria su un insieme A non è nient’altro che
una applicazione ϕ : A × A → A. In generale, l’immagine di una
coppia (a, b) si indica con a ∗ b oppure con a · b o ancora a + b.
Nota che la usuale “sottrazione” sui numeri naturali non è una
operazione in quanto, ad esempio, la coppia (5, 7) non ha alcun
2.1. NUMERI NATURALI 37

corrispondente in N (ovviamente sarebbe −2); mentre essa è una


operazione su Z. In modo analogo la usuale “divisione” non è una
operazione in Q, in quanto, ad esempio la coppia (3, 0) non ha
corrispondente; mentre essa è una operazione su Q∗ (razionali non
nulli).
Allora cominciamo a definire l’addizione in N e facciamo ciò
usando l’induzione.
Volendo definire per ogni coppia di interi m, n ∈ N un intero,
che indicheremo con m + n, possiamo usare induzione su n.
- Cosı̀ definiamo m + 0 := m (base dell’induzione)
- e supposto noto m+u (ipotesi induttiva), definiamo m+s(u) :=
s(m + u).
Cosı̀, ad esempio m + 1 = m + s(0) := s(m + 0) = s(m), per cui
m + 1 non è altro che quello che abbiamo chiamato in precedenza
il successivo di m. Analogamente, m + 2 = m + s(1) = s(m + 1) =
s(s(m)), e cosı̀ via, per induzione abbiamo definito m + n per ogni
coppia di numeri naturali m, n.
Vediamo alcune proprietà di cui gode l’addizione in N.

1) Proprietà associativa: per ogni m, n, p ∈ N ⇒ (m + n) + p =


m + (n + p).

2) Proprietà commutativa: per ogni m, n ∈ N ⇒ m + n = n + m.

3) Legge di cancellazione: per ogni m, n, p ∈ N, m = n ⇔ m +


p = n + p.

A titolo di verifica, proviamo la prima di queste proprietà. Poiché


vogliamo provare che per ogni m, n, p ∈ N si ha (m + n) + p =
m + (n + p), consideriamo questa proprietà in funzione di p, P(p)
e quindi lavoriamo per induzione su p.
Base dell’induzione: per p = 0 la proprietà da provare è (m +
n) + 0 = m + (n + 0), che risulta banale in quanto per definizione
(m + n) + 0 = m + n e m + (n + 0) = m + n.
Ipotesi induttiva: supposta vera (m + n) + u = m + (n + u),
si tratta di provare che (m + n) + s(u) = m + (n + s(u)). Allora,
38 CAPITOLO 2. INSIEMI NUMERICI

(m + n) + s(u) = s((m + n) + u) = s(m + (n + u)) = m + s(n + u) =


m + (n + s(u)).
Anche per la seconda operazione che si definisce su N, il pro-
dotto o moltiplicazione, che si indica m · n per ogni m, n ∈ N,
si può costruire il numero m · n per induzione su n.
- Cosı̀ definiamo m · 0 := 0 (base dell’induzione)
- e supposto noto m · u (ipotesi induttiva), definiamo m · s(u) :=
m · u + m.
Cosı̀ ad esempio: m · 1 = m · s(0) = m · 0 + m = 0 + m =
m + 0 = m. Si noti che 1 si comporta rispetto al prodotto come lo
0 si comportava per l’addizione, cioè lascia invariato l’elemento con
cui viene moltiplicato. Si dice pertanto che 1 è l’elemento neutro
per il prodotto, cosı̀ come 0 è l’elemento neutro della addizione.
Vediamo adesso alcune proprietà di cui gode il prodotto in N.

1’) Proprietà associativa: per ogni m, n, p ∈ N ⇒ (m · n) · p =


m · (n · p).

2’) Proprietà commutativa: per ogni m, n ∈ N ⇒ m · n = n · m.

3’) Legge di cancellazione: per ogni m, n, p ∈ N, e p 6= 0, m = n


⇔ m · p = n · p.

4) Proprietà distributiva del prodotto rispetto all’addizione: per


ogni m, n, p ∈ N ⇒ (m + n) · p = m · p + n · p.

Passiamo adesso a definire su N una relazione d’ordine, che sarà


nel seguito indicata come la relazione d’ordine usuale.
Dati due numeri naturali m, n, diremo che m è minore o eguale
ad n, e scriveremo m ≤ n se esiste un numero naturale x tale che
m + x = n.
È facile verificare che tale relazione è riflessiva, antisimmetrica e
transitiva e quindi si tratta di una relazione d’ordine. In effetti, pro-
veremo molto di più: ovvero l’insieme p.o. (N, ≤) è ben ordinato,
cioè ogni suo sottoinsieme non vuoto U possiede il minimo.
In particolare, N stesso ammette minimo, chiaramente lo 0. Os-
serviamo che questa proprietà è tipica di N, vedremo infatti che gli
2.2. DIVISIBILITÀ NEI NUMERI NATURALI 39

altri insiemi numerici che incontreremo, quali ad esempio Z, Q, R,


ecc. non soddisfano più tale proprietà.
Sia allora U ⊆ N un sottoinsieme non vuoto e consideriamo
l’insieme di tutti i suoi minoranti in N: M = {x ∈ N | x ≤ u ∀ u ∈
U }. Osserviamo questi due semplici fatti:

a. 0 ∈ M in quanto 0 ≤ n per ogni n ∈ N e quindi anche per


ogni u ∈ U.

b. M 6= N in quanto, visto che U è non vuoto, preso un u ∈ U


il suo successivo, ovvero s(u) = u + 1 non può essere un
minorante di U perché u + 1 non è minore o eguale ad u (in
effetti è maggiore di u), quindi s(u) ∈
/ M.

Queste due osservazioni permettono di dedurre che non può va-


lere su M la seconda condizione richiesta dal principio di induzione
(altrimenti M coinciderebbe con N). Ma negare questa seconda
condizione significa che esiste un m ∈ M tale che s(m) ∈ / M. Voglio
dimostrare, a tal punto, che tale m è il richiesto minimo di U, cioè
m ∈ U tale che m ≤ u per ogni u ∈ U. Dal fatto che m è un mino-
rante di U la seconda richiesta è verificata, resta da controllare che
m ∈ U. Ragioniamo, allora, per assurdo, supponendo quindi che
m∈ / U ; dal fatto che m ≤ u per ogni u ∈ U segue allora che m < u
(con l’ovvio significato) per ogni u ∈ U per cui s(m) ≤ u per ogni
u ∈ U ; ovvero s(m) è un minorante di U per cui s(m) ∈ M contro
l’ipotesi su m. Questo ci porta alla conclusione che m ∈ U e che
quindi ne è il suo minimo.

2.2 Divisibilità nei numeri naturali


In N∗ = N \ {0} si definisce un’altra relazione d’ordine “la divisibi-
lità”.
Se m, n ∈ N∗ sono naturali non nulli, si dice che m divide n, e
si indica m|n, se esiste un numero naturale q per cui n = mq. Tale
relazione di divisibilità si dimostra essere una relazione d’ordine,
40 CAPITOLO 2. INSIEMI NUMERICI

cioè gode delle proprietà riflessiva, antisimmetrica e transitiva, ma


chiaramente tale relazione non è totale in quanto ad esempio è falso
sia che 5|7 sia che 7|5.
Nota che se m|n ed n|m si ha m = n (nel seguito due ‘numeri’
con tale proprietà si diranno associati). Infatti, da m|n segue
n = mq, mentre da n|m segue m = nq 0 ; quindi n = nqq 0 ovvero
qq 0 = 1. Ma in N la precedente eguaglianza implica q = q 0 = 1.

Definizione 2.2.1 Dati due numeri naturali non nulli a, b ∈ N∗


si definisce massimo comune divisore tra a e b, e scriveremo
M CD(a, b) = d, un numero naturale d tale che

i) d divide sia a che b;

ii) se d0 è un altro numero naturale che divide sia a che b allora


d0 divide d.

Naturalmente, a priori, non è detto che un siffatto numero esista.


Tuttavia, se esistono due di siffatti numeri d1 e d2 dovranno essere
associati, quindi coincidere. Infatti, dalla definizione applicata sia
a d1 che a d2 si ha che d1 divide d2 e viceversa d2 divide d1 per cui
essi sono associati e quindi d1 = d2 .
Euclide fu il primo a trovare un algoritmo che riuscisse a pro-
durre il M CD(a, b) in N provandone cosı̀ l’esistenza (non ovvia in
altri insiemi numerici).
Abbiamo bisogno dapprima di una proprietà di N nota come
algoritmo di divisione.

Proposizione 2.2.2 (Algoritmo di divisione) Se a, b ∈ N, b 6=


0, allora esistono q, r ∈ N (“quoziente” e “resto”) tali che a = bq+r
con r < b.

Dimostrazione. Sia T = {x ∈ N | bx > a}; si tratta di un


sottoinsieme di N, non vuoto, in quanto contiene almeno a + 1.
Allora, per il buon ordinamento di N, T possiede il minimo q 0 ,
2.2. DIVISIBILITÀ NEI NUMERI NATURALI 41

che sarà certamente diverso da 0 in quanto 0 ∈ / T. Quindi q 0 è il


successivo di un numero naturale, diciamo q, ovvero q 0 = q + 1. Per
costruzione q ∈ / T, in definita bq ≤ a per cui esiste un r ∈ N tale
che a = bq + r. Per concludere resta da provare che r < b. Infatti,
da q 0 ∈ T segue (q + 1)b > a ovvero esiste un naturale non nullo z
tale che qb + b = a + z; per cui sostituendo si ha qb + b = bq + r + z
e dalla legge di cancellazione b = r + z, cioè b > r.

Osservazione 2.2.3 Osserviamo che il quoziente ed il resto trovati


nell’algoritmo di divisione tra a e b sono unici. Infatti, se fosse
a = bq + r con r < b e a = bq 0 + r0 con r0 < b, e fosse q 6= q 0 ,
diciamo q < q 0 , si avrebbe bq + r = a = bq 0 + r0 con q 0 = q + h con
h > 0. Per cui avremmo bq + r = b(q + h) + r0 da cui r = bh + r0 , ma
essendo h > 0 si otterrebbe r ≥ b contro il fatto che r < b. Per cui
possiamo concludere che q = q 0 . Ma da quest’ultima uguaglianza e
da bq + r = a = bq 0 + r0 per cancellazione avremo r = r0 .

Euclide sfruttò proprio questa proprietà per costruire il suo


algoritmo.

Proposizione 2.2.4 (Algoritmo Euclideo) Siano a, b ∈ N∗ , con-


sideriamo le seguenti divisioni successive.

a = bq1 + r1 , con r1 < b, e se r1 6= 0,

b = r1 q2 + r2 , con r2 < r1 , e se r2 6= 0,

r1 = r2 q3 + r3 , con r3 < r2 , e se r3 6= 0,

··· ··· ···

··· ··· ···

rn−2 = rn−1 qn + rn , con rn < rn−1 , e se rn 6= 0,


42 CAPITOLO 2. INSIEMI NUMERICI

rn−1 = rn qn+1 ;

Allora rn (ultimo resto non nullo) è il cercato massimo comune


divisore.

Dimostrazione. Euclide osservò che tale procedura ha termine


in quanto r1 < b, r2 < r1 , ecc. per cui dopo al più b divisioni suc-
cessive il resto deve essere 0. Per provare che tale rn è il M CD(a, b)
cominciamo ad osservare che dall’ultima eguaglianza segue rn |rn−1 ;
dalla penultima segue che rn |rn−2 ; cosı̀ risalendo dalla terza deduco
rn |r1 , dalla seconda rn |b ed infine dalla prima rn |a. In definitiva,
rn soddisfa la prima condizione richiesta dal M CD(a, b). D’altra
parte, se d è un divisore comune ad a e b dalla prima divisione
deduciamo che d|r1 , quindi dalla seconda deduciamo d|r2 e dalla
terza d|r3 , cosı̀ continuando quando arriveremo all’ultima divisione
troveremo che d|rn e la seconda condizione per il M CD(a, b) resta
verificata. Per cui rn = M CD(a, b).

Esempio 2.2.5 Consideriamo 72 e 750 ed applichiamo l’algoritmo


euclideo

750 = 72 · 10 + 30,

72 = 30 · 2 + 12,

30 = 12 · 2 + 6,

12 = 6 · 2

quindi M CD(750, 72) = 6.


2.3. CENNI DI CALCOLO COMBINATORICO 43

2.3 Cenni di calcolo combinatorico


Adesso che abbiamo a disposizione l’insieme dei numeri naturali
e le due operazioni di addizione e moltiplicazione definite su esso,
possiamo affrontare un primo problema che riguarda la possibilità
di contare certi enti. Per introdurre l’argomento indichiamo alcune
situazioni in cui dobbiamo far uso di un tale tipo di conto.

Esempio 2.3.1 1) Quante parole (anche prive di senso) sono for-


mate da 4 lettere distinte dell’alfabeto italiano (21 lettere)?
2) Quanti sottoinsiemi di 3 elementi ci sono in un insieme di 10
elementi?

Per rispondere a queste semplici domande diamo le seguenti


definizioni.

Definizione 2.3.2 Sia X un insieme con n elementi e k un nu-


mero naturale con 1 ≤ k ≤ n; diremo disposizione di n oggetti in
k posti una k-upla di elementi distinti di X, ovvero un elemento del
tipo (x1 , . . . , xk ) con xi ∈ X, e xi 6= xj per i 6= j. Una disposizione
di n oggetti in n posti si dirà permutazione.

Data la precedente definizione, porremo Dn,k il numero di di-


sposizioni di n oggetti in k posti. Ed in particolare, Dn,n = Pn il
numero di permutazioni su n oggetti.
Nel seguito indicheremo con n! (n fattoriale) il prodotto di tutti i
numeri naturali non nulli minori o eguali ad n. (Nel seguito porremo
0! = 1)

Proposizione 2.3.3 Siano 1 ≤ k ≤ n due numeri naturali, allora


n!
Dn,k = = n(n − 1) · . . . · (n − k + 1)
(n − k)!

Dimostrazione. Lavoriamo per induzione (finita) su k, chiunque


n!
sia n ≥ k. Per k = 1 si tratta di provare che Dn,1 = (n−1)! = n
e ciò è banale in quanto si tratta di contare quanti elementi ci
44 CAPITOLO 2. INSIEMI NUMERICI

sono in un insieme con n elementi. Supponiamo allora che Dn,k =


n! n!
(n−k)!
e verifichiamo che Dn,k+1 = (n−k−1)! . Ora, osservato che se
ad una disposizione di n oggetti in k posti mettiamo come (k + 1)-
esimo elemento uno dei rimanenti (n − k) elementi dell’insieme di n
oggetti, osservato che in tale maniera si ottengono tutte disposizioni
distinte e che ogni disposizione su k + 1 posti si può ottenere in
questa maniera, avremo

n! n!
Dn,k+1 = Dn,k · (n − k) = · (n − k) =
(n − k)! (n − k − 1)!

Corollario 2.3.4 Per ogni n si ha Pn = n!.

La precedente proposizione ci permette di calcolare facilmente


il numero richiesto nel punto 1) dell’Esempio 2.3.1. In questo caso
l’insieme di oggetti è composto dalle 21 lettere dell’alfabeto italiano
mentre k è il numero di lettere che compongono una singola parola,
cioè k = 4. Per cui si tratta di calcolare D21,4 , quindi

21!
D21,4 = = 21 · 20 · 19 · 18 = 143.640
17!

Definizione 2.3.5 Sia X un insieme con n elementi e k un nu-


mero naturale con 1 ≤ k ≤ n; diremo combinazione di n oggetti
in k posti un sottoinsieme di X composto da k elementi di X.

Data la precedente definizione, porremo Cn,k il numero di dispo-


sizioni di n oggetti in k posti.

Proposizione 2.3.6 Siano 1 ≤ k ≤ n due numeri naturali, allora

n! n(n − 1) · . . . · (n − k + 1)
Cn,k = = .
k!(n − k)! k!
2.3. CENNI DI CALCOLO COMBINATORICO 45

Dimostrazione. La prova è piuttosto elementare una volta che


uno osserva che per ottenere tutte le disposizioni di n oggetti in k
posti basta prendere tutte le combinazioni di n oggetti in k posti e
operare tutte le permutazioni su ciascuna combinazione. Per cui

Dn,k = Cn,k · Pk ,

e quindi

n! n(n − 1) · . . . · (n − k + 1)
Cn,k = Dn,k /Pk = = .
k!(n − k)! k!

Nel seguito porremo


 
n n! n(n − 1) · . . . · (n − k + 1)
= =
k k!(n − k)! k!

e tale numero sarà detto coefficiente binomiale.


La precedente proposizione ci permette di calcolare facilmente
il numero richiesto nel punto 2) dell’Esempio 2.3.1. In questo caso
si tratta di calcolare C10,3 , quindi
 
10 10! 10 · 9 · 8
C10,3 = = = = 120.
3 3!7! 6

Notiamo che, dalla definizione stessa, segue la seguente eguaglianza


   
n n
=
k n−k
La prossimaapplicazione giustifica il nome di coefficiente bino-
miale dato a nk .

Binomio di Newton.
Molti ricordano, per averli studiato nelle scuole superiori, il
quadrato e il cubo di un binomio: (a + b)2 = a2 + 2ab + b2 e
46 CAPITOLO 2. INSIEMI NUMERICI

(a+b)3 = a3 +3a2 b+3ab2 +b3 . Adesso vorremmo generalizzare que-


sti risultati al caso della n-esima potenza di un binomio. Proviamo
allora che per ogni n
n  
n
X n n−i i
(a + b) = a b
i=0
i

Poiché per n = 2 e n = 3 il risultato è noto, per induzione, basta


provare che
u   u+1  
u
X u u−i i u+1
X u + 1 u+1−i i
(a + b) = a b ⇒ (a + b) = a b.
i=0
i i=0
i

Ed infatti,
u  
u+1 u
X u u−i i
(a + b) = (a + b) (a + b) = a b (a + b) =
i=0
i
u   u  
X u u+1−i i X u u−i i+1
a b + a b =
i=0
i i=0
i
u   u+1  
X u u+1−i i X u
= a b + au−j+1 bj
i=0
i j=1
j − 1
avendo posto nella seconda sommatoria j = i − 1. Per cui
u   u  
u+1 u+1
X u u+1−i i X u
(a + b) =a + a b + au−j+1 bj + bu+1
i=1
i j=1
j − 1

e quindi
u    
u+1 u+1
X u u
(a + b) =a + + au+1−i bi + bu+1
i=1
i i−1
ma
   
u u u! u!
+ = + =
i i−1 i!(u − i)! (i − 1)!(u − i + 1)!
2.4. CARDINALITÀ DI UN INSIEME 47
   
u! 1 1 u+1
+ =
(i − 1)!(u − i)! i u−i+1 i
per cui
u   u+1  
u+1 u+1
X u + 1 u+1−i i u+1 X u + 1 u+1−i i
(a+b) =a + a b +b = a b.
i=1
i i=0
i

Cosı̀, ad esempio

(x + y)7 = a7 + 7a6 b + 21a5 b2 + 35a4 b3 + 35a3 b4 + 21a2 b5 + 7ab6 + b7 .

Avverto che i concetti di disposizione e combinazione si possono


generalizzare ammettendo che gli elementi che le compongono pos-
sano non essere distinti. In tal caso si parlerà di disposizione con
ripetizione e combinazione con ripetizione. Ovviamente, anche il
numero di siffatte disposizioni o combinazioni si può calcolare, ma
ciò esula dai compiti del nostro corso e quindi si rimanda a testi
specifici questa trattazione.

2.4 Cardinalità di un insieme


La conoscenza dei numeri naturali permette di dare in modo cor-
retto il concetto di insieme finito e infinito. Per fare ciò, preso un
numero naturale n indicheremo con n = {0, 1, 2 . . . , n − 1} (ovvia-
mente 0 è l’insieme vuoto). Possiamo pensare ad n come ad un
insieme “campione” contenente n elementi. A questo punto, un in-
sieme A lo diremo finito se esiste un numero naturale n tale che A
si può porre in corrispondenza biiettiva con l’insieme campione n.
In tal caso, più precisamente, diremo che A è finito di cardinalità
o potenza n (ovvero che in A vi sono esattamente n elementi). A
questo punto è facile definire infinito un insieme che non è finito.
48 CAPITOLO 2. INSIEMI NUMERICI

Nota che la definizione di insieme finito è stata data in questo


modo perché essa si presta bene ad essere generalizzata al caso di
insiemi infiniti.

Definizione 2.4.1 Due insiemi si dicono equipotenti se hanno la


stessa potenza, vale a dire se esiste un’applicazione biiettiva tra i
due insiemi. In tal caso scriveremo |A| = |B|.

Si può provare facilmente che un insieme è finito se e solo se non


è equipotente ad alcun suo sottoinsieme proprio (cioè diverso da
tutto l’insieme). In effetti, si può provare che un modo equivalente
di definire un insieme infinito è quello per cui un insieme è infinito
se e solo se è equipotente ad un suo sottoinsieme proprio.

Definizione 2.4.2 Più in generale diremo che A ha potenza mi-


nore o eguale a B, e scriveremo |A| ≤ |B|, se esiste un’applicazione
iniettiva da A in B. Ed ancora, diremo che A ha potenza minore di
B, e scriveremo |A| < |B|, se esiste un’applicazione iniettiva da A
in B e non ne esiste una suriettiva (e quindi neanche una biiettiva).
Ovviamente |B| ≥ |A| significa |A| ≤ |B|, e quindi che esiste una
applicazione suriettiva da B in A.

Ad esempio, se consideriamo i numeri naturali N e il suo sot-


toinsieme proprio 2N, cioè l’insieme dei numeri pari, essi sono equi-
potenti in quanto si può stabilire tra essi la seguente corrispondenza
biiettiva: f : N → 2N definita da f (n) = 2n.
Si potrebbe pensare che due insiemi infiniti si possano sempre
mettere in corrispondenza biiettiva. Ma ciò non è affatto vero come
mostra la seguente proposizione.

Proposizione 2.4.3 Sia A un qualsiasi insieme e P(A) l’insieme


delle sue parti. Allora |A| < |P(A)|.
2.4. CARDINALITÀ DI UN INSIEME 49

Dimostrazione. Ovviamente, se |A| = n, allora abbiamo visto


che |P(A)| = 2n (vedi Esempio 2.1.6) e quindi, essendo n < 2n , si
ha |A| < |P(A)|. Nel caso infinito bisogna provare che esiste una
iniettività tra A e P(A), ma non esiste una suriettività.
Ora, per ogni a ∈ A definiamo f (a) = {a} ∈ P(A), cioè l’imma-
gine di a è il sottoinsieme di A formato solo da a. È facile vedere
che tale applicazione f : A → P(A) è iniettiva.
Adesso supponiamo per assurdo che esista una suriettività tra i
due insiemi, cioè un’applicazione suriettiva ϕ : A → P(A). Consi-
deriamo il seguente sottoinsieme di A:

B = {x ∈ A | x ∈
/ ϕ(x)}

Ma B, in quanto sottoinsieme di A, è elemento di P(A), cioè B ∈


P(A). Poiché abbiamo supposto che ϕ è suriettiva, deve esistere un
y ∈ A tale che ϕ(y) = B.
Ma allora, vediamo se y ∈ B oppure y ∈ / B. Se y ∈ B, allora
y ∈/ ϕ(y) ovvero y ∈ / B; una contraddizione. Se y ∈ / B, allora
y ∈ ϕ(y) ovvero y ∈ B; un’altra contraddizione. In definitiva per y
sarebbe falso affermare sia che stia sia che non stia in B, un chiaro
assurdo.
Questo prova che non esiste alcuna suriettività tra A e P(A).

Ricordiamo che abbiamo posto 2 = {0, 1} e 2A = {f : A → 2}.


Notiamo inoltre che per ogni sottoinsieme B di A si può definire
una applicazione ϕB : A → 2 mediante la legge

1 se x ∈ B
ϕB (x) =
0 se x ∈ /B
che viene detta la “funzione caratteristica” di A rispetto a B.
Proviamo che anche 2A ha una potenza strettamente maggiore
di quella di A. Precisamente vale la seguente

Proposizione 2.4.4 Sia A un qualsiasi insieme allora |2A | = |P(A)|.


50 CAPITOLO 2. INSIEMI NUMERICI

Dimostrazione. Dobbiamo trovare una applicazione biiettiva tra


2A e P(A). Allora definiamo le seguenti due applicazioni

ψ : 2A → P(A), mediante ψ(f ) = Af = {x ∈ A | f (x) = 1};

ϕ : P(A) → 2A , mediante ϕ(B) = ϕB (la funzione caratteri-


stica).

Per controllare che una (e quindi entrambe) di tali applicazioni è


biiettiva basterà provare che ψ ◦ ϕ = 1P(A) e ϕ ◦ ψ = 12A (vedi
Proposizione 1.3.10).
Sia allora B un qualunque elemento di P(A), cioè un sottoin-
sieme di A. Dobbiamo provare che (ψ ◦ ϕ)(B) = B; sia allora
x ∈ (ψ ◦ ϕ)(B) = ψ(ϕ(B)), cioè x ∈ Aϕ(B) ; questo implica che
ϕB (x) = 1 che, per la definizione della funzione caratteristica,
significa x ∈ B. Viceversa, sia x ∈ B allora ϕB (x) = 1 ovvero
x ∈ AϕB .
Sia adesso f un qualunque elemento di 2A ovvero f : A → 2.
Dobbiamo provare che (ϕ ◦ ψ)(f ) = f ovvero che ϕAf = f. Ora,
poiché sono entrambe applicazioni di dominio A e codominio 2 dob-
biamo solo verificare che esse sono definite dalla stessa legge, ovvero
che ogni elemento di A ha la stessa immagine sia per l’applicazione
ϕAf che per l’applicazione f. Sia allora a ∈ A si ha

se f (a) = 1 allora a ∈ Af e quindi ϕAf (a) = 1;

se f (a) = 0 allora a ∈
/ Af e quindi ϕAf (a) = 0.

Definizione 2.4.5 Un insieme A si dice numerabile se è equipo-


tente con l’insieme dei numeri naturali N, |A| = |N|.
Si dice che un insieme A ha la potenza del continuo se è equi-
potente a P(N), cioè |A| = |P(N)|.
2.4. CARDINALITÀ DI UN INSIEME 51

Osserviamo ancora che qualsiasi insieme infinito contiene un


sottoinsieme numerabile (basta usare l’assioma della scelta).
Ed ancora, se son dati tre insiemi tali che |A| ≤ |B| ≤ |C| con
A numerabile e C avente la potenza del continuo, possiamo solo
concludere, che per B si verifica necessariamente che |B| = |A|
oppure che |B| = |C|.
In altri termini si assume la ipotesi del continuo: tra nume-
rabilità e la potenza del continuo non esistono altre cardinalità.
Ci chiediamo se esiste una potenza più grande del continuo.
La risposta è chiaramente affermativa: ad esempio, l’insieme P(N)
ha potenza certamente inferiore a quella di P(P(N)), a sua volta
certamente inferiore a P(P(P(N))) e cosı̀ via.
Quindi, non tutti gli infiniti sono uguali!!!!
Il seguente risultato ha importanti conseguenze quali il fatto che
sia l’insieme degli interi relativi Z che quello dei razionali Q sono
numerabili.

Proposizione 2.4.6 (Diagonalizzazione di Cantor) Il prodot-


to cartesiano N × N è numerabile. Più in generale, il prodotto
cartesiano di due insiemi numerabili è numerabile.
Dimostrazione. Si tratta di trovare una applicazione biiettiva tra
N×N ed N. Per fare ciò utilizzeremo la cosiddetta diagonalizzazione
di Cantor. Precisamente, distribuiamo gli elementi di N×N secondo
la seguente tabella
(0, 0) (0, 1) (0, 2) (0, 3) ...
. . . .
(1, 0) (1, 1) (1, 2) (1, 3) ...
. . . .
(2, 0) (2, 1) (2, 2) (2, 3) ...
. . . .
(3, 0) (3, 1) (3, 2) (3, 3) ...
. . . .
... ... ... ... ...
indi contiamo gli elementi seguendo il percorso indicato dalle frecce
diagonali. Ad esempio, il corrispondente dell’elemento (1, 1) è 4
52 CAPITOLO 2. INSIEMI NUMERICI

ed il corrispondente dell’elemento (3, 2) è 18 (ovviamente iniziamo


a contare da 0). Questa corrispondenza dà la richiesta corrispon-
denza biiettiva. Se vogliamo essere più formali, la corrispondenza
biiettiva ϕ : N × N → N è data dalla legge ϕ(m, n) = m+n+1

2
+m
−1
(verificare). [La corrispondenza inversa ϕ : N → N × N è de-
finita come segue: per ogni n ∈ N si indichi con  d il minimo
x+1
del sottoinsieme di N definito da {x ∈ N | 2 > n}, allora
ϕ−1 (n) = n − d2 , d+1
  
2
− n − 1 ].


2.5 Insieme dei numeri interi relativi


L’insieme dei numeri naturali con le operazioni introdotte non per-
mette però di risolvere come detto, ad esempio, semplici equazioni
del tipo x + 2 = 0. Ciò vuol dire, in altri termini, che in N l’addi-
zione non ammette per ogni elemento n l’esistenza di un elemento
n0 (detto l’opposto) tale che n + n0 = 0. Per risolvere questo proble-
ma, bisogna espandere l’insieme dei numeri naturali creando cosı̀
un nuovo insieme che contenga N (anzi tale che N sia “immergibile”
in questo nuovo insieme) e in modo tale che si riesca a guadagnare
qualcuna delle proprietà come quella suddetta.
Chiameremo il nuovo insieme, estensione di N, l’insieme dei
numeri relativi.
Vediamo, ora, da dove si parte per costruire questo insieme.
Consideriamo l’insieme N × N e costruiamo su tale insieme la
seguente relazione:
(a, b) ∼ (c, d) ⇔ a + d = b + c.
È facile verificare che tale relazione è una relazione di equiva-
lenza e quindi resta definito l’insieme quoziente, cioè l’insieme delle
classi di equivalenza che indicheremo con Z = N × N/ ∼ e che
chiameremo l’insieme dei numeri interi relativi.
Di conseguenza, un elemento di Z è una di queste classi di equi-
valenza che indicheremo [a, b]. Vediamo di rivedere gli elementi di Z
2.5. INSIEME DEI NUMERI INTERI RELATIVI 53

come usualmente siamo abituati, cioè +n o −n con n numero natu-


rale. Allora prendiamo un qualsiasi elemento [a, b] ∈ Z, ovviamente
con a, b ∈ N, si vede che si hanno queste tre possibilità


 se a > b cioè ∃ n ∈ N | a = b + n, scriveremo + n
[a, b] = se a < b cioè ∃ n ∈ N | b = a + n, scriveremo − n
se a = b scriveremo 0

Ricordiamo che [a, b] non indica solo la coppia (a, b) di numeri


naturali, ma tutte quelle ad essa equivalenti; per cui è lecito chie-
dersi se il numero naturale n definito sopra dipende dalle coppie
che stanno nella classe di equivalenza o solo dalla classe. Ora, os-
serviamo che in effetti se [a, b] = [a0 , b0 ] ed a = b + n allora anche
a0 = b0 + n e quindi il numero naturale n dipende solo dalla classe
di equivalenza: infatti, [a, b] = [a0 , b0 ] significa che (a, b) ∼ (a0 , b0 )
ovvero a+b0 = a0 +b; quindi da a = b+n per sostituzione otterremo
b + n + b0 = a0 + b, ovvero per la legge di cancellazione a0 = b0 + n.
Il fatto che n dipende solo dalla classe permette di indicare la
classe con il simbolo +n sopra indicato. Analogo discorso vale nel
caso in cui b = a + n. Infine osserviamo che tutte le coppie con gli
elementi uguali sono fra loro equivalenti e quindi individuano una
sola classe che sarà indicata con 0.
Definiamo adesso le operazioni su Z. Utilizzando il simbolismo
formale delle classi definiamo

[a, b] + [c, d] = [a + c, b + d]

Ovviamente, se scegliamo altre coppie di numeri naturali che, però


appartengono alla stessa classe di equivalenza, cioè se [a, b] = [a0 , b0 ]
e [c, d] = [c0 , d0 ] allora [a+c, b+d] = [a0 +c0 , b0 +d0 ]. Infatti, da [a, b] =
[a0 , b0 ] segue a+b0 = a0 +b e da [c, d] = [c0 , d0 ] segue c+d0 = c0 +d per
cui a+b0 +c+d0 = a0 +b+c0 +d ovvero [a+c, b+d] = [a0 +c0 , b0 +d0 ].
Vediamo un esempio: +7 + (−13); poiché +7 = [8, 1] e −13 =
[2, 15] allora +7 + (−13) = [8, 1] + [2, 15] = [10, 16] = −6.
54 CAPITOLO 2. INSIEMI NUMERICI

Definiamo adesso il prodotto in Z :

[a, b] · [c, d] = [ac + bd, ad + bc]

Ovviamente, anche qui, si verifica che se scegliamo altre coppie


di numeri naturali che, però, appartengono alla stessa classe di
equivalenza, cioè se [a, b] = [a0 , b0 ] e [c, d] = [c0 , d0 ] allora

[ac + bd, ad + bc] = [a0 c0 + b0 d0 , a0 d0 + b0 c0 ].

La verifica è analoga alla precedente.


Vediamo un esempio: +7 · (−3); poiché +7 = [8, 1] e −3 = [0, 3]
allora +7 · (−3) = [8, 1] · [0, 3] = [0 + 3, 24 + 0] = [3, 24] = −21.
Dalla definizione di prodotto appena data si può verificare fa-
cilmente la regola ben nota come “regola dei segni”. Vediamo ad
esempio il caso − · − = + (meno per meno = più).

−m · (−n) = [0, m] · [0, n] = [0 + mn, 0 + 0] = [mn, 0] = +mn.

Vediamo alcune proprietà di cui gode Z con le due operazioni


appena definite:

1. l’operazione + è associativa;

2. l’operazione + è commutativa;

3. 0 è elemento neutro per l’operazione +, cioè x + 0 = x; infatti


[a, b] + [0, 0] = [a, b];

4. ogni elemento x ∈ Z ammette un elemento, detto “opposto”


denominato −x, tale che x + (−x) = 0 : infatti, [a, b] + [b, a] =
[a + b, a + b] = [0, 0];

le 4 suddette proprietà si riassumono dicendo che Z rispetto all’ad-


dizione costituisce un gruppo abeliano;

5. l’operazione · è associativa;
2.5. INSIEME DEI NUMERI INTERI RELATIVI 55

6. l’operazione · è commutativa;
7. +1 è elemento neutro per l’operazione ·, cioè x · 1 = x; infatti
[a, b] · [1, 0] = [a, b];
8. l’operazione · è distributiva rispetto all’operazione + cioè x ·
(y + z) = x · y + x · z

tutte le 8 proprietà si riassumono dicendo che Z rispetto alle due


operazioni costituisce un anello commutativo unitario;

9. se x 6= 0 e a · x = b · x allora a = b (legge di cancellazione del


prodotto)

con questa ulteriore proprietà si dice che Z è un dominio di integrità


unitario.
Cosı̀ abbiamo costruito un insieme che rispetto all’insieme dei
numeri naturali gode di qualche ulteriore proprietà; ad esempio,
rispetto all’addizione, per ogni elemento esiste l’elemento opposto.
Tuttavia, si potrebbe obiettare che Z non sembra una vera esten-
sione dell’insieme N in quanto i suoi elementi sono delle classi di
equivalenza (e non vi sono singoli elementi di N). Per dimostrare
che effettivamente i numeri relativi costituiscono una estensione di
quelli naturali, dobbiamo trovare una applicazione iniettiva di N in
Z che sia “compatibile” con le operazioni. Cioè, deve esistere una
applicazione iniettiva ϕ : N → Z tale che
ϕ(m + n) = ϕ(m) + ϕ(n) per ogni m, n ∈ N;
ϕ(m · n) = ϕ(m) · ϕ(n) per ogni m, n ∈ N.
Una applicazione ϕ di questo genere si dice una immersione di
N in Z. Non è difficile trovare una siffatta applicazione: ϕ(n) =
[n, 0] = +n. In effetti è facile verificare che tale ϕ è una immersione:
infatti, se ϕ(n) = ϕ(m) segue [n, 0] = [m, 0], ovvero n + 0 = m + 0
(iniettività); inoltre

ϕ(m + n) = [m + n, 0] = [m, 0] + [n, 0] = ϕ(m) + ϕ(n)


56 CAPITOLO 2. INSIEMI NUMERICI

e
ϕ(m · n) = [m · n, 0] = [m, 0] · [n, 0] = ϕ(m) · ϕ(n).
Alla luce di quanto detto il numero naturale n si può identificare
con il numero intero relativo +n ovvero con [n, 0].
Infine, su Z si può definire una relazione d’ordine che estenda
quella definita su N :

a ≤ b ⇔ ∃ x ∈ N | b = a + x.

Si vede che Z con tale relazione è totalmente ordinato ed inol-


tre valgono le seguenti due proprietà (compatibilità rispetto alle
operazioni):
se a ≤ b ⇒ a + c ≤ b + c,

se a ≤ b e c ≥ 0 ⇒ ac ≤ bc.
Alla luce di queste proprietà si dice che Z è un anello ordinato.

2.6 Divisibilità negli interi relativi


Se m, n ∈ Z∗ sono interi non nulli, si dice che m divide n, e si indica
m|n, se esiste un intero q per cui n = mq (in tal caso q si dice
“divisore”). Tale relazione di divisibilità è riflessiva e transitiva e
chiaramente non ogni coppia di elementi m, n sono in tale relazione.
Inoltre se m|n ed n|m i due numeri si dicono associati ed è
facile vedere che essi sono uguali o opposti. Infatti, da m|n segue
n = mq, mentre da n|m segue m = nq 0 ; quindi n = nqq 0 ovvero
qq 0 = 1. Ma in Z la precedente eguaglianza implica q = q 0 = ±1.
Introduciamo adesso due concetti fondamentali sull’anello dei
numeri interi relativi, che nel seguito potremo generalizzare.

Definizione 2.6.1 Un numero p ∈ Z, p 6= ±1, si dice primo se


dal fatto che p|ab segue che p|a oppure p|b.
2.6. DIVISIBILITÀ NEGLI INTERI RELATIVI 57

Definizione 2.6.2 Un numero q ∈ Z, q 6= ±1, si dice irriducibile


se i suoi soli divisori sono ±q e ±1.

Osservazione 2.6.3 Le precedenti definizioni sono equivalenti. In-


fatti, se p è primo si può provare che i suoi soli divisori sono ±p
e ±1. Infatti, sia d un divisore di p, cioè p = dh; quindi p|dh per
cui p|d oppure p|h. Nel primo caso allora p e d sarebbero associati
quindi d = ±p; nel secondo caso sarà h = ±p il che implica che
d = ±1. Il viceversa, cioè il fatto che ogni numero irriducibile è
primo seguirà dal Teorema di Bézout che tra poco dimostreremo.

Il risultato appena dimostrato ci permette d’ora in poi di uti-


lizzare indifferentemente i termini primo o irriducibile per i numeri
interi relativi.

Definizione 2.6.4 Dati due numeri interi relativi a, b ∈ Z∗ si de-


finisce massimo comune divisore tra a e b, un numero intero
relativo d tale che

i) d divide sia a che b;

ii) se d0 è un altro intero che divide sia a che b allora d0 divide


d.

In tal caso scriveremo M CD(a, b) = d.


Anche in questo caso, a priori, non è detto che un siffatto intero
esista. Tuttavia, se esistono due di siffatti interi d1 e d2 dovranno
essere associati. Infatti, dalla definizione applicata sia a d1 che a
d2 si ha che d1 divide d2 e viceversa d2 divide d1 per cui essi sono
associati e quindi d1 = ±d2 .
Anche per Z per provare l’algoritmo Euclideo che produce il
M CD(a, b) in Z mostrandone cosı̀ l’esistenza (non ovvia in altri
insiemi numerici), abbiamo bisogno dapprima dell’algoritmo di
divisione in Z.
58 CAPITOLO 2. INSIEMI NUMERICI

A questo proposito ricordiamo che se x è un intero relativo, il


suo valore assoluto |x| si definisce

x se x ≥ 0
|x| =
−x se x < 0

Proposizione 2.6.5 (Algoritmo di divisione) Se a, b ∈ Z, b 6=


0, allora esistono q, r ∈ Z (quoziente e resto) tali che a = bq + r
con 0 ≤ r < |b|.

Dimostrazione. Supponiamo dapprima a ≥ 0 e procediamo per


induzione su a. Per a = 0 la proprietà è vera, basta prendere q = r =
0. Supposta vera la proprietà per a, cioè supponiamo che a = bq + r
con 0 ≤ r < |b| e proviamola per a + 1. Ma da a = bq + r abbiamo
a + 1 = bq + r + 1; per cui se r + 1 < |b| la proprietà è vera per
a + 1; se invece r + 1 = |b|, cioè r + 1 = +b o −b allora avremo
a+1 = b(q ±1)+0 ed anche in tal caso la proprietà è vera per a+1.
Cosı̀ per l’ipotesi induttiva l’algoritmo di divisione è vero per ogni
a naturale. Infine, se a < 0 la proprietà sarà vera per −a e quindi
−a = bq + r con 0 ≤ r < |b|. Allora a = b(−q) − r, per cui se r = 0
abbiamo la tesi, se invece r > 0, scriveremo a = b(−q) − |b| + |b| − r,
cioè a = b(−q ± 1) + r0 con r0 = |b| − r < |b|.

Nota che anche in questo caso quoziente e resto sono unici.


Adesso siamo in grado di illustrare l’algoritmo euclideo mediante
l’algoritmo di divisione.

Proposizione 2.6.6 (Algoritmo Euclideo) Siano a, b ∈ Z, b 6=


0, consideriamo le seguenti divisioni successive.

a = bq1 + r1 , con 0 ≤ r1 < |b|, e se r1 6= 0,

b = r1 q2 + r2 , con 0 ≤ r2 < r1 , e se r2 6= 0,
2.6. DIVISIBILITÀ NEGLI INTERI RELATIVI 59

r1 = r2 q3 + r3 , con 0 ≤ r3 < r2 , e se r3 6= 0,

··· ··· ···

rn−2 = rn−1 qn + rn , con 0 ≤ rn < rn−1 , e se rn 6= 0,

rn−1 = rn qn+1 ;

Allora rn (ultimo resto non nullo) è il cercato massimo comune


divisore.

Dimostrazione. La dimostrazione è analoga a quella vista nel


caso dei numeri naturali.

Esempio 2.6.7 Consideriamo −72 e 750 ed applichiamo l’algorit-


mo euclideo

750 = −72 · (−10) + 30,

−72 = 30 · (−3) + 18,

30 = 18 · 1 + 12,

18 = 12 · 1 + 6

12 = 6 · 2

quindi M CD(750, 72) = 6 (o −6).

Il prossimo risultato avrà importanti conseguenze in diverse


applicazioni future.

Proposizione 2.6.8 (Identità di Bézout) Se d = M CD(a, b)


allora si possono trovare λ e µ in Z tali che d = λa + µb.
60 CAPITOLO 2. INSIEMI NUMERICI

Dimostrazione. Basta utilizzare le divisioni successive dell’algo-


ritmo euclideo partendo dall’ultima e risalendo sino alla prima.


A titolo esemplificativo illustriamo la procedura per ottenere


l’identità di Bézout nel caso dell’esempio precedente:
6 = 18 − 1 · 12,
6 = 18 − [30 − 1 · 18] = 2 · 18 − 30,
6 = 2 · [−72 + 3 · 30] − 30 = 2 · (−72) + 5 · 30,
6 = 2 · (−72) + 5 · [750 + 10 · (−72)] = 5 · 750 + 52 · (−72),
in definitiva, 6 = 5 · 750 + 52 · (−72).
Utilizzando l’identità di Bézout possiamo finire la prova dell’equi-
valenza dei concetti di numero primo e numero irriducibile, vedi
Osservazione 2.6.3.
Sia quindi q un intero irriducibile e proviamo che q è primo,
cioè proviamo che se q|ab allora q|a oppure q|b. Supponiamo allora
che q non divida a, si tratta di provare che allora q|b. Poiché q
è irriducibile e non divide a il massimo comune divisore tra q ed
a è 1. Allora, per l’identità di Bézout si ha 1 = mq + na; allora
b = mqb + nab, quindi q poiché divide mqb e nab dovrà dividere
mqb + nab = b.
Fattorizzazione unica in Z.
Una delle più importanti proprietà dei numeri interi relativi Z
(nota anche come proprietà fondamentale dell’Aritmetica) è data
dal seguente risultato.

Teorema 2.6.9 Fattorizzazione unica in Z. Ogni intero re-


lativo, diverso da ±1, si può esprimere come prodotto (finito) di
numeri primi ed una tale fattorizzazione è unica a meno del se-
gno e dell’ordine. In questo senso si dice che Z è un dominio a
fattorizzazione unica o UFD.
2.6. DIVISIBILITÀ NEGLI INTERI RELATIVI 61

Dimostrazione. Esistenza della fattorizzazione. Sia n un qua-


lunque intero, che possiamo supporre positivo; poiché per n = 2 la
conclusione è ovvia, per l’ipotesi induttiva possiamo supporre che
la proprietà sia vera per ogni d < n e provarla per n. Allora, se n
è irriducibile la sua fattorizzazione è n = n. Se invece è riducibile,
allora n = ab con a < n e b < n, sicché per l’ipotesi induttiva
a = p1 . . . pt e b = q1 . . . qs , dove ogni pi e qj è irriducibile. Allora,
n = p1 . . . pt q1 . . . qs è la fattorizzazione di n in fattori irriducibili.
Unicità della fattorizzazione. Se n = p1 p2 . . . pt = q1 q2 . . . qs
sono due fattorizzazioni di n in fattori irriducibili, proviamo che
a meno del segno esse coincidono. Intanto, posto t ≤ s, se fosse
t = 1 dal fatto che p1 divide q1 q2 . . . qs segue che p1 divide qualche
qi , diciamo q1 , ma essendo quest’ultimo irriducibile ne segue che
p1 = q1 (a meno del segno). Allora, per la legge di cancellazione,
si avrebbe 1 = q2 . . . qs e quindi s = 1 e le due fattorizzazioni
coincidono. Se t > 1, supposta vera l’unicità per fattorizzazioni di
lunghezza < t, ripetendo lo stesso discorso su p1 si avrà p2 . . . pt =
q2 . . . qs per cui t − 1 = s − 1 ed ogni pi = qi (a meno del segno
e dell’ordine) per i = 2, . . . t. Questo prova quindi l’unicità della
fattorizzazione (a meno del segno e dell’ordine).

Ricordiamo che in modo analogo alla definizione di massimo


comune divisore si può dare la definizione di “minimo comune mul-
tiplo” tra due interi a e b. Precisamente

Definizione 2.6.10 Dati due numeri interi non nulli a, b ∈ N∗


si definisce minimo comune multiplo tra a e b, e scriveremo
mcm(a, b) = m, un numero intero m tale che

i) m è multiplo sia di a che di b;

ii) se m0 è un altro multiplo di a e di b allora m0 è multiplo di


m.
62 CAPITOLO 2. INSIEMI NUMERICI

La fattorizzazione unica in Z, tra l’altro, consente di calcolare


in altra maniera il M CD(a, b) ed il mcm(a, b). Infatti, se

a = pm mt
1 · . . . · pt ,
1

b = pn1 1 · . . . · pnt t ,

con mi ≥ 0, ni ≥ 0 (nota che permettendo agli esponenti di essere


anche nulli, possiamo supporre che i primi che compaiono nelle due
fattorizzazioni siano gli stessi), allora il M CD(a, b) = pα1 1 · . . . · pαt t e
mcm(a, b) = pβ1 1 ·. . .·pβt t , dove αi = min{mi , ni } e βi = max{mi , ni }
per ogni i. Quanto appena detto mostra tra l’altro che M CD(a, b) ·
mcm(a, b) = ab.
Vediamo un esempio.

Esempio 2.6.11 Consideriamo come prima 72 e 750 e fattorizzia-


moli

750 = 2 · 3 · 53 ,

72 = 23 · 32 · 50 ;

quindi M CD(750, 72) = 2 · 3 · 50 = 6 e mcm(750, 72) = 23 · 32 · 53 =


9000. Nota che 6 · 9000 = 750 · 72 = 54000.

2.7 Classi di resto modulo n


Gli insiemi numerici con le rispettive operazioni che abbiamo finora
introdotto sono insiemi infiniti. Tuttavia, spesso si ha a che fare
con problematiche in cui entrano in gioco solo un numero finito di
“numeri”. Basti pensare al caso dell’orologio in cui si usano solo
12 numeri (o 24) o dei giorni della settimana in cui si usano solo
7 numeri. Allora un modo molto utile ed attuale, per le molteplici
applicazioni che oggi si fanno, per operare in questo campo si rivela
la costruzione delle classi di resto modulo n e della relativa “aritme-
tica modulare”. Tali classi si ottengono definendo una relazione di
2.7. CLASSI DI RESTO MODULO N 63

equivalenza (la “congruenza” introdotta originariamente da Gauss)


su Z realizzando cosı̀ l’insieme delle classi di equivalenza. Vediamo
come si procede: si fissa un intero n > 0 e si stabilisce su Z la
seguente relazione

x≡y ⇔ x − y = λn

(ovvero se x ed y divisi per n danno lo stesso resto).


Ad esempio, se n = 10 allora 13 ≡ 3, −7 ≡ 3, mentre 12 non è
in relazione con 7.
Cosı̀ Z resta diviso in classi di equivalenza e l’insieme di queste
classi di equivalenza si indica con Zn e sarà chiamato l’insieme
delle classi di resto modulo n.
In Zn l’elemento costituito dalla classe di equivalenza individua-
ta dall’intero a sarà indicato con a o talvolta [a].

Esempio 2.7.1 Costruiamo ad esempio Z10 :

• prendiamo dapprima tutti i numeri di Z che divisi per 10


danno resto 0 (ovvero i multipli di 10); essi costituiscono una
classe di equivalenza che indichiamo con 0;

• prendiamo ora tutti i numeri di Z che divisi per 10 danno


resto 1; essi costituiscono una classe di equivalenza che indi-
chiamo con 1. (Osserviamo che nessun numero che sta in 0
starà in 1);

• prendiamo ora tutti i numeri di Z che divisi per 10 dan-


no resto 2; essi costituiscono una classe di equivalenza che
indichiamo con 2;

• cosı̀ procediamo formando le classi dei numeri che divisi per


10 danno resto, rispettivamente 3, 4, 5, 6, 7, 8, 9, cioè 3, 4,
5, 6, 7, 8, 9. Ricordiamo che il resto della divisione per 10
dà per resto un numero compreso tra 0 e 9).
64 CAPITOLO 2. INSIEMI NUMERICI

Alla fine abbiamo costruito l’insieme Z10

Z10 = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}.

Naturalmente per considerare Zn un insieme numerico occorre


definire su esso due operazioni (addizione e prodotto) cosı̀ come si
è fatto per N prima e Z poi.
Cominciamo operando su un esempio. Allora prendiamo Z7 =
{0, 1, 2, 3, 4, 5, 6}. Consideriamo un elemento della classe 4, ad
esempio 18, ed uno della classe 5, diciamo 26, sommando avre-
mo 18 + 26 = 44 che si trova nella classe 2. Ovviamente si potrebbe
obiettare che il risultato possa dipendere dalla scelta che noi abbia-
mo operato nelle due classi. Per provare ad eliminare questo dubbio
ripetiamo l’operazione eseguita facendo altre scelte. Per esempio,
prendiamo −3 nella classe 4 e 75 nella classe 5, sommando avremo
−3 + 75 = 72 che ancora sta nella classe 2. In altri termini potremo
dire che 4 + 5 = 2.
Analogamente, si può operare con il prodotto: consideriamo un
elemento della classe 3, ad esempio 10, ed uno della classe 6, diciamo
13, moltiplicando avremo 10 · 13 = 130 che si trova nella classe 4.
Anche qui si potrebbe obiettare che il risultato possa dipendere
dalla scelta che noi abbiamo operato nelle due classi. Per eliminare
anche questo dubbio ripetiamo l’operazione eseguita facendo altre
scelte. Per esempio, prendiamo −11 nella classe 3 e 27 nella classe
6, moltiplicando avremo −11·27 = −297 che ancora sta nella classe
4. In altri termini potremo dire che 3 · 6 = 4.
Passiamo alla formalizzazione di quanto visto nell’esempio pre-
cedente.

Siano [a], [b] elementi qualunque di Zn . Allora si definiscono le


seguenti operazioni:

[a] + [b] = [a + b];

[a] · [b] = [a · b];


2.7. CLASSI DI RESTO MODULO N 65

Naturalmente, affinché le precedenti siano ben definite, cioè di-


pendano dalle classi e non dagli elementi delle singole classi, bisogna
verificare che se [a] = [a0 ] e [b] = [b0 ] allora [a + b] = [a0 + b0 ]. Ed
infatti, da [a] = [a0 ] e [b] = [b0 ] segue a0 = a + λn e b0 = b + µn per
cui a0 + b0 = a + b + (λ + µ)n, cioè [a + b] = [a0 + b0 ].
Analogamente, se [a] = [a0 ] e [b] = [b0 ] allora [ab] = [a0 b0 ]. Ed
infatti, da [a] = [a0 ] e [b] = [b0 ] segue a0 = a + λn e b0 = b + µn per
cui a0 b0 = ab + (λb + µa)n, cioè [ab] = [a0 b0 ].
Osserviamo che un elemento di Zn è a sua volta un insieme
contenente infiniti elementi di Z e che quindi se x ∈ [a] poiché x
sarà equivalente ad a, cioè [x] = [a] potremo scrivere [x] in luogo di
[a].
Vediamo adesso le proprietà di cui godono queste due operazioni
in Zn .
1. [a] + [b] = [b] + [a] (commutatività dell’addizione);
2. ([a] + [b]) + [c] = [a] + ([b] + [c]) (associatività dell’addizione);
3. [a]+[0] = [0]+[a] = [a] ([0] è elemento neutro per l’addizione);
4. [a]+[n−a] = [n−a]+[a] = [0] (ogni elemento [a] ha l’opposto
−[a] = [n − a]);
1’ [a] · [b] = [b] · [a] (commutatività del prodotto);
2’. ([a] · [b]) · [c] = [a] · ([b] · [c]) (associatività del prodotto);
3’. [a] · [1] = [1] · [a] = [a] ([1] è elemento neutro o unità per il
prodotto);
5. [a] · ([b] + [c]) = [a] · [b] + [a] · [c] (distributività del prodotto
rispetto all’addizione).
Ma attenzione!!
Se in Z10 consideriamo [4] e [5], due elementi che sono diversi
da [0], facendo il prodotto otterremo:
[4] · [5] = [20] = [0]
66 CAPITOLO 2. INSIEMI NUMERICI

ovvero in Z10 non vale la legge dell’annullamento del prodotto. Que-


sto, tra l’altro, implica che né [4] né [5], in Z10 hanno l’inverso,
cioè non esiste alcun elemento in Z10 che moltiplicato per essi dia
l’elemento unità [1].
Se provassimo a fare un analoga ricerca ad esempio in Z7 non
troveremo due elementi non nulli che diano come prodotto lo zero;
in effetti, tutti i suoi elementi non nulli sono invertibili, cioè hanno
l’inverso:

[1] · [1] = [1], [2] · [4] = [1], [3] · [5] = [1], [6] · [6] = [1].

Dove sta la differenza? Perché in Z7 ogni elemento non nullo


ha l’inverso mentre ciò è falso per Z10 ? La risposta è nel seguente
teorema.

Teorema 2.7.2 Un elemento [a] ∈ Zn è invertibile se e solo se


M CD(a, n) = 1 ovvero se a ed n sono coprimi o primi tra loro.

Dimostrazione. Se [a] è invertibile in Zn allora esiste [b] tale che


[a] · [b] = [1], ovvero ab = λn + 1, quindi 1 = ab − λn. Per cui se a
ed n avessero un divisore comune d esso dovrebbe dividere ab, λn
quindi ab − λn cioè 1, quindi d = 1. Se viceversa M CD(a, n) = 1,
per il Teorema di Bézout, si avrà ah + nk = 1 per qualche h ed k,
quindi [ah] = [1] ovvero [a][h] = [1], cioè [a] è invertibile.


Corollario 2.7.3 Gli elementi non nulli di Zn sono tutti invertibili


se e solo se n è primo.

Dimostrazione. Infatti, se n è primo ogni elemento a, con 1 ≤


a ≤ n − 1, è primo con n quindi per il teorema precedente [a] è
invertibile. Viceversa se n non è primo allora n = p · q per qualche
p, q 6= 1 per cui [p] (e [q]) per il teorema precedente non è invertibile.

2.7. CLASSI DI RESTO MODULO N 67

Abbiamo già visto che in Zn possono esserci elementi non nulli


che moltiplicati tra loro danno [0]. Questo giustifica la seguente

Definizione 2.7.4 Un elemento [a] 6= [0] si dice divisore dello


zero se esiste un elemento [b] 6= [0] tale che [a] · [b] = [0].

Ovviamente un divisore dello zero non può essere invertibile e quin-


di un elemento invertibile non può essere un divisore dello zero.
Indichiamo con Un il sottoinsieme di Zn formato da tutti i suoi
elementi invertibili. Alla luce del teorema precedente

|Un | = numero di numeri naturali che sono < n e primi con n.

Eulero per primo studiò questa funzione che ad ogni intero n > 1
associa il numero di numeri naturali minori di n e primi con esso.
Per cui chiameremo funzione di Eulero e la indicheremo con ϕ(n),
la funzione data da

ϕ(n) = numero di numeri naturali < n e primi con n = |Un |.

Esempio 2.7.5

ϕ(20) = 8, infatti 1, 3, 7, 9, 11, 13, 17, 19 sono i numeri minori


di 20 e primi con esso.

ϕ(11) = 10, infatti 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 sono i numeri mi-


nori di 11 e primi con esso (nota che 11 è un numero primo).

Queste semplici proprietà di ϕ(n) permetteranno il calcolo di


tale funzione.

P1. Se p è un numero primo allora ϕ(p) = p − 1. Ciò è ovvio.

P2. Se p è un numero primo allora ϕ(pt ) = pt − pt−1 = pt−1 (p − 1).


Ciò segue osservando che di numeri minori di pt e che sono
multipli di p ve ne sono pt−1 .
68 CAPITOLO 2. INSIEMI NUMERICI

P3. Se m ed n sono coprimi allora ϕ(mn) = ϕ(m)ϕ(n). La pro-


va di questa proprietà la vedremo dopo aver conosciuto il
Teorema Cinese del Resto.

Applicando le suddette proprietà, se n = pm mt


1 · . . . · pt , allora
1

1 −1 t −1
ϕ(n) = pm
1 · . . . · pm
t (p1 − 1) · . . . · (pt − 1).

[Quando avremo conosciuto i numeri razionali potremo scrivere


1 1
ϕ(n) = n(1 − ) · . . . · (1 − ) ] .
p1 pt

Per esempio, visto che 20 = 22 5, sarà ϕ(20) = 20(1 − 12 )(1 − 15 ) = 8.


Fermat mostrò questo semplice risultato

Teorema 2.7.6 (Piccolo teorema di Fermat) Se p è un primo


e se a non è multiplo di p, allora ap−1 = 1 in Zp .

Nota che, per abuso di notazione abbiamo scritto semplicemente


ap−1 = 1 in Zp anzicché usare la notazione [ap−1 ] = [1].
Questo teorema fu generalizzato in modo mirabile da Eulero
ed il suo risultato viene ancor oggi usato soprattutto in Critto-
grafia ed in Teoria dei codici. Poiché il Teorema di Fermat è un
caso particolare del Teorema di Eulero, ci limiteremo a provare
quest’ultimo.

Teorema 2.7.7 (Teorema di Eulero) Se a ed n sono numeri


primi tra loro allora aϕ(n) = 1 in Zn .

Dimostrazione. Ricordiamo che |Un | = ϕ(n). Poniamo per co-


modità t = ϕ(n) ed indichiamo Un = {a1 , a2 , . . . , at }. Visto che
M CD(a, n) = 1, a in Zn è invertibile quindi a ∈ Un , ovvero coin-
cide con uno degli ai . Consideriamo i prodotti di a per ciascuno
degli ai di Un ; ovviamente essendo prodotti di elementi invertibili
saranno elementi invertibili quindi staranno ancora in Un . Poiché se
2.7. CLASSI DI RESTO MODULO N 69

aai = aaj , moltiplicando per l’inverso di a in Zn si avrebbe ai = aj ,


possiamo dedurre che {aa1 , aa2 , . . . , aat } formano un sottoinsieme
di Un con lo stesso numero t di elementi, quindi deve coincidere con
Un , ovvero
{aa1 , aa2 , . . . , aat } = {a1 , a2 , . . . , at }.
Allora in Zn si ha
aa1 · aa2 · . . . · aat = a1 · a2 · . . . · at
ovvero
at · a1 · a2 · . . . · at = a1 · a2 · . . . · at
ma a1 ·a2 ·. . .·at è un elemento invertibile di Zn , per cui moltiplican-
do ambo i membri della precedente eguaglianza per il suo inverso,
otterremo at = 1; in conclusione
aϕ(n) = 1 in Zn .

Alcune delle più comuni domande che ci si pone in Aritmetica
sono: quanti sono i numeri primi, come si possono riconoscere,
come si distribuiscono? Mentre la prima domanda ha una semplice
risposta le altre due sono ancora di grande attualità ed oggetto di
studio.
I numeri primi sono infiniti: infatti, se per assurdo fossero in
numero finito, denominati tali primi con {p1 , p2 , . . . , pt } si verifica
facilmente che anche q = p1 p2 · . . . · pt + 1 sarebbe un primo (diverso
dai pi ); basta notare che nella sua fattorizzazione in fattori primi
non ci può stare alcun dei primi pi in quanto il resto della divisione
di q per pi è 1.
Il prossimo classico risultato, che possiamo rivedere alla luce
delle classi di resto, è un test di primalità, cioè una caratterizza-
zione dei numeri primi, dovuto al matematico Wilson. L’utilità sta
anche nel fatto che con questa caratterizzazione è sufficiente una
sola divisione per scoprire se un dato numero è primo.
70 CAPITOLO 2. INSIEMI NUMERICI

Teorema 2.7.8 (Teorema di Wilson) Un numero p è primo se e


solo se (p−1)! = −1 in Zp . Ovvero p è primo se e solo se (p−1)!+1
è divisibile per p.

Dimostrazione. Se (p − 1)! = −1 in Zp , ovvero (p − 1)! + 1 = λp,


facciamo vedere che allora p è primo: infatti, se per assurdo non
fosse primo ci sarebbe un numero 1 6= q < p che lo divide; ma poiché
(p − 1)! è il prodotto di tutti i numeri minori di p ha come fattore
anche q, quindi q dividerebbe anche (p − 1)! per cui q dovrebbe
dividere (p − 1)! − λp = 1, il che è un assurdo.
Supponiamo ora che p sia primo; allora in Zp tutti gli elementi
non nulli sono invertibili. Ma vediamo se vi sono elementi che hanno
per inverso se stesso: cioè x ∈ Zp tale che x2 = 1. Ora x2 = 1
implica (x − 1)(x + 1) = 0, ma in Zp vale la legge dell’annullamento
del prodotto, sicché si ha x − 1 = 0 oppure x + 1 = 0; in definitiva,
gli unici elementi di Zp che hanno per inverso se stesso sono 1 e
−1 = p − 1. Da questa osservazione segue che in Zp

2 · 3 · . . . · (p − 2) = 1

poiché ogni elemento incontra come fattore il proprio inverso. Mol-


tiplicando allora ambo i membri per p − 1 si otterrà in Zp

1 · 2 · 3 · . . . (p − 2) · (p − 1) = p − 1 = −1.

Le prossime sezioni saranno dedicate ad alcune applicazioni delle


classi di resto.

2.8 Criteri di divisibilità


Un criterio di divisibilità si può pensare come una procedura che
permetta di decidere se un numero x è divisibile per un dato numero
n senza eseguire la divisione. L’idea banale è che se x è divisibile
per n allora [x] = [0] in Zn .
2.8. CRITERI DI DIVISIBILITÀ 71

In effetti non si capisce, a prima vista, quanto brillante sia que-


sta idea visto che per decidere se in Zn [x] = [0] devo dividere x
per n e vedere se il resto è 0! Tuttavia, poiché lavoriamo in Zn [x]
si può scrivere in diverse maniere per cui se uno sa che [x] = [y]
per controllare se x è divisibile per n basterà farlo su y e la cosa
potrebbe rivelarsi molto più semplice!
Allora ricordiamo che ogni numero intero x si può scrivere nella
forma decimale:
x = ct . . . c1 c0 = ct 10t + . . . + c1 10 + c0
in cui ci sono cifre; quindi in Zn si ha
[x] = [ct ][10]t + . . . + [c1 ][10] + [c0 ]
cosı̀ il tutto dipende da quanto valgono le potenze di 10 in Zn .

Criterio di divisibilità per 5. Osserviamo che in Z5 [10]i =


[0], per cui [x] = [c0 ]. Allora,
“x è divisibile per 5 se e solo se c0 è divisibile per 5, ovvero c0 = 0
oppure c0 = 5”.

Criterio di divisibilità per 4 (e per 25). Osserviamo che in


Z4 [10]i = [0], per i ≥ 2, quindi [x] = [c1 ][10] + [c0 ] = [c1 c0 ]. Allora
“x è divisibile per 4 se e solo se il numero costituito dalle ultime
due cifre c1 c0 è divisibile per 4”.
Poiché anche in Z25 [10]i = [0], per i ≥ 2, lo stesso criterio varrà
per 25
“x è divisibile per 25 se e solo se il numero costituito dalle ultime
due cifre c1 c0 è divisibile per 25, ovvero le ultime due cifre sono 00,
25, 50, 75”.

Criterio di divisibilità per 3 (e per 9). Osserviamo che


in Z3 [10]i = [1], per ogni i, quindi [x] = [ct ] + . . . + [c1 ] + [c0 ] =
[ct + . . . + c1 + c0 ]. Allora
“x è divisibile per 3 se e solo se la somma della sue cifre è divisibile
per 3”.
72 CAPITOLO 2. INSIEMI NUMERICI

Poiché anche in Z9 [10]i = [1], per ogni i, lo stesso criterio varrà


per 9, cioè
“x è divisibile per 9 se e solo se la somma della sue cifre è divisibile
per 9”.

Criterio di divisibilità per 11. Osserviamo che in Z11 [10]i =


[1], per ogni i pari, mentre [10]i = −[1], per ogni i dispari, quindi
[x] = [c0 ] − [c1 ] + [c2 ] + . . . + (−1)t [ct ] = [c0 − c1 + c2 + . . . + (−1)t ct ].
Allora
“x è divisibile per 11 se e solo se la somma della sue cifre di po-
sto pari diminuito della somma delle sue cifre di posto dispari è
divisibile per 11”.

2.9 Equazioni diofantee


Le equazioni diofantee (dal nome del Matematico Diofanto) sono le
equazioni del tipo:

ax + by = c con a, b, c ∈ Z

in cui si ricercano le soluzioni intere, quindi per soluzione di una


equazione diofantea si intende una coppia di interi (x, y) tale che
ax + by = c. Naturalmente non tutte le equazioni diofantee hanno
soluzioni. Ad esempio, l’equazione 4x + 10y = 21 non ha soluzioni
come si può evincere facilmente dal fatto che il primo membro è
sempre pari (per ogni x e y) mentre il secondo membro è dispari.
È allora lecito chiedersi per quali a, b, c ∈ Z un’equazione dio-
fantea ammette soluzioni (sempre in Z × Z). La risposta è molto
semplice e segue dalla seguente proposizione.

Proposizione 2.9.1 Una equazione diofantea ax + by = c ha so-


luzioni se e solo se M CD(a, b) divide c.

Dimostrazione. Supponiamo che l’equazione diofantea abbia so-


luzioni e sia (m, n) ∈ Z × Z una di esse per cui am + bn = c. Cosı̀
2.9. EQUAZIONI DIOFANTEE 73

se M CD(a, b) = d, poiché d divide sia a che b, si ha che d divide


am + bn, cioè d divide c. Viceversa, se d divide c, si ha c = dh; ma,
per l’identità di Bézout, d = λa + µb cosı̀ moltiplicando per h ambo
i membri otterremo c = hd = hλa + hµb, per cui una soluzione
dell’equazione diofantea sarà (hλ, hµ).

A questo punto ci chiediamo, nel caso che una equazione dio-


fantea ammetta soluzioni, quante sono le soluzioni e quali sono?
Innanzitutto osserviamo che, se (x0 , y0 ) è una soluzione dell’e-
quazione diofantea ax + by = c, allora posto d = M CD(a, b), anche
(x0 + λ db , y0 − λ ad ), per ogni λ ∈ Z sono soluzioni dell’equazione
diofantea. Infatti, a(x0 + λ db ) + b(y0 − λ ad )) = ax0 + by0 = c, in
quanto (x0 , y0 ) è una soluzione dell’equazione diofantea.
Il fatto interessante è che queste sono tutte le soluzioni della
suddetta equazione diofantea. Infatti, se (x1 , y1 ) è una soluzione
di ax + by = c, allora ax1 + by1 = c per cui ax0 + by0 = ax1 +
by1 cioè b(y0 − y1 ) = a(x1 − x0 ) Dividendo ambo i membri per
d = M CD(a, b) si ottiene db (y0 − y1 ) = ad (x1 − x0 ). Da questa
uguaglianza, osservato che db e ad sono primi fra loro, ne segue che db
divide (x1 − x0 ), mentre ad divide (y0 − y1 ) (basta osservare che ogni
fattore primo nella fattorizzazione di db dovendo dividere ad (x1 − x0 )
e non dividendo ad dovrà dividere (x1 − x0 ), analogamente per ad ).
Pertanto, (x1 − x0 ) = λ db e (y0 − y1 ) = µ ad ed usando l’uguaglianza
b(y0 − y1 ) = a(x1 − x0 ) si ha λa db = µb ad , in definitiva λ = µ e quindi
(x1 , y1 ) = (x0 + λ db , y0 − λ ad ).
Cosı̀ per trovare tutte le soluzioni di un’equazione diofantea ba-
sta trovarne una particolare (x0 , y0 ). Illustriamo allora un metodo
che utilizza le classi di resto per trovare una soluzione di una equa-
zione diofantea (un altro metodo potrebbe essere quello che utilizza
il Teorema di Bézout).
Data l’equazione diofantea ax + by = c, con d = M CD(a, b) che
divide c. Dividiamo ambo i membri per d ottenendo cosı̀ l’equazione
mx + ny = p. Per semplicità consideriamo il minore tra m ed n, di-
ciamo n, e consideriamo la detta equazione in Zn , cioè [m][x] = [p].
74 CAPITOLO 2. INSIEMI NUMERICI

Poiché m è primo con n [m] è invertibile in Zn , per cui moltipli-


cando per l’inverso di [m] si otterrà [x] = [m]−1 [p] = [q]. Diciamo
x0 = q e consideriamo l’equazione mx0 + ny = p. Ora osserviamo
che [m][x0 ] = [p], ovvero mx0 = p + hn, quindi n divide p − mx0
per cui ponendo y0 = p−mx n
0
avremo la soluzione dell’equazione
diofantea (x0 , y0 ).

Esempio 2.9.2 Nell’isola di Mat vi sono solo due tipi di monete:


da 36 o da 70 numi (il nume è la valuta ufficiale). È possibile
comprare (senza resto) il libro di Algebra che costa 2000 numi? In
caso affermativo dire in quanti modi è possibile pagare i 2000 numi.
Dobbiamo vedere se è possibile trovare un numero n di monete
da 36 numi ed un numero m di monete da 70 numi in modo che la
somma faccia 2000 numi, cioè:

36n + 70m = 2000 ovvero 18n + 35m = 1000.

Se leggiamo la precedente eguaglianza in Z18 abbiamo: [17][m] =


[10], ovvero −[m] = [10], per cui [m] = [8]. Prendiamo m = 8 e
consideriamo l’equazione 18n + 280 = 1000, cioè 18n = 720 ovvero
n = 40. Cosı̀ una soluzione particolare della nostra equazione è
m = 8, n = 40. Allora tutte le possibili soluzioni sono

m = 8 + 18h

n = 40 − 35h

con h ∈ Z. Poiché per il nostro problema m ed n devono essere dei


numeri naturali ne segue che, per il nostro problema, ad h possiamo
dare solo i valori 0 ed 1. Per pagare allora il libro di Algebra devo
pagare o con 40 monete da 36 numi e 8 monete da 70 numi oppure
con 5 monete da 36 numi e 26 monete da 70 numi.

Esempio 2.9.3 Nella repubblica di San Josè, Phelipe possiede 5


biglietti da 2000 dinari, 34 monete da 250 dinari e 130 monete
2.10. IL TEOREMA CINESE DEL RESTO 75

da 180 dinari. Come può formare la somma di 40.000 dinari per


comprare il frigorifero?
Il modo di procedere è analogo al precedente, per cui detti x, y e
z, rispettivamente il numero di biglietti da 2000 dinari e di monete
da 250 e da 180 dinari che Phelipe deve usare per ottenere la somma
richiesta, deve aversi

2000x + 250y + 180z = 40.000.

Ora, l’ammontare di monete in possesso di Phelipe è di 8500 +


23400 = 31.900 dinari, per cui se usasse al più 4 biglietti da 2000
dinari raggiungerebbe al più 39900 e non potrebbe quindi realizzare
la somma di 40.000 dinari. Quindi x = 5. A questo punto avremo

250y + 180z = 30.000

ed il problema è esattamente analogo al caso precedente. Allora,


molto rapidamente, si ha

25y + 18z = 3000

cosı̀ in Z18 si ha [7][y] = [12] (l’inverso di [7] è [13]) da cui [y] =


[13][12] = [12]. Preso allora y0 = 12 e considerata l’equazione 300 +
18z = 3000 si ottiene z0 = 150. Per cui le soluzioni sono (y =
12 + 18h, z = 150 − 25h). Ma poiché Phelipe possiede 34 monete
da 250 dinari e 130 monete da 180 dinari, cioè y ≤ 34 e z ≤ 130,
si vede che l’unica possibilità si ha per h = 1. Per cui il frigorifero
può essere pagato da Phelipe solo con 5 biglietti da 2000 dinari, 30
monete da 250 dinari e 125 monete da 180 dinari.

2.10 Il Teorema cinese del resto


Consideriamo in Zn l’equazione [a][x] = [b] e vediamo quando essa
ammette soluzioni. È chiaro che se tale equazione ammette una
soluzione [m] allora deve essere am−b = λn ovvero am−λn = b, per
cui per la Proposizione 2.9.1 deve accadere che il M CD(a, n) = d
76 CAPITOLO 2. INSIEMI NUMERICI

divida b. In tal caso l’equazione [ ad ][x] = [ db ] ha in Z nd un’unica


soluzione (visto che [ ad ] è invertibile). Se [α] è tale soluzione in
Z nd allora le soluzioni della data equazione [a][x] = [b] in Zn sono
[α + λ nd ] per λ = 0, 1, . . . d − 1.
A questo punto ci occupiamo di un sistema di equazioni del tipo
[ai ][x] = [bi ] in Zni per i = 1, 2, . . . , t. Precisamente, ci poniamo la
seguente domanda: esiste x ∈ Z tale che soddisfi il sistema (di
congruenze)


 [a1 ][x] = [b1 ] in Zn1
[a2 ][x] = [b2 ] in Zn2

(T CR)

 ··· ··· ··· ···
[at ][x] = [bt ] in Znt ?

È chiaro che per avere soluzioni un siffatto sistema occorre che ognu-
na delle equazioni deve ammettere soluzioni e quindi il M CD(ai , ni )
deve dividere bi per ogni i = 1, 2, . . . , t. Sicché, dividendo ogni equa-
zione per il relativo di , possiamo supporre che nel sistema (TCR)
accada che M CD(ai , ni ) = 1 per ogni i. Allora essendo ogni [ai ]
invertibile in Zni possiamo moltiplicare ciascuna equazione per il
relativo inverso di [ai ], in definitiva il precedente sistema si può
trasformare nel sistema


 [x] = [c1 ] in Zn1
[x] = [c2 ] in Zn2

(T CR1)

 ··· ··· ··· ···
[x] = [ct ] in Znt

A questo punto siamo in grado di provare il seguente

Teorema 2.10.1 Teorema Cinese del Resto Se nel sistema di


congruenze (TCR) si ha M CD(ai , ni ) = 1 per ogni i = 1, 2, . . . , t e
M CD(ni , nj ) = 1 per i 6= j, allora esiste un intero in Z che soddisfa
tutte le equazioni del sistema. Inoltre, posto R = n1 n2 · . . . · nt e z
una soluzione del sistema, allora tutte le soluzioni del (TCR) sono
x = z + λR per ogni λ ∈ Z.
2.10. IL TEOREMA CINESE DEL RESTO 77

Dimostrazione. Come detto il sistema (TCR) si può trasformare


in un sistema (TCR1). Poniamo allora per ogni i, Ri = nRi ed os-
serviamo che M CD(Ri , ni ) = 1. Allora l’equazione [Ri ][x] = [ci ] in
Zni ha una soluzione, diciamo [xi ] (basta moltiplicare per l’inverso
di [Ri ] in Zni ). Poniamo allora s = R1 x1 + R2 x2 + . . . + Rt xt ∈ Z e
verifichiamo che s è una soluzione del sistema (TCR1). Ed infatti,
per ogni i, [s] in Zni diventa

[s] = [R1 x1 + R2 x2 + . . . + Rt xt ] = [Ri ][xi ] = [ci ]

dopo aver osservato che [Rj ] = [0] in Zni per ogni j 6= i e che [xi ]
è una soluzione dell’equazione [Ri ][x] = [ci ] in Zni . Per concludere,
se s e v sono due qualsiasi soluzioni del sistema (TCR1) allora
[v] − [s] = [0] in ogni Zni , cioè v − s è multiplo di ni per ogni i ed
essendo questi ultimi a due a due coprimi si ha che v − s è multiplo
di R = n1 n2 · . . . · nt , in definitiva v = s + λR.

Notiamo che la condizione M CD(ni , nj ) = 1, per i 6= j, del
Teorema Cinese del Resto è solo sufficiente, per cui, come vedremo,
potremo avere sistemi del tipi (TCR) in cui non vale la suddetta
condizione e tuttavia il sistema ammette soluzioni.

Esempio 2.10.2 La mia collezione di monete è distribuita in parti


uguali in 3 scatole (ciascuna contenente meno di 1000 monete).
Ho preso le monete da una scatola e le ho distribuite in gruppi di 7
monete e ne è rimasta una, lo stesso è capitato prendendo le monete
da due scatole e distribuendole in gruppi di 9 o prendendo tutte le
monete e distribuendole in gruppi di 10. Quante monete contiene
la mia collezione?
Per risolvere la questione, poniamo x il numero di monete con-
tenute in una scatola; dai dati del problema abbiamo il seguente
sistema 
 x = 1 in Z7
2x = 1 in Z9
3x = 1 in Z10

78 CAPITOLO 2. INSIEMI NUMERICI

da cui si ottiene

 x = 1 in Z7
x = 5 in Z9
x = 7 in Z10

Poniamo R = 7 · 9 · 10 = 630, R1 = 9 · 10 = 90, R2 = 7 · 10 = 70,


R3 = 7 · 9 = 63. Risolvendo R1 x = 1 in Z7 si ottiene x1 = 6;
risolvendo R2 x = 5 in Z9 si ottiene x2 = 2; risolvendo R3 x = 7 in
Z10 si ottiene x3 = 9. Allora tutte le soluzioni del sistema sono

x = 90 · 6 + 70 · 2 + 63 · 9 + 630λ = 1247 + 630λ

poiché in ogni scatola vi sono meno di 1000 monete deve essere


λ = −1 per cui x = 617. In definitiva la mia collezione contiene
1851 monete.

Esempio 2.10.3 Devo distribuire i francobolli della mia collezione


in certe bustine (ne ho 100 a disposizione). Ma se ne metto 8 per
bustina ne restano fuori 4, se ne metto 7 ne rimangono fuori 3
mentre se ne metto 6 per bustina ne rimangono 2. Sapendo che in
ogni caso ho usato almeno 50 bustine sapete dire quanto francobolli
posseggo?
Vogliamo utilizzare questo problema per illustrare il metodo di
sostituzione per la risoluzione dei sistemi di congruenze. Intanto
osserviamo che dai dati si deduce che il numero ricercato è compreso
tra 444 = 8 · 50 + 4 e 602 = 6 · 100 + 2. Cosı̀, posto x il numero di
francobolli si ha

 x = 4 in Z8
x = 3 in Z7
x = 2 in Z6

e 444 ≤ x ≤ 602. Osserviamo che M CD(8, 6) = 2 per cui il siste-


ma non è nelle ipotesi del Teorema cinese. Adesso, pensando che
2.10. IL TEOREMA CINESE DEL RESTO 79

la soluzione richiesta in particolare deve soddisfare le prime due


equazioni si ha 
x = 4 + 8h
x = 3 + 7k
ovvero 4 + 8h = 3 + 7k quindi 8h − 7k = −1, una cui soluzione
si ottiene per h = k = −1; per cui una soluzione delle prime due
equazioni deve essere del tipo x = −4 + 56m. Ma la soluzione deve
soddisfare anche la terza equazione, quindi x = 2 + 6n che unita
alla precedente uguaglianza porta a −4 + 56m = 2 + 6n ovvero
56m − 6n = 6 cioè 28m − 3n = 3 una cui soluzione si ottiene per
m = 0 ed n = −1. In definitiva, una soluzione è x = −4, ora poiché
la differenza tra due soluzioni deve essere multiplo sia di 56 che di
6 e quindi del loro minimo comune multiplo, tutte le soluzioni del
sistema sono x = −4 + 168λ. Per soddisfare le limitazioni imposte
dal problema bisognerà scegliere λ = 3 ottenendo cosı̀ x = 500
(notare che 444 ≤ −4 + 168λ ≤ 603 per cui 448 168
607
≤ λ ≤ 168 ).
Nota che se la terza equazione fosse stata x = 1 in Z6 , il sistema
non avrebbe avuto soluzioni!

Osservazione 2.10.4 Si prendano due numeri naturali coprimi m


ed n e si consideri l’applicazione f : Zmn → Zm × Zn definita
da f ([x]mn ) = ([x]m , [x]n ). Il Teorema cinese ci consente di ve-
rificare che tale applicazione è biiettiva. In effetti, la iniettività
segue semplicemente dal fatto che se f ([x]mn ) = f ([y]mn )) cioè
([x]m , [x]n ) = ([y]m , [y]n ) allora x − y = λm e x − y = µn quindi,
dato che m ed n sono coprimi, x − y = νmn e quindi [x]mn = [y]mn .
Mentre, per la suriettività, ci chiediamo se preso un qualunque
([a]m , [b]n ) ∈ Zm × Zn esiste un elemento [x]mn ∈ Zmn tale che
f ([x]mn ) = ([a]m , [b]n ), cioè cerchiamo un x in Z tale che

x = a in Zm
x = b in Zn
e l’esistenza di tale elemento ci è garantita dal Teorema cinese,
visto che m ed n sono coprimi.
80 CAPITOLO 2. INSIEMI NUMERICI

Possiamo utilizzare analogo discorso per provare la proprietà


P3 della funzione di Eulero, cioè se m ed n sono coprimi allo-
ra ϕ(mn) = ϕ(m)ϕ(n). Utilizzando la precedente legge f ([x]mn ) =
([x]m , [x]n ) si può vedere che essa fornisce una applicazione f :
Umn → Um × Un (ricordare che Ut indica l’insieme degli invertibili
di Zt ). Infatti, se [x]mn è invertibile in Zmn allora [x]m è invertibile
in Zm e [x]n è invertibile in Zn . Infine, come prima si vede che tale
applicazione è biiettiva, per cui |Umn | = |Um | · |Un |, da cui segue
quanto volevamo: ϕ(mn) = ϕ(m)ϕ(n).

2.11 Una applicazione alla Crittografia


Come ultima applicazione delle classi di resto ed in particolare del
Teorema di Eulero vogliamo illustrare un codice a chiave pubbli-
ca: tale codice permette di inviare un messaggio, ad esempio un
numero identificativo, codificato in maniera tale che possa essere
decodificato solo dal ricevente (anche se viene in possesso di terzi).
Vedremo che un siffatto codice si ottiene utilizzando il Teorema di
Eulero-Fermat e quindi delle classi di resto.
Uno dei problemi della teoria dei codici è quello di escogitare
delle procedure che permettano di inviare un messaggio ad un in-
terlocutore in maniera tale che possa essere letto solo dalla persona
cui il messaggio è indirizzato. Sin da piccoli abbiamo sperimentato
dei codici segreti, quali ad esempio quello di permutare le lettere
dell’alfabeto o quello di associare ad ogni lettera un numero. Ov-
viamente tali codici elementari sono facilmente decodificabili. Al-
lora si cercano codici che necessitano molto tempo e risorse, anche
con l’ausilio dei computer, per essere decodificati. L’idea fonda-
mentale che ha guidato per tanto tempo i “costruttori” di codici
consisteva nel fatto che trovare la fattorizzazione in fattori primi
di interi “molto grandi” (diciamo interi con centinaia o migliaia di
cifre) è praticamente impossibile (ovvero per siffatti numeri anche
un potente calcolatore di quell’epoca impiegava diversi anni per
trovarne la fattorizzazione). Sfruttando questo principio uno dei
2.11. UNA APPLICAZIONE ALLA CRITTOGRAFIA 81

più famosi codici fu escogitato da tre matematici americani intor-


no agli anni ’80. Ogni codice crittografico utilizza dei codici per
trasformare un messaggio in cifre. Uno dei più noti di questi è
il famoso codice ASCII (American Standard Code for Information
Interchange) che assegna alla lettera A il numero 065, alla B il nu-
mero 066 e cosı̀ via sino a Z = 090. Per cui, se ad esempio si volesse
spedire il messaggio “ALGEBRA” si dovrebbe spedire il numero
065076071069066082065. Ma, ovviamente se si spedisse il messag-
gio in questo modo chiunque sarebbe in grado di decifrarlo. Allora
si può operare in questa maniera. Indichiamo con U l’insieme di
tutti gli utenti che vogliono scambiarsi messaggi senza essere de-
codificati da persone diverse dal destinatario. Ogni utente u ∈ U
consegna una coppia di interi (nu , eu ) che sarà pubblicata in una
tabella disponibile a tutti, soddisfacente le seguenti due condizioni:

1. nu = pu ·qu , dove pu e qu sono due numeri primi (molto grandi


e noti solo ad u);

2. eu deve essere scelto primo con pu − 1 e qu − 1.

Sottolineiamo che, mentre le coppie (nu , eu ) sono di dominio pub-


blico, i primi pu e qu che fattorizzano nu sono noti solo all’utente u.
Supponiamo allora che l’utente a debba mandare il messaggio M
(già in codice ASCII) all’utente b. Per prima cosa, a codifica il mes-
saggio M in questo modo: dopo aver controllato nella tabella pub-
blica la coppia corrispondente all’utente destinatario b, suddivide il
messaggio M in M = M1 M2 . . . Mt in modo che ogni Mi sia minore
di nb ed invia i singoli messaggi Mi ; sicchè si può supporre che il
messaggio M da inviare sia minore di nb . Inoltre, si può aggiungere
al messaggio una cifra (non significativa per il messaggio) in modo
tale che il messaggio M da inviare sia primo con nb . A questo punto
a codifica il messaggio M da inviare calcolando M 0 = M eb in Znb .
A questo punto a manda il messaggio M 0 a b (messaggio che natu-
ralmente può essere intercettato da chiunque). L’utente b ricevuto
il messaggio M 0 sarà l’unico in grado di decodificare il messaggio
(cioè di dedurre che il vero messaggio inviato è M !). L’utente b
82 CAPITOLO 2. INSIEMI NUMERICI

inizia la decodifica: osservato che ϕ(nb ) = (pb − 1)(qb − 1) (nota


che solo b conosce ϕ(nb )) e che eb è stato scelto primo con (pb − 1)
e (qb − 1) quindi con ϕ(nb ), b può determinare l’inverso db di eb in
Zϕ(nb ) . Verifichiamo adesso che M 0db in Znb è proprio M (ed essendo
M < nb b avrà ricevuto correttamente il messaggio inviato da a).
M 0db = M eb db = M 1+λϕ(nb ) = M (M ϕ(nb ) )λ = M · 1λ = M
avendo usato l’eguaglianza M ϕ(nb ) = 1 in Znb dovuta al Teorema di
Eulero-Fermat.

Esempio 2.11.1 Supponiamo che il codice identificato del nostro


bancomat sia 142. Tale codice deve essere letto dalla nostra Banca
la cui coppia identificativa (nota a tutti) sia (221, 5) (qui stiamo
supponendo numeri di poche cifre per cui è facile ottenere la fatto-
rizzazione di 221 = 13 · 17 ma nella pratica il numero scelto sarà
prodotto di due primi costituiti ciascuno da migliaia di cifre in mo-
do tale che la sua fattorizzazione sia impossibile anche attraverso
velocissimi computers). Nella nostra carta bancomat apparirà non
142 bensı̀ 194 (che è stato ottenuto come 1425 in Z221 ). Il lettore
del bancomat della nostra Banca, poiché conosce ϕ(221) = 192 (gli
altri non conoscono tale numero perché conoscono 221 ma non la
sua fattorizzazione), sa che in Z192 5 ha per inverso 77 per cui de-
codifica il codice identificativo della nostra carta potendo fare 19477
in Z221 . Osservato che 5 · 77 = 1 + 192h e che per il Teorema di
Eulero-Fermat 142192 = 1 in Z221 , si può concludere che il lettore
del bancomat leggerà in Z221 :
19477 = (1425 )77 = 1421+192h = 142 · (142192 )h = 142.

2.12 L’insieme dei numeri razionali


Ricordiamo che abbiamo costruito i numeri interi relativi per po-
ter disporre dell’opposto di ogni elemento, proprietà che non valeva
nell’insieme dei numeri naturali. Adesso vogliamo costruire un in-
sieme in cui immergere Z e dove ogni elemento non nullo abbia
2.12. L’INSIEME DEI NUMERI RAZIONALI 83

l’inverso. Tale insieme, che sarà costruito utilizzando una tecnica


analoga a quella usata per costruire Z, sarà l’insieme dei numeri
razionali che sarà indicato con Q.
Consideriamo allora Z × Z∗ e stabiliamo in tale insieme la se-
guente relazione

(a, b) ≡ (c, d) ⇔ ad = bc.

Si verifica facilmente che questa è una relazione di equivalenza e na-


sce, quindi, l’insieme quoziente (cioè l’insieme delle classi di equiva-
lenza) Q = Z×Z∗ / ≡ . La classe di equivalenza [(a, b)] sarà indicata
con ab , e sarà detta frazione. Cosı̀ Q è l’insieme di tutte le frazioni
ed è detto l’insieme dei numeri razionali.
Anche in questo caso per poter considerare Q un insieme nume-
rico occorre definire le operazioni di addizione e prodotto e verificare
che esse soddisfino alcune proprietà. Allora definiamo
a c a c ad + bc
Per ogni , ∈Q ⇒ + = ,
b d b d bd
e
a c a c ac
Per ogni , ∈Q ⇒ · = .
b d b d bd
Naturalmente si può verificare che le definizioni precedenti non
dipendono dalla coppia all’interno della classe di equivalenza (o
frazione), cioè:
a a0 c c0 ad + bc a0 d 0 + b 0 c 0
se = 0, = 0 allora =
b b d d bd b0 d 0
e
a a0 c c0 ac a0 c 0
se = 0, = 0 allora = 0 0.
b b d d bd bd
Vediamo adesso le proprietà di cui godono queste due operazioni in
Q.

1. (commutatività dell’addizione)
a c c a
+ = + ;
b d d b
84 CAPITOLO 2. INSIEMI NUMERICI

2. (associatività dell’addizione)
a c e a c e
( + ) + = + ( + );
b d f b d f

3.
a 0 a
+ =
b d b
0
( d è elemento neutro per l’addizione);

4.
a −a 0
+ =
b b b
a −a
(ogni elemento b
ha l’opposto b );

1’ (commutatività del prodotto)


a c c a
· = · ;
b d d b

2’. (associatività del prodotto)


a c e a c e
( · ) · = · ( · );
b d f b d f

3’.
a 1 a
· =
b 1 b
1
( 1 è elemento neutro o unità per il prodotto);
a
4’. se b
con a 6= 0 allora
a b 1
· =
b a 1
a 0
(ogni elemento b
6= b
ha l’inverso ab );

5. (distributività del prodotto rispetto all’addizione)


a c e a c a e
·( + )= · + · .
b d f b d b f
2.12. L’INSIEME DEI NUMERI RAZIONALI 85

Il fatto che Q con le due operazioni goda delle precedenti 9 proprietà


si esprime dicendo che Q è un campo.
Osserviamo a questo proposito che anche Zp , con p primo, è un
campo.
Per provare che nel passaggio dagli interi relativi ai numeri ra-
zionali abbiamo semplicemente ampliato l’insieme numerico su cui
lavorare, dobbiamo mostrare come Z si possa “immergere”in Q,
cioè si tratta di trovare una applicazione iniettiva f : Z → Q tale
che
f (x + y) = f (x) + f (y) per ogni x, y ∈ Z;

f (x · y) = f (x) · f (y) per ogni x, y ∈ Z;


Definiamo a questo scopo, per ogni x ∈ Z
x
f (x) = .
1
In effetti, f è iniettiva, perché
x y
f (x) = f (y) ⇒ = ⇒ x = y;
1 1
d’altra parte,
x+y x y
f (x + y) = = + = f (x) + f (y)
1 1 1
e
xy x y
f (x · y) = = · = f (x) · f (y).
1 1 1
Ricordiamo, infine, che su Z abbiamo definito una relazione d’or-
dine che lo rende un anello ordinato. Osserviamo intanto che, es-
sendo ab = −a
−b
, possiamo sempre supporre che in una frazione ab sia
b > 0. In questo contesto, in Q definiamo questa relazione d’ordine
a c
≤ , con b, d > 0, ⇔ ad ≤ bc.
b d
Poiché tale relazione d’ordine (totale) gode delle due proprietà
(compatibilità rispetto alle operazioni):
86 CAPITOLO 2. INSIEMI NUMERICI

a c a x c
se b
≤ d
⇒ b
+ y
≤ d
+ xy ,
a c x a x c
se b
≤ d
e y
≥0⇒ b
· y
≤ d
· xy ,
in questo senso diremo che Q è un campo ordinato.

2.13 Cenni sul campo dei numeri reali


Nel campo dei numeri razionali Q possiamo risolvere tutte le equa-
zioni algebriche di 1o grado ax = b :
• se a 6= 0, detto a−1 l’inverso di a, l’equazione ammette come
unica soluzione x = ba−1 ;
• se a = 0 allora l’equazione è impossibile se b 6= 0 o indetermi-
nata se b = 0.
Ma ad esempio in Q non si hanno soluzioni per equazioni di 2o
grado come x2 − 2 = 0.
Occorre costruire un campo, in cui Q si possa immergere, in cui
equazioni di questo tipo ammettano soluzioni. Diamo qui un cenno
sulla costruzione del campo dei numeri reali.

Definizione 2.13.1 Si chiama sezione del campo dei numeri ra-


zionali un sottoinsieme non banale A di Q tale che:
∗ per ogni a ∈ A se b è un numero razionale con b < a, allora
b ∈ A,

∗ A non ha massimo.

L’insieme R di tutte le sezioni dei numeri razionali si chiama in-


sieme dei numeri reali. Su tale insieme si definiscono poi le
operazioni di addizione e prodotto che godono delle stesse 9 pro-
prietà già viste per Q. Per cui R rispetto a tali operazioni costituirà
un campo. Inoltre su R si definisce una relazione d’ordine totale che
lo rende un campo ordinato. Poi facilmente si riesce ad immergere
Q in R: basta associare ad ogni numero razionale q il numero reale
costituito dalla sezione A = {x ∈ Q | x < q}.
2.14. IL CAMPO C DEI NUMERI COMPLESSI 87

2.14 Il campo C dei numeri complessi


Ma anche il campo dei numeri reali non risulta sufficiente a risolvere
tutte le possibili equazioni algebriche, ad esempio x2 + 2 = 0 non
ammette soluzioni reali. Sicché si costruisce un nuovo ampliamento
in cui si possano risolvere altre equazioni (possibilmente tutte).
La costruzione in questo caso è molto semplice.

Definizione 2.14.1 Definiamo insieme dei numeri complessi, l’in-


sieme C = R × R.

Ovviamente anche in questo caso dobbiamo definire le operazioni


di addizione e prodotto che rendano C un campo. Precisamente,

(a, b) + (c, d) = (a + c, b + d) per ogni (a, b), (c, d) ∈ C;


(a, b) · (c, d) = (ac − bd, ad + bc) per ogni (a, b), (c, d) ∈ C;

Anche in questo caso si prova facilmente che sono soddisfatte le


9 condizioni per rendere C un campo, detto appunto il campo
dei numeri complessi. In effetti, a parte le semplici verifiche,
osserviamo che l’elemento neutro dell’addizione è (0, 0), l’elemento
unità è (1, 0), mentre l’inverso dell’elemento non nullo (a, b) è il
a −b
numero ( a2 +b 2 , a2 +b2 ).

Naturalmente, R si può immergere in C: consideriamo l’appli-


cazione ϕ : R → C che associa ad ogni numero reale α il numero
complesso (α, 0). Essendo tale applicazione chiaramente iniettiva,
basterà verificare che ϕ(α+β) = ϕ(α)+ϕ(β) e ϕ(α·β) = ϕ(α)·ϕ(β).
Infatti, (α + β, 0) = (α, 0) + (β, 0) e (α · β, 0) = (α, 0) · (β, 0).
Alla luce della suddetta immersione si può identificare il numero
complesso (a, 0) con il numero reale a.
Adesso consideriamo il numero complesso (0, 1) ed osserviamo
che

(0, 1)(0, 1) = (−1, 0)


cosı̀, se indichiamo (0, 1) = i, possiamo scrivere i2 = −1.
88 CAPITOLO 2. INSIEMI NUMERICI

D’altra parte,

(a, b) = (a, 0) + (0, b) = (a, 0) + (0, 1)(b, 0) = a + ib

questo modo di esprimere un numero complesso si dice forma al-


gebrica del numero complesso. La forma algebrica dei numeri
complessi si rivela utile nel calcolare il prodotto tra due numeri
complessi, infatti

(a + ib)(c + id) = ac + iad + ibc + i2 bd = ac − bd + i(ad + bc).

Utilizziamo questa forma per vedere come abbiamo determinato


l’inverso del numero complesso non nullo a + ib :

(a + ib)(x + iy) = 1 ⇒ ax − by + i(ay + bx) = 1

da cui x, y devono soddisfare il sistema



ax − by = 1
bx + ay = 0

e la soluzione di questo sistema è come detto


a

x = a2 +b 2
−b
y = a2 +b2

Purtroppo in C non possiamo definire un ordinamento (che estenda


quello di R) che renda C un campo ordinato: infatti, poiché in un
campo ordinato l’ordinamento è compatibile con le operazioni, ne
segue che per ogni elemento x si ha

1. x2 ≥ 0;

2. se x < 0 allora −x > 0.

Ma allora si avrebbe in C una contraddizione: infatti,

−1 = i2 > 0;
2.14. IL CAMPO C DEI NUMERI COMPLESSI 89

1 = 12 > 0.

Per cui C non è un campo ordinato.


L’importanza dei numeri complessi sta nel più importante teo-
rema di Algebra di cui diamo adesso solo l’enunciato (anche se
nell’enunciato utilizzeremo concetti che saranno definiti in seguito).

Teorema 2.14.2 (Teorema fondamentale dell’Algebra). Ogni


equazione algebrica a coefficienti complessi ammette almeno una so-
luzione in C. Più precisamente, ogni equazione di grado d ammette
d soluzioni in C (se contate con la dovuta molteplicità).

Nel seguito, se z = a + ib è un numero complesso il numero


z = a − ib sarà detto il coniugato di z. Notiamo che z + z = 2a e
z · z = a2 + b2 sono numeri reali. Inoltre

z = z;

z + y = z + y;

z · y = z · y;

Il numero reale kzk = z · z = a2 + b2 si chiama la norma di z.


Per quanto riguarda la norma sono semplici proprietà

kzk ≥ 0 e kzk = 0 se e solo se z = 0.

kzz 0 k = kzkkz 0 k.

|kzk − kz 0 k| ≤ kz + z 0 k ≤ kzk + kz 0 k (proprietà triangolare).

Abbiamo visto che la forma algebrica dei numeri complessi si


presta bene per eseguire addizioni e moltiplicazioni. Ma se dovessi-
mo eseguire la potenza di un numero complesso, del tipo (a+ib)n , la
questione diventerebbe più complicata. Allora vediamo come pos-
siamo semplificare la questione. Per fare ciò osserviamo che ogni
numero complesso si può pensare come le coordinate di un punto
P = (a, b) del piano cartesiano. A questo punto, posto ρ = OP ,
90 CAPITOLO 2. INSIEMI NUMERICI

che verrà detto il modulo del numero complesso e posto ϑ l’angolo



che l’asse x forma con il vettore OP, che verrà detto argomento (o
anomalia) del numero complesso, si ha

a = ρ cos ϑ
~y
b = ρ sin ϑ
per cui il numero complesso può scriversi nella forma Pρ(cos
= (a,
ϑ b)
+
ρ
i sin ϑ), che viene detta la forma trigonometrica di un numero
complesso. ϑ
O ~x

Osserviamo che due numeri complessi ρ(cos ϑ+i sin ϑ) e ρ0 (cos ϑ0 +


i sin ϑ0 ) risultano uguali quando ρ = ρ0 e ϑ − ϑ0 = 2πλ, con λ ∈ Z
(visto che cos ϑ = cos ϑ0 e sin ϑ = sin ϑ0 , contemporaneamente, se e
solo se gli angoli differiscono di un multiplo di un angolo giro). No-
tiamo ancora che, da semplici teoremi di√ trigonometria si ha che se
a+ib è un numero complesso, allora ρ = a2 + b2 mentre cos ϑ = aρ
e sin ϑ = ρb .
Se adesso proviamo a moltiplicare due numeri complessi in for-
ma trigonometrica si ottiene

[ρ(cos ϑ + i sin ϑ)][ρ0 (cos ϑ0 + i sin ϑ0 )] =

ρρ0 [(cos ϑ cos ϑ0 − sin ϑ sin ϑ0 ) + i(cos ϑ sin ϑ0 − sin ϑ cos ϑ0 )] =


ρρ0 (cos(ϑ + ϑ0 ) + i sin(ϑ + ϑ0 )).
Questa formula, detta formula di De Moivre, permette di cal-
colare facilmente le potenze e l’inverso di un numero complesso
espresso in forma trigonometrica:

[ρ(cos ϑ + i sin ϑ)]n = ρn (cos nϑ + i sin nϑ)]

[ρ(cos ϑ + i sin ϑ)]−1 = ρ−1 (cos(−ϑ) + i sin(−ϑ)).


2.14. IL CAMPO C DEI NUMERI COMPLESSI 91

Esempio 2.14.3

√ √ √ √
1. Calcolare (− 2+i 2)8 : osservato che (− 2+i 2) = 2(cos 3π
4
+

i sin 4 ), si ha
√ √ 3π 3π
(− 2+i 2)8 = [2(cos +i sin )]8 = 256(cos 6π+i sin 6π) = 256.
4 4
√ √
2. Calcolare (1 − i 3)6 : osservato che (1 − i 3) = [2(cos −π
3
+
−π
i sin 3 )], si ha
√ −π −π 6
(1−i 3)6 = [2(cos +i sin )] = 64(cos(−2π)+i sin(−2π)) = 64
3 3
√ √
3. Determinare l’inverso di 2( 3 + i) : osservato che 2( 3 + i) =
[4(cos π6 + i sin π6 )], si ha
√ π π
[2( 3 + i)]−1 = [4(cos + i sin )]−1 =
6 6

1 −π −π 1 3 1 1 √
(cos + i sin )= ( − i ) = ( 3 − i).
4 6 6 4 2 2 8
La precedente formulazione dei numeri complessi permette di dare
una risposta alla seguente questione, che si può vedere come un
caso particolare del più generale TFA.
Se α è un numero complesso non nullo ed n un intero, quanti
sono i numeri complessi x che elevati ad n danno α? Ricordiamo a
tal proposito che la stessa questione posta sull’insieme dei numeri
reali aveva una risposta articolata funzione sia di α che della parità
del numero n. Infatti, in questo caso la risposta è

• se α >
√ 0 ed n è pari allora di siffatti numeri (reali) ve ne sono
2 : ± α;
n

• se α > 0 ed
√ n è dispari allora di siffatti numeri (reali) ve n’è
solo uno: α;
n
92 CAPITOLO 2. INSIEMI NUMERICI

• se α < 0 ed n è pari allora di siffatti numeri (reali) non ve ne


sono;

• se α < 0 ed √
n è dispari allora di siffatti numeri (reali) ve n’è
solo uno: − n −α.

Vediamo di dare la risposta al problema nel caso dei numeri


complessi, in cui in pratica si tratta di trovare quei numeri complessi
x tali che
xn = α
che saranno chiamati le radici n-esime di α. Per fare ciò, scriviamo
sia il numero complesso dato α, che quello incognito x in forma
trigonometrica: α = ρ(cos ϑ + i sin ϑ) ed x = z(cos y + i sin y).
Poiché xn = α si ha

[z(cos y + i sin y)]n = ρ(cos ϑ + i sin ϑ)

cioè
z n (cos ny + i sin ny) = ρ(cos ϑ + i sin ϑ)

da cui segue z = n ρ (ricordato che sia z che ρ sono positivi), e
ny − ϑ = 2λπ, ovvero y = ϑ+2λπ n
, con λ ∈ Z.
A prima vista sembrerebbe di aver trovato infiniti numeri com-
plessi che soddisfino quella equazione, in effetti faremo vedere che
di essi solo n sono distinti e tutti gli altri coincidono con essi. Più

precisamente, posto xλ = n ρ(cos ϑ+2λπ n
+ i sin ϑ+2λπ
n
), facciamo ve-
dere che, ad esempio, x0 , x1 , . . . , xn−1 sono tutti distinti ed ogni xh
deve coincidere con uno di essi. Infatti, se 0 ≤ u < v ≤ n − 1 allora
xu 6= xv : se per assurdo fosse xu = xv , allora ϑ+2uπ n
− ϑ+2vπ
n
= 2µπ
il che porterebbe a u − v = µn una contraddizione col fatto che u
e v sono distinti e minori di n. Prendiamo adesso un xh qualsiasi,
dall’algoritmo di divisione si ha che h = qn+r con 0 ≤ r < n; allora
xh = xr . Infatti, ϑ+2hπ
n
− ϑ+2rπ
n
= 2(h−r)π
n
= 2qnπ
n
= 2qπ. In definitiva,
abbiamo provato il TFA per le equazioni del tipo xn − a = 0.
2.14. IL CAMPO C DEI NUMERI COMPLESSI 93

Esempio 2.14.4 Cerchiamo le radici seste di −1. Osservato che


−1 = cos π + i sin π si ha xλ = cos π+2λπ
6
+ i sin π+2λπ
6
; pertanto le 6
radici seste sono

3
x0 = cos π6 + i sin π6 = 2
+ i 21 ;

x1 = cos π2 + i sin π2 = i;

3
x2 = cos 5π
6
+ i sin 5π
6
=− 2
+ i 12 ;

x3 = cos 7π
6
+ i sin 7π
6
= − 23 − i 12 ;

x4 = cos 3π
2
+ i sin 3π
2
= −i;

3
x5 = cos 11π
6
+ i sin 11π
6
= 2
− i 12 .

Un caso particolare riguarda le radici n−esime dell’unità, cioè


le soluzioni dell’equazione xn = 1. Esse si ottengono, dopo aver
osservato che 1 = cos 0 + i sin 0, da uλ = cos 2λπ n
+ i sin 2λπ
n
, per λ =
0, 1, . . . , n−1. Le n radici n−esime dell’unità hanno la particolarità
che
uλ uµ = u[λ+µ]
dove [λ + µ] ∈ Zn . Questa proprietà ci permetterà di trattare l’in-
sieme delle radici n−esime dell’unità, rispetto alla moltiplicazione,
come Zn rispetto all’addizione (cosa che vedremo meglio quando
studieremo la teoria dei gruppi).
94 CAPITOLO 2. INSIEMI NUMERICI
Capitolo 3

Teoria dei polinomi

3.1 Funzioni polinomiali


Consideriamo uno degli insiemi numerici che costituiva un campo
(cioè Q, R, C o Zp ) ed indichiamolo semplicemente con K.

Definizione 3.1.1 Diremo funzione polinomiale sul campo K


una qualunque applicazione f : K → K tale che esiste un d ∈ N e
d+1 elementi in K, a0 , a1 , . . . , ad , tali che ogni x ∈ K ha immagine
f (x) = a0 + a1 x + a2 x2 + . . . + ad xd ∈ K.

Consideriamo adesso l’insieme FK di tutte le funzioni polino-


miali su K. Definiamo su FK le seguenti due operazioni.
- Addizione: per ogni f, g ∈ FK definiamo f + g : K → K
l’applicazione definita da

(f + g)(x) = f (x) + g(x)

notiamo che f +Pg è una funzione polinomiale;


P infatti, ise f (x) =
i i
P
ai x e g(x) = bi x , allora (f + g)(x) = (ai + bi )x .
Vediamo le proprietà di cui gode tale operazione di addizione.

1. L’operazione + è associativa: se f, g, h ∈ FK allora (f + g) +


h = f + (g + h) (verifica elementare);

95
96 CAPITOLO 3. TEORIA DEI POLINOMI

2. l’operazione + è commutativa: se f, g ∈ FK allora f + g =


g + f (verifica elementare);

3. l’elemento neutro per l’operazione + è la funzione polinomiale


nulla, Ω, cioè quella che manda ogni x in 0; infatti f + Ω =
Ω + f = f;

4. ogni elemento f ∈ FK ammette l’opposto −f definito da


(−f )(x) = −f (x) cioè la funzione polinomiale che ha per
coefficienti gli opposti di quelli di f (x);

Cosı̀ FK rispetto all’addizione costituisce un gruppo abeliano.


- Moltiplicazione: per ogni f, g ∈ FK definiamo f g : K → K
l’applicazione definita da

(f g)(x) = f (x)g(x)

notiamo che f g P
è una funzione polinomiale,
P iinfatti, se f (x) =
i i
P
ai x e g(x) = bi x , allora (f g)(x) = ci x , dove
c 0 = a0 b 0 ;

c 1 = a0 b 1 + a1 b 0 ;

c 2 = a0 b 2 + a1 b 1 + a2 b 0 ;

......;
Pm
cm = a0 bm + a1 bm−1 + . . . + am b0 = i=0 ai bm−i ;

......
Vediamo le proprietà di cui gode tale operazione di moltiplica-
zione.

5. La moltiplicazione è associativa: se f, g, h ∈ FK allora (f g)h =


f (gh) (verifica elementare);

6. la moltiplicazione è commutativa: se f, g ∈ FK allora f g = gf


(verifica elementare);
3.1. FUNZIONI POLINOMIALI 97

7. l’elemento neutro per la moltiplicazione è la funzione poli-


nomiale 1, cioè quella per cui f (x) = 1 per ogni x; infatti
f 1 = 1f = f ;

8. la moltiplicazione è distributiva rispetto all’addizione cioè se


f, g, h ∈ FK allora f (g + h) = f g + f h.

tutte le 8 proprietà si riassumono dicendo che FK rispetto alle


due operazioni costituisce un anello commutativo unitario, detto
l’anello delle funzioni polinomiali su K.
In effetti, siccome è facile verificare che vale anche la legge del-
l’annullamento del prodotto (ovvero che non vi sono divisori dello
zero di cui parleremo in seguito), FK è anche un dominio d’integrità.
Ma cosa c’entrano le funzioni polinomiali con i polinomi come
siamo soliti immaginare per averli studiati nelle scuole superiori?
Ricordiamo che un polinomio su K ci fu presentato come una
espressione formale del tipo

f (x) = a0 + a1 x + . . . + ad xd

dove x è semplicemente un simbolo (nelle funzioni polinomiali era


un elemento di K) detta indeterminata. Se indichiamo con K[x]
l’insieme di tutte queste espressioni formali o polinomi, e definiamo
su K[x] le operazioni di somma e prodotto tra polinomi come si è
fatto a scuola, si ottiene l’anello dei polinomi su K.
Apparentemente sembra che, a meno del simbolismo, si sia scrit-
to la stessa cosa. Ma, in generale non è cosı̀. Infatti, c’è una na-
turale applicazione ϕ : K[x] → FK , precisamente quella che al
polinomio f (x) = a0 + a1 x + . . . + ad xd associa la funzione polino-
miale ϕ(f ) che manda α in f (α) = a0 + a1 α + . . . + ad αd . Uno si
augurerebbe che ϕ risulti biiettiva e che conservi le operazioni (o co-
me suol dirsi costituisca un isomorfismo), ma vedremo nel prossimo
esempio che in generale tale applicazione non è iniettiva.

Esempio 3.1.2 Consideriamo nell’anello dei polinomi Z3 [x] i due


polinomi f (x) = 1 + 2x e g(x) = 1 + x + x3 . Ovviamente que-
98 CAPITOLO 3. TEORIA DEI POLINOMI

sti sono due polinomi diversi, vediamo quali funzioni polinomiali


corrispondono a tali polinomi.

 1 + 0 = 1 se a = 0
ϕ(f )(a) = 1 + 2 = 0 se a = 1
1 + 4 = 2 se a = 2


 1+0+0=1 se a = 0
ϕ(g)(a) = 1 + 1 + +1 = 0 se a = 1
1+2+8=2 se a = 2

in definitiva ϕ(f ) = ϕ(g).

L’esempio precedente mostra che l’anello delle funzioni polino-


miali e quello dei polinomi non coincidono, ma ciò capita per i
campi finiti. Vedremo, invece, che se K è un campo infinito allora
i due concetti coincidono, ovvero ϕ è un isomorfismo.

3.2 Polinomi: definizione formale


Diamo adesso una definizione più precisa di polinomio e dell’anello
dei polinomi.
Consideriamo un campo K e una successione di elementi di K,
cioè una applicazione s : N → K, che indicheremo con s(0) =
s0 , s(1) = s1 , . . . s(n) = sn . . . Indichiamo con SK l’insieme di queste
successioni. Adesso consideriamo il sottoinsieme PK di SK formato
dalle successioni definitivamente nulle, cioè

PK = {s = (sn )n | si = 0 per i >> 0}.

(Nota che dire che si = 0 per i >> 0 significa che esiste un indice
d tale che si = 0 per ogni i ≥ d.).
Un elemento di PK verrà detto polinomio (in una indeterminata
su K). Vediamo di definire le operazioni in PK
- Addizione: se s, t ∈ PK , s = (sn )n e t = (tn )n , allora definiamo
s+t = (sn +tn )n , che è ancora una successione definitivamente nulla;
3.2. POLINOMI: DEFINIZIONE FORMALE 99

- Moltiplicazione: se s, t ∈ PP K , s = (sn )n e t = (tn )n , allora


definiamo s·t = (pn )n , dove pn = ni=o si tn−i , che è una successione
definitivamente nulla in quanto se si = 0 per i > d e ti = 0 per
i > d0 allora pi = 0 per i > d + d0 .
Non è difficile provare che (PK , +, · ) gode delle solite prorprietà
che lo rendono un anello commutativo unitario: nota che lo 0 è la
successione 0 = (0, 0, . . . , 0, . . .) l’unità è 1 = (1, 0, 0, . . . , 0, . . .).
Vediamo come questi oggetti si possano riguardare come i poli-
nomi che ci sono familiari e di cui abbiamo parlato in precedenza.
Per questo scopo facciamo queste semplici posizioni:

le successioni del tipo (a, 0, 0, . . . , 0, . . .) le indicheremo con a;

la successione (0, 1, 0, . . . , 0, . . .) la indicheremo con x;

osservato poi che

(0, 1, 0, . . . , 0, . . .) · (0, 1, 0, . . . , 0, . . .) = (0, 0, 1, . . . , 0, . . .),

indicheremo quest’ultima successione con x2 ;

più in generale la successione (0, 0, 0, . . . , 1, 0, . . .), con 1 nel


posto n (ricordiamo che i posti partono da 0), sarà indicata
con xn .

Ora osserviamo che un qualsiasi elemento di PK , ovvero ogni “po-


linomio” si può esprimere nella forma

(a0 , a1 , a2 , . . . , ad , 0, 0, . . .) = (a0 , 0, 0, . . .)+(a1 , 0, 0, . . .)(0, 1, 0, . . .)+

(a2 , 0, 0, . . .)(0, 0, 1, 0 . . .) + . . . + (ad , 0, 0, . . .)(0, 0, 0, . . . , 1, 0, . . .).


Alla luce delle posizioni fatte allora potremo scrivere

(a0 , a1 , a2 , . . . , ad , 0, 0, . . .) = a0 + a1 x + a2 x2 + . . . + ad xd

esattamente come siamo soliti vedere un polinomio!!


A questo punto potremo identificare PK e K[x].
100 CAPITOLO 3. TEORIA DEI POLINOMI

Dato un polinomio non nullo f (x) (comunque lo si interpreti),


diremo grado del polinomio l’intero d = deg f (x) = max{i | ai 6=
0}
Ad esempio il polinomio f (x) = 5 + 4x ha grado 1; il polinomio
g(x) = 5 ha grado 0; il polinomio h(x) = 3+0x+7x2 −3x3 +0x4 +0x5
ha grado 3.
Osserviamo che al polinomio nullo non abbiamo assegnato alcun
grado!
Quali sono gli elementi invertibili nell’anello dei polinomi K[x]?

Proposizione 3.2.1 Gli unici elementi invertibili in K[x] sono i


polinomi di grado 0, (cioè le costanti non nulle).
Dimostrazione. Sia f (x) = a0 + a1 x + a2 x2 + . . . + ad xd un
polinomio invertibile, bisogna provare che ai = 0 per i > 0. Diciamo
g(x) = b0 +b1 x+b2 x2 +. . .+bh xh l’inverso di f (x) di grado h (anche
0) quindi bh 6= 0. Allora da f (x)g(x) = 1, segue
se d > 0, ad bh = 0 ⇒ ad = 0;
se d − 1 > 0, ad−1 bh + ad bh−1 = 0 ⇒ ad−1 = 0;
......
se i > 0, ai bh + ai+1 bh−1 + . . . ad bh−d+i = 0 ⇒ ai = 0.

Cosı̀ in Z7 [x] vi sono 6 polinomi invertibili (in generale in Zp [x]
vi sono p − 1 polinomi invertibili, se p è primo), mentre in R[x] vi
sono infiniti polinomi invertibili.

3.3 Divisibilità nei polinomi


Vogliamo adesso ripercorrere, fin dove possibile, il percorso effettua-
to sull’anello degli interi relativi riguardo la divisibilità. Vedremo
che le cose si ripetono punto per punto.
3.3. DIVISIBILITÀ NEI POLINOMI 101

Intanto in K[x] diremo che f (x) divide g(x) (o che g(x) è mul-
tiplo di f (x)) se esiste h(x) tale che g(x) = f (x)h(x).
Due polinomi f (x) e g(x) che si dividono l’un l’altro si dicono
associati ed in tal caso f (x) = g(x) · u e g(x) = f (x) · v dove u, v
sono dei polinomi costanti.
Un polinomio p(x) si dice primo se dal fatto che divide f (x)g(x)
segue che divide f (x) o g(x).
Un polinomio q(x) si dice irriducibile se i suoi soli divisori sono
gli invertibili ed i suoi associati, ovvero se q(x) = a(x)b(x) allora
a(x) o b(x) è una costante.
Anche in K[x], come in Z, i due concetti di primo ed irriducibile
coincidono, cioè f (x) è primo se e solo se è irriducibile.

Proposizione 3.3.1 (Algoritmo di divisione)


Siano f (x), g(x) ∈ K[x], con g(x) 6= 0, allora esistono q(x) ed
r(x) in K[x] tali che f (x) = q(x)g(x) + r(x), dove r(x) = 0 oppure
deg r(x) < deg g(x).

Dimostrazione. Diciamo f (x) = a0 + a1 x + . . . + am xm e g(x) =


b0 + b1 x + . . . + bn xn (bn 6= 0). Se f (x) = 0 il risultato è banale,
basterà prendere q(x) = r(x) = 0. Cosı̀ possiamo senz’altro sup-
porre che f (x) 6= 0 e lavorare per induzione su m = deg f (x). Se
m < n (base dell’induzione) la tesi è vera prendendo q(x) = 0 e
r(x) = f (x). Supponiamo quindi m ≥ n e facciamo l’ipotesi indut-
tiva che il teorema sia vero per polinomi dividendi di grado minore
di m. Costruiamo il seguente polinomio

F (x) = f (x) − am b−1


n x
m−n
g(x)

(b−1
n è l’inverso di bn 6= 0 ed esiste perché K è un campo) è fa-
cile vedere che il coefficiente del termine di grado m del secondo
termine in F (x) è −am , ciò comporta che F (x) ha coefficiente 0
in grado m ovvero il suo grado è minore di m. Possiamo applicare
ad F (x) l’ipotesi induttiva per cui esistono q 0 (x) ed r(x) tali che
F (x) = q 0 (x)g(x) + r(x) con r(x) = 0 oppure deg r(x) < deg g(x).
102 CAPITOLO 3. TEORIA DEI POLINOMI

Sostituendo il valore di F (x) si ha


f (x) − am b−1
n x
m−n
g(x) = q 0 (x)g(x) + r(x) ⇒
f (x) = (am bn−1 xm−n + q 0 (x))g(x) + r(x)
la nostra tesi segue allora per q(x) = am b−1
n x
m−n
+ q 0 (x).

Notiamo che nella precedente dimostrazione abbiamo usato pesan-
temente il fatto che K è un campo.

Definizione 3.3.2 Se f (x), g(x) ∈ K[x] sono due polinomi non


nulli diremo massimo comune divisore di f (x) e g(x) un poli-
nomio d(x) = M CD(f (x), g(x)) tale che
1. d(x) divide sia f (x) che g(x);
2. se d0 (x) divide sia f (x) che g(x) ⇒ d0 (x) divide d(x).

In virtù dell’algoritmo appena provato possiamo costruire, in ma-


niera analoga a quanto visto in Z, l’algoritmo euclideo (delle divisio-
ni successive) ed ancora l’ultimo resto non nullo fornirà il massimo
comune divisore. Utilizzando l’algoritmo di divisione quindi siamo
in grado di verificare che in K[x]

• esiste il M CD(f (x), g(x));


• vale l’identità di Bézout, cioè
M CD(f (x), g(x)) = d(x) = λ(x)f (x) + µ(x)g(x);

• f (x) è primo se e solo se è irriducibile;


• ogni polinomio (non invertibile) f (x) si può esprimere come
prodotto di polinomi irriducibili e tale fattorizzazione è unica
a meno dell’ordine e di elementi invertibili (ovvero di costan-
ti): f (x) = p1 (x)p2 (x) . . . pt (x), ovvero K[x] è un dominio a
fattorizzazione unica o UFD.
3.4. IRRIDUCIBILITÀ DEI POLINOMI 103

3.4 Irriducibilità dei polinomi


Uno dei problemi più interessanti nella teoria dei polinomi è quello
di riconoscere se un polinomio è irriducibile o più in generale trovare
l’eventuale fattorizzazione in fattori primi. L’importanza di questo
segue, ad esempio, dall’osservazione che se ci si trova a risolvere
una equazione f (x) = 0 e si conosce una fattorizzazione di f (x) =
g(x)h(x), per trovare le soluzioni basterà risolvere le equazioni (più
semplici) g(x) = 0 e h(x) = 0. Una prima banale osservazione è la
seguente.
• Ogni polinomio f (x) ∈ K[x] di grado 1 è irriducibile.
Adesso diamo alcune fondamentali definizioni che sono utili allo
scopo.

Definizione 3.4.1 Se f (x) ∈ K[x] diremo radice del polinomio


un elemento α ∈ K tale che f (α) = 0.

Il prossimo ben noto risultato ci dice cosa succede quando un


polinomio ha una radice.

Teorema 3.4.2 (Teorema di Ruffini) Se f (x) ∈ K[x] è un poli-


nomio di grado n ed α è una sua radice, allora f (x) = (x − α)g(x)
con g(x) polinomio di grado n − 1 in K[x].

Dimostrazione. Applichiamo l’algoritmo di divisione tra f (x) e


x − α; otterremo f (x) = q(x)(x − α) + r(x) dove r(x) = r è una
costante dovendo avere grado < 1. Ma α è una radice di f (x) per
cui
0 = f (α) = q(α)(α − α) + r
cioè r = 0. Pertanto, f (x) = q(x)(x − α) ed il grado di q(x) è
proprio n − 1.


104 CAPITOLO 3. TEORIA DEI POLINOMI

Dal Teorema di Ruffini segue una prima semplice conseguenza.

Corollario 3.4.3 Se f (x) ∈ K[x] ha grado > 1 ed ammette una


radice (in K) allora f (x) è riducibile.

Inoltre

Corollario 3.4.4 Se f (x) ∈ K[x] ha grado n allora ammette al


più n radici.

Dimostrazione. Lavoriamo per induzione su n. La base dell’in-


duzione n = 0 ed anche n = 1 è ovvia. Quindi facciamo l’ipotesi
induttiva che il risultato sia vero per polinomi di grado < n. Allora
se f (x) non ha radici il risultato è provato. Se invece ha almeno
una radice α, per il Teorema di Ruffini avremo f (x) = (x − α)g(x)
con g(x) di grado n − 1. Poiché le radici di f (x) si ottengono (per
la legge dell’annullamento del prodotto) da quelle di x − α e g(x) e
poiché g(x) per l’ipotesi induttiva ha al più n − 1 radici possiamo
concludere che f (x) ha al più n radici.


Il precedente risultato ci permette di eliminare la differenza tra


polinomi e funzioni polinomiali nel caso di campi infiniti.

Proposizione 3.4.5 Sia K un campo infinito e supponiamo che


due polinomi f (x), g(x) ∈ K[x] diano luogo alla stessa funzione po-
linomiale, ovvero ϕ(f ) = ϕ(g) (vedi la corrispondenza tra polinomi
e funzioni polinomiali), allora f (x) = g(x).

Dimostrazione. Consideriamo la funzione F (x) = f (x) − g(x);


poiché f (x) e g(x) danno luogo alla stessa funzione polinomiale si ha
che per ogni a ∈ K f (a) = g(a). Allora F (a) = 0 per ogni a ∈ K,
cosı̀ essendo K infinito il polinomio F (x) avrebbe infinite radici.
3.4. IRRIDUCIBILITÀ DEI POLINOMI 105

Ma un polinomio di grado n ha al più n radici per il precedente


corollario, per cui F (x) deve essere il polinomio nullo, cioè f (x) −
g(x) = 0 e quindi f (x) = g(x).

Adesso consideriamo il seguente esempio.

Esempio 3.4.6 In R[x] consideriamo i due polinomi f (x) = (x −


2)3 (x + 3) e g(x) = (x − 2)4 (x + 3)2 . Ovviamente sono due polinomi
distinti di grado, rispettivamente, 4 e 6, tuttavia le uniche due radici
che entrambi hanno sono 2 e −3!

Si vede in questo esempio che le radici vengono in un certo senso ri-


petute. Dobbiamo rendere rigoroso questo concetto. D’altra parte,
ricordiamo che a è radice di f (x) se e solo se f (x) = (x − a)g(x).
Allora

Definizione 3.4.7 Sia f (x) ∈ K[x] diremo che a è una radice di


f (x) di molteplicità m (o che è una radice m-upla) se f (x) =
(x − a)m g(x) con g(a) 6= 0.

Esempio 3.4.8 Consideriamo f (x) = (x − 1)5 (x3 + x − 2) ∈ R[x];


si vede che x = 1 è una sua radice ed a prima vista si è tentati
di dire che ha molteplicità 5. Ma x3 + x − 2 si annulla per x = 1
ovvero ha 1 come radice, per cui, per il Teorema di Ruffini, a sua
volta si esprime x3 + x − 2 = (x − 1)(x2 + x + 2) per cui f (x) =
(x − 1)6 (x2 + x + 2), con x2 + x + 2 che non si annulla in 1. Pertanto
x = 1 è una radice di molteplicità 6 per f (x).

Alla luce della precedente definizione il Corollario 3.4.4 diventa

Corollario 3.4.9 Un polinomio f (x) di grado n ammette delle


radici tali che la somma delle loro molteplictà è al più n.
106 CAPITOLO 3. TEORIA DEI POLINOMI

Adesso ci occupiamo della irriducibilità dei polinomi allorquan-


do K è C, R e Q. Vedremo che le cose risultano banali in C,
abbastanza semplici in R e molto difficili in Q.

Irriducibilità in C[x].
Ricordiamo che i polinomi di 1o grado sono irriducibili su qual-
siasi campo. Ebbene per C questi sono gli unici polinomi irriduci-
bili.

Proposizione 3.4.10 Un polinomio di C[x] è irriducibile se e solo


se è di grado 1.
Dimostrazione. La tesi segue dal Teorema Fondamentale dell’Al-
gebra (TFA). Infatti, se f (x) ha grado n > 1, per il citato teorema
ammette almeno una radice a, sicché f (x) = (x − a)g(x) con g(x)
di grado n − 1 > 0 per cui f (x) è riducibile.

Osserviamo che il TFA in virtù di quanto detto sinora si può
enunciare in una forma più precisa.

Corollario 3.4.11 Un polinomio f (x) di grado n in C[x] ha radici


la cui somma delle molteplicità è n.
Per concludere osserviamo che se f (x) ∈ C[x], con f (x) = a0 +
a1 x + a2 x2 + . . . si può considerare il suo coniugato f (x) = a0 +
a1 x + a2 x 2 + . . .
È facile verificare che se α è una radice di f (x) allora il suo
coniugato α è una radice per il polinomio coniugato f (x).

Irriducibilità in R[x].
Se applichiamo la precedente osservazione ad un polinomio f (x) ∈
R[x] avremo
3.4. IRRIDUCIBILITÀ DEI POLINOMI 107

Lemma 3.4.12 Se f (x) ∈ R[x] ha una radice α in C allora anche


α è una radice per f (x).

Dimostrazione. Basta osservare che se a ∈ R allora a = a per


cui f (x) = f (x); quindi f (α) = f (α) = f (α) = 0.

Corollario 3.4.13 Se f (x) ∈ R[x] ha grado n dispari, allora ha


almeno una radice in R. In particolare, se n > 1 f (x) è riducibile.

Dimostrazione. Sia n = 2m + 1. Pensiamo f (x) ∈ C[x] (ov-


viamente R[x] ⊆ C[x]) e sia α1 ∈ C una sua radice. Se α1 ∈ R
abbiamo concluso. Se α1 ∈ / R allora α1 6= α1 . Cosı̀, dopo aver divi-
so sia per x − α1 che per x − α1 (il grado del polinomio residuo sarà
2m − 1), consideriamo una successiva radice α2 ∈ C e ragioniamo
come sopra; cioè se α2 ∈ R abbiamo concluso oppure si considera
anche la sua coniugata e si va avanti. Questo si può fare m volte
senza aver trovato ancora alcuna radice reale, cosı̀ avremo trovato
2m radici complesse (non reali). Poiché n = 2m+1 deve esserci una
ulteriore radice a; se diciamo a la sua coniugata non potrà essere
a 6= a altrimenti f (x) avrebbe 2m + 2 radici. Allora a = a, cioè
a ∈ R, per cui f (x) ha almeno una radice reale.

Siamo adesso in grado di classificare tutti i polinomi irriducibili


R[x].

Proposizione 3.4.14 Un polinomio f (x) ∈ R[x] è irriducibile se


e solo se ha grado 1 oppure ha grado 2, f (x) = ax2 + bx + c, e
∆ = b2 − 4ac < 0.

Dimostrazione. Che i polinomi di 1o grado e quelli di 2o grado


con ∆ < 0 siano irriducibili è ovvio, in quanto se un polinomio di 2o
108 CAPITOLO 3. TEORIA DEI POLINOMI

grado è riducibile allora ammette almeno una radice reale e quindi


come è noto ∆ ≥ 0. Allora possiamo supporre che il grado di f (x)
sia n > 2 e poiché se n è dispari è sicuramente riducibile, possiamo
supporre che n = 2m sia pari (m > 1). Ora se f (x) ammette
qualche radice reale come detto, per il Teorema di Ruffini, sarà
riducibile. Cosı̀ supponiamo che f (x) non ammetta radici reali.
Siano quindi α1 , α1 , . . . , αm , αm tutte le radici (complesse) di f (x).
Avremo

f (x) = (x − α1 )(x − α1 ) . . . (x − αm )(x − αm )

ora osserviamo che (x − αi )(x − αi ) = x2 − (αi + αi )x + αi αi ∈ R[x]


per ogni i = 1, . . . , m. Se indichiamo hi (x) = x2 − (αi + αi )x + αi αi
avremo
f (x) = h1 (x) . . . hm (x)
con hi (x) ∈ R[x] quindi f (x) è riducibile.

Da quanto detto sinora possiamo trovare la fattorizzazione (uni-


ca) di un polinomio f (x) ∈ R[x], che per semplicità supporremo
‘monico’, cioè con coefficiente di massimo grado 1: siano

• ai , i = 1, . . . , t le radici reali distinte con molteplicità mi ;

• αi , i = 1, . . . , r le radici complesse (non reali) distinte con


molteplicità ni e poniamo, come detto, hi (x) = x2 − (αi +
αi )x + αi αi

allora in C[x] :

f (x) = (x−a1 )m1 . . . (x−at )mt (x−α1 )n1 (x−α1 )n1 . . . (x−αr )nr (x−αr )nr

ed in R[x] :

f (x) = (x − a1 )m1 . . . (x − at )mt h1 (x)n1 . . . hr (x)nr .


3.4. IRRIDUCIBILITÀ DEI POLINOMI 109

Esempio 3.4.15 Il polinomio x4 + 1 ∈ R[x] è riducibile, solo che


non ammettendo alcuna radice reale i suoi fattori saranno√di 2o
grado con
√ il discriminante ∆ < 0. Si ha x4 + 1 = (x2 − 2x +
1)(x2 + 2x + 1).

Irriducibilità in Q[x].
La irriducibilità in Q[x] è piuttosto difficile da verificare a di-
spetto del fatto che invece saremo in grado di trovare le sue radici
razionali. In effetti, non avremo una caratterizzazione generale che
ci permetta di decidere se un polinomio in Q[x] è irriducibile o me-
no, ma troveremo delle condizioni sufficienti che ci consentiranno
di affermare se un certo polinomio è irriducibile.
Sia allora f (x) ∈ Q[x], i suoi coefficienti sono delle frazioni abii
per cui moltiplicando per un opportuno fattore (il minimo comune
multiplo dei denominatori dei coefficienti) il polinomio f (x) si può
scrivere f (x) = a · g(x) dove a ∈ Q e g(x) ∈ Z[x], per cui ci si
può ricondurre a studiare la irriducibilità in Q[x] di polinomi a
coefficienti in Z.
• Esempio. f (x) = 21 + 35 x − 56 x3 = 30 1
(15 + 18x − 25x3 )
Allora poniamoci dapprima la seguente domanda: se f (x) =
a0 + a1 x + a2 x2 + . . . + an xn è un polinomio a coefficienti interi quali
sono le sue radici razionali, cioè in Q?
Il prossimo risultato ci consente di rispondere in modo esaurien-
te alla suddetta domanda.

Proposizione 3.4.16 Sia f (x) = a0 + a1 x + a2 x2 + . . . + ad xd


un polinomio con coefficienti interi. Se m n
∈ Q è una frazione
con M CD(m, n) = 1, ovvero ridotta ai minimi termini, che è una
radice di f (x) allora m divide a0 e n divide ad .
Dimostrazione. Supponiamo quindi m n
una frazione ridotta ai
minimi termini che sia radice di f (x), cioè f ( m
n
) = 0. Allora avremo
m m m
a0 + a1 + a2 ( )2 + . . . + ad ( )d = 0
n n n
110 CAPITOLO 3. TEORIA DEI POLINOMI

da cui moltiplicando per nd

a0 nd + a1 mnd−1 + a2 m2 nd−2 + . . . + ad md = 0.

Scriviamo la precedente eguaglianza nella forma

a0 nd = −m(a1 nd−1 + a2 mnd−2 + . . . + ad md−1 );

per cui m, dividendo il II membro, deve dividere il I membro, cioè


a0 nd ; ma m è coprimo con n per cui m divide a0 .
Scrivendo invece l’eguaglianza nella forma

(a0 nd−1 + a1 mnd−2 + a2 m2 nd−3 + . . . + ad−1 )n = −ad md

avremo che n divide ad md , ma essendo n coprimo con m, si ha che


n divide ad .

Il risultato appena dimostrato ci permette di determinare tutte
le radici razionali di un polinomio a coefficienti in Z (o Q). Infatti,
se f (x) = a0 +a1 x+a2 x2 +. . .+ad xd ha i coefficienti in Z indichiamo
{mi } l’insieme (finito) di tutti i divisori di a0 (che possiamo facil-
mente determinare) ed indichiamo {ni } l’insieme (finito) di tutti i
divisori di ad ; consideriamo adesso tutti i rapporti { m nj
i
}. Le even-
tuali radici razionali di f (x) devono trovarsi tra queste frazioni, per
la proposizione precedente. Basterà allora controllare se f ( m nj
i
) = 0.

Esempio 3.4.17 Sia f (x) = 2x4 + 27x3 − 45x2 − 24x + 36, pren-
diamo i divisori di 36, {±1, ±2, ±3, ±4, ±6, ±9, ±12, ±18, ±36} ed
i divisori di 2, {±1, ±2}; allora le possibili radici di f (x) sono
1 3 9
{±1, ±2, ±3, ±4, ±6, ±9, ±12, ±18, ±36, ± , ± , ± }.
2 2 2
3
Facendo le varie verifiche si vede che 2
è una radice:
3 3 3 3 3 81 729 405
f ( ) = 2( )4 +27( )3 −45( )2 −24 +36 = + − −36+36 = 0.
2 2 2 2 2 8 8 4
3.4. IRRIDUCIBILITÀ DEI POLINOMI 111

In effetti, dividendo f (x) per (x − 23 ) si ottiene


3
f (x) = (x − )(2x3 + 30x2 − 24) = (2x − 3)(x3 + 15x2 − 12).
2
Poiché x3 +15x2 −12 è di grado 3 e non ha radici in Q (verifica-
re) deve essere irriducibile. Cosı̀ quella scritta è la fattorizzazione
di f (x).

Quanto sopra esposto risolve completamente il problema della


ricerca delle radici razionali per un polinomio in Q[x], quindi ci
permette di dire che se f (x) è di grado > 1 ed ha una radice in Q
allora è riducibile. Per esempio un polinomio di 3o grado se non ha
radici in Q sarà certamente irriducibile, perché se fosse riducibile
uno dei suoi fattori dovrebbe essere di 1o grado e quindi fornire una
radice razionale. Ma, viceversa, se f (x) non ha radici razionali ed
ha grado > 3 nulla si può in generale dire.
Attenzione! Se f (x) ∈ Z[x] la sua irriducibilità in Z[x] non è
equivalente alla irriducibilità in Q[x]. Infatti, 5x2 + 5 è riducibile in
Z[x] visto che 5x2 + 5 = 5(x2 + 1) (nota che 5 non è invertibile in
Z[x]), mentre è irriducibile in Q[x] visto che 5 è invertibile in Q[x]
e x2 + 1 è irriducibile perché non ammette radici in Q.

Definizione 3.4.18 Sia f (x) = a0 + a1 x + a2 x2 + . . . + ad xd ∈ Z[x],


si chiama contenuto di f (x) e si denota c(f ), il massimo comune
divisore dei coefficienti, cioè c(f ) = M CD(a0 , a1 , . . . , ad ).
Un polinomio che ha contenuto 1 si dice primitivo.

Osserviamo quindi che un qualunque polinomio f (x) ∈ Z[x], si


può scrivere f (x) = c(f ) · g(x) con g(x) primitivo.
Uno dei risultati più importanti per le sue conseguenze nella
fattorizzazione unica dei polinomi è il seguente

Lemma 3.4.19 (Lemma di Gauss) Se f (x), g(x) ∈ Z[x] so-


no polinomi primitivi, allora anche f (x)g(x) è primitivo. Più in
generale, c(f g) = c(f )c(g).
112 CAPITOLO 3. TEORIA DEI POLINOMI

Dimostrazione. Siano f (x) = a0 +a1 x+a2 x2 +. . .+ad xd e g(x) =


b0 + b1 x + b2 x2 + . . . + bt xt i due polinomi primitivi. Consideriamo
f (x)g(x) = c0 + c1 x + c2 x2 + . . . + cd+t xd+t dove ricordiamo ch =
P h
i=o ai bh−i . Vogliamo provare che f (x)g(x) è primitivo, ovvero che
il massimo comune divisore tra i coefficienti ci è 1. Supponiamo per
assurdo che non sia primitivo e che quindi M CD({ci }) = m 6= 1,
allora esisterà un numero primo p che divide m e quindi tutti i
coefficienti ci . Dato che f (x) è primitivo, p non può dividere tutti i
suoi coefficienti ai ; diciamo ah il coefficiente di indice minore che non
sia divisibile per p. Facendo analogo discorso su g(x) vediamo che p
non può dividere tutti i suoi coefficienti bi ; diciamo bk il coefficiente
di indice minore che non sia divisibile per p. Allora, consideriamo
il coefficiente ch+k

ch+k = a0 bh+k + . . . + ah−1 bk+1 + ah bk + ah+1 bk−1 + . . . + ah+k b0

ed osserviamo che p divide ch+k (perché divide tutti i ci ), [a0 bh+k +


. . . + ah−1 bk+1 ] (perché divide tutti gli ai con i < h), [ah+1 bk−1 +
. . . + ah+k b0 ] (perché divide tutti i bi con i < k). Pertanto p divide

ch+k − [a0 bh+k + . . . + ah−1 bk+1 ] − [ah+1 bk−1 + . . . + ah+k b0 ] = ah bk .

Essendo p un primo dovrebbe allora dividere o ah o bk il che porta


ad una contraddizione.
Infine, per vedere che c(f g) = c(f )c(g), basta ricordare che
f (x) = c(f )f 0 (x) e g(x) = c(g)g 0 (x) con f 0 (x) e g 0 (x) primiti-
vi. Pertanto, f (x)g(x) = c(f )c(g)f 0 (x)g 0 (x) da cui si ha c(f g) =
c(f )c(g)c(f 0 g 0 ). Ma essendo f 0 g 0 primitivo per quanto provato in
precedenza, ne segue c(f 0 g 0 ) = 1 e la conclusione segue facilmente.

Come si è visto nell’esempio di cui sopra, se f (x) = c(f )f 0 (x) e
c(f ) 6= 1 allora tale polinomio è riducibile in Z[x] mentre potrebbe
essere irriducibile in Q[x] (dipende da f 0 (x)). Questa differenza sul-
la irriducibiltà riguarda però solo i polinomi che non sono primitivi.
Infatti, vale il seguente risultato.
3.4. IRRIDUCIBILITÀ DEI POLINOMI 113

Proposizione 3.4.20 Se f (x) ∈ Z[x] è un polinomio primitivo,


allora è irriducibile in Z[x] se e solo se è irriducibile in Q[x].

Dimostrazione. Sia f (x) irriducibile in Z[x] e supponiamo per


assurdo che sia riducibile in Q[x]. Allora f (x) = q1 (x)q2 (x) con
qi (x) ∈ Q[x] di grado > 0. Ora un qualsiasi polinomio qi (x) ∈
Q[x] si può scrivere (dopo aver condotto i coefficienti allo stesso
denominatore facendone il minimo comune multiplo e dopo aver
calcolato il massimo comune divisore dei numeratori) nelle forma
ai 0
qi (x) = q (x)
bi i

dove qi0 (x) è un polinomio primitivo in Z[x]. Pertanto


a1 0 a2
f (x) = q1 (x) q20 (x)
b1 b2
da cui
b1 b2 f (x) = a1 a2 q10 (x)q20 (x)
ma il contenuto del I membro è b1 b2 e quello del II membro è
a1 a2 c(q10 q20 ) = a1 a2 , usando il Lemma di Gauss. Cosı̀ b1 b2 = a1 a2
e quindi f (x) = q10 (x)q20 (x), cioè f (x) sarebbe riducibile in Z[x],
contro l’ipotesi.
Viceversa, sia f (x) irriducibile in Q[x] e per assurdo riduci-
bile in Z[x]; questo comporterebbe che f (x) = h1 (x)h2 (x) con
hi (x) ∈ Z[x]. Osserviamo adesso che hi (x) non possono avere grado
0, cioè essere delle costanti (6= 0) altrimenti il suo contenuto sareb-
be multiplo di tali costanti e quindi sarebbe 6= 1 contro l’ipotesi
che f (x) è primitivo. Sicché tali polinomi, che ovviamente stanno
anche in Q[x], avendo grado ≥ 1 in Q[x] sarebbero non invertibili
e pertanto f (x) risulterebbe riducibile in Q[x] contro l’assunto.

Attenzione. Come abbiamo già detto in K[x], con K campo, vale


l’algoritmo di divisione con tutte le sue conseguenze (esistenza del
114 CAPITOLO 3. TEORIA DEI POLINOMI

MCD, l’identità di Bézout, la fattorizzazione unica, ecc.), quindi


tutto ciò vale in Q[x]. Poiché Z non è un campo, in Z[x] non vale
l’algoritmo di divisione per cui alcune delle proprietà valide in Q[x]
falliscono. Ad esempio in Z[x] non vale l’identità di Bézout.

Esempio 3.4.21 Consideriamo in Z[x] i due polinomi f (x) = 2


e g(x) = x. È evidente che il M CD(2, x) = 1 ma chiaramente
non si possono trovare polinomi λ(x), µ(x) ∈ Z[x] tali che 1 =
λ(x) · 2 + µ(x) · x. Infatti, se ci fossero siffatti polinomi, calcolando
i polinomi dei due membri di tale eguaglianza in 0 (ottenendo cosı̀
il termine noto) si avrebbe che il I membro dà 1 ed il II membro dà
2λ(0), un numero pari che quindi non può essere 1.
Tuttavia, questo importante risultato di Gauss ci garantisce che
anche Z[x] è un UFD (Dominio a fattorizzazione unica).

Teorema 3.4.22 (Teorema di Gauss) Ogni polinomio, non nul-


lo e non invertibile, in Z[x] si può esprimere come prodotto di poli-
nomi irriducibili e tale fattorizzazione è unica, a meno dell’ordine e
del segno; in altre parole Z[x] è un UFD (Dominio a fattorizzazione
unica).
Dimostrazione. Cominciamo a provare che ogni f (x) ∈ Z[x] si
può esprimere come prodotto di polinomi irriducibili. Sia f (x) =
c(f )g(x) con g(x) primitivo. Poiché c(f ) ∈ Z si può fattorizzare
(in modo unico) come prodotto di numeri primi, resta da vedere
che anche g(x) si può fattorizzare. Cosı̀ in pratica ci siamo ricon-
dotti a fattorizzare i polinomi primitivi. Ora g(x) ∈ Z[x] ⊆ Q[x] e
quest’ultimo è un UFD. Cosı̀ certamente g(x) si fattorizza in Q[x]
come prodotto di polinomi irriducibili (in Q[x]):
g(x) = q1 (x) . . . qt (x)
con qi (x) polinomi irriducibili di Q[x]. Come prima scriviamo qi (x) =
ai
h (x) dove hi (x) sono polinomi primitivi di Z[x] irriducibili in Q[x]
bi i
e quindi anche in Z[x], per la proposizione precedente. Ma allora
b1 . . . bt g(x) = a1 . . . at h1 (x) . . . ht (x)
3.4. IRRIDUCIBILITÀ DEI POLINOMI 115

e come prima, uguagliando i contenuti dei due membri si ottie-


ne a1 . . . at = b1 . . . bt , da cui g(x) = h1 (x) . . . ht (x) prodotto di
polinomi irriducibili in Z[x].
La unicità segue poi osservando che se g(x) ammettesse due
fattorizzazioni distinte (a meno dell’ordine e di invertibili) in Z[x]
esse sarebbero anche due fattorizzazioni di g(x) in Q[x], ma ciò non
può accadere perché Q[x] è un UFD.

Per quanto detto sinora per tutti i polinomi di Q[x] di grado
≤ 3 siamo in grado di dire se essi sono irriducibili o no: infatti, in
questo caso, almeno uno dei fattori deve avere grado 1 per cui tali
polinomi sono riducibili se e solo se hanno soluzioni (in Q) e poiché
siamo in grado di trovare le eventuali radici razionali il problema è
risolto per tali polinomi.
Ma per polinomi di grado ≥ 4 può accadere che essi non abbiano
radici e pur tuttavia siano riducibili (in tal caso i fattori avranno
grado ≥ 2).

Esempio 3.4.23 Consideriamo i seguenti tre polinomi in Z[x] :


f (x) = 2x4 + 27x3 − 45x2 − 24x + 36;
g(x) = 3x5 + 14x4 + 35x2 + 49x + 21;
h(x) = 4x4 + 9x3 + 15x2 + 7x + 5.
Si tratta di tre polinomi primitivi. Come abbiamo visto in preceden-
za, calcolando i rapporti tra i divisori di 36 e di 2 si può verificare
che 23 è una radice di f (x), sicché f (x) = (x− 32 )(2x3 +30x2 −24) =
(2x − 3)(x3 + 15x2 − 12) e poiché x3 + 15x2 − 12 non ammette radici
razionali, quella ottenuta è la fattorizzazione di f (x).
Per quanto riguarda gli altri due polinomi, si può verificare che
essi non ammettono radici razionali e tuttavia non possiamo dedur-
re che essi sono irriducibili. Adesso svilupperemo due criteri che ci
permetteranno di concludere che sia g(x) che h(x) sono irriducibili
in Z[x] e quindi in Q[x].
116 CAPITOLO 3. TEORIA DEI POLINOMI

Teorema 3.4.24 (Criterio di Eisenstein) Sia f (x) = a0 +a1 x+


a2 x2 + . . . + ad xd un polinomio primitivo di Z[x] soddisfacente le
seguenti condizioni:
1. esiste un primo p che divide ogni ai per 0 ≤ i < d (e non ad
essendo f (x) primitivo);

2. p2 non divide a0 ,
allora f (x) è irriducibile in Z[x] (e in Q[x]).

Dimostrazione. Supponiamo per assurdo che f (x) sia riducibile,


allora f (x) = g(x)h(x) con g(x) e h(x) di gradi, rispettivamente,
m ed n (entrambi < d, altrimenti uno dei due sarebbe una costante
contro il fatto che f (x) è primitivo). Diciamo g(x) = b0 + b1 x +
b2 x2 + . . . + bm xm , h(x) = c0 + c1 x + c2 x2 + . . . + cn xn . Osservato che
a0 = b0 c0 e che p divide a0 segue che p divide b0 o c0 , diciamo che
p divide b0 . Ma per l’ipotesi 2. p non potrà allora dividere anche c0
altrimenti p2 dividerebbe b0 c0 = a0 . Ora, p non può dividere ogni bi
altrimenti c(f ) sarebbe divisibile per p, ma f (x) è primitivo. Cosı̀
diciamo bh quello tra le bi che ha indice più piccolo tra quelli che
non sono divisibili per p; notiamo che h ≤ m < d. Allora p divide
ah , ma
ah = b0 ch + b1 ch−1 + . . . + bh−1 c1 + bh c0
e per la scelta di h, p divide b0 ch +b1 ch−1 +. . .+bh−1 c1 . In definitiva,
p dovrebbe dividere bh c0 , ma essendo p primo dovrebbe dividere uno
dei due fattori bh o c0 , in ogni caso otteniamo una contraddizione.
Per cui siamo giunti ad un assurdo che deriva dall’aver supposto
f (x) riducibile.

Torniamo all’Esempio 3.4.23 e vediamo se possiamo applicare il
Criterio di Eisenstein al polinomio g(x): prendiamo il primo p = 7,
esso divide tutti i coefficienti di g(x) eccetto a5 mentre 72 = 49 non
divide a0 = 21. Essendo soddisfatte le due condizioni richieste dal
Criterio di Eisenstein possiamo concludere che g(x) è irriducibile.
3.4. IRRIDUCIBILITÀ DEI POLINOMI 117

Ma questo criterio non si applica sempre, ad esempio per h(x)


dell’Esempio 3.4.23 l’unico primo che divide a0 è 5 che però non
divide tutti gli altri coefficienti. Vediamo di provare un altro criterio
che possa essere usato per h(x).
L’osservazione cruciale è che se si lavorasse in qualche Zp [x] (p
primo) poiché per ogni grado vi è solo un numero finito di polinomi,
in linea di principio, dovremmo essere in grado di decidere se un
dato polinomio è o no irriducibile. Non è difficile contare quanti
sono i polinomi di grado d in Zp [x] :

i polinomi di primo grado 1 sono del tipo ax + b con a ∈ Z∗p


e b ∈ Zp per cui sono p(p − 1);

i polinomi di grado 2 sono del tipo ax2 + bx + c con a ∈ Z∗p e


b, c ∈ Zp per cui sono p2 (p − 1);

in generale, i polinomi di grado d sono del tipo ad xd +ad−1 xd−1 +


. . . + a1 x + a0 con ad ∈ Z∗p e ai ∈ Zp per 0 ≤ i < d, quindi essi
sono pd (p − 1).

Esempio 3.4.25 Studiamo l’irriducibilità del polinomio f (x) =


x4 + x + 2 ∈ Z3 [x]. Calcoliamo:

f (0) = 2; f (1) = 1 + 1 + 2 = 1; f (2) = 16 + 2 + 2 = 2

ciò prova che f (x) non ha radici, ma questo ci assicura che f (x)
non ha fattori di 1o grado, ma potrebbe essere il prodotto di due
polinomi di 2o grado. Vediamo cioè se

x4 + x + 2 = (x2 + bx + c)(x2 + dx + e) =

x4 + (b + d)x3 + (c + bd + e)x2 + (eb + cd)x + ce


in tal caso i coefficienti dovranno soddisfare il seguente sistema in
Z3
118 CAPITOLO 3. TEORIA DEI POLINOMI



 b+d=0
c + bd + e = 0


 eb + cd = 1
ce = 2

e si vede che invece tale sistema non ha soluzioni (in Z3 ) (per esem-
pio, ce = 2 implica c = 1, e = 2 oppure c = 2, e = 1 in ogni caso
c + e = 0, per cui dalla seconda equazione bd = 0 che con la pri-
ma ci dà b = d = 0 che fa vedere che la terza equazione risulta
impossibile).
Pertanto, f (x) = x4 + x + 2 è irriducibile in Z3 [x].

Il prossimo risultato ci dà informazioni sulla irriducibilità di un


polinomio f (x) ∈ Z[x] sfruttando la irriducibilità di un opportuno
polinomio in qualche Zp [x].
Se f (x) = ad xd + ad−1 xd−1 + . . . + a1 x + a0 è un polinomio in
Z[x] e p è un primo potremo considerare i suoi coefficienti ridotti
modulo p ovvero in Zp , in tal caso scriveremo
f (x) = ad xd + ad−1 xd−1 + . . . + a1 x + a0 ∈ Zp [x].

Teorema 3.4.26 (Criterio di riduzione modulo p) Sia f (x) =


ad xd + ad−1 xd−1 + . . . + a1 x + a0 ∈ Z[x] un polinomio primitivo per
cui esiste un primo p che non divide ad tale che f (x) ∈ Zp [x] sia
irriducibile, allora f (x) è irriducibile in Z[x].

Dimostrazione. Se per assurdo f (x) fosse riducibile avremmo


f (x) = g(x)h(x) con g(x) e h(x) di gradi, rispettivamente, m ed
n; diciamo g(x) = b0 + b1 x + b2 x2 + . . . + bm xm , h(x) = c0 + c1 x +
c2 x2 + . . . + cn xn . Poiché ad = bm cn e p non divide ad , p non può
dividere né bm né cn per cui g(x) e h(x) in Zp [x] hanno lo stesso
grado di g(x) e h(x) e
f (x) = g(x)h(x)
3.4. IRRIDUCIBILITÀ DEI POLINOMI 119

il che direbbe che f (x) ∈ Zp [x] è riducibile, contro l’ipotesi.

Ritorniamo all’Esempio 3.4.23 e riprendiamo h(x) = 4x4 +9x3 +


15x2 + 7x + 5. Consideriamo p = 3 (che non divide 4) e riduciamo
h(x) modulo 3, si otterrà h(x) = x4 + x + 2, ma dall’Esempio 3.4.25
sappiamo che tale polinomio è irriducibile in Z3 [x] per cui appli-
cando il criterio della riduzione modulo p possiamo concludere che
h(x) è irriducibile in Z[x].
Osserviamo che se h(x) fosse stato riducibile in Zp [x] non avrem-
mo potuto concludere che anche h(x) era riducibile in Z[x].
120 CAPITOLO 3. TEORIA DEI POLINOMI
Capitolo 4

Teoria dei gruppi

4.1 Definizioni e primi esempi


Studiando insiemi numerici, insiemi di polinomi ci siamo imbattuti
in insiemi su cui erano definite delle operazioni che godevano di
certe proprietà. Adesso noi ci svincoleremo dal tipo di elementi
che compongono il nostro insieme e ci occuperemo soltanto della
struttura che nasce sull’insieme quando su esso si definiscono delle
operazioni che godono di certe proprietà. In questo capitolo ci
occuperemo della più semplice struttura, cioè quella di gruppo.

Definizione 4.1.1 Sia G un insieme e ∗ : G × G → G un’opera-


zione (binaria, interna) su G. Se

1) a ∗ (b ∗ c) = (a ∗ b) ∗ c per ogni a, b, c ∈ G (proprietà associativa


di ∗),

2) esiste un elemento e ∈ G tale che a ∗ e = e ∗ a = a per ogni


a ∈ G (elemento neutro),

3) per ogni a ∈ G esiste un elemento a0 ∈ G tale che a ∗ a0 =


a0 ∗ a = e, (a0 è detto “inverso” di a)

allora (G, ∗) si dice gruppo. Se inoltre

121
122 CAPITOLO 4. TEORIA DEI GRUPPI

4) a ∗ b = b ∗ a per ogni a, b ∈ G (proprietà commutativa di ∗),

allora (G, ∗) si dice gruppo abeliano o commutativo.

Osserviamo che nella definizione abbiamo richiesto l’esistenza


dell’elemento neutro, che a priori potrebbe non essere unico. Pro-
viamo invece che l’elemento neutro è necessariamente unico: infatti,
se e ed e0 fossero due elementi neutri per l’operazione ∗ si avrebbe

e ∗ e0 = e0 poiché e è un elemento neutro;

e ∗ e0 = e poiché e0 è un elemento neutro.

per cui e = e0 .
Analogamente si verifica che l’inverso di un elemento a è an-
ch’esso unico e spesso si indica a−1 : infatti, se a0 e a00 sono due
inversi di a si ha

a0 = a0 ∗ e = a0 ∗ (a ∗ a00 ) = (a0 ∗ a) ∗ a00 = e ∗ a00 = a00 .

Inoltre, poiché a sua volta a è l’inverso di a−1 si ha che (a−1 )−1 = a.


Infine, osserviamo che (a ∗ b)−1 = b−1 ∗ a−1 ; infatti,

(a ∗ b) ∗ (b−1 ∗ a−1 ) = a ∗ (b ∗ b−1 ) ∗ a−1 = a ∗ e ∗ a−1 = e.

Esempio 4.1.2 Ecco alcuni esempi di gruppi abeliani che abbiamo


già incontrato.
(Z, +), (Q, +), (R, +), (C, +), (Zn , +), (Q∗ , · ), (R∗ , · ), (C∗ , · ),

(Zp , · ), (con p primo)
sono tutti gruppi abeliani.

Notiamo che, ad esempio (Z∗10 , · ), non è un gruppo in quanto


il prodotto non è un’operazione in Z∗10 , infatti presi [2], [5] ∈ Z∗10 si
/ Z∗10 .
ha [2] · [5] = [0] ∈
4.1. DEFINIZIONI E PRIMI ESEMPI 123

Esempio 4.1.3 Un altro esempio di gruppo abeliano è (Mn (R), +)


costituito dalle matrici quadrate di ordine n, a elementi in R, ri-
spetto all’addizione tra matrici. Le verifiche sono del tutto banali.

Esempio 4.1.4 (Mn (R), · ), dove · è il prodotto righe per colonne


tra matrici, non costituisce un gruppo in quanto non è vero che ogni
matrice ammetta l’inversa.
1) Indichiamo adesso

Gln (R) = {A ∈ Mn (R) | |A| =


6 0},

cioè l’insieme delle matrici quadrate con determinante diverso da


zero. Allora (Gln (R), · ) è un gruppo, detto gruppo lineare reale:
infatti il prodotto è un’operazione in Gln (R), visto che se |A| 6=
0 e |B| 6= 0 anche |AB| = |A||B| 6= 0 per il teorema di Binét;
inoltre l’associatività del prodotto e l’esistenza della matrice unità
si verificano facilmente, ed ogni matrice in Gln (R) è invertibile.
Tale gruppo non è però abeliano, come si può verificare facilmente
portando un controesempio in Gl2 (R):
    
1 2 0 1 4 9
=
0 3 2 4 6 12
    
0 1 1 2 0 3
=
2 4 0 3 2 16
2) Altro esempio di gruppo di matrici è dato da

Sln (R) = {A ∈ Mn (R) | |A| = 1},

detto gruppo lineare speciale reale. Basta osservare che per il


Teorema di Binét si ha |AB| = |A||B| = 1.
3) Altro esempio di gruppo di matrici è

On (R) = {A ∈ Mn (R) | A−1 = AT },


124 CAPITOLO 4. TEORIA DEI GRUPPI

detto gruppo ortogonale reale. Anche in questo caso basta os-


servare (AB)−1 = B −1 A−1 = B T AT = (AB)T .
4) Ed infine, altro gruppo di matrici è
SOn (R) = {A ∈ Mn (R) | A−1 = AT , |A| = 1},
detto gruppo ortogonale speciale reale.

Esempio 4.1.5 L’insieme dei polinomi in una indeterminata x ed


a coefficienti reali, R[x], rispetto all’operazione di somma tra poli-
nomi è un gruppo abeliano (R[x], +) in cui l’elemento neutro è il
polinomio nullo, e l’opposto di un polinomio è quel polinomio che
ha per coefficienti gli opposti di quelli del polinomio dato.
Abbiamo quindi visto che esistono gruppi con infiniti elementi
e gruppi che hanno un numero finito di elementi. In quest’ultimo
caso, cioè quando |G| = n si dice che G ha ordine n e si scriverà
O(G) = n. Osserviamo che possiamo dire di conoscere un gruppo G
allorquando ne conosciamo i suoi elementi ed il prodotto tra tutti
questi elementi. Il caso interessante è quello in cui G è finito, dicia-
mo |G| = n, nel qual caso tutti i possibili prodotti sono n2 . Essi si
possono disporre in una tabella n × n che prende il nome di Tavo-
la di moltiplicazione o tabella moltiplicativa del gruppo. Notiamo
che, nel caso di un gruppo abeliano, tale tabella risulterà simmetri-
ca rispetto alla diagonale (principale). Riportiamo ad esempio la
tabella moltiplicativa del gruppo (abeliano) con 6 elementi (Z∗7 , ·)

1 2 3 4 5 6
1 1 2 3 4 5 6
2 2 4 6 1 3 5
3 3 6 2 5 1 4
4 4 1 5 2 6 3
5 5 3 1 6 4 2
6 6 5 4 3 2 1
4.2. SOTTOGRUPPI 125

4.2 Sottogruppi
I sottoinsiemi di un gruppo assumono una loro importanza se, in
un certo senso, conservano la “struttura”. Ciò giustifica la seguente

Definizione 4.2.1 Un sottoinsieme S di un gruppo (G, · ) si dice


sottogruppo di G, se a sua volta (S, · ) costituisce un gruppo.

Quando S è un sottogruppo di un gruppo G spesso scriveremo


semplicemente S ≤ G. Ma cosa bisognerà verificare per controllare
se un sottoinsieme S è un sottogruppo di un gruppo (G, · )?
1) Innanzitutto che · sia ancora un’operazione (interna) di S,
cioè che, se a, b ∈ S allora a · b ∈ S.
2) Poi che · sia associativa in S; ma ciò è banale perché essa era
già associativa in G e quindi, a fortiori, lo sarà anche in S.
3) Inoltre l’elemento neutro e di G deve stare in S.
4) Infine, se a ∈ S allora a−1 (che esiste in G) deve stare in S.
In effetti facciamo vedere che basta molto meno.

Proposizione 4.2.2 Sia (G, · ) un gruppo ed S ⊆ G un suo sot-


toinsieme non vuoto. Allora S è un sottogruppo di G se e solo se
per ogni a, b ∈ S segue a · b−1 ∈ S.

Dimostrazione. Ovviamente se S è un sottogruppo la condizione


richiesta è soddisfatta. Viceversa sia soddisfatta la detta proprietà;
preso un elemento a ∈ S (non essendo vuoto) avremo a · a−1 ∈ S,
quindi e ∈ S, sicché la condizione 3) è verificata. Per ogni a ∈ S,
applicando la data proprietà ad e, a ∈ S si ha e · a−1 = a−1 ∈ S,
per cui la condizione 4) è verificata. Infine, se a, b ∈ S, poiché
anche b−1 ∈ S, applicando ancora la proprietà ad a, b−1 ∈ S si avrà
a · b ∈ S quindi anche la condizione 1) è verificata. In definitiva, S
è un sottogruppo di G.


126 CAPITOLO 4. TEORIA DEI GRUPPI

Nel caso di sottoinsiemi finiti la caratterizzazione dei sottogrup-


pi è addirittura più semplice.

Proposizione 4.2.3 Sia (G, · ) un gruppo ed S ⊆ G un suo sot-


toinsieme finito. Allora S è un sottogruppo di G se e solo se per
ogni a, b ∈ S segue a · b ∈ S.

Dimostrazione. Sia S un sottoinsieme finito di G, diciamo S =


{s1 , s2 , . . . , sn }. Sia s ∈ S un qualsiasi elemento e moltiplichiamolo
per tutti gli elementi di S. Otterremo T = {ss1 , ss2 , . . . , ssn }, tutti
elementi di S per ipotesi. D’altra parte, poiché ssi 6= ssj , per i 6= j,
essi sono n distinti elementi di S, quindi T deve coincidere con
tutto S. In particolare, s = ssu per qualche u. Cosı̀ moltiplicando
per s−1 si deduce che e = su , quindi l’elemento neutro sta in S. Ma
allora e ∈ T per cui e = ssv per qualche v, per cui ogni s ∈ S ha
l’inverso in S. Allora, se a, b ∈ S anche b−1 ∈ S quindi per l’ipotesi
a · b−1 ∈ S e quindi applicando il precedente teorema si deduce che
S è un sottogruppo di G.

Naturalmente la prima cosa da chiedersi è se in un sottogruppo
G vi sono sempre sottogruppi. Posta cosı̀ la domanda ha una rispo-
sta ovvia visto che G stesso e {e} sono certamente due sottogruppi
di G, per qualunque gruppo. Tali due sottogruppi si diranno i sot-
togruppi banali di G. Cosı̀ la domanda va posta in maniera più
precisa: vi sono in G sottogruppi diversi da quelli banali? Fra poco
daremo una risposta definitiva a questa domanda.

Esempio 4.2.4 Sia G il gruppo (Z, +) ed S = 2Z il sottoinsieme


dei numeri pari: 2Z è un sottogruppo di Z. Infatti presi 2m, 2n ∈ 2Z
si ha che 2m + (−2n) = 2(m − n) ∈ 2Z. In effetti, questo risultato
si può generalizzare prendendo nZ il sottoinsieme dei multipli di n.
Si può provare che in Z non vi sono altri sottogruppi.
4.2. SOTTOGRUPPI 127

Esempio 4.2.5 Abbiamo visto che Gl2 (R) è un gruppo (rispetto al


prodotto tra matrici). Se consideriamo il suo sottoinsieme D for-
mato dalle matrici diagonali (ed invertibili) si vede che esso forma
un sottogruppo. Basta osservare che l’inversa di una matrice dia-
gonale è una matrice diagonale ed il prodotto di matrici diagonali
è una matrice diagonale.

Proposizione 4.2.6 Se S1 ed S2 sono due sottogruppi di un gruppo


G allora S1 ∩ S2 è un sottogruppo di G.

Dimostrazione. Siano a, b ∈ S1 ∩ S2 , allora a, b ∈ S1 e a, b ∈ S2 ,


quindi ab−1 ∈ S1 e ab−1 ∈ S2 , cioè ab−1 ∈ S1 ∩ S2 . Cioè S1 ∩ S2 è
un sottogruppo di G.

La precedente proprietà si estende al caso dell’intersezione di un


numero qualsiasi di sottogruppi.

Esempio 4.2.7 Si considerino i due sottogruppi di (Z, +) S1 =


12Z ed S2 = 20Z e verifichiamo che S1 ∩ S2 = 60Z. Infatti, un
elemento di 60Z essendo un multiplo di 60 sarà sia multiplo di 12
che di 20 e quindi starà in S1 ∩ S2 . Viceversa se un elemento sta
in S1 ∩ S2 sarà sia multiplo di 12 che di 20 e quindi sarà multiplo
di 60.

Per l’unione la situazione è completamente diversa.

Proposizione 4.2.8 Se S1 ed S2 sono due sottogruppi di un gruppo


G allora S1 ∪ S2 è un sottogruppo di G se e solo se S1 ⊆ S2 o
S2 ⊆ S1 .
128 CAPITOLO 4. TEORIA DEI GRUPPI

Dimostrazione. Ovviamente se S1 ⊆ S2 o S2 ⊆ S1 l’unione,


essendo il più grande dei due sottogruppi, è un sottogruppo. Sup-
poniamo, ora, che S1 non sia contenuto in S2 ed S2 non sia con-
tenuto in S1 . Allora esisterà x1 ∈ S1 \ S2 ed x2 ∈ S2 \ S1 . Allora
x1 , x2 ∈ S1 ∪ S2 , ma x1 x−1
2 ∈
/ S1 (altrimenti x2 ∈ S1 ) ed anche
x1 x−1
2 ∈
/ S2 (altrimenti x 1 ∈ S2 ) sicché x1 x−1
2 ∈
/ S1 ∪ S2 per cui
S1 ∪ S2 non è un sottogruppo.

In generale in un gruppo gli elementi non commutano tra lo-
ro, allora il sottoinsieme degli elementi che commutano con tutti
gli elementi assumerà una certa importanza e quindi merita una
definizione.

Definizione 4.2.9 In un gruppo (G, ·) si chiama centro del grup-


po
Z(G) = {c ∈ G | cx = xc ∀ x ∈ G}

Proposizione 4.2.10 Il centro Z(G) di un gruppo G è un suo


sottogruppo.
Dimostrazione. Siano a, b ∈ Z(G) dobbiamo provare che ab−1 ∈
Z(G), cioè che per ogni x si ha ab−1 x = xab−1 . Infatti, xb = bx
quindi b−1 xb = x ovvero ab−1 xb = ax = xa per cui ab−1 x = xab−1 .

Osserviamo che un gruppo G risulta abeliano se e solo se Z(G) =
G.

Esempio 4.2.11 Calcoliamo il centro di Gl2 (R) :


       
a b a b x y x y a b
∈ Z(Gl2 (R)) ⇔ =
c d c d z t z t c d
 
x y
per ogni , questo implica
z t
4.3. GRUPPI CICLICI 129

bz = cy per ogni z, y quindi b = 0 e c = 0

ay + bt = bx + dy per ogni x, y, z, t quindi a = d

cx + dz = az + ct per ogni x, y, z, t quindi a = d.


  
a 0
In definitiva, Z(Gl2 (R)) = |a∈R
0 a

4.3 Gruppi ciclici


Se (G, ·) è un gruppo ed X ⊆ G un suo sottoinsieme, in generale
non un sottogruppo, si può considerare il “più piccolo”, in un certo
senso, sottogruppo che contiene X. Precisamente,

Definizione 4.3.1 Siano (G, ·) un gruppo ed X ⊆ G un suo sot-


toinsieme, si dice sottogruppo generato da X, e sarà indicato
con G(X) l’intersezione di tutti i sottogruppi contenenti X, cioè
\
G(X) = Si
i∈I

dove {Si }I denota la famiglia dei sottogruppi di G che contengono


X.

Si potrebbe verificare che un elemento di G(X) è del tipo x1 x2 . . . xt


dove per ogni xi si ha che xi ∈ X oppure x−1 i ∈ X. X si dirà un
sistema di generatori per G(X). Quindi se X è tale che G(X) = G
si dirà che X è un sistema di generatori per G.
Il caso più semplice ed interessante si ha allorquando X = {a}
è costituito da un solo elemento. In tal caso useremo la seguente
definizione.

Definizione 4.3.2 Un gruppo G si dice ciclico se esiste un ele-


mento a ∈ G tale che G = G(a).
130 CAPITOLO 4. TEORIA DEI GRUPPI

Evidentemente, quando G è ciclico i suoi elementi sono facil-


mente esprimibili. Infatti, se G = G(a), allora

G = {ai | per ogni i ∈ Z}.

Questo fatto ci dice, tra l’altro, che il più piccolo sottogruppo con-
tenente un elemento a è l’insieme di tutte le sue potenze, basta
osservare che ai · aj = ai+j e che se un sottogruppo contiene a de-
ve contenere a−1 e quindi tutte le sue potenze con esponenti in Z.
(Nota che a−n = (a−1 )n = (an )−1 ).
Un gruppo ciclico con un numero finito di elementi si dice cicli-
co finito altrimenti si dirà ciclico infinito. Vedremo che i gruppi
ciclici assumeranno un ruolo fondamentale nello studio dei gruppi
abeliani.

Esempio 4.3.3 (Zn , +) è un gruppo ciclico finito generato, ad esem-


pio, da [1].
Cosı̀ Z6 è un gruppo ciclico finito di ordine 6 generato ad esem-
pio da [1]. Ma oltre che da [1] da chi può essere generato? Calcolia-
mo G([2]) (attenzione a ricordare che l’operazione è l’addizione):

G([2]) = {[0], [2], [4]}

quindi [2] non è un suo generatore. Continuiamo

G([3]) = {[0], [3]} G([4]) = G([2]) G([5]) = {[0], [5], [4], [3], [2], [1]}

quindi anche [5] è un generatore di Z6 .

Osserviamo che nell’esempio precedente abbiamo anche trovato


due sottogruppi non banali di Z6 , G([2]) e G([3]) che hanno rispet-
tivamente 3 e 2 elementi, ed osserviamo che 3 e 2 sono due divisori
di 6. Vedremo tra breve che questo non è un caso!
4.3. GRUPPI CICLICI 131

Esempio 4.3.4 Sia R6 = {x ∈ C | x6 = 1}, cioè l’insieme delle


radici seste dell’unità. Sappiamo dal teorema fondamentale dell’al-
gebra che R6 ha 6 elementi. Palesemente, R6 rispetto al prodotto
tra numeri complessi forma un gruppo abeliano (nota che se x6 = 1
e y 6 = 1 allora (xy)6 = x6 y 6 = 1). Verifichiamo che tale gruppo è
ciclico (cosı̀ come lo sono tutti gli altri esempi di gruppi abeliani di
ordine 6 che sono tutti isomorfi tra loro). Calcoliamo gli elementi
di R6 .

x6 − 1 = 0 ⇒ (x3 + 1)(x3 − 1) = 0 ⇒

⇒ (x + 1)(x − 1)(x2 + x + 1)(x2 − x + 1) = 0


per cui u1 = 1, u2 = −1, u3 ed u4 sono due numeri complessi tali
che u23 +u3 +1 = 0 e u24 +u4 +1 = 0, quindi u3 +u4 = −1, u3 u4 = 1;
mentre u5 e u6 sono due numeri complessi tali che u25 − u5 + 1 = 0
e u26 − u6 + 1 = 0, quindi u5 + u6 = 1, u5 u6 = 1. Dalle precedenti
eguaglianze segue u23 −u25 +u3 +u5 = 0, ovvero (u3 +u5 )(u3 −u5 +1) =
0, da cui u5 = −u3 e u6 = 1 + u3 (o viceversa). Ora, né 1 né −1
possono generare R6 visto che le loro potenze danno sempre ±1.
Vediamo cosa generano gli altri elementi.

u23 = −u3 − 1 = u4 , u33 = −u23 u3 = u4 u3 = 1


quindi G(u3 ) = {1, u3 , u4 }. Analogamente, dopo aver osservato che
u5 = u3 + 1 = −u4 (o u5 = u4 + 1 = −u3 ), si ha

u25 = u5 −1 = u3 , u35 = u25 −u5 = −1, u45 = u23 = u4 , u55 = u6 , u65 = 1

quindi G(u5 ) = G(u6 ) = R6 , ovvero R6 può essere generato o da u5


o da u6 .

Proposizione 4.3.5 Sia G un gruppo ciclico finito generato da


a 6= e. Allora esiste m ∈ N∗ tale che am = e.
132 CAPITOLO 4. TEORIA DEI GRUPPI

Dimostrazione. Visto che G = G(a) tutte le potenze di a stanno


in G, ma essendo questo finito non possono essere tutte distinte
queste potenze, sicché esisteranno i, j ∈ Z, i 6= j, tali che ai =
aj . Supponiamo i > j; allora m = i − j > 0. Ma da ai = aj ,
moltiplicando ambo i membri per a−j si ottiene ai−j = aj−j cioè
am = e.

Alla luce del precedente risultato si ha

Proposizione 4.3.6 Sia G = G(a) un gruppo ciclico finito e po-


niamo n = min{m ∈ N∗ | am = e}. Allora G è costituito da
{e = a0 , a, a2 , . . . , an−1 }, quindi G ha ordine n.

Dimostrazione. Che {e = a0 , a, a2 , . . . , an−1 } ⊆ G è ovvio. Vi-


ceversa, se g ∈ G visto che G = G(a), g = at . Usando l’algoritmo
di divisione tra t ed n si ha che t = qn + r con 0 ≤ r < n, per cui

g = at = aqn+r = (an )q ar = ear = ar .

Infine, per concludere che l’ordine di G è proprio n, dobbiamo mo-


strare che tutti gli elementi in {e = a0 , a, a2 , . . . , an−1 } sono distinti.
Ed infatti, se per assurdo esistessero due interi 0 ≤ i < j ≤ n − 1
tali che aj = ai , moltiplicando per a−i si avrebbe aj−i = e con
0 < j − i < n e questo è in contrasto con la minimalità di n.

Notiamo che dalla dimostrazione precedente segue che se G è ciclico


infinito non esistono interi m > 0 tali che am = e.

Osservazione 4.3.7 Alla luce della precedente proposizione, l’or-


dine di un gruppo ciclico finito generato da a coincide con il più
piccolo intero positivo n tale che an = e. Tale numero si chiama
l’ordine di a e si indica o(a).
4.3. GRUPPI CICLICI 133

Nell’esempio del gruppo delle radici seste dell’unità R6 si ha:


o(1) = 1, o(−1) = 2, o(u3 ) = o(u4 ) = 3, 0(u5 ) = O(u6 ) = 6.
I gruppi ciclici sono i più semplici gruppi da studiare visto che
i loro elementi si possono esprimere come potenze di uno stesso
elemento. Inoltre, essi sono tutti abeliani in quanto chiaramente
ai aj = aj ai .
Ma come sono fatti i sottogruppi dei gruppi ciclici?

Teorema 4.3.8 I sottogruppi dei gruppi ciclici sono anch’essi ci-


clici. Nel caso di gruppi ciclici infiniti i sottogruppi sono anch’essi
infiniti. Ed ovviamente, nel caso di gruppi ciclici finiti i sottogruppi
sono finiti.
Dimostrazione. Sia G = G(a) un gruppo ciclico ed S < G un
suo sottogruppo non banale. Indichiamo T = {m ∈ N∗ | am ∈ S}.
Chiaramente T 6= ∅ in quanto se e 6= at ∈ S, con t > 0 allora t ∈ T ;
se t < 0, siccome (at )−1 = a−t ∈ S, perché S è un sottogruppo,
allora −t ∈ T. A questo punto denotiamo s = min T e proviamo
che S = G(as ).
Intanto, G(as ) ⊆ S; si tratta allora di provare che vale l’inclu-
sione inversa. Cosı̀, se at ∈ S, utilizzando l’algoritmo di divisione,
t = qs + r con 0 ≤ r < s, per cui at = aqs+r = (as )q ar . Da ciò segue
ar = at ((as )q )−1 ∈ S, in quanto at , as ∈ S ed S è un sottogruppo.
Pertanto dalla minimalità di s segue r = 0. In definitiva, at = (as )q
e quindi S = G(as ).
Ci resta da vedere che se G è infinito anche S deve essere infinito.
Se in effetti S = G(as ) fosse finito allora esisterebbe una potenza di
as che dà l’elemento neutro; cioè (as )m = e per cui asm = e e quindi,
poiché vi è una potenza di a che dà l’elemento neutro, G = G(a)
non può essere infinito.

Siamo adesso in grado di rispondere alla domanda sui possibili
sottogruppi non banali di un gruppo.
134 CAPITOLO 4. TEORIA DEI GRUPPI

Teorema 4.3.9 Un gruppo G è privo di sottogruppi non banali se


e solo se è ciclico di ordine un numero primo p.

Dimostrazione. Supponiamo dapprima che G sia privo di sotto-


gruppi non banali. Ovviamente possiamo escludere il caso banale
G = {e}, e prendiamo in G un elemento a 6= e. Poiché G(a) è
un sottogruppo diverso da {e}, per la nostra ipotesi, deve essere
G = G(a), per cui G è ciclico. Se fosse ciclico infinito allora, ad
esempio, G(a2 ) sarebbe un sottogruppo diverso da G quindi non
banale. Per cui G è ciclico finito. Diciamo |G| = n. Se n non fosse
primo sarebbe n = pq con 1 < p ≤ q < n, allora G(ap ) sarebbe
un sottogruppo non banale di G contro l’ipotesi. In definitiva, G è
ciclico ed ha per ordine un numero primo.
Viceversa, supponiamo che G sia ciclico di ordine un primo p.
Allora, G = {e, a, a2 , . . . , ap−1 } ed ap = e. Proviamo per assurdo
che G non possiede sottogruppi non banali. Se avesse infatti un
sottogruppo G0 di ordine k < p, poiché G0 = G(ah ), con h < p,
sarà (ah )k = e. Poiché p era il più piccolo intero positivo tale che
ap = e, sarà hk multiplo di p, cioè hk = λp. Ora, essendo p primo,
p dovrebbe dividere h o k contro il fatto che h, k sono minori di p.

Una conseguenza del teorema precedente è che tutti i gruppi non
ciclici hanno sottogruppi non banali.
Concludiamo questa sezione studiando qualche interessante pro-
prietà.

Proposizione 4.3.10 Sia G un gruppo.


1. Se per ogni a, b ∈ G si ha (ab)2 = a2 b2 allora G è abeliano.

2. Se per ogni a ∈ G si ha a2 = e allora G è abeliano.

Dimostrazione. 1. Da (ab)2 = abab = a2 b2 per ogni a, b ∈ G


segue, moltiplicando a sinistra per a−1 ed a destra per b−1 , ba = ab
e quindi vale la proprietà commutativa, quindi G è abeliano.
4.4. OMOMORFISMI TRA GRUPPI 135

2. Per ogni a, b ∈ G, dall’ipotesi segue (ab)2 = e, cioè abab = e.


Moltiplicando ambo i membri a sinistra per a ed a destra per b si
ottiene a2 bab2 = ab; ma a2 = b2 = e, quindi ba = ab, la cercata
commutatività. Ne segue che G è abeliano.

4.4 Omomorfismi tra gruppi


Allorquando abbiamo studiato gli insiemi, ci siamo occupati delle
applicazioni, cioè delle leggi che legano tra loro due insiemi. Ma
quando si lavora con strutture definite su un insieme le applica-
zioni che ci interessano sono quelle che sono “compatibili” con le
operazioni definite sull’insieme. Per essere precisi diamo allora la
seguente definizione.

Definizione 4.4.1 Siano (G, · ) e (G0 , ∗) due gruppi. Diremo omo-


morfismo da G in G0 una applicazione ϕ : G → G0 tale che

ϕ(x · y) = ϕ(x) ∗ ϕ(y), per ogni x, y ∈ G.

Se inoltre ϕ è iniettiva l’omomorfismo si dice iniettivo o immer-


sione, se ϕ è suriettiva l’omomorfismo si dice suriettivo o surie-
zione, se infine ϕ è biiettiva l’omomorfismo si dice isomorfismo.

Esempio 4.4.2 1) Consideriamo i due gruppi (abeliani) (Z, +) de-


gli interi relativi rispetto all’addizione e (Q, +) dei razionali sempre
rispetto all’addizione; allora considerata l’applicazione (che abbia-
mo già conosciuto)
ϕ:Z→Q
definita da ϕ(x) = x1 è facile verificare che essa è un omomorfismo
iniettivo.
2) Consideriamo i due gruppi (abeliani) (R+ , · ) dei numeri reali
136 CAPITOLO 4. TEORIA DEI GRUPPI

positivi rispetto al prodotto e (R, +) dei reali rispetto all’addizione


e l’applicazione
ϕ : R+ → R
definita da ϕ(x) = log x. È facile verificare che tale applicazione
è biiettiva ed inoltre ϕ(x · y) = ϕ(x) + ϕ(y), in quanto log(xy) =
log x + log y. Quindi ϕ è un isomorfismo tra i due gruppi.
3) Consideriamo adesso i due gruppi (Gl2 (R), · ) e (R∗ , · ) e l’ap-
plicazione ϕ : Gl2 (R) → R∗ definita da ϕ(M ) = |M |. Per verificare
che si tratta di un omomorfismo (suriettivo) bisogna verificare che
ϕ(A · B) = ϕ(A)ϕ(B) cioè |A · B| = |A||B|, la cui veridicità è data
dal Teorema di Binet.
4) Infine, tra i due gruppi di ordine 6 (Z6 , +) e (Z∗7 , · ) l’applicazione
ϕ : Z6 → Z∗7 definita da ϕ([x]6 ) = [3x ]7 è un isomorfismo. Infatti,
che sia un omomorfismo segue dal fatto che [3(x+y) ]7 = [3x 3y ]7 =
[3x ]7 [3y ]7 ; mentre l’iniettività segue osservando che se [3x ]7 = [3y ]7
allora [3(x−y) ]7 = [1]7 (basta moltiplicare ambo i membri per [3y ]−1 7 )
e, dato che o([3]7 ) = 6 (vedi anche il Teorema di Fermat), si deduce
che x−y = 6m ovvero che [x]6 = [y]6 ; l’iniettività ed il fatto che en-
trambi i gruppi hanno lo stesso numero (finito) di elementi implica
anche la suriettività, sicché tale omomorfismo è un isomorfismo.

Cosı̀ come le applicazioni biiettive permettevano di affermare


che gli insiemi su cui agivano erano equipotenti, ovvero avevano
la stessa cardinalità, nel caso dei gruppi isomorfi potremo dire che
essi hanno la stessa struttura, ovvero che ogni proprietà algebrica
(cioè che dipende dall’operazione) che vale in uno dei due gruppi
deve valere anche nell’altro, anche se i due insiemi hanno elementi
diversi.
Nel seguito quando tra due gruppi G e G0 esiste un isomorfismo
diremo che essi sono isomorfi e scriveremo G ∼ = G0 .
L’esempio 4) precedente ha una ovvia generalizzazione.

Proposizione 4.4.3 Due gruppi ciclici dello stesso ordine sono


isomorfi.
4.4. OMOMORFISMI TRA GRUPPI 137

Dimostrazione. Siano (G, · ) e (G0 , ∗) due gruppi ciclici di ordine


n (la prova è analoga nel caso infinito), allora esistono a ∈ G e
b ∈ G0 tali che G = {e, a, . . . , an−1 } e G0 = {e0 , b, . . . , bn−1 }, per cui
l’applicazione ϕ : G → G0 definita da ϕ(ah ) = bh è chiaramente un
isomorfismo tra G e G0 (controllare!).

Proviamo adesso alcune semplici proprietà di cui godono gli


omomorfismi.

Proposizione 4.4.4 Sia f : G → G0 un omomorfismo tra due


gruppi, allora
f (e) = e0 dove e ed e0 sono gli elementi neutri dei due gruppi;
f (a−1 ) = f (a)−1 per ogni a ∈ G.

Dimostrazione. Per provare che f (e) è l’elemento neutro di G0 ,


poniamo f (e) = u0 , allora
u0 = f (e) = f (e · e) = f (e) ∗ f (e) = u0 ∗ u0
cioè u0 = u0 ∗ u0 che moltiplicando per l’inverso di u0 ambo i membri
ci dice u0 ∗ u0−1 = u0 ∗ u0 ∗ u0−1 , cioè e0 = u0 .
Per provare la seconda eguaglianza, cioè che f (a−1 ) è l’inverso
di f (a), basterà farne il prodotto
f (a) ∗ f (a−1 ) = f (a · a−1 ) = f (e) = e0 .

Infine, dato un omomorfismo ϕ : G → G0 , si definisce imma-
gine di ϕ il sottoinsieme di G0 dato da tutte le immagini degli
elementi di G, cioè im ϕ = {x0 ∈ G0 | ∃ x ∈ G | ϕ(x) = x0 }.
Ed ancora, si definisce nucleo di ϕ il sottoinsieme di G deter-
minato da tutti gli elementi che hanno per immagine l’elemento
neutro di G0 , cioè ker ϕ = {x ∈ G | ϕ(x) = e0 }.
138 CAPITOLO 4. TEORIA DEI GRUPPI

Proposizione 4.4.5 Se ϕ : G → G0 , è un omomorfismo di gruppi


allora im ϕ è un sottogruppo di G0 e ker ϕ è un sottogruppo di G.

Dimostrazione. Se x0 , y 0 ∈ im ϕ allora x0 = ϕ(x), y 0 = ϕ(y), per


certi x, y ∈ G; allora x0 y 0−1 = ϕ(x)ϕ(y)−1 = ϕ(xy −1 ) ∈ im ϕ.
Se x, y ∈ ker ϕ allora ϕ(x) = ϕ(y) = e0 , quindi si ha ϕ(xy −1 ) =
ϕ(x)ϕ(y)−1 = e0 e0 = e0 , cioè xy −1 ∈ ker ϕ.

L’applicazione ϕ : G → G0 tra due gruppi definita da ϕ(a) = e0
per ogni a ∈ G, cioè tale che ker ϕ = G, si dirà l’ omomorfismo
banale.

Cosı̀ come per le applicazioni si possono considerare composi-


zioni tra omomorfismi, precisamente

f g
Proposizione 4.4.6 Se G → G0 → G00 sono omomorfismi di grup-
g◦f
pi allora G → G00 è un omomorfismo di gruppi.

Dimostrazione. Infatti,

(g◦f )(xy) = g(f (xy)) = g(f (x)f (y)) = g(f (x))g(f (y)) = (g◦f )(x)(g◦f )(y).

4.5 Laterali e gruppo quoziente


Sia dato un gruppo (G, · ) ed un suo sottogruppo H ≤ G. A
partire da questo sottogruppo possiamo definire una relazione di
equivalenza su G definendo

a ≡ b ⇔ ab−1 ∈ H ∀ a, b ∈ G

Verifichiamo che si tratta di una relazione di equivalenza:


1) Riflessiva: a ≡ a per ogni a in G perché aa−1 = e ∈ H;
4.5. LATERALI E GRUPPO QUOZIENTE 139

2) Simmetrica: se a ≡ b ⇒ ab−1 ∈ H, ma H è un sottogruppo


quindi (ab−1 )−1 = ba−1 ∈ H ⇒ b ≡ a;
3) Transitiva: se a ≡ b e b ≡ c allora ab−1 ∈ H e bc−1 ∈ H, ma
H è un sottogruppo, quindi (ab−1 )(bc−1 ) = ac−1 ∈ H, ovvero a ≡ c.
Stabilita allora su G questa relazione di equivalenza mediante
H, G resta suddiviso in classi di equivalenza. Indicheremo con [a]
la classe di equivalenza determinata dall’elemento a.
Per quel che segue è comodo dare la seguente definizione

Definizione 4.5.1 Se H ≤ G è un sottogruppo di un gruppo G ed


a un elemento di G, diremo laterale destro di H individuato da
a, il sottoinsieme di G

Ha = {ha | ∀ h ∈ H}

In modo analogo, si chiama laterale sinistro di H individuato da


a il sottoinsieme di G

aH = {ah | ∀ h ∈ H}.

Facciamo vedere che laterali e classi di equivalenza individuati


dal sottogruppo H sono strettamente correlati.

Proposizione 4.5.2 Siano H ≤ G ed a ∈ G. Allora [a] = Ha.

Dimostrazione. Sia x ∈ [a] questo implica x ≡ a ovvero xa−1 ∈


H. Pertanto, xa−1 = h per qualche h ∈ H, da cui segue, moltipli-
cando a destra per a, x = ha ∈ Ha. Cosı̀ [a] ⊆ Ha.
Sia ora y ∈ Ha, cioè y = ha per qualche h ∈ H. Ma questo
significa ya−1 = h ∈ H, ovvero y ∈ [a]. Cosı̀ Ha ⊆ [a] da cui segue
l’eguaglianza richiesta.


140 CAPITOLO 4. TEORIA DEI GRUPPI

Alla luce del risultato precedente i laterali destri costituiscono


una partizione di G, cioè la loro unione dà tutto G e l’intersezione
di due distinti laterali è vuota.
Ora osserviamo che due qualsiasi laterali (destri) sono equi-
potenti, cioè |Ha| = |Hb|; infatti, esiste una naturale applica-
zione biiettiva tra essi, precisamente ϕ : Ha → Hb definita da
ϕ(ha) = hb. Essa è biiettiva:

• iniettività: se ϕ(ha) = ϕ(h0 a) allora hb = h0 b per cui h = h0 e


quindi ha = h0 a;

• suriettività: preso un qualunque hb ∈ Hb allora ϕ(ha) = hb.

Adesso osserviamo che tra i tanti laterali vi è anche He = H, per


cui tutti i laterali sono equipotenti al sottogruppo assegnato.
Concentriamoci adesso sul caso in cui G è un gruppo finito. In
tal caso anche il numero di laterali (destri) deve essere finito. Il
numero di laterali (destri) verrà indicato con iG (H), detto indice
di H in G.
Riassumendo tutto quanto detto finora si ha

Teorema 4.5.3 (Teorema di Lagrange) Se G è un gruppo finito


di ordine O(G) ed H un suo sottogruppo di ordine O(H), allora

O(G) = O(H)iG (H).

In particolare, l’ordine di un qualsiasi sottogruppo è un divisore


dell’ordine del gruppo.

Esempio 4.5.4 Se G è un gruppo di ordine 10, per il Teorema di


Lagrange, i suoi possibili sottogruppi possono avere ordine: 1, 2, 5, 10.
Conseguentemente in G non vi sono sottogruppi di ordine 3, 4, 6,
7, 8, 9.
4.5. LATERALI E GRUPPO QUOZIENTE 141

Il Teorema di Lagrange ci consente di dire quali sottogruppi non


possono stare in un dato gruppo, ma nulla ci dice sull’esistenza di
quelli possibili. Cioè se m è un divisore di n = O(G) non è detto
che esista un sottogruppo di ordine m.

Corollario 4.5.5 Se G è un gruppo finito ed a ∈ G, allora o(a) è


un divisore di O(G). Inoltre, aO(G) = e.

Dimostrazione. Basterà ricordare che o(a) è il più piccolo na-


turale non nullo m tale che am = e e che in tal caso G(a) =
{e, a, a2 , . . . , am−1 } per cui o(a) = O(G(a)). Ma G(a) è un sotto-
gruppo di G quindi O(G(a)) è un divisore di O(G). Quindi O(G) =
o(a)h ed essendo ao(a) = e per definizione, si deduce che ao(a)h =
aO(G) = e.

Il fatto che i laterali (destri) di un sottogruppo H in un gruppo
G costituiscono una partizione di G, ci permette di affermare che
essi danno luogo all’insieme quoziente di G rispetto ad H. Tale
insieme quoziente ha come elementi tutti i laterali (destri)

G/H = {Ha | ∀a ∈ G}.

Ma naturalmente, poiché siamo partiti da un gruppo, ci piacerebbe


che l’insieme quoziente G/H ereditasse in qualche modo la struttura
di gruppo posseduta da G. Cioè sarebbe opportuno definire su G/H
una operazione che dipenda dall’operazione in G e che renda G/H
un gruppo. La maniera più naturale è quella di definire la seguente
operazione in G/H :

Ha · Hb = Hab ∀ Ha, Hb ∈ G/H.

Ma prima di controllare se (G/H, · ) formi un gruppo dobbiamo


verificare se · è una operazione (interna) in G/H, perché dobbiamo
ricordare che se Ha = Ha0 non significa che a = a0 ma bensı̀ a ≡ a0 ,
cioè a · a0−1 ∈ H. Allora dobbiamo verificare che se Ha = Ha0
142 CAPITOLO 4. TEORIA DEI GRUPPI

e Hb = Hb0 allora Hab = Ha0 b0 . Per fare quest’ultima verifica


dobbiamo provare che

se aa0−1 ∈ H, bb0−1 ∈ H ⇒ ab(a0 b0 )−1 ∈ H.

Ora ab(a0 b0 )−1 = abb0−1 a0−1 = a(bb0−1 )a0−1 e noi sappiamo solo che
bb0−1 ∈ H. In conclusione l’operazione non è, in generale, ben de-
finita. Abbiamo bisogno di sottogruppi particolari perché le cose
funzionino (notare che per semplicità si sotto intende il “·”). Diamo
allora la seguente definizione.

Definizione 4.5.6 Un sottogruppo H ≤ G si dice normale se per


ogni a ∈ G si ha aHa−1 ⊆ H o, equivalentemente, se aHa−1 = H,
o, ancora, Ha = aH (cioè ogni laterale destro è anche un laterale
sinistro).

È evidente che se G è un gruppo abeliano ogni suo sottogrup-


po è normale. Nel seguito per indicare un sottogruppo normale
scriveremo H / G.

Proposizione 4.5.7 Sia G un gruppo e H un suo sottogruppo


normale. Allora definendo in G/H l’operazione

Ha · Hb = Hab

si ottiene in G/H una struttura di gruppo, detto gruppo quozien-


te di G su H.

Dimostrazione. Ovviamente la cosa più seria è provare che l’o-


perazione sia ben definita. Ma avevamo lasciato che occorreva pro-
vare che se Ha = Ha0 e Hb = Hb0 allora a(bb0−1 )a0−1 ∈ H. Ora,
bb0−1 ∈ H perché Hb = Hb0 ; sicché a(bb0−1 )a0−1 ∈ aHa−1 , ma per la
normalità di H, aHa−1 = H; in conclusione a(bb0−1 )a0−1 ∈ H per
cui l’operazione è ben definita. Adesso verifichiamo tutto il resto.
1) Associatività: Ha(HbHc) = (HaHb)Hc, infatti entrambi
producono il laterale Habc.
4.6. SOTTOGRUPPI NORMALI 143

2) Elemento neutro: He = H è l’elemento neutro. Infatti


HeHa = Hea = Ha.
3) L’inverso di ogni elemento: per ogni Ha l’inverso è Ha−1 .
Infatti, HaHa−1 = Haa−1 = He = H.


Proposizione 4.5.8 Se ϕ : G → G0 è un omomorfismo tra gruppi,


allora ker ϕ è un sottogruppo normale di G.

Dimostrazione. Posto per semplicità ker ϕ = K si tratta di


provare che per ogni x ∈ G si ha xKx−1 ⊆ K. Ed infatti, per ogni
k ∈ K si ha ϕ(xkx−1 ) = ϕ(x)ϕ(k)ϕ(x−1 ) = ϕ(x)e0 ϕ(x)−1 = e0 , cioè
xkx−1 ∈ K.


4.6 Sottogruppi normali


Adesso che abbiamo definito i sottogruppi normali e evidenziato la
loro importanza nel contesto della teoria dei gruppi specialmente
per la possibilità di costruire il gruppo quoziente, in questa sezione
ci dedichiamo a studiare alcune proprietà relative a tali sottogruppi.
Una prima osservazione è la seguente.

Proposizione 4.6.1 Se G è un gruppo di ordine pari, O(G) = 2n,


ed H un suo sottogruppo di ordine n, allora H è un sottogruppo
normale.

Dimostrazione. Dalle ipotesi segue che iG (H) = 2, cioè in G


vi sono solo due laterali destri: uno è H e l’altro, dovendo essere
disgiunto da H e completare G deve necessariamente essere G \ H.
Per lo stesso motivo G possiede due soli laterali sinistri: uno è
ancora H e quindi l’altro è ancora G \ H. In definitiva, ogni laterale
destro è anche un laterale sinistro e questo ci dice che H è normale.
144 CAPITOLO 4. TEORIA DEI GRUPPI


Ovviamente il centro Z(G) di un gruppo G è normale: infatti,
dalla definizione segue che xZ(G) = Z(G)x per ogni x ∈ G.

Proposizione 4.6.2 Sia d un intero e supponiamo che in un grup-


po G vi sia un solo sottogruppo H per un dato ordine d. Allora H
è normale.

Dimostrazione. Cominciamo con l’osservare che, fissato un ele-


mento x ∈ G, allora xHx−1 è un sottogruppo di G equipotente ad
H. Infatti, se xh1 x−1 , xh2 x−1 sono due elementi di xHx−1 allora

(xh1 x−1 )(xh2 x−1 )−1 = xh1 x−1 xh−1


2 x
−1
= x(h1 h−1
2 )x
−1
∈ xHx−1 ,

per cui xHx−1 è un sottogruppo. Il fatto che esso sia equipotente


con H si vede dal fatto che l’applicazione

ϕ : H → xHx−1

definita da ϕ(h) = xhx−1 è biiettiva. Sicché nelle nostre ipotesi


O(xHx−1 ) = d; ma poiché H era l’unico sottogruppo di ordine d,
segue xHx−1 = H per ogni x ∈ G, ovvero H è un sottogruppo
normale.


Proposizione 4.6.3 Se N1 ed N2 sono due sottogruppi normali di


G allora N1 ∩ N2 è un sottogruppo normale di G.

Dimostrazione. Sia xzx−1 un elemento con z ∈ N1 ∩ N2 , cioè


z ∈ N1 e z ∈ N2 ; ma essendo tali sottogruppi normali si ha che
xzx−1 ∈ xN1 x−1 = N1 e xzx−1 ∈ xN2 x−1 = N2 , in definitiva,
xzx−1 ∈ N1 ∩ N2 , ovvero

x(N1 ∩ N2 )x−1 = N1 ∩ N2 .
4.6. SOTTOGRUPPI NORMALI 145

Una questione semplice da porre è la seguente: se H, K sono due


sottogruppi di un gruppo G, possiamo considerare il loro prodotto

HK = {hk | ∀ h ∈ H, k ∈ K};

quando HK è un sottogruppo di G? La risposta sta nella seguente


proposizione.

Proposizione 4.6.4 Siano H, K sottogruppi di un gruppo G. Al-


lora
HK ≤ G ⇔ HK = KH.

Dimostrazione. Supponiamo che HK sia un sottogruppo di G e


proviamo che HK = KH verificando le due inclusioni.
1) HK ⊆ KH. Sia hk ∈ HK, poiché HK è un sottogruppo
(hk)−1 ∈ HK; sicché (hk)−1 = h0 k 0 da cui segue hk = (h0 k 0 )−1 =
k 0−1 h0−1 ∈ KH.
2) KH ⊆ HK. Sia kh ∈ KH, e consideriamo (kh)−1 = h−1 k −1 ∈
HK; ma HK è un sottogruppo quindi ((kh)−1 )−1 = kh ∈ HK.
Viceversa, supponiamo che HK = KH e proviamo che HK è
un sottogruppo. Siano allora h1 k1 , h2 k2 due qualsiasi elementi di
HK; allora
(h1 k1 )(h2 k2 )−1 = h1 k1 k2−1 h−1
2 .

Utilizzando il fatto che HK = KH possiamo dire che k2−1 h−1 2 ∈


KH = HK cioè k2−1 h−1 2 = h0 0
k ; ma k1 h0
∈ KH = HK per cui
k1 h0 = h00 k 00 . In definitiva

h1 k1 k2−1 h−1 0 0 00 00 0
2 = h1 k1 h k = (h1 h )(k k ),

pertanto, (h1 k1 )(h2 k2 )−1 = (h1 h00 )(k 00 k 0 ) ∈ HK.


146 CAPITOLO 4. TEORIA DEI GRUPPI

Corollario 4.6.5 Se H, K sono sottogruppi di G di cui uno almeno


è normale, allora HK è un sottogruppo di G.

Dimostrazione. Diciamo H il sottogruppo normale: allora Hk =


kH per ogni k ∈ G ed a fortiori per ogni k ∈ K. Pertanto HK =
KH e la tesi segue dalla proposizione precedente.

Corollario 4.6.6 Se H, K sono sottogruppi di G e G è abeliano,


allora HK è un sottogruppo di G.

Dimostrazione. Basta osservare che in tal caso H e K sono


sottogruppi normali.

Abbiamo studiato il prodotto tra due sottogruppi H e K (che


non sempre è un sottogruppo). È interessante chiedersi, nel caso
in cui G sia un gruppo finito (ed indipendentemente dal fatto che
HK sia un sottogruppo) quanti elementi possiede HK. La risposta
è data dalla seguente semplice relazione

Proposizione 4.6.7 Se H e K sono due sottogruppi di un gruppo


finito G allora

O(HK) = O(H)O(K)/O(H ∩ K).

Dimostrazione. Ovviamente se consideriamo tutti i possibili pro-


dotti hk con h ∈ H e k ∈ K otterremo O(H)O(K) elementi, ma
naturalmente alcuni di essi potrebbero coincidere fra loro. Allo-
ra per ottenere la nostra formula basterà far vedere che ognuno
di quegli elementi si ripete un numero di volte pari a O(H ∩ K).
Ed allora sia hk con h ∈ H e k ∈ K e z ∈ H ∩ K; avremo
hk = h(zz −1 )k = (hz)(z −1 k) con, ovviamente, hz ∈ H e z −1 k ∈ K.
4.7. TEOREMI DELL’OMOMORFISMO 147

Quindi ogni elemento di H ∩ K produce una ripetizione dell’ele-


mento hk che quindi in tutti i possibili prodotti si ripete almeno
O(H ∩ K) volte. Ora, viceversa, sia hk = h0 k 0 una ripetizione in
tutti i suddetti prodotti e poniamo kk 0−1 = h−1 h0 = z ∈ H ∩ K. Da
ciò segue h0 = hz e k 0 = z −1 k per cui avremo hk = (hz)(z −1 k) cioè
la ripetizione è una di quelle provenienti da un elemento di H ∩ K.

Vediamo una semplice applicazione della precedente formula.

Esempio 4.6.8 Sia G un gruppo con O(G) = pq con p > q e p


primo. Se in G esiste un sottogruppo H di ordine p (ed in effetti
tra breve vedremo che un siffatto sottogruppo deve esserci!) allora
esso è normale. In effetti, proviamo che H è l’unico sottogruppo di
ordine p. Infatti, se K è un sottogruppo di ordine p allora H ∩ K
essendo un sottogruppo di H (e di K) deve avere ordine un divisore
di p; ma p è primo per cui l’ordine di H ∩ K è 1 oppure p. Se fosse
1, dalla formula precedente, seguirebbe O(HK) = O(H)O(K) = p2
ma ciò è assurdo in quanto essendo HK ⊆ G ha ordine ≤ pq mentre
p2 > pq. Cosı̀ l’ordine di H ∩ K deve essere p (quanto quello di H
e K), ma essendo H ∩ K ⊆ H dovrà essere H = K. Essendo allora
H l’unico sottogruppo di ordine p per la Proposizione 4.6.2 si ha
che H è normale.

4.7 Teoremi dell’omomorfismo


Cominciamo a far vedere che vi è una maniera semplice per verifi-
care se un omomorfismo è iniettivo.

Proposizione 4.7.1 Un omomorfismo di gruppi f : G → G0 è


iniettivo se e solo se ker f = {e}.

Dimostrazione. Sia f iniettivo ed x un qualunque elemento di


ker f ; allora f (x) = e0 e, d’altra parte, anche f (e) = e0 , come
148 CAPITOLO 4. TEORIA DEI GRUPPI

abbiamo già visto. Quindi per l’iniettività di f si ha x = e, pertanto


ker f = {e}. Viceversa, se ker f = {e}, presi due elementi x, y tali
che f (x) = f (y), si avrà f (x)f (y)−1 = e0 , cioè f (xy −1 ) = e0 . Questo
implica che xy −1 ∈ ker f, ma ker f = {e}, quindi xy −1 = e, in
definitiva, x = y, cioè f è iniettivo.

Se G è un gruppo ed H un suo sottogruppo normale nasce come


detto il gruppo quoziente G/H. Tra G e G/H vi è un omomorfismo
suriettivo π : G → G/H definito per ogni a ∈ G da π(a) = Ha,
che viene detto la suriezione naturale tra un gruppo ed un suo
quoziente.
In particolare, se ϕ : G → G0 è un omomorfismo tra gruppi,
poiché ker ϕ è un sottogruppo normale, nasce il gruppo quoziente
G/ ker ϕ e la suriezione naturale π : G → G/ ker ϕ.

Proposizione 4.7.2 (1o Teorema dell’omomorfismo) Se f :


G → G0 è un omomorfismo di gruppi, allora esiste un omomorfismo
iniettivo ω : G/ ker f → G0 tale che ω ◦ π = f.
f
G −→ G0
π& %ω
G/ ker f

Dimostrazione. Per semplicità denotiamo ker f = K. Definiamo


la seguente applicazione ω : G/K → G0

ω(Kx) = f (x).

Si tratta di verificare che questo è l’omomorfismo cercato. In-


nanzitutto, verifichiamo che essa è una applicazione, ovvero che
sia ben definita, cioè se Kx = Ky allora ω(Kx) = ω(Ky), cioè
f (x) = f (y). Ma Kx = Ky implica x = ky, per qualche k ∈ K.
Allora f (x) = f (ky) = f (k)f (y) = e0 f (y) = f (y), ricordando che
K = ker f.
4.7. TEOREMI DELL’OMOMORFISMO 149

Adesso proviamo che si tratta di un omomorfismo:

ω(KxKy) = ω(Kxy) = f (xy) = f (x)f (y) = ω(Kx)ω(Ky).

Verifichiamo adesso che si tratta di un omomorfismo iniettivo. Cal-


coliamo il nucleo di ω :

ker ω = {Kx | f (x) = e0 } = {Kx | x ∈ ker f = K} = {K}

ma K è l’elemento neutro di G/K, quindi ω è iniettivo.


Infine, ω ◦ π(x) = ω(Kx) = f (x), cioè ω ◦ π = f.

Osserviamo che se f : G → G0 è un omomorfismo iniettivo, sosti-
tuendo G0 con im f , allora f : G → im f è un isomorfismo. Per
cui

Teorema 4.7.3 (Teorema dell’isomorfismo) Se f : G → G0 è


un omomorfismo di gruppi, allora G/ ker f è isomorfo a im f, cioè
G/ ker f ∼
= im f. In particolare, se f è suriettivo, allora G/ ker f ∼
=
0
G.

Dimostrazione. Basta osservare che l’omomorfismo ω, definito


nel teorema precedente, è un isomorfismo su im ω = im f.

Vediamo una semplice applicazione del precedente risultato.

Esempio 4.7.4 Siano G e G0 gruppi di ordine, rispettivamente,


O(G) = 25 e O(G0 ) = 72 e ϕ : G → G0 un omomorfismo tra es-
si. Allora ϕ è l’omomorfismo banale. Infatti, per il Teorema di
Lagrange O(im ϕ) è un divisore di 72 e dal Teorema dell’omomor-
fismo O(im ϕ) = O(G/ ker ϕ) è un divisore di O(G) = 25, quindi
O(im ϕ) = 1. Pertanto l’unico omomorfismo tra G e G0 sarà quello
banale.
Naturalmente, l’esempio può essere generalizzato a due qualsiasi
gruppi aventi gli ordini primi tra loro.
150 CAPITOLO 4. TEORIA DEI GRUPPI

Teorema 4.7.5 (Relazioni tra omomorfismi e sottogruppi)


Sia f : G → G0 un omomorfismo tra gruppi, allora

i. se H ≤ G ⇒ f (H) ≤ G0 ;

ii. se H 0 ≤ G0 ⇒ f −1 (H 0 ) ≤ G e contiene ker f ;

iii. se N 0 / G0 ⇒ f −1 (N 0 ) / G;

iv. se N / G ⇒ f (N ) / im f.

Dimostrazione. i. Se x0 , y 0 ∈ f (H) allora x0 = f (x) e y 0 = f (y)


per certi x, y ∈ H, allora x0 y 0−1 = f (x)f (y −1 ) = f (xy −1 ); ma poiché
H è un sottogruppo xy −1 ∈ H quindi x0 y 0−1 ∈ f (H).
ii. Se x, y ∈ f −1 (H 0 ) allora f (x) ∈ H 0 e f (y) ∈ H 0 , per cui
f (xy −1 ) = f (x)f (y)−1 ∈ H 0 ovvero xy −1 ∈ f −1 (H 0 ).
iii. Se h ∈ f −1 (N 0 ), cioè f (h) ∈ N 0 , proviamo che per ogni
x ∈ G, xhx−1 ∈ f −1 (N 0 ). Per fare ciò calcoliamo f (xhx−1 ) =
f (x)f (h)f (x)−1 ∈ N 0 perché f (h) ∈ N 0 ed N 0 è un sottogruppo
normale di G0 .
iv. Se h0 ∈ f (N ), cioè h0 = f (h) per qualche h ∈ N, e se
x ∈ im f, cioè x0 = f (x) per qualche x ∈ G, dobbiamo provare
0

che x0 h0 x0−1 ∈ f (N ). Ma, x0 h0 x0−1 = f (x)f (h)f (x−1 ) = f (xhx−1 )


e dalla normalità di N segue che xhx−1 ∈ N, pertanto x0 h0 x0−1 ∈
f (N ).
Osserviamo che nel caso in cui f è suriettivo allora la iv. dice
che se N / G ⇒ f (N ) / G0 .

Utilizzando il precedente risultato possiamo dare alcune nuove


versioni del teorema dell’isomorfismo.

Teorema 4.7.6 (Teorema dell’isomorfismo 2) Se f : G → G0


è un omomorfismo suriettivo di gruppi ed N 0 / G0 , allora posto N =
f −1 (N 0 ) si ha G/N ∼
= G0 /N 0 . In particolare, posto K = ker f, si ha
G/N ∼ = (G/K)/(N/K).
4.7. TEOREMI DELL’OMOMORFISMO 151

f π0
Dimostrazione. Si consideri la composizione G → G0 → G0 /N 0
con π 0 suriezione naturale. Essa è un omomorfismo suriettivo, quin-
di per il Teorema dell’isomorfismo sarà G/ ker(π 0 ◦ f ) ∼
= G0 /N 0 ; ma
0 0 0
ker(π ◦ f ) = {x ∈ G | f (x) ∈ N } cioè ker(π ◦ f ) = N da cui segue
la prima conclusione. L’ultima asserzione segue dal fatto che dal
Teorema dell’isomorfismo si ha G0 ∼ = G/K e N 0 ∼= N/K.

Teorema 4.7.7 (Teorema dell’isomorfismo 3) Se f : G → G0


è un omomorfismo suriettivo di gruppi e K = ker f. Se H è un
qualsiasi sottogruppo di G allora

1. f −1 f (H) = HK = KH;

2. H ∩ K / H; e K / HK;

3. H/(H ∩ K) ∼
= HK/K.

Dimostrazione. 1. Sia x ∈ f −1 f (H) questo significa che f (x) ∈


f (H) e quindi f (x) = f (h) per qualche h ∈ H. Cosı̀ f (x)f (h)−1 = e0
per cui xh−1 ∈ ker f = K cioè x ∈ Kh ⊆ KH = HK (visto che K
è normale in G). Viceversa, se x ∈ HK allora x = hk con h ∈ H
e k ∈ K. Allora f (x) = f (h)f (k) = f (h)e0 = f (h) e pertanto
x ∈ f −1 f (H).
2. Se consideriamo la restrizione dell’omomorfismo f ad H, cioè
f|H : H → G0 si verifica facilmente che ker f|H = H ∩ K quindi
H ∩ K è un sottogruppo normale di H. Il secondo fatto è ovvio.
3. Intanto G0 ∼ = G/K, mentre imf|H ∼ = HK/K (verificare!);
allora per il Teorema dell’isomorfismo H/ ker f|H ∼ = imf|H cioè

H/(H ∩ K) = HK/K.


152 CAPITOLO 4. TEORIA DEI GRUPPI

4.8 Automorfismi di un gruppo

Definizione 4.8.1 Se G è un gruppo, un isomorfismo ϕ : G → G


si dice automorfismo di G.

Un esempio elementare di automorfismo è quello definito da


j : G → G con j(x) = x−1 .
Se indichiamo con Aut(G) l’insieme di tutti gli automorfismi
di un gruppo G si vede facilmente che rispetto alla operazione di
composizione (Aut(G), ◦) costituisce un gruppo. Basta osservare
che la composizione è associativa, che se f ∈ Aut(G) anche f −1 ∈
Aut(G) e che l’applicazione identica 1G è un elemento di Aut(G).
Tra i tanti automorfismi di un gruppo G vi sono quelli del se-
guente tipo: fissato un elemento g ∈ G si definisce tg : G → G
l’applicazione definita da tg (x) = gxg −1 . È una facile verifica mo-
strare che tg è un automorfismo, che viene detto automorfismo
interno. L’insieme degli automorfismi interni di G si denota con
I(G).

Proposizione 4.8.2 Se G è un gruppo, I(G) è un sottogruppo


normale di Aut(G).

Dimostrazione. Sia f ∈ Aut(G) e ty ∈ I(G), dobbiamo provare


che f ◦ ty ◦ f −1 ∈ I(G). Ed infatti, per ogni x ∈ G si ha (f ◦ ty ◦
f −1 )(x) = f (ty (f −1 (x))) = f (yf −1 (x)y −1 ) = f (y)(x)f (y)−1 cioè
f ◦ ty ◦ f −1 = tf (y) ∈ I(G).

La cosa interessante è che il sottogruppo degli automorfismi interni


è strettamente legato al centro del gruppo. Nota che ad esempio
se G è abeliano, cioè Z(G) = G allora I(G) = {1G } : infatti,
tg (x) = gxg −1 = gg −1 x = x.

Proposizione 4.8.3 Se G è un gruppo allora I(G) ∼


= G/Z(G).
4.9. GRUPPI SIMMETRICI 153

Dimostrazione. Consideriamo infatti l’applicazione ϕ : G →


I(G) definita da ϕ(g) = tg ∈ I(G). È chiaro che ϕ è un omomor-
fismo suriettivo. Verifichiamo che ker ϕ = Z(G) : sia g ∈ ker ϕ
cioè ϕ(g) = tg = 1G ; allora per ogni x ∈ G si ha tg (x) = x ovvero
gxg −1 = x cioè gx = xg per cui g ∈ Z(G). Viceversa, se g ∈ Z(G)
allora gx = xg, per ogni x, ovvero gxg −1 = x, per cui tg (x) = x, in
definitiva ϕ(g) = tg = 1G il che implica g ∈ ker ϕ. Usando allora il
Teorema dell’isomorfismo avremo G/Z(G) ∼ = I(G).


4.9 Gruppi simmetrici


Questa sezione è dedicata ad una speciale classe di gruppi, i gruppi
simmetrici o gruppi di sostituzioni, la cui importanza verrà presto
evidenziata dal Teorema di Cayley che tra poco vedremo.
Sia I un insieme qualsiasi e consideriamo l’insieme di tutte le
applicazioni biiettive di I in sé, che indicheremo con
S(I) = {f : I → I | f biiettiva}.
Definiamo su S(I) l’operazione di composizione, cioè per ogni f, g ∈
S(I)
f · g = g ◦ f.
Poiché la composizione di applicazioni biiettive è biiettiva, la com-
posizione è una operazione (interna) su S(I). D’altra parte, la com-
posizione è associativa e l’applicazione identica 1I si comporta da
elemento neutro per la composizione; infine, poiché le applicazioni
in S(I) sono biiettive, ammettono l’inversa. Pertanto (S(I), · ) co-
stituisce un gruppo, detto gruppo simmetrico su I (o gruppo
delle sostituzioni).
In generale, il gruppo simmetrico su un insieme I non è abeliano
in quanto è noto che, se |I| > 2, esistono applicazioni tali che
g ◦ f 6= f ◦ g.
Il caso più interessante sia ha quando I è un insieme finito. In
tal caso, se |I| = n, S(I) lo si indica con Sn e si ha che |Sn | = n!.
154 CAPITOLO 4. TEORIA DEI GRUPPI

Studiamo più in dettaglio il gruppo simmetrico su tre elemen-


ti S3 , che ovviamente contiene 3! = 6 elementi. Esplicitiamo gli
elementi di S3 . Posto I = {1, 2, 3}, si ha
     
1 2 3 1 2 3 1 2 3
s1 = ; s2 = ; s3 = ;
1 2 3 1 3 2 3 2 1
     
1 2 3 1 2 3 1 2 3
s4 = ; s5 = ; s6 = .
2 1 3 2 3 1 3 1 2
Cosı̀ S3 = {s1 , s2 , s3 , s4 , s5 , s6 }. Calcoliamo, a titolo di esempio,
     
1 2 3 1 2 3 1 2 3
s2 · s4 = · = = s5
1 3 2 2 1 3 2 3 1
     
1 2 3 1 2 3 1 2 3
s4 · s2 = · = = s6
2 1 3 1 3 2 3 1 2
da cui segue, tra l’altro, che S3 non è commutativo.
Poiché O(S3 ) = 6 per il Teorema di Lagrange i suoi sottogruppi
(non banali) devono avere ordine 2 o 3. Cerchiamo quelli di ordine
2 : poiché s2 s2 = s1 , s3 s3 = s1 , s4 s4 = s1 , allora si hanno questi tre
sottogruppi di ordine 2

A1 = {s1 , s2 }, A2 = {s1 , s3 }, A3 = {s1 , s4 }.

Ora s3 A1 = {s3 , s5 }, mentre A1 s3 = {s3 , s6 }, quindi s3 A1 6= A1 s3


per cui A1 non è un sottogruppo normale. Analogo discorso può
farsi per A2 ed A3 .
Cerchiamo adesso quelli di ordine 3 (che non possono conte-
nere s2 , s3 , s4 in quanto sono di ordine 2 che non divide 3): l’u-
nica possibilità che rimane è B1 = {s1 , s5 , s6 } ed in effetti B1 è
un sottogruppo, basta verificare che s5 s6 = s1 e s6 s5 = s1 per la
caratterizzazione dei sottogruppi finiti. Chiaramente B1 è un sot-
togruppo normale avente per ordine la metà dell’ordine del gruppo
S3 (o anche perché l’unico sottogruppo di ordine 3).
4.9. GRUPPI SIMMETRICI 155

Osservazione 4.9.1 Abbiamo visto che S3 è un gruppo non abe-


liano. Poiché vedremo che ogni gruppo che ha meno di 6 elementi è
certamente abeliano, S3 risulta essere il più piccolo dei gruppi non
abeliani.
Sia ora I = {1, 2, . . . , n} e s ∈ Sn ; considerato un qualunque
elemento x ∈ I si dirà orbita di x in s l’insieme Os (x) definito da
Os (x) = {y ∈ I | y = si (x) per qualche intero positivo i}.
 
1 2 3 4 5
Ad esempio in S5 preso s = , si ha
2 4 5 1 3
Os (2) = {1, 2, 4} Os (5) = {3, 5}.
Poiché ovviamente vi sono interi i per cui si (x) = x possiamo pren-
dere il più piccolo di tali interi (positivi), diciamo m; in tal caso la
m-upla
(x, s(x), s2 (x), . . . , sm−1 (x))
si dirà un m-ciclo di s.
Un m-ciclo si può pensare come una delle sostituzioni, pre-
cisamente come quella che manda si (x) in si+1 (x) per ogni i =
1, . . . , m − 1 (e lascia fissi
 gli altri elementi).
 Ad esempio, in S5
1 2 3 4 5
preso come prima s = , il 3-ciclo (1, 2, 4) è la
 2 4 5  1 3
1 2 3 4 5
sostituzione s1 = , mentre il 2-ciclo (3, 5) è la
 2 4 3 1 5
1 2 3 4 5
sostituzione s2 = .
1 2 5 4 3
Naturalmente un m-ciclo s ∈ Sn è un elemento di ordine m del
gruppo. Un 2-ciclo usualmente si chiama trasposizione. Osser-
viamo che nell’esempio precedente s = s1 · s2 ; questo è un fatto
generale, precisamente vale la seguente

Proposizione 4.9.2 Sia s ∈ Sn una sostituzione e siano s1 , . . . st


tutti i suoi cicli (distinti). Allora s = s1 ·. . .·st cioè ogni sostituzione
è prodotto dei suoi cicli.
156 CAPITOLO 4. TEORIA DEI GRUPPI

Dimostrazione. Si tratta di provare che per ogni x ∈ I si ha


s(x) = (s1 · . . . · st )(x). Ora x appare in un solo ciclo si (visto
che cicli distinti sono disgiunti) e si ha si = (x, s(x), . . . sm−1 (x))
cosı̀ x è lasciato fisso da tutti gli altri, cioè sj (x) = x per ogni
j 6= i; ovviamente lo stesso può dirsi per gli elementi dell’orbita di
x. Allora

(s1 ·. . .·st )(x) = (st ◦. . .◦si+1 ◦si . . .◦s1 )(x) = (st ◦. . .◦si+1 )(s(x)) = s(x).

Corollario 4.9.3 Ogni sostituzione ha ordine dato dal minimo co-


mune multiplo degli ordini (o lunghezza) dei suoi cicli.

Dimostrazione. Basta usare la proposizione precedente per de-


durre che se sh = 1I allora shi = 1I quindi h è multiplo di o(si ) per
ogni i quindi h è multiplo del mcm degli ordini dei cicli di s.

Un’altra conseguenza della Proposizione 4.9.2 è il fatto che ogni
sostituzione è esprimibile (in modo non unico) attraverso trasposi-
zioni.

Corollario 4.9.4 Ogni sostituzione è prodotto di 2-cicli (o traspo-


sizioni).

Dimostrazione. In virtù della Proposizione 4.9.2 basta verifica-


re che ogni ciclo è prodotto di trasposizioni. Ma questo fatto è
elementare, basta osservare che il ciclo (1, 2, . . . , m) può scriversi

(1, 2, . . . , m) = (1, 2)(1, 3) . . . (1, m − 1)(1, m).


Alla luce del precedente corollario ha senso la seguente defini-
zione.
4.9. GRUPPI SIMMETRICI 157

Definizione 4.9.5 Una sostituzione si dice di classe pari se es-


sa è prodotto di un numero pari di trasposizioni mentre si dice di
classe dispari se è prodotto di un numero dispari di trasposizioni.

Naturalmente, per aver senso la precedente definizione occorre


osservare che, visto che ogni sostituzione si può esprime in più modi
come prodotto di trasposizioni, in ogni caso il numero di trasposi-
zioni che appaiono in una qualunque di tali espressioni ha sempre la
stessa parità (cioè se uno è pari lo sono tutti gli altri, analogamente
se uno è dispari lo sono tutti gli altri).
È facile verificare che in Sn l’insieme di tutte le sostituzioni di
classe pari An costituisce un sottogruppo, detto il sottogruppo
alterno. Poiché |An | = n!2 si deduce, per la Proposizione 4.6.1, che
An è un sottogruppo normale di Sn .
L’importanza dei gruppi simmetrici risiede nel fatto che ogni
gruppo si può immergere in uno di questi gruppi ovvero è isomorfo
ad un sottogruppo di un gruppo di sostituzioni, come mostra il
seguente Teorema dovuto a Cayley.

Teorema 4.9.6 (Teorema di Cayley) Ogni gruppo G si può


immergere nel gruppo simmetrico S(G).

Dimostrazione. Cominciamo a provare che ad ogni g ∈ G possia-


mo associare una applicazione biiettiva tg : G → G, precisamente
tg (x) = gx.
- Verifichiamo che tg è iniettiva: se tg (x) = tg (y) allora gx = gy
per cui x = y.
- Verifichiamo la suriettività: se y ∈ G si consideri g −1 y ∈ G,
allora tg (g −1 y) = gg −1 y = y il che porta alla cercata suriettività.
Siamo adesso in grado di trovare l’immersione di G in S(G).
Definiamo ϕ : G → S(G) mediante

ϕ(g) = tg ∈ S(G)

Controlliamo che ϕ è un omomorfismo iniettivo.


158 CAPITOLO 4. TEORIA DEI GRUPPI

- Omomorfismo: ϕ(g1 g2 ) = ϕ(g1 )ϕ(g2 ), infatti ϕ(g1 g2 ) = tg1 g2


mentre ϕ(g1 )ϕ(g2 ) = tg1 tg2 ; ma,

tg1 g2 (x) = (g1 g2 )x, tg1 (tg2 (x)) = tg1 (g2 x) = g1 (g2 x).

- Iniettività: ker ϕ = {g ∈ G | tg = 1G }, in particolare tg (e) =


e da cui ge = e ovvero g = e, cioè ker ϕ = {e}. Cosı̀ ϕ è una
immersione.

In effetti, questo risultato molto importante dal punto di vista
teorico è invece poco utile da un punto di visto pratico perché S(G)
è notevolmente più grande di G. Ad esempio un gruppo di ordine
6 si può immergere in S6 che ha ordine 720. In effetti, vi sono dei
risultati parziali che migliorano il risultato di Cayley.
Un altro tipo di gruppi di grande interesse è quello costituito
dalle simmetrie di un poligono regolare. Il gruppo delle simmetrie
del poligono regolare di n lati si chiama il gruppo diedrale Dn .
Cominciamo da un caso particolare

Esempio 4.9.7 Il gruppo delle simmetrie del triangolo equi-


latero. Sia T un triangolo equilatero di vertici P = {P1 , P2 , P3 }.
Consideriamo un movimento rigido del piano di T in sé che mandi
T in T. Naturalmente tale applicazione dovrà mandare un vertice
di T in un vertice di T. Questo fa capire che di tale trasformazioni
ve ne sono al più 6, quante sono tutte le biiezioni di P.
 
P1 P2 P3
sia t1 la trasformazione identica: t1 =
P1 P2 P3
sia t2 la rotazione
 di 180o attorno
 all’altezza di T passante
P1 P 2 P3
per P1 : t2 =
P1 P 3 P2
sia t3 la rotazione
 di 180o attorno
 all’altezza di T passante
P1 P 2 P3
per P2 : t3 =
P3 P 2 P1
4.9. GRUPPI SIMMETRICI 159

sia t4 la rotazione
 di 180o attorno
 all’altezza di T passante
P1 P 2 P3
per P3 : t4 =
P2 P 1 P3
sia t5 la rotazione di 120o attorno al centro di T :
 
P1 P2 P3
t5 =
P2 P3 P1

sia t6 la rotazione di 240o attorno al centro di T :


 
P1 P2 P3
t6 =
P3 P1 P2

L’insieme di tutte le simmetrie del triangolo equilatero sono quindi


6 e rispetto alla composizione forma un gruppo (non abeliano) D3
detto il gruppo diedrale del triangolo equilatero. Come uno può
controllare facilmente tale gruppo è isomorfo ad S3 .
Più in generale, quanto fatto sul triangolo equilatero si può ripe-
tere su un qualunque poligono regolare con n lati, ottenendo cosı̀ il
gruppo diedrale Dn dell’n-agono regolare che possiede 2n elementi
e risulta isomorfo ad un sottogruppo di Sn (nota che per n = 3 si
ha 2 · 3 = 3! per cui D3 ∼= S3 ).
Gli elementi di Dn si possono descrivere facilmente. Sia Pn un
poligono regolare con n lati su un piano α ed indichiamo con a
la rotazione di 180o (o ribaltamento) attorno ad un suo asse di
simmetria e b una rotazione di 360o /n attorno al suo centro O.
Osserviamo che a2 = a ◦ a = 1α , e b2 è una rotazione di 2 · 360o /n,
ecc., bn = 1α . Allora tutte le simmetrie di Pn si ottengono dalle
suddette simmetrie, cioè
Pn = {1α , a, b, b2 , . . . , bn−1 , ab, ab2 , . . . , abn−1 }
quindi, come detto, O(Dn ) = 2n. Inoltre si può verificare facilmente
che ba = abn−1 e ciò determina tutti gli altri prodotti. Come altro
caso particolare, studiamo il gruppo delle simmetrie del quadrato
ovvero il gruppo diedrale D4 .
160 CAPITOLO 4. TEORIA DEI GRUPPI

Esempio 4.9.8 (Gruppo delle simmetrie del quadrato) Due


delle simmetrie di un quadrato di vertici P1 , P2 , P3 , P4 (a parte l’i-
dentità) sono il ribaltamento attorno ad un asse t del quadrato (di-
ciamo dell’asse di P1 P4 , che indicheremo con a, e la rotazione di
2π/4 = π/2 attorno al suo centro, che indicheremo con b. Risulta
poi chiaro che a2 = b4 = 1. Le altre simmetrie del quadrato sono
allora:
- b2 una rotazione di π attorno al centro;
- b3 una rotazione di 3π/2 attorno al centro;
- ab un ribaltamento attorno a P2 P4 ;
- ab2 un ribaltamento attorno all’asse ortogonale a t;
- ab3 un ribaltamento attorno a P1 P3 .
In definitiva, D4 = {1, a, b, b2 , b3 , ab, ab2 , ab3 } e O(D4 ) = 8.

4.10 Azione di gruppo su un insieme.


Equazione delle classi.
Il Teorema di Lagrange fu ottenuto realizzando una certa parti-
zione del gruppo attraverso una relazione di equivalenza definita
a partire da un suo sottogruppo. Adesso vogliamo usare la stessa
idea, cioè quella di realizzare una partizione di un gruppo attraver-
so un’altra relazione di equivalenza. Ciò ci permetterà di trovare
svariate importanti applicazioni sull’esistenza di certi sottogruppi
di un gruppo.

Definizione 4.10.1 Sia X un insieme e G un gruppo definiamo


azione di G in X una applicazione ∗ : G × X → X, in cui
l’immagine di (g, x) sarà indicata con g ∗ x ∈ X, tale che
1. e ∗ x = x per ogni x ∈ X ed e elemento neutro di G;

2. (g1 g2 ) ∗ x = g1 ∗ (g2 ∗ x) per ogni x ∈ X e g1 , g2 ∈ G.

Allorquando si ha l’azione di un gruppo G su un insieme X si dice


che X è un G-insieme.
4.10. AZIONE DI GRUPPO SU UN INSIEME. EQUAZIONE DELLE CLASSI.161

Osserviamo che per ogni dato g ∈ G nasce su un G-insieme X


una applicazione biiettiva χg : X → X definita da χg (x) = g ∗ x.
In effetti le condizioni sull’azione dicono che l’applicazione χ : G →
S(X) definita da χ(g) = χg è un omomorfismo di gruppi.
Quando X è un G-insieme possiamo definire su X la seguente
relazione
x ≡ y ⇔ ∃ g ∈ G |y = g ∗ x.
Si verifica facilmente che tale relazione è di equivalenza e le sue classi
di equivalenza si chiamano orbite; cosı̀ l’orbita di un elemento x è
O(x) = {y ∈ X |∃ g ∈ G |y = g ∗ x.}
Allora tutte le orbite (distinte) costituiranno una partizione di X.

Esempio 4.10.2 L’esempio più importante, probabilmente, è l’a-


zione che un gruppo G produce su se stesso attraverso il “coniugio”.
In questo caso X = G e l’azione è la seguente: ∗ : G × G → G
definita da g ∗ x = gxg −1 (il coniugio). In tal caso l’orbita di un
elemento x ∈ G è costituita da tutti i coniugati di x cioè O(x) =
{gxg −1 |∀ g ∈ G.}

Esempio 4.10.3 Altro esempio è quello dato dall’azione di un sot-


togruppo H ≤ G data dalla stessa operazione di G. Cioè h∗g = hg.
In tal caso l’orbita di un elemento g ∈ G è il laterale Hg.

A questo punto se X è un G-insieme, come detto, esso viene


ripartito per mezzo delle sue orbite per cui diventa interessante,
soprattutto allorquando X e G sono finiti, calcolare la cardinalità
delle orbite, visto che la somma di queste cardinalità darà quella di
X. Per fare ciò occorrono alcune definizioni ed alcune proprietà.

Definizione 4.10.4 Se X è un G-insieme ed x ∈ X si chiama


stabilizzatore di x l’insieme
Stx = {g ∈ G |g ∗ x = x}.
162 CAPITOLO 4. TEORIA DEI GRUPPI

Proposizione 4.10.5 Se X è un G-insieme ed x ∈ X allora Stx


è un sottogruppo di G. Inoltre, se y ∈ O(x) allora ogni elemento di
Sty è coniugato di un elemento di Stx .
Dimostrazione. Siano a, b ∈ Stx , cioè a ∗ x = b ∗ x = x, allora
intanto b−1 ∗ (b ∗ x) = b−1 ∗ x per cui b−1 ∗ x = x; quindi ab−1 ∗ x =
a ∗ (b−1 ∗ x) = a ∗ x = x e pertanto ab−1 ∈ Stx cosı̀ Stx risulta un
sottogruppo. La seconda parte della proposizione segue dal fatto
che y ∈ O(x) se e solo se esiste g ∈ G tale che y = g ∗ x allora
z ∈ Sty ⇔ z ∗ (g ∗ x) = g ∗ x ⇔ g −1 ∗ z ∗ g ∈ Stx ⇔ z ∈ gStx g −1 .

Ricordiamo che il centro di un gruppo G è quel sottogruppo
(normale) contenente tutti gli elementi che commutano con tutti gli
elementi del gruppo. Più in particolare, si chiama centralizzante
di un elemento x ∈ G, e si indica con C(x), il sottogruppo di G
(verificare!) contenente gli elementi di G che commutano con x,
cioè C(x) = {g ∈ G | gx = xg}.

Proposizione 4.10.6 Si consideri su un gruppo G l’azione di G


data dal coniugio (vedi Esempio 4.10.2), allora Stx = C(x).
Dimostrazione. Infatti, y ∈ Stx se e solo se y ∗ x = x cioè
yxy −1 = x per cui yx = xy il che significa y ∈ C(x).

Il risultato cruciale su questo argomento è dato dalla

Proposizione 4.10.7 Se X è un G-insieme ed x ∈ X allora |O(x)| =


|G|/|Stx | = iG (Stx ).
Dimostrazione. Se indichiamo, per semplicità, L l’insieme dei
laterali destri di Stx in G, si tratta di provare che esiste una ap-
plicazione biiettiva tra O(x) ed L. Per questo scopo consideriamo
f : O(x) → L definita da f (g ∗ x) = Stx g −1 . Facciamo vedere che
f è una applicazione (cioè è ben definita) biiettiva.
4.10. AZIONE DI GRUPPO SU UN INSIEME. EQUAZIONE DELLE CLASSI.163

• Ben definita: se g1 ∗ x = g2 ∗ x allora g1−1 g2 ∈ Stx ovvero


g1−1 ∈ Stx g2−1 per cui Stx g1−1 = Stx g2−1 .

• Iniettività: se f (g1 ∗ x) = f (g2 ∗ x) allora Stx g1−1 = Stx g2−1


quindi g2−1 g1 ∈ Stx per cui g1 ∗ x = g2 ∗ x.

• Suriettività: preso un laterale destro di Stx , diciamo Stx g, si


ha f (g −1 ∗ x) = Stx g, il che dà la voluta suriettività.

Corollario 4.10.8 Nel caso della relazione di coniugio su G si ha


|O(x)| = |G|/|C(x)| = iG (C(x)).

Dimostrazione. Basta ricordare che in tal caso Stx = C(x).

Corollario 4.10.9 Se P X è un G-insieme finito con G anch’esso


finito, allora |X| = |G|/|Stx | dove la sommatoria è estesa agli
x ∈ X uno per ogni orbita.

Dimostrazione. BastaP osservare che le orbite formano una parti-


zione di X quindi |X| = |O(x)| per cui dalla Proposizione 4.10.7
segue l’asserto.

Quando il precedente risultato si applica all’azione di coniugio ot-


teniamo il seguente risultato

Corollario 4.10.10 (1a equazione


P delle classi) Se G è un grup-
po finito allora O(G) = O(G)/O(C(x)) dove la sommatoria è
estesa agli x ∈ G uno per ogni classe di coniugio.
164 CAPITOLO 4. TEORIA DEI GRUPPI

Dimostrazione. Basta applicare il Corollario 4.10.9 al caso del


coniugio.

Una semplice considerazione permette di riformulare la prece-
dente eguaglianza in modo che si rivelerà molto utile.

Corollario 4.10.11 (2a equazione delle classi) Se G è un grup-


po finito allora
X
O(G) = O(Z(G)) + O(G)/O(C(x))
x∈Z(G)
/

dove la sommatoria è estesa agli x ∈ G \ Z(G) uno per ogni classe


di coniugio.
Dimostrazione. Cominciamo con lo scrivere la 1a equazione delle
classi sotto questa forma:
X X
O(G) = O(G)/O(C(x)) + O(G)/O(C(x));
x∈Z(G) x∈Z(G)
/

adesso osserviamo che se x ∈ Z(G) allora


P C(x) = G (e viceversa
se C(x) = G allora x ∈ Z(G)) per cui x∈Z(G) O(G)/O(C(x)) =
O(Z(G)) da cui segue la tesi.

Nelle prossime sezioni ci occuperemo di alcune applicazioni del-
l’equazione delle classi.

4.11 Teorema di Cauchy


Osserviamo che i risultati che finora abbiamo visto ci dicono sol-
tanto che tipo di sottogruppi non possono esistere in un gruppo di
ordine n. I prossimi risultati invece ci permetteranno di affermare
che in G certi sottogruppi devono necessariamente esistere.
4.11. TEOREMA DI CAUCHY 165

Teorema 4.11.1 (Teorema di Cauchy) Se G è un gruppo di


ordine n, cioè O(G) = n, e p un numero primo che divide tale
ordine, allora esiste in G un elemento di ordine p. In particolare,
in G esiste un sottogruppo di ordine p.
Dimostrazione. Dobbiamo trovare un elemento g 6= e in G tale
che g p = e. Sia X il sottoinsieme di Gp = G
| × .{z
. . × G} definito da
p

X = {(g1 , g2 , . . . , gp ) ∈ Gp | g1 g2 . . . gp = e}.
Intanto osserviamo che |X| = np−1 in quanto, mentre g1 , . . . , gp−1
possono essere scelti su tutto G, gp è determinato dai primi p − 1
elementi essendo gp = (g1 g2 . . . gp−1 )−1 ; cosı̀ |X| è divisibile per p.
Consideriamo adesso il gruppo Zp e la seguente azione di Zp su X
t ∗ (g1 , g2 , . . . , gp ) = (gt+1 , gt+2 , . . . , gt+p ) per ogni t ∈ Zp
(si tratta di una traslazione degli indici di t termini, modulo p). Si
verifica facilmente che valgono le due condizioni per affermare che
questa è una azione di gruppo, per cui dalla Proposizione 4.10.7
segue |O(x)| = |Zp |/|Stx |, in particolare la cardinalità di ogni orbita
deve essere un divisore di p, cioè ogni orbita deve essere costituita o
da 1 o da p elementi. Ma un elemento x = (g1 , g2 , . . . , gp ) per avere
un solo elemento nella sua orbita deve essere g1 = g2 = . . . = gp .
Ora, l’elemento  = (e,P e, . . . , e) ∈ X ha un solo elemento nella
sua orbita, ma poiché |O(x)| = |X|, questo non potrà essere
l’unico elemento con orbita di cardinalità 1: infatti, se tutti
P gli altri
elementi avessero orbite di cardinalità p risulterebbe |O(x)| =
1 + λp contro il fatto che |X| è divisibile per p. In conclusione, in X
deve esserci qualche altro elemento con orbita di cardinalità 1, cioè
deve esserci un g 6= e in G tale che (g, g, . . . , g) ∈ X, cioè g p = e.
Ovviamente, il sottogruppo ciclico generato da un tale g, cioè G(g),
avrà ordine p.

Ad esempio in un gruppo di ordine 30, oltre ai sottogruppi
banali, devono esserci sottogruppi di ordine 2, 3, e 5.
166 CAPITOLO 4. TEORIA DEI GRUPPI

4.12 p-gruppi
Un particolare ruolo giocano nella teoria dei gruppi quei gruppi che
hanno ordine una potenza di un numero primo. Per questo diamo
questa semplice definizione.

Definizione 4.12.1 Un gruppo G il cui ordine è pn , con p primo,


si dice un p-gruppo.

Tali gruppi godono di alcune notevoli proprietà.

Proposizione 4.12.2 (1a proprietà dei p-gruppi) Se G è un


p-gruppo allora il suo centro non coincide con {e}.

Dimostrazione. Sia O(G) = pn ed osserviamo che i suoi sotto-


gruppi propri devono aver per ordine pm con m < n (i soli divisori
di pn ). Consideriamo allora l’equazione delle classi
X
O(G) = O(Z(G)) + O(G)/O(C(a))
a∈Z(G)
/

poiché
P O(G)/O(C(a)) = pn−m con n−m > 0, si deduce che p divide
a∈Z(G)
/ O(G)/O(C(a)), e poiché ovviamente divide O(G) si ha che
p divide O(Z(G)) e quindi Z(G) non può coincidere con {e}.


Proposizione 4.12.3 (2a proprietà dei p-gruppi) Se G è un


gruppo di ordine p2 allora è abeliano.

Dimostrazione. Z(G) essendo sottogruppo di un gruppo di or-


dine p2 può avere ordine 1, p o p2 . Ma per la 1a proprietà appe-
na provata O(Z(G)) 6= 1. Verifichiamo che tale ordine non può
essere neanche p. Infatti, se per assurdo O(Z(G)) = p sarebbe
G \ Z(G) 6= ∅ quindi possiamo trovare un elemento a ∈ G \ Z(G),
4.12. P -GRUPPI 167

quindi a 6= e. Proviamo che ciò porta ad un assurdo. Chiediamoci


- che ordine ha C(a)? Noi sappiamo

Z(G) ( C(a) ( G

quindi O(C(a)) dovrebbe essere un divisore di p2 diverso da p2 e


un multiplo di p diverso da p e ciò è palesemente impossibile!
Cosı̀ O(Z(G)) = p2 cioè Z(G) = G ovvero G è abeliano.

Proposizione 4.12.4 (3a proprietà dei p-gruppi) Se G è un


p-gruppo allora in esso si può invertire il teorema di Lagrange, cioè
se m divide l’ordine di G esiste in G un sottogruppo di ordine m.

Dimostrazione. Sia allora O(G) = pn ed m un divisore di pn ,


cioè m = ph con 0 ≤ h ≤ n. Lavoriamo per induzione su n. I casi
base n = 0, 1, 2 sono pressocché banali. Facciamo allora l’ipotesi
0
induttiva, cioè che il teorema sia vero per gruppi di ordine pn con
n0 < n. Poiché il centro di G non è banale il suo ordine è pt con
t > 0 quindi possiamo trovare in Z(G) un elemento di ordine p (per
il Teorema di Cauchy); sia esso a e diciamo A = G(a) il sottogruppo
che esso genera. Poiché A ⊆ Z(G) esso sarà un sottogruppo norma-
le per cui è possibile considerare il gruppo quoziente G/A che avrà
ordine O(G)/O(A) = pn /p = pn−1 . Per l’ipotesi induttiva il teore-
ma sarà vero in G/A, cosı̀ se consideriamo pk , con 0 ≤ k ≤ n − 1,
possiamo affermare che in G/A esiste un sottogruppo H di ordine
pk . Si consideri adesso l’omomorfismo naturale π : G → G/A e
prendiamo la controimmagine di H, diciamo H = π −1 (H). Per la
relazione dei sottogruppi con gli omomorfismi possiamo dire che H
è un sottogruppo di G contenente il nucleo ker π = A. Se restringia-
mo π ad H avremo un omomorfismo suriettivo πH : H → H, che
per il Teorema dell’isomorfismo ci permette di dedurre che H/A è
isomorfo ad H, quindi O(H/A) = O(H) da cui O(H)/O(A) = pk e
168 CAPITOLO 4. TEORIA DEI GRUPPI

quindi O(H) = pk+1 con 0 ≤ k ≤ n − 1, cioè 1 ≤ k + 1 ≤ n cosı̀


abbiamo potuto trovare in G un sottogruppo di ordine ps per ogni
s = 0, 1, . . . , n, cioè un qualunque divisore di pn .


4.13 I Teoremi di Sylow


Consideriamo un gruppo G di ordine 48, per il Teorema di Cauchy
possiamo semplicemente dire che in G (oltre ad i sottogruppi banali
{e} e G) vi sono sottogruppi di ordine 2 e 3. Ma i divisori di 48 sono
1, 2, 3, 4, 6, 8, 12, 16, 24, 48 quindi potrebbero esserci sottogruppi di
tali ordini (per il Teorema di Lagrange). Il prossimo teorema ci dà
una risposta parziale in questa direzione.

Teorema 4.13.1 (1o Teorema di Sylow) Sia G un gruppo di


ordine n = pm q con p primo e q non divisibile per p (cioè pm
è la massima potenza di p che divide n). Allora in G esiste un
sottogruppo di ordine pm , detto p-sottogruppo di Sylow.

Dimostrazione. Ancora una volta lavoriamo per induzione su n.


Al solito i casi con n piccolo sono banali; in questo caso, a parte il
caso ovvio n = 1, per n = 2, 3, 5, 7, 11 il risultato segue perché si
tratta di numeri primi, per n = 4, 8, 9, segue perché non v’è nulla da
provare, per n = 6, 10 segue dal Teorema di Cauchy, quindi il primo
caso non ancora noto si ha per n = 12. In ogni caso possiamo fare
l’ipotesi induttiva e cioè che il teorema sia vero per tutti i gruppi di
ordine n0 < n. Se in G esiste un sottogruppo proprio H il cui ordine
sia divisibile per pm applicando l’ipotesi induttiva troveremo in H
un suo sottogruppo di ordine pm ma tale sottogruppo è anche un
sottogruppo di G per cui avremo provato la tesi. Allora supponiamo
per assurdo che un siffatto sottogruppo non esista. Utilizziamo
ancora una volta l’equazione delle classi
X
O(G) = O(Z(G)) + O(G)/O(C(a))
a∈Z(G)
/
4.13. I TEOREMI DI SYLOW 169

dal fatto che pm divide O(G) mentre non divide O(C(a)) visto
che è un sottogruppo proprio (con a ∈ / Z(G)), ne segue che p
deveP dividere O(G)/O(C(a)) per ogni a ∈
/ Z(G) e quindi p divi-
de a∈Z(G)
/ P O(G)/O(C(a)) e conseguentemente anche O(Z(G)) =
O(G) − a∈Z(G)/ O(G)/O(C(a)). Allora per il Teorema di Cauchy
si può trovare un elemento a ∈ Z(G) di ordine p. Detto A = G(a) il
sottogruppo generato da a, esso avrà ordine p e sarà normale (dato
che è contenuto in Z(G)). Lavorando come in una precedente di-
mostrazione, consideriamo il gruppo quoziente G/A che avrà ordine
pm q/p = pm−1 q < n. Per l’ipotesi induttiva allora in G/A vi sarà un
sottogruppo H di ordine pm−1 (la massima potenza di p che divide
O(G/A)). Consideriamo quindi π : G → G/A e H = π −1 (H) e co-
me prima l’omomorfismo suriettivo πH : H → H da cui segue per
il teorema dell’isomorfismo H/A ∼ = H. Per cui O(H/A) = O(H),
cioè O(H) = ppm−1 = pm contro l’assunto che in G non ci fossero
sottogruppi propri di ordine divisibile per pm .

Se rivisitiamo alla luce del precedente teorema l’esempio del


gruppo G di ordine 48 = 24 3, vedremo che, oltre a quanto è stato
detto, in G deve esistere un sottogruppo H di ordine 16. Inoltre,
essendo O(H) = 16 = 24 si tratta di un p-gruppo e quindi in
esso (e quindi in G) vi sono anche sottogruppi di ordine 8, 4 e 2
(quest’ultimo si sapeva dal Teorema di Cauchy).

Osservazione 4.13.2 Il precedente risultato ci dice che in un grup-


po G di ordine n = pm q, con q non divisibile per p, vi sono gruppi di
ordine pm (i p-sottogruppi di Sylow). Ebbene si può dimostrare che
due p-sottogruppi di Sylow H e K sono sempre tra loro coniugati,
cioè esiste un x ∈ G per cui K = xHx−1 .

Osservazione 4.13.3 Il precedente Teorema di Sylow permette di


dedurre che in ogni gruppo abeliano finito si “inverte” il Teorema di
Lagrange, cioè se O(G) = n ed m è un divisore di n allora esiste in
G un sottogruppo di ordine m. Infatti, decomponendo n in fattori
170 CAPITOLO 4. TEORIA DEI GRUPPI

primi sarà n = pn1 1 · . . . · pnt t , per cui avremo m = pm mt


1 · . . . · pt ,
1

con mi ≤ ni per ogni i = 1, . . . , t. Allora il Teorema di Sylow ci


garantisce che in G vi sono sottogruppi Hi di ordine pni i e, per la
Proposizione 4.12.4 sui p-gruppi, esisteranno in G sottogruppi Ki
di ordine pmi , per ogni i = 1, . . . , t = m. Dato che G è abeliano
i

tali sottogruppi Ki sono normali e quindi K = K1 K2 . . . Kt è un


sottogruppo di G di ordine O(K) = pm mt
1 · . . . · pt = m.
1

Un esempio curioso.

Esempio 4.13.4 Consideriamo un gruppo G con O(G) = 1.776.889.


Ebbene noi dimostreremo che esso è abeliano!!
Ci arriveremo per gradi. Intanto osserviamo che 1.776.889 =
31 432 , per cui per il Teorema di Sylow esistono in G due sottogrup-
2

pi, H e K di ordine, rispettivamente, O(H) = 312 e O(K) = 432 .


Ora osserviamo che H ∩ K = {e} perché ha ordine divisore sia di
O(H) = 312 e sia di O(K) = 432 , quindi deve avere ordine 1. Da
questo segue che O(HK) = O(H)O(K) = 312 432 , per cui HK = G.
Per affermare che G è abeliano abbiamo bisogno di ulteriori
informazioni.

Il 1o Teorema di Sylow afferma che se p divide l’ordine di un


gruppo G vi è almeno un p-sottogruppo di Sylow. Ma quanti p-
sottogruppi di Sylow esistono in G? Indichiamo con rp il numero di
p-sottogruppi di Sylow presenti in G. Il prossimo teorema (che non
proveremo) dà informazioni su tale numero.

Teorema 4.13.5 (2o Teorema di Sylow) Sia G un gruppo di


ordine n e p un numero primo che divide n. Allora il numero rp di
p-sottogruppi di Sylow gode di queste due proprietà:

i) rp divide n;

ii) rp = 1 + λp, cioè rp ≡ 1 modulo p.


4.13. I TEOREMI DI SYLOW 171

Torniamo all’Esempio 4.13.4. Quanti sono i 31-sottogruppi di


Sylow? r31 deve dividere 312 432 ma non può essere divisibile per
31 (visto che per ii) del precedente teorema il resto della divisione
per 31 è 1); quindi r31 = 1 o 43 o 432 . Ma né 43 né 432 danno resto
1 nella divisione per 31. Pertanto, r31 = 1. Allora essendo unico il
sottogruppo H di ordine 312 , H è un sottogruppo normale (vedi
Proposizione 4.6.2).
Analogamente, quanti sono i 43-sottogruppi di Sylow? r43 deve
dividere 312 432 ma non può essere divisibile per 43; quindi r43 =
1 o 31 o 312 . Ma né 31 né 312 danno resto 1 nella divisione per
43. Pertanto, r43 = 1. Allora, come prima, K è un sottogruppo
normale.
Riassumiamo cosa si sa sul gruppo G di ordine n = 1.776.889 :
vi sono due sottogruppi normali H e K tali che G = HK e H ∩K =
{e}. In una tale situazione vi è questo risultato che è propedeutico
a ciò che vogliamo ottenere.

Lemma 4.13.6 Se H e K sono due sottogruppi normali di un


gruppo G tali che H ∩K = {e}, allora gli elementi di H commutano
con quelli di K, cioè se h ∈ H e k ∈ K allora hk = kh.

Dimostrazione. Notiamo che provare che hk = kh è equiva-


lente a provare che k −1 hkh−1 = e (moltiplicando per k −1 e h−1 ,
rispettivamente, a sinistra e a destra). Ora (k −1 hk)h−1 ∈ H perché
k −1 hk ∈ H per la normalità di H e h−1 ∈ H perché H è un sot-
togruppo; d’altra parte, k −1 (hkh−1 ) ∈ K perché hkh−1 ∈ K per la
normalità di K e k −1 ∈ K perché K è un sottogruppo. Per cui,
k −1 hkh−1 ∈ H ∩ K e per l’ipotesi segue k −1 hkh−1 = e.

Siamo adesso in grado di provare quanto affermato nell’Esem-
pio 4.13.4: un gruppo di ordine 1.776.889 è abeliano. Infatti, i due
suoi p-sottogruppi H e K sono abeliani perché di ordine p2 (2a pro-
prietà dei p-gruppi) e gli elementi di H e K commutano tra loro
per il lemma precedente. Poiché G = HK ogni elemento di G è del
172 CAPITOLO 4. TEORIA DEI GRUPPI

tipo hk con h ∈ H e k ∈ K. Allora, presi due elementi di G, h1 k1


e h2 k2 , si avrà:

(h1 k1 )(h2 k2 ) = h1 h2 k1 k2 = h2 h1 k2 k1 = (h2 k2 )(h1 k1 ),

quindi il gruppo G è commutativo.

4.14 Somma diretta di gruppi


La situazione che si è presentata nell’esempio appena discusso ci
porta a dare questa definizione.

Definizione 4.14.1 Sia G un gruppo e N1 , N2 / G due sottogruppi


normali tali che

G = N1 N2 ;

N1 ∩ N2 = {e},

allora diremo che G è somma diretta (interna) di N1 e N2 e


scriveremo G = N1 ⊕ N2 .

Da quanto provato nell’ultima parte dell’esempio precedente


segue il seguente

Corollario 4.14.2 Se G = N1 ⊕N2 ed N1 , N2 sono abeliani, allora


G è abeliano.

Corollario 4.14.3 Se G = N1 ⊕ N2 allora ogni elemento x ∈ G si


può esprimere in modo unico nella forma x = n1 n2 dove n1 ∈ N1
ed n2 ∈ N2 .
4.14. SOMMA DIRETTA DI GRUPPI 173

Dimostrazione. Che ogni x ∈ G si possa scrive nella forma


x = n1 n2 dove n1 ∈ N1 ed n2 ∈ N2 segue dal fatto che G =
N1 N2 . Per vedere che tale espressione è unica supponiamo che x =
n1 n2 = m1 m2 con m1 , n1 ∈ N1 e m2 , n2 ∈ N2 , allora moltiplicando
tale eguaglianza per n−1 1 a sinistra e per m−1 2 a destra si otterrà
n2 m−1
2 = n −1
1 m1 . Ma n m−1
2 2 ∈ N 2 e n −1
1 m 1 ∈ N −1
1 quindi n2 m2 =
n−1 −1
1 m1 ∈ N1 ∩ N2 = {e}. Allora da n1 m1 = e segue n1 = m1 e da
−1
n2 m2 = e segue n2 = m2 , il che vuol dire che la espressione di x
era unica.

Il concetto di somma diretta si può impostare in maniera diffe-


rente.

Definizione 4.14.4 Siano (G1 , · ) e (G2 , ∗) due gruppi; si defini-


sce somma diretta (esterna) o prodotto diretto di G1 e G2 il
gruppo, denotato G1 ⊗ G2 , che insiemisticamente è dato dal pro-
dotto cartesiano G1 × G2 e l’operazione è quella componente per
componente, cioè (x1 , x2 )(y1 , y2 ) = (x1 · y1 , x2 ∗ y2 ).

Naturalmente si deve verificare che G, cosı̀ come è stato definito,


costituisce un gruppo. In effetti, l’operazione è chiaramente interna,
l’associatività è banale, l’elemento neutro è (e1 , e2 ) e l’inverso di un
qualsiasi elemento (a, b) ∈ G è (a−1 , b−1 ).
Questa definizione permette di produrre esempi di gruppi par-
tendo da due gruppi dati. Per esempio, partendo da Z3 e da S3 si
può costruire un gruppo di ordine 18, Z3 ⊗ S3 .
Ma un gruppo che è somma diretta (esterna) di due certi gruppi
“si ricorda” dei gruppi che lo hanno generato? In effetti è cosı̀;
infatti se G1 ⊗G2 è la somma diretta (esterna) di G1 e G2 , possiamo
considerare i suoi sottoinsiemi A1 = {(x1 , e2 ) | ∀ x1 ∈ G1 } e A2 =
{(e1 , x2 ) | ∀ x2 ∈ G2 }. È facile verificare che

• A1 e A2 sono due sottogruppi di G1 ⊗ G2 (verifica banale);


174 CAPITOLO 4. TEORIA DEI GRUPPI

• A1 e A2 sono due sottogruppi normali di G1 ⊗G2 : se (a1 , e2 ) ∈


A1 e (x1 , x2 ) ∈ G1 ⊗ G2 allora

(x1 , x2 )(a1 , e2 )(x1 , x2 )−1 = (x1 a1 x−1 −1


1 , x2 x2 ) = (b1 , e2 ) ∈ A1

ed analogamente per A2 ;

• A1 ∼= G1 e A2 ∼ = G2 : basta verificare che f1 : G1 → A1


definito da f1 (x1 ) = (x1 , e2 ) è un isomorfismo; analogamente
per A2 ;

• G1 ⊗ G2 = A1 A2 : infatti, ogni elemento (x1 , x2 ) ∈ G1 ⊗ G2 si


può scrivere (x1 , x2 ) = (x1 , e2 )(e1 , x2 );

• A1 ∩ A2 = {(e1 , e2 )}: infatti, se (x1 , x2 ) ∈ A1 ∩ A2 allora


(x1 , x2 ) ∈ A1 e quindi x2 = e2 e (x1 , x2 ) ∈ A2 e quindi x1 = e1 .

Alla luce di quanto detto segue quindi che G1 ⊗ G2 è la somma


diretta (interna) dei suoi sottogruppi normali A1 e A2 , cioè G1 ⊗
G2 = A1 ⊕ A2 .
Ricordando che A1 è isomorfo a G1 e A2 è isomorfo a G2 pos-
siamo affermare che G1 ⊗ G2 ∼ = G1 ⊕ G2 ed i concetti di somma
diretta interna ed esterna possono essere considerati coincidenti.
La somma diretta si può estendere dal caso di due gruppi al
caso di un numero finito qualunque di gruppi. Precisamente, sia
G un gruppo e N1 , N2 , . . . , Nt sottogruppi normali di G allora G è
somma diretta di N1 , N2 , . . . , Nt se

G = N1 N2 . . . Nt ;

Ni ∩ (N1 . . . N
bi . . . Nt ) = {e}, per ogni i.

dove N1 . . . N
bi . . . Nt significa che dal prodotto si sopprime Ni .
4.15. IL TEOREMA DI STRUTTURA DEI GRUPPI ABELIANI FINITI175

4.15 Il Teorema di struttura dei gruppi


abeliani finiti
Concludiamo questo capitolo illustrando un importante risultato
che ci permette di caratterizzare (e costruire) tutti i gruppi abeliani
finiti.
Sia allora G un gruppo abeliano di ordine O(G) = n. Fattoriz-
ziamo n in fattori primi: n = pm mt
1 . . . pt .
1

Per il Teorema di Sylow noi sappiamo che in G vi sono pi -


sottogruppi di Sylow: Hi di ordine pm i
i
per i = 1, . . . , t.
Tali sottogruppi sono certamente normali, dato che G è abe-
m
liano. Inoltre, pmi
i
e pj j , con i 6= j, sono coprimi, per cui G =
H1 ⊕. . .⊕Ht cioè G è uguale alla somma diretta dei suoi sottogruppi
di Sylow. Questo porta al seguente risultato

Proposizione 4.15.1 Ogni gruppo abeliano finito G è somma di-


retta di p-gruppi.

Per completare le informazioni che ci occorrono per dare il teo-


rema di struttura manca il seguente risultato.

Proposizione 4.15.2 Ogni p-gruppo abeliano è somma diretta di


gruppi ciclici.

Dimostrazione. Sia quindi G un gruppo abeliano di ordine pn ;


consideriamo un elemento y1 ∈ G che abbia ordine massimo ph tra
gli elementi di G. Se h = n allora G è ciclico cosı̀ possiamo supporre
h < n. Tra i sottogruppi H tali che H ∩G(y1 ) = {e} consideriamone
uno massimale M1 . Si può verificare che M1 G(y1 ) = G e quindi
G = G(y1 ) ⊕ M1 . Adesso ripetiamo il discorso su M1 considerando
un elemento y2 ∈ M1 che abbia ordine massimo tra gli elementi di
G. Tra i sottogruppi H tali che H ∩ G(y2 ) = {e} consideriamone
uno massimale M2 . Si può verificare che M2 G(y2 ) = M1 e quindi
G = G(y1 ) ⊕ G(y2 ) ⊕ M2 . Cosı̀ per induzione decrescente si può
concludere che G = G(y1 ) ⊕ G(y2 ) ⊕ . . . ⊕ G(yt ).
176 CAPITOLO 4. TEORIA DEI GRUPPI

Ricordiamo che tutti i gruppi ciclici di uno stesso ordine n sono


tra loro isomorfi e poiché Zn è un gruppo ciclico di ordine n pos-
siamo affermare che tutti i gruppi ciclici di ordine n sono isomorfi
a Zn .
Inoltre, per dare un completa descrizione dei gruppi abeliani
finiti, diamo la seguente definizione.

Definizione 4.15.3 Se m è un numero naturale non nullo si dice


partizione di m una sequenza di numeri naturali non nulli q1 ≥
q2 ≥ . . . ≥ qt tale che m = q1 + q2 + . . . + qt .

Il numero delle partizioni di m si indica con p(m).


- Esempio. Per m = 7, 7 = 4 + 2 + 1, 7 = 3 + 1 + 1 + 1 + 1 sono
delle partizioni di 7.
- Esempio: p(5) = 7, infatti, 5 = 5, 5 = 4 + 1, 5 = 3 + 2,
5 = 3 + 1 + 1, 5 = 2 + 2 + 1, 5 = 2 + 1 + 1 + 1, 5 = 1 + 1 + 1 + 1 + 1,
sono tutte le possibili partizioni di 5.
Riassumendo quanto finora detto abbiamo

Teorema 4.15.4 (Teorema di struttura dei gruppi abeliani


finiti) Ogni gruppo abeliano finito G è somma diretta di gruppi
ciclici (di ordine potenze di un primo). Inoltre se O(G) = n ed
n = pm mt
1 . . . pt
1
è la sua fattorizzazione allora

G∼
M M
= (Zpa1 11 ⊕ . . . ⊕ Zpa1 1r ) ... (Zpat t1 ⊕ . . . ⊕ Zpat ts )

dove ai1 ≥ . . . ≥ air è una partizione di mi . Una tale fattorizzazione


è unica.

Dimostrazione. Basta ricordare le Proposizioni 4.15.1 e 4.15.2.


4.15. IL TEOREMA DI STRUTTURA DEI GRUPPI ABELIANI FINITI177

Adesso siamo in grado di dire quanti gruppi abeliani di ordine n


vi sono a meno di isomorfismi: basterà fattorizzare n = pm mt
1 . . . pt
1

ed allora il numero di gruppi abeliani di ordine n tra loro non


isomorfi saranno Ab(n) = p(m1 )p(m2 ) . . . p(mt ).
Per completare il discorso descriviamo tutti i gruppi abeliani di
ordine 72.

Esempio 4.15.5 I gruppi abeliani di ordine 72 sono 6. Infatti,


72 = 23 32 e quindi il numero di gruppi abeliani di ordine 72 sarà
p(3)p(2) = 3 · 2 = 6 (è facile contare quante sono le partizioni di 3
e quelle di 2). Vediamo di descrivere questi 6 gruppi.

Z8 × Z9 , Z8 × Z3 × Z3 , Z4 × Z2 × Z9 ,

Z4 × Z2 × Z3 × Z3 , Z2 × Z2 × Z2 × Z9 , Z2 × Z2 × Z2 × Z3 × Z3

Nota che la costruzione è semplice: basta mettere come esponenti


di 2 e di 3 (le basi nella fattorizzazione di 72) le partizioni degli
esponenti (che si trovano nella fattorizzazione di 72 e che nel nostro
caso sono ancora 3 e 2). Osserviamo che naturalmente potremo
pensare ad altri gruppi di ordine 72 costruiti come sopra ma qua-
lunque gruppo costruiremo sarà isomorfo ad uno dei precedenti. Ad
esempio, Z72 è isomorfo a Z8 ×Z9 , Z2 ×Z36 è isomorfo a Z4 ×Z2 ×Z9 ,
ecc.
Concludiamo questa parte dedicata alla Teoria dei gruppi il-
lustrando brevemente una importante classe di gruppi che trova
applicazioni nella Teoria di Galois e nelle risolubilità per radicali
delle equazioni algebriche.

Definizione 4.15.6 Un gruppo G si dice risolubile se esiste una


catena di sottogruppi

{e} = G0 / G1 / G2 . . . / Gn−1 / Gn = G

tali che
1) Gi è sottogruppo normale di Gi+1 per ogni i;
178 CAPITOLO 4. TEORIA DEI GRUPPI

2) Gi+1 /Gi è un gruppo abeliano per ogni i.

Esempio 4.15.7 1) Tutti i gruppi abeliani sono risolubili: basta


considerare la catena
{e} / G.
2) S3 è risolubile: posto infatti H3 il suo sottogruppo di ordine 3
(c’è per il teorema di Cauchy) si ha la catena

{e} / H3 / S3 .

3) D4 è risolubile: posto infatti H4 un suo sottogruppo di ordine


4 (controllare che il sottogruppo generato dalla rotazione di π2 ha
ordine 4), si ha la catena

{e} / H4 / D4 .

4) I p-gruppi finiti sono risolubili: se |G| = pn basta prendere la


catena

{e} / P1 / . . . / Pi / . . . / Pn = G
dove ogni Pi è un suo sottogruppo di ordine pi .
5) S4 è risolubile: posto infatti A4 il sottogruppo delle permutazioni
pari (che ha ordine 12) e V4 = {(1), (12)(34), (13)(24), (14)(23)}, si
ha la catena
{e} / V4 / A4 / S4
in cui l’unico fatto vero, ma non banale, è che V4 sia un sottogruppo
normale in A4 .

Cosa dire di S5 o più in generale di Sn per n ≥ 5? Si può


provare che tali gruppi non sono risolubili!! Questo risultato, tra
l’altro, permette di dire che non tutte le equazioni algebriche di
grado ≥ 5 sono risolubili per radicali.
Quelle che seguono sono alcune semplici proprietà dei gruppi
risolubili.
4.15. IL TEOREMA DI STRUTTURA DEI GRUPPI ABELIANI FINITI179

Proposizione 4.15.8 a) Se G è un gruppo risolubile ed H un


suo sottogruppo, allora anche H è risolubile.

b) Se G è un gruppo risolubile ed N / G è un suo sottogruppo


normale, allora anche G/N è risolubile.

c) Se G è un gruppo ed N / G è un suo sottogruppo normale tale


che sia N che G/N sono risolubili, allora anche G è risolubile.
180 CAPITOLO 4. TEORIA DEI GRUPPI
Capitolo 5

Teoria degli anelli

5.1 Definizioni e prime proprietà


Nel precedente capitolo ci siamo occupati della più semplice strut-
tura algebrica, quella di gruppo, che richiedeva la presenza di una
operazione sull’insieme. Ma come abbiamo visto, studiando sia
insiemi numerici che insiemi di polinomi, spesso si ha a che fare
con insiemi su cui sono definite due operazioni che godono di certe
proprietà. Pertanto per capirne meglio la struttura complessiva in
questo capitolo ci occuperemo di quelle strutture che prevedono de-
finite su un insieme due operazioni legate da opportune proprietà.
Anche in questo contesto ci svincoleremo dal tipo di elementi che
compongono il nostro insieme ma ci occuperemo di ciò che produce
nell’insieme la presenza delle operazioni.

Definizione 5.1.1 Sia A un insieme su cui sono definite due ope-


razioni (binarie, interne) che denoteremo + e · (non necessaria-
mente le usuali operazioni che abbiamo conosciuto, anche perché
non sappiamo quali elementi contiene A). Se
1) a+(b+c) = (a+b)+c per ogni a, b, c ∈ A (proprietà associativa
di +),
2) a + b = b + a per ogni a, b ∈ A (proprietà commutativa di +),

181
182 CAPITOLO 5. TEORIA DEGLI ANELLI

3) esiste un elemento 0 ∈ A tale che a + 0 = 0 + a = a per ogni


a ∈ A (elemento neutro),
4) per ogni a ∈ A esiste un elemento −a ∈ A tale che a+(−a) =
(−a) + a = 0,
5) a · (b · c) = (a · b) · c per ogni a, b, c ∈ A (proprietà associativa
di ·),
6) a · (b + c) = a · b + a · c
(a+b)·c = a·c+b·c per ogni a, b, c ∈ A (proprietà distributive
del · rispetto a +),
allora diremo che (A, +, · ) costituisce un anello.

Nota che le prime 4 proprietà asseriscono che (A, +) è un gruppo


abeliano.
Sono esempi di anelli (Z, +, · ), (Q, +, · ), (R, +, · ), (C, +, · ),
(Zn , +, · ), (K[x], +, · ), dove K è uno dei precedenti, (Mn (R), +, · )
In un qualunque anello, cioè solo dalle sei suddette proprietà,
seguono alcuni fatti che furono provati negli insiemi numerici o nei
polinomi, mostrando cosı̀ che essi dipendono solo dalle proprietà e
non dagli elementi che costituiscono l’insieme.
• In ogni anello A, per ogni a ∈ A si ha a · 0 = 0 · a = 0. Infatti,
posto a · 0 = z si ha

z = a · 0 = a · (0 + 0) = a · 0 + a · 0 = z + z

da cui z + (−z) = z + z + (−z) cioè z = 0.


Vale la legge dell’annullamento del prodotto? Cioè se a · b = 0
possiamo dedurre che a = 0 oppure b = 0? Sappiamo che in generale
la risposta è negativa, ad esempio in Z30 si ha [15] · [4] = [0].

Esempio 5.1.2 Consideriamo in M2 (R) il seguente prodotto


    
1 0 0 0 0 0
=
0 0 0 4 0 0
5.1. DEFINIZIONI E PRIME PROPRIETÀ 183

allora anche in M2 (R) non vale la legge dell’annullamento del pro-


dotto.

Definizione 5.1.3 In un anello A un elemento a 6= 0 si dice di-


visore dello zero se esistono a0 6= 0 ed a00 6= 0 in A tali che
aa0 = a00 a = 0.

Anelli con ulteriori proprietà.

7) un anello (A, +, · ) in cui a·b = b·a per ogni a, b ∈ A (proprietà


commutativa di ·), si dice anello commutativo;

8) un anello commutativo A in cui vale la legge dell’annullamen-


to del prodotto ovvero non vi sono divisori dello zero, si dice
dominio d’integrità;

9) un anello in cui esiste l’elemento neutro del ·, che si indica 1,


si dice unitario;

10) un anello unitario in cui ogni elemento non nullo a ammet-


te l’inverso (rispetto al prodotto), cioè è invertibile, si dice
corpo. Un corpo commutativo si dice campo.

Notiamo che se vale la proprietà 10) automaticamente è soddisfatta


la 8) cioè vale la legge dell’annullamento del prodotto. Infatti, se
ab = 0 ed a 6= 0 detto a−1 l’inverso di a (che esiste per la 10))
avremo a−1 (ab) = 0 da cui b = 0.
Nel seguito se A è un anello unitario indicheremo U (A) l’insieme
degli elementi invertibili. Inoltre si pone Z(A) l’insieme contenente
lo 0 ed i divisori dello zero.
Notiamo che, ad esempio in Zn , un elemento non nullo o è in-
vertibile o è divisore dello zero, cioè Zn = U (Zn ) ∪ Z(Zn ). Infatti,
preso [a] ∈ Zn se a è primo con n allora [a] ∈ U (Zn ), mentre se a
non è primo con n, posto d = (a, n) allora [a][n/d] = [a/d][n] = 0 e
quindi [a] ∈ Z(Zn ). Analogo discorso vale anche in Mn (R) in quan-
to, se una matrice ha determinante non nullo è invertibile, mentre
184 CAPITOLO 5. TEORIA DEGLI ANELLI

se ha determinante
 nullo
 è divisore dello zero: infatti, per esempio
a b
per n = 2, se è una matrice non nulla con determinante
c d
nullo si ha ad = bc (e per esempio a 6= 0) per cui
    
a b b b 0 0
= .
c d −a −a 0 0
Notiamo tuttavia che questo fenomeno non accade in ogni anello;
infatti, come vedremo in altri esempi, un elemento di un anello può
non essere né invertibile, né divisore dello zero.
Riprendendo gli esempi iniziali abbiamo
• (Mn (R), +, · ) è un anello unitario;
• (Zn , +, · ), è un anello commutativo unitario;
• (2Z, +, · ), è un dominio d’integrità;
• (Z, +, · ), (K[x], +, · ), sono domini d’integrità unitari;
• (Q, +, · ), (R, +, · ), (C, +, · ), (Zp , +, · ) (con p primo), sono
campi.
Negli esempi precedenti abbiamo visto che Zn è un anello (non
dominio se n non è primo) mentre Zp è un campo (se n è primo).
Cosı̀ non riusciamo a produrre un dominio finito che non sia un
campo. Ed in effetti questo è un fatto generale.

Proposizione 5.1.4 Ogni dominio finito è un campo.


Dimostrazione. Sia D = {d1 , d2 , . . . , dn } un dominio finito.
Preso un elemento d ∈ D, d 6= 0, consideriamo l’insieme D0 =
{dd1 , dd2 , . . . , ddn }, naturalmente D0 ⊆ D e |D0 | = |D| visto che
se di 6= dj allora ddi 6= ddj (basta osservare che in D vale la legge
di cancellazione). Allora D0 = D per cui d = ddu per qualche du ;
verifichiamo che du è un elemento unità: prendiamo un qualsiasi
elemento di D, diciamo dda , allora avremo
du (dda ) = (du d)da = dda .
Poi, preso d ∈ D, d 6= 0, poiché in D0 = D vi è l’elemento unità
du = 1 si ha che 1 = ddb per qualche db ∈ D, cioè ogni d 6= 0 è
invertibile e quindi D è un campo.
5.1. DEFINIZIONI E PRIME PROPRIETÀ 185

Abbiamo visto che l’unica differenza che c’è tra un corpo ed


un campo sta nella commutatività del prodotto che è valida in un
campo ma non in un corpo che non è un campo. Ovviamente vi
sono esempi di corpi che non sono campi e per lungo tempo si è
cercato un tale esempio tra i corpi finiti, ma senza successo. Finché
Wedderburn nel secolo scorso provò.

Teorema 5.1.5 (Teorema di Wedderburn) Ogni corpo finito è


un campo.

Cosı̀ il più semplice esempio di corpo che non è un campo è il


famoso Corpo dei quaternioni reali

Esempio 5.1.6 Consideriamo l’insieme Q(R) delle espressioni for-


mali del tipo
a0 + a1 i + a2 j + a3 k
dove a0 , a1 , a2 , a3 ∈ R ed i, j, k soddisfano le seguenti condizioni

i2 = j 2 = k 2 = −1; ij = k; jk = i; ki = j

(se uno volesse evitare di parlare di espressioni formali, basterebbe


considerare R4 e definire su esso la somma componente per compo-
nente ed il prodotto in modo opportuno come fatto sui complessi).
(Q(R), +, · ), rispetto alle usuali operazioni di addizione e pro-
dotto forma un corpo, detto appunto il corpo dei quaternioni
reali. Notiamo che la commutatività del prodotto non è valida come
si vede facilmente dal fatto che ij = k mentre ji = ki2 = −k.
Ma lo stesso corpo lo si può vedere in maniera diversa attraverso
l’algebra delle matrici.
Si consideri il sottoinsieme dell’anello delle matrici M2 (C)
  
0 a b
Q = a, b ∈ C .
−b a
186 CAPITOLO 5. TEORIA DEGLI ANELLI

Ebbene si verifica banalmente che Q0 è un corpo. Ad esempio ogni


matrice è invertibile in quanto ha determinante ||a||2 + ||b||2 che
risulta nullo solo se a = b = 0. Inoltre tale corpo risulta isomorfo al
corpo dei quaternioni reali; basterà considerare l’isomorfismo Q0 →
Q(R) che si ottiene associando
   
1 0 i 0
7→ 1; 7→ i;
0 1 0 −i
   
0 1 0 i
7→ j; 7→ k.
−1 0 i 0

5.2 Sottoanelli
Definizione 5.2.1 Sia (A, +, · ) un anello ed S ⊆ A un suo sot-
toinsieme, diremo che S è un sottoanello di A se (S, +, · ) è
un anello (con le stesse operazioni definite su A). In tal caso
scriveremo S ≤ A.

Vi è una semplice caratterizzazione di quali sottoinsiemi sono


sottoanelli.

Proposizione 5.2.2 Sia (A, +, · ) un anello ed S ⊆ A un suo


sottoinsieme non vuoto. Allora S è sottoanello di A se e solo se

1. per ogni x, y ∈ S ⇒ x + (−y) = x − y ∈ S;

2. per ogni x, y ∈ S ⇒ x · y ∈ S.

Dimostrazione. Basta osservare che preso un qualunque x ∈ S


dal fatto che x−x ∈ S segue che 0 ∈ S. Inoltre da 0−x ∈ S segue che
−x ∈ S. E da x, y ∈ S segue −y ∈ S e quindi x + y = x − (−y) ∈ S.


5.3. OMOMORFISMI DI ANELLI 187

Esempio 5.2.3 1) In (Z, +, · ) il sottoinsieme 2Z è un sottoanel-


lo. Più in generale, per ogni n, nZ è un suo sottoanello. Invece
in (Z, +, · ) il sottoinsieme dei numeri dispari (Z \ 2Z) non è un
sottoanello.
2) Nell’anello dei polinomi reali A = R[x], consideriamo il sot-
toinsieme D = {f (x) ∈ A | f 0 (0) = 0}. Verifichiamo che D è un
sottoanello di A.
• Presi f (x), g(x) ∈ D, cioè f 0 (0) = g 0 (0) = 0 si ha (f (x) −
g(x))0 (0) = f 0 (0) − g 0 (0) = 0 − 0 = 0.
• Presi f (x), g(x) ∈ D, cioè f 0 (0) = g 0 (0) = 0 si ha (f (x) ·
g(x))0 (0) = f 0 (0)g(0) + f (0)g 0 (0) = 0g(0) + f (0)0 = 0.
Allora D è un sottoanello di A.

Osservazione 5.2.4 Come vedremo A = R[x] è un dominio a fat-


torizzazione unica, come Z, mentre il dominio D del precedente
esempio non lo è. Questo ci consente di affermare che non neces-
sariamente una proprietà che vale in un anello si conserva nei suoi
sottoanelli.

5.3 Omomorfismi di anelli


Definizione 5.3.1 Siano A ed A0 due anelli, una applicazione ϕ :
A → A0 si dice omomorfismo di A in A0 se

1. per ogni x, y ∈ A ⇒ ϕ(x + y) = ϕ(x) + ϕ(y);

2. per ogni x, y ∈ A ⇒ ϕ(x · y) = ϕ(x) · ϕ(y).

Se ϕ : A → A0 è un omomorfismo di anelli non è difficile veri-


ficare che l’immagine im(ϕ) è un sottoanello di A0 (come vedremo
anche più in generale).
Inoltre sono semplici verifiche per un omomorfismo ϕ : A → A0

1) ϕ(0) = 00 (dove abbiamo indicato con 00 lo zero in A0 ).


188 CAPITOLO 5. TEORIA DEGLI ANELLI

2) ϕ(−a) = −ϕ(a) per ogni a ∈ A.

1) Infatti, posto ϕ(0) = z avremo:

z = ϕ(0) = ϕ(0 + 0) = ϕ(0) + ϕ(0) = z + z

da cui z + (−z) = z + z + (−z) ovvero 00 = z.


2) Inoltre ϕ(−a) + ϕ(a) = ϕ(−a + a) = ϕ(0) = 00 cioè ϕ(−a) =
−ϕ(a).
Notiamo che in generale, anche se gli anelli sono unitari, non
è detto che un omomorfismo mandi l’elemento unità di A nell’ele-
mento unità di A0 . Tale proprietà è valida, per esempio, in almeno
due casi significativi.

1) Se ϕ : A → A0 è un omomorfismo suriettivo di anelli unitari


allora ϕ(1) = 10 . Infatti, posto ϕ(1) = u0 preso un qualsiasi
elemento di a0 ∈ A0 si ha, per la suriettività, che a0 = ϕ(a)
per qualche a ∈ A. Pertanto

u0 a0 = ϕ(1)ϕ(a) = ϕ(1 · a) = ϕ(a) = a0

per cui u0 è l’elemento unità di A0 .

2) Se ϕ : A → A0 è un omomorfismo di domini unitari allora


ϕ(1) = 10 . Infatti, posto ϕ(1) = u0 si ha

u0 = ϕ(1) = ϕ(1 · 1) = ϕ(1)ϕ(1) = u0 u0

e quindi 10 ·u0 = u0 u0 che per la legge di cancellazione (visto che


stiamo lavorando su un dominio d’integrità) implica u0 = 10 .

Inoltre, quando ϕ(1) = 10 vale anche

3) Se ϕ : A → A0 è un omomorfismo di anelli unitari ed a è inver-


tibile in A allora ϕ(a−1 ) = (ϕ(a))−1 (cioè ϕ(a−1 ) è l’inverso
di ϕ(a)). Infatti, ϕ(a−1 )ϕ(a) = ϕ(a−1 a) = ϕ(1) = 10 .
5.3. OMOMORFISMI DI ANELLI 189

Osservazione 5.3.2 Se f : A → A0 e g : A0 → A00 sono omomor-


fismi di anelli, allora la composizione gf : A → A00 è ancora un
omomorfismo di anelli.

Definizione 5.3.3 Se ϕ : A → A0 è un omomorfismo di anelli si


chiama nucleo di ϕ e si indica con ker ϕ
ker ϕ = {a ∈ A | ϕ(a) = 0}
Per il nucleo di un omomorfismo non solo si può verificare facil-
mente che si tratta di un sottoanello di A, ma vale anche la seguente
proprietà di assorbimento

Proposizione 5.3.4 Se ϕ : A → A0 è un omomorfismo di anelli


e ker ϕ il suo nucleo, allora per ogni a ∈ A ed x ∈ ker ϕ si ha
ax, xa ∈ ker ϕ.
Dimostrazione. Infatti, ϕ(ax) = ϕ(a)ϕ(x) = ϕ(a)0 = 0 e,
analogamente, ϕ(xa) = ϕ(x)ϕ(a) = 0ϕ(a) = 0.

Ovviamente, come nel caso dei gruppi, un omomorfismo si dice
iniettivo (o immersione) se l’applicazione è iniettiva; un omomor-
fismo si dice suriettivo (o suriezione) se l’applicazione è suriettiva;
ed infine, un omomorfismo si dice isomorfismo se l’applicazione
è biiettiva. Se tra due anelli A ed A0 esiste un isomorfismo essi si
dicono isomorfi e scriveremo A ∼ = A0 .
Anche nel caso degli anelli vale

Proposizione 5.3.5 Un omomorfismo di anelli ϕ : A → A0 è


iniettivo se e solo se ker ϕ = {0}.
Dimostrazione. Infatti, se ϕ è iniettivo ed x ∈ ker ϕ allora
ϕ(x) = 00 e poiché ϕ(0) = 00 dalla iniettività segue x = 0. Vi-
ceversa, se ker ϕ = {0} e ϕ(x) = ϕ(y) allora ϕ(x) − ϕ(y) = 00
ovvero ϕ(x − y) = 00 cioè (x − y) ∈ ker ϕ = {0} quindi x − y = 0
per cui x = y.

190 CAPITOLO 5. TEORIA DEGLI ANELLI

5.4 Anelli quozienti ed Ideali


Si consideri un anello (A, +, · ) ed un suo sottoanello S. Stabiliamo
su A la seguente relazione

x∼y ⇔ x − y ∈ S.

Si vede facilmente che tale relazione è una relazione di equiva-


lenza su A per cui nasce l’insieme quoziente, cioè l’insieme delle
classi di equivalenza A/S.
Se a è un elemento di A la classe di equivalenza [a] che esso
individua non è null’altro che il laterale a + S. Per cui A/S =
{laterali}. Vediamo se è possibile definire su A/S due operazioni (a
partire da quelle definite su A) che lo rendano un anello. Allora
definiamo per ogni a + S, b + S ∈ A/S
(a + S) + (b + S) = a + b + S

(a + S)(b + S) = ab + S
Ma per vedere se abbiamo definito delle operazioni su A/S dobbia-
mo controllare che esse non dipendano dalla scelta dei rappresen-
tanti dei laterali assegnati, cioè

se a + S = a0 + S, b + S = b0 + S ⇒ a + b + S = a0 + b0 + S

se a + S = a0 + S, b + S = b0 + S ⇒ ab + S = a0 b0 + S.

La prima verifica è del tutto banale quindi la somma è una opera-


zione definita su A/S : infatti, se a − a0 ∈ S e b − b0 ∈ S allora
a + b − (a0 + b0 ) = a − a0 + b − b0 ∈ S.
Ben diversa è la situazione per quel che concerne il prodotto,
infatti dal fatto che a − a0 ∈ S e b − b0 ∈ S dovremmo provare che
ab − a0 b0 ∈ S. Ma da a − a0 ∈ S possiamo dire che a = a0 + s1 con
s1 ∈ S e da b − b0 ∈ S possiamo dire che b = b0 + s2 con s2 ∈ S
per cui ab − a0 b0 = a0 s2 + s1 b0 + s1 s2 e solo di s1 s2 siamo certi che
5.4. ANELLI QUOZIENTI ED IDEALI 191

si trova in S. Cosı̀ quella legge non definisce, in questa generalità,


una operazione su A/S, abbiamo bisogno che in S valga qualche
proprietà che ci consenta di dire che a0 s2 e s1 b0 stiano in S! Se ben
ricordiamo, questa era la proprietà di assorbimento che avevamo
verificato per il nucleo di un omomorfismo.

Definizione 5.4.1 Sia (A, +, · ) un anello ed I ⊆ A un suo sot-


toinsieme, diremo che I è un ideale di A, e scriveremo I / A,
se

1. per ogni x, y ∈ I segue x − y ∈ I;

2. per ogni x ∈ I ed a ∈ A segue ax ∈ I e xa ∈ I (proprietà di


assorbimento).

Se vale solo ax ∈ I l’ideale si dice sinistro se vale solo xa ∈ I


l’ideale si dice destro.

Ovviamente, un ideale è in particolare un sottoanello.


Tornando allora all’insieme quoziente A/S, se supponiamo che
S sia un ideale di A potremo concludere che ab − a0 b0 = a0 s2 +
s1 b0 + s1 s2 ∈ S e quindi in A/S sarebbero definite le operazioni
di somma e prodotto. Ora è facile verificare che in (A/S, +, · )
valgono le proprietà 1)-6), dunque esso costituirà un anello detto
anello quoziente di A rispetto all’ideale S.
Osserviamo che lo 0 in A/S è il laterale 0 + S = S.
Un primo semplice esempio è quello, già visto in precedenza,
ottenuto prendendo nell’anello Z l’ideale 10Z. In questo caso l’anello
quoziente Z/10Z è il ben noto anello delle classi di resto Z10 .
È banale verificare che in un anello A sia {0} che A sono due
ideali, detti appunto ideali banali. Tra non molto saremo in grado
di dire quando in un anello ci sono ideali diversi da quelli banali.
Vediamo alcune proprietà di cui godono gli ideali (le verifiche di
queste proprietà sono del tutto analoghe a quelle studiate nel caso
dei gruppi e quindi vengono qui tralasciate).
192 CAPITOLO 5. TEORIA DEGLI ANELLI

Proposizione 5.4.2 1) Se I, J / A allora I ∩ J / A.


2) Se I / A ed S ≤ A allora I ∩ S / S.
3) Se I, J / A allora I ∪ J / A se e solo se I ⊆ J o J ⊆ I.
4 Sia f : A → A0 è un omomorfismo di anelli
4a) se S ≤ A allora f (S) ≤ A0 ;
4b) se S 0 ≤ A0 allora f −1 (S 0 ) ≤ A (contenente il kerf );
4c) se I 0 / A0 allora f −1 (I 0 ) / A (contenente il kerf );
4d) se I / A allora f (I) / im(f ) (nota che in generale f (I)
non è ideale di A0 ; ovviamente se f è suriettivo poiché
im(f ) = A0 allora f (I) sarà anche ideale di A0 ).

Esempio 5.4.3 In questo esempio vogliamo determinare tutti gli


ideali di Z. Sia allora I / Z, naturalmente può accadere che I = {0}
oppure I 6= {0}; in quest’ultimo caso consideriamo m = min{x ∈
I | x > 0} (esiste perché {x ∈ I | x > 0} è un sottoinsieme
non vuoto di N) e verifichiamo che I = mZ. Dalla proprietà di
assorbimento segue subito che mZ ⊆ I. D’altra parte, se y ∈ I
dall’algoritmo di divisione possiamo scrivere y = qm + r con 0 ≤
r < m; ora da r = y − qm, osservato che y ∈ I e qm ∈ I, segue
r ∈ I ma allora dalla minimalità di m si deduce che r = 0, e quindi
y = qm ∈ mZ.

5.5 Teoremi dell’omomorfismo tra anel-


li
Notiamo che se A/I è un anello quoziente possiamo definire il se-
guente omomorfismo suriettivo π : A → A/I mediante π(a) =
a + I. Tale omomorfismo verrà detto omomorfismo naturale o
canonico di A nel suo quoziente A/I.
In analogia con quanto fatto per i gruppi si ha il seguente
5.6. GENERATORI DI IDEALI ED IDEALI PRINCIPALI 193

Teorema 5.5.1 (Teorema dell’omomorfismo) Se f : A → A0


è un omomorfismo di anelli e K = ker f allora esiste un omomor-
fismo iniettivo ω : A/K → A0 tale che ωπ = f. In particolare, A/K
è isomorfo a im(f ). Nel caso in cui f è suriettivo A/ ker f ∼
= A0 .

Ed in analogia ai Teoremi dell’isomorfismo 2 e 3 (vedi Teore-


mi 4.7.6 e 4.7.7) si ha

Teorema 5.5.2 (Teorema dell’isomorfismo 2) Se f : A → A0


è un omomorfismo suriettivo di anelli ed I 0 / A0 , allora posto I =
f −1 (I 0 ) si ha A/I ∼
= A0 /I 0 . In particolare, posto K = ker f, si ha
A/I ∼ = (A/K)/(I/K).

Teorema 5.5.3 (Teorema dell’isomorfismo 3) Se f : A → A0


è un omomorfismo suriettivo di anelli e K = ker f. Se S è un
qualsiasi sottoanello di A allora
1. f −1 f (S) = S + K;

2. S ∩ K / S; e K / S + K;

3. S/(S ∩ K) ∼
= (S + K)/K.

5.6 Generatori di ideali ed ideali prin-


cipali
Cominciamo con alcune osservazioni.
• Sia A un anello commutativo unitario ed I un suo ideale. Se
1 ∈ I allora I = A. Infatti, se a ∈ A per la proprietà di assorbi-
mento 1 · a ∈ I, quindi a ∈ I ovvero A ⊆ I; poiché l’inclusione
inversa è sempre vera, segue I = A. Più in generale, se I contiene
un invertibile u allora I = A. Infatti, in tal caso, sempre per la
proprietà di assorbimento, 1 = uu−1 ∈ I e quindi, da quanto detto
sopra, I = A.
• Se A è un anello commutativo ed a un suo elemento, allora il
sottoinsieme (a) = {λa | ∀λ ∈ A} di tutti i multipli di a, forma un
194 CAPITOLO 5. TEORIA DEGLI ANELLI

ideale di A (verifica banale) detto ideale principale generato da


a.
Con queste osservazioni siamo in grado di provare il

Teorema 5.6.1 Un anello commutativo unitario A è privo di idea-


li non banali ⇔ A è un campo.

Dimostrazione. Se A è un campo, allora ogni elemento a 6= 0 è


invertibile; per cui se I è un ideale non nullo contiene un elemento
u 6= 0 cioè un elemento invertibile e per quanto detto sopra I = A.
Viceversa, se A è un anello commutativo unitario privo di ideali
non banali, per provare che A è un campo bisogna dimostrare che
ogni a 6= 0 in A è invertibile. Ed infatti, consideriamo l’ideale
principale (a) generato da a. Poiché (a) 6= (0) dovrà essere (a) = A,
in particolare 1 ∈ (a), cioè 1 = aλ con λ ∈ A, ovvero a è invertibile.

Adesso generalizziamo quanto visto nella precedente osserva-


zione. In un anello commutativo unitario A consideriamo un suo
sottoinsieme S, allora il sottoinsieme

(S) = {λ1 s1 + λ2 s2 + . . . + λn sn | ∀ λi ∈ A, si ∈ S, ∀ n ∈ N}

costituisce un ideale di A che si dice l’ideale generato da S.


Un ideale I si dice finitamente generato se esistono elementi
b1 , . . . , bt tali che I = (b1 , . . . , bt ). In tal caso l’insieme degli elementi
{b1 , . . . , bt } si dirà un sistema di generatori per I. Nel caso partico-
lare in cui I può essere generato da un solo elemento a avremo un
ideale principale (come già detto).

Esempio 5.6.2 Nell’anello Z gli ideali nZ sono principali. Il pun-


to è che in Z questi sono gli unici ideali! Quindi in Z tutti gli ideali
sono principali.
5.7. IDEALI PRIMI E MASSIMALI 195

5.7 Ideali primi e massimali


Definizione 5.7.1 Un ideale proprio P / A si dice primo se dal
fatto che il prodotto di due elementi di A sta in P segue che almeno
uno dei due elementi deve stare in P, cioè da xy ∈ P segue x ∈ P
oppure y ∈ P.

Esempio 5.7.2 In ogni dominio D l’ideale (0) è primo (come in


Z). Ed ancora, 5Z è un ideale primo e più in generale pZ con p
primo è un ideale primo.
Nell’anello dei polinomi R[x] se f (x) è un polinomio irriducibile
allora l’ideale principale (f (x)) è primo.

Teorema 5.7.3 In un anello commutativo un ideale P è primo se


e solo se A/P è un dominio d’integrità.

Dimostrazione. Se P è primo bisogna provare che se x, y ∈ A/P


sono tali che xy = 0 allora x = 0 oppure y = 0. Allora x = x + P,
y = y + P e da (x + P )(y + P ) = P segue xy + P = P ovvero
xy ∈ P. Dal fatto che P è primo segue x ∈ P oppure y ∈ P, cioè
x = 0 oppure y = 0.
Viceversa, sia A/P un dominio e supponiamo che xy ∈ P, cioè
xy + P = P ovvero (x + P )(y + P ) = P ; sicché xy = 0, ma dal
fatto che A/P è un dominio, segue x = 0 oppure y = 0. Ciò dice
che x + P = P oppure y + P = P, ovvero x ∈ P oppure y ∈ P, cioè
P è primo.

Definizione 5.7.4 In un anello A un ideale M si dice massimale


se non è contenuto in alcun altro ideale diverso da A, cioè se M /
J / A allora J = M oppure J = A.
196 CAPITOLO 5. TEORIA DEGLI ANELLI

Esempio 5.7.5 In Z l’ideale (0) è primo (come detto) ma non è


massimale perché è contenuto in tutti gli ideali di Z.
Invece, se p è un numero primo, pZ è non solo un ideale primo
(come detto) ma anche un ideale massimale. Infatti, se pZ / J / Z
verifichiamo che se J 6= pZ allora J = Z. Visto che J 6= pZ si
può trovare in J un elemento n che non sia divisibile per p; allora,
dal fatto che p è primo, segue che M CD(n, p) = 1. Dall’identità di
Bézout si ha allora 1 = an + bp, ma an ∈ J (perché n ∈ J) e bp ∈ J
(perché pZ ⊆ J). Cosı̀ 1 ∈ J da cui segue J = Z.

Teorema 5.7.6 Se A è un anello commutativo unitario, allora un


ideale M in A è massimale ⇔ A/M è un campo.

Dimostrazione. Sia M un ideale massimale di A e sia J / A/M.


Detto π : A → A/M l’omomorfismo canonico, allora J = π −1 (J) è
un ideale di A contenente ker π = M. Dal fatto che M è massimale
segue che J = A oppure J = M e quindi J = π(J) = A/M oppure
J = π(M ) = (0). Quindi in A/M ci sono solo gli ideali banali e
quindi è un campo.
Viceversa, supponiamo che A/M sia un campo e consideriamo
un ideale J tale che M / J / A e proviamo che J = M oppure
J = A. Considerato il solito omomorfismo π : A → A/M si ha π(J)
è un ideale di A/M, ma essendo quest’ultimo un campo possiede
solo ideali banali e quindi π(J) = (0) oppure π(J) = A/M. Nel
primo caso J = π −1 (π(J)) = π −1 (0) = ker π = M ; nel secondo caso
J = π −1 (π(J)) = π −1 (A/M ) = A.

Corollario 5.7.7 In un anello commutativo unitario A ogni ideale


massimale è primo.
5.7. IDEALI PRIMI E MASSIMALI 197

Dimostrazione. Sia M un ideale massimale, allora A/M è un


campo per il Teorema 5.7.6 e quindi A/M un dominio d’integrità
per cui M è primo per il Teorema 5.7.3.

Notiamo che l’ipotesi che A sia unitario per la validità del risul-
tato precedente è essenziale.

Esempio 5.7.8 Consideriamo l’anello commutativo 2Z (non è uni-


tario) ed in esso l’ideale M = 4Z. Tale ideale è massimale, infatti
se 4Z / J / 2Z deve essere J = nZ con n multiplo di 2 e divisore di
4; per cui n = 2 oppure n = 4 ovvero J = 2Z oppure J = 4Z.
Ma M non è primo in quanto 2 · 2 ∈ 4Z ma 2 ∈ / 4Z.

Un caso particolarmente interessante è quello degli anelli unitari


finiti. In tal caso si ha

Proposizione 5.7.9 In ogni anello commutativo unitario finito ogni


ideale primo è massimale.

Dimostrazione. Basta osservare che se P è un ideale primo di


un anello unitario finito A, allora A/P è un dominio finito, quindi
un campo, per cui P è un ideale massimale.

Ma negli anelli commutativi unitari vi sono sempre ideali mas-
simali? Il prossimo risultato dice che, in effetti, ogni ideale proprio
(cioè diverso dall’anello stesso) è contenuto in almeno un ideale
massimale.
Per provare questo risultato abbiamo bisogno di una nota pro-
prietà degli insiemi parzialmente ordinati.

Lemma 5.7.10 (Lemma di Zorn) Se P è un insieme p.o. non


vuoto in cui ogni catena (ovvero sottoinsieme totalmente ordinato)
ammette maggioranti in P, allora P possiede elementi massimali.
198 CAPITOLO 5. TEORIA DEGLI ANELLI

Teorema 5.7.11 Se A è un anello commutativo unitario ed I 6= A


un suo ideale proprio, allora esiste in A un ideale massimale M
che contiene I. In particolare, ogni anello commutativo unitario
possiede ideali massimali.
Dimostrazione. Consideriamo l’insieme II = {J /A | I ⊆ J, J 6=
A} degli ideali propri contenenti I ed ordiniamolo per inclusione.
Verifichiamo che tale insieme p.o. è nelle ipotesi del Lemma di
Zorn. Sia allora {Jα } una catena in S II e consideriamo l’unione di
tutti gli elementi della catena, J = α Jα , e verifichiamo che J è
un maggiorante della catena in II . Poiché il fatto che J contenga
ogni Jα è banale, l’unica cosa da verificare è che J è un elemento
di II . Ed ancora, poiché ovviamente J ⊇ I in quanto ogni Jα ⊇ I,
resta da vedere che J è un ideale proprio.
• J è un ideale. Siano x, y ∈ J allora x ∈ Jα1 e y ∈ Jα2 per certi
indici α1 ed α2 . Ma poiché {Jα } è un insieme t.o. i due suddetti
ideali sono confrontabili, cioè Jα1 ⊆ Jα2 o Jα2 ⊆ Jα1 . Per fissare le
idee diciamo Jα1 ⊆ Jα2 ; allora x, y ∈ Jα2 e quindi x − y ∈ Jα2 ⊆ J.
Siano adesso x ∈ J ed a ∈ A, allora x ∈ Jα1 per qualche α1 e
quindi, essendo Jα1 un ideale, ax ∈ Jα1 ⊆ J.
• J è un ideale proprio,
S cioè J 6= A. Se per assurdo J = A
seguirebbe 1 ∈ J = α Jα , e quindi 1 ∈ Jα1 per qualche α1 ; ma
questo comporterebbe Jα1 = A contro il fatto che essendo Jα1 ∈ II
deve essere proprio.
Visto che II si trova nelle ipotesi del Lemma di Zorn deve possedere
elementi massimali. Sia M un massimale di II e verifichiamo che
M è un ideale massimale di A contenente I. Intanto per il fatto che
M ∈ II segue che M è un ideale proprio contenente I; si tratta
allora solo di controllare che è un ideale massimale. Sia quindi
M / K / A; se K 6= A poiché I ⊆ M ⊆ K possiamo affermare che
K ∈ II , ma allora per la massimalità di M in II ne segue M = K
e questo mostra che M è un ideale massimale.

Nota che in un campo (che ha solo gli ideali banali) l’ideale (0) è
massimale.
5.7. IDEALI PRIMI E MASSIMALI 199

Un caso particolarmente interessante è quello degli anelli com-


mutativi unitari che posseggono un solo ideale massimale.

Definizione 5.7.12 Un anello commutativo unitario A che pos-


siede un solo ideale massimale M si dice locale.

Osservazione 5.7.13 Alla luce del Teorema 5.7.11 se A è un anel-


lo locale di massimale M allora U (A) = A \ M. D’altra parte,
se A \ U (A) è un ideale allora A è un anello locale. Infatti, po-
sto J = A \ U (A) basta verificare che J è l’unico ideale massi-
male. Ed infatti, ogni ideale proprio, essendo composto da ele-
menti non invertibili deve essere contenuto in A \ U (A) = J che
conseguentemente deve essere l’unico massimale.

Esempio 5.7.14 Consideriamo il seguente sottoinsieme di Q


na o
Z(p) = | (a, b) = 1, p non divide b
b

con p numero primo. È facile verificare che Z(p) è un anello; un


elemento ab ∈ Z(p) è invertibile quando a non è divisibile per p
quindi, posto J = Z(p) \U (Z(p) ) = { ph
b
| (h, b) = 1, p non divide b},
si verifica facilmente che J è un ideale. Pertanto Z(p) è un anello
locale.

Come è noto in un dominio non ogni elemento è invertibile,


tuttavia vedremo che potremo trovare un ambiente “più ampio” in
cui ogni elemento non nullo di un dominio si possa invertire. Infatti
vale il seguente risultato.

Proposizione 5.7.15 Ogni dominio D può essere immerso in un


campo.
200 CAPITOLO 5. TEORIA DEGLI ANELLI

Dimostrazione. La prova è del tutto analoga a quella fatta per


costruire il campo dei numeri razionali a partire dal dominio degli
interi relativi.
Sull’insieme D × D∗ si introduce la relazione di equivalenza

(x, y) ∼ (x0 , y 0 ) ⇔ xy 0 = x0 y

nasce cosı̀ l’insieme quoziente K = D × D∗ / ∼, cioè l’insieme delle


classi di equivalenza. La classe [(a, b)] sarà indicata con il simbolo
di frazione ab . Si definiscono in K le due operazioni

a c ad + bc
+ = ;
b d bd
a c ac
· = .
b d bd
È facile a questo punto verificare che (K, +, · ) costituisce un campo.
Facciamo solo alcune delle verifiche necessarie:
• l’elemento neutro dell’addizione è la frazione 0b ;
• l’opposto di ab è −a
b
= −ba
;
• l’elemento neutro della moltiplicazione ovvero l’elemento unità
è la frazione bb (nota che non è richiesto che nel dominio vi sia
l’elemento unità);
• ogni frazione ab , con a 6= 0, ammette l’inverso, la frazione ab .
Il campo K cosı̀ ottenuto si chiama il campo delle frazioni
del dominio D.
Vediamo, infine, come D si può immergere in K: per questo
scopo definiamo l’omomorfismo iniettivo g : D → K:

xb
g(x) =
b
la verifica che g sia un omomorfismo iniettivo è del tutto analoga a
quella fatta per l’immersione di Z in si Q.


5.7. IDEALI PRIMI E MASSIMALI 201

Dato un dominio D definiamo il seguente sottoinsieme di N

c(D) = {i ∈ N∗ | ia = 0 ∀ a ∈ D}

(ia significa a + . . . + a somma di i-volte a). Allora possiamo dare


la seguente definizione.

Definizione 5.7.16 Si dice che il dominio D ha “caratteristica”


zero se c(D) = ∅. Altrimenti si dirà che D ha “caratteristica finita”
e precisamente se m = min c(D) si darà che D ha caratteristica m
e si scriverà ch(D) = m.

Osservazione 5.7.17 Osserviamo che nel caso in cui D ha carat-


teristica finita, la sua caratteristica è un numero primo. Infatti, se
D ha caratteristica m, essendo m = min c(D), deve esistere un ele-
mento b ∈ D tale che mb = 0 ed m0 b 6= 0 per ogni m0 < m. Allora
se fosse m = pq con p e q diversi da 1 (quindi p < m, q < m) da
mb = 0 seguirebbe pqb = 0 ovvero (pb)(qb) = 0 per cui, essendo D
un dominio, deve essere o pb = 0 o qb = 0 contro la citata minima-
lità di m. Inoltre, nel caso di domini unitari la caratteristica sarà
più semplicemente il minimo naturale n > 0 tale che n1 = 0.

Ad esempio il dominio D = Zp [x] ha caratteristica p.


Il caso dei campi è ovviamente un caso particolare. In questo
caso, un campo K ha caratteristica zero se non esiste un intero
n > 0 tale che n1 = 0; mentre ha caratteristica p se p1 = 0 e per
ogni q < p si ha q1 6= 0.
Adesso poniamo questa semplice domanda:
È vero che per ogni intero n > 0 vi è un campo con n elementi?
Vedremo facilmente che cosı̀ non è. Per fare ciò, diamo la
seguente definizione.

Definizione 5.7.18 Si chiama campo primo di un campo K


il più piccolo sottocampo F contenuto in K o, equivalentemente,
l’intersezione di tutti i sottocampi di K.
202 CAPITOLO 5. TEORIA DEGLI ANELLI

Il seguente risultato ci dice tutto sul campo primo di un campo


K.

Proposizione 5.7.19 Se K è un campo di caratteristica zero allo-


ra il suo campo primo F è isomorfo a Q. Se invece K è un campo
di caratteristica p allora il suo campo primo F è isomorfo a Zp .

Dimostrazione. Consideriamo l’applicazione ϕ : Z → K definita


da ϕ(z) = z1. È una facile verifica che ϕ è un omomorfismo di
anelli. Inoltre, im(ϕ) ⊆ F in quanto 1 ∈ F e quindi n1 ∈ F per
ogni naturale n e quindi anche (−n)1 ∈ F, cioè z1 ∈ F per ogni
z ∈ Z. Ora,

- se ch(K) = 0 si ha ker(ϕ) = {0} cioè ϕ è iniettivo, quindi


Z∼ = im(ϕ). Ora poiché il più piccolo campo contenente Z è
Q, mentre il campo primo F è il più piccolo campo contenente
im(ϕ), ne segue che F ∼
= Q;
- se ch(K) = p si ha ker(ϕ) = pZ (per definizione di carat-
teristica), quindi per il teorema dell’isomorfismo im(ϕ) =
Z/pZ = Zp .

Il precedente risultato permette di trovare per quali interi n esi-


stono campi finiti con n elementi. In quel che segue utilizzeremo
qualche definizione e qualche risultato elementare di Algebra lineare
(che richiameremo all’occorrenza). Sia, allora K un campo finito,
diciamo |K| = n, e sia F ∼ = Zp il suo campo primo. Definiamo la
seguente operazione (esterna di K su F ):

α • x = αx ∈ K

per ogni α ∈ F e x ∈ K (nota che α, x ∈ K e che il prodotto


al secondo membro è l’operazione definita su K). È facile vede-
re che con l’operazione cosı̀ definita K ha la struttura di F -spazio
vettoriale. Ovviamente, dal fatto che K è un campo finito segue
5.7. IDEALI PRIMI E MASSIMALI 203

che K come F -spazio vettoriale è di dimensione finita, diciamo


dimF K = t. Ricordiamo allora che in tal caso K risulta isomorfo
a F t , di conseguenza avremo che K è isomorfo a (Zp )t . Ma allora,
|K| = pt . Questo mostra che ogni campo finito possiede un nu-
mero di elementi pari alla potenza di un numero primo. Inoltre,
si può provare, ma qui ci limitiamo ad enunciarlo, che vale anche
il viceversa, cioè se n è la potenza di un numero primo esiste un
campo con n elementi. In definitiva abbiamo la seguente risposta
alla domanda che ci eravamo posti inizialmente.

Teorema 5.7.20 Esistono campi finiti con n elementi se e solo se


n è la potenza di un numero primo.

Cosı̀ mentre esistono campi con 49 o 121 elementi, non esistono


campi con 50 o 100 elementi.

• Costruzione di campi finiti.


Il precedente teorema afferma, tra l’altro, che per ogni intero
n = pd , con p primo, esiste un campo con n elementi. In effetti,
un siffatto campo lo si può costruire in questo modo: si conside-
ri il dominio Zp [x] dei polinomi a coefficienti in Zp ed in esso si
consideri un polinomio f (x) irriducibile di grado d (si può provare
che, per ogni d ≥ 1, vi sono polinomi irriducibili in Zp [x] di grado
d, anzi si può anche calcolare quanti sono i polinomi irriducibili in
Zp [x] di grado d). Per una proprietà che vedremo più avanti (vedi
Proposizione 5.8.11) l’ideale di Zp [x] generato da f (x), J = (f (x)),
è massimale, per cui l’anello quoziente Zp [x]/J = K è un campo.
Se uno pone x + J = z, si verifica che ogni elemento di K si può
esprimere nella forma ad−1 z d−1 + · · · + a1 z + a0 con ogni ai ∈ Zp .
Per cui, potendo ogni ai assumere p valori, ed essendo il numero di
tali ai pari a d si deduce che in K vi sono pd elementi.
Per illustrare quanto finora espresso, costruiamo un campo con
125 = 53 elementi. Consideriamo allora in Z5 [x] il polinomio x3 +
x + 1. Una facile verifica mostra che esso non ha radici in Z5 e
pertanto è irriducibile. Consideriamo l’ideale J = (x3 + x + 1)
e l’anello quoziente K = Z5 [x]/J. Cominciamo col far vedere che
204 CAPITOLO 5. TEORIA DEGLI ANELLI

ogni elemento di K, f (x) + J, si può scrivere come r(x) + J con


r(x) polinomio di grado ≤ 2 (o r(x) = 0). Infatti, dall’algoritmo di
divisione su Z5 [x] applicato ai polinomi f (x) e x3 + x + 1 si deduce
che esistono q(x), r(x) ∈ Z5 [x] tali che f (x) = q(x)(x3 +x+1)+r(x)
dove r(x) = 0 oppure ha grado < 3. Per cui f (x)−r(x) = q(x)(x3 +
x+1) ∈ J e quindi, come affermato, f (x)+J = r(x)+J con r(x) = 0
oppure polinomio di grado ≤ 2. Posto allora x + J = z e, per abuso,
a + J = a, si ha che un qualsiasi elemento di K si può scrivere nella
forma
f (x) + J = ax2 + bx + c + J = az 2 + bz + c
con a, b, c ∈ Z5 , quindi K possiede 5 · 5 · 5 = 125 elementi.

5.8 Domini euclidei


Adesso cercheremo di generalizzare i risultati sulla teoria della divi-
sibilità studiata su Z al caso di domini unitari qualsiasi. Ricordiamo
a questo proposito che se D è un dominio unitario ed a e b sono due
suoi elementi non nulli, dire che a divide b, a|b, significa che b = ha
per qualche h in D. Inoltre, se a|b, e b|a, i due elementi si dicono as-
sociati ed accade che a = ub e b = va con u, v elementi invertibili.
Per illustrare questa teoria diamo la seguente definizione.

Definizione 5.8.1 Un domino D si dice dominio euclideo se


esiste una applicazione v : D∗ → N, detta “valutazione euclidea”,
tale che

1. v(a) ≤ v(ab) per ogni a, b ∈ D∗ ;

2. (algoritmo di divisione) per ogni a, b ∈ D, b 6= 0, esistono


q, r ∈ D tali che a = bq + r con r = 0 oppure v(r) < v(b).

Esempio 5.8.2 1) Z è un dominio euclideo: basta prendere come


valutazione euclidea il valore assoluto, cioè v(x) = |x|.
5.8. DOMINI EUCLIDEI 205

2) K[x] è un dominio euclideo, con K campo; in questo caso


basta prendere come valutazione di un polinomio il suo grado, cioè
v(f (x)) = deg f (x) (per la prova vedi Proposizione 3.3.1).

Nel seguito vedremo un altro importante esempio di dominio eucli-


deo.
Vediamo adesso alcune proprietà, già studiate in Z, e che val-
gono per tutti i domini euclidei.
Cominciamo con l’osservare che nella definizione di dominio
euclideo non si è richiesto che il dominio fosse unitario, tuttavia
proveremo che

Proposizione 5.8.3 (E1) Ogni dominio euclideo è unitario.

Dimostrazione. Sia D un dominio euclideo con valutazione eu-


clidea v e proviamo che in D esiste l’elemento unità. Consideriamo
im(v); poiché si tratta di un sottoinsieme non vuoto di N, im(v)
deve avere il minimo m. Sia d ∈ D∗ un elemento tale che v(d) = m
ed a un qualsiasi elemento di D. Applichiamo l’algoritmo di divi-
sione tra a e d, troveremo due elementi q, r ∈ D tali che a = dq + r
con r = 0 oppure v(r) < v(d) = m; ma per la minimalità di m
questo secondo evento non può verificarsi, quindi r = 0 per cui
a = dq per ogni a ∈ D. Pertanto ogni elemento di D è multiplo
di d, anche d, cosı̀ anche d = ud. Proviamo che u è la cercata
unità, cioè verifichiamo che per ogni a si ha ua = a. Ed infatti,
ua = u(dq) = (ud)q = dq = a.


Gli unici ideali che abbiamo trovato in Z sono stati quelli del
tipo nZ, cioè quelli principali. Vedremo che in effetti nei domini eu-
clidei questi sono i soli ideali. Per questo motivo diamo la seguente
definizione.

Definizione 5.8.4 Un dominio si dice ad ideali principali o


semplicemente (PID) se ogni suo ideale è principale.
206 CAPITOLO 5. TEORIA DEGLI ANELLI

Proposizione 5.8.5 (E2) Ogni dominio euclideo è ad ideali prin-


cipali, ovvero è un PID.

Dimostrazione. Sia D un dominio euclideo con valutazione eu-


clidea v ed I un suo ideale. Proviamo che I = (d) per qualche
d ∈ I. Se I = (0) non c’è nulla da verificare. Se I 6= (0), consi-
deriamo im(I ∗ ); essendo I 6= (0), im(I ∗ ) sarà un sottoinsieme non
vuoto di N, quindi per il buon ordinamento di N, im(I ∗ ) deve avere
il minimo m. Sia d ∈ I ∗ un elemento tale che v(d) = m ed a un
qualsiasi elemento di I. Applichiamo l’algoritmo di divisione tra a
e d, troveremo due elementi q, r ∈ D tali che a = dq + r con r = 0
oppure v(r) < v(d) = m. Ma r = a − dq ∈ I, perché a, d ∈ I, cosı̀
per la minimalità di m non può essere v(r) < v(d), quindi r = 0.
Allora a = dq il che prova che d genera I.


Poiché in ogni dominio si può dare la definizione di massimo


comune divisore di due elementi (non nulli) (vedi Definizioni 2.2.1
e 2.6.4) ha sempre senso chiederci se un siffatto elemento esiste nel
dominio. In generale la risposta è negativa, ma nei domini euclidei
vale il seguente risultato.

Proposizione 5.8.6 (E3) In ogni dominio euclideo D, per ogni


a, b ∈ D∗ esiste il massimo comune divisore M CD(a, b).

Dimostrazione. Consideriamo l’ideale generato dagli elementi a


e b, cioè I = (a, b) = {λa + µb | ∀ λ, µ ∈ D}. Poiché I è un ideale di
D, che, essendo euclideo, è un PID, si ha che I è un ideale principale.
Cosı̀ esisterà un elemento d ∈ I tale che I = (d). Dimostriamo che
d è il cercato M CD(a, b). Intanto, da (a, b) = (d) segue a ∈ (d),
cioè a = λd e b ∈ (d), cioè b = µd, per cui d divide sia a che b.
Inoltre, d = ma + nb per qualche m, n ∈ D in quanto d ∈ (a, b) per
cui se d0 divide sia a che b deve dividere anche ma + nb = d. Cosı̀
5.8. DOMINI EUCLIDEI 207

le due condizioni affinché d risulti il massimo comune divisore di a


e b sono soddisfatte.

Dalla dimostrazione della precedente proposizione segue

Proposizione 5.8.7 (E4) (Identità di Bézout) In ogni dominio


euclideo D, per ogni a, b ∈ D∗ vale l’identità di Bézout, cioè il
massimo comune divisore d = M CD(a, b) si può esprimere come
somma di un multiplo di a e di un multiplo di b, ovvero esistono
m, n ∈ D tali che d = ma + nb.

Notiamo, tuttavia, che non sempre l’esistenza del M CD(a, b)


implica la validità dell’identità di Bézout anche se ciò è vero nei
domini euclidei.
I concetti di numeri primi o irriducibili introdotti nelle Defini-
zioni 2.6.1 e 2.6.2 naturalmente si possono generalizzare al caso di
un dominio qualsiasi.

Definizione 5.8.8 In un dominio D un elemento non nullo e non


invertibile p si dice primo se dal fatto che p divide un prodotto ab
deve dividere almeno uno dei due elementi, cioè o p divide a oppure
p divide b.

Definizione 5.8.9 In un dominio D un elemento non nullo e non


invertibile q si dice irriducibile se se i suoi soli divisori sono gli
invertibili ed i suoi associati, cioè se q = uv ne segue che u è
invertibile oppure v è invertibile.

Come abbiamo visto nell’Osservazione 2.6.3 anche in ogni do-


minio ogni elemento primo è irriducibile. Nei domini euclidei i due
concetti sono equivalenti.
208 CAPITOLO 5. TEORIA DEGLI ANELLI

Proposizione 5.8.10 (E5) In ogni dominio euclideo D, un ele-


mento è irriducibile se e solo se è primo.

Dimostrazione. Abbiamo gıà detto che, in generale, un elemento


primo è irriducibile; si tratta allora di provare che se un elemento
è irriducibile allora è primo. Sia quindi q un elemento irriducibile
in D. Per provare che q è primo dobbiamo verificare che se q divide
ab allora divide almeno uno dei due fattori. Sia allora hq = ab e
supponiamo che q non divida a; allora, per l’irriducibilità di q, il
M CD(a, q), che esiste per il fatto che D è euclideo, deve essere 1 =
M CD(a, q); ma poiché vale anche l’identità di Bézout, 1 = ma+nq.
Moltiplicando ambo i membri della precedente eguaglianza per b si
ha: b = mab+nqb. Dal fatto che q divide ab segue che q divide mab,
poiché q divide banalmente nqb segue che q divide mab + nqb = b.

Osserviamo che alla luce del precedente risultato, in un dominio


euclideo un ideale generato da un elemento irriducibile è primo.
Noi adesso vedremo che in effetti vale qualcosa di più.

Proposizione 5.8.11 Sia D un dominio euclideo e q ∈ D un


elemento irriducibile. Allora l’ideale J = (q) è massimale.

Dimostrazione. Infatti, sia H un ideale di D tale che J / H / D


e verifichiamo che H = J oppure H = D. Poiché D è un dominio
euclideo è anche un PID e quindi anche H sarà principale, cioè
H = (h). Allora
(q) / (h) / D
per cui q = λh, per qualche λ ∈ D; ma dalla irriducibilità di q si
deduce che λ o h deve essere invertibile. Se λ è invertibile allora
h = qλ−1 , cioè h ∈ J e quindi H = J; se h è invertibile allora
H = D.


5.8. DOMINI EUCLIDEI 209

Ricordiamo che in un dominio euclideo la prima condizione as-


serisce che v(a) ≤ v(ab). Allora è interessante chiedersi quando vale
l’eguaglianza. La risposta è la prossima proprietà.

Proposizione 5.8.12 (E6) In un dominio euclideo D si ha v(a) =


v(ab) se e solo se b è invertibile.

Dimostrazione. Supponiamo v(a) = v(ab) e consideriamo l’idea-


le I = (a). Poiché ab ∈ I, ricordato che un ideale di un dominio
euclideo è generato da un elemento di valutazione minima, dal fat-
to che ab ha la stessa valutazione di a segue che ab genera I, cioè
(a) = (ab). In particolare, a ∈ (ab) ovvero a = λab ed essendo D
un dominio, quindi vale la legge di cancellazione, ne segue λb = 1
da cui b è invertibile.
Viceversa, se b è invertibile, dalla prima proprietà della valuta-
zione euclidea si ha

v(a) ≤ v(ab) ≤ v(abb−1 ) = v(a)

ovvero v(a) = v(ab).

Vogliamo concludere questa sezione sui domini euclidei con una


interessante applicazione. Enunciamo un problema che sarà il punto
di partenza della nostra investigazione.

Problema 5.1 Dovendo costruire due piattaforme quadrate abbia-


mo comprato 10 scatole di mattonelle quadrate di 1×1 metro ognuna
contenente 117 mattonelle. Ci chiediamo se sia possibile, ed in che
modo, utilizzare tutte le mattonelle per costruire le due piattaforme
quadrate. Se durante i lavori si rompe una mattonella è possibi-
le ugualmente costruire due piattaforme quadrate con le restanti
mattonelle?
210 CAPITOLO 5. TEORIA DEGLI ANELLI

È chiaro che per affrontare il problema precedente dobbiamo


essere in grado di saper rispondere alla seguente
Domanda. Quali numeri naturali si possono esprimere come
somma di due quadrati?
Vedremo che sapremo rispondere alla precedente domanda uti-
lizzando, in qualche modo, i domini euclidei!
Cominciamo col definire il seguente dominio.

Definizione 5.8.13 Il sottoinsieme dei numeri complessi Z[i] =


{a + ib | a, b ∈ Z} è un dominio, detto il dominio degli interi di
Gauss.

È anche facile verificare qual è il campo delle frazioni del dominio


degli interi di Gauss: precisamente, il campo delle frazioni di Z[i] è
Q[i] = {a + ib | a, b ∈ Q} (verificarlo!).

Proposizione 5.8.14 Z[i] = {a + ib | a, b ∈ Z} è un dominio


euclideo.

Dimostrazione. Consideriamo la seguente applicazione v : Z[i]∗ →


N definita da v(a + ib) = ka + ibk = a2 + b2 e mostriamo che si
tratta di una valutazione euclidea.
Ovviamente, v(a + ib) ≤ v[(a + ib)(c + id)] in quanto

ka + ibk ≤ k(a + ib)(c + id)k = ka + ibkkc + idk

una volta osservato che kc + idk ≥ 1.


Si tratta allora di provare che rispetto a tale valutazione in Z[i]
vale l’algoritmo di divisione. Prendiamo allora x, y ∈ Z[i] con y 6= 0.
Utilizziamo il fatto che Z[i] ⊆ Q[i] e che quest’ultimo è un campo
per considerare xy −1 ∈ Q[i]. Cosı̀ si ha
m p
xy −1 = +i .
n s
5.8. DOMINI EUCLIDEI 211

m
Adesso facciamo una piccola digressione per mostrare che n
(e
quindi anche ps ) si può scrivere nella forma

m h h 1
= u + , con u ∈ Z e ≤ .
n n n 2

Infatti, dall’algoritmo di divisione in Z si ha m = un + h con 0 ≤


|h| < n e quindi m/n = u + h/n con |h/n| < 1. Ora se |h/n| ≤
1/2 abbiamo ottenuto ciò che volevamo, se invece |h/n| > 1/2 da
m/n = u + 1 + h/n − 1 = u0 + h0 /n, avendo posto u0 = u + 1
e h0 = h − n nel caso in cui h/n > 1/2 (ed invece u0 = u − 1 e
h0 = h + n nel caso in cui h/n < −1/2) si ha che |h0 /n| < 1/2 e si
ottiene ugualmente ciò che si voleva.
Applicando quanto detto ad m/n e p/s avremo
   
−1 m p h k h k
xy = +i =u+ +i v+ = (u + iv) + +i
n s n s n s

con u, v ∈ Z e |h/n| ≤ 1/2 e |k/s| ≤ 1/2. Moltiplicando adesso


ambo i membri per y avremo
 
h k
x = (u + iv)y + +i y
n s

posto allora q = u + iv ed r = ( nh + i ks )y avremo la nostra tesi se


proveremo che, se r 6= 0 allora v(r) < v(y). Ed infatti,
"   2 #
2
h k h k
v(r) = + i v(y) = + v(y) ≤
n s n s
 
1 1 1
+ v(y) = v(y) < v(y).
4 4 2


Osserviamo che gli invertibili di Z[i] sono gli elementi di norma 1,


quindi ±1, ±i.
212 CAPITOLO 5. TEORIA DEGLI ANELLI

Torniamo adesso alla domanda precedente ed osserviamo che


5 = 12 + 22 , 17 = 12 + 42 , 41 = 42 + 52 , ecc., cioè vi sono dei
numeri primi che si possono esprimere come somma di due quadrati.
D’altra parte, 3, 7, 23, ecc. non si possono scrivere come somma
di due quadrati. Ed allora cominciamo a rispondere alla domanda
più debole
Domanda. Quali numeri primi si possono esprimere come som-
ma di due quadrati?
Un numero primo p (a parte 2 che è banalmente somma di due
quadrati: 1 + 1) è dispari e quindi diviso per 4 dà resto 1 o 3. Ora
si vede subito che se un primo p > 2 è somma di due quadrati deve
essere del tipo p = 4n + 1: infatti, se p = a2 + b2 , a e b devono
avere diversa parità in quanto se fossero entrambi pari o entrambi
dispari risulterebbe p pari. Pertanto a = 2n e b = 2m + 1, da cui
p = 4n2 + 4m2 + 4m + 1.
Per cui i primi del tipo 4n + 3 non si possono scrivere come
somma di due quadrati. Il resto che segue servirà a provare che
ogni primo della forma p = 4n + 1 è somma di due quadrati.

Teorema 5.8.15 Un numero primo p è somma di due quadrati se


e solo se p è congruo 1 modulo 4, cioè è del tipo p = 4n + 1.

Dimostrazione. C’è solo da provare che ogni primo p = 4n + 1 è


somma di due quadrati. Per far ciò abbiamo bisogno del seguente
risultato (che proveremo nel prossimo lemma): “se p è un primo del
tipo 4n + 1 allora in Zp l’equazione x2 + 1 = 0 ha soluzioni”. Sia
allora [α] ∈ Zp una di tali soluzioni, cioè α2 + 1 = λp; consideriamo
α2 +1 ∈ Z[i], allora λp = (1+iα)(1−iα) cioè p divide (1+iα)(1−iα);
ma chiaramente p non divide nessuno dei due fattori, perché se fosse
p(m + in) = (1 + iα) si avrebbe pm = 1, una ovvia contraddizione.
Pertanto p non è primo in Z[i], ma poiché Z[i] è un dominio euclideo,
p è riducibile in Z[i]. In conclusione p = (a+ib)(c+id) che, passando
alle norme, produce p2 = (a2 + b2 )(c2 + d2 ) con (a2 + b2 ) 6= 1 e
(c2 +d2 ) 6= 1 (in quanto sia (a+ib) che (c+id) non sono invertibili).
5.8. DOMINI EUCLIDEI 213

Quindi (a2 + b2 ) è un divisore di p2 diverso da 1 e p2 (altrimenti


sarebbe (c2 + d2 ) = 1) pertanto (a2 + b2 ) = p (osservare che i soli
divisori di p2 sono 1, p, p2 ).

Lemma 5.8.16 Se p è un primo del tipo 4n + 1 allora in Zp l’e-


quazione x2 + 1 = 0 ha soluzioni.

Dimostrazione. Poniamo α = ( p−12


)! ed osserviamo che p−1
2
= 2n
è un numero pari. Allora si ha

p−1 p−1
α = 1 · 2 · ... · = (−1)(−2) . . . (− )
2 2
per cui in Zp potremo scrivere

p−1 p−1
α = 1 · 2 · ... · = (p − 1)(p − 2) . . . (p − )
2 2
pertanto in Zp avremo

p−1 p+1
α2 = 1 · 2 · . . . · · . . . (p − 2)(p − 1) = (p − 1)! = −1
2 2
dove per l’ultima uguaglianza abbiamo usato il Teorema di Wilson.

Ora che abbiamo scoperto quali sono i numeri primi che si pos-
sono scrivere come somma di due quadrati, per estendere la ricerca
a tutti gli interi, è importante la seguente semplice proprietà.

Proposizione 5.8.17 Se m ed n sono due interi somma di due


quadrati, allora anche mn è somma di due quadrati.
214 CAPITOLO 5. TEORIA DEGLI ANELLI

Dimostrazione. Infatti, se m = a2 + b2 ed n = c2 + d2 allora


m = ka + ibk, n = kc + idk e quindi

mn = ka + ibkkc + idk = k(a + ib)(c + id)k = k(ac − bd) + i(bc + ad)k

ed in definitiva

mn = (ac − bd)2 + (bc + ad)2 .


Alla luce del Teorema 5.8.15 e la Proposizione 5.8.17 segue il
risultato richiesto.

Teorema 5.8.18 Sia n un intero e n = 2h pm 1 m2 mt


1 p2 . . . pt la sua
fattorizzazione. Se per ogni i per cui pi = 4ni + 3 l’intero mi è pari,
allora n è somma di due quadrati.

Dimostrazione. Basta osservare che sotto la suddetta ipotesi


tutti i fattori di n sono somme di quadrati per il Teorema 5.8.15,
la conclusione segue quindi per la Proposizione 5.8.17.

In effetti, si può provare che il Teorema precedente si può inverti-
re, cioè questi sono gli unici interi che si possono esprimere come
somma di due quadrati.
Ritornando al Problema 5.1, si tratta di provare che 1170 è
esprimibile come somma di due quadrati. Ora 1170 = 2 · 32 · 5 · 13
pertanto

1170 = k1 + ikk3kk1 + 2ikk2 + 3ik = k3(1 + i)(1 + 2i)(2 + 3i)k =

= k3(−11 + 3i)k = k − 33 + 9ik = 332 + 92 .


Osserviamo che potrebbe capitare che il numero si possa esprimere
in più maniere come somma di sue quadrati, ad esempio

1170 = k1 + ikk3kk1 + 2ikk2 − 3ik = k3(1 + i)(1 + 2i)(2 − 3i)k =


5.9. DOMINI A FATTORIZZAZIONE UNICA (UFD) 215

= k21 + 27ik = 212 + 272 .


Per quanto riguarda poi il caso in cui si rompe una mattonella,
osserviamo che 1169 è divisibile per 7 ma non per 72 , per cui nella
sua fattorizzazione apparirà il fattore 7 con esponente dispari quindi
non sarà esprimibile come somma di due quadrati.

5.9 Domini a fattorizzazione unica (UFD)


Ricordando la proprietà della fattorizzazione unica studiata in Z
possiamo dare la seguente definizione generale.

Definizione 5.9.1 Un dominio D si dice a fattorizzazione uni-


ca (o UFD) se qualsiasi elemento non nullo e non invertibile in
D si può scrivere come prodotto finito di elementi irriducibili e tale
fattorizzazione è unica a meno dell’ordine e di invertibili.

Diamo una utile caratterizzazione degli UFD.

Teorema 5.9.2 Un dominio D è un UFD se e solo se sono soddi-


sfatte le seguenti due condizioni
1) ogni elemento irriducibile è primo;

2) vale la condizione delle catene ascendenti finite per ideali prin-


cipali, cioè se

(a1 ) ⊆ (a2 ) ⊆ . . . ⊆ (an ) ⊆ . . .

è una catena ascendente di ideali principali, esiste un indice


ν tale che per ogni m ≥ ν si ha (aν ) = (am ).

Dimostrazione. Cominciamo a provare che se D è un UFD sono


soddisfatte le condizioni 1) e 2). Abbiamo già provato la condi-
zione 1) nei domini euclidei, ma stavolta l’ipotesi è più debole (ad
esempio, non è detto che valga l’identità di Bézout). Sia allora q un
216 CAPITOLO 5. TEORIA DEGLI ANELLI

elemento irriducibile e supponiamo che q divida ab, cioè mq = ab.


Dal fatto che D è un UFD segue che a, b, m si possono fattorizzare
in fattori irriducibili (q è già irriducibile), cioè
a = a1 a2 . . . ar ,

b = b 1 b 2 . . . bs ,

m = m1 m2 . . . mt ,
dove gli elementi ai , bi , mi sono irriducibili, per cui

m1 m2 . . . mt q = a1 a2 . . . ar b1 b2 . . . bs

ma per l’unicità della fattorizzazione, q a meno di invertibili deve


essere uno dei fattori del II membro, ovvero deve essere associato
ad uno dei fattori del II membro. Se tale fattore è uno degli ai
allora q dividerà a, se tale fattore è uno dei bi allora q dividerà b,
quindi q o divide a o divide b.
Per provare la condizione 2), premettiamo che in un UFD si
indica con l(a) il numero di fattori irriducibili che compaiono nella
fattorizzazione (unica a meno dell’ordine) di ogni elemento non in-
vertibile a. Osserviamo che se a è multiplo di b, cioè a = λb, si ha
l(a) ≥ l(b).
Allora sia
(a1 ) ⊆ (a2 ) ⊆ . . . ⊆ (an ) ⊆ . . .
una catena di ideali principali, poiché ai è multiplo di ai+1 , si ha
li = l(ai ) ≥ li+1 = l(ai+1 ) cioè si forma una catena discendente
di numeri naturali. Per il buon ordinamento di N tale catena am-
mette il minimo l = min{li }. Diciamo ν l’indice per cui lν = l e
proviamo che se m ≥ ν allora (am ) = (aν ). Infatti, da m ≥ ν segue
(aν ) ⊆ (am ) ovvero aν = λam e quindi l(am ) ≤ l(aν ) = l; ma dalla
minimalità di l segue l(am ) = l(aν ) e questo ci dice che λ è un
invertibile, per cui (am ) = (aν ).
Viceversa, supponiamo che siano soddisfatte 1) e 2) e proviamo
che D è un UFD. Cominciamo a far vedere che ogni elemento a non
invertibile si può esprimere come prodotto di irriducibili.
5.9. DOMINI A FATTORIZZAZIONE UNICA (UFD) 217

Un primo passo (più debole) consiste nel vedere che a ammette


un divisore irriducibile, cioè a = qq 0 con q irriducibile. Infatti, se a
è irriducibile la prova è conclusa; se è riducibile possiamo scrivere
a = q1 b1 con q1 , b1 entrambi non invertibili. Se q1 è irriducibile
la tesi è ottenuta, altrimenti q1 = q2 b2 con q2 , b2 entrambi non
invertibili. Cosı̀ procedendo si costruisce una catena ascendente di
ideali principali

(q1 ) ⊆ (q2 ) ⊆ . . . ⊆ (qt ) ⊆ . . .

ma per la condizione 2) deve esistere un indice n tale che (qn ) =


(qn+1 ) il che comporta qn = qn+1 bn+1 e qn+1 = qn λ da cui qn =
qn λbn+1 ovvero λbn+1 = 1 (dato che siamo in un dominio). Ciò ci
dice che qn era irriducibile e poiché qn è un divisore di a (andare a
ritroso per affermare ciò) abbiamo provato ciò che volevamo.
Utilizzando questa prima parte possiamo provare che a si fat-
torizza in fattori irriducibili ripetendo, grossomodo, lo stesso ra-
gionamento fatto in precedenza. Cioè, se a è irriducibile abbiamo
finito, altrimenti a si può scrivere nella forma q1 b1 dove possiamo
prendere q1 irriducibile per la prova precedente. Se b1 è irriducibile,
siamo riusciti a scrivere a come prodotto di irriducibili, altrimenti
possiamo scrivere b1 = q2 b2 ancora con q2 irriducibile per la prova
precedente. Cosı̀ procedendo si costruisce una catena ascendente di
ideali principali

(b1 ) ⊆ (b2 ) ⊆ . . . ⊆ (bt ) ⊆ . . .

che per la condizione 2) deve stabilizzarsi, cioè deve esistere un


indice n tale che (bn ) = (bn+1 ), il che comporta bn = qn+1 bn+1 e
bn+1 = bn µ, da cui bn = bn µqn+1 ovvero µqn+1 = 1 (dato che siamo
in un dominio). Ciò ci dice che bn era irriducibile. In definitiva
avremo
a = q 1 q 2 . . . q n bn
dove tutti i fattori sono irriducibili.
Per concludere la prova del teorema ci resta da vedere che una
tale fattorizzazione è unica (a meno dell’ordine e di invertibili).
218 CAPITOLO 5. TEORIA DEGLI ANELLI

Consideriamo allora due fattorizzazioni

a = p1 p2 . . . pt = q1 q2 . . . qs ,

dove pi , qi sono irriducibili. Bisogna dimostrare intanto che le lun-


ghezze delle fattorizzazioni sono uguali, cioè t = s. Supponiamo che
t < s; poiché p1 divide il I membro deve dividere il II membro, ma
essendo primo (visto che vale la 1)) deve dividere uno dei fattori del
II membro, diciamo, a meno dell’ordine, q1 . Ma anche q1 è irriduci-
bile, sicché p1 e q1 sono associati, cioè q1 = p1 u1 con u1 invertibile.
Per cui
p1 p2 . . . pt = u1 p1 q2 . . . qs ,
e per cancellazione

p 2 . . . pt = u 1 q 2 . . . qs .

Ripetendo lo stesso discorso per p2 , . . . , pt si perverrà a

1 = u1 u2 . . . ut qt+1 . . . qs .

sicché qt+1 , . . . , qs sarebbero invertibili. Un assurdo. Analogamen-


te, si perviene ad un assurdo se si supponesse s < t. Cosı̀ s = t e
nel corso della dimostrazione abbiamo trovato che, a meno dell’or-
dine, pi e qi sono associati, cioè differiscono per un invertibile. In
definitiva, la fattorizzazione è unica a meno dell’ordine ed a meno
di invertibili.

La precedente caratterizzazione ci permette di provare il seguen-


te risultato.

Teorema 5.9.3 (E7) Ogni PID è UFD. In particolare, ogni do-


minio euclideo è UFD.
5.9. DOMINI A FATTORIZZAZIONE UNICA (UFD) 219

Dimostrazione. Sia D un dominio ad ideali principali, per prova-


re che D è un UFD proveremo che sono soddisfatte le due condizioni
richieste per la caratterizzazione degli UFD.
La prima è banalmente vera in quanto in un PID esiste il MCD
tra due qualsiasi elementi ed inoltre vale l’identità di Bézout e ciò
permette di verificare che ogni elemento irriducibile è primo.
Per verificare la seconda condizione prendiamo una catena ascen-
dente di ideali principali

(c1 ) ⊆ (c2 ) ⊆ . . . ⊆ (ct ) ⊆ . . .


S
e definiamo J = i (ci ). Si verifica facilmente che J è un ideale di
D ed, essendo quest’ultimo un PID, deve esistere un elemento
S che
genera J, diciamo J = (b). Ora dal fatto che b ∈ J = i (ci ) segue
b ∈ (cj ) per qualche j. Ma allora J = (b) ⊆ (cj ) ⊆ J e quindi
(cj ) = J. Per cui, per ogni m ≥ j sarà (cj ) = J ⊆ (cm ) ⊆ J ovvero
(cm ) = (cj ).
La seconda parte della tesi segue dal fatto che ogni dominio
euclideo è un PID (Proposizione (E2)) e quindi è anche un UFD.


Osservazione 5.9.4 I campi sono palesemente dei domini eucli-


dei. Se K è un campo, assegnando l’applicazione v : K ∗ → N
definita da v(x) = 1, per ogni x 6= 0, si ottiene una valutazione
euclidea. Infatti, v(a) ≤ v(ab) perché entrambi valgono 1. Inoltre,
se a, b ∈ K con b 6= 0 possiamo scrivere a = b(b−1 a) per cui vale
l’algoritmo di divisione con q = b−1 a ed r = 0.

Riassumendo, abbiamo visto

campi ⇒ domini euclidei ⇒ PID ⇒ UFD.

Tutte le implicazioni inverse sono false.

• Esistono domini euclidei che non sono campi: Z è il più


semplice di tali esempi.
220 CAPITOLO 5. TEORIA DEGLI ANELLI

• Esistono PID che non sono domini euclidei:√ un esempio sif-


fatto (difficile da verificare) è {a + ib 19 | a, b ∈ Z, a + b ∈
2Z}.

• Esistono UFD che non sono PID: un esempio è dato da Z[x].


Che Z[x] sia un UFD segue dal Teorema di Gauss (che sarà
generalizzato al caso dell’anello dei polinomi a coefficienti in
un UFD). Che Z[x] non sia un PID si vede facilmente pren-
dendo l’ideale I = (2, x) (esso è costituito dai polinomi a
termine noto pari). Che tale ideale non sia principale si vede
supponendo per assurdo che lo sia, per esempio generato da
h(x), ed osservando che in tal caso h(x) dovrebbe dividere sia
2 che x e ciò implicherebbe h(x) = 1 e quindi I = Z[x] il che
è assurdo in quanto non tutti i polinomi hanno termine noto
pari.

Concludiamo la nostra analisi facendo vedere che vi sono domini


che non sono UFD.

• Consideriamo D = {f (x) ∈ R[x] | f 0 (0) = 0} cioè l’insieme dei


polinomi reali che hanno derivata nulla in 0, ovvero i polinomi
del tipo a0 + a2 x2 + a3 x3 + . . . + ad xd . È facile verificare che
D è un dominio. Osservato che x ∈ / D si deduce che x2 e x3
sono elementi irriducibili in D. Eppure essi non sono primi, ad
esempio x2 divide x6 in quanto x6 = x2 x4 , quindi divide x3 x3
ma non divide x3 (attenzione in D non si può scrivere x3 =
x2 x perché x ∈ / D). Analogamente, x3 divide x2 x2 x2 senza
che divida x2 . In definitiva, abbiamo anche trovato due diverse
fattorizzazioni di x6 in fattori irriducibili: x6 = x2 x2 x2 =
x3 x3 .

• Consideriamo adesso il sottoinsieme dei numeri complessi


√ √
Z[i 3] = {a + ib 3 | a, b ∈ Z}.

Anche qui è una facile verifica provare che si tratta di un


dominio. Siccome nei numeri complessi kxyk = kxkkyk si ha
5.10. TEOREMA DI GAUSS 221

che in Z[i 3] gli elementi invertibili sono quelli che hanno
norma 1, cioè a2√+ 3b2 = 1, questo comporta che gli unici √
invertibili di Z[i 3] sono
√ ±1. Allora, prendiamo in Z[i 3]
l’elemento x = 1 + i 3 e proviamo che √ esso è irriducibile
ma non √ è primo. Ciò √
implicherà √che Z[i 3] non è UFD. √ Ora
se 1 +√i 3 = (a√+ ib 3)(c + id 3) avremmo k1 + i 3k =
ka+ib 3kkc+id 3k, cioè 4 = (a2 +3b2 )(c2 +3d2 ). Ma a2 +3b2
non può essere uguale a 2 per cui almeno uno tra (a2 +√3b2 )
e (c2 +√3d2 ) deve valere 1, questo implica √ che o a + ib 3 o
c + id√ 3 è invertibile e quindi 1 + i√ 3 è irriducibile.
√ Ma
1 + i 3 non√ è primo: infatti, da (1 +
√ i 3)(1 − i 3) = 4 segue
che 1 + i 3 divide 2 · 2; ma √ 1 + i 3√ non divide 2, perché se
cosı̀ fosse avremmo (1 + i 3)(x + iy 3) = 2 che passando
alle norme√darebbe 4 = 4 · (x2 + 3y 2 ) cioè√(x2 + 3y 2 ) = 1 per
cui x + iy 3 = ±1, ma ciò darebbe 1 + i 3 = ±2, un palese
assurdo.

5.10 Teorema di Gauss


In quest’ultima sezione, generalizzando quanto provato in Z[x], ci
occuperemo del dominio dei polinomi A[x] dove A è un UFD. In
tutto quel che seguirà, dunque, A sarà un dominio a fattorizzazione
unica.

Definizione 5.10.1 Sia f (x) = a0 +a1 x+a2 x2 +. . .+ad xd ∈ A[x],


si chiama contenuto di f (x) e si denota c(f ), il massimo comune
divisore dei coefficienti, cioè c(f ) = M CD(a0 , a1 , . . . , ad ).
Un polinomio che ha contenuto 1 (ovvero un invertibile) si dice
primitivo.

Osserviamo quindi che un qualunque polinomio f (x) ∈ A[x], si


può scrivere f (x) = c(f ) · g(x) con g(x) primitivo.
Uno dei risultati più importanti per le sue conseguenze nella
fattorizzazione unica dei polinomi è il seguente
222 CAPITOLO 5. TEORIA DEGLI ANELLI

Lemma 5.10.2 (Lemma di Gauss) Se f (x), g(x) ∈ A[x] so-


no polinomi primitivi, allora anche f (x)g(x) è primitivo. Più in
generale, c(f g) = c(f )c(g).

Dimostrazione. La dimostrazione è del tutta analoga a quella


effettuata nel caso in cui A = Z (vedi Lemma 3.4.19).

Essendo A un dominio esso può essere immerso nel suo campo


delle frazioni Q(A). Questa sarà l’idea chiave che porterà al Teore-
ma di Gauss. Intanto, se f (x) ∈ A[x] ⊆ Q(A)[x] e f (x) = c(f )f 0 (x)
e c(f ) 6= 1 allora tale polinomio è riducibile in A[x] mentre potrebbe
essere irriducibile in Q(A)[x] (dipende da f 0 (x)). Questa differen-
za sulla irriducibiltà riguarda però solo i polinomi che non sono
primitivi. Infatti, vale il seguente risultato.

Proposizione 5.10.3 Se f (x) ∈ A[x] è un polinomio primitivo,


allora è irriducibile in A[x] se e solo se è irriducibile in Q(A)[x].

Dimostrazione. Anche in questo caso la prova è analoga a quella


della Proposizione 3.4.20.

Siamo quindi pronti al

Teorema 5.10.4 (Teorema di Gauss) Se A è un UFD allora


A[x] è un UFD.

Dimostrazione. Ripetiamo i passi già fatti nel caso degli interi.


Cominciamo a provare che ogni f (x) ∈ A[x] si può esprimere come
prodotto di polinomi irriducibili. Sia f (x) = c(f )g(x) con g(x)
primitivo. Poiché c(f ) ∈ A si può fattorizzare (in modo unico) come
prodotto di elementi irriducibili, resta da vedere che anche g(x) si
può fattorizzare. Cosı̀ in pratica ci siamo ricondotti a fattorizzare i
5.10. TEOREMA DI GAUSS 223

polinomi primitivi. Ora g(x) ∈ A[x] ⊆ Q(A)[x] e quest’ultimo è un


UFD. Cosı̀ certamente g(x) si fattorizza in Q(A)[x] come prodotto
di polinomi irriducibili (in Q(A)[x]):

g(x) = q1 (x) . . . qt (x)

con qi (x) polinomi irriducibili di Q(A)[x]. Come fatto in Q[x], scri-


viamo qi (x) = abii hi (x) dove hi (x) sono polinomi primitivi di A[x]
irriducibili in Q(A)[x] e quindi anche in A[x], per la proposizione
precedente. Ma allora

b1 . . . bt g(x) = a1 . . . at h1 (x) . . . ht (x)

e uguagliando i contenuti dei due membri si ha a1 . . . at = b1 . . . bt ,


da cui g(x) = h1 (x) . . . ht (x) prodotto di polinomi irriducibili in
A[x].
La unicità segue poi osservando che se g(x) ammettesse due
fattorizzazioni distinte (a meno dell’ordine e di invertibili) in A[x]
esse sarebbero anche due fattorizzazioni di g(x) in Q(A)[x], ma ciò
non può accadere perché Q(A)[x] è un UFD.

Il Teorema di Gauss ci permette di dire che, se K è un campo,
allora K[x, y] e, più in generale, K[x1 , x2 , . . . , xn ] sono UFD. Infat-
ti, essendo K[x] UFD, per il Teorema di Gauss K[x, y] = K[x][y]
è UFD. Ed analogamente, per induzione, K[x1 , x2 , . . . , xn−1 ][xn ]
sarà UFD. Inoltre, sempre per induzione, se A è UFD allora anche
A[x1 , x2 , . . . , xn ] è UFD.

Esempio 5.10.5 Consideriamo i seguenti due polinomi in R[x, y] :


f (x, y) = 2x4 + 7x3 y − 5x2 y 3 + y 2 − y;
g(x, y) = y 5 + 4y 4 x + x2 + 4y 2 + x + 5.

Per studiare l’irriducibilità dei polinomi dell’esempio precedente


riformuliamo il
224 CAPITOLO 5. TEORIA DEGLI ANELLI

Teorema 5.10.6 (Criterio di Eisenstein) Sia f (x) = a0 +a1 x+


a2 x2 + . . . + ad xd un polinomio primitivo di A[x] soddisfacente le
seguenti condizioni:

1. esiste un elemento primo p ∈ A che divide ogni ai per 0 ≤


i < d (e non ad essendo f (x) primitivo);

2. p2 non divide a0 ,

allora f (x) è irriducibile in A[x] (e in Q(A)[x]).

Dimostrazione. Del tutto analoga al criterio studiato nel caso


degli interi.

Torniamo all’Esempio 5.10.5 e vediamo se possiamo applicare


il Criterio di Eisenstein al polinomio f (x, y): in effetti, pensiamo
f (x, y) ∈ R[y][x], f (x, y) = 2x4 +7yx3 −5y 3 x2 +y(y −1); se prendia-
mo l’elemento primo y, esso soddisfa le due condizioni del Criterio
di Eisenstein (y divide tutti i coefficienti ed y 2 non divide y(y − 1)).
Quindi f (x, y) è irriducibile in R[x, y].
Ma questo criterio non si applica sempre, ad esempio per g(x, y)
dell’Esempio 5.10.5. Vediamo di provare un altro criterio che possa
essere usato per g(x, y). Per riformulare il criterio di riduzione pro-
vato nel caso degli interi abbiamo bisogno di fare qualche posizione.
Se P / A è un ideale primo e f (x) = ad xd + ad−1 xd−1 + . . . + a1 x + a0
è un polinomio in A[x], posto ai = ai + P, indicheremo con f (x) =
ad xd + ad−1 xd−1 + . . . a1 x + a0 ∈ (A/P )[x].

Teorema 5.10.7 (Criterio di riduzione modulo un ideale


primo P ) Sia f (x) = ad xd + ad−1 xd−1 + . . . + a1 x + a0 ∈ A[x]
un polinomio primitivo per cui esiste un ideale primo P / A non
contenente ad tale che f (x) ∈ (A/P )[x] sia irriducibile, allora f (x)
è irriducibile in A[x].
5.10. TEOREMA DI GAUSS 225

Dimostrazione. Se per assurdo f (x) fosse riducibile avremmo


f (x) = g(x)h(x) con g(x) e h(x) di gradi positivi, rispettivamente,
m ed n; diciamo g(x) = b0 + b1 x + b2 x2 + . . . + bm xm , h(x) =
c0 + c1 x + c2 x2 + . . . + cn xn . Poiché ad = bm cn ∈
/ P ne segue bm ∈
/P
e cn ∈/ P per cui
f (x) = g(x) · h(x)
con g(x) e h(x) aventi lo stesso grado di g(x) e h(x) il che direbbe
che f (x) ∈ (A/P )[x] è riducibile, contro l’ipotesi.

Ritorniamo all’Esempio 5.10.5 e riprendiamo g(x, y) = y 5 +


4y 4 x + x2 + 4y 2 + x + 5. Consideriamo tale polinomio in R[x, y] =
R[y][x] e prendiamo in R[y] l’ideale primo P = (y) ed osservia-
mo che R[y]/(y) ∼ = R; sicché g(x, y) ∈ R[y]/(y)[x] ∼
= R[x] diventa
2
g(x, y) = x + x + 5 ∈ R[x]. Essendo quest’ultimo irriducibile
possiamo concludere che g(x, y) è irriducibile in R[x, y].
226 CAPITOLO 5. TEORIA DEGLI ANELLI
Referenze

Testi consigliati

- H. Herstein - Algebra - Editori Riuniti.

- G. Piacentini Cattaneo - Algebra - Ed. Zanichelli.

- A. Ragusa - C. Sparacino - Esercizi di Algebra - Ed. Zani-


chelli.

227

Potrebbero piacerti anche