Sei sulla pagina 1di 159

Che cos`e un numero?

Una introduzione allAlgebra

Luca Barbieri Viale

http:/users.unimi.it/barbieri/
Dipartimento di Matematica F. Enriques
Universit`a degli Studi di Milano
c L. Barbieri Viale 2012

LATEX

Indice
1 Insiemi
1.1 Dizionario . . . . . . . .
1.2 Eguaglianza e inclusione
1.3 Esistenza di insiemi . . .
1.4 Operazioni tra insiemi .
1.5 Relazioni e funzioni . . .
2 Numeri
2.1 Numeri naturali . . . . .
2.2 Insiemi finiti . . . . . . .
2.3 Funzioni di scelta . . . .
2.4 Insiemi infiniti . . . . . .
2.5 Relazioni di equivalenza
2.6 Numeri interi e razionali

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

9
9
10
10
11
16

.
.
.
.
.
.

26
26
33
35
42
44
47

3 Ordini
3.1 Relazioni dordine . . . .
3.2 Insiemi ben ordinati . .
3.3 Insiemi completi . . . . .
3.4 Reticoli . . . . . . . . .
3.5 Insiemi continui . . . . .
3.6 Numeri reali e complessi

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

54
54
56
59
61
63
65

4 Aritmetica
4.1 Divisione . . . .
4.2 Congruenze . .
4.3 Equazioni . . .
4.4 Numeri primi .
4.5 Numeri p-adici

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

71
71
77
80
84
89

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

5 Strutture
93
5.1 Gruppi, anelli e campi . . . . . . . . . . . . . . . . . . . . . . 93
5.2 Alcune propriet`a notevoli . . . . . . . . . . . . . . . . . . . . . 101
5.3 Anelli di polinomi . . . . . . . . . . . . . . . . . . . . . . . . . 115

5.4
5.5
5.6

Anelli euclidei . . . . . . . . . . . . . . . . . . . . . . . . . . . 121


Numeri algebrici . . . . . . . . . . . . . . . . . . . . . . . . . 132
Moduli e algebre . . . . . . . . . . . . . . . . . . . . . . . . . 137

A Appendici
A.1 Buon ordinamento . . . . . .
A.2 Numeri ordinali . . . . . . . .
A.3 Universi e insiemi ben fondati
A.4 Categorie e funtori . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

143
143
145
147
151

Ringraziamenti
Desidero innanzitutto ringraziare amici e colleghi che hanno contribuito anche a loro insaputa alla composizione di questo libro. In particolare F. Andreatta, A. Bertapelle, C. Bartocci, M. Bertolini, M. Bianchi, F. Binda, B.
Chiarellotto, A. Conca, S. Mantovani, C. Mazza, E. Pacifici e A. Vezzani
che hanno pazientemente letto versioni preliminari e apportato migliorie con
i loro commenti. Chiaramente imprecisioni o manchevolezze che dovessero
ancora esser presenti sono responsabilit`a dellautore.
Desidero anche ringraziare tutti gli studenti che hanno costantemente stuzzicato e stimolato la redazione di questo testo; mi `e sembrato infine assolutamente necessario scrivere questo libro proprio per loro. In particolare,
ricordo uno studente che dopo aver scoperto che `e necessario assumere lesistenza di un insieme infinito si `e presentato alla fine della lezione con la
domanda: Ma allora la matematica cos`e? Che cosa sono i numeri? Proprio con questa domanda ho deciso di intitolare un libro dedicato a questa
condivisibile preoccupazione.
Desidero infine ringraziare Raffaella per avermi sempre aiutato in tutti i modi
e per la sua infinita pazienza, nellavermi sopportato mentre vagavo distratto
pensando a questo libro tante (troppe!) volte negli ultimi tempi.

Milano, 1 Ottobre 2012

Prefazione
Queste pagine raccolgono e sviluppano le note della parte teorica del corso
di Algebra per gli studenti del primo anno di Matematica a Milano dal 2008.
Da queste note ho deciso di estrarre e ricomporre un testo introduttivo che
mantiene uno stile espositivo informale. Un testo da intendere come una
raccolta di concetti essenziali che possa ben essere utilizzato come compendio delle lezioni in aula ma che possa anche esser riutilizzato, nel corso del
processo di maturazione del giovane matematico o del filosofo o per chi si
accosta per puro diletto al potente richiamo dellalgebra. Un testo che costituisce un invito allastrazione ma che non richiede conoscenze matematiche
preliminari: ho scelto di procedere alla costruzione delledificio matematico
a partire dalla esposizione dei materiali che lo costituiscono.
Il libro, fedelmente alle note originali, si sviluppa idealmente in tre fili del discorso che sintrecciano tra loro: il primo affronta i fondamenti e il linguaggio
della matematica come appare nella teoria deglinsiemi e nellalgebra categoriale, il secondo sviluppa le problematiche elementari che scaturiscono dalla
semplice esistenza dei numeri come si sono presentate nella storia, con laritmetica e la teoria dei numeri, e il terzo conduce direttamente allalgebra
astratta presentando le sue principali strutture, alcuni risultati e soprattutto
i metodi.
Senza necessariamente affrontare in modo formale e sistematico la teoria assiomatica degli insiemi ho ritenuto necessario trattare con cura il linguaggio
degli insiemi sul quale si basa la matematica moderna. Nella prima parte
affronteremo appunto il concetto di insieme e le principali costruzioni insiemistiche segnalando brevemente gli assiomi (dovuti storicamente a Ernst
Zermelo e riportati in nota) che permettono di concepire gli insiemi in modo
intuitivo e che garantiscono lesistenza di alcuni insiemi fondamentali.
Il contesto assiomatico in cui opera il matematico non `e da considerare come
un paradigma chiuso ma piuttosto una scatola che potrebbe essere parte di
unaltra scatola. Si potrebbe dire che il rapporto del matematico con gli
assiomi `e dialettico, forse strumentale; una teoria matematica sviluppa un
discorso deduttivo a partire da alcune premesse e poco importa al matematico delle premesse. Il ragionamento che si distingue per la sua eleganza ecco
lassoluta bellezza della matematica. In favore di questa eleganza che com-

prende innanzitutto la versatilit`a si esprime la forza creativa del matematico.


Bellezza come quella che ci svela che dalla nozione di insieme, sinonimo di
aggregato, scaturiscono i numeri come Richard Dedekind gi`a nel 1887 dimostra chiaramente attraverso la sua nozione dinsieme infinito anticipando il
sistema di assiomi introdotto poi da Peano; ecco cosa dice nella prefazione
alla prima edizione del suo Was sind und was sollen die Zahlen? ovvero
Cosa sono i numeri e cosa dovrebbero essere?
I numeri sono libere creazioni della mente umana. Servono come mezzi
per apprendere pi`
u facilmente e precisamente le differenze tra le cose.
Solamente attraverso il processo puramente logico di costruzione della
scienza dei numeri e quindi acquisendo il numero nel continuo noi siamo correttamente preparati a investigare le nostre nozioni di spazio e
tempo mettendole in relazione con questo numero creato nella nostra
mente. Se esaminiamo accuratamente cosa viene fatto nel contare un
aggregato o numero di cose, giungiamo a considerare labilit`a della
mente a mettere in relazione oggetti con oggetti, facendo corrispondere una cosa con unaltra, unabilit`a senza la quale nessun pensare `e
possibile.

Un punto di vista che ci permette di scoprire le fondamentali propriet`a elementari dei numeri naturali come semplici propriet`a di particolari insiemi.
Propriet`a aritmetiche che si trasmettono ai numeri interi, razionali, reali e
complessi. Inoltre, mediante lo studio deglinsiemi ordinati, possiamo agilmente giungere al concetto di insieme continuo e alla costruzione dei numeri
reali, secondo Dedekind.
Analogamente, scopriamo che lintroduzione delle principali strutture algebriche permette di caratterizzare e classificare questi numeri e le loro propriet`a.
Ad esempio, possiamo dimostrare lunicit`a dei numeri interi mostrando che
esiste un solo anello ordinato con elementi positivi un insieme ben ordinato.
Inoltre, scopriremo altri numeri ancora; numeri che sono intimamente connessi a propriet`a aritmetiche non elementari. Ad esempio, gli interi di Gauss.
Considerando proprio questi altri numeri che si comportano come gli interi
giungiamo a considerare parallelamente altre strutture algebriche preposte a
trattarne loro propriet`a. Ad esempio, il concetto di ideale e infine quello di
modulo.

Finalmente, possiamo quindi considerare compiuto questo libro proprio quando iniziamo ad addentrarci nel nostro principale argomento di ricerca: lalgebra. Per rispondere alla domanda da cui siamo partiti penso di poter
affermare che lalgebra `e proprio la risposta a che cos`e un numero e che dunque questa domanda ha avuto molte risposte e ancora molte se ne troveranno!
Non posso concludere questa breve introduzione senza aggiungere alcune note per i lettori pi`
u volenterosi e giustamente diffidenti.
Lo stile adottato in questo libro `e saggistico non manualistico; ad esempio,
gli esercizi che si trovano opportunamente raccolti ed evidenziati in tutti i
manuali rispettabili qui si nascondono allinterno del testo quasi ovunque.
Per seguire il filo del discorso `e indispensabile rispondere a molti perch`e che
sono evidenziati e molti altri che non lo sono. Per la comprensione (ovvero la
digestione) di questo libro `e quindi indispensabile molto esercizio (ovvero un
buon addestramento alla produzione di acidi gastrici) e solamente lesercizio
render`a consapevoli (di quel che non si digerisce).
In conclusione, leggere questo libro significa innanzitutto completarlo in tutte
le sue volute omissioni e poi estenderlo nelle sue articolazioni: non penso
che questo debba necessariamente avvenire nel corso di una sola lettura.
Suggerisco di non cedere alla tentazione di voler capire tutto subito come di
non farsi prendere dal panico di non riuscire a capire: le principali difficolt`a in
matematica sono di natura psicologica. Acquisire maggiore consapevolezza
permette di capire che cosa non `e chiaro e diventando pi`
u saggi si dissolvono
gli ostacoli mentali che impediscono di pensare deducendo semplicemente e
liberamente.

1 INSIEMI

Insiemi

Si dice insieme una collezione di oggetti che si dicono elementi dellinsieme. Si assume che un insieme sia determinato in modo univoco dai suoi
elementi. Si potrebbe disquisire a lungo su questa definizione e in particolare
sul concetto di elemento ma in un primo approccio consideriamo esclusivamente la teoria degli insiemi standard (di Zermelo-Fraenkel). Ai lettori pi`
u
appassionati consigliamo di consultare parallelamente lAppendice A.4 che
indica come sia possibile trattare gli insiemi distintamente dai loro elementi.

1.1

Dizionario

Facciamo nel seguito abbondante e proficuo utilizzo dei seguenti simboli che
elenchiamo con la loro traduzione:
def

la notazione X = {, . . .} definisce linsieme X mediante la lista {, . . .}


il simbolo di appartenenza traduce `e un elemento di come X
traduce per ogni e si chiama anche quantificatore universale
traduce esiste e si chiama anche quantificatore esistenziale
il simbolo dimplicazione traduce se . . . allora . . .
& traduce la congiunzione e e infine | traduce tale che
Adotteremo anche la notazione 6 come @ per tradurre non `e un elemento
di e non esiste (questo sottintende lesistenza di un simbolo di negazione).
Infine, ! traduce esiste ed `e unico. Ad esempio, per esercizio, potete
tradurre
x X x Y & ! y Y | y
/X
Osserviamo per`o che `e superfluo e quindi spesso lo ometteremo.
Nel seguito, con proposizione o propriet`a P intendiamo esattamente una
espressione di questo tipo. Indichiamo inoltre con P Q lequivalenza logica
di proposizioni P e Q che risulta dalla validit`a simultanea delle implicazioni
P Q e Q P.

1 INSIEMI

1.2

10

Eguaglianza e inclusione

Il primo fondamentale assioma1 ci consente di affermare che un insieme `e


univocamente determinato dai suoi elementi. Secondo questo assioma due
insiemi X e Y sono uguali se valgono simultaneamente x X x Y e
y Y y X. Questo si pu`o tradurre anche con x X x Y ovvero
con lequivalenza logica tra lessere un elemento di X e lessere un elemento
di Y . Con il simbolo = traduciamo coincide con e con 6= traduciamo `e
diverso da sia per gli insiemi che per gli elementi di un insieme. Scriviamo
dunque X = Y se due insiemi sono uguali e X 6= Y se non sono uguali.
Risulta spesso conveniente separare le due implicazioni per comprendere se
due insiemi sono o non sono uguali.
Mediante il simbolo di inclusione indichiamo
X Y se vale x X x Y
In questo caso, diciamo anche che X `e un sottoinsieme di Y . Dunque si ha
che X = Y se e solo se si ha X Y e Y X. Un sottoinsieme X di Y tale
che X 6= Y si dice sottoinsieme proprio e si denota con il simbolo X Y
dinclusione stretta.

1.3

Esistenza di insiemi

Una questione non del tutto trascurabile `e quella della esistenza di insiemi e
dellesistenza dinsiemi costruiti a partire da altri insiemi.
Si assume lesistenza dinsiemi elementari2 ovvero dellinsieme vuoto che
`e un insieme senza elementi e dellinsieme singoletto o singleton che `e
un insieme con un solo elemento come {} linsieme che ha come elemento linsieme vuoto. In effetti, dati due insiemi X e Y si assume lesistenza
dellinsieme {X, Y }. Ad esempio, lesistenza dellinsieme {, {}} `e cos` garantita.
Il fondamentale assioma di specificazione3 consente di affermare lesistenza
di un insieme costituito dagli elementi di un altro insieme che soddisfano una
1

Axiom der Bestimmtheit


Axiom der Elementarmengen
3
Axiom der Aussonderung
2

1 INSIEMI

11

qualunque propriet`a. In altre parole, dato un insieme X esiste sempre un


insieme
def
A = {x X | x verifica P }
costituito da elementi x di X tali che verificano una propriet`a P (espressa
da una proposizione con termini gli elementi di insiemi). Tale insieme A `e
un sottoinsieme di X ed `e unico per quanto detto sopra.
Ad esempio, linsieme singoletto X = {} se esiste `e unico in quanto il
pallino `e il suo elemento costitutivo. Dato X = {} si ottiene linsieme
vuoto = {x X | x 6= } per lassioma di specificazione.

Attenzione! Sia X un insieme e sia P la propriet`a di non appartenere


a se stessi. Dunque, per lassioma di specificazione, esiste linsieme
def

A = {x X | x
/ x}
Per costruzione si ha:
y A y X e inoltre y
/y
Supponendo che A A si ha che A X ma pure che A
/ A: assurdo! Dunque A
/ A e quindi A
/ X. Infatti: supponendo A X e A
/ A si ottiene
che A A: assurdo!
Linsieme X `e completamente arbitrario e a partire da questo insieme abbiamo costruito un insieme A che non appartiene a X.
Se X fossero tutti gli insiemi si avrebbe cos` un insieme A che non appartiene
a X: assurdo! Se ne deduce che tutti gli insiemi non sono un insieme! Per
ovviare a questo inconveniente si pu`o introdurre il concetto di universo
(il lettore interessato trova nellAppendice A.3 una ulteriore discussione su
questo argomento).

1.4

Operazioni tra insiemi

Le seguenti costruzioni insiemistiche costituiscono le operazioni elementari mediante le quali `e possibile esprimere concetti e strutture matematiche

1 INSIEMI

12

pi`
u elaborate. Ad esempio, vedremo come il concetto di numero si esprime
operando con insiemi.
Unione e intersezione
Indichiamo come unione di due insiemi X e Y linsieme
def

X Y = {z X oppure z Y }
Si osserva che dati insiemi X, Y e Z valgono le seguenti propriet`a
X Y =Y X
(X Y ) Z = X (Y Z)
X X =X
se X Z e Y Z allora X Y Z
Da questa ultima proposizione segue che lunione di due insiemi dati `e il pi`
u
piccolo insieme contenente gli insiemi dati. Infatti, X X Y ma anche
Y X Y e se x X Y allora x X oppure x Y ma allora x Z
assumendo che X Z e Y Z.
Analogamente, indichiamo come intersezione di due insiemi X e Y linsieme
def

X Y = {z X Y | z X pure z Y }
Si ha che X Y X Y . Due insiemi si dicono disgiunti se X Y = . Si
osserva che dati insiemi X, Y e Z valgono le seguenti propriet`a
X Y =Y X
(X Y ) Z = X (Y Z)
X X =X
se Z X e Z Y allora Z X Y

1 INSIEMI

13

Dunque lintersezione di due insiemi dati `e il pi`


u grande insieme contenuto
negli insiemi dati.
Iterando le operazioni di intersezione e unione si pu`o definire lunione e
lintersezione di tre o pi`
u insiemi. A questo fine `e utile considerare una
famiglia dinsiemi ovvero un insieme F = {X, Y, . . .} dove i suoi elementi
sono a loro volta insiemi. Assumiamo che siano insiemi
[
\
X
X
XF

XF

le unioni e intersezioni di tutti gli insiemi X F. Osserviamo che lesistenza


dellunione `e garantita dallassioma dellunione4 e lesistenza dellintersezione
segue dallassioma di specificazione.
Si utilizza spesso la notazione {Xi }iI per indicare una famiglia dinsiemi al
variare di i I in un insieme di indici. Si denotano cos`
[
\
Xi
Xi
iI

iI

le corrispondenti unioni e intersezioni.


Insieme delle parti
In particolare, abbiamo una famiglia naturalmente associata a ogni insieme
X ovvero la famiglia costituita da tutti gli insiemi Y tali che Y X `e un
sottoinsieme di X. Denotiamo
def

P(X) = {Y | Y X}
e assumiamo5 che sia un insieme. Ad esempio, P() = {} e P({}) =
{, {}}. Inoltre X Y P(X) P(Y ) e si vede facilmente che
[
X=
Y
Y P(X)
4
5

Axiom der Vereinigung


Axiom der Potenzmenge

1 INSIEMI

14

Una partizione di un insieme X `e una famiglia F dinsiemi disgiunti a


coppie (ovvero per cui A B = per ogni A, B F non vuoti e distinti)
tale che
[
X=
A
AF

Ad esempio, P(X) non `e una partizione di X ma sia {{a}}aX P(X) la


famiglia dinsiemi costituita di singoli elementi di X. Si vede facilmente che
`e una partizione di X
[
X=
{a}
aX

Insieme differenza
Una importante operazione tra insiemi `e linsieme differenza o il complementare
di un insieme Y in un insieme X che denotiamo
def

X \ Y = {x X | y
/ Y}
Si ha che X \ Y X e Y X \ Y = . Si noti che se Y X allora
X = Y X \ Y `e una partizione di X e viceversa. Infine, si ha che X \ Y =
se e solo se X Y .
Seguono le seguenti formule la cui verifica `e un facile esercizio.
Proposizione 1.1 Siano A, B e C insiemi. Si ha
(A B) C = (A C) (B C)
(A B) C = (A C) (B C)
A \ (B C) = A \ B A \ C
A \ (B C) = A \ B A \ C
Le ultime che coinvolgono il complementare (sono anche dette Leggi di de
Morgan e) si possono anche formulare, pi`
u in generale, come segue:
Proposizione 1.2 Sia X un insieme, A X e sia F P(X). Allora
\
[
A\
B=
A\B
BF

A\

[
BF

BF

B=

\
BF

A\B

1 INSIEMI

15

Insieme prodotto
Il prodotto di due insiemi X e Y che denotiamo
def

X Y = {(x, y) | x X y Y }
`e linsieme delle coppie ordinate ed `e unaltra importante operazione tra
insiemi. Dati x X e y Y elementi di due insiemi fissati denotiamo con
def

(x, y) = {{x}, {x, y}}


linsieme coppia ordinata (secondo Kuratowsky). Questo insieme esiste
grazie allassioma sullesistenza di insiemi elementari. Si vede che:
(x, y) 6= (y, x) se x 6= y in quanto {x} (x, y) ma {x} 6 (y, x)
(x, x) = {{x}, {x, x}} = {{x}, {x}} = {{x}}
(x, y) = (x0 , y 0 ) se e solo se x = x0 e y = y 0
Lesistenza del prodotto `e garantita in quanto sottoinsieme di P(P(X Y )).
Infine si ha:
[ [
X Y =
{(x, y)}
xX yY

Notare che X = X = mentre X Y 6= Y X in generale anche


se a ciascun (x, y) corrisponde un unico (y, x) e viceversa. Ad esempio, se
denotiamo 0 = , 1 = {0} e 2 = {0, 1} si vede che 1 2 = {(0, 0), (0, 1)}
mentre 2 1 = {(0, 0), (1, 0)}.
Insieme somma
Per un qualunque insieme X fissato vediamo che
X {} X {?} =
per =
6 ? e ogni scelta di un singoletto anche se gli elementi (x, ) X {}
sono sempre tanti quanti gli elementi x X. Inoltre, si ha che linsieme
X {} X {?} = X {, ?}
realizza due copie disgiunte dellinsieme X.

1 INSIEMI

16

La somma o unione disgiunta di due insiemi X e Y `e linsieme


def

X ] Y = X {} Y {?}
Si ha che X ] X = X {, ?} 6= X = X X. Notare che e ? sono
solo etichette ausiliarie che sono scelte per distinguere insiemi identici. Per
una famiglia dinsiemi distinti F possiamo semplicemente definire linsieme
somma come
X def [
X=
X {X}
XF

XF

Per qualunque famiglia {Xi }iI possiamo anche definire linsieme somma
X def [
Xi =
Xi {i}
iI

iI

Sorge naturale lesigenza di confrontare tutti questi insiemi.

1.5

Relazioni e funzioni

Come abbiamo appena visto, sorge naturalmente la necessit`a di associare


elementi di insiemi diversi. Ad esempio, i due singolettti X = {x} e Y = {y}
sono insiemi disgiunti e sono tali che X Y = {x, y} ha esattamente tanti
elementi quanti X ] Y = {(x, ), (y, ?)} ed `e evidente come associare gli elementi di un insieme a quelli dellaltro.
Una relazione tra due insiemi X e Y `e definita da R X Y un qualunque
sottoinsieme del prodotto. Si scrive anche xRy se (x, y) R e si dice che x
e y sono associati mediante R.
Ad esempio, se X Y 6= possiamo definire una relazione R = {(x, y) |
x, y X Y }. In questo caso, se x X \ X Y allora (x, y) 6 R per ogni
y Y e quindi non associo nessun y a x mediante R. Mentre se x X Y
si ha che xRy per ogni y X Y .
Funzioni
Una funzione o applicazione tra due insiemi X e Y `e una relazione che associa ad ogni elemento x X uno e un solo elemento y Y . Linsieme X si
dice dominio e linsieme Y codominio della funzione (assumiamo dunque

1 INSIEMI

17

che la funzione sia sempre definita). Se denotiamo tale relazione con 7 si ha


che x 7 y dove y Y `e lunico elemento associato ad x X.
La notazione universalmente adottata per una funzione `e f : X Y che
traduce ad x X si associa y Y mediante f ovvero significa che x 7 y
sono in relazione e possiamo scrivere semplicemente y = f (x) in questo caso.
Chiaramente questo sottintende che f sia una legge o una proposizione
che applicata a ciascun elemento di X permette di ottenere elementi di Y .
In altre parole, una relazione R X Y `e una funzione se:
x X (x, y) R
se (x, y) R e (x, y 0 ) R allora y = y 0
Nella notazione x 7 f (x) il corrispondente sottoinsieme di X Y si denota
def

f = {(x, y) X Y | y = f (x)} X Y
e si dice grafico della funzione f : X Y . Se X = Y denotiamo con
idX : X X la funzione identit`a che associa x 7 x con grafico
def

X = {(x, x) | x X} X X
Inoltre, si denota
def

Y X = {f : X Y | f funzione} = {R X Y | R = f }
linsieme di tutte le funzioni con dominio X e codominio Y (`e un insieme per
lassioma di specificazione).
Ad esempio, per ben comprendere il concetto di funzione, osserviamo che se
1 = {} (o un qualunque singoletto) esiste ununica funzione f : X 1 e
dunque 1X `e un singoletto; mentre una funzione f : 1 X `e unicamente
determinata dalla scelta di x X e viceversa, quindi X 1 ha tanti elementi
quanti X. Osserviamo infine che se X = esiste ununica funzione Y
ovvero la funzione vuota ovvero con grafico linsieme vuoto.
Un altro esempio notevole di funzione `e
{ } : X P(X)

1 INSIEMI

18

che associa x 7 {x} con x X. Infatti, la proposizione che si applica agli


elementi x X `e quella di formare il singoletto {x} che `e un elemento di
P(X) associato in modo unico ad x. Se X = si ottiene cos` lunica funzione
0 1 dove 0 = e 1 = P().
Immagine e controimmagine
Sia f : X Y una funzione. Dato A X si dice immagine di A mediante
f linsieme
def
f (A) = {y Y | y = f (a) a A} Y
Se A = {a} allora f ({a}) = {f (a)}. Si dice immagine di f linsieme
def

Im f = f (X) = {f (x) | x X}
Dato B Y si dice controimmmagine o immagine inversa di B mediante
f linsieme
def
f 1 (B) = {x X | f (x) B}
Se B = {b} si ha f 1 ({b}) = {x X | f (x) = b}. Associando y 7
def
f 1 (y) = f 1 ({y}) si ottiene una funzione
f 1 : Y P(X)
ma `e ben possibile che f 1 (y) = come f 1 (y) = X. Nel primo caso si ha
che y Y \ f (X) e nel secondo caso si ha che f (x) = y per ogni x X
ovvero che f `e una funzione costante.
Abbiamo effettivamente due funzioni indotte tra gli insiemi delle parti. La
prima
f : P(X) P(Y )
def

che associa A 7 f (A) = f (A) a un sottoinsieme di X la sua immagine in Y .


La seconda
f : P(Y ) P(X)
def

che associa B 7 f 1 (B) = f (B) a un sottoinsieme di Y la sua controimmagine in X.

1 INSIEMI

19

Funzioni surgettive
Diciamo che una funzione f : X Y `e surgettiva se f (X) = Y . Siccome
f (X) Y si ha che f `e surgettiva se e solo se Y f (X) ovvero
y Y x X | f (x) = y
ovvero f 1 (y) 6= per ogni y Y . Denotiamo f : X
Y una funzione
surgettiva. Ad esempio, le funzioni p : X Y X tale che p(x, y) = x e
q : X Y Y tale che q(x, y) = y sono surgettive (con Y e X non vuoti
rispettivamente).
Funzioni iniettive
Diciamo che una funzione f : X Y `e iniettiva se x 6= x0 implica che
f (x) 6= f (x0 ) ovvero
x, x0 X f (x) = f (x0 ) x = x0
Denotiamo f : X , Y una funzione iniettiva. In termini di controimmagine f iniettiva se e solo se y Y si ha che f 1 (y) `e un singoletto oppure
f 1 (y) = . Ad esempio, le funzioni i : X X ] Y tale che i(x) = (x, ) e
j : Y X ] Y tale che j(y) = (y, ?) sono iniettive.
Chiaramente i e j non sono surgettive per Y e X non vuoti mentre p e q non
sono iniettive se Y e X non sono singoletti.
Funzioni bigettive
Diciamo che una funzione f : X Y `e bigettiva se `e sia surgettiva che
iniettiva ovvero
y Y ! x X | f (x) = y
In questo caso abbiamo che {x} = f 1 (y) e quindi associando y 7 x si
ottiene una funzione
f 1 : Y X

detta funzione inversa della funzione f . Denotiamo f : X Y una funzione bigettiva.

1 INSIEMI

20

Si ha che p : X 1 X come i : X X ] 0 sono esempi paradigmatici


di funzioni bigettive. Inoltre, osserviamo che esiste sempre una funzione
surgettiva
f :X ]Y
X Y
tale che (x, ) 7 x e (y, ?) 7 y ma f non `e iniettiva se (e solo se) X Y 6= .
Se X Y = ovvero X e Y sono insiemi disgiunti allora f `e bigettiva e la
funzione inversa
f 1 : X Y X ] Y
`e tale che x 7 (x, ) se x X mentre y 7 (y, ?) se y Y (questa ultima
funzione non esiste se gli insiemi non sono disgiunti).
Infine, si vede facilmente che la funzione { } : X , P(X) `e iniettiva ma
non surgettiva. Limmagine di { } `e la partizione {{x}}xX . Una qualunque famiglia {Xi }iI di sottoinsiemi di X si ottiene come immagine di una
funzione
: I P(X)
def

dove sintende Xi = (i) al variare di i I in un insieme di indici. Il seguente


importante ma elementare risultato stabilisce che la famiglia P(X) non pu`o
essere ottenuta come una famiglia con X come insieme di indici.
Teorema 1.3 (Cantor) Sia X un insieme. Non esistono funzioni surgettive
f : X P(X) (e in particolare non esistono bigettive).
def

Dimostrazione: Supponniamo che esista una tale f surgettiva. Sia B = {x


X | x 6 f (x)} X e quindi B P(X). Siccome f `e surgettiva esiste un
elemento b X tale che f (b) = B. Se b B allora b 6 f (b) = B che `e
assurdo! Se b 6 B = f (b) per definizione b B che `e assurdo!

Una interpretazione suggestiva dellinsieme delle parti `e la seguente. Sia X


un insieme e sia 2 = {0, 1} linsieme che abbiamo gi`a considerato. Ciascuna
funzione f : X 2 determina in modo univoco f 1 (1) P(X). Associando
def
f 7 f 1 (1) = (f ) si ottiene una funzione

: 2X P(X)

1 INSIEMI

21

che risulta bigettiva. Infatti, dato Y P(X) esiste ed `e unica la funzione


Y : X 2 tale che

1 xY
def
Y (x) =
0 x 6 Y
La funzione Y : X 2 si dice funzione caratteristica di Y in X. In altre
parole, si ha che 1
Y (1) = Y e quindi (Y ) = Y ovvero linversa
1 : P(X) 2X
`e proprio la funzione che associa Y 7 Y per ciascun Y P(X).
Funzioni composte
Siano f : X Y e g : Y Z funzioni con il dominio di g che coincide
con il codominio di f . La funzione composta `e la funzione gf : X Z che
def

associa x 7 f (x) 7 g(f (x)) = gf (x) per x X. In altre parole, si ha un


diagramma
X

gf

/Y
(

Osserviamo che se X = Y e f = idX allora gidX = g e che se Y = Z e g = idY


allora idY f = f . Per ogni f : X Y si ha dunque che f idX = idY f = f .
Inoltre abbiamo che se f : X Y , g : Y Z e h : Z S sono tre funzioni
allora h(gf ) = (hg)f . Ad esempio, se f : X X `e una funzione allora
def
def
def
possiamo considerare f 0 = idX , f 1 = f , f 2 = f f , etc.

Se f : X , Y `e iniettiva allora f : X f (X) `e bigettiva e la gf si dice


restrizione di g : Y Z a X e si denota con g|X . Ad esempio, per ogni
sottoinsieme X Y si ha X , Y definita da x 7 x iniettiva e dunque
g|X : X Z. Se f : X Y non `e iniettiva allora f : X
f (X) `e solo surgettiva e si ottiene f componendo con f (X) Y . In questo caso abbiamo
g|f (X) : f (X) Z la restrizione di g allimmagine di f .
Si verifica immediatamente che:
f e g iniettive gf iniettiva
f e g surgettive gf surgettiva

1 INSIEMI

22

Inoltre si ha:
Lemma 1.4 Siano f : X Y e g : Y Z funzioni.
(a) gf iniettiva f iniettiva
(b) gf surgettiva g surgettiva
Dimostrazione: (a) Siano x, x0 X tali che f (x) = f (x0 ) e quindi g(f (x)) =
g(f (x0 )) da cui x = x0 in quanto gf iniettiva.
(b) Per ogni z Z esiste x X tale che gf (x) = g(f (x)) = z in quanto gf
surgettiva e dunque y = f (x) Y `e tale che g(y) = z.

Funzioni invertibili
Diciamo che una funzione f : X Y `e invertibile se esiste g : Y X tale
che gf = idX e f g = idY . Se tale g esiste `e unica. Infatti, supponiamo che
esista anche g 0 tale che g 0 f = idX e f g 0 = idY da cui si ha
g = idX g = (g 0 f )g = g 0 (f g) = g 0 idY = g 0
Proposizione 1.5 Una funzione f `e invertibile se e solo se f `e bigettiva.
Linversa f 1 `e unicamente determinata da f e viceversa. La composta gf
di invertibili `e invertibile e si ha (gf )1 = f 1 g 1 .
Dimostrazione:
Se f : X Y `e invertibile allora gf = idX iniettiva da
cui f iniettiva e f g = idY surgettiva da cui f surgettiva. Viceversa, se f
bigettiva allora esiste ed `e unica linversa f 1 che verifica f 1 f = idX e
f f 1 = idY . Sia g : Y Z invertibile, la composta gf : X Z `e tale che
f 1 g 1 gf = f 1 f = idX e inoltre gf f 1 g 1 = gg 1 = idZ .

Per una qualunque funzione f : X Y considerando la funzione indotta


sugli insiemi delle parti f : P(Y ) P(X) possiamo riassumere quanto
detto con un diagramma
Y
f 1

{ }

P(Y )

f 1

%
{ }

/ P(X)

1 INSIEMI

23

dove f 1 : Y P(X) esiste sempre (e risulta essere la funzione composta


/ X esiste se e solo se f `
come indicato) mentre f 1 : Y
e invertibile.
Inoltre si ha f : P(X) P(Y ) e le composte
f f : P(Y ) P(Y ) tale che f f (B) = f (f 1 (B)) B
f f : P(X) P(X) tale che A f 1 (f (A)) = f f (A)
per ogni A P(X) e B P(Y ). Notare che f preserva le inclusioni ovvero
se B B 0 allora f (B) f (B 0 ) inoltre (idX ) = idP(X) e (gf ) = f g
per g : Y Z. Analoghe propriet`a valgono per f ma in questo caso si ha
(gf ) = g f .
Proposizione 1.6 La funzione f `e invertibile se e solo se f `e invertibile.
Se f `e invertibile allora la funzione f `e linversa della f . In particolare si
ha che:
(a) la funzione f `e iniettiva se e solo se f `e surgettiva;
(b) la funzione f `e surgettiva se e solo se f `e iniettiva.
Dimostrazione: (a) Segue che f f = idP(Y ) per f surgettiva dato che vale luguaglianza f (f 1 (B)) = B. Viceversa, se f 1 (B) = allora B = in
quanto f iniettiva dunque f 1 (B) `e sempre non vuoto se B = {y} per y Y .
(b) Analogamente f f = idP(X) se f iniettiva in quanto vale luguaglianza
f 1 (f (A)) = A. Vicerversa, se f `e surgettiva possiamo scrivere A = f 1 (B)
e quindi f (A) = f (f 1 (B)) B ma allora A f 1 (f (A)) f 1 (B) in
quanto f 1 preserva le inclusioni ovvero f 1 (f (A)) = A ovvero f iniettiva.
Segue da (a) e (b) che f `e bigettiva se e solo se f `e bigettiva. Infine, se f
`e invertibile si ha f f = idP(Y ) e f f = idP(X) per quanto detto sopra e
quindi per lunicit`a dellinversa si ha che f = (f )1 = (f 1 ) .

Ricordiamo che abbiamo descritto P(X) mediante 2X esibendo esplicitamen
te una funzione bigettiva : 2X P(X) tra questi insiemi. Inoltre, data

1 INSIEMI

24

f : X Y abbiamo che componendo con f si ottiene una funzione 2Y 2X


compatibilmente con f indotta sullinsieme delle parti

2Y


2X

P(Y )
f

/ P(X)

Unicit`
a e universalit`
a
Abbiamo visto che i nostri assiomi garantiscono esistenza e unicit`a di unione
e intersezione. Linsieme delle parti `e unico una volta assunto che esista, in
quanto ogni insieme `e univocamente determinato dai suoi elementi e linsieme
delle parti ha come elementi i sottoinsiemi di un insieme; tuttavia, linsieme
delle parti pu`o esser ricostruito mediante altri insiemi. Infine, assumendo
lesistenza dellinsieme delle parti, abbiamo ottenuto linsieme prodotto e
linsieme somma: il prodotto e la somma sono unici nel senso che tali costruzioni sono universali ovvero soddisfano una propriet`a che le caratterizza
a meno di funzioni invertibili.
Linsieme prodotto `e caratterizzato dalla seguente propriet`a: dato un insieme
Z con funzioni f : Z X e g : Z Y esiste ununica funzione
def

h = (f, g) : Z X Y z 7 (f (z), g(z))


tale che le composte ph = f e qh = g ovvero si ottiene un diagramma
p

X_
:

X Y o
q

Z
g

Supponendo che pure linsieme Z (con le funzioni f : Z X e g : Z Y )


soddisfa questa propriet`a allora esiste ununica k : X Y Z tale che

hk = idZ e kh = idXY e dunque X Y Z. Ad esempio, si ha che

X Y Y X.

1 INSIEMI

25

Analogamente, linsieme somma `e caratterizzato dalla seguente propriet`a:


dato un qualunque insieme Z con funzioni f : X Z e g : Y Z esiste
ununica funzione h : X ] Y Z tale che le composte hi = f e hj = g
ovvero si ottiene un analogo diagramma
X
f

X ] Yd

>Z

Y
Ad esempio, la funzione X ] Y X Y si ottiene per Z = X Y , con f e
g le inclusioni X X Y e Y X Y . Una qualunque scelta di etichette
diverse nella definizione della somma produce insiemi somma diversi con una
funzione bigettiva tra questi.
Per chi fosse interessato ad approfondire questi argomenti pu`o trovare nellAppendice A.4 una prima breve introduzione a questi argomenti.

2 NUMERI

26

Numeri

Abbiamo postulato lesistenza dinsiemi elementari che abbiamo denotato


0 = , 1 = {} e 2 = {0, 1} e che si possono anche considerare da diversi
punti di vista (insiemi di parti o unioni). Osserviamo che linsieme 1 = 0{0}
si deduce semplicemente da 0 come 2 = 1 {1} si deduce da 1 e dunque
def
def
possiamo continuare 3 = 2 {2} = {0, 1, 2}, 4 = 3 {3}, etc. Infatti, come
suggerito da von Neumann, postulando lesistenza del singoletto e dellunione
di due insiemi esistono tutti questi insiemi: 0, 1, 2, 3, ...

2.1

Numeri naturali

Lassioma dellinfinito6 postula lesistenza di un insieme X con X tale


che
x X x {x} X
Diciamo che un insieme X `e apodittico se X verifica lassioma dellinfinito.
Se un tale insieme X esiste allora la famiglia dinsiemi
FX = {X 0 P(X) | X 0 apodittico}
def

esiste ovvero FX `e un insieme non vuoto siccome X FX . In quanto


lintersezione dinsiemi che verificano lassioma dellinfinito verifica lassioma dellinfinito si ottiene dunque il pi`
u piccolo tra questi insiemi apodittici
ovvero
\
def
N=
X0
X 0 FX

Gli elementi di N sono quelli che comunemente chiamiamo numeri naturali


ma lesistenza dellinsieme N di tutti i numeri naturali non `e affatto naturale!
Esistenza e unicit`
a
Se esiste X apodittico allora N esiste ed `e unico. Gli insiemi elementari
0, 1, 2 X e cos` via; quindi possiamo descrivere linsieme
N = {0, 1, 2, 3, . . .}
6

Axiom des Unendlichen

2 NUMERI

27

come il pi`
u piccolo insieme che contiene 0, 1, 2, 3, etc. come elementi. Linsieme N viene cos` ottenuto a partire da X e quindi sembra dipendere da questo:
scegliendo un altro insieme Y apodittico si potrebbe ottenere N0 in Y . In
effetti, basta osservare che X Y 6= `e apodittico: quindi N X Y Y
e quindi N0 N come N0 X Y X e quindi N N0 ovvero N = N0 .
Principio dinduzione
Come abbiamo appena visto N `e contenuto in qualunque insieme apodittico.
Viceversa, se S N `e un sottoinsieme apodittico allora S = N. In generale,
sia P (n) una qualunque proposizione che dipende da n N. Supponiamo
che valga la seguente ipotesi induttiva
P (0) `e vera e inoltre
se P (n) `e vera allora P (n {n}) `e vera.
Allora si ha che P (n) `e vera per ogni n N. Infatti, sia
def

S = {n N | P (n) `e vera}
Dunque S N e per ipotesi induttiva si ha che S `e apodittico e quindi che
S = N. Questo principio dimostrativo viene detto principio dinduzione e
si dice che la P (n) vale per induzione per ogni n N. Questa `e la principale
propriet`a di N dalla quale si ottengono tutte le ben note propriet`a dei numeri
naturali.
Ad esempio, ricordiamo che un numero naturale n N `e un insieme. Si
vede facilmente, per induzione, che ogni elemento di un numero naturale `e
un numero naturale:
Lemma 2.1 Se m n e n N allora m N.
Dimostrazione:

Infatti, sia P (n) la propriet`a che m n m N e sia


def

S = {n N | m n m N}
il sottoinsieme di tutti gli n N per cui P (n) `e vera. Si ha che 0 S in quanto
non ha elementi. Supponiamo che n S e mostriamo che n {n} S. Se
m n {n} allora m n oppure m = n. Se m n allora m N per ipotesi

2 NUMERI

28

induttiva. Inoltre m = n N. Per induzione si ha S = N ovvero P (n) `e vera


per ogni n N.

Inoltre, ogni elemento di un numero naturale `e anche un suo sottoinsieme:


Lemma 2.2 Se m n e n N allora m n.
Dimostrazione:

Infatti, sia
def

S = {n N | m n m n}
si ha che 0 S in quanto non ha elementi. Sia n S. Sia m n {n}
ovvero m n oppure m = n. Se m = n si ha n n {n}. Se m n allora
m n n {n} in quanto per ipotesi n S. Per induzione si ha che S = N
come affermato.

Sistemi di Peano
Gli insiemi X che verificano lassioma dellinfinito sono semplicemente insiemi
tali che X sia un elemento con la funzione successore
:XX

x 7 x {x}

def

ovvero (x) = x {x} X per ogni X.


Proposizione 2.3 Linsieme N verifica le seguenti propriet`a:
(P1) 0 N
(P2) n N (n) N per ogni n N
(P3) (n) 6= 0 per ogni n N
(P4) (n) = (m) n = m per ogni n, m N.
(P5) S N tale che 0 S e per ogni n S si ha (n) S S = N

2 NUMERI

29

Dimostrazione: Tutte le propriet`a tranne la (P4) sono evidenti. Ad esempio, (P5) `e il principio dinduzione (basta osservare che S `e apodittico e
quindi N S). Per vedere (P4) se n {n} = m {m} si ha che n m
oppure n = m e viceversa m n oppure m = n. Dal Lemma 2.2 si ha n = m
e (P4) `e verificata.

Le propriet`a (P1)(P5) sono gli assiomi di Peano. Una terna (E, s, e) dove
E `e un insieme con un elemento e E e una funzione (detta successore)
s : E E soddisfa (P1)(P2). Una terna (E, s, e) che soddisfa le propriet`a
(P3)(P5) si dice sistema di Peano Una terna (E, s, e) che soddisfa (P3)
(P4) `e dunque costituita da un insieme E con e E e la funzione iniettiva
s : E E tale che e 6 s(E) dunque s non surgettiva. Si ha:
Proposizione 2.4 Sia E un insieme tale che esiste s : E E iniettiva ma
non surgettiva. Allora esiste N E ed e N tale che (N, s, e) `e un sistema
di Peano.
Dimostrazione:
Infatti, sia (E, s, e) una terna con e E \ s(E) scelto a
piacere. La terna (E, s, e) soddisfa (P3)(P4). Ogni terna (E 0 , s, e) con E 0
E verifica (P3)(P4). Se (E 0 , s, e) e (E 00 , s, e) sono tali terne con E 0 , E 00 E
anche (E 0 E 00 , s, e) `e una tale terna. Sia
FE = {E 0 P(E) | (E 0 , s, e)}
def

e definiamo
def

N=

E0

E 0 FE

Allora (N, s, e) `e un sistema di Peano. Infatti, e N e s(n) N per ogni


n N quindi (N, s, e) `e una terna; dato che lintersezione soddisfa (P3)
(P4) basta mostrare che (N, s, e) verifica (P5): infatti, una terna (F, s, e)
con F N `e nella famiglia FE e dunque N F .

Un aspetto fondamentale di ogni sistema di Peano `e il seguente:


Teorema 2.5 (Ricorsivit`a) Sia (N, s, e) un sistema di Peano. Per ogni funzione t : X X e x X esiste ununica funzione f : N X tale che
f (e) = x e f (s(n)) = t(f (n)) per ogni n N .

2 NUMERI

30

Dimostrazione: Supponiamo che esistano due funzioni f, f 0 : N X con


def
le propriet`a richieste. Sia E = {n N | f (n) = f 0 (n)} N . Si ha che
(E, s, e) `e una terna e quindi N = E per (P5) ovvero: per induzione, se tale
f esiste `e unica. Bisogna mostrare che esiste. Sia
F = {T N X | (e, x) T & (n, y) T (s(n), t(y)) T }
Siccome N X F si ha che F 6= . Sia
\
def
f =
T
T F

Si vede per induzione che f `e il grafico di una funzione f : N X. Sia


S linsieme di tutti gli n N tali che esiste un unico (n, y) f . Allora
e S poich`e se (e, y) f con x 6= y allora f \ {(e, y)} F ovvero
f f \ {(e, y)} che `e assurdo e quindi x = y. Inoltre, se n S allora
s(n) S. Infatti, se s(n) 6 S sia (s(n), y 0 ) con y 0 6= t(y) per (n, y) S. Si ha
nuovamente che f \ {(s(n), y 0 )} F e quindi un assurdo. Dunque S = N
per induzione e la funzione f cos` ottenuta soddisfa quanto affermato.

Infine, si ha che un sistema di Peano `e unico, secondo la seguente:


Proposizione 2.6 Se (N, s, e) e (N 0 , s0 , e0 ) sono due sistemi di Peano al
lora esiste ununica funzione invertibile f : N N 0 tale che f (e) = e0 e
f (s(n)) = s0 (f (n)) per ogni n N .
def

Dimostrazione:
Poniamo appunto f (e) = e0 e se f `e definita per n N
def
poniamo f (s(n)) = s0 (f (n)). Per il Teorema 2.5 applicato al sistema di Peano (N, s, e) esiste una unica funzione con queste propriet`a. Siccome anche
(N 0 , s0 , e0 ) `e un sistema di Peano, ancora per il Teorema 2.5, esiste una unica funzione g : N 0 N tale che g(e0 ) = e e g(s0 (n0 )) = s(g(n0 )) per ogni
n0 N 0 . Si ha dunque che gf : N N `e tale che g(f (e)) = e e inoltre
g(f (s(n))) = g(s0 (f (n)))) = s(g(f (n)). Dunque gf = idN : N N per
lunicit`a stabilita nel Teorema 2.5 e analogamente f g = idN 0 : N 0 N 0 . In
conclusione g = f 1 .

2 NUMERI

31

Corollario 2.7 Se (N, s, e) `e una qualunque terna allora esiste ununica funzione f : N N tale che f (0) = e e f ((n)) = s(f (n)) per ogni n N
ovvero f (1) = s(e), f (2) = s2 (e), etc. Se inoltre (N, s, e) `e un sistema di
Peano allora f `e bigettiva.

Attenzione! Notare che in un sistema di Peano (N, s, e) lelemento


e 6 s(N ) `e unico. Infatti, S = s(N ) {e} N e dunque {e} = N \ s(N ) per
(P5). Daltra parte possiamo avere N 0 N con e 6 N 0 ma (N 0 , s, e0 ) sistema
di Peano tale che N 0 6= N . Ad esempio, basta prendere N 0 = s(N ) con
e0 = s(e). Questa osservazione permette di verificare che una propriete`a P (n)
sia vera nel sistema (N 0 , s, e0 ) ovvero a partire da P (e0 ). Infatti, supponendo
P (e0 ) vera e che se P (n) `e vera allora P (s(n)) `e vera si ha che P (n) `e vera
per ogni n N 0 .

Propriet`
a notevoli dei numeri naturali
In ogni sistema di Peano possiamo fare dimostrazioni e dare definizioni per
induzione: una propriet`a o una formula `e vera oppure `e definita per
induzione grazie al Teorema 2.5. In particolare, in (N, , 0) possiamo definire
def
la somma m+n N dati n, m N ponendo m+0 = m e inoltre supponendo
def
m + n definita ponendo m + (n) = (m + n): per induzione m + n `e definita
per ogni n, m N. Secondo questa definizione si ha
m + 1 = (m)
per ogni m N. Per induzione
m + n = n (m)
def

dove anche le composte n si intendono definite per induzione ovvero 0 = idN


def
e n+1 = n . Si hanno le seguenti ben note propriet`a della somma la cui
dimostrazione `e un facile esercizio, per induzione.
Lemma 2.8 Siano n, m, k N
(m + n) + k = m + (n + k)

2 NUMERI

32

m+n=n+m
m+n=k+n m=k
Per n, m N denotiamo n m se m = n + k per qualche k N e scriviamo
anche n = m k in questo caso. Scriviamo n < m se n m ma n 6= m.
Lemma 2.9 n m n m n < m
Dimostrazione:
Mostriamo subito che n 6 n. Infatti, se n n allora
n n {n} n e quindi n = (n) = n + 1 ovvero 1 = 0: assurdo!
n < m n m Chiaramente si ha che n < m se e solo se esiste k 6= 0 tale
che m = k (n). Se n < m allora basta mostrare per induzione su k 6= 0 che
n k (n). Se k = 1 allora n (n) = n {n} e se n k (n) allora si ha
pure che n k+1 (n) = k (n) { k (n)}.
n m n m Come abbiamo visto nel Lemma 2.2 osservando che n 6= m
altrimenti n n.
n m n < m Si consideri il sottoinsieme S di N
def

S = {n N | n m n < m}
Si ha 0 S. Supponiamo n S e n + 1 m. Dunque n {n} m da
cui n m ma allora, per ipotesi induttiva, esiste k 6= 0 tale che m = k (n).
Infatti, k 6= 1 poich`e se k = 1 allora m = n + 1. Quindi m = k1 (n) =
k1 (n + 1) per k 1 6= 0 ovvero n + 1 < m e n + 1 S. Per induzione
S = N.

Lemma 2.10 Siano n, m N. Si ha che n m oppure m n oppure


n = m e un solo caso tra questi `e sempre vero.
Dimostrazione:
Vediamo che una sola di queste affermazioni pu`o essere
valida. Se n = m si ha n 6 n. Se n 6= m, n m e m n dal Lemma 2.9 si
ha che n m e m n che `e assurdo. Inoltre, sia
def

S = {n N | n m o m n o n = m}

2 NUMERI

33

Si ha che 0 S in quanto 0 m oppure m = 0. Se n S sia m 6= n {n} e


mostriamo che n {n} m oppure m n {n}. Se m = n si ha n n {n}.
Se m 6= n e n S allora n m oppure m n. Ovviamente se m n allora
m n {n}. Se invece n m allora n m dal Lemma 2.9 e quindi
n {n} m ma allora n {n} m ancora per il Lemma 2.9. Per induzione
S = N.

Osserviamo che per il Lemma 2.9 e il Lemma 2.10 si ha che n m oppure
m n oppure n = m come pure:
Corollario 2.11 n < m oppure m < n oppure n = m
def

Si definisce il prodotto n m N dati n, m N come segue. Sia 0 m = 0


def

e inoltre 1 m = m. Supponendo 2 n e (n 1) m definita poniamo


def
n m = (n 1) m + m. Si hanno le seguenti propriet`a del prodotto che si
verificano per induzione.
Lemma 2.12 Siano n, m, k N
(m n) k = m (n k)
mn=nm
m (n + k) = m n + m k
m n = 0 m = 0 oppure n = 0

2.2

Insiemi finiti

Diciamo che un insieme X `e finito se esiste una funzione bigettiva

f : {0, 1, 2, 3, . . . , n 1} X
In altre parole questo significa che possiamo elencare tutti i suoi elementi
X = {x0 , x1 , . . . , xn1 }
def

dove xi = f (i) e xi 6= xj se i 6= j anche se questo elenco non `e unico linsieme


di indici `e un numero naturale n unicamente determinato. Infatti, un elenco
`e una funzione bigettiva f e si vede che:

2 NUMERI

34

Lemma 2.13 Se n 6= m allora non esistono funzioni bigettive f : n m.


Dimostrazione:
Infatti, sia S linsieme degli n N tali che se esiste una
funzione bigettiva f : n m e m N allora m = n. Si ha 0 S in quanto
esiste ununica 0 m ed `e bigettiva se e solo se m = 0. Supponiamo che
n S e vediamo che n + 1 S. Infatti, se esiste f : n {n} m bigettiva
allora la restrizione f|n : n f (n) `e bigettiva ma inoltre f (n) m poich`e
n n {n} e quindi f (n) N per il Lemma 2.1. Per ipotesi induttiva
f (n) = n. Dunque n m e n m da cui n {n} m. Si ha f (n {n}) =
f (n) f ({n}) = n {n}. Siccome f `e surgettiva si ha che m = n {n}. Per
induzione S = N e si ha la tesi.

Definiamo quindi n la cardinalit`a di un insieme finito X se esiste f : n X
bigettiva. Osserviamo che se f : n X bigettiva e se g : m X bigettiva
allora g 1 f : n m `e bigettiva con n, m N ma allora n = m per il
Lemma 2.13. Denotiamo |X| N la cardinalit`a di X e osserviamo che
|X| = 0 se e solo se X =
|X| = 1 se e solo se X `e un singoletto

|X| = |Y | se e solo se esiste f : X Y bigettiva


Esempi canonici di insiemi finiti sono i sottoinsiemi dei numeri naturali.
Lemma 2.14 Sia n N. Se F P(n) allora F `e finito.
Dimostrazione: Sia
def

S = {n N | F P(n) F finito}
Allora 0 S in quanto 0 `e finito. Sia n S e mostriamo che n {n} S.
Sia F n {n}. Se x F allora x n oppure x = n. Se x 6= n per ogni
x F allora F n e per ipotesi induttiva `e finito. Se esiste x F tale che
x = n allora F \ {n} n {n} \ {n} = n. Siccome F \ {n} n `e finito

esiste una f : m F bigettiva con m N. Quindi g : m {m} F tale


che g|m = f e g(m) = n `e bigettiva. In conclusione F `e finito e S = N per
induzione.

Da quanto appena dimostrato segue che se F n `e un sottoinsieme di n N


allora esiste un modo di elencare i numeri naturali in F mediante un altro

2 NUMERI

35

numero naturale m e una funzione bigettiva f : m F . Otteniamo cos`


una funzione iniettiva f : m n. Inoltre si ha:
Lemma 2.15 Se n < m allora non esistono funzioni iniettive f : m n.
Dimostrazione:
Infatti, sia S linsieme degli n N tali che se esiste una
funzione iniettiva f : n m e m N allora n m. Si ha 0 S in quanto
esiste ununica 0 m ed `e iniettiva. Supponiamo che n S. Se esiste
f : n {n} m iniettiva allora la restrizione f|n : n f (n) `e bigettiva.
Dunque per il Lemma 2.13 si ha f (n) = n. Dunque n m e per il Lemma 2.9
si ha n < m e quindi n + 1 m. Per induzione S = N. Per il Corollario 2.11
si ha la tesi.

Possiamo dunque ora mostrare che:


Teorema 2.16 (Dirichlet) Siano X e Y insiemi finiti. Se |Y | < |X| non
esistono funzioni j : X , Y iniettive.
Dimostrazione:
Sia |Y | = n e |X| = m. Siano f : m X e g : n Y
bigettive. Se n < m ed esistesse j : X , Y iniettiva allora la composta
g 1 jf : m n sarebbe iniettiva in contraddizione con il Lemma 2.15.

Tratteremo ancora glinsiemi finiti nel Lemma 2.19 e 2.22 e nella Proposizione 2.23.

2.3

Funzioni di scelta

Una importante assunzione senza la quale molte ulteriori costruzioni non


sarebbero giustificate `e lassioma della scelta che ora qui consideriamo in
dettaglio, che risulta indipendente dai precedenti assiomi e che ogni onesta
trattazione della teoria degli insiemi deve opportunamente includere. Per
ulteriori forme dellassioma della scelta si veda lAppendice A.1.
Un insieme S si dice un insieme di scelta di un insieme F se per ogni X F
esiste un unico x S tale che x X ovvero S X `e un singoletto. In altre
parole, se F = {X, Y, . . .} un insieme di scelta S = {x, y, . . .} `e un insieme

2 NUMERI

36

che ha come elementi x X, y Y con x 6= y, etc. Se F allora F non


ha nessun insieme di scelta. Inoltre
F = {{1, 2}, {2, 3}, {1, 3}}
non ha nessun insieme di scelta! Se linsieme F = {X0 , X1 , . . . , Xn } `e finito,
6 F e i suoi elementi sono a due a due disgiunti allora esiste un insieme di
scelta. Infatti, sia Xi = {xi , . . .} per i = 0, . . . , n e quindi
[
S = {x
X | x = x0 , . . . , x = xn }
XF

`e un insieme di scelta di F. Se F `e non `e finito `e evidente che i precedenti


assiomi non garantiscono che tale insieme S esista.

Assioma della scelta


Lassioma della scelta7 assicura che per ogni insieme tale che i suoi elementi
sono due a due disgiunti e che non ha linsieme vuoto come elemento esiste
un insieme di scelta.
Una funzione di scelta per F tale che 6 F `e una funzione
[
X
f :F
XF

che associa X 7 x X per X F. Osserviamo che per un insieme di scelta


S otteniamo una funzione di scelta e si ha S = f (F). Inoltre, un insieme F
pu`o avere una funzione di scelta senza possedere un insieme di scelta. Infatti,
nellesempio precedente {1, 2} 7 1, {2, 3} 7 2, {1, 3} 7 1 `e una funzione di
scelta. Daltra parte si ha:
Lemma 2.17 Lassioma della scelta `e equivalente a dire che per ogni insieme F tale che 6 F esista una funzione di scelta.
Dimostrazione: Abbiamo gi`a osservato che ogni insieme di scelta definisce
una funzione di scelta. Viceversa, dato un insieme F tale che 6 F consideriamo linsieme unione disgiunta
X def [
X=
{X} X
XF
7

Axiom der Auswahl

XF

2 NUMERI

37

Siccome gli insiemi {X} X al variare di X F sono due a due disgiunti e


non vuoti esiste un insieme di scelta e quindi una funzione di scelta
X
f :F
X
XF

ovvero f (X) {X} X e quindi f (X) = (X, x) con x X. Daltra parte


si ha una funzione canonica
X
[
X
X
XF

XF

che associa (X, x) 7 x X. Per composizione si ottiene una funzione di


scelta per F.

Insieme delle funzioni di scelta


Se F `e un insieme allora esiste linsieme di tutte le funzioni di scelta per F.
Denotiamo tale insieme
Y
X
XF

che viene anche detto insieme prodotto. Se F = {X0 , X1 , . . . , Xn } `e finito si


ha una funzione bigettiva
Y

X0 Xn
X
XF

in quanto (x0 , . . . , xn ) con xi Xi determina univocamente una funzione di


scelta e viceversa. Per una famiglia qualunque F = {Xi }iI , con un insieme
di indici I, un elemento dellinsieme prodotto viene comunemente denominato
mediante limmagine della corrispondente funzione di scelta ovvero (xi )iI
con xi Xi per ogni i I. Chiaramente si ha che:
Lemma 2.18 Lassioma della scelta `e equivalente a
Y
X 6= 6 F
XF

per ogni famiglia F dinsiemi.

2 NUMERI

38

Dimostrazione:

Riformulazione di 2.17.

Osserviamo che per F famiglia finita dinsiemi finiti il Lemma 2.18 `e contenuto nel seguente:
Lemma 2.19 Siano X0 , X1 , . . . , Xn insiemi finiti. Si ha che X0 X1 . . .
Xn `e finito con cardinalit`a
|X0 X1 . . . Xn | = |X0 | |X1 | |Xn |
Inoltre si ha
|X0 ] X1 ] . . . ] Xn | = |X0 | + |X1 | + + |Xn |
Inversa sinistra e destra
Due funzioni g : X Y e f : Y X tali che gf = idY : Y Y si dicono
inversa sinistra e destra rispettivamente. Si ha che una funzione `e surgettiva
se e solo se ha un inversa destra assumendo lassioma della scelta.
Lemma 2.20 Lassioma della scelta `e equivalente a che per g : X
Y surgettiva esista f : Y , X iniettiva tale che componendo f con g si ottiene
gf = idY : Y Y .
Dimostrazione:
Sia g : X
Y e sia {g 1 (y)}yY la famiglia dinsiemi
costituiti dalle controimmagini degli elementi y Y . Siccome g surgettiva
si ha g 1 (y) 6= per ogni y Y . Si ha che g 1 (y) g 1 (y 0 ) = se y 6= y 0 e
inoltre
[
X=
g 1 (y)
yY

Dunque {g 1 (y)}yY `e una partizione di X. Sia f : Y X una funzione


di scelta. Chiaramente gf = idY : Y Y , in particolare, f `e iniettiva.
Viceversa, sia F tale che 6 F e sia
X
g:
XF
XF

ottenuta associando X a tutti gli (X, x) al variare di x X. Si ottiene una


funzione surgettiva: si ha che g 1 (X) 6= per ogni X F in quanto 6 F.
Sia dunque
X
f :F
X
XF

2 NUMERI

39

tale che gf = idF ovvero f (X) = (X, x) per ogni X F. Si conclude come
nella dimostrazione di 2.17.

Attenzione!
Osserviamo che se Y `e finito allora {g 1 (y)}yY `e finito
e non `e necessario ricorrere allassioma della scelta per ottenere f inversa
destra di g.

Proposizione 2.21 Sia Y un insieme non vuoto. Esiste p : X


Y surgettiva se e solo se esiste j : Y , X iniettiva. Inoltre, si possono scegliere p e
j tali che componendo j con p si ottiene pj = idY : Y Y .
Dimostrazione: Se p : X
Y `e surgettiva allora esiste j : Y , X iniettiva
come dal Lemma 2.20. Viceversa, se j : Y , X e j(Y ) 6= X sia z
def
def
X \ j(Y ) e sia q : X j(Y ) tale che q(x) = x se x j(Y ) e q(x) = z se
def
x 6 j(Y ). Si ottiene p = j 1 q : X
Y come composta di q : X
j(Y ) e di
1
j : j(Y )
Y .

Notiamo che per n N si ha:


Lemma 2.22 Ogni funzione f : n n iniettiva `e anche surgettiva.
Dimostrazione:
Infatti, sia S linsieme dei n N tali che ogni funzione
f : n n iniettiva `e anche surgettiva. Si ha 0 S in quanto esiste ununica
0 0 ed `e bigettiva. Supponiamo che n S. Sia f : n {n} n {n}
iniettiva allora la restrizione f|n : n f (n) `e bigettiva. Dunque per il
Lemma 2.13 si ha f (n) = n. Dunque f (n {n}) = n {n} ovvero f
surgettiva. Per induzione S = N.

Proposizione 2.23 Sia X un insieme finito.


(a) Esiste j : Y , X iniettiva se e solo se Y `e finito e si ha |Y | |X|
(b) Se t : X X allora t iniettiva se e solo se t surgettiva.

2 NUMERI

40

(c) Si ha che P(X) `e finito e |P(X)| = 2|X|

Sia |X| = n N e f : n X bigettiva.

Dimostrazione:

(a) Se esiste j : Y , X iniettiva allora sia Y 0 n costituito da tutti gli


x n tali che f (x) j(Y ) ovvero
Y 0 = {x n | y Y f (x) = j(y)} = f 1 (j(Y ))
def

def

Siccome j : Y j(Y ) `e invertibile definiamo g = f|Y 0 j 1 come composta


della restrizione f|Y 0 : Y 0 j(Y ) e di j 1 : j(Y ) Y . Mostriamo che

g : Y 0 Y `e bigettiva. Infatti, g bigettiva in quanto composta di bigettive: j 1 `e bigettiva e f|Y 0 `e iniettiva in quanto restrizione di f iniettiva e
siccome f surgettiva si ha f (f 1 (j(Y ))) = j(Y ) ovvero f (Y 0 ) = j(Y ) quindi
f|Y 0 surgettiva. Dunque Y `e finito poich`e Y 0 lo `e per il Lemma 2.14 e si ha
|Y | = |Y 0 |. Per il Lemma 2.15 si ha che |Y 0 | n = |X|.

Viceversa, se Y `e finito, |Y | = m N, esiste g : m Y bigettiva e se m n


def
allora (per 2.9) si ha m n e quindi la composta j = f|m g 1 : Y , X `e
iniettiva.
(b) Consideriamo la composta
f

f 1

n X X n
def

Allora t `e iniettiva e/o surgettiva se e solo se lo `e g = f 1 tf : n n. Se


g : n n `e iniettiva allora `e surgettiva per il Lemma 2.22. Quindi se t `e
iniettiva allora t `e surgettiva. Viceversa, se t `e surgettiva per la Proposizione 2.21 esiste r : X X iniettiva tale che tr = idX . Per quanto abbiamo
appena visto r `e anche surgettiva e dunque t = r1 iniettiva (ovvero bigettiva).

(c) Infine, si ha f : P(X) P(n) per la Proposizione 1.6. Si vede per


induzione che
|P(n)| = 2n

2 NUMERI

41

Infatti, si ha |P(0)| = 20 = 1 e |P(1)| = 2. Se F n {n} allora F n se


n 6 F oppure (F \{n}){n} n{n} e quindi |P(n {n})| = 2n +2n = 2n+1
per ipotesi induttiva.

Sia n N. Sia F n con |F | = k ovvero F `e un sottoinsieme costituito da


k-elementi di n. Si ha k n (in accordo con quanto appena dimostrato).
Consideriamo {F P(n) | |F | = k} P(n) che quindi `e anchesso finito.
Definiamo
 
n def
= |{F P(n) | |F | = k}|
k
che vien detto coefficiente binomiale di n rispetto a k. Siccome n + 1 =
n {n} si ha:
Lemma 2.24 Se 0 k n allora

 
  
n+1
n
n
=
+
k+1
k+1
k
Osserviamo che

n
n


=1

in quanto se F P(n) con |F | = n allora esiste f : n n iniettiva con


Im f = F e quindi F = n (per 2.22). Daltra parte
n! = |{f : n n | f iniettiva}|
def

def

dove 0! = 1 e n! = n(n 1)! per n 1. Si vede quindi subito che


 
n
k!
= |{f : k n | f iniettiva}|
k
in quanto per ogni F P(n) con |F | = k esistono k! funzioni f : k n
iniettive con Im f = F . Inoltre ci sono esattamente n(n 1) (n k + 1)
funzioni f : k n iniettive e dunque:
Lemma 2.25 Se 0 k n allora
 
n
k!
= n(n 1) (n k + 1)
k
La formula del Lemma 2.25 si pu`o anche ricavare per induzione dal Lemma 2.24 (un facile esercizio di calcolo per il lettore volenteroso).

2 NUMERI

2.4

42

Insiemi infiniti

Per quanto abbiamo visto, in un insieme finito non esistono funzioni iniettive
non surgettive. Dunque, mediante un insieme finito non si pu`o costituire un
sistema di Peano. In particolare, N non `e un insieme finito.
Teorema 2.26 Le seguenti affermazioni sono equivalenti:
(i) linsieme X non `e finito ovvero `e tale che per ogni n N non esiste
f : n X bigettiva;
(ii) linsieme X ammette una funzione iniettiva non surgettiva nel senso che
esiste s : X X iniettiva non surgettiva (infinito secondo Cantor);
(iii) linsieme X contiene i numeri naturali nel senso che esiste una funzione
j : N , X iniettiva (infinito secondo Dedekind).
(iv) linsieme X contiene un sottoinsieme proprio Y X tale che esiste una
funzione f : X Y bigettiva.
Dimostrazione: (ii) (i) Se esiste s : X X iniettiva non surgettiva allora X non `e finito altrimenti si avrebbe una contraddizione con la (b) della
Proposizione 2.23.
(ii) (iv) Basta prendere Y = s(X). Viceversa, basta comporre la funzione f : X Y con Y X.
(ii) (iii) Se esiste s : X X iniettiva non surgettiva scegliendo un elemento a piacere x X \ s(X) si ottiene una terna (X, s, x). Applicando la
Proposizione 2.4 si ottiene un sistema di Peano (N, s, x) con N X. Per
lunicit`a, vista nel Corollario 2.7, si ha che esiste f : N N bigettiva. Denotiamio j : N , X la composta di f : N N e N X che `e iniettiva in
quanto composta di iniettive.
(iii) (ii) Se esiste una funzione j : N , X iniettiva allora per la Proposizione 2.21 si ottiene p : X
N surgettiva e tale che pj = idN . Se j `e
invertibile allora p = j 1 e basta prendere s = jj 1 . Se j(N) 6= X allora
definiamo s : X X come estensione della : N N a tutto X ovvero tale
che

x
x 6 j(N)
def
s(x) =
jp(x) x j(N)

2 NUMERI

43

In altre parole, se x j(N) allora esiste un unico n N tale che x = j(n)


e quindi pj(n) = n in modo che s(x) = j(n). Chiaramente s `e iniettiva.
def
Non `e surgettiva in quanto x0 = j(0) j(N) e per x = j(n) j(N) tale che
s(x) = j(n) = j(0) si ha (n) = 0 ma 0 6 (N).
def

(i) (iii) Sia Pfin (X) = {F X | F finito}. Sia F = {X \ F | F Pfin (X)}.


Notare che 6 F in quanto X non `e finito. Consideriamo una funzione di
scelta
[
f :F
X \F
F Pfin (X)
def

Sia t : Pfin (X) Pfin (X) che associa F 7 F {f (X \ F )}. Sia x0 = f (X)
X. Per il Teorema 2.5 esiste ununica g : N Pfin (X) tale che g(0) = {x0 }
e inoltre
g((n)) = g(n) {f (X \ g(n))}
per ogni n N. In altre parole, g(0) = {x0 }, g(1) = {x0 , x1 } con x1 6= x0 ,
etc. in modo che
g(0) g(1) g(n) g(n + 1) = g(n) {xn+1 } = {x0 , x1 , . . . , xn+1 }
def

dove xn+1 = f (X \ g(n)) 6 g(n). Quindi xn 6= xm se n 6= m. Definiamo


def
def
j : N , X ponendo j(0) = x0 X e j(n + 1) = xn+1 X \ g(n) X.
Chiaramente, per costruzione, si ha che j `e iniettiva.

Diciamo che un insieme `e infinito se verifica una e quindi tutte le condizioni


del precedente Teorema: abbiamo cos` scoperto che le diverse possibili definizioni di insieme infinito sono equivalenti! Un insieme apodittico `e dunque
un particolare insieme infinito (secondo Dedekind). Inoltre, lesistenza di un
insieme infinito equivale allesistenza di un sistema di Peano.

Per X e Y insiemi infiniti possiamo chiederci se esiste f : X Y bigettiva.


Ad esempio, sappiamo che non esistono tali applicazioni bigettive se Y =
P(X) per il Teorema 1.3. Diciamo che un insieme infinito X `e numerabile

se esiste f : N X bigettiva. In altre parole, se X `e numerabile possiamo


elencare tutti i suoi elementi X = {x0 , x1 , x2 , . . .} mediante N come insieme di
indici. Come conseguenza del Teorema 1.3, si ha che P(N) non `e numerabile

2 NUMERI

44

ma esiste una funzione bigettiva

2N P(N)
In effetti, per descrivere meglio linsieme X I di tutte le funzioni da I a X
possiamo anche considerare F = {Xi }iI ponendo Xi = X per ogni i I e
la funzione bigettiva
Y

X I
X
iI
def

che associa f : I X alla funzione di scelta (xi )iI dove xi = f (i) Xi = X.


Per I = N otteniamo successioni di elementi di X. Per X = 2 possiamo dunque descrivere P(N) come successioni di 0 e 1.

Scriviamo |X| = |Y | se esiste f : X Y bigettiva e diciamo che i due


insiemi X e Y hanno stessa cardinalit`a

2.5

Relazioni di equivalenza

Una relazione di equivalenza su un insieme X `e una relazione determinata


da un sottoinsieme di X X che indichiamo tale che per ogni x, y, z X
si ha:
xx
xy yx
xy &yz xz
ovvero riflessiva, simmetrica e transitiva. Per ogni x X definiamo [x]
la classe di equivalenza di x come linsieme di tutti gli elementi y X in
relazione con x ovvero
def
[x] = {y X | x y}
Si ha che
[x] = [y] x y
Per ogni scelta di y X tale che y x si ha [x] = [y]: un tale elemento si
dice un rappresentante della classe di equivalenza. Per ogni x, x0 X si ha:
[x] 6=

2 NUMERI

45

[x] [x0 ] 6= se e solo se [x] = [x0 ]


Infatti, x [x] in quanto x x e se y [x] [x0 ] allora y x e y x0 da
cui si ha x x0 (poich`e `e riflessiva, simmetrica e transitiva).
La famiglia {[x]}xX P(X) di sottoinsiemi di X costituisce dunque una
partizione di X
[
X=
[x]
xX

Denotiamo tale partizione con


def

X/ = {[x] | x X}
e diremo che X/ `e linsieme quoziente di X modulo . Ad esempio, luguaglianza = tra elementi di un insieme X `e una relazione di equivalenza che
ha come classi [x] = {x} i singoli elementi x X e ritroviamo la partizione
{{x}}xX come quoziente X/ =.
Viceversa, data una partizione F = {Xi }iI P(X) di X possiamo definire
una relazione di equivalenza su X tale che F = X/ . Infatti, x y se
esiste i I tale che x, y Xi .
Proposizione 2.27 Sia X un insieme. Associando una relazione di equivalenza alla partizione X/ si ottiene una funzione invertibile

{R X X | R equivalenza} {F P(X) | F partizione}


Dimostrazione:
Verifichiamo che data F = {Xi }iI la relazione x y se
esiste i I tale che x, y Xi `e una relazione di equivalenza. Siccome
[
Xi
X=
iI

si ha che per ogni x X esiste i I tale che x Xi e dunque `e riflessiva.


Chiaramente `e simmetrica in quanto x, y Xi `e simmetrico. Se x, y Xi
e y, z Xj allora y Xi Xj 6= e quindi i = j ovvero x, y, z Xi = Xj
e quindi `e transitiva. Si vede facilmente che F = X/ . Inoltre, se F =

2 NUMERI

46

{[x]}xX , la relazione cos` definita coincide con la relazione di equivalenza


data.

def

Associando x 7 [x] si ottiene una funzione (x) = [x]


: X
X/
chiaramente surgettiva. La si dice proiezione sul quoziente e gode della
seguente propriet`a:
Proposizione 2.28 Sia f : X Y una funzione e una relazione di
equivalenza su X. Se per ogni x, x0 X tali che x x0 si ha f (x) = f (x0 )
allora esiste ununica f : X/ Y tale che
/

X/
)

ovvero f = f . Se f (x) = f (x0 ) implica che x x0 allora f `e iniettiva.


Inoltre, f `e surgettiva se e solo se f `e surgettiva.
Dimostrazione:
Per definire f basta associare [x] 7 f (x) in quanto, per
def
0
ipotesi, se x x allora f (x) = f (x0 ). Dunque f ([x]) = f (x) `e ben definita
sulle classi di equivalenza. Inoltre f `e unica tale che f = f . Infatti, se
f = f 0 sia [x] = (x) e f 0 (x) = f (x) dunque f 0 ([x]) = f ([x]) ovvero

f0 = f.

Nella proposizione precedente si dice che una tale f passa al quoziente. Viceversa, data una qualunque funzione f : X Y possiamo definire una relazione di equivalenza indotta da f ponendo x f x0 se f (x) = f (x0 ) per
x, x0 X. Si ha che:
Corollario 2.29 Sia f : X Y una funzione, sia f la relazione di equivadef
lenza indotta da f e sia X = X/ f linsieme quoziente. Allora esiste ed `e
unica f : X Y iniettiva tale che

X
f

/X
'

2 NUMERI

47

ovvero f = f . Inoltre, f `e surgettiva se e solo se f `e bigettiva.


Ad esempio, se disponiamo di una famiglia dinsiemi X possiamo definire

una relazione di equivalenza x y se esiste x y bigettiva per x, y X.


Questa relazione si dice equipollenza di insiemi. Abbiamo detto che x, y X
hanno stessa cardinalit`a e denotato |x| = |y| in questo caso. Supponiamo
che X sia apodittico: allora N X e per n, m N si ha che n m se e solo
se n = m (per 2.13). Se X `e costituito interamente da insiemi finiti si ha che
la cardinalit`a | | : X N `e una funzione surgettiva che induce esattamente
questa relazione di equipollenza e si ha
X
| |

/X
'

e quindi X N per il Corollario 2.29. Per glinsiemi finiti i numeri naturali sono rappresentanti privilegiati delle classi di equipollenza. Questo
suggerisce che anche per glinsiemi infiniti si possano trovare tali rappresentanti. Ad esempio, se inoltre N X allora si potrebbe considerare
def
N {N} = {0, 1, 2, . . . , N} definendo |N| = N (che si denota per`o spesso
con 0 dove `e la prima lettera dellalfabeto ebraico); se X `e costituito
interamente da insiemi finiti o al pi`
u numerabili definiamo la cardinalit`a
| | : X N {N} che induce esattamente la relazione di equipollenza tra
insiemi. Se anche P(N) X allora N {N} non `e pi`
u sufficiente. Rimandiamo allAppendice A.2 per un approfondimento che coinvolge per`o argomenti
che saranno affrontati in seguito.

2.6

Numeri interi e razionali

Siano n, m N. Abbiamo definito la differenza n m = k N se m n


ovvero se n = m + k per k N. Per avere n m anche per n < m bisogna
aggiungere allinsieme N tutti gli opposti ovvero per ogni n N un numero
n in modo che n + (n) = 0. Definiamo linsieme dei numeri interi come
lunione disgiunta
def
Z = N+ N {0}
dove N+ = N \ {0} {+} sono i numeri positivi, N = N \ {0} {} sono
i numeri negativi e 0 `e lo zero. La notazione Z proviene dal tedesco Zahl.
def

def

2 NUMERI

48
def

def

Denotiamo +n = (n, +) e n = (n, ).


Consideriamo linsieme delle coppie (n, m) N N. Se n < m quindi
m = n + k poniamo
(n, m) = (n, n + k) = k N
def

mentre se m < n quindi n = m + k poniamo


(n, m) = (m + k, m) = +k N+
e inoltre (n, n) = 0. Si ottiene quindi la funzione differenza
:NNZ
per il Corollario 2.11. Chiaramente la funzione differenza `e surgettiva ma
non iniettiva. Infatti, (k, 0) = +k, (0, k) = k e (0, 0) = 0. Si ha per`o
che (m + k, m) = +k per ogni m N come si ha (n, n + k) = k per ogni
n N. In N N consideriamo dunque la relazione di equivalenza indotta
dalla funzione differenza ovvero dichiariamo equivalenti tutte le coppie che
hanno la stessa differenza
(n, m) (n0 , m0 ) se vale n + m0 = n0 + m
per ogni (n, m), (n0 , m0 ) N N. Si ottiene, per il Corollario 2.29, una
funzione indotta sul quoziente
NN

N N/
+

Poich`e `e surgettiva linsieme quoziente sidentifica con linsieme dei numeri


interi ovvero `e bigettiva

: N N/ Z
Mediante si ha che per ogni z Z esiste ununica classe [(n, m)] tale che
[(n, m)] 7 z. Ad esempio, [(n, 0)] 7 +n e [(0, m)] 7 m.
Definiamo la somma e il prodotto in Z come segue. Siano (n, m), (n0 , m0 )
N N. Consideriamo N N con la somma (n, m) + (n0 , m0 ) = (n + n0 , m + m0 )
indotta da quella di N sulle componenti e poniamo

2 NUMERI

49
def

[(n, m)] + [(n0 , m0 )] = [(n + n0 , m + m0 )]


verificando (per esercizio!) che `e ben definita sulle classi di equivalenza.
Per [(n, m)] 7 z e [(n0 , m0 )] 7 z 0 definiamo [(n + n0 , m + m0 )] 7 z + z 0
in Z. In particolare, [(0, 0)] 7 0 Z e per ogni [(n, m)] 7 z Z si ha
[(m, n)] 7 z Z in quanto
[(n, m)] + [(m, n)] = [(n + m, m + n)] 7 z + (z) = 0
Inoltre
def

[(n, m)] = [(n, 0)] + [(0, m)] 7 z = (+n) + (m) = n m


ovvero ogni numero intero si scrive come differenza di numeri naturali. In
conclusione, la somma di numeri interi gode delle seguenti propriet`a.
Lemma 2.30 Siano [(n, m)] 7 z, [(n0 , m0 )] 7 z 0 e [(n00 , m00 )] 7 z 00 numeri
interi. Si ha:
(z + z 0 ) + z 00 = z + (z 0 + z 00 ) ovvero ([(n, m)] + [(n0 , m0 )]) + [(n00 , m00 )] =
[(n, m)] + ([(n0 , m0 )] + [(n00 , m00 )])
z + z 0 = z 0 + z ovvero [(n, m)] + [(n0 , m0 )] = [(n0 , m0 )] + [(n, m)]
z + 0 = z ovvero [(n, m)] + [(0, 0)] = [(n, m)]
z + (z) = 0 ovvero [(n, m)] + [(m, n)] = [(0, 0)]
z = n m per n, m N ovvero [(n, m)] = [(n, 0)] + [(0, m)]
Per definire il prodotto sia z = n m e z 0 = n0 m0 e consideriamo
z z 0 = (n m) (n0 m0 ) = (n n0 + m m0 ) (n m0 + m n0 )
def

def

Definiamo il prodotto (n, m) (n0 , m0 ) = (n n0 + m m0 , n m0 + m n0 ) in


N N e quindi se [(n, m)] 7 z e [(n0 , m0 )] 7 z 0
def

[(n, m)] [(n0 , m0 )] = [(n n0 + m m0 , n m0 + m n0 )]


definiamo il prodotto [(n n0 + m m0 , n m0 + m n0 )] 7 z z 0 verificando
(per esercizio!) che `e ben definito sulle classi di equivalenza. Il prodotto di
numeri interi gode delle seguenti propriet`a.

2 NUMERI

50

Lemma 2.31 Siano [(n, m)] 7 z, [(n0 , m0 )] 7 z 0 e [(n00 , m00 )] 7 z 00 numeri


interi. Si ha:
(z z 0 ) z 00 = z (z 0 z 00 ) ovvero ([(n, m)] [(n0 , m0 )]) [(n00 , m00 )] =
[(n, m)] ([(n0 , m0 )] [(n00 , m00 )])
z z 0 = z 0 z ovvero [(n, m)] [(n0 , m0 )] = [(n0 , m0 )] [(n, m)]
z 1 = z ovvero [(n, m)] [(1, 0)] = [(n, m)]
z (1) = z ovvero [(n, m)] [(0, 1)] = [(m, n)]
z (z 0 + z 00 ) = z z 0 + z z 00 ovvero [(n, m)] ([(n0 , m0 )] + [(n00 , m00 )]) =
[(n, m)] [(n0 , m0 )] + [(n, m)] [(n00 , m00 )]
z z 0 = 0 z = 0 oppure z 0 = 0
Osserviamo infine che:
Proposizione 2.32 Si ha una funzione iniettiva
j : N , Z
tale che j(0) = 0 e j(n) = +n N+ per n N \ {0}. Si ha che j(1) = 1,
j(n + m) = j(n) + j(m), j(n m) = j(n) j(m) per ogni n, m N.
Dimostrazione:
La j `e iniettiva poich`e j : N Z = N {0} N+
`e linclusione nellunione disgiunta. Siccome (n, 0) = j(n) in particolare
(0, 0) = j(0) = 0 e (1, 0) = j(1) = 1, j(n + m) = (n + m, 0) = (n, 0) +
(m, 0) = j(n) + j(m) e infine j(n m) = (n m, 0) = (n, 0) (m, 0) =
j(n) j(m).

Denotiamo ancora n Z limmagine j(n) = (n, 0) = ([(n, 0)]) = +n di un


numero naturale n N. Per ogni z Z si ha z = n m per n, m N e si
ha che z `e positivo se m < n ovvero z = (n, m) N+ oppure z `e negativo
se n < m ovvero z = (n, m) N oppure z nullo se n = m. Come per
i numeri naturali diciamo che z z 0 per z, z 0 Z se esiste k N tale che
z 0 = z + k. Osserviamo che se [(n, m)] 7 z e [(n0 , m0 )] 7 z 0 si ha che z z 0
se e solo se n + m0 n0 + m come numeri naturali. Si ha che:
Lemma 2.33 Dati z, z 0 , z 00 Z si ha:

2 NUMERI

51

z < z 0 oppure z 0 < z oppure z = z 0


z < z 0 & z 0 < z 00 z < z 00
z 0 < z 00 z + z 0 < z + z 00
z > 0 & z 0 < z 00 z z 0 < z z 00
Dimostrazione: Osserviamo che z < z 0 se e solo se z 0 z N+ `e positivo.
Inoltre, se n N+ allora n N e viceversa. Siccome Z = N+ {0} N
si ha z 0 z = k N+ ovvero z < z 0 oppure z 0 z = k N ovvero
z z 0 = k N+ oppure z 0 z = 0. Inoltre, se z 0 z N+ e z 00 z 0 N+ allora
(z 0 z)+(z 00 z 0 ) = z 00 z N+ . Come anche (z +z 00 )(z +z 0 ) = z 00 z 0 N+
per ogni z Z. Infine, z z 00 z z 0 = z (z 00 z 0 ) N+ per ogni z N+ .

Numeri razionali
Dato z Z esiste z 0 Z tale che z z 0 = 1 se e solo se z = z 0 = 1 oppure
z = z 0 = 1. Infatti, ovviamente z e z 0 devono essere non nulli e possiamo
supporre che 0 < z < z 0 ovvero z 0 z N+ positivo: dunque si ottiene
0 < z 2 < z z 0 e quindi 1 < z z 0 . Per avere gli inversi moltiplicativi di tutti
gli interi non nulli bisogna aggiungerli a Z compatibilmente con somma e
prodotto dei numeri interi. La costruzione dei numeri razionali segue infatti
da quella dei numeri interi sfruttando le propriet`a della somma e prodotto di
numeri interi. Ad esempio, `e fondamentale che il prodotto di interi non nulli
`e non nullo.
Sia Z6=0 = Z\{0}. Rappresentiamo una frazione mediante una coppia (a, b)
Z Z6=0 considerando equivalenti coppie proporzionali. Si ha che:
def

Lemma 2.34 La relazione (a, b) (a0 , b0 ) se ab0 = ba0 `e una relazione di


equivalenza su Z Z6=0 .
Dimostrazione:
La propriet`a riflessiva e la simmetrica sono ovvie conseguenze del Lemma 2.31. Inoltre (0, b) (a0 , b0 ) se e solo se a0 = 0 in
quanto b 6= 0. Per verificare la propriet`a transitiva si osserva che se anche (a0 , b0 ) (a00 , b00 ) si ha a0 b00 = b0 a00 e quindi ba0 b00 = bb0 a00 ma ba0 b00 = ab0 b00

2 NUMERI

52

dunque bb0 a00 = ab0 b00 da cui si ricava b0 (ba00 ab00 ) = 0 e quindi ab00 = ba00
eliminando b0 6= 0.

Definiamo linsieme dei numeri razionali o quozienti


Q = Z Z6=0 / = {[(a, b)] | (a, b) Z Z6=0 }
def

come linsieme quoziente. Denotiamo inoltre r Q


r=

a def
= [(a, b)]
b

una classe di equivalenza. Si ha dunque che


a0
a
= 0 ab0 = ba0
b
b
In particolare
at
a
=
b
bt
6=0
per ogni t Z . Definendo somma e prodotto di numeri razionali bisogna
verificare (per esercizio!) che non dipendono dalla scelta di rappresentanti
nella classe di equivalenza. Definiamo la somma di numeri razionali
r=

a c def ad + bc
+ =
b d
bd
e in particolare
0 c
c
+ =
b d
d
tale che
Definiamo il prodotto
osservando che

0 def
=0 Q
b

0
a a
+
= =0
b
b
b
a c def ac
=
b d bd

a c
ac
a
c
1 def
=
=

= =1 Q
b c
bc
b
c
1
Segue infatti facilmente che in Q valgono propriet`a analoghe di somma e
prodotto gi`a elencate per Z (in 2.30 e 2.31) con in aggiunta che per ogni

2 NUMERI

53

r Q non nullo r 6= 0 si ha r1 Q tale che r r1 = 1. Infatti, basta


osservare che
a b
ab
1
=
= =1
b a
ab
1
Proposizione 2.35 Si ha una funzione iniettiva
i : Z , Q

def

z 7 i(z) =

z
1

per z Z. Si ha che i(0) = 0, i(1) = 1, i(z + z 0 ) = i(z) + i(z 0 ), i(z z 0 ) =


i(z) i(z 0 ) per ogni z, z 0 Z.
Dimostrazione: Se z, z 0 Z sono tali che i(z) = i(z 0 ) si ha z1 = 1z 0 dunque
i `e iniettiva. Le altre affermazioni seguono facilmente dalle definizioni.

Denotiamo ancora z Q limmagine i(z) di un numero intero z Z osservando che per ogni z Z6=0 esiste z 1 Q ovvero z `e invertibile in Q.
Osserviamo che gli interi positivi in Q permettono di definire in modo del
tutto analogo i numeri razionali positivi
def

Q+ = {r =

a
Q | ab N+ }
b

Infatti, se (a, b) (a0 , b0 ) ovvero se ab0 = ba0 allora abb02 = a0 b2 b0 e dunque


ab N+ se e solo se a0 b0 N+ .
Lemma 2.36 In Q+ si ha che:
r, s Q+ r + s Q+ & r s Q+
r Q+ oppure r Q+ oppure r = 0
Ponendo r < s se s r Q+ si ottengono per Q le stesse propriet`a che
abbiamo elencato per Z (in 2.33) in modo che siano preservate da i : Z , Q
ovvero per z, z 0 Z tali che z < z 0 in Z si ha i(z) < i(z 0 ) in Q.

3 ORDINI

54

Ordini

Per N, Z e Q abbiamo introdotto una relazione che intendiamo ora affrontare in modo sistematico.

3.1

Relazioni dordine

Dato un insieme X si dice preordine su X una relazione determinata da un


sottoinsieme di X X che indichiamo tale che per ogni x, y, z X si ha:
xx
xy &yz xz
ovvero riflessiva e transitiva. Se inoltre `e antisimmetrica
xy &yxx=y
allora diciamo che `e un ordine o un ordinamento; talvolta si dice che X
`e parzialmente ordinato. Si denota (X, ) un tale insieme ordinato. Una
funzione f : X Y tra insiemi ordinati (X, ) e (Y, ) si dice monot`ona
o che preserva lordine se x y f (x) f (y) per x, y X.
Diciamo che un insieme ordinato (X, ) `e denso se dati x, y X con x < y
esiste t X tale che x < t < y. Osserviamo subito che N, Z e Q sono
ordinati e inoltre Q `e denso mentre N e Z non sono densi. Se r < s con
r, s Q allora t = (r + s)/2 Q `e tale che r < t < s mentre per r = z e
s = z + 1 con z Z non esiste nessun t Z con tale propriet`a.
Sia X = P(S) linsieme delle parti di un insieme S. Linclusione `e una
relazione riflessiva, transitiva e antisimmetrica su X e quindi (X, ) `e un
insieme ordinato. Ovviamente X non `e denso, in generale.

Attenzione!
Sia S = 2 = {0, 1} e X = P(S) = {0, 1, {1}, 2} dove
1 = {0} ma 1 6 {1} e {1} 6 1 in quanto 0 6= 1. Inoltre, se f : X Y con
Y = 4 = {0, 1, 2, 3} definita da f (0) = 0, f (1) = 1, f ({1}) = 2 e f (2) = 3 `e
monot`ona e bigettiva ma linversa non `e monot`ona.

3 ORDINI

55

Minimale e massimale
Sia Y X un sottoinsieme di un insieme ordinato (X, ). Diciamo che
y Y `e minimo se y z per ogni z Y . Diciamo che y Y `e massimo
se z y per ogni z Y . Chiaramente minimo e massimo se esistono sono unici. Denotiamo min Y e max Y rispettivamente minimo e massimo di Y .
Diciamo che y Y `e minimale se per ogni z Y si ha
zy y=z
Diciamo che y Y `e massimale se per ogni z Y si ha
yz y=z
Gli elementi minimali e massimali non sono unici. Se esiste min Y allora `e
lunico minimale e analogamente se esiste max Y allora `e lunico massimale.
Se Y X `e un sottoinsieme di un insieme ordinato (X, ), anche se X avesse
un minimo e un massimo, `e ben possibile che Y non vuoto possa essere senza
minimo ne massimo: basta che Y = {x, y} e che x 6 y e y 6 x.
Ad esempio, sia X = P(S) = {, . . . , S} ordinato per inclusione con S 6= .
Si ha che = min P(S) e S = max P(S). Se Y = {{s}} P(S) `e una
famiglia di singoletti con s S allora {s} sono tutti elementi minimali distinti
a meno che S non sia un singoletto.
Insiemi totalmente ordinati
Un insieme si dice totalmente ordinato se `e ordinato e inoltre
x < y oppure y < x oppure x = y
In questo caso lordine si dice totale o lineare. Inoltre, si ha che se f : X Y
`e iniettiva monot`ona e X `e totalmente ordinato allora
x<y

f (x) < f (y)

Inoltre, se f : X Y `e bigettiva monot`ona e X `e totalmente ordinato,


linversa f 1 : Y X `e monot`ona e Y `e totalmente ordinato.

3 ORDINI

56

Ad esempio, (N, ), (Z, ) e (Q, ) sono insiemi totalmente ordinati secondo lordinamento considerato in precedenza. Le funzioni iniettive N , Z
e Z , Q sono monot`one. Per N lordinamento coincide con lordinamento come abbiamo visto nel Lemma 2.9. Inoltre ogni numero naturale
n = {0, 1, . . . n 1} `e anchesso un insieme totalmente ordinato. Linsieme
X = P(S) ordinato per inclusione non `e totalmente ordinato, in generale.
Osserviamo inoltre che se X `e totalmente ordinato allora minimo equivale a
minimale (e massimo a massimale). Infatti, se y Y `e minimale e lordine
`e totale, per ogni z Z si ha z y oppure y z e quindi y z per ogni
z Y . Inoltre si ha:
Proposizione 3.1 (X, ) `e totalmente ordinato se e solo se ogni sottoinsieme finito non vuoto Y X ha minimo e massimo.
Dimostrazione: Ogni sottoinsieme Y = {x, y} X ha minimo se e solo se
ha massimo. Se esistono, sia x = min Y quindi x y (ovvero y = max Y )
oppure y = min Y quindi y x (ovvero x = max Y ): quindi X `e totalmente
ordinato. Viceversa, se X `e totalmente ordinato ogni sottoinsieme non vuoto
Y = {x, y} ha minimo e massimo: si ha che x y oppure y x. Quindi
min Y e max Y esistono per ogni Y X non vuoto con |Y | 2. Sia
def
S N linsieme S = {n N | per ogni Y X non vuoto finito n =
|Y | min Y e max Y esistono}. Si hanno dunque 1 S e 2 S. Sia
n S e |Y | = n + 1 3. Consideriamo y Y e sia Y = Y \ {y} {y}.
Siccome |Y \ {y}| = n S allora esistono min Y \ {y} e max Y \ {y}. Si
ha che min Y = min{min Y \ {y}, y} e pure max Y = max{max Y \ {y}, y}.
Quindi n + 1 S. Per induzione S = N.

Siccome N, Z e Q sono totalmente ordinati si ha:


Corollario 3.2 Se S `e un insieme finito non vuoto di numeri naturali, interi
o razionali allora esistono min S e max S e sono numeri naturali, interi o
razionali.

3.2

Insiemi ben ordinati

Un insieme ordinato (X, ) si dice ben ordinato oppure che `e buono se


per ogni Y X sottoinsieme non vuoto esiste min Y il minimo. Se X `e

3 ORDINI

57

finito allora ogni sottoinsieme Y X `e finito e quindi ha massimo e minimo


(per 2.23 e 3.1). Dunque (X, ) `e ben ordinato se e solo se `e totalmente
ordinato per X insieme finito. In generale, se (X, ) `e ben ordinato allora `e
totalmente ordinato. Non `e vero il viceversa! Ad esempio, (Z, ) non `e ben
ordinato: il sottoinsieme {n Z | n N} di Z non ha minimo.
Proposizione 3.3 Ogni sottoinsieme non vuoto di N ha minimo ovvero
(N, ) `e ben ordinato.
Dimostrazione: Sia S N. Supponiamo che S N non ha minimo e sia
N \ S il complementare. Se 0 S allora 0 = min S `e il minimo e quindi
0 N \ S. Inoltre se n N \ S allora possiamo supporre anche m N \ S
def
per ogni 0 m n. Infatti, S 0 = {m S | m < n} = S n `e finito (per
2.9 e 2.14): se S 0 6= allora esiste m = min S 0 per il Corollario 3.2. Inoltre
min S 0 = min S poich`e se k S \ S 0 allora n < k e quindi m < k. Si ha
quindi che n + 1 N \ S. Infatti, siccome m 6 S per ogni 0 m n se
n + 1 S allora n + 1 = min S. Per induzione N \ S = N ovvero S = .

Questa propriet`a prende il nome di principio del buon ordinamento dei numeri naturali. Osserviamo che, per calcolare il min S per S N si ragiona
def
nel seguente modo. Sia S 0 = {m N | n m & n S}. Si ha S S 0 e
chiaramente min S = min S 0 . Sia S 00 = N \ S 0 . Allora S 00 `e finito e dunque
ha un massimo max S 00 . Si ha min S = min S 0 = max S 00 + 1.
Induzione e buon ordinamento
La dimostrazione del principio di buon ordinamento non `e costruttiva ma
`e istruttiva! Rivela infatti che il buon ordinamento `e in effetti equivalente
al principio dinduzione. Supponendo (N, ) ben ordinato, sia S N e sia
N \ S 6= . Allora n = min N \ S esiste. Si ha n 6= 0 se supponiamo 0 S.
Quindi m S per ogni m < n e in particolare n 1 S ma n 6 S. Se
supponiamo che S sia apodittico si deduce che N \ S = ovvero S = N che
`e appunto il principio dinduzione.
Applichiamo il ragionamento precedente a P (n) una qualunque proposizione
def
che dipende da n N. Sia S = {n N | P (n) `e vera} e N \ S = {n N |
P (n) `e falsa}. Se P (0) `e vera si ha 0 < n = min N \ S e per ogni m < n si
deve avere che P (m) `e vera ovvero m S. Supponendo quindi che

3 ORDINI

58

P (0) `e vera e inoltre


se P (m) `e vera per ogni m < n allora P (n) `e vera
si ha che P (n) `e vera per ogni n N. Abbiamo ottenuto una nuova forma
del principio dinduzione.
Induzione transfinita
Vediamo ora una forma del principio dinduzione valido in qualunque insieme
ben ordinato: questa propriet`a `e il principio dinduzione transfinita Sia
(X, ) un qualunque insieme ordinato. Per ogni x X denotiamo (x) il
segmento iniziale ovvero linsieme
def

(x) = {y X | y < x}
Sia (X, ) ben ordinato. Sia S X un sottoinsieme che soddisfa lipotesi
induttiva
(x) S x S
Allora S = X. Infatti, X \ S =
6 ha un minimo x = min X \ S. Se y < x
allora y S quindi (x) S e per ipotesi x S: assurdo!
Ad esempio, se X = N ed S N `e come sopra, si ha che (0) = e quindi
0 S. Se n N si ha (n) = n in quanto m < n equivale a m n (per
2.9). Inoltre, se n 6= 0, (n) = n S se e solo se m S per ogni m < n.
Per lipotesi induttiva n S ovvero S `e apodittico. Linduzione transfinita
coincide con linduzione per linsieme ben ordinato dei numeri naturali.
Sia X = N {N} con lordinamento dei numeri naturali trattando N come
un numero naturale: n < m se n m per ogni n, m N {N}. Si vede
facilmente che (X, ) `e ben ordinato. In X vale dunque linduzione transfinita. Non vale per`o linduzione: N X `e apodittico! Per ulteriori propriet`a
di tali insiemi ben ordinati si veda lAppendice A.2.

3 ORDINI

3.3

59

Insiemi completi

Sia (X, ) un insieme ordinato e sia Y X non vuoto. Un elemento x X


tale che x y per ogni y Y si dice minorante di Y in X. Analogamente,
un elemento x X tale che y x per ogni y Y si dice maggiorante di Y
in X. Indichiamo con Y e Y linsieme dei minoranti e maggioranti di Y in
X. Diciamo che Y `e inferiormente limitato se Y 6= e che `e superiormente
limitato se Y 6= . Diciamo che Y `e limitato se `e inferiormente e superiormente limitato. Chiaramente si ha che min Y = Y Y e max Y = Y Y se
esistono. Il massimo dei minoranti si dice estremo inferiore e si indica con
def

inf Y = max Y
Il minimo dei maggioranti si dice estremo superiore e si indica
sup Y = min Y
def

Se (X, ) `e totalmente ordinato ogni sottoinsieme finito non vuoto Y X `e


limitato in quanto min Y = inf Y e max Y = sup Y esistono (per 3.1). Ecco
un esempio dinsieme limitato ma non finito. Sia
Y ={

1
| n N+ } X = Q
n

Si ha che sup Y = max Y = 1 ma non esiste min Y . Linsieme dei minoranti


`e Y = Q {0}. Infatti se r = m/n Q `e positivo allora 1/(n + 1) < r. Si
ha che inf Y = max Y = 0.
Proposizione 3.4 Ogni sottoinsieme limitato di Z `e finito. In particolare,
ogni sottoinsieme limitato di Z ha minimo e massimo.
Dimostrazione:
Se Y `e limitato allora esiste un minorante z Y e un
0
maggiorante z Y . Quindi z y z 0 per ogni y Y . In altre parole
def
Y [z, z 0 ] = {t Z | z t z 0 } e quindi basta mostrare che questultimo `e
finito. Se z = z 0 allora Y = {z} `e finito. Supponiamo che z 6= z 0 e dunque
z < z 0 ovvero z 0 z N+ `e positivo. Inoltre, si ha f : [z, z 0 ] [0, z 0 z]
definita da f (t) = t z bigettiva. Dunque basta dimostrare che [0, n] `e finito
per ogni n N+ . Si vede per induzione che n + 1 = [0, n].

3 ORDINI

60

Proposizione 3.5 Sia Y Z un sottoinsieme non vuoto.


(a) Se Y `e inferiormente limitato ha minimo.
(b) Se Y `e superiormente limitato ha massimo.
Dimostrazione: (a) Se Y 6= allora esiste z Y minorante z y per ogni
def
y Y . Siccome z y per ogni y Y allora Y z = {y z | y Y } N.
Siccome N `e ben ordinato esiste min Y z = y z per qualche y Y . Si ha
che y z y z per ogni y Y e quindi y = min Y (per 2.33).
(b) Analogamente: se Y 6= allora esiste z Y maggiorante y z per
def
ogni y Y . Quindi z Y = {z y | y Y } N. Siccome N `e ben ordinato
esiste min z Y = z y. Quindi z y z y ovvero y y per ogni y Y

(per 2.33). Quindi y = max Y .

In generale si ha che:
Proposizione 3.6 Sia (X, ) un insieme ordinato. Ogni sottoinsieme non
vuoto inferiormente limitato di X ha estremo inferiore se e solo se ogni
sottoinsieme non vuoto superiormente limitato di X ha estremo superiore.
Dimostrazione: Sia Y un sottoinsieme non vuoto inferiormente limitato di
X e sia Y linsieme dei minoranti di Y . Quindi Y non vuoto `e superiormente
limitato in quanto ogni elemento y Y `e un maggiorante. Supponendo
che ogni sottoinsieme non vuoto superiormente limitato di X ha estremo
superiore si ha che x = sup Y esiste. Siccome x `e il minimo dei maggioranti
si ha che x y per ogni y Y . Quindi x `e un minorante di Y e quindi x Y .
In conclusione x = max Y = inf Y . Viceversa si ragiona analogamente.

Diciamo che un insieme ordinato (X, ) `e completo se ogni sottoinsieme


non vuoto superiormente limitato di X ha estremo superiore. Se X `e completo anche ogni sottoinsieme non vuoto inferiormente limitato ha estremo
inferiore (per 3.6). Ad esempio, (Z, ) `e completo.
Se (X, ) `e un insieme ordinato completo, f : X X una funzione monot`ona e supponiamo che esistano elementi a, b X tali che
a f (a) f (b) b

3 ORDINI

61

allora si vede che esiste c X tale che a c b e f (c) = c ovvero f ha un


punto fisso. Infatti, basta considerare
Y = {x X | a x b & x f (x)}
Si vede (per esercizio!) che c = inf Y .

3.4

Reticoli

Diciamo che un insieme ordinato (X, ) `e un reticolo se per ogni x, y X


esiste inf{x, y} X e sup{x, y} X. Diciamo che `e un reticolo completo se
def
`e completo come insieme ordinato. In un reticolo denotiamo xy = inf{x, y}
def
e x y = sup{x, y}. Chiaramente si ha che
xy xy =x xy =y
Un insieme totalmente ordinato `e dunque un reticolo (per 3.1). In un reticolo,
per ogni x, y, z X si ha:
xx=x & xx=x
xy =yx & xy =yx
x (x y) = x (x y) = x
x (y z) = (x y) z & x (y z) = (x y) z
Ad esempio, sia S un insieme e sia X = P(S) linsieme delle parti ordinato
per inclusione. Allora (X, ) `e un reticolo completo. In questo caso A B =
A B e A B = A B per ogni A, B S. In effetti, si ha che = min X
e S = max X e dunque ogni famiglia Y = {A, . . .} X di sottoinsiemi `e
limitata. Inoltre, lintersezione e lunione
\
[
inf Y =
AX
sup Y =
AX
AY

AY

costituiscono lestremo inferiore e lestremo superiore della famiglia Y . Per


vedere che lunione `e sup Y basta ricordare che lunione di tutti gli A Y
`e il pi`
u piccolo insieme che contiene tutti gli A Y . Analogamente si vede
che lintersezione `e inf Y in quanto `e il pi`
u grande insieme contenuto in tutti
gli A Y .

3 ORDINI

62

Lemma 3.7 In un reticolo (X, ) si ha che


x (y z) = (x y) (x z)
se e solo se
x (y z) = (x y) (x z)
per ogni x, y, z X.
Dimostrazione: Infatti, assumendo valida la prima formula per ogni x, y, z
X si ha che (xy)(xz) = [(xy)x][(xy)z] = x[(z x)(z y)] =
[x (z x)] (z y) = x (z y). Analogamente, assumendo la seconda si
ricava la prima.

Diciamo che un reticolo `e distributivo se vale una e quindi entrambe le formule del Lemma 3.7. Il reticolo (P(S), ) `e distributivo (per 1.1).
Un reticolo distributivo si dice reticolo di Boole se ha minimo 0 X,
massimo 1 X e per ogni x X esiste x0 X tale che
x x0 = 0 & x x0 = 1
Si noti subito che un tale x0 X in un reticolo distributivo `e unico. Infatti,
se x ha questa propriet`a allora
x = x 1 = x (x x0 ) = (x x) (x x0 ) = 0 (x x0 ) = x x0
e quindi x x0 . Analogamente si ha x0 x e dunque x = x0 . Un tale x0 si
dice complementare di x in X. Si ha dunque (x0 )0 = x e associando x 7 x0
si ottiene una funzione X X invertibile. Si ha inoltre che
x y = 0 x y0
Si ottiene, di conseguenza, che se x y allora y 0 x0 e infine
(x y)0 = x0 y 0 & (x y)0 = x0 y 0
In conclusione, il reticolo completo (P(S), ) `e un reticolo di Boole ponendo
def
A0 = S \ A per A S. Se S = 1 e quindi P(S) = 2 `e anche totalmente
ordinato. Viceversa, se X `e un reticolo di Boole totalmente ordinato allora
X = 2 come insieme totalmente ordinato.

3 ORDINI

3.5

63

Insiemi continui

Diciamo che un insieme ordinato (X, ) `e continuo se `e completo e denso.


Ad esempio, (Q, ) `e denso ma non completo: ecco un esempio dinsieme
limitato senza estremo superiore
Y = {r Q+ | r2 < 2} X = Q
Si vede (per esercizio! utilizzando 4.19 per`o) che non esiste estremo superiore
di Y in X. Quindi (Q, ) non `e completo.
Tagli di Dedekind
Diciamo che un sottoinsieme proprio S X di un insieme ordinato (X, ) `e
un taglio di Dedekind se:
S 6=
@ max S
xS &yxyS
Consideriamo linsieme
def

D(X) = {S | S taglio di Dedekind di X} P(X)


ordinato per inclusione.
Lemma 3.8 Se (X, ) `e un insieme ordinato allora (D(X), ) `e completo.
Dimostrazione: Sia Y = {S, . . .} D(X) una famiglia di tagli di Dedekind
che costituisce un sottoinsieme non vuoto superiormente limitato. Sia
[
def
U=
S
SY

Mostriamo che U D(X) `e un taglio di Dedekind e quindi U = sup Y .


Infatti, esiste T D(X) maggiorante ovvero S T per ogni S Y e quindi
U T X e chiaramente U `e non vuoto. Inoltre U non ha massimo in
quanto nessun S ha massimo. Infine, x U e y x implica che x S per
qualche S Y ma allora y S e quindi y U . Dunque U = sup Y D(X).

3 ORDINI

64

Lemma 3.9 Un insieme totalmente ordinato (X, ) `e denso se e solo se


ogni segmento iniziale non vuoto `e un taglio di Dedekind.
Dimostrazione:
Sia (x) = {y X | y < x} X un segmento iniziale
non vuoto. Per mostrare che (x) `e un taglio di Dedekind basta osservare
che non ha massimo. Se m = max (x) siccome X `e denso esiste t X tale
che m < t < x e quindi t (x): assurdo! Viceversa, siano x, y X tali che
x < y. Dunque (y) 6= in quanto x (y) e allora (y) `e un taglio di
Dedekind per ipotesi. Se t x per ogni t (y) si ha una contraddizione
con lipotesi che (y) non ha massimo: deve esistere t (y) tale che
x < t < y ovvero X `e denso.

Lemma 3.10 Sia (X, ) un insieme totalmente ordinato completo. Se un


sottoinsieme S X `e un taglio di Dedekind allora S `e un segmento iniziale
non vuoto.
Dimostrazione:
Sia y X \ S. Si ha x < y per ogni x S e dunque
linsieme dei maggioranti S 6= in quanto y S `e un maggiorante. Siccome
S `e superiormente limitato e (X, ) `e completo esiste s = inf S = min S .
Mostriamo che (s) = S. Siccome S non ha massimo si ha s 6 S. Dunque
S (s). Infine, se y < s allora y S in quanto se y 6 S allora y `e un
maggiorante ma s `e il minimo dei maggioranti. Quindi (s) S.

Se (X, ) `e totalmente ordinato si ha che (x) = se e solo se x = min X.


Supponendo X privo di minimo ma denso allora per 3.9 si ottiene
: X D(X)
una funzione iniettiva (verificare!?) che associa x 7 (x). Se X ha minidef
mo basta considerare D (X) = D(X) {} e si ottiene analogamente.
Considerando in D(X) oppure D (X) lordinamento per inclusione siccome
x < y implica (x) (y) si ha che `e una funzione iniettiva monot`ona.
Sia (X, ) un insieme totalmente ordinato continuo: per 3.9 e 3.10 si ha che
un sottoinsieme S X `e un taglio di Dedekind se e solo se S `e un segmento
iniziale non vuoto. Si ha dunque che `e invertibile in questo ultimo caso.
In conclusione si ha:

3 ORDINI

65

Teorema 3.11 (Dedekind) Se (X, ) totalmente ordinato privo di minimo


`e denso allora (D(X), ) `e totalmente ordinato e continuo, : X D(X) `e
iniettiva monot`ona ed `e invertibile se X `e continuo. (Un analogo enunciato
vale per D (X) qualora X sia dotato di minimo).
Dimostrazione: Se (X, ) `e totalmente ordinato allora ogni taglio di Dedekind `e unione di segmenti iniziali. Sia S D(X) allora si ha
[
S=
(x)
xS

Infatti, (x) S per ogni x S; viceversa, se y S siccome S non ha


massimo deve esistere x S tale che y < x e quindi y (x) (altrimenti
x y per ogni x S).
Per vedere che D(X) `e totalmente ordinato sia S * S 0 . Esiste x S tale che
x 6 S 0 . Allora x0 < x per ogni x0 S 0 (ovvero x `e un maggiorante di S 0 ).
Quindi S 0 (x) S. Abbiamo cos` dimostrato che S S 0 oppure S 0 S
per ogni S, S 0 D(X).
Per vedere che D(X) `e denso sia S S 0 . Esiste x0 S 0 tale che x0 6 S.
Allora x < x0 per ogni x S (ovvero x0 `e un maggiorante di S). Quindi
S (x0 ) S 0 . Se (x0 ) 6= S allora T = (x0 ) `e un taglio di Dedekind (per 3.9) tale che S T S 0 . Se S = (x0 ) sia x00 S 0 tale che
x0 (x00 ) S 0 . Allora si ha che S = (x0 ) (x00 ) S 0 . Dunque
T = (x00 ) `e tale che S T S 0 e con questo abbiamo dimostrato che
D(X) `e denso.
Infine, per 3.8 si ha che D(X) `e completo e le restanti affermazioni seguono
da 3.9 e 3.10 come gi`a osservato.

3.6

Numeri reali e complessi


def

Definiamo linsieme dei numeri reali R = D(Q) ovvero


def

R = {x | x taglio di Dedekind di Q} P(Q)

3 ORDINI

66

Siccome (Q, ) `e denso e privo di minimo i segmenti iniziali (r) per ogni
r Q sono tagli di Dedekind (per 3.9) e si ha
: Q , R
la funzione iniettiva monot`ona che associa r 7 (r) rispetto allordinamento per inclusione dei tagli di Dedekind. Per il Teorema 3.11 si ha che R `e
totalmente ordinato e continuo. Si definiscono facilmente somma e prodotto di numeri reali come somma e prodotto di tagli di Dedekind di Q. Segue
inoltre che in R valgono propriet`a analoghe di somma e prodotto gi`a elencate
per Q e infatti deducibili da quelle di Q.
Siano x, y R. Se x y scriviamo che x y osservando che s < r per
def
r, s Q se e solo se (s) (r). Denotiamo (0) = 0 R. Sia
def

R+ = {x R | x > 0}
Definiamo la somma di numeri reali
def

x + y = {r + s | r x & s y} R
def

Si ha che 0 + x = x e se x, y R+ allora x + y R+ . Sia (r) = (r)


per ogni r Q e sia
def

x = {r | r Q \ x} R
altrimenti. Si ha che x R+ se x < 0 e inoltre x + (x) = 0 per ogni
x R. Definiamo il prodotto di numeri reali x, y R+ ponendo
def

x y = Q \ {r s | r Q \ x & s Q \ y} R
def

def

Si ha che x (1) = x. Denotiamo (1) = 1 R. Sia 1/ (r) = (1/r)


per ogni r 6= 0, r Q e se x R+ sia

1 def 1
= { | r Q \ x} (0) {0} R
x
r

Si ha che R+ soddisfa le propriet`a elencate per Q+ nel Lemma 2.36. Se


x 6= 0 e x 6 R+ si ha dunque che x R+ e si ottiene facilmente un
prodotto x y R per ogni x, y R.

3 ORDINI

67

Proposizione 3.12 La funzione iniettiva monot`ona


: Q , R
che associa r 7 (r) `e tale che (r + s) = (r) + (s), (r s) =
(r) (s), (0) = 0 e (1) = 1.
Dimostrazione:

Segue dalla costruzione di somma e prodotto in R.

In R valgono propriet`a analoghe di somma e prodotto elencate per Q la cui


verifica `e lasciata al lettore per esercizio.
Numeri complessi
Definiamo linsieme dei numeri complessi come linsieme prodotto
def

C=RR
costituito da coppie ordinate di numeri reali (x, y) C. Disponiamo in
questo modo di una funzione iniettiva
: R , C
def

che associa x 7 (x) = (x, 0). Definiamo somma e prodotto di numeri


complessi (x, y) e (x0 , y 0 ) in C come segue:
def

(x, y) + (x0 , y 0 ) = (x + x0 , y + y 0 )
def

(x, y) (x0 , y 0 ) = (xx0 yy 0 , xy 0 + yx0 )


In questo modo si ha che (x + x0 ) = (x) + (x0 ) e (x x0 ) = (x) (x0 ) e
possiamo identificare R con limmagine di in C. Denotiamo z = (x, y) C.
def
def
Si ha che (0) = 0 C tale che 0 + z = z e z + (z) = 0 con z = (x, y).
def
Si ha (1) = 1 C con 1 z = z e per ogni z 6= 0 esiste 1/z C (verificare
per esercizio!).
In conclusione, si ha che in C valgono propriet`a analoghe di somma e prodotto gi`a elencate per Q e R tranne lordinamento totale! Per z = (x, y) C e
z 0 = (x0 , y 0 ) C possiamo definire z z 0 se x y e y y 0 . In questo modo

3 ORDINI

68

(C, ) risulta ordinato e la funzione iniettiva : R , C `e monot`ona: ma


(1, 0) e (0, 1) non sono confrontabili e quindi lordine non `e totale. Inoltre
(0, 1)2 = (1, 0) in C. Non esiste dunque un sottoinsieme di elementi positivi
(come abbiamo visto per Q nel Lemma 2.36).
def

Ponendo i = (0, 1), si ha dunque che i2 = 1 e per ogni numero complesso


z C si ha
z = (x, 0) + (0, y) = (x, 0) + (0, 1) (y, 0)
e quindi z si pu`o riscrivere come x + iy in modo unico con x, y R. Si dice
che x `e la parte reale e la y `e la parte immaginaria del numero complesso
def
z. Il numero complesso z = x iy C si dice complesso coniugato di
z = x + iy C (non `e altro che il simmetrico rispetto allasse reale). Si vede
facilmente che:
def

Lemma 3.13 Per z = x + iy C il coniugato z = x iy C `e tale che:


z=z
zR z=z
Per ogni z, z 0 C si ha:
z + z0 = z + z0
z z0 = z z0
La funzione
def

: C C z 7 z = (z)
preserva quindi somma e prodotto; inoltre, |R = idR , `e invertibile e 1 =
. Si ottiene inoltre una funzione
def

: C R z = x + iy 7 z z = x2 + y 2 = (z)
Non `e difficile mostrare che:
(z) R+ se z 6= 0 e si ha (z) = 0 se e solo z = 0
(z z 0 ) = (z) (z 0 ) e inoltre (1) = 1
per ogni z, z 0 C. Notare che (z + z) < (z) + (z) per ogni z = iy non
nullo. Si pu`o infine facilmente descrivere linverso moltiplicativo di z 6= 0
come
1
1
=z
z
(z)

3 ORDINI

69

Quaternioni
Linsieme dei quaternioni (di Hamilton) `e linsieme prodotto
def

H=CC = RRRR
di numeri reali. Disponiamo in questo modo di una funzione iniettiva
: C , H
def

che associa z 7 (z) = (z, 0). Definiamo somma e prodotto di quaternioni


(z, t) H e (z 0 , t0 ) H come segue:
def

(z, t) + (z 0 , t0 ) = (z + z 0 , t + t0 )
def

(z, t) (z 0 , t0 ) = (zz 0 tt0 , zt0 + tz 0 )


Si ha che (z + z 0 ) = (z) + (z 0 ) e (z z 0 ) = (z) (z 0 ) e possiamo
identificare C con limmagine di in H. Denotiamo q = (z, t) H. Si ha che
def
def
(0) = 0 H tale che 0+q = q e q+(q) = 0 con q = (z, t). Osserviamo
che per x R si ha
(x, 0) (z, t) = (xz, xt) = (z, t) (x, 0)
ovvero
xq =qx
def

per x R. Si ha (1) = 1 H con 1 q = q 1 = q per ogni q H. Per


def
j = (0, 1) si ha che j 2 = 1. Bisogna fare attenzione poich`e
(z, 0) (0, 1) = (0, z) = (0, 1) (z, 0)
ovvero
zj =jz
per z C. Dunque

q q 0 6= q 0 q

per q, q 0 H. A parte ci`o le propriet`a gi`a stabilite per i numeri complessi


valgono anche per i quaternioni. Ogni quaternione q H si scrive comunque
q = z + jt in modo unico per z, t C. Siccome z = x + iy e t = x0 iy 0 con
x, y, x0 , y 0 R si ha che ogni quaternione q si riscrive anche come
q = x + iy + jx0 + ky 0

3 ORDINI

70

def

con k = ji = ij tale che k 2 = 1 e x, y, x0 , y 0 R. Infine, per ogni q 6= 0


def
esiste 1/q H. Infatti, per q = z + jt definiamo il coniugato q = z jt in
modo che si ha una funzione
def

: H R q = z + jt 7 q q = q q = zz + tt = (q)
tale che:
(q) R+ se q 6= 0 e si ha (q) = 0 se e solo q = 0
(q q 0 ) = (q) (q 0 ) e inoltre (1) = 1
per ogni q, q 0 C. Si ottiene quindi linverso moltiplicativo di un quaternione
q 6= 0 come
1
1
=q
q
(q)

Attenzione! Osserviamo, in conclusione, che dallesistenza di un insieme apodittico abbiamo ottenuto gli insiemi
N , Z , Q , R , C , H
dei numeri naturali, interi, razionali, reali, complessi e infine i quaternioni.
Si `e tentati di continuare a definire in Rn con n > 4 somma e prodotto con
propriet`a analoghe alle precedenti! Un importante teorema stabilisce che
questo non `e possibile: R, R2 e R4 sono gli unici insiemi dotati di somma e
prodotto compatibili con quelle di R per cui esistono gli inversi moltiplicativi.
Inoltre, R `e lunico che `e totalmente ordinato e completo.

4 ARITMETICA

71

Aritmetica

Abbiamo visto che Z ha un ordinamento naturale che estende quello di N


determinato dalla somma ovvero dalla funzione successore. Esiste per`o una
relazione dordine in N e Z indotta dalla moltiplicazione che non abbiamo
ancora considerato.

4.1

Divisione

Dati a, b Z diciamo che b divide a se esiste c Z tale che a = bc.


Scriviamo b|a se b divide a. Scriviamo a per indicare a oppure a. Si vede
facilmente che per ogni a Z si ha 1|a, a|a, a|0 ma 0|a a = 0 e infine
a| 1 a = 1. Inoltre si ha:
c|b & b|a c|a
per ogni a, b, c Z e quindi (Z, | ) `e un preordine. Osserviamo per`o che
non `e un ordine in quanto | non `e antisimmetrica! Infatti, se a|b e b|a allora
b = a ovvero b = a oppure b = a.
Diciamo che 1 e a sono divisori impropri di a Z. Se possiamo scrivere
a = bc con b e c interi diversi da 1 e a allora diciamo che b e c sono divisori
propri di a. Diciamo anche che a `e un multiplo di b e di c.
Un intero a Z tale che a 6= 0, 1 `e un numero primo se non ha divisori
propri ovvero ha solamente divisori impropri: se a = bc allora b e c sono 1
oppure a.
Massimo comun divisore
Un intero d tale che d|a e d|b si dice divisore comune di a, b Z. Un intero d
`e un massimo comun divisore di a e b se d `e un divisore comune e se inoltre
def
d0 `e un altro divisore comune allora d0 |d. Denotiamo d = (a, b) un massimo
comun divisore: se esiste `e unico a meno del segno! Diciamo che a e b sono
coprimi se (a, b) = 1.
Lemma 4.1 Siano a, b Z non entrambi nulli. Per ogni a0 , b0 , c Z si ha:
(1) c|a & c|b c|aa0 + bb0

4 ARITMETICA

72

(2) a|a0 & b|b0 ab|a0 b0


(3) c|a & c|b & c = aa0 + bb0 c = (a, b)
(4) c = (a, b) a = ca1 & b = cb1 & 1 = (a1 , b1 )
Dimostrazione: (1) Sia a = ct e b = cs da cui aa0 + bb0 = c(ta0 + sb0 ).
(2) Sia a0 = at e b0 = bs da cui a0 b0 = abts.
(3) Per la (1) se d `e divisore comune di a e b allora divide c e quindi c `e
massimo comune divisore.
(4) Si ha che a = ca1 e b = cb1 in quanto c `e un comune divisore. Se d|a1
e d|b1 allora cd|a e cd|b dunque cd| c. Quindi si ha che c = cdd0
per qualche d0 Z ovvero c(1 dd0 ) = 0 e quindi d = 1.

Lemma 4.2 (Divisione con resto) Siano n, m N con m 6= 0. Esistono e


sono unici q, r N tali che
n = qm + r
e inoltre r < m.
Dimostrazione: Sia S linsieme dei n N per cui esistono q, r N tali che
n = qm+r e r < m. Se esistono sono unici: infatti, sia n = qm+r = q 0 m+r0
con r, r0 < m. Supponiamo che r r0 quindi r0 r = m(q q 0 ) r0 < m
ovvero q = q 0 e r = r0 . Chiaramente si ha che 0 S per q = r = 0. Sia
n S. Dunque n = qm+r con r < m. Se r < m1 allora n+1 = qm+r +1
con r + 1 < m. Se r = m 1 allora n + 1 = (q + 1)m. In entrambi i casi
n + 1 S. Per induzione S = N.

Teorema 4.3 Siano a, b Z con b 6= 0. Esistono e sono unici q, r Z tali


che
a = qb + r
e inoltre 0 r < |b| dove |b| = b se b N+ `e positivo e |b| = b se b N `e
negativo.
def

def

4 ARITMETICA
Dimostrazione:

73

Consideriamo i seguenti casi:

a 0 & b > 0 Questo caso `e stato dimostrato nel Lemma 4.2.


a < 0 & b > 0 Si ha che a > 0 e quindi a = qb + r con 0 r < b per il
Lemma 4.2. Se r = 0 allora a = (q)b e se r 6= 0 allora b r N+ `e positivo
e si ha a = (q 1)b + b r con b r < b.
a Z & b < 0 Si ha che b > 0 e per i casi precedenti si ha a = q(b) + r
con 0 r < b e inoltre b = |b|.
Mostriamo lunicit`a: supponiamo a = qb + r = q 0 b + r0 con 0 r, r0 < |b|.
Supponiamo che r r0 quindi 0 r0 r = b(q q 0 ) e quindi |b(q q 0 )| =
|b||q q 0 | = r0 r r0 < |b|. Dunque |q q 0 | < 1 da cui segue q = q 0 e inoltre
r = r0 .

Teorema 4.4 Siano a, b Z non entrambi nulli. Esiste d = (a, b) un


massimo comune divisore e si scrive d = na + mb per qualche n, m Z.
def

Dimostrazione: Sia S = {d N+ | d = ax + by x, y Z} N. Si ha che


S 6= in quanto a oppure b `e non nullo. Dunque S ha minimo (per 3.3), sia
d = na + mb = min S. Vediamo che d = (a, b). Dividendo a per d, per il
Teorema 4.3, possiamo scrivere a = dq + r con 0 r < d. Quindi si ha che
r = a dq = a (na + mb)q = a(1 nq) + b(mq)
Se r 6= 0 allora r S ma r < d: assurdo! Dunque r = 0 quindi a = dq
ovvero d|a. Analogamente d|b dividendo b per d, per il Teorema 4.3. Siccome
d = na + mb allora d `e il massimo comun divisore di a e b (per il Lemma 4.1
ogni d0 divisore comune di a e b `e un divisore di d).

Corollario 4.5 Siano a, b Z. Si ha che a e b sono coprimi se e solo se


1 = na + mb per qualche n, m Z. Inoltre, se a e b sono coprimi allora
a|bc a|c

4 ARITMETICA

74

per ogni c Z.
Dimostrazione:
Se (a, b) = 1 per il Teorema 4.4 possiamo scrivere 1 =
na + mb. Viceversa, per il Lemma 4.1 (3). Quindi c = nac + mbc ma a|ac e
a|bc quindi a|c per il Lemma 4.1 (1).

Possiamo ora mostrare una importante caratterizzazione dei numeri primi in


termini di divisori. Notiamo che se p `e un numero primo e p non divide a
allora lunico divisore comune di p e a `e 1. Dunque 1 = (p, a) ovvero p e
a sono coprimi.
Proposizione 4.6 Un intero p 6= 0, 1 `e un numero primo se e solo se per
ogni a, b Z se p|ab allora p|a oppure p|b.
Dimostrazione:
Sia p primo e p|ab ma supponiamo che p non divida a.
Quindi p e a sono coprimi e per il Corollario 4.5 si ha che p|b. Viceversa,
se p non `e primo si ha che p = ab con a e b divisori propri di p. Quindi p
non divide a in quanto a = pc implica a = abc ovvero b = 1 e a = p.
Analogamente p non divide b ma p|ab.

Minimo comune multiplo


Se a, b Z e m Z `e multiplo comune di a e b ovvero a|m e b|m e
per ogni multiplo comune m0 di a e b si ha che m|m0 allora m si dice
minimo comune multiplo di a e b. Possiamo ora mostrare lesistenza del
minimo comune multiplo.
Teorema 4.7 Siano a, b Z non entrambi nulli. Si ha che

ab
(a, b)

`e un minimo comune multiplo di a e b.


Dimostrazione: Per il Teorema 4.4 esiste d = (a, b) e per il Lemma 4.1 si
def
ha che a = da1 e b = db1 con 1 = (a1 , b1 ). Dunque m = a1 b = a1 db1 =
ab1 `e un multiplo comune. Sia m0 = ax = by multiplo comune. Dunque

4 ARITMETICA

75

da1 x = db1 y ovvero a1 x = b1 y (per 2.31). Per il Corollario 4.5 si ha che


a1 |y e b1 |x ovvero y = a1 y1 e x = b1 x1 . In conclusione m0 = ax = ab1 x1 =
mx1 ovvero m|m0 .

Algoritmo di Euclide
Si pone dunque il problema di trovare d = (a, b) un massimo comun divisore di a, b Z non entrambi nulli. Infatti, la dimostrazione della sua esistenza
che sfrutta il buon ordinamento di N non `e costruttiva (vedere Teorema 4.4).
Dati a, b Z con b 6= 0 si ha (per 4.3)
a = q1 b + r1
Se r1 = 0 allora b|a e quindi (a, b) = b = 0a + 1b. Se r1 6= 0 allora si ottiene
b = q2 r1 + r2
con r2 < r1 < |b|, etc. si ha
ri1 = qi+1 ri + ri+1
per ri N e ri+1 < ri < < |b|. Dunque esiste k N tale che rk+1 = 0. Si
ha rk1 = qk+1 rk ovvero rk |rk1 e inoltre
(a, b) = (b, r1 ) = (r1 , r2 ) = = (rk1 , rk ) = rk
Infatti, si ha
c|b & c|r1 & a = q1 b + r1 c|a
c|a & c|b & r1 = a q1 b c|r1
ovvero (a, b) = (b, r1 ), etc. Per trovare rk = na+mb basta sostituire a ritroso.
Ad esempio, se r3 = 0 allora (a, b) = r2 = b q2 r1 = b q2 (a q1 b) e quindi
n = q2 a mentre m = 1 + q1 q2 .

4 ARITMETICA

76

Sistemi di numerazione
Siano n, m N e m > 1. Dividendo n per m si ottiene (per 4.3)
n = q 1 m + a0
Se n < m allora n = a0 . Se q1 6= 0 ovvero n m possiamo dividere ancora
q1 per m e si ottiene
q 1 = q 2 m + a1
con q2 < q1 e q2 6= 0 se q1 m. Sostituendo si ha
n = q 2 m 2 + a1 m + a0
Procedendo in questo modo si ottengono
qi = qi+1 m + ai
tali che ai < m e qi+1 < qi . Quindi esiste k N tale che qk+1 = 0 ovvero
qk = ak . Esistono dunque a0 , . . . , ak N con ai < m tali che
n = a0 + a1 m + a2 m2 + + ak mk
in modo unico per qualche k N. I numeri a0 , . . . , ak N si dicono cifre
di n e il numero m si dice base del sistema di numerazione. Il numero n in
base m si scrive
n(m) = ak a0
Si ha che
m(m) = 10
e quindi m = 10 ovvero il sistema decimale risulta conveniente. Il sistema
binario ovvero in base 2 `e anche molto conveniente perch`e permette di riscrivere ciascun numero naturale mediante una sequenza di 0 e 1. Ad esempio,
7(2) = 111. Ritorneremo su questo argomento con il Lemma 4.29.
Fattorizzazione unica
Si ha il seguente fondamentale teorema dellaritmetica:

4 ARITMETICA

77

Teorema 4.8 Sia a Z, a 6= 0, 1. Si ha


a = p1 pk
dove pi N+ sono numeri primi e k N+ . Inoltre, tali p1 , . . . , pk sono unici
(a meno di ripeterli e scambiarli tra loro).
Dimostrazione: Sia a N+ . Per a = 2 si ha un primo e se a > 2 e non `e
primo allora a = bc con 1 < b < a e 1 < c < a. Per induzione, supponendo
vero lenunciato per b e c si ottiene lenunciato per a. Se a N allora
a N+ e quindi si conclude lesistenza della fattorizzazione in primi per
ogni a Z. Per lunicit`a, supponiamo a = p1 pk = p01 p0k e a non
primo. Siccome p1 | p01 p0k , per la Proposizione 4.6 allora p1 | p0j per
qualche j e quindi p1 = p0j . Per induzione (perch`e!?) si conclude.

Corollario 4.9 (Euclide) Esistono infiniti numeri primi.


Dimostrazione: Se {p1 , . . . , pn } fosse linsieme finito di tutti i primi allora
a = p1 pn + 1 avrebbe resto 1 nella divisione per ogni primo ovvero nessun
primo dividerebbe a e quindi, per la fattorizzazione unica in numeri primi,
si avrebbe un assurdo!

4.2

Congruenze

Vediamo ora che relazione intercorre tra un numero intero e il resto della
divisione per un intero fissato. Sia m Z con m > 1 fissato. Per ogni a Z
sia a = qm + r con 0 r < m il resto della divisione di a per m. Abbiamo
dunque che a r = qm e quindi m|a r.
Siano a, b Z e m N. Diciamo che a e b sono congruenti modulo m se
m divide la differenza a b ovvero a b = nm per qualche n Z. Si vede
facilmente che:
Lemma 4.10 La congruenza modulo m `e una relazione di equivalenza su Z.

4 ARITMETICA

78

Denotiamo a m b se a e b sono congruenti modulo m. Sia


def

[a]m = {b Z | a m b}
una classe di congruenza e infine
def

Zm = {[a]m | a Z}
linsieme quoziente Z/ m . Osserviamo che:
m = 0 si ha a 0 b se e solo se a = b e quindi Z0 = Z
m = 1 si ha che a 1 b per ogni a, b Z e quindi Z1 `e un singoletto
m > 1 si ha che a m b se e solo se b = a + nm con n Z
Se m > 0 e a Z allora la classe di equivalenza
[a]m = {. . . , a 2m, a m, a, a + m, a + 2m, . . .}
`e un insieme infinito. Infatti, si ha che n 7 a + nm `e una funzione iniettiva
da N a [a]m . Daltra parte abbiamo che:
Lemma 4.11 Se m > 0 allora
Zm = {[0]m , [1]m , . . . , [m 1]m }
`e un insieme finito di cardinalit`a |Zm | = m > 0.
Dimostrazione:
Per ogni a Z sia a = qm + r la divisione con resto
0 r < m. Quindi si ha a m r e di conseguenza [a]m = [r]m per qualche
r {0, 1, . . . , m 1}. Dunque Zm {[0]m , [1]m , . . . , [m 1]m }. Inoltre, se
a, b {0, 1, . . . , m 1} e b < a allora 0 < a b < m e quindi [a]m 6= [b]m .

Ad esempio, per m = 2 abbiamo Z2 = {[0]2 , [1]2 } dove [0]2 = {2n | n Z}


sono glinteri pari e [1]2 = {2n + 1 | n Z} sono glinteri dispari.
Si ha che:
Lemma 4.12 Siano a, b, a0 , b0 Z
a m a0 & b m b0 a + b m a0 + b0 & aa0 m bb0

4 ARITMETICA

79

Se c Z tale che (c, m) = 1 allora


ac m bc a m b
Dimostrazione: Infatti se m|(a a0 ) e m|(b b0 ) allora m|(a a0 ) + (b b0 )
e inoltre m|b(a a0 ) + a0 (b b0 ) dal Lemma 4.1. Inoltre, se m|c(a b) allora
m|(a b) per il Corollario 4.5

Possiamo quindi definire somma e prodotto di classi di congruenza come la


classe di congruenza della somma e del prodotto. Infatti, per quanto appena
visto, questa definizione non dipende dalla scelta del rappresentante della
classe di congruenza. Si ha:
def

def

[a]m + [b]m = [a + b]m & [a]m [b]m = [ab]m


def

per ogni a, b Z. Ponendo [a]m = [a]m si ottiene facilmente, come


conseguenza di 2.30 e 2.31 i seguenti:
Lemma 4.13 Siano [a]m , [b]m , [c]m Zm classi di congruenza modulo m. Si
ha:
([a]m + [b]m ) + [c]m = [a]m + ([b]m + [c]m )
[a]m + [b]m = [b]m + [a]m
[a]m + [0]m = [a]m
[a]m + ([a]m ) = [0]m
Lemma 4.14 Siano [a]m , [b]m , [c]m Zm classi di congruenza modulo m. Si
ha:
([a]m [b]m ) [c]m = [a]m ([b]m [c]m )
[a]m [b]m = [b]m [a]m
[a]m [1]m = [a]m
[a]m ([1]m ) = [a]m
[a]m ([b]m + [c]m ) = [a]m [b]m + [a]m [c]m

4 ARITMETICA

80

Attenzione! Si pu`o avere [a]m [b]m = [0]m con [a]m 6= [0]m e [b]m 6= [0]
se m non `e primo! Infatti, se m non `e primo allora m = ab e si ha sempre
che [0]m = [m]m in Zm .

Osserviamo infine che considerando la proiezione sul quoziente si ha un


risultato analogo a quello in 2.32 e 2.35.
Proposizione 4.15 Si ha una funzione surgettiva
: Z
Zm a 7 [a]m
tale che (0) = [0]m , (1) = [1]m , (a + b) = (a) + (b) e (ab) = (a)(b)
per ogni a, b Z.
Ad esempio, una immediata applicazione che utilizza le congruenze `e la dimostrazione della prova del 9. Siano a0 , . . . , ak le cifre decimali di n N.
Allora n 9 a0 + +ak . Infatti, 10 9 1 quindi 10k 9 1 e inoltre ak 10k 9 ak
per ogni k N+ . Inoltre, n = a0 + a1 10 + + ak 10k 9 a0 + + ak . Di
conseguenza n `e divisibile per 9 se e solo se a0 + + ak `e divisibile per 9.

4.3

Equazioni

Siano a, b Z. Lequazione ax = b ha una soluzione intera se e solo se a|b.


Consideriamo lequazione
ax m b

ovvero

[a]m [x]m = [b]m

nellincognita x Z per m > 1. Si vede che vi possono essere soluzioni anche


se a non divide b. Infatti:
Proposizione 4.16 Sia a 6= 0 e d = (a, m). Esiste x Z tale che ax m b
se e solo se d|b. Se x0 `e una soluzione e m = m1 d tutte le soluzioni sono
x0 + nm1 al variare di n Z.
Dimostrazione:
Se x `e una soluzione allora m|ax b e quindi d|ax b.
Inoltre d|a da cui d|b. Viceversa, sia db1 = b, a = da1 e m = dm1 con
(a1 , m1 ) = 1 (per 4.1). Sia d = ha + km (per 4.4). Qundi
b = db1 = (ha + km)b1 = (hb1 )a + (kb1 )m m (hb1 )a

4 ARITMETICA

81

def

ovvero x0 = hb1 `e una soluzione. Inoltre a(x0 + nm1 ) m b + na1 dm1 m b.


Se x1 `e una soluzione siccome ax0 m ax1 si ha che m|a(x1 x0 ) da cui
a(x1 x0 ) = tm ovvero da1 (x1 x0 ) = tm1 d e quindi a1 |t (per 4.5). In
conclusione t = na1 ovvero x1 x0 = nm1 per qualche n Z.

Lemma 4.17 Siano a, b Z non entrambi nulli e c Z. Consideriamo


lequazione
ax + by = c
nelle incognite x, y Z. Sono equivalenti:
(1) ax + by = c ha soluzioni intere
(2) ax + by m c ha soluzioni per ogni m > 1
(3) d|c dove d = (a, b).
Dimostrazione:
Ovviamente (1) (2). Sia m = d e supponiamo che d
divida ax + by c. Quindi d|c e (2) (3) `e dimostrata. Sia a = da1 , b = db1
e c = dc1 con 1 = a1 x0 + b1 y0 e d = ax0 + by0 . Dunque c1 = c1 a1 x0 + c1 b1 y0
def
def
e quindi c = dc1 = ac1 x0 + bc1 y0 per cui x = c1 x0 e y = c1 y0 `e una soluzione.
In conclusione (3) (1).

Teorema 4.18 Siano a1 , , an Z non tutti nulli e siano n N+ e c Z.


Sono equivalenti:
(1) a1 x1 + + an xn = c ha soluzioni intere
(2) a1 x1 + + an xn m c ha soluzioni per ogni m > 1
(3) d|c dove d = (a1 , . . . , an ) `e un massimo comune divisore.
Dimostrazione:

Ragionando come nella dimostrazione del Lemma 4.17.

4 ARITMETICA

82

Proposizione 4.19 Siano a0 , a1 , , an Z con an 6= 0 e n N+ . Se


esiste x Q tale che a0 + a1 x + a2 x2 + + an xn = 0 allora x = a/b con
a|a0 e b|an . In particolare, se an = 1 allora x Z e x|a0 .
Dimostrazione:
Sia x = a/b con (a, b) = 1 (per 4.4 possiamo sempre
ridurre una frazione ai minimi termini). Sostituendo si ottiene
a
a2
an
a0 + a1 + a2 2 + + an n = 0
b
b
b
e quindi
a0 bn + a1 abn1 + + an an = 0
Siccome b|ai ai bni per ogni i = 0, . . . , n 1 si ha che b|an an e quindi b|an
(per 4.5) in quanto a e b sono coprimi. Analogamente a|ai ai bni per ogni
i = 1, . . . , n dunque a|a0 bn e a|a0 .

Ad esempio, xn = p con p primo e n 2 non ha soluzioni in Q. Inoltre, 1
sono le uniche soluzioni razionali di xn = 1 per ogni n N+ .
Consideriamo ora pi`
u congruenze. La formulazione originale del seguente
teorema compare gi`a attorno al 1200 in testi dei matematici cinesi Sun Zi e
Qin Jiushao.
Lemma 4.20 Siano n, m > 1. Allora esiste x Z tale che

x n a
S:
x m b
per ogni a, b Z se e solo se (n, m) = 1. Se x0 `e una tale soluzione allora
tutte le soluzioni sono x0 + nmk al variare di k Z.
Dimostrazione: Se a = 0, b = 1, n|x e m|(1x) allora x = nt e 1x = ms.
Quindi 1 = nt + ms ovvero n e m sono coprimi (per 4.5). Viceversa, x n a
x = a + ny e quindi x m b ny m b a. Supponendo (n, m) = 1
per la Proposizione 4.16 si hanno soluzioni. Inoltre, se x0 `e una soluzione
anche x0 + nmk `e una soluzione per ogni k Z. Se x1 `e unaltra soluzione
x1 x0 n 0 e x1 x0 m 0 ovvero n|x1 x0 e m|x1 x0 . Siccome (n, m) = 1
un minimo comune multiplo di n e m `e nm per il Teorema 4.7. Quindi
nm|x1 x0 ovvero x1 x0 = nmk per qualche k Z.

4 ARITMETICA

83

Teorema 4.21 (Teorema cinese del resto) Siano m1 , , mn N con mi >


1 per i = 1, . . . , n e n 2. Esiste x Z tale che

x m1 a1

x m a2
2
Sn :
..

x a
mn

per ogni a1 , , an Z se e solo se (mi , mj ) = 1 per ogni i 6= j. Se x0 `e


una soluzione tutte le soluzioni sono x0 + m1 mn k al variare di k Z.
Dimostrazione: Se ai = 0, aj = 1 ed esiste x tale che x mi 0 e x mj 1
allora per il Lemma 4.20 si ha (mi , mj ) = 1. Viceversa, il caso n = 2 `e il
Lemma 4.20. Per induzione su n > 2 supponiamo che x0 sia una soluzione
del sistema Sn1 costituito dalle prime n 1 congruenze. Sia

x m x0
0
S :
x mn an
dove m = m1 mn1 . Il sistema Sn1 `e equivalente alla congruenza x m x0 .
Infatti, se x m x0 allora x mi x0 mi ai per ogni i n 1 e ogni soluzione
x di Sn1 `e tale che x m x0 per ipotesi induttiva. Per il Lemma 4.20 il
sistema S 0 ha soluzioni in quanto (m, mn ) = 1 ovvero (mi , mn ) = 1 per
ogni i 6= n. Inoltre, se x0 `e una soluzione di S 0 allora x0 + mmn k al variare
di k Z son tutte e sole le soluzioni di S 0 . Infine, x0 + m1 mn k son tutte
e sole le soluzioni di Sn .

Consideriamo n, m > 1 tali che (n, m) = 1. Se a, b Z allora esiste x Z


tale che x n a e x m b per il Lemma 4.20. Esiste ununica soluzione x con
0 x < nm. Infatti, x = x + nmk con k Z son tutte e sole le soluzioni.
Abbiamo quindi ottenuto una funzione
def

f : Zn Zm Znm ([a]n , [b]m ) 7 [x]nm = f ([a]n , [b]m )


in quanto la soluzione x dipende solo dalle classi di congruenza [a]n e [b]m
ovvero scelte di rappresentanti a0 n a e b0 m b producono la stessa x
soluzione particolare.

4 ARITMETICA

84

Lemma 4.22 Siano n, m > 1 tali che (n, m) = 1. La funzione

f : Zn Zm Znm
`e bigettiva.
Dimostrazione:
Se x = f ([a]n , [b]m ) = f ([a0 ]n , [b0 ]m ) allora a n x n a0
0
e b m x m b e quindi [a]n = [a0 ]n e [b]m = [b0 ]m . Dunque f `e iniettiva.
Sia [c]nm Znm . Sia c = qn + a = q 0 m + b la divisione di c per n e per m.
I resti a, b Z delle divisioni sono tali che c n a e c m b. Quindi esiste
([a]n , [b]m ) Zn Zm tale che f ([a]n , [b]m ) = [c]nm ovvero f `e surgettiva.

Corollario 4.23 Sia n N+ e sia n = pn1 1 pnk k la fattorizzazione in primi


p1 , . . . , pk distinti. Allora si ha

Zn Zpn1 1 Zpnk
k

4.4

Numeri primi

Un numero primo `e un intero p 6= 0, 1 che non ha divisori propri. Come


abbiamo visto, un numero primo p `e anche caratterizzato dalla propriet`a che
se p divide un prodotto allora p divide uno dei fattori (per 4.6). Inoltre,
esistono infiniti primi (per 4.9). Una questione del tutto naturale `e dunque
quella di trovare numeri primi!
Chiaramente, dato un numero possiamo stabilire se questo `e un numero primo
verificando che non ha divisori propri. Non possiamo per`o facilmente stabilire
quale successore di un numero `e un numero primo. Un metodo elementare
per trovare dei numeri primi `e il crivello di Eratostene. Questo metodo
consiste nellelencare tutti i numeri fino a un certo numero grande fissato
e poi cancellare tutti i multipli iniziando dai numeri pi`
u piccoli: i restanti
saranno numeri primi.
Teorema di Fermat
Mostriamo ora una fondamentale propriet`a di un numero primo attribuita a
Pierre de Fermat attorno al 1636. Sembra che i matematici cinesi fecero indipendentemente lipotesi (talvolta detta ipotesi cinese avanzata circa 2000

4 ARITMETICA

85

anni prima di Fermat) secondo cui p `e primo se e solo se 2p p 2. Si vede


per`o che 2341 341 2 ma 341 = 11 31 non `e primo mentre in effetti 2p p 2
per ogni p primo. Fermat annunci`o senza dimostrazione il suo teorema: il
primo a pubblicare una dimostrazione del suo enunciato fu Leonhard Euler
nel 1736 ma Gottfried Wilhelm Leibniz scrisse che conosceva una dimostrazione prima del 1683.
Per numeri interi x, y Z si ha la ben nota formula del binomio

n 
X
n
(x + y) =
xnk y k
k
n

k=0

che si dimostra per induzione su n N (per esercizio utilizzando 2.24).


Ricordiamo che (per 2.25) si ha
 
n(n 1) (n k + 1)
n!
n
=
N
=
k
k!(n k)!
k(k 1) 1
Nel caso in cui n `e un primo si ottiene:
Teorema 4.24 (Fermat) Sia p > 1 un numero primo. Allora
xp p x
per ogni x Z.
Dimostrazione:

Se p `e primo allora per 0 < k < p si ha (perch`e!?)


 
p
p 0
k

e quindi
(x + y)p p xp + y p
per ogni x, y Z. Se x N allora possiamo ragionare per induzione. Se
xp p x allora
(x + 1)p p xp + 1 p x + 1

4 ARITMETICA

86

ponendo y = 1 nella formula del binomio. Se x N allora x N+ e


dunque (x)p p x. Se p `e dispari (x)p = xp e quindi xp p x. Se p = 2
si ha x 2 x e quindi x2 2 x.

Osserviamo che se x p 0 ovvero p|x allora ovviamente xp p 0. Se p non
divide x ovvero (p, x) = 1 allora
xp1 p 1 xp p x
per il Lemma 4.12.

Attenzione!
Viceversa un numero n N tale che xn n x per ogni
x Z non `e necessariamente primo! Il numero n = 561 = 3 11 17 `e il primo
numero con questa propriet`a.

Funzione di Eulero
Lequazione
ax m 1

ovvero

[a]m [x]m = [1]m

ha soluzioni se e solo se 1 = (a, m) sono coprimi (per 4.16). Inoltre, se esiste


def
x Z tale che ax m 1 allora [x]m `e unico in Zm e si denota [x]m = [a]1
m .
Sia
def
Zm = {[a]m | (a, m) = 1} Zm
Osserviamo che (1, m) = 1 e inoltre (ab, m) = 1 se (a, m) = (b, m) = 1.
Per m > 1 sia
(m) = |Zm | = |{a Z | 1 a < m & (a, m) = 1}|
def

def

Ponendo (1) = 1 si ottiene la funzione di Eulero : N+ N+ . Ad


esempio, se p `e primo Zp = Zp \ {[0]p } e (p) = p 1.
Lemma 4.25 Sia p > 1 primo e sia n N+ . Allora
(pn ) = pn pn1

4 ARITMETICA

87

Dimostrazione:
Si ha 1 k pn non coprimo con pn se e solo se p|k.
0
Dunque pk = k pn e quindi k 0 pn1 . Viceversa, da ciascun k 0 si ottiene
k = pk 0 non coprimo con pn . Quindi ci sono pn pn1 numeri pn e coprimi
con pn .

Lemma 4.26 Siano n, m N+ tali che (n, m) = 1. Allora


(n m) = (n) (m)

Dimostrazione: La funzione bigettiva f : Zn Zm Znm del Lemma 4.22


ammette una restrizione

Zn Zm Znm
che `e bigettiva. Se ([a]n , [b]m ) Zn Zm allora x = f ([a]n , [b]m ) Znm
ovvero (x, nm) = 1. Infatti, (x, n) = 1 e (x, m) = 1 e quindi (x, nm) =
1. Inoltre, se [c]nm Znm allora (c, n) = (c, m) = 1 e quindi esiste
([a]n , [b]m ) Zn Zm tale che f ([a]n , [b]m ) = [c]nm (come nella dimostrazione
di 4.22). Di conseguenza si ha
|Zn Zm | = |Znm |
Per il Lemma 2.19 si ha
|Zn Zm | = |Zn | |Zm |
da cui segue la formula.

Per ogni n N+ si calcola (n) utilizzando il Teorema 4.8. Si ha:


Teorema 4.27 Per n N+ sia n = pn1 1 pnk k la fattorizzazione in primi
p1 , . . . , pk distinti. Si ha
 


1
1
1
(n) = n 1
p1
pk

4 ARITMETICA

88

Dimostrazione:
Infatti, dal Lemma 4.26 si ha (n) = (pn1 1 ) (pnk k ),
per il Lemma 4.25 si ha (pn1 1 ) (pnk k ) = (pn1 1 pn1 1 1 ) (pnk k pknk 1 ) e

raccogliendo pn1 1 , . . . , pnk k si trova la formula.

Attenzione!
congruenza

La funzione di Eulero soddisfa inoltre per ogni x > 1 la


x(m) m 1

nota come Teorema di Eulero e che generalizza il Teorema di Fermat.

Teorema di Wilson
Il seguente teorema che ha correntemente preso il nome da Sir John Wilson,
studente del matematico inglese Edward Waring, si attribuisce anche a Ibn
al-Haytham (matematico arabo vissuto intorno allanno mille). Il teorema
venne annunciato nel 1770 senza dimostrazione. Joseph Louis Lagrange diede
una dimostrazione nel 1773 ma forse Leibniz conosceva questo risultato gi`a
un secolo prima.
Teorema 4.28 (Wilson) Sia p > 1 un numero intero. Allora
(p 1)! p 1

p `e un numero primo

Dimostrazione: Si verifica direttamente per p = 2, 3 e quindi supponiamo


p > 3. I divisori 6= p di un qualunque p si trovano tra i fattori di (p 1)! Sia
d = (p, (p 1)!) il massimo comun divisore, sia p = dm e (p 1)! = dn. Se
(p 1)! = pk 1 allora dn = pk 1 = dmk 1 e quindi d = 1. Se p non `e
primo per`o si ha che d > 1. Se invece p `e primo allora p 1, p 2, . . . , 1 sono
coprimi con p. Inoltre, in Zp = {1, . . . , p 1} per ciascun x Zp esiste un
unico y Zp tale che xy p 1. Notare che x2 p 1 implica (x1)(x+1) p 0
da cui x p 1 oppure x p 1 poich`e p `e primo. Escludendo 1 e p 1 per
x = p 2 esiste y Zp tale che xy p 1 e y 6= x, etc. e quindi
(p 1)! = (p 1)(p 2) 1 p (p 1)1 p 1

4 ARITMETICA

89

come affermato.

Il Teorema di Wilson produce un algoritmo per stabilire se un numero `e


primo. Dato un numero naturale (dispari) n si pu`o calcolare m = (n 1)! + 1
e poi verificare se tale numero m sia divisibile per n oppure non lo sia. Se m
`e divisibile per n allora n `e primo altrimenti n non `e primo.

Attenzione!
Sfortunatamente, come `e facile capire, questo algoritmo
basato sul Teorema di Wilson non `e efficiente come test di primalit`a per
numeri grandi. La complessit`a computazionale per stabilire se un numero `e
primo `e polinomiale ovvero sono noti (dal 2002) algoritmi che terminano in
tempo polinomiale rispetto alla dimensione dei dati.

4.5

Numeri p-adici

Sia p > 1 un numero primo fissato. Abbiamo visto che per ogni a N
esistono a0 , . . . , ak N con ai < p tali che
a=

k
X

ai p i

i=0

per qualche k N. Abbiamo che:


Lemma 4.29 Sia a Z e p > 1 un numero primo. Le classi di a in Zpn al
variare di n N+ possono essere rappresentate in modo unico
a p n

n1
X

ai pi

i=0

con 0 ai < p per i = 0, . . . , n 1.


Dimostrazione: Si verifica per induzione. Per n = 1 segue dal Lemma 4.11.
Supponiamo che tale affermazione valga per n 1. Allora abbiamo una
rappresentazione a = a0 +a1 p+a2 p2 + +an2 pn2 +bpn1 per un qualche b

4 ARITMETICA

90

Z. Dividendo per p si ha b = qp + r e quindi a = + an2 pn2 + rpn1 + qpn .


def
Ponendo an1 = r si ha b p an1 per un unico an1 < p e si conclude.

def

Consideriamo Zp = {a0 + a1 p + a2 p2 + | 0 an < p}. Intendiamo


un elemento di Zp come una successione di somme parziali (sn )nN+ dove
def
sn = a0 + a1 p + a2 p2 + + an1 pn1 . Un elemento di Zp viene anche pi`
u
sinteticamente rappresentato con la scrittura
X
an p n
nN

Daltra parte, per ogni a Z si ha ([a]pn )nN+ ovvero la successione costituita


da tutte le immagini di a mediante le proiezioni n : Z Zpn dove a 7
def
n (a) = [a]pn (come in 4.15) al variare di n N+ . Inoltre, si hanno funzioni
Zp Zp2 Zpn1 Zpn
che semplicemente associano [a]pn 7 [a]pn1 al variare di n N+ . Denotiamo n : Zpn Zpn1 queste funzioni e osserviamo che n n = n1 .
Consideriamo linsieme
Y
def
n
n
+
|
x

Z
&

(x
)
=
x
}

Zpn
Z
=
{(x
)
lim
n
p
n n
n1
p
n nN

nN+

sottoinsieme del prodotto.


Lemma 4.30 Si ha una funzione bigettiva

Zpn a0 + a1 p + a2 p2 + 7 ([sn ]pn )nN+


Zp lim

Dimostrazione: La funzione associa ad (sn )nN+ le sue classi ([sn ]pn )nN+ .
Zpn . Per il
Si ha che n ([sn ]pn ) = [sn1 ]pn1 . Sia (xn )nN+ un elemento di lim

Lemma 4.29 si ha che xn = [bn ] = [a0 + a1 p + a2 p2 + + an1 pn1 ] = [sn ]


in Zpn in modo unico. Siccome n (xn ) = xn1 si ha che (sn )nN+ costituisce
una successione di somme parziali.

Chiamiamo interi p-adici indifferentemente gli elementi degli insiemi appena considerati. Come osservato, per ogni a Z si ha che al variare di n N+

4 ARITMETICA

91

la funzione n 7 n (a) Zpn `e chiaramente una funzione di scelta che coincide (per 4.29) con le classi delle corrispondenti somme parziali n (a) = [sn ]pn .
Questo consente di associare ad ogni intero a Z un intero p-adico
X
a Z 7
an pn Zp 7 (n (a))nN+ lim
Zpn

nN

Questo intero p-adico si chiama sviluppo o espansione p-adica di a Z. Al


variare di a Z si ottiene cos` una funzione

Zpn
: Z Zp lim

Definiamo somma e prodotto dinteri p-adici (xn )nN+ e (yn )nN+ sulle componenti ovvero
Zpn
(xn )nN+ + (yn )nN+ = (xn + yn )nN+ lim

(xn )nN+ (yn )nN+ = (xn yn )nN+ lim


Zpn

mediante 4.13 e 4.14. Infatti, si ha che n (xn + yn ) = n (xn ) + n (yn ) =


xn1 + yn1 in quanto n (xn ) = xn1 e n (yn ) = yn1 e analogamente per il
prodotto.
Proposizione 4.31 La funzione `e iniettiva e tale che (a + b) = (a) +
(b) e (ab) = (a)(b) per ogni a, b Z.
Dimostrazione:
Siccome ciascuna proiezione n : Z Zpn soddisfa le
propriet`a elencate nella Proposizione 4.15 cos` la funzione le soddisfa in
quanto la somma e il prodotto dinteri p-adici `e stato definito sulle componenti. Inoltre `e chiaramente iniettiva. Infatti, se a e b hanno la stessa
espansione p-adica allora a b `e divisibile per pn per ogni n N+ e quindi
a = b.

Come conseguenza identifichiamo Z con la sua immagine negli interi p-adici.


Ad esempio, per 1 si ha lidentit`a
1 = (p 1) + (p 1)p + (p 1)p2 + + (p 1)pn1 pn
dalla quale seguono le congruenze

4 ARITMETICA

92

1 p p 1 = s1
1 p2 p 1 + (p 1)p = s2
..
.
1 pn (p 1) + (p 1)p + (p 1)p2 + + (p 1)pn1 = sn
Lespansione p-adica di 1 `e dunque
X
1 =
(p 1)pn
nN

dove senza ambiguit`a alcuna questa riscrittura sintetizza le infinite congruenze precedenti. Un intero positivo ha uno sviluppo finito ma come abbiamo
appena visto questo non accade per gli interi negativi.

Il valore assoluto p-adico


Riconsideriamo ora gli interi p-adici da un diverso punto di vista.

5 STRUTTURE

93

Strutture

Abbiamo visto che N, Z, Q e Zm son tutti dotati di propriet`a specifiche


deducibili dalle operazioni di somma e prodotto: vogliamo ora estrapolare
queste propriet`a. Assumendo lesistenza di somma e prodotto in un dato
insieme vogliamo dedurre propriet`a specifiche di questo insieme: desideriamo
inoltre caratterizzare gli interi e le congruenze in un contesto assiomatico.
Pi`
u in generale, vogliamo pensare a una struttura come un insieme o pi`
u
insiemi dotati di relazioni o funzioni. Le strutture sono oggetto di studio
dellalgebra astratta.

5.1

Gruppi, anelli e campi

Un insieme S con una funzione


: S S S (a, b) 7 a b
`e un insieme dotato di una operazione binaria che denotiamo (S, ). Se per
tale operazione vale la legge associativa ovvero
a (b c) = (a b) c
per ogni a, b, c S allora diciamo che (S, ) `e un semigruppo Diciamo che
un semigruppo `e commutativo se inoltre
ab=ba
per ogni a, b S.
La cardinalit`a |S| si dice anche ordine del semigruppo. La notazione moltiplicativa a b `e del tutto arbitraria; per semplicit`a, se non si rischia confusione,
denoteremo spesso ab una generica operazione in un semigruppo. Omettiamo
spesso il riferimento alloperazione binaria per semplificare la notazione.
def

Ad esempio, sia X un insieme e sia X  = {f : X X/f funzione}. La


composizione di funzioni : X  X  X  (f, g) 7 f g determina un
semigruppo su X  . Non commutativo, in generale. Daltra parte, considerando in P(X) lintersezione o lunione si ottengono semigruppi commutativi (P(X), ) e (P(X), ). Infatti, per un reticolo (X, ) si ha che (X, )
e (X, ) sono semigruppi commutativi. Infine, (N, +) oppure (N, ) sono
semigruppi commutativi come abbiamo visto.

5 STRUTTURE

94

Cancellazione
In un semigruppo un elemento x S si dice cancellabile a sinistra (risp.
a destra) se xb = xc b = c (risp. bx = cx b = c) per ogni b, c S.
Vale la legge di cancellazione in un semigruppo S se ogni elemento x S `e
cancellabile a destra e a sinistra.
Ad esempio, (N, +) soddisfa la legge di cancellazione.
Monoide
Un semigruppo (S, ) si dice monoide se esiste un elemento 1 S tale che
1 a = a 1 = a per ogni a S.
Se 1 esiste `e unico. Infatti, se ea = ae = a per ogni a S allora e1 = e = 1.
Se 1 S esiste viene detto elemento neutro del semigruppo (S, ).
Ad esempio, (N, +, 0) `e il paradigmatico monoide. Anche (X  , , idX ) oppure (Z, , 1) sono monoidi.
Siano (T, T , 1T ) e (S, S , 1S ) monoidi. Un omomorfismo di monoidi `e una
funzione f : T S tale che f (1T ) = 1S e f (t T t0 ) = f (t) S f (t0 ) per t, t0 T .
Osserviamo che per ogni s S la funzione
def

f : N S n 7 sn = f (n)
def

def

def

tale che 0 7 s0 = 1, 1 7 s1 = s, 2 7 s2 = ss, etc. `e un omomorfismo di


monoidi (verificare per esercizio!).
Lemma 5.1 Sia (S, , 1) un monoide. Per ogni s S esiste ununico omomorfismo di monoidi f : N S tale che f (1) = s. Se tale f `e iniettiva
allora sn 6= 1 per ogni n N+ .
Dimostrazione: Ogni omomorfismo di monoidi f : N S `e tale che f (0) =
1 e f (n + 1) = f (n)f (1) per n N. Sia t : S S la funzione x 7
def
t(x) = xf (1). Per ricorsivit`a 2.5 e 2.7 esiste ununica funzione f : N S tale
che f (0) = 1 e f (n + 1) = t(f (n)) ovvero f (n + 1) = f (n)f (1). Quindi per
ogni s S quello visto sopra `e lunico omomorfismo di monoidi f : N S

5 STRUTTURE

95

tale che f (1) = s. Se sn = 1 per qualche n N+ allora sn+m = sm per ogni


m N e quindi f non `e iniettiva.

Un elemento idempotente x S `e un elemento tale che x2 = x nel semigruppo (S, ).
Proposizione 5.2 Sia (S, , 1) un monoide. Un elemento e S cancellabile
a sinistra oppure a destra `e idempotente se e solo se e = 1.
Dimostrazione: Si ha e e = e 1 ma anche e e = 1 e poich`e e idempotente.
Siccome e `e cancellabile a sinistra o a destra si ha e = 1.

In un monoide che soddisfa la legge di cancellazione non vi sono idempotenti


a parte lelemento neutro. In un reticolo (X, ) con massimo 1 e minimo 0 si
ha che (X, , 1) e (X, , 0) sono monoidi in cui ogni elemento `e idempotente.
Gruppo
Sia (S, , 1) un monoide. Un elemento a S si dice invertibile se esiste
def
x S tale che xa = ax = 1. Se tale x esiste `e unico: x = a1 si dice inverso
di a. Infatti, x = 1x = (x0 a)x = x0 1 = x0 se anche x0 a = 1. Notare che se
a, b S sono invertibili anche ab `e invertibile. Infatti, b1 a1 `e linverso.
Si dice gruppo un monoide in cui tutti gli elementi sono invertibili. Si dice
gruppo abeliano se `e inoltre commutativo.
Ad esempio, (Z, +, 0) `e il paradigmatico gruppo abeliano. Dato un qualundef
que monoide (S, , 1) sia S = {s S | s invertibile} il sottoinsieme degli
elementi invertibili. Allora (S , , 1) `e un gruppo.
Proposizione 5.3 Ogni gruppo soddisfa la legge di cancellazione.

5 STRUTTURE

96

Dimostrazione:
Se ab = ac in un gruppo allora b = 1b = a1 (ab) =
1
a (ac) = 1c = c, quindi ogni a `e cancellabile a sinistra. Analogamente a
destra.

Ad esempio, X  non `e un gruppo, in generale. Se X la funzione costante


x 7 non `e cancellabile a sinistra se |X| > 1. Viceversa, nel monoide
(X  , , idX ) ogni funzione iniettiva `e cancellabile a sinistra. Infatti, se f
X  iniettiva allora esiste g X  tale che gf = idX (per 2.21). Dunque
f h = f k implica che h = idX h = gf h = gf k = idX k = k per ogni h, k X  .
Analogamente, ogni funzione surgettiva `e cancellabile a destra. Gli elementi
invertibili del monoide (X  , , idX ) sono le applicazioni bigettive. Sia
def

SX = {f : X X/f bigettiva} X 
Il gruppo (SX , , idX ) `e il principale esempio di gruppo non commutativo ed
`e detto gruppo simmetrico. Se |X| = n N `e un insieme finito allora SX `e
finito si denota Sn ed `e non commutativo se n > 2.
Teorema 5.4 Un monoide finito (S, , 1) `e un gruppo se e solo se soddisfa
la legge di cancellazione.
def

Dimostrazione:
Sia t : S S la funzione t(x) = ax con a S fissato.
Allora t `e iniettiva in quanto vale la legge di cancellazione quindi surgettiva
poich`e S `e finito (per 2.23). Esiste x S tale che t(x) = 1 ovvero ax = 1.
Analogamente considerando y 7 ya si ha che esiste y S tale che ya = 1.
Quindi x = y = a1 in quanto y = y1 = y(ax) = (ya)x = 1x = x.

Ad esempio, (Zm , +, 0) `e un gruppo finito. Se Z6=0 = Z {0} allora nel


monoide abeliano (Z6=0 , , 1) vale la legge di cancellazione ma questo non `e
0
un gruppo: chiaramente (Q6=0 , , 1) `e un gruppo. Analogamente, (Z6=
e
p , , 1) `
un gruppo se p `e primo. Infatti, ax p ay x p y se (a, p) = 1 (per 4.12).
def

Per un gruppo abeliano G `e spesso conveniente la notazione additiva anche


se `e una pura convenzione linguistica non `e del tutto irrilevante da un punto
di vista psicologico. Per un gruppo abeliano si assume dunque lesistenza
di una operazione + : G G G e un elemento 0 G tali che per ogni
a, b, c G si ha:

5 STRUTTURE

97

(a) a + (b + c) = (a + b) + c (associativit`a)
(b) a + b = b + a (commutativit`a)
(c) a + b = a + c b = c (cancellazione)
(d) a + 0 = a (elemento neutro)
(e) a + a = 0 (inverso)
Inoltre si definisce per induzione:
def

def

(f) Z G G (n, a) 7 na 0a = 0, na = (n 1)a + a se n N+ e


def
(n)a = na per n N tale che:
(f.1) n(a + b) = na + nb
(f.2) (n + m)a = na + ma
(f.3) (nm)a = n(ma)
(f.4) 1a = a
per ogni a, b G e n, m Z come si vede facilmente (per induzione!). Notare
che la (f.1) non vale se il gruppo non `e abeliano (perch`e!?).
Utilizzeremo sia la notazione additiva che quella moltiplicativa per denotare
un gruppo.
Anello
Si dice anello una terna (A, +, ) ovvero un insieme A con due operazioni
binarie + e tali che:
(a) (A, +, 0) `e un gruppo abeliano
(b) (A, ) `e un semigruppo ovvero vale la propriet`a associativa
a (b c) = (a b) c
e inoltre

5 STRUTTURE

98

(c) valgono le propriet`a distributive


a (b + c) = (a b) + (a c)
(a + b) c = (a c) + (b c)
per ogni a, b, c A.
Inoltre, un anello (A, +, ) si dice unitario se possiede lidentit`a moltiplicativa 1 A ovvero se (A, , 1) `e un monoide e si dice commutativo se
(A, , 1) `e commutativo.
Notare che dalla distributivit`a si ha che a 0 = 0 a = 0 per ogni a A.
Quindi 1 = 0 in A se e solo A = {0} `e lanello nullo. Inoltre, se 1 A allora
1 + (1) = 0 e quindi a (1) = (1) a = a per ogni a A.
Ad esempio, (Z, +, ) e (Zm , +, ) sono anelli commutativi con identit`a. Notare che ogni gruppo abeliano (G, +, 0) si pu`o considerare come un anello in
cui a b = 0 per ogni a, b G. In particolare, la struttura di anello non `e
unica come daltra parte non `e unica la struttura di gruppo.
Dato un anello A unitario possiamo considerare
A = {a A | a invertibile } A
def

il sottoinsieme degli elementi con inverso moltiplicativo. Si ha che (A , , 1)


`e un gruppo. Ad esempio, come abbiamo visto nel Teorema 4.27, la funzione
di Eulero (m) = |Zm | calcola esplicitamente il numero di elementi invertibili
dellanello finito (Zm , +, ).
Dominio
def

Sia A un anello commutativo unitario e sia A6=0 = A \ {0}. Lanello A si dice


dominio se (A6=0 , , 1) `e un monoide che soddisfa la legge di cancellazione.
In particolare, se a 6= 0 e b 6= 0 allora a b 6= 0 in A.
Al contrario, diciamo che un elemento a A6=0 di un anello qualunque `e
uno zero-divisore se esiste b A6=0 tale che a b = 0. In questo caso,
ab
/ A6=0 e dunque A6=0 non `e chiuso rispetto al prodotto in A. Se lanello
non `e commutativo a `e detto zero-divisore sinistro e b zero-divisore destro.

5 STRUTTURE

99

Inoltre, siccome a b = 0 = a 0 ma b 6= 0 si ha che a non `e cancellabile a


sinistra.
Lemma 5.5 Sia A anello e a A. Se a 6= 0 non `e zero-divisore sinistro
allora `e cancellabile a sinistra ovvero
ab = ac b = c
per ogni b, c A. Analogamente a destra.
Dimostrazione:
Se ab = ac allora a(b c) = 0 da cui b = c se a non `e
zero-divisore sinistro.

Proposizione 5.6 Un anello commutativo unitario non nullo `e un dominio


se e solo se non ha zero-divisori.
Dimostrazione: Infatti, dal lemma segue che se A non ha zero-divisori allora (A6=0 , , 1) `e un monoide che soddisfa la legge di cancellazione. Viceversa,
ab = ac ovvero a(b c) = 0 e se b 6= c si hanno zero-divisori.

Ad esempio, A = Z `e un dominio, mentre A = Zm ha zero-divisori se m non


`e primo.
Campo
Un anello A si dice corpo se (A6=0 , , 1) `e un gruppo. Si dice campo se
tale gruppo `e commutativo.
Ad esempio, A = Q, R, C sono campi ma anche Zp con p primo. Notare che
il pi`
u piccolo campo ha due elementi e quindi `e Z2 = {0, 1}. Inoltre, H `e un
corpo.
Chiaramente A `e un corpo se e solo se A = A6=0 .
Proposizione 5.7 Se A `e un campo allora `e un dominio.

5 STRUTTURE

100

Dimostrazione: Basta osservare che a A invertibile non `e zero-divisore.


Infatti, se ab = 0 allora a1 ab = 0 e quindi b = 0.

Lemma 5.8 Se A `e un anello commutativo finito non nullo e senza zerodivisori allora A `e un campo.
def

Dimostrazione: Sia a 6= 0 e sia f : A A definita da f (x) = ax. Siccome a


`e cancellabile si ha che f `e iniettiva quindi surgettiva poich`e A finito. Quindi
esiste e A tale che ae = a. Dato b A esiste c A tale che ac = b ma
anche ca = b poich`e A `e commutativo. Dunque cae = be ovvero b = be. In
conclusione e = 1 `e lidentit`a moltiplicativa e f 1 (1) = a1 `e linverso.

Corollario 5.9 Un anello finito `e un campo se e solo se `e un dominio.


Ad esempio, A = Zp `e un dominio e quindi un campo se e solo se p `e primo.
Anello ordinato
Per lanello Z e poi per i campi Q e R abbiamo considerato un ordinamento con le propriet`a elencate in 2.33 che abbiamo dedotto dallesistenza di
un sottoinsieme di elementi positivi (come in 2.36). Dato un anello A un
sottoinsieme di elementi positivi A+ A `e un sottoinsieme tale che:
a, b A+ a + b A+ & a b A+
a A+ oppure a A+ oppure a = 0
per ogni a, b A. Osserviamo che a2 A+ per ogni a 6= 0. Dunque, se A `e
unitario allora 12 = 1 A+ e dunque 1
6 A+ .
Diciamo che A `e un anello ordinato se `e commutativo unitario non nullo
e possiede un sottoinsieme A+ A di elementi positivi. Un anello ordinato
che `e un campo viene detto campo ordinato. Ad esempio, Q e R sono campi
ordinati mentre in generale si ha:
Proposizione 5.10 Se A `e un anello ordinato allora A `e un dominio ordinato.

5 STRUTTURE

101

Dimostrazione: Infatti, siano a, b A6=0 . Se a, b A+ allora ab A+ , se


a, b A+ allora (a)(b) = ab A+ e se a A+ e b A+ oppure
a A+ e b A+ allora ab A+ e quindi ab 6= 0 in ogni caso.

Ponendo a < b se b a A+ si ottiene per un anello ordinato A un ordinamento totale (A, ) con le stesse propriet`a che abbiamo elencato per Z in
2.33. Infatti, si vede facilmente per A anello ordinato, come abbiamo visto
per Z nella dimostrazione di 2.33, che per a, b, c A si ha:
a < b oppure b < a oppure a = b
a<b&b<ca<c
b<c a+b<a+c
a>0 & b<c ab<ac
Diciamo che un anello ordinato A `e denso o completo se (A, ) `e denso o
completo.

5.2

Alcune propriet`
a notevoli

Consideriamo ora sottoinsiemi, funzioni e relazioni di equivalenza per insiemi


con operazioni. Nella notazione moltiplicativa, diciamo che un sottoinsieme
T S di un monoide (S, , 1) `e un sottomonoide se t t0 T per ogni
t, t0 T e inoltre 1 T ovvero se linclusione T S `e un omomorfismo
di monoidi. Se esiste t1 S per t T non `e garantito che t1 T . Ad
esempio, (Z, , 1) `e un sottomonoide di (Q, , 1) e ogni intero non nullo `e
invertibile in Q ma non in Z.
Sottogruppo
Sia (G, +, 0) un gruppo. Un sottogruppo H G `e un sottoinsieme non
vuoto tale che
(1) a, b H a + b H
(2) a H a H

5 STRUTTURE

102

siano soddisfatte per ogni a, b H. Chiaramente anche 0 H in quanto


a + a = 0. Dunque (H, +, 0) risulta un gruppo rispetto alloperazione +
indotta da G (e viceversa!).
def

Ad esempio, G = Z e H = mZ = {mn | n Z} per m N.


Lemma 5.11 Se H Z `e un sottogruppo allora H = nZ per qualche n N.
Dimostrazione: Se H = {0} si ha n = 0. Se H 6= {0} sia n H con n > 0
minimo (deve esistere in quanto h H, h 6= 0 implica h H e N `e ben
ordinato per 3.3). Dunque nZ H. Inoltre dato x H si ha che x = qn + r
con r < n. Quindi r = x qn H e dunque r = 0 poich`e n `e minimo tra gli
elementi positivi.

Lintersezione arbitraria di sottogruppi `e un sottogruppo. Inoltre, dati H e


K sottogruppi di G abeliano si ha che la somma
\
def
H + K = {a + b | a H, b K} =
F
H,KF

`e ancora un sottogruppo ed `e il pi`


u piccolo sottogruppo contenente H K.
Ad esempio, se G = Z, H = mZ e K = nZ allora mZ + nZ = dZ per
d = (m, n).
Sottoanello e sottocampo
Sia A un anello. Un sottoinsieme B A si dice sottoanello se
(1) B `e un sottogruppo di (A, +, 0)
(2) a, b B a b B
(3) 1 A 1 B
Se A `e ordinato allora B `e un sottoanello ordinato se inoltre B + A+ . Ad
esempio, Z Q R C H sono sottoanelli e Z `e un sottoanello ordinato
di Q. Notare che lanello nullo non `e un sottoanello di Z e Z `e il minimo
anello (come vedremo in 5.16 e 5.22).

5 STRUTTURE

103

Se A `e un campo diciamo che B `e un sottocampo se inoltre B `e un campo.


Ad esempio, ciascun Q R C `e un sottocampo del campo successivo e
son tutti sottocampi del corpo H. Inoltre Q R `e un sottocampo ordinato
e Q `e il minimo campo ordinato (come vedremo in 5.23 e 5.24).
Lintersezione di sottoanelli `e un sottoanello e lintersezione di sottocampi `e
un sottocampo.

Sottoanello generato da un sottoinsieme


Sia A B sottoanello commutativo unitario e sia b B. Ad esempio,
Z C e C. Costruiamo il pi`
u piccolo sottoanello di B contenente A e
2 3
b. Se a A dunque b, b , b , . . . , ab, ab2 , . . . e loro somme saranno tutti suoi
elementi. In generale, tutte le espressioni a0 + a1 b + a2 b2 + + an bn saranno
tutti suoi elementi per ogni ai A con i = 0, . . . , n. Con le operazioni
indotte da B linsieme A[b] di tali espressioni `e chiaramente un sottoanello
di B. Chiaramente A[b] `e contenuto in tutti i sottoanelli Ab di B contenenti
A e b. In conclusione si ha
\
def
A[b] = {x B | x = a0 + a1 b + a2 b2 + + an bn } =
Ab
Ad esempio, abbiamo dunque costruito anelli Z[] per ogni C. In
particolare, per = i tale che i2 = 1 otteniamo gli interi di Gauss ovvero
Z[i] = {a + ib | a, b Z}
Per S B un sottoinsieme arbitrario, il pi`
u piccolo sottoanello di B contenente A e S `e lanello A[S] che ammette una descrizione del tutto analoga.
Ideale
In un anello A un sottogruppo additivo I A si dice ideale sinistro (risp.
destro) se a A x I ax I (risp. se a A x I xa I). Ideale
bilatero se destro e sinistro: ovviamente se lanello `e commutativo si ha che
sinistro destro bilatero.
Ad esempio, I = mZ sono tutti e soli (per 5.11) gli ideali di A = Z. Mentre
Z Q `e un sottoanello che non `e ideale.

5 STRUTTURE

104

Osserviamo infine che lintersezione arbitraria di ideali `e un ideale. Inoltre,


def
dati I e J ideali di A si ha che la somma I + J = {a + b | a I, b J} `e
ancora un ideale.
Dominio a ideali principali
Dato un sottoinsieme S A, lideale (sinistro) generato da S `e semplicemente
linsieme di tutte le combinazioni lineari di elementi di S a coefficienti in A
ovvero
k
X
\
def
I(S) = {
ai si | ai A si S} =
I
i=0

SI

e si ha che I(S) `e il pi
u piccolo ideale di A contenente S. Ad esempio, se I
e J sono ideali di A e S = I J allora I(S) = I + J.
Per S = {a} si ha che I(S) = {xa | x A} si denota Aa oppure aA
lideale destro; se A `e commutativo Aa = aA si denota anche (a) e si
chiama ideale principale generato da a A. Un dominio A si dice a
ideali principali (P.I.D.) se ogni ideale I di A `e principale.
Ad esempio, abbiamo visto che A = Z `e un P.I.D. in quanto ogni sottogruppo
`e (m) = mZ Z per qualche m Z (per 5.11). In un campo K ci sono solo
i due ideali (0) e (1) e quindi ogni campo `e un P.I.D. Infatti, basta osservare
che se a 6= 0 e a I in un ideale di un campo K allora a `e invertibile e
a1 a = 1 I.
Gruppo abeliano quoziente
Dato H G sottogruppo di un gruppo abeliano (G, +, 0) e g, g 0 G possiamo definire una relazione g g 0 se g g 0 H. Ad esempio, se H = mZ
e G = Z allora x y `e la relazione di congruenza x m y. In generale,
`e facile verificare che `e una relazione di equivalenza su G. Si ha che le
classi di equivalenza di sono glinsiemi [g] = {g + h | h H} al variare
di g G. Siccome G `e abeliano possiamo considerare linsieme quoziente
def
G/ = {[g] | g G} con la somma indotta
[g] + [g 0 ] = [g + g 0 ]
def

5 STRUTTURE

105

Infatti, gh H e g 0 h0 H implica (gh)+(g 0 h0 ) = (g+g 0 )(h+h0 ) H


e quindi la somma `e ben definita sulle classi di equivalenza. Si ha che [0] = H.
Il gruppo quoziente (G/ , +, [0]) si denota semplicemente G/H. Osserviadef

mo che la proiezione sul quoziente : G G/H g 7 [g] = (g) `e tale che


(g + g 0 ) = (g) + (g 0 ) per costruzione. Ad esempio, ritroviamo le congruenze Z/mZ = Zm con la proiezione Z Zm . Inoltre, abbiamo il gruppo
quoziente Q/Z in quanto Z Q `e un sottogruppo additivo di Q.
Immagine e nucleo
In generale, siano (G, G , 1G ) e (F, F , 1F ) due gruppi non necessariamente
abeliani. Una funzione f : G F `e un omomorfismo di gruppi se
f (g G g 0 ) = f (g) F f (g 0 )
per ogni g, g 0 G. Un isomorfismo di gruppi `e un omomorfismo bigettivo.
Notare che f (1G G 1G ) = f (1G ) F f (1G ) implica che f (1G ) = 1F per la legge
di cancellazione. Inoltre, f (g G g 1 ) = f (g) F f (g 1 ) = 1F e quindi, per
lunicit`a dellinverso, si ha f (g 1 ) = f (g)1 per ogni g G. Osserviamo che:
Proposizione 5.12 Sia (G, , 1) un gruppo. Ogni omomorfismo (iniettivo
e/o surgettivo) di monoidi da N a G estende in modo unico a un omomorfismo (iniettivo e/o surgettivo) di gruppi da Z a G
j

N
g

' 

In particolare, per ogni g G esiste un unico omomorfismo di gruppi Z G


tale che 1 7 g. Tale omomorfismo `e iniettivo se e solo se g n 6= 1 per ogni
n N+ .
Dimostrazione: Ogni omomorfismo di monoidi N G `e unicamente determinato dalla scelta di un elemento g G tale che 1 7 g e quindi n 7 g n per
ogni n N (come abbiamo visto in 5.1). Siccome vogliamo un omomorfismo
di gruppi Z G basta che 1 7 g 1 e quindi n 7 g n per ogni n N .
Se N G `e iniettivo allora g k 6= 1 per ogni k N+ ma g n = g m con m < n

5 STRUTTURE

106

implica g nm = 1 con n m N+ e quindi anche Z G `e iniettivo. Se


N G `e surgettivo allora Z G `e ovviamente surgettivo.

Ad ogni f : G F omomorfismo possiamo associare:
def

immagine Im f = f (G) = {f (g) | g G}


def

nucleo Ker f = {g G | f (g) = 1F }


Si ha che Im f F e Ker f G sono sottogruppi (perch`e!?). Si dice che f
`e nullo o banale se Im f = {1F } ovvero Ker f = G.
La relazione di equivalenza f associata ad f `e per definizione g f g 0 se
f (g) = f (g 0 ) per g, g 0 G. Siccome f `e un omomorfismo di gruppi si ha
f (g) = f (g 0 ) f (g 0 )f (g)1 = 1F f (g 0 g 1 ) = 1F g 0 g 1 Ker f
Segue che f iniettiva se e solo se Ker f = {1G }. Linsieme quoziente G/ f
ha una struttura di gruppo indotta da quella di G come segue
[g] [g 0 ] = [g G g 0 ]
def

in quanto tale prodotto risulta ben definito sulle classi di equivalenza. Infatti, f (g) = f (h) e f (g 0 ) = f (h0 ) implica f (g) F f (g 0 ) = f (h) F f (h0 ) ovvero
f (g G g 0 ) = f (h G h0 ) e quindi [g G g 0 ] = [h G h0 ].
Denotiamo G/Ker f il gruppo quoziente (G/ f , , [1G ]) canonicamente indotto dallomomorfismo f . La proiezione : G G/Ker f sul quoziente `e
un omomorfismo di gruppi. Se inoltre G `e abeliano allora ogni sottogruppo H G `e il nucleo di un omomorfismo: infatti si ha : G G/H
omomorfismo e H = Ker . In conclusione si ha:
Teorema 5.13 Dato f : G F omomorfismo di gruppi si ha che il gruppo
quoziente G/Ker f `e canonicamente isomorfo al sottogruppo Im f F ovvero
si ha la fattorizzazione canonica
G

G/Ker f
)

con f omomorfismo iniettivo e G/Ker f


= Im f = Im f .

5 STRUTTURE
Dimostrazione:
vato sopra.

107
Diretta conseguenza del Corollario 2.29 e di quanto osser

Ad esempio, per G = C e F = R i gruppi moltiplicativi dei numeri comdef


plessi e reali si ha che f = : C R z 7 zz = (z) `e un omomorfismo
con nucleo la circonferenza unitaria S 1 in C = R2 \ {(0, 0)} mentre la sua
immagine `e R+ il sottogruppo dei reali positivi. Dunque C /S 1
= R+ . Analo
gamente, sia G = H il gruppo moltiplicativo (non abeliano) dei quaternioni
def
e F = R . La funzione f = : H R q = (z, t) 7 zz + tt = (q) `e un
omomorfismo. Il suo nucleo `e la sfera S 3 unitaria in R4 . Dunque si ha che
R+
= H /S 3 .
Osserviamo che applicando il Teorema 5.13 alla Proposizione 5.12 si ha che:
Corollario 5.14 Ogni g G induce g : Z G omomorfismo con immagine
il sottogruppo
def
hgi = {g n | n Z} G
in modo che si ha un isomorfismo:
hgi
= Z se Ker g = 0 oppure
hgi
= Z/mZ = Zm se Ker g = mZ con m 6= 0 (per 5.11) ovvero esiste
m N+ minimo tale che g m = 1.
Ad esempio, se G `e un gruppo finito allora non esistono omomorfismi iniettivi
da Z in G. Di conseguenza non esistono omomorfismi non nulli da un gruppo
finito G verso Z. Infatti, se esiste f : G Z omomorfismo non nullo allora
esiste g G e f (g) = a Z con a 6= 0. Componendo con lomomorfismo
g : Z G si ottiene a : Z Z omomorfismo iniettivo. Dunque a = f g
iniettivo implica g : Z G iniettivo.
Considerando tutti gli omomorfismi iniettivi N , G, segue che Z `e il minimo gruppo contenente N. Viceversa si ha che il gruppo simmetrico `e il
massimo gruppo nel senso che:
Proposizione 5.15 (Cayley) Associando a g G la moltiplicazione per g
in G si ottiene un omomorfismo iniettivo
G SG = {f : G G | f bigettiva}

5 STRUTTURE

108

In particolare, G `e isomorfo ad un sottogruppo del gruppo simmetrico SG .


g

Dimostrazione: Sia G G la funzione x 7 gx per g G. Per g = 1 si


g
g0
ottiene idG e per gg 0 G si ottiene la composta G G G. Siccome
g 1

g 1 G allora G G `e linversa di G G. Dunque G SG che associa


g
g 7 G G `e un omomorfismo. Vediamo che ha nucleo banale: se gx = x
per ogni x G allora per x = 1 si ha g = 1. Per il Teorema 5.13 si ha che G
`e isomorfo al sottogruppo immagine di G in SG .

Anello quoziente
Il gruppo quoziente Q/Z non eredita una struttura di anello perch`e il sottoanello Z di Q non `e un ideale. Se I A `e un ideale di un anello commutativo
il gruppo quoziente A/I eredita il prodotto
def

[a] [b] = [a b]
Infatti, [a] = [a0 ] ovvero a a0 I quindi ab a0 b I (in quanto I ideale)
ovvero [ab] = [a0 b] in A/I. Se A non `e commutativo questo avviene se I `e
bilatero poich`e bisogna anche mostrare che [b] = [b0 ] implica [ab] = [ab0 ] in
A/I. Se A `e commutativo unitario anche A/I `e commutativo unitario. Si
dice che (A/I, , [1]) `e la struttura di anello quoziente sul gruppo quoziente
A/I.
Omomorfismo di anelli
def

Osserviamo che la funzione : A A/I a 7 [a] = (a) (proiezione sul


quoziente) `e tale che [a + a0 ] = [a] + [a0 ], [aa0 ] = [a][a0 ] e [1] = 1 in A/I.
Diciamo che un omomorfismo di anelli `e una funzione f : A B tra anelli
(A, +A , A ) e (B, +B , B ) tale che
(1) f (a +A a0 ) = f (a) +B f (a0 )
(2) f (a A a0 ) = f (a) B f (a0 )
(3) 1A A, 1B B f (1A ) = 1B

5 STRUTTURE

109

per ogni a, a0 A. Un isomorfismo di anelli `e un omomorfismo bigettivo.


Notiamo che dalla (1) segue che
(1.1) f (0A ) = 0B
(1.2) f (a) = f (a)
(1.3) f (na) = nf (a)
per ogni a A e n Z. Infatti, f (0A ) = f (0A ) +B f (0A ) e basta usare la legge di cancellazione in (B, +B , 0B ) per ottenere la (1.1) e inoltre
0B = f (a +A a) = f (a) +B f (a) e si sfrutta lunicit`a dellinverso in
(B, +B , 0B ).
Un omomorfismo ordinato tra anelli ordinati A e B con elementi positivi
A+ e B + `e un omomorfismo di anelli f : A B tale che f (A+ ) B + .
Proposizione 5.16 Se A `e unitario allora esiste un unico omomorfismo di
anelli Z A. Se A `e un anello ordinato allora tale omomorfismo `e un
omomorfismo ordinato.
Dimostrazione:
Notiamo che f : Z A omomorfismo di gruppi abeliani
`e completamente determinato da f (1) A in accordo con 5.12. Se 1 A
e f (1) = 1 si ha f (n) = n1 per ogni n Z. Inoltre, si vede facilmente
(per induzione e distributivit`a) che f (nm) = f (n)f (m) ovvero che (nm)1 =
(n1)(m1) in A per ogni n, m Z. Quindi f : Z A `e un omomorfismo di
anelli unitari. Inoltre, se A `e un anello ordinato 1 A+ `e positivo e quindi
n1 A+ per n N+ .

Lomomorfismo Z A n 7 n1 `e detto omomorfismo caratteristico dellanello (ordinato) unitario A.
Ad ogni omomorfismo di anelli f : A B possiamo associare immagine
def
def
Im f = f (A) e nucleo Ker f = {a A | f (a) = 0}. Ricordiamo che la relazione di equivalenza f associata ad f `e tale che x f y f (x) =
f (y) f (x y) = 0 x y Ker f . In particolare, f iniettivo
Ker f = 0. Un omomorfismo iniettivo `e anche detto un estensione di anelli
Inoltre, ogni ideale (bilatero) I A `e il nucleo dellomomorfismo di anelli
: A A/I. Viceversa si ha:

5 STRUTTURE

110

Lemma 5.17 Ker f `e ideale (bilatero) di A e Im f `e sottoanello di B.


Dimostrazione: Per vedere che f (A) = {f (a) | a A} sia un sottoanello
e che Ker f sia un sottogruppo basta usare la definizione di omomorfismo.
Inoltre, se a A e x Ker f ovvero f (x) = 0 allora ax Ker f in quanto
f (ax) = f (a)f (x) = f (a)0 = 0.

Notare che se f : A B `e un omomorfismo di anelli unitari Ker f `e un


sottoanello se e solo 1 Ker f e questo equivale a B = 0. Daltra parte Im f
`e un ideale se e solo Im f = B.

Attenzione! Sia a Z un intero fissato e sia a : Z Z b 7 ab la


moltiplicazione per a in Z. Si ha un omomorfismo di gruppi additivi (per
5.12) ma non un omomorfismo di anelli se a 6= 1. Si ha che Ker a = {0} ma
Im a = aZ dunque f `e iniettiva non surgettiva e la sua immagine `e infatti un
ideale.
Osserviamo che ogni omomorfismo ordinato f : A B `e iniettivo. Infatti,
se x 6= 0 allora x A+ oppure x A+ e quindi f (x) A+ oppure f (x) =
f (x) A+ ovvero f (x) 6= 0. Inoltre, ogni omomorfismo f : A B con A
campo `e iniettivo e se B `e un campo si dice estensione di campi. Si ha infine
che:
Teorema 5.18 Dato f : A B omomorfismo di anelli si ha che lanello
quoziente A/Ker f `e canonicamente isomorfo al sottoanello Im f B ovvero
si ha la fattorizzazione canonica
A

A/Ker f
)

con f omomorfismo iniettivo e A/Ker f


= Im f = Im f .

5 STRUTTURE
Dimostrazione:
Lemma 5.17.

111
Conseguenza del Corollario 2.29, del Teorema 5.13 e del

In particolare, dato A unitario con 1 A si ha che limmagine di Z A


omomorfismo caratteristico `e il sottoanello fondamentale
A = {n1 | n Z} = h1i A
def

che coincide con il sottogruppo additivo h1i di A considerato nel Corollario 5.14 ma `e inoltre un sottoanello di A contenuto in tutti i sottoanelli di A.
Infatti, se B A `e un sottoanello allora 1 B e quindi A B. Per il Corollario 5.14, la Proposizione 5.16 e il Teorema 5.18 applicato allomomorfismo
caratteristico si ottengono isomorfismi:
Corollario 5.19 A
= Zm
= Z oppure A
Inoltre, il sottoanello fondamentale `e invariante per estensioni:
Lemma 5.20 Sia f : A B un omomorfismo di anelli. La composizione
dellomomorfismo caratteristico Z A con f : A B
Z

/A
 

`e lomomorfismo caratteristico Z B. La restrizione di f ad A induce un


omomorfismo surgettivo f : A
B . Se f `e iniettivo allora i sottoanelli
fondamentali
'
f : A B
sono isomorfi.
Dimostrazione: Per lunicit`a dellomomorfismo caratteristico si ha che Z
A B `e lomomorfismo caratteristico di B. Siccome f (n1A ) = nf (1A ) =
def
n1B per ogni n Z si ha f = f|A : A
B surgettivo. Se f iniettivo allora

f iniettivo e quindi bigettivo.


5 STRUTTURE

112

Caratteristica di un anello e sottocampo primo


Sia A un anello e A A il suo sottoanello fondamentale. Se A
= Z `e

infinito si dice che A ha caratteristica zero mentre se A = Zm non nullo `e

def
finito si dice che A ha caratteristica positiva e si denota char (A) = A .
Se A `e un dominio allora char (A) deve essere zero oppure un numero primo
altrimenti A conterrebbe zero-divisori. Si noti che char (Zm ) = m e Zm `e un
sottoanello di A se A ha caratteristica positiva.
Proposizione 5.21 Sia f : A B un omomorfismo di anelli. Se char (A) 6=
0 allora char (B) 6= 0 e si ha char (A) char (B). Se f `e iniettivo allora
char (A) = char (B).
Dimostrazione: Per il Lemma 5.20 si ha f : A
B surgettiva e A
= B


se
f iniettiva. Se A `e finito allora anche B `e finito e char (B) = B
A = char (A) (per 2.21 e 2.23).

In particolare, non esistono omomorfismi di anelli f : A B se char (A) 6= 0
e char (B) = 0.
Se A `e un anello ordinato allora char (A) = 0 in quanto n1 A+ per ogni
n N+ ma 0 6 A+ e quindi n1 6= 0 per ogni n N+ . Il seguente fondamentale Teorema caratterizza glinteri come lunico anello ordinato con elementi
positivi ben ordinati.
Teorema 5.22 (Unicit`a deglinteri) Se A `e un anello ordinato tale che A+
'
sia ben ordinato in (A, ) allora lomomorfismo caratteristico Z A `e un
isomorfismo ordinato.
Dimostrazione: Lomomorfismo caratteristico `e ordinato (per 5.16): si ha
che Z
= A A e inoltre N+
= {n1 | n N+ } A+ . Siccome A+ `e ben
ordinato possiamo applicare linduzione transfinita al sottoinsieme S = {n1 |
n N+ }. Mostriamo che S soddisfa lipotesi induttiva
(x) = {y A+ | y < x} S x S
(x) = ovvero x = min A+ . Se x > 1 allora x 1 < x con x 1 A+
che contraddice la minimalit`a di x. Se x < 1 allora x2 < x in quanto x A+

5 STRUTTURE

113

ma inoltre x2 A+ che nuovamente contraddice la minimalit`a di x. Dunque


si deve avere x = 1 = min A+ e quindi min A+ S.
(x) 6= ovvero esiste y A+ tale che y < x e quindi y = n1 per qualche
n N+ per ipotesi induttiva. Allora x y < x con x y A+ per cui
x y = m1 e quindi x = n1 + m1 = (n + m)1 S.
In conclusione S = N+ e quindi N
= A+ {0} e infine Z
= A in quanto se
+
+
+
a 6 A {0} allora a A e quindi a = n1 per n N ovvero a = (n)1
per n N .

Vediamo ora, nel seguente Teorema, che i razionali sono il pi`


u piccolo campo
ordinato che contiene glinteri come sottoanello ordinato.
Teorema 5.23 (Unicit`a dei razionali) Sia A un dominio. Allora esiste un
campo K(A) con un omomorfismo iniettivo i : A , K(A) tale che ogni
omomorfismo iniettivo di anelli f da A a un campo K si estende in modo
unico a un omomorfismo (iniettivo) da K(A) a K
i

A
f

K(A)
( 

Se A `e ordinato esiste un unico modo di rendere K(A) ordinato tale che


i : A , K(A) sia un omomorfismo ordinato. In particolare, per A = Z si
ottiene K(A) = Q come campo ordinato.
Dimostrazione:
Si generalizza infatti, senza difficolt`a, la costruzione di
Q a partire da Z. Rappresentiamo una frazione mediante una coppia
(a, b) A A6=0 considerando equivalenti (a, b) (a0 , b0 ) se ab0 = ba0 coppie
proporzionali. Siccome A `e un dominio si vede (come nel Lemma 2.34) che la
relazione `e una relazione di equivalenza su A A6=0 . Definiamo linsieme
delle frazioni
a
def
K(A) = A A6=0 / = { | (a, b) A A6=0 }
b
come linsieme quoziente: si ha dunque che
a
a0
= 0 ab0 = ba0
b
b

5 STRUTTURE

114

Si ottiene un campo K(A) definendo somma e prodotto di frazioni e verificando (come per Q) che non dipendono dalla scelta di rappresentanti nella
classe di equivalenza. Si ha un omomorfismo di anelli (come in 2.35)
def a
i : A , K(A) a 7 i(a) =
1
chiaramente iniettivo. Sia f : A , K un omomorfismo iniettivo in un
campo K. Se a 6= 0 allora f (a) 6= f (0) = 0 e quindi f (a) `e invertibile in K.
Definiamo
a
7 f (a)f (b)1
K(A) , K
b
osservando che se (a, b) (a0 , b0 ) ovvero ab0 = ba0 allora f (ab0 ) = f (ba0 )
e quindi f (a)f (b0 ) = f (b)f (a0 ) ovvero f (a)f (b)1 = f (a0 )f (b0 )1 . Siccome
a/1 7 f (a), 1/b 7 f (b)1 e inoltre
a
a 1
= 7 f (a)f (b)1
b
1 b
per costruzione questo `e un omomorfismo ed `e lunico che estende f a K(A).
Supponiamo A ordinato (e quindi un dominio per 5.10) e K(A) ordinato in
modo che i : A , K(A) sia un omomorfismo ordinato. Se K(A)+ sono gli
elementi positivi di K(A) si ha dunque che
1
a
= ab ( )2 K(A)+ ab K(A)+
b
b
in quanto un quadrato non nullo `e sempre positivo. Siccome i : A+ , K(A)+
allora si ha
ab K(A)+ ab A+
Siccome linsieme
a
K(A)+ = { K(A) | ab A+ }
b
risulta effettivamente (verifcando come per Q nel Lemma 2.36) un sottoinsieme di elementi positivi di K(A) si ha che esiste un unico i : A , K(A)
omomorfismo ordinato.

Il campo K(A) si dice campo dei quozienti del dominio A. Se A = K `e un


campo si ha K = K(A). Sia
\
def
F=
K0
K 0 K

5 STRUTTURE

115

lintersezione di tutti i sottocampi K 0 di K. Si ha che F `e un campo che si


dice sottocampo primo di K.
Si ha char (F) = char (K 0 ) = char (K) (per 5.21) per ogni K 0 K sottocampo di K. Notare che K F in generale. Per la Proposizione 5.16, il
Corollario 5.19 e il precedente Teorema 5.23 si ha:
Corollario 5.24 Sia K un campo. Se char (K) = 0 allora si ha che
Q
=FK
oppure char (K) = p > 0 con p primo e quindi
Zp
= F = K K
In particolare, se K `e un campo ordinato allora si ha che K `e un estensione
del campo Q dei numeri razionali. Se invece K `e un campo finito allora
def
char (K) = p > 0 e quindi K `e un estensione del campo finito Fp = Zp con
p-elementi.

5.3

Anelli di polinomi

Sia A anello commutativo unitario. Un polinomio in X a coefficienti in A


def

`e una espressione formale p(X) = a0 + a1 X + a2 X 2 + + an X n con ai A,


inteso che due tali espressioni p(X) = a0 + a1 X + + an X n e q(X) =
b0 + b1 X + + bm X m coincidano, ovvero p(X) = q(X), se ai = bi in
A. Pi`
u precisamente, possiamo riscrivere p(X) mediante una successione
(a0 , a1 , a2 , . . . , an , 0, . . .) tale che ai 6= 0 per un numero finito di indici i N.
def
In questo modo a A si riscrive come (a, 0, . . .) e si ha che X = (0, 1, 0, . . .),
def
X 2 = (0, 0, 1, 0, . . .), etc. Ad esempio, 1 + X + X 2 = (1, 1, 1, 0, . . .). Chiaramente (a0 , a1 , a2 , . . . , an , 0, . . .) = (b0 , b1 , b2 , . . . , bm , 0, . . .) se e solo se ai = bi
in A. Sia dunque
Y
def
A[X] = {p(X) = (ai )iN | p(X) polinomio}
A
iN

il sottoinsieme del prodotto di infinite copie di A costituito da (ai )iN tali


che ai 6= 0 per un numero finito di indici i N. Definiamo la somma di due

5 STRUTTURE

116

polinomi p(X) = (a0 , a1 , a2 , . . . , an , 0, . . .) e q(X) = (b0 , b1 , b2 , . . . , bm , 0, . . .)


mediante
def
p(X) + q(X) = (a0 + b0 , a1 + b1 , . . . , ak + bk , . . .)
e il prodotto p(X) q(X) come segue
def

(a0 , a1 , a2 , . . . , an , 0, . . .) (b0 , b1 , b2 , . . . , bm , 0, . . .) = (c0 , c1 , . . . , ci , . . . , 0)


def

dove c0 = a0 b0 , c1 = a0 b1 + a1 b0 e
ci =

aj b k

j+k=i

In particolare, per a A si ha che a q(X) = (ab0 , ab1 , ab2 , . . . , abm , 0, . . .).


Dunque 1 A risulta unit`a anche di A[X]. Inoltre, X X = X 2 , etc. Non
`e difficile verificare che (A[X], +, ) `e un anello commutativo unitario detto
anello dei polinomi a coefficienti in A. Infine, la funzione
A A[X] a 7 (a, 0, . . .)
`e un omomorfismo di anelli iniettivo che identifica A con un sottoanello di
A[X].
Se f : A B `e un omomorfismo di anelli allora si ha ununica estensione di
f agli anelli di polinomi f : A[X] B[X] tale che X 7 X, lomomorfismo
cos` definito
(a0 , a1 , a2 , . . . , an , 0, . . .) 7 (f (a0 ), f (a1 ), f (a2 ), . . . , f (an ), 0, . . .)
Inoltre si ha:
Lemma 5.25 (Principio di sostituzione) Sia B un anello commutativo unitario e sia f : A B un omomorfismo di anelli. Dato b B esiste un unico
omomorfismo fb : A[X] B X 7 b ovvero
/

A
f

def

A[X]
(

fb

B
def

tale che fb (a) = f (a) per ogni a A e fb (X) = b.

5 STRUTTURE

117

Dimostrazione:
Supponiamo che esista un omomorfismo g : A[X] B
tale che g(a) = f (a) per ogni a A e g(X) = b. Dunque g(X 2 ) = b2 , etc.
g(X k ) = bk per ogni k 0. Inoltre, per p(X) = a0 + a1 X + + an X n
si ha che g(p(X)) = f (a0 ) + f (a1 )b + f (an )bn . Dunque g `e unicamente
determinato da g(a) = f (a) per ogni a A e g(X) = b. Basta dunque
verificare che
a0 + a1 X + + an X n 7 f (a0 ) + f (a1 )b + f (an )bn
sia un omomorfismo ma questo `e evidente. Ad esempio si vede facilmente
che
X
 X

X
X
p(X)q(X) =
ai bj X i+j 7
f (ai bj )bi+j =
f (ai )bi
f (bj )bj
dove p(X) = a0 + a1 X + + an X n e q(X) = b0 + b1 X + + bm X m .

Supponiamo che f sia linclusione A B di un sottoanello. Lomomorfismo


fb del Lemma 5.25 precedente associa ad un polinomio p(X) = a0 + a1 X +
+ an X n A[X] il suo valore in b B ovvero
def

p(b) = fb (p(X)) = a0 + a1 b + + an bn B
Dunque ha come immagine Im fb lanello A[b] e nucleo Ker fb lideale dei
polinomi p(X) tali che p(b) = 0. Diciamo che b B `e radice di un polinomio
p(X) A[X] se appunto p(b) = 0 ovvero se p(X) si annulla in b. Mediante
il Teorema 5.18 si ha il seguente:
Corollario 5.26 Sia A B un sottoanello di B commutativo unitario e
b B. Il sottoanello A[b] B `e canonicamente isomorfo allanello quoziente
di A modulo lideale dei polinomi che si annullano in b.
In particolare, con B = A[Y ] e b = Y si ha che fY `e iniettivo; dunque, fY
`e lunico isomorfismo A[X]
= A[Y ] che `e lidentit`a su A. Daltra parte, se
B = A e b = 0 si ha che A[0] = A e dunque A
= A[X]/(X).
Serie formali
Osserviamo che la stessa identica costruzione dellanello dei polinomi si pu`o
ripetere considerando successioni (an )nN di elementi di A anche se an 6= 0

5 STRUTTURE

118

per ogni n N. Chiamiamo serie formale una tale successione


def

(a0 , a1 , . . .) =

an X n

nN

Denotiamo A[|X|] lanello delle serie formali. Ad esempio, in A[|X|] si ha


che 1 X diventa invertibile e infatti si vede subito che
X
(1 X)1 =
Xn
nN

Inoltre si ha che:
P
Lemma 5.27 Una serie
an X n = a0 + a1 X + `e invertibile in A[|X|]
se e solo se a0 A `e invertibile.
1
Dimostrazione: Infatti, se a0 `e invertibile poniamo b0 = a1
0 , b1 = a0 (a1 b0 )
in modo che a0 b1 + a1 b0 = 0, etc. supponendo b0 , b1 , . . . , bn1 definiti e tali
che
X
aj b k = 0
def

def

j+k=m

per ogni m n 1 allora


n
X

bn = a1
0
def

!
ai bni

i=1

da cui si ricava
a0 b n +

n
X

ai bni =

i=1

aj b k = 0

j+k=n

Si ha dunque che (a0 + a1 X + )1 = b0 + b1 X + b2 X 2 + .

Mediante le serie formali a coefficienti interi, si possono ritrovare gli interi


p-adici mediante
/ Z[|X|]
Z

lim
Zpn

5 STRUTTURE

119

Infatti, p `e lunico omomorfismo che associa X 7 p ovvero


a0 + a1 X + a2 X 2 + 7 ([a0 + a1 p + a2 p2 + + an1 pn1 ]pn )nN
Chiaramente, p (X p) = 0 e in ragione di 4.30 si ha che p `e surgettiva.
Inoltre, se a0 + a1 X + a2 X 2 + Ker p allora sn = a0 + a1 p + a2 p2 + +
an1 pn1 pn 0 per ogni n N+ ovvero sn = bn1 pn per qualche bn1 Z.
Quindi
a0 = b0 p
a0 + a1 p = b1 p2 a1 p = b0 p b1 p2 a1 = b0 b1 p
a0 +a1 p+a2 p2 = b2 p2 a2 p2 = b0 p(b0 b1 p)pb2 p2 a2 = b1 b2 p
..
.
an = bn1 bn p
come si vede facilmente per induzione. Da queste identit`a segue che a0 +
a1 X + a2 X 2 + = (X p)(b0 + b1 X + b2 X 2 + ). In conclusione

Zpn
p : Z[|X|]/(X p) lim

Un analogo principio di sostituzione (come in 5.25) vale per le serie formali ma


per formularlo correttamente bisogna introdurre propriet`a delle serie formali
che esulano dai compiti di questo libro.
Divisione di polinomi
Dato un polinomio p A[X] non nullo sia p(X) = a0 + a1 X + + an X n
diciamo che il grado di p(X) `e n se an 6= 0 e ai = 0 per i > n. Denotiamo
deg p il grado. Inoltre, an `e detto coefficiente direttivo e il polinomio si dice
monico se an = 1.
Lemma 5.28 Se A `e un dominio allora
deg(p q) = deg p + deg q
per ogni p, q A[X] non nulli.

5 STRUTTURE

120

Dimostrazione:
Infatti, sia p(X) = an X n + di grado n e sia q(X) =
m
bm X + di grado m. Dunque an 6= 0 e bm 6= 0 da cui an bm 6= 0 in quanto
A `e un dominio, p(X)q(X) = an bm X n+m + e deg(p q) = n + m.

Se A non `e un dominio deg(p q) 6= deg p + deg q. Ad esempio, sia A = Z4 e


p(X) = 2X + 1. Si ha (2X + 1)2 = 1 in Z4 [X].
Come diretta conseguenza del Lemma 5.28 si ha che se A `e un dominio allora
A[X] `e un dominio. Inoltre, se A `e un dominio allora A[X] = A ovvero
p(X) `e invertibile in A[X] se e solo p(X) = a `e un elemento invertibile di A.
In particolare, se A = k `e un campo allora k[X] `e un dominio. Analogamente
p(X) k[X] invertibile implica p(X) k 6=0 e quindi k[X] non `e un campo.
Teorema 5.29 Siano f (X), g(X) A[X] e supponiamo che il coefficiente
direttivo di g(X) sia invertibile in A. Allora
f (X) = q(X)g(X) + r(X)
con r(X) = 0 oppure deg r < deg g.
Dimostrazione:
Se f = 0 allora q = r = 0. Sia f (X) = an X n + di
grado n e sia g(X) = bm X m + di grado m. Se n = deg f < m = deg g
allora f (X) = r(X) e q(X) = 0. Se n = deg f m = deg g procediamo per
induzione su n 0. Se n = m = 0 ovvero f (X) = a0 , g(X) = b0 A allora
1
a0 = a0 b1
0 b0 , q(X) = a0 b0 , r(X) = 0. Possiamo dunque applicare lipotesi
induttiva a tutti i gradi k di polinomi f 0 tali che k < n. Sia
nm
f 0 (X) = f (X) an b1
g(X)
m X
1 nm
X
)(bm X m ) + ha grado n 1 quindi
da cui f 0 (X) = an X n (an bm
f 0 (X) = q 0 (X)g(X) + r0 (X) e sostituendo
nm
f (X) = (q 0 (X) + an b1
)g(X) + r0 (X)
m X
nm
da cui q(X) = q 0 (X) + an b1
e r(X) = r0 (X).
m X

In generale, si dice che g(X) divide f (X) se r(X) = 0. Se ad esempio,


si considera a A, f (X) A[X] `e radice di f (X) se e solo se X a divide f (X): basta scrivere f (X) = q(X)(X a)+r(X) da cui r(X) = f (a) A.

5 STRUTTURE

121

Se A `e un dominio e deg f = n > 0 allora f (X) ha al pi`


u n-radici distinte in
A (come si vede facilmente per induzione sul grado n del polinomio).
In particolare in k[X] con k campo si ha che per ogni f (X), g(X) k[X] con
g(X) 6= 0 possiamo sempre scrivere f (X) = q(X)g(X) + r(X) con r(X) = 0
oppure deg r < deg g. Inoltre, il polinomio f (X) ha al pi`
u deg f radici in k.

5.4

Anelli euclidei

Sia A un anello commutativo unitario e siano a A6=0 e b A. Diciamo


che a divide b in A se b = ac per qualche c A. Sinteticamente scriviamo
a|b in questo caso. Osserviamo subito che se a|b, b|a e a oppure b non sono
zero-divisori allora b = ac e a = bc1 con c A invertibile. Infatti, se b = ac
e a = bd allora a = acd e dunque a(1 cd) = 0 oppure b = bdc e dunque
b(1 dc) = 0. Viceversa, se b = ac con c A invertibile allora a|b e b|a.
Sia A un dominio e a, b, c A6=0 :
a e b si dicono associati se a|b e b|a
a
/ A si dice irriducibile se a = bc b A oppure c A
a
/ A si dice primo se a|bc a|b oppure a|c
Denotiamo a b due elementi associati di A. La relazione `e una relazione
di equivalenza e le classi di equivalenza sono [a] = {ac | c A }. Per lanello
dei numeri interi A = Z si ha A = {1} e quindi [a] = {a, a} per a Z.
Un primo in Z `e un numero primo e irriducibile equivale a primo, per la
Proposizione 4.6.
Lemma 5.30 In un dominio ogni primo `e irriducibile.
Dimostrazione:

Se a = bc e a|b allora a = adc e quindi dc = 1.

def
Ad esempio, sia = 5 = 5i C radice del polinomio X 2 + 5.
Sia A = Z[ 5] C sottoanello dunque dominio. Si vede facilmente che
A = {1} e dunque
a sono i soli associati di a in A. Abbiamo che

6 = 2 3 = (1 + 5)(1 5). Si ha che2 `e irriducibile ma non `e primo


in A in quanto 2 non divide 1 5 in Z[ 5].

5 STRUTTURE

122

Dominio a fattorizzazione unica


Un dominio A si dice a fattorizzazione unica (U.F.D.) se tutti gli elementi
non invertibili a
/ A si possono scrivere come prodotto
a = a1 an
con ai irriducibile e in modo unico a meno di associati. Lunicit`a significa
che
a = a1 an = b 1 b m
implica che n = m e ai bj sono coppie di associati.
Ad esempio, A = Z `e

un U.F.D. (per il Teorema 4.8) mentre A = Z[ 5] non lo `e.


Lemma 5.31 In un U.F.D. ogni irriducibile `e primo.
Dimostrazione:
Supponiamo p|ab con a, b non invertibili e p irriducibile.
Dunque p|a1 an b1 bm ovvero a1 an b1 bm = pc e quindi p ai oppure p bj per qualche i o j per lunicit`a della fattorizzazione in irriducibili.
In conclusione, p|ai ma ai |a dunque p|a oppure p|bj ma bj |b dunque p|b.

Lemma 5.32 Se in un dominio A si ha che:


(a) ogni irriducibile `e primo e
(b) ogni a
/ A si scrive come a = a1 an con ai irriducibili
allora tale fattorizzazione `e unica a meno di associati ovvero A `e un U.F.D.
Dimostrazione: Sia a = p1 pn = q1 qm e procediamo per induzione su
n 1. Se a = p1 = q1 qm allora a `e irriducibile dunque m = 1 poich`e
qj sono irriducibili qj
/ A . Se n > 1 allora p1 |q1 qm dunque p1 |qk per
qualche k 1 poich`e p1 `e primo. Siccome qk `e irriducibile non ha divisori
propri e quindi p1 qk . Per ipotesi induttiva p2 pn `e unico a meno di
associati e quindi pi qj per ogni i, j 1.

In conclusione, in A anello U.F.D. si ha che la nozione di irriducibile e primo


coincidono. Inoltre, scegliendo una volta per tutte i rappresentanti pi nelle

5 STRUTTURE

123

classi di equivalenza degli associati si ha che ogni a


/ A si scrive in modo
unico
a = cpn1 1 pnk k
con pi primi, ni N e c A .
Esistenza di un massimo comun divisore
Sia A un dominio e a, b, c A6=0 : d A6=0 `e un massimo comun divisore di
def
a e b se d|a, d|b e se c|a e c|b allora c|d. Denotiamo d = (a, b) un massimo
comun divisore di a e b. Osserviamo subito che d `e unico a meno di associati:
se d0 = (a, b) `e un altro massimo comun divisore allora d|d0 e d0 |d ovvero
d d0 .
In un dominio A due elementi a, b A6=0 si dicono coprimi se 1 = (a, b). Ad
esempio, se a A oppure b A allora (a, b) = 1. Infatti, se a A allora
a|1 e a|b in quanto b = a(a1 b).
Proposizione 5.33 Se A `e U.F.D. allora d = (a, b) esiste per ogni a, b
A6=0 .
ms
1
Dimostrazione:
Siano a, b
/ A e sia a = cpn1 1 pnr r e b = c0 pm
1 ps .
l1
lt
Poniamo d = p1 pt dove li = min(ni , mi ). Non `e difficile vedere che
d = (a, b).

Proposizione 5.34 Se A `e P.I.D. allora d = (a, b) esiste per ogni a, b A6=0


e inoltre d = ra + sb per qualche r, s A6=0 .
Dimostrazione:
Siano (a) e (b) gli ideali principali generati da a, b
/ A .
def
Allora (a) + (b) = {ra + sb | r, s A} = I(S) con S = {a, b} `e un ideale.
Siccome A `e P.I.D. si ha che (a)+(b) = (d) `e principale, (a) (d) e (b) (d),
dunque a (d) e b (d) ovvero d|a e d|b. Inoltre d = ra + sb (a) + (b).
Infine, se c|a e c|b allora c|d.

5 STRUTTURE

124

Traduzione in termini di ideali


In un dominio A qualunque:
a|b b (a) (b) (a)
a b (a) = (b)
a A (a) = (1) = A
a irriducibile (a) 6= (1) e se (a) (b) allora (b) = (1) oppure
(a) = (b)
p primo (p) 6= (1) e se ab (p) allora a (p) oppure b (p)
Sempre in termini di ideali si ha che (d) lideale generato dal massimo comun
divisore d = (a, b) `e il pi`
u piccolo ideale principale contenente a e b. Infatti,
lideale somma (a) + (b) `e il piu piccolo ideale contenente gli elementi a e b
e quindi (a) + (b) (d) e inoltre se (a) + (b) (c) allora (d) (c) in quanto
c|d dalla definizione di massimo comun divisore.
Osserviamo che lideale somma esiste sempre, mentre, in generale, lesistenza
del pi`
u piccolo ideale principale contenente lideale somma dipende fortemente da propriet`a specifiche dellanello. In un anello qualunque, si denota
def
spesso (a, b) = (a) + (b) lideale somma.
Ideale primo e massimale
Un ideale I di un anello (commutativo unitario) qualunque A si dice
ideale primo se I 6= A e dati a, b A tali che ab I allora a I
oppure b I
ideale massimale se I 6= A e dato J ideale di A tale che I J allora
J = A oppure J = I.
Un anello con un unico ideale massimale si dice anello locale Ad esempio,
I = (0) primo se e solo se A dominio e I = (0) massimale se e solo se A
campo; ogni campo `e un anello locale e Z4 `e un anello locale che non `e un
campo. Si ha sempre che:

5 STRUTTURE

125

Lemma 5.35 In un anello commutativo unitario A ogni ideale I massimale


`e primo. Inoltre, il quoziente A/I `e un campo se e solo se I A `e massimale.
Dimostrazione:
Infatti, se ab I e a
/ I allora I ( (a) + I = A se I
massimale. Dunque, 1 = ra + x con r A e x I ma allora b = rab + bx I
in quanto rab I e bx I. Inoltre [r] = [a]1 in A/I. Infine, sia ora J ideale
di A tale che I ( J. Esiste dunque a J I ma se A/I `e un campo allora
1 = ra + x con r A e x I dunque ra J e x J da cui 1 J.

Ecco unimportante applicazione del Lemma di Zorn dellAppendice A.1.


Lemma 5.36 In un anello commutativo unitario A non nullo esiste sempre
un ideale massimale e quindi anche un ideale primo.
Dimostrazione:
Sia S = {I A | I ideale} ordinato per inclusione. Siccome A `e non nullo (0) S e quindi S 6= . Sia C S una catena ovvero
(C, ) totalmente ordinato. Vediamo che
[
def
J=
I
IC

`e un ideale proprio di A. Infatti, se x, y J allora x I e y I 0 con I I 0


oppure I 0 I in quanto I, I 0 C. Supponiamo I I 0 dunque anche x I 0
e x y I 0 poich`e I 0 `e un sottogruppo. Quindi x y J. Inoltre, se a A
e x J allora x I e ax I in quanto I `e un ideale. Quindi ax J. Infine,
J 6= A ovvero 1 6 J in quanto 1 6 I per ogni I C. In conclusione, ogni
catena C di (S, ) ha un maggiorante J ovvero (S, ) `e induttivo. Quindi
per il Lemma A.1 esiste un elemento massimale di (S, ) ovvero un ideale
massimale di A. Per il Lemma 5.35 esiste un ideale primo.

P.I.D. U.F.D.
Sia ora I un ideale principale di A dominio. Osserviamo che I = (p) `e un
ideale primo non nullo se e solo se p `e un elemento primo in A. Inoltre, se (p)
`e un ideale massimale allora p `e irriducibile ma non viceversa, in generale.
Proposizione 5.37 Se A `e P.I.D. allora I = (p) ideale non nullo `e primo
se e solo se massimale ovvero un elemento p A6=0 `e irriducibile se e solo se
`e primo.

5 STRUTTURE

126

Dimostrazione: Infatti, se ogni ideale `e principale, si ha che p irriducibile


(p) ideale massimale. Abbiamo dunque che (p) primo p primo p
irriducibile (p) massimale (p) primo.

Corollario 5.38 Sia I ideale non nullo in A P.I.D. Se A/I `e un dominio


allora `e un campo.
Si ha il seguente importante:
Teorema 5.39 Se A `e P.I.D. allora A `e U.F.D.
Dimostrazione: Basta vedere che per ogni a
/ A esiste una fattorizzazione
a = b1 bn con bi irriducibili, in quanto ogni irriducibile `e primo (per 5.37),
questa fattorizzazione `e unica (per 5.32). Supponiamo che a sia riducibile
a = a1 b1 e sia anche a1 = a2 b2 riducibile, dunque a = b1 b2 a2 , etc. ovvero
(a) (a1 ) (a2 ) Continuando a decomporre a in fattori irriducibili
per mostrare che il processo termina in numero finito di passi e dunque
si ha a = b1 bn con bi irriducibili mostriamo che ogni catena di ideali
(a) (a1 ) (a2 ) con ai
/ A `e stazionaria ovvero che esiste k tale che
(ak ) = (ak+1 ) = Sia I = (ai ) lunione di tutti gli ideali (ai ). Siccome
{(ai )} `e una catena di ideali si ha che I `e un ideale (come nella dimostrazione
di 5.36). In quanto A `e P.I.D. si ha che I = (b). Dunque esiste k tale che
b (ak ). Inoltre b 6 A in quanto (ai ) 6= A per ogni i. In conclusione
I = (b) (ak ) e quindi I = (ak ) = (ak+1 ) = .

Ad esempio, se k `e un campo in A = k[X] ogni ideale I `e principale: k[X] `e


P.I.D. e quindi U.F.D. per il Teorema 5.39. Infatti, se f (X) I `e un polinomio di grado minimo in I non nullo allora la divisione di polinomi mostra
che `e un generatore I = (f (X)). Basta applicare il Teorema 5.29 allanello k[X] nello stesso modo in cui abbiamo applicato nella dimostrazione del
Lemma 5.11 il Teorema 4.3 allanello Z dei numeri interi.
Sia k = R, C e sia f : R[X] C lomomorfismo X 7 indotto da
R C (per sostituzione 5.25). Limmagine Im f `e un dominio in quanto
sottoanello di C che `e un campo. Se Ker f 6= 0 allora R[] = Im f
=
R[X]/Ker f `e un sottocampo di C che contiene R (siccome R[X] `e un P.I.D.).

5 STRUTTURE

127

Infatti Ker f = (p(X)) con p(X) 6= 0 irriducibile in R[X]. Se R allora


p(X) X e R = R[]. Se 6 R allora f `e surgettivo. Se p() = 0
allora anche p() = p() = 0. Quindi il polinomio
def

p (X) = X 2 ( + )X + = (X )(X ) Ker f


Siccome + , R si ha che p (X) R[X] ed `e irriducibile in quanto
, 6 R: si ha dunque p(X) p (X). In particolare, per = i si ottiene
un isomorfismo
R[X]/(X 2 + 1)
=C
Osserviamo che dal precedente ragionamento segue che:
Proposizione 5.40 Se A `e un sottoanello di C che contiene R allora A = R
oppure A = C.
Dimostrazione:
Se R 6= A sia A \ R. Allora R[] A e quindi
A = R[] = C in quanto f : R[X] C `e surgettivo e Im f = R[].

Attenzione! Sia A un anello, consideriamo A[X] lanello dei polinomi


def
e sia a A6=0 . Sia (a, X) = (a) + (X) lideale generato da a e X in A[X].
Se (a, X) = (f (X)) `e principale allora f (X) = b A in quanto a (f (X))
e inoltre b A in quanto X (b) e dunque (a, X) = A. In particolare,
1 (a, X) e quindi a A . Se A `e un dominio che non `e un campo allora
A[X] `e un dominio che non `e a ideali principali; inoltre, X `e irriducibile
ma (X) non `e massimale. Ad esempio, se A = Z allora Z[X] non `e P.I.D.
Dimostriamo nel Lemma 5.51 per`o che Z[X] `e un U.F.D.

Divisione euclidea
Sia A un dominio. Una funzione : A6=0 N tale che (ab) (a) si dice
norma su A. Un anello euclideo `e una coppia (A, ) dove A `e un dominio
e `e una norma su A tali che per ogni a A e b A6=0 si ha
a = qb + r
per qualche q, r A con r = 0 oppure (r) < (b). Ecco alcuni esempi di
anelli euclidei:

5 STRUTTURE

128

A = Z e (z) = |z| il valore assoluto dellintero z Z6=0 per la ben nota


divisione euclidea in Z (come abbiamo visto nel Teorema 4.3)
A = k[X] con k campo e = deg il grado per la divisione di polinomi
in k[X] (come abbiamo visto nel Teorema 5.29)
A = K campo e costante in quanto a|b e b|a per ogni a, b A6=0 .
Osserviamo che in un dominio A con norma si ha che (a) (1) per
ogni a A6=0 e se a A allora (a) = (1); infatti, in questo caso anche
(a) (aa1 ) = (1). Se inoltre (A, ) `e euclideo allora vale anche il viceversa ovvero (a) > (1) per ogni a
/ A . Basta osservare che se b|a e
(a) = (b) allora a|b. Infatti, se a = bc, b = aq + r e r 6= 0 si ha r = b(1 qc)
e quindi (r) < (a) = (b) e (r) (b).
In particolare, (A, ) euclideo con (a) = (1) costante per ogni a A `e
necessariamente un campo.
Teorema 5.41 Se (A, ) `e euclideo allora A `e P.I.D. Se A `e un anello locale
vale anche il viceversa.
Dimostrazione: Sia (A, ) euclideo. Sia I 6= (0), (1) ideale proprio non nullo. Sia a0 I tale che a0 6= 0 e (a0 ) > (1) minimo di {(a) | a I} N.
Mostriamo che I = (a0 ). Sia a I e scriviamo a = a0 q + r. Dunque
r = a a0 q I da cui r = 0 altrimenti (r) < (a0 ) contraddice la minimalit`a di a0 .
Supponiamo che A sia un anello locale che `e anche P.I.D. Se A `e un campo
e dunque A = A6=0 poniamo = 0 costante. Altrimenti, sia dunque (p)
lunico primo non nullo di A (per 5.37). Siccome A `e U.F.D. (per 5.39) ogni
elemento a A6=0 si scrive a = cpn con c A . Definiamo : A6=0 N
a = cpn 7 n e dunque (a) = 0 per ogni a A e per a
/ A il valore
6=0
(a) = n > 0 `e unicamente determinato. Sia b A e sia b = c0 pm con
c0 A . Siccome (ab) = (a) + (b) si ha che `e una norma su A. Infine,
si ha che a|b oppure b|a in quanto m n oppure n m. Comunque sia, per
scrivere a = bq + r se n m allora a = bq con q = c00 pnm , c = c0 c00 ed r = 0
mentre se m > n allora a = r e q = 0.

5 STRUTTURE

129

Anelli locali euclidei


Ecco due importanti esempi di anelli locali che sono anche P.I.D. e quindi
euclidei (per 5.41). Consideriamo lanello
def

A = Z(p) = {a/b Q | (b, p) = 1} con p > 1 primo


Si ha che Z(p) Q `e un sottoanello dunque un dominio. Vediamo che ogni
ideale `e principale. Se a/b Z(p) `e tale che (a, p) = 1 allora b/a Z(p) e
viceversa. Dunque a/b
/ Z(p) implica che p|a. Denotiamo
def

(p/1) = {a/b Q | (b, p) = 1 & p|a}


lideale principale generato da p in Z(p) . Sia I 6= (1) un ideale di Z(p) : per
a/b I dunque p|a e I (p/1). Per ogni a/b I non nullo si ha
a
a0
= pn
b
b

(a0 , p) = 1 pn =

ba
I
a0 b
def

in quanto a0 /b `e invertibile in Z(p) . Se I 6= (0), (1) allora sia k = min{n N |


pn I}. Sia
def
(pk /1) = {a/b Q | (b, p) = 1 & pk |a}
Si ha (pk /1) I. Inoltre, per quanto gi`a osservato se a/b I allora
a/b = pn a0 /b dove n k per la minimalit`a di k. Si ha dunque che I = (pk /1)
`e principale. Dunque Z(p) `e P.I.D. e I = (pk /1) `e primo se e solo se pk irriducibile in Z(p) ovvero se k = 1. In conclusione, I = (p/1) `e lunico primo di Z(p) .
Un esempio del tutto analogo al precedente `e lanello delle serie formali a
coefficienti in un campo k ovvero
A = k[|X|] `e euclideo.
Osserviamo innanzitutto che ogni serie a0 +a1 X + con a0 6= 0 `e invertibile
in k[|X|] grazie al Lemma 5.27. Sia (X) lideale principale generato da X in
k[|X|]. Si ha che ogni ideale I 6= (1) di k[|X|] `e contenuto in (X). Inoltre,
una serie non nulla in I si scrive
X
an X n = X m (am + am+1 X + )
nN

con am 6= 0. Dunque am + am+1 X + `e invertibile e quindi X m I. Sia


def
k = min{m N | X m I}. Si ha (X k ) = I. Siccome k[|X|] `e un dominio
(perch`e!?) si ha che k[|X|] `e P.I.D. e lideale (X) `e il suo unico primo.

5 STRUTTURE

130

Interi di Gauss

Sia A = Z[ n] C con = n C tale che 2 + n = 0 e n


N+ un intero positivo. Per n = 1 si hanno glinteri di Gauss. Per n > 1
supponiamo che n sia libero da quadrati ovvero che nella fattorizzazione
in

primi n = p1
pk ci siano tutti primi distinti. Si ha che z Z[ n] si
scrive z = a + b n con a, b Z. Siccome

(z) = (a + b n)(a b n) = a2 + nb2 N

e inoltre (zz 0 ) = (z)(z 0


) per z, z 0 Z[ n] si ha che costituisce una
norma moltiplicativa su Z[ n]. Inoltre abbiamo che:

Lemma 5.42 Se y|z in Z[ n] allora (y)|(z) in N. In particolare, z `e


invertibile se e solo se (z) = 1.
Dimostrazione: Infatti, se z = xy allora (z) = (x)(y). Se z = 1 ovvero
x = y 1 allora 1= (x) = (y). Viceversa, se (z) = zz = 1 allora z = z 1 .

Quindi z 1 Z[ n].

Da quanto appena visto segue immediatamente che in A = Z[ n] si ha


A = {1} se n > 1. Per n = 1 ovvero per glinteri di Gauss A = {1,
i}.
Inoltre, si ha lesistenza di fattorizzazioni in elementi irriducibili in Z[ n].
Infatti, se z 6= 0 `e riducibile non invertibile allora z = z1 y1 e quindi (z) =
(z1 )(y1 ) con z1 e y1 non invertibili e quindi (z) > (z1 ) 6= 1. Proseguendo a fattorizzare z1 = z2 y2 , etc. troviamo zk tale che (zk ) = 1 e quindi
z = zk yk y1 `e una fattorizzazione. Nonostante ci`o osserviamo che questa
fattorizzazione non `e unica nella maggiorparte dei casi. Se n > 1 `e dispari
allora 2 `e irriducibile ma non primo in Z[ n]. Infatti, per n dispari si ha



n+1
n+1=2
n + 1 = (1 + n)(1 n)
2
Per n > 1
dispari si ha che 2 divide propriamente n + 1 ma non divide i
fattori 1 n. Per n = 1 notare che 2 = (1 + i)(1 i) = i(1 + i)2 non `e
irriducibile (e quindi neanche primo!) in Z[i] e la fattorizzazione `e unica (a
meno di associati) in quanto
A = Z[i] glinteri di Gauss sono un anello euclideo

5 STRUTTURE

131

Infatti si ha:
Lemma 5.43 Per x, z Z[i] se x 6= 0 allora
z = xy + r
dove y, r Z[i] e si ha r = 0 oppure (r) < (x).
Dimostrazione: Sia Q[i] C il sottocampo Q[i]
= Q[X]/(X 2 +1). Si ha che
Z[i] Q[i] `e un sottoanello. Se x, z Z[i] e x 6= 0 allora x1 = x/(x) Q[i]
e pure zx1 Q[i]. Se zx1 Z[i] allora z = xzx1 e poniamo y = zx1 e
r = 0. Altrimenti, nel disco D = {y Q[i] | (zx1 y) 1/2} scegliamo il
nostro y Z[i] (che esiste sempre: perch`e!?). Dunque
z = xy + x(zx1 y)
e troviamo r = z xy Z[i] tale che
(r) = (x(zx1 y)) = (x)(zx1 y) (x)/2 < (x)
come volevasi dimostrare.

Siccome Z[i] `e euclideo allora `e U.F.D. e quindi ogni irriducibile `e primo in


Z[i]. Ad esempio, 3 `e primo anche in Z[i] ma 5 = (2 + i)(2 i) `e riducibile.
Abbiamo che:
Lemma 5.44 Sia p > 1 un numero primo. Se p non `e primo in Z[i] allora
p = dove e sono primi coniugati in Z[i].
Dimostrazione:
Ogni p Z primo non `e invertibile in Z[i]. Se p non `e
primo in Z[i] allora esiste Z[i] primo che divide p. Dunque divide p2
in Z e quindi = p. Infatti, () = = p2 e |p implica che `e associato

a p (e se () = = 1 allora `e invertibile).

Siccome = a + ib e () = = a2 + b2 come conseguenza di quanto


visto si ha che un numero primo p > 1 si scrive come somma di quadrati
p = a2 + b2 se non `e primo in Z[i]. Viceversa, se p = a2 + b2 `e primo allora

5 STRUTTURE

132

p = (a + ib)(a ib) con a ib non invertibili in Z[i] quindi p riducibile ovvero


non primo in Z[i]. In conclusione, se p > 1 `e un numero primo
p = a2 + b2 con a, b Z p non `e primo in Z[i]
Siccome i quadrati n2 di n N sono n2 4 0 se n `e pari oppure n2 4 1 se n
`e dispari allora segue che p 4 1 se p `e un primo dispari che si scrive come
somma di due quadrati. Vale anche il viceversa:
Teorema 5.45 Sia p > 1 un numero primo dispari. Si ha
p = a2 + b2 con a, b Z

p 4 1

p non `e primo in Z[i]

Dimostrazione:
Per quanto detto precedentemente basta mostrare che se
p 4 1 allora p non `e primo in Z[i]. Questo segue dal Teorema di Wilson 4.28.
Infatti, se p = 1 + 4n allora x = (2n)! `e soluzione della congruenza x2 p 1.
Si ha
1 p (p 1)! = [(p 1)(p 2) (p 2n)] [(2n)(2n 1) 1]
p [(1)(2) (2n)] [(2n)(2n 1) 1]
= [(1)2n (2n)!] [(2n)!]
= [(2n)!]2
Di conseguenza p divide x2 + 1 per x = (2n)! ma p non divide x + i e neppure
x i in Z[i] e quindi p non `e primo.

Attenzione! In generale, abbiamo dunque visto che A = Z[] C non


`e U.F.D. quindi non `e P.I.D. ma Z[i] `e un
dominio euclideo! Vogliamo per`o
aggiungere che A = Z[] per = (1 + 19)/2 `e P.I.D. ma non euclideo
(non `e ovvio mostrarlo!).

5.5

Numeri algebrici

Un numero complesso C `e detto algebrico se `e radice di un polinomio


non nullo a coefficienti razionali ovvero se esiste p(X) Q[X] tale che p() =
0. Ad esempio, ogni numero razionale a/b Q `e radice del polinomio
pbXa
Z[X] e possiamo sempre ottenerlo con (a, b) = 1. Inoltre, = a/b C
sono algebrici: per p(X) = bX 2 a si ha p() = 0 per ogni a/b Q.

5 STRUTTURE

133

Numeri trascendenti
Altrimenti, se non `e algebrico, si dice trascendente ovvero nel caso in cui
tale polinomio non esista. Si vede che C `e trascendente.
Polinomi a coefficienti interi
Abbiamo visto che Q[X] `e un anello euclideo ma Z[X] non `e P.I.D. dunque
non `e euclideo nonostante Z sia euclideo; si vede per`o che Z[X] `e U.F.D. In
generale, si dimostra:
Teorema 5.46 Se A `e U.F.D. allora A[X] `e U.F.D.
Un altro esempio di U.F.D. non P.I.D. `e dunque lanello di polinomi in n 2
variabili definito per induzione
def

k[X1 , X2 , , Xn ] = k[X1 , X2 , , Xn1 ][Xn ]


a coefficienti in k campo.
Se A `e U.F.D. diciamo che un polinomio p(X) = a0 + a1 X + an X n A[X]
`e primitivo se i coefficienti a0 , , an A non hanno fattori comuni che non
def

siano invertibili. In altre parole se c(p) = (a0 , , an ) `e un massimo comun


divisore si ha p(X) primitivo se e solo se c(p) 1. Ad esempio, ogni polinomio monico `e primitivo ma non viceversa. Se A = k campo ogni polinomio
p(X) k[X] si scrive p(X) = cp0 (X) con c k e p0 (X) monico: questo non
`e vero in generale. Se A = Z possiamo al pi`
u richiedere che il coefficiente
direttivo di un polinomio primitivo sia positivo.
Dimostriamo il Teorema precedente nel caso di A = Z
Lemma 5.47 Ogni polinomio non nullo p(X) = a0 + a1 X + an X n
Q[X] si scrive in modo unico p(X) = cp0 (X) dove c Q e p0 (X) Z[X] `e
primitivo. Inoltre, p(X) Z[X] se e solo se c Z e p(X) `e primitivo se e
solo se c = 1 .
Dimostrazione: Si ha ap(X) Z[X] dove a `e il minimo comune multiplo
dei denominatori di ai Q. Si ha bp0 (X) = ap(X) dove b `e il massimo
comun divisore dei coefficienti di ap(X) preso con segno concorde con quello
def
del coefficiente direttivo di p(X). Quindi c = b/a.

5 STRUTTURE

134

Lemma 5.48 (Lemma di Gauss) Un prodotto di polinomi primitivi in Z[X]


`e primitivo.
Dimostrazione:

Sia h = f g con f, g primitivi. Sia p Z un primo e sia

p : Z[X] Zp [X] am X m + + a0 7 am X m + + a0
lomomorfismo surgettivo di anelli di polinomi indotto da p : Z Zp ovvero
dalla riduzione modulo p dei coefficienti. Siccome Zp [X] `e un dominio il
nucleo di p : Z[X] Zp [X] `e un ideale primo e si tratta dellideale dei
polinomi per cui p divide i coefficienti
def

Ker p = (p)[X] = {am X m + + a0 Z[X] | ai (p)}


Siccome f e g sono primitivi f, g
/ (p)[X] ma (p)[X] `e primo e dunque
h = fg
/ (p)[X]. In conclusione, h
/ (p)[X] per ogni primo p Z e dunque
h `e primitivo.

Lemma 5.49 Ogni irriducibile in Z[X] `e primo.


Dimostrazione: Sia f Z[X] irriducibile. Mostriamo che (f ) `e un ideale
primo. Sia gh (f ) e scriviamo g = cg 0 Z[X] e h = dh0 Z[X] con g 0 , h0
primitivi dunque g 0 h0 primitivo. Osserviamo che: se f = p Z `e un primo
allora qualche coefficiente di g 0 h0 sia a Z non `e divisibile per p ma p|gh
implica p|cda e dunque p|c oppure p|d ovvero g (f ) oppure h (f ); se f `e
un polinomio primitivo che `e irriducibile in Q[X] allora (f ) `e primo in Q[X]
e dunque f |g oppure f |h in Q[X]. Basta dunque mostrare che:
(i) se f Z[X] `e irriducibile allora f `e un primo in Z oppure `e un polinomio
primitivo che `e irriducibile in Q[X]
(ii) se f, g Z[X] con f primitivo e f |g in Q[X] allora f |g in Z[X].
Per vedere (ii) sia g = f q, q Q[X] scriviamo q = tq 0 con q 0 primitivo e
dunque f q 0 primitivo, g = tf q 0 Z[X] da cui t Z e quindi q Z[X].
Per vedere (i) sia f = zf 0 Z[X] irriducibile dunque f 0 = 1 oppure z = 1.
Se f 0 = 1 allora f = p `e un primo in Z. Se z = 1 allora f `e primitivo
irriducibile in Z[X] e dunque in Q[X].

5 STRUTTURE

135

Lemma 5.50 Ogni polinomio non nullo p(X) Z[X] si scrive


p(X) = p1 pm q1 (X) qn (X)
dove pi sono primi in Z e qj Z[X] sono polinomi primitivi irriducibili in
Z[X].
Dimostrazione:
Sia p = cp0 con p0 primitivo. Se p0 `e irriducibile basta
fattorizzare c e si ha la tesi. Altrimenti fattorizziamo anche p0 = q1 q2 dove q1 , q2 Z[X] sono ancora primitivi (in quanto p0 `e primitivo). Si ha
che deg(p) = deg(p0 ) ma deg(qi ) < deg(p0 ) e continuando a fattorizzare il
grado dei polinomi qi decresce e quindi ha un minimo > 0 e si ottiene la
fattorizzazione.

Da questi ultimi due lemmi segue (per 5.32) che:


Lemma 5.51 Z[X] `e U.F.D.
In generale, la dimostrazione di 5.46 ovvero che A U.F.D. A[X] U.F.D.
non `e difficile: lunica differenza dal caso A = Z `e che in A possono esserci
parecchi elementi invertibili. Si sfrutta lesistenza del campo dei quozienti
K(A) (vedere 5.23) e il fatto che A[X] `e su sottoanello di K(A)[X]. Il Lemma
di Gauss 5.48 vale anche per A[X] con la stessa dimostrazione.
Interi algebrici
Se C `e algebrico, supponiamo quindi che esiste p(X) Q[X] tale che
p() = 0, allora possiamo sempre trovare anche p0 (X) Z[X] primitivo tale
che p0 () = 0 (basta considerare p = cp0 con c Q). Diciamo inoltre che
`e un intero algebrico se esiste un polinomio p(X) Z[X] monico tale che
p() = 0.
Ad esempio, le radici n-esime dellunit`a sono interi algebrici in quanto sono
radici del polinomio monico p(X) = X n 1.
In altre parole sia C e sia f : Q[X] C lomomorfismo che associa ad
un polinomio p(X) Q[X] il suo valore p() ovvero
p(X) = an X n + a1 X + a0 7 p() = an n + a1 + a0

5 STRUTTURE

136

Si ha che Im f = Q[] C `e un dominio e dunque Ker f `e un ideale


primo. Se Ker f 6= 0 allora `e algebrico e viceversa. In effetti, siccome
Q[X] `e P.I.D. si ha inoltre che Ker f = (p(X)). Se p(X) 6= 0 allora p(X)
`e irriducibile e Q[] `e un campo che coincide con Q() il pi`
u piccolo campo contenente Q ed . Se p(X) = 0 ovvero trascendente si ha Q[X]
= Q[].
In generale, un sottocampo K di C si dice campo di numeri algebrici se
tutti i suoi elementi sono algebrici. Ad esempio, se `e algebrico, non `e difficile (ma non `e ovvio) vedere che K = Q() `e un campo di numeri algebrici.
Il generatore non nullo p(X) di Ker f `e un polinomio di grado minimo che
ha come radice ed `e unico a meno di associati: possiamo scegliere p0 (X)
p(X) primitivo e irriducibile in Z[X]. Si ha:
Lemma 5.52 Z[X]/(p0 (X))
= Z[].
Dimostrazione:
Se consideriamo lanalogo omomorfismo f : Z[X] C
che associa ad un polinomio il suo valore in si ha Im f = Z[] e dunque
basta mostrare che Ker f = (p0 (X)). Infatti, se g Z[X] con g() = 0
allora e p0 |g in Q[X] ma allora p0 |g in Z[X], come abbiamo visto, in quanto
p0 `e primitivo.

Come conseguenza si ha:


Teorema 5.53 Un numero algebrico C `e un intero algebrico se e solo
se il suo polinomio p0 (X) Z[X] primitivo irriducibile `e monico.
Dimostrazione: Infatti, se p0 (X) non `e monico nessun suo multiplo in Z[X]
pu`o essere monico.

Sia K un campo di numeri algebrici. Si vede che


def

OK = {z K | z intero su Z}
`e un anello e si dice anello degli interi del campo K. La verifica che OK `e
un anello non `e elementare! Siccome non ne faremo alcun uso nel seguito la
omettiamo e rimandiamo il lettore interessato a un qualunque testo di teoria
algebrica dei numeri. Proponiamo comunque i due esempi paradigmatici:

5 STRUTTURE

137

Se K = Q allora OK = Z sono gli interi. Per z = b/a Q con (a, b) = 1


ha polinomio primitivo irriducibile p0 (X) = aX b Z[X] che `e monico
se e solo se z Z.
Se K = Q(i) allora OK = Z[i] sono gli interi di Gauss. Per Q(i)
ha polinomio p(X) = X 2 ( + )X + e gli interi sono tutti e soli
Z[i]. Infatti se = s + it con s, t Q allora 2 2s + s2 + t2 = 0.
Se t, s Z allora 2s, s2 + t2 Z; inoltre, Q(i) `e intero su Z solo
se p(X) ha coeffficienti interi e quindi s, t Z (perch`e!?).

2)
allora
O
=
Z[
2] ma se
Analogamente
si
vede
che
se
K
=
Q(
K

K = Q( 3) ci sono interi algebrici che non sono elementi di Z[ 3].

Attenzione!
Non farsi ingannare da ingenue analogie nel dire che un

numero algebrico sia un intero o meno! Ad esempio, = (1 + 3)/2 `e


un intero algebrico. Infatti, 2 + + 1 = 0 e inoltre
Z[] sono tutti interi

(detti di Eisenstein). Infatti, Q() = Q( 3) ha sempre polinomio


p(X) = X 2 ( +)X +. Sia = s+t allora 2 (2st) +s2 st+t2 = 0.
Se Z[]allora 2s + t, s2 st + t2 Z. Un altro esempio `e anche
=
1+ = (1+ 3)/2 che `e dunque un intero algebrico. Se per`o = (1+ 2)/2
allora 42 4 1 = 0 ma questo non `e un intero algebrico.

5.6

Moduli e algebre

Presentiamo infine le strutture algebriche che possono esser considerate come


concetti riassuntivi di quanto visto precedentemente. La struttura di modulo
`e una diretta generalizzazione di quella di anello.
Supponiamo che (A, +A , A , 1) sia un anello commutativo unitario. Diciamo
che un insieme M ha una struttura di A-modulo se
(a) (M, +M , 0) `e un gruppo abeliano
(b) con unazione
A M M (a, m) 7 a m
tale che:

5 STRUTTURE

138

(b.1) a (m +M n) = a m +M a n
(b.2) (a +A b) m = a m +M b m
(b.3) (a A b) m = a (b m)
(b.4) 1 m = m
per ogni a, b A e m, n M .
In particolare, ogni anello commutativo unitario A `e canonicamente un Amodulo intendendo che sia il prodotto A in A. Se A = k `e un campo un
k-modulo viene anche detto k-spazio vettoriale.
Osserviamo che dalle (b.1) e (b.2) segue che a 0 = 0 = 0A m e inoltre
(a) m = (a m) = a (m) per ogni a A e m M . Si ha dunque
che (n1) m = nm per ogni n Z e m M .
Siano (M, M ) e (N, N ) due A-moduli. Un omomorfismo f : M N di
gruppi abeliani `e A-lineare o un A-omomorfismo se
f (a M m) = a N f (m)
per ogni a A e m M . Un isomorfismo di A-moduli `e un isomorfismo
A-lineare di gruppi abeliani.
Ad esempio, per ogni m M esiste un unico A-omomorfismo m : A M
a 7 a m tale che
/A
Z
m

' 

M
tale che componendo con lomomorfismo caratteristico Z A si ottiene lunico omomorfismo di gruppi abeliani m : Z M (che abbiamo introdotto
in 5.12).
Si hanno i seguenti paradigmatici esempi di A-moduli.
Ogni gruppo abeliano (G, +, 0) ha una struttura canonica di Z-modulo
def

Z G G (n, g) 7 n g = ng
come abbiamo infatti gi`a visto. In effetti, questa struttura `e unica.
Inoltre, ogni omomorfismo di gruppi abeliani `e chiaramente Z-lineare.

5 STRUTTURE

139

Ogni ideale I A ha una struttura canonica di A-modulo


def

A I I (a, x) 7 a x = a A x
Ogni An per n N+ ha una struttura canonica di A-modulo
def

AAn An (a, (a1 , . . . , an )) 7 a(a1 , . . . , an ) = (aA a1 , . . . , aA an )


Analogamente

AN

nN

ha una struttura di A-modulo.


Osserviamo che An come pure AN `e un anello considerando somma e prodotto
sulle componenti. Inoltre : A An a 7 (a, . . . , a) `e un omomorfismo di
anelli tale che (a) An (ai )i=1,...,n = a (ai )i=1,...,n . Analogamente per AN si
ha un omomorfismo di anelli
Y
: A
A a 7 (a)nN
nN

tale che (a) AN (an )nN = a (an )nN .


In generale, si ha che
ogni omomorfismo f : A B di anelli commutativi unitari determina
una struttura di A-modulo su B come segue
def

A B B (a, b) 7 a b = f (a) B b
per a A e b B. Sia g : A C un altro omomorfismo di anelli commutativi unitari e consideriamo C come A-modulo; allora un
omomorfismo di anelli h : B C `e A-lineare se e solo se si ha
f

A
g

/B
' 

g = hf . Infatti, questa verifica `e un buon esercizio per il lettore volenteroso.

5 STRUTTURE

140

Diciamo che B `e una A-algebra se (B, +B , B ) `e un anello, non necessariamente commutativo ma unitario, con un omomorfismo di anelli f : A B
tale che f (a) B b = b B f (a) per ogni a A e b B se B non `e commutativo. Un omomorfismo di A-algebre `e un omomorfismo di anelli che `e inoltre
A-lineare.
Ad esempio, sia B = A[|X|] e sia f lomomorfismo canonico A A[|X|].
Mediante tale omomorfismo si ottiene una struttura di A-modulo
A A[|X|] A[|X|] (a, a0 + a1 X + ) 7 aa0 + aa1 X +
che infatti coincide con quella canonicamente indotta da lomomorfismo
diagonale considerato in precedenza una volta ricordato che a0 + a1 X +
sidentifica con (an )nN . Si ha dunque che
Y

A
A[|X|]
nN

`e un isomorfismo di A-moduli ma non di anelli! Per ogni anello A abbiamo quindi due A-algebre che sono isomorfe come A-moduli ma non come
A-algebre.
Analogamente, lanello dei polinomi a coefficienti in A `e una A-algebra; lomomorfismo canonico A A[X] induce una struttura di A-modulo sullanello A[X]. Se consideriamo
Y
X def
A
A = {(an )nN | m N n m an = 0}
nN

nN

si ha un sottogruppo che eredita la struttura di A-modulo (ma non `e un


sottoanello!). Inoltre si ha che
X

A[X]
A
nN

`e un isomorfismo di A-moduli.
Algebre di matrici
Una matrice m n di elementi di un anello commutativo unitario A `e una
funzione dallinsieme di indici {1, . . . , m} {1, . . . , n} a valori in A. Una

5 STRUTTURE

141

matrice viene comunemente indicata come una tabella (aij ) dove i e j sono
gli indici di riga e colonna rispettivamente. I singoli elementi aij sono anche
dette entrate della matrice ed il formato `e il numero di righe per il numero
di colonne. Adotteremo la seguente notazione
def

Mm,n (A) = {matrici m n ad entrate in A}


Notare che si ha una funzione bigettiva canonica

An M1,n (A) (a1 , . . . , an ) 7 (a11 , . . . , a1n )


e inoltre

a11

An Mn,1 (A) (a1 , . . . , an ) 7 ...


an1

In una matrice (aij ) Mm,n (A) con m n i termini aii per i = 1, . . . m


vengono detti diagonale principale. Una matrice diagonale `e una matrice
quadrata ovvero con m = n tale che tutti gli elementi aij con i 6= j sono
nulli.
def

Siano (aij ) e (bij ) matrici mn. La somma di matrici (aij )+(bij ) = (aij +bij )
`e ancora una matrice m n. Si ha che (Mm,n (A), +, 0) `e un gruppo abeliano
dove 0 indica la matrice nulla. Si ha una struttura naturale di A-modulo
def

A Mm,n (A) Mm,n (A) (a, (aij )) 7 a (aij ) = (aaij )


Sia (aij ) matrice m n e sia (bij ) matrice n l. Il prodotto righe per colonne
(aij ) (bij ) `e la matrice m l che al posto ij ha il risultato

b1j

 b2j def

= ai1 b1j + ai2 b2j + + ain bnj
ai1 ai2 a13 . . . ain
.
.
.

bn1j
bnj
della i-esima riga di (aij ) per la j-esima colonna di (bij ).
Ad esempio, moltiplicando a sinistra della matrice (aij ) la matrice m m
diagonale a ovvero la matrice m m dove a compare sulla diagonale si
ottiene
a (aij ) = (aaij ) = a (aij )

5 STRUTTURE

142

Analogamente moltiplicando a destra della matrice (aij ) la matrice n n


diagonale a si ottiene ancora (aaij ). In particolare, si ha che la matrice
def
quadrata diagonale I = 1 con 1 sulla diagonale `e tale che IM = M I = M
per una qualunque matrice quadrata M dello stesso formato di I. La matrice
I si dice matrice identica. Si verifica che:
Lemma 5.54 Siano M, N, P Mn (A) matrici quadrate n n.
M(NP) = (MN)P
M(N + P) = M N + M P
(M + N) P = M P + N P
Le matrici quadrate (Mn (A), +, , I) con entrate in un anello A commutativo
unitario rispetto alle operazioni di somma di matrici e prodotto righe per
colonne costituiscono un anello non commutativo (se n 2) unitario. Inoltre
: A Mn (A) a 7 a
`e un omomorfismo di anelli che induce una struttura di A-algebra su Mn (A)
che, in generale, non `e commutativa.

A APPENDICI

A
A.1

143

Appendici
Buon ordinamento

Presentiamo qui altre forme equivalenti dellassioma della scelta.


Sia (X, ) ordinato. Un sottoinsieme C X si dice catena se (C, ) `e
totalmente ordinato. Si dice che (X, ) `e induttivo se ogni catena ha un
maggiorante. Ad esempio, linsieme delle parti ordinato per inclusione `e
induttivo.
Lemma A.1 (Lemma di Zorn) Se (X, ) `e induttivo allora ha elementi
massimali.
Dimostrazione: Supponiamo per assurdo che X non abbia massimali. Sia
X linsieme degli insiemi superiormente limitati di X. Si ha che X 6 X ma
ogni catena C X per ipotesi. Per ogni Y X denotiamo Y linsieme dei
maggioranti: se Y X si ha che Y \Y 6= . Infatti, se esiste max Y = Y Y
siccome X non ha massimali esiste x > max Y e dunque x Y \ Y . Sia
F = {Y \ Y | Y X}. Consideriamo una funzione di scelta
[
Y\Y
f :F
Y X

e sia f : X X che associa Y 7 f (Y \ Y ) il suo prolungamento. Sia X


linsieme di Y X tali che (Y, ) `e ben ordinato. Si ha che X X per
ipotesi e sia f : X X la restrizione di f .
Sia Y X tale che per ogni y Y si ha y = f ( (y)): diciamo che un
tale Y `e un f -insieme. Ad esempio, `e un f -insieme (dove = X). Sia
def
y0 = f (). Allora (y0 ) = in ({y0 }, ) e dunque ({y0 }, ) `e un f -insieme.
Consideriamo in X lordinamento Y < Y 0 se Y `e un segmento iniziale di
Y 0 . Dunque < Y e y0 Y per ogni f -insieme non vuoto Y . Infatti, se
y = min Y allora (y) = e quindi y = f () = y0 . Dati due f -insiemi Y e
Y 0 si ha che Y Y 0 oppure Y 0 Y . Infatti, sia Z lunione di tutti i segmenti
iniziali V Y e V Y 0 . Se Y \ Z 6= sia z = min(Y \ Z). Se y Z allora
z < y implica che z Z in quanto Z `e unione di segmenti iniziali. Quindi
y < z per ogni y Z ovvero Z (z) ma anche (z) Z in quanto
z `e il minimo di Y \ Z. In conclusione Z = (z) < Y . Analogamente

A APPENDICI

144

Z = (z 0 ) < Y 0 per z 0 = min(Y 0 \ Z). Siccome Y e Y 0 sono f -insiemi si


ha z = f ( (z)) = f (Z) = f ( (z 0 )) = z 0 . Si ottiene dunque un f -insieme
Z {z} tale che Z < Z {z} e pure Z {z} Y e Z {z} Y 0 ovvero
Z {z} Z che implica z Z: assurdo! Si deve quindi avere che Z = Y
oppure Z = Y 0 ovvero Y Y 0 oppure Y 0 Y .
Sia T lunione di tutti gli f -insiemi Y X. Si ha che T `e un f -insieme.
Infatti, T `e ben ordinato. Siccome y0 = min Y per ogni f -insieme non vuoto
Y si ha che y0 = min T . Se S T `e non vuoto allora S Y `e non vuoto per
qualche f -insieme Y e sia y = min(S Y ). Se y 0 S tale che y 0 < y allora
y 0 Y 0 per qualche f -insieme Y 0 ma come abbiamo visto Y 0 Y oppure
Y Y 0 . Se Y 0 Y allora y 0 Y dunque y 0 S Y e y 0 < y contraddice
la minimalit`a di y. Se Y < Y 0 allora Y `e un segmento iniziale di Y 0 e y 0 < y
implica y 0 Y che nuovamente contraddice la minimalit`a di y. Siccome T `e
totalmente ordinato (verificare per esercizio!) si ha dunque che y = min S.
Inoltre se y T allora esiste Y tale che y Y e si ha y = f ( (y)).
def

Sia t = f (T ). Siccome t = f (T \ T ) T \ T si ha che t 6 T e inoltre t0 < t


per ogni t0 T . In conclusione, T {t} `e ben ordinato f ( (t)) = f (T ) = t
e quindi T {t} `e un f -insieme tale che T < T {t} ma anche T {t} T
e quindi t T : assurdo!

Lemma A.2 (Buon ordinamento) Per ogni insieme X esiste un ordinamento (X, ) per il quale `e ben ordinato.
Dimostrazione:
Sia X un insieme. Sia O = {S X | S ben ordinato}
e consideriamo lordinamento S < S 0 se S `e un segmento iniziale di S 0 .
Ogni catena C di (O, ) ha un estremo superiore: infatti sup C = C O
(verificare per esercizio!). Per il Lemma A.1 esiste un elemento massimale
S O. Mostriamo che X = S. Se esiste x X tale che x 6 S allora S {x}
`e ben ordinato con s < x per ogni s S. Dunque S `e un segmento iniziale
di S {x} e quindi S < S {x} che `e assurdo per la massimalit`a di S.

Lemma A.3 Assioma della scelta Lemma A.1 Lemma A.2.

A APPENDICI

145

Dimostrazione: Infatti, abbiamo dimostrato il Lemma A.1 mediante lassioma della scelta e il Lemma A.2 mediante il Lemma A.1. Basta vedere che il
Lemma A.2 implica lassioma della scelta. Sia F un insieme tale che 6 F.
Sia U lunione di tutti gli X per X F. Esiste un ordinamento (U, ) per
il quale `e ben ordinato. Siccome X U e X 6= allora esiste min X X.
Associando X 7 min X si ha una funzione di scelta f : F U . Per il
Lemma 2.17 si conclude.

A.2

Numeri ordinali

Un insieme ben ordinato (, ) `e un numero ordinale se (x) = x per


ogni x . Notare che (x) = {y X | y < x} `e un sottoinsieme; per i
numeri ordinali si ha quindi che ogni segmento iniziale `e anche un elemento.
Inoltre, ogni elemento `e anche un segmento iniziale e quindi un sottoinsieme.
Osserviamo infatti che (x) = x se e solo se y < x equivale a y x in . Se
`e un ordinale anche {} `e un ordinale con lordinamento x < y se x y
per x, y {}. Ad esempio, abbiamo quindi che 0, 1, . . . , N, N {N}, . . .
sono tutti ordinali.
Lemma A.4 Si ha che:
linsieme vuoto `e un ordinale ed `e il minimo di ogni ordinale non vuoto;
ogni segmento iniziale di un ordinale `e un ordinale e ogni ordinale `e un
segmento iniziale di qualche ordinale;
ogni elemento di un ordinale `e un ordinale e ogni ordinale `e un elemento
di qualche ordinale;
ogni ordinale non `e elemento di se stesso.
Dimostrazione: Abbiamo gi`a osservato che 0 = `e un ordinale. Sia un
ordinale non vuoto e sia a = min . Si ha = (a) = a. Chiaramente
(x) = x `e un ordinale per ogni x . Ogni ordinale `e segmento
iniziale e pure elemento dellordinale {}. Infine, implica che
= () e quindi 6 .

A APPENDICI

146

Lemma A.5 Se esiste f : 0 bigettiva monot`ona tra e 0 ordinali


allora = 0 . Se inoltre `e un ordinale finito allora = n per qualche
n N.
Dimostrazione: Mostriamo che f (x) = x per ogni x . Sia a = min{x
| x 6= f (x)}. Si ha che f ( (a)) = (a). Inoltre, f ( (a)) = (f (a))
in quanto f `e bigettiva monot`ona. Siccome (a) = a e (f (a)) = f (a)
si ottiene f (a) = a che `e assurdo. Inoltre, se `e finito allora esiste n
bigettiva: basta dunque mostrare, per induzione su n, che esiste f : n
bigettiva monot`ona per ogni n N. Per n = 0 si ha f = id0 . Se n {n}
`e bigettiva, sia = max (che esiste per 3.1); per ipotesi induttiva esiste
f : n \ {} bigettiva monot`ona. Quindi si ottiene f + : n {n}
def
+
ponendo f|n
= f e f + (n) = che `e ovviamente bigettiva monot`ona.

Lemma A.6 Dati e 0 ordinali si ha che 0 oppure 0 oppure


= 0 e un solo caso tra questi `e sempre vero.
Dimostrazione:
Se = e 0 6= allora 0 e viceversa (per A.4).
def
Siano {} e 0 {0 }. Sia S = ( {}) (0 {0 }). Per induzione
transfinita mostriamo che S = {} oppure S = 0 {0 }. Si ha che
S 6= in quanto S. Basta mostrare che S soddisfa lipotesi induttiva
(x) S x S. Per (x) = x {} basta vedere che x 0 {0 }.
Se y x allora y 0 {0 } e quindi y = 0 oppure y 0 . Se y = 0 si
ha 0 x e quindi 0 . Supponiamo che 0 6 e quindi che y 6= 0 per
ogni y x. Allora si ha che y x y 0 e quindi x 0 . Per induzione
transfinita si ha {} 0 {0 } e quindi 0 oppure = 0 .

Numeri cardinali
Dati e 0 ordinali da A.4, A.5 e A.6 segue che se 6= 0 uno `e un segmento
iniziale dellaltro ovvero che se nessuno dei due `e segmento iniziale dellaltro
allora = 0 . Inoltre, si ha che 0 oppure 0 oppure = 0 .
Ogni insieme di numeri ordinali `e totalmente ordinato. Infatti, `e anche ben
ordinato.

A APPENDICI

147
def

Si vede (non facilmente!) che = {0 | |0 | = ||} costituito da tutti gli


ordinali equipollenti a un dato ordinale `e un insieme che `e quindi ben
ordinato. Possiamo considerare il minimo di . Si dice numero cardinale
lordinale minimo di . In altre parole, un ordinale `e un numero cardinale se
`e un segmento iniziale di ogni altro ordinale equipollente. Notiamo che per
A.5 gli ordinali finiti sono numeri naturali n N e si ha che n = {n} per
2.13. Si denota 0 il minimo di N. In effetti, 0 = N come ordinale. Infatti,
se 6= N `e infinito allora N in quanto se fosse un segmento iniziale di
N allora sarebbe finito.
def

Inoltre, se `e un ordinale allora () = {} `e un ordinale tale che


(). Si ha che `e infinito se e solo se |()| = ||. Si noti che
N 6= () per ogni ordinale . Un ordinale non nullo si dice ordinale
limite se non esiste nessun ordinale tale che = (). Nessun ordinale
finito `e un ordinale limite e quindi 0 = N `e il primo ordinale limite.
Fissato un insieme X possiamo, per A.2, renderlo un insieme (X, ) ben
ordinato. Per linsieme ben ordinato (X, ) se esiste `e unico lordinale con

una funzione bigettiva monot`ona f : X . Infatti, lunicit`a segue da A.4.


Se per`o consideriamo classi di equipollenza allora non `e unico. Siccome
per ogni insieme X esiste almeno un ordinale tale che |X| = || possiamo
definire la cardinalit`a di X come lunico numero cardinale associato a .
Ad esempio, si vede che 0 `e anche la cardinalit`a di Q in quanto |N| = |Z| =
|Z Z| = |Q|. Quindi

N
2 = |P(N)| = |P(Q)|
Inoltre, sfruttando che R P(Q), un ben noto argomento (dovuto a Cantor)
mostra che |R| = |P(N)| e in particolare che R non `e numerabile. Dunque, se
`e la cardinalit`a di R, che `e anche la cardinalit`a di P(0 ), allora 0 < . Sia
def
1 = 0 0 il cardinale successivo a 0 . Lipotesi del continuo (di Cantor)
`e che = 1 .

A.3

Universi e insiemi ben fondati

Sebbene la teoria degli insiemi standard (di Zermelo-Fraenkel) fornisca un


quadro logico minimale allinterno del quale poter sviluppare molte costru-

A APPENDICI

148

zioni insiemistiche comunemente utilizzate in matematica ci si trova a dover


fronteggiare linconveniente (anche estetico) che tutti gli insiemi non sono un
insieme. Al fine di ovviare a tale inconveniente si pu`o introdurre (mediante
un assioma supplementare) un insieme abbastanza grande, fissato il quale,
tutte le operazioni della teoria degli insiemi standard sono ammesse al suo
interno.
Un universo (di Grothendieck) `e un insieme U (non vuoto) tale che:
XU &xX xU
X, Y U {X, Y } U
X U P(X) U
se {Xi }iI `e una famiglia con Xi U e I U allora

Xi U

iI

Vediamo innanzitutto che da questi assiomi si deduce:


Lemma A.7 Sia U un universo:
(a) gli insiemi elementari appartengono a U
(b) i sottoinsiemi, le unioni, le intersezioni, i complementari, i prodotti e
le somme di elementi di U appartengono a U
(c) U non appartiene a U
(d) U `e apodittico.
Dimostrazione: (a) In quanto P(X) per ogni X U si ha che U per
ogni universo; dunque, il singoletto 1 = {} U e pure 2 = {, {}} U, etc.
(b) Dato X U e Y X ovvero Y P(X) e P(X) U dunque Y U. Sia
{Xi }iI una famiglia con Xi U e I U per cui
\
[
Xi
Xi U
iI

e dunque

iI

Xi U. Siccome 2 = {0, 1} U, in particolare, lunione e

iI

lintersezione di due elementi di U `e un elemento di U. Analogamente, se

A APPENDICI

149

X U e Y `e un qualunque insieme si ha che X \ Y P(X) e quindi


X \ Y U. Siano X, Y U, x X e y Y da cui x, y U quindi
(x, y) = {{x}, {x, y}} U e dunque X Y U in quanto X Y `e unione
deglinsiemi {(x, y)}. Segue subito che X, Y U implica X ] Y U e inoltre
Y
X
Xi U
Xi U
iI

iI

per ogni famiglia con Xi U e I U.


(c) Supponiamo che U U. Linsieme A = {X U | X
/ X} `e un sottoinsieme di U dunque A U. Ma abbiamo visto che A 6 U e si ha dunque un
assurdo!
(d) Infatti, U per (a) e inoltre se X U allora {X} U e pure il
successore X {X} U. Dunque U `e un insieme apodittico ovvero un
insieme che verifica lassioma dellinfinito.

Osserviamo che lintersezione di universi `e un universo. In particolare, se X


`e un insieme e se esiste un universo U tale che X U allora F = {U 0
P(U) | X U 0 & U 0 universo} `e un insieme (non vuoto) per lassioma di
specificazione e dunque esiste
\
def
U0
UX =
U 0 F

il pi`
u piccolo universo a cui X appartiene. Luniverso UX si dice generato
da X. Ad esempio, si pu`o mostrare facilmente lesistenza di U0 luniverso
generato dallinsieme vuoto. Si ha che U0 `e linsieme che oltre a ha come
elementi tutti gli insiemi finiti che si ottengono a partire dallinsieme per
iterazione di unioni, parti e formazione di coppie. Osserviamo che N U0 ,
linclusione `e stretta in quanto i sottoinsiemi di numeri naturali non sono
numeri naturali.
Lassioma degli universi afferma che per ogni insieme X esiste un universo
U tale che X U e quindi anche luniverso UX generato da X. Postulando
lesistenza di universi, una volta scelto un universo U si ha che tutti gli insiemi appartenenti a U costituisce un insieme ovvero {X U | X insieme}

A APPENDICI

150

`e un insieme. Se luniverso fissato non `e abbastanza grande si pu`o sempre


ampliarlo richiedendo che contenga un qualunque cardinale assegnato.

Insiemi ben fondati


I nostri assiomi come anche questultimo assioma degli universi non escludono
lesistenza dinsiemi che sono elementi di se stessi. Nella pratica matematica
non `e necessario escluderlo a priori ma un altro assioma affronta la questione
dellesistenza dinsiemi bizzarri alla radice. Lassioma di regolarit`a o anche
detto di fondazione afferma che ogni insieme non vuoto X ha un elemento
x X tale che X x = . In questo modo, X = {x} tale che x x viene
escluso dalla teoria degli insiemi. Inoltre, si vede facilmente che lassioma
di regolarit`a `e equivalente alla non esistenza di -catene discendenti infinite ovvero x2 x1 x0 per x0 , x1 , x2 , . . . una famiglia infinita dinsiemi.
Dunque ogni -catena discendente dovr`a terminare con .
Diciamo che un insieme x `e transitivo se y x e z y allora z x.
Ogni ordinale costituisce un insieme transitivo. Ad esempio, N (per 2.1).
Inoltre, ogni universo `e un insieme transitivo. Se x `e un qualunque insieme
sia x0 = {x}, xn+1 = xn e x = n xn per n N. Si ha che x `e il pi`
u
piccolo insieme transitivo a cui x appartiene.
Lemma A.8 Si ha che x x e x `e transitivo. Se x T con T transitivo
allora x T e quindi
\
x =
T
xT

Se x `e transitivo allora x = x {x} `e il successore.


Dimostrazione: Se y x allora y xn per qualche n N. Dunque z y
implica z xn+1 e quindi z x . Se T `e transitivo e x T allora x0 T e
se xn T per la transitivit`a di T si ha che xn+1 T . Dunque xn T per
ogni n N e x T . Se x `e transitivo allora x {x} `e transitivo e quindi
x x {x} e se x T con T transitivo allora x {x} T .

Una funzione-rango per un insieme transitivo T `e una funzione r su T a valori


ordinali tale che per ogni x T si ha r(x) = sup{r(y) | y x}.

A APPENDICI

151

Lemma A.9 Se T1 e T2 sono transitivi, r1 e r2 sono funzioni-rango allora


r1 = r2 su T1 T2 .
Dimostrazione: Chiaramente T1 T2 `e transitivo. Sia il minimo ordinale
per cui esiste x T1 T2 con r1 (x) = e r1 (x) 6= r2 (x). Se y x si ha
r1 (y) < e quindi r1 (y) = r2 (y). Dunque r1 (x) = sup{r1 (y) | y x} =
sup{r2 (y) | y x} = r2 (x). Assurdo!

Di conseguenza possiamo definire rk (x) il rango di x in T transitivo come


r(x) per una qualunque funzione-rango r di T . Diciamo che un insieme x `e
ben fondato se x appartiene a qualche insieme transitivo per cui esiste una
funzione-rango. Come conseguenza dellassioma di regolarit`a si ha che:
Lemma A.10 Ogni insieme `e ben fondato.
Dimostrazione:
Se x non `e ben fondato, x x ed esiste un insieme
y x che non `e ben fondato e tale che z y implica z ben fondato e quindi
esiste una funzione-rango su z . Si ha che
[
y = {y}
z
zy
def

Per ogni t zy z abbiamo rk (t) e ponendo r(y) = sup{rk (t)} otteniamo


una funzione-rango su y . Assurdo!

Mediante lassioma di regolarit`a, per ogni insieme transitivo, ad esempio un


universo U, abbiamo quindi la funzione-rango rk che misura il processo di
aggregazione che a partire dal conduce alla formazione di U.

A.4

Categorie e funtori

Il concetto di insieme come concepito nellambito della teoria di ZermeloFraenkel `e sufficiente a costruire ledificio in cui si articola la matematica
moderna ma non `e necessario. Infatti, gli oggetti di indagine della matematica possono costituire indipendentemente un edificio a prescindere dalla
teoria degli insiemi. Questo edificio si esprime attraverso il concetto di categoria che `e tanto essenziale quanto elementare. Attraverso questo concetto

A APPENDICI

152

si spiega lesistenza di una pluralit`a di sistemi assiomatici che coesistono come diverse categorie degli insiemi. Viceversa, mediante questo concetto, si
possono trovare nuove teorie degli insiemi che corrispondono, ad esempio, a
sistemi assiomatici costruttivisti ovvero che affermano la necessit`a di trovare
o costruire un oggetto matematico per dimostrare la sua esistenza e che rifiutano le dimostrazioni per assurdo.
Un altro vantaggio del concetto di categoria `e che esprime una sintesi delle
strutture algebriche. Come il lettore attento forse avr`a gi`a capito leggendo
gran parte di questo libro, la legge associativa non `e mai violata. Algebra `e
fino a qui sinonimo di algebra associativa eventualmente non commutativa;
abbiamo tralasciato interamente e volutamente il mondo non associativo. La
ragione fondamentale per giustificare e comprendere questo fatto `e che esiste
infatti un solo concetto elementare mediante il quale si esprimono tutti gli
altri concetti fino a qui introdotti: questo `e ancora il concetto di categoria
rivisto ora come algebra della composizione.
Diciamo che una categoria C `e una collezione C0 di oggetti X, Y, . . . e una
collezione C1 di morfismi f, g, . . . in modo che
per ogni morfismo f : X Y si ha un oggetto dominio X e un oggetto
codominio Y
per ogni oggetto X si ha un morfismo identit`a idX : X X
per ogni coppia di morfismi f : X Y e g : Y Z con codominio di
f uguale a dominio di g si ha un morfismo composto g f : X Z
tali che soddisfano le seguenti condizioni
per morfismi
gf

/Y

"

=T

hg

si ha
h (g f ) = (h g) f
ovvero vale la legge associativa per la composizione di morfismi e

A APPENDICI

153

in particolare
f idX

idX

"

idY

=Y

idY f

richiediamo che
f idX = f = idY f

Per X e Y oggetti di C denotiamo con


Hom C (X, Y )
la collezione di morfismi con dominio X e codominio Y . Per ogni categoria
def
C si ha che X  = Hom C (X, X) ha una struttura (X  , , idX ) che abbiamo
chiamato monoide (per un insieme).
Ad esempio, la categoria degli insiemi S ha come oggetti gli insiemi e morfismi le funzioni (proprio nel senso che abbiamo considerato precedentemente)
e Hom S (X, Y ) `e un insieme per ogni insieme X, Y S. Ritroviamo il monoide X  considerato precedentemente.
Daltra parte un monoide (M, , 1) `e una categoria con un solo oggetto,
in cui M sono i morfismi, 1 `e lidentit`a e `e la composizione. Infine, un
preordine (X, ) non `e altro che una categoria in cui X sono gli oggetti ed
esiste al pi`
u un morfismo tra due oggetti.
Categorie piccole
Una volta fissato un universo U abbastanza grande diciamo che una categoria C `e una U-categoria se C0 U ovvero se gli oggetti di C sono elementi
di U. Diciamo che una categoria C `e piccola (relativamente a U fissato) se
inoltre oggetti C0 U e morfismi C1 U sono elementi di U. Diciamo che `e
localmente piccola se Hom C (X, Y ) U per tutti gli oggetti X e Y di C.
Ad esempio, la U-categoria degli insiemi ovvero la categoria S U degli insiemi
che sono elementi di U non `e piccola in quanto S0U = U 6 U ma `e localmente
piccola.

Postfazione
Abbiamo scoperto numeri di natura diversa e modi di pensare un numero
da diversi punti di vista. Riguardando a ritroso il nostro percorso da un
punto di vista storico ritengo cruciale lintroduzione del concetto di ideale
da parte di Dedekind (nel 1879 circa) riprendendo la definizione di numero
ideale proposta da Kummer (nel 1843 circa). Ritengo che il lavoro di Dedekind che per primo accetta la nascente teoria degli insiemi di Cantor, a cui
anche contribuisce con il concetto dinsieme infinito, sia un punto di svolta
che divide la nostra concezione di numero in un prima e dopo Dedekind.
Un altro aspetto che voglio mettere in rilievo `e lanalogia manifesta tra numeri e funzioni. Infatti, per un qualunque anello commutativo unitario A e
f A possiamo considerare il valore f (p) in un primo p A come la classe
f A/p nellanello quoziente. Pensiamo quindi ai primi di A come punti
di uno spazio e gli elementi di A come funzioni. Nel caso di A = k[X] e
p = (X a) si ha infatti che f (X) = (X a)g(X) + f (a). Questa semplice
ma fondamentale osservazione `e allorigine (nel 1958 circa) della teoria degli
schemi di Alexander Grothendieck, teoria che ci ha svelato una concezione
dello spazio che `e esattamente simmetrica rispetto a quella di anello. Il lavoro
di Grothendieck sui punti come quello di Dedekind sui numeri ha cambiato
la nostra concezione dello spazio in un prima e dopo Grothendieck.
Per concludere non posso esimermi dallincombenza dindicare alcuni riferimenti bibliografici per approfondire gli argomenti trattati. Innanzitutto
suggerisco Halmos [5] come utile breviario di teoria degli insiemi: un testo
molto diffuso e che ha il pregio di essere facilmente leggibile. Per chi fosse
pi`
u seriamente intenzionato ad approfondire alcuni temi di teoria degli insiemi suggerisco Cohen [4] che comunque contiene una introduzione alla teoria
degli insiemi nella prima parte del libro e nellultima edizione contiene anche una interessante parte biografica. Uno storico risultato di Cohen mostra
lindipendenza dellassioma della scelta dal sistema di assiomi di ZermeloFraenkel. A questo proposito, suggerisco Herrlich [7] per chi `e interessato
al dibattito sullassioma della scelta e per vedere il ruolo cruciale che questo
svolge in matematica e specialmente in analisi. Infine, per chi fosse interessato alla categoria degli insiemi consiglio Lawvere-Schanuel [8].
Per alcuni aspetti aritmetici computazionali consiglio il Childs [3] con uno

sguardo anche alla teoria dei codici mentre Hardy-Wright [6] `e un testo classico che resta negli anni una inossidabile introduzione allaritmetica e alla
teoria dei numeri. Per il lettore interessato ad approfondire la teoria algebrica dei numeri posso indicare Samuel [12] e lonnicomprensivo Neukirch [11]
che presuppongono per`o una certa conoscenza della teoria dei campi e della
teoria di Galois.
Per i testi di riferimento storici di algebra segnalo Lang [9] in cui si trova tutto
il necessario tranne una introduzione allalgebra categoriale che si trova invece
anche troppo nel Mac Lane-Birkhoff [10] che `e anche un ottimo testo base.
Inoltre, il Bosch [2] `e un testo efficiente, molto ben organizzato, che adotta
come idea guida quella di risoluzione di unequazione algebrica e quindi una
buona parte del libro `e dedicata alla teoria di Galois. Infine, il libro di Artin
[1] `e un testo molto esteso, con il pregio di essere sufficientemente ricco di
motivazioni in tutta la sua estensione, e che si articola su tutte le sponde
dellalgebra con un approccio molto operativo. LArtin [1] `e il testo base di
algebra che posso senza dubbio raccomandare a tutti voi che avete appena
finito di leggere questo libro.

Riferimenti bibliografici
[1] M. Artin: Algebra Addison Wesley, (2nd Edition) 2010 (ed. Bollati
Boringhieri, 1997)
[2] S. Bosch: Algebra Unitext Springer (6th German Edition) 2006 (ed.
Springer Italia, 2003)
[3] S. Childs: A Concrete Introduction to Higher Algebra UTM Springer,
(3rd Edition) 2009. (ed. ETS, 1989)
[4] P. J. Cohen: Set Theory and the Continuum Hypothesis Dover, 2008.
(ed. Feltrinelli, 1973)
[5] P. Halmos: Naive Set Theory Springer, 1974. (ed. Feltrinelli, 1970)
[6] G.H. Hardy & E.M. Wright: An Introduction to the Theory of
Numbers Oxford University Press, (6th Edition) 2008.
[7] H. Herrlich: Axiom of Choice LNM Springer, 2006.
[8] W. Lawvere & S.H. Schanuel: Conceptual Mathematics: a first Introduction to Categories Cambridge University Press, (2nd Edition) 2009.
(ed. Muzzio, 1994)
[9] S. Lang: Undergraduate Algebra UTM Springer, (3rd Edition) 2005.
[10] S. Mac Lane & G. Birkhoff: Algebra AMS Chelsea, 1999. (ed.
Mursia, 1985)
[11] J. Neukirch: Algebraic Number Theory Springer, 1999.
[12] P. Samuel: Algebraic Theory of Numbers Hermann, 1970. Dover, 2008.

Indice analitico
Algebra, 140
Anello, 97
Caratteristica di un, 112
Commutativo, 98
degli Interi, 136
dei Polinomi, 116
delle Serie formali, 118
Estensione di un, 109
Euclideo, 127
Locale, 124
Norma su un, 127
Ordinato, 100
Quoziente, 108
Unitario, 98
Buon ordinamento, 57, 144
Campo, 99
dei Quozienti, 114
di Numeri algebrici, 136
Ordinato, 100
Cardinalit`a, 34, 44
Categoria, 152
Classe di equivalenza, 44
Rappresentante di una, 44
Coefficiente binomiale, 41
Corpo, 99
Dominio, 98
a fattorizzazione unica, 122
a ideali principali, 104
Elemento, 9
Associato, 121
Cancellabile, 94
Coprimi, 71, 123

Idempotente, 95
Invertibile, 95
Irriducibile, 121
Neutro, 94
Positivo, 100
Primo, 74, 121
Zero-divisore, 98
Espansione p-adica, 91
Estremo inferiore e superiore, 59
Funzione, 16
Bigettiva, 19
Caratteristica, 21
Composta, 21
Controimmagine di una, 18
di Eulero, 86
di Scelta, 36
Grafico di una, 17
Identit`a, 17
Immagine di una, 18
Iniettiva, 19
Inversa, 19
Inversa destra e sinistra, 38
Invertibile, 22
Monot`ona, 54
Restrizione di una, 21
Successore, 28
Surgettiva, 19
Gruppo, 95
Abeliano, 95
Notazione additiva di un, 96
Quoziente, 105
Somma, 102
Ideale, 103
157

Bilatero, 103
Massimale, 124
Nucleo, 109
Primo, 124
Principale, 104
Inclusione, 10
Induzione, 27
Transfinita, 58
Insieme, 9
Apodittico, 26
Ben fondato, 151
Ben ordinato, 56
Complementare, 14
Completo, 60
Continuo, 63
Coppia ordinata, 15
delle Parti, 13
di Funzioni, 17
di Scelta, 35
Elementare, 10
Famiglia, 13
Finito, 33
Infinito, 43
Intersezione, 12
Limitato, 59
Numerabile, 43
Ordinato, 54
Partizione di un, 14
Prodotto, 15, 37
Quoziente, 45
Singoletto, 10
Totalmente ordinato, 55
Transitivo, 150
Uguale, 10
Unione, 12
Unione disgiunta, 16
Vuoto, 10
Isomorfismo, 105, 109

Legge associativa, 93
Legge di cancellazione, 94
Lemma di Gauss, 134
Lemma di Zorn, 143
Maggiorante e minorante, 59
Massimale e minimale, 55
Massimo comun divisore, 71, 123
Massimo e minimo, 55
Matrice, 140
Minimo comune multiplo, 74
Modulo, 137
Monoide, 94
Numeri
Algebrici, 132
Cardinali, 147
Complessi, 67
Interi, 47
Interi p-adici, 90, 118
Interi algebrici, 135
Interi di Gauss, 103, 130
Naturali, 26
Ordinali, 145
Primi, 71, 74, 77, 84
Quaternioni, 69
Razionali, 52
Reali, 65
Trascendenti, 133
Omomorfismo, 94
Caratteristico, 109
di Anelli, 108
di Gruppi, 105
Immagine di un, 106, 109
Nucleo di un, 106, 109
Ordinato, 109
Ordine, 54
Buono, 56

Completo, 60
Continuo, 63
Denso, 54
Totale, 55
Polinomio, 115
Coefficiente direttivo di un, 119
Grado di un, 119
Monico, 119
Primitivo, 133
radice di un, 117
Prova del 9, 80
Relazione, 16
di Congruenza, 77
di Equipollenza, 47
di Equivalenza, 44
di Ordine, 54
di Preordine, 54
Reticolo, 61
Completo, 61
di Boole, 62
Distributivo, 62
Ricorsivit`a, 29
Segmento iniziale, 58
Semigruppo, 93
Commutativo, 93
Serie formale, 118
Sistema di numerazione, 76
Base di un, 76
Cifre di un, 76
Sistema di Peano, 29
Sottoanello, 102
Fondamentale, 111
Ordinato, 102
Sottocampo, 103
Primo, 115
Sottogruppo, 101

Sottoinsieme, 10
Sottomonoide, 101
Taglio di Dedekind, 63
Teorema di Fermat, 85
Teorema di Wilson, 88
Universo, 11, 148